「情報処理学会 第73回 デジタルドキュメント研究会」聴講メモ

行こうかいくまいか迷っていたけれど、イベント参加月間(謎)ということで、参加してきた。文中の [ほにゃらら] は、個人的な感想。例によって、一部、誤字の修正、参照関係の調整有り。

開会前

「Web API マッシュアップのための E4X サービス」

  • 11:09:11 http://twitter.com/nsiena nsiena: 「Web API マッシュアップのための E4X サービス」: マインドマップなプレゼンだ。 #sigdd [※ここで分割 → 「邂逅」へ]
  • 11:26:11 http://twitter.com/nsiena nsiena: ここまで、E4X の話。E4X ウェブサービスを試作。SOAP型 でなく REST型を想定。簡単に書けるよ。今後、熟練者でなくても作れる、汎用マッシュアップアーキテクチャを狙っていく予定。各種PL用エージェントサービスを作って、各種PLの良いところを活かす。 #sigdd
  • 11:26:11 http://twitter.com/nsiena nsiena: [ここで仮定してるのは、RESTful というより、POX/HTTP ということかも。JavaScriptXML ライブラリではだめなのかしら。] #sigdd
  • 11:27:11 http://twitter.com/mie_treky mie_treky: 最初は常連の大学の先生。マインドマップを使っての発表いい感じ。学会発表では初めて見ました。先生、いつもながら、力入りすぎです。リラックス、リラックス。
  • 11:28:11 http://twitter.com/mie_treky mie_treky: あ、タグ付け忘れました。とほほ。

邂逅

  • 11:09:11 http://twitter.com/nsiena nsiena: 「Web API マッシュアップのための E4X サービス」: マインドマップなプレゼンだ。 #sigdd邂逅
  • | 11:12:11 http://twitter.com/repeatedly repeatedly: @nsiena と同じへやにいる予感
  • || 11:34:11 http://twitter.com/nsiena nsiena: @repeatedly いますね、確実に ^^)/
  • ||| 11:42:11 http://twitter.com/repeatedly repeatedly: @nsiena さっきライブラリとの違いを質問された方ですか?
  • |||| 13:10:13 http://twitter.com/nsiena nsiena: @repeatedly ですです。部屋のまんなか辺に座ってますです
    • 13:27:13 http://twitter.com/nsiena nsiena: はて。Dの人はどこにいるのかしらん……。
    • 13:35:13 http://twitter.com/repeatedly repeatedly: @nsiena おお。僕は右後ろの真っ黒なDebian Tシャツ着てるやつです。
    • 14:43:14 http://twitter.com/repeatedly repeatedly: @nsiena さんとお話した!

運営裏話

  • 11:31:11 http://twitter.com/mie_treky mie_treky: 本日のDD研究会は現主査が午後から来るので、前主査の私が最初の挨拶をせよと。今ひとつまとまりのない挨拶でごめんなさい。 #ipsj #sigdd
  • | 11:34:11 http://twitter.com/amagasa amagasa: @mie_treky 急に振ってしまってすみませんでした.最初にあいさつがあった方が研究会が始まる感じがしてとてもよかったと思います.助かりました. #ipsj #sigdd
    • 11:45:11 http://twitter.com/mie_treky mie_treky: @amagasa 最初の挨拶は、想定内の依頼なのになぜかぶっ飛んでました。(^^;)  #ipsj #sigdd
    • 11:49:11 http://twitter.com/mie_treky mie_treky: @amagasa 正面のプロジェクタの縦横比がおかしくないですか?左側のモニタの縦横比が普通かと。
  • 11:36:11 http://twitter.com/mie_treky mie_treky: いつもより、参加者数多い感じです。私がtwitterでPRしたからかしら?午後、HTML5の招待講演もありますしね。  #ipsj #sigdd

「消去を含むデジタルコンテンツのライフサイクル管理」

  • 11:37:11 http://twitter.com/nsiena nsiena: 「消去を含むデジタルコンテンツのライフサイクル管理」: 情報漏洩対策の必要性から、企業内・オフライン顧客・協力会社など組織をまたがる情報取扱方法の分析、自動消去機能を持つ USB メモリを用いた安全なデータ持出しソリューションの紹介。#sigdd
  • 11:41:11 http://twitter.com/nsiena nsiena: 情報漏洩対策の現況と関連技術。DRM を応用した ERM : コンテンツや人ごとにポリシーが異なるので運用困難。 #sigdd
  • 11:41:11 http://twitter.com/nsiena nsiena: DLP : NW上の移動時、保存時、エンドポイントでの利用時など場面ごとのポリシー管理可能だが、大領大量のデータのどれを機密とするかが手動であることが多く大変。 #sigdd
  • 11:49:11 http://twitter.com/nsiena nsiena: コンテンツを持ち運ぶシーンを分析。USB の利用シナリオを対象とする: A) 一時的な交換, B) 出張先や自宅からオフィスへ, C) オフィスから出張先や自宅へ。課題: 1) 消去忘れ, 2) USB分室, 3) ローカルHDDに保存 (+ネットへ流出)。 #sigdd
  • 11:53:11 http://twitter.com/nsiena nsiena: 一般利用者としては、普通に使えるが、自動的に消えることが不安。消去タイミングが分かるようにして欲しい、顧客の情報を扱うのは不安、など心理的課題が障壁。ユーザの慣れとユーザビリティの改善が必要そう。

休憩

  • 12:01:12 http://twitter.com/nsiena nsiena: おひるごはーん
  • 13:05:13 http://twitter.com/nsiena nsiena: 書くだけ書いて、全然見てなかった ^^;
  • 13:09:13 http://twitter.com/nsiena nsiena: おひるは海鮮丼などいただいてきた
  • 13:25:13 http://twitter.com/nsiena nsiena: いいぐあいに、ねむたくなってきた
    • 13:50:13 http://twitter.com/amagasa amagasa: @nsiena 寝るなー!死ぬぞー!!
  • 13:29:13 http://twitter.com/nsiena nsiena: SIG-DD のハッシュタグは、#sigdd と #ipsj の両方。おぼえた。検索は " #sigdd OR #ipsj " で。

「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」

  • 13:32:13 http://twitter.com/nsiena nsiena: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」: 形態素解析や読み上げで詳がい障害となるテキストアートを抽出。同じ記号列が出現しやすいことから、圧縮を利用することで既存手法を改善する。 #sigdd #ipsj
  • 13:36:13 http://twitter.com/mie_treky mie_treky: 午後の部始まりました。午後一番のテーマは「情報抽出」です。ハッシュタグはこちらです→ #ipsj #sigdd
  • 13:57:13 http://twitter.com/mie_treky mie_treky: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」:ですが、読み上げソフトなどでテキストアートがどの程度邪魔になるのでしょうか?ちょっと、実感わきません。 #ipsj #sigdd

「Webページを対象としたXMLデータ抽出手法の検討」

  • 14:06:14 http://twitter.com/nsiena nsiena: 「Webページを対象としたXMLデータ抽出手法の検討」: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
  • 14:13:14 http://twitter.com/nsiena nsiena: 例示データを種に、ブートストラップ手法を用いて辞書を拡張していく。既存手法は、多項関係を二項関係に分解して抽出し、関係グラフを作成し、最大クリークを探索して、多項関係を再構築する。XML データのレコードは対象外。 #sigdd #ipsj
  • 14:14:14 http://twitter.com/mie_treky mie_treky: @amagasa どっちですか? RT @nsiena: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
  • 14:16:14 http://twitter.com/nsiena nsiena: 提案アプローチでは、XMLデータを関係表に写像する。まず XML スキーマを獲得する。存在しない場合は、既存手法でスキーマ推論で。次に、既存手法を用いてスキーマに基づいて関係表へ写像する。更に、主キーとそれ以外のキーのペアに分解して、二項関係群へ。 #sigdd #ipsj
  • 14:28:14 http://twitter.com/mie_treky mie_treky: 研究のスコープをきちんと説明することは大切ですよね。#sigdd #ipsj
  • 14:31:14 http://twitter.com/mie_treky mie_treky: 元のXMLデータからスキーマ情報を抽出して、関係表へ写像後、二項関係へ分解して従来手法を利用してからXMLデータを再構築することで、より広い検索結果が得られるようにした仕掛けかな? #sigdd #ipsj

招待講演「HTML5 の過去、現在、未来」

ボリュームがあるので記事を分割することにした。

オノマトペロリ:オノマトペを利用した料理推薦システム」

  • 16:22:16 http://twitter.com/nsiena nsiena: オノマトペロリ:オノマトペを利用した料理推薦システム」: 「とろとろ」「ピリリ」といった表現 (オノマトペ) を考慮して、料理を推薦。名前がかわいい。 #sigdd #ipsj
  • 16:23:16 http://twitter.com/nsiena nsiena: バッテリがほぼ空になったので、2 本めに交換。これであと何時間か戦える。PC が戦えても、あたしが戦えない(弱) #sigdd #ipsj
  • 16:28:16 http://twitter.com/mie_treky mie_treky: オノマトペとは擬声語で、擬音語と擬態語の総称。フランス語(onomatop?e)なんだ。英語ではオノマトピア/オノマトペア(onomatopoeia)ですか。知らなかったなぁ。 #ipsj #sigdd
  • 16:31:16 http://twitter.com/nsiena nsiena: 料理レシピを cabocha で形態素構文解析。名詞, 動詞, 形容詞に分類。オノマトペ vs 用語で、tf*idf を求める。評価実験で妥当性を確認。 #sigdd #ipsj
  • 16:32:16 http://twitter.com/mie_treky mie_treky: 料理レシピ推薦システム「オノマトペロリ」はCookpadで実証しているのね。そりゃそうね。そういやぁ、「600万人の女性に指示される「クックパッド」というビジネス」を読み始めたところ。シンクロニシティ。 #ipsj #sigdd
  • 16:34:16 http://twitter.com/nsiena nsiena: 二つの推薦アプローチ。1) レシピの構造をトップダウンで検索, 2) 同ボトムアップに。1) は、「シャキシャキ」「サラダ」→「レタス」「サラダ」のように置き換えていく。2) は、構造図の末端から特徴値を合成して異なるレシピを比較。 #sigdd #ipsj
  • 16:37:16 http://twitter.com/mie_treky mie_treky: テキストアートといい、オノマトペといい、大学ではビジネス系では予想もつかないキーワード、モチベーションから研究をスタートしてるんですね。ここで、有効性は何?なんて無粋な質問をしちゃでめですよね。 #ipsj #sigdd
  • 16:41:16 http://twitter.com/mie_treky mie_treky: オノマトペの具体例「ふわふわ」、「しゃきしゃき」、「ぴりっ」ってのが、発表者の個性と相まっていいなぁ。外人女子大生なんですが、日本語がとっても上手。 #ipsj #sigdd
  • 16:44:16 http://twitter.com/mie_treky mie_treky: オノマトペと食材の関係しか分析していないが、料理方法との関係は?→これからの研究課題。ナイスアンサー。 #ipsj #sigdd
  • 16:46:16 http://twitter.com/nsiena nsiena: [レシピの概念構造はどうモデリングされるのかしら。確かに複雑だ。] #sigdd #ipsj

「異種XMLデータに対するファセット検索手法の提案」

  • 16:49:16 http://twitter.com/nsiena nsiena: 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。XPathXQuery は文書構造を理解しなければ、キーワード検索では検索意図が明確でなければ適切に検索できない。ファセット検索で解決! #sigdd #ipsj
  • 16:53:16 http://twitter.com/ceekz ceekz: タイトルを見て発表者が想像できたので、調べてみたら当たりだったw RT @nsiena 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。
  • 16:53:16 http://twitter.com/nsiena nsiena: 異種構造が混合した XML データを探索対象とする。オブジェクト、ファセットを形式的定義。DTD から導出されるスキーマ木から、クラス (繰返し出現する要素), クラスの属性 (クラスの子孫要素か属性でテキストを含むもの) を定義。 #sigdd #ipsj
  • 16:55:16 http://twitter.com/nsiena nsiena: [スキーマは、木でなくグラフになるから、適用範囲がかなり限定されそう。クラスの属性は、混合内容は考えないのかしら。] #sigdd #ipsj
  • 16:59:16 http://twitter.com/nsiena nsiena: ファセットとキーの組で適合オブジェクトを検索。全ての組の検索結果の共通部分が解候補。講演の残りはシステムの概要。 #sigdd #ipsj
  • 17:12:17 http://twitter.com/mie_treky mie_treky: XMLDBRDBを使っているけれど、XMLDBだけでできるんじゃないの?→アグリゲーションの計算でやっているので、XMLDBだけだと重くなるので(発表者)。スケッチあるいはキーバリューによる解決も考えている(共同研究者の天笠先生)。#ipsj #sigdd

終了〜懇親会〜帰宅

  • 17:18:17 http://twitter.com/nsiena nsiena: おっしまーい #sigdd #ipsj
    • 17:18:17 http://twitter.com/KKI KKI: @nsiena おつかれさまでしたー
  • 17:20:17 http://twitter.com/mie_treky mie_treky: 今村主査より、「11/28にデジタルドキュメントシンポジウム@東洋大(白山)を開催しますので、こちらへも参加ください。」 #ipsj #sigdd
  • 24:06:00 http://twitter.com/nsiena nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj
  • 24:10:00 http://twitter.com/nsiena nsiena: 今回の心残りは、 @repeatedly さんとあまり話せなかったこと。あちこち話し込んでしまって、気付いたら話し損ねた ><;
  • | 24:20:00 http://twitter.com/repeatedly repeatedly: @nsiena 今日はお疲れさまです。まあおそらくまだまだ会えるチャンスはあるはずなので、その時は宜しくお願いします。
  • 25:38:01 http://twitter.com/mie_treky mie_treky: お疲れさま〜。楽しかったですね。RT @nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj
  • 25:50:01 http://twitter.com/nsiena nsiena: 表層的に見た文書や、文書の利用上の問題に対する興味は薄いけれど、文書化における理念とか、その構造のモデル/メタモデルとかの方には興味がある。のかな。
  • 25:55:01 http://twitter.com/nsiena nsiena: 今日は、いろんな人に出会えた。ここで @yohei さんに会えたのは予想外だった ^^;
  • 25:58:01 http://twitter.com/mie_treky mie_treky: 私も。RT @nsiena: 今日は、いろんな人に出会えた。ここで @yohei さんに会えたのは予想外だった ^^;