「情報処理学会第73回デジタルドキュメント研究会」聴講メモ

行こうかいくまいか、迷っていたけれど、イベント参加月間(謎)ということで、参加してきた。文中の [ほにゃらら] は、個人的な感想。例によって、一部、誤字の修正、参照関係の調整有り。

開会前

05:42:05 nsiena: うぅ、外が明るくなってしまった。終わらなかったけれど、出かける前にちょっとだけ横になろう。ちょっとだけ。
06:48:06 nsiena: むくり
| 06:57:06 zakkas783: @nsiena おはようございます･･･って睡眠時間1h！？　･･･つhttp://bit.ly/4nifGD
06:49:06 mie_treky: 今日は情報処理学会デジタルドキュメント研究会at東大本郷に参加します。招待講演は話題のHTML5です。当日でも参加できますのでご興味がある方はどうぞ。#ipsj #sigdd http://tinyurl.com/yb2j6ru
06:51:06 mie_treky: #ipsj のハッシュタグがうまく機能しません。泣)
06:54:06 mie_treky: あれ？できた。では、改めて本日の情報処理学会デジタルドキュメント研究会のプラグラムを。http://tinyurl.com/yb2j6ru #ipsj #sigdd
09:48:09 nsiena: おしごと中断して、移動開始する
11:08:11 nsiena: #event 「情報処理学会第73回デジタルドキュメント研究会」参加中。

「Web API マッシュアップのための E4X サービス」

11:09:11 nsiena: 「Web API マッシュアップのための E4X サービス」: マインドマップなプレゼンだ。 #sigdd [※ここで分割 → 「邂逅」へ]
11:26:11 nsiena: ここまで、E4X の話。E4X ウェブサービスを試作。SOAP型でなく REST型を想定。簡単に書けるよ。今後、熟練者でなくても作れる、汎用マッシュアップアーキテクチャを狙っていく予定。各種PL用エージェントサービスを作って、各種PLの良いところを活かす。 #sigdd
11:26:11 nsiena: [ここで仮定してるのは、RESTful というより、POX/HTTP ということかも。JavaScript の XML ライブラリではだめなのかしら。] #sigdd
11:27:11 mie_treky: 最初は常連の大学の先生。マインドマップを使っての発表いい感じ。学会発表では初めて見ました。先生、いつもながら、力入りすぎです。リラックス、リラックス。
11:28:11 mie_treky: あ、タグ付け忘れました。とほほ。

邂逅

11:09:11 nsiena: 「Web API マッシュアップのための E4X サービス」: マインドマップなプレゼンだ。 #sigdd邂逅
| 11:12:11 repeatedly: @nsiena と同じへやにいる予感
|| 11:34:11 nsiena: @repeatedly いますね、確実に ^^)/
||| 11:42:11 repeatedly: @nsiena さっきライブラリとの違いを質問された方ですか？
|||| 13:10:13 nsiena: @repeatedly ですです。部屋のまんなか辺に座ってますです
- 13:27:13 nsiena: はて。Dの人はどこにいるのかしらん……。
- 13:35:13 repeatedly: @nsiena おお。僕は右後ろの真っ黒なDebian Tシャツ着てるやつです。
- 14:43:14 repeatedly: @nsiena さんとお話した！

運営裏話

11:31:11 mie_treky: 本日のDD研究会は現主査が午後から来るので、前主査の私が最初の挨拶をせよと。今ひとつまとまりのない挨拶でごめんなさい。 #ipsj #sigdd
| 11:34:11 amagasa: @mie_treky 急に振ってしまってすみませんでした．最初にあいさつがあった方が研究会が始まる感じがしてとてもよかったと思います．助かりました． #ipsj #sigdd
- 11:45:11 mie_treky: @amagasa 最初の挨拶は、想定内の依頼なのになぜかぶっ飛んでました。(^^;)　 #ipsj #sigdd
- 11:49:11 mie_treky: @amagasa 正面のプロジェクタの縦横比がおかしくないですか？左側のモニタの縦横比が普通かと。
11:36:11 mie_treky: いつもより、参加者数多い感じです。私がtwitterでPRしたからかしら？午後、HTML5の招待講演もありますしね。　 #ipsj #sigdd

「消去を含むデジタルコンテンツのライフサイクル管理」

11:37:11 nsiena: 「消去を含むデジタルコンテンツのライフサイクル管理」: 情報漏洩対策の必要性から、企業内・オフライン顧客・協力会社など組織をまたがる情報取扱方法の分析、自動消去機能を持つ USB メモリを用いた安全なデータ持出しソリューションの紹介。#sigdd
11:41:11 nsiena: 情報漏洩対策の現況と関連技術。DRM を応用した ERM : コンテンツや人ごとにポリシーが異なるので運用困難。 #sigdd
11:41:11 nsiena: DLP : NW上の移動時、保存時、エンドポイントでの利用時など場面ごとのポリシーを管理可能だが、大領大量のデータのどれを機密とするかが手動であることが多く大変。 #sigdd
11:49:11 nsiena: コンテンツを持ち運ぶシーンを分析。USB の利用シナリオを対象とする: A) 一時的な交換, B) 出張先や自宅からオフィスへ, C) オフィスから出張先や自宅へ。課題: 1) 消去忘れ, 2) USB分室, 3) ローカルHDDに保存 (+ネットへ流出)。 #sigdd
11:53:11 nsiena: 一般利用者としては、普通に使えるが、自動的に消えることが不安。消去タイミングが分かるようにして欲しい、顧客の情報を扱うのは不安、など心理的課題が障壁。ユーザの慣れとユーザビリティの改善が必要そう。

休憩

12:01:12 nsiena: おひるごはーん
13:05:13 nsiena: 書くだけ書いて、全然見てなかった ^^;
13:09:13 nsiena: おひるは海鮮丼などいただいてきた
13:25:13 nsiena: いいぐあいに、ねむたくなってきた
- 13:50:13 amagasa: @nsiena 寝るなー！死ぬぞー！！
13:29:13 nsiena: SIG-DD のハッシュタグは、#sigdd と #ipsj の両方。おぼえた。検索は " #sigdd OR #ipsj " で。

「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」

13:32:13 nsiena: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」: 形態素解析や読み上げで~~詳がい~~障害となるテキストアートを抽出。同じ記号列が出現しやすいことから、圧縮を利用することで既存手法を改善する。 #sigdd #ipsj
13:36:13 mie_treky: 午後の部始まりました。午後一番のテーマは「情報抽出」です。ハッシュタグはこちらです→ #ipsj #sigdd
13:57:13 mie_treky: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」:ですが、読み上げソフトなどでテキストアートがどの程度邪魔になるのでしょうか？ちょっと、実感わきません。 #ipsj #sigdd

「Webページを対象としたXMLデータ抽出手法の検討」

14:06:14 nsiena: 「Webページを対象としたXMLデータ抽出手法の検討」: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
14:13:14 nsiena: 例示データを種に、ブートストラップ手法を用いて辞書を拡張していく。既存手法は、多項関係を二項関係に分解して抽出し、関係グラフを作成し、最大クリークを探索して、多項関係を再構築する。XML データのレコードは対象外。 #sigdd #ipsj
14:14:14 mie_treky: @amagasa　どっちですか？ RT @nsiena: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
14:16:14 nsiena: 提案アプローチでは、XMLデータを関係表に写像する。まず XML スキーマを獲得する。存在しない場合は、既存手法でスキーマ推論で。次に、既存手法を用いてスキーマに基づいて関係表へ写像する。更に、主キーとそれ以外のキーのペアに分解して、二項関係群へ。 #sigdd #ipsj
14:28:14 mie_treky: 研究のスコープをきちんと説明することは大切ですよね。#sigdd #ipsj
14:31:14 mie_treky: 元のXMLデータからスキーマ情報を抽出して、関係表へ写像後、二項関係へ分解して従来手法を利用してからXMLデータを再構築することで、より広い検索結果が得られるようにした仕掛けかな？ #sigdd #ipsj

招待講演「HTML5 の過去、現在、未来」

ボリュームがあるので記事を分割することにした。

招待講演「HTML5 の過去、現在、未来」聴講メモ - 討論妄言録

「オノマトペロリ：オノマトペを利用した料理推薦システム」

16:22:16 nsiena: 「オノマトペロリ：オノマトペを利用した料理推薦システム」: 「とろとろ」「ピリリ」といった表現 (オノマトペ) を考慮して、料理を推薦。名前がかわいい。 #sigdd #ipsj
16:23:16 nsiena: バッテリがほぼ空になったので、2 本めに交換。これであと何時間か戦える。PC が戦えても、あたしが戦えない(弱) #sigdd #ipsj
16:28:16 mie_treky: オノマトペとは擬声語で、擬音語と擬態語の総称。フランス語（onomatop?e）なんだ。英語ではオノマトピア/オノマトペア（onomatopoeia）ですか。知らなかったなぁ。 #ipsj #sigdd
16:31:16 nsiena: 料理レシピを cabocha で形態素・構文解析。名詞, 動詞, 形容詞に分類。オノマトペ vs 用語で、tf*idf を求める。評価実験で妥当性を確認。 #sigdd #ipsj
16:32:16 mie_treky: 料理レシピ推薦システム「オノマトペロリ」はCookpadで実証しているのね。そりゃそうね。そういやぁ、「600万人の女性に指示される「クックパッド」というビジネス」を読み始めたところ。シンクロニシティ。 #ipsj #sigdd
16:34:16 nsiena: 二つの推薦アプローチ。1) レシピの構造をトップダウンで検索, 2) 同ボトムアップに。1) は、「シャキシャキ」「サラダ」→「レタス」「サラダ」のように置き換えていく。2) は、構造図の末端から特徴値を合成して異なるレシピを比較。 #sigdd #ipsj
16:37:16 mie_treky: テキストアートといい、オノマトペといい、大学ではビジネス系では予想もつかないキーワード、モチベーションから研究をスタートしてるんですね。ここで、有効性は何？なんて無粋な質問をしちゃでめですよね。 #ipsj #sigdd
16:41:16 mie_treky: オノマトペの具体例「ふわふわ」、「しゃきしゃき」、「ぴりっ」ってのが、発表者の個性と相まっていいなぁ。外人女子大生なんですが、日本語がとっても上手。 #ipsj #sigdd
16:44:16 mie_treky: オノマトペと食材の関係しか分析していないが、料理方法との関係は？→これからの研究課題。ナイスアンサー。 #ipsj #sigdd
16:46:16 nsiena: [レシピの概念構造は同どうモデリングされるのかしら。確かに複雑だ。] #sigdd #ipsj

「異種XMLデータに対するファセット検索手法の提案」

16:49:16 nsiena: 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。XPath や XQuery は文書構造を理解しなければ、キーワード検索では検索意図が明確でなければ適切に検索できない。ファセット検索で解決! #sigdd #ipsj
16:53:16 ceekz: タイトルを見て発表者が想像できたので、調べてみたら当たりだったｗ RT @nsiena 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。
16:53:16 nsiena: 異種構造が混合した XML データを探索対象とする。オブジェクト、ファセットを形式的定義。DTD から導出されるスキーマ木から、クラス (繰返し出現する要素), クラスの属性 (クラスの子孫要素か属性でテキストを含むもの) を定義。 #sigdd #ipsj
16:55:16 nsiena: [スキーマは、木でなくグラフになるから、適用範囲がかなり限定されそう。クラスの属性は、混合内容は考えないのかしら。] #sigdd #ipsj
16:59:16 nsiena: ファセットとキーの組で適合オブジェクトを検索。全ての組の検索結果の共通部分が解候補。講演の残りはシステムの概要。 #sigdd #ipsj
17:12:17 mie_treky: XMLDBとRDBを使っているけれど、XMLDBだけでできるんじゃないの？→アグリゲーションの計算でやっているので、XMLDBだけだと重くなるので（発表者）。スケッチあるいはキーバリューによる解決も考えている（共同研究者の天笠先生）。#ipsj #sigdd

終了〜懇親会〜帰宅

17:18:17 nsiena: おっしまーい #sigdd #ipsj
- 17:18:17 KKI: @nsiena おつかれさまでしたー

17:20:17 mie_treky: 今村主査より、「11/28にデジタルドキュメントシンポジウム＠東洋大（白山）を開催しますので、こちらへも参加ください。」 #ipsj #sigdd

24:06:00 nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj
24:10:00 nsiena: 今回の心残りは、 @repeatedly さんとあまり話せなかったこと。あちこち話し込んでしまって、気付いたら話し損ねた ><;
| 24:20:00 repeatedly: @nsiena 今日はお疲れさまです。まあおそらくまだまだ会えるチャンスはあるはずなので、その時は宜しくお願いします。
25:38:01 mie_treky: お疲れさま〜。楽しかったですね。RT @nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj

25:50:01 nsiena: 表層的に見た文書や、文書の利用上の問題に対する興味は薄いけれど、文書化における理念とか、その構造のモデル/メタモデルとかの方には興味がある。のかな。

25:55:01 nsiena: 今日は、いろんな人に出会えた。ここで @yohei さんに会えたのは予想外だった ^^;
25:58:01 mie_treky: 私も。RT @nsiena: 今日は、いろんな人に出会えた。ここで @yohei さんに会えたのは予想外だった ^^;