「情報処理学会 第73回 デジタルドキュメント研究会」聴講メモ
行こうかいくまいか、迷っていたけれど、イベント参加月間(謎)ということで、参加してきた。文中の [ほにゃらら] は、個人的な感想。例によって、一部、誤字の修正、参照関係の調整有り。
開会前
- 05:42:05
nsiena: うぅ、外が明るくなってしまった。終わらなかったけれど、出かける前にちょっとだけ横になろう。ちょっとだけ。
- 06:48:06
nsiena: むくり
- | 06:57:06
zakkas783: @nsiena おはようございます・・・って睡眠時間1h!? ・・・つhttp://bit.ly/4nifGD
- 06:49:06
mie_treky: 今日は情報処理学会デジタルドキュメント研究会at東大本郷に参加します。招待講演は話題のHTML5です。当日でも参加できますのでご興味がある方はどうぞ。#ipsj #sigdd http://tinyurl.com/yb2j6ru
- 06:51:06
mie_treky: #ipsj のハッシュタグがうまく機能しません。泣)
- 06:54:06
mie_treky: あれ?できた。では、改めて本日の情報処理学会デジタルドキュメント研究会のプラグラムを。http://tinyurl.com/yb2j6ru #ipsj #sigdd
- 09:48:09
nsiena: おしごと中断して、移動開始する
- 11:08:11
nsiena: #event 「情報処理学会 第73回 デジタルドキュメント研究会」参加中。
「Web API マッシュアップのための E4X サービス」
- 11:09:11
nsiena: 「Web API マッシュアップのための E4X サービス」: マインドマップなプレゼンだ。 #sigdd [※ここで分割 → 「邂逅」へ]
- 11:26:11
nsiena: ここまで、E4X の話。E4X ウェブサービスを試作。SOAP型 でなく REST型を想定。簡単に書けるよ。今後、熟練者でなくても作れる、汎用マッシュアップアーキテクチャを狙っていく予定。各種PL用エージェントサービスを作って、各種PLの良いところを活かす。 #sigdd
- 11:26:11
nsiena: [ここで仮定してるのは、RESTful というより、POX/HTTP ということかも。JavaScript の XML ライブラリではだめなのかしら。] #sigdd
- 11:27:11
mie_treky: 最初は常連の大学の先生。マインドマップを使っての発表いい感じ。学会発表では初めて見ました。先生、いつもながら、力入りすぎです。リラックス、リラックス。
- 11:28:11
mie_treky: あ、タグ付け忘れました。とほほ。
邂逅
運営裏話
「消去を含むデジタルコンテンツのライフサイクル管理」
- 11:37:11
nsiena: 「消去を含むデジタルコンテンツのライフサイクル管理」: 情報漏洩対策の必要性から、企業内・オフライン顧客・協力会社など組織をまたがる情報取扱方法の分析、自動消去機能を持つ USB メモリを用いた安全なデータ持出しソリューションの紹介。#sigdd
- 11:41:11
nsiena: 情報漏洩対策の現況と関連技術。DRM を応用した ERM : コンテンツや人ごとにポリシーが異なるので運用困難。 #sigdd
- 11:41:11
nsiena: DLP : NW上の移動時、保存時、エンドポイントでの利用時など場面ごとのポリシーを管理可能だが、
大領大量のデータのどれを機密とするかが手動であることが多く大変。 #sigdd - 11:49:11
nsiena: コンテンツを持ち運ぶシーンを分析。USB の利用シナリオを対象とする: A) 一時的な交換, B) 出張先や自宅からオフィスへ, C) オフィスから出張先や自宅へ。課題: 1) 消去忘れ, 2) USB分室, 3) ローカルHDDに保存 (+ネットへ流出)。 #sigdd
- 11:53:11
nsiena: 一般利用者としては、普通に使えるが、自動的に消えることが不安。消去タイミングが分かるようにして欲しい、顧客の情報を扱うのは不安、など心理的課題が障壁。ユーザの慣れとユーザビリティの改善が必要そう。
休憩
「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」
- 13:32:13
nsiena: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」: 形態素解析や読み上げで
詳がい障害となるテキストアートを抽出。同じ記号列が出現しやすいことから、圧縮を利用することで既存手法を改善する。 #sigdd #ipsj - 13:36:13
mie_treky: 午後の部始まりました。午後一番のテーマは「情報抽出」です。ハッシュタグはこちらです→ #ipsj #sigdd
- 13:57:13
mie_treky: 「テキスト圧縮を用いた言語に依存しないテキストアート抽出法」:ですが、読み上げソフトなどでテキストアートがどの程度邪魔になるのでしょうか?ちょっと、実感わきません。 #ipsj #sigdd
「Webページを対象としたXMLデータ抽出手法の検討」
- 14:06:14
nsiena: 「Webページを対象としたXMLデータ抽出手法の検討」: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
- 14:13:14
nsiena: 例示データを種に、ブートストラップ手法を用いて辞書を拡張していく。既存手法は、多項関係を二項関係に分解して抽出し、関係グラフを作成し、最大クリークを探索して、多項関係を再構築する。XML データのレコードは対象外。 #sigdd #ipsj
- 14:14:14
mie_treky: @amagasa どっちですか? RT @nsiena: ウェブ上の情報源からのレコードデータ抽出手法を用いて、XML データの抽出を試みる。[かな? 抽出元データが XML なのか、抽出結果を XML にするのか、どっちかしらん] #sigdd #ipsj
- 14:16:14
nsiena: 提案アプローチでは、XMLデータを関係表に写像する。まず XML スキーマを獲得する。存在しない場合は、既存手法でスキーマ推論で。次に、既存手法を用いてスキーマに基づいて関係表へ写像する。更に、主キーとそれ以外のキーのペアに分解して、二項関係群へ。 #sigdd #ipsj
- 14:28:14
mie_treky: 研究のスコープをきちんと説明することは大切ですよね。#sigdd #ipsj
- 14:31:14
mie_treky: 元のXMLデータからスキーマ情報を抽出して、関係表へ写像後、二項関係へ分解して従来手法を利用してからXMLデータを再構築することで、より広い検索結果が得られるようにした仕掛けかな? #sigdd #ipsj
「オノマトペロリ:オノマトペを利用した料理推薦システム」
- 16:22:16
nsiena: 「オノマトペロリ:オノマトペを利用した料理推薦システム」: 「とろとろ」「ピリリ」といった表現 (オノマトペ) を考慮して、料理を推薦。名前がかわいい。 #sigdd #ipsj
- 16:23:16
nsiena: バッテリがほぼ空になったので、2 本めに交換。これであと何時間か戦える。PC が戦えても、あたしが戦えない(弱) #sigdd #ipsj
- 16:28:16
mie_treky: オノマトペとは擬声語で、擬音語と擬態語の総称。フランス語(onomatop?e)なんだ。英語ではオノマトピア/オノマトペア(onomatopoeia)ですか。知らなかったなぁ。 #ipsj #sigdd
- 16:31:16
nsiena: 料理レシピを cabocha で形態素・構文解析。名詞, 動詞, 形容詞に分類。オノマトペ vs 用語で、tf*idf を求める。評価実験で妥当性を確認。 #sigdd #ipsj
- 16:32:16
mie_treky: 料理レシピ推薦システム「オノマトペロリ」はCookpadで実証しているのね。そりゃそうね。そういやぁ、「600万人の女性に指示される「クックパッド」というビジネス」を読み始めたところ。シンクロニシティ。 #ipsj #sigdd
- 16:34:16
nsiena: 二つの推薦アプローチ。1) レシピの構造をトップダウンで検索, 2) 同ボトムアップに。1) は、「シャキシャキ」「サラダ」→「レタス」「サラダ」のように置き換えていく。2) は、構造図の末端から特徴値を合成して異なるレシピを比較。 #sigdd #ipsj
- 16:37:16
mie_treky: テキストアートといい、オノマトペといい、大学ではビジネス系では予想もつかないキーワード、モチベーションから研究をスタートしてるんですね。ここで、有効性は何?なんて無粋な質問をしちゃでめですよね。 #ipsj #sigdd
- 16:41:16
mie_treky: オノマトペの具体例「ふわふわ」、「しゃきしゃき」、「ぴりっ」ってのが、発表者の個性と相まっていいなぁ。外人女子大生なんですが、日本語がとっても上手。 #ipsj #sigdd
- 16:44:16
mie_treky: オノマトペと食材の関係しか分析していないが、料理方法との関係は?→これからの研究課題。ナイスアンサー。 #ipsj #sigdd
- 16:46:16
nsiena: [レシピの概念構造は
同どうモデリングされるのかしら。確かに複雑だ。] #sigdd #ipsj
「異種XMLデータに対するファセット検索手法の提案」
- 16:49:16
nsiena: 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。XPath や XQuery は文書構造を理解しなければ、キーワード検索では検索意図が明確でなければ適切に検索できない。ファセット検索で解決! #sigdd #ipsj
- 16:53:16
ceekz: タイトルを見て発表者が想像できたので、調べてみたら当たりだったw RT @nsiena 「異種XMLデータに対するファセット検索手法の提案」: 本日最後の発表。
- 16:53:16
nsiena: 異種構造が混合した XML データを探索対象とする。オブジェクト、ファセットを形式的定義。DTD から導出されるスキーマ木から、クラス (繰返し出現する要素), クラスの属性 (クラスの子孫要素か属性でテキストを含むもの) を定義。 #sigdd #ipsj
- 16:55:16
nsiena: [スキーマは、木でなくグラフになるから、適用範囲がかなり限定されそう。クラスの属性は、混合内容は考えないのかしら。] #sigdd #ipsj
- 16:59:16
nsiena: ファセットとキーの組で適合オブジェクトを検索。全ての組の検索結果の共通部分が解候補。講演の残りはシステムの概要。 #sigdd #ipsj
- 17:12:17
mie_treky: XMLDBとRDBを使っているけれど、XMLDBだけでできるんじゃないの?→アグリゲーションの計算でやっているので、XMLDBだけだと重くなるので(発表者)。スケッチあるいはキーバリューによる解決も考えている(共同研究者の天笠先生)。#ipsj #sigdd
終了〜懇親会〜帰宅
- 24:06:00
nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj
- 24:10:00
nsiena: 今回の心残りは、 @repeatedly さんとあまり話せなかったこと。あちこち話し込んでしまって、気付いたら話し損ねた ><;
- | 24:20:00
repeatedly: @nsiena 今日はお疲れさまです。まあおそらくまだまだ会えるチャンスはあるはずなので、その時は宜しくお願いします。
- 25:38:01
mie_treky: お疲れさま〜。楽しかったですね。RT @nsiena: 二次会を解散して新宿なぅ。楽しかったよ、みなさんありがとー ^^= #sigdd #ipsj