「Web とデータベースに関するフォーラム 2009」二日め参加メモ

Web とデータベースに関するフォーラム 2009 (WebDB Forum 2009)」、初日 (=昨日) は参加できず。最初のセッションと、特別セッション後から続けて開催される「第149回 データベースシステム研究発表会」はメモ流してなかった。ので、リブログもなし。

#webdb OR #webdbf OR #dbs149 くらいで検索すれば、両イベントの主立ったつぶやきは把握できるかな。

  • 10:21:10 http://twitter.com/nsiena nsiena: WebDBF2009 の #hashtag は #webdbf じゃなくて #webdb なのか。気付かなかった ^^;
  • 11:21:11 http://twitter.com/nsiena nsiena: 「セッション3B : XML・ストリームデータ」は、メモってたら分からなくなりそうなので聞くのに注力してた。けど、細部を理解できず。感覚的には分かったと思うので、後で良く呼んでおこう。 #webdbf
  • 11:26:11 http://twitter.com/nsiena nsiena: しまった。 #webdbf2009 と入れて削ったけど #webdbf にしてしちゃった。 #webdb だった。どうもややこしい。国際ワークショップの WebDB と WebDBF (と WEB+DB PRESS)。

セッション 4A: Web検索

サーチエンジンにおける検索意図の周期的変化の検出」
  • 11:36:11 http://twitter.com/nsiena nsiena: 「サーチエンジンにおける検索意図の周期的変化の検出」: 検索意図を、検索結果ページで最初に行なった行動 (選択した検索結果の順位や、再検索などの行動) で得られると仮定。検索意図 (最初の行動) 毎の頻度の割合を時間変化をフーリエ変換でスペクトル分析。 #webdb 4A-2
  • 11:42:11 http://twitter.com/nsiena nsiena: 「単一型, 複数型 = { 非時間変動型, 時間変動型 = { 非周期変動型, 周期変動型 } } に分類。それぞれについて、検索意図に基づいて分析した結果のいろいろ。それなりに傾向が見られる。これに基づいて、検索性能の向上や適切な広告提示ができるだろう。 #webdb 4A-2
  • 11:46:11 http://twitter.com/nsiena nsiena: .o[結果はそれなりっぽい。一方で、ほとんどの検索者が、最上位の検索結果をクリックする、という調査結果が多かったりするのだけどので、検索意図をうまく抽出できるのかしら。 #webdb 4A-2
「順序関係を維持したWeb検索結果の網羅的閲覧」
  • 11:53:11 http://twitter.com/nsiena nsiena: 「順序関係を維持したWeb検索結果の網羅的閲覧」: 「informational な検索が対象。複数のページを必要とするが、どれを選ぶかの問題とページ間で重複が多いという問題。閲覧量を押さえつつ、網羅量を向上させることが目標。 #webdb 4A-3
  • 12:05:12 http://twitter.com/nsiena nsiena: 「検索結果の上位から順序を保存して選択していく。既に選んだ出力候補と比べ、新規度・網羅度が閾値以上なら出力候補に追加。/ 既存検索エンジンと比較して考察 → ページに含まれるトピックが少ない方が良い結果になりそう。検索条件によって適切な閾値が異なりそう。 #webdb 4A-3
  • 12:08:12 http://twitter.com/nsiena nsiena: .o[検索結果をグルーピングしてグループ別に表示するというのもあった。グループから代表ページを選択するという方法も。上位から取って行くので、次第に重複が増えて行くと推測。全体最適になるのかしら。全体のバランスを考えて選択する余地がありそう。 #webdb 4A-3

X1, X2, X3, ... とある時に、X1, X2 でなく、X1, X3 と選択した方が、全体最適になることもあるだろう、ということ。

また、各ページの扱う話題が X1 = { a, b }, X2 = { b, c }, X3 = { c, d } の時。差分があるので、X1, X2, X3 が選択されうる。でも、X1, X3 で網羅できるから、重複を除去しきれていないとも言える。もっとも、削りすぎてしまっても情報獲得しにくくなる虞もあるけれど。

表彰式

  • 13:11:13 http://twitter.com/nsiena nsiena: ただいま表彰式 #webdb

特別セッション3: 「インターンシップと産学連携の可能性」

  • 13:32:13 http://twitter.com/nsiena nsiena: 特別セッション3: 「インターンシップと産学連携の可能性」 企業 (MSRA, NTT CS研, mixi) と経験者 3名 <http://db-event.jpn.org/webdbf2009/program.html> #webdb
  • 13:41:13 http://twitter.com/nsiena nsiena: .o[パネルの逐次メモは流さないでおく。公開していいのか分からないので。思ったことくらいはメモるかも。/ 論文は公表されたものだからいいだろうという、個人的な判断。 #webdb
  • 13:59:13 http://twitter.com/nsiena nsiena: mixi の企業紹介で時間を使いきりそう…… ^^; #webdb
  • 14:03:14 http://twitter.com/nsiena nsiena: 研究者養成のためのインターンシップと、開発者養成のためのインターンシップでは。やること、目標、学ぶことは違うだろうな。MSR と NTT CS研は前者、mixi は後者 (の上流工程) だね。 #webdb
  • 14:10:14 http://twitter.com/nsiena nsiena: 今回は、研究インターンシップに偏ってる感じ。優秀 or 活動的な人の事例なんでないかしら。立派なサンプル。企業に就職する人が多いので、将来の業務体験という意味では開発現場を経験する方がいいこともある。両者は繋がっているので、区切る必要はないけれど。 #webdb