うろぐ

インターネットサービス&デジタル家電&デジタルカメラ&パソコンのレビュー

NTT R&D Forumへの参加はアジャイルメディア・ネットワークのブロガーツアーとして実施されました。
このため、ブース以外の場所で特別に担当者からの話を聞くことができました。

サイバースペース研究所(テキスト)

自然言語処理の研究。
テキスト中の地名の所在地を特定するアルゴリズム。例えば「今日は日本橋の三越に買い物に行く」の「日本橋」を東京都中央区日本橋と特定する技術です。ちなみに「日本橋は」大阪をはじめ日本各地に存在する地名です。全国の中から中央区の日本橋を特定するアルゴリズムを開発しています。
テキスト中の評判・表現(「かわいい」など)や感性表現(「ふあふあ」など)が指す対象を特定する「評判検索」や「ぐにゅなび」などの開発を行っています。

ひとつなぎ

gooラボで公開を始めている新しいサービス「ひとつなぎ」。
人のつながりをクリックするだけで直感的に見ることが出来きます。
「友達」や「交流」といった情報を検索できるサービスです。
描画はFlashで出力されています。
goo らぼ「ひとつなぎ」

人物はウィキペディアを参考にしているので、人物の範囲に限界があります。
画像も歴史上の人物では十分にそろっていません。

ブログで旬の話題、有名人と有名人の関係を「どんな関係」なのかを、タイムリーに表示します。

どんな技術で実現をしているの?
2つの手がかりを総合的に判断して特定しています。
goo らぼ「ひとつなぎ」

人名が誰なのかを特定。
人物データベースをあらかじめ用意。人名はウィキペディアから取得。

旬の情報が次々と現れるブログ記事を解析して、人と人の関係を自動抽出。

パソコンやメーカー名など商品名や技術マップが欲しいという要望があがってきています。
他にも技術リスト、つまり誰が誰から影響を受けたかなどのマップが欲しいという要望もあります。

ユーザーの傾向をデータ分析しているか?
例として織田信長をあげると、信長の「どの関係」や「どんな人」がクリックされているかをログとして取得しています。将来的にはパーソナライズ化の可能性もあり得るそうです。

表示の問題。
一つのノードとして表示するところまでは出来ていません。
信長から貼られている「明智光秀」ですが、その光秀から貼られているリンクが10以上有った場合の表現の仕方に課題があります。数が多いとごちゃごちゃしてして見にくくなってしまうからです。
このため、現状では6本に制限しています。

関係の強弱は現在は対応していません。
しかし、太さや長さなどを変えようとする研究は進めています。
方向性までを入れてしまうと、システムがまだ対応出来ないそうです。

織田信長の父が織田信秀、子が織田信秀だが、見た目には織田信長から「父」で織田信忠が表示されるとう問題が現在起きています。
goo らぼ「ひとつなぎ」

表示される線は6本。見やすさを重視した結果です。

開発当初はクロスブラウザの問題を回避するためにFlashを採用したが、iPadやiPhoneはFlashに対応していないので、マルチデバイス対応も視野に入れている。

毎日アップデート。
今日から昨年の今日までの1年を含んでいます。つまり2009/2/22-2010/2/23までです。翌日になると2009/2/23-2010/2/24が取り込まれることになります。
旬の情報が中心なので歴史的人物の変化はほとんどありません。
芸能人の「つきあっている」や「結婚した」などリアルタイム性が要求される話題の変化が多いです。

次は...。

コミュニケーショントリガを書きます。

2月 25th, 2010

Posted In: NTT R&D 2010, 参加レポート・ブログ・ブロガーミーティング

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です