【9月22日 AFP】コンピューターに単語の識別だけではなく、言語の意味認識までさせる次世代のセマンティック自然言語処理システムを開発する米Cognition Technologiesが前週、この言語認識の基礎となる「意味マップ」の使用許諾を開始した。

 この「意味マップ」は、米国の一般的な大卒者が知っている10倍以上の語彙を提供し「世界最大の意味マップ」と呼ばれているだけでなく、コンピュータープログラムに対し、人間の脳とより近い認識方法で時制や文脈から単語を「理解」させる。開発には30年が要された。

 同社のスコット・ジャラス(Scott Jarus)CEOは「このマップは明らかに、Web 3.0とも呼ばれるセマンティックWebの基礎的な部分を構成する」と胸を張る。すでに英語のほとんどすべての単語や熟語、慣用句などの意味を覚えさせたという。

■期待される次世代Web 3.0へのマップ活用

 セマンティック技術が検索エンジンに適用されると、検索結果は単にオンライン上で検索語に一致した単語を表示するのではなく、検索者が探そうとしている内容を表示することができる。例えば「哀愁を帯びた鳥の鳴き声」と入力すると、さまざまな種類の鳥の鳴き声に、悲しみの表現を連関させて検索し、表示するといった具合だ。

 次世代ウェブのWeb 3.0では、ネット上の膨大な情報の中からユーザーの興味に即したものを探し当てることができる人工知能(AI)「エージェント」を開発することが目標とされている。「当社の意味マップは、ユーザーが探そうとしている事柄の概念を正確に理解した上で、ユーザーの興味に当てはまりそうな事柄を常に探そうとする。プル型ではなくプッシュ型のAIエージェントだ」とジャラスCEO。

 同社の意味マップは既に、大量の判例・判決を検索する法曹界向けのe-ディクショナリー「LexisNexis Concordance」で使用され、米連邦裁判所の半世紀以上におよぶ資料を集めたCognition's Caselawプログラムに採用されている。また、医療データベースでも広く活用されている。オンライン百科事典ウィキペディア(Wikipedia)の意味認識にも貢献しているという。

■マイクロソフトらもセマンティック技術に着手

 競合他社もセマンティック技術を独自に開発中だ。

 米マイクロソフト(Microsoft)は7月、自然言語検索エンジンの開発ベンチャー、Powerset(本社:サンフランシスコ)を買収した。

 マイクロソフトは自社の検索サービス「ライブサーチ(Live Search)」でPowersetの検索技術を利用し、グーグル(Google)やヤフー(Yahoo)の後塵を拝している検索サイト連動広告の市場シェアで追い上げを図る。

 Powersetの「自然言語検索」技術は質問形式での入力や、ひとつながりの語句をもとに検索結果を表示するもの。単語に対する検索結果を表示する既存の検索エンジンとは異なる技術を用いている。

 マイクロソフトの「サーチ、ポータル&アドバタイジング・プラットホーム・グループ」担当上級副社長サティヤ・ナデラ(Satya Nadella)氏は、「現在は、1度目の検索で望む結果を得られない場合が全検索の3分の1に上る」と説明。今の検索エンジンは「shrub(低木)」と「tree(木)」が関連性のある単語であることを理解できず、また、各サイトで「cancer」が「癌(がん)」と「かに座」のどちらの意味で使用されているかを判別することができないと指摘した。(c)AFP