【3月5日 東方新報】阿里巴巴(アリババ、Alibaba)の研究開発機関「達摩院(DAMO)」が「デマ判別器」を開発したとして、ネット上で話題になっている。記者は先ごろ、太平洋の反対側にいる開発者の李泉志(Li Quanzhi)氏に取材した。

 李氏は達摩院のNLP(自然言語プログラミング)チームのキーパーソン。中国の清華大学(Tsinghua University)卒業後、米国で自然言語処理の博士号を取得し、現在は達摩院シアトルオフィスに勤務する。それ以前は、ロイター通信(Reuters)の情報処理担当者として、膨大なネット情報をふるい分け、第一線の記者たちに信頼できる情報を提供していた。

 このデマ判別器は、先日の国際計算言語学会(The Association for Computational Linguistics)主催の自然言語処理の国際的ワークショップ「SemEval」で、正確率81%という新記録を打ち立てた。

 李氏によれば、ニュースがデマか否かを判断するには3段階で進めるという。まず、情報の最初の出所を探し当て、情報源をあらゆる角度から解析し、信頼性を判断する。次に、その情報が流されたすべての経路の信頼性を解析する。さらに、ニュースの主要な論拠を摘出し、権威性のある情報データベースと付き合せ、論理の矛盾の有無を検証する。もし論理的関連性が無ければ減点とする。

 李氏は「人には基本的な判断能力はあるが、即時にニュースを解析し大きな情報データベースと付き合せて検討するようなことは困難。人工知能(AI)にはそれができる」と語る。

 デマ判別器は、大量の学習訓練による蓄積が必要で、長い時間がかかる。これは自然言語処理のあらゆる技術を総合しなければできないものだからだ。

 李氏は、「まだ多くの学習訓練が必要だし、社会的な理解も必要だが、将来はもっと広い範囲に応用ができるようになるだろう」と考えている。例えば、研究論文の盗用や作家の代筆の疑いの真偽判定から、デマの大本の出所を特定し警察に通報することもできる。

「このデマ判別器には、人の本心、例えば反語や風刺、比喩などを把握する訓練が必要。これは機械には難しいことだが、訓練を重ねることできっと可能になる」(c)東方新報/AFPBB News