【2月28日 AFP】49種類のビデオゲームを自力で学習し、人間のプレイヤーを上回るスコアを出すことに成功した人工知能(AI)ソフトウエアシステムの研究が25日、英科学誌ネイチャー(Nature)に掲載された。発表したのは米グーグル(Google)傘下のAI開発企業ディープマインド(DeepMind)だ。

 共同開発者のデミス・ハサビス(Demis Hassabis)氏は「経験から直接学ぶことによって、さまざまな課題を習熟することのできる、史上初めての汎用(はんよう)学習システムだ」と述べた。

 自ら学び、試行錯誤した「記憶」を保管し、行動を適応させて次の課題を達成する汎用ロボットの未来像がまた一歩近づいたと言える。このような汎用ロボットは、自動車の運転から休日の予定作り、さらには科学研究まで、あらゆる用途に使うことができると、研究チームは述べている。

■学習し、適応し、上達する

 人間の学習プロセスを参考に開発された人工知能「ディープQネットワーク(deep Q-networkDQN)」は1980年代から、米ビデオゲーム会社「アタリ(Atari)」のゲーム機に、最小限のプログラミングだけで投入された。

「DQNが得られる情報は(画面上の)ピクセルとゲームの得点だけで、課せられた目標は、できるだけ高い得点をとること」とハサビス氏はネイチャーの動画の中で説明する。「それ以外には、いったいどういう種類のゲームをしているのか、コントローラーが何をしているのか、ゲーム中の何を操作しているのかさえ、全く知らされていない」