【7月27日 AFP】生体を構成する主成分であるタンパク質の構造をAI(人工知能)に学習・予測させたこれまでで最も網羅的なデータベースが先週、オンライン上で公開された。画期的な成果は「生物学研究を根本から変える」と注目を集めている。

 公開されたのは、ヒトのゲノム(全遺伝情報)によって発現するタンパク質、約2万種類のデータベース。米IT大手グーグル(Google)の親会社アルファベット(Alphabet)傘下のAI開発企業ディープマインド(DeepMind)と、欧州分子生物学研究所(EMBL)が無料で一般公開した。

 生物の細胞はどれもタンパク質が絶え間なく発する指令によって、健康を維持したり、感染を防いだりするための機能を発揮させる。

 ゲノムとは異なり、プロテオーム(発現し得る全タンパク質)は遺伝的指令や環境の刺激によって常に変化している。

 タンパク質が細胞内でどのように作用するか、つまり、「折りたたみ」と呼ばれる立体構造のどの形に落ち着くかを理解する研究は、何十年にもわたって科学者たちを魅了してきた。

 しかし、それぞれのタンパク質の正確な機能を実験によって直接明らかにすることは非常に困難で、過去50年間で、ヒトのプロテオームのアミノ酸のうちわずか17%しか明らかになっていない。アミノ酸はタンパク質の構成成分。

 今回のデータベースを構築するために科学者らは、アミノ酸配列に基づいてタンパク質の形状を正確に予測する最新の機械学習プログラムを使用。既知のタンパク質構造17万種類のデータベースをAI「アルファフォールド(AlphaFold)」に学習させ、人間で発現し得る全タンパク質のうち58%の構造を予測した。

 遺伝性疾患や抗菌剤耐性の研究など、応用できる可能性は極めて大きいと期待される。(c)AFP/ Patrick GALEY