【10月14日 CNS】今年最もホットなテクノロジー関連のトピックは何かと問われれば、多くの人が大規模言語モデル(LLM)を挙げるだろう。年初にチャットGPT(Chat GPT)が引き起こした大規模言語モデルの波から、関連テクノロジー企業による大規模言語モデル製品の稼働に至るまで、「百モデル大戦」は次々とアップグレードが進み、それによって引き起こされる人工知能(AI)の「激震」はまだ続いている。

 技術進歩とイノベーションの熱気の中、人びとの注目は、われわれは一体どのような大規模言語モデルが必要なのか、どのような大規模言語モデルがAIの最終的な答えなのかという点に集中している。

 中国工業・情報化部傘下の市場調査会社の賽迪顧問が発表した「2023大規模言語モデル現状調査報告書」によれば、2023年7月末までに国外では合計138、中国では130の大規模言語モデルが登場している。

 チャットGPTがもたらした衝撃があまりにも強烈だったため、自然言語対話を主な機能とする大言語モデル製品が、多くのテクノロジー企業の第一の選択肢となり、一時的に大規模言語モデルの代名詞とさえなった。

 しかし、大規模言語モデル自体にこだわらず、業界の具体的な課題に向き合うといった別の道を選ぶ企業もある。

 例えば、山東エネルギー集団(Shandong Energy Group)が、華為技術(ファーウェイ、Huawei)の「盤古」鉱山大規模言語モデルを採掘、掘削、機械、輸送、通信などの九つの主要ビジネスシステムと21のシーンに全面的に導入した結果、済寧2号炭鉱は毎年8000トン以上の精炭を生産することができる。精炭生産量が1000分の2上昇したことにより、約2000万元(約4億847万円)の増収が見込まれる。

「百モデル大戦」は多くの可能性を引き出したが、負の影響も多くもたらした。多くのメーカーが大規模言語モデルに群がる中で、品質が不均一な製品が人びとをかく乱し、その中には法律や道徳上のリスクも潜んでいることに、人びとは警戒すべきだ。

 また、具体的な業界に導入する場合、異なる業界の異なる特性が大規模言語モデルの精度、安全性、専門性などにさらに高い要求を求めている。

 競争の激化につれ、現在の大規模言語モデル自体が持つ欠陥の他、中国における関連データ、計算力、アルゴリズムなどの面での苦境も次第に明らかになってきた。

 例えば、訓練データについて、清華大学(Tsinghua University)のコンピュータ科学部の唐杰(Tang Jie)教授は、現在中国のデータ開放の態勢は強くはなく、「大多数の機関はまだ自分たちの手元にデータを握っている」と指摘している。

 また、「百モデル大戦」は高い計算力を必要とするため、すでに逼迫(ひっぱく)している中国の計算力リソースはさらなる負荷に直面している。

 アルゴリズムについて、AI企業の小冰のCEO、李笛(Li Di)氏は、大規模言語モデルの訓練の際には、パラメータの数より、エンジニアリングプロセス中のチューニングこそが真の試練だとみている。(c)CNS/JCM/AFPBB News