ビジュアルチャットGPTの使用例(写真=Microsoft Research Asiaギットハブキャプチャー)(c)MONEYTODAY
ビジュアルチャットGPTの使用例(写真=Microsoft Research Asiaギットハブキャプチャー)(c)MONEYTODAY

【03月17日 KOREA WAVE】米オープンAI社が近く超巨大AI言語モデルGPTの次のシリーズであるGPT-4.0を公開する。マイクロソフト(MS)ドイツ法人最高技術責任者(CTO)アンドレアス・ブラウンは10日、GPT-4発売が迫っていると明らかにした。MSはまだ公式の立場を示していないが、ブラウンCTOの発言を訂正してもいない状態だ。

GPT-4.0は一つのモデルが自然言語からイメージ・音声など多様な形態のコンテンツを入力・生産できるマルチモーダル(Multimodal)形態をとる。

これまで言語モデルはGPT、イメージモデルはダリ(Dall-e2)など、希望する結果によってAIモデルが違っていたが、これからは1カ所で一括処理できる。

マルチモーダル超巨大AIモデル(MLM)はAI産業のもう一つのターニングポイントになる。

フューチャープランニング研究所のキム・イェウン所長は「GPT-4.0は一つのモデルでテキストだけでなくイメージなどすべてのサービスができる」と説明した。

業界はマルチモーダルAIモデルが最近公開された「ビジュアルチャットGPT」と類似した方式だと見ている。

ビジュアルチャットGPTは「MSリサーチアジア」が公開したイメージ生成AIサービスで、AIと対話しながらイメージを生成・変更することが可能だ。画像を説明するテキストを抽出することもできる。

(c)MONEYTODAY/KOREA WAVE/AFPBB News