オープンAIが公開した映像生成人工知能(AI)「ソラ」で作った中国の祭り映像の一部の姿=オープンAI公式ブログ(c)news1
オープンAIが公開した映像生成人工知能(AI)「ソラ」で作った中国の祭り映像の一部の姿=オープンAI公式ブログ(c)news1

【02月27日 KOREA WAVE】漫画では100万の大軍が対決する大規模な戦争場面を、クリエイターの努力と時間によって描き出すことができる。映画は大規模な人員を動員したり、精巧なコンピューターグラフィック(CG)を使ったりして、これを実現する。CGに数百億ウォンが投入された例があるほど、コスト負担が大きい。

こうしたやり方を選択せざるを得なかったメディア産業が、転換期を迎えた。実際、同じ映像を制作する人工知能(AI)が登場したためだ。

従来のCGは、人の手で一つ一つ描き出すか、3次元物体をモデリング、レンダリングし、物理的なインタラクションを組み込むなどの作業が必要で、多くのリソースとコストがかかった。

「アバター:水の道」は異星人の惑星で起きることを描いており、ほとんどの場面にCG技術が活用された。制作費として約4700億ウォン(1ウォン=約0.11円)以上が投入されたと推定される。特に、米紙ニューヨーク・タイムズの報道によると、物体が水中で動く場面を再現するのに約2週間のコンピューターシミュレーションが必要だった。

Googleの映像生成人工知能モデル「ルミエール」を活用して、元画像の服を変更した事例。一番左がオリジナル=ルミエール(c)news1
Googleの映像生成人工知能モデル「ルミエール」を活用して、元画像の服を変更した事例。一番左がオリジナル=ルミエール(c)news1

最近、米オープンAIは映像生成AI「ソラ(Sora)」で、リアリティの高い高解像度映像をわずかなコマンドで作り出した。

オープンAIは「ソラは生成された単一ビデオ内でキャラクターと視覚スタイルを正確に維持するさまざまなシーンを作ることができる。ソラはユーザーが要求した内容だけでなく、これらの内容が実際の世界にどのように存在するのか理解する」と説明した。

例えば、利用者が具体的事項を全て入力しなくても「ゴールドラッシュ当時、カリフォルニアの歴史記録映像」のようなフレーズを入力すれば人々が馬に乗って通った当時の時代背景を反映した映像が作られる。

グーグルも先月、「ルミエール」(Lumiere)という映像生成AIモデルを発表した。ルミエールはコマンドに基づいた映像を生成するだけでなく、従来の映像の中の登場人物の服を変えたり、一部が隠されたり、削除された部分を復元したりすることも可能だ。映像生成を越えて編集の領域でも生成AI活用の可能性が証明されたのだ。これは再撮影コストの削減や表現可能性の拡大につながる。

ただ、オープンAIとグーグルは悪用される可能性などを理由に、一般ユーザーには公開しなかった。ソラは現在、映像や人工知能関連の専門家を対象にフィードバックを受ける段階だ。両社はAI合成物表示・探知技術など悪用防止策を模索している。

ソラとルミエールが広く使われているのは、副作用防止の他にも技術高度化が必要な状況だ。

生成された映像の一部は、指の関節が不自然であるなど、細かく見た時にぎごちない点がある。また、オープンAIによると、物理的に不可能だったり、因果関係に反する映像が作られたりする場合もある。例えば、前の場面ではクッキーをかじったが、後でクッキーがそのまま残っている映像が出たりもする。

業界の一部ではテキスト、イメージ生成AIでも同様の問題が発生するが、徐々に改善されているため、映像領域でも限界を克服できると見ている。

(c)news1/KOREA WAVE/AFPBB News