世界初のチベット語のAI大規模言語モデルがラサで発表
このニュースをシェア
【3月18日 CGTN Japanese】世界初のチベット語に高度に対応する人工知能(AI)大規模言語モデル(LLM)のディープ・ザン(DeepZang)が3月15日に中国南西部にあるチベット自治区のラサで発表されました。
ディープ・ザンはチベット覚羅デジタル産業管理が独自開発したもので、中国で初めて国の生成AIの登録を完了したチベット語の大規模言語モデルです。
同日に行われたディープ・ザンおよびそのインテリジェントアプリの発表会で、ディープ・ザンの事業を手掛けたテンジンノルブ(旦増羅布)氏は、「このオープンソースの大規模言語モデルは多言語・マルチモーダルに対応した中国初の民族言語AIオープンプラットフォームであり、80種類以上の言語サービスを実行し、『聞く、話す、翻訳する、見る、考える』の機能を実現した」と説明しました。ディープ・ザンのアプリも同時にリリースされており、多くの業界に導入される予定です。
テンジンノルブ氏によると、覚羅デジタルは2018年に「チベット語・中国語バイリンガル+AI」という発展計画を早くも確定しました。同社はそれから4年間をかけて、7000万件近くの高品質なチベット語と中国語の平行コーパス(翻訳の見本一覧)を構築しました。同時に、チベット語の三大方言地域における大規模な音声収集として、ウーツァン(衛蔵)方言1万500時間、カム(康巴)方言1万時間、アムド(安多)方言1万時間を収録し、中国における規模最大で精度の高いチベット語音声データベースを構築しました。
世界記録認証機構(WRCA)はディープ・ザンの発表会で「世界初のチベット語大規模言語モデル」の認定証明を授与しました。(c)CGTN Japanese/AFPBB News