韓国代表AIでまた「独自技術」論争…ネイバーのモデルが「中国オープンソース」活用
このニュースをシェア
【01月14日 KOREA WAVE】韓国政府が推進する「独自ファウンデーションモデル(大規模AI)」プロジェクトにおいて、「完全自社開発(from scratch)」ではないとの指摘がまたもや浮上した。今回は、ネイバークラウドの生成AIモデルが、中国アリババのオープンソースモデルの一部を使用していたことが判明し、議論を呼んでいる。
業界関係者によれば、ネイバークラウドが開発した「HyperCLOVA X Seed 32B Sync」モデルは、中国アリババの大規模言語モデル「Qwen 2.5」のビジョンインコーダの重み(ウェイト)とのコサイン類似度が99.51%、ピアソン相関係数が98.98%を記録。極めて高い一致を示しており、既存モデルを微調整(ファインチューニング)して使っていた可能性が高い。
さらにオーディオインコーダについてはファインチューニングすらせず、オリジナルをそのまま使用していたとみられている。インコーダとは、入力データを意味のあるトークンに変換する、数千万以上のパラメータで構成されるAIの「理解エンジン」であり、単なる補助的なフィルターではない。
このような使用実態により、ネイバーの最新モデルは音声・画像処理の主要部分で中国製オープンソースに依存しているという指摘が出ている。
西江大学AI学科のチャン・ドゥソン教授は「画像・音声データはテキスト以上に大量の学習データが必要なため、優れた公開モデルを再利用するのは業界の一般的な慣行」としつつも、「通常これを“from scratch”とは呼ばない。政府が『完全自社開発』を明確に義務付けたわけではなく、これは評価の際に加点・減点の判断材料となる事項であり、ネイバーが虚偽を述べたとは言えない」とも語った。
ネイバークラウドもQwen 2.5のビジョン・オーディオインコーダを使用したことは認めており、「最新グローバルトレンドへの適応とシステム最適化を考慮した戦略的選択」であったと説明している。同社関係者は「モデルの“頭脳”である言語処理部分は100%自社開発しており、そこにおいては独自の競争力を確保している」と強調。テクニカルレポートでも関連情報を明記していると述べた。
(c)news1/KOREA WAVE/AFPBB News