(c)news1
(c)news1

【02月02日 KOREA WAVE】世界的に生成型AI(人工知能)学習データの著作権問題が提起される中で、韓国政府が著作権保護技術開発に着手した。政府は生成型AI学習データ追跡技術を開発する一方、記事の類似度判断技術を開発する計画だ。

IT業界によると、文化体育観光省は生成型AIに学習させた著作物に対する追跡・管理技術を2026年完了目標で4月に開発に入る。生成型AIが出した成果物から学習データを追跡できる技術も開発する。文体省は12日、公募によって事業者を選定し、4月に着手する予定だ。

さらに、文体省は生成型AIが作成した記事と既存のニュース記事間の類似度判断技術も2025年までに開発する。剽窃論文を見抜く「コピーキラー」のような技術でニュース記事の特徴を分析し、これを数値化して、報道機関が生成型AIが作成した記事と既存の自社記事がどの程度類似しているかを比較できるようにする。

文化体育観光省がこのような技術開発に着手した理由は、生成型AI学習データの著作権問題が絶えず提起されているためだ。生成型AIは主にインターネットに掲載された情報を学習する。この情報自体には著作権があるが、生成型AIが該当情報の著作権まで学習することはない。

生成型AIの著作権問題は特にニュース記事の分野で多く発生する。ニュース記事は他の情報より相対的に客観性が高く、学習データとして価値が高い。これに対し、生成型AI開発が活発な米国では、現在メディア各社がビッグテック企業を相手に著作権侵害訴訟を起こしている。

国内でもネイバーの生成型AI「ハイパークローバーX」が国内のマスコミの記事を無断で学習するという疑惑が持たれている。ネイバーはコンテンツ提携契約を結んだという立場だが、韓国新聞協会は「生成型AI学習にニュース記事を活用するのは提携範囲を超えるもの」とし、公正取引委員会に意見書を提出した。

業界によると、ネイバーが国内のメディアとニュース記事使用契約を簡単に結ぶことができないのは、ハイパークローバーXがニュース記事をどれだけ学習するのか明確にわからないからだ。生成型AIが出した成果物にニュース記事の寄与度がどの程度なのか、今まで出てきた技術では判断が不可能だ。

韓国新聞協会はネイバーなどAI企業が、国内のマスコミとライセンス契約を締結すべきだという立場だ。最近、声明文でこのように明らかにした協会は「AI企業は正当なライセンスを通じて高品質コンテンツの安定的な供給を受けることができる。学習に使われたデータ公開も義務化する必要がある」と話した。

(c)MONEYTODAY/KOREA WAVE/AFPBB News