視覚補助音声案内サービス「SULLIVAN PLUS」をスマートフォン内で実行した姿(右)と今年8月に発売予定のサービスを搭載したメガネ(c)news1
視覚補助音声案内サービス「SULLIVAN PLUS」をスマートフォン内で実行した姿(右)と今年8月に発売予定のサービスを搭載したメガネ(c)news1

【03月09日 KOREA WAVE】世界最大の移動通信展示会「モバイルワールドコングレス(MWC)」がスペイン・バルセロナで開催され、韓国のスタートアップ企業が革新的なAI技術を携えて挑戦した。特に、未来の有望企業を発掘するスタートアップ特別展示「4YFN(4 Years From Now)」には、韓国から78社が参加し、音声認識やAI音声合成技術などの最先端技術を披露した。

スタートアップ企業「TUAT」は、AIを活用した視覚補助アプリ「SULLIVAN PLUS」を展示した。このアプリは、視覚障害者が文字や物体、風景を認識し、音声で説明を受けられる機能を備えている。文字認識、色彩識別、顔認識、紙幣識別など多様な機能を提供し、AIカメラを通じてリアルタイムで情報を伝える。

2025年8月には、この技術を搭載したスマートグラスも発売予定で、メガネ型デバイスを装着するだけで、周囲の情報を音声で伝えるシステムが実現する。

「Hudson AI」は、感情をリアルに表現するAI音声合成技術を発表した。同社のAIは、従来の単調な機械音声ではなく、自然で人間らしい抑揚を持つ音声を生成する。特に、スポーツ実況の自動翻訳・多言語吹き替えサービスを提供し、2025年3月から北米のスポーツチャンネルで野球中継の実況翻訳を手掛ける。

現在、9言語に対応し、音声合成にかかる時間は約15分。2025年後半にはリアルタイム対応を目指し、ライブストリーミング機能を強化する。

また、同社のAIエージェントは、自然な会話を可能にする音声AIを搭載。デモでは、機械的な音声ではなく、温かみのあるトーンで受け答えするAIカスタマーサポートが披露された。

「VTouch」は、特定の音声のみを識別するAI音声認識技術「WIZPR RING」を発表した。指輪型デバイスを使用し、装着者の音声コマンドだけを認識する仕組みだ。

例えば、指輪に口を近づけて「1時間後に会議のリマインダーを設定」と話すと、スマートフォンに自動で予定が登録される。運転中やスマートフォンを操作できない状況でも、遠隔操作が可能になる。

この技術は韓国語、英語を含む20カ国語に対応しており、AIとの音声対話の利便性を飛躍的に向上させることが期待される。

(c)news1/KOREA WAVE/AFPBB News