株式会社DeNAは、スマートフォン上でリアルタイム音声変換を実現する生成AI技術を独自に開発し、多様な用途への活用を目指すために協業パートナーの募集を開始したと発表しました。
開発されたリアルタイム音声変換AIの特徴
今回開発された技術は、音声を受け取るAIと変換音声を出力するAIのペアにより構成され、リアルタイムで動作します。従来、スマートフォンでの音声変換のリアルタイム運用は困難でしたが、計算量を小さくする技術の開発により、高品質かつ低遅延での動作が可能になったとのことです。こうした技術進歩のおかげで、PC向けソフトウェアや専用機器がなくても利用可能なポータブル音声変換AIの開発を実現ています。
また、このリアルタイム音声変換AIは「スマホで低遅延」「高品質」「低コスト」を同時に実現しています。この速度、品質、コストという三つの相反する要素の改良に成功したことにより、個人利用から業務用途まで幅広く活用できるとのことです。
音声変換AI技術の社会的意義
DeNAはこの技術を用いて、話し手の特性を隠して個人情報を保護する「入力話者情報の秘匿」と、最適な声を選択する「出力話声の最適化」という二つの要素で社会に貢献するとしています。VTuberや、ジェンダーに囚われないコミュニケーションの場の提供、防犯対策、ヘルスケア、公共交通機関のアナウンスなど、多様な領域での利用が可能だということです。
今後の展望
DeNAは、市場の成長と共に増大する音声変換技術への需要を予測し、その需要に応じた中長期的な事業展開を計画しているとのことです。これには、音声変換技術の精度と耐久性を高める取り組み、プロセスの効率化による処理負荷の削減、そして幅広いデバイスへの対応などが含まれます。さらに、声の特性を活かした新たなプロダクトやサービスの創出も視野に入れ、技術開発を加速させていくとのことです。
また、DeNAは音声の権利を重視し、「DeNAグループAIポリシー」に基づいてAIの適切な利用を推進するとのことです。声優を含む関係者の権利保護に配慮し、声の模倣や濫用への技術的対策を継続的に検討していく予定があるとしています。
株式会社ディー・エヌ・エー(DeNA)とは
株式会社ディー・エヌ・エー(DeNA)は、日本の大手モバイルインターネットサービス企業です。1999年に創業され、主にモバイルゲーム、eコマース、スポーツマネジメント、自動車関連サービスなど幅広い分野で事業を展開しています。特にモバイルゲーム分野では、多くのヒット作を生み出しており、国内外で高い評価を受けています。DeNAは技術革新とユーザーエクスペリエンスの向上を目指して、AIやヘルスケア技術などの最先端分野にも積極的に取り組んでいます。
参照元:生成AIによるリアルタイム音声変換技術を開発 スマホで低遅延に動作し、様々なシーンでの利用が実現
どんなおっさんのダミ声も、萌え萌えキュンキュンな美少女の声に早変わりだね。