米俳優のスカーレット・ヨハンソン氏の声がOpenAIの合成音声「Sky」に似ているとして、大きな論争が巻き起こっています。ヨハンソン氏は、この新しいAIシステムのデモを聞いた際に、その声が自身のものに「驚くほど似ている」と感じ、法的措置を検討すると表明しました。
事件の経緯
ヨハンソン氏は、友人や家族、そしてニュースメディアから「Sky」の声が彼女の声に似ているとの指摘を受け、彼女自身もデモを確認し音声が似ていることを確認したようです。これについて彼女は「ショックを受け、怒りを感じた」と述べ、OpenAIに対して法的措置を講じ、同社に説明を求めています。実は以前、ヨハンソン氏のもとには、「(ヨハンソン氏の)声を『Sky』に使用したい」とOpenAIのCEOであるサム・アルトマン氏から依頼があったようで、彼女はこのオファーを断っていると声明を出しています。
OpenAIの対応
OpenAIのサム・アルトマン氏は、「Sky」の声はスカーレット・ヨハンソン氏の声を模倣したものではなく、別の声優によるものであると説明しました。同社は、ヨハンソン氏の声に似ているとされたことに対して謝罪し、混乱を避けるために「Sky」の使用を一時停止すると発表しました 。同時に声明も発表し、「我々はAIの声が意図的に有名人の特徴的な声を模倣すべきではないと信じています」と述べました。
AI技術の問題点
AIを用いた合成音声は以前から注目を浴びてきました。技術的な革新性に注目が集まっていたのはもちろんのことですが、悪用の可能性という問題にも焦点が当たっていました。このような合成音声は声を利用されてしまった人のプライバシー侵害や肖像権の侵害につながる可能性があります。特に、有名人の声は無許可で商業利用されるリスクが高まっており、彼らの声を利用して偽情報を拡散する所謂ディープフェイクの問題もあります。そして今現在、このようなディープフェイクのコンテンツや広告は多くのメディアプラットフォームにあふれています。コンテンツの受け手、作り手ともに、AI技術へのさらなる理解と利用に際してのリスク認識や倫理観の向上が求められています。
ChatGPTとは
ChatGPTは、OpenAIが開発した高度な自然言語処理モデルであり、GPT-4アーキテクチャに基づいています。大量のデータをもとにトレーニングされ、人間のように自然な対話を行うことができます。さまざまな質問に答えたり、文章を生成したりする能力があります。音声機能にも対応しており、ユーザーはテキスト入力に加えて音声入力を使って対話することが可能です。この機能は、音声認識技術とテキスト読み上げ技術を組み合わせることで実現されています。ビジネス、教育、日常生活など、幅広い用途で利用されています。
参考:How the voices for ChatGPT were chosen
今回は異議申し立てしたから良かったのかもしれないけど、気づかないでもAI活用できてしまうから怖いよね。