Googleは、生成AI「Gemini」上でも利用可能な音声要約機能「Audio Overview」の提供を開始しました。

引用元:New ways to collaborate and get creative with Gemini
AIがテキストを“耳で聴けるコンテンツ”に変換
Googleは2025年3月18日、自社ブログで、生成AI「Gemini」に音声要約機能「Audio Overview」を新たに統合したことを発表しました。これまでNotebookLMで提供されていたこの機能は、Googleドキュメントやスライドなどの資料をポッドキャスト形式の音声コンテンツへと自動変換するもので、今回からGeminiでも利用可能となりました。
Audio Overviewの特徴は、単なる読み上げではなく、2人のAIホストによる会話形式でコンテンツを解説するスタイルにあります。ドキュメントの内容を要約し、関連するトピックをつなげ、テンポの良い対話を通して情報をわかりやすく届けてくれます。そのため、ユーザーはまるで本物のポッドキャストを聴いているような自然な音声体験を得られます。
リサーチ資料や長文のメールスレッドなど、さまざまな文書をアップロードするだけで、耳から効率的に情報を理解できる便利なツールとして活用できるようになります。今後は、テキストさえあれば誰でも音声コンテンツを作れるようになり、ポッドキャストやナレーションなどの発信手段がより身近なものになるでしょう。
AIホストとは
AIホストは、人工知能によって生成された“話し手”のことを指します。単なる読み上げではなく、人間らしい声や会話の流れを再現し、ポッドキャストや動画、ナレーションなどで司会や案内役のように情報を伝える役割を担います。近年は自然なイントネーションや感情表現も可能となり、実在の人物に近いコミュニケーションを実現しています。音声コンテンツの自動化やパーソナライズにおいて、AIホストは重要な存在となっています。
参照元:New ways to collaborate and get creative with Gemini
ポッドキャストの量産時代、来ちゃうかもね。