2025年4月29日、GoogleはAI情報整理ツール「NotebookLM」に搭載されている音声要約機能「Audio Overviews(日本語名:音声概要)」の対応言語を、日本語を含む50以上に拡大したと発表しました。本機能は英語版が2024年に公開されており、その精度の高さが注目されていました。

引用元:blog.google
音声要約機能「音声概要」
音声概要は、ユーザーがアップロードした資料をもとに、AIが要点を抽出し、2人のAIホストによる自然な会話形式の音声として出力する機能です。ポッドキャストのような自然な音声で情報を聞けるのが特長で、もともとは英語のみに対応していましたが、今回のアップデートで日本語を含む50以上の言語に対応しました。
ユーザーはNotebookLMの設定から「出力言語」を選択することで、音声概要やチャットの応答を任意の言語に切り替えることができます。この多言語対応は、Googleの最新AI「Gemini 2.5 Pro」の高度な音声処理と、テキストや音声などさまざまな情報を同時に理解できる技術によって実現されています。
下記は「オトナル、音声マーケティングの最前線をお届けするウェブメディア『AUDIO MARKETING INSIGHTS』を公開」というウェブページを実施にNotebookLMで音声概要機能で生成したものです。
教育やビジネスシーンでの活用事例
Googleは、教育現場での具体的な活用例として、「アマゾンの熱帯雨林」に関する授業を準備する教師の事例を紹介しています。教師はポルトガル語のドキュメンタリー、スペイン語の論文、英語のレポートなど複数の言語資料を生徒に共有します。生徒はそれらをNotebookLMにアップロードすることで、自分が理解しやすい言語で音声概要を生成し、効率的に学習できます。
また、ビジネスの場面でも活用は進んでいます。たとえば、企業が保有するホワイトペーパーや商品説明書をNotebookLMに読み込ませれば、AIがその内容を音声化しポッドキャスト形式で配信するといった使い方も可能です。プロのナレーターを起用しなくても、資料ベースの音声コンテンツを手軽に制作・配信できるという点で、音声マーケティングや営業支援ツールとしても注目されています。
Gemini 2.5 Proとは
Gemini 2.5 Proは、Googleが開発した最新の生成AIモデルで、2025年時点における「Gemini」シリーズの上位版にあたります。高精度なテキスト理解はもちろん、音声、画像、コードなど複数の情報形式を同時に処理できる能力(マルチモーダル性能)を備えており、NotebookLMをはじめとするAIツールの高度な要約・会話・音声出力機能を支えています。高性能ながら、より軽量なモデルとの切り替えも柔軟にできる点が特長です。
参照元:NotebookLM の音声概要が日本語を含む 50 以上の言語で利用可能に
ポッドキャスト作るハードル、もはや“0”説。