Google DeepMindが開発した音楽生成モデル「Lyria 3」が、2026年2月18日からGeminiアプリにβ版として統合された。テキストか画像を入力すれば30秒のカスタム楽曲を作れる機能だ。

これは何の話?

画像や動画の生成AIはすでに普及しつつあるが、音楽生成は一般ユーザーにとってまだ遠い存在だった。GeminiがLyria 3を組み込むことで、専門的な音楽知識がなくてもAIに曲を作ってもらう体験が日常のアプリで可能になる。

記事概要インフォグラフィック

Lyria 3の機能と操作方法

テキストから楽曲を作ることも、写真や映像をアップロードして曲を生成することもできる。テキストの場合、ジャンルやムード、記憶などを文章で伝えると歌詞入りまたはインストゥルメンタルのトラックが生成される。例として「アフロビートスタイルで母へのノスタルジックな曲を」といった指示が使われている。画像・動画の場合は、アップロードしたコンテンツの雰囲気に合った歌詞付きトラックが生成される。

生成されるトラックは30秒で、カスタムカバーアートがNano Bananaによって生成され付属する。ダウンロードまたはシェアリンクで共有できる設計だ。

旧モデルからの改善点

旧モデルからの主な改善点は3点ある(Googleの発表による)。歌詞を自分で用意しなくてもプロンプトから自動生成される点、vocal・tempo・styleなどのパラメータをより細かく制御できる点、より写実的で音楽的に複雑な楽曲が作れる点だ。

AI生成の証明——SynthID

生成された音楽には全件SynthIDと呼ばれる知覚不可能な電子透かしが埋め込まれる。これにより、その音声がGoogle AIによって生成されたかどうかを後からツールで確認できる。SynthIDはGoogle DeepMindが開発したAI生成コンテンツの認証システムで、音声・画像・テキスト・動画に対応している。

利用条件・展開状況

対象は18歳以上のユーザーで、複数言語に対応している。有料プランで制限が緩和される(詳細な制限数はGoogleの発表に記載なし)。YouTubeのDream TrackでもLyria 3が導入され、米国でのサービスに続き、他の国のYouTubeクリエイターへの展開が始まっている。

詳細インフォグラフィック

なぜ重要か

「30秒の楽曲」という制約はクリエイティブな長尺用途には小さいが、SNSのショート動画やメッセージに添えるパーソナライズされたBGMのニーズには十分かもしれない。画像生成AIが個人のクリエイティブ活動を変えたように、音楽生成AIが一般化すると、BGM制作やSNSコンテンツ制作のフローが変わる可能性がある。

SynthIDの全件統合はAI生成コンテンツの透明性確保という観点でも意味がある。生成AIが作ったコンテンツにデフォルトで証明可能な識別情報を付与するという考え方は、規制当局や権利者にとっても注目すべきアプローチだ。

So What?

Lyria 3のGemini搭載は、AI音楽生成をマニア向けではなく一般ユーザー向けの製品に統合した最初の大手事例のひとつだ。30秒という短さは現時点での制約でもあるが、「何かを伝えるための音楽をAIに作ってもらう」という使い方のハードルを大きく下げる。音楽生成AIが画像生成と同様に日常化するまでには時間がかかるかもしれないが、その入り口がGeminiという主流プラットフォームに開いた意味は小さくない。SynthIDの全件統合という取り組みとあわせて、Googleのアプローチは技術開発と安全基盤の整備を同時に進める姿勢を示している。

出典と日付