一文定義
テキストプロンプトや鼻歌からAIが楽曲・BGM・効果音を自動生成する技術。Suno・Udio・MusicLMが代表例。
詳細解説
AI音楽生成とは、テキストプロンプト・ハミング・鼻歌・楽器音などを入力として、AIが楽曲・BGM・ジングル・効果音を自動生成する技術です。拡散モデル・Transformer・GAN等の生成AIアーキテクチャをオーディオ領域に適用したものです。
代表的なサービスとして、SunoとUdioが「ボーカル付き楽曲」の生成で注目を集めています。「アップテンポなポップソング、桜の散る春の情景」のようなテキストから数十秒の完成度の高い楽曲を数秒で生成できます。GoogleのMusicLM・MusicFX・Meta's MusicGen・Stability AIのStable Audioも代表的なモデルです。
ゲームBGM・広告音楽・ポッドキャストのオープニング・映像BGMなど、著作権フリーの音楽素材を必要とする用途での活用が進んでいます。
課題として、学習データへの著作権問題が深刻で、Suno・UdioはRIAAから訴訟を受けています。また生成された楽曲の著作権帰属も未整備の部分が多く、商用利用時は各サービスの利用規約の確認が必要です。
参考情報・出典
- ▸MusicLM: Generating Music From Text – Google Research— Google Research(参照日: 2026-02-26)
- ▸Suno AI— Suno(参照日: 2026-02-26)
最終更新: 2026-02-26← 用語集一覧へ