一文定義
テキストや画像を入力としてAIが動画を自動生成する技術。Sora・Runway・Pika等が代表例。エンタメ・広告制作を変えつつある。
詳細解説
動画生成(Video Generation)とは、テキストプロンプトや参照画像・動画を入力として、AIが数秒〜数十秒の動画クリップを自動生成する技術です。拡散モデルをベースとした時系列モデルが主流となっており、2024年以降に急速に品質が向上しました。
代表的なモデルとして、OpenAIのSora(最大1分の高品質動画)、Runway Gen-3・Pika・Kling・GoogleのLumiere・Veo、Stability AIのStable Video Diffusionなどがあります。テキストから動画(Text-to-Video)のほか、画像から動画(Image-to-Video)・動画スタイル変換・動画補間なども可能です。
広告・マーケティング・映像制作・ゲーム・教育コンテンツなど幅広い分野での活用が期待されています。従来は専門的なCGソフトや撮影機材が必要だった動画制作が、テキストプロンプトで実現できるようになりつつあります。
一方で、ディープフェイク動画の生成・政治的フェイク映像・著作権問題など倫理的課題も大きく、AIウォーターマーキングによる生成コンテンツの識別技術の整備が急務となっています。
参考情報・出典
- ▸Sora – OpenAI— OpenAI(参照日: 2026-02-26)
- ▸Runway Gen-3 Alpha— Runway(参照日: 2026-02-26)