一文定義
Soraとは、OpenAIが2024年に公開したテキストから動画を生成するAIモデルです。最大60秒の高品質動画を生成でき、物理法則を理解した一貫性ある映像表現が特徴です。
詳細解説
Sora(ソラ)とは、OpenAIが2024年2月に発表し、同年12月に一般公開したテキストから動画を生成するAIモデルです。「空(Sora)」の名の通り、これまでにない映像生成の可能性を象徴するモデルとして大きな注目を集めました。
Soraが重要な理由は、最大60秒の高品質・高解像度動画を単一のテキストプロンプトから生成できるという、それまでのAI動画生成モデルを大幅に超える能力を示したためです。複数キャラクターの一貫した描写、カメラワークの制御、物理的に自然な動き(液体の流れ・光の反射等)が実現されました。
技術的には、画像の拡散モデルを動画(時間次元を持つシーケンス)に拡張した「Video Diffusion Transformer(DiT)」をベースとしています。動画をパッチに分割してTransformerで処理する設計が採用されています。課題としてハルシネーション(物理法則の破綻・オブジェクトの突然の消失等)が指摘されており、悪用リスクへの対策(deepfake防止のためのC2PAメタデータ付与等)も議論されています。RunwayML Gen-3・Google Lumiere・Stability AI Video等が競合です。
参考情報・出典
- ▸Sora: Creating video from text - OpenAI— OpenAI (2024)(参照日: 2026-02-26)
- ▸Video generation models as world simulators— OpenAI Technical Report (2024)(参照日: 2026-02-26)