一文定義
一貫性モデルとは、拡散モデルを蒸留して1〜数ステップで高品質な画像を生成できる高速生成モデルです。LCM(Latent Consistency Model)が代表例で、SDXL比10〜50倍高速なリアルタイム画像生成を実現します。
詳細解説
一貫性モデル(Consistency Models)とは、拡散モデルの多ステップ生成プロセスを大幅に短縮し、1〜4ステップ程度で高品質な画像を生成できるようにした生成モデルのファミリーです。OpenAIのYang Songらが2023年に提案しました。
核心的なアイデアは「一貫性関数(Consistency Function)」の学習です。拡散プロセスは同一の「ODE軌道(確率微分方程式の解軌道)」上の任意の点を、常に同じ元データに写像するという一貫性を持つべきだという発想です。この一貫性制約を学習することで、任意のノイズレベルから一回の順伝播で高品質な画像を生成できます。
主要な実装として、Consistency Distillation(CD)は既存の拡散モデルを蒸留して一貫性モデルを作る方法で、Consistency Training(CT)は一貫性モデルを最初から訓練する方法です。LCM(Latent Consistency Models)はStable Diffusionの潜在空間に適用し、4ステップ以下での高品質生成を実現しました。LCM-LoRAを使えば任意のSD派生モデルに高速推論を追加できます。
実用的な価値として、リアルタイム画像生成(毎秒数枚以上)を可能にし、インタラクティブなAIアート制作ツール、ストリーミング型画像編集、低スペック環境でのローカル生成などのユースケースを実現します。拡散モデルのサンプリング効率問題を解決する重要なブレイクスルーです。
参考情報・出典
- ▸Consistency Models— arXiv / Song et al.(参照日: 2026-02-26)
- ▸Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference— arXiv / Luo et al.(参照日: 2026-02-26)