一文定義
Stable Diffusionとは、Stability AIが開発・公開したオープンソースの高品質テキストトゥイメージモデルです。商用利用可能かつローカル実行もでき、画像生成AIの普及に大きく貢献しました。
詳細解説
Stable Diffusion(ステーブルディフュージョン)とは、Stability AI・CompVis・RunwayMLが共同開発し、2022年8月にオープンソースで公開されたテキストトゥイメージ生成モデルです。潜在拡散モデル(Latent Diffusion Model)をベースとした高品質な画像生成が可能です。
Stable Diffusionが画期的だった理由は、高性能な画像生成モデルが初めてオープンソースで公開されたことです。それまで商用クラウドサービス経由でしか使えなかった高品質な画像生成が、個人のPCでもローカル実行できるようになり、画像生成AIの民主化が加速しました。
現在はStable Diffusion 1.5・2.1・XL・3など複数バージョンがあり、Automatic1111やComfyUIなどのUIツール、LoRAやControlNetなどの拡張技術と組み合わせることで、特定スタイルへのfine-tuningや構図制御など高度なカスタマイズが可能です。Hugging Faceのdiffusersライブラリを通じた利用も広く行われています。
参考情報・出典
- ▸High-Resolution Image Synthesis with Latent Diffusion Models— arXiv / Rombach et al. (2022)(参照日: 2026-02-26)
- ▸Stable Diffusion - Wikipedia— Wikipedia(参照日: 2026-02-26)