一文定義
Classifier-Free Guidance(CFG)とは、拡散モデルで条件付き生成を制御するテクニックで、分類器なしにテキストプロンプトへの準拠度をガイダンススケールで調整します。値が高いほどプロンプトに忠実な生成結果が得られます。
詳細解説
Classifier-Free Guidance(CFG)とは、拡散モデルにおいてテキストなどの条件(プロンプト)への準拠度を制御するためのテクニックです。従来の分類器ガイダンスでは、別途訓練した分類器を使って生成方向を誘導する必要がありましたが、CFGはその分類器を不要にし、無条件生成と条件付き生成を組み合わせるシンプルな仕組みで同等以上の効果を実現します。
仕組みを説明します。CFGでは、モデルが同時に「プロンプトなし(無条件)の予測」と「プロンプトあり(条件付き)の予測」を行います。最終的な生成方向は「無条件予測 + ガイダンススケール × (条件付き予測 − 無条件予測)」という式で求められます。ガイダンススケール(guidanceスケール、CFGスケール)を大きくするほどプロンプトへの忠実度が上がり、小さくすると多様性が増しますが忠実度は下がります。
実際の利用シーンでは、Stable DiffusionのCFGスケールは通常7〜12程度が標準です。DALL-E・Imagen・Fluxなど主要な画像生成モデルほぼ全般でCFGが採用されています。ネガティブプロンプトはCFGの無条件サイドに入力することで、避けたい要素を効果的に排除できます。
CFGは学習段階でも適用され、一定割合でプロンプトをドロップアウトさせることでモデルが無条件生成も学習します。これによりInference時のCFG計算が可能になります。
参考情報・出典
- ▸Classifier-Free Diffusion Guidance— arXiv / Ho & Salimans(参照日: 2026-02-26)
- ▸High-Resolution Image Synthesis with Latent Diffusion Models— arXiv / Rombach et al.(参照日: 2026-02-26)