一文定義
フローマッチングとは、確率的フローを使ってノイズからデータへの変換経路を直接学習する生成モデル技術です。DDPMより学習が安定し、少ないステップで高品質な生成が可能で、Stable Diffusion 3・Fluxなど最新モデルに採用されています。
詳細解説
フローマッチング(Flow Matching)とは、生成モデルの学習パラダイムの一つで、単純な確率分布(例:ガウスノイズ)からデータ分布へと連続的に変換する「フロー」を学習します。従来の拡散モデル(DDPM)が逆拡散過程を徐々に学習するのに対し、フローマッチングは直線的・効率的な変換経路を直接学習するため、より高速で安定した生成を実現します。
技術的な仕組みを説明します。フローマッチングはベクトル場(velocity field)を学習し、ノイズからデータへの最適輸送経路を近似します。Continuous Normalizing Flows(CNF)の理論を基盤としながら、Conditional Flow Matching(CFM)というシミュレーションフリーな方法で効率よく訓練できます。これにより100〜1000ステップが必要だったDDPMに対し、10〜20ステップ程度で同等品質の生成が可能です。
採用事例を紹介します。Stable Diffusion 3はフローマッチングをベースとし、テキスト整合性と画像品質を大幅に向上させています。Black Forest LabsのFluxシリーズもフローマッチングを採用し、高解像度・高品質な画像生成を実現しています。Meta Voiceboxは音声生成にフローマッチングを適用した事例です。
拡散モデルとの比較では、フローマッチングは学習の安定性・推論速度・サンプル品質の三点で優れており、2024年以降の最先端生成モデルのデファクトスタンダードになりつつあります。
参考情報・出典
- ▸Flow Matching for Generative Modeling— arXiv / Lipman et al.(参照日: 2026-02-26)
- ▸Stable Diffusion 3: Scaling Rectified Flow Transformers for High-Resolution Image Synthesis— arXiv / Esser et al.(参照日: 2026-02-26)