ディフュージョンポリシーとは？わかりやすく解説

一文定義

ディフュージョンポリシーとは、ロボット制御に拡散モデルを応用した手法で、人間のデモンストレーションから複雑な操作スキルを学習でき、ロボット工学とAIの融合を代表する注目技術です。

詳細解説

ディフュージョンポリシー（Diffusion Policy）とは、拡散モデル（Diffusion Model）の確率的生成プロセスをロボットの行動ポリシー学習に応用した手法です。2023年にChi et al.によって提案されました。

従来の模倣学習（Imitation Learning）では、人間のデモンストレーションから平均的な行動を学ぼうとするため、複数の合理的な選択肢がある状況（マルチモーダルな行動分布）の扱いが困難でした。ディフュージョンポリシーはノイズから徐々に行動を精製するプロセスを使い、このマルチモーダル性を自然に表現できます。

具体的な活用例として、部品の組み立て・食材の切断・布の折りたたみなど、高度な手先の器用さが求められる操作タスクにおいて、従来手法を大幅に上回る成功率が報告されています。また、視覚情報（カメラ画像）と力覚情報を組み合わせたビジュオモーター制御への応用も進んでいます。

ロボット基盤モデル（Robot Foundation Model）の研究が加速する中で、ディフュージョンポリシーはデータ効率の高い汎用ロボット制御への重要なアプローチとして注目されています。

参考情報・出典

▸
Diffusion Policy: Visuomotor Policy Learning via Action Diffusion— arXiv / Chi et al.（参照日: 2026-02-26）

ディフュージョンポリシー

一文定義

詳細解説

参考情報・出典

関連用語

AIスキルだけでなく、自分と未来を再設計する