一文定義
ディフュージョンポリシーとは、ロボット制御に拡散モデルを応用した手法で、人間のデモンストレーションから複雑な操作スキルを学習でき、ロボット工学とAIの融合を代表する注目技術です。
詳細解説
ディフュージョンポリシー(Diffusion Policy)とは、拡散モデル(Diffusion Model)の確率的生成プロセスをロボットの行動ポリシー学習に応用した手法です。2023年にChi et al.によって提案されました。
従来の模倣学習(Imitation Learning)では、人間のデモンストレーションから平均的な行動を学ぼうとするため、複数の合理的な選択肢がある状況(マルチモーダルな行動分布)の扱いが困難でした。ディフュージョンポリシーはノイズから徐々に行動を精製するプロセスを使い、このマルチモーダル性を自然に表現できます。
具体的な活用例として、部品の組み立て・食材の切断・布の折りたたみなど、高度な手先の器用さが求められる操作タスクにおいて、従来手法を大幅に上回る成功率が報告されています。また、視覚情報(カメラ画像)と力覚情報を組み合わせたビジュオモーター制御への応用も進んでいます。
ロボット基盤モデル(Robot Foundation Model)の研究が加速する中で、ディフュージョンポリシーはデータ効率の高い汎用ロボット制御への重要なアプローチとして注目されています。
参考情報・出典
- ▸Diffusion Policy: Visuomotor Policy Learning via Action Diffusion— arXiv / Chi et al.(参照日: 2026-02-26)