基礎概念

ディフュージョンポリシー

ディフュージョンポリシー

一文定義

ディフュージョンポリシーとは、ロボット制御に拡散モデルを応用した手法で、人間のデモンストレーションから複雑な操作スキルを学習でき、ロボット工学とAIの融合を代表する注目技術です。

詳細解説

ディフュージョンポリシー(Diffusion Policy)とは、拡散モデル(Diffusion Model)の確率的生成プロセスをロボットの行動ポリシー学習に応用した手法です。2023年にChi et al.によって提案されました。

従来の模倣学習(Imitation Learning)では、人間のデモンストレーションから平均的な行動を学ぼうとするため、複数の合理的な選択肢がある状況(マルチモーダルな行動分布)の扱いが困難でした。ディフュージョンポリシーはノイズから徐々に行動を精製するプロセスを使い、このマルチモーダル性を自然に表現できます。

具体的な活用例として、部品の組み立て・食材の切断・布の折りたたみなど、高度な手先の器用さが求められる操作タスクにおいて、従来手法を大幅に上回る成功率が報告されています。また、視覚情報(カメラ画像)と力覚情報を組み合わせたビジュオモーター制御への応用も進んでいます。

ロボット基盤モデル(Robot Foundation Model)の研究が加速する中で、ディフュージョンポリシーはデータ効率の高い汎用ロボット制御への重要なアプローチとして注目されています。

参考情報・出典

最終更新: 2026-02-26← 用語集一覧へ

AIスキルだけでなく、自分と未来を再設計する

生成AI活用力を体系的に習得し、自己理解・キャリアデザインを深め、志を同じくする仲間と共に学ぶ場がここにあります。

AIリブートアカデミーを見る