本發(fā)明公開了一種序列撥推采樣歸置策略迭代生成學(xué)習(xí)方法,用于在有限的工作空間、豐富的碰撞和高度耦合的情況下生成連續(xù)的推送動作,將隨機分散在有限容器內(nèi)的任意形狀的物體自主歸置,從而為未來的未知物體擠出盡可能多的空間,自主實現(xiàn)最大化裝箱。本方法采用任務(wù)和運動規(guī)劃思想,將任務(wù)學(xué)習(xí)抽象為一個兩層問題。高層任務(wù)規(guī)劃使用基于近端策略優(yōu)化(PPO)的強化學(xué)習(xí)進(jìn)行順序推送決策。在底層運動規(guī)劃中,采用傳統(tǒng)的軌跡線性規(guī)劃方法結(jié)合碰撞檢測生成機器人推送操作。本方法能夠以高效靈活的方式排列未知對象,同時將策略學(xué)習(xí)和機械臂控制解耦,從而具有更好的從仿真到現(xiàn)實世界的可移植性。
聲明:
“序列撥推采樣歸置策略迭代生成學(xué)習(xí)方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)