本發(fā)明涉及一種基于強化學習的空間機器人捕獲翻滾目標運動規(guī)劃方法,包括設(shè)計了用以學習訓練的智能體狀態(tài)與動作具體形式,與到達任務(wù)的獎勵函數(shù);基于優(yōu)先回放的DDPG算法改進;應(yīng)用改進的DDPG算法進行抓捕任務(wù)的訓練過程。本發(fā)明的有益效果是,不再需要對空間機器人與非合作環(huán)境進行精確建模,僅在觀測特定狀態(tài)的情況下進行智能算法的學習訓練,即可對空間機器人抓捕非合作目標進行運動規(guī)劃。其學習到的策略可以應(yīng)對一定程度的觀測噪聲,使得機器人可以智能、自主地抓捕目標。
聲明:
“基于強化學習的空間機器人捕獲翻滾目標運動規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)