本發(fā)明公開了一種基于深度增強學習的預(yù)觀控制仿人機器人步態(tài)規(guī)劃方法,包括步驟:1)通過裝配在仿人機器人上的傳感器獲取狀態(tài)信息;2)改進現(xiàn)有的深度強化學習網(wǎng)絡(luò),定義全新的狀態(tài)、動作向量和獎勵函數(shù);3)使用定義的動作向量對預(yù)觀控制器的輸出進行修正,計算出仿人機器人雙腿各舵機的角度,指導(dǎo)仿人機器人行走;4)在仿人機器人行走過程中,用狀態(tài)、動作向量、獎勵函數(shù)的值更新改進的深度強化學習網(wǎng)絡(luò)。本發(fā)明方法可有效解決仿人機器人在復(fù)雜環(huán)境下的行走問題,且在仿真平臺和實體機器人上進行了測試,驗證了此方法的有效性。
聲明:
“基于深度增強學習的預(yù)觀控制仿人機器人步態(tài)規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)