本發(fā)明公開了一種基于自適應權重強化學習的六足機器人避障方法,步驟包括:由六足機器人通過測距傳感器測量機器人與附近各個障礙物的距離,并通過模糊隸屬度函數(shù)將測量的障礙物距離轉化為有限的狀態(tài)集合;根據(jù)有限的狀態(tài)集合建立六足機器人避障模型,再利用自適應權重強化學習算法學習出最優(yōu)網絡模型參數(shù)θ*;根據(jù)上述訓練好的最優(yōu)網絡模型參數(shù)θ*得到六足機器人避障的最優(yōu)目標策略,由最優(yōu)目標策略獲得六足機器人在t時刻避障所要采取的動作a
t。該避障方法能夠在障礙物數(shù)量較多的位置環(huán)境中實現(xiàn)較好的避障效果,具有良好的市場應用前景。
聲明:
“基于自適應權重強化學習的六足機器人避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)