一種基于深度強(qiáng)化學(xué)習(xí)的水下自主航行器動態(tài)避障方法,涉及水下機(jī)器人避障技術(shù)領(lǐng)域。本發(fā)明是為了解決目前缺乏水下自主航行器對動態(tài)障礙物的避障研究的問題。本發(fā)明建立水下自主航行器模型與運(yùn)動學(xué)模型,獲取周圍障礙物的信息;采集水下自主航行器周圍機(jī)動障礙物的運(yùn)動狀態(tài)信息,并構(gòu)造動態(tài)障礙物狀態(tài)方程;根據(jù)動態(tài)障礙物狀態(tài)方程預(yù)測動態(tài)障礙物運(yùn)動學(xué)模型;根據(jù)水下自主航行器周圍障礙物的信息和動態(tài)障礙物運(yùn)動學(xué)模型,融合多動態(tài)障礙物避障法生成避障策略并轉(zhuǎn)化為MDP模型;結(jié)合確定性深度策略梯度算法對MDP模型進(jìn)行訓(xùn)練,直至水下自主航行器能夠無碰撞的到達(dá)目標(biāo)區(qū)域;利用訓(xùn)練好的MDP模型引導(dǎo)水下自主航行器航行。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的水下自主航行器動態(tài)避障方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)