本發(fā)明提供一種基于深度強化學習的動態(tài)AUV追蹤路徑規(guī)劃方法,通過引入深度強化學習算法,運用航路模型來處理AUV的路徑追蹤問題。首先對目標和AUV狀態(tài)分析,判斷并選擇采用哪種航路進行追蹤,建立三種航路模型,用訓練好的模型對AUV下一狀態(tài)進行預測。采用純方位最小二乘估計法對檢測到的目標信號進行運動要素解算,獲得目標信息。將目標和AUV運動情況作為狀態(tài)輸入,AUV下一狀態(tài)的動作和航向作為輸出,建立狀態(tài)——動作映射策略。根據(jù)任務要求,選擇獎賞函數(shù),AUV每段時間所采取的決策都會獲得相應評價。本發(fā)明結(jié)合深度學習和強化學習的優(yōu)點,將深度強化學習算法用在AUV路徑追蹤上,實現(xiàn)了對動態(tài)AUV的追蹤路徑規(guī)劃。
聲明:
“基于深度強化學習的動態(tài)AUV追蹤路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)