本發(fā)明公開了一種考慮累積誤差的AUV強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法,首先計算AUV運(yùn)行的累積誤差,再計算累計誤差的期望和方差,最后采用Q?Learning強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法,并更改獎勵策略,對AUV沿著直線運(yùn)動的動作進(jìn)行獎勵,對AUV的轉(zhuǎn)彎動作不作獎勵懲罰;在每次迭代過程中生成每條路徑的累積誤差統(tǒng)計分析,選擇累積誤差最小的路徑作為規(guī)劃結(jié)果,生成最佳路徑。本發(fā)明使AUV在路徑規(guī)劃中定性和定量分析生成路徑的累積誤差統(tǒng)計,實現(xiàn)在規(guī)劃和控制的整個過程中有效減小定位誤差累積。
聲明:
“考慮累積誤差的AUV強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)