本發(fā)明涉及一種基于強化學(xué)習(xí)的無人艇混合感知自主避障方法及系統(tǒng),該方法包括以下步驟:1)搭建海洋環(huán)境;2)根據(jù)無人艇推進器情況設(shè)置動作空間,根據(jù)靜態(tài)海圖提供的全局規(guī)劃信息與雷達系統(tǒng)探測半徑范圍內(nèi)的障礙物信息學(xué)習(xí)得到強化學(xué)習(xí)狀態(tài)編碼;3)設(shè)置獎勵目標(biāo)權(quán)重,獲得綜合獎勵函數(shù);4)搭建并訓(xùn)練評價網(wǎng)絡(luò)與策略網(wǎng)絡(luò);5)將強化學(xué)習(xí)狀態(tài)編碼分別輸入至評價網(wǎng)絡(luò)與策略網(wǎng)絡(luò),將綜合獎勵函數(shù)輸入至評價網(wǎng)絡(luò),根據(jù)學(xué)習(xí)到的策略網(wǎng)絡(luò)的均值對應(yīng)的動作,決定控制器的輸出。與現(xiàn)有技術(shù)相比,本發(fā)明具有高度自我學(xué)習(xí)的能力,可以經(jīng)過簡單的部署訓(xùn)練適應(yīng)不同大規(guī)模復(fù)雜環(huán)境,進而實現(xiàn)自主感知、自主導(dǎo)航、自主避障。
聲明:
“基于強化學(xué)習(xí)的無人艇混合感知自主避障方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)