本發(fā)明公開(kāi)一種規(guī)則約束下基于深度強(qiáng)化學(xué)習(xí)的船舶避碰決策方法。該方法考慮船舶操縱特性,引入MMG模型,通過(guò)該模型推斷船舶實(shí)時(shí)的航行信息。然后設(shè)計(jì)了分場(chǎng)景、考慮駕駛經(jīng)驗(yàn)的狀態(tài)空間和動(dòng)作空間定義方法,并提出了避碰決策網(wǎng)絡(luò)構(gòu)建和訓(xùn)練框架。此外,為了充分考慮規(guī)則,設(shè)計(jì)了一套分層的獎(jiǎng)勵(lì)函數(shù)組合,并將其用于后期決策網(wǎng)絡(luò)的訓(xùn)練。隨后通過(guò)引入DQN算法,構(gòu)建了避碰決策網(wǎng)絡(luò)訓(xùn)練模型,并經(jīng)過(guò)大量的訓(xùn)練獲得了可適用于不同場(chǎng)景的避碰決策網(wǎng)絡(luò)。最后,為了驗(yàn)證所提方法的適用性,設(shè)計(jì)了多種仿真測(cè)試場(chǎng)景進(jìn)行了綜合性能評(píng)價(jià)。該方法能夠使船舶在復(fù)雜環(huán)境下安全避碰,同時(shí)保證其符合規(guī)則和良好船藝的要求。
聲明:
“規(guī)則約束下基于深度強(qiáng)化學(xué)習(xí)的船舶避碰決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)