本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的越野車三維路徑規(guī)劃方法,構(gòu)建一個(gè)基于價(jià)值的越野車三維路徑規(guī)劃的深度卷積神經(jīng)網(wǎng)絡(luò)模型,以最優(yōu)動(dòng)作價(jià)值函數(shù)為學(xué)習(xí)目標(biāo),構(gòu)建隨越野車移動(dòng)的動(dòng)態(tài)全局地圖作為觀測輸入,設(shè)計(jì)綜合考慮路程和能耗的獎(jiǎng)勵(lì)函數(shù),根據(jù)目標(biāo)距離設(shè)計(jì)深度強(qiáng)化學(xué)習(xí)的探索策略,最后結(jié)合探索策略和獎(jiǎng)勵(lì)函數(shù)對深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行端到端的訓(xùn)練,以使越野車從起點(diǎn)到終點(diǎn)的行駛過程中獲得的獎(jiǎng)勵(lì)最大,實(shí)現(xiàn)越野車的三維路徑規(guī)劃。采用上述方法規(guī)劃出的越野車三維路徑,綜合考慮了路程和能耗,在探索過程中可以兼顧方向性和隨機(jī)性,為三維地圖中的越野車規(guī)劃出路程和能耗折中的節(jié)能路徑。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的越野車三維路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)