本發(fā)明公開了一種自動(dòng)駕駛決策方法、裝置、車輛及存儲(chǔ)介質(zhì)。其中,該方法包括:采集目標(biāo)車輛的行車環(huán)境數(shù)據(jù),行車環(huán)境數(shù)據(jù)包括目標(biāo)車輛的車輛數(shù)據(jù)和障礙物數(shù)據(jù);利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)行車環(huán)境數(shù)據(jù)進(jìn)行分析,得到?jīng)Q策動(dòng)作,其中,深度神經(jīng)網(wǎng)絡(luò)模型基于回報(bào)函數(shù)和深度強(qiáng)化學(xué)習(xí)算法構(gòu)建并訓(xùn)練,回報(bào)函數(shù)用于根據(jù)目標(biāo)車輛至少兩個(gè)時(shí)刻的行車速度和行車位移對(duì)深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;控制目標(biāo)車輛執(zhí)行決策動(dòng)作。本發(fā)明解決了決策模型中的回報(bào)函數(shù)設(shè)計(jì)不合理,進(jìn)而導(dǎo)致模型輸出的決策結(jié)果不夠合理的技術(shù)問題。
聲明:
“自動(dòng)駕駛決策方法、裝置、車輛及存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)