本發(fā)明公開了一種基于注意力模型和深度強(qiáng)化學(xué)習(xí)的無人車行駛決策方法通過構(gòu)建感知模塊和決策模塊完成無人車行駛決策任務(wù),具體為:通過搭建自注意力模型和長短時(shí)記憶網(wǎng)絡(luò)對(duì)感知模塊進(jìn)行建模,然后通過自動(dòng)編碼器模型對(duì)感知模塊進(jìn)行訓(xùn)練;利用卷積網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)搭建決策模塊,所述決策模塊基于深度確定性策略算法。利用感知模塊對(duì)觀測數(shù)據(jù)進(jìn)行降維,再利用深度強(qiáng)化學(xué)習(xí)決策模塊進(jìn)行策略學(xué)習(xí),并通過引入優(yōu)先經(jīng)驗(yàn)回放的方法,提高數(shù)據(jù)樣本的利用率,從而提高算法的訓(xùn)練速度。本發(fā)明方法通過在自動(dòng)駕駛環(huán)境中進(jìn)行模型訓(xùn)練后,可以在復(fù)雜的道路環(huán)境中安全行駛,并根據(jù)環(huán)境的變化制定合理的駕駛策略。
聲明:
“基于注意力模型和深度強(qiáng)化學(xué)習(xí)的無人車行駛決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)