本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛優(yōu)化方法及相關(guān)設(shè)備,所述方法包括:在虛擬仿真環(huán)境下,采集離線訓(xùn)練數(shù)據(jù)和相應(yīng)的真值;構(gòu)建基于注意力機(jī)制的密集交通環(huán)境預(yù)測(cè)模型;利用所述基于注意力機(jī)制的密集交通環(huán)境預(yù)測(cè)模型對(duì)所述離線訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,得到初步的環(huán)境預(yù)測(cè)模型;將所述初步的環(huán)境預(yù)測(cè)模型代入到基于值的環(huán)境模型強(qiáng)化學(xué)習(xí)算法或者基于策略的環(huán)境模型強(qiáng)化學(xué)習(xí)算法中,在相應(yīng)的虛擬仿真平臺(tái)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,獲得強(qiáng)化學(xué)習(xí)算法模型,所述強(qiáng)化學(xué)習(xí)算法模型用于為智能體通過(guò)密集交通環(huán)境提供最優(yōu)策略。本發(fā)明提高了密集交通模型的預(yù)測(cè)準(zhǔn)確率和采樣效率,提高了車輛通過(guò)密集交通環(huán)境的成功率,提高了自動(dòng)駕駛的安全性。
聲明:
“基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛優(yōu)化方法及相關(guān)設(shè)備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)