本發(fā)明基于神經(jīng)網(wǎng)絡(luò)以及深度強(qiáng)化學(xué)習(xí)做了一個(gè)融合運(yùn)用,采用多層網(wǎng)絡(luò)架構(gòu)豐富對(duì)于軌跡預(yù)測(cè)的已知量導(dǎo)入,能夠在避免過擬合的情況下進(jìn)一步提升對(duì)于軌跡預(yù)測(cè)的精度,同時(shí)采用DDPG強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),其屬于介于“監(jiān)督學(xué)習(xí)”和“非監(jiān)督學(xué)習(xí)”之間的一種架構(gòu),能夠進(jìn)一步提升算法的魯棒性,避免針對(duì)非訓(xùn)練數(shù)據(jù)集的情況出現(xiàn)太差的效果,進(jìn)一步保障車輛行駛的安全性與算法的魯棒性提升。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的軌跡預(yù)測(cè)模型方法、系統(tǒng)及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)