本發(fā)明屬于自動(dòng)駕駛技術(shù)領(lǐng)域,具體為基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛車輛交叉口無(wú)沖突合作方法,包括步驟1:交叉口問(wèn)題馬爾可夫建模,綜合考慮安全約束馬爾可夫決策(constrained Markov decision process,CMDP)與馬爾可夫博弈(Markov Game,MG)理論,將道路交叉口環(huán)境轉(zhuǎn)化為為符合強(qiáng)化學(xué)習(xí)算法要求的模型;步驟2:?jiǎn)尾呗跃W(wǎng)絡(luò)與雙價(jià)值網(wǎng)絡(luò)更新過(guò)程設(shè)計(jì),設(shè)計(jì)單策略?雙評(píng)論家(Actor?Critic1?Critic2)網(wǎng)絡(luò)架構(gòu);步驟3:馬爾可夫形式數(shù)據(jù)搜集;步驟4:強(qiáng)化學(xué)習(xí)訓(xùn)練,訓(xùn)練單策略?雙評(píng)論家(Actor?Critic1?Critic2)神經(jīng)網(wǎng)絡(luò);步驟5:強(qiáng)化學(xué)習(xí)測(cè)試,在仿真器Carla中實(shí)際測(cè)試該強(qiáng)化學(xué)習(xí)算法的性能,能夠針對(duì)時(shí)變的交通網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)輸出符合預(yù)期的車輛通行策略,在安全、舒適與效率方面均能夠獲得良好性能。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛車輛交叉口無(wú)沖突合作方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)