本發(fā)明提供了一種基于深度強化學(xué)習(xí)的連續(xù)交叉口信號協(xié)同控制方法,該方法采用上下層Agent網(wǎng)絡(luò)的DQN策略處理連續(xù)交叉口信號配時,以減少狀態(tài)獲取及反饋評價的復(fù)雜度,解決連續(xù)交叉口信號優(yōu)化問題。為保證訓(xùn)練目標(biāo)的平穩(wěn)性,避免其訓(xùn)練陷入目標(biāo)值與預(yù)測值的反饋循環(huán)中震蕩發(fā)散,采用Dueling Double優(yōu)化方法對DQN優(yōu)化訓(xùn)練,相比于傳統(tǒng)DQN控制模型,該方法可根據(jù)不同道路環(huán)境和交通狀態(tài)實時切換交叉口相位,增加了交叉口之間的協(xié)作能力,保障交叉口行車暢通,提高交叉口通行能力,為緩解交通擁堵、提高出行效率并減少安全事故提出了新的解決方案和理論依據(jù)。
聲明:
“基于深度強化學(xué)習(xí)的連續(xù)交叉口信號協(xié)同控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)