本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的十字路口交通信號(hào)燈控制方法,首先,將當(dāng)前時(shí)刻十字路口的通行狀態(tài)表示成Position和Speed矩陣;其次,在傳統(tǒng)強(qiáng)化學(xué)習(xí)算法Deep Q?network的基礎(chǔ)上根據(jù)State的特征構(gòu)建基于空間注意力機(jī)制的框架,其中主干網(wǎng)絡(luò)為卷積神經(jīng)網(wǎng)絡(luò);然后,根據(jù)貪婪策略隨機(jī)選取或者從模型預(yù)測(cè)一個(gè)Action執(zhí)行。如果當(dāng)前時(shí)刻的Action和前一時(shí)刻的相同,那么就直接執(zhí)行綠燈相位時(shí)間,并在此過(guò)程中不斷訓(xùn)練網(wǎng)絡(luò);否則,首先執(zhí)行黃燈相位時(shí)間,然后,再執(zhí)行綠燈相位時(shí)間,同樣在此過(guò)程中同樣不斷地訓(xùn)練網(wǎng)絡(luò);最后,所有訓(xùn)練回合結(jié)束后保存模型,然后測(cè)試并評(píng)估模型效果。本發(fā)明改進(jìn)了現(xiàn)有的交通信號(hào)燈控制方法,使得車輛能夠更快的通過(guò)十字路口,一定程度上緩解了交通擁堵。
聲明:
“基于強(qiáng)化學(xué)習(xí)的十字路口交通信號(hào)燈控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)