本發(fā)明公開(kāi)了一種基于納什Q學(xué)習(xí)算法的交叉口聯(lián)合信號(hào)控制方法,屬于交通信號(hào)自適應(yīng)控制技術(shù)領(lǐng)域,包括以下步驟:構(gòu)建相鄰交叉口協(xié)調(diào)控制模型并確立強(qiáng)化學(xué)習(xí)的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)信息;構(gòu)建納什Q學(xué)習(xí)網(wǎng)絡(luò)控制模型;獲取模型訓(xùn)練和測(cè)試數(shù)據(jù);訓(xùn)練納什Q學(xué)習(xí)網(wǎng)絡(luò)模型;對(duì)控制區(qū)域交叉口實(shí)施聯(lián)合協(xié)同控制。本發(fā)明在基于強(qiáng)化學(xué)習(xí)思想實(shí)現(xiàn)交叉口自學(xué)習(xí)控制的基礎(chǔ)上,考慮交叉口間存在的聯(lián)系對(duì)交叉口整體區(qū)域控制效果的,在交叉口的協(xié)同博弈中實(shí)現(xiàn)交叉口間的納什均衡控制。本發(fā)明通過(guò)博弈控制理論,實(shí)現(xiàn)相鄰交叉口間的協(xié)調(diào)控制,在一定程度上緩解了因相鄰交叉口缺乏合作機(jī)制而造成的擁堵問(wèn)題。
聲明:
“基于納什Q學(xué)習(xí)算法的交叉口聯(lián)合信號(hào)控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)