本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)與動(dòng)態(tài)配時(shí)的交通信號(hào)燈控制系統(tǒng)及方法,首先對(duì)十字路口進(jìn)行建模,分別定義強(qiáng)化學(xué)習(xí)三要素state,reward,action;然后依據(jù)強(qiáng)化學(xué)習(xí)A2C算法構(gòu)建策略網(wǎng)絡(luò)和評(píng)估網(wǎng)絡(luò);最后收集路口實(shí)時(shí)信息,轉(zhuǎn)化為state向量后輸入到構(gòu)建的策略網(wǎng)絡(luò)和評(píng)估網(wǎng)絡(luò),輸出action概率分布,系統(tǒng)根據(jù)action概率分布選擇最合適的相位;決定相位后,接下來的一段時(shí)間就屬于該相位的綠燈時(shí)間;由自適應(yīng)定時(shí)控制器構(gòu)成的動(dòng)態(tài)配時(shí)模塊根據(jù)實(shí)時(shí)的交通流信息,以最大化綠燈時(shí)間利用為目標(biāo),動(dòng)態(tài)控制綠燈時(shí)間;當(dāng)檢測到綠燈時(shí)間的損失,就終止當(dāng)前相位。本發(fā)明克服了固定分配交通燈時(shí)長而導(dǎo)致綠燈利用率不高的缺陷,減少了車輛的平均等待時(shí)間和二氧化碳等有害氣體的排放。
聲明:
“基于強(qiáng)化學(xué)習(xí)與動(dòng)態(tài)配時(shí)的交通信號(hào)燈控制系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)