本發(fā)明公開(kāi)了一種網(wǎng)聯(lián)車探測(cè)狀態(tài)感知的交叉口強(qiáng)化學(xué)習(xí)信號(hào)控制方法,在網(wǎng)聯(lián)自動(dòng)駕駛車輛具有一定市場(chǎng)滲透率的情況下,將交叉口進(jìn)口道劃分為一定數(shù)目的網(wǎng)格,以網(wǎng)聯(lián)自動(dòng)駕駛車輛作為移動(dòng)傳感器,探測(cè)周圍車輛的實(shí)時(shí)位置、速度等數(shù)據(jù),將數(shù)據(jù)填充到相應(yīng)的進(jìn)口道網(wǎng)格中,形成網(wǎng)格填充矩陣。將信號(hào)燈視作智能體并設(shè)計(jì)馬爾可夫決策過(guò)程,以網(wǎng)格填充矩陣作為智能體狀態(tài),以相位切換為動(dòng)作,以車輛更新等待時(shí)間為獎(jiǎng)勵(lì)函數(shù)。采用深度策略梯度算法訓(xùn)練智能體,可以減少車輛的等待時(shí)間,同時(shí)實(shí)現(xiàn)排隊(duì)長(zhǎng)度以及平均速度的優(yōu)化。本發(fā)明提出的方法能夠在對(duì)信號(hào)交通口進(jìn)行控制時(shí)減少交通擁堵,緩解因交通擁堵帶來(lái)的交通延誤和碳排放及能源消耗。
聲明:
“網(wǎng)聯(lián)車探測(cè)狀態(tài)感知的交叉口強(qiáng)化學(xué)習(xí)信號(hào)控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)