本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)和圖注意力網(wǎng)絡(luò)的交通信號(hào)控制方法及系統(tǒng),包括:初始化步驟:定義交通信號(hào)控制問(wèn)題中各個(gè)變量,初始化交通信號(hào)算法模型;觀測(cè)信息向量化步驟:通過(guò)多層感知機(jī)將觀測(cè)信息向量降維,得到降維后的數(shù)據(jù)h
i;圖注意力機(jī)制構(gòu)建步驟:利用降維后的數(shù)據(jù)h
i,從注意力機(jī)制出發(fā),構(gòu)建適用于交通信號(hào)算法模型的注意力機(jī)制hm
i;損失函數(shù)構(gòu)建步驟:根據(jù)注意力機(jī)制hm
i,計(jì)算損失函數(shù);行為更新步驟:根據(jù)構(gòu)建的交通信號(hào)算法模型中獎(jiǎng)勵(lì)函數(shù),對(duì)損失函數(shù)進(jìn)行迭代計(jì)算,以獲得最終交通信號(hào)算法模型;預(yù)測(cè)結(jié)果計(jì)算步驟:根據(jù)構(gòu)建的最終交通信號(hào)算法模型計(jì)算交通信號(hào)的控制策略π,實(shí)現(xiàn)信號(hào)控制;本發(fā)明適用于大規(guī)模復(fù)雜的交通道路情況。
聲明:
“基于強(qiáng)化學(xué)習(xí)和圖注意力網(wǎng)絡(luò)的交通信號(hào)控制方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)