本發(fā)明公開(kāi)了一種實(shí)時(shí)監(jiān)測(cè)的強(qiáng)化學(xué)習(xí)可變時(shí)長(zhǎng)信號(hào)燈控制方法,包括:通過(guò)事先安裝于道路上的物聯(lián)網(wǎng)設(shè)備采集道路上的實(shí)時(shí)交通數(shù)據(jù)生成新定義的壓力信息;基于上述各個(gè)壓力信息設(shè)計(jì)強(qiáng)化學(xué)習(xí)方法,生成強(qiáng)化學(xué)習(xí)狀態(tài);在每個(gè)路口配置一個(gè)強(qiáng)化學(xué)習(xí)智能體,并且設(shè)計(jì)一個(gè)監(jiān)視屬性,通過(guò)所述智能體實(shí)時(shí)判斷當(dāng)前相位下,路口監(jiān)視屬性是否到達(dá)閾值;并根據(jù)是否達(dá)到閾值確定是否對(duì)信號(hào)燈的相位進(jìn)行調(diào)整;存儲(chǔ)數(shù)據(jù)并通過(guò)強(qiáng)化學(xué)習(xí)智能體的回放機(jī)制來(lái)更新網(wǎng)絡(luò)參數(shù);各個(gè)路口配置的強(qiáng)化學(xué)習(xí)智能體通過(guò)當(dāng)前道路情況控制交通信號(hào)燈的相位選擇。本發(fā)明能夠提高強(qiáng)化學(xué)習(xí)代理的學(xué)習(xí)能力,快速獲得優(yōu)秀的信號(hào)燈控制策略,并且控制效果大大提升。
聲明:
“實(shí)時(shí)監(jiān)測(cè)的強(qiáng)化學(xué)習(xí)可變時(shí)長(zhǎng)信號(hào)燈控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)