本申請(qǐng)揭示了一種基于強(qiáng)化學(xué)習(xí)模型的信息控制方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),所述方法包括:獲取當(dāng)前時(shí)間與信號(hào)燈所處路口的圖像;若所述當(dāng)前時(shí)間與所述信號(hào)燈所處路口的圖像符合使用條件,則從所述信號(hào)燈所處路口的圖像中提取出指定狀態(tài)特征;將所述指定狀態(tài)特征輸入所述信號(hào)燈動(dòng)作預(yù)測(cè)模型中,從而得到預(yù)測(cè)動(dòng)作;所述信號(hào)燈動(dòng)作預(yù)測(cè)模型基于強(qiáng)化學(xué)習(xí)模型并通過(guò)具有指定數(shù)據(jù)結(jié)構(gòu)的樣本數(shù)據(jù)訓(xùn)練得到的,所述指定數(shù)據(jù)結(jié)構(gòu)由多個(gè)數(shù)據(jù)塊構(gòu)成,具有同一信號(hào)燈相位和同一預(yù)測(cè)動(dòng)作的樣本數(shù)據(jù)被存在同一個(gè)所述數(shù)據(jù)塊中;根據(jù)所述預(yù)測(cè)動(dòng)作控制所述信號(hào)燈。從而使信號(hào)燈的控制更適用于更多的交通狀況,更具魯棒性。
聲明:
“基于強(qiáng)化學(xué)習(xí)模型的信息控制方法、裝置和計(jì)算機(jī)設(shè)備” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)