本發(fā)明涉及一種基于強化學(xué)習(xí)的閑時交通指示燈控制方法,包括下列步驟:采用的SlimYOLOv3模型感知環(huán)境,解析場景,識別出場景中所有車輛類型的目標(biāo),并通過在每個目標(biāo)周圍定義邊界框來定位這些目標(biāo)的位置。采用基于DQN的強化學(xué)習(xí)方法訓(xùn)練交通指示燈控制智能體:a)定義動作空間,交通指示燈以的概率隨機選取動作,以的概率采用貪婪算法選取動作;b)定義狀態(tài)空間:任意時刻觀測的路面狀態(tài)為各方向不同區(qū)間的車輛個數(shù),觀測狀態(tài)值為一個六維的向量;c)定義獎勵函數(shù):三個區(qū)間路段、和的懲罰權(quán)重分別為、和,獎勵值為各路段懲罰權(quán)重之和;d)采用基于DQN的強化學(xué)習(xí)方法學(xué)習(xí)出使得獎勵值最高的策略,得到性能優(yōu)質(zhì)的交通指示燈控制智能體。
聲明:
“基于強化學(xué)習(xí)的閑時交通指示燈智能控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)