本申請(qǐng)公開(kāi)了一種智能車輛交叉口行為決策方法,方法包括:確定預(yù)設(shè)分層強(qiáng)化學(xué)習(xí)決策模型,包括上層路徑策略與下層動(dòng)作策略;獲取智能車輛的環(huán)境觀測(cè)狀態(tài),環(huán)境觀測(cè)狀態(tài)包括智能車輛的位置信息與速度信息以及障礙物的位置信息與速度信息;根據(jù)環(huán)境觀測(cè)狀態(tài),通過(guò)上層路徑策略,生成智能車輛通過(guò)交叉口的轉(zhuǎn)彎半徑;根據(jù)環(huán)境觀測(cè)狀態(tài)及轉(zhuǎn)彎半徑,通過(guò)下層動(dòng)作策略,得到智能車輛的縱向加速度;根據(jù)環(huán)境觀測(cè)狀態(tài)以及轉(zhuǎn)彎半徑,對(duì)下層動(dòng)作策略進(jìn)行更新,以對(duì)縱向加速度進(jìn)行更新;根據(jù)轉(zhuǎn)彎半徑,通過(guò)預(yù)設(shè)策略獎(jiǎng)勵(lì)函數(shù),得到下層動(dòng)作策略的回合總獎(jiǎng)勵(lì)值;根據(jù)回合總獎(jiǎng)勵(lì)值、環(huán)境觀測(cè)狀態(tài)、轉(zhuǎn)彎半徑,對(duì)上層路徑策略進(jìn)行更新,以對(duì)轉(zhuǎn)彎半徑進(jìn)行更新。
聲明:
“智能車輛交叉口行為決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)