本發(fā)明公開(kāi)了一種基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛行為一體化決策方法,從兩種基本駕駛行為,即換道和跟馳行為的優(yōu)先級(jí)和邏輯出發(fā),首先采用上下兩層深度強(qiáng)化學(xué)習(xí)模型處理大規(guī)?;旌蠣顟B(tài)空間并保證換道決策和跟馳決策的復(fù)合動(dòng)作輸出,在上層模型中使用D3QN算法來(lái)區(qū)分環(huán)境的潛在價(jià)值和換道決策的價(jià)值,在下層模型采用DDPG算法處理跟馳決策從而輸出連續(xù)的車速控制。選取混合標(biāo)準(zhǔn)駕駛工況對(duì)兩種算法進(jìn)行耦合訓(xùn)練之后,在利用NGSIM數(shù)據(jù)重建的高度復(fù)雜的駕駛場(chǎng)景中對(duì)模型進(jìn)行測(cè)試。本發(fā)明提出的集成駕駛決策模型提高了跟馳與換道決策的協(xié)同性,并將車道優(yōu)勢(shì)函數(shù)與危險(xiǎn)動(dòng)作屏蔽機(jī)制整合到?jīng)Q策模型中,顯著提升了行駛速度,優(yōu)于其他的智能駕駛決策模型。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛行為一體化決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)