一種基于行車風(fēng)險(xiǎn)分析的車輛強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃方法,包括:獲取本車所在車道的兩側(cè)邊界信息由車道兩側(cè)邊界點(diǎn)橫縱坐標(biāo)(Xr,Xl)以及本車到左右兩側(cè)邊界的垂直距離(dl,dr)組成;利用高精度地圖和雷達(dá)獲取狀態(tài)信息數(shù)組由本車坐標(biāo)位置(X,Y)、障礙物的坐標(biāo)位置(Xobs,Yobs)和相對(duì)速度Δv組成;距離Δv=[Δv1,Δv2,...,Δvn],n是檢測(cè)到的障礙物數(shù)量;將和組合成狀態(tài)向量相對(duì)狀態(tài)信息輸入基于深度強(qiáng)化學(xué)習(xí)的車輛運(yùn)動(dòng)規(guī)劃模型Φ,以輸出本車動(dòng)作向量action=[a,θ],其中a∈[?amax,amax]是加速度動(dòng)作,amax為最大加速度,θ∈[?θmax,θmax]是方向盤轉(zhuǎn)角動(dòng)作,當(dāng)θ∈[0,θmax]時(shí)為向左轉(zhuǎn)動(dòng)θ,當(dāng)θ∈[?θmax,0]時(shí)為向右轉(zhuǎn)動(dòng)θ;本車根據(jù)獲取的action行駛t時(shí)長(zhǎng)后,判斷是否到達(dá)目的地,若是則結(jié)束工作狀態(tài),否則進(jìn)入步驟1進(jìn)行下一時(shí)間步長(zhǎng)的車輛控制。
聲明:
“基于行車風(fēng)險(xiǎn)分析的車輛強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)