本發(fā)明涉及車輛動(dòng)力學(xué)技術(shù)領(lǐng)域,公開了一種基于深度強(qiáng)化學(xué)習(xí)的車輛行駛狀態(tài)估計(jì)系統(tǒng)及方法,該系統(tǒng)的數(shù)據(jù)來(lái)源模塊獲取車輛行駛狀態(tài)量,并將得到的第I類狀態(tài)量輸出給深度強(qiáng)化學(xué)習(xí)智能體,將第Ⅱ類狀態(tài)量輸出給估計(jì)誤差評(píng)價(jià)器;深度強(qiáng)化學(xué)習(xí)智能體接收第I類狀態(tài)量,通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算得到第Ⅱ類狀態(tài)量估計(jì)值,并輸出給所述估計(jì)誤差評(píng)價(jià)器,估計(jì)誤差評(píng)價(jià)器將接收的第Ⅱ類狀態(tài)量和第Ⅱ類狀態(tài)量估計(jì)值進(jìn)行比較,生成獎(jiǎng)勵(lì)值并輸出給所述深度強(qiáng)化學(xué)習(xí)智能體;所述深度強(qiáng)化學(xué)習(xí)智能體根據(jù)獎(jiǎng)勵(lì)值對(duì)內(nèi)部的深度神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整和優(yōu)化,調(diào)整對(duì)第Ⅱ類狀態(tài)量估計(jì)值的計(jì)算。本發(fā)明能夠?qū)囕v上難以直接測(cè)量的行駛狀態(tài)量進(jìn)行估計(jì),功能可靠也易于實(shí)現(xiàn)。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的車輛行駛狀態(tài)估計(jì)系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)