本發(fā)明涉及一種基于模型和強(qiáng)化學(xué)習(xí)混合切換的車(chē)輛路徑跟蹤控制方法,包括以下步驟:根據(jù)規(guī)劃層給出的軌跡和車(chē)輛運(yùn)動(dòng)學(xué)模型,使用模型預(yù)測(cè)控制算法得到控制策略一(控制策略包括對(duì)油門(mén)、剎車(chē)和方向盤(pán)的控制);同時(shí)根據(jù)規(guī)劃層給出的軌跡,使用深度強(qiáng)化學(xué)習(xí)中的演員網(wǎng)絡(luò)得到控制策略二;根據(jù)當(dāng)前的車(chē)輛狀態(tài)和環(huán)境狀態(tài)信息,使用深度強(qiáng)化學(xué)習(xí)中的評(píng)論家網(wǎng)絡(luò)對(duì)兩種控制策略進(jìn)行評(píng)估,并選擇能夠獲得更高價(jià)值的控制策略進(jìn)行實(shí)際的輸出,實(shí)現(xiàn)車(chē)輛的路徑跟蹤控制。與現(xiàn)有技術(shù)相比,本發(fā)明將基于模型的經(jīng)典方法和基于學(xué)習(xí)的新興方法融合,具有靈活性強(qiáng)、穩(wěn)健性好、控制性能更優(yōu)等特點(diǎn)。
聲明:
“基于模型和強(qiáng)化學(xué)習(xí)混合切換的車(chē)輛路徑跟蹤控制方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)