本發(fā)明公開了一種結(jié)合路徑規(guī)劃和強化學(xué)習(xí)的導(dǎo)航避障控制方法、系統(tǒng)及模型,將駕駛?cè)蝿?wù)分為靜態(tài)的路徑規(guī)劃和動態(tài)的最優(yōu)軌跡跟蹤,實現(xiàn)基于規(guī)則的路徑規(guī)劃算法與深度強化學(xué)習(xí)的結(jié)合,可以有效地解決復(fù)雜道路場景(如無信號燈路口左轉(zhuǎn))下的車輛控制難的問題。本發(fā)明與現(xiàn)有的PID+LQR控制策略相比,不需要人為地對參數(shù)進(jìn)行不斷調(diào)整。與模型預(yù)測控制(MPC)控制方法相比,不過分依賴被控對象的模型精度,同時求解過程的復(fù)雜性大大降低,提高了車載的實時計算效率。本發(fā)明與端到端的強化學(xué)習(xí)相比,結(jié)合了車輛的運動學(xué)模型,具有可解釋性,同時也大大提高了車輛導(dǎo)航過程中的安全性。
聲明:
“結(jié)合路徑規(guī)劃和強化學(xué)習(xí)的導(dǎo)航避障控制方法、系統(tǒng)及模型” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)