本發(fā)明涉及一種基于強化學習的模型預測控制軌跡跟蹤控制系統(tǒng),包括線性時變模型預測控制器、規(guī)劃模塊、狀態(tài)估計模塊以及強化學習模塊,所述線性時變模型預測控制器包括預測模型、優(yōu)化求解模塊和目標函數+約束條件模塊;預測模型的預測軌跡結合規(guī)劃模塊的參考軌跡輸入給優(yōu)化求解模塊,對目標函數和約束條件進行求解,計算出最優(yōu)控制量發(fā)送給被控車輛執(zhí)行;車輛執(zhí)行命令后得到狀態(tài)量反饋給狀態(tài)估計模塊、規(guī)劃模塊、強化學習模塊;狀態(tài)估計模塊根據反饋狀態(tài)量修正模型誤差;規(guī)劃模塊進行局部路徑規(guī)劃;強化學習模塊根據參考軌跡與實際車輛位置差值調整車輛MPC控制誤差權重參數,適配行駛道路與軌跡,提高控制精度。
聲明:
“基于強化學習的模型預測控制軌跡跟蹤控制系統(tǒng)及方法方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)