本發(fā)明涉及一種基于多維獎(jiǎng)勵(lì)Q學(xué)習(xí)的模型預(yù)測(cè)加權(quán)因子動(dòng)態(tài)調(diào)整方法,屬于自動(dòng)駕駛車輛軌跡跟蹤控制領(lǐng)域。解決了采用模型預(yù)測(cè)控制原理設(shè)計(jì)軌跡跟蹤控制器時(shí)對(duì)加權(quán)因子的選取不當(dāng)會(huì)降低自動(dòng)駕駛車輛軌跡跟蹤穩(wěn)定性和精確性以及行駛安全性的問題。本發(fā)明通過強(qiáng)化學(xué)習(xí)中Q學(xué)習(xí)方法,訓(xùn)練了加權(quán)因子最優(yōu)調(diào)整策略,可實(shí)時(shí)動(dòng)態(tài)調(diào)整模型預(yù)測(cè)軌跡跟蹤控制器的加權(quán)因子,從而實(shí)時(shí)優(yōu)化自動(dòng)駕駛車輛的軌跡跟蹤性能,以減少在每個(gè)采樣時(shí)刻下車輛實(shí)際位置與預(yù)期軌跡之間的誤差,提高自動(dòng)駕駛車輛的軌跡跟蹤精度和行駛穩(wěn)定性、舒適性。
聲明:
“基于多維獎(jiǎng)勵(lì)Q學(xué)習(xí)的模型預(yù)測(cè)加權(quán)因子動(dòng)態(tài)調(diào)整方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)