本文描述了用于逆向強(qiáng)化學(xué)習(xí)以利用基于模型的優(yōu)化方法和無模型學(xué)習(xí)方法的優(yōu)勢(shì)的系統(tǒng)和方法。提出了將人類行為模型與模型預(yù)測(cè)控制相結(jié)合的框架的實(shí)施方式。該框架利用神經(jīng)網(wǎng)絡(luò)的特征識(shí)別能力來確定模型預(yù)測(cè)控制的獎(jiǎng)勵(lì)函數(shù)。此外,實(shí)施本方法的實(shí)施方式,以解決實(shí)際的自動(dòng)駕駛縱向控制問題,同時(shí)優(yōu)先考慮安全執(zhí)行和乘客舒適度。
聲明:
“利用模型預(yù)測(cè)控制的逆向強(qiáng)化學(xué)習(xí)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)