本發(fā)明公開了一種基于勢能場函數(shù)逼近的強(qiáng)化學(xué)習(xí)方法的泊車策略,通過設(shè)計勢能場來逼近強(qiáng)化學(xué)習(xí)過程中的狀態(tài)價值函數(shù);根據(jù)車輛狀態(tài)價值函數(shù)值通過ε?貪婪策略從預(yù)設(shè)的可執(zhí)行動作空間中選擇執(zhí)行動作;利用車輛利用狀態(tài)轉(zhuǎn)移方程根據(jù)車輛當(dāng)前狀態(tài)和選擇的動作預(yù)測車輛下一狀態(tài);重復(fù)選擇執(zhí)行動作和預(yù)測狀態(tài)這一過程至泊車結(jié)束,所有選擇的動作序列構(gòu)成實(shí)時泊車規(guī)劃路徑。本發(fā)明通過訓(xùn)練勢能場參數(shù)適用于各種不同的泊車區(qū)域,在不同的場景下進(jìn)行泊車路徑規(guī)劃,具有通用性;可實(shí)時地規(guī)劃泊車路徑,且該路徑可準(zhǔn)確跟蹤。
聲明:
“基于勢能場函數(shù)逼近的強(qiáng)化學(xué)習(xí)方法的泊車策略” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)