本發(fā)明公開了一種基于視覺的深度模仿強化學習駕駛策略訓練方法,包括:構建模仿學習網絡;訓練所述模仿學習網絡;對訓練完成的模仿學習網絡進行網絡拆分,獲得感知模塊;構建DDPG網絡,獲得控制模塊;通過所述感知模塊和所述控制模塊,完成深度模仿強化學習模型的搭建;訓練所述深度模仿強化學習模型。所述模仿學習網絡包括5個卷積層和四個全連接層,其中卷積層用于提取特征,全連接層用于轉向角、油門和剎車開度的預測;此外,深度模仿強化學習模型訓練過程設置了獎勵函數(shù),保證彎道行駛的舒適性和安全性。
聲明:
“基于視覺的深度模仿強化學習駕駛策略訓練方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)