本發(fā)明公開了一種基于深度強化學習的車輛自動循跡駕駛方法,包括如下步驟:步驟1、構建雙重深度Q網絡進行圖像特征提取;步驟2、采用經驗回放方案進行環(huán)境交互訓練樣本采集和雙重網絡訓練;步驟3、采用RMSprop算法優(yōu)化網絡的訓練過程;步驟4、采用訓練完畢的雙重深度網絡進行預測,進而實現自動循跡駕駛。本發(fā)明采取深度強化學習方法,直接實現從圖像采集到車輛控制的端到端網絡建立,避免了傳統(tǒng)方法中復雜的PID控制環(huán)節(jié),并且采用雙重深度網絡進行動作預測,可以有效減少單一深度強化學習網絡中最大化偏差帶來的性能損失。
聲明:
“基于深度強化學習的車輛自動循跡駕駛方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)