本發(fā)明公開了一種基于粒子注意力深度Q學習的部分觀測路口自主并道方法,著眼于路口場景、車輛并道任務、觀測視野被樓宇和其他車輛遮擋住的部分觀測條件,使用強化學習中的深度Q學習算法對給定路線的并道車輛的駕駛行為進行優(yōu)化。使用低維物理信息量作為車輛的觀測表征;使用基于粒子的表示處理因遮擋造成的部分觀測問題;通過引入注意力機制優(yōu)化狀態(tài)表示,使模型可以僅接受未被遮擋到的車輛信息同時具有輸入排列不變性;使用深度Q學習算法根據獲取到的社會車輛信息輸出當前最優(yōu)駕駛動作;通過在經驗回放池中加入多種車流密度下的采樣數據,結合優(yōu)先經驗回放技術,使自主并道行為可以適應真實環(huán)境下多變的車流密度。
聲明:
“基于粒子注意力深度Q學習的部分觀測路口自主并道方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)