本發(fā)明公開一種基于強化學習的多目標復雜交通場景下自動駕駛解決方法,該方法可以使用一套強化學習自動駕駛建模方法處理所有交通場景,具有較好的通用性。強化學習綜合建?;趥鹘y(tǒng)強化學習框架,使用環(huán)境感知信息及結合人類知識提取的特征量作為觀測空間。模型訓練基于時變訓練策略,提高訓練速度和策略應用的泛化性。為對其形式安全性作進一步保障,還提出了基于長短時記憶(LSTM)網(wǎng)絡的危險動作識別器與基于人類知識體的規(guī)則約束器,從環(huán)境中采樣并訓練危險動作識別器,使車輛具備識別危險動作與危險場景的能力,并針對特定情形設計規(guī)則約束對輸出動作加以限制,可以大大提高安全性,減少碰撞次數(shù),以保障車輛的行駛安全。
聲明:
“基于強化學習的多目標復雜交通場景下自動駕駛解決方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)