本發(fā)明公開了一種基于場景區(qū)分的深度強化學習訓練方法及系統(tǒng),包括以下步驟,將測試車輛接入仿真環(huán)境中并隨意行駛;數(shù)據(jù)采集模塊收集所述仿真環(huán)境中不同位置的街道圖像數(shù)據(jù)集;利用U?net網(wǎng)絡(luò)模塊對進行語義分割的訓練;識別模塊在線識別不同的道路情況;在不同的場景中分別設(shè)定符合各個場景的Reward值,分別進行針對性的訓練;訓練完成后模型部署使用。本發(fā)明的有益效果:通過減少算法模型學習如何區(qū)分各個場景的時間,來減少基于車輛行駛仿真軟件中數(shù)據(jù)進行算法訓練時間,可以快速驗證車輛輔助駕駛/自動駕駛,能夠明顯降低算法模型在低效率探索上花費的時間,從而大大降低開發(fā)時間,提高訓練性能。
聲明:
“基于場景區(qū)分的深度強化學習訓練方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)