本發(fā)明涉及一種強化學(xué)習(xí)自動駕駛測試方法及系統(tǒng),本發(fā)明首先由駕駛員駕駛自動駕駛車輛在特定場景下進行失效場景駕駛測試,車輛的自動駕駛系統(tǒng)進行環(huán)境數(shù)據(jù)和自車數(shù)據(jù)采集,然后根據(jù)采集的環(huán)境數(shù)據(jù)和自車數(shù)據(jù)構(gòu)建虛擬環(huán)境用以模擬真實環(huán)境下的車輛行駛信息與環(huán)境信息,最后通過強化學(xué)習(xí)模塊與虛擬環(huán)境的交互反饋學(xué)習(xí),得到自動駕駛系統(tǒng)失效場景下的自動駕駛參考控制數(shù)據(jù)。本發(fā)明利用真實的失效場景,構(gòu)建成虛擬環(huán)境,將虛擬失效場景數(shù)據(jù)輸入到強化學(xué)習(xí)框架,逐漸訓(xùn)練出針對特定場景的安全策略,最終改善該事故場景下自動駕駛車輛的安全性,達到減少自動駕駛車輛事故的目的。
聲明:
“強化學(xué)習(xí)自動駕駛測試方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)