本發(fā)明公開了基于深度強化學(xué)習(xí)的車道保持方法,包括采集環(huán)境?智能體狀態(tài)觀測值,即環(huán)境狀態(tài)數(shù)據(jù)和車輛狀態(tài)數(shù)據(jù)并進(jìn)行數(shù)據(jù)的預(yù)處理后用以傳入網(wǎng)絡(luò)模型和初始化網(wǎng)絡(luò)。網(wǎng)絡(luò)基于交互數(shù)據(jù)以強化學(xué)習(xí)的方式學(xué)習(xí)車道保持這一駕駛?cè)蝿?wù),期間不斷更新網(wǎng)絡(luò)直至模型收斂,然后基于收斂后的網(wǎng)絡(luò)進(jìn)行任務(wù)執(zhí)行的最優(yōu)策略輸出控制。本發(fā)明提供的基于深度強化學(xué)習(xí)的車道保持方法,實現(xiàn)了小車車道保持任務(wù)的自學(xué)習(xí),簡化了傳統(tǒng)的車道檢測?處理?控制流程,實現(xiàn)了端到端的命令輸出控制。
聲明:
“基于深度強化學(xué)習(xí)的車道保持方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)