本發(fā)明涉及一種面向自動(dòng)駕駛的基于深度強(qiáng)化學(xué)習(xí)的端到端導(dǎo)航避障方法,采用激光雷達(dá),對(duì)激光雷達(dá)點(diǎn)云進(jìn)行采樣,生成環(huán)境一維激光點(diǎn)云,并通過(guò)代價(jià)地圖轉(zhuǎn)換算法進(jìn)行轉(zhuǎn)換,得到表示環(huán)境動(dòng)態(tài)靜態(tài)障礙物的障礙物地圖;通過(guò)與仿真環(huán)境進(jìn)行閉環(huán)交互,收集環(huán)境障礙物地圖,從而生成導(dǎo)航環(huán)境數(shù)據(jù)集;構(gòu)建異構(gòu)智能體自我博弈避障模型,異構(gòu)多智能體自我博弈模型包括:觀測(cè)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)和神經(jīng)網(wǎng)絡(luò);進(jìn)行多階段并行課程學(xué)習(xí),以使神經(jīng)網(wǎng)絡(luò)更快更好的達(dá)到局部最優(yōu)解,同時(shí)加速學(xué)習(xí)過(guò)程,最終得到訓(xùn)練后的異構(gòu)智能體自我博弈避障模型;將訓(xùn)練好的異構(gòu)智能體自我博弈避障模型部署到實(shí)際車輛上,在現(xiàn)實(shí)世界中實(shí)現(xiàn)導(dǎo)航和避障。
聲明:
“面向自動(dòng)駕駛的基于深度強(qiáng)化學(xué)習(xí)的端到端導(dǎo)航避障方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)