本發(fā)明公布了基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)自主避障系統(tǒng)和方法,通過新穎的系統(tǒng)架構(gòu),將訓(xùn)練與決策分離,能夠大幅降低訓(xùn)練時(shí)耗,提升飛行器決策時(shí)效;該自主避障方法采用基于策略迭代的深度強(qiáng)化學(xué)習(xí)模型,以無人機(jī)單目攝像機(jī)拍攝的以原始的RGB圖像為訓(xùn)練數(shù)據(jù),無需復(fù)雜的點(diǎn)云等其他3D信息,通過完全卷積神經(jīng)網(wǎng)絡(luò)對原始RGB圖形進(jìn)行訓(xùn)練獲得深度圖像信息,再通過基于策略迭代的強(qiáng)化學(xué)習(xí)方法對圖像進(jìn)行分析預(yù)測,提前預(yù)判出無人機(jī)下一時(shí)刻的飛行動(dòng)作,實(shí)現(xiàn)自主避障。本發(fā)明提出的避障方法訓(xùn)練時(shí)耗比現(xiàn)有典型的基于值迭代的方法都更加高效、時(shí)耗更低,可實(shí)現(xiàn)靈活自主地避障,適用于變電站自動(dòng)巡檢、無人機(jī)巡航等高要求的自主避障場景。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)自主避障系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)