本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的移動機(jī)器人動態(tài)復(fù)雜環(huán)境避障導(dǎo)航方法,包括避障模塊、目標(biāo)接近模塊、DRL策略訓(xùn)練模塊、模擬?現(xiàn)實任務(wù)。本發(fā)明的有益效果是:通過該方法實現(xiàn)移動機(jī)器人在無全局地圖信息的情況下,依靠傳感器的觀測信息,通過多障礙物識別網(wǎng)絡(luò)對觀測結(jié)果進(jìn)行處理,結(jié)合目標(biāo)的相對位置信息,通過深度強(qiáng)化學(xué)習(xí)模型進(jìn)行訓(xùn)練,學(xué)習(xí)避障導(dǎo)航策略,避開多個動態(tài)障礙物,到達(dá)指定目標(biāo)點;不再依賴于全局地圖,不需耗費大量算力建立高精度地圖,不需考慮全局地圖信息的維護(hù)與更新;輸入傳感器觀測信息,輸出機(jī)器人控制動作,端到端的導(dǎo)航策略模式反應(yīng)迅速,能夠適應(yīng)復(fù)雜動態(tài)多障礙物的環(huán)境。
聲明:
“強(qiáng)化學(xué)習(xí)的移動機(jī)器人動態(tài)復(fù)雜環(huán)境避障導(dǎo)航方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)