本發(fā)明提出了基于免疫深度強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人自主導(dǎo)航方法,該方法基于深度確定性策略梯度(DDPG)算法,并結(jié)合移動(dòng)機(jī)器人的運(yùn)動(dòng)學(xué)分析、信息熵理論以及免疫優(yōu)化理論來實(shí)現(xiàn)移動(dòng)機(jī)器人的自主導(dǎo)航。首先通過Gazebo仿真平臺(tái)搭建仿真實(shí)驗(yàn)環(huán)境,然后將移動(dòng)機(jī)器人通過傳感器獲得的機(jī)器人周圍環(huán)境的特征信息,將其輸入到KAI?DDPG網(wǎng)絡(luò),并進(jìn)行一定次數(shù)的訓(xùn)練,就可獲得移動(dòng)機(jī)器人的運(yùn)動(dòng)策略模型和不同場(chǎng)景下每步的執(zhí)行動(dòng)作。然后在真實(shí)場(chǎng)景下,將訓(xùn)練好的網(wǎng)絡(luò)模型導(dǎo)入真實(shí)移動(dòng)機(jī)器人中,即可實(shí)現(xiàn)移動(dòng)機(jī)器人的自主導(dǎo)航。本發(fā)明具有一定的環(huán)境適應(yīng)能力,移動(dòng)機(jī)器人在不用預(yù)知環(huán)境地圖信息下自主實(shí)現(xiàn)多種場(chǎng)景下的導(dǎo)航。
聲明:
“基于免疫深度強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人自主導(dǎo)航方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)