本發(fā)明提供一種復(fù)雜場(chǎng)景自主移動(dòng)機(jī)器人自監(jiān)督學(xué)習(xí)及導(dǎo)航方法,具體步驟包括:設(shè)置機(jī)器人的訓(xùn)練次數(shù);采集機(jī)器人所在環(huán)境的實(shí)際狀態(tài)圖像;將采集的實(shí)際狀態(tài)圖像與機(jī)器人執(zhí)行動(dòng)作前所預(yù)測(cè)的預(yù)測(cè)狀態(tài)圖像比較,計(jì)算所述實(shí)際狀態(tài)圖像與所述預(yù)測(cè)狀態(tài)圖像之間的損失函數(shù),根據(jù)所述的損失函數(shù)計(jì)算獎(jiǎng)懲信號(hào),根據(jù)獎(jiǎng)懲信號(hào)更新網(wǎng)絡(luò)權(quán)重,預(yù)測(cè)機(jī)器人的動(dòng)作和預(yù)測(cè)狀態(tài)圖像;機(jī)器人執(zhí)行動(dòng)作,記錄已完成訓(xùn)練次數(shù);判斷其是否達(dá)到預(yù)先設(shè)置的訓(xùn)練次數(shù),若結(jié)果為否,則返回繼續(xù)訓(xùn)練;若結(jié)果為是,則加權(quán)所有的獎(jiǎng)懲信號(hào),更新網(wǎng)絡(luò)權(quán)重,結(jié)束訓(xùn)練。本發(fā)明結(jié)合視頻預(yù)測(cè)技術(shù)和強(qiáng)化學(xué)習(xí)技術(shù),解決了強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到機(jī)器人中時(shí)人工標(biāo)記的工作量大的問(wèn)題。
聲明:
“復(fù)雜場(chǎng)景自主移動(dòng)機(jī)器人自監(jiān)督學(xué)習(xí)及導(dǎo)航方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)