本發(fā)明涉及信息處理領(lǐng)域,具體是一種通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)實(shí)現(xiàn)無(wú)人機(jī)自主飛行的方法,包括如下步驟:步驟一、獲取模擬數(shù)據(jù)集和真實(shí)數(shù)據(jù)集;步驟二、提取圖像特征和動(dòng)作特征;步驟三、使用Q?learn ing訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò)Q?funct ion;步驟四、構(gòu)建現(xiàn)實(shí)世界策略學(xué)習(xí)網(wǎng)絡(luò),將深度神經(jīng)網(wǎng)絡(luò)Q?funct ion訓(xùn)練好的參數(shù)遷移至現(xiàn)實(shí)世界策略學(xué)習(xí)網(wǎng)絡(luò)中,訓(xùn)練行動(dòng)條件獎(jiǎng)勵(lì)預(yù)測(cè)函數(shù);步驟五、輸入狀態(tài)向量和H個(gè)未來(lái)計(jì)劃行動(dòng)向量的序列至行動(dòng)條件獎(jiǎng)勵(lì)預(yù)測(cè)函數(shù),通過(guò)一個(gè)長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)整合之后,并在將來(lái)的每個(gè)時(shí)間點(diǎn)輸出預(yù)測(cè)的獎(jiǎng)勵(lì);步驟六、根據(jù)預(yù)測(cè)的獎(jiǎng)勵(lì)實(shí)現(xiàn)自主飛行;該方法能夠使機(jī)器人僅使用單目攝像機(jī)就可以避免碰撞以實(shí)現(xiàn)自主飛行。
聲明:
“通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)實(shí)現(xiàn)無(wú)人機(jī)自主飛行的方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)