本發(fā)明提供一種情景記憶引導(dǎo)的機(jī)器人操作技能高效學(xué)習(xí)方法,屬于智能機(jī)器人服務(wù)技術(shù)領(lǐng)域。該高效學(xué)習(xí)方法首先,建立機(jī)器人學(xué)習(xí)系統(tǒng)情景記憶模型,并構(gòu)建機(jī)器人感知與記憶進(jìn)行相似性度量算法,實(shí)現(xiàn)對(duì)事件和場(chǎng)景信息檢索匹配與情景記憶中事件的更新調(diào)用;其次,構(gòu)建兩相情景記憶引導(dǎo)的機(jī)器人操作技能深度強(qiáng)化學(xué)習(xí)算法,分別使用情景記憶引導(dǎo)動(dòng)作選擇過程;最后,并以情景記憶評(píng)估學(xué)習(xí)過程中各狀態(tài)的價(jià)值,生成深度強(qiáng)化學(xué)習(xí)算法的獎(jiǎng)賞函數(shù)。本發(fā)明提供使用已有經(jīng)驗(yàn)指導(dǎo)機(jī)器人學(xué)習(xí)新技能的方法,能夠提高機(jī)器人對(duì)操作技能的學(xué)習(xí)效率,解決機(jī)器人操作技能學(xué)習(xí)過程中數(shù)據(jù)量過大、使用深度強(qiáng)化學(xué)習(xí)算法學(xué)習(xí)效率低的問題。
聲明:
“情景記憶引導(dǎo)的機(jī)器人操作技能高效學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)