本發(fā)明公開了一種結(jié)合知識轉(zhuǎn)移的強化學習方法,步驟如下:S1、設(shè)計BP神經(jīng)網(wǎng)絡(luò)自主任務(wù)間映射關(guān)系;S2、對源任務(wù)學習經(jīng)驗進行案例存儲,并構(gòu)建線性感知器來學習源域和目標域之間的動作映射關(guān)系;S3、運用基于案例推理機理;S4、進行相似度計算與案例檢索,并運用所學到的案例庫中的經(jīng)驗作為啟發(fā)式來加速相關(guān)但不同任務(wù)的學習;及其應(yīng)用于無人車自主技能的學習方法;本發(fā)明結(jié)合強化學習與遷移學習的優(yōu)勢,可實現(xiàn)機器人從簡單領(lǐng)域或源域獲得的經(jīng)驗通過遷移加速應(yīng)用到復雜領(lǐng)域或目標域中;學習速度快,可避免維數(shù)災(zāi)難;顯著的提高了無人車自主技能學習的速度和效率。
聲明:
“結(jié)合知識轉(zhuǎn)移的強化學習方法及其應(yīng)用于無人車自主技能的學習方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)