一種基于因果圖的分層強(qiáng)化學(xué)習(xí)任務(wù)圖進(jìn)化方法,步驟包括:(1)參數(shù)設(shè)置;(2)探索目標(biāo)環(huán)境的因果圖;(3)種群N初始化;(4)計(jì)算適應(yīng)度值;(5)遺傳操作,包括選擇、交叉和變異;操作時保持結(jié)點(diǎn)之間的因果關(guān)系;(6)判斷是否終止;(7)保存此因果圖對應(yīng)的k個適應(yīng)度最高的任務(wù)圖G1,G2,…,GK;(8)輸出適應(yīng)度最高的任務(wù)圖G1。與現(xiàn)有技術(shù)相比本發(fā)明的構(gòu)造任務(wù)圖的自動化,任務(wù)圖的高效性,能適應(yīng)大規(guī)模復(fù)雜系統(tǒng),能適用系統(tǒng)環(huán)境動態(tài)變化的情況。本方法僅僅依賴目標(biāo)環(huán)境的因果圖變化情況,在目標(biāo)環(huán)境因果圖有規(guī)律變化時能夠預(yù)測目標(biāo)環(huán)境的任務(wù)層次變化情況,從而快速高效地生成目標(biāo)環(huán)境的MAXQ任務(wù)圖。
聲明:
“基于因果圖的分層強(qiáng)化學(xué)習(xí)任務(wù)圖進(jìn)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)