本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)鏈路預(yù)測模型魯棒性增強(qiáng)方法,包括:(1)對原始圖數(shù)據(jù)進(jìn)行特征嵌入,提取嵌入向量;(2)將特征嵌入后的嵌入向量作為馬爾科夫決策過程中的狀態(tài)進(jìn)行建模,輸出動(dòng)作為修改的連邊數(shù);(3)使用強(qiáng)化學(xué)習(xí)DDPG的訓(xùn)練策略,逐圖增刪連邊,直到最后一張;(4)計(jì)算處理后的圖數(shù)據(jù),輸入到動(dòng)態(tài)鏈路預(yù)測模型進(jìn)行準(zhǔn)確率預(yù)測,得到回報(bào)值;(5)重復(fù)步驟(3)~(4),直到設(shè)定的訓(xùn)練輪數(shù),得到魯棒性增強(qiáng)的圖數(shù)據(jù)。利用本發(fā)明的方法,修改后的圖數(shù)據(jù)在模型上可以保持良好的性能,同時(shí)具有強(qiáng)魯棒性,對動(dòng)態(tài)鏈路預(yù)測模型應(yīng)用到安全關(guān)鍵的領(lǐng)域中具有重要的理論和實(shí)踐意義。
聲明:
“基于強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)鏈路預(yù)測模型魯棒性增強(qiáng)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)