本發(fā)明提供了一種基于多智能體強(qiáng)化學(xué)習(xí)的惡意軟件檢測(cè)方法及裝置,其中方法包括:S1對(duì)惡意軟件樣本進(jìn)行提取PE特征的操作;S2檢測(cè)智能體對(duì)PE特征進(jìn)行檢測(cè),如果檢測(cè)結(jié)果為惡意則執(zhí)行S3,如果檢測(cè)結(jié)果為良性則執(zhí)行S5;S3操作智能體對(duì)惡意軟件進(jìn)行變體操作;S4將經(jīng)過變體操作的惡意軟件變體作為惡意軟件樣本,返回執(zhí)行S1;S5判斷檢測(cè)智能體是否成功檢測(cè)出惡意軟件,如果未成功檢測(cè)出惡意軟件,則對(duì)檢測(cè)智能體進(jìn)行懲罰操作,對(duì)操作智能體進(jìn)行獎(jiǎng)勵(lì)操作;如果成功檢測(cè)出惡意軟件,則對(duì)檢測(cè)智能體進(jìn)行獎(jiǎng)勵(lì)操作,對(duì)操作智能體進(jìn)行懲罰操作;S6如果訓(xùn)練結(jié)束,收斂模型,存儲(chǔ)檢測(cè)智能體的檢測(cè)策略以及操作智能體的操作策略。
聲明:
“基于多智能體強(qiáng)化學(xué)習(xí)的惡意軟件檢測(cè)方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)