本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的惡意PDF文件對(duì)抗樣本生成方法,涉及信息系統(tǒng)安全技術(shù)領(lǐng)域。本發(fā)明基于強(qiáng)化學(xué)習(xí)的PDF對(duì)抗樣本生成方法使用強(qiáng)化學(xué)習(xí)模型從已有的探索經(jīng)驗(yàn)中形成快速尋找下一個(gè)最佳修改動(dòng)作的策略,根據(jù)檢測(cè)器返回的分類結(jié)果選擇合適的修改動(dòng)作執(zhí)行黑盒攻擊,而不依賴于對(duì)檢測(cè)器特征集合的先驗(yàn)知識(shí),克服了啟發(fā)式算法的缺陷并在實(shí)際情景下具有可行性。同時(shí),通過自動(dòng)尋找最優(yōu)修改動(dòng)作修改給定的PDF文件,生成可逃逸檢測(cè)器檢測(cè)的對(duì)抗樣本,并采用離線訓(xùn)練與在線微調(diào)的方式輕量化更新生成模型,使得模型保持對(duì)不斷進(jìn)化的PDF惡意軟件和檢測(cè)器的有效性,從而暴露檢測(cè)器缺陷、提高機(jī)器學(xué)習(xí)檢測(cè)器的魯棒性。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的惡意PDF文件對(duì)抗樣本生成方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)