本發(fā)明公開了一種深度強化學習模型對抗攻擊的防御方法,通過訓練樣本觀測數(shù)據(jù)內部統(tǒng)計規(guī)律,基于所得的概率分布模型,產(chǎn)生與原始樣本同分布的樣本,使模型能抵御不同類型的對抗攻擊,較之其他防御算法,本發(fā)明提供的防御方法在保證防御效果的基礎上,具有更強的泛化能力和魯棒性。此外,本發(fā)明的對抗樣本是在原始樣本基礎上加入擾動后生成,再將對抗樣本中的擾動去除重構為原始樣本,因此本發(fā)明提供的防御方法更具可解釋性。樣本數(shù)據(jù)形成了一個從對抗攻擊到防御的閉環(huán),滿足循環(huán)一致性的原則。
聲明:
“深度強化學習模型對抗攻擊的防御方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)