本發(fā)明公開了一種面向深度強化學(xué)習(xí)模型對抗攻擊的防御方法及應(yīng)用,包括:利用視覺預(yù)測模型對輸入的前一時刻環(huán)境狀態(tài)進行預(yù)測輸出預(yù)測當(dāng)前環(huán)境狀態(tài),并獲得預(yù)測當(dāng)前環(huán)境狀態(tài)在深度強化學(xué)習(xí)策略下的下一幀預(yù)測環(huán)境狀態(tài)值;獲取深度強化學(xué)習(xí)模型輸出的實際當(dāng)前環(huán)境狀態(tài),并獲得實際當(dāng)前環(huán)境狀態(tài)在深度強化學(xué)習(xí)策略下添加擾動的環(huán)境狀態(tài)值;利用判別模型對預(yù)測環(huán)境狀態(tài)值和添加擾動的環(huán)境狀態(tài)值進行判別,根據(jù)判別結(jié)果獲得深度強化學(xué)習(xí)模型是否被攻擊;在深度強化學(xué)習(xí)模型被攻擊時,提取實際當(dāng)前環(huán)境狀態(tài),利用兩個防御模型對實際當(dāng)前環(huán)境狀態(tài)進行防御;深度強化學(xué)習(xí)模型利用防御后的實際當(dāng)前環(huán)境狀態(tài)進行學(xué)習(xí)預(yù)測輸出。
聲明:
“面向深度強化學(xué)習(xí)模型對抗攻擊的防御方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)