本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)防御滲透攻擊的方法及裝置、電子設(shè)備,該方法包括:(1)將滲透測(cè)試過(guò)程建模為馬爾可夫決策過(guò)程,其中所述馬爾可夫決策過(guò)程包括狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)值;(2)訓(xùn)練智能體,其中所述智能體作為滲透攻擊方,訓(xùn)練目標(biāo)為生成當(dāng)前最優(yōu)滲透攻擊路徑過(guò)程;(3)將網(wǎng)絡(luò)環(huán)境中敏感主機(jī)的價(jià)值進(jìn)行符號(hào)翻轉(zhuǎn),并設(shè)置獲得目標(biāo)敏感主機(jī)的Root權(quán)限時(shí)滲透攻擊的回合不結(jié)束,將滲透攻擊的回合的結(jié)束條件修改為回合中訓(xùn)練步數(shù)達(dá)到了預(yù)定閾值;(4)將對(duì)主機(jī)價(jià)值的修改更新到步驟(1)的獎(jiǎng)勵(lì)值中,利用訓(xùn)練好的智能體對(duì)步驟(3)中的網(wǎng)絡(luò)環(huán)境進(jìn)行防御訓(xùn)練,重復(fù)防御訓(xùn)練的過(guò)程直至訓(xùn)練回合數(shù)達(dá)到預(yù)定閾值,得到防御滲透攻擊的策略。
聲明:
“基于強(qiáng)化學(xué)習(xí)防御滲透攻擊的方法及裝置、電子設(shè)備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)