本發(fā)明提供一種基于強化學習的控制流完整性保護方法,包括:(1)獲得第一樣本,將所述第一樣本進行反匯編分析,獲得信息,所述信息為代碼塊和根據代碼塊構建的控制流圖;(2)通過所述的信息構建馬爾科夫決策過程模塊;(3)根據所述的馬爾科夫決策過程模塊構建學習模型;(4)獲得、執(zhí)行第二樣本,訓練所述的Q學習模型,獲得期望值,將所述期望值與閾值比較,完成檢測點設置,實現(xiàn)控制流完整性保護。本發(fā)明提供的基于強化學習的保護方法相比于固定檢測點的設置,更具有安全性和靈活性。
聲明:
“基于強化學習的控制流完整性保護方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)