本發(fā)明提供了一種基于深度強化學(xué)習(xí)的物理層欺騙檢測方法,主要解決現(xiàn)有物理層欺騙檢測方法中對于動態(tài)未知的無線環(huán)境,信道模型或參數(shù)難獲取,難準(zhǔn)確地選擇固定檢測閾值的問題。其實現(xiàn)步驟為:1)建立欺騙攻擊場景,接收方提取收發(fā)雙方之間物理層信道信息表征物理層指紋特征;2)建立二進制假設(shè)檢驗?zāi)P停?)以動態(tài)的物理層指紋特征構(gòu)建狀態(tài)值,以閾值數(shù)值選擇構(gòu)建行為值,以貝葉斯風(fēng)險函數(shù)作為瞬時效益函數(shù),建立狀態(tài)?行為?效益三元組;4)基于深度確定性策略梯度框架,設(shè)計檢測閾值動態(tài)選擇方法,對物理層欺騙攻擊進行檢測。本發(fā)明可以實現(xiàn)檢測閾值的動態(tài)連續(xù)選擇且對于動態(tài)未知環(huán)境具有自適應(yīng)性,有效地檢測物理層欺騙攻擊。
聲明:
“基于深度強化學(xué)習(xí)的物理層欺騙檢測方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)