基于深度強化學(xué)習(xí)的認(rèn)知無線電空頻二維抗敵意干擾方法,認(rèn)知無線電次用戶在未知干擾機攻擊模式和無線信道環(huán)境的狀態(tài)下,觀察認(rèn)知無線電主用戶的接入狀態(tài)、無線信號的信干比,利用深度強化學(xué)習(xí)機制決定是否離開所在被干擾區(qū)域或者選擇一個合適的頻點發(fā)送信號。結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)和Q學(xué)習(xí),利用Q學(xué)習(xí)在無線動態(tài)博弈中學(xué)習(xí)最優(yōu)抗干擾策略,將觀測狀態(tài)和獲取效益輸入深度卷積神經(jīng)網(wǎng)絡(luò)作為訓(xùn)練集加快學(xué)習(xí)速度。利用深度強化學(xué)習(xí)的機制,提高認(rèn)知無線電在動態(tài)變化的無線網(wǎng)絡(luò)環(huán)境場景下對抗敵意干擾機的通信效率??煽朔斯ど窠?jīng)網(wǎng)絡(luò)需要在訓(xùn)練過程中需要先對數(shù)據(jù)進行分類以及Q學(xué)習(xí)算法在狀態(tài)集和動作集維度大的情況下學(xué)習(xí)速度會快速下降問題。
聲明:
“基于深度強化學(xué)習(xí)的認(rèn)知無線電空頻二維抗敵意干擾方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)