本申請?zhí)峁┮环N基于深度強(qiáng)化學(xué)習(xí)的認(rèn)知無線網(wǎng)絡(luò)動態(tài)頻譜接入方法,包括:對預(yù)先提出的動態(tài)頻譜接入問題進(jìn)行建模和分析;預(yù)先構(gòu)建雙深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型;根據(jù)第一深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型,獲取系統(tǒng)模型中次用戶基于動態(tài)頻譜接入策略的所有動態(tài)頻譜接入動作的Q值;各個次用戶選擇Q值最優(yōu)狀態(tài)下次用戶的動態(tài)頻譜接入動作;根據(jù)選擇的次用戶的動態(tài)頻譜接入動作選擇第二深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型的目標(biāo)Q值;計(jì)算損失函數(shù),通過最小化損失函數(shù)訓(xùn)練雙深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型,并更新雙深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型的權(quán)重。本申請滿足多用戶多信道認(rèn)知無線網(wǎng)絡(luò)中大狀態(tài)動作空間的高計(jì)算需求,利用過去觀測來預(yù)測現(xiàn)實(shí)狀態(tài),加快收斂速度并提高預(yù)測精度。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的認(rèn)知無線網(wǎng)絡(luò)動態(tài)頻譜接入方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)