本發(fā)明公開(kāi)一種基于深度強(qiáng)化學(xué)習(xí)的頻譜資源管理方法。主要解決現(xiàn)有技術(shù)不能有效利用不完全信道狀態(tài)信息進(jìn)行頻譜和功率分配以及頻譜資源管理多目標(biāo)優(yōu)化的問(wèn)題。其實(shí)現(xiàn)方案是,以頻譜效率最大化為優(yōu)化目標(biāo),構(gòu)造以信道增益和噪聲功率為權(quán)值參數(shù)的自適應(yīng)深度神經(jīng)網(wǎng)絡(luò);初始化權(quán)值參數(shù),觀測(cè)用戶(hù)接入信息和干擾信息,根據(jù)通信網(wǎng)絡(luò)能量效率和公平性計(jì)算損失函數(shù),沿著損失函數(shù)梯度下降方向逐層更新信道增益和噪聲功率,反復(fù)訓(xùn)練自適應(yīng)深度神經(jīng)網(wǎng)絡(luò),當(dāng)滿足訓(xùn)練結(jié)束條件,輸出最優(yōu)頻譜資源管理策略。本發(fā)明能基于不完全信道狀態(tài)信息得到最優(yōu)頻譜資源管理策略,有效提升了通信網(wǎng)絡(luò)的頻譜效率、能量效率和公平性,可用于無(wú)線通信中的頻譜和功率分配。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的頻譜資源管理方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)