本發(fā)明公開了一種基于DDPG的發(fā)射資源智能認(rèn)知管理方法,包括:構(gòu)建并訓(xùn)練LSTM預(yù)測(cè)網(wǎng)絡(luò);利用深度強(qiáng)化學(xué)習(xí)智能體感知環(huán)境,以獲取目標(biāo)狀態(tài)的觀測(cè)值;將目標(biāo)狀態(tài)的觀測(cè)值輸入已訓(xùn)練的LSTM預(yù)測(cè)網(wǎng)絡(luò),得到目標(biāo)的先驗(yàn)信息表示;將目標(biāo)的先驗(yàn)信息表示輸入Actor?Critic網(wǎng)絡(luò),得到動(dòng)作向量;根據(jù)動(dòng)作向量生成發(fā)射波束并分配功率,以實(shí)現(xiàn)發(fā)射資源的智能管理。本發(fā)明提供的基于DDPG的發(fā)射資源智能認(rèn)知管理方法,簡(jiǎn)化了優(yōu)化過程,提高了跟蹤精度;且未限制發(fā)射波束與目標(biāo)個(gè)數(shù)的數(shù)量關(guān)系,使得資源分配更合理,資源的利用效率更高,應(yīng)用范圍更廣泛。
聲明:
“基于DDPG的發(fā)射資源智能認(rèn)知管理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)