本發(fā)明公開了帶動作集合的強化學(xué)習(xí)干擾波形生成、評價方法及裝置,建立干擾波形庫;構(gòu)建干擾波形決策網(wǎng)絡(luò),包括策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò);探索階段使用跟蹤算法進行干擾,填充經(jīng)驗池;從經(jīng)驗池中隨機選取一組數(shù)據(jù);根據(jù)當(dāng)前通信狀態(tài)的干擾動作,通過策略網(wǎng)絡(luò)預(yù)測下一時刻相應(yīng)干擾動作;根據(jù)策略網(wǎng)絡(luò)輸出的干擾動作,生成離散化干擾動作,從干擾波形庫中選取干擾動作,并結(jié)合策略網(wǎng)絡(luò)輸出的干擾動作,共同輸入價值網(wǎng)絡(luò),得到價值最高的干擾動作作為實際的干擾動作;再進行干擾效果評價。針對干擾動作和干擾參數(shù)龐大的情況,對通信方的抗干擾行為進行學(xué)習(xí),解決了現(xiàn)有干擾波形算法收斂速度慢、準(zhǔn)確率不高的問題,實現(xiàn)了精準(zhǔn)干擾。
聲明:
“帶動作集合的強化學(xué)習(xí)干擾波形生成、評價方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)