針對當(dāng)前反無人機(jī)系統(tǒng)單一攔截裝備在暫時性的任務(wù)分配中無法有效壓制無人機(jī)的問題,本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的反無人機(jī)任務(wù)分配方法,包括:對改進(jìn)的DQN算法初始化,改進(jìn)的DQN算法是指相對于DQN算法,采用當(dāng)前時刻的狀態(tài)來預(yù)測Q值;通過改進(jìn)的DQN算法完成智能體的訓(xùn)練與優(yōu)化,在智能體訓(xùn)練完備之后保存網(wǎng)絡(luò)參數(shù);將無人機(jī)狀態(tài)信息S輸入強(qiáng)化學(xué)習(xí)模塊,通過強(qiáng)化學(xué)習(xí)輸出次優(yōu)解X,即初期的分配策略;通過進(jìn)化算法對強(qiáng)化學(xué)習(xí)生成的次優(yōu)解進(jìn)行優(yōu)化,生成目標(biāo)分配的最優(yōu)解;對所述的最優(yōu)解進(jìn)行解碼,獲得反無人機(jī)的任務(wù)分配方案。本發(fā)明中通過改進(jìn)的DQN算法訓(xùn)練的智能體攔截表現(xiàn)更為精確,任務(wù)分配更加高效且適用。
聲明:
“基于強(qiáng)化學(xué)習(xí)的反無人機(jī)任務(wù)分配方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)