本公開涉及作戰(zhàn)態(tài)勢分析技術(shù)領(lǐng)域、智能博弈技術(shù)領(lǐng)域、航空兵建模技術(shù)領(lǐng)域和仿真技術(shù)領(lǐng)域,提供了基于DQN的航空兵多平臺協(xié)同智能對抗決策方法,該方法包括:基于DQN算法和規(guī)則集,構(gòu)建集調(diào)度層、編隊層、單機層的協(xié)同作戰(zhàn)行為模型作為指揮決策平臺;基于航空兵多平臺空戰(zhàn)特點以及影響多平臺聯(lián)合作戰(zhàn)結(jié)果相關(guān)因素的重要等級,構(gòu)建調(diào)度層狀態(tài)空間;構(gòu)建調(diào)度層行為空間;設(shè)計DQN算法中的獎勵函數(shù);基于DQN算法,強化學(xué)習(xí)框架進行多平臺聯(lián)合指揮決策的迭代學(xué)習(xí)訓(xùn)練,獲得多平臺協(xié)同作戰(zhàn)策略。本公開實現(xiàn)了指揮策略的自學(xué)習(xí)、自演化,在無經(jīng)驗累積的全新作戰(zhàn)場景下探索、優(yōu)化作戰(zhàn)指揮策略,實現(xiàn)協(xié)調(diào)指揮多平臺兵力聯(lián)合作戰(zhàn)的目標(biāo)。
聲明:
“基于DQN的航空兵多平臺協(xié)同智能對抗決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)