本發(fā)明提供了一種基于強化學習的無人機空戰(zhàn)機動決策方法,首先創(chuàng)建飛機平臺的運動模型;然后分析影響空戰(zhàn)態(tài)勢的各主要因素,在運動模型和空戰(zhàn)態(tài)勢因素分析的基礎上,設計空戰(zhàn)機動決策的動態(tài)模糊Q學習模型,確定強化學習的各要素和算法流程;對空戰(zhàn)機動決策的狀態(tài)空間進行模糊化作為強化學習的狀態(tài)輸入;選取典型空戰(zhàn)動作作為強化學習基本行動,通過各模糊規(guī)則的觸發(fā)強度加權求和實現(xiàn)連續(xù)行動空間的覆蓋;在構建的空戰(zhàn)優(yōu)勢函數(shù)為基礎通過設置權重和疊加獎懲值的方法設置了強化學習的回報值。本發(fā)明可有效提高無人機進行空戰(zhàn)機動自主決策的能力,具有較高的魯棒性和自主尋優(yōu)性,在不斷的仿真和學習中無人機所做的決策水平不斷提高。
聲明:
“基于強化學習的無人機空戰(zhàn)機動決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)