本發(fā)明公開一種基于課程學習的無人機空中博弈對抗的解決方法,包含以下步驟:(1)構(gòu)建仿真模擬環(huán)境;(2)收集飛行員控制飛機的真實軌跡數(shù)據(jù),將軌跡數(shù)據(jù)按照機動動作難度進行課程目標分類;(3)對指定課程目標下的軌跡,通過模仿學習來優(yōu)化策略模型生成的軌跡和專家軌跡的相似度;(4)獲得預(yù)訓(xùn)練無人機策略模型;(5)基于預(yù)訓(xùn)練無人機策略模型,在模擬器中創(chuàng)建敵我雙方無人機智能體;(6)無人機在模擬器中獲得當前時刻的觀測;(7)無人機與模擬環(huán)境進行交互,將我方與敵方無人機對抗的任務(wù)建模為一個強化學習智能體與環(huán)境交互的問題,用強化學習算法優(yōu)化無人機對抗的飛行策略;(8)獲得無人機進行空中博弈對抗的有效策略。
聲明:
“基于課程學習的無人機空中博弈對抗的解決方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)