本發(fā)明公開了一種基于強化學習的高超聲速飛行器航跡規(guī)劃方法,本發(fā)明根據航跡規(guī)劃分2個階段:離線訓練階段,訓練一個不依賴于固定環(huán)境的RL智能體作為航跡規(guī)劃的基線策略;在線規(guī)劃階段,RL?CEM利用環(huán)境模擬器預測未來的狀態(tài)進行規(guī)劃,之后選擇優(yōu)于基線策略的策略作為執(zhí)行策略,否則將使用基線策略。本發(fā)明提出的RL?CEM不僅有效地回避航跡規(guī)劃中的局部最優(yōu),還展現出了令人滿意的成功率。RL?CEM彌補了以往基于RL的航跡規(guī)劃方法容易陷入局部最優(yōu)、規(guī)劃失敗時無替代方案的缺點。本發(fā)明的航跡規(guī)劃方法回避了高超聲速飛行器復雜的動力學,僅通過其運動學來解決該問題。
聲明:
“基于強化學習的高超聲速飛行器航跡規(guī)劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)