本發(fā)明涉及一種狀態(tài)自適應的機群發(fā)動機檢測任務動態(tài)調(diào)度方法,包括以下步驟:步驟1.結(jié)合資源充足度與任務緊迫度進行檢測系統(tǒng)狀態(tài)實時感知;步驟2.構(gòu)建/更新基于強化學習的系統(tǒng)狀態(tài)自適應重調(diào)度決策網(wǎng)絡,并根據(jù)系統(tǒng)狀態(tài)輸出重調(diào)度信號;步驟3.根據(jù)重調(diào)度信號決定維持原調(diào)度方案或使用智能優(yōu)化算法進行重調(diào)度問題求解;步驟4.根據(jù)上一步方案效果計算獎勵值,并感知此時的系統(tǒng)狀態(tài);步驟5.迭代多次后輸出訓練完成的強化學習決策網(wǎng)絡參數(shù)值,利用訓練完成的強化學習決策網(wǎng)絡進行機群航空發(fā)動機檢測任務動態(tài)調(diào)度。本發(fā)明使用強化學習算法進行了系統(tǒng)狀態(tài)自適應重調(diào)度,克服了啟發(fā)式算法的短視性,實現(xiàn)了調(diào)度效率的長效提升。
聲明:
“狀態(tài)自適應的機群發(fā)動機檢測任務動態(tài)調(diào)度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)