基于深度強(qiáng)化學(xué)習(xí)的艦載機(jī)出動(dòng)回收在線調(diào)度方法涉及艦載機(jī)出動(dòng)回收調(diào)度領(lǐng)域,解決航母甲板上的大規(guī)模艦載機(jī)出動(dòng)回收在線調(diào)度問(wèn)題。本發(fā)明通過(guò)將出動(dòng)回收過(guò)程抽象為馬爾可夫決策過(guò)程,將艦載機(jī)群當(dāng)前狀態(tài)作為輸入,調(diào)度的行為作為輸出,建立帶權(quán)重的特征向量作為獎(jiǎng)賞函數(shù),構(gòu)造出艦載機(jī)出動(dòng)回收調(diào)度模型。為得到安全高效的調(diào)度策略,確立多目標(biāo)調(diào)度策略,以艦載機(jī)艦面位移、任務(wù)調(diào)度時(shí)間、艦面沖突次數(shù)和設(shè)備利用率作為目標(biāo),利用深度Q學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練調(diào)度模型。經(jīng)過(guò)實(shí)驗(yàn)測(cè)試結(jié)果表明,該算法在遇到突發(fā)狀況時(shí)能迅速處理并且對(duì)后續(xù)任務(wù)執(zhí)行不產(chǎn)生影響,同時(shí)得到安全性和靈活性都較高的調(diào)度策略。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的艦載機(jī)出動(dòng)回收在線調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)