本發(fā)明公開(kāi)了一種基于深度強(qiáng)化學(xué)習(xí)的艦載機(jī)保障作業(yè)人員調(diào)度方法,包括以下步驟:構(gòu)建艦載機(jī)保障過(guò)程的馬爾可夫決策過(guò)程(Markov Decision Process,MDP)模型,作為智能體訓(xùn)練環(huán)境;根據(jù)保障作業(yè)流程,確定智能體及其觀測(cè)空間與動(dòng)作空間;隨后設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)、經(jīng)驗(yàn)抽取機(jī)制和終止條件,并基于此設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu);通過(guò)設(shè)置主要參數(shù)初始化環(huán)境,并采用多智能體深度確定策略梯度算法(Multi Agent Deep Deterministic Policy Gradient,MADDPG)訓(xùn)練智能體;最終使用完成訓(xùn)練智能體的決策輔助指揮人員進(jìn)行保障作業(yè)人員調(diào)度。本發(fā)明可用于人員調(diào)度智能決策,將各類保障小組設(shè)定為智能體,輔助指揮人員和保障人員進(jìn)行決策,提高保障作業(yè)決策效率,從而提高艦載機(jī)出動(dòng)回收架次率。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的艦載機(jī)保障作業(yè)人員調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)