本發(fā)明公開的一種基于Q?Learning的深空探測器任務(wù)規(guī)劃方法,屬于航空航天技術(shù)領(lǐng)域。本發(fā)明將結(jié)構(gòu)化表達(dá)方法表達(dá)的狀態(tài)空間本身和狀態(tài)的轉(zhuǎn)移,以Q?Learning方法識別的扁平化數(shù)值、向量和矩陣形式輸入強(qiáng)化學(xué)習(xí)的訓(xùn)練過程,完成Q?Learning方法對規(guī)劃的訓(xùn)練,能夠提升對突發(fā)事件適應(yīng)性的基礎(chǔ)上,提升小行星探測任務(wù)規(guī)劃、轉(zhuǎn)移效率。本發(fā)明采用向量和矩陣表達(dá)規(guī)劃中的狀態(tài)和動作關(guān)系,能夠很好的表達(dá)規(guī)劃中狀態(tài)空間各狀態(tài)以及各狀態(tài)之間的轉(zhuǎn)移方式、轉(zhuǎn)移條件和轉(zhuǎn)移效果,進(jìn)而提高小行星探測任務(wù)軌道轉(zhuǎn)移精度。本發(fā)明訓(xùn)練之后的模型擁有快速獲得規(guī)劃解和從其它初始狀態(tài)開始規(guī)劃的能力,提升規(guī)劃效率和規(guī)劃過程的魯棒性。
聲明:
“基于Q-Learning的深空探測器任務(wù)規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)