利用深度強化學習的可變構航天器在軌自變構規(guī)劃方法,本發(fā)明涉及可變構航天器在軌自變構規(guī)劃方法。本發(fā)明的目的是為了解決現(xiàn)有方法對于稍微復雜的構型,算法復雜度大;無法進行規(guī)劃的問題。過程為:S1:初始化均值和目標網(wǎng)絡的參數(shù);S2:根據(jù)目標網(wǎng)絡選擇組成自變構衛(wèi)星的可動模塊動作;S3:化解碰撞沖突;S4:監(jiān)測S3動作執(zhí)行后運動模塊的狀態(tài)改變;S5:獲取每個模塊執(zhí)行動作的收益;S6:選取模塊執(zhí)行動作獲得的經(jīng)驗,存儲在內存中;S7:從內存中選取樣本輸入均值網(wǎng)絡,得到訓練好的均值網(wǎng)絡;S8:將參數(shù)復制到目標網(wǎng)絡中進行更新;目標網(wǎng)絡輸入為模塊狀態(tài)、動作,輸出動作價值函數(shù)。本發(fā)明用于航天器在軌自變構規(guī)劃領域。
聲明:
“利用深度強化學習的可變構航天器在軌自變構規(guī)劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)