本發(fā)明涉及一種多節(jié)點探測器著陸行為智能規(guī)劃及決策方法,屬于航天器控制和人工智能技術(shù)領(lǐng)域。本發(fā)明利用多智能體強化學習來端到端地完成探測器著陸行為規(guī)劃決策,采用“集中訓練分布執(zhí)行”的訓練范式,智能體以局部觀測作為Actor網(wǎng)絡(luò)的輸入,以全局觀測作為Critic網(wǎng)絡(luò)的輸入,達到了智能體之間信息交互的目的。同時,本發(fā)明將基于模型的元學習方法融入本發(fā)明方法中,在Actor和Critic網(wǎng)絡(luò)中嵌入GRU模塊實現(xiàn)歷史經(jīng)驗的存儲與利用,使智能體在面對不確定環(huán)境時具有更好的魯棒性,最終使獲得的策略能夠指導探測器各節(jié)點應(yīng)對不確知的小行星環(huán)境,顯著降低了探測器著陸時發(fā)生反彈、滾轉(zhuǎn)、傾覆的概率。
聲明:
“多節(jié)點探測器著陸行為智能規(guī)劃及決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)