本發(fā)明涉及一種多任務(wù)深度強(qiáng)化學(xué)習(xí)的深空探測(cè)器軟著陸路徑規(guī)劃方法,屬于人工智能與深空探測(cè)技術(shù)領(lǐng)域。本發(fā)明基于深度確定性策略強(qiáng)化學(xué)習(xí)算法DDPG,采用多任務(wù)學(xué)習(xí),充分利用智能體之間的對(duì)抗與協(xié)作關(guān)系,提升了每個(gè)智能體應(yīng)對(duì)不確定情況的能力,提高模型整體的泛化性能。通過(guò)采用融合時(shí)間上下文信息的自注意力機(jī)制,不僅避免智能體陷入局部最優(yōu)狀態(tài),而且使智能體更加聚焦到有利于自身獲得最大回報(bào)的信息進(jìn)行學(xué)習(xí),進(jìn)一步提高探測(cè)器著陸的成功率。本方法能夠?qū)崿F(xiàn)深空探測(cè)器的穩(wěn)定著陸,為后續(xù)實(shí)現(xiàn)小行星探測(cè)、自主取樣和航天員登陸活動(dòng)奠定基礎(chǔ)。
聲明:
“多任務(wù)深度強(qiáng)化學(xué)習(xí)的深空探測(cè)器軟著陸路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)