一種基于強(qiáng)化學(xué)習(xí)的行星軟著陸控制方法及系統(tǒng)和存儲(chǔ)介質(zhì),涉及軟著陸軌跡優(yōu)化與控制領(lǐng)域,為了解決現(xiàn)有的行星軟著陸控制存在無法保證制導(dǎo)律最優(yōu)、模型較復(fù)雜,訓(xùn)練難以收斂等問題。本發(fā)明包括:一:基于著陸器的硬件構(gòu)型和發(fā)動(dòng)機(jī)動(dòng)力配置等特征,建立著陸器動(dòng)力下降段六自由度動(dòng)力學(xué)模型;二:設(shè)計(jì)訓(xùn)練交互環(huán)境的獎(jiǎng)勵(lì)函數(shù)、觀測(cè)空間、動(dòng)作空間和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);三:數(shù)值仿真環(huán)境的搭建,利用強(qiáng)化學(xué)習(xí)算法訓(xùn)練得到軟著陸控制器;四:通過速度跟蹤測(cè)試和軟著陸測(cè)試對(duì)訓(xùn)練控制效果評(píng)估。通過執(zhí)行步驟一和步驟二獲得軟著陸強(qiáng)化學(xué)習(xí)環(huán)境模型,智能體與環(huán)境模型交互,從而獲得訓(xùn)練數(shù)據(jù)。通過步驟三訓(xùn)練可以得到軟著陸控制器,最后通過步驟四挑選出表現(xiàn)最佳的訓(xùn)練結(jié)果,作為最優(yōu)軟著陸控制器。本發(fā)明用于軟著陸軌跡優(yōu)化與控制。
聲明:
“基于強(qiáng)化學(xué)習(xí)的行星軟著陸控制方法及系統(tǒng)和存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)