本發(fā)明公開了一種基于ARS強(qiáng)化學(xué)習(xí)算法的行星飛行避障制導(dǎo)方法,首先設(shè)置飛行器動(dòng)作空間、飛行器狀態(tài)空間、獎(jiǎng)勵(lì)函數(shù),然后設(shè)置ARS算法超參數(shù),采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)飛行器避障功能;運(yùn)行ARS算法,與環(huán)境交互獲取經(jīng)驗(yàn)并不斷更新神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)避障制導(dǎo)律;訓(xùn)練多個(gè)回合后算法收斂即獲得避障制導(dǎo)律;當(dāng)障礙物距離飛行器的距離在飛行器探測(cè)范圍內(nèi)時(shí),將飛行器探測(cè)范圍的邊界圓作為探測(cè)邊界,探測(cè)邊界外為安全區(qū),探測(cè)邊界內(nèi)為預(yù)警區(qū);當(dāng)飛行器在預(yù)警區(qū)內(nèi)時(shí)需要啟動(dòng)避障制導(dǎo)律避障,否則正常飛行。本發(fā)明方法是一種相對(duì)簡(jiǎn)化的無模型強(qiáng)化學(xué)習(xí)算法,采用適宜解決連續(xù)行為問題的線性策略,具有較高的效率和魯棒性。
聲明:
“基于ARS強(qiáng)化學(xué)習(xí)算法的行星飛行避障制導(dǎo)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)