本發(fā)明公開了一種基于記憶增強(qiáng)學(xué)習(xí)的無人機(jī)自主避障導(dǎo)航方法,克服了傳統(tǒng)深度強(qiáng)化學(xué)習(xí)導(dǎo)航方法在部分可測(cè)環(huán)境中極易陷入局部困境的問題。首先把無人機(jī)自主避障導(dǎo)航問題建模為目標(biāo)驅(qū)動(dòng)的馬爾可夫決策過程,提出動(dòng)態(tài)相對(duì)目標(biāo)的目標(biāo)特征提取方法,引導(dǎo)無人機(jī)學(xué)習(xí)導(dǎo)航問題的本質(zhì)特征;然后考慮到傳統(tǒng)導(dǎo)航方法由于沒有保存歷史信息,導(dǎo)致無人機(jī)在部分可測(cè)環(huán)境中極易陷入局部困境,本發(fā)明設(shè)計(jì)了一種保存動(dòng)作記憶和空間信息的記憶增強(qiáng)模塊,在決策時(shí)額外考慮歷史的觀測(cè)以及動(dòng)作序列,使無人機(jī)更易脫離困境;最后本發(fā)明提出基于高斯分布探索增強(qiáng)的深度強(qiáng)化學(xué)習(xí)算法,使其能夠在提高算法收斂速度的前提下保持并提高無人機(jī)避障導(dǎo)航的成功率。
聲明:
“基于記憶增強(qiáng)學(xué)習(xí)的無人機(jī)自主避障導(dǎo)航方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)