本發(fā)明公開了一種面向多無人機(jī)碰撞規(guī)避的深度強(qiáng)化學(xué)習(xí)訓(xùn)練加速方法,其包括:步驟S1:基于馬爾可夫決策過程對(duì)完全分布式的無人機(jī)集群避障問題進(jìn)行形式化建模;步驟S2:構(gòu)建深度神經(jīng)網(wǎng)絡(luò)構(gòu)建觀測(cè)輸入?動(dòng)作輸出的映射、網(wǎng)絡(luò)更新方法;步驟S3:融合人類經(jīng)驗(yàn)以加速訓(xùn)練。本發(fā)明具有原理簡(jiǎn)單、訓(xùn)練智能化程度高、可加速深度強(qiáng)化學(xué)習(xí)訓(xùn)練過程等優(yōu)點(diǎn)。
聲明:
“面向多無人機(jī)碰撞規(guī)避的深度強(qiáng)化學(xué)習(xí)訓(xùn)練加速方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)