本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的無(wú)人飛行器自主編隊(duì)智能控制方法,應(yīng)用于多無(wú)人機(jī)系統(tǒng)。本發(fā)明方法首先構(gòu)建多無(wú)人飛行器系統(tǒng)模型,確定多無(wú)人飛行器協(xié)同編隊(duì)的任務(wù)目標(biāo);然后基于MADDPG框架構(gòu)建自主編隊(duì)協(xié)同控制器,布置在每個(gè)跟隨無(wú)人飛行器上;自主編隊(duì)協(xié)同控制器包括基于策略梯度的編隊(duì)行為者網(wǎng)絡(luò)和編隊(duì)目標(biāo)行為者網(wǎng)絡(luò),以及基于值的編隊(duì)評(píng)價(jià)者網(wǎng)絡(luò)和編隊(duì)目標(biāo)評(píng)價(jià)者網(wǎng)絡(luò);行為者網(wǎng)絡(luò)允許單個(gè)智能體策略網(wǎng)絡(luò)的優(yōu)化過(guò)程使用鄰居節(jié)點(diǎn)的觀測(cè)信息,訓(xùn)練完成之后每個(gè)智能體以分散的方式行動(dòng),本發(fā)明方法可實(shí)現(xiàn)多飛行器智能協(xié)同編隊(duì),共同完成特定的隊(duì)形保持、沖突協(xié)調(diào)以及避免碰撞等協(xié)同問(wèn)題,提高采樣效率,適用于大規(guī)模的多智能體系統(tǒng)。
聲明:
“基于強(qiáng)化學(xué)習(xí)的無(wú)人飛行器自主編隊(duì)智能控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)