本發(fā)明公開(kāi)一種基于多智能體強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)集群高效通信方法,構(gòu)建無(wú)人機(jī)飛行環(huán)境模擬器;隨機(jī)選取一架無(wú)人機(jī)作為隊(duì)長(zhǎng)并標(biāo)記;每架無(wú)人機(jī)獲取并維護(hù)本機(jī)的局部觀測(cè)值,將自身觀測(cè)值進(jìn)行編碼并發(fā)送給隊(duì)長(zhǎng);隊(duì)長(zhǎng)根據(jù)每架無(wú)人機(jī)的自身觀測(cè)值,分別對(duì)全局觀測(cè)值進(jìn)行attention注意力機(jī)制處理,根據(jù)信息的重要程度來(lái)決定信息的權(quán)重,繼而將計(jì)算好的觀測(cè)值發(fā)送給每個(gè)隊(duì)友,作為隊(duì)友的全局觀測(cè)值;訓(xùn)練階段以全局觀測(cè)值作為訓(xùn)練數(shù)據(jù),直到策略網(wǎng)絡(luò)收斂;執(zhí)行階段以分布式的方式進(jìn)行;對(duì)隊(duì)長(zhǎng)的存活給一個(gè)額外的獎(jiǎng)勵(lì)。本發(fā)明可以在通信開(kāi)銷較小的條件下解決無(wú)人機(jī)集群集中式信息交互的問(wèn)題,給予無(wú)人機(jī)自主決策權(quán)。
聲明:
“基于多智能體強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)集群高效通信方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)