本發(fā)明屬于多智能體系統(tǒng)的強(qiáng)化學(xué)習(xí)領(lǐng)域,具體涉及了一種基于動態(tài)圖神經(jīng)網(wǎng)絡(luò)的多智能體對抗方法及系統(tǒng),旨在解決現(xiàn)有基于圖神經(jīng)網(wǎng)絡(luò)的多智能體模型訓(xùn)練速度慢、效率低以及圖構(gòu)建中需要較多人工干預(yù)的問題。本發(fā)明包括:獲取每一個(gè)智能體的觀測向量,并進(jìn)行線性變換獲得觀測特征向量;計(jì)算相鄰智能體之間的連接關(guān)系,構(gòu)建智能體之間的圖結(jié)構(gòu);結(jié)合觀測特征向量對智能體之間的圖結(jié)構(gòu)進(jìn)行嵌入表示;將嵌入表示用于動作網(wǎng)絡(luò)的動作預(yù)測結(jié)果和評價(jià)網(wǎng)絡(luò)的評價(jià),進(jìn)行網(wǎng)絡(luò)時(shí)空并行訓(xùn)練;通過訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行多智能體對抗中的動作預(yù)測和動作評價(jià)。本發(fā)明通過剪枝建立更真實(shí)的圖關(guān)系,利用全連接神經(jīng)網(wǎng)絡(luò)加位置編碼的實(shí)現(xiàn)時(shí)空并行訓(xùn)練,訓(xùn)練效率高、效果好。
聲明:
“基于動態(tài)圖神經(jīng)網(wǎng)絡(luò)的多智能體對抗方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)