本發(fā)明公開(kāi)了一種基于圖神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)集群蜂擁控制方法,包括以下步驟:建立集群蜂擁控制模型;確定集群的拓?fù)浣Y(jié)構(gòu)特征表示方法;確定智能體的觀測(cè)信息特征表示方法;設(shè)計(jì)狀態(tài)空間、行為空間與回報(bào)函數(shù);設(shè)計(jì)深度強(qiáng)化學(xué)習(xí)算法中的策略網(wǎng)絡(luò)與評(píng)價(jià)網(wǎng)絡(luò)模型;設(shè)計(jì)算法框架及網(wǎng)絡(luò)參數(shù)更新方法;設(shè)計(jì)集群蜂擁控制算法的訓(xùn)練流程。本發(fā)明借助深度強(qiáng)化學(xué)習(xí)技術(shù)實(shí)現(xiàn)集群蜂擁控制算法,利用圖神經(jīng)網(wǎng)絡(luò)提取集群的拓?fù)浣Y(jié)構(gòu)特征以及觀測(cè)信息特征,有效提高集群蜂擁控制算法的收斂速度和對(duì)動(dòng)態(tài)環(huán)境的適應(yīng)能力,同時(shí)能夠保證在控制噪聲等干擾下算法的穩(wěn)定性。
聲明:
“基于圖神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)集群蜂擁控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)