本發(fā)明公開了一種強化學習多智能體溝通與決策方法,包括:根據(jù)各個智能體的觀測狀態(tài)信息通過神經(jīng)網(wǎng)絡(luò)提取相應(yīng)的狀態(tài)特征;將所有智能體的狀態(tài)特征作為溝通信息輸入至VLAD層中進行軟分配與聚類,得到聚類后的溝通信息;將聚類后的溝通信息分發(fā)給各個智能體,由各個智能體將自身的狀態(tài)特征與接收到的聚類后的溝通信息進行聚合,并通過智能體內(nèi)部的全連接神經(jīng)網(wǎng)絡(luò)進行動作決策。該方法可以對各智能體的狀態(tài)信息進行聚類并與其他智能體進行溝通,進而提高智能體的決策水平。
聲明:
“強化學習多智能體溝通與決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)