本發(fā)明公開了一種基于多智能體系統(tǒng)的深度強(qiáng)化學(xué)習(xí)方法,包括如下步驟:基于結(jié)合體框架建立算法,多智能體系統(tǒng)中每個獨(dú)立的智能體均為分類的誘發(fā)條件,智能體觸發(fā)誘發(fā)條件,判斷該智能體的觀測范圍內(nèi)所有智能體能否成為合作者,當(dāng)觸發(fā)誘發(fā)條件的智能體觀測范圍內(nèi)具有成為合作者的智能體時,將其構(gòu)成組,建立雙向的LSTM模型,并整合每個上述的通信組中所有智能體的信息,促成協(xié)作決策,智能體同時屬于至少兩個通信組時,建立通信通道連接該智能體所在的通信組;本方案應(yīng)用在具有較多智能體的多智能體系統(tǒng)中,可在其判斷哪些智能體攝取的信息是有價值的,避免將這些沒有價值的信息帶入系統(tǒng)中時,降低了系統(tǒng)的運(yùn)算量,極大地增加了通信的速率。
聲明:
“基于多智能體系統(tǒng)的深度強(qiáng)化學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)