本發(fā)明公開一種基于異步深度強(qiáng)化學(xué)習(xí)的無線傳感器網(wǎng)絡(luò)拓?fù)鋬?yōu)化方法,利用無標(biāo)度網(wǎng)絡(luò)模型的規(guī)則生成初始化的無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);壓縮無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);初始化異步深度強(qiáng)化學(xué)習(xí)模型;訓(xùn)練與測試階段;在訓(xùn)練階段,首先對無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行序列化,用一個(gè)行向量來表示無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);然后,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)行向量分別輸入到不同的本地網(wǎng)絡(luò)訓(xùn)練模型中;其次,本地網(wǎng)絡(luò)訓(xùn)練模型中包含兩個(gè)神經(jīng)網(wǎng)絡(luò)模型,分別是動(dòng)作選取策略網(wǎng)絡(luò)和策略評估網(wǎng)絡(luò);測試階段,全局網(wǎng)絡(luò)訓(xùn)練模型對測試數(shù)據(jù)集進(jìn)行測試評估;重復(fù)步驟1、2、3和4;直至最大的迭代次數(shù)。
聲明:
“基于異步深度強(qiáng)化學(xué)習(xí)的無線傳感器網(wǎng)絡(luò)拓?fù)鋬?yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)