本發(fā)明公開了一種意圖驅(qū)動的強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法,主要步驟包括:1、數(shù)據(jù)采集器獲取監(jiān)測網(wǎng)絡(luò)的狀態(tài);2、根據(jù)環(huán)境障礙物、傳感器節(jié)點(diǎn)和數(shù)據(jù)采集器的位置選擇數(shù)據(jù)采集器的轉(zhuǎn)向角;3、根據(jù)ε貪心策略選擇數(shù)據(jù)采集器的速度、目標(biāo)節(jié)點(diǎn)和下一目標(biāo)節(jié)點(diǎn)作為動作;4、數(shù)據(jù)采集器根據(jù)選擇的轉(zhuǎn)向角和速度確定下一時隙的位置;5、根據(jù)數(shù)據(jù)采集器和傳感器節(jié)點(diǎn)的意圖得到獎賞和懲罰,并更新Q值;6、重復(fù)執(zhí)行步驟1至步驟5,直至到達(dá)終止?fàn)顟B(tài)或收斂條件;7、數(shù)據(jù)采集器選擇每一時隙Q值最大的動作作為規(guī)劃結(jié)果,生成最佳路徑;本發(fā)明提出的方法可以以較高的成功概率、更接近意圖的性能完成數(shù)據(jù)采集路徑規(guī)劃。
聲明:
“意圖驅(qū)動的強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)