本發(fā)明在結(jié)合強化學(xué)習(xí)試錯和動態(tài)規(guī)劃思想的基礎(chǔ)上,公開了一種基于地理位置的多智能體Q學(xué)習(xí)路由算法,QLGR(Q Learning based Geographic Routing)路由協(xié)議。協(xié)議在考慮下一跳節(jié)點質(zhì)量與負(fù)載能力的同時,基于地理位置信息選擇較優(yōu)的鄰居節(jié)點。同時在數(shù)據(jù)包傳輸時考慮數(shù)據(jù)回傳的情況,并對該情況的出現(xiàn)基于懲罰。本發(fā)明首先詳細(xì)分析了QLGR的設(shè)計思路、網(wǎng)絡(luò)架構(gòu);其次,設(shè)計了基于Q學(xué)習(xí)衡量鄰居節(jié)點價值評估方法;接著,結(jié)合地理位置信息,權(quán)衡貪婪轉(zhuǎn)發(fā)與鄰居節(jié)點價值,設(shè)計了一種基于地理位置的轉(zhuǎn)發(fā)策略;最后通過仿真實驗對提出的路由協(xié)議進行測試,并與現(xiàn)有的路由協(xié)議進行對比。
聲明:
“基于地理位置的多智能體強化學(xué)習(xí)路由算法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)