本發(fā)明屬于分布式路由技術(shù)領(lǐng)域,具體為一種基于多智能體深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)包路由算法。本發(fā)明為了緩解計(jì)算機(jī)網(wǎng)絡(luò)中的擁塞情況,利用多智能體深度強(qiáng)化學(xué)習(xí)技術(shù),設(shè)計(jì)了一種端到端的自適應(yīng)路由算法,各路由器依據(jù)局部信息完成數(shù)據(jù)包調(diào)度,降低了數(shù)據(jù)包的傳輸時(shí)延。本發(fā)明首先構(gòu)建分布式路由的數(shù)學(xué)模型,明確強(qiáng)化學(xué)習(xí)中各要素的具體含義,然后對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,最后在仿真環(huán)境下進(jìn)行算法性能測試。仿真實(shí)驗(yàn)結(jié)果表明,深度神經(jīng)網(wǎng)絡(luò)的引入可以挖掘輸入網(wǎng)絡(luò)狀態(tài)中的特征信息,實(shí)現(xiàn)暢通路徑和最短路徑之間的權(quán)衡,與其他常用路由算法相比,本發(fā)明實(shí)現(xiàn)了更短的數(shù)據(jù)包傳輸時(shí)延。
聲明:
“基于多智能體深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)包路由算法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)