一種基于多智能體深度強(qiáng)化學(xué)習(xí)的車聯(lián)網(wǎng)邊緣緩存方法,通過以下步驟實(shí)現(xiàn),第1、系統(tǒng)模型與數(shù)學(xué)模型的構(gòu)建;第2、建立基于多智能體的執(zhí)行者?評(píng)價(jià)家結(jié)構(gòu)的協(xié)同內(nèi)容分發(fā)的邊緣緩存策略。本發(fā)明首先采用Zipf分布請(qǐng)求內(nèi)容,每個(gè)智能體根據(jù)自己的策略網(wǎng)絡(luò)及其過程中的噪聲選擇相應(yīng)動(dòng)作并執(zhí)行,之后判斷是否超出緩存,超出則刪除流行度較低內(nèi)容。然后,每個(gè)智能體獲得環(huán)境獎(jiǎng)勵(lì),獲得新的觀測空間,并將相應(yīng)數(shù)據(jù)放入經(jīng)驗(yàn)池中。最后,更新每個(gè)智能體的目標(biāo)網(wǎng)絡(luò)參數(shù)。結(jié)果表明本方法所提出的車聯(lián)網(wǎng)邊緣緩存方案與其他方法相比,在減少內(nèi)容內(nèi)容分發(fā)過程中的時(shí)延、提高內(nèi)容命中率和成功率方面有較好的表現(xiàn)。
聲明:
“基于多智能體深度強(qiáng)化學(xué)習(xí)的車聯(lián)網(wǎng)邊緣緩存方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)