本發(fā)明公開(kāi)了一種基于多智能體強(qiáng)化學(xué)習(xí)的車聯(lián)網(wǎng)頻譜共享方法,包括建立車聯(lián)網(wǎng)系統(tǒng)模型,基于馬爾科夫決策過(guò)程建立強(qiáng)化學(xué)習(xí)中觀測(cè)空間、行為空間、獎(jiǎng)勵(lì)設(shè)定的基礎(chǔ)模型,然后將系統(tǒng)模型中的車輛鏈路視為智能體,利用強(qiáng)化學(xué)習(xí)SAC(Soft Actor?critic)思想設(shè)計(jì)頻譜共享方法。本發(fā)明的設(shè)計(jì)方案能夠以合作的方式實(shí)現(xiàn)車聯(lián)網(wǎng)中車輛與車輛(Vehicle?to?Vehicle,V2V)鏈路和車聯(lián)與路旁基礎(chǔ)設(shè)施(Vehicle?to?Roadside Infrastructure,V2I)鏈路的頻譜共享,保證最大化V2I鏈路的信道容量和性能和V2V鏈路載荷的成功傳輸概率性能。
聲明:
“基于多智能體強(qiáng)化學(xué)習(xí)的車聯(lián)網(wǎng)頻譜共享方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)