本發(fā)明公開了一種基于深度強化學(xué)習(xí)的車聯(lián)網(wǎng)信道資源優(yōu)化方法及系統(tǒng),其中方法包括:首先獲取目標(biāo)車輛對應(yīng)的可用信道資源列表;根據(jù)目標(biāo)車輛中的第一執(zhí)行網(wǎng)絡(luò)和可用信道資源列表,確定轉(zhuǎn)移元組;目標(biāo)車輛將轉(zhuǎn)移元組發(fā)送至路測單元;路測單元將接收到的轉(zhuǎn)移元組存入經(jīng)驗回放池;從經(jīng)驗回放池中抽取數(shù)據(jù)進行訓(xùn)練,并通過最小化損失函數(shù)確定網(wǎng)絡(luò)權(quán)重;路測單元將網(wǎng)絡(luò)權(quán)重發(fā)送至目標(biāo)車輛;目標(biāo)車輛根據(jù)網(wǎng)絡(luò)權(quán)重,對第一執(zhí)行網(wǎng)絡(luò)和第二執(zhí)行網(wǎng)絡(luò)進行更新。本申請實施例讓車輛選擇合適的信道進行通信,優(yōu)化了信道資源的分配方式,降低了信道沖突發(fā)生的可能;另外,本申請實施例提出中心式訓(xùn)練,分布式?jīng)Q策的框架,能有效提高訓(xùn)練效率。
聲明:
“基于深度強化學(xué)習(xí)的車聯(lián)網(wǎng)信道資源優(yōu)化方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)