本公開實施例是關(guān)于一種基于多智能體深度強化學習的波束預測方法。該基于多智能體深度強化學習的波束預測方法包括:深度神經(jīng)網(wǎng)絡(luò)利用瞬時信道狀態(tài)信息學習無線信道的關(guān)鍵傳播特性;Q網(wǎng)絡(luò)利用所述深度神經(jīng)網(wǎng)絡(luò)輸出估計動作?值函數(shù),計算網(wǎng)絡(luò)參數(shù)梯度,并讓每個智能體依次做出下一次波束預測;利用所述Q網(wǎng)絡(luò)輸出參數(shù)更新所述深度神經(jīng)網(wǎng)絡(luò)權(quán)值,實現(xiàn)對動態(tài)用戶的精準波束預測。本公開實施例利用深度神經(jīng)網(wǎng)絡(luò)獲取多個能反映信道特征的關(guān)鍵值,使多天線(MIMO)系統(tǒng)的波束預測更符合動態(tài)用戶信道的時變特性,提高波束切換成功率,減小大規(guī)模多天線(MIMO)系統(tǒng)的反饋開銷,從而提高和速率。
聲明:
“基于多智能體深度強化學習的波束預測方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)