一種QUIC協(xié)議下基于深度強化學(xué)習(xí)的視頻流自適應(yīng)傳輸方法,結(jié)合基于門控循環(huán)單元(GRU)和卷積(CNN)的神經(jīng)網(wǎng)絡(luò)建立網(wǎng)絡(luò)軌跡特征的提取模型,利用注意力機制學(xué)習(xí)不同特征對帶寬的影響,預(yù)測未來時刻帶寬信息;將預(yù)測的帶寬信息作為碼率決策的狀態(tài)輸入,建立QoE獎勵模型,采用PPO算法訓(xùn)練強化學(xué)習(xí)網(wǎng)絡(luò),決策最優(yōu)碼率;客戶端根據(jù)碼率自適應(yīng)決策模塊的反饋結(jié)果將相應(yīng)視頻下載并播放,實現(xiàn)QUIC下的視頻流自適應(yīng)傳輸框架。本發(fā)明能夠保證在QUIC協(xié)議下,帶寬預(yù)測模塊能夠充分提取網(wǎng)絡(luò)狀態(tài)信息,實現(xiàn)長窗口的帶寬預(yù)測,為碼率自適應(yīng)決策提供有效輸入,達到充分利用帶寬資源的目的,有效提升用戶觀看體驗質(zhì)量。
聲明:
“QUIC協(xié)議下基于深度強化學(xué)習(xí)的視頻流自適應(yīng)傳輸方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)