本發(fā)明提出一種基于深度強化學習的容器云集群資源利用優(yōu)化方法,包括:對原始負載數(shù)據進行預處理并組裝為輸入狀態(tài)s;構建深度Q網絡模型,將輸入狀態(tài)s輸入深度Q網絡模型中,深度Q網絡模型以一定概率隨機選取動作a,或選取使深度Q網絡模型最優(yōu)的動作a,執(zhí)行一次超賣比預測;通過獎勵函數(shù)對所選取的動作a進行評估,得到獎勵r并進入下一狀態(tài)s′;將輸入狀態(tài)s、動作a、獎勵r、下一狀態(tài)s′組成四元組并作為訓練樣本放入緩存中;當達到預設的訓練間隔時,從緩存中采樣e個訓練樣本并輸入深度Q網絡模型中進行訓練,更新深度Q網絡模型的參數(shù);當深度Q網絡模型經過E輪訓練后,將完成參數(shù)更新的深度Q網絡模型應用于確定超賣策略。
聲明:
“基于深度強化學習的容器云集群資源利用優(yōu)化方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)