本發(fā)明涉及計算機技術領域,特別涉及一種基于深度強化學習的數據中心資源離線調度方法。深度強化學習可以為資源調度管理的人為啟發(fā)式方法提供一個可行的替代方案。通過不斷學習,深度強化學習方法可以針對特定工作負載(例如周期性負載或隨機負載)進行優(yōu)化,并在各種條件下保持高質量優(yōu)化調度結果。把最小化平均作業(yè)slowdown(系統(tǒng)減緩時間)作為優(yōu)化目標,通過計算離線調度中每一次調度的獎勵值,引導深度網絡向著目標優(yōu)化,最終向著最優(yōu)目標訓練。結果顯示,在本發(fā)明的大量實施例測試中,使用深度強化學習的離線調度方法的slowndown遠低于SJF(最短作業(yè)優(yōu)先算法)等傳統(tǒng)的優(yōu)化作業(yè)調度方法,體現出深度強化學習方法在這一領域的優(yōu)勢。
聲明:
“基于深度強化學習的數據中心資源離線調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)