基于深度強化學習的多園區(qū)能源調(diào)度方法,包括:S1:構(gòu)建分布式園區(qū)綜合能源系統(tǒng)模型;S2:用基于多智能體的深度強化學習算法解決綜合能源系統(tǒng)的動態(tài)調(diào)度問題,搭建分布式園區(qū)綜合能源系統(tǒng)的多智能體深度強化學習框架;S3:以實時獎勵函數(shù)代替目標函數(shù),利用各園區(qū)內(nèi)的智能體與環(huán)境互動,尋找分布式園區(qū)綜合能源系統(tǒng)最優(yōu)調(diào)度策略;S4:將測試集數(shù)據(jù)用于訓練后的智能體進行調(diào)度決策,并將其獲得的目標成本與經(jīng)由線性化處理后的綜合能源系統(tǒng)模型通過求解器獲得的目標成本進行比較,證明算法的有效性。本發(fā)明還包括基于深度強化學習的多園區(qū)能源調(diào)度系統(tǒng)。本發(fā)明在促進各園區(qū)內(nèi)的
光伏消納的同時,提高了綜合能源系統(tǒng)經(jīng)濟運行的有效性。
聲明:
“基于深度強化學習的多園區(qū)能源調(diào)度方法和系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)