本發(fā)明公開了一種基于雙Q值網(wǎng)絡(luò)深度強化學習的微電網(wǎng)能量調(diào)度方法,將微電網(wǎng)的一天預(yù)測信息當作生成最優(yōu)控制策略的訓練集,訓練一個獨立于微電網(wǎng)環(huán)境、以
儲能系統(tǒng)作為控制對象的智能體,通過對儲能系統(tǒng)的充放電動作進行控制來實現(xiàn)微電網(wǎng)的運行花費最小和對公共電網(wǎng)功率波動最小的雙重優(yōu)化目標。該方法因其不依賴于具體微電網(wǎng)模型的構(gòu)建,并且由獎勵函數(shù)的設(shè)計來引導策略實現(xiàn)微電網(wǎng)運行的目標,可以獲得全局時間的最優(yōu)策略,能夠有效解決新能源發(fā)電和用戶負荷分布的不確定性導致的功率不平衡。
聲明:
“基于雙Q值網(wǎng)絡(luò)深度強化學習的微電網(wǎng)能量調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)