本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的智慧家庭能量管理方法及系統(tǒng),方法的設(shè)計(jì)步驟如下:將在無建筑熱動(dòng)力學(xué)模型和維持室內(nèi)溫度在舒適范圍的情況下最小化智慧家庭能量成本這一能量管理問題建模為馬爾可夫決策過程并設(shè)計(jì)相應(yīng)的環(huán)境狀態(tài)、行為、獎(jiǎng)勵(lì)函數(shù);利用深度確定性策略梯度算法訓(xùn)練出不同環(huán)境狀態(tài)下能量存儲(chǔ)系統(tǒng)或/和可控負(fù)載的最優(yōu)行為,進(jìn)而最大化獎(jiǎng)勵(lì)函數(shù);將訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)參數(shù)定期拷貝至智慧家庭能量管理系統(tǒng)本地的深度神經(jīng)網(wǎng)絡(luò),用于實(shí)際性能測試。本發(fā)明提出的方法無需知曉任何不確定性系統(tǒng)參數(shù)的先驗(yàn)信息和建筑熱動(dòng)力學(xué)模型,且采用本地測試與云端訓(xùn)練相結(jié)合的在線學(xué)習(xí)模式來應(yīng)對(duì)環(huán)境變化可能帶來的性能降級(jí)問題。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的智慧家庭能量管理方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)