本發(fā)明提供一種基于離線強化學(xué)習(xí)的供熱控制方法及系統(tǒng),所述方法包括以下步驟:采集供熱數(shù)據(jù),將供熱數(shù)據(jù)集輸入供熱模型;從供熱數(shù)據(jù)集中采樣條交互數(shù)據(jù)獲得四元組(s,a,r,s′),以時間步長從t=1到T步進行循環(huán),訓(xùn)練Gω模型;將訓(xùn)練后的Gω模型部署至服務(wù)器,并通過定時任務(wù),實施對一網(wǎng)和二網(wǎng)供水溫度進行預(yù)測,將預(yù)測結(jié)果下發(fā)至換熱站;并對Gω模型的效果進行監(jiān)控。本發(fā)明將先進的離線強化學(xué)習(xí)算法應(yīng)用于集中供熱控制系統(tǒng),在無需與真實環(huán)境交互的情況下充分發(fā)揮了強化學(xué)習(xí)算法的優(yōu)勢,避免了與環(huán)境交互時的低效采樣和昂貴成本;充分利用了歷史交互數(shù)據(jù),相較于現(xiàn)有技術(shù)在理論和實際上都大大提高了控制算法的性能。
聲明:
“基于離線強化學(xué)習(xí)的供熱控制方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)