本公開提供了一種基于深度強化學習的空調風量控制方法、裝置以及存儲介質,其中的方法包括:建立狀態(tài)預測模型,使用狀態(tài)預測模型獲得外界預測狀態(tài);根據(jù)外界預測狀態(tài)生成訓練樣本,基于訓練樣本對長期回報值預測網(wǎng)絡模型進行訓練,用于對長期回報值預測網(wǎng)絡模型的參數(shù)θ進行調整;通過長期回報值預測網(wǎng)絡模型并基于當前狀態(tài)預測下一時刻的空調執(zhí)行行動,用以對于空調風量進行控制;本公開的方法、裝置以及存儲介質,能夠對卷煙企業(yè)空調進行自動控制,實現(xiàn)損失最小化,可以提高空調溫濕度預測的準確率和空調開關切換的穩(wěn)定性,能夠實現(xiàn)節(jié)能降耗,能夠減少企業(yè)的成本并提高產(chǎn)品質量。
聲明:
“基于深度強化學習的空調風量控制方法、裝置以及介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)