本發(fā)明涉及一種基于深度確定性策略算法的發(fā)電機組啟停配置方法及系統(tǒng),該方法將機組組合啟停分配問題構造成為強化學習序列決策問題,所述的方法包括以下步驟:1)將前一歷史時刻各機組出力值向量作為智能體觀測狀態(tài),用以作為深度策略網(wǎng)絡的輸入向量;2)針對連續(xù)時間序列機組啟停優(yōu)化問題,使用深度確定性策略梯度算法給出優(yōu)化決策序列,輸出機組在該時刻的啟停向量,實現(xiàn)對機組啟停狀態(tài)的分配。與現(xiàn)有技術相比,本發(fā)明采用深度確定性策略學習方法,直接得到不同時刻的啟停向量,能夠適應不同規(guī)模機組集群啟停表的自動分配,使得系統(tǒng)具有較好的擴展性。
聲明:
“基于深度確定性策略算法的發(fā)電機組啟停配置方法及系統(tǒng)” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)