本發(fā)明公開了一種基于物理信息和深度強化學習的電力系統(tǒng)自動化操作方法及裝置。該方法設定強化學習訓練需要的神經(jīng)網(wǎng)絡結(jié)構(gòu)、參數(shù)、狀態(tài)空間、可選擇的動作空間,構(gòu)建一個深度Q學習智能體,通過最小化線路故障的頻率和嚴重程度來預測自動行動。然后,直接應用電力系統(tǒng)物理信息作為訓練已知限定,減少訓練數(shù)據(jù),加快訓練時間。其次,設計用于優(yōu)化的獎勵函數(shù),訓練選擇不同的動作以達到最大的獎勵,尋找最優(yōu)的自動化操作。本發(fā)明結(jié)合物理信息特征,基于DQN算法對電力系統(tǒng)各輸電線路和變電站拓撲進行了優(yōu)化控制,兼顧了經(jīng)濟性和有效性。本發(fā)明能在較少數(shù)據(jù)的情況下,實時地進行電力系統(tǒng)穩(wěn)定控制。
聲明:
“基于物理信息和深度強化學習的電力系統(tǒng)自動化操作方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)