本發(fā)明涉及一種基于多模態(tài)強化學習的電網(wǎng)調(diào)控方法,包括以下步驟:步驟1、輸入電網(wǎng)的數(shù)據(jù)集;步驟2、構(gòu)建出包含數(shù)據(jù)集中電網(wǎng)設備節(jié)點狀態(tài)和故障處置的知識圖譜;步驟3、獲得能對當前設備節(jié)點多模態(tài)狀態(tài)和故障處置動作進行的Embedding的多模態(tài)信息融合模塊;步驟4、選取步驟2中構(gòu)建的知識圖譜,根據(jù)當前狀態(tài)到目標狀態(tài)的情況定義出多跳評分函數(shù),用于評估兩個狀態(tài)之間的相關(guān)性;步驟5、構(gòu)建故障處置的元路徑;步驟6、產(chǎn)生強化學習的獎勵函數(shù);步驟7、定義強化學習的馬爾可夫過程生成基于policy?based的強化學習框架;步驟8、訓練產(chǎn)生基于多模態(tài)強化學習獲得的電網(wǎng)調(diào)控策略。本發(fā)明可解釋性強且預測準確性高。
聲明:
“基于多模態(tài)強化學習的電網(wǎng)調(diào)控方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)