本發(fā)明提出一種基于強化學(xué)習(xí)的配電網(wǎng)多時間尺度無功電壓控制方法,屬于電力系統(tǒng)運行和控制技術(shù)領(lǐng)域。該方法根據(jù)配電網(wǎng)慢速離散設(shè)備與快速連續(xù)設(shè)備的無功電壓控制目標(biāo),構(gòu)建配電網(wǎng)多時間尺度無功電壓控制優(yōu)化模型;基于該模型,構(gòu)建基于雙層馬爾科夫決策過程的分層交互訓(xùn)練框架,為慢速離散設(shè)備和快速連續(xù)設(shè)備分別設(shè)置對應(yīng)智能體;各智能體根據(jù)輸入的量測信息決策所控對應(yīng)設(shè)備的動作值,實現(xiàn)多時間尺度的無功電壓控制,同時兩智能體進行持續(xù)在線學(xué)習(xí)。本發(fā)明特別適合模型不完備問題嚴重的配電網(wǎng)使用,既節(jié)省重復(fù)維護精確模型的高昂成本,又充分挖掘多時間尺度可控資源的控制能力,最大程度上障配電網(wǎng)的電壓安全和經(jīng)濟運行。
聲明:
“基于強化學(xué)習(xí)的配電網(wǎng)多時間尺度無功電壓控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)