本發(fā)明公開了一種基于用戶側(cè)需求反應(yīng)的增強學(xué)習(xí)的電網(wǎng)服務(wù)價值制定方法,涉及一種定價方法。目前,電網(wǎng)服務(wù)價值制定的系統(tǒng)成本高。本發(fā)明包括步驟:在初始時刻觀測當(dāng)前時刻狀態(tài),通過∈?貪婪策略選擇相應(yīng)的行為,對初始電價進行調(diào)整;將得到的行為反饋給電網(wǎng)售電市場環(huán)境,根據(jù)環(huán)境信息生成當(dāng)前時刻狀態(tài);根據(jù)目標(biāo)函數(shù)計算當(dāng)前時間的損失函數(shù)U(t),并根據(jù)損失函數(shù)U(t)更新V值表;利用更新后的V值表,采用∈?貪婪策略選取新的行為,并調(diào)整電價;直到V值表收斂到一定程度,獲取當(dāng)前狀態(tài)下的最優(yōu)價格。本技術(shù)方案利用強化學(xué)習(xí)來學(xué)習(xí)用戶的反饋函數(shù),使用學(xué)習(xí)到的反饋函數(shù),LSE可以找到更好的價格,以最大限度地降低系統(tǒng)成本。
聲明:
“基于用戶側(cè)需求反應(yīng)的增強學(xué)習(xí)的電網(wǎng)服務(wù)價值制定方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)