本發(fā)明涉及一種基于強化學習的自適應新能源超短期功率預測方法及裝置,所述方法包括獲取用于構(gòu)建自適應智能體的環(huán)境變量、動作空間及獎勵函數(shù);其中,環(huán)境變量為反映環(huán)境特點的環(huán)境變量指標,動作空間為智能體決策采取的動作函數(shù)集合,獎勵函數(shù)為智能體在動作執(zhí)行后,環(huán)境變量相應變化的評價結(jié)果;根據(jù)所述環(huán)境變量、和獎勵函數(shù)構(gòu)建自適應智能體;對環(huán)境變量進行處理,利用處理后的環(huán)境變量對自適應智能體進行訓練,得到自適應預測智能體。本發(fā)明將根據(jù)環(huán)境變量自適應選取與外部環(huán)境最契合的單一類預測方法預測結(jié)果,從而最大限度提升預測結(jié)果準確率。本申請?zhí)峁┑姆椒▽嵤┝鞒毯唵危哂休^強的應用前景。
聲明:
“基于強化學習的自適應新能源超短期功率預測方法及裝置” 該技術專利(論文)所有權(quán)利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)