本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的異常天氣場(chǎng)景風(fēng)電預(yù)測(cè)方法,所述風(fēng)電預(yù)測(cè)方法基于強(qiáng)化學(xué)習(xí)系統(tǒng),所述強(qiáng)化學(xué)習(xí)系統(tǒng)包括數(shù)據(jù)集、策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò);所述強(qiáng)化學(xué)習(xí)系統(tǒng)還包括根據(jù)異常天氣中歷史時(shí)段風(fēng)電功率變化對(duì)所述策略網(wǎng)絡(luò)、價(jià)值網(wǎng)絡(luò)更新預(yù)測(cè)未來(lái)時(shí)段風(fēng)電狀況的環(huán)境互換模塊,其中:所述環(huán)境互換模塊通過(guò)如下步驟完成對(duì)策略網(wǎng)絡(luò)、價(jià)值網(wǎng)絡(luò)更新:S101、初始化價(jià)值網(wǎng)絡(luò)與策略網(wǎng)絡(luò);S102、根據(jù)歷史階段風(fēng)電功率對(duì)數(shù)據(jù)集訓(xùn)練獲得環(huán)境獎(jiǎng)賞值;S103、根據(jù)歷史階段風(fēng)電功率對(duì)數(shù)據(jù)集訓(xùn)練獲得預(yù)測(cè)價(jià)值;S104、根據(jù)環(huán)境獎(jiǎng)賞值、預(yù)測(cè)價(jià)值對(duì)價(jià)值網(wǎng)絡(luò)更新;S105、根據(jù)環(huán)境獎(jiǎng)賞值、預(yù)測(cè)價(jià)值對(duì)策略網(wǎng)絡(luò)更新;本發(fā)明可以應(yīng)對(duì)不同環(huán)境的策略處理異常環(huán)境下的風(fēng)電預(yù)測(cè)問(wèn)題。
聲明:
“基于強(qiáng)化學(xué)習(xí)的異常天氣場(chǎng)景風(fēng)電預(yù)測(cè)方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)