本發(fā)明涉及一種基于圖卷積神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)的負(fù)荷轉(zhuǎn)供方法及裝置,包括:基于圖卷積神經(jīng)網(wǎng)絡(luò)和深度強(qiáng)化學(xué)習(xí)Dueling?DQN算法搭建的第一神經(jīng)網(wǎng)絡(luò)和第二神經(jīng)網(wǎng)絡(luò),基于第一神經(jīng)網(wǎng)絡(luò)、第二神經(jīng)網(wǎng)絡(luò)和經(jīng)驗(yàn)池構(gòu)建智能體模型,配電網(wǎng)發(fā)生故障,智能體模型將配電網(wǎng)實(shí)時(shí)運(yùn)行數(shù)據(jù)輸入到智能體模型,計(jì)算出動(dòng)作評(píng)價(jià)向量,基于動(dòng)作評(píng)價(jià)向量根據(jù)動(dòng)作策略選取相應(yīng)的動(dòng)作;動(dòng)作作用于環(huán)境使其狀態(tài)發(fā)生改變,同時(shí)獎(jiǎng)勵(lì)函數(shù)對(duì)該動(dòng)作進(jìn)行評(píng)價(jià),并反饋給智能體,更新智能體的參數(shù)進(jìn)行學(xué)習(xí),通過(guò)大量的訓(xùn)練后,智能體實(shí)現(xiàn)最佳目標(biāo)的負(fù)荷轉(zhuǎn)供動(dòng)作。本發(fā)明直接通過(guò)分析實(shí)時(shí)運(yùn)行大數(shù)據(jù)與網(wǎng)絡(luò)拓?fù)鋽?shù)據(jù)進(jìn)行負(fù)荷轉(zhuǎn)供決策,可以在短時(shí)間內(nèi)給出更好的負(fù)荷轉(zhuǎn)供策略。
聲明:
“基于圖卷積神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)的負(fù)荷轉(zhuǎn)供方法及裝置” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)