本發(fā)明公開了一種基于進(jìn)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的電壓調(diào)節(jié)方法及系統(tǒng),屬于人工智能與控制系統(tǒng)交叉技術(shù)領(lǐng)域,包括:獲取實(shí)時(shí)檢測到的環(huán)境狀態(tài),將其輸入已訓(xùn)練的策略網(wǎng)絡(luò),得到電壓調(diào)節(jié)策略;根據(jù)電壓調(diào)節(jié)策略調(diào)動(dòng)調(diào)壓資源完成電壓調(diào)節(jié);所述策略網(wǎng)絡(luò)通過以下方法訓(xùn)練:對策略網(wǎng)絡(luò)進(jìn)行多階段遞進(jìn)式多節(jié)點(diǎn)深度強(qiáng)化學(xué)習(xí)的訓(xùn)練,每階段訓(xùn)練中應(yīng)用進(jìn)化學(xué)習(xí),通過已訓(xùn)練的策略網(wǎng)絡(luò)之間的交叉使已訓(xùn)練的策略網(wǎng)絡(luò)數(shù)量翻倍,在進(jìn)行交叉操作的下一個(gè)階段中對已訓(xùn)練的策略網(wǎng)絡(luò)進(jìn)行變異操作,直至已訓(xùn)練的策略網(wǎng)絡(luò)數(shù)量達(dá)到預(yù)設(shè)目標(biāo);每個(gè)節(jié)點(diǎn)對應(yīng)一個(gè)策略網(wǎng)絡(luò);適用于多節(jié)點(diǎn)的配電網(wǎng)協(xié)同電壓調(diào)節(jié),促進(jìn)網(wǎng)絡(luò)訓(xùn)練過程的多樣性,具有強(qiáng)大的可拓展性。
聲明:
“基于進(jìn)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的電壓調(diào)節(jié)方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)