本發(fā)明公開(kāi)了一種基于神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的混合能量管理方法,屬于自動(dòng)化技術(shù)領(lǐng)域。本發(fā)明采用模糊控制器的輸出作為神經(jīng)網(wǎng)絡(luò)初始的離線數(shù)據(jù)集來(lái)進(jìn)行訓(xùn)練,應(yīng)用學(xué)習(xí)得到的神經(jīng)網(wǎng)絡(luò)產(chǎn)生新的數(shù)據(jù)加入至原有的數(shù)據(jù)集中,并反復(fù)更迭這兩個(gè)過(guò)程。針對(duì)每個(gè)時(shí)刻的狀態(tài),采用訓(xùn)練之后的神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)當(dāng)前狀態(tài)在采取相應(yīng)動(dòng)作之后轉(zhuǎn)移到的下一狀態(tài),根據(jù)累計(jì)獎(jiǎng)勵(lì)最大化的原則選擇一定長(zhǎng)度的最優(yōu)動(dòng)作序列,選取動(dòng)作序列的第一個(gè)動(dòng)作作為當(dāng)前狀態(tài)的最優(yōu)控制動(dòng)作。利用該方法可有效減少能量的浪費(fèi)并且通過(guò)超級(jí)電容輔助
鋰電池供電,減少了鋰電池的使用,達(dá)到了延長(zhǎng)鋰電池壽命的目標(biāo)。
聲明:
“基于神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的混合能量管理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)