本發(fā)明公開了一種基于神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的混合能量管理方法,屬于自動(dòng)化技術(shù)領(lǐng)域。本發(fā)明采用模糊控制器的輸出作為神經(jīng)網(wǎng)絡(luò)初始的離線數(shù)據(jù)集來進(jìn)行訓(xùn)練,應(yīng)用學(xué)習(xí)得到的神經(jīng)網(wǎng)絡(luò)產(chǎn)生新的數(shù)據(jù)加入至原有的數(shù)據(jù)集中,并反復(fù)更迭這兩個(gè)過程。針對每個(gè)時(shí)刻的狀態(tài),采用訓(xùn)練之后的神經(jīng)網(wǎng)絡(luò)來預(yù)測當(dāng)前狀態(tài)在采取相應(yīng)動(dòng)作之后轉(zhuǎn)移到的下一狀態(tài),根據(jù)累計(jì)獎(jiǎng)勵(lì)最大化的原則選擇一定長度的最優(yōu)動(dòng)作序列,選取動(dòng)作序列的第一個(gè)動(dòng)作作為當(dāng)前狀態(tài)的最優(yōu)控制動(dòng)作。利用該方法可有效減少能量的浪費(fèi)并且通過超級電容輔助
鋰電池供電,減少了鋰電池的使用,達(dá)到了延長鋰電池壽命的目標(biāo)。
聲明:
“基于神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的混合能量管理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)