本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的智能控制方法及系統(tǒng),該方法包括:構(gòu)建經(jīng)驗(yàn)池和網(wǎng)絡(luò)并進(jìn)行參數(shù)初始化;構(gòu)建訓(xùn)練樣本并對(duì)前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;基于訓(xùn)練完成網(wǎng)絡(luò)輸出控制量并對(duì)系統(tǒng)進(jìn)行控制;采集系統(tǒng)運(yùn)行過程的過程變量并存儲(chǔ)到經(jīng)驗(yàn)池;檢測(cè)經(jīng)驗(yàn)池?cái)?shù)據(jù)是否存滿;判斷到滿足迭代條件,系統(tǒng)結(jié)束運(yùn)行,保存網(wǎng)絡(luò)參數(shù)并停止控制量輸出。該系統(tǒng)包括:參數(shù)初始化模塊、預(yù)訓(xùn)練模塊、控制模塊、采集模塊、判斷模塊和迭代模塊。通過使用本發(fā)明,能夠克服PID控制器在非線性復(fù)雜系統(tǒng)上的不足。本發(fā)明作為一種基于深度強(qiáng)化學(xué)習(xí)的智能控制方法及系統(tǒng),可廣泛應(yīng)用于電機(jī)運(yùn)動(dòng)控制領(lǐng)域。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的智能控制方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)