本發(fā)明公開(kāi)了一種工業(yè)過(guò)程的優(yōu)化學(xué)習(xí)控制性能提升方法。本發(fā)明在傳統(tǒng)狀態(tài)空間模型的基礎(chǔ)上,通過(guò)構(gòu)建包含跟蹤誤差和狀態(tài)增量的新型狀態(tài)空間模型,在執(zhí)行器新模型的基礎(chǔ)上提出性能指標(biāo)并構(gòu)建值函數(shù)與Q函數(shù),最后通過(guò)設(shè)計(jì)非策略Q?學(xué)習(xí)算法進(jìn)行最優(yōu)控制律學(xué)習(xí)及性能指標(biāo)的優(yōu)化,得到最優(yōu)的控制器增益,進(jìn)而提升控制性能。本發(fā)明不依賴于系統(tǒng)的數(shù)學(xué)模型而是對(duì)大量在線數(shù)據(jù)的強(qiáng)化學(xué)習(xí),這在實(shí)際系統(tǒng)狀態(tài)很難直接測(cè)量或者只能測(cè)量部分狀態(tài)信息的環(huán)境下有著突出優(yōu)勢(shì),可以有效地改善實(shí)際過(guò)程生產(chǎn)的控制性能,使得控制效果與控制精度得到提升。
聲明:
“工業(yè)過(guò)程的優(yōu)化學(xué)習(xí)控制性能提升方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)