本發(fā)明公布了一種并行優(yōu)化的強化學習自適應PID控制方法,其特征在于包括以下步驟:步驟S1:運用matlab軟件,通過零階保持器法將傳遞函數(shù)離散化,初始化控制器參數(shù)和M個控制線程進行并行學習;步驟S2:定義輸入信號傳遞給S1中的傳遞函數(shù),計算輸出值,將輸入與輸出信號的差值作為控制算法的輸入向量;步驟S3:將輸入向量傳遞給改進的自適應PID控制器進行訓練,迭代N次后得到訓練好的模型;步驟S4:使用訓練好的模型進行控制測試,記錄輸入、輸出信號,PID參數(shù)的變化值;步驟S5:可視化測試數(shù)據(jù),控制效果對比。該發(fā)明較好地解決了以往自適應PID存在的問題,利用A3C學習的多線程并行學習的特性,提高了算法的穩(wěn)定性和學習效率。
聲明:
“并行優(yōu)化的強化學習自適應PID控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)