本發(fā)明提出一種基于強(qiáng)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)逆控制器進(jìn)行控制的方法,神經(jīng)網(wǎng)絡(luò)控制包含神經(jīng)網(wǎng)絡(luò)逆控制器和神經(jīng)網(wǎng)絡(luò)模型兩部分,神經(jīng)網(wǎng)絡(luò)模型主要用于對(duì)被控制對(duì)象進(jìn)行辨識(shí),并向神經(jīng)網(wǎng)絡(luò)逆控制器提供被控制對(duì)象信息。神經(jīng)網(wǎng)絡(luò)逆控制器采用強(qiáng)化學(xué)習(xí)中的行動(dòng)者?評(píng)論家結(jié)構(gòu),行動(dòng)者采用神經(jīng)網(wǎng)絡(luò)根據(jù)評(píng)論家提供的值函數(shù)學(xué)習(xí)控制策略,依據(jù)策略函數(shù)給出下一步控制增量,評(píng)論家采用神經(jīng)網(wǎng)絡(luò)建立狀態(tài)、行動(dòng)與值函數(shù)的擬合關(guān)系,值函數(shù)根據(jù)預(yù)測(cè)控制中的性能評(píng)價(jià)函數(shù)設(shè)置,能有效解決控制系統(tǒng)的遲延問(wèn)題。本發(fā)明的方法能夠適應(yīng)時(shí)滯系統(tǒng)的控制要求,能根據(jù)被控參數(shù)未來(lái)的趨勢(shì)使執(zhí)行機(jī)構(gòu)提早動(dòng)作,抑制被控量的波動(dòng),同時(shí)能適應(yīng)被控對(duì)象時(shí)變和非線性的特性,提高控制品質(zhì)和穩(wěn)定性。
聲明:
“基于強(qiáng)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)逆控制器進(jìn)行控制的方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)