本發(fā)明涉及一種強化學習單元匹配循環(huán)神經(jīng)網(wǎng)絡系統(tǒng)及其訓練和預測方法,包括循環(huán)神經(jīng)網(wǎng)絡、強化學習單元和單調趨勢識別器,循環(huán)神經(jīng)網(wǎng)絡包括輸入、輸出和多個隱層,隱層包括多個隱層節(jié)點,單調趨勢識別器判斷由輸入構建的時間序列的趨勢狀態(tài),強化學習單元為根據(jù)輸入時間序列的趨勢狀態(tài),選擇一個隱層層數(shù)和隱層節(jié)點數(shù)與其變化規(guī)律相適應的循環(huán)神經(jīng)網(wǎng)絡。本發(fā)明通過判斷輸入時間序列的趨勢狀態(tài),用趨勢狀態(tài)和不同隱層層數(shù)及隱層節(jié)點數(shù)分別表示Q值集的狀態(tài)與動作,根據(jù)更新后的Q值集來選擇執(zhí)行最優(yōu)的動作,增強了RLUMRNN的泛化能力和收斂速度,本發(fā)明應用于旋轉機械的剩余壽命預測的精度高。
聲明:
“強化學習單元匹配循環(huán)神經(jīng)網(wǎng)絡系統(tǒng)及其訓練和預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)