本發(fā)明涉及一種強化學習三態(tài)組合長短時記憶神經(jīng)網(wǎng)絡(luò)系統(tǒng),包括長短時記憶神經(jīng)網(wǎng)絡(luò)、強化學習單元和單調(diào)趨勢識別器,單調(diào)趨勢識別器判斷由輸入時間序列的趨勢狀態(tài),強化學習單元為根據(jù)輸入時間序列的趨勢狀態(tài),選擇一個隱層層數(shù)和隱層節(jié)點數(shù)與其變化規(guī)律相適應(yīng)的長短時記憶神經(jīng)網(wǎng)絡(luò),其中,輸入時間序列的趨勢狀態(tài)包括三種狀態(tài),每個趨勢狀態(tài)對應(yīng)一個隱層層數(shù)和隱層節(jié)點數(shù)與其變化規(guī)律相適應(yīng)的長短時記憶神經(jīng)網(wǎng)絡(luò)。本發(fā)明判斷輸入時間序列的趨勢,根據(jù)更新后的Q值集來選擇執(zhí)行最優(yōu)的動作,增強了網(wǎng)絡(luò)泛化能力,對于旋轉(zhuǎn)機械的退化趨勢具有較高的預(yù)測精度;通過輸出誤差計算獎勵,提高了網(wǎng)絡(luò)的收斂速度,提高了系統(tǒng)的計算效率。
聲明:
“強化學習三態(tài)組合長短時記憶神經(jīng)網(wǎng)絡(luò)系統(tǒng)及訓練和預(yù)測方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)