本發(fā)明公開了一種基于憶阻交叉陣列的Q學習系統(tǒng),包括憶阻交叉陣列,其特征在于:所述系統(tǒng)還包括讀寫選擇開關:控制憶阻交叉陣列的讀寫操作,狀態(tài)選擇開關:狀態(tài)檢測模塊檢測當前環(huán)境狀態(tài)st,通過狀態(tài)選擇開關,選擇相應的行線;列選擇開關:當需要對Q值,也即對憶阻交叉陣列的某一個憶阻值進行更新時,列選擇開關選擇動作at所對應的列線。延遲單元:將選擇的列線的電壓延遲一個時間步長;狀態(tài)檢測模塊:檢測當前的環(huán)境狀態(tài),保存上一個環(huán)境狀態(tài),。本發(fā)明將新的電路元件—憶阻器成功應用到了強化學習中,解決了強化學習需要大量的存儲空間問題,為以后強化學習的研究提供了一種新的思路。
聲明:
“基于憶阻交叉陣列的Q學習系統(tǒng)” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)