本發(fā)明揭示了一種基于深度強(qiáng)化學(xué)習(xí)和深度殘差收縮網(wǎng)絡(luò)的投資方法及智能體,通過構(gòu)建策略神經(jīng)網(wǎng)絡(luò),以實(shí)現(xiàn)下一個(gè)交易周期的收益率最高;用訓(xùn)練完的策略函數(shù)獲取下一個(gè)交易周期的資產(chǎn)分配權(quán)重,并調(diào)整資產(chǎn)在加密貨幣市場(chǎng)中的分配,以此實(shí)現(xiàn)最優(yōu)策略。本發(fā)明強(qiáng)化學(xué)習(xí)的策略函數(shù)在使用資產(chǎn)價(jià)格輸入神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,通過引入額外的特征,幫助策略神經(jīng)網(wǎng)絡(luò)完善了對(duì)市場(chǎng)環(huán)境的分析,并采用了深度的殘差收縮結(jié)構(gòu),極大的提高的智能體的學(xué)習(xí)能力和對(duì)于最優(yōu)投資組合策略的探索能力,并且避免了訓(xùn)練時(shí)候的梯度消失問題的出現(xiàn),使得策略網(wǎng)絡(luò)可以進(jìn)行有效的訓(xùn)練,并找出每一個(gè)狀態(tài)下的最有效動(dòng)作。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)和深度殘差收縮網(wǎng)絡(luò)的投資方法及智能體” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)