本申請涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,尤其涉及一種基于強(qiáng)化學(xué)習(xí)的信息處理的方法、裝置、設(shè)備和存儲介質(zhì),包括:獲取原始數(shù)據(jù)并對原始數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本數(shù)據(jù);獲取目標(biāo)值,提取樣本數(shù)據(jù)中的實(shí)際值,將目標(biāo)值與實(shí)際值入?yún)⒌筋A(yù)設(shè)的獎懲函數(shù)中進(jìn)行計算,得到實(shí)際值的評分權(quán)重;獲取樣本數(shù)據(jù)對應(yīng)的多個備選方案數(shù)據(jù),將各備選方案數(shù)據(jù)和實(shí)際值的評分權(quán)重導(dǎo)入到用于強(qiáng)化學(xué)習(xí)模型中進(jìn)行評分后,得到各備選方案數(shù)據(jù)的初始評分;根據(jù)預(yù)設(shè)的加分策略對初始評分進(jìn)行處理后得到備選方案數(shù)據(jù)的最終評分;根據(jù)預(yù)設(shè)的業(yè)務(wù)邏輯對各備選方案數(shù)據(jù)進(jìn)行過濾,以過濾后的備選方案數(shù)據(jù)中最終評分最高項作為原始數(shù)據(jù)的目標(biāo)方案數(shù)據(jù)。提升了信息處理的速度和準(zhǔn)確性。
聲明:
“基于強(qiáng)化學(xué)習(xí)的信息處理方法、裝置、設(shè)備和存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)