本說明書實施例提供一種通過強化學習模型對業(yè)務模型進行壓縮的方法和裝置。方法包括,首先獲取通過神經(jīng)網(wǎng)絡實現(xiàn)的業(yè)務模型,其包含N個網(wǎng)絡層。依次將各個網(wǎng)絡層作為當前層進行剪枝操作,該操作包括,基于當前層的層特征確定環(huán)境狀態(tài),將環(huán)境狀態(tài)輸入強化學習模型,得到針對當前層的剪枝決策,據(jù)此進行剪枝;并在樣本隊列中添加當前層的剪枝記錄,該記錄包括環(huán)境狀態(tài)和剪枝決策。然后,將驗證數(shù)據(jù)集輸入N個網(wǎng)絡層均進行剪枝后的壓縮模型,得到性能評估結果。根據(jù)該性能評估結果確定獎勵分數(shù),將獎勵分數(shù)分別添加到N條剪枝記錄中,形成N條訓練樣本。然后,根據(jù)樣本隊列中的訓練樣本,更新強化學習模型。
聲明:
“通過強化學習模型對業(yè)務預測模型進行壓縮的方法和裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)