本發(fā)明提供了一種模型壓縮方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì),該方法包括:對(duì)待壓縮模型進(jìn)行模型訓(xùn)練,在待壓縮模型中添加正則項(xiàng)和奇異值分解,得到奇異值矩陣,根據(jù)奇異值矩陣返回執(zhí)行對(duì)待壓縮模型進(jìn)行模型訓(xùn)練的步驟及后續(xù)步驟,直至待壓縮模型滿足性能下降條件,輸出待壓縮模型;根據(jù)待壓縮模型的權(quán)重張量進(jìn)行參數(shù)聚類,得到權(quán)重參數(shù)矩陣,對(duì)權(quán)重參數(shù)矩陣進(jìn)行權(quán)值量化,得到聚類量化矩陣;根據(jù)聚類量化矩陣對(duì)待壓縮模型進(jìn)行參數(shù)設(shè)置,得到壓縮模型。本發(fā)明基于稀疏正則化、迭代剪枝和聚類量化的聯(lián)合模型壓縮方式,從全局的角度上對(duì)待壓縮模型進(jìn)行模型壓縮,在保障精度不減的前提下,實(shí)現(xiàn)了最大化的模型壓縮。
聲明:
“模型壓縮方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)