本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的深度學(xué)習(xí)模型安全性保障壓縮方法與裝置,包括:(1)使用圖網(wǎng)絡(luò)的方式將深度學(xué)習(xí)模型建模成圖網(wǎng)絡(luò);(2)采用GCN提取圖網(wǎng)絡(luò)的嵌入向量;(3)將圖網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)的當(dāng)前嵌入向量作為強(qiáng)化學(xué)習(xí)的環(huán)境狀態(tài),采用強(qiáng)化學(xué)習(xí)預(yù)測(cè)基于環(huán)境狀態(tài)的動(dòng)作值,并依據(jù)動(dòng)作值實(shí)現(xiàn)每個(gè)節(jié)點(diǎn)的嵌入向量的修剪,直到所有節(jié)點(diǎn)的嵌入向量修剪完成,實(shí)現(xiàn)深度學(xué)習(xí)模型的一輪壓縮;(4)根據(jù)經(jīng)過一輪壓縮后的模型對(duì)樣本數(shù)據(jù)的預(yù)測(cè)結(jié)果計(jì)算錯(cuò)誤率和安全性;(5)根據(jù)錯(cuò)誤率和安全性計(jì)算采用強(qiáng)化學(xué)習(xí)進(jìn)行一輪深度學(xué)習(xí)模型壓縮的回報(bào)值;(6)基于回報(bào)值,重復(fù)步驟(3)~步驟(5),直到迭代終止,實(shí)現(xiàn)深度學(xué)習(xí)模型的壓縮。
聲明:
“基于強(qiáng)化學(xué)習(xí)的深度學(xué)習(xí)模型安全性保障壓縮方法與裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)