本發(fā)明公開了基于深度強(qiáng)化學(xué)習(xí)的場(chǎng)景文本檢測(cè)方法及系統(tǒng),所述方法包括:訓(xùn)練一個(gè)特征提取網(wǎng)絡(luò);訓(xùn)練一個(gè)決策網(wǎng)絡(luò);通過特征提取網(wǎng)絡(luò)和決策網(wǎng)絡(luò)定位待檢測(cè)圖像上場(chǎng)景文本的位置;其中,所述特征提取網(wǎng)絡(luò)為場(chǎng)景文本圖像特征提取的深度卷積神經(jīng)網(wǎng)絡(luò);所述決策網(wǎng)絡(luò)為擬合強(qiáng)化學(xué)習(xí)Q值函數(shù)的神經(jīng)網(wǎng)絡(luò)。本發(fā)明將場(chǎng)景文本檢測(cè)解析為基于視覺的連續(xù)性決策問題,結(jié)合強(qiáng)化學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò),模擬日常生活中人眼從整圖開始逐漸聚焦到目標(biāo)物體的過程;在訓(xùn)練過程中,利用深度神經(jīng)網(wǎng)絡(luò),很好地提取出當(dāng)前定位框圖像信息,以強(qiáng)化學(xué)習(xí)方法訓(xùn)練出能進(jìn)行目標(biāo)文本定位的模型。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的場(chǎng)景文本檢測(cè)方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)