本發(fā)明涉及圖像識別領(lǐng)域,特別涉及一種基于深度學(xué)習(xí)的復(fù)雜文字識別方法。通過分析文字復(fù)雜性的原因,使用隨機(jī)樣本生成器產(chǎn)生的包含待識別圖片噪聲模型和扭曲特征模型的訓(xùn)練樣本來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò);這樣的訓(xùn)練樣本中包含復(fù)雜的噪聲和扭曲變形,可以滿足各種復(fù)雜文字識別的需要;將少量人工標(biāo)注的第一訓(xùn)練樣本集和隨機(jī)生成的大量第二訓(xùn)練樣本集混合后輸入所述深度神經(jīng)網(wǎng)絡(luò)中,解決了通過深度神經(jīng)網(wǎng)絡(luò)來識別文字時(shí)需要大量人工標(biāo)注訓(xùn)練樣本的問題;并且在保留了待識別圖片的噪聲、扭曲等復(fù)雜性的前提下,使用最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行自動化學(xué)習(xí),避免了現(xiàn)有OCR方法中需要去噪而導(dǎo)致的信息丟失的問題,提高了識別的準(zhǔn)確率。
聲明:
“基于深度學(xué)習(xí)的復(fù)雜文字識別方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)