本發(fā)明實(shí)施例提供一種語(yǔ)言模型建立方法及裝置。所述方法包括獲取語(yǔ)料庫(kù),語(yǔ)料庫(kù)包括至少一個(gè)經(jīng)過(guò)分詞處理的句子;根據(jù)策略函數(shù)對(duì)所述語(yǔ)料庫(kù)中的每個(gè)句子進(jìn)行篩選,將滿足預(yù)設(shè)篩選條件的句子組成分詞詞典;通過(guò)對(duì)分詞詞典中每個(gè)句子的分析得到語(yǔ)言模型;用語(yǔ)言模型對(duì)預(yù)先獲取的聲學(xué)模型進(jìn)行解碼以計(jì)算損失函數(shù);若根據(jù)損失函數(shù)和預(yù)設(shè)的獎(jiǎng)勵(lì)函數(shù)得到的獎(jiǎng)勵(lì)值滿足預(yù)設(shè)的優(yōu)化條件,則判斷所述語(yǔ)言模型建立完成,本發(fā)明實(shí)施例通過(guò)策略函數(shù)對(duì)獲取的語(yǔ)料庫(kù)進(jìn)行篩選,然后將得到語(yǔ)言模型對(duì)聲學(xué)模型進(jìn)行解碼得到CTC函數(shù),再通過(guò)得到的獎(jiǎng)勵(lì)函數(shù)對(duì)策略函數(shù)進(jìn)行優(yōu)化改進(jìn),從而通過(guò)強(qiáng)化學(xué)習(xí)的方法快速得到需要的語(yǔ)言模型,且能夠提高語(yǔ)音識(shí)別的準(zhǔn)確率。
聲明:
“語(yǔ)言模型建立方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)