本發(fā)明公開(kāi)了一種基于相似上下文和強(qiáng)化學(xué)習(xí)的中文詞向量生成方法,解決了現(xiàn)有的中文詞向量生成方法都是考慮基于目標(biāo)詞的相鄰上下文和目標(biāo)詞的關(guān)系來(lái)進(jìn)行預(yù)測(cè)的,沒(méi)有考慮到在中文中有些單詞雖然相鄰,但是語(yǔ)義不相關(guān)的情況,且詞向量的表示質(zhì)量不高問(wèn)題。本發(fā)明方法包括:選取語(yǔ)料庫(kù),進(jìn)行語(yǔ)料庫(kù)預(yù)處理,從而構(gòu)建中文語(yǔ)料庫(kù);對(duì)中文目標(biāo)詞進(jìn)行相似上下文發(fā)現(xiàn),獲得與中文目標(biāo)詞的語(yǔ)義相關(guān)的相似上下文;構(gòu)建中文詞向量強(qiáng)化學(xué)習(xí)框架,并進(jìn)行強(qiáng)化學(xué)習(xí),得到中文目標(biāo)詞的詞向量表示。本發(fā)明能夠解決中文相鄰詞不相關(guān)的問(wèn)題,生成高質(zhì)量的中文詞向量。
聲明:
“基于相似上下文和強(qiáng)化學(xué)習(xí)的中文詞向量生成方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)