本發(fā)明公開了一種基于語言模型和強化學(xué)習(xí)的關(guān)鍵詞問答方法,包括以下步驟:(1)用關(guān)鍵詞問題句和自然語言問題句的混合數(shù)據(jù)集來訓(xùn)練一個關(guān)鍵詞問題分類器;(2)在自然語言問題句的數(shù)據(jù)集上預(yù)訓(xùn)練一個語言模型;(3)將步驟(2)中的語言模型高層網(wǎng)絡(luò)提取,并用關(guān)鍵詞問題句和其對應(yīng)的自然語言問題句來訓(xùn)練一個含語言模型網(wǎng)絡(luò)的問題重構(gòu)模型來重構(gòu)由步驟(1)判斷為關(guān)鍵詞問題句的問題;(4)將重構(gòu)的問題句送入一個訓(xùn)練好的問答模型中,得到答案;(5)利用強化學(xué)習(xí),以步驟(4)中預(yù)測答案和標(biāo)準(zhǔn)答案的相似度作為獎勵函數(shù)來優(yōu)化步驟(3)中的重構(gòu)模型。利用本發(fā)明,可以大大提升了在大規(guī)模數(shù)據(jù)集上關(guān)鍵詞問答任務(wù)的準(zhǔn)確率。
聲明:
“基于語言模型和強化學(xué)習(xí)的關(guān)鍵詞問答方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)