本發(fā)明提供了一種基于連詞標(biāo)記和強(qiáng)化學(xué)習(xí)的自然語言推理方法,包括以下步驟:(1)在連詞預(yù)測任務(wù)上訓(xùn)練一個連詞預(yù)測模型;(2)在自然語言推理模型中,輸入前提和猜想文本并使用編碼器對其編碼,得到表達(dá)矩陣;(3)將連詞預(yù)測模型的編碼器嵌入到自然語言推理模型中,將步驟(2)編碼過程中得到的前提和猜想的詞向量送入預(yù)訓(xùn)練好的編碼器并輸出表達(dá)向量;(4)將自然語言推理模型的編碼器和嵌入的連詞預(yù)測模型中的編碼器在注意力機(jī)制中交互,得到一個注意力向量;(5)將注意力向量轉(zhuǎn)化為概率分布并輸出結(jié)果。利用本發(fā)明,通過遷移其他監(jiān)督學(xué)習(xí)任務(wù)所學(xué)到的知識,大大提升了在大規(guī)模數(shù)據(jù)集上進(jìn)行自然語言推理任務(wù)的準(zhǔn)確率。
聲明:
“基于連詞標(biāo)記和強(qiáng)化學(xué)習(xí)的自然語言推理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)