本申請公開了一種知識抽取方法、裝置、設(shè)備和介質(zhì),涉及自然語言處理技術(shù)。具體實現(xiàn)方案為:獲取輸入文本、預(yù)先訓(xùn)練的預(yù)測器和獎勵擬合器;依據(jù)強化學(xué)習(xí)的方法,對輸入文本的輸出文本序列的狀態(tài)空間進行搜索,并在搜索過程中,根據(jù)預(yù)測器輸出的預(yù)測序列中與各時間步下每個狀態(tài)對應(yīng)的下一個位置上所有單詞的概率,和獎勵擬合器對應(yīng)擬合得到的獎勵,確定各時間步下每個狀態(tài)選擇的動作;根據(jù)對狀態(tài)空間的搜索結(jié)果,確定各時間步下的目標(biāo)動作,并根據(jù)各時間步下的目標(biāo)動作確定目標(biāo)輸出文本序列。本申請實施例通過在強化學(xué)習(xí)中增加對狀態(tài)空間的探索,避免了預(yù)測階段模型被困在局部最小值,并能細化到字詞級別的評價,從而提高了模型的準(zhǔn)確率和召回率。
聲明:
“知識抽取方法、裝置、設(shè)備和介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)