本發(fā)明提供一種用于航空領(lǐng)域的知識元抽取方法,具體實(shí)施步驟包括:將航空領(lǐng)域的結(jié)構(gòu)化標(biāo)注數(shù)據(jù)輸入到Bert模型,輸出結(jié)構(gòu)化標(biāo)注數(shù)據(jù)的特征向量;將輸出的特征向量和Word2Vec模型學(xué)習(xí)到的特征向量進(jìn)行融合,并做Concat疊加步驟;將得到的字向量輸入到層次歸一化層,得到標(biāo)準(zhǔn)化的字向量;利用高層強(qiáng)化學(xué)習(xí)過程對得到的每個字向量進(jìn)行解碼,按句識別字向量中的關(guān)系觸發(fā)詞;建立面向航空領(lǐng)域長實(shí)體的頭尾指針模型,得到預(yù)測出的關(guān)系和尾實(shí)體起止位置序列;將預(yù)測出的實(shí)體輸出后,根據(jù)實(shí)體的標(biāo)簽信息進(jìn)行就近原則以及匹配方式進(jìn)行匹配。本發(fā)明面向航空領(lǐng)域,基于鄭碼、五筆、拼音和筆畫等特征融入的方式,與Bert輸出的向量相結(jié)合,提升了準(zhǔn)確率與召回率。
聲明:
“用于航空領(lǐng)域的知識元抽取方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)