本發(fā)明公開了一種基于自然語(yǔ)言處理的地質(zhì)表頭歸并方法及裝置,所述方法包括獲取地質(zhì)表頭文本原始數(shù)據(jù),對(duì)地質(zhì)表頭文本原始數(shù)據(jù)進(jìn)行預(yù)處理;將所述預(yù)處理過的地質(zhì)表頭文本原始數(shù)據(jù)轉(zhuǎn)化為包括詞編號(hào)和詞的詞表,再利用所述詞表將地質(zhì)表頭文本原始數(shù)據(jù)轉(zhuǎn)化為詞編號(hào)序列;將所述詞編號(hào)序列輸入預(yù)先建立的基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的表頭歸并模型,經(jīng)過所述表頭歸并模型的嵌入層、LSTM層后輸出特征向量;使用softmax對(duì)所述特征向量計(jì)算,得出地質(zhì)表頭文本所屬標(biāo)簽類別的概率,輸出表頭文本的類別預(yù)測(cè)結(jié)果,本發(fā)明能夠統(tǒng)籌地質(zhì)表頭文本數(shù)據(jù)集的局部和全局文本特征,具備良好的準(zhǔn)確性和穩(wěn)定性,有效提升地質(zhì)表頭文本類別預(yù)測(cè)的效果。
聲明:
“基于自然語(yǔ)言處理的地質(zhì)表頭歸并方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)