本發(fā)明涉及地質(zhì)文本分析領(lǐng)域,提供一種地質(zhì)文本實(shí)體關(guān)系聯(lián)合抽取方法及系統(tǒng),包括:S1:獲得句子文本集;S2:獲得篩選后的句子文本集;S3:獲得各句子的詞向量;獲得各句子的詞標(biāo)簽;獲得依存關(guān)系樹;S4:獲得每個詞聯(lián)系上下文的連續(xù)嵌入表示;S5:獲得每個詞當(dāng)前時間步的包含上下文信息的隱藏層狀態(tài)向量;S6:獲得包含豐富鄰域信息和語義特征的詞向量表示;S7:獲得訓(xùn)練好的提取模型;S8:將所述測試樣本集輸入所述訓(xùn)練好的提取模型,獲得所述測試樣本集的實(shí)體間關(guān)系的三元組。本發(fā)明使大量非結(jié)構(gòu)化數(shù)據(jù)得以有效利用,并且可以通過訓(xùn)練大量數(shù)據(jù)自動獲取模型,而不需要人工提取特征,節(jié)省了大量時間與人工成本。
聲明:
“地質(zhì)文本實(shí)體關(guān)系聯(lián)合抽取方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)