本發(fā)明涉及知識(shí)圖譜技術(shù)領(lǐng)域,提供了一種基于語(yǔ)言統(tǒng)計(jì)模型的地質(zhì)領(lǐng)域文獻(xiàn)圖譜生成方法。其旨在發(fā)現(xiàn)同類信息(這里是地質(zhì)學(xué)金礦領(lǐng)域內(nèi)信息)之間的關(guān)聯(lián)性,構(gòu)建的圖譜創(chuàng)新點(diǎn)在于金礦領(lǐng)域內(nèi)的知識(shí),采用文獻(xiàn)進(jìn)行構(gòu)建。其主要方案包括:分詞操作,進(jìn)行詞性過(guò)濾操作,得到僅剩下名詞、動(dòng)詞、介詞的主干句子,對(duì)主干句子進(jìn)行動(dòng)詞過(guò)濾操作,得到不以人為主語(yǔ)的及物動(dòng)詞的句子。對(duì)上一步的結(jié)果進(jìn)行關(guān)系二元組抽取操作,并計(jì)算概率每一個(gè)關(guān)系二元組均有一個(gè)概率p。將相同的關(guān)系詞拼接,根據(jù)概率p計(jì)算組成的關(guān)系三元組的概率P。對(duì)關(guān)系三元組進(jìn)行關(guān)系詞過(guò)濾及概率排序操作得到關(guān)系三元組列表,對(duì)關(guān)系三元組進(jìn)行圖譜生成。
聲明:
“基于語(yǔ)言統(tǒng)計(jì)模型的地質(zhì)領(lǐng)域文獻(xiàn)圖譜生成方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)