本申請涉及化學技術(shù)領域,公開了一種構(gòu)建方法、分析方法、裝置、存儲介質(zhì)和計算機設備,其中,構(gòu)建方法包括:獲取多個化合物樣本的SMILES序列;對所述多個化合物樣本的SMILES序列進行拼接處理,確定拼接SMILES序列;根據(jù)訓練樣本序列對BERT模型進行訓練,構(gòu)建所述預訓練模型,所述訓練樣本序列包括所述多個化合物樣本的SMILES序列和所述拼接SMILES序列。本申請的方法,能夠從無標簽的樣本數(shù)據(jù)對BERT模型進行有監(jiān)督學習得到相應的機器學習模型,不僅節(jié)約模型訓練時間,而且模型泛化能力較強。
聲明:
“構(gòu)建方法、分析方法、裝置、存儲介質(zhì)和計算機設備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)