本發(fā)明涉及一種基于幾何圖神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)信號(hào)肽的預(yù)測方法及裝置,其方法包括:獲取數(shù)據(jù)集中的蛋白質(zhì)序列,提取其中信號(hào)肽的字符序列;對(duì)所述信號(hào)肽進(jìn)行特征提取,得到所述信號(hào)肽的序列進(jìn)化特征、物理化學(xué)特征、結(jié)構(gòu)特征、統(tǒng)計(jì)特征;將進(jìn)化特征、物理化學(xué)特征、結(jié)構(gòu)特征、統(tǒng)計(jì)特征進(jìn)行融合,得到多維向量;根據(jù)所述字符序列和所述多維向量構(gòu)建信號(hào)肽的特征圖;將所述特征圖作為幾何圖神經(jīng)網(wǎng)絡(luò)模型的輸入,訓(xùn)練所述幾何圖神經(jīng)網(wǎng)絡(luò)直至其誤差低于閾值,保存所述幾何圖神經(jīng)網(wǎng)絡(luò)模型并將其用于預(yù)測待預(yù)測信號(hào)肽。本發(fā)明結(jié)合幾何圖神經(jīng)網(wǎng)絡(luò)和字符序列,在保留了特征提取的原始信息同時(shí),減少了模型過擬合,提高了信號(hào)肽預(yù)測的準(zhǔn)確率。
聲明:
“基于幾何圖神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)信號(hào)肽的預(yù)測方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)