本發(fā)明公開(kāi)了基于深度森林的蛋白質(zhì)?蛋白質(zhì)相互作用預(yù)測(cè)方法,屬于生物信息技術(shù)領(lǐng)域。所述方法融合偽氨基酸組成、自相關(guān)描述符、互信息描述符、組成、分布和轉(zhuǎn)化描述符、氨基酸組成位置特異性得分矩陣和二肽組成位置特異性得分矩陣將蛋白質(zhì)序列轉(zhuǎn)化為數(shù)值向量,融合蛋白質(zhì)對(duì)的序列信息、物理化學(xué)性質(zhì)信息和進(jìn)化信息作為樣本的初始特征;使用彈性網(wǎng)進(jìn)行特征選擇,剔除冗余和不相關(guān)的特征;將融合后的最優(yōu)特征向量輸入到構(gòu)建的多粒度級(jí)聯(lián)深度森林中,預(yù)測(cè)蛋白質(zhì)?蛋白質(zhì)相互作用。本發(fā)明簡(jiǎn)單有效,深度森林能夠表征蛋白質(zhì)對(duì)的高水平特征信息,在訓(xùn)練集和測(cè)試集上的結(jié)果明顯優(yōu)于其它預(yù)測(cè)方法,可以為藥物靶點(diǎn)預(yù)測(cè)和人類疾病治療提供一定借鑒。
聲明:
“基于深度森林的蛋白質(zhì)-蛋白質(zhì)相互作用預(yù)測(cè)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)