本發(fā)明公開了一種基于深度學(xué)習(xí)的基因組數(shù)據(jù)無損壓縮方法及相關(guān)設(shè)備,所述方法包括:基于深度學(xué)習(xí)模型學(xué)習(xí)得到基因組序列的上下文關(guān)系特征和非局部特征;基于上下文關(guān)系特征和非局部特征,當(dāng)輸入堿基上文時(shí),深度學(xué)習(xí)模型預(yù)測(cè)堿基上文后緊鄰的多個(gè)堿基分別對(duì)應(yīng)的預(yù)測(cè)概率;利用深度學(xué)習(xí)模型輸出的多個(gè)堿基分別對(duì)應(yīng)的預(yù)測(cè)概率連接算術(shù)編碼,利用算術(shù)編碼,編碼待壓縮堿基的概率,輸出壓縮結(jié)果文件。本發(fā)明通過深度學(xué)習(xí)模型學(xué)習(xí)得到基因組上下文之間的相關(guān)性,利用已壓縮過的堿基序列信息,預(yù)測(cè)當(dāng)前待編碼堿基的概率,最后利用算術(shù)編碼,輸出壓縮結(jié)果文件,實(shí)現(xiàn)了對(duì)基因組數(shù)據(jù)的無損壓縮。
聲明:
“基于深度學(xué)習(xí)的基因組數(shù)據(jù)無損壓縮方法及相關(guān)設(shè)備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)