本發(fā)明公開了一種基因測序數(shù)據(jù)壓縮預(yù)處理方法、系統(tǒng)及計算機(jī)可讀介質(zhì),方法實(shí)施步驟包括獲取參考基因組數(shù)據(jù),獲取短串K?mer及其預(yù)測字符c之間的映射關(guān)系,得到包含參考基因組的正鏈及負(fù)鏈中任意短串K?mer及其對應(yīng)相鄰位的預(yù)測字符c的預(yù)測數(shù)據(jù)模型P1;系統(tǒng)為包含編程以執(zhí)行前述方法的計算機(jī)系統(tǒng),計算機(jī)可讀介質(zhì)包含執(zhí)行前述方法的計算機(jī)程序。本發(fā)明能夠面向無損基因測序數(shù)據(jù)壓縮的參考基因組數(shù)據(jù)預(yù)處理方法,為基因測序數(shù)據(jù)的高性能無損壓縮和解壓算法提供充分有效的信息,能夠?qū)崿F(xiàn)對任意基因組數(shù)據(jù)樣本中的短串K?mer的相鄰位的預(yù)測字符c進(jìn)行預(yù)測,預(yù)測信息越準(zhǔn)確,則可以實(shí)現(xiàn)對基因組數(shù)據(jù)樣本實(shí)現(xiàn)越低的壓縮率。
聲明:
“基因測序數(shù)據(jù)壓縮預(yù)處理方法、系統(tǒng)及計算機(jī)可讀介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)