本發(fā)明公開了一種基于糾錯的基因組測序數(shù)據(jù)無損壓縮方法及相關(guān)設(shè)備,所述方法包括:識別并糾正原始測序短片段中的測序堿基錯誤,并記錄堿基錯誤信息,所述堿基錯誤信息包括測序錯誤的堿基位置及原堿基;將原始測序短片段歸類到糾正后的索引區(qū)域文件中,并將測序錯誤糾正信息加入到索引區(qū)域文件中;對不同的索引區(qū)域文件內(nèi)原始測序短片段中的堿基序列進行排序并進行壓縮,得到基因組測序數(shù)據(jù)的壓縮結(jié)果文件。本發(fā)明實現(xiàn)了高效的測序短片段測序錯誤的糾正,通過糾正堿基當(dāng)中的測序錯誤,使得更多相似測序短片段被分配到同一桶中,進而提高了后續(xù)桶內(nèi)測序短片段的壓縮效率,通過記錄糾正測序短片段中的桶索引序列,實現(xiàn)對基因組測序數(shù)據(jù)的無損壓縮。
聲明:
“基于糾錯的基因組測序數(shù)據(jù)無損壓縮方法及相關(guān)設(shè)備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)