本發(fā)明提供一種針對FASTQ數(shù)據(jù)的多線程快速存儲無損壓縮方法,應(yīng)用于DNA序列的壓縮,其中,所述方法包括:數(shù)據(jù)分類步驟:輸入原始FASTQ數(shù)據(jù),并將所述原始FASTQ數(shù)據(jù)的短讀分成元數(shù)據(jù)、質(zhì)量分?jǐn)?shù)和堿基序列三個數(shù)據(jù)流;數(shù)據(jù)壓縮步驟:針對元數(shù)據(jù),利用增量編碼方式進(jìn)行檢測并消除元數(shù)據(jù)的冗余信息;針對質(zhì)量分?jǐn)?shù),利用比特級別的PPM預(yù)測模型和算術(shù)編碼進(jìn)行壓縮;針對堿基序列,利用固定階位的改良型算術(shù)編碼進(jìn)行壓縮;數(shù)據(jù)輸出步驟:將不同數(shù)據(jù)流的壓縮結(jié)果進(jìn)行歸檔合并,輸出經(jīng)過壓縮后的最終數(shù)據(jù)。本發(fā)明還提供一種針對FASTQ數(shù)據(jù)的多線程快速存儲無損壓縮系統(tǒng)。本發(fā)明提供的技術(shù)方案能提高壓縮效率和壓縮速度。
聲明:
“針對FASTQ數(shù)據(jù)的多線程快速存儲無損壓縮方法及其系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)