本發(fā)明公開了一種基于濾波器組頻率區(qū)分的深度網(wǎng)絡波形合成方法及裝置,方法包括:采用解析方法設計多個任意頻率通帶的濾波器組;將生成器輸出的語音信號并行饋入到濾波器組中,獲得多個窄頻帶的信號;將窄頻帶的信號分別輸入到各個子鑒別器中進行處理,綜合子鑒別器的損失函數(shù)對生成對抗網(wǎng)絡的參數(shù)進行訓練,將測試文本饋入到給定的聲學模型前端網(wǎng)絡中,生成測試梅爾譜,再將該測試梅爾譜輸入到生成器中,生成語音信號。裝置包括:處理器和存儲器。本發(fā)明提出的語音波形合成GAN網(wǎng)絡解決了高頻部分混疊失效的問題,大大減輕了高頻頻段的頻譜失真。
聲明:
“基于濾波器組頻率區(qū)分的深度網(wǎng)絡波形合成方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)