基于雙生成器與頻域判別器GAN語(yǔ)音增強(qiáng)算法
云南大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁(yè)數(shù): 10 2024-05-23
摘要: 針對(duì)在低信噪比條件下,生成對(duì)抗網(wǎng)絡(luò)語(yǔ)音增強(qiáng)算法難以捕捉帶噪語(yǔ)音的時(shí)域分布信息,導(dǎo)致語(yǔ)音信號(hào)被噪音淹沒(méi),進(jìn)而影響模型的增強(qiáng)效果,可能產(chǎn)生增強(qiáng)后語(yǔ)音失真等問(wèn)題,提出了一種基于雙生成器與頻域判別器的新型生成對(duì)抗網(wǎng)絡(luò)語(yǔ)音增強(qiáng)算法.首先,該算法采用了兩個(gè)參數(shù)相同的生成器,通過(guò)多階段的增強(qiáng)映射改善語(yǔ)音質(zhì)量;然后,每個(gè)生成器模型在原有模型的基礎(chǔ)上增加了自注意力層,以提升模型性能和增強(qiáng)效果;最...