針對(duì)口音識(shí)別中冗余特征及長(zhǎng)尾效應(yīng)的有效方法
應(yīng)用聲學(xué)
頁數(shù): 7 2024-02-27
摘要: 口音識(shí)別是指在同一語種下識(shí)別不同的區(qū)域口音的過程。為了提高口音識(shí)別的準(zhǔn)確率,采用了多種方法,取得了明顯的效果。首先,為了解決聲學(xué)特征中關(guān)鍵特征權(quán)重不突出的問題,引入了有效的注意力機(jī)制,并對(duì)多種注意力機(jī)制進(jìn)行了比較和分析。通過模型自適應(yīng)學(xué)習(xí)通道和空間維度的不同權(quán)重,提高了口音識(shí)別的性能。在Common Voice英語口音數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,引入CBAM注意力模塊是有效的,識(shí)別...