融合漢字輸入法的BERT與BLCG的長(zhǎng)文本分類研究
計(jì)算機(jī)工程與應(yīng)用
頁(yè)數(shù): 7 2023-03-14
摘要: 現(xiàn)有的中文長(zhǎng)文本分類模型中,沒(méi)有考慮漢字讀音、筆畫(huà)等特征信息,因此不能充分表示中文語(yǔ)義;同時(shí),長(zhǎng)文本中常常包含大量與目標(biāo)主題無(wú)關(guān)的信息,甚至部分文本與其他主題相關(guān),導(dǎo)致模型誤判。為此,提出了一種融合漢字輸入法的BERT(BERT fused Chinese input methods,CIMBERT)、帶有門控機(jī)制的長(zhǎng)短期記憶卷積網(wǎng)絡(luò)(BiLSTM fused CNN with...