多模態(tài)信息增強表示的中文關(guān)鍵詞抽取方法
清華大學(xué)學(xué)報(自然科學(xué)版)
頁數(shù): 12 2024-05-09
摘要: 關(guān)鍵詞抽取是指能自動抽取反映文本主題的詞或者短語,被廣泛應(yīng)用于文本檢索、文本摘要等領(lǐng)域中。目前關(guān)鍵詞抽取任務(wù)主要依賴于預(yù)訓(xùn)練語言模型來獲取文本表示,這類語言模型主要基于單一模態(tài)的通用文本語料進行訓(xùn)練,存在無法根據(jù)下游任務(wù)特性進行領(lǐng)域適配和語義表征能力有限的問題。該文提出一種多模態(tài)信息增強表示的中文關(guān)鍵詞抽取方法MIEnhance-KPE,首先引入Adapter層將偏旁和部首信息...