面向中文科學(xué)數(shù)據(jù)集的句子級語義匹配模型
鄭州大學(xué)學(xué)報(工學(xué)版)
頁數(shù): 9 2024-01-10
摘要: 針對現(xiàn)有以詞為粒度的語義匹配模型難以理解句子級科學(xué)數(shù)據(jù)集元數(shù)據(jù)的問題,提出了一個面向中文科學(xué)數(shù)據(jù)集的句子級語義匹配(CSDSM)模型。該模型使用CSL數(shù)據(jù)集對SimCSE和CoSENT進行訓(xùn)練生成CoSENT預(yù)訓(xùn)練模型?;贑oSENT模型,引入多頭自注意力機制進行特征提取,通過余弦相似度與KNN分類結(jié)果加權(quán)求和得到最終輸出。以國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心開放的語義元數(shù)據(jù)信息作為自...