文本相似度計(jì)算方法綜述
計(jì)算機(jī)工程
頁(yè)數(shù): 15 2024-02-05
摘要: 文本相似度計(jì)算是自然語(yǔ)言處理的一部分,用來(lái)計(jì)算兩個(gè)詞、句子及文本之間的相似程度,具有多種應(yīng)用場(chǎng)景,文本相似度計(jì)算的研究對(duì)于人工智能的發(fā)展有著重要作用。文本相似度計(jì)算起初基于字符串表面,隨著詞向量的提出,文本相似度計(jì)算可進(jìn)行基于統(tǒng)計(jì)以及深度學(xué)習(xí)的建模與計(jì)算,也可與預(yù)訓(xùn)練模型相結(jié)合。首先,將文本相似度計(jì)算方法分為基于字符串、基于詞向量、基于預(yù)訓(xùn)練模型、基于深度學(xué)習(xí)、其他方法5類,并...