基于大語言模型的中文科技文獻(xiàn)標(biāo)注方法
計(jì)算機(jī)工程
頁數(shù): 8 2024-01-19
摘要: 高質(zhì)量的標(biāo)注數(shù)據(jù)是中文科技文獻(xiàn)領(lǐng)域自然語言處理任務(wù)的重要基石。針對(duì)目前缺乏中文科技文獻(xiàn)的高質(zhì)量標(biāo)注語料以及人工標(biāo)注質(zhì)量參差不齊且效率低下的問題,提出一種基于大語言模型的中文科技文獻(xiàn)標(biāo)注方法。首先,制定適用于多領(lǐng)域中文科技文獻(xiàn)的細(xì)粒度標(biāo)注規(guī)范,明確標(biāo)注實(shí)體類型以及標(biāo)注粒度;其次,設(shè)計(jì)結(jié)構(gòu)化文本標(biāo)注提示模板和生成解析器,將中文科技文獻(xiàn)標(biāo)注任務(wù)設(shè)置成單階段單輪問答過程,將標(biāo)注規(guī)范和帶...