基于樣本分布特征的數(shù)據(jù)投毒防御
計(jì)算機(jī)應(yīng)用研究
頁數(shù): 6 2023-04-10
摘要: 流量分類模型在更新過程中易受數(shù)據(jù)污染的干擾而降低模型性能,現(xiàn)有基于數(shù)據(jù)清洗的防御方法需依賴專家經(jīng)驗(yàn)和人工篩選,且無法有效應(yīng)對(duì)利用未知分布樣本構(gòu)造的投毒攻擊。針對(duì)上述問題,受分布外檢測和判別主動(dòng)學(xué)習(xí)的啟發(fā),設(shè)計(jì)一種基于樣本分布特征的數(shù)據(jù)投毒防御方法,通過二分類判別器篩選每輪新增樣本中的已知及未知分布樣本。對(duì)于新增的已知分布樣本,通過模型預(yù)測與標(biāo)注結(jié)果一致率評(píng)估新增樣本的數(shù)據(jù)質(zhì)量,... (共6頁)