基于欠采樣和多層集成學(xué)習(xí)的惡意網(wǎng)頁(yè)識(shí)別
計(jì)算機(jī)工程與設(shè)計(jì)
頁(yè)數(shù): 7 2024-03-16
摘要: 現(xiàn)實(shí)中惡意網(wǎng)頁(yè)與良性網(wǎng)頁(yè)比重嚴(yán)重失衡,傳統(tǒng)的機(jī)器學(xué)習(xí)分類模型不能很好的應(yīng)用,為此提出一種基于欠采樣和多層集成學(xué)習(xí)的惡意網(wǎng)頁(yè)檢測(cè)模型。通過(guò)欠采樣達(dá)到局部數(shù)據(jù)平衡;通過(guò)第一層基于權(quán)重和閾值的集成學(xué)習(xí)確保模型的準(zhǔn)確度;通過(guò)第二層基于投票的集成學(xué)習(xí)保證全局信息的完整性。實(shí)驗(yàn)結(jié)果表明,所提模型在不平衡數(shù)據(jù)集上的惡意網(wǎng)頁(yè)識(shí)別性能優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型。 (共7頁(yè))