基于PPO算法的攻擊路徑發(fā)現(xiàn)與尋優(yōu)方法
信息網(wǎng)絡安全
頁數(shù): 11 2023-09-10
摘要: 基于策略網(wǎng)絡選擇滲透動作發(fā)現(xiàn)最優(yōu)攻擊路徑,是自動化滲透測試的一項關(guān)鍵技術(shù)。然而,現(xiàn)有方法在訓練過程中存在無效動作過多、收斂速度慢等問題。為了解決這些問題,文章將PPO(Proximal Policy Optimization)算法用于解決攻擊路徑尋優(yōu)問題,并提出帶有滲透動作選擇模塊的改進型PPO算法IPPOPAS(Improved PPO with Penetration Ac... (共11頁)