當(dāng)前位置:首頁 > 科技文檔 > 互聯(lián)網(wǎng) > 正文

環(huán)境感知的自適應(yīng)深度強化學(xué)習(xí)路由算法

計算機工程與設(shè)計 頁數(shù): 8 2023-11-16
摘要: 針對現(xiàn)有強化學(xué)習(xí)路由算法未能根據(jù)網(wǎng)絡(luò)負(fù)載變化較好權(quán)衡動作探索和利用的問題,提出一種基于環(huán)境感知的自適應(yīng)深度強化學(xué)習(xí)路由算法。依據(jù)智能體經(jīng)驗回放時的平均誤差,動態(tài)調(diào)整ε-greedy策略以平衡探索和利用,引入啟發(fā)式規(guī)則限制動作探索以積累正向經(jīng)驗,結(jié)合優(yōu)先經(jīng)驗回放機制加速模型收斂,提升智能體收斂前后的網(wǎng)絡(luò)吞吐量和數(shù)據(jù)交付率。仿真結(jié)果表明,部署了該算法的網(wǎng)絡(luò)的吞吐量和數(shù)據(jù)交付率均高于... (共8頁)

開通會員,享受整站包年服務(wù)立即開通 >