基于相似性樣本生成的深度強(qiáng)化學(xué)習(xí)快速抗干擾算法
通信學(xué)報(bào)
頁數(shù): 10 2024-07-24
摘要: 為提高基于深度強(qiáng)化學(xué)習(xí)的通信抗干擾算法的學(xué)習(xí)效率,以更快適應(yīng)未知干擾環(huán)境,提出一種基于相似性樣本生成的深度強(qiáng)化學(xué)習(xí)快速抗干擾算法。該算法將基于互模擬關(guān)系的狀態(tài)-動(dòng)作對相似性度量與基于深度Q網(wǎng)絡(luò)的抗干擾算法相結(jié)合,能在未知?jiǎng)討B(tài)干擾環(huán)境下快速學(xué)習(xí)有效的多域抗干擾策略。算法在完成每步傳輸動(dòng)作時(shí),首先利用深度Q網(wǎng)絡(luò)抗干擾算法與環(huán)境交互,獲得實(shí)際的狀態(tài)-動(dòng)作對。然后,基于互模擬關(guān)系生成與...