多智能體協(xié)同決策仿真平臺研究與開發(fā)
系統(tǒng)仿真學(xué)報
頁數(shù): 11 2023-11-22
摘要: 強化學(xué)習(xí)仿真平臺為強化學(xué)習(xí)提供交互和訓(xùn)練的環(huán)境。為了使仿真平臺兼容多智能體強化學(xué)習(xí)算法,滿足軍事領(lǐng)域仿真的需求,提煉多智能體強化學(xué)習(xí)算法中的相似流程,設(shè)計統(tǒng)一接口,將多種不同類型深度強化學(xué)習(xí)算法在仿真平臺進行嵌入驗證;優(yōu)化仿真平臺后端服務(wù)框架以加速算法模型的訓(xùn)練過程。實驗結(jié)果表明:在仿真平臺中統(tǒng)一接口規(guī)范,能夠兼容多種不同類型的多智能體強化學(xué)習(xí)算法,顯著提升了后端服務(wù)框架重構(gòu)和...