基于深度強化學習的立體投送策略優(yōu)化方法研究
系統(tǒng)仿真學報
頁數(shù): 11 2022-10-21
摘要: 基于深度強化學習算法在策略優(yōu)化問題中的良好表現(xiàn),以立體投送作戰(zhàn)行動為主要研究對象,提出了一種深度強化學習框架與仿真推演實驗協(xié)同的作戰(zhàn)行動策略優(yōu)化方法。在分析策略優(yōu)化研究現(xiàn)狀的基礎(chǔ)上,根據(jù)研究問題對深度學習框架進行了分析比較,構(gòu)建了基于A3C算法的深度強化學習立體投送策略模型,并通過仿真推演和分布式計算,實現(xiàn)深度強化學習模型與“人不在回路”仿真推演的交互學習,獲得優(yōu)化后的立體投送...