作戰(zhàn)方案驅(qū)動(dòng)的可學(xué)習(xí)兵棋推演智能體研究
系統(tǒng)仿真學(xué)報(bào)
頁(yè)數(shù): 11 2023-07-20
摘要: 為了使智能體能夠應(yīng)對(duì)兵棋推演中的復(fù)雜作戰(zhàn)場(chǎng)景和作戰(zhàn)目的,提出作戰(zhàn)方案驅(qū)動(dòng)的可學(xué)習(xí)兵棋推演智能體架構(gòu)。剖析智能體對(duì)兵棋系統(tǒng)的“依附特性”和“松耦合特性”,得到智能體的可學(xué)習(xí)要求;在智能體框架設(shè)計(jì)中,使用作戰(zhàn)方案壓減智能體學(xué)習(xí)范圍。通過(guò)有限狀態(tài)機(jī)對(duì)應(yīng)作戰(zhàn)方案中的作戰(zhàn)階段知識(shí),依據(jù)作戰(zhàn)方案框架確定智能體決策空間,設(shè)計(jì)可學(xué)習(xí)的深層神經(jīng)網(wǎng)絡(luò)實(shí)施關(guān)鍵決策空間探索,神經(jīng)網(wǎng)絡(luò)采用先驗(yàn)知識(shí)模仿學(xué)...