基于雙向長短時記憶與混合獎勵函數(shù)的多無人車協(xié)同圍捕控制
中國科學(xué):技術(shù)科學(xué)
頁數(shù): 11 2024-09-10
摘要: 針對未知、不確定環(huán)境下多無人車協(xié)同圍捕問題,本文提出了一種基于雙向長短時記憶與混合獎勵函數(shù)(BM-MADDPG)的多智能體協(xié)同圍捕決策算法解決無人車圍捕策略生成與協(xié)同控制問題.首先,通過雙向長短時記憶(bidirectional long short-term memory, Bi-LSTM)網(wǎng)絡(luò)捕捉狀態(tài)和動作序列間時序信息特征,評估當(dāng)前狀態(tài)采取不同動作的長期效果,解決協(xié)作圍捕... (共11頁)