當(dāng)前位置:首頁 > 科技文檔 > 公路運(yùn)輸 > 正文

基于雙向長短時記憶與混合獎勵函數(shù)的多無人車協(xié)同圍捕控制

中國科學(xué):技術(shù)科學(xué) 頁數(shù): 11 2024-09-10
摘要: 針對未知、不確定環(huán)境下多無人車協(xié)同圍捕問題,本文提出了一種基于雙向長短時記憶與混合獎勵函數(shù)(BM-MADDPG)的多智能體協(xié)同圍捕決策算法解決無人車圍捕策略生成與協(xié)同控制問題.首先,通過雙向長短時記憶(bidirectional long short-term memory, Bi-LSTM)網(wǎng)絡(luò)捕捉狀態(tài)和動作序列間時序信息特征,評估當(dāng)前狀態(tài)采取不同動作的長期效果,解決協(xié)作圍捕... (共11頁)

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔