基于改進(jìn)DQN的移動(dòng)機(jī)器人避障路徑規(guī)劃
中國(guó)慣性技術(shù)學(xué)報(bào)
頁(yè)數(shù): 11 2024-04-30
摘要: 針對(duì)一般強(qiáng)化學(xué)習(xí)方法下機(jī)器人在避障路徑規(guī)劃上學(xué)習(xí)時(shí)間長(zhǎng)、探索能力差和獎(jiǎng)勵(lì)稀疏等問(wèn)題,提出了一種基于改進(jìn)深度Q網(wǎng)絡(luò)(DQN)的移動(dòng)機(jī)器人避障路徑規(guī)劃。首先在傳統(tǒng)DQN算法基礎(chǔ)上設(shè)計(jì)了障礙學(xué)習(xí)規(guī)則,避免對(duì)同一障礙重復(fù)學(xué)習(xí),提升學(xué)習(xí)效率和成功率。其次提出獎(jiǎng)勵(lì)優(yōu)化方法,利用狀態(tài)間的訪問(wèn)次數(shù)差異給予獎(jiǎng)勵(lì),平衡狀態(tài)點(diǎn)的訪問(wèn)次數(shù),避免過(guò)度訪問(wèn);同時(shí)通過(guò)計(jì)算與目標(biāo)點(diǎn)的歐氏距離,使其偏向于選擇接...