機(jī)場航班延誤恢復(fù)的強(qiáng)化學(xué)習(xí)算法
重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁數(shù): 9 2024-09-15
摘要: 機(jī)場出現(xiàn)航班延誤會導(dǎo)致飛行器和乘客滯留機(jī)場,若航班延誤恢復(fù)調(diào)度不當(dāng)會擴(kuò)大延誤造成的損失。針對航班延誤恢復(fù)調(diào)度的損失最小化問題,設(shè)計(jì)了延誤總損失計(jì)算的目標(biāo)函數(shù),構(gòu)建航班延誤恢復(fù)馬爾科夫決策過程,建立了機(jī)場航班延誤恢復(fù)重排班模型。為了解決計(jì)算的復(fù)雜性問題,采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)化策略函數(shù)對減小延誤損失目標(biāo)函數(shù)值的策略進(jìn)行參數(shù)化,利用獎勵函數(shù)和優(yōu)勢函數(shù)對其進(jìn)行訓(xùn)練,提出了一種機(jī)場航...