本發(fā)明公開(kāi)了融合深度強(qiáng)化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法,DRL模塊利用編碼器提取數(shù)據(jù)在高維空間的特征表達(dá),解碼器則根據(jù)規(guī)則和概率選擇路徑,最后使用強(qiáng)化學(xué)習(xí)的訓(xùn)練方法更新參數(shù);訓(xùn)練并迭代了足夠多次網(wǎng)絡(luò)參數(shù)后,測(cè)試數(shù)據(jù)能通過(guò)網(wǎng)絡(luò)計(jì)算得到一系列強(qiáng)大的“初始解”將“初始解”所組成的“種群”將作為輸入傳入遺傳算法得到最終解。本發(fā)明有益效果:本發(fā)明深度強(qiáng)化學(xué)習(xí)完成了從問(wèn)題輸入到問(wèn)題輸出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最優(yōu)陷阱,依靠DRL提供的好的初始種群可以輔助搜索過(guò)程跳出“局優(yōu)”;對(duì)于一定規(guī)模的問(wèn)題,神經(jīng)網(wǎng)絡(luò)只需一次預(yù)訓(xùn)練,求解時(shí)響應(yīng)速度快,提高搜索效率,減少搜索空間和時(shí)間。
聲明:
“融合深度強(qiáng)化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)