本發(fā)明涉及一種基于深度強化學習的出租車調(diào)度方法及系統(tǒng),所述系統(tǒng)包括:區(qū)域構(gòu)建模塊、需求預(yù)測模塊、車輛調(diào)度模塊、模擬器;所述方法包括:S1:形成區(qū)域網(wǎng)絡(luò);S2:預(yù)測任意區(qū)域在任意的時間中將會出現(xiàn)的訂單數(shù)量;S3:計算出一個區(qū)域總的車輛供應(yīng);獲取每個區(qū)域的需求/供應(yīng)狀態(tài);S4:將任意空閑車輛所在區(qū)域和鄰居區(qū)域的狀態(tài)輸入訓練好的出租車調(diào)度模型中,得到該車輛的調(diào)度策略,確定該車是繼續(xù)留在當?shù)貐^(qū)域還是調(diào)度到系統(tǒng)指定的鄰居區(qū)域中。本發(fā)明實現(xiàn)對空閑出租車進行調(diào)度,增加了訂單匹配成功率,減少了乘客的等待時間,提高了出租車使用率。
聲明:
“基于深度強化學習的出租車調(diào)度方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)