本發(fā)明公開了一種基于深度強化學習的共享自行車調(diào)度方法,包括以下步驟:S1:劃分共享自行車的調(diào)度區(qū)域,得到調(diào)度區(qū)域單元,并確定共享自行車的運行環(huán)境變量;S2:確定共享自行車的調(diào)度變量;S3:構(gòu)建共享自行車的車輛調(diào)度優(yōu)化模型;S4:基于共享自行車的車輛調(diào)度優(yōu)化模型,利用平均場理論構(gòu)建共享自行車調(diào)度框架,并利用共享自行車調(diào)度框架完成共享自行車調(diào)度。本發(fā)明提出的基于強化學習的共享自行車調(diào)度優(yōu)化方法有利于智能地解決隨機和復(fù)雜的動態(tài)環(huán)境下,大規(guī)模路網(wǎng)的共享自行車短期和長期調(diào)度優(yōu)化問題。其考慮環(huán)境的供需變化和未來時間中調(diào)度決策與環(huán)境的交互影響,且不需要提前預(yù)測需求或進行人工數(shù)據(jù)處理,不受到需求預(yù)測計算效率和準確性的影響。
聲明:
“基于深度強化學習的共享自行車調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)