本發(fā)明公開了一種適于乘客等待時間分布隨時間變化的網(wǎng)約車訂單分配方法,包括:根據(jù)乘客等待時間分布變化范圍計算出該分布變化范圍下批處理算法對應(yīng)的最優(yōu)的匹配間隔并對不同的乘客等待時間分布訓(xùn)練不同的深度強(qiáng)化學(xué)習(xí)模型,將上述具有不同匹配間隔的批處理算法和適應(yīng)不同乘客等待時間分布的深度強(qiáng)化學(xué)習(xí)模型合并為一個算法集合;當(dāng)有訂單到來時,采用預(yù)設(shè)的選擇模型在算法集合中選擇其中一個算法進(jìn)行分配訂單,根據(jù)收益反饋對選擇模型中的參數(shù)進(jìn)行更新;結(jié)合收益反饋檢測乘客等待時間分布是否變化,若發(fā)生變化則重啟選擇模型并清空反饋記錄。本發(fā)明能夠隨乘客等待時間和數(shù)目分布變化而不斷調(diào)整分配從而最大化網(wǎng)約車平臺收益。
聲明:
“適于乘客等待時間分布隨時間變化的網(wǎng)約車訂單分配方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)