本發(fā)明涉及行人軌跡預(yù)測與分析技術(shù)領(lǐng)域,尤其涉及一種基于融合逆強化學(xué)習(xí)的軌跡預(yù)測方法,包括S1、基于輸入的觀測軌跡和場景圖生成路徑獎勵地圖和終點獎勵地圖;S2、利用逆強化學(xué)習(xí)算法對策略采樣得到路徑;S3、利用全卷積網(wǎng)絡(luò)進行路徑位置編碼,融合雙向門控循環(huán)單元對場景路徑編碼,融合場景路徑和行人觀測軌跡。本發(fā)明通過引入輕量化的特征提取ENet網(wǎng)絡(luò),減少了算法參數(shù)量,提升了算法理解場景的泛化能力;利用場景的注意力機制模塊,更好的融合場景信息和行人觀測軌跡,場景導(dǎo)向的行人軌跡預(yù)測網(wǎng)絡(luò)S2Tirl相較于主流算法在公共數(shù)據(jù)集和實際數(shù)據(jù)上都取得了更好的效果。
聲明:
“基于融合逆強化學(xué)習(xí)的軌跡預(yù)測方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)