本發(fā)明公開了一種基于強化學(xué)習(xí)和加權(quán)元路徑的語義推薦方法,屬于推薦算法技術(shù)領(lǐng)域,包括收集用戶各類實體屬性信息、獲取記錄中用戶和物品的異構(gòu)信息網(wǎng)絡(luò),對提取的記錄以及各類實體屬性信息進行預(yù)處理并分析,利用強化學(xué)習(xí)算法計算不同元路徑的權(quán)重,自主學(xué)習(xí)不同元路徑的權(quán)重,構(gòu)建馬爾可夫決策過程,對元路徑的權(quán)重進行訓(xùn)練,得到元路徑選擇權(quán)重的信息并生成記錄,構(gòu)建深層決策網(wǎng)絡(luò)并訓(xùn)練,設(shè)計經(jīng)驗池、預(yù)測網(wǎng)絡(luò)和結(jié)果網(wǎng)絡(luò),對輸出的獎勵值進行擬合得到最佳權(quán)重,依據(jù)得到的最佳權(quán)重的元路徑,計算用戶相似度,并選取Top?N進行排列,完成推薦。本發(fā)明能夠結(jié)合用戶的購買記錄以及其他信息進行個性化推薦,提高了推薦的準確性。
聲明:
“基于強化學(xué)習(xí)和加權(quán)元路徑的語義推薦方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)