本申請是關(guān)于一種基于對話的內(nèi)容推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì),涉及人工智能交互技術(shù)領(lǐng)域。所述方法包括:獲取與目標(biāo)用戶之間的歷史對話語句;將歷史對話語句,以及各個(gè)候選推薦內(nèi)容輸入至對話推薦模型,獲得對話推薦預(yù)測結(jié)果;對話推薦模型的獎(jiǎng)勵(lì)函數(shù)的輸入信息包括預(yù)測回復(fù)信息以及預(yù)測推薦結(jié)果;預(yù)測回復(fù)信息包括對話推薦模型在強(qiáng)化學(xué)習(xí)過程中產(chǎn)生的預(yù)測對話回復(fù)對應(yīng)的信息;預(yù)測推薦結(jié)果指示對話推薦模型在強(qiáng)化學(xué)習(xí)過程中從各個(gè)候選推薦內(nèi)容中預(yù)測出的目標(biāo)推薦內(nèi)容。該對話推薦模型的優(yōu)化維度包含了對話推薦模型的對話回復(fù),從而提高了對話推薦模型的優(yōu)化效果,進(jìn)而提高對話推薦模型應(yīng)用時(shí)的對話推薦效果。
聲明:
“基于對話的內(nèi)容推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)