本公開實(shí)施例公開了一種語音播報(bào)模型的強(qiáng)化學(xué)習(xí)方法、電子設(shè)備及程序產(chǎn)品,所述方法包括:獲取樣本數(shù)據(jù);樣本數(shù)據(jù)包括樣本導(dǎo)航軌跡中樣本位置處的導(dǎo)航相關(guān)信息以及樣本位置處輸出的語音播報(bào)樣本內(nèi)容;將樣本導(dǎo)航軌跡中當(dāng)前樣本位置的導(dǎo)航相關(guān)信息作為當(dāng)前狀態(tài)輸入至語音播報(bào)模型,得到當(dāng)前狀態(tài)下的動(dòng)作信息;動(dòng)作信息包括在當(dāng)前樣本位置處的語音播報(bào)預(yù)測(cè)內(nèi)容;基于語音播報(bào)預(yù)測(cè)內(nèi)容,以及在當(dāng)前樣本位置處輸出的語音播報(bào)樣本內(nèi)容之間的匹配結(jié)果,計(jì)算目標(biāo)獎(jiǎng)勵(lì)值;匹配結(jié)果包括語音播報(bào)預(yù)測(cè)內(nèi)容中的預(yù)測(cè)導(dǎo)航元素與語音播報(bào)樣本內(nèi)容中的樣本導(dǎo)航元素之間的匹配結(jié)果;基于目標(biāo)獎(jiǎng)勵(lì)值對(duì)語音播報(bào)模型進(jìn)行強(qiáng)化訓(xùn)練。
聲明:
“語音播報(bào)模型的強(qiáng)化學(xué)習(xí)方法、電子設(shè)備及程序產(chǎn)品” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)