本發(fā)明涉及一種基于行動(dòng)者評(píng)論家強(qiáng)化學(xué)習(xí)算法的循環(huán)網(wǎng)絡(luò)人機(jī)對(duì)話方法。該系統(tǒng)由兩個(gè)子系統(tǒng)構(gòu)成:對(duì)話生成系統(tǒng)和情感分析系統(tǒng)。對(duì)話生成系統(tǒng)基于門(mén)循環(huán)單元網(wǎng)絡(luò)模型,使用有標(biāo)簽的對(duì)話數(shù)據(jù)集進(jìn)行訓(xùn)練。進(jìn)一步地,我們對(duì)經(jīng)過(guò)訓(xùn)練的模型使用強(qiáng)化學(xué)習(xí)中的行動(dòng)者評(píng)論家算法進(jìn)行參數(shù)調(diào)優(yōu);即,我們使用已被訓(xùn)練的模型建立兩個(gè)網(wǎng)絡(luò),分別稱之為“行動(dòng)者”網(wǎng)絡(luò)和“評(píng)論家”網(wǎng)絡(luò);進(jìn)一步地,為了減少訓(xùn)練時(shí)間、提高資源的利用率,我們創(chuàng)建了多個(gè)進(jìn)程,向每一個(gè)進(jìn)程分配一對(duì)“行動(dòng)者”和“評(píng)論家”。
聲明:
“基于行動(dòng)者評(píng)論家強(qiáng)化學(xué)習(xí)算法的循環(huán)網(wǎng)絡(luò)人機(jī)對(duì)話方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)