本發(fā)明提供了基于強(qiáng)化學(xué)習(xí)的對(duì)話式導(dǎo)診方法,包括:利用用戶編碼模塊記錄用戶在t時(shí)刻的輸入x
t,并通過卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到用戶輸入的編碼u
t;通過循環(huán)神經(jīng)網(wǎng)絡(luò),基于編碼u
t及上一時(shí)刻系統(tǒng)的隱藏狀態(tài)h
t?1,得到核心網(wǎng)絡(luò)模塊的輸出o
t及當(dāng)前的隱藏狀態(tài)h
t,在分類預(yù)測模塊,輸出o
t通過全連接的前向網(wǎng)絡(luò),輸出分類評(píng)定c
t;在提問策略模塊,基于輸出o
t,通過全連接的前向網(wǎng)絡(luò)得到預(yù)定義命名實(shí)體識(shí)NER類別上的概率分布q
t,基于累計(jì)的NER記錄表和提問模板,進(jìn)行交互對(duì)話,在達(dá)到預(yù)定的T輪交互后,退出交互,并以最后一次c
t的結(jié)果作為最終的科室推薦結(jié)果。本發(fā)明可及時(shí)調(diào)整系統(tǒng)狀態(tài),向用戶提供可靠的科室推薦結(jié)果,并保存收集到用戶關(guān)鍵信息,供下游應(yīng)用調(diào)用。
聲明:
“基于強(qiáng)化學(xué)習(xí)的對(duì)話式導(dǎo)診方法、裝置及存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)