本發(fā)明公開了一種基于強化學習的服務流程構(gòu)造方法。將流程構(gòu)造過程視作圖生成過程,使用有向無環(huán)圖來表示服務流程圖,并使用基于深度隨機游走的方法來生成服務流程圖的圖嵌入表示向量;將圖嵌入向量輸入策略神經(jīng)網(wǎng)絡和價值神經(jīng)網(wǎng)絡,策略神經(jīng)網(wǎng)絡的輸出為對服務流程圖中的下一條邊的預測,價值神經(jīng)網(wǎng)絡的輸出為對當前服務流程圖價值的估計;根據(jù)服務流程構(gòu)造的不同優(yōu)化目標來設計獎勵函數(shù),將其作為神經(jīng)網(wǎng)絡參數(shù)學習的信號,并使用基于策略梯度的方法來學習神經(jīng)網(wǎng)絡參數(shù)。本發(fā)明提供的基于強化學習的服務流程構(gòu)造方法能根據(jù)不同的流程構(gòu)造目標來學習流程構(gòu)造方法的參數(shù),并自動化挑選合適的服務實體來進行流程構(gòu)造。
聲明:
“基于強化學習的服務流程構(gòu)造方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)