本發(fā)明公開(kāi)了一種結(jié)合高斯過(guò)程與強(qiáng)化學(xué)習(xí)的服務(wù)組合方法,包括如下步驟:1、將服務(wù)組合問(wèn)題建模為一個(gè)四元組馬爾可夫決策過(guò)程;2、應(yīng)用基于Q?learning的強(qiáng)化學(xué)習(xí)方法求解四元組馬爾可夫決策過(guò)程,得到最優(yōu)策略;其中通過(guò)建立Q值高斯預(yù)測(cè)模型來(lái)對(duì)Q值進(jìn)行更新;3、將最優(yōu)策略映射為web服務(wù)組合的工作流。該方法使用高斯過(guò)程對(duì)Q值的學(xué)習(xí)進(jìn)行建模,從而使其具有更好的精確性和泛化性。
聲明:
“結(jié)合高斯過(guò)程與強(qiáng)化學(xué)習(xí)的服務(wù)組合方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)