本申請(qǐng)實(shí)施例提供了一種博弈決策方法和系統(tǒng)。該博弈決策方法包括服務(wù)器端基于預(yù)先訓(xùn)練好的環(huán)境預(yù)測(cè)模型,根據(jù)不完美信息環(huán)境已知狀態(tài)的數(shù)據(jù)對(duì)所述不完美信息環(huán)境未知狀態(tài)的數(shù)據(jù)進(jìn)行預(yù)測(cè),得到所述不完美信息環(huán)境未知狀態(tài)的數(shù)據(jù)的有效預(yù)測(cè)結(jié)果;所述服務(wù)器端基于強(qiáng)化學(xué)習(xí)模型,根據(jù)所述不完美信息環(huán)境已知狀態(tài)的數(shù)據(jù)和所述不完美信息環(huán)境未知狀態(tài)的數(shù)據(jù)的所述有效預(yù)測(cè)結(jié)果做出有效決策。該博弈決策方法能夠根據(jù)不完美信息環(huán)境已知狀態(tài)的數(shù)據(jù)對(duì)不完美信息環(huán)境未知狀態(tài)的數(shù)據(jù)進(jìn)行預(yù)測(cè),以便做出有效決策。
聲明:
“博弈決策方法和系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)