本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種面向模擬推演的主動式序列決策方法、裝置和介質(zhì),該方法包括如下步驟:步驟1,面向大規(guī)模強(qiáng)化學(xué)習(xí)的系統(tǒng)狀態(tài)劃分;步驟2,模擬推演環(huán)境的持續(xù)數(shù)據(jù)采集;步驟3,基于流數(shù)據(jù)的實時狀態(tài)預(yù)測與判斷;步驟4,啟動基于多主體多目標(biāo)強(qiáng)化學(xué)習(xí)的決策。本發(fā)明有以下優(yōu)點(diǎn):(1)為模擬推演系統(tǒng)提供主動式?jīng)Q策支持,可以避免或延緩未來某一異常狀態(tài)的發(fā)生;(2)通過并行算法支持大規(guī)模多主體多目標(biāo)強(qiáng)化學(xué)習(xí)。基于這些優(yōu)點(diǎn)更好地解決了如何高效地在模擬推演環(huán)境中尋求可以避免損失的優(yōu)化序列決策,從而指導(dǎo)現(xiàn)實環(huán)境中決策的問題。
聲明:
“面向模擬推演的主動式序列決策方法、裝置和介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)