本申請(qǐng)?zhí)峁┮环N控制方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備。本申請(qǐng)實(shí)施例提供的控制方法,通過(guò)獲取用于表征待控設(shè)備物理狀態(tài)的狀態(tài)檢測(cè)參數(shù),并將狀態(tài)檢測(cè)參數(shù)輸入至預(yù)設(shè)強(qiáng)化深度學(xué)習(xí)模型中,以確定與狀態(tài)檢測(cè)參數(shù)相對(duì)應(yīng)的控制指令,其中,該預(yù)設(shè)強(qiáng)化深度學(xué)習(xí)模型是通過(guò)實(shí)際測(cè)量值所構(gòu)成的第一數(shù)據(jù)樣本集以及根據(jù)預(yù)設(shè)仿真模型與第一數(shù)據(jù)樣本集所確定的仿真模擬值所構(gòu)成的第二數(shù)據(jù)樣本集進(jìn)行訓(xùn)練得到的,從而使得基于真實(shí)數(shù)據(jù)以及模擬數(shù)據(jù)相結(jié)合所得到的強(qiáng)化深度學(xué)習(xí)模型所確定的學(xué)習(xí)策略的分布更接近真實(shí)策略分布,提高基于該深度強(qiáng)化學(xué)習(xí)模型所確定的控制指令與實(shí)際情況的匹配度。
聲明:
“控制方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)