本發(fā)明實(shí)施例提供了一種用于環(huán)境監(jiān)測(cè)與控制的強(qiáng)化學(xué)習(xí)方法及系統(tǒng),方法包括:將現(xiàn)場(chǎng)實(shí)際環(huán)境映射為學(xué)習(xí)模型,所述學(xué)習(xí)模型是根據(jù)所述現(xiàn)場(chǎng)實(shí)際環(huán)境中智能體的狀態(tài)、動(dòng)作以及學(xué)習(xí)目標(biāo)建立的;基于強(qiáng)化學(xué)習(xí)后的所述學(xué)習(xí)模型,對(duì)所述實(shí)際環(huán)境進(jìn)行監(jiān)測(cè)與控制,其中,所述強(qiáng)化學(xué)習(xí)后的所述學(xué)習(xí)模型是通過(guò)在線的全連接深度網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)得到的。本發(fā)明實(shí)施例提供的一種用于環(huán)境監(jiān)測(cè)與控制的強(qiáng)化學(xué)習(xí)方法及系統(tǒng),通過(guò)在線的全連接深度網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)方法智能實(shí)時(shí)對(duì)環(huán)境進(jìn)行監(jiān)測(cè)與控制,滿足不同環(huán)境下的不同需求,降低運(yùn)行成本具有自適應(yīng)和預(yù)測(cè)能力,可應(yīng)對(duì)各種復(fù)雜的展廳環(huán)境。
聲明:
“用于環(huán)境監(jiān)測(cè)與控制的強(qiáng)化學(xué)習(xí)方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)