本發(fā)明公開了一種基于強化學(xué)習(xí)訓(xùn)練施工管理決策模型的方法,包括:獲取目標(biāo)施工項目的初始施工參數(shù)和所述目標(biāo)施工項目所在地區(qū)的歷史環(huán)境參數(shù);其中,所述目標(biāo)施工項目為待規(guī)劃工人工時和物料購買量的施工項目;以所述初始施工參數(shù)和所述歷史環(huán)境參數(shù)為基礎(chǔ)數(shù)據(jù)構(gòu)造出施工項目模擬器;根據(jù)所述施工項目模擬器模擬出與施工過程相關(guān)的觀測軌跡、行動軌跡、狀態(tài)軌跡和激勵序列;根據(jù)所述觀測軌跡、所述行動軌跡、所述狀態(tài)軌跡和所述激勵序列對預(yù)設(shè)結(jié)構(gòu)的決策模型進行優(yōu)化,以使優(yōu)化后的決策模型可用于規(guī)劃工人工時和物料購買量。本發(fā)明還公開了一種基于強化學(xué)習(xí)規(guī)劃工人工時和物料購買量的方法、一種施工項目模擬器以及一種計算機可讀存儲介質(zhì)。
聲明:
“基于強化學(xué)習(xí)訓(xùn)練施工管理決策模型的方法和介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)