本發(fā)明涉及一種基于DQN深度強化學(xué)習(xí)算法的單一水庫智能防洪調(diào)度方法,包括:構(gòu)建基于人工智能的水庫調(diào)度“無監(jiān)督深度學(xué)習(xí)”模型、以水庫發(fā)電調(diào)度為基礎(chǔ)建立DRL的獎勵反饋,以及基于水庫實測入庫徑流過程建立針對某水庫的調(diào)度人工智能專家。與動態(tài)規(guī)劃求解的最優(yōu)發(fā)電調(diào)度過程進行對比,本發(fā)明所述基于DQN深度強化學(xué)習(xí)算法的單一水庫智能防洪調(diào)度方法的發(fā)電調(diào)度結(jié)果,明顯優(yōu)于傳統(tǒng)的基于決策樹的水庫發(fā)電調(diào)度結(jié)果,說明本發(fā)明所述水庫調(diào)度“無監(jiān)督深度學(xué)習(xí)”模型具有很強大的學(xué)習(xí)能力和決策能力,在水庫調(diào)度決策中具有很強的適應(yīng)能力。
聲明:
“基于DQN深度強化學(xué)習(xí)算法的單一水庫智能防洪調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)