本發(fā)明公開了屬于
新能源汽車優(yōu)化管理技術(shù)領(lǐng)域的一種基于深度強化學習的集群電動汽車充電行為優(yōu)化方法。本發(fā)明為基于雙延遲深度確定性策略梯度算法,實現(xiàn)對電動汽車的功率連續(xù)可調(diào)充電過程進行建模,訓(xùn)練智能體控制充電功率,優(yōu)化電動汽車充電行為,將分時電價高時的負荷向電價低時進行轉(zhuǎn)移,達到減少用戶充電開銷,平抑電網(wǎng)峰時負荷的目的;相較于傳統(tǒng)的優(yōu)化控制方法,TD3在速度和靈活性上優(yōu)勢明顯,且可以有效克服以往的強化學習方法動作空間離散、訓(xùn)練收斂困難、穩(wěn)定性差的問題。為增強智能體的泛化能力,本發(fā)明在原有狀態(tài)觀測上添加噪聲,模擬一組初始SOC不同,到達與駛離時間各異的電動汽車,并擴展到集群電動汽車充電行為控制。
聲明:
“基于深度強化學習的集群電動汽車充電行為優(yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)