本發(fā)明涉及一種基于強化學習的變電站內(nèi)巡檢機器人路徑規(guī)劃方案,該方案針對變電站巡檢場景,在獲取實際變電站環(huán)境信息之后,通過柵格法建立變電站環(huán)境模型,并采用SARSA算法設(shè)計巡檢機器人路徑規(guī)劃方案,以貪婪策略代替Q?learning中的貪婪策略,通過更為保守的路徑規(guī)劃,減少巡檢機器人與障礙物發(fā)生碰撞的概率,大大延長其使用壽命。此外,通過對SARSA算法中獎賞的設(shè)計,減少機器人到達同一個巡檢點位的次數(shù),保證機器人快速高效地完成巡檢任務(wù)。與現(xiàn)有技術(shù)相比,本發(fā)明能夠?qū)崿F(xiàn)以巡檢機器人為主體的自主路徑選擇與安全避障,達到性能的快速高效收斂,對場景的適應(yīng)能力更強,業(yè)務(wù)性能更優(yōu)。
聲明:
“基于強化學習的變電站內(nèi)巡檢機器人路徑規(guī)劃方案” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)