本發(fā)明提出了基于深度強(qiáng)化學(xué)習(xí)的盾構(gòu)最優(yōu)自主掘進(jìn)控制方法。深度強(qiáng)化學(xué)習(xí)決策模塊根據(jù)觀測到的反饋的傳感器實(shí)測參數(shù),地質(zhì)前勘測量的參數(shù)以及從獎(jiǎng)勵(lì)函數(shù)模塊反饋的獎(jiǎng)勵(lì)函數(shù)值處理獲得總推進(jìn)力期望值和刀盤扭矩期望值;最優(yōu)控制模塊處理輸出總推進(jìn)力實(shí)際值和刀盤扭矩實(shí)際值;獎(jiǎng)勵(lì)函數(shù)模塊生成獎(jiǎng)勵(lì)函數(shù)值,反饋到通過深度強(qiáng)化學(xué)習(xí)決策模塊;最優(yōu)控制模塊輸出的總推進(jìn)力實(shí)際值和刀盤扭矩實(shí)際值施加到盾構(gòu)機(jī)上,通過盾構(gòu)環(huán)境交互模塊處理獲得經(jīng)過盾構(gòu)環(huán)境交互后的傳感器實(shí)測參數(shù)。本發(fā)明減輕盾構(gòu)司機(jī)的工作量,能夠?qū)崿F(xiàn)完全自主控制的基礎(chǔ)上提升綜合掘進(jìn)性能,同時(shí)實(shí)現(xiàn)掘進(jìn)參數(shù)的智能決策與長期綜合掘進(jìn)性能的多目標(biāo)動(dòng)態(tài)優(yōu)化,顯著提高綜合掘進(jìn)性能。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的盾構(gòu)最優(yōu)自主掘進(jìn)控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)