一種基于深度強(qiáng)化學(xué)習(xí)的加速器束流軌道控制方法及系統(tǒng),其用于將加速器的束流軌道控制在目標(biāo)狀態(tài),所述方法利用訓(xùn)練數(shù)據(jù)采用深度強(qiáng)化學(xué)習(xí)方法對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,存儲(chǔ)訓(xùn)練完的深度神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)及軌道控制策略的經(jīng)驗(yàn)數(shù)據(jù);利用束流位置監(jiān)測(cè)器在線獲取束流軌道的狀態(tài)數(shù)據(jù),將其饋入到所述深度深度神經(jīng)網(wǎng)絡(luò),將所述深度神經(jīng)網(wǎng)絡(luò)的輸出耦接到束流軌道校正器;載入所述訓(xùn)練完的深度神經(jīng)網(wǎng)絡(luò)的權(quán)重?cái)?shù)據(jù)及軌道控制策略的經(jīng)驗(yàn)數(shù)據(jù),所述深度神經(jīng)網(wǎng)絡(luò)通過(guò)預(yù)測(cè)控制并進(jìn)行在線強(qiáng)化學(xué)習(xí)調(diào)整控制參數(shù)將束流軌道自適應(yīng)穩(wěn)定控制在目標(biāo)狀態(tài)。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的加速器束流軌道控制方法及系統(tǒng)” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)