本申請?zhí)峁┝艘环N基于深度強化學(xué)習(xí)的機器人自主尋源方法及裝置。所述方法包括:建立放射源計數(shù)衰減模型和放射源計數(shù)分布模型;基于實際環(huán)境,建立尋源模擬環(huán)境,所述尋源模擬環(huán)境包括探測器、放射源和屏蔽物;基于所述放射源計數(shù)衰減模型和放射源計數(shù)分布模型,利用所述探測器在所述尋源模擬環(huán)境中沿著不同路徑測量不同位置的所述放射源的放射性活度,并依據(jù)價值函數(shù),確定探測器在每個狀態(tài)下,不同動作對應(yīng)的價值函數(shù)值,多次訓(xùn)練后以建立深度強化學(xué)習(xí)模型;基于所述深度強化學(xué)習(xí)模型,在實際環(huán)境中找到放射源。
聲明:
“基于深度強化學(xué)習(xí)的機器人自主尋源方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)