本發(fā)明公開了一種連通性保持的多機導航方法、系統(tǒng)及介質,方法包括:根據強化學習框架確定導航策略元素;導航策略元素包括觀測數據、共享策略數據、速度控制信號、獎勵信號和全局連通性信號;根據導航策略元素,構建導航策略學習模型;獲取專家策略數據,結合模仿學習對導航策略學習模型進行策略去最小化處理;根據策略去最小化處理的結果,完成策略優(yōu)化。本發(fā)明針對未知復雜的導航環(huán)境,提出以原始距離測量的環(huán)境感知數據作為輸入的多機導航策略。通過強化學習方法,機器人在訓練過程中自主學習導航多機的策略,并在連通性約束下避免個體機器人脫離隊伍,可廣泛應用于移動機器人技術領域。
聲明:
“連通性保持的多機導航方法、系統(tǒng)及介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)