本發(fā)明提供一種基于強(qiáng)化學(xué)習(xí)的機(jī)器人多目標(biāo)搜索路徑規(guī)劃方法和裝置。方法包括:對(duì)機(jī)器人進(jìn)行目標(biāo)搜索的地圖信息和狀態(tài)信息進(jìn)行初始化;指示機(jī)器人按照第一搜索模式開始目標(biāo)搜索,并同時(shí)啟動(dòng)搜索計(jì)時(shí);第一搜索模式包括規(guī)則搜索模式、隨機(jī)搜索模式;判斷機(jī)器人是否在其當(dāng)前探測(cè)范圍區(qū)域搜索到目標(biāo);若為否,則指示機(jī)器人繼續(xù)按照第一搜索模式執(zhí)行目標(biāo)搜索;若為是,則指示機(jī)器人按照第二搜索模式執(zhí)行目標(biāo)搜索;第二搜索模式為:先根據(jù)機(jī)器人的環(huán)境狀態(tài),基于強(qiáng)化學(xué)習(xí)算法獲得機(jī)器人的狀態(tài)?動(dòng)作對(duì)的評(píng)價(jià)值,再根據(jù)獲得的機(jī)器人的狀態(tài)?動(dòng)作對(duì)的評(píng)價(jià)值確定機(jī)器人執(zhí)行的下一個(gè)動(dòng)作。本發(fā)明提供的技術(shù)方案可以有效提高機(jī)器人對(duì)多目標(biāo)搜索的速度和精度。
聲明:
“基于強(qiáng)化學(xué)習(xí)的機(jī)器人多目標(biāo)搜索路徑規(guī)劃方法和裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)