本發(fā)明涉及一種基于動態(tài)模型強(qiáng)化學(xué)習(xí)的倒水服務(wù)機(jī)器人控制方法,包括:步驟1:基于深度相機(jī)獲取三維空間的視覺信息;步驟2:利用深度神經(jīng)網(wǎng)絡(luò)完成對機(jī)器人、源容器和目標(biāo)容器的識別,同時獲得源容器、目標(biāo)容器之間的相對位置信息、液體類型以及液位高度信息,完成狀態(tài)信息的獲取;步驟3:根據(jù)步驟2獲取的信息建立動態(tài)模型模擬當(dāng)前環(huán)境,并利用動態(tài)模型對策略網(wǎng)絡(luò)進(jìn)行訓(xùn)練;步驟4:待策略網(wǎng)絡(luò)收斂后,將機(jī)器人的位姿信息和狀態(tài)信息輸入至策略網(wǎng)絡(luò),輸出機(jī)器人動作策略;步驟5:使用步驟4預(yù)測出的機(jī)器人動作策略驅(qū)動機(jī)器人完成倒水動作。與現(xiàn)有技術(shù)相比,本發(fā)明具有對環(huán)境的泛化適應(yīng)能力強(qiáng)、部署復(fù)雜度低等優(yōu)點(diǎn)。
聲明:
“基于動態(tài)模型強(qiáng)化學(xué)習(xí)的倒水服務(wù)機(jī)器人控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)