本申請(qǐng)公開了一種基于深度強(qiáng)化學(xué)習(xí)的四足機(jī)器人的步態(tài)訓(xùn)練方法、裝置、電子設(shè)備及介質(zhì)。本申請(qǐng)中,可以在模擬器中搭建環(huán)境、四足機(jī)器人模型以及傳感器模型;通過多源信息融合技術(shù)以及傳感器,獲取測(cè)量信號(hào),并估計(jì)機(jī)器人狀態(tài);利用環(huán)境模塊、機(jī)器人模型以及測(cè)量信號(hào),生成四足機(jī)器人的足端軌跡規(guī)劃和初始步態(tài)控制策略;基于深度強(qiáng)化學(xué)習(xí)算法對(duì)四足機(jī)器人的初始步態(tài)控制策略進(jìn)行策略提升,直至觸發(fā)策略提升結(jié)束條件。通過應(yīng)用本申請(qǐng)的技術(shù)方案,可以避免相關(guān)技術(shù)中存在的基于模型控制算法所導(dǎo)致的需要大量的手工調(diào)參,人工成本較高的問題。且訓(xùn)練得到的參數(shù)往往魯棒性較差,只能適用于某種固定的場(chǎng)景,難以應(yīng)付實(shí)際四足機(jī)器人的多種應(yīng)用任務(wù)的需求。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的四足機(jī)器人的步態(tài)訓(xùn)練方法、裝置、電子設(shè)備及介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)