本發(fā)明公開了一種乒乓球機(jī)器人靈活擊球策略的實(shí)現(xiàn)方法,方法包括:在仿真環(huán)境下通過(guò)自監(jiān)督學(xué)習(xí)方法訓(xùn)練出乒乓球軌跡的特征提取器;自監(jiān)督學(xué)習(xí)方法的任務(wù)包括異常軌跡的修正與軌跡預(yù)測(cè);將特征提取器遷移至現(xiàn)實(shí)環(huán)境中進(jìn)行遷移式學(xué)習(xí)以對(duì)特征提取器進(jìn)行再訓(xùn)練;遷移式學(xué)習(xí)的數(shù)據(jù)標(biāo)簽是通過(guò)采集的乒乓球軌跡與物理學(xué)分析得出的真實(shí)乒乓球軌跡;將特征提取器應(yīng)用于強(qiáng)化學(xué)習(xí)中,得到擊球策略;強(qiáng)化學(xué)習(xí)中,針對(duì)組成一個(gè)完整乒乓球軌跡的四個(gè)軌跡階段分別設(shè)置獎(jiǎng)賞;擊球策略直接輸出乒乓球機(jī)器人的關(guān)節(jié)位置。本發(fā)明結(jié)合了自監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)以及遷移學(xué)習(xí),可大幅降低機(jī)器人與現(xiàn)實(shí)環(huán)境交互次數(shù),提升機(jī)器人擊球策略靈活性。
聲明:
“乒乓球機(jī)器人靈活擊球策略的實(shí)現(xiàn)方法、系統(tǒng)及存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)