本發(fā)明公開了一種基于課程強(qiáng)化學(xué)習(xí)的游戲跟隨方法和系統(tǒng),包括:獲取游戲接口,建立訓(xùn)練環(huán)境并定義課程導(dǎo)航任務(wù);采用策略梯度的強(qiáng)化學(xué)習(xí)算法訓(xùn)練策略;將地圖上所有可到達(dá)的點分別作為起點和目標(biāo)點對策略進(jìn)行測試。本發(fā)明通過對課程導(dǎo)航任務(wù)的訓(xùn)練,建立一種根據(jù)環(huán)境狀態(tài)直接給出動作指令的跟隨策略,解決了現(xiàn)有技術(shù)中跟隨靈活性差,對復(fù)雜地形適應(yīng)性差的問題。
聲明:
“基于課程強(qiáng)化學(xué)習(xí)的游戲跟隨方法和系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)