本發(fā)明公開了一種通過強化學(xué)習(xí)訓(xùn)練書法機器人的方法。該方法包括:獲取目標(biāo)書法作品圖片,并輸入到卷積神經(jīng)網(wǎng)絡(luò)進行特征提取,獲得圖像預(yù)處理結(jié)果;構(gòu)建深度強化學(xué)習(xí)模型,該深度強化學(xué)習(xí)模型的智能體輸出用于控制機器人書寫的指令,環(huán)境的狀態(tài)觀測量是圖像預(yù)處理結(jié)果;智能體根據(jù)輸入的狀態(tài)觀測量和獎賞,通過隨機梯度下降進行訓(xùn)練,其中獎賞反映機器人書法作品和目標(biāo)書法作品之間的匹配程度,并且訓(xùn)練過程中,機器人書寫的書法作品也作為環(huán)境的狀態(tài)觀測量。利用本發(fā)明訓(xùn)練的書法機器人不需要人類預(yù)先設(shè)置書寫動作,就能自動學(xué)習(xí)書法作品與書寫動作之間聯(lián)系,書寫出與目標(biāo)書法作品匹配度更高的作品。
聲明:
“通過強化學(xué)習(xí)訓(xùn)練書法機器人的方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)