一種基于強(qiáng)化學(xué)習(xí)的多用戶圖像數(shù)據(jù)自適應(yīng)處理方法包括:分析多用戶輸出中存在的輸出遮擋問題,針對(duì)輸出遮擋問題設(shè)計(jì)輸出策略;對(duì)輸出控制問題進(jìn)行建模得到自適應(yīng)圖像輸出控制模型,根據(jù)輸出策略設(shè)置行為動(dòng)作及相應(yīng)的獎(jiǎng)勵(lì)函數(shù);在移動(dòng)設(shè)備端收集環(huán)境信息,智能體與環(huán)境進(jìn)行不斷地交互,進(jìn)行強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)輸出策略的自適應(yīng)生成;移動(dòng)設(shè)備接收到輸出信息指令后收集狀態(tài)信息;若當(dāng)前狀態(tài)信息符合輸出策略,則直接輸出;若不符合輸出策略,則按照最終的輸出控制模型輸出的動(dòng)作進(jìn)行調(diào)整,將調(diào)整后的對(duì)象進(jìn)行輸出。本發(fā)明利用強(qiáng)化學(xué)習(xí)通過與環(huán)境的不斷交互自適應(yīng)的學(xué)習(xí)到所求的策略,避免隱私信息的泄露同時(shí)增加模型學(xué)習(xí)的信息量,從而增強(qiáng)模型的魯棒性。
聲明:
“基于強(qiáng)化學(xué)習(xí)的多用戶圖像數(shù)據(jù)自適應(yīng)處理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)