本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)算法SAC的目標(biāo)跟蹤方法、裝置及存儲(chǔ)介質(zhì),方法包括:獲取視頻數(shù)據(jù);在視頻數(shù)據(jù)的當(dāng)前幀中確定搜索區(qū)域位置和大??;判斷當(dāng)前幀是否為第一幀;響應(yīng)于當(dāng)前幀非第一幀,將當(dāng)前幀輸入預(yù)訓(xùn)練好的actor網(wǎng)絡(luò)模型進(jìn)行特征提取,得到輸出的預(yù)測(cè)框,根據(jù)所述預(yù)測(cè)框?qū)δ繕?biāo)進(jìn)行跟蹤;其中所述actor網(wǎng)絡(luò)模型的訓(xùn)練方法,包括:通過(guò)第一幀對(duì)actor、target_actor網(wǎng)絡(luò)進(jìn)行初始化,根據(jù)經(jīng)驗(yàn)池中存儲(chǔ)的數(shù)據(jù),通過(guò)actor、critic網(wǎng)絡(luò)計(jì)算動(dòng)作,計(jì)算actor、critic1、critic2網(wǎng)絡(luò)損失,利用強(qiáng)化學(xué)習(xí)SAC算法更新網(wǎng)絡(luò)權(quán)值。將目標(biāo)跟蹤問(wèn)題轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)算法中在線決策的問(wèn)題,并且本發(fā)明只需要少量數(shù)據(jù)集,充分利用現(xiàn)有技術(shù),提升訓(xùn)練速度。
聲明:
“基于強(qiáng)化學(xué)習(xí)算法SAC的目標(biāo)跟蹤方法、裝置及存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)