本發(fā)明提供一種基于強化學習的對抗性視頻時刻檢索方法、裝置、計算機設備和存儲介質(zhì),輸入完整視頻和查詢語句作為強化學習代理的環(huán)境信息;提取所述環(huán)境信息的查詢語句特征、全局視頻特征、位置特征和局部視頻特征構(gòu)成當前的視頻時刻片段的狀態(tài);所述強化學習代理根據(jù)所述狀態(tài)作出在所述時序邊界移動的動作,獲取執(zhí)行所述動作的獎勵以及根據(jù)所述獎勵輸出若干個更新的時序邊界和局部視頻特征,所述時序邊界為更新后當前的視頻時刻候選片段;通過貝葉斯個性化排序方法對所述時序邊界和所述查詢語句進行匹配,輸出匹配分值,并將所述匹配分值作為獎勵返回所述強化學習代理;通過對抗學習相互增強,直到收斂,得到對應所述查詢語句的視頻時刻片段。
聲明:
“基于強化學習的對抗性視頻時刻檢索方法、裝置、計算機設備和存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)