視覺關(guān)系通常表示為一個(gè)三元組<subject,predicate,object>,其中包含兩個(gè)物體subject和object及它們之間的交互動(dòng)作predicate。視覺關(guān)系學(xué)習(xí)是連通低水平的圖像感知任務(wù)和高水平的圖像認(rèn)知任務(wù)之間的一道橋梁,屬于中等水平的圖像理解任務(wù)。視覺關(guān)系實(shí)例學(xué)習(xí)是在給定圖像及對應(yīng)的視覺關(guān)系集合的情況下,確定每個(gè)視覺關(guān)系中涉及到的兩個(gè)物體實(shí)例的問題。本發(fā)明將該問題建模成兩個(gè)智能體關(guān)于subject和object的兩個(gè)實(shí)例搜索框在圖像上進(jìn)行搜索時(shí)的序列決策過程,從而提出了一種基于深度強(qiáng)化學(xué)習(xí)的視覺關(guān)系實(shí)例學(xué)習(xí)方法。對于給定的測試圖像及關(guān)聯(lián)的視覺關(guān)系集合,能夠快速準(zhǔn)確地找到每個(gè)視覺關(guān)系中subject和object物體所對應(yīng)的實(shí)例框。
聲明:
“基于強(qiáng)化學(xué)習(xí)的視覺關(guān)系實(shí)例學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)