本發(fā)明公開了一種基于視覺描述語句的圖像檢索方法,包括:基于圖卷積深度學習網絡,構建視覺知識圖譜表征中節(jié)點與邊的信息傳遞模式,實現各語義單元特征的聚合與更新;結合注意力機制,采用多層級長短時記憶網絡對圖譜中聚合與更新后的各語義單元特征進行編碼用于圖像描述語句的生成;在強化學習的框架下,利用CIDEr分數和圖譜相似度,設計基于圖像描述語句的獎懲函數,并用于“圖像?圖譜”過程、“圖譜?語句”過程以及“圖像?圖譜?語句”過程的反饋調節(jié)與優(yōu)化,獲取圖像更細粒度的視覺描述語句并進行檢索,輸出與查詢圖像對應的目標檢索圖像。本發(fā)明提高了基于文字的圖像檢索在大規(guī)模數據集上利用的可行性。
聲明:
“基于視覺描述語句的圖像檢索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)