本發(fā)明公開了一種基于動作采樣的強化學習知識圖譜推理方法。該發(fā)明針對傳統(tǒng)知識圖譜強化學習推理算法中表征能力不足、無效冗余動作選取以及無記憶組件問題,根據(jù)表示學習方法在數(shù)據(jù)集上的原始事實預測評分,針對性地選取適應性更強的表示學習方法來表示強化學習環(huán)境以增強算法表征能力;設計動作采樣器以減少智能體在游走過程中的無效冗余動作選擇;以LSTM為記憶組件,將歷史信息進行編碼以增加模型精度,這使得本算法可以在擺脫預訓練的情況下取得優(yōu)于基于路徑的推理算法的效果。該方法將智能體在環(huán)境中游走得到的路徑映射到三層LSTM策略網(wǎng)絡,通過動作采樣促進智能體選擇更有意義的路徑,最終實現(xiàn)較為準確的實體關系路徑學習。
聲明:
“基于動作采樣的強化學習知識圖譜推理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)