本發(fā)明提供一種基于智能分析的海量數據樣本增量分析方法,包括如下步驟:步驟1、利用原始訓練數據集D學習出當前分類器C;步驟2、用當前分類器對未標注類別標簽的新增訓練集T進行分類,針對每一個未標記的新增訓練樣例,利用Q一學習算法計算其Q值,從T中選擇有利于提高當前分類器精度的新增訓練實例,并賦予其標簽CP,添加到訓練集D中;步驟3、利用新增樣本修正分類器參數,直到新增訓練集T中的全部實例加入訓練集D中。本發(fā)明的有益效果是:利用強化學習中經典的Q學習來合理選擇樣本增量序列,削弱噪聲數據的負面影響。
聲明:
“基于智能分析的海量數據樣本增量分析方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)