本發(fā)明提供的基于匹配學(xué)習(xí)的多標簽分類學(xué)習(xí)方法,首先對客戶端數(shù)據(jù)進行特征值計算,得到訓(xùn)練集;設(shè)定訓(xùn)練集中的正負標簽;然后計算訓(xùn)練集中特征集合的嵌入式表征E;計算正標簽的嵌入式表征Z+和負標簽的嵌入式表征Z?;接著對E和Z+作損失計算,對E與Z?作損失計算;依據(jù)正負損失值,采用梯度下降算法對訓(xùn)練集進行模型訓(xùn)練;當訓(xùn)練模型的損失值不再下降時,訓(xùn)練結(jié)束,否則再次訓(xùn)練;最后采用測試集測試該訓(xùn)練模型。本發(fā)明考慮了長尾標簽對傳統(tǒng)極大規(guī)模多標簽分類模型學(xué)習(xí)的不利影響,提出利用特征集合和標簽集合的匹配學(xué)習(xí)方法。此外,為保證模型能夠擴展到大規(guī)模數(shù)據(jù)集上,采用梯度下降算法的模型學(xué)習(xí)方式,既可保證模型并行化學(xué)習(xí),還可支持模型在線增量學(xué)習(xí)。
聲明:
“基于匹配學(xué)習(xí)的多標簽分類學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)