本發(fā)明公開了一種基于SHAP值構建可解釋的XGBoost回歸模型加速發(fā)現高PCE的N?P類有機敏化劑的QSPR方法及系統(tǒng),建立數據集樣本;切分分子片段;Chem3D優(yōu)化分子;生成描述符;隨機劃分訓練集和測試集;利用SHAP嵌套XGBoost篩選變量,選出XGBoost建模的最優(yōu)變量子集;用XGBoost回歸建立N?P類有機敏化劑的快速預報模型;根據建立的模型,快速預報測試集染料分子的PCE。根據SHAP反饋的對目標特征的影響和參考文獻解釋描述符,對應分子片段的結構,構建QSPR模型;python生成大量虛擬樣本,利用建好的XGBoost模型進行預報。本發(fā)明基于可靠的文獻真實值和建模方法,所建的N?P類有機敏化劑的XGBoost預報模型具有方便快捷,無化學污染的優(yōu)點。
聲明:
“基于SHAP值構建可解釋的XGBoost回歸模型預測PCE的QSPR方法及其系統(tǒng)” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)