本發(fā)明公開一種基于故障數據建模的HPC可靠性評估方法,包括以下步驟:對目標系統(tǒng)的所有故障單元,進行故障數據采集;基于故障嚴重等級,對采集到的故障數據進行故障分類,將故障數據分為嚴重故障數據與非嚴重故障數據;篩除與失效無關的非嚴重故障數據;選定時間區(qū)間,將該時間區(qū)間內的所有嚴重故障數據作為采樣樣本,采用最大似然估計法,計算weibull分布參數,獲得該時間區(qū)間內的目標系統(tǒng)的失效時間分布模型;計算時間區(qū)間上的目標系統(tǒng)的MTTF,即weibull分布的特征值;根據不同時間區(qū)間的目標系統(tǒng)的MTTF變化,評估目標系統(tǒng)的可靠性變化特征。本發(fā)明能夠真實反映系統(tǒng)運行中的可靠性指標,可以在線分析出系統(tǒng)在不同時間段的可靠性水平,指導系統(tǒng)容錯和日常運維。
聲明:
“基于故障數據建模的HPC可靠性評估方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)