CN105760287A - 一种计算机系统错误的预测方法及装置 - Google Patents

一种计算机系统错误的预测方法及装置 Download PDF

Info

Publication number
CN105760287A
CN105760287A CN201610094567.9A CN201610094567A CN105760287A CN 105760287 A CN105760287 A CN 105760287A CN 201610094567 A CN201610094567 A CN 201610094567A CN 105760287 A CN105760287 A CN 105760287A
Authority
CN
China
Prior art keywords
class
mistake
sequence
prediction error
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610094567.9A
Other languages
English (en)
Other versions
CN105760287B (zh
Inventor
倪琼琳
刘羽
朱红
吕文静
金莲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610094567.9A priority Critical patent/CN105760287B/zh
Publication of CN105760287A publication Critical patent/CN105760287A/zh
Application granted granted Critical
Publication of CN105760287B publication Critical patent/CN105760287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种计算机系统错误的预测方法及装置,其中,该方法包括:对计算机历史上发生的系统错误进行分类,得到对应错误类;依据每个错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;确定与每个错误类对应的携带有对应错误类发生时间的含时符号,由全部错误类的含时符号组成历史错误类序列;利用错误类的条件概率建立转移概率矩阵;将与预设时刻发生的预测错误类对应的携带有预设时刻的含时符号加入历史错误类序列中,得到预测错误类序列;基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测错误类。由此,工作人员能够在预测错误类发生前做出防范措施,提高计算机的工作效率及工作可靠性。

Description

一种计算机系统错误的预测方法及装置
技术领域
本发明涉及计算机技术领域,更具体地说,涉及一种计算机系统错误的预测方法及装置。
背景技术
超级计算机在现代社会中扮演着重要的角色,其应用遍布于各行各业。自20世纪70年代诞生以来,超级计算机已经成为衡量一国科技实力的重要标志。对超级计算机本身的研究工作也越来越多,其中,对于超级计算机的系统错误研究一直是热点之一。超级计算机的系统错误是指超级计算机在运行过程中,导致作业终止或者停机的关键事件。
现有技术中,当出现超级计算机的系统错误时,通常需要由工作人员对系统错误进行分析并做出对应的解决措施,以保证超级计算机在系统错误解决之后能够正常运行。但是,发明人发现,在系统错误出现之后,再对其进行解决会大大影响超级计算机的工作效率及工作可靠性。
综上所述,现有技术中对超级计算机出现的系统错误的解决方法存在导致超级计算机的工作效率及工作可靠性较低的问题。
发明内容
本发明的目的是提供一种计算机系统错误的预测方法及装置,以在系统错误发生前对其进行预测,使得工作人员能够在系统错误发生前做出防范措施,解决了现有技术对超级计算机出现的系统错误的解决方法中存在的导致超级计算机的工作效率及工作可靠性较低的问题。
为了实现上述目的,本发明提供如下技术方案:
一种计算机系统错误的预测方法,包括:
对所述计算机历史上发生的系统错误进行分类,得到对应的错误类;
依据每个所述错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;
确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部所述错误类对应的含时符号组成历史错误类序列;
利用所述错误类的条件概率建立转移概率矩阵;
将与预设时刻发生的预测错误类对应的携带有所述预设时刻的含时符号加入所述历史错误类序列中,得到预测错误类序列;
基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类。
优选的,对所述计算机历史上发生的系统错误进行分类之前,还包括:
获取所述计算机的系统日志,所述系统日志包含有所述计算机历史上发生的系统错误;
对所述系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,并对所述符合预设要求的系统错误进行分类。
优选的,确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,包括:
确定与每个所述错误类对应的定位错误类的最佳定位技术;
确定与每个所述最佳定义技术对应的携带有所述错误类发生时间的含时符号;
对应的,基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类,包括:
基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,并确定所述预测最佳定位技术对应的错误类为所述预测错误类。
优选的,利用所述错误类的条件概率建立转移概率矩阵,包括:
建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,x=1,2,…,n,y=1,2,…,n。
优选的,基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,包括:
建立如下式的关系式:
Qn+1[C(t1),C(t2),…,C(tn+1)]=PQn[C(t1),C(t2),…,C(tn)]
其中,Qn[C(t1),C(t2),…,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),…,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
一种计算机系统错误的预测装置,包括:
分类模块,用于对所述计算机历史上发生的系统错误进行分类,得到对应的错误类;
时间确定模块,用于依据每个所述错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;
历史错误类序列组成模块,用于确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部所述错误类对应的含时符号组成历史错误类序列;
转移概率矩阵建立模块,用于利用所述错误类的条件概率建立转移概率矩阵;
预测错误类序列组成模块,用于将与预设时刻发生的预测错误类对应的携带有所述预设时刻的含时符号加入所述历史错误类序列中,得到预测错误类序列;
预测模块,用于基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类。
优选的,还包括:
预处理模块,用于获取所述计算机的系统日志,所述系统日志包含有所述计算机历史上发生的系统错误;并对所述系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,以使所述分类模块对所述符合预设要求的系统错误进行分类。
优选的,历史错误类序列组成模块包括:
含时符号确定单元,用于确定与每个所述错误类对应的定位错误类的最佳定位技术;并确定与每个所述最佳定义技术对应的携带有所述错误类发生时间的含时符号;
对应的,预测模块包括:
预测单元,用于基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,并确定所述预测最佳定位技术对应的错误类为所述预测错误类。
优选的,转移概率矩阵建立模块包括:
转移概率矩阵建立单元,用于建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,x=1,2,…,n,y=1,2,…,n。
优选的,预测单元包括:
关系式建立单元,用于建立如下式的关系式:
Qn+1[C(t1),C(t2),…,C(tn+1)]=PQn[C(t1),C(t2),…,C(tn)]
其中,Qn[C(t1),C(t2),…,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),…,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
本发明提供了一种计算机系统错误的预测方法及装置,其中,该方法包括:对所述计算机历史上发生的系统错误进行分类,得到对应的错误类;依据每个所述错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部所述错误类对应的含时符号组成历史错误类序列;利用所述错误类的条件概率建立转移概率矩阵;将与预设时刻发生的预测错误类对应的携带有所述预设时刻的含时符号加入所述历史错误类序列中,得到预测错误类序列;基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类。通过本申请公开的上述技术特征,利用历史上发生的系统错误,及系统错误的条件概率获取预设时刻对应的预测错误类,实验证明,通过上述技术方案能够准确快速的获取到预测错误类,由此,工作人员在预设时刻的预测错误类发生前针对预测错误类做出防范措施,从而很大程度上避免了预测错误类的发生,进而大大提高了计算机的工作效率及工作可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种计算机系统错误的预测方法的流程图;
图2为本发明实施例提供的一种计算机系统错误的预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种计算机系统错误的预测方法的流程图,其中,计算机可以是普通计算机,也可以是超级计算机,均在本发明的保护范围之内。上述方法具体可以包括以下步骤:
S11:对计算机历史上发生的系统错误进行分类,得到对应的错误类。
需要说明的是,对计算机历史上发生的系统错误进行分类可以依据与系统错误对应的描述对其进行分类,具体可以是将描述一致或者非常接近的系统错误分为一类,由此,能够得到多个错误类,且不同的错误类之间相互独立。其中,与系统错误对应的描述可以包括系统错误的类型、系统错误的引起原因以及系统错误的本质等,可以由工作人员根据实际需要进行确定,在此不做具体限定。
S12:依据每个错误类包含的系统错误的发生时间确定该错误类的错误类发生时间。
依据任一错误类包含的系统错误的发生时间确定该错误类的错误类发生时间,可以是由工作人员确定该错误类中最具代表性的系统错误对应的发生时间为错误类发生时间,也可以将该错误类包含的全部系统错误的发生时间的平均值作为错误类发生时间,还可以根据实际需要进行其他确定,均在本发明的保护范围之内。
S13:确定与每个错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部错误类对应的含时符号组成历史错误类序列。
确定与每个错误类对应的错误类发生时间之后,将含时符号按照对应错误类发生时间对其进行排序,如越早发生的错误类在历史错误类序列中的位置越靠前等。当然,还可以将错误类对应的描述及含时符号等加入预先设置的符号映射表中,由此,工作人员可通过查找符号映射表获取错误类的相关信息。
S14:利用错误类的条件概率建立转移概率矩阵。
S15:将与预设时刻发生的预测错误类对应的携带有预设时刻的含时符号加入历史错误类序列中,得到预测错误类序列。
其中,预设时刻即为未来某一时刻,具体可以由工作人员根据实际需要进行确定。通常情况下,当按照越早发生的错误类在历史错误类序列中的位置越靠前的原则获取到历史错误类序列时,预测错误类对应的含时符号可放置在历史错误类序列的最后,以得到预测错误类序列。
S16:基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测错误类。
得到与预设时刻对应的预测错误类,即为预测在预设时刻计算机会发生的系统错误。
通过本申请公开的上述技术特征,利用历史上发生的系统错误,及系统错误的条件概率获取预设时刻对应的预测错误类,即,对未来将发生的系统错误做出预测,实验证明,通过上述技术方案能够准确快速的获取到预测错误类,由此,工作人员在预设时刻的预测错误类发生前针对预测错误类做出防范措施,从而很大程度上避免了预测错误类的发生,进而大大提高了计算机的工作效率及工作可靠性。
另外,本发明提供的上述技术方案具有很强的普适性与可操作性,能够应用于所有计算机的系统错误的研究,为计算机的系统错误的研究提供了一个基础性的模型。
本发明实施例提供的一种计算机系统错误的预测方法中,对计算机历史上发生的系统错误进行分类之前,还可以包括:
获取计算机的系统日志,系统日志包含有计算机历史上发生的系统错误;
对系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,并对符合预设要求的系统错误进行分类。
其中,预设要求可以根据实际需要进行确定,如可以是其严重程度大于某预先设定的值的系统错误为符合预设要求的系统错误,由此,通过对系统错误进行的上述预处理,大大减少了系统错误的数量,提高了本发明实施例提供的上述技术方案的预测效率。另外,对于系统日志中包含的系统错误进行筛选,也可以认为是对系统日志进行筛选,从而得到符合预设要求的系统日志,而符合要求的系统日志中包含的系统错误即为符合预设要求的系统错误,具体可以利用如时空压缩法等手段实现。
本发明实施例提供的一种计算机系统错误的预测方法中,确定与每个错误类对应的携带有该错误类的错误类发生时间的含时符号,可以包括:
确定与每个错误类对应的定位错误类的最佳定位技术;
确定与每个最佳定义技术对应的携带有错误类发生时间的含时符号。
最佳定位技术即为对对应错误类进行定位时准确度最高的技术,如用Bj表示错误类,用Cj表示定位错误类Bj的最佳定位技术,Wj i表示备选技术Ti在定位错误类Bj时的准确度。显然,Cj=argmax{Wj i}。具体来说,t1,t2,…,tn-1可以表示过去时刻,tn表示现在时刻。通过与最佳定义技术对应的含时符号组成的历史错误类序列可以表示为:Qn[C(t1),C(t2),…,C(tn)],其中,C(tm)∈Cj,m=1,…,n。
对应的,基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测错误类,可以包括:
基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测最佳定位技术,并确定预测最佳定位技术对应的错误类为预测错误类。
由此,通过上述步骤可以得到与预测错误类对应的预测最佳定位技术,进而确定与预测最佳定位技术对应的错误类为预测错误类。即,通过上述步骤,并不直接计算得到预测错误类,而是通过预测最佳定位技术进而定位到预测错误类,由于通常即使是比较相近的系统错误,其对应的最佳定位技术的差别也很大,因此,通过确定预测最佳定位技术进而确定预测错误类的方式大大提高了本发明实施例提供的一种计算机系统错误的预测方法的准确度。
本发明实施例提供的一种计算机系统错误的预测方法中,利用错误类的条件概率建立转移概率矩阵,可以包括:
建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,即出现错误类x和出现错误类y之间并未出现过其他错误类,特别的,当x=y时,如P11表示连续两次出现错误类1的条件概率,x=1,2,…,n,y=1,2,…,n。具体来说,计算Pxy的方法如下:当时,其中,Sxy=sizeof(Cj|Cj=Cx,Cj+1=Cy);当时,根据遍历原理,假设每种错误类发生的概率相同,则Pxy=1/n。
另外,基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测最佳定位技术,可以包括:
建立如下式的关系式:
Qn+1[C(t1),C(t2),…,C(tn+1)]=PQn[C(t1),C(t2),…,C(tn)]
其中,Qn[C(t1),C(t2),…,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),…,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
其中,tn+1表示将来时刻,即预设时刻,预测错误类序列通过查普曼-柯尔莫哥洛夫方程(Chapman-KolmogorovEquation)与历史错误类序列及转移概率矩阵建立上述关系式,对该关系式进行代数迭代求解,就可以获得预设时刻对应的预测最佳定位技术,进而获取与预测最佳定位技术对应的预测错误类,从而实现了基于历史上的系统错误来预测未来某时刻,即预设时刻的系统错误的目的。
与上述方法实施例相对应,本发明实施例还提供了一种计算机系统错误的预测装置,如图2所示,可以包括:
分类模块11,用于对计算机历史上发生的系统错误进行分类,得到对应的错误类;
时间确定模块12,用于依据每个错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;
历史错误类序列组成模块13,用于确定与每个错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部错误类对应的含时符号组成历史错误类序列;
转移概率矩阵建立模块14,用于利用错误类的条件概率建立转移概率矩阵;
预测错误类序列组成模块15,用于将与预设时刻发生的预测错误类对应的携带有预设时刻的含时符号加入历史错误类序列中,得到预测错误类序列;
预测模块16,用于基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测错误类。
本发明实施例提供的一种计算机系统错误的预测装置中,还可以包括:
预处理模块,用于获取计算机的系统日志,系统日志包含有计算机历史上发生的系统错误;并对系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,以使分类模块对符合预设要求的系统错误进行分类。
本发明实施例提供的一种计算机系统错误的预测装置中,历史错误类序列组成模块可以包括:
含时符号确定单元,用于确定与每个错误类对应的定位错误类的最佳定位技术;并确定与每个最佳定义技术对应的携带有错误类发生时间的含时符号;
对应的,预测模块包括:
预测单元,用于基于历史错误类序列、转移概率矩阵及预测错误类序列进行计算,得到与预设时刻对应的预测最佳定位技术,并确定预测最佳定位技术对应的错误类为预测错误类。
本发明实施例提供的一种计算机系统错误的预测装置中,转移概率矩阵建立模块可以包括:
转移概率矩阵建立单元,用于建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,x=1,2,…,n,y=1,2,…,n。
本发明实施例提供的一种计算机系统错误的预测装置中,预测单元可以包括:
关系式建立单元,用于建立如下式的关系式:
Qn+1[C(t1),C(t2),…,C(tn+1)]=PQn[C(t1),C(t2),…,C(tn)]
其中,Qn[C(t1),C(t2),…,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),…,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
对于本发明实施例提供的一种计算机系统错误的预测装置中相关部分的说明请参见本发明实施例提供的一种计算机系统错误的预测方法中对应部分的详细说明,在此不再赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种计算机系统错误的预测方法,其特征在于,包括:
对所述计算机历史上发生的系统错误进行分类,得到对应的错误类;
依据每个所述错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;
确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部所述错误类对应的含时符号组成历史错误类序列;
利用所述错误类的条件概率建立转移概率矩阵;
将与预设时刻发生的预测错误类对应的携带有所述预设时刻的含时符号加入所述历史错误类序列中,得到预测错误类序列;
基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类。
2.根据权利要求1所述的方法,其特征在于,对所述计算机历史上发生的系统错误进行分类之前,还包括:
获取所述计算机的系统日志,所述系统日志包含有所述计算机历史上发生的系统错误;
对所述系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,并对所述符合预设要求的系统错误进行分类。
3.根据权利要求1所述的方法,其特征在于,确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,包括:
确定与每个所述错误类对应的定位错误类的最佳定位技术;
确定与每个所述最佳定义技术对应的携带有所述错误类发生时间的含时符号;
对应的,基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类,包括:
基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,并确定所述预测最佳定位技术对应的错误类为所述预测错误类。
4.根据权利要求3所述的方法,其特征在于,利用所述错误类的条件概率建立转移概率矩阵,包括:
建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,x=1,2,...,n,y=1,2,...,n。
5.根据权利要求4所述的方法,其特征在于,基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,包括:
建立如下式的关系式:
Qn+1[C(t1),C(t2),...,C(tn+1)]=PQn[C(t1),C(t2),...,C(tn)]
其中,Qn[C(t1),C(t2),...,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),...,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
6.一种计算机系统错误的预测装置,其特征在于,包括:
分类模块,用于对所述计算机历史上发生的系统错误进行分类,得到对应的错误类;
时间确定模块,用于依据每个所述错误类包含的系统错误的发生时间确定该错误类的错误类发生时间;
历史错误类序列组成模块,用于确定与每个所述错误类对应的携带有该错误类的错误类发生时间的含时符号,并由全部所述错误类对应的含时符号组成历史错误类序列;
转移概率矩阵建立模块,用于利用所述错误类的条件概率建立转移概率矩阵;
预测错误类序列组成模块,用于将与预设时刻发生的预测错误类对应的携带有所述预设时刻的含时符号加入所述历史错误类序列中,得到预测错误类序列;
预测模块,用于基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测错误类。
7.根据权利要求6所述的装置,其特征在于,还包括:
预处理模块,用于获取所述计算机的系统日志,所述系统日志包含有所述计算机历史上发生的系统错误;并对所述系统日志中包含的系统错误进行筛选,得到符合预设要求的系统错误,以使所述分类模块对所述符合预设要求的系统错误进行分类。
8.根据权利要求6所述的装置,其特征在于,历史错误类序列组成模块包括:
含时符号确定单元,用于确定与每个所述错误类对应的定位错误类的最佳定位技术;并确定与每个所述最佳定义技术对应的携带有所述错误类发生时间的含时符号;
对应的,预测模块包括:
预测单元,用于基于所述历史错误类序列、所述转移概率矩阵及所述预测错误类序列进行计算,得到与所述预设时刻对应的预测最佳定位技术,并确定所述预测最佳定位技术对应的错误类为所述预测错误类。
9.根据权利要求8所述的装置,其特征在于,转移概率矩阵建立模块包括:
转移概率矩阵建立单元,用于建立如下式的转移概率矩阵P:
P = P 11 P 12 ... P 1 n P 21 P 22 ... P 2 n ... ... ... ... P n 1 P n 2 ... P n n
其中,Pxy表示出现错误类x后出现错误类y的条件概率,x=1,2,...,n,y=1,2,...,n。
10.根据权利要求9所述的装置,其特征在于,预测单元包括:
关系式建立单元,用于建立如下式的关系式:
Qn+1[C(t1),C(t2),...,C(tn+1)]=PQn[C(t1),C(t2),...,C(tn)]
其中,Qn[C(t1),C(t2),...,C(tn)]表示历史错误类序列,Qn+1[C(t1),C(t2),...,C(tn+1)]表示预测错误类序列,C(tm)表示tm时刻对应的最佳定义技术C(tm),m=1,…,n。
CN201610094567.9A 2016-02-19 2016-02-19 一种计算机系统错误的预测方法及装置 Active CN105760287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610094567.9A CN105760287B (zh) 2016-02-19 2016-02-19 一种计算机系统错误的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610094567.9A CN105760287B (zh) 2016-02-19 2016-02-19 一种计算机系统错误的预测方法及装置

Publications (2)

Publication Number Publication Date
CN105760287A true CN105760287A (zh) 2016-07-13
CN105760287B CN105760287B (zh) 2018-03-20

Family

ID=56329805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610094567.9A Active CN105760287B (zh) 2016-02-19 2016-02-19 一种计算机系统错误的预测方法及装置

Country Status (1)

Country Link
CN (1) CN105760287B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110133539A (zh) * 2019-06-03 2019-08-16 北京中科奥创科技有限公司 Ups的健康度预测方法、系统和计算机可读存储介质
CN110161418A (zh) * 2019-06-03 2019-08-23 北京中科奥创科技有限公司 蓄电池的健康度预测方法、系统和计算机可读存储介质
CN110163451A (zh) * 2019-06-03 2019-08-23 北京中科奥创科技有限公司 暖通系统的健康度预测方法、系统和计算机可读存储介质
CN110175270A (zh) * 2019-06-03 2019-08-27 北京中科奥创科技有限公司 一种大数据处理方法、系统和计算机可读存储介质
CN110188961A (zh) * 2019-06-03 2019-08-30 北京中科奥创科技有限公司 配电系统的健康度预测方法、系统和计算机可读存储介质
CN112306831A (zh) * 2020-10-27 2021-02-02 苏州浪潮智能科技有限公司 计算集群错误预测方法及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073318A (zh) * 2009-11-17 2011-05-25 通用汽车环球科技运作公司 使用诊断故障代码马尔可夫链的故障诊断和预测
JP2011186520A (ja) * 2010-03-04 2011-09-22 Mitsubishi Electric Corp 画像処理シミュレーション方法及び画像処理シミュレーションプログラム
CN102222033A (zh) * 2011-06-20 2011-10-19 中兴通讯股份有限公司 一种保存小型计算机系统接口访问错误的方法及装置
US20140281745A1 (en) * 2013-03-14 2014-09-18 International Business Machines Corporation Tracking Errors In A Computing System

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073318A (zh) * 2009-11-17 2011-05-25 通用汽车环球科技运作公司 使用诊断故障代码马尔可夫链的故障诊断和预测
JP2011186520A (ja) * 2010-03-04 2011-09-22 Mitsubishi Electric Corp 画像処理シミュレーション方法及び画像処理シミュレーションプログラム
CN102222033A (zh) * 2011-06-20 2011-10-19 中兴通讯股份有限公司 一种保存小型计算机系统接口访问错误的方法及装置
US20140281745A1 (en) * 2013-03-14 2014-09-18 International Business Machines Corporation Tracking Errors In A Computing System
US9075902B2 (en) * 2013-03-14 2015-07-07 International Business Machines Corporation Tracking errors in a computing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田曲波等: ""超级计算机错误预测模型研究"", 《计算机工程与应用》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110133539A (zh) * 2019-06-03 2019-08-16 北京中科奥创科技有限公司 Ups的健康度预测方法、系统和计算机可读存储介质
CN110161418A (zh) * 2019-06-03 2019-08-23 北京中科奥创科技有限公司 蓄电池的健康度预测方法、系统和计算机可读存储介质
CN110163451A (zh) * 2019-06-03 2019-08-23 北京中科奥创科技有限公司 暖通系统的健康度预测方法、系统和计算机可读存储介质
CN110175270A (zh) * 2019-06-03 2019-08-27 北京中科奥创科技有限公司 一种大数据处理方法、系统和计算机可读存储介质
CN110188961A (zh) * 2019-06-03 2019-08-30 北京中科奥创科技有限公司 配电系统的健康度预测方法、系统和计算机可读存储介质
CN110133539B (zh) * 2019-06-03 2020-10-20 北京中科奥创科技有限公司 Ups的健康度预测方法、系统和计算机可读存储介质
CN112306831A (zh) * 2020-10-27 2021-02-02 苏州浪潮智能科技有限公司 计算集群错误预测方法及相关设备
CN112306831B (zh) * 2020-10-27 2022-12-27 苏州浪潮智能科技有限公司 计算集群错误预测方法及相关设备

Also Published As

Publication number Publication date
CN105760287B (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
CN105760287A (zh) 一种计算机系统错误的预测方法及装置
Khan et al. Diversity on corporate boards and firm performance: An empirical evidence from Malaysia
CN103106134B (zh) 一种性能缺陷检测方法、装置和系统
US20180276263A1 (en) Hierarchical index involving prioritization of data content of interest
CN105719073A (zh) 一种企业信用评价系统及方法
US20190095495A1 (en) Computerized methods and systems for grouping data using data streams
CN103473100A (zh) 一种基于依赖关系的Web服务替换方法
CN110222203A (zh) 元数据搜索方法、装置、设备及计算机可读存储介质
Cruz et al. Algorithm development for power system contingency screening and ranking using voltage-reactive power performance index
CN110990575A (zh) 测试用例失败原因分析方法、装置及电子设备
Wang et al. A resilient framework for fault handling in web service oriented systems
US8438155B1 (en) Impressions-weighted coverage monitoring for search results
US20200380037A1 (en) Information Retrieval Precision Evaluation Method, System and Device and Computer-Readable Storage Medium
CN103207804A (zh) 基于集群作业日志的MapReduce负载模拟方法
Destek et al. Military expenditure and economic growth in BRICS and MIST countries: Evidence from Bootstrap panel Granger causality analysis
Bhat et al. The validity of Okun’s Law: Evidences from Indian economy
Marsudi et al. Production line performance by using queuing model
CN114816804A (zh) 煤矿井下边缘计算系统的存储可靠性评估方法以及装置
CN115018124A (zh) 数据预测方法、系统、设备及存储介质
CN105607726A (zh) 一种降低高性能计算集群内存功耗的方法及装置
CN107944684B (zh) 数控装备故障组件重要度分析方法和装置
US20140164397A1 (en) Apparatus and method for searching information
Tariq Six Sigma based risk identification and mitigation framework for projects execution
CN113434193B (zh) 根因变更的定位方法和装置
Pantz PnL prediction under extreme scenarios

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant