CN105893208A - 基于隐半马尔可夫模型的云计算平台系统故障预测方法 - Google Patents

基于隐半马尔可夫模型的云计算平台系统故障预测方法 Download PDF

Info

Publication number
CN105893208A
CN105893208A CN201610195766.9A CN201610195766A CN105893208A CN 105893208 A CN105893208 A CN 105893208A CN 201610195766 A CN201610195766 A CN 201610195766A CN 105893208 A CN105893208 A CN 105893208A
Authority
CN
China
Prior art keywords
sequence
events
fault
cloud computing
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610195766.9A
Other languages
English (en)
Inventor
曹晖
寿黎但
张之宣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CITY CLOUD TECHNOLOGY (HANGZHOU) Co Ltd
Original Assignee
CITY CLOUD TECHNOLOGY (HANGZHOU) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CITY CLOUD TECHNOLOGY (HANGZHOU) Co Ltd filed Critical CITY CLOUD TECHNOLOGY (HANGZHOU) Co Ltd
Priority to CN201610195766.9A priority Critical patent/CN105893208A/zh
Publication of CN105893208A publication Critical patent/CN105893208A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3079Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by reporting only the changes of the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于隐半马尔可夫模型的云计算平台系统故障预测方法。具体步骤如下:从海量日志文件中提取错误事件,并错误事件赋予类型和时间信息;将同一错误事件的重复的报告合并为同一事件;将若干连续事件组合成事件序列,并根据是否对系统故障造成影响分成为故障相关事件序列和故障无关事件序列;根据序列似然值,对所有的事件序列进行聚类处理;在每一类内部进行噪声消除处理;分别计算实时提取出的事件序列与故障相关的HSMM和故障无关的HSMM的序列似然值,利用贝叶斯分类器,通过计算判断系统是否会发生故障。本发明基于机器学习的理论,实现了云计算平台的实时系统故障预测的功能,并能够提供准确的故障预测结果和更高的整体性能。

Description

基于隐半马尔可夫模型的云计算平台系统故障预测方法
技术领域
本发明涉及到云计算平台系统故障预测技术,特别是涉及一种基于隐半马尔可夫模型的云计算平台实时系统故障预测方法。
背景技术
在传统的云计算平台运维工作中,当系统出现故障时,运维人员往往需要花费一定的时间用来排查故障解决问题,这也导致了系统服务不稳定甚至是服务暂停。因此,提前对系统中可能发生的故障做出准确的预测,能够为系统运维人员预留出足够的故障反应时间,提前处理问题,从而避免系统故障的发生,对于提高系统服务的稳定性和运维工作的效率有着极大的意义。
云计算系统往往是一个大型松耦合的分布式系统集群,不同节点上的不同组件模块相互协同工作,共同对外提供服务。在计算机系统中,日志机制发挥着重要的作用,每个模块通过日志将系统中的动作和操作记录下来,其中包含着丰富的信息和数据。传统的运维方式通过系统运维人员查看日志文件的方式来分析整个系统的运行情况和服务情况。受限于人的时间和精力,这种方式造成日志中许多有用的信息被忽略,从而导致了数据的大量浪费。
在这样的背景下,当前在日志文件分析和数据挖掘方向的工作成为了研究热点,特别是对于大规模分布式系统下的故障预测的研究工作,具有巨大的实际应用价值。然而目前在大规模分布式系统下的故障预测领域仍然缺乏一个比较成熟可靠的解决方案。
发明内容
本发明的目的是提供一种基于隐半马尔可夫模型的云计算平台系统故障预测方法,实现了云计算平台的实时系统故障预测的功能,并能够提供准确的故障预测结果和更高的整体性能。
为解决上述问题,本发明实施例提供一种基于隐半马尔可夫模型的云计算平台系统故障预测方法,包括以下步骤:
根据日志数据提取错误事件;
根据是否对系统故障造成影响,把错误事件划分为故障相关事件序列和故障无关事件序列中;
分别训练处故障相关事件序列的隐半马尔可夫模型和故障无关事件序列的隐半马尔可夫模型,计算实时提取出的事件序列基于故障相关事件序列的隐半马尔可夫模型的序列似然值和故障无关事件序列的隐半马尔可夫模型的序列似然值,利用贝叶斯分类器判断系统未来是否会发生故障。
进一步地,所述根据日志数据提取错误事件步骤包括实时地对云计算平台生成的日志数据的进行处理,从非结构化的日志文件中将其中所包含的错误事件提取出来,将类似的错误事件记录合并,并对得到的错误事件赋予类型和时间信息,
进一步地,所述根据日志数据提取错误文件,其具体步骤如下:
从云平台中接收到日志数据之后,通过消息队列中间件,将每一条日志记录转化成为对应的消息;
在消息队列中间件中,只留下“ERROR”级别的日志记录,同时只保留日志记录的文本信息和时间戳信息;
基于编辑距离算法,将相似的错误事件记录合并分类,从而将所有的错误事件记录简化成为类型信息和时间戳的组合。
作为一种可实施方式,所述故障预测方法还包括将同一个错误事件的重复的报告合并为同一事件,该步骤采用时间窗的方法,将所有到达时间小于阈值ε的事件视为重复事件,并将之合并。
作为一种可实施方式,所述根据是否对系统故障造成影响,把错误事件划分为故障相关事件序列和故障无关事件序列,具体步骤如下:
根据时间窗口区间的设定,将同一窗口内所有错误事件组合成一个事件序列,并根据是否对系统故障造成影响,将事件序列划分成为故障相关事件序列和故障无关事件序列。
作为一种实施方式,所述故障预测方法还包括以下步骤:
计算不同的事件序列之间的序列似然值,将序列似然值作为相似度对所有的事件序列进行聚类;
在每一类内部进行噪声消除,得到精炼的事件序列。
作为一种实施方式,所述序列似然值以相异度矩阵的形式保存,D(i,j)代表的是Fi和Fj之间的相异度,其计算公式如下:
D ( i , j ) = | l o g [ P ( F i | M j ) ] + l o g [ P ( F j | M i ) ] 2 |
其中,Fi代表一个故障相关事件序列,Mi是基于一个Fi训练出来的一个小的隐半马尔可夫模型。
进一步地,所述在每一类内部进行噪声消除,得到代表该类别的事件序列,具体包括以下步骤:
在同一类的事件序列内,计算每个事件基于具体的每个隐半马尔可夫模型的先验概率;
在每个序列类别中,按照系统发生的时间将序列进行对齐操作,每个事件都根据所在时间被划分到指定的时间槽内;
以时间槽为单位,频率大于先验概率的事件即为故障相关事件,频率小于先验概率的事件则为故障无关事件,这些故障无关事件将被删除。
进一步地,所述利用贝叶斯分类器判断系统未来是否会发生故障,具体包括以下步骤:
将这两个序列似然值输入到贝叶斯分类器内,根据公式来进行预测判断,其计算公式如下:
l o g [ p ( 0 | λ F ) ] - l o g [ p ( 0 | λ F ‾ ) ] > l o g [ C F ‾ F - C F F ‾ C F F ‾ - C F F ] + l o g [ P ( F ‾ ) P ( F ) ]
其中,CFF表示错误的将故障相关事件序列判断成为故障无关事件序列所要的代价,P(F)表示发生系统故障的概率,P(0|λ)为计算得到的序列似然值;
当不等式成立时,将这个事件序列标记成为故障相关事件序列,当不等式不成立时,将事件序列标记为故障无关序列;
对域系统中实时产生的每个序列,实时计算判断,做出故障预测。
进一步地,对p(0|λF)取对数处理。
本方法由于采用以上所述的技术方案,其具有以下的优点:
与传统的故障预测技术所不同的是,本方法结合具体的云计算平台使用场景,基于隐半马尔可夫模型,以事件序列为单位进行分析。由于隐半马尔可夫模型是对于隐马尔可夫模型的一种扩展和改良,它将每个状态的驻留时间对于具体状态转移概率的影响纳入到模型中,从而克服了隐马尔可夫模型所存在的局限性,更加适合于实际云计算平台的系统故障预测的应用场景。同时本方法引入了贝叶斯分类理论将最后的预判问题转化成为分类问题,提高了预测结果的准确性。
本方法所有的数据来源于实际场景中的日志数据,其中包含着丰富的有效数据,同时本方法针对预测模型的特点,对日志数据进行了高效复杂地处理,从海量的数据中提取出真正有效的信息,提高了方法的可行性和预测结果的准确性。
本方法能够对于收集来的数据进行实时地计算处理,及时给出预测结果,为运维工作提供宝贵的反应时间,提高系统服务的稳定性和运维工作的效率。
附图说明
图1是本发明实施例的基于隐半马尔可夫模型的云计算平台实时系统故障预测方法的流程图;
图2是本发明实施例的故障预测的过程图。
具体实施方式
下面结合附图,通过具体实施例,对本发明的技术方案进行清楚、完整的描述。
如图1所示,本发明基于隐半马尔可夫模型(HSMM)的云计算平台实时系统故障预测方法通过对于云计算平台中的日志数据进行细致的处理分析,目的是能够将隐含在海量的日志数据中的丰富信息挖掘出来,从而能够对未来可能发生的系统故障做出准确的预测,保障系统服务的稳定性和延续性。具体步骤如下:
S100,实时地对云计算平台生成的日志数据的进行处理,从非结构化的日志文件中将其中所包含的错误事件提取出来,然后使用编辑距离算法将类似的错误事件记录合并,并对得到的错误事件赋予类型和时间信息。
步骤S100的主要作用是从海量的非结构化的数据中将其中的有效数据提取出来,组成事件,然后再将这些事件组合成为事件序列。具体的实时过程包括以下内容:
从云平台中接收到日志数据之后,通过消息队列中间件,将每一条日志记录转化成为对应的消息,在消息队列中,所有的日志记录被初步格式化成为消息,包括了日志的来源,日志内容,日志级别,事件信息等关键内容;
在消息队列中间件中,将所有的日志级别不是“ERROR”的日志记录过滤剔除,只留下“ERROR”的日志记录,同时只保留日志记录的文本信息和时间戳信息;
基于Levenshtein编辑距离算法,将相似的错误事件记录合并分类,从而将所有的错误事件记录简化成为类型信息和时间戳的组合。
S200,将这些记录中,将同一个错误事件的重复的报告合并为同一事件。
步骤S200的主要作用是将合并日志文件中的重复事件记录,由于在日志机制中,日志文件中可能会存在多条的记录,称为重复事件。对于重复事件的合并有许多研究和应用,根据系统的特点,本发明采用时间窗的方法,将所有到达时间小于一个阈值ε的事件视为重复事件,并将之合并。重复事件合并效果的好坏关键在于ε的取值,具体的取值应结合具体系统实验决定。
S300,根据具体的提取规则和时间窗大小,将若干个合并后连续的错误事件组合成为事件序列,并将事件序列划分成为故障相关事件序列和故障无关事件序列。
步骤S300的主要作用是将分散的错误事件记录绑定成为一个完整的事件序列,以事件序列为单位进行计算。在完成错误事件的提取之后,这一步的目的是将分散的错误事件组合成为事件序列。按照一定的时间窗口区间,将同一个窗口内的所有的错误事件串联起来成为一个事件序列,同时根据该序列是否导致了系统故障,将所有的事件序列划分成为故障相关事件序列和故障无关事件序列。所谓的故障相关事件序列是指在可能引起系统故障的系统错误事件的集合。
S400,计算不同的序列之间的“序列似然值”作为相似度,对所有的事件序列进行聚类。
步骤S400的目的是对得到的日志事件序列进行进一步的聚类处理,聚类的目的是为了将同一类的序列划分到一起。采用层次聚类的方法,使用序列似然值作为度量值来计算序列之间的相似度。
本发明根据实际应用,采用序列似然值作为相似度的度量值进行计算,并将序列似然值以相异度矩阵的形式保存。在本发明中,对象Fi代表一个故障相关事件序列,D(i,j)代表的是Fi和Fj之间的相异度,D(i,j)越小表示两个序列越相似,Mi是基于一个Fi训练出来的一个小的HSMM,训练的最终目标是不断地调整HSMM的各种参数,使得最终的序列似然值尽可能高。D(i,j)的计算公式如下:
D ( i , j ) = | l o g [ P ( F i | M j ) ] + l o g [ P ( F j | M i ) ] 2 |
其中P(Fi|Mj)表示Fi相对应与Mj的似然值,似然值越大表示Fi和Fj之间的相似程度越高,为了避免数据的颠簸,保证数值的稳定性,对计算结果进行取对数处理。
S500,在每一类内部进行噪声消除,通过对比计算,得到代表该类别的事件序列。
步骤S500的作用是对每一类中的事件序列进行噪声过滤处理,通过将各个类别中的事件序列的噪声剔除了,得到精炼的事件序列进行计算。
在系统故障发生之前,同一类的事件序列中,故障发生的错误事件出现的概率会明显的高于其他的故障无关事件序列。根据这一特点,事件序列的噪声消除工作具体实施过程包括了以下几个步骤:
在同一类的事件序列内,计算每个事件序列基于具体的每个HSMM的先验概率,先验概率值越高,则说明这个事件在系统故障发生前出现的概率越大;
在每个事件序列类别中,按照系统发生的时间将事件序列进行对齐操作,每个事件序列都根据所在时间被划分到指定的时间槽内;
以时间槽为单位,对每个时间槽内的所有事件序列里同一个事件发生的频率,将这个频率与先验概率相比,频率大于先验概率的即为故障相关事件,频率小于先验概率的则为故障无关事件,这些故障无关事件将被剔除。
S600,在训练阶段,将得到的事件序列分成故障相关序列和故障无关序列,分别训练出故障相关事件序列的HSMM和故障无关事件序列的HSMM。在线上的实时故障预测阶段,分别计算实时提取出的事件序列基于故障相关的HSMM的序列似然值和故障无关的HSMM的序列似然值,将两个序列似然值输入到贝叶斯分类器内,通过计算判断系统未来是否会发生故障。
步骤S600是最终的故障预测步骤,如图2所示,步骤6的具体实施过程如下所示:
首先计算出待检测的事件序列相对于故障相关HSMM和故障无关的HSMM的序列似然值,将这两个似然值输入到贝叶斯分类器内,根据公式:
l o g [ p ( 0 | λ F ) ] - l o g [ p ( 0 | λ F ‾ ) ] > l o g [ C F ‾ F - C F F ‾ C F F ‾ - C F F ] + l o g [ P ( F ‾ ) P ( F ) ]
来做最后的预测判断。当不等式成立时,将这个事件序列标记成为故障相关事件序列,当不等式不成立时,将事件序列标记为故障无关序列。其中P(0|λ)为计算得到的序列似然值,由观测值和HSMM唯一确定。对序列似然值取对数处理,能够避免序列似然值快速缩小从而导致值太小溢出的问题。其中CFF表示错误的将故障相关事件序列判断成为故障无关事件序列所要的代价,P(F)表示发生系统故障的概率。通过这样层层的计算,对域系统中实时产生的每个序列,可以高效地进行实时计算判断,做出故障预测。
本方法由于采用以上所述的技术方案,其具有以下的优点:
与传统的故障预测技术所不同的是,本方法结合具体的云计算平台使用场景,基于隐半马尔可夫模型,以事件序列为单位进行分析。由于隐半马尔可夫模型是对于隐马尔可夫模型的一种扩展和改良,它将每个状态的驻留时间对于具体状态转移概率的影响纳入到模型中,从而克服了隐马尔可夫模型所存在的局限性,更加适合于实际云计算平台的系统故障预测的应用场景。同时本方法引入了贝叶斯分类理论将最后的预判问题转化成为分类问题,提高了预测结果的准确性。
本方法所有的数据来源于实际场景中的日志数据,其中包含着丰富的有效数据,同时本方法针对预测模型的特点,对日志数据进行了高效复杂地处理,从海量的数据中提取出真正有效的信息,提高了方法的可行性和预测结果的准确性。
本方法能够对于收集来的数据进行实时地计算处理,及时给出预测结果,为运维工作提供宝贵的反应时间,提高系统服务的稳定性和运维工作的效率。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

Claims (10)

1.一种基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,包括以下步骤:
根据日志数据提取错误事件;
根据是否对系统故障造成影响,把错误事件划分为故障相关事件序列和故障无关事件序列;
分别训练处故障相关事件序列的隐半马尔可夫模型和故障无关事件序列的隐半马尔可夫模型,计算实时提取出的事件序列基于故障相关事件序列的隐半马尔可夫模型的序列似然值和故障无关事件序列的隐半马尔可夫模型的序列似然值,利用贝叶斯分类器判断系统未来是否会发生故障。
2.如权利要求1所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述根据日志数据提取错误事件步骤包括实时地对云计算平台生成的日志数据的进行处理,从非结构化的日志文件中将其中所包含的错误事件提取出来,将类似的错误事件记录合并,并对得到的错误事件赋予类型和时间信息。
3.如权利要求1或2所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述根据日志数据提取错误文件,其具体步骤如下:
从云平台中接收到日志数据之后,通过消息队列中间件,将每一条日志记录转化成为对应的消息;
在消息队列中间件中,只留下“ERROR”级别的日志记录,同时只保留日志记录的文本信息和时间戳信息;
基于编辑距离算法,将相似的错误事件记录合并分类,从而将所有的错误事件记录简化成为类型信息和时间戳的组合。
4.如权利要求1所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述故障预测方法还包括将同一个错误事件的重复的 报告合并为同一事件,该步骤采用时间窗的方法,将所有到达时间小于阈值ε的事件视为重复事件,并将之合并。
5.如权利要求1所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述根据是否对系统故障造成影响,把错误事件划分为故障相关事件序列和故障无关事件序列,具体步骤如下:
根据时间窗口区间的设定,将同一窗口内所有错误事件组合成一个事件序列,并根据是否对系统故障造成影响,将事件序列划分成为故障相关事件序列和故障无关事件序列。
6.如权利要求5所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述故障预测方法还包括以下步骤:
计算不同的事件序列之间的序列似然值,将序列似然值作为相似度对所有的事件序列进行聚类;
在每一类内部进行噪声消除,得到精炼的事件序列。
7.如权利要求6所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述序列似然值以相异度矩阵的形式保存,D(i,j)代表的是Fi和Fj之间的相异度,其计算公式如下:
其中,Fi代表一个故障相关事件序列,Mi是基于一个Fi训练出来的一个小的隐半马尔可夫模型。
8.如权利要求6所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述在每一类内部进行噪声消除,得到代表该类别的事件序列,具体包括以下步骤:
在同一类的事件序列内,计算每个事件基于具体的每个隐半马尔可夫模型的先验概率;
在每个序列类别中,按照系统发生的时间将序列进行对齐操作,每个事 件都根据所在时间被划分到指定的时间槽内;
以时间槽为单位,频率大于先验概率的事件即为故障相关事件,频率小于先验概率的事件则为故障无关事件,这些故障无关事件将被删除。
9.如权利要求1所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,所述利用贝叶斯分类器判断系统未来是否会发生故障,具体包括以下步骤:
将这两个序列似然值输入到贝叶斯分类器内,根据公式来进行预测判断,其计算公式如下:
其中,CFF表示错误的将故障相关事件序列判断成为故障无关事件序列所要的代价,P(F)表示发生系统故障的概率,P(0|λ)为计算得到的序列似然值;
当不等式成立时,将这个事件序列标记成为故障相关事件序列,当不等式不成立时,将事件序列标记为故障无关序列;
对域系统中实时产生的每个序列,实时计算判断,做出故障预测。
10.如权利要求8所述的基于隐半马尔可夫模型的云计算平台系统故障预测方法,其特征在于,对p(0|λF)取对数处理。
CN201610195766.9A 2016-03-31 2016-03-31 基于隐半马尔可夫模型的云计算平台系统故障预测方法 Pending CN105893208A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610195766.9A CN105893208A (zh) 2016-03-31 2016-03-31 基于隐半马尔可夫模型的云计算平台系统故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610195766.9A CN105893208A (zh) 2016-03-31 2016-03-31 基于隐半马尔可夫模型的云计算平台系统故障预测方法

Publications (1)

Publication Number Publication Date
CN105893208A true CN105893208A (zh) 2016-08-24

Family

ID=57014117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610195766.9A Pending CN105893208A (zh) 2016-03-31 2016-03-31 基于隐半马尔可夫模型的云计算平台系统故障预测方法

Country Status (1)

Country Link
CN (1) CN105893208A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085544A (zh) * 2017-04-19 2017-08-22 国家电网公司 一种系统错误定位方法及装置
CN107169243A (zh) * 2017-06-27 2017-09-15 电子科技大学 一种基于hsmm和经验模型的燃料电池故障预测方法
CN107239403A (zh) * 2017-07-27 2017-10-10 广州云测信息技术有限公司 一种问题定位方法和设备
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN107784115A (zh) * 2017-11-09 2018-03-09 福建省特种设备检验研究院 一种基于编辑距离算法的特种设备故障分析方法及系统
CN108038049A (zh) * 2017-12-13 2018-05-15 西安电子科技大学 实时日志控制系统及控制方法、云计算系统及服务器
CN108984362A (zh) * 2017-05-31 2018-12-11 北京京东尚科信息技术有限公司 日志采集方法及装置、存储介质、电子设备
CN109635098A (zh) * 2018-12-20 2019-04-16 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN109685217A (zh) * 2017-10-17 2019-04-26 博彦科技股份有限公司 数据处理方法、装置、存储介质和处理器
CN109885456A (zh) * 2019-02-20 2019-06-14 武汉大学 一种基于系统日志聚类的多类型故障事件预测方法及装置
CN110750455A (zh) * 2019-10-18 2020-02-04 北京大学 基于系统日志分析的智能在线自更新故障诊断方法和系统
CN111542846A (zh) * 2018-01-19 2020-08-14 株式会社日立制作所 故障预测系统和故障预测方法
CN111813587A (zh) * 2020-05-28 2020-10-23 国网山东省电力公司 一种软件接口评估及故障预警方法及系统
CN112000502A (zh) * 2020-08-11 2020-11-27 杭州安恒信息技术股份有限公司 海量错误日志的处理方法、装置、电子装置及存储介质
CN112955328A (zh) * 2018-11-01 2021-06-11 惠普发展公司,有限责任合伙企业 打印设备组件状态分类
CN114265930A (zh) * 2021-11-19 2022-04-01 国电南京自动化股份有限公司 一种基于事件抽取的低压用户故障报修合并处理方法
CN114676105A (zh) * 2022-03-29 2022-06-28 国家电网有限公司信息通信分公司 一种日志数据预处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080189567A1 (en) * 2006-10-18 2008-08-07 Goodnow Kenneth J System For Method Of Predicting Power Events In An Intermittent Power Environment And Dispatching Computational Operations Of An Integrated Circuit Accordingly
CN101888309A (zh) * 2010-06-30 2010-11-17 中国科学院计算技术研究所 在线日志分析方法
CN103218521A (zh) * 2013-03-25 2013-07-24 南通大学 基于隐半马尔科夫模型的设备状态动态自适应报警方法
CN103559584A (zh) * 2013-11-08 2014-02-05 浙江工商大学 一种基于物联网的城市安全事故溯源与风险预警方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080189567A1 (en) * 2006-10-18 2008-08-07 Goodnow Kenneth J System For Method Of Predicting Power Events In An Intermittent Power Environment And Dispatching Computational Operations Of An Integrated Circuit Accordingly
US7732949B2 (en) * 2006-10-18 2010-06-08 International Business Machines Corporation System for method of predicting power events in an intermittent power environment and dispatching computational operations of an integrated circuit accordingly
CN101888309A (zh) * 2010-06-30 2010-11-17 中国科学院计算技术研究所 在线日志分析方法
CN103218521A (zh) * 2013-03-25 2013-07-24 南通大学 基于隐半马尔科夫模型的设备状态动态自适应报警方法
CN103559584A (zh) * 2013-11-08 2014-02-05 浙江工商大学 一种基于物联网的城市安全事故溯源与风险预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FELIX SALFNER等: ""Using Hidden Semi-Markov Models for Effective Online Failure Prediction"", 《26TH IEEE INTERNATIONAL SYMPOSIUM ON RELIABLE DISTRIBUTED SYSTEMS》 *
高英举: ""新浪技术分享:我们如何扛下32亿条实时日志的分析处 ", 《HTTP://CLOUD.51CTO.COM/ART/201507/484338.HTM》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN107423190B (zh) * 2017-04-19 2020-09-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN107085544B (zh) * 2017-04-19 2020-04-17 国家电网公司 一种系统错误定位方法及装置
CN107085544A (zh) * 2017-04-19 2017-08-22 国家电网公司 一种系统错误定位方法及装置
CN108984362A (zh) * 2017-05-31 2018-12-11 北京京东尚科信息技术有限公司 日志采集方法及装置、存储介质、电子设备
CN107169243A (zh) * 2017-06-27 2017-09-15 电子科技大学 一种基于hsmm和经验模型的燃料电池故障预测方法
CN107169243B (zh) * 2017-06-27 2019-08-20 电子科技大学 一种基于hsmm和经验模型的燃料电池故障预测方法
CN107239403A (zh) * 2017-07-27 2017-10-10 广州云测信息技术有限公司 一种问题定位方法和设备
CN109685217A (zh) * 2017-10-17 2019-04-26 博彦科技股份有限公司 数据处理方法、装置、存储介质和处理器
CN107784115A (zh) * 2017-11-09 2018-03-09 福建省特种设备检验研究院 一种基于编辑距离算法的特种设备故障分析方法及系统
CN107784115B (zh) * 2017-11-09 2019-01-22 福建省特种设备检验研究院 一种基于编辑距离算法的特种设备故障分析方法及系统
CN108038049A (zh) * 2017-12-13 2018-05-15 西安电子科技大学 实时日志控制系统及控制方法、云计算系统及服务器
CN108038049B (zh) * 2017-12-13 2021-11-09 西安电子科技大学 实时日志控制系统及控制方法、云计算系统及服务器
CN111542846A (zh) * 2018-01-19 2020-08-14 株式会社日立制作所 故障预测系统和故障预测方法
CN111542846B (zh) * 2018-01-19 2023-08-29 株式会社日立制作所 故障预测系统和故障预测方法
CN112955328A (zh) * 2018-11-01 2021-06-11 惠普发展公司,有限责任合伙企业 打印设备组件状态分类
CN109635098A (zh) * 2018-12-20 2019-04-16 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN109635098B (zh) * 2018-12-20 2020-08-21 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN109885456A (zh) * 2019-02-20 2019-06-14 武汉大学 一种基于系统日志聚类的多类型故障事件预测方法及装置
CN110750455A (zh) * 2019-10-18 2020-02-04 北京大学 基于系统日志分析的智能在线自更新故障诊断方法和系统
CN111813587A (zh) * 2020-05-28 2020-10-23 国网山东省电力公司 一种软件接口评估及故障预警方法及系统
CN111813587B (zh) * 2020-05-28 2024-04-26 国网山东省电力公司 一种软件接口评估及故障预警方法及系统
CN112000502A (zh) * 2020-08-11 2020-11-27 杭州安恒信息技术股份有限公司 海量错误日志的处理方法、装置、电子装置及存储介质
CN114265930A (zh) * 2021-11-19 2022-04-01 国电南京自动化股份有限公司 一种基于事件抽取的低压用户故障报修合并处理方法
CN114676105A (zh) * 2022-03-29 2022-06-28 国家电网有限公司信息通信分公司 一种日志数据预处理方法及装置

Similar Documents

Publication Publication Date Title
CN105893208A (zh) 基于隐半马尔可夫模型的云计算平台系统故障预测方法
CN108038049B (zh) 实时日志控制系统及控制方法、云计算系统及服务器
CN105653444B (zh) 基于互联网日志数据的软件缺陷故障识别方法和系统
CN106202561B (zh) 基于文本大数据的数字化应急管理案例库构建方法及装置
CN107563426B (zh) 一种机车运行时序特征的学习方法
CN111858526B (zh) 基于信息系统日志的故障时间空间预测方法及系统
CN110166484A (zh) 一种基于LSTM-Attention网络的工业控制系统入侵检测方法
CN111652290B (zh) 一种对抗样本的检测方法及装置
CN113326244B (zh) 一种基于日志事件图和关联关系挖掘的异常检测方法
CN109034194A (zh) 基于特征分化的交易欺诈行为深度检测方法
CN109918505B (zh) 一种基于文本处理的网络安全事件可视化方法
CN101571853A (zh) 网络话题内容演化分析装置及分析方法
JP7103496B2 (ja) 関連スコア算出システム、方法およびプログラム
CN109472462A (zh) 一种基于多模型堆栈融合的项目风险评级方法及装置
CN111274814A (zh) 一种新型的半监督文本实体信息抽取方法
CN110263944A (zh) 一种多变量故障预测方法和装置
CN111949480A (zh) 一种基于组件感知的日志异常检测方法
CN110879881A (zh) 基于特征组分层和半监督随机森林的鼠标轨迹识别方法
CN107329770A (zh) 针对软件安全性bug修复的个性化推荐方法
CN113869285B (zh) 一种人群密度估计装置、方法和存储介质
CN114416479A (zh) 一种基于流外正则化的日志序列异常检测方法
Rijal et al. Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19.
KR20220134954A (ko) 오토인코더 앙상블 기반 이상행위 탐지 방법 및 시스템
CN115048873B (zh) 一种用于飞机发动机的剩余使用寿命预测系统
CN116545679A (zh) 一种工业情境安全基础框架及网络攻击行为特征分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824