CN108664374A - 故障告警模型创建方法、装置、故障告警方法及装置 - Google Patents

故障告警模型创建方法、装置、故障告警方法及装置 Download PDF

Info

Publication number
CN108664374A
CN108664374A CN201810476298.1A CN201810476298A CN108664374A CN 108664374 A CN108664374 A CN 108664374A CN 201810476298 A CN201810476298 A CN 201810476298A CN 108664374 A CN108664374 A CN 108664374A
Authority
CN
China
Prior art keywords
fault warning
term vector
warning
daily record
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810476298.1A
Other languages
English (en)
Other versions
CN108664374B (zh
Inventor
叶茂
李靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810476298.1A priority Critical patent/CN108664374B/zh
Publication of CN108664374A publication Critical patent/CN108664374A/zh
Application granted granted Critical
Publication of CN108664374B publication Critical patent/CN108664374B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明提供一种故障告警模型创建方法,其包括:获取多个告警信息样本,并根据告警信息样本采集对应的至少一个故障告警日志;使用词向量化工具,对故障告警日志中每个单词进行词向量化操作,以获取故障告警日志中每个单词的词向量信息;对故障告警日志中的每个单词的词向量信息进行叠加操作,以获取故障告警日志的叠加词向量信息;以多个故障告警日志的叠加词向量信息作为输入、以告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。本发明还提供一种故障告警模型创建装置、故障告警方法以及故障告警装置。本发明缩短了故障告警处理的耗时以及提高了故障告警处理的效率。

Description

故障告警模型创建方法、装置、故障告警方法及装置
技术领域
本发明涉及服务器应用领域,特别是涉及一种故障告警模型创建方法、装置、故障告警方法、装置及存储介质。
背景技术
现有的服务器硬件故障告警分为明确故障告警和非明确故障告警。其中明确故障告警是根据各部件的故障标准对不同服务器部件的运行状态日志中的内容进行检测,从而诊断出服务器故障,若符合故障标准则进行明确故障处理流程。
而非明确故障告警仅仅是表征服务器系统出现异常,该异常可能是由软件异常导致,如服务器上的程序或服务器系统暂时不可用;也可能是硬件异常导致。因此非明确故障告警不能诊断出故障的真正原因以及对该故障的应对方法。所以如服务器出现非明确故障告警,需要服务器用户自行判断该故障是否为软件故障,如非软件故障再转交给现场维护人员进行故障的诊断以及处理。
因此现有的故障告警处理耗时较长,往往会错过故障处理的最佳时机,从而对业务产生不良影响;且现有的非明确故障告警在整个告警体系中的占比非常大,如所有的非明确故障告警均需要用户或现场维护人员进行处理,则现有的故障告警处理效率太低,无法满足用户日益增长的需求。
发明内容
本发明实施例提供一种可提高故障告警处理效率的故障告警模型创建方法、装置及对应的故障告警方法、装置;以解决现有的故障告警处理耗时较长且故障告警处理效率太低,无法满足用户日益增长的需求的技术问题。
本发明实施例提供一种故障告警模型创建方法,其包括:
获取多个告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警日志;
使用词向量化工具,对所述故障告警日志中每个单词进行词向量化操作,以获取所述故障告警日志中每个单词的词向量信息;
对所述故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述故障告警日志的叠加词向量信息;以及
以多个所述故障告警日志的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
本发明实施例还提供一种故障告警方法,其包括:
获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
使用词向量化工具,对所述待确认故障告警日志进行词向量化操作,以获取所述待确认故障告警日志的词向量信息;
对所述待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述待确认故障告警日志的叠加词向量信息;
将所述待确认故障告警日志的叠加词向量信息输入至上述的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率;以及
根据所述待确认故障告警日志的故障告警类型的概率进行故障告警操作。
本发明实施例还提供一种故障告警模型创建装置,其包括:
故障告警日志采集模块,用于获取多个告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警日志;
第一词向量化操作模块,用于使用词向量化工具,对所述故障告警日志中每个单词进行词向量化操作,以获取所述故障告警日志中每个单词的词向量信息;
第一叠加操作模块,用于对所述故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述故障告警日志的叠加词向量信息;以及
故障告警模型创建模块,用于以多个所述故障告警日志的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
本发明实施例还提供一种故障告警装置,其包括:
待确认故障告警日志采集模块,用于获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
第二词向量化操作模块,用于使用词向量化工具,对所述待确认故障告警日志进行词向量化操作,以获取所述待确认故障告警日志的词向量信息;
第二叠加操作模块,用于对所述待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述待确认故障告警日志的叠加词向量信息;
故障告警概率获取模块,用于将所述待确认故障告警日志的叠加词向量信息输入至上述任一的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率;以及
故障告警模块,用于根据所述待确认故障告警日志的故障告警类型的概率进行故障告警操作。
本发明实施例还提供一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述的故障告警模型创建方法。
本发明实施例还提供一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述的故障告警方法。
相较于现有技术,本发明的故障告警模型创建方法、装置、故障告警方法、装置及存储介质通过故障告警模型来进行故障告警处理,缩短了故障告警处理的耗时以及提高了故障告警处理的效率;有效的解决了现有的故障告警处理耗时较长且故障告警处理效率太低,无法满足用户日益增长的需求的技术问题。
附图说明
图1为本发明的故障告警模型创建方法的第一实施例的流程图;
图2为本发明的故障告警模型创建方法的第二实施例的流程图;
图3为本发明的故障告警模型创建方法的第二实施例的步骤S201的流程图;
图4为本发明的故障告警模型创建方法的第二实施例的步骤S202的流程图;
图5为本发明的故障告警方法的第一实施例的流程图;
图6为本发明的故障告警方法的第二实施例的流程图;
图7为本发明的故障告警模型创建装置的第一实施例的结构示意图;
图8为本发明的故障告警模型创建装置的第二实施例的结构示意图;
图9为本发明的故障告警模型创建装置的第二实施例的故障告警日志采集模块的结构示意图;
图10为本发明的故障告警模型创建装置的第二实施例的第一词向量化操作模块的结构示意图;
图11为本发明的故障告警模型创建装置的第二实施例的第一词向量化操作模块的词向量化操作单元的结构示意图;
图12为本发明的故障告警装置的第一实施例的结构示意图;
图13为本发明的故障告警装置的第二实施例的结构示意图;
图14为本发明的故障告警模型创建方法以及故障告警模型创建装置的具体实施例的故障告警模型创建流程图;
图15为本发明的故障告警模型创建方法以及故障告警模型创建装置的具体实施例的故障告警模型创建示意图;
图16为本发明的故障告警模型创建方法以及故障告警模型创建装置的具体实施例的神经网络模型框架的示意图;
图17a为本发明的故障告警方法及故障告警装置的具体实施例的故障告警流程图;
图17b为本发明的故障告警方法及故障告警装置的具体实施例的处理流程示意图;
图18为本发明的故障告警模型创建装置以及故障告警装置所在的电子设备的工作环境结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本发明具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
在以下的说明中,本发明的具体实施例将参考由一部或多部计算机所执行之作业的步骤及符号来说明,除非另有述明。因此,其将可了解到这些步骤及操作,其中有数次提到为由计算机执行,包括了由代表了以一结构化型式中的数据之电子信号的计算机处理单元所操纵。此操纵转换该数据或将其维持在该计算机之内存系统中的位置处,其可重新配置或另外以本领域技术人员所熟知的方式来改变该计算机之运作。该数据所维持的数据结构为该内存之实体位置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本发明的故障告警模型创建方法、装置及故障告警方法、装置可设置在任何的电子设备中,用于高速高效的对服务器硬件故障进行告警操作。该电子设备包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA,Personal Digital Assistant)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。该电子设备优选为进行服务器硬件故障告警操作的故障告警服务器,该故障告警服务器可通过故障告警模型来进行故障告警处理,缩短了故障告警处理的耗时以及提高了故障告警处理的效率。
请参照图1,图1为本发明的故障告警模型创建方法的第一实施例的流程图。本实施例的故障告警模型创建方法可使用上述的电子设备进行实施,本实施例的故障告警模型创建方法可包括:
步骤S101,获取多个告警信息样本,并根据告警信息样本采集对应的至少一个故障告警日志;
步骤S102,使用词向量化工具,对故障告警日志中每个单词进行词向量化操作,以获取故障告警日志中每个单词的词向量信息;
步骤S103,对故障告警日志中的每个单词的词向量信息进行叠加操作,以获取故障告警日志的叠加词向量信息;
步骤S104,以多个故障告警日志的叠加词向量信息作为输入、以告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
下面详细说明本实施例的故障告警模型创建方法的各步骤的具体流程。
在步骤S101中,故障告警模型创建装置获取多个告警信息样本,这里的告警信息样本为包括故障告警类型以及故障告警时间的告警信息,以便对故障告警模型进行训练创建。
随后故障告警模型创建装置根据故障告警时间以及对应故障告警日志的类型,采集对应的故障告警日志。由于这里可包括系统内核日志、系统事件日志等多种不同的故障告警日志的来源,因此这里根据告警信息样本可采集多个不同类型的故障告警日志。
在步骤S102中,故障告警模型创建装置使用word2vec等词向量化工具,对步骤S101获取的故障告警日志中的每个单词进行词向量化操作,从而获取该故障告警日志中每个单词的词向量信息。这里的故障告警日志中每个单词的词向量信息可通过word2vec等词向量化工具统计该单词在故障告警日志中日志语句的语句顺序以及故障告警日志中单词的词序来获取。在进行词向量信息的统计时,每个单词的词向量的长度是可以预先设置的,如设置每个单词的词向量长度为100维等,则表示通过100维向量空间中的某个位置点来表示该单词的词向量信息。
在步骤S103中,由于通过word2vec等词向量工具获取的词向量信息具有可累加性,故障告警模型创建装置可对步骤S102获取的每个单词的词向量信息进行叠加操作,从而获取对应的故障告警日志的叠加词向量信息。该故障告警日志的叠加词向量信息为故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
在步骤S104中,故障告警模型创建装置以步骤S103获取的多个故障告警日志的叠加词向量信息作为输入、以步骤S101获取的告警信息样本对应的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,并根据训练结果创建对应的故障告警模型。
这样即完成了本实施例的故障告警模型创建方法的故障告警模型的创建过程。
本实施例的故障告警模型创建方法通过故障告警日志中的单词的词向量信息来训练神经网络模型,提高了故障告警模型创建的准确性以及模型训练效率。
请参照图2,图2为本发明的故障告警模型创建方法的第二实施例的流程图。本实施例的故障告警模型创建方法可使用上述的电子设备进行实施,本实施例的故障告警模型创建方法可包括:
步骤S201,获取多个告警信息样本,并根据告警信息样本采集对应的至少一个故障告警日志;
步骤S202,使用词向量化工具,对故障告警日志中每个单词进行词向量化操作,以获取故障告警日志中每个单词的词向量信息;
步骤S203,对故障告警日志中的每个单词的词向量信息进行叠加操作,以获取故障告警日志的叠加词向量信息;
步骤S204,根据告警信息样本的类型,获取不同类型的故障告警日志的权重信息;
步骤S205,根据故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到告警信息样本的叠加词向量信息;
步骤S206,以告警信息样本的叠加词向量信息作为输入、以告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
下面详细说明本实施例的故障告警模型创建方法的各步骤的具体流程。
在步骤S201中,故障告警模型创建装置获取多个告警信息样本,这里的告警信息样本为包括故障告警类型以及故障告警时间的告警信息,以便对故障告警模型进行训练创建。
随后故障告警模型创建装置根据故障告警时间以及对应故障告警日志的类型,采集对应的故障告警日志。由于这里可包括系统内核日志、系统事件日志等多种不同的故障告警日志的来源,因此这里根据告警信息样本可采集多个不同类型的故障告警日志。
具体请参照图3,图3为本发明的故障告警模型创建方法的第二实施例的步骤S201的流程图。该步骤S201包括:
步骤S301,故障告警模型创建装置获取告警信息样本,并根据告警信息样本采集对应的至少一个故障告警全日志。这里的故障告警全日志是指包含具有告警信息样本对应的故障告警日志在内的系统日志,故障告警全日志可具有多个不同类型,如反馈系统启动信息的系统内核日志(Dmesg)、反馈系统传感器数据的系统事件日志(SEL,Sensor EventLog)、磁盘阵列日志(RAID,Redundant Arrays of Independent Disks)以及内存MCE日志等。
步骤S302,故障告警模型创建装置根据步骤S301获取的告警信息样本中的告警时间以及步骤S301采集的故障告警全日志的类型,确定固定告警全日志的采集时间。
由于不同类型的故障告警全日志的数据采集间隔以及数据量均不同,为了能较好以及较快的采集到能够反馈故障信息的故障告警日志,故障告警模型创建装置需要根据告警信息样本的告警时间,确定故障告警全日志的采集开始时间;根据故障告警全日志的类型,确定故障告警全日志的采集时长。
如系统内核日志的数据采集间隔较大且系统内核日志的数据量较少,因此可将对应的故障告警全日志的采集时长设置得较长,以使得可获得较为完整的系统内核日志类型的故障告警日志。
如系统事件日志的数据采集间隔较小且系统事件日志的数据量较多,因此可将对应的故障告警全日志的采集时长设置得较短,以避免获取较多的不相关的系统事件日志类型的故障告警日志。
步骤S303,故障告警模型创建装置根据步骤S302确定的固定告警全日志的采集时间,对步骤S301获取的故障告警全日志进行采集操作,以便从固定告警全日志中采集对应的故障告警日志。
在步骤S202中,故障告警模型创建装置使用word2vec等词向量化工具,对步骤S201获取的故障告警日志中的每个单词进行词向量化操作,从而获取该故障告警日志中每个单词的词向量信息。这里的故障告警日志中每个单词的词向量信息可通过word2vec等词向量化工具统计该单词在故障告警日志中日志语句的语句顺序以及故障告警日志中单词的词序来获取。
具体请参照图4,图4为本发明的故障告警模型创建方法的第二实施例的步骤S202的流程图。该步骤S202包括:
步骤S401,故障告警模型创建装置对步骤S201获取的故障告警日志进行去字符串预处理。由于故障告警日志中可能包含大量的十六进制字符,为了避免十六进制字符串中的A至F对后续词向量信息获取的影响,这里需要提前对故障告警日志进行去字符串预处理。
步骤S402,由于步骤S201中获取的故障告警日志中的日志语句可能会产生乱序,从而影响后续生成的故障告警日志的每个单词的词向量信息的准确性。因此这里故障告警模型创建装置会按时间顺序对去字符串预处理后的故障告警日志中的日志语句进行排序,以还原故障告警日志中日志语句的时间上的关联性。
步骤S403,故障告警模型创建装置使用word2vec词向量化工具,对步骤S402排序后的故障告警日志中的每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息。
使用word2vec词向量化工具对故障告警日志中的每个单词,进行词向量化操作流程包括以下步骤:
由于词向量化操作是对故障告警日志中的单词进行的,因此首先故障告警模型创建装置要对获取的所有故障告警日志进行分词操作。
随后故障告警模型创建装置将分词操作后的所有故障告警日志放到词向量化工具word2vec中,以使得词向量化工具word2vec可根据分词操作后的故障告警日志中单词的词序以及故障告警日志中日志语句的语句顺序,生成用于表示单词与词向量信息的词向量化字典表。
如使用CBOW连续词袋模型,预先设置每个单词的词向量长度为100维,以3个连续单词的词序依次进行关联度训练,最终生成故障告警日志中每个单词对应的词向量信息,最终生成对应的词向量化字典表。
如将“rejecting I/O to dead device”的故障告警日志放到词向量化工具word2vec中,词向量化工具word2vec会依次以“rejecting I/O to”、“I/O to dead”以及“to dead device”进行关联度训练,最终生成单词rejecting、I/O、to、dead以及device的100维词向量信息,然后再将其他的故障告警日志也输入到词向量化工具word2vec中,这样词向量化工具word2vec可通过大量的故障告警日志得出这些故障告警日志中单词之间的词序关系,最后将故障告警日志中所有单词和词向量信息的对应关系设置为词向量化字典表。这里是使用所有已知的故障告警日志生成可在所有的故障告警日志中通用的词向量化字典表。
然后故障告警模型创建装置使用上述的词向量化字典表,对步骤S402排序后的故障告警日志中的每个单词进行查表操作,以获取故障告警日志中每个单词的词向量信息,从而获取单独每个故障告警日志中每个单词的词向量信息。
在步骤S203中,由于通过word2vec等词向量工具获取的词向量信息具有可累加性,故障告警模型创建装置可对步骤S202获取的每个单词的词向量信息进行叠加操作,从而获取对应的故障告警日志的叠加词向量信息。该故障告警日志的叠加词向量信息为故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
在步骤S204中,同一告警信息样本可能具有多种不同的故障告警日志,如系统内核日志或系统事件日志等。不同类型的故障告警日志对于不同类型的告警信息样本的影响权重也不同。如系统内核日志与设备输入输出故障关联度较大,系统事件日志与设备驱动故障关联度较大等等。因此故障告警模型创建装置根据告警信息样本确定的故障类型,获取不同类型的故障告警日志的权重信息,以使得可通过多个不同类型的故障告警日志对最终的告警信息样本的叠加词向量信息进行准确修正。
在步骤S205中,故障告警模型创建装置根据步骤S204获取的故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到告警信息样本的叠加词向量信息。
这里可将多个故障告警日志的叠加词向量信息直接按权重比例进行叠加,如按权重比例对不同个故障告警日志的叠加词向量信息进行调整,如系统内核日志类型的故障告警日志的输出维数为100维,系统事件日志类型的故障告警日志的输出维数也为100维,但是针对设备输入输出故障,系统内核日志的权重大于系统事件日志的权重,因此这里可将100维的系统内核日志类型的故障告警日志的叠加词向量信息乘上权重系数1,将系统事件日志类型的故障告警日志的叠加词向量信息乘上权重系数0.8,再进行合成操作,得到200维的告警信息样本的叠加词向量信息,从而对告警信息样本的叠加词向量信息进行进一步简化。
当然这里也可不考虑故障告警日志的权重信息,直接对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,如将100维的系统内核日志类型的故障告警日志和100维的系统事件日志类型的故障告警日志进行合成操作,得到200维的告警信息样本的叠加词向量信息。
在步骤S206中,故障告警模型创建装置以步骤S205获取的告警信息样本的叠加词向量信息作为输入、以步骤S201获取的告警信息样本对应的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,并根据训练结果创建对应的故障告警模型。
这里的神经网络模型框架可使用张量流(TensorFlow)机器学习方法进行构成。具体的,该神经网络模型框架可包括告警信息样本或多个故障告警日志的叠加词向量信息的输入层、使用整流线性激活函数(如Rectified Linear Unit,ReLU函数)的隐藏层、以及使用损失函数(如softmax)输出的输出层。
这样即完成了本实施例的故障告警模型创建方法的故障告警模型的创建过程。
在第一实施例的基础上,本实施例的故障告警模型创建方法根据故障告警全日志的类型来采集对应的故障告警日志,提高了获取的故障告警日志的准确性;基于故障告警日志的权重信息来获取告警信息样本的叠加词向量信息,提高了获取的告警信息样本的叠加词向量信息的准确性;因此可进一步提高故障告警模型创建的准确性以及模型训练效率。
本发明还提供一种故障告警方法,请参照图5,图5为本发明的故障告警方法的第一实施例的流程图。本实施例的故障告警方法可使用上述的电子设备进行实施,本实施例的故障告警方法可包括:
步骤S501,获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
步骤S502,使用词向量化工具,对待确认故障告警日志进行词向量化操作,以获取待确认故障告警日志的词向量信息;
步骤S503,对待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取待确认故障告警日志的叠加词向量信息;
步骤S504,将待确认故障告警日志的叠加词向量信息输入至预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率;
步骤S505,根据待确认故障告警日志的故障告警类型的概率进行故障告警操作。
下面详细说明本实施例的故障告警方法的各步骤的具体流程。
在步骤S501中,故障告警装置获取待确认告警信息,这里的待确认告警信息为包括待确认告警时间的告警信息。
随后故障告警装置根据待确认告警信息的待确认告警时间以及对应的待确认故障告警日志的类型,从待确认故障告警全日志中采集对应的待确认故障告警日志。待确认告警全日志是指包含具有待确认告警信息对应的待确认故障告警日志在内的系统日志,待确认告警全日志可具有多个不同类型,如反馈系统启动信息的系统内核日志(Dmesg)或反馈系统传感器数据的系统事件日志(SEL,Sensor Event Log)等。因此这里根据待确认告警信息可采集多个不同类型的待确认故障告警日志。
在步骤S502中,故障告警装置使用word2vec等词向量化工具,对步骤S501获取的待确认故障告警日志中的每个单词进行词向量化操作,从而获取该待确认故障告警日志中每个单词的词向量信息。
这里可通过在故障告警模型对应的词向量化字典表中查找对应单词的词向量信息,来获取待确认故障告警日志中每个单词的词向量信息。
在步骤S503中,由于通过word2vec等词向量工具获取的词向量信息具有可累加性,故障告警装置可对步骤S502获取的每个单词的词向量信息进行叠加操作,从而获取对应的待确认故障告警日志的叠加词向量信息。该待确认故障告警日志的叠加词向量信息为待确认故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
在步骤S504中,故障告警装置将步骤S503获取的待确认故障告警日志的叠加词向量信息输入到上述故障告警模型创建方法创建的预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率。
在步骤S505中,故障告警装置根据步骤S504获取的待确认告警日志的故障告警类型的概率进行故障告警操作。这里可选择概率最大的故障告警类型进行故障告警操作;也可以选择最大的两个或多个故障告警类型同时进行故障告警提示,以便用户可方便快捷的对真正的故障告警类型进行判断。
这样即完成了本实施例的故障告警方法的故障告警过程
本实施例的故障告警方法通过故障告警模型来进行故障告警处理,缩短了故障告警处理的耗时以及提高了故障告警处理的效率。
请参照图6,图6为本发明的故障告警方法的第二实施例的流程图。本实施例的故障告警方法可使用上述的电子设备进行实施,本实施例的故障告警方法可包括:
步骤S601,获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
步骤S602,使用词向量化工具,对待确认故障告警日志进行词向量化操作,以获取待确认故障告警日志的词向量信息;
步骤S603,对待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取待确认故障告警日志的叠加词向量信息;
步骤S604,对同一待确认告警信息对应的多个待确认故障告警日志的叠加词向量信息进行合成操作,以得到待确认告警信息的叠加词向量信息;
步骤S605,将待确认告警信息的叠加词向量信息输入至预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率;
步骤S606,根据待确认故障告警日志的故障告警类型的概率进行故障告警操作。
下面详细说明本实施例的故障告警方法的各步骤的具体流程。
在步骤S601中,故障告警装置获取待确认告警信息,这里的待确认告警信息为包括待确认告警时间的告警信息。
随后故障告警装置根据待确认告警信息的待确认告警时间以及对应的待确认故障告警日志的类型,从待确认故障告警全日志中采集对应的待确认故障告警日志。
在步骤S602中,故障告警装置使用word2vec等词向量化工具,对步骤S601获取的待确认故障告警日志中的每个单词进行词向量化操作,从而获取该待确认故障告警日志中每个单词的词向量信息。
这里可通过在故障告警模型对应的词向量化字典表中查找对应单词的词向量信息,来获取待确认故障告警日志中每个单词的词向量信息。
在步骤S603中,由于通过word2vec等词向量工具获取的词向量信息具有可累加性,故障告警装置可对步骤S602获取的每个单词的词向量信息进行叠加操作,从而获取对应的待确认故障告警日志的叠加词向量信息。该待确认故障告警日志的叠加词向量信息为待确认故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
在步骤S604中,故障告警装置对同一待确认告警信息对应的多个待确认故障告警日志的叠加词向量信息进行合成操作,以得到待确认告警信息的叠加词向量信息。这里的合成操作可直接将不同待确认故障告警日志的叠加词向量信息的维度相加,如将100维的系统内核日志类型的待确认故障告警日志和100维的系统事件日志类型的待确认故障告警日志进行合成操作,得到200维的待确认告警信息的叠加词向量信息。
在步骤S605中,故障告警装置将步骤S604获取的待确认告警信息的叠加词向量信息输入到上述故障告警模型创建方法创建的预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率。
在步骤S606中,故障告警装置根据步骤S605获取的待确认告警日志的故障告警类型的概率进行故障告警操作。这里可选择概率最大的故障告警类型进行故障告警操作;也可以选择最大的两个或多个故障告警类型同时进行故障告警提示,以便用户可方便快捷的对真正的故障告警类型进行判断。
这样即完成了本实施例的故障告警方法的故障告警过程
在第一实施例的基础上,本实施例的故障告警方法通过多个待确认故障告警日志的叠加词向量信息来生成待确认告警信息的叠加词向量信息;提高了输入至故障告警模型的数据的准确性,进一步缩短了故障告警处理的耗时以及提高了故障告警处理的效率。
本发明还提供一种故障告警模型创建装置,请参照图7,图7为本发明的故障告警模型创建装置的第一实施例的结构示意图。本实施例的故障告警模型创建装置可使用上述的故障告警模型创建方法的第一实施例进行实施,本实施例的故障告警模型创建装置70包括故障告警日志采集模块71、第一词向量化操作模块72、第一叠加操作模块73以及故障告警模型创建模块74。
故障告警日志采集模块71用于获取多个告警信息样本,并根据告警信息样本采集对应的至少一个故障告警日志;第一词向量化操作模块72用于使用词向量化工具,对故障告警日志中每个单词进行词向量化操作,以获取故障告警日志中每个单词的词向量信息;第一叠加操作模块73用于对故障告警日志中的每个单词的词向量信息进行叠加操作,以获取故障告警日志的叠加词向量信息;故障告警模型创建模块74用于以多个故障告警日志的叠加词向量信息作为输入、以告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
本实施例的故障告警模型创建装置70使用时,首先故障告警日志采集模块71获取多个告警信息样本,这里的告警信息样本为包括故障告警类型以及故障告警时间的告警信息,以便对故障告警模型进行训练创建。
随后故障告警日志采集模块71根据故障告警时间以及对应故障告警日志的类型,采集对应的故障告警日志。由于这里可包括系统内核日志、系统事件日志等多种不同的故障告警日志的来源,因此这里根据告警信息样本可采集多个不同类型的故障告警日志。
随后第一词向量化操作模块72使用word2vec等词向量化工具,对故障告警日志采集模块获取的故障告警日志中的每个单词进行词向量化操作,从而获取该故障告警日志中每个单词的词向量信息。这里的故障告警日志中每个单词的词向量信息可通过word2vec等词向量化工具统计该单词在故障告警日志中日志语句的语句顺序以及故障告警日志中单词的词序来获取。在进行词向量信息的统计时,每个单词的词向量的长度是可以预先设置的,如设置每个单词的词向量长度为100维等,则表示通过100维向量空间中的某个位置点来表示该单词的词向量信息。
由于通过word2vec等词向量工具获取的词向量信息具有可累加性,然后第一叠加操作模块73可对第一词向量化操作模块72获取的每个单词的词向量信息进行叠加操作,从而获取对应的故障告警日志的叠加词向量信息。该故障告警日志的叠加词向量信息为故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
最后故障告警模型创建模块74以第一叠加操作模块73获取的多个故障告警日志的叠加词向量信息作为输入、以故障告警日志采集模块获取的告警信息样本对应的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,并根据训练结果创建对应的故障告警模型。
这样即完成了本实施例的故障告警模型创建装置70的故障告警模型的创建过程。
本实施例的故障告警模型创建装置通过故障告警日志中的单词的词向量信息来训练神经网络模型,提高了故障告警模型创建的准确性以及模型训练效率。
请参照图8,图8为本发明的故障告警模型创建装置的第二实施例的结构示意图。本实施例的故障告警模型创建装置可使用上述的故障告警模型创建方法的第二实施例进行实施,本实施例的故障告警模型创建装置80包括故障告警日志采集模块81、第一词向量化操作模块82、第一叠加操作模块83、权重信息获取模块84、合成操作模块85、故障告警模型创建模块86以及神经网络模型框架构建模块87。
故障告警日志采集模块81用于获取多个告警信息样本,并根据告警信息样本采集对应的至少一个故障告警日志;第一词向量化操作模块82用于使用词向量化工具,对故障告警日志中每个单词进行词向量化操作,以获取故障告警日志中每个单词的词向量信息;第一叠加操作模块83用于对故障告警日志中的每个单词的词向量信息进行叠加操作,以获取故障告警日志的叠加词向量信息;权重信息获取模块84用于根据告警信息样本的类型,获取不同类型的故障告警日志的权重信息;合成操作模块85用于根据故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到告警信息样本的叠加词向量信息;故障告警模型创建模块86用于以告警信息样本的叠加词向量信息作为输入、以告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型;神经网络模型框架构建模块87用于使用张量流机器学习方法构建神经网络模型框架,其中神经网络模型框架包括输入所述叠加词向量信息的输入层、使用整流线性激活函数的隐藏层以及使用损失函数输出的输出层。
请参照图9,图9为本发明的故障告警模型创建装置的第二实施例的故障告警日志采集模块的结构示意图。该故障告警日志采集模块81包括故障告警全日志采集单元91、采集时间确定单元92以及故障告警日志采集单元93。
故障告警全日志采集单元91用于获取告警信息样本,并根据告警信息样本采集对应的至少一个故障告警全日志;采集时间确定单元92用于根据告警信息样本的告警时间以及故障告警全日志的类型,确定固定告警全日志的采集时间;故障告警日志采集单元93用于基于固定告警全日志的采集时间,从固定告警全日志中采集对应的故障告警日志。
请参照图10,图10为本发明的故障告警模型创建装置的第二实施例的第一词向量化操作模块的结构示意图。第一词向量化操作模块82包括去字符串预处理单元101、排序单元102以及词向量化操作单元103。
去字符串预处理单元101用于对故障告警日志进行去字符串预处理;排序单元102用于按时间顺序,对去字符串预处理后的故障告警日志中的日志语句进行排序;词向量化操作单元103用于使用词向量化工具,对排序后的故障告警日志中每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息。
请参照图11,图11为本发明的故障告警模型创建装置的第二实施例的第一词向量化操作模块的词向量化操作单元的结构示意图。该词向量化操作单元103包括分词操作子单元111、字典表创建子单元112以及查表操作子单元113。
分词操作子单元111用于对所有的故障告警日志进行分词操作;字典表创建子单元112用于使用词向量化工具,根据所有分词操作后的故障告警日志中单词的词序以及故障告警日志中日志语句的语句顺序,生成用于表示单词与词向量信息的词向量化字典表;查表操作子单元113用于使用词向量化字典表,对排序后的故障告警日志中的每个单词进行查表操作,以获取故障告警日志中每个单词的词向量信息。
本实施例的故障告警模型创建装置80使用时,首先故障告警日志采集模块81获取多个告警信息样本,这里的告警信息样本为包括故障告警类型以及故障告警时间的告警信息,以便对故障告警模型进行训练创建。
随后故障告警日志采集模块81根据故障告警时间以及对应故障告警日志的类型,采集对应的故障告警日志。由于这里可包括系统内核日志、系统事件日志等多种不同的故障告警日志的来源,因此这里根据告警信息样本可采集多个不同类型的故障告警日志。具体流程包括:
故障告警日志采集模块81的故障告警全日志采集单元91获取告警信息样本,并根据告警信息样本采集对应的至少一个故障告警全日志。这里的故障告警全日志是指包含具有告警信息样本对应的故障告警日志在内的系统日志,故障告警全日志可具有多个不同类型,如反馈系统启动信息的系统内核日志(Dmesg)或反馈系统传感器数据的系统事件日志(SEL,Sensor Event Log)等。
故障告警日志采集模块81的采集时间确定单元92根据故障告警全日志采集单元91获取的告警信息样本中的告警时间以及故障告警全日志采集单元采集的故障告警全日志的类型,确定固定告警全日志的采集时间。
由于不同类型的故障告警全日志的数据采集间隔以及数据量均不同,为了能较好以及较快的采集到能够反馈故障信息的故障告警日志,故障告警日志采集模块81需要根据告警信息样本的告警时间,确定故障告警全日志的采集开始时间;根据故障告警全日志的类型,确定故障告警全日志的采集时长。
如系统内核日志的数据采集间隔较大且系统内核日志的数据量较少,因此可将对应的故障告警全日志的采集时长设置得较长,以使得可获得较为完整的系统内核日志类型的故障告警日志。
如系统事件日志的数据采集间隔较小且系统事件日志的数据量较多,因此可将对应的故障告警全日志的采集时长设置得较短,以避免获取较多的不相关的系统事件日志类型的故障告警日志。
故障告警日志采集模块81的故障告警日志采集单元93根据采集时间确定单元92确定的固定告警全日志的采集时间,对故障告警全日志采集单元91获取的故障告警全日志进行采集操作,以便从固定告警全日志中采集对应的故障告警日志。
然后第一词向量化操作模块82使用word2vec等词向量化工具,对故障告警日志采集模块81获取的故障告警日志中的每个单词进行词向量化操作,从而获取该故障告警日志中每个单词的词向量信息。这里的故障告警日志中每个单词的词向量信息可通过word2vec等词向量化工具统计该单词在故障告警日志中日志语句的语句顺序以及故障告警日志中单词的词序来获取。具体流程包括:
第一词向量化操作模块82的去字符串预处理单元101对故障告警日志采集模块获取的故障告警日志进行去字符串预处理。由于故障告警日志中可能包含大量的十六进制字符,为了避免十六进制字符串中的A至F对后续词向量信息获取的影响,这里需要提前对故障告警日志进行去字符串预处理。
由于故障告警日志采集模块81获取的故障告警日志中的日志语句可能会产生乱序,从而影响后续生成的故障告警日志的每个单词的词向量信息的准确性。因此第一词向量化操作模块82的排序单元102会按时间顺序对去字符串预处理后的故障告警日志中的日志语句进行排序,以还原故障告警日志中日志语句的时间上的关联性。
第一词向量化操作模块82的词向量化操作单元103使用word2vec词向量化工具,对排序单元102排序后的故障告警日志中的每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息。
使用word2vec词向量化工具对故障告警日志中的每个单词,进行词向量化操作流程包括以下步骤:
由于词向量化操作是对故障告警日志中的单词进行的,因此首先词向量化操作单元103的分词操作子单元111要对获取的所有故障告警日志进行分词操作。
词向量化操作单元103的字典表创建子单元112将分词操作后的所有故障告警日志放到词向量化工具word2vec中,以使得词向量化工具word2vec可根据分词操作后的故障告警日志中单词的词序以及故障告警日志中日志语句的语句顺序,生成用于表示单词与词向量信息的词向量化字典表。
如使用CBOW连续词袋模型,预先设置每个单词的词向量长度为100维,以3个连续单词的词序依次进行关联度训练,最终生成故障告警日志中每个单词对应的词向量信息,最终生成对应的词向量化字典表。
如将“rejecting I/O to dead device”的故障告警日志放到词向量化工具word2vec中,词向量化工具word2vec会依次以“rejecting I/O to”、“I/O to dead”以及“to dead device”进行关联度训练,最终生成单词rejecting、I/O、to、dead以及device的100维词向量信息,然后再将其他的故障告警日志也输入到词向量化工具word2vec中,这样词向量化工具word2vec可通过大量的故障告警日志得出这些故障告警日志中单词之间的词序关系,最后将故障告警日志中所有单词和词向量信息的对应关系设置为词向量化字典表。这里是使用所有已知的故障告警日志生成可在所有的故障告警日志中通用的词向量化字典表。
词向量化操作单元103的查表操作子单元113使用上述的词向量化字典表,对排序后的故障告警日志中的每个单词进行查表操作,以获取故障告警日志中每个单词的词向量信息,从而获取单独每个故障告警日志中每个单词的词向量信息。
由于通过word2vec等词向量工具获取的词向量信息具有可累加性,随后第一叠加操作模块83可对第一词向量化操作模块82获取的每个单词的词向量信息进行叠加操作,从而获取对应的故障告警日志的叠加词向量信息。该故障告警日志的叠加词向量信息为故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
同一告警信息样本可能具有多种不同的故障告警日志,如系统内核日志或系统事件日志等。不同类型的故障告警日志对于不同类型的告警信息样本的影响权重也不同。如系统内核日志与设备输入输出故障关联度较大,系统事件日志与设备驱动故障关联度较大等等。因此权重信息获取模块84根据告警信息样本确定的故障类型,获取不同类型的故障告警日志的权重信息,以使得可通过多个不同类型的故障告警日志对最终的告警信息样本的叠加词向量信息进行准确修正。
然后合成操作模块85根据权重信息获取模块84获取的故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到告警信息样本的叠加词向量信息。
这里可将多个故障告警日志的叠加词向量信息直接按权重比例进行叠加,如按权重比例对不同个故障告警日志的叠加词向量信息进行调整,如系统内核日志类型的故障告警日志的输出维数为100维,系统事件日志类型的故障告警日志的输出维数也为100维,但是针对设备输入输出故障,系统内核日志的权重大于系统事件日志的权重,因此这里可将100维的系统内核日志类型的故障告警日志的叠加词向量信息乘上权重系数1,将系统事件日志类型的故障告警日志的叠加词向量信息乘上权重系数0.8,再进行合成操作,得到200维的告警信息样本的叠加词向量信息,从而对告警信息样本的叠加词向量信息进行进一步简化。
当然这里也可不考虑故障告警日志的权重信息,直接对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,如将100维的系统内核日志类型的故障告警日志和100维的系统事件日志类型的故障告警日志进行合成操作,得到200维的告警信息样本的叠加词向量信息。
最后故障告警模型创建模块86以合成操作模块85获取的告警信息样本的叠加词向量信息作为输入、以故障告警日志采集模块81获取的告警信息样本对应的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,并根据训练结果创建对应的故障告警模型。
这里的神经网络模型框架可通过神经网络模型框架构建模块87使用张量流(TensorFlow)机器学习方法进行构成。具体的,该神经网络模型框架可包括告警信息样本或多个故障告警日志的叠加词向量信息的输入层、使用整流线性激活函数(如RectifiedLinear Unit,ReLU函数)的隐藏层、以及使用损失函数(如softmax)输出的输出层。
这样即完成了本实施例的故障告警模型创建装置80的故障告警模型的创建过程。
在第一实施例的基础上,本实施例的故障告警模型创建装置根据故障告警全日志的类型来采集对应的故障告警日志,提高了获取的故障告警日志的准确性;基于故障告警日志的权重信息来获取告警信息样本的叠加词向量信息,提高了获取的告警信息样本的叠加词向量信息的准确性;因此可进一步提高故障告警模型创建的准确性以及模型训练效率。
本发明还提供一种故障告警装置,请参照图12,图12为本发明的故障告警装置的第一实施例的结构示意图。本实施例的故障告警装置可使用上述的故障告警方法的第一实施例进行实施。本实施例的故障告警装置120包括待确认故障告警日志采集模块121、第二词向量化操作模块122、第二叠加操作模块123、故障告警概率获取模块124以及故障告警模块125。
待确认故障告警日志采集模块121用于获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;第二词向量化操作模块122用于使用词向量化工具,对待确认故障告警日志进行词向量化操作,以获取待确认故障告警日志的词向量信息;第二叠加操作模块123用于对待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取待确认故障告警日志的叠加词向量信息;故障告警概率获取模块124用于将待确认故障告警日志的叠加词向量信息输入至预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率;故障告警模块125用于根据待确认故障告警日志的故障告警类型的概率进行故障告警操作。
本实施例的故障告警装置120使用时,首先待确认故障告警日志采集模块121获取待确认告警信息,这里的待确认告警信息为包括待确认告警时间的告警信息。
随后待确认故障告警日志采集模块121根据待确认告警信息的待确认告警时间以及对应的待确认故障告警日志的类型,从待确认故障告警全日志中采集对应的待确认故障告警日志。待确认告警全日志是指包含具有待确认告警信息对应的待确认故障告警日志在内的系统日志,待确认告警全日志可具有多个不同类型,如反馈系统启动信息的系统内核日志(Dmesg)或反馈系统传感器数据的系统事件日志(SEL,Sensor Event Log)等。因此这里根据待确认告警信息可采集多个不同类型的待确认故障告警日志。
然后第二词向量化操作模块122使用word2vec等词向量化工具,对待确认故障告警日志采集模块获取的待确认故障告警日志中的每个单词进行词向量化操作,从而获取该待确认故障告警日志中每个单词的词向量信息。
这里可通过在故障告警模型对应的词向量化字典表中查找对应单词的词向量信息,来获取待确认故障告警日志中每个单词的词向量信息。
由于通过word2vec等词向量工具获取的词向量信息具有可累加性,第二叠加操作模块123可对第二词向量化操作模块122获取的每个单词的词向量信息进行叠加操作,从而获取对应的待确认故障告警日志的叠加词向量信息。该待确认故障告警日志的叠加词向量信息为待确认故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
故障告警概率获取模块124将第二叠加操作模块123获取的待确认故障告警日志的叠加词向量信息输入到上述故障告警模型创建方法创建的预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率。
最后故障告警模块125根据故障告警概率获取模块124获取的待确认告警日志的故障告警类型的概率进行故障告警操作。这里可选择概率最大的故障告警类型进行故障告警操作;也可以选择最大的两个或多个故障告警类型同时进行故障告警提示,以便用户可方便快捷的对真正的故障告警类型进行判断。
这样即完成了本实施例的故障告警装置120的故障告警过程
本实施例的故障告警装置通过故障告警模型来进行故障告警处理,缩短了故障告警处理的耗时以及提高了故障告警处理的效率。
请参照图13,图13为本发明的故障告警装置的第二实施例的结构示意图。本实施例的故障告警装置可使用上述的故障告警方法的第一实施例进行实施。本实施例的故障告警装置130包括待确认故障告警日志采集模块131、第二词向量化操作模块132、第二叠加操作模块133、叠加词向量信息合成模块134、故障告警概率获取模块135以及故障告警模块136。
待确认故障告警日志采集模块131用于获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;第二词向量化操作模块132用于使用词向量化工具,对待确认故障告警日志进行词向量化操作,以获取待确认故障告警日志的词向量信息;第二叠加操作模块133用于对待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取待确认故障告警日志的叠加词向量信息;叠加词向量信息合成模块134用于对同一待确认告警信息对应的多个待确认故障告警日志的叠加词向量信息进行合成操作,以得到待确认告警信息的叠加词向量信息;故障告警概率获取模块135用于将待确认告警信息的叠加词向量信息输入至预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率;故障告警模块136用于根据待确认故障告警日志的故障告警类型的概率进行故障告警操作。
本实施例的故障告警装置130使用时,首先待确认故障告警日志采集模块131获取待确认告警信息,这里的待确认告警信息为包括待确认告警时间的告警信息。
随后待确认故障告警日志采集模块131根据待确认告警信息的待确认告警时间以及对应的待确认故障告警日志的类型,从待确认故障告警全日志中采集对应的待确认故障告警日志。
然后第二词向量化操作模块132使用word2vec等词向量化工具,对待确认故障告警日志采集模块获取的待确认故障告警日志中的每个单词进行词向量化操作,从而获取该待确认故障告警日志中每个单词的词向量信息。
这里可通过在故障告警模型对应的词向量化字典表中查找对应单词的词向量信息,来获取待确认故障告警日志中每个单词的词向量信息。
由于通过word2vec等词向量工具获取的词向量信息具有可累加性,第二叠加操作模块133可对第二词向量化操作模块132获取的每个单词的词向量信息进行叠加操作,从而获取对应的待确认故障告警日志的叠加词向量信息。该待确认故障告警日志的叠加词向量信息为待确认故障告警日志下所有单词的词向量信息进行叠加操作后生成的。
然后叠加词向量信息合成模块134对同一待确认告警信息对应的多个待确认故障告警日志的叠加词向量信息进行合成操作,以得到待确认告警信息的叠加词向量信息。这里的合成操作可直接将不同待确认故障告警日志的叠加词向量信息的维度相加,如将100维的系统内核日志类型的待确认故障告警日志和100维的系统事件日志类型的待确认故障告警日志进行合成操作,得到200维的待确认告警信息的叠加词向量信息。
随后故障告警概率获取模块135将叠加词向量信息合成模块134获取的待确认告警信息的叠加词向量信息输入到上述故障告警模型创建方法创建的预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率。
最后故障告警模块136根据故障告警概率获取模块135获取的待确认告警日志的故障告警类型的概率进行故障告警操作。这里可选择概率最大的故障告警类型进行故障告警操作;也可以选择最大的两个或多个故障告警类型同时进行故障告警提示,以便用户可方便快捷的对真正的故障告警类型进行判断。
这样即完成了本实施例的故障告警装置130的故障告警过程
在第一实施例的基础上,本实施例的故障告警装置通过多个待确认故障告警日志的叠加词向量信息来生成待确认告警信息的叠加词向量信息;提高了输入至故障告警模型的数据的准确性,进一步缩短了故障告警处理的耗时以及提高了故障告警处理的效率。
下面通过一具体实施例说明本发明的故障告警模型创建方法以及故障告警模型创建装置的工作原理。请参照图14,图14为本发明的故障告警模型创建方法以及故障告警模型创建装置的具体实施例的故障告警模型创建流程图。该故障告警模型创建装置可设置在故障告警服务器,以便故障告警服务器通过多个告警信息样本来生成对应的故障告警模型。
该故障告警模型的创建流程包括:
步骤S1401,故障告警服务器获取多个告警信息样本,随后根据告警信息样本中采集对应故障告警日志。这里的故障告警日志可包括系统内核日志以及系统事件日志。具体的告警信息样本如图15中的1501所示。
步骤S1402,故障告警服务器对故障告警日志进行去字符串预处理,以保证获取数据的准确性。
步骤S1403,故障告警服务器按事件顺序对取数字串预处理后的故障告警日志中的日志语句进行排序,以还原故障告警日志中日志语句的时间上的关联性。具体的故障告警日志如图15中的1502所示。
步骤S1404,故障告警服务器对获取的所有故障告警日志进行分词操作;随后故障告警服务器将所有的故障告警日志放到词向量化工具word2vec中,以生成词向量化字典表。
具体的,词向量化工具word2vec的运行环境配置可为双路Intel(R)Xeon(R)CPUE5-2670v2,内存大小为64GB,搭配NVIDIA Tesla K40m GPU。词向量化字典表的训练采用CBOW连续词袋模型,词向量长度设置为100维,训练窗口大小为3,即以3个连续单词的词序依次进行关联度训练,使用NEG(Negative Sampling)负采样,提高训练效率,最终输出二进制数据以生成词向量化字典表。
步骤S1405,故障告警服务器使用上述词向量字典表,采用最长匹配规则,将步骤S1403中获取的故障告警日志的每个单词均转换为对应的词向量信息。具体如图15中的1503所示。
步骤S1406,故障告警服务器对步骤S1405获取的故障告警日志的每个单词的词向量信息进行叠加操作,以获取对应的故障告警日志的叠加词向量信息。如图15中的1504所示。
步骤S1407,故障告警服务器将同一告警信息样本的多个故障告警日志的叠加词向量信息进行合成操作,以得到告警信息样本的叠加词向量信息,如图15中的1505所示。
步骤S1408,故障告警服务器以步骤S1407获取的告警信息样本的叠加词向量信息作为输入、以步骤S1401获取的告警信息样本对应的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,并根据训练结果创建对应的故障告警模型。
这里神经网络模型框架可使用张量流(TensorFlow)机器学习方法进行构成。如图16所示,该神经网络模型框架的输入层为告警信息样本的叠加词向量信息A1 n,n=1-200;隐藏层使用ReLU函数,隐藏层设置有10个神经元A2 x,x=1-10;输出层用softmax损失函数,优化算法选用梯度下降法,输出A3 y,y=1-10;其中A2 x=g(θ1 n*A1 n),这里的g()为ReLU函数;A3 y=h(θ2 x*A2 x),这里h()为softmax损失函数,通过训练可以得出参数θ1 n以及θ2 x。由于本实施例的训练数据维度较大,容易出现过拟合现象,因此在训练时还会引入Dropout设置,从而得到对应的故障告警模型。
这样即完成了本具体实施例的故障告警模型创建方法以及故障告警模型创建装置的故障告警模型的创建过程。
下面通过一具体实施例说明本发明的故障告警方法及故障告警装置的工作原理。请参照图17a和图17b,图17a为本发明的故障告警方法及故障告警装置的具体实施例的故障告警流程图,图17b为本发明的故障告警方法及故障告警装置的具体实施例的处理流程示意图;该故障告警装置可设置在故障告警服务器中,以便故障藏告警服务器根据待确认告警信息进行故障告警操作。
该故障告警操作的流程包括:
步骤S1701,故障告警装置接收到待确认告警信息,如分别ping不可达、逻辑盘只读、agent上报超时等待确认告警信息。
步骤S1702,故障告警装置根据上述待确认告警信息的待确认告警时间,获取对应的待确认故障告警日志。
步骤S1703,故障告警装置可通过故障告警模型对应的词向量化字典表中查找对应单词的词向量信息,从而获取待确认故障告警日志中每个单词的词向量信息。
步骤S1704,故障告警装置对步骤S1703获取的待确认故障告警日志的每个单词的词向量信息进行叠加操作,从而获取待确认故障告警日志的叠加词向量信息。
步骤S1705,故障告警装置将上述待确认故障告警日志输入到预设的故障告警模型中,以获取待确认故障告警日志的故障告警类型的概率。如确认是具体硬件故障,则可按既定的明确故障处理策略进行故障排除操作。如确认是非明确的故障,则会将对应的待确认故障告警日志提供给用户,以便用户对故障告警类型进行判断,从而提高用户的处理效率。
这样即完成了本具体实施例的故障告警方法及故障告警装置的故障告警操作流程。
本发明的故障告警模型创建方法、装置、故障告警方法、装置及存储介质通过故障告警模型来进行故障告警处理,提高了故障告警的明确化精度,减少了人工干预,从而减少了过失出错的可能性;通过使用多种部件日志创建对应的故障告警模型,增大了故障告警的明确化比例;缩短了故障告警处理的耗时以及提高了故障告警处理的效率;有效的解决了现有的故障告警处理耗时较长且故障告警处理效率太低,无法满足用户日益增长的需求的技术问题。
如本申请所使用的术语“组件”、“模块”、“系统”、“接口”、“进程”等等一般地旨在指计算机相关实体:硬件、硬件和软件的组合、软件或执行中的软件。例如,组件可以是但不限于是运行在处理器上的进程、处理器、对象、可执行应用、执行的线程、程序和/或计算机。通过图示,运行在控制器上的应用和该控制器二者都可以是组件。一个或多个组件可以有在于执行的进程和/或线程内,并且组件可以位于一个计算机上和/或分布在两个或更多计算机之间。
图18和随后的讨论提供了对实现本发明所述的故障告警模型创建装置以及故障告警装置所在的电子设备的工作环境的简短、概括的描述。图8的工作环境仅仅是适当的工作环境的一个实例并且不旨在建议关于工作环境的用途或功能的范围的任何限制。实例电子设备1812包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。
尽管没有要求,但是在“计算机可读指令”被一个或多个电子设备执行的通用背景下描述实施例。计算机可读指令可以经由计算机可读介质来分布(下文讨论)。计算机可读指令可以实现为程序模块,比如执行特定任务或实现特定抽象数据类型的功能、对象、应用编程接口(API)、数据结构等等。典型地,该计算机可读指令的功能可以在各种环境中随意组合或分布。
图18图示了包括本发明的故障告警模型创建装置以及故障告警装置中的一个或多个实施例的电子设备1812的实例。在一种配置中,电子设备1812包括至少一个处理单元1816和存储器1818。根据电子设备的确切配置和类型,存储器1818可以是易失性的(比如RAM)、非易失性的(比如ROM、闪存等)或二者的某种组合。该配置在图18中由虚线1814图示。
在其他实施例中,电子设备1812可以包括附加特征和/或功能。例如,设备1812还可以包括附加的存储装置(例如可移除和/或不可移除的),其包括但不限于磁存储装置、光存储装置等等。这种附加存储装置在图18中由存储装置1820图示。在一个实施例中,用于实现本文所提供的一个或多个实施例的计算机可读指令可以在存储装置1820中。存储装置1820还可以存储用于实现操作系统、应用程序等的其他计算机可读指令。计算机可读指令可以载入存储器1818中由例如处理单元1816执行。
本文所使用的术语“计算机可读介质”包括计算机存储介质。计算机存储介质包括以用于存储诸如计算机可读指令或其他数据之类的信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。存储器1818和存储装置1820是计算机存储介质的实例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备、或可以用于存储期望信息并可以被电子设备1812访问的任何其他介质。任意这样的计算机存储介质可以是电子设备1812的一部分。
电子设备1812还可以包括允许电子设备1812与其他设备通信的通信连接1826。通信连接1826可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频发射器/接收器、红外端口、USB连接或用于将电子设备1812连接到其他电子设备的其他接口。通信连接1826可以包括有线连接或无线连接。通信连接1826可以发射和/或接收通信媒体。
术语“计算机可读介质”可以包括通信介质。通信介质典型地包含计算机可读指令或诸如载波或其他传输机构之类的“己调制数据信号”中的其他数据,并且包括任何信息递送介质。术语“己调制数据信号”可以包括这样的信号:该信号特性中的一个或多个按照将信息编码到信号中的方式来设置或改变。
电子设备1812可以包括输入设备1824,比如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外相机、视频输入设备和/或任何其他输入设备。设备1812中也可以包括输出设备1822,比如一个或多个显示器、扬声器、打印机和/或任意其他输出设备。输入设备1824和输出设备1822可以经由有线连接、无线连接或其任意组合连接到电子设备1812。在一个实施例中,来自另一个电子设备的输入设备或输出设备可以被用作电子设备1812的输入设备1824或输出设备1822。
电子设备1812的组件可以通过各种互连(比如总线)连接。这样的互连可以包括外围组件互连(PCI)(比如快速PCI)、通用串行总线(USB)、火线(IEEE1394)、光学总线结构等等。在另一个实施例中,电子设备1812的组件可以通过网络互连。例如,存储器1818可以由位于不同物理位置中的、通过网络互连的多个物理存储器单元构成。
本领域技术人员将认识到,用于存储计算机可读指令的存储设备可以跨越网络分布。例如,可经由网络1828访问的电子设备1830可以存储用于实现本发明所提供的一个或多个实施例的计算机可读指令。电子设备1812可以访问电子设备1830并且下载计算机可读指令的一部分或所有以供执行。可替代地,电子设备1812可以按需要下载多条计算机可读指令,或者一些指令可以在电子设备1812处执行并且一些指令可以在电子设备1830处执行。
本文提供了实施例的各种操作。在一个实施例中,所述的一个或多个操作可以构成一个或多个计算机可读介质上存储的计算机可读指令,其在被电子设备执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,尽管已经相对于一个或多个实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件、资源等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或多个其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以实施例揭露如上,实施例前的序号仅为描述方便而使用,对本发明各实施例的顺序不造成限制。并且,上述实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (15)

1.一种故障告警模型创建方法,其特征在于,包括:
获取多个告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警日志;
使用词向量化工具,对所述故障告警日志中每个单词进行词向量化操作,以获取所述故障告警日志中每个单词的词向量信息;
对所述故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述故障告警日志的叠加词向量信息;以及
以多个所述故障告警日志的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
2.根据权利要求1所述的故障告警模型创建方法,其特征在于,所述获取多个告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警日志的步骤包括:
获取告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警全日志;
根据告警信息样本的告警时间以及故障告警全日志的类型,确定固定告警全日志的采集时间;以及
基于所述固定告警全日志的采集时间,从所述固定告警全日志中采集对应的故障告警日志。
3.根据权利要求1所述的故障告警模型创建方法,其特征在于,所述使用词向量化工具,对所述故障告警日志中每个单词进行词向量化操作,以获取所述故障告警日志中每个单词的词向量信息的步骤包括:
对所述故障告警日志进行去字符串预处理;
按时间顺序,对去字符串预处理后的故障告警日志中的日志语句进行排序;以及
使用词向量化工具,对排序后的故障告警日志中每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息。
4.根据权利要求3所述的故障告警模型创建方法,其特征在于,所述使用词向量化工具,对排序后的故障告警日志中每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息的步骤包括:
对所有的故障告警日志进行分词操作;
使用词向量化工具,根据所有分词操作后的故障告警日志中单词的词序以及故障告警日志中日志语句的语句顺序,生成用于表示单词与词向量信息的词向量化字典表;以及
使用所述词向量化字典表,对排序后的故障告警日志中的每个单词进行查表操作,以获取故障告警日志中每个单词的词向量信息。
5.根据权利要求1所述的故障告警模型创建方法,其特征在于,所述获取所述故障告警日志的叠加词向量信息的步骤之后,所述对预设的神经网络模型框架的参数进行神经网络模型训练的步骤之前还包括:
根据所述告警信息样本的类型,获取不同类型的故障告警日志的权重信息;
根据所述故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到所述告警信息样本的叠加词向量信息;
所述以多个所述故障告警日志的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型的步骤为:
以所述告警信息样本的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
6.根据权利要求1所述的故障告警模型创建方法,其特征在于,所述故障告警模型创建方法还包括:
使用张量流机器学习方法构建所述神经网络模型框架,其中所述神经网络模型框架包括输入所述叠加词向量信息的输入层、使用整流线性激活函数的隐藏层以及使用损失函数输出的输出层。
7.一种故障告警方法,其特征在于,包括:
获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
使用词向量化工具,对所述待确认故障告警日志进行词向量化操作,以获取所述待确认故障告警日志的词向量信息;
对所述待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述待确认故障告警日志的叠加词向量信息;
将所述待确认故障告警日志的叠加词向量信息输入至权利要求1-6中任一的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率;以及
根据所述待确认故障告警日志的故障告警类型的概率进行故障告警操作。
8.根据权利要求7所述的故障告警方法,其特征在于,所述故障告警方法还包括:
对同一待确认告警信息对应的多个待确认故障告警日志的叠加词向量信息进行合成操作,以得到所述待确认告警信息的叠加词向量信息;
所述将所述待确认故障告警日志的叠加词向量信息输入至权利要求1-6中任一的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率的步骤为:
将所述待确认告警信息的叠加词向量信息输入至权利要求1-6中任一的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率。
9.一种故障告警模型创建装置,其特征在于,包括:
故障告警日志采集模块,用于获取多个告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警日志;
第一词向量化操作模块,用于使用词向量化工具,对所述故障告警日志中每个单词进行词向量化操作,以获取所述故障告警日志中每个单词的词向量信息;
第一叠加操作模块,用于对所述故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述故障告警日志的叠加词向量信息;以及
故障告警模型创建模块,用于以多个所述故障告警日志的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
10.根据权利要求9所述的故障告警模型创建装置,其特征在于,所述故障告警日志采集模块包括:
故障告警全日志采集单元,用于获取告警信息样本,并根据所述告警信息样本采集对应的至少一个故障告警全日志;
采集时间确定单元,用于根据告警信息样本的告警时间以及故障告警全日志的类型,确定固定告警全日志的采集时间;以及
故障告警日志采集单元,用于基于所述固定告警全日志的采集时间,从所述固定告警全日志中采集对应的故障告警日志。
11.根据权利要求9所述的故障告警模型创建装置,其特征在于,所述第一词向量化操作模块包括:
去字符串预处理单元,用于对所述故障告警日志进行去字符串预处理;
排序单元,用于按时间顺序,对去字符串预处理后的故障告警日志中的日志语句进行排序;以及
词向量化操作单元,用于使用词向量化工具,对排序后的故障告警日志中每个单词,进行词向量化操作,以获取故障告警日志中每个单词的词向量信息。
12.根据权利要求9所述的故障告警模型创建装置,其特征在于,所述故障告警模型创建装置还包括:
权重信息获取模块,用于根据所述告警信息样本的类型,获取不同类型的故障告警日志的权重信息;以及
合成操作模块,用于根据所述故障告警日志的权重信息,对同一告警信息样本对应的多个故障告警日志的叠加词向量信息进行合成操作,以得到所述告警信息样本的叠加词向量信息;
故障告警模型创建模块用于以所述告警信息样本的叠加词向量信息作为输入、以所述告警信息样本的故障告警类型作为输出,对预设的神经网络模型框架的参数进行神经网络模型训练,从而创建对应的故障告警模型。
13.一种故障告警装置,其特征在于,包括:
待确认故障告警日志采集模块,用于获取待确认告警信息,并根据待确认告警信息采集对应的至少一个待确认故障告警日志;
第二词向量化操作模块,用于使用词向量化工具,对所述待确认故障告警日志进行词向量化操作,以获取所述待确认故障告警日志的词向量信息;
第二叠加操作模块,用于对所述待确认故障告警日志中的每个单词的词向量信息进行叠加操作,以获取所述待确认故障告警日志的叠加词向量信息;
故障告警概率获取模块,用于将所述待确认故障告警日志的叠加词向量信息输入至权利要求10-14中任一的故障告警模型中,以获取所述待确认故障告警日志的故障告警类型的概率;以及
故障告警模块,用于根据所述待确认故障告警日志的故障告警类型的概率进行故障告警操作。
14.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1-6中任一的故障告警模型创建方法。
15.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求7、8中任一的故障告警方法。
CN201810476298.1A 2018-05-17 2018-05-17 故障告警模型创建方法、装置、故障告警方法及装置 Active CN108664374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810476298.1A CN108664374B (zh) 2018-05-17 2018-05-17 故障告警模型创建方法、装置、故障告警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810476298.1A CN108664374B (zh) 2018-05-17 2018-05-17 故障告警模型创建方法、装置、故障告警方法及装置

Publications (2)

Publication Number Publication Date
CN108664374A true CN108664374A (zh) 2018-10-16
CN108664374B CN108664374B (zh) 2020-05-08

Family

ID=63776639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810476298.1A Active CN108664374B (zh) 2018-05-17 2018-05-17 故障告警模型创建方法、装置、故障告警方法及装置

Country Status (1)

Country Link
CN (1) CN108664374B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274421A (zh) * 2018-11-20 2019-01-25 中国电信集团工会上海市委员会 一种传输otn网络端到端电路故障自动定位的方法
CN110263172A (zh) * 2019-06-26 2019-09-20 国网江苏省电力有限公司南京供电分公司 一种电网监控告警信息事件化自主识别方法
CN110334756A (zh) * 2019-06-26 2019-10-15 国网江苏省电力有限公司 电网监控告警事件识别的方法、终端装置、设备和介质
CN111090747A (zh) * 2019-12-03 2020-05-01 国家电网有限公司 一种基于神经网络分类的电力通信故障应急处置方法
CN111338915A (zh) * 2020-05-15 2020-06-26 北京必示科技有限公司 动态告警定级方法、装置、电子设备以及存储介质
CN112925668A (zh) * 2021-02-25 2021-06-08 北京百度网讯科技有限公司 服务器健康评价方法、装置、设备以及存储介质
CN113064769A (zh) * 2020-12-24 2021-07-02 泰州可以信息科技有限公司 大服务器故障排查系统
CN113806180A (zh) * 2021-09-23 2021-12-17 腾云悦智科技(深圳)有限责任公司 一种无监督智能降噪处理方法
CN113825162A (zh) * 2020-06-19 2021-12-21 中国移动通信集团设计院有限公司 电信网络故障原因定位方法及装置
CN113835987A (zh) * 2021-11-25 2021-12-24 北京世纪好未来教育科技有限公司 混沌实验执行文件生成方法、装置、电子设备及存储介质
CN114003479A (zh) * 2021-10-31 2022-02-01 苏州浪潮智能科技有限公司 一种故障日志推送方法、计算机及存储介质
CN115225460A (zh) * 2022-07-15 2022-10-21 北京天融信网络安全技术有限公司 故障判定方法、电子设备和存储介质
CN116069540A (zh) * 2023-02-24 2023-05-05 北京关键科技股份有限公司 一种系统软硬件部位运行状态的采集分析处理方法及装置
CN116089231A (zh) * 2023-02-13 2023-05-09 北京优特捷信息技术有限公司 一种故障告警方法、装置、电子设备及存储介质
CN116991620A (zh) * 2023-08-03 2023-11-03 北京优特捷信息技术有限公司 一种解决方案确定方法、装置、设备及介质
CN114003479B (zh) * 2021-10-31 2024-04-19 苏州浪潮智能科技有限公司 一种故障日志推送方法、计算机及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461842A (zh) * 2013-09-23 2015-03-25 伊姆西公司 基于日志相似性来处理故障的方法和装置
CN105471659A (zh) * 2015-12-25 2016-04-06 华为技术有限公司 一种故障根因分析方法和分析设备
CN107248927A (zh) * 2017-05-02 2017-10-13 华为技术有限公司 故障定位模型的生成方法、故障定位方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461842A (zh) * 2013-09-23 2015-03-25 伊姆西公司 基于日志相似性来处理故障的方法和装置
CN105471659A (zh) * 2015-12-25 2016-04-06 华为技术有限公司 一种故障根因分析方法和分析设备
CN107248927A (zh) * 2017-05-02 2017-10-13 华为技术有限公司 故障定位模型的生成方法、故障定位方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
程孝龙等: "《智慧城市重大危险源安全监控开发设计》", 30 August 2013, 华中科技大学出版社 *
莫兴德等: "《网络信息安全理论与技术》", 30 June 2016, 东北师范大学出版社 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274421A (zh) * 2018-11-20 2019-01-25 中国电信集团工会上海市委员会 一种传输otn网络端到端电路故障自动定位的方法
CN110263172A (zh) * 2019-06-26 2019-09-20 国网江苏省电力有限公司南京供电分公司 一种电网监控告警信息事件化自主识别方法
CN110334756A (zh) * 2019-06-26 2019-10-15 国网江苏省电力有限公司 电网监控告警事件识别的方法、终端装置、设备和介质
CN110263172B (zh) * 2019-06-26 2021-05-25 国网江苏省电力有限公司南京供电分公司 一种电网监控告警信息事件化自主识别方法
CN111090747A (zh) * 2019-12-03 2020-05-01 国家电网有限公司 一种基于神经网络分类的电力通信故障应急处置方法
CN111338915A (zh) * 2020-05-15 2020-06-26 北京必示科技有限公司 动态告警定级方法、装置、电子设备以及存储介质
CN111338915B (zh) * 2020-05-15 2020-09-01 北京必示科技有限公司 动态告警定级方法、装置、电子设备以及存储介质
CN113825162A (zh) * 2020-06-19 2021-12-21 中国移动通信集团设计院有限公司 电信网络故障原因定位方法及装置
CN113064769A (zh) * 2020-12-24 2021-07-02 泰州可以信息科技有限公司 大服务器故障排查系统
CN112925668B (zh) * 2021-02-25 2024-04-05 北京百度网讯科技有限公司 服务器健康评价方法、装置、设备以及存储介质
CN112925668A (zh) * 2021-02-25 2021-06-08 北京百度网讯科技有限公司 服务器健康评价方法、装置、设备以及存储介质
CN113806180A (zh) * 2021-09-23 2021-12-17 腾云悦智科技(深圳)有限责任公司 一种无监督智能降噪处理方法
CN114003479A (zh) * 2021-10-31 2022-02-01 苏州浪潮智能科技有限公司 一种故障日志推送方法、计算机及存储介质
CN114003479B (zh) * 2021-10-31 2024-04-19 苏州浪潮智能科技有限公司 一种故障日志推送方法、计算机及存储介质
CN113835987A (zh) * 2021-11-25 2021-12-24 北京世纪好未来教育科技有限公司 混沌实验执行文件生成方法、装置、电子设备及存储介质
CN115225460A (zh) * 2022-07-15 2022-10-21 北京天融信网络安全技术有限公司 故障判定方法、电子设备和存储介质
CN115225460B (zh) * 2022-07-15 2023-11-28 北京天融信网络安全技术有限公司 故障判定方法、电子设备和存储介质
CN116089231A (zh) * 2023-02-13 2023-05-09 北京优特捷信息技术有限公司 一种故障告警方法、装置、电子设备及存储介质
CN116089231B (zh) * 2023-02-13 2023-09-15 北京优特捷信息技术有限公司 一种故障告警方法、装置、电子设备及存储介质
CN116069540A (zh) * 2023-02-24 2023-05-05 北京关键科技股份有限公司 一种系统软硬件部位运行状态的采集分析处理方法及装置
CN116991620B (zh) * 2023-08-03 2024-02-23 北京优特捷信息技术有限公司 一种解决方案确定方法、装置、设备及介质
CN116991620A (zh) * 2023-08-03 2023-11-03 北京优特捷信息技术有限公司 一种解决方案确定方法、装置、设备及介质

Also Published As

Publication number Publication date
CN108664374B (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN108664374A (zh) 故障告警模型创建方法、装置、故障告警方法及装置
Schlegel et al. Towards a rigorous evaluation of XAI methods on time series
Washizaki et al. Studying software engineering patterns for designing machine learning systems
CN104246759B (zh) 应用程序接口测试服务
CN105164643A (zh) 重算用户接口中的信号捕捉控件
CN102402479B (zh) 用于静态分析的中间表示结构
CN106526376A (zh) 仿真测试系统和仿真测试方法
CN107316082A (zh) 用于确定机器学习样本的特征重要性的方法及系统
CN111243682A (zh) 药物的毒性预测方法及装置、介质和设备
CN108021505A (zh) 数据上线方法、装置和计算机设备
CN109388376A (zh) 软件开发风险评估方法、装置、设备及可读存储介质
US11747405B2 (en) System and method for audio and vibration based power distribution equipment condition monitoring
CN116127899B (zh) 芯片设计系统、方法、电子设备和存储介质
CN106537423A (zh) 作为服务的自适应特征化
CN107942956A (zh) 信息处理装置、信息处理方法、信息处理程序及记录介质
CN108628654A (zh) 基于增强现实和物联网的电子手册系统
CN106502720A (zh) 一种数据处理方法和装置
Muslim et al. A modular and extensible framework for open learning analytics
CN109993506A (zh) 智慧矿山工业物联网操作系统平台性能测试方法
Bajammal et al. A survey on the use of computer vision to improve software engineering tasks
CN116088469A (zh) 一种基于专家系统的通用化故障诊断平台系统
CN115658523A (zh) 一种人机交互界面的自动控制及测试方法和计算机设备
CN115114448A (zh) 智能多模态融合用电检查方法、装置、系统、设备及介质
CN114048024A (zh) 任务部署方法、装置、设备、存储介质及产品
CN110275820A (zh) 页面兼容性测试方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant