CN115225456A - 告警处理方法、装置、设备及存储介质 - Google Patents

告警处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115225456A
CN115225456A CN202210675993.7A CN202210675993A CN115225456A CN 115225456 A CN115225456 A CN 115225456A CN 202210675993 A CN202210675993 A CN 202210675993A CN 115225456 A CN115225456 A CN 115225456A
Authority
CN
China
Prior art keywords
alarm
information
rule
alarm information
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210675993.7A
Other languages
English (en)
Inventor
朱杰
黄文莹
畅亚男
龚华杰
邵壮丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210675993.7A priority Critical patent/CN115225456A/zh
Publication of CN115225456A publication Critical patent/CN115225456A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了告警处理方法、装置、设备及存储介质,所述方法包括:在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;根据所述告警规则对所述告警信息进行告警处理。通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,尽量百分百地保证针对告警处理的自动化,从而节约人工成本。

Description

告警处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种告警处理方法、一种告警处理装置、相应的一种电子设备以及相应的一种计算机存储介质。
背景技术
裸金属服务器通常可无缝对接和兼容云厂商提供的其它云服务,例如网络服务(例如VPC专有网络)、云数据库服务等,而云管平台负责纳管裸金属服务器,为云平台虚拟化提供基础支撑。
云管平台所提供的基础支撑,可表现为实时监控裸金属服务器的资源状态,此时可以以告警的方式将资源状态展示在云管平台,并由运维人员根据经验有选择性地处理相关告警,然而云管平台通常会接收到大量且可能重复的告警信息,需要依赖人工进行告警消除操作,整个告警消除过程耗时且费力。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分的解决上述问题的一种告警处理方法、一种告警处理装置、相应的一种电子设备以及相应的一种计算机存储介质。
本发明实施条例公开了一种告警处理方法,所述方法包括:
在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;
根据所述告警规则对所述告警信息进行告警处理。
可选地,在接收到告警信息时,根据所述告警信息进行告警规则的学习,包括:
对所述告警信息进行分词操作,得到分词结果;所述分词结果包括针对告警信息的关键词;
采用所述关键词生成告警规则,将所述告警规则加入预设规则库。
可选地,在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习,包括:
若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库。
可选地,所述告警规则包括针对所述告警信息的关键词;所述关键词包括告警对象、对象执行任务以及对象执行状态;其中,所述告警对象用于指示需要告警的对象,对象执行任务用于指示所述告警对象的执行动作,对象执行状态用于指示所述告警对象的执行结果。
可选地,所述告警信息用于指示与其相应的网络设备的告警状态,所述根据所述告警规则对所述告警信息进行告警处理,包括:
采用所述告警信息进行告警规则匹配;
根据告警规则匹配的匹配结果,对所述告警信息进行告警处理。
可选地,所述根据告警规则匹配的匹配结果,对所述告警信息进行告警处理,包括:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息符合所述告警规则,则获取与所述告警信息相应的网络设备的设备信息;
采用所述设备信息生成告警报修信息;所述告警报修信息用于指示维修人员对所述告警信息相应的网络设备进行维修;
在接收到针对所述告警报修信息的告警消除指令后,响应所述告警消除指令对所述告警消息进行告警消除操作。
可选地,还包括:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库;
再次根据所述告警规则对所述告警信息进行告警处理,直至在进行告警规则匹配的过程中所述告警信息存在匹配的告警规则为止。
本发明实施例还公开了一种告警处理装置,所述装置包括:
告警规则学习模块,用于在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;
告警处理模块,用于根据所述告警规则对所述告警信息进行告警处理。
可选地,所述告警规则学习模块包括:
分词处理子模块,用于对所述告警信息进行分词操作,得到分词结果;所述分词结果包括针对告警信息的关键词;
告警规则生成子模块,用于采用所述关键词生成告警规则,将所述告警规则加入预设规则库。
可选地,所述告警规则学习模块包括:
告警规则接收子模块,用于在所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息时,接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库。
可选地,所述告警规则包括针对所述告警信息的关键词;所述关键词包括告警对象、对象执行任务以及对象执行状态;其中,所述告警对象用于指示需要告警的对象,对象执行任务用于指示所述告警对象的执行动作,对象执行状态用于指示所述告警对象的执行结果。
可选地,所述告警信息用于指示与其相应的网络设备的告警状态,所述告警处理模块包括:
告警规则匹配子模块,用于采用所述告警信息进行告警规则匹配;
告警规则处理子模块,用于根据告警规则匹配的匹配结果,对所述告警信息进行告警处理。
可选地,所述告警规则处理子模块包括:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息符合所述告警规则,则获取与所述告警信息相应的网络设备的设备信息;
采用所述设备信息生成告警报修信息;所述告警报修信息用于指示维修人员对所述告警信息相应的网络设备进行维修;
在接收到针对所述告警报修信息的告警消除指令后,响应所述告警消除指令对所述告警消息进行告警消除操作。
可选地,所述告警规则处理子模块还包括:
告警规则接收单元,用于在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库;
告警循环处理单元,用于再次根据所述告警规则对所述告警信息进行告警处理,直至在进行告警规则匹配的过程中所述告警信息存在匹配的告警规则为止。
本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现任一项所述告警处理方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现任一项所述告警处理方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,可以在接收到告警信息时或者在基于所接收的告警信息规则进行匹配的过程中,可基于告警信息进行告警规则的学习,通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,且通过后续采用告警规则对告警信息所进行的告警处理,尽量百分百地保证针对告警处理的自动化,从而节约人工成本;此外,还可通过智能学习告警并添加告警规则的方式,进一步降低工作量,实现告警处理的自我学习能力,使得故障处理效率最大化。
附图说明
图1是本发明的一种告警处理方法实施条例的步骤流程图;
图2是本发明实施例提供的告警监控系统的系统框架示意图;
图3是本发明的另一种告警处理方法实施条例的步骤流程图;
图4是本发明实施例提供的告警处理的实施过程示意图;
图5是本发明的又一种告警处理方法实施条例的步骤流程图;
图6是本发明实施例提供的告警处理的应用场景示意图;
图7是本发明的一种告警处理装置实施条例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明做进一步详细的说明。
云管平台接纳与管理全部的裸金属服务器,为云平台虚拟化提供基础支撑,包括计算虚拟化、网络虚拟化、存储虚拟化。云管平台可实时监控裸金属服务器的计算资源、网络资源与存储资源的健康状态,并可以以告警的方式将所监控的资源状态展示在云管平台,并由运维人员根据经验有选择性地处理相关告警,在运维人员选择处理相关告警完成后告警将会被进行告警消除处理。而告警消除处理需要由运维人员在完成告警处理后通知厂家,再由厂家通知备件方,然后通过机房人员进行操作,最后由运维人员确认故障恢复,对告警进行消除。
由上述可知,针对告警的选择处理以及告警消除处理均需要依赖人工进行操作,特别是在云管平台通常会接收到大量且可能重复的告警信息的情况下,整个告警消除过程耗时且费力,且造成故障处理效率低。
本发明实施例提出了基于云管平台的硬件告警智能学习与处理方法,本发明实施条例的核心思想之一在于可自动化智能学习并处理告警信息及自动报修,实现告警消除处理,其主要是通过省略人工判断告警内容的步骤或者过程,将其替换为自动智能学习告警处理的方式,并基于所收集的设备信息进行自动报修,能够快速响应并处理告警,实现告警的闭环;且通过智能学习告警并添加告警规则的方式,基于智能学习告警内容降低人工成本,从而进一步降低工作量,实现告警处理的自我学习能力;以及,生成告警规则的方式还可处理大量重复的告警信息,使得故障处理效率最大化,并可通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,尽量百分百地保证针对告警处理的自动化。
参照图1,示出了本发明的一种告警处理方法实施条例的步骤流程图,具体可以包括如下步骤:
步骤101,在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据告警信息进行告警规则的学习;
为了减少在针对告警的选择处理过程中所需的人工成本,主要可省略人工判断告警内容的步骤或者过程,将其替换为自动智能学习告警处理的方式,实现告警选择处理的自动化的研判操作。
自动智能学习告警处理主要可通过基于所接收的告警信息进行告警规则的学习实现,所进行的告警规则学习具体可表现为告警规则的生成,而学习告警规则的完成具体可表现为将所生成的告警规则加入预设规则库,所加入的预设规则库可以为本地的规则库,也可以为联网获取的规则库,本发明实施例不加以限制。
其中,所生成的告警规则可用于确认所接收的告警规则是否符合告警的条件或者要求,使得无需人为根据经验对告警信息进行研判以选择性地处理相关告警,且有利于对大量重复的告警信息的自动处理。
进行告警规则的学习的时机可以包括在接收到告警信息时,或者在基于所接收的告警信息进行告警规则匹配的过程中,其中进行告警规则匹配的过程通常发生在接收到告警信息并采用告警信息生成告警规则之后,即此时不仅可以在接收到告警信息时进行告警规则生成,还可以在生成告警规则后又再次进行告警规则,这两个时机分别属于前后顺序,可通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,以便后续在采用告警规则对告警信息所进行的告警处理,能够尽量百分百地保证针对告警处理的自动化。
在实际应用中,所生成的告警规则可以为针对告警信息的关键词,即其可以包含用于确认告警信息符合告警的条件或者要求时所需符合的关键词,此关键词可以包含告警对象、对象执行任务以及对象执行状态。其中,告警对象可用于指示需要告警的对象,对象执行任务可用于指示告警对象的执行动作,对象执行状态可用于指示告警对象的执行结果,以便基于上述关键词明确对象、所执行的任务以及执行的状态,明确告警的具体信息,进行告警的精确定位,有利于快速且准确地进行告警定位及告警处理。
步骤102,根据告警规则对告警信息进行告警处理。
所生成的告警规则可用于确认所接收的告警规则是否符合告警的条件或者要求,那么为了减少在告警消除处理过程中所需的人工成本,在进行告警规则的学习后,可基于所生成的告警规则对告警信息进行告警处理,实现告警消除处理的自动化操作。
在实际应用中,告警信息主要用于指示与其相应的网络设备的告警状态,那么此时可采用告警信息进行告警规则匹配,以便基于据告警规则匹配的匹配结果,对告警信息进行告警处理。
其中,所进行的告警处理可表现为告警消除处理,而告警消除处理可表现为对告警信息的报修操作,以及在报修确认后的告警消除操作。在具体实现中,对告警信息的报修操作可通过收集与此告警信息相应网络设备的设备信息,并进行自动报修的方式实现,而告警消除操作具体可通过取消或者消除此告警信息相应网络设备的告警状态实现,从而快速响应并处理设备告警,实现告警的闭环。
在本发明实施例中,可以在接收到告警信息时或者在基于所接收的告警信息规则进行匹配的过程中,可基于告警信息进行告警规则的学习,通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,且通过后续采用告警规则对告警信息所进行的告警处理,尽量百分百地保证针对告警处理的自动化,从而节约人工成本;此外,还可通过智能学习告警并添加告警规则的方式,进一步降低工作量,实现告警处理的自我学习能力,使得故障处理效率最大化。
参照图2,示出了本发明实施例提供的告警处理系统的系统框架示意图,云管平台对于裸金属服务器配备有相应的告警监控系统,此告警处理系统210可以包括告警监控系统211、云中台212以及维修平台213,而告警监控系统211可以包括网络设施2110、云管平台2111。
其中,网络设施2110也可称为网络设备,此网络设施可包括裸金属服务器,裸金属服务器通常可无缝对接和兼容云厂商提供的其他云服务,例如网络服务(例如VPC专有网络)、云数据库服务等,且裸金属服务器的健康状态可以以告警的方式显示在云管平台2111;云管平台2111可负责纳管裸金属服务器,为云平台虚拟化提供基础支撑,包括计算虚拟化、网络虚拟化、存储虚拟化,其主要是管理、监控全部虚拟化层、物理层资源的管理平台,例如可实时监控网络设施的计算资源、网络资源与存储资源的健康状态,对网络设施的告警信息进行采集;云中台212为另外部署的且与云管平台2111网络互通的小型系统,主要可用于接收自云管平台2111的数据以及对所接收的数据进行处理,例如对云管平台2111所采集的告警信息对相应的网络设施进行告警处理,具体可表现为基于告警信息对告警规则的学习与告警规则的匹配过程,以及设备信息的收集与自动报修过程;维修平台213通常为用于向维修人员进行通知的平台,其可分别与云管平台2111以及云中台212进行通信连接,其可基于云中台212所发出的告警报修信息告知维修人员对告警信息相应的网络设施进行维修,且由于发出告警信息的网络设施可以以告警的方式显示在云管平台2111,那么在告知维修人员对此网络设施进行维修后,还可对云管平台2111上所显示的告警信息进行告警消除操作。
在如图2所示的告警处理系统中,可基于云管平台2111集中管理网络设施2110的告警信息的特性,并通过云中台212智能学习告警规则的方式,对网络设施的告警信息进行处理,自动收集与告警信息相应的设备信息并进行报修的告警处理闭环操作,对告警信息进行自动消除,有效地节约运维人员处理告警信息的时间,由云中台212智能学习告警内容,节约所需运维人员处理的大量故障工作,且基于学习告警规则与添加告警规则的方式,进一步降低工作量,在实现自我学习能力,将故障处理效率最大化的同时,实现人工成本的节约,此外还可帮助运维人员节省收集网络设备以进行报修的过程。
参照图3,示出了本发明的另一种告警处理方法实施条例的步骤流程图,云中台212对云管平台2111所采集的告警信息对相应的网络设施进行告警处理,此步骤流程可应用于如图2所示的云中台212,且云中台212可与云管平台2111进行通信连接,具体可以包括如下步骤:
步骤301,通过云中台接收云管平台所采集的告警信息,在接收到告警信息时根据告警信息生成告警规则;
云中台主要可用于接收自云管平台的数据以及对所接收的数据进行处理,例如对云管平台所采集的告警信息对相应的网络设施进行告警处理。
在实际应用中,在云管平台所配置的告警监控系统中,云管平台可采集针对网络设施的告警信息,并向云中台传输所采集的告警信息,以便云中台可基于告警信息对告警规则进行学习与对告警规则进行匹配,以及对设备信息进行收集与自动报修。
云中台对告警规则的学习,可表现生成告警规则,而针对告警规则的学习完成则可具体表现为将所生成的告警规则加入预设规则库,所加入的预设规则库可以为本地的规则库,也可以为联网获取的规则库,本发明实施例不加以限制。其中,所生成的告警规则可用于确认所接收的告警规则是否符合告警的条件或者要求,使得无需人为根据经验对告警信息进行研判以选择性地处理相关告警,且有利于对大量重复的告警信息的自动处理。
在具体实现中,对于云中台进行告警规则的学习的时机可以是在云中台接收到云管平台所传输的告警信息时,可基于告警信息进行告警规则的学习。
所生成的告警规则可以为针对告警信息的关键词,即其可以包含用于确认告警信息符合告警的条件或者要求时所需符合的关键词,那么在进行针对告警信息的告警规则的学习时,可对所接收到的告警信息进行分词操作,即对告警信息进行划分,得到分词结果,此时可采用分词结果中所包含的关键词生成告警规则,并将所生成的告警规则加入预设规则库,表示针对当前的告警信息的告警规则已学习完成。
在实际应用中,所接收的告警信息具有告警名称,此时首先可对告警名称进行分词,并根据分词结果进行关键词匹配,然后基于将所匹配得到的关键词加入到预设规则库中,生成针对当前的告警信息的告警规则。
示例性地,所接收到的告警信息可以如表1所示,所示的告警信息可以为部分网络设施的部分告警信息,所接收的告警信息可以包含告警流水号、云服务、级别以及告警名称等信息:
Figure BDA0003696594640000101
表1
作为一种示例,假设所接收到的告警信息为[告警流水号:1309401299,云服务:Server,级别:重要,告警名称:电源输入丢失],此时可获取告警信息中的告警名称“电源输入丢失”,并对此告警名称进行分词操作,例如划分为“电源”、“输入”、“丢失”,此时同样存在“电源”、“输入”、“丢失”的关键词,那么可将“电源”、“输入”、“丢失”加入预设规则库,生成针对此告警信息的告警规则[“电源”,“输入”,“丢失”];作为又一种示例,假设所接收到的告警信息为[告警流水号:1352401429,云服务:DBS Platform,级别:重要,告警名称:主备实例复制状态异常],此时可获取告警信息中的告警名称“主备实例复制状态异常”,并对此告警名称进行分词操作,例如划分为“主备实例”、“复制”、“状态异常”,此时同样存在“主备实例”、“复制”、“状态异常”的关键词,那么可将“主备实例”、“复制”、“状态异常”加入预设规则库,生成针对此告警信息的告警规则[“主备实例”,“复制”,“状态异常”]。
由上述可知,所生成的告警规则可以为针对告警信息的关键词,其中,关键词通常可以包括告警对象、对象执行任务以及对象执行状态的组合形式。告警对象可用于指示需要告警的对象,其通常可以为发生告警的网络设施;对象执行任务可用于表示当前的操作过程,和/或指示告警对象的执行动作,即为对象在执行任务过程中的某个动作;对象执行状态也可为执行状况,可用于指示告警对象的执行结果,以便基于上述关键词明确对象、所执行的任务以及执行的状态,明确告警的具体信息,进行告警的精确定位,有利于快速且准确地进行告警定位及告警处理。
需要说明的是,所生成的告警规则可以是依次包含告警对象、对象执行任务以及对象执行状态的组合形式,即[告警对象,对象执行任务,对象执行状态],此时是为了明确告警的具体信息,进行告警的精确定位;而在无需进行定位(例如所发生的故障为某个网络设施特有的等)的情况,可能还可以以[对象执行状态]的形式生成告警规则,或者当所发生的故障存在通过解决方案的告警中,可能还可以以[告警对象,对象执行状态]的形式生成告警规则,对于所生成的告警规则的形式以及其所包含的关键词的类型,可依据实际情况进行变动,本发明实施例不加以限制。
步骤302,在基于所接收的告警信息进行告警规则匹配的过程中,若告警信息符合告警规则,则对告警消息进行告警消除操作;
所生成的告警规则可用于确认所接收的告警规则是否符合告警的条件或者要求,那么为了减少在告警消除处理过程中所需的人工成本,在进行告警规则的学习后,可基于所生成的告警规则对告警信息进行告警处理,实现告警消除处理的自动化操作。
在实际应用中,告警信息主要用于指示与其相应的网络设备的告警状态,那么此时可采用告警信息进行告警规则匹配,以便基于据告警规则匹配的匹配结果,对告警信息进行告警处理。
其中,所进行的告警处理可表现为告警消除处理,而告警消除处理可表现为对告警信息的报修操作,以及在报修确认后的告警消除操作。在具体实现中,对告警信息的报修操作可通过收集与此告警信息相应网络设备的设备信息,并进行自动报修的方式实现,而告警消除操作具体可通过取消或者消除此告警信息相应网络设备的告警状态实现,从而快速响应并处理设备告警,实现告警的闭环。
在采用告警信息进行告警规则匹配时,主要可采用所生成的告警规则中所包含的关键词进行匹配,示例性地,假设告警规则为按照[告警对象,对象执行任务,对象执行状态]的组合形式生成,那么在匹配时告警信息中需要完全匹配组合形式中的全部关键词,方可表示为有效的告警信息。
如图4所示,在基于所接收的告警信息进行告警规则匹配的过程中,在一种情况下,可以出现告警信息符合告警规则的情况,此时可获取与告警信息相应的网络设备的设备信息,并采用设备信息生成告警报修信息,所生成的告警报修信息可用于向维修平台发送,并用于指示维修人员对告警信息相应的网络设备进行维修,在维修人员对告警报修信息进行确认后,可基于报修确认信息生成告警消除指令,并由维修平台向云管平台发送告警消除指令,以便云管平台响应告警消除指令对告警消息进行告警消除操作,完成对告警信息进行告警处理的闭环。
在实际应用中,网络设备的设备信息的收集可以表现为在命中之后的自动收集,此时云中台可自动执行脚本,并迁移与告警信息相应的网络设备的相关业务,然后收集相关硬件信息进行报修,以便硬件运维人员会进行备件与更换相关硬件,并在备件与更换后在维修平台进行报修确认,进行后续的告警消除操作。
示例性地,云中台自动采集的设备信息可以如表2所示,设备信息可以包含故障定位、设备物理成名、节点逻辑名称、序列号、BMC IP(Baseboard Management Controller,是一款服务器AC上电起始即运行的软件,负责用于管理整个服务器的元件)、管理IP等信息,以便基于设备信息对所需维修的网络设施进行定位:
故障定位:请更换PSU2
设备物理名称:TS-AZ05-FSTPOD01-SATA-Pooll6-ds006
节点逻辑名称:TSYS-803-0311-931-SEV-RH528-4U12
序列号:2102351CVD10J7012385
BMCIP:10.234.17.149
管理IP:10.124.85.145
表2
在一种可选的实施例中,采用告警信息进行告警规则匹配的过程也可采用模型训练的方式实现,针对模型的训练过程主要可表现对告警规则的不断学习,即通过智能分词,然后根据分词结果进行匹配,并根据匹配结果调整相应的关键词,将匹配的关键词生成告警规则,通过对新的告警规则的不断学习,使得规则库始终处于不断完善的过程,以便尽量百分百地保证针对告警处理的自动化。而对于模型的使用过程,即可表现为将告警信息作为输入项输入所训练得到的模型,然后得到告警规则匹配的匹配结果,其中,一条告警规则可能通过多个关键词精确匹配到相关告警信息。
步骤303,在基于所接收的告警信息进行告警规则匹配的过程中,若告警信息不存在匹配的告警规则,根据告警信息进行告警规则的学习,直至在基于所接收的告警信息进行告警规则匹配的过程中存在符合告警信息的告警规则为止。
如图4所示,在基于所接收的告警信息进行告警规则匹配的过程中,在另一种情况下,可以出现告警信息不存在匹配的告警规则的情况,例如假设告警规则为按照[告警对象,对象执行任务,对象执行状态]的组合形式生成,此时所接收的告警信息并未完全命中所有关键词,即当前的告警信息并不是有效的告警信息,可再一次进行告警规则的学习,并再次根据告警规则对告警信息进行告警处理,直至在基于所接收的告警信息进行告警规则匹配的过程中存在符合告警信息的告警规则为止,直至实现对告警消息的告警消除操作为止。
在这种情况下的告警规则的学习过程,其时机可以是在基于所接收的告警信息进行告警规则匹配的过程中,此过程发生在接收到告警信息后,即不仅可以在接收到告警信息时进行告警规则生成,还可以在生成告警规则后又再次进行告警规则,这两个时机分别属于前后顺序,可通过规则匹配过程中再一次提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,以便后续在采用告警规则对告警信息所进行的告警处理,能够尽量百分百地保证针对告警处理的自动化。
当告警信息不存在匹配的告警规则时,若此时接收到针对告警信息的告警确认信息时,可接收针对告警信息进行自定义的告警规则,并将所接收到的告警规则加入预设规则库,以完成告警规则的再一次学习。
在实际应用中,当告警信息不存在匹配的告警规则时,可人工干预云中台的学习过程,由维修人员人工干预研判告警内容,若此时的人工研判结果为故障告警,那么可在维修平台上生成告警确认信息,并向云管平台发送所生成的告警确认信息,再由云管平台向云中台发送告警确认信息,此时所发送的告警确认信息还可以携带有针对当前的告警信息进行自定义的告警规则,即为人工自定义添加的告警规则,然后再由云中台学习并执行单元轮询匹配告警规则,对此自定义的告警规则进行学习。云中台能够通过人工干预告警学习,添加自定义告警规则的方式以弥补智能学习过程中的不足,并基于自定义的告警规则的实现,也能够快速将维修人员的经验逐渐转化为永久性的告警规则,以便后续对重复告警的自动化处理。
其中,自定义的告警规则可表现为人工手动向预设规则库加入告警规则,例如可能某条告警信息(为全英文或者告警信息涉及数字、符合之类的情况)无法进行分词,此时需要人工手动录入告警规则。加入自定义的告警规则的过程并不影响在接收到告警信息时的匹配过程,所有的告警规则均可加入同一个预设规则库,相当于一个数据集。
在一种可选的实施例中,在基于所接收的告警信息进行告警规则匹配的过程中根据告警信息对告警规则进行学习完成后,还可再次进行根据告警规则匹配的匹配结果,对告警信息进行告警处理的过程,直至在基于所接收的告警信息进行告警规则匹配的过程中存在符合告警信息的告警规则为止。
在本发明实施例中,可以在接收到告警信息时或者在基于所接收的告警信息规则进行匹配的过程中,可基于告警信息进行告警规则的学习,通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,且通过后续采用告警规则对告警信息所进行的告警处理,尽量百分百地保证针对告警处理的自动化,从而节约人工成本;此外,还可通过智能学习告警并添加告警规则的方式,进一步降低工作量,实现告警处理的自我学习能力,使得故障处理效率最大化。
参照图5,示出了本发明的又一种告警处理方法实施条例的步骤流程图,云中台212对云管平台2111所采集的告警信息对相应的网络设施进行告警处理,此步骤流程可应用于如图2所示的云中台212,且云中台212可与云管平台2111进行通信连接,具体可以包括如下步骤:
步骤501,通过云中台接收云管平台所采集的告警信息,在基于所接收的告警信息进行告警规则匹配的过程中,根据告警信息生成告警规则;
在本发明实施例中,步骤501可以是步骤303的具体步骤,也可以是步骤303中进行再次的告警规则的学习的循环过程,即在步骤501中所描述的在基于所接收的告警信息进行告警规则匹配的过程中,根据告警信息生成告警规则的过程,可以是在告警信息不存在匹配的告警规则这种情况下,所进行的第N次(N为正整数)告警规则的学习操作,即在如图4人工干预学习后的,那么如图5所示的步骤流程可以为如图4所示的循环过程,即在告警信息不存在匹配的告警规则时,可不断根据告警信息进行告警规则的学习,然后不断根据告警规则对告警信息进行告警处理,即对告警规则进行匹配,直至在告警规则匹配的过程中存在符合告警信息的告警规则为止。
在基于所接收的告警信息进行告警规则匹配的过程中根据告警信息生成告警规则的过程,是在进行告警规则匹配时告警信息并不存在匹配的告警规则的情况下进行的。通过规则匹配过程中再一次提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,以便后续在采用告警规则对告警信息所进行的告警处理,能够尽量百分百地保证针对告警处理的自动化。
当告警信息不存在匹配的告警规则时,若此时接收到针对告警信息的告警确认信息时,可接收针对告警信息进行自定义的告警规则,并将所接收到的告警规则加入预设规则库,以完成告警规则的再一次学习。
在实际应用中,当告警信息不存在匹配的告警规则时,可人工干预云中台的学习过程,由维修人员人工干预研判告警内容,若此时的人工研判结果为故障告警,那么可在维修平台上生成告警确认信息,并向云管平台发送所生成的告警确认信息,再由云管平台向云中台发送告警确认信息,此时所发送的告警确认信息还可以携带有针对当前的告警信息进行自定义的告警规则,即为人工自定义添加的告警规则,然后再由云中台学习并执行单元轮询匹配告警规则,对此自定义的告警规则进行学习。云中台能够通过人工干预告警学习,添加自定义告警规则的方式以弥补智能学习过程中的不足,并基于自定义的告警规则的实现,也能够快速将维修人员的经验逐渐转化为永久性的告警规则,以便后续对重复告警的自动化处理。
其中,自定义的告警规则可表现为人工手动向预设规则库加入告警规则,例如可能某条告警信息(为全英文或者告警信息涉及数字、符合之类)无法进行分词,此时需要人工手动录入告警规则。加入自定义的告警规则的过程并不影响在接收到告警信息时的匹配过程,所有的告警规则均可加入同一个预设规则库,相当于一个数据集。
步骤502,根据告警规则匹配的匹配结果,对告警信息进行告警处理。
在本发明的一种实施例中,在基于所接收的告警信息进行告警规则匹配的过程中根据告警信息对告警规则进行学习完成后,还可再次进行根据告警规则匹配的匹配结果,对告警信息进行告警处理的过程,直至在基于所接收的告警信息进行告警规则匹配的过程中存在符合告警信息的告警规则为止。
基于对匹配结果对告警信息所进行的告警处理,如图4所示,在基于所接收的告警信息进行告警规则匹配的过程中,在一种情况下,可以出现告警信息符合告警规则的情况,例如假设告警规则为按照[告警对象,对象执行任务,对象执行状态]的组合形式生成,此时所接收的告警信息并完全命中所有关键词,即当前的告警信息为有效的告警信息,此时可获取与告警信息相应的网络设备的设备信息,并采用设备信息生成告警报修信息,所生成的告警报修信息可用于向维修平台发送,并用于指示维修人员对告警信息相应的网络设备进行维修,在维修人员对告警报修信息进行确认后,可基于报修确认信息生成告警消除指令,并由维修平台向云管平台发送告警消除指令,以便云管平台响应告警消除指令对告警消息进行告警消除操作,完成对告警信息进行告警处理的闭环。
如图4所示,在另一种情况下,可以出现告警信息不存在匹配的告警规则的情况,例如假设告警规则为按照[告警对象,对象执行任务,对象执行状态]的组合形式生成,此时所接收的告警信息并未完全命中所有关键词,即当前的告警信息并不是有效的告警信息,可再一次进行告警规则的学习,即返回到步骤501并继续执行如图5所示的步骤流程,直至在基于所接收的告警信息进行告警规则匹配的过程中存在符合告警信息的告警规则为止,直至实现对告警消息的告警消除操作为止。
在本发明实施例中,可以在接收到告警信息时或者在基于所接收的告警信息规则进行匹配的过程中,可基于告警信息进行告警规则的学习,通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,且通过后续采用告警规则对告警信息所进行的告警处理,尽量百分百地保证针对告警处理的自动化,从而节约人工成本;此外,还可通过智能学习告警并添加告警规则的方式,进一步降低工作量,实现告警处理的自我学习能力,使得故障处理效率最大化。
参照图6,示出了本发明实施例提供的告警处理的应用场景示意图,可应用在用户使用云管平台进行网络设备告警监控时,处理硬件类告警的场景,此时可采用本发明实施例所提出的基于云管平台的告警智能学习与处理方法。
在此应用场景下,云管平台对于裸金属服务器配备有相应的告警监控系统,此告警处理系统可以包括告警监控系统、云中台以及维修平台,而告警监控系统可以包括网络设施、云管平台,在本应用场景中告警监控系统所包括的网络设施可表现为硬件网络设施。
在本发明实施例中,可基于云管平台集中管理硬件网络设施的告警信息的特性,并通过云中台智能学习告警规则的方式,对网络设施的告警信息进行处理,自动收集与告警信息相应的设备信息并进行报修的告警处理闭环操作,对告警信息进行自动消除。
在具体过程中,其可包含告警采集过程、告警智能学习过程、云中台匹配过程,以及自动报修及告警消除过程。
(1)在告警采集过程中,云管平台可通过对于硬件网络设置所配置的告警监控系统采集告警信息,当云管平台采集到告警信息后,将告警信息集中运送至云中台;
(2)在告警智能学习过程中,云中台的子流程可根据告警信息中的告警内容,具体为告警名称进行学习得到告警的关键词,针对告警的关键词生成告警规则,同时云中台的子流程还将会进行告警规则的匹配,进入云中台匹配过程;
(3)在云中台匹配过程中,云中台可根据学习到的告警规则进行告警信息的匹配,如果所接收的告警信息匹配到相应的告警规则,则可触发云中台自动收集该告警涉及的硬件设备信息,即进入自动报修及告警消除过程,如果所接收的告警信息未匹配到相关的告警规则,则此时还可提供再一次的告警规则的学习机会,通常可由人工干预研判告警内容以及干预智能学习,若此时人工的研判结果为硬件故障告警,则需要人工添加一条自定义的告警规则,并由云中台学习并执行单元轮询匹配告警规则,直至云中台匹配过程中所接收的告警信息存在匹配的告警规则为止;
(4)在云中台匹配过程中若所接收的告警信息存在匹配的告警规则,那么即可进入自动报修及告警消除过程,此时可触发云中台自动收集该告警信息所涉及的硬件网络设施的设备信息,并自动判断与告警信息相应的硬件网络设施中是否存在业务,并将所涉及的业务进行迁空操作,然后可将硬件设备信息中携带的故障定位信息(具体为硬件故障点)、设备名称、逻辑节点名称、序列号、管理IP、BMC IP等信息,以及硬件更换信息自动通过维修平台发送至现场的硬件维护人员,硬件人员在接收到报修信息并确定为硬件故障后,则会进行备件以及机房更换配件等措施,在进行维修后,可通过维修平台生成维修确认信息,并基于此维修确认信息生成告警消除指令,向云管平台发送告警消除指令,以便云管平台响应告警消除指令对告警消息进行告警消除操作,完成对告警信息进行告警处理的闭环。
在本发明实施例中,通过智能学习告警的方式让云中台学会自动告警处理,节约所需运维人员处理的大量故障工作,且基于学习告警规则与添加告警规则的方式,进一步降低工作量,在实现自我学习能力,将故障处理效率最大化的同时,实现人工成本的节约;且云中台还可全天候处理硬件告警,保证时效性,使得故障处理效率最大化。
需要说明的是,本发明实施例所提出的基于云管平台的告警智能学习与处理方法,不仅可应用于针对硬件的告警消除处理,还可以基于适应性地变通与调整,应用在任意的告警消除,对此,本发明实施例不加以限制。
本发明实施例可自动化智能学习并处理告警信息及自动报修,实现告警消除处理,其主要是通过省略人工判断告警内容的步骤或者过程,将其替换为自动智能学习告警处理的方式,并基于所收集的设备信息进行自动报修,能够快速响应并处理告警,实现告警的闭环;且通过智能学习告警并添加告警规则的方式,基于智能学习告警内容降低人工成本,从而进一步降低工作量,实现告警处理的自我学习能力;以及,生成告警规则的方式还可处理大量重复的告警信息,使得故障处理效率最大化,并可通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,尽量百分百地保证针对告警处理的自动化。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优先实施例,所涉及的动作并不一定是本发明实施例所必需的。
参照图7,示出了本发明的一种告警处理装置实施条例的结构框图,具体可以包括如下模块:
告警规则学习模块701,用于在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;
告警处理模块702,用于根据所述告警规则对所述告警信息进行告警处理。
在本发明的一种实施例中,告警规则学习模块701可以包括如下子模块:
分词处理子模块,用于对所述告警信息进行分词操作,得到分词结果;所述分词结果包括针对告警信息的关键词;
告警规则生成子模块,用于采用所述关键词生成告警规则,将所述告警规则加入预设规则库。
在本发明的一种实施例中,告警规则学习模块701可以包括如下子模块:
告警规则接收子模块,用于在所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息时,接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库。
在本发明的一种实施例中,所述告警规则包括针对所述告警信息的关键词;所述关键词包括告警对象、对象执行任务以及对象执行状态;其中,所述告警对象用于指示需要告警的对象,对象执行任务用于指示所述告警对象的执行动作,对象执行状态用于指示所述告警对象的执行结果。
在本发明的一种实施例中,所述告警信息用于指示与其相应的网络设备的告警状态,告警处理模块702可以包括如下子模块:
告警规则匹配子模块,用于采用所述告警信息进行告警规则匹配;
告警规则处理子模块,用于根据告警规则匹配的匹配结果,对所述告警信息进行告警处理。
在本发明的一种实施例中,告警规则处理子模块可以包括如下单元:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息符合所述告警规则,则获取与所述告警信息相应的网络设备的设备信息;
采用所述设备信息生成告警报修信息;所述告警报修信息用于指示维修人员对所述告警信息相应的网络设备进行维修;
在接收到针对所述告警报修信息的告警消除指令后,响应所述告警消除指令对所述告警消息进行告警消除操作。
在本发明的一种实施例中,告警规则处理子模块还可以包括如下单元:
告警规则接收单元,用于在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库;
告警循环处理单元,用于再次根据所述告警规则对所述告警信息进行告警处理,直至在进行告警规则匹配的过程中所述告警信息存在匹配的告警规则为止。
在本发明实施例中,可以在接收到告警信息时或者在基于所接收的告警信息规则进行匹配的过程中,可基于告警信息进行告警规则的学习,通过规则匹配前与规则匹配过程中的两个时机均提供告警规则的学习,不断完善规则库,提高规则库对于告警信息的覆盖率,且通过后续采用告警规则对告警信息所进行的告警处理,尽量百分百地保证针对告警处理的自动化,从而节约人工成本;此外,还可通过智能学习告警并添加告警规则的方式,进一步降低工作量,实现告警处理的自我学习能力,使得故障处理效率最大化。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法实施条例的部分说明即可。
本发明实施例还提供了一种电子设备,包括:
包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述告警处理方法实施条例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述告警处理方法实施条例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施条例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施条例的实施例可提供为方法、装置或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施条例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施条例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施条例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施条例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优先实施条例以及落入本发明实施条例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其他任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者还是包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种告警处理方法、一种告警处理装置、相应的一种电子设备以及相应的一种计算机存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施条例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种告警处理方法,其特征在于,所述方法包括:
在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;
根据所述告警规则对所述告警信息进行告警处理。
2.根据权利要求1所述的方法,其特征在于,在接收到告警信息时,根据所述告警信息进行告警规则的学习,包括:
对所述告警信息进行分词操作,得到分词结果;所述分词结果包括针对告警信息的关键词;
采用所述关键词生成告警规则,将所述告警规则加入预设规则库。
3.根据权利要求1所述的方法,其特征在于,在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习,包括:
若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库。
4.根据权利要求1或2或3所述的方法,其特征在于,所述告警规则包括针对所述告警信息的关键词;所述关键词包括告警对象、对象执行任务以及对象执行状态;其中,所述告警对象用于指示需要告警的对象,对象执行任务用于指示所述告警对象的执行动作,对象执行状态用于指示所述告警对象的执行结果。
5.根据权利要求1所述的方法,其特征在于,所述告警信息用于指示与其相应的网络设备的告警状态,所述根据所述告警规则对所述告警信息进行告警处理,包括:
采用所述告警信息进行告警规则匹配;
根据告警规则匹配的匹配结果,对所述告警信息进行告警处理。
6.根据权利要求5所述的方法,其特征在于,所述根据告警规则匹配的匹配结果,对所述告警信息进行告警处理,包括:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息符合所述告警规则,则获取与所述告警信息相应的网络设备的设备信息;
采用所述设备信息生成告警报修信息;所述告警报修信息用于指示维修人员对所述告警信息相应的网络设备进行维修;
在接收到针对所述告警报修信息的告警消除指令后,响应所述告警消除指令对所述告警消息进行告警消除操作。
7.根据权利要求5或6所述的方法,其特征在于,还包括:
在基于所接收的告警信息进行告警规则匹配的过程中,若所述告警信息不存在匹配的告警规则,且接收到针对所述告警信息的告警确认信息,则接收针对所述告警信息进行自定义的告警规则,并将所述告警规则加入预设规则库;
再次根据所述告警规则对所述告警信息进行告警处理,直至在进行告警规则匹配的过程中所述告警信息存在匹配的告警规则为止。
8.一种告警处理装置,其特征在于,所述装置包括:
告警规则学习模块,用于在接收到告警信息时或者在基于所接收的告警信息进行告警规则匹配的过程中,根据所述告警信息进行告警规则的学习;
告警处理模块,用于根据所述告警规则对所述告警信息进行告警处理。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述告警处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述告警处理方法的步骤。
CN202210675993.7A 2022-06-15 2022-06-15 告警处理方法、装置、设备及存储介质 Pending CN115225456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210675993.7A CN115225456A (zh) 2022-06-15 2022-06-15 告警处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210675993.7A CN115225456A (zh) 2022-06-15 2022-06-15 告警处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115225456A true CN115225456A (zh) 2022-10-21

Family

ID=83607973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210675993.7A Pending CN115225456A (zh) 2022-06-15 2022-06-15 告警处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115225456A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268399A (zh) * 2021-06-15 2021-08-17 上海天正信息科技有限公司 一种告警处理方法、装置和电子设备
WO2021174835A1 (zh) * 2020-03-04 2021-09-10 平安科技(深圳)有限公司 告警信息处理方法、装置、计算机装置及存储介质
CN114091704A (zh) * 2021-11-26 2022-02-25 奇点浩翰数据技术(北京)有限公司 一种告警压制方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021174835A1 (zh) * 2020-03-04 2021-09-10 平安科技(深圳)有限公司 告警信息处理方法、装置、计算机装置及存储介质
CN113268399A (zh) * 2021-06-15 2021-08-17 上海天正信息科技有限公司 一种告警处理方法、装置和电子设备
CN114091704A (zh) * 2021-11-26 2022-02-25 奇点浩翰数据技术(北京)有限公司 一种告警压制方法和装置

Similar Documents

Publication Publication Date Title
US11704189B1 (en) System and method for autonomous data center operation and healing
CN110796343A (zh) 智能派工方法及装置、系统
CN110086664B (zh) 一种接入设备故障处理方法及装置
CN106776243B (zh) 一种针对监控软件的监控方法及装置
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN105162632A (zh) 一种服务器集群故障自动处理系统
CN109274531A (zh) 数据采集设备重启方法、系统及计算机可读存储介质
CN110097196A (zh) 一种智能化运维管理方法及系统
EP3885854B1 (en) Data analysis method, device and system
CN108764739A (zh) 智能机器人控制系统及方法、可读存储介质
CN112148733A (zh) 确定故障类型的方法、装置、电子装置和计算机可读介质
CN114285725A (zh) 网络故障确定方法及装置、存储介质及电子设备
CN109905268B (zh) 网络运维的方法及装置
CN113672427A (zh) 基于rpa及ai的异常处理方法、装置、设备及介质
CN111626445A (zh) 一种电器维修方法、装置、电子设备及存储介质
CN106789234B (zh) 呼叫中心的自动告警测试系统及方法
CN103024425A (zh) 一种结合故障检测和工作流的智能报修监控设备的新方法
CN115225456A (zh) 告警处理方法、装置、设备及存储介质
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN105025179A (zh) 呼叫中心座席的监控方法及系统
CN103902429A (zh) 在自动化测试中进行预警的方法、服务器和系统
CN117221089A (zh) 一种设备监测方法、服务器及设备监测系统
CN106649414B (zh) 一种数据仓库数据异常的预检测方法和设备
CN116645088A (zh) 城轨信息模型构件划分与机电设备运维方法及装置
CN114374996A (zh) 一种故障处理方法、装置、设备及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination