CN105549508B - 一种基于信息合并的报警方法及装置 - Google Patents

一种基于信息合并的报警方法及装置 Download PDF

Info

Publication number
CN105549508B
CN105549508B CN201510997948.3A CN201510997948A CN105549508B CN 105549508 B CN105549508 B CN 105549508B CN 201510997948 A CN201510997948 A CN 201510997948A CN 105549508 B CN105549508 B CN 105549508B
Authority
CN
China
Prior art keywords
equipment
unnatural proportions
equipment group
warping apparatus
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510997948.3A
Other languages
English (en)
Other versions
CN105549508A (zh
Inventor
李跃红
任建峰
梁敬彪
曾志海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qizhi Business Consulting Co ltd
Beijing Qihoo Technology Co Ltd
360 Digital Security Technology Group Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510997948.3A priority Critical patent/CN105549508B/zh
Publication of CN105549508A publication Critical patent/CN105549508A/zh
Application granted granted Critical
Publication of CN105549508B publication Critical patent/CN105549508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/048Monitoring; Safety

Abstract

本发明涉及一种基于信息合并的报警方法及装置,所述方法包括:监测多个设备并判断所述多个设备中的异常设备;判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;发送所述第一报警信息。本发明的技术方案,通过在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰。

Description

一种基于信息合并的报警方法及装置
技术领域
本发明涉及智能监控技术领域,具体而言,涉及一种基于信息合并的报警方法及装置。
背景技术
随着网络高访问量的提升,越来越多的集群和机器用于做负载均衡。此时,服务器是否正常提供业务已经成为高可用性业务的一个衡量指标。
为了保证服务器能够正常提供业务,现有技术通过请求每台服务器的接口,若按照约定格式返回错误则触发短信报警,实现服务器的监控。但是如果同机房线路故障,则会导致大面积的服务器报警,频繁重复的短信报警,不仅会对技术运维人员产生不必要的困扰,而且也会造成一定的资源浪费。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决或者减缓上述问题的基于信息合并的报警方法及装置,在实现准确监测的前提下进行合并报警,以减少对监测资源的浪费以及频繁报警带来的困扰。
根据本发明的一个方面,提供了一种基于信息合并的报警方法,所述方法包括:
监测多个设备并判断所述多个设备中的异常设备;
判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
发送所述第一报警信息。
其中,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
其中,所述若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括:
获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
其中,所述若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括:
获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
其中,所述方法还包括:
若所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例,则确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息;
发送所述第二报警信息。
其中,所述设备报警信息中包括设备标识;
相应地,所述获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息,进一步包括:
提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
其中,所述确定所述设备组的当前异常比例之后,还包括:
将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;
若所述设备组的当前异常比例与该设备组上一次的异常比例相同,则延长监测所述设备组的监测时间周期。
其中,所述方法还包括:
若所述当前异常比例小于预设容灾比例,则延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
其中,所述获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,还包括:
根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
根据本发明的另一个方面,提供了一种一种基于信息合并的报警装置,所述装置包括:
监测单元,适于监测多个设备并判断所述多个设备中的异常设备;
确定单元,适于判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
合并单元,适于在所述确定单元确定所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例时,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
发送单元,适于所述第一报警信息。
其中,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
其中,所述装置还包括:
第一获取单元,适于在所述合并单元获取为各异常设备生成的设备报警信息之前,获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
其中,所述装置还包括:
第二获取单元,适于在所述合并单元获取为各异常设备生成的设备报警信息之前,获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
其中,所述装置还包括:
生成单元,适于在所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例时,确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息;
所述发送单元,还适于发送所述第二报警信息。
其中,所述设备报警信息中包括设备标识;
所述合并单元,具体适于提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
其中,所述装置还包括:
比较单元,适于在所述确定单元确定所述设备组的当前异常比例之后,将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;
处理单元,适于在所述比较单元的比较结果为所述设备组的当前异常比例与该设备组上一次的异常比例相同时,延长监测所述设备组的监测时间周期。
其中,所述处理单元还适于在所述当前异常比例小于预设容灾比例时,延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
其中,所述确定单元,还适于在所述合并单元获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
本发明提供的基于信息合并的报警方法及装置,在多个设备的监测过程中,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例时,获取为设备组中的异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到合并报警信息,进而在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示意性示出了本发明一个实施例的基于信息合并的报警方法的流程示意图;
图2示意性示出了本发明另一实施例的基于信息合并的报警方法的流程示意图;
图3示意性示出了本发明一个实施例的基于信息合并的报警装置的结构示意图;
图4示意性示出了本发明另一实施例的基于信息合并的报警装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
以下将结合附图对本发明实施例的基于信息合并的报警方法和基于信息合并的报警装置进行详细说明。
为实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰,节约设备检测的经济成本,本发明提出一种基于信息合并的报警方法,包括:监测多个设备并判断所述多个设备中的异常设备;判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;发送所述第一报警信息。
需要说明的是,在上下文中所称“设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑等。
图1示意性示出了本发明一个实施例的基于信息合并的报警方法的流程示意图。
参照图1,本发明实施例的基于信息合并的报警方法具体包括以下步骤:
S11、监测多个设备并判断所述多个设备中的异常设备。
具体的,可通过预先配置的监控列表、监测时间周期以及监测方式、监测结果返回格式,实现对监控列表中的多个设备的监测,并根据返回的监测结果确定监控列表中的多个设备的当前状态,以判断所述多个设备中的异常设备。
需要说明的是,异常设备为设备运行中存在异常状态的设备,具体可根据监测过程中返回的监测结果进行确定。
可理解的是,每台设备可承载相应的一种或多种数据业务,为前端服务器提供数据服务支持。
其中,监测并采集返回的监测结果的方式包括但不限于:
ganglia监控方式;zabbix监控方式;nagios监控方式。
其中,每种监测方式对应的监控项包括但不限于:CPU负载率;可用磁盘容量;I/O数量,即每秒对磁盘读写总次数;网络流量;内存占用率。在此,监控项可为运维人员在监控之前根据监控需求预先设置的。
S12、判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例。
可理解的是,所述当前异常比例为所述设备组中当前存在的异常设备数量所占该设备组中总设备数量的比例。
具体的,根据步骤S11中在多个设备中确定出的异常设备,确定属于同一设备组的设备中所述异常设备的数量,进而确定同一设备组的当前异常比例。
在一个具体示例中,若监控返回错误状态,则统计本次批量监控的多个设备所在设备组以及异常设备数量。比如:本次监控共200台设备,其中BJDT设备组80台,异常40台,ZWT设备组50台,异常48台,BJCC设备组50台,异常2台,CCT设备组20台,异常3台。进一步,确定同一设备组的当前异常比例。
S13、若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息。
需要说明的是,所述预设异常比例为设备组的实际容灾比,本发明不需要对所述预设异常比例的具体取值进行限定,本领域技术人员需要设备组的实际应用情况进行设置。
本实施例中,当设备组中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例(即设备组的实际容灾比)时,通过获取为设备组中各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,以得到第一报警信息,进而实现多个异常设备的合并报警。
S14、发送所述第一报警信息。
在具体实现中,第一报警信息的发送可通过多种方式实现,例如:通过短信,或,邮件的方式实现第一报警信息的发送。
需要说明的是,上面提到的第一报警信息的发送方式仅是举例,除了上述情况之外还可以包括其他的情况,如,邮件+短信,或语音电话等。本实施例不需要对具体根据怎样的模式实现第一报警信息的发送进行限定,本领域技术人员需要根据实际应用进行设置。
本发明实施例提供的基于信息合并的报警方法,通过在多个设备的监测过程中,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例时,获取为设备组中的异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到合并报警信息,进而在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰。
在本发明的一个优选实施例中,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
在一个具体示例中,可根据设备的地址信息确定设备是否为属于相同线路的设备,进而确定是否可以被归于同一设备组。其中,设备的地址信息可以为路由地址和/或IP地址等。例如,可根据设备的IP地址,通过判断不同设备的IP地址是否属于同一IP地址段判断这些设备是否属于同一设备组。
在一个具体示例中,可根据设备处理的业务类型确定设备是否为处理相同或相关的业务的设备,进而确定是否可以被归于同一设备组。其中,设备的业务类型可以为路由地址和/或IP地址等。例如,可根据设备的IP地址,通过判断不同设备的IP地址是否属于同一IP地址段判断这些设备是否属于同一设备组。
在本发明的一个优选实施例中,在步骤S13中的若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括以下图中未示出的步骤:获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
其中,设备数量为设备组中的设备总数量。
本实施例中,对于相同类型集群中的设备组,如都是web集群中的设备组,则通过设备数量确定对应的预设异常比例。具体的通过根据设备组中的设备数量查找第一映射关系,以获得与设备数量对应的预设异常比例,其中,第一映射关系为预先设置的,第一映射关系中包括:设备数量和预设异常比例之间的对应关系。
在本发明的一个优选实施例中,在步骤S13中的若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括以下图中未示出的步骤:获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
其中,标识信息用于唯一标示设备组,可根据实际应用进行设置。
本实施例中,对于不同类型的集群中的设备组,则通过设备组的类型确定对应的预设异常比例。具体的,通过根据设备组的标识信息查找第二映射关系,以获得与标识信息对应的预设异常比例,其中,第一映射关系为预先设置的,第二映射关系中包括:标识信息与预设异常比例之间的对应关系。
需要说明的是,上述两种确定预设异常比例的方式仅是举例,除了上述情况之外还可以包括其他的情况,如,综合两种确定预设异常比例的方式,例如:先判断类型再判断数量等。本领域技术人员需要根据实际应用进行设置。
图2示意性示出了本发明另一实施例的基于信息合并的报警方法的流程示意图。
参照图2,本发明实施例的基于信息合并的报警方法具体包括以下步骤:
S21、监测多个设备并判断所述多个设备中的异常设备。
S22、判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例。
S23、若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息。
需要说明的是,所述预设异常比例为设备组的实际容灾比,本发明不需要对所述预设异常比例的具体取值进行限定,本领域技术人员需要设备组的实际应用情况进行设置。
本实施例中,当设备组中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例(即设备组的实际容灾比)时,通过获取为设备组中各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,以得到第一报警信息,进而实现多个异常设备的合并报警。
S24、发送所述第一报警信息。
S25、若所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例,则确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息。
本实施例中,当设备组中存在多个异常设备且对应的所述设备组的当前异常比例大于或等于预设异常比例(即设备组的实际容灾比)时,则确定所述设备组存在线路故障,同时取消为各异常设备生成的设备报警信息并通过生成用于线路故障报警的第二报警信息,实现多个异常设备的合并报警。
S26、发送所述第二报警信息。
在具体实现中,第一报警信息和第二报警信息的发送可通过多种方式实现,例如:通过短信,或,邮件的方式实现第一报警信息的发送。
需要说明的是,上面提到的报警信息的发送方式仅是举例,除了上述情况之外还可以包括其他的情况,如,邮件+短信,或语音电话等。本实施例不需要对具体根据怎样的模式实现报警信息的发送进行限定,本领域技术人员需要根据实际应用进行设置。
本发明实施例提供的基于信息合并的报警方法,通过在多个设备的监测过程中,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例时,获取为设备组中的异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到合并报警信息,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例大于或等于预设异常比例时,确定所述设备组存在线路故障,同时取消为各异常设备生成的设备报警信息并通过生成用于线路故障报警的第二报警信息,进而在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰。
进一步地,所述设备报警信息中包括设备标识;
相应地,步骤S23中的获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息,具体为:提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
在一个具体示例中,通过将各设备标识进行合并的方式生成第一报警信息格式可采用如下方式实现,本发明对此不做具体限定。格式为:某设备组,4%的机器异常,bjcc01,bjcc02,bjcc03,bjcc04,或,某业务:ZWT机房4%的机器异常,bjcc01,bjcc02,bjcc03,bjcc04。
本发明实施例中,通过提取各设备报警信息中的设备标识,并将各设备标识进行合并的方式生成第一报警信息,不仅可以报警信息,还可以通过合并后的报警信息得到设备中异常设备的标识信息,进一步保证监测信息的精确性。
此外,当确定所述设备组存在线路故障是,生成的用于线路故障报警的第二报警信息的信息格式可采用如下方式实现,本发明对此不做具体限定。格式为:某设备组,90%异常,请确认是否线路故障,或,某业务:ZWT机房90%异常,请确认是否线路故障。
在本发明的一个优选实施例中,所述确定所述设备组的当前异常比例之后,还包括以下步骤:将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;若所述设备组的当前异常比例与该设备组上一次的异常比例相同,则延长监测所述设备组的监测时间周期。
本发明实施例中,通过将设备组的当前异常比例与该设备组上一次的异常比例进行比较,并在该设备组的当前异常比例与该设备组上一次的异常比例相同时,延长监测所述设备组的监测时间周期,实现监测时间周期的动态调整。
在一个具体示例中,动态调整监测时间周期的具体实现,如本次1分钟,下次3分钟,第3次5分钟,第4-10次10分钟,大于10次60分钟。
在一个具体示例中,动态调整监测时间周期的具体实现也可以通过每次延长预设的时间长度实现。
需要说明的是,上面提到的动态调整监测时间周期的方式仅是举例,除了上述情况之外还可以包括其他的情况,如,邮件+短信,或语音电话等。本实施例不需要对具体根据怎样的模式实现监测时间周期的调整进行限定,本领域技术人员可根据实际应用进行设置。
此外,在本发明实施例保护的技术方案中,还包括以下步骤:记录存在异常设备的设备组信息或发生线路故障的设备组信息。一旦该设备组服务恢复,则发短信提醒告之设备组服务已经恢复,并将动态调整报警时间策略取消。这样不仅能达到准确提醒报警功能,更能减少对资源浪费、频繁骚扰的困扰,尤其是夜间。
在本发明的一个优选实施例中,所述方法还包括:若所述当前异常比例小于预设容灾比例,则延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
需要说明的是,所述预设容灾比例为小于所述预设异常比例的值。
在本发明实施例中,在当前异常比例小于预设容灾比例时,即可认为当前的设备异常不对影响总体业务服务,可延长监测所述设备组的监测时间周期,进而在不影响总体业务服务的前提下,减少对资源浪费、频繁骚扰的困扰,尤其是夜间。
在本发明的一个优选实施例中,所述获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,还包括:根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
图3示意性示出了本发明一个实施例的基于信息合并的报警装置的结构示意图。
参照图3,本发明实施例的基于信息合并的报警装置具体包括监测单元301、确定单元302、合并单元303以及发送单元304,其中:
所述监测单元301,适于监测多个设备并判断所述多个设备中的异常设备;
所述确定单元302,适于判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
所述合并单元303,适于在所述确定单元302确定所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例时,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
所述发送单元304,适于所述第一报警信息。
本发明实施例提供的基于信息合并的报警装置,通过在多个设备的监测过程中,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例时,获取为设备组中的异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到合并报警信息,进而在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰。
在本发明实施例中,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
根据本发明的一个优选实施例,所述装置还包括附图中未示出的第一获取单元:
所述第一获取单元,适于在所述合并单元303获取为各异常设备生成的设备报警信息之前,获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
根据本发明的一个优选实施例,所述装置还包括附图中未示出的第二获取单元:
所述第二获取单元,适于在所述合并单元303获取为各异常设备生成的设备报警信息之前,获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
图4示意性示出了本发明一个实施例的基于信息合并的报警装置的结构示意图。
参照图4,本发明实施例的基于信息合并的报警装置具体包括监测单元401、确定单元402、合并单元403、生成单元404以及发送单元405,其中:
所述监测单元401,适于监测多个设备并判断所述多个设备中的异常设备;
所述确定单元402,适于判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
所述合并单元403,适于在所述确定单元402确定所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例时,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
所述发送单元405,适于所述第一报警信息。
所述生成单元404,适于在所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例时,确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息;
相应地,所述发送单元405,还适于发送所述第二报警信息。
根据本发明的一个优选实施例,所述设备报警信息中包括设备标识;
进一步地,所述合并单元403,具体适于提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
根据本发明的一个优选实施例,所述装置还包括附图中未示出的比较单元和处理单元:
所述比较单元,适于在所述确定单元402确定所述设备组的当前异常比例之后,将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;
所述处理单元,适于在所述比较单元的比较结果为所述设备组的当前异常比例与该设备组上一次的异常比例相同时,延长监测所述设备组的监测时间周期。
进一步地,所述处理单元还适于在所述当前异常比例小于预设容灾比例时,延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
根据本发明的一个优选实施例,所述确定单元402,还适于在所述合并单元403获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
综上所述,本发明实施例提供的基于信息合并的报警方法及装置,通过在多个设备的监测过程中,当属于同一设备组的设备中存在多个异常设备且对应的所述设备组的当前异常比例小于预设异常比例时,获取为设备组中的异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到合并报警信息,进而在实现准确监测的前提下进行合并报警,有效地减少了对监测资源的浪费以及频繁报警带来的困扰,更能节省设备监测过程中投入的费用。
应当注意,在此提供的算法和公式不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解本发明各个方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法和装置解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网站安全检测设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种基于信息合并的报警方法,包括:
监测多个设备并判断所述多个设备中的异常设备;
判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
发送所述第一报警信息。
2.如权利要求1所述的方法,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
3.如权利要求2所述的方法,所述若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括:
获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
4.如权利要求2所述的方法,所述若所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例,获取为各异常设备生成的设备报警信息之前,所述方法还包括:
获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
5.如权利要求1所述的方法,还包括:
若所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例,则确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息;
发送所述第二报警信息。
6.如权利要求1所述的方法,所述设备报警信息中包括设备标识;
相应地,所述获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息,进一步包括:
提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
7.如权利要求1所述的方法,所述确定所述设备组的当前异常比例之后,还包括:
将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;
若所述设备组的当前异常比例与该设备组上一次的异常比例相同,则延长监测所述设备组的监测时间周期。
8.如权利要求1所述的方法,还包括:
若所述当前异常比例小于预设容灾比例,则延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
9.如权利要求1~8中任一项所述的方法,所述获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,还包括:
根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
10.一种基于信息合并的报警装置,包括:
监测单元,适于监测多个设备并判断所述多个设备中的异常设备;
确定单元,适于判断属于同一设备组的设备中所述异常设备的数量,并确定所述设备组的当前异常比例,所述当前异常比例标示所述设备组中异常设备所占的比例;
合并单元,适于在所述确定单元确定所述设备组中存在多个异常设备且对应的所述当前异常比例小于预设异常比例时,获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并,得到第一报警信息;
发送单元,适于所述第一报警信息。
11.如权利要求10所述的装置,属于相同线路的设备被归于同一设备组,或者处理相同业务的设备被归于同一设备组。
12.如权利要求11所述的装置,还包括:
第一获取单元,适于在所述合并单元获取为各异常设备生成的设备报警信息之前,获取所述设备组中的设备数量,并根据所述设备数量查找第一映射关系,以获得与所述设备数量对应的预设异常比例,所述第一映射关系包括:设备数量和预设异常比例之间的对应关系。
13.如权利要求11所述的装置,还包括:
第二获取单元,适于在所述合并单元获取为各异常设备生成的设备报警信息之前,获取所述设备组的标识信息,并根据所述标识信息查找第二映射关系,以获得与所述标识信息对应的预设异常比例,所述第二映射关系包括:标识信息与预设异常比例之间的对应关系。
14.如权利要求10所述的装置,还包括:
生成单元,适于在所述设备组中存在多个异常设备且对应的所述当前异常比例大于或等于所述预设异常比例时,确定所述设备组存在线路故障,取消为各异常设备生成的设备报警信息并生成用于线路故障报警的第二报警信息;
所述发送单元,还适于发送所述第二报警信息。
15.如权利要求10所述的装置,所述设备报警信息中包括设备标识;
所述合并单元,具体适于提取各设备报警信息中的设备标识,将提取的各设备标识进行合并,得到第一报警信息。
16.如权利要求10所述的装置,还包括:
比较单元,适于在所述确定单元确定所述设备组的当前异常比例之后,将所述设备组的当前异常比例与该设备组上一次的异常比例进行比较;
处理单元,适于在所述比较单元的比较结果为所述设备组的当前异常比例与该设备组上一次的异常比例相同时,延长监测所述设备组的监测时间周期。
17.如权利要求16所述的装置,所述处理单元还适于在所述当前异常比例小于预设容灾比例时,延长监测所述设备组的监测时间周期,其中,所述预设容灾比例小于所述预设异常比例。
18.如权利要求10~17中任一项所述的装置,所述确定单元,还适于在所述合并单元获取为各异常设备生成的设备报警信息,并将生成的设备报警信息进行合并之前,根据所述当前异常比例与所述预设异常比例的差值,确定发送所述第一报警信息的方式。
CN201510997948.3A 2015-12-25 2015-12-25 一种基于信息合并的报警方法及装置 Active CN105549508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510997948.3A CN105549508B (zh) 2015-12-25 2015-12-25 一种基于信息合并的报警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510997948.3A CN105549508B (zh) 2015-12-25 2015-12-25 一种基于信息合并的报警方法及装置

Publications (2)

Publication Number Publication Date
CN105549508A CN105549508A (zh) 2016-05-04
CN105549508B true CN105549508B (zh) 2018-03-23

Family

ID=55828756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510997948.3A Active CN105549508B (zh) 2015-12-25 2015-12-25 一种基于信息合并的报警方法及装置

Country Status (1)

Country Link
CN (1) CN105549508B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874135B (zh) * 2017-02-20 2020-09-04 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备
CN107453940A (zh) * 2017-06-19 2017-12-08 深圳市盛路物联通讯技术有限公司 一种基于接入节点的物联网终端设备检测方法及系统
CN107241242B (zh) * 2017-07-19 2020-09-15 北京奇艺世纪科技有限公司 一种数据处理方法和装置
CN108156039B (zh) * 2018-01-08 2021-07-09 北京知道创宇信息技术股份有限公司 一种防告警风暴方法以及装置
CN108540567B (zh) * 2018-04-19 2019-10-11 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN113849328B (zh) * 2018-05-22 2024-04-12 华为技术有限公司 一种容灾系统的管理方法和装置
CN109165138B (zh) * 2018-08-01 2022-06-17 网宿科技股份有限公司 一种监控设备故障的方法和装置
CN113282447B (zh) * 2021-04-16 2024-05-07 北京中大科慧科技发展有限公司 一种用于数据中心的机房安全检测方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8051330B2 (en) * 2006-06-30 2011-11-01 Telecom Italia S.P.A. Fault location in telecommunications networks using bayesian networks
CN101068162B (zh) * 2007-06-27 2010-12-08 中兴通讯股份有限公司 一种实现告警位置条件选择的方法
CN102014020A (zh) * 2010-11-12 2011-04-13 百度在线网络技术(北京)有限公司 一种用于对网络设备进行网络监控的设备及其方法
CN103401698B (zh) * 2013-07-02 2017-03-15 北京奇虎科技有限公司 用于服务器集群运算中对服务器状况报警的监控系统
CN104954178B (zh) * 2015-05-29 2019-02-15 北京奇虎科技有限公司 优化系统报警的方法及装置

Also Published As

Publication number Publication date
CN105549508A (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN105549508B (zh) 一种基于信息合并的报警方法及装置
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN110708204A (zh) 一种基于运维知识库的异常处理方法、系统、终端及介质
EP2759938A1 (en) Operations management device, operations management method, and program
CN105335271A (zh) 一种状态监控装置、综合监控系统和方法
CN105095056A (zh) 一种数据仓库数据监控的方法
CN113438110B (zh) 一种集群性能的评价方法、装置、设备及存储介质
US10185614B2 (en) Generic alarm correlation by means of normalized alarm codes
CN114398354A (zh) 数据监测方法、装置、电子设备及存储介质
CN115033463A (zh) 一种系统异常类型确定方法、装置、设备和存储介质
CN115529595A (zh) 一种日志数据的异常检测方法、装置、设备及介质
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
CN112769615B (zh) 一种异常分析方法及装置
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
US20210027254A1 (en) Maintenance management apparatus, system, method, and non-transitory computer readable medium
CN111049685A (zh) 电力系统的网络安全感知系统、网络安全感知方法和装置
JP2017211806A (ja) 通信の監視方法、セキュリティ管理システム及びプログラム
KR101973728B1 (ko) 통합 보안 이상징후 모니터링 시스템
KR101288535B1 (ko) 통신 시스템 모니터링 방법 및 이를 위한 장치
CN114531338A (zh) 一种基于调用链数据的监控告警和溯源方法及系统
CN107765123A (zh) 检测规则更新方法及用电安全监测系统
CN112612676A (zh) 设备的监控方法及监控装置
CN113807697A (zh) 基于告警关联的派单方法及装置
CN112817827A (zh) 运维方法、装置、服务器、设备、系统及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee after: Beijing Qizhi Business Consulting Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20220329

Address after: 100016 1773, 15 / F, 17 / F, building 3, No.10, Jiuxianqiao Road, Chaoyang District, Beijing

Patentee after: Sanliu0 Digital Security Technology Group Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Beijing Qizhi Business Consulting Co.,Ltd.

TR01 Transfer of patent right