CN111555899B - 告警规则配置方法、设备状态监测方法、装置和存储介质 - Google Patents

告警规则配置方法、设备状态监测方法、装置和存储介质 Download PDF

Info

Publication number
CN111555899B
CN111555899B CN202010099534.XA CN202010099534A CN111555899B CN 111555899 B CN111555899 B CN 111555899B CN 202010099534 A CN202010099534 A CN 202010099534A CN 111555899 B CN111555899 B CN 111555899B
Authority
CN
China
Prior art keywords
alarm
rule
alarm rule
rules
rule set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010099534.XA
Other languages
English (en)
Other versions
CN111555899A (zh
Inventor
朱海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Envision Innovation Intelligent Technology Co Ltd
Envision Digital International Pte Ltd
Original Assignee
Shanghai Envision Innovation Intelligent Technology Co Ltd
Envision Digital International Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Envision Innovation Intelligent Technology Co Ltd, Envision Digital International Pte Ltd filed Critical Shanghai Envision Innovation Intelligent Technology Co Ltd
Priority to CN202010099534.XA priority Critical patent/CN111555899B/zh
Publication of CN111555899A publication Critical patent/CN111555899A/zh
Application granted granted Critical
Publication of CN111555899B publication Critical patent/CN111555899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本公开提供了一种告警规则配置方法、设备状态监测方法、装置和存储介质,该告警规则配置方法包括:获取第一时间段内目标设备的告警记录,第一时间段内的告警记录是基于目标设备的第一告警规则集合生成的,第一告警规则集合包括N个第一告警规则;基于第一时间段内的告警记录,生成第二告警规则,第二告警规则用于指示第一告警规则集合中至少两个第一告警规则之间的关联关系;将第二告警规则加入第一告警规则集合。

Description

告警规则配置方法、设备状态监测方法、装置和存储介质
技术领域
本公开涉及设备监测技术领域,特别涉及一种告警规则配置方法、设备状态监测方法、装置和存储介质。
背景技术
在物联网中,需要实时监测设备的运行状态,在设备运行状态异常时,产生告警信息,以提醒工作人员。
相关技术中,告警信息的产生是针对设备的实时测点的,测点即该设备的某一个被监测状态。针对一个或者一类设备,先手动配置一批基于测点的告警规则。若设备的测点符合该告警规则,则生成对应的告警信息。如果设备发生故障,工作人员将参考这些告警信息进行远程或者现场排查,得出设备故障的原因。
由于告警规则是手动设置的,所以需要工作人员的经验丰富,才能准确设置告警规则,此外,基于测点的告警规则,产生的告警信息是零散的,难以基于告警信息准确确定出设备故障的原因,故障排查效率较低。
发明内容
本公开实施例提供了一种告警规则配置方法、设备状态监测方法、装置和存储介质,能够基于告警记录生成告警规则,且该告警规则能够反应至少两个告警规则之间的关联关系,所述技术方案如下:
一方面,提供了一种告警规则配置方法,包括:
获取第一时间段内目标设备的告警记录,所述第一时间段内的告警记录是基于所述目标设备的第一告警规则集合生成的,所述第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2;
基于所述第一时间段内的告警记录,生成第二告警规则,所述第二告警规则用于指示所述第一告警规则集合中至少两个所述第一告警规则之间的关联关系;
将所述第二告警规则加入所述第一告警规则集合。
可选地,所述基于所述第一时间段内的告警记录,生成第二告警规则,包括:
将所述第一时间段划分为多个长度相等的第二时间段;
基于每个所述第二时间段内的告警记录生成二元数组,所述二元数组包括N个元素,所述N个元素与所述N个第一告警规则一一对应,每个所述元素的取值用于表示所述第二时间段内所对应的第一告警规则是否被触发;
基于所述二元数组,生成所述第二告警规则。
可选地,所述基于所述二元数组,生成所述第二告警规则,包括:
将所述二元数组中1个第一元素的取值和Y个第二元素的取值组成训练样本,所述第一元素为从所述N个第一告警规则中选择出的作为结果的1个第一告警规则对应的元素,所述Y个第二元素分别为从除了所述第一元素对应的第一告警规则以外的N-1个第一告警规则中,选择出的作为原因的Y个第一告警规则对应的元素,Y为整数,且1<Y≤N-1;
采用所述训练样本训练得到逻辑回归分类器;
采用所述逻辑回归分类器,所述第一元素对应的第一告警规则和所述第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系;
基于所述关联关系,生成所述第二告警规则。
可选地,所述采用所述逻辑回归分类器,确定所述第一元素和所述第二元素对应的第一告警规则中的至少两个第一告警规则之间的关联关系,包括:
枚举所述Y个第二元素的各种取值组合;
采用所述逻辑回归分类器预测每一种所述取值组合下,所述第一元素对应的第一告警规则被触发的概率值;
基于所述概率值,所述第一元素对应的第一告警规则和所述第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系。
可选地,
所述基于所述概率值,确定第一元素和所述第二元素对应的第一告警规则中的至少两个第一告警规则之间的关联关系,包括:
若所述概率值大于设定值,则基于所述取值组合确定Y个第二元素对应的第一告警规则中,被触发的第一告警规则;
确定Y个第二元素对应的第一告警规则中被触发的第一告警规则、与所述第一元素对应的第一告警规则之间的关联关系为因果关系。
另一方面,还提供了一种设备状态监测方法,包括:
获取目标时间段内目标设备的被监测状态的状态量;
获取所述目标设备的告警规则集合,所述告警规则集合包括多个告警规则,所述告警规则集合是采用前述任一种告警规则配置方法得到的;
基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则;
按照被触发的告警规则进行告警。
另一方面,还提供了一种告警规则配置装置,包括:
获取模块,用于获取第一时间段内目标设备的告警记录,所述第一时间段内的告警记录是基于所述目标设备的第一告警规则集合生成的,所述第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2;
生成模块,用于基于所述第一时间段内的告警记录,生成第二告警规则,所述第二告警规则用于指示所述第一告警规则集合中至少两个所述第一告警规则之间的关联关系;
配置模块,用于将所述第二告警规则加入所述第一告警规则集合。
另一方面,还提供了一种设备状态监测装置,包括:
第一获取模块,用于获取目标时间段内目标设备的被监测状态的状态量;
第二获取模块,用于获取所述目标设备的告警规则集合,所述告警规则集合包括多个告警规则,所述告警规则集合是采用前述任一种告警规则配置方法得到的;
确定模块,用于基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则;
告警模块,用于按照被触发的告警规则进行告警。
另一方面,还提供了一种计算机设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行上述实施例中所述的告警规则配置方法或者设备状态监测方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述实施例中所述的告警规则配置方法或者设备状态监测方法。
本公开实施例提供的技术方案带来的有益效果是:
本公开实施例中,通过获取基于目标设备的第一告警规则集合中的第一告警规则生成的告警记录,并且基于目标设备在第一时间段内的告警记录自动生成用于指示至少两个第一告警规则之间的关联关系的第二告警规则,无需人为配置全部告警规则,提高了告警规则配置的准确性和自动化程度。
同时,基于该第二告警规则生成的告警记录能够反应第一告警规则集合中至少两个第一告警规则之间的关联关系,当该第二告警记录被触发时,工作人员能够基于该关联关系快速确定出设备故障的原因,有利于提高故障排查的效率。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开一示例性实施例提供告警规则配置方法的流程示意图;
图2示出了本公开一示例性实施例提供告警规则配置方法的流程示意图;
图3示出了本公开一示例性实施例提供的设备状态监测方法的流程示意图;
图4示出了本公开一示例性实施例提供告警规则配置装置的结构示意图;
图5示出了本公开一示例性实施例提供的设备状态监测装置的结构示意图;
图6示出了本公开另一实施例中的计算机设备的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
为了保证设备的正常运行,需要对设备的运行状态(在本公开实施例中,简称为状态)进行监测,及时发现设备的异常状态,以便于预防设备出现故障或者在设备出现故障后根据告警记录确定故障发生的原因。
在本公开实施例中,被监测的设备上安装有各种传感器,例如,温度传感器、压力传感器、振动传感器等等,这些传感器用于实时检测设备的状态量,并根据检测得到的状态量判断对应的设备状态是否异常。每个传感器对应一个测点,每个测点对应一条基于测点的告警规则,例如,该基于测点的告警规则为检测得到的状态量超过阈值,则当检测得到的状态量符合该告警规则时,表示对应的设备状态异常,产生告警记录。反之,若检测得到的状态量未超过阈值,即检测得到的状态量不符合对应的告警规则,则表示对应的设备状态正常,不产生告警记录。
本公开适用于物联网中的设备,包括但不限于各类工业传感器、智能家居设备等等。
图1示出了本公开一示例性实施例提供告警规则配置方法的流程示意图。
如图1所示,该方法可以由计算机设备执行,包括以下步骤:
步骤101:获取第一时间段内目标设备的告警记录。
目标设备具有至少两个被监测状态(也可以称为测点)。在本公开实施例中,被监测状态包括但不限于温度、压力、速度、振动幅度、角度、位移、运动频率等等。目标设备可以具有多个同一类型的被监测状态。也即是,目标设备的所有被监测状态可以是同一类别的被监测状态,或者,可以是不同类别的被监测状态,或者,部分被监测状态是同一类别的被监测状态,部分被监测状态是不同类别的被监测状态。
第一时间段内的告警记录是基于第一告警规则集合生成的,第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2。第一告警规则用于指示当对应的触发条件被满足时,生成告警记录。
在一种可能的实现方式中,第一告警规则集合中的第一告警规则都是基于单个被监测状态的,用于指示当对应的被监测状态异常时生成告警记录,也即是,此时触发条件可以为某个被监测状态异常,例如该被监测状态对应的状态量超过状态阈值等等。
在另一种可能的实现方式中,第一告警规则集合中的一部分第一告警规则是基于单个被监测状态的。另一部分第一告警规则是基于至少两个被监测状态的,该另一部分第一告警规则对应的触发条件为至少两个被监测状态同时存在异常,例如,至少两个被监测状态的状态量同时超过状态阈值等等。
示例性地,基于单个被监测状态的第一告警规则与目标设备的所有被监测状态一一对应。
步骤102:基于第一时间段内的告警记录,生成第二告警规则。
第二告警规则用于指示所述第一告警规则集合中至少两个第一告警规则之间的关联关系。
步骤103:将第二告警规则加入第一告警规则集合,得到第二告警规则集合。
后续该目标设备即可采用该第二告警规则集合中的告警规则监测目标设备的运行状态,并在第二告警规则集合中的告警规则被触发时进行告警。
本公开实施例中,通过获取基于目标设备的第一告警规则集合中的第一告警规则生成的告警记录,并且基于目标设备在第一时间段内的告警记录自动生成用于指示至少两个第一告警规则之间的关联关系的第二告警规则,无需人为配置全部告警规则,提高了告警规则配置的准确性和自动化程度。
图2示出了本公开一示例性实施例提供告警规则配置方法的流程示意图。该方法可以由计算机设备执行,如图2所示,所述方法包括:
步骤201,获取目标设备的第一告警规则集合。
目标设备具有至少两个被监测状态(也可以称为测点)。目标设备具有至少两个被监测状态(也可以称为测点)。在本公开实施例中,被监测状态包括但不限于温度、压力、速度、振动幅度、转动角度、位移、运动频率等等。目标设备可以具有多个同一类型的被监测状态。也即是,目标设备的所有被监测状态可以是同一类别的被监测状态,或者,可以是不同类别的被监测状态,或者,部分被监测状态是同一类别的被监测状态,部分被监测状态是不同类别的被监测状态。
该第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2。第一告警规则用于指示当对应的触发条件被满足时,生成告警记录。
在一种可能的实现方式中,这N个第一告警规则与目标设备的被监测状态一一对应,每个第一告警规则用于指示当对应的所述被监测状态异常时生成告警记录,例如,当被监测状态达到状态阈值时,产生相应的告警记录。这种第一告警规则可以被称为是基于单个被监测状态的告警规则。
在另一种可能的实现方式中,第一告警规则集合中,除了基于单个被监测状态的告警规则之外,还可以包括基于至少两个被监测状态的告警规则。此时,第一告警规则对应的触发条件为至少两个被监测状态同时存在异常,例如,至少两个被监测状态的状态量同时超过状态阈值等等。
假设目标设备具有X个被监测状态,X为正整数,且X大于1。则该目标设备的第一告警规则集合中,至少包括X个第一告警规则,也即是N≥X。
该第一告警规则集合中的告警规则可以是预先配置的,例如可以由领域专家或其他工作人员根据实际经验确定。也即是说,在该步骤201中,第一告警规则集合可以是初始的告警规则集合。
可选地,该第一告警规则集合中的告警规则可以是多个设备的通用告警规则,也可以是某个设备的专用告警规则。
步骤202:获取目标设备在第一时间段内的告警记录。
每条告警记录用于反应目标设备的至少一个被监测状态异常。该告警记录是可读的,以便于实时监控目标设备的运行状态。该告警记录是基于第一告警规则集合产生的。当第一告警规则集合中的第一告警规则被触发,则会生成对应的告警记录。
示例性地,对于基于单个被监测状态的第一告警规则,一条告警记录可以包括设备标识、状态标识、生成时间和告警内容等。其中,设备标识用于指示该告警记录对应的设备,例如风机等,状态标识用于指示被检测的状态(也可以称为测点),比如温度、风速等。生成时间用于指示检测动作的执行时间或者告警记录生成的时间。告警内容用于指示被检测的状态异常,例如温度过高等。
例如,一条告警记录可以{deviceID=“风机1”,‘风机转速’,‘2019-9-908:00:00’,‘风机转速过高’}。
该第一时间段的长度可以根据实际需要设置,例如一个月、一周等等。
步骤203:将第一时间段划分为多个长度相等的第二时间段。
示例性地,该第二时间段的长度可以根据实际需要设置,例如可以设置为1分钟、3分钟、5分钟等。该第二时间段也可以称为第一时间段的子时间段。
步骤204:基于每个第二时长内的告警记录,生成二元数组。
仍然以该第一告警规则集合中包括N个第一告警规则为例,相应的,该二元数组中包括N个元素,每个元素对应一个第一告警规则。
每个元素的取值用于表示对应的第一告警规则是否被触发。示例性地,若一个元素的取值为第一数值,则表示该元素对应的第一告警规则被触发;若一个元素的取值为第二数值,则表示该元素对应的第一告警规则没有被触发。这里,第一数值和第二数值分别为0和1中的一个。例如,1表示对应的第一告警规则被触发,0表示对应的第一告警规则没有被触发。
在一个第二时间段中,若存在某个第一告警规则对应的告警记录,表示该第一告警规则被触发,则将该第一告警规则对应的元素采用第一数值表示;若不存在某个第一告警规则对应的告警记录,表示对应的第一告警规则没有被触发,则将该第一告警规则对应的元素采用第二数值表示。
示例性地,假设第一告警规则集合为{Rule1,Rule2……RuleN-1,RuleN},其中,Rule1表示第一个第一告警规则,Rule2表示第二个第一告警规则,依次类推。对应的二元数组为{Record1,Record2,……RecordN-1,RecordN},若Rulei被触发,则Recordi为1;若Rulei未被触发,则Recordi为0,i为整数,且1≤i≤N。
步骤205:对生成的二元数组进行筛选。
该步骤205可以包括:将规则触发比例不大于触发比例阈值(也可以称为有效触发率)的二元数组去除,得到有效二元数组,其中,规则触发比例等于被触发的告警规则的数量与第一告警规则集合中告警规则的总数量的比值。这里,被触发的告警规则是指已基于该告警规则生成告警记录。
例如,假设第一告警规则集合中的告警规则的总数量为N,在第二时间段内,被触发的告警规则数量为n,则规则触发比例等于n/N。
该触发比例阈值可以为经验值,触发比例阈值的取值范围可以为50%~90%,例如50%。
当规则触发比例不大于触发比例阈值时,通过该二元数组挖掘得到的关联关系不准确,因此将该部分数据删除,一方面可以减少需要处理的数据量,另一方面可以提高数据挖掘的准确度。
步骤206:将二元数组中1个第一元素和Y个第二元素的取值组成训练样本。
第一元素为从N个第一告警规则中选择出的作为结果的1个第一告警规则对应的元素,Y个第二元素分别为从除了第一元素对应的第一告警规则以外的N-1个第一告警规则中,选择出的作为原因的Y个第一告警规则对应的元素,Y为整数,且1<Y≤N-1。
也即是,一个训练样本包括Y+1个数值。
在本公开实施例中,Y的数值可以根据实际需要设置,例如,可以为2、3、4等。
在本公开实施例中,作为结果的1个第一告警规则为N个第一告警规则中的任一个。作为原因的Y个第一告警规则有多种组合方式,组合方式的数量等于例如,假设要从4个第一告警规则中选出3个第一告警规则,那么组合方式的数量为假设4个第一告警规则分别为r1,r2,r3,r4,则4种组合方式分别为:{r1,r2,r3},{r1,r2,r4},{r1,r3,r4},{r2,r3,r4}。
通过该步骤206可以得到的训练样本的数量为
步骤207:采用训练样本训练逻辑回归分类器。
示例性地,可以采用开源软件Sklearn(scikit-learn)构建逻辑回归分类器。然后采用训练样本训练该逻辑回归分类器。逻辑回归的目标为获得最佳的分类回归系数。训练逻辑回归分类器的过程中,可以采用相关技术中的任一种优化算法,包括但不限于liblinear(坐标轴下降算法)、梯度上升算法、随机平均梯度下降算法等等。
在本公开实施例中,由于一个训练样本包括Y+1个数值,因此,可以称为Y+1元回归。
逻辑回归分类器的训练过程可以参见相关技术,本公开实施例对此不做限定。
步骤208:验证训练得到的逻辑回归分类器的准确性。
该步骤208可以包括:
第一步、采用训练得到的逻辑回归分类器,对验证样本进行分类,得到分类结果。
第二步、将分类结果与标准结果进行比较。
第三步、将分类结果正确的数量与验证样本的总量之比,作为准确率。比值越大,准确性越高。准确率大于设定值的逻辑回归分类器可以认为是有效的逻辑回归分类器。
在该步骤中,验证样本可以基于步骤204中的二元数组得到,例如可以为训练样本中的一部分。
步骤209:枚举Y个第二元素的各种取值组合。
步骤210:采用逻辑回归分类器预测每一种取值组合下,第一元素对应的告警规则被触发的概率值。
示例性地,在该步骤209中所采用的可以是有效的逻辑回归分类器中准确率最高的逻辑回归分类器。
示例性地,假设作为原因的告警规则分别为r1、r2、r3,作为结果的告警规则为r4。枚举作为原因的告警规则对应的各种元素取值组合,得到以下8种取值组合:{0,0,0}、{0,0,1}、{0,1,0}、{1,0,0}、{0,1,1}、{1,0,1}、{1,1,0}、{1,1,1}。将每种取值组合与r4=1组合,输入逻辑回归分类器,该逻辑回归分类器输出一个概率值,即为相应的取值组合预测r4=1发生的概率值。
步骤211:基于所述概率值,确定第一元素对应的第一告警规则和第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系。
示例性地,该步骤211可以包括:
若所述概率值大于设定值,则基于所述取值组合确定Y个第二元素对应的第一告警规则中,被触发的第一告警规则;
确定Y个第二元素对应的第一告警规则中被触发的第一告警规则、与所述第一元素对应的第一告警规则之间的关联关系为因果关系。
该设定值可以根据实际需要设置,例如可以为80%。
通过前述步骤209~211即可实现采用所述逻辑回归分类器,确定第一元素对应的第一告警规则和第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系。
步骤212:基于该关联关系,生成第二告警规则。
该第二告警规则用于指示被触发的作为原因的告警规则和被触发的作为结果的告警规则之间的关联关系。在本公开实施例中,该关联关系为因果关系。
该第二告警规则可以包括触发条件和告警记录,表示当触发条件被满足时生成相应的告警记录。该触发条件为至少两个第一告警规则被触发。
例如,若r1、r2、r3对应的取值组合为{1,0,1}时,r4=1的概率值为85%,该概率值大于设定值80%,则表示告警规则r1和r3被触发,被触发的告警规则r1、r3和告警规则r4之间存在关联关系,且为因果关系。基于该关联关系生成第二告警规则,该第二告警规则用于指示被触发的告警规则r1、r3和r4之间存在关联关系。
示例性地,该第二告警规则可以为“若告警规则r1、r3和r4被触发,则生成一条告警记录,该告警记录中的告警内容为‘r1和r3同时被触发会有85%的概率引起r4被触发’”,或者,该第二告警规则可以为“若告警规则r1、r3和r4被触发,则生成一条告警记录,该告警记录中的告警内容为‘可能是r1和r3同时被触发引起r4被触发’”。
例如,告警规则r1被触发,生成一条告警记录“风场风速过高”;告警规则r3被触发生成一条告警记录“风机转速过快”,告警规则r4被触发,生成一条告警记录“风机发动机过热”。第二告警规则可以为当告警规则r1、r3和r4同时被触发,则生成一条告警记录“风场风速过高和发动机转速过快可能引起发动机温度过高”。
步骤213:将第二告警规则加入第一告警规则集合中,得到第二告警规则集合。
也即是,该第二告警规则集合中除了包括第一告警规则之外,还包括基于多个被监测状态的第二告警规则。
通过前述步骤206~213即可实现基于二元数组,生成所述第二告警规则。
可选地,在基于第二告警规则集合监测设备运行之后,该方法还可以包括:以该第二告警规则集合替代第一告警规则集合,重复执行前述步骤201~211,对目标设备的告警规则集合进行再次更新。
需要说明的是,在重复执行前述步骤201~213时,可以调整第一时间段和第二时间段的长度。例如,如果在步骤208中,逻辑回归分类器的准确率较低,则可以调整第二时间段的长度。
本公开实施例中,通过获取基于目标设备的第一告警规则集合中的第一告警规则生成的告警记录,并且基于目标设备在第一时间段内的告警记录自动生成用于指示至少两个第一告警规则之间的关联关系的第二告警规则,无需人为配置全部告警规则,提高了告警规则配置的准确性和自动化程度。
同时,基于该第二告警规则生成的告警记录能够反应第一告警规则集合中至少两个第一告警规则之间的关联关系,当该第二告警记录被触发时,工作人员能够基于该关联关系快速确定出设备故障的原因,有利于提高故障排查的效率。
可选地,该方法还可以包括:
获取多个设备的告警规则集合;
将多个设备的告警规则集合中,出现频率高于频率阈值的告警规则,确定为共性规则;
将共性规则添加到通用告警规则集合中,该通用告警规则集合包括多个设备通用的初始告警规则。
示例性地,出现频率可以等于出现该告警规则的告警规则集合的数量与设备总数的比值。该频率阈值为设定值,例如,可以为80%。
通过该方式可以使得初始告警规则集合中,除了包括针对单个被监测状态的告警规则以外,还包括针对多个被监测状态的告警规则,使得初始告警规则集合中的告警规则的实用性增加,这样,基于该初始告警规则集合,本公开实施例提供的方法所需要的告警规则更新量较少,能够更加快速的获得设备所需的告警规则。
可选地,为了节省存储空间以及提高监控效率,该方法还可以包括:
从第一告警规则集合中,删除超过时长阈值未被触发的第一告警规则。例如,某条告警规则一个月没有被触发,则可以将其删除。
图3示出了本公开一示例性实施例提供的设备状态监测方法的流程示意图,如图3所示,该方法包括:
步骤301:获取目标时间段内目标设备的被监测状态的状态量。
步骤302:获取所述目标设备的告警规则集合。
告警规则集合包括多个告警规则,所述告警规则集合为采用图1或图2所示方法得到的。
步骤303:基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则。
步骤304:按照被触发的告警规则进行告警。
示例性地,在该步骤303中,可以将目标设备的告警规则集合中的每条告警规则的触发条件与目标设备的被监测状态的状态量进行匹配,以确定告警规则是否被触发。例如,若第一告警规则的触发条件为被监测状态的状态量超过状态阈值,则将目标设备的被监测状态的状态量与该状态阈值比较,若目标设备的被监测状态的状态量大于该状态阈值,则表示该第一告警规则被触发。
本公开实施例中,通过获取基于目标设备的第一告警规则集合中的第一告警规则生成的告警记录,并且基于目标设备在第一时间段内的告警记录自动生成用于指示至少两个第一告警规则之间的关联关系的第二告警规则,无需人为配置全部告警规则,提高了告警规则配置的准确性和自动化程度。
同时,基于该第二告警规则生成的告警记录能够反应第一告警规则集合中至少两个第一告警规则之间的关联关系,当该第二告警记录被触发时,工作人员能够基于该关联关系快速确定出设备故障的原因,有利于提高故障排查的效率。
图4示出了本公开一示例性实施例提供告警规则配置装置的结构示意图,该装置具有实现图1或图2所示方法实施例的功能,该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。如图4所示,该装置包括:
获取模块401,用于获取第一时间段内目标设备的告警记录,所述第一时间段内的告警记录是基于所述目标设备的第一告警规则集合生成的,所述第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2;
生成模块402,用于基于所述第一时间段内的告警记录,生成第二告警规则,所述第二告警规则用于指示所述第一告警规则集合中至少两个第一告警规则之间的关联关系;
配置模块403,用于将所述第二告警规则加入所述第一告警规则集合。
可选地,生成模块402可以包括:
划分子模块421,用于将所述第一时间段划分为多个长度相等的第二时间段;
第一生成子模块422,用于基于每个所述第二时间段内的告警记录生成二元数组,所述二元数组包括N个元素,所述N个元素与所述N个第一告警规则一一对应,每个所述元素的取值用于表示所述第二时间段内所对应的第一告警规则是否被触发;
第二生成子模块423,用于基于所述二元数组,生成所述第二告警规则。
可选地,第二生成子模块423,用于将所述二元数组中1个第一元素的取值和Y个第二元素的取值组成训练样本,所述第一元素为从所述N个第一告警规则中选择出的作为结果的1个第一告警规则对应的元素,所述Y个第二元素分别为从除了所述第一元素对应的第一告警规则以外的N-1个第一告警规则中,选择出的作为原因的Y个第一告警规则对应的元素,Y为整数,且1<Y≤N-1;
采用所述训练样本训练得到逻辑回归分类器;采用所述逻辑回归分类器,确定第一元素对应的第一告警规则和第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系;基于所述关联关系,生成所述第二告警规则。
可选地,第二生成子模块423,用于枚举所述Y个第二元素的各种取值组合;采用所述逻辑回归分类器预测每一种所述取值组合下,所述第一元素对应的第一告警规则被触发的概率值;基于所述概率值,确定第一元素对应的第一告警规则和第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系。
可选地,第二生成子模块423,用于若所述概率值大于设定值,则基于所述取值组合确定Y个第二元素对应的第一告警规则中,被触发的第一告警规则;确定Y个第二元素对应的第一告警规则中被触发的第一告警规则、与所述第一元素对应的第一告警规则之间的关联关系为因果关系。
可选地,生成模块402还可以包括:
处理子模块424,在所述基于所述二元数组,生成所述第二告警规则之前,将规则触发比例不大于触发比例阈值的二元数组去除,得到有效二元数组,所述规则触发比例等于被触发的告警规则的数量与第一告警规则集合中告警规则的总数量的比值;
第二生成子模块423,用于基于所述有效二元数组,生成所述第二告警规则。
图5示出了本公开一示例性实施例提供的设备状态监测装置的结构示意图,该装置具有实现图3所示方法实施例的功能,该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。如图5所示,该装置包括:
第一获取模块501,用于获取目标时间段内目标设备的被监测状态的状态量;
第二获取模块502,用于获取所述目标设备的告警规则集合,所述告警规则集合包括多个告警规则,所述告警规则集合是采用图1或图2所示的方法得到的;
确定模块503,用于基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则;
告警模块504,用于按照被触发的告警规则进行告警。
图6是根据一示例性实施例示出的一种计算机设备的结构示意图。计算机设备600包括中央处理单元(CPU)601、包括随机存取存储器(RAM)602和只读存储器(ROM)603的系统存储器604,以及连接系统存储器604和中央处理单元601的系统总线605。计算机设备600还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)606,和用于存储操作系统613、应用程序614和其他程序模块615的大容量存储设备607。
基本输入/输出系统606包括有用于显示信息的显示器608和用于用户输入信息的诸如鼠标、键盘之类的输入设备609。其中显示器608和输入设备609都通过连接到系统总线605的输入/输出控制器610连接到中央处理单元601。基本输入/输出系统606还可以包括输入/输出控制器610以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入/输出控制器610还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备607通过连接到系统总线605的大容量存储控制器(未示出)连接到中央处理单元601。大容量存储设备607及其相关联的计算机可读介质为计算机设备600提供非易失性存储。也就是说,大容量存储设备607可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器604和大容量存储设备607可以统称为存储器。
根据本公开的各种实施例,计算机设备600还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备600可以通过连接在系统总线605上的网络接口单元611连接到网络612,或者说,也可以使用网络接口单元611来连接到其他类型的网络或远程计算机系统(未示出)。
存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,中央处理单元601通过执行该一个或一个以上程序来实现图1或图2所示的告警规则配置方法,或者执行图3所示的设备状态监测方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由计算机设备的处理器执行以完成本发明各个实施例所示的人脸识别方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本公开的可选实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种告警规则配置方法,其特征在于,包括:
获取第一时间段内目标设备的告警记录,所述第一时间段内的所述告警记录是基于所述目标设备的第一告警规则集合生成的,所述第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2,所述目标设备为物联网中的设备,所述告警记录是被监测状态异常时生成的,所述被监测状态包括温度、压力、速度、振动幅度、角度、位移、运动频率;
基于所述第一时间段内的所述告警记录,生成第二告警规则,所述第二告警规则用于指示所述第一告警规则集合中至少两个所述第一告警规则之间的关联关系,所述第二告警规则用于指示被触发的作为原因的告警规则和被触发的作为结果的告警规则之间的因果关系,所述第二告警规则包括触发条件和告警记录,表示当触发条件被满足时生成相应的告警记录;
将所述第二告警规则加入所述第一告警规则集合,得到第二告警规则集合;
以所述第二告警规则集合替代所述第一告警规则集合,重复执行第一步骤,对所述目标设备的告警规则集合进行再次更新,所述第一步骤包括:
所述获取第一时间段内目标设备的告警记录;所述基于所述第一时间段内的所述告警记录,生成第二告警规则;所述将所述第二告警规则加入所述第一告警规则集合,得到第二告警规则集合。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一时间段内的所述告警记录,生成第二告警规则,包括:
将所述第一时间段划分为多个长度相等的第二时间段;
基于每个所述第二时间段内的告警记录生成二元数组,所述二元数组包括N个元素,所述N个元素与所述N个第一告警规则一一对应,每个所述元素的取值用于表示所述第二时间段内所对应的第一告警规则是否被触发;
基于所述二元数组,生成所述第二告警规则。
3.根据权利要求2所述的方法,其特征在于,所述基于所述二元数组,生成所述第二告警规则,包括:
将所述二元数组中1个第一元素的取值和Y个第二元素的取值组成训练样本,所述第一元素为从所述N个第一告警规则中选择出的作为结果的1个第一告警规则对应的元素,所述Y个第二元素分别为从除了所述第一元素对应的第一告警规则以外的N-1个第一告警规则中,选择出的作为原因的Y个第一告警规则对应的元素,Y为整数,且1<Y≤N-1;
采用所述训练样本训练得到逻辑回归分类器;
采用所述逻辑回归分类器,确定所述第一元素对应的第一告警规则和所述第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系;
基于所述关联关系,生成所述第二告警规则。
4.根据权利要求3所述的方法,其特征在于,所述采用所述逻辑回归分类器,确定所述第一元素和所述第二元素对应的第一告警规则中的至少两个第一告警规则之间的关联关系,包括:
枚举所述Y个第二元素的各种取值组合;
采用所述逻辑回归分类器预测每一种所述取值组合下,所述第一元素对应的第一告警规则被触发的概率值;
基于所述概率值,确定第一元素对应的第一告警规则和所述第二元素对应的第一告警规则中的至少一个第一告警规则之间的关联关系。
5.根据权利要求4所述的方法,其特征在于,所述基于所述概率值,确定第一元素和所述第二元素对应的第一告警规则中的至少两个第一告警规则之间的关联关系,包括:
若所述概率值大于设定值,则基于所述取值组合确定Y个第二元素对应的第一告警规则中,被触发的第一告警规则;
确定Y个第二元素对应的第一告警规则中被触发的第一告警规则、与所述第一元素对应的第一告警规则之间的关联关系为因果关系。
6.一种设备状态监测方法,其特征在于,包括:
获取目标时间段内目标设备的被监测状态的状态量;
获取所述目标设备的告警规则集合,所述告警规则集合包括多个告警规则,所述告警规则集合是采用权利要求1至5任一项所述的方法得到的;
基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则;
按照被触发的告警规则进行告警。
7.一种告警规则配置装置,其特征在于,包括:
获取模块,用于获取第一时间段内目标设备的告警记录,所述第一时间段内的所述告警记录是基于所述目标设备的第一告警规则集合生成的,所述第一告警规则集合包括N个第一告警规则,其中,N为整数且N大于2,所述目标设备为物联网中的设备,所述告警记录是被监测状态异常时生成的,所述被监测状态包括温度、压力、速度、振动幅度、角度、位移、运动频率;
生成模块,用于基于所述第一时间段内的所述告警记录,生成第二告警规则,所述第二告警规则用于指示所述第一告警规则集合中至少两个所述第一告警规则之间的关联关系,所述第二告警规则用于指示被触发的作为原因的告警规则和被触发的作为结果的告警规则之间的因果关系,所述第二告警规则包括触发条件和告警记录,表示当触发条件被满足时生成相应的告警记录;
配置模块,用于将所述第二告警规则加入所述第一告警规则集合,得到第二告警规则集合;
以所述第二告警规则集合替代所述第一告警规则集合,重复执行第一步骤,对所述目标设备的告警规则集合进行再次更新,所述第一步骤包括:
所述获取第一时间段内目标设备的告警记录;所述基于所述第一时间段内的所述告警记录,生成第二告警规则;所述将所述第二告警规则加入所述第一告警规则集合,得到第二告警规则集合。
8.一种设备状态监测装置,其特征在于,包括:
第一获取模块,用于获取目标时间段内目标设备的被监测状态的状态量;
第二获取模块,用于获取所述目标设备的告警规则集合,所述告警规则集合包括多个告警规则,所述告警规则集合是采用权利要求1至5任一项所述的方法得到的;
确定模块,用于基于所述目标设备的被监测状态的状态量,确定所述告警规则集合中被触发的告警规则;
告警模块,用于按照被触发的告警规则进行告警。
9.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1至5任一项所述的告警规则配置方法,或者,执行如权利要求6所述的设备状态监测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1至5任一项所述的告警规则配置方法,或者,执行如权利要求6所述的设备状态监测方法。
CN202010099534.XA 2020-02-18 2020-02-18 告警规则配置方法、设备状态监测方法、装置和存储介质 Active CN111555899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010099534.XA CN111555899B (zh) 2020-02-18 2020-02-18 告警规则配置方法、设备状态监测方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010099534.XA CN111555899B (zh) 2020-02-18 2020-02-18 告警规则配置方法、设备状态监测方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN111555899A CN111555899A (zh) 2020-08-18
CN111555899B true CN111555899B (zh) 2023-07-28

Family

ID=72002907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010099534.XA Active CN111555899B (zh) 2020-02-18 2020-02-18 告警规则配置方法、设备状态监测方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN111555899B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163413B (zh) * 2020-10-26 2024-02-02 青岛明略软件技术开发有限公司 告警事件规则的解析方法、装置、电子设备及存储介质
CN114996119B (zh) * 2022-04-20 2023-03-03 中国工商银行股份有限公司 故障诊断方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399262A (zh) * 2019-06-17 2019-11-01 平安科技(深圳)有限公司 运维监测告警收敛方法、装置、计算机设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101222360B (zh) * 2008-01-22 2012-09-05 中兴通讯股份有限公司 用于建立告警规则关联的规则引擎系统及方法
CN103346912B (zh) * 2013-06-29 2017-04-12 华为技术有限公司 告警相关性分析的方法、装置及系统
WO2016141007A1 (en) * 2015-03-02 2016-09-09 Abb Technology Ag Alarm management using hiding rules
CN108156037B (zh) * 2017-12-29 2020-12-15 中国移动通信集团江苏有限公司 告警关联分析方法、装置、设备及介质
CN110247792A (zh) * 2019-05-28 2019-09-17 广东南方通信建设有限公司 一种基于网络告警关联的故障处理方法及装置
CN110245056A (zh) * 2019-06-10 2019-09-17 中国工商银行股份有限公司 运维告警信息处理方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399262A (zh) * 2019-06-17 2019-11-01 平安科技(深圳)有限公司 运维监测告警收敛方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111555899A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
US20210334656A1 (en) Computer-implemented method, computer program product and system for anomaly detection and/or predictive maintenance
US10410135B2 (en) Systems and/or methods for dynamic anomaly detection in machine sensor data
KR101955305B1 (ko) 희소 코딩 방법론을 활용한 가스 터빈 센서 고장 검출
US20200371858A1 (en) Fault Predicting System and Fault Prediction Method
US10373065B2 (en) Generating database cluster health alerts using machine learning
US8275735B2 (en) Diagnostic system
EP2015186B1 (en) Diagnostic systems and methods for predictive condition monitoring
JP7106847B2 (ja) 診断装置、診断方法、プログラム、および記録媒体
US20160239756A1 (en) Correlation and annotation of time series data sequences to extracted or existing discrete data
Klinkenberg et al. Data mining-based analysis of HPC center operations
US20160116378A1 (en) Population-based learning with deep belief networks
US20150346066A1 (en) Asset Condition Monitoring
US20160239755A1 (en) Correlation and annotation of time series data sequences to extracted or existing discrete data
US10540612B2 (en) Technique for validating a prognostic-surveillance mechanism in an enterprise computer system
CN111555899B (zh) 告警规则配置方法、设备状态监测方法、装置和存储介质
WO2014199177A1 (en) Early warning and prevention system
CN113196311A (zh) 用于识别和预测机器的异常感测行为模式的系统和方法
CN102141948A (zh) 带噪声的监控器检测和间歇故障隔离
WO2021064144A1 (en) Method and system for continuous estimation and representation of risk
CN111814557A (zh) 动作流检测方法、装置、设备及存储介质
WO2022115419A1 (en) Method of detecting an anomaly in a system
US11188064B1 (en) Process flow abnormality detection system and method
US11228606B2 (en) Graph-based sensor ranking
CN115943353A (zh) 用于确定机器的运行异常的原因的系统和方法以及计算机程序和电子可读的数据载体
US20230315559A1 (en) Fault diagnosis apparatus, non-transitory computer-readable recording medium, and fault diagnosis method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant