WO2023138058A1

WO2023138058A1 - 一种告警事件的处理方法、装置及计算机可读存储介质

Info

Publication number: WO2023138058A1
Application number: PCT/CN2022/115339
Authority: WO
Inventors: 武警贺; 闫冬冬
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2022-01-21
Filing date: 2022-08-28
Publication date: 2023-07-27
Also published as: CN114443429A; CN114443429B

Abstract

本申请公开了一种告警事件的处理方法、装置及计算机可读存储介质，当判断待监控资源在运行过程中产生的事件满足告警条件时，获取对满足告警条件的事件设置的告警参数（S12）。告警参数至少包括与事件对应的待监控资源在当前时间段对应的目标使用频率和表征告警事件严重程度的影响因子。根据告警参数确定告警事件的优先级以便接收到用户查看请求时按照优先级展示（S13）。

Description

一种告警事件的处理方法、装置及计算机可读存储介质

相关申请的交叉引用

本申请要求于2022年01月21日提交中国专利局，申请号为202210073375.5，申请名称为“一种告警事件的处理方法、装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种告警事件的处理方法、装置及非易失性计算机可读存储介质。

背景技术

大多数企业将每台服务器用于一个特定的任务或者应用程序，因为这些不同的应用或者程序并不适用于同一个系统中，但问题是，但多数服务器在运行计算时只会使用他们整体处理能力的一小部分，不能充分利用服务器的处理能力。虚拟化就解决了这个问题，将多台服务器整合到一台服务器中，运行多个虚拟环境，最终将节省物理空间。服务器的虚拟化平台管理着大量设备资源，其中包括底层的服务器主机、磁盘、网络等物理资源，以及由用户根据业务需求自发搭建的虚拟机、共享存储、虚拟网络等虚拟资源。虚拟化平台时刻都在更新接收着所有资源(包括物理资源和虚拟资源)的监控数据和各类资源底层发生的上报事件。

然而，发明人意识到，为了能够让用户了解到系统(由各服务器通过虚拟化技术整合在一起所形成的系统)的运行状态，当前的方式是直接将触发告警的事件(后文简称告警事件)无差别的展示给用户。虽然该方式能够让用户了解到系统的运行状态，但是在这些触发告警的事件中，有的是对系统运行危害程度较大的告警事件，这类事件为亟待解决的事件，而有的是对系统运行危害程度较小的告警事件，这类事件为可以延缓处理的事件，如果按照当前的处理方式，对于用户来说，不能对告警事件做出合理的处理顺序，甚至会引发系统中断或宕机的问题，降低了系统运行的可靠性。

发明内容

本申请的一方面，提供了一种告警事件的处理方法，包括以下步骤：获取待监控资源在运行过程中产生的事件；

判断所获取的事件是否满足告警条件；

响应于所获取的事件满足告警条件，获取对满足告警条件的告警事件所设置的告警参数，其中，告警参数至少包括与告警事件对应的待监控资源在当前时间段对应的目标使用频率，以及用于表征告警事件的严重程度的影响因子；及

根据所得到的告警参数确定所得到的告警事件的优先级以便于在接收到用户查看请求时按照所确定的优先级顺序展示。

相应的，本申请还提供一种告警事件的处理装置，包括：

第一获取模块，用于获取待监控资源在运行过程中产生的事件；

判断模块，用于判断所获取的事件是否满足告警条件；响应于事件满足告警条件，触发第二获取模块；

第二获取模块，用于获取对满足告警条件的告警事件所设置的告警参数，其中，告警参数至少包括与告警事件对应的待监控资源在当前时间段对应的目标使用频率，以及用于表征告警事件的严重程度的影响因子；及

确定模块，用于根据所得到的告警参数确定所得到的告警事件的优先级以便于在接收到用户查看请求时按照所确定的优先级顺序展示。

为解决上述技术问题，本申请还提供一种告警事件的处理装置，包括存储器，用于存储计算机可读指令；

一个或多个处理器，用于执行计算机可读指令时实现如上述的告警事件的处理方法的步骤。

为解决上述技术问题，本申请还提供一种非易失性计算机可读存储介质，非易失性计算机可读存储介质上存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时实现如上述的告警事件的处理方法的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例，下面将对实施例中所需要使用的附图做简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一个或多个实施例提供的一种告警事件的处理方法的流程图；

图2为本申请一个或多个实施例提供的另一种告警事件的处理方法的流程图

图3为本申请一个或多个实施例提供的一种告警事件的处理方法对应的功能模块示意图；

图4为本申请一个或多个实施例提供的一种告警事件的处理装置的结构图；

图5为本申请一个或多个实施例提供的告警事件的处理装置的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下，所获得的所有其他实施例，都属于本申请保护范围。

本申请的核心是提供一种告警事件的处理方法、装置及非易失性计算机可读存储介质。需要说的是，本申请所提到的告警事件的处理方法可以应用于单个服务器或服务器集群，也可以应用于虚拟化平台。由于虚拟化平台中管理着大量设备资源，故涉及到的告警事件较多，所以本方法尤其适用于该场景。

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。

图1为本申请实施例提供的一种告警事件的处理方法的流程图，值得注意的是，本申请主要应用于服务器虚拟化平台中各类不同时间所引发告警的处理与排序展示，如图1所示，告警事件的处理方法包括如下步骤。

S10：获取待监控资源在运行过程中产生的事件。

S11：判断所获取的事件是否满足告警条件，若是，进入S12步骤。

S12：获取对满足告警条件的告警事件所设置的告警参数。

S13：根据所得到的告警参数，确定所得到的告警事件的优先级，以便于在接收到用户查看请求时按照所确定的优先级顺序展示。

对于步骤S10所说，获取待监控资源在运行过程中产生的事件，本步骤中所提到的待监控资源可以为中央处理器(Central Processing Unit，CPU)、显卡、图像处理器(Graphics Processing Unit，GPU)等器件，而待监控资源在运行过程中产生的事件是指CPU的使用率、显卡的使用率、GPU的使用率或主机网卡断开等事件，也就是说待监控资源的使用率为多少是一个事件，待监控资源的发生情况也为一个事件。可以将事件分为两大类，一类是待监控资源使用率的多少，可称之为阈值类告警事件，另一类是待监控资源的发生情况，可以称之为事件类告警事件。此外，对于步骤S11所说，判断所获取的事件是否满足告警条件，若是，进入步骤S12。值得注意的是，本实施例对于告警条件不作限定，可以通过待监控资源的使用率是否超出预设范围，和待监控资源的发生情况是否处于正常状态来判断，但不限于这种方法判断事件是否满足告警条件。

此外，对于S12步骤所说，当事件满足告警条件时，获取对满足告警条件的告警事件所设置的参数，并且，告警参数至少包括与告警事件对应的待监控资源在当前时间段对应的目标使用频率，以及用于表征告警事件的严重程度的影响因子。其中，与告警事件对应的待监控资源在各个时间段对应的使用频率都有记录，而目标使用频率是指待监控资源发生告警事件的那段时间的使用频率。另外，目标使用频率相当于从时间上对告警事件进行评估，而用于表征告警事件的严重程度的影响因子，是从空间上对告警事件进行评估，故本方法是通过时间和空间相结合的方式对告警事件的严重程度进行评估。另外，本实施例对影响因子的选择不作限定，可以是对此事件预先设定好的权重系数，也可以是待监控资源使用率超出阈值的时间，本实施例对影响因子的具体内容不作限定，可以根据具体的实施情况对影响因子进行选择。

在此基础上，S13步骤中提到根据所得到的告警参数，确定所得到的告警事件的优先级，以便于在接收到用户查看请求时按照所确定的优先级顺序展示。本实施例对于告警事件优先级的设定是通过告警参数，可以是通过各个告警参数相加或相乘的形式得出一个值，最后根据这个值的大小确定优先级的大小，具体的为，告警参数为A、B和C，那么ABC三者的乘积或和可以作为此告警事件的优先级，但不限于将告警参数相乘或相加的形式。另外，对于如何根据优先级对告警事件进行展示不作限定，可以按照优先级从大到小的顺序进行排列，也可以按照优先级从小到大的顺序进行排列，可以根据具体的实施情况，对如何根据优先级对告警事件排序做选择。

本实施例所提供的告警事件的处理方法，当判断出待监控资源在运行过程中产生的事件满足告警条件时，获取对满足告警条件的告警事件所设置的告警参数。其中，告警参数至少包括与告警事件对应的待监控资源在当前时间段对应的目标使用频率，以及用于表征告警事件的严重程度的影响因子。最后根据所得到告警参数，确定所得到的告警事件的优先级，以便于在接收到用户查看请求时按照所确定的优先级顺序展示。由此可见，采用上述技术方案，由于结合了待监控资源的目标使用频率，和用于表征告警事件的严重程度的影响因子，相当于从时间和空间上对告警事件进行评估，因此能够较大程度的反应出告警事件对于系统运行的影响程度，所以以此确定各告警事件的优先级，能够让用户及时确定出对于系统影响较大的告警事件进而优先采取处理措施，故能够提高系统运行的可靠性。

在上述实施例的基础上，对如何获取待监控资源在运行过程中产生的事件进行描述。可以将告警事件分为两大类，一类为待监控资源使用率超出阈值时为告警事件称为阈值类告警事件，另一类为待监控资源的发生情况处于非正常状态时为告警事件称为事件类告警事件。在本实施例中，获取待监控资源在运行过程中产生的事件即为两类，可能获取到的是待监控资源的待监控项的监控数值或资源底层上报事件。其中，当获取到的是待监控资源的待监控项的监控数值时，判断此事件是否满足告警条件则变为，判断监控数值是否超过阈值。若是，确定当前事件满足告警条件，即为告警事件，若否，则确定当前事件不满足告警条件，即不为告警事件。值得注意的是，本实施例对阈值的大小不作限定，阈值的大小与待监控资源相关。例如CPU的使用率超出80％属于告警事件，但GPU使用率超出85％却不构成告警事件，因此对于阈值的大小不作限定，且不同的待监控资源可以对应相同的阈值，也可以对应不同的阈值，可以根据告警事件对应的待监控资源进行选择合适的阈值。另外，阈值通常是预先设定的，也可以根据实际情况动态设置，其也在本申请的保护范围内。

此外，当获取到的是资源底层上报事件时，判断此事件是否满足告警条件则变为，判断资源底层上报时间是否为告警黑名单上设定的事件。若是，则确定当前事件满足告警条件，即为告警事件，若不是，则确定当前事件不满足告警条件，即不为告警事件。值得注意的是，告警黑名单上设定的事件是之前发生过的突发事件，和未发生但发生就处于非正常状态的事件，例如主机网卡突然断开、CPU突然不工作等事件为告警黑名单上设定的事件。需要说明的是，告警黑名单上设定的事件可以根据实际情况修改，例如，增加事件或删除事件，其也在本申请的保护范围内。

本实施例所提供的获取待监测资源在运行过程中产生的事件有两种可能，一种为获取到的是待监控资源的待监控项的监控数值，另一种为资源底层上报事件，分别对两种情况进行了分析，当为监控数值时，通过监控数值和阈值比较，确定当前事件是否为告警事件，当为资源底层上报事件时，通过告警黑名单来确定当前事件是否为告警事件，可见此方法对两种情况都进行了分析，使确定告警事件更加准确。

在具体实施例中，当获取带监控资源在运行过程中产生的事件不同时，对应的用于表征告警事件的严重程度的影响因子可能也不同，考虑到这种情况的发生，本实施例对影响因子进行一个描述，具体的为：

当获取到的是监控数值，且监控数值对应的事件为告警事件时，用于表征告警事件的严重程度的影响因子为：监控数值与阈值的差值所对应的第一权重，且差值与第一权重呈正相关的关系。可以理解的是，当监控数值与阈值的差值越大，则第一权重就越大，就证明当前事件的严重程度比较高。此外，监控数值与阈值的差值所对应的第一权重仅仅是一种优选的实施方式，并不对其进行限定，也可以通过监控数值大于阈值的时间对应的权重作为第一权重，也就是告警时间的长短作为第一权重。本实施例对此不作限定，可以根据具体的实施情况对第一权重进行选择。需要说明的是，第一权重通常是预先设定的，但是可根据实际情况动态设置，其也在本申请的保护范围内。

例如，CPU的使用率为90％，阈值为80％，而二者的差值为10％。针对这一差值，通常情况下对应的第一权重为0.5，而根据实际情况，可以更改。例如，在业务繁忙期可以上调第一权重，设置为0.6，而在业务非繁忙期可以下调第一权重，设置为0.4。第一权重的大小可以根据待监控资源的重要程度以及当前业务是否繁忙等因素而定。

此外，当获取到的是资源底层上报事件，且该事件为告警事件，则用于表征告警事件的严重程度的影响因子为：告警事件的累计上报次数所对应的第二权重，其中累计上报次数与第二权重呈正相关关系。可以理解的是，当告警事件为资源底层上报事件时，每个告警事件都有一个上报次数，也就是此告警事件之前也发送过告警，而上报次数越多，则证明当前告警事件越严重。另外，本实施例仅仅作为一种优选的实施方式，对获取的事件为资源底层上报事件的影响因子的内容进行限定，但不限于这一种方式，可以根据具体的实施情况对影响因子的内容进行选择。需要说明的是，第二权重通常是预先设定的，但是可根据实际情况动态设置，其也在本申请的保护范围内。具体的设置可参考第一权重，此处不再赘述。

本实施例所提供的，用于表征告警事件的严重程度的影响因子是根据告警事件的类型进行选择，当为阈值类告警事件时，影响因子为监控数值与阈值的差值所对应的第一权重。当事件类告警事件时，影响因子为告警事件的累计上报次数所对应的第二权重，由此可见，此方法根据获取的事件不同，选择与事件对应的影响因子，保证了告警事件严重程度的严谨性，且获取影响因子的方法也较为简单，提高了整体的工作效率。

作为一种优选的实施方式，对目标使用频率的获取方法进行描述，下表是对各个待监控资源的事件在各个事件端的使用频率，具体如下：

获取发生告警事件所属的目标时间段以及告警事件对应的目标资源，在包含有各资源、各时间段和各使用频率的对应关系中选取与目标时间段和目标资源对应的使用频率作为目标使用频率。

可以理解的是，可能待监控资源1在01.00时的使用频率高，但是告警事件发生在02.00，而另一个待监控资源在02.00时的使用频率比待监控资源1在02.00的使用频率高，因此，获取对应时间段的使用频率可以使优先级的设定更加严谨，更能体现出当前事件的严重程度。

值得注意的是，对于各个待监控资源的事件在各个时间段的使用频率都有记录，而目标使用频率对应的是事件发生时对应的时间段，如下表所示，R0、R1、R2以及R22和R23分别代表待监控资源对应时间段内的使用频率。具体的为，待监控资源1对应的事件在02.00时满足告警条件，则对应的目标频率为待监控资源对应1对应的R2。值得注意的是，每个待监控资源中的R1、R2等频率不相同，R1代表的仅仅为待监控资源对象在对应时间的使用频率，每个待监控资源对应的事件的各时间段的使用频率的具体的数值本实施例暂不赘述。此外，各待监控资源在各时间段的使用频率的获取是通过线性拟合算法得到，但不限于这种方式。

本实施例所提供的目标使用频率的获取方法，是通过获取发生告警事件所属的目标时间段以及告警事件对应的目标资源，在包含有各资源、各时间段和各使用频率的对应关系中选取与目标时间段和目标资源对应的使用频率作为目标使用频率。可见，此方法将各个时间段中待监控资源对应的事件的使用频率都计算出来，并通过事件发生的时间来确定对应的使用频率，从而得出当前事件的优先级，此方法保证了优先级设定的严谨性，更好的体现出告警事件的严重程度。

在具体实施例中，根据获取的事件对应的类型，确定出当前事件是否为告警事件，但是可能存在此事件已经确定为告警事件的情况，产生重复告警的情况。图2为本申请实施例提供的另一种告警事件的处理方法，如图2所示，为了防止这种情况的发生，在步骤S11之后，S12之前还包括：

S14：判断当前的告警事件与已确定为告警事件的事件是否所属于同一资源的同一监控项或与已确定为告警事件的事件是否属于同一资源底层上报事件，若是，进入步骤S15。

S15：删除对应的已确定为告警事件的事件。

可以理解的是，在具体实施例中，所确定的告警事件可能已经被确定为告警事件，造成重复告警的情况，因此如S14步骤所说，首先判断当前的告警事件与已确定为告警事件的事件是否所属于同一资源的同一监控项或与已确定为告警事件的事件是否所属于同一资源底层上报事件，也就是说根据上述实施例所提到的告警事件的两大类来判断，而当前告警事件与已确定为告警事件的事件属于同一资源的同一监控项，就对应的是待监控资源的使用率对应的事件。若与已确定为告警事件的事件属于同一资源底层上报事件，则对应的是待监控资源的发生情况对应的事件。也就是说，本实施例对于两种情况都做出了对应的处理。

本实施例时提出的，在确定为告警事件之后，判断当前的告警事件与已确定为告警事件的事件是否所属于同一资源的同一监控项，或与已确定为告警事件的事件是否属于同一资源底层上报事件，避免了告警事件重复告警的情况发生，提高了确定告警事件的严谨性。

在具体实施例中，存在有些事件在01.00确定为告警事件，但下一时刻已经消除告警，已经解除危险，但仍记录为告警事件就会浪费资源，考虑到这种情况，如图2所示，若当前事件不满足告警条件，则还包括：

S16：判断当前的不满足告警条件的事件与已确定为告警事件的事件，是否所属于同一资源的同一监控项，或与已确定为告警事件的事件是否所属于同一资源底层上报事件，若是，进入S17步骤。

S17：删除对应的已确定为告警事件的事件。

可以理解的是，当此事件不满足告警条件时，还需要对此事件进行一个判断，判断此事件与已确定为告警事件的事件是否所属于同一资源的同一监控项，或与已确定为告警事件的事件是否所属于同一资源底层上报事件。可见，在两种告警事件类型中分别判断，若是，则删除对应的已确定为告警事件的事件，也就是说，当前事件已经解除了告警，没有必要再对其进行记录。

本实施例所提供的，在当前事件不满足告警条件时，对当前事件判断是否与已确定为告警事件的事件是否所属于同一资源的同一监控项，或与已确定为告警事件的事件是否所属于同一资源底层上报事件，避免了已经成为告警事件的事件已经消除告警，但仍被记录的可能，提高了记录告警事件的准确性。

在上述实施例的基础上，对于不满足告警条件的事件，但此事件与已确定为告警事件的实际属于同一资源的同一监控项时，还需要判断监控数值连续低于阈值的次数是否超过预设次数。

值得注意的是，可能会出现监控数值跳变，具体的为，在01.00时刻大于阈值，02.00时刻低于阈值又在03.00时刻大于阈值，为了防止这种情况的发生，防止监控数值跳变带来的不稳定，因此在连续多次出现监控数值低于阈值时，才认为告警被修复，才删除对应的告警事件。此外，本实施例对于预设次数不作限定，可以根据具体的实施情况对预设次数进行选择，另外，本实施例仅仅提供一种优选的实施方式，但不限于这一种判定方式，也可以根据监控数值低于阈值的连续时间来判定，本实施例不再赘述。

此外，对应的，不满足告警条件的事件，但此事件与已确定为告警事件的事件属于同一资源底层上报事件，还需要将累计上报次数清零，值得注意的是，对于底层上报事件，每发生一次告警就会对当前事件的告警次数记录，而若当前事件不满足告警条件但与已确定为告警事件的事件属于同一资源底层上报事件，则代表此事件已经消除报警，因此需要将上报次数清零。

本实施例所提供的不满足告警条件的事件，但与已确定为告警事件的实际属于同一资源的同一监控项时，对监控数值低于阈值的次数进行判断，避免了监控数值跳变带来的不稳定，也避免了对告警事件误删的情况发生，提高了确定告警事件的准确率。

在上述实施例的基础上，告警参数还包括自定义告警系数，并对优先级的设定进行限定，具体如下：

对于阈值类告警事件对应的优先级是通过当前事件的目标使用频率、第一权重和自定义告警系数的乘积作为当前事件的优先级。而对于事件类告警事件对应的优先级是通过当前事件的目标使用频率、第二权重和自定义告警系数的乘积作为当前事件的优先级。

值得注意的是，自定义告警系数是根据用户设定，可以对使用较多的器件设定较大的数，对于使用较少的器件设定较少的数。此外，本实施例是根据三者的乘积确定出事件的优先级，但不止于这一种方法，也可以对三者加上对应的权重，最后也可以加上权重后的三个信息的乘积作为当前事件的优先级。

本实施例所提供的告警参数还包括自定义告警系数，且自定义告警系数是通过用户设定，对于获取的是监控数值的事件通过自定义告警系数、第一权重和目标使用频率来确定优先级，获取的是底层上报事件的实际通过自定义告警系数、第二权重和目标使用频率来确定优先级，确保了每个告警事件的公平性，也可以根据个人爱好对个别待监控资源设定较高的自定义告警参数，提高了用户的体验感。

此外，为了让本领域技术人员更加清楚的理解本申请提供的技术方案，参考图3。图3为本申请实施例提供的一种告警事件的处理方法对应的功能模块示意图，如图3所示，参与告警事件的处理方法的功能模块包括告警排序装置1、时空优先级评估装置2、资源忙闲度时刻分布表3、告警事件上报装置4、监控阈值研判装置5和资源监控存储介质6。

其中，这些装置都是通过编程实现，是为了更好的理解本申请提供的一种告警事件的处理方法，资源监控存储介质6是按照固定的采样周期，将所有待监控资源的监控记录保存下来，并不断地更新最新的数据以及清除最早的数据，而监控阈值研判装置5是不断读取监控存储介质，比较告警事件的监控数值和阈值的差值，也就是上述实施例提到阈值类告警事件的判定方法。而告警事件上报装置4是负责搜集资源底层发送的各类事件，将与告警相关的事件筛选处理上报系统。此外，资源忙闲度时刻分布表3通过线性拟合算法，根据近段时间的历史资源忙闲度时刻分布数据，推算出当天不同时刻系统中各个资源的使用频率，时空优先级评估装置2根据告警的时空数据代入参数模型对告警的重要程度进行评分，并动态地根据最新的监控数值和事件上报情况进行更新，告警排序装置1将告警按照时空优先级评估装置所评分数的高低进行排序。

在上述实施例中，对于告警事件的处理方法进行了详细描述，本申请还提供告警事件的处理装置对应的实施例。需要说明的是，本申请从两个角度对装置部分的实施例进行描述，一种是基于功能模块的角度，另一种是基于硬件的角度。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

图4为本申请实施例提供的一种告警事件的处理装置的结构图，如图4所示，告警事件的处理装置包括：

第一获取模块10，用于获取待监控资源在运行过程中产生的事件。

判断模块11，用于判断所获取的事件是否满足告警条件；若是，则触发第二获取模块。

第二获取模块12，用于获取对满足告警条件的告警事件所设置的告警参数，其中，告警参数至少包括与告警事件对应的待监控资源在当前时间段对应的目标使用频率，以及用于表征告警事件的严重程度的影响因子。

确定模块13，用于根据所得到的告警参数确定所得到的告警事件的优先级以便于在接收到用户查看请求时按照所确定的优先级顺序展示。

图5为本申请另一实施例提供的告警事件的处理装置的结构图，如图5所示，告警事件的处理装置包括：存储器20，用于存储计算机可读指令；

处理器21，用于执行计算机可读指令时实现如上述实施例中所提到的告警事件的处理方法的步骤。

本实施例提供的告警事件的处理装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中，处理器21可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。

处理器21也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称中央处理器；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器21可以在集成有GPU，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器21还可以包括人工智能(Artificial Intelligence，AI)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个非易失性计算机可读存储介质，该非易失性计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。本实施例中，存储器20至少用于存储以下计算机可读指令201，其中，该计算机可读指令被处理器21加载并执行之后，能够实现前述任意一个实施例公开的告警事件的处理方法的相关步骤。另外，存储器20所存储的资源还可以包括操作系统202和数据203等，存储方式可以是短暂存储或者永久存储。其中，操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于告警事件的处理方法的数据等。

在一些实施例中，告警事件的处理装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解，图5中示出的结构并不构成对告警事件的处理装置的限定，可以包括比图示更多或更少的组件。

最后，本申请还提供一种非易失性计算机可读存储介质对应的实施例。非易失性计算机可读存储介质上存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时实现如上述方法实施例中记载的步骤。

可以理解的是，如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上对本申请所提供的告警事件的处理方法、装置及非易失性计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

一种告警事件的处理方法，其特征在于，包括：

获取待监控资源在运行过程中产生的事件；

判断所获取的所述事件是否满足告警条件；

响应于所获取的所述事件满足告警条件，获取对满足所述告警条件的告警事件所设置的告警参数，其中，所述告警参数至少包括与所述告警事件对应的，所述待监控资源在当前时间段对应的目标使用频率，以及用于表征所述告警事件的严重程度的影响因子；及

根据所得到的所述告警参数确定所得到的所述告警事件的优先级，以便于在接收到用户查看请求时按照所确定的所述优先级顺序展示。
根据权利要求1所述的告警事件的处理方法，其特征在于，所述获取待监控资源在运行过程中产生的事件包括：获取所述待监控资源的待监控项的监控数值和/或资源底层上报事件；

响应于获取到的是所述监控数值，所述判断所获取的所述事件是否满足告警条件包括：判断所述监控数值是否超过阈值，响应于所述监控数值超过阈值，确定所述事件满足所述告警条件，响应于所述监控数值未超过阈值，确定所述事件不满足所述告警条件；

响应于获取到的是所述资源底层上报事件，所述判断所获取的所述事件是否满足告警条件包括：判断所述资源底层上报事件是否为告警黑名单上设定的事件，响应于所述资源底层上报事件为告警黑名单上设定的事件，确定所述事件满足所述告警条件，响应于所述资源底层上报事件不为告警黑名单上设定的事件，确定所述事件不满足所述告警条件。
根据权利要求2所述的告警事件的处理方法，其特征在于，若获取到的是所述监控数值且所述事件为所述告警事件，则所述用于表征所述告警事件的严重程度的影响因子为：所述监控数值与阈值的差值所对应的第一权重；其中，所述差值与所述第一权重呈正相关关系。
根据权利要求2所述的告警事件的处理方法，其特征在于，若获取到的是所述资源底层上报事件且所述事件为所述告警事件，则所述用于表征所述告警事件的严重程度的影响因子为：所述告警事件的累积上报次数所对应的第二权重；其中，所述累积上报次数与所述第二权重呈正相关关系。
根据权利要求1所述的告警事件的处理方法，其特征在于，所述目标使用频率通过如下方式确定：

获取发生所述告警事件所属的目标时间段以及所述告警事件对应的目标资源；及

在包含有各资源、各时间段和各使用频率的对应关系中，选取与所述目标时间段和所述目标资源对应的使用频率作为所述目标使用频率。
根据权利要求1或5所述的告警事件的处理方法，其特征在于，所述与所述告警事件对应的待监控资源在各个时间段对应的使用频率都有记录，所述目标使用频率是指待监控资源发生告警事件的那段时间的使用频率。
根据权利要求5所述的告警事件的处理方法，其特征在于，所述包含有各资源、各时间段和各使用频率的对应关系是通过线性拟合算法，对各资源在各时间段内的历史使用频率所确定的。
根据权利要求2所述的告警事件的处理方法，其特征在于，若所获取的所述事件满足所述告警条件，在所述获取对满足所述告警条件的告警事件设置的告警参数的步骤之前，还包括：

判断当前的所述告警事件与已确定为所述告警事件的事件，是否属于同一资源的同一监控项，或与已确定为所述告警事件的事件是否属于同一资源底层上报事件；及

响应于判断结果为是，删除对应的已确定为所述告警事件的事件，并进入所述获取对满足所述告警条件的告警事件所设置的告警参数的步骤。
根据权利要求2所述的告警事件的处理方法，其特征在于，所述方法还包括：

响应于所获取的所述事件不满足所述告警条件，判断当前不满足所述告警条件的事件与已确定为所述告警事件的事件，是否属于同一资源的同一监控项，或与已确定为所述告警事件的事件是否属于同一资源底层上报事件；及

响应于判断结果为是，删除对应的已确定为所述告警事件的事件。
根据权利要求9所述的告警事件的处理方法，其特征在于，响应于当前的不满足所述告警条件的事件与已确定为所述告警事件的事件，属于同一资源的同一监控项，在所述删除对应的已确定为所述告警事件的事件步骤之前，还包括：

记录属于同一待监控资源的，同一待监控项的所述监控数值连续低于所述阈值的次数；

判断所述次数是否超过预设次数；及

响应于所述次数超过预设次数，进入所述删除对应的，已确定为所述告警事件的事件步骤。
根据权利要求4所述的告警事件的处理方法，其特征在于，所述方法还包括：

响应于所获取的所述事件不满足所述告警条件，判断不满足所述告警条件的事件与已确定为所述告警事件的事件，是否属于同一资源底层上报事件；及

响应于所述告警条件的事件与已确定为所述告警事件的事件，属于同一资源底层上报事件，将所述累积上报次数清零。
根据权利要求3或4所述的告警事件的处理方法，其特征在于，所述告警参数还包括自定义告警系数，对应的，所述根据所得到所述告警参数确定所得到的所述告警事件的优先级包括：

将所述目标使用频率、第一权重、所述自定义告警系数的乘积作为所得到的所述告警事件的优先级。
根据权利要求3或4所述的告警事件的处理方法，其特征在于，所述告警参数还包括自定义告警系数，对应的，所述根据所得到所述告警参数确定所得到的所述告警事件的优先级还包括：

将所述目标使用频率、第二权重、所述自定义告警系数的乘积作为所得到的所述告警事件的优先级。
一种告警事件的处理装置，其特征在于，包括：

第一获取模块，用于获取待监控资源在运行过程中产生的事件；

判断模块，用于判断所获取的所述事件是否满足告警条件；响应于所述事件满足告警条件，触发第二获取模块；

所述第二获取模块，用于获取对满足所述告警条件的告警事件所设置的告警参数，其中，所述告警参数至少包括与所述告警事件对应的，所述待监控资源在当前时间段对应的目标使用频率，以及用于表征所述告警事件的严重程度的影响因子；及

确定模块，用于根据所得到的所述告警参数，确定所得到的所述告警事件的优先级，以便于在接收到用户查看请求时按照所确定的所述优先级顺序展示。
一种告警事件的处理装置，其特征在于，包括存储器，用于存储计算机可读指令；

一个或多个处理器，用于执行所述计算机可读指令时实现如权利要求1至13任一项所述的告警事件的处理方法的步骤。
一种非易失性计算机可读存储介质，其特征在于，所述非易失性计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时实现如权利要求1至13任一项所述的告警事件的处理方法的步骤。