CN105205568B

CN105205568B - 告警事务提取方法及系统

Info

Publication number: CN105205568B
Application number: CN201510666158.7A
Authority: CN
Inventors: 曾瑛; 蔡毅; 罗云; 李星南; 王平
Original assignee: Sichuan Enrising Information Technology Co Ltd; Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Current assignee: Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd; China Comservice Enrising Information Technology Co Ltd
Priority date: 2015-10-14
Filing date: 2015-10-14
Publication date: 2017-03-08
Anticipated expiration: 2035-10-14
Also published as: CN105205568A

Abstract

本发明涉及一种告警事务提取方法及系统，其中方法包括以下步骤：将告警时间序列划分成若干个时间段；根据各个相邻的所述时间段中心时间点确定所述告警时间序列的段间差异，同时根据每一所述时间段内的各个时间点确定所述告警时间序列的段内差异；根据所述段间差异和所述段内差异的比值确定所述告警时间序列的最优划分；利用滑动时间窗口法提取所述最优划分下每一时间段内的告警事务。本发明所提出的告警事务提取方法及系统，首先通过对告警时间序列的时间段划分质量进行合理的评价，确定告警时间序列的最优划分后，再对最优划分下的各个时间段进行告警事务提取，极大地提高了提取告警事务的效率。

Description

告警事务提取方法及系统

技术领域

本发明涉及网络风险管控技术领域，特别是涉及一种告警事务提取方法及系统。

背景技术

网络中各设备产生的告警信息对网络风险分析至关重要，由于通信网中告警传播的复杂性，故障的发生往往伴随着大量的相关告警出现，为故障的精确定位带来很大的困难。对告警进行关联分析是故障定位的基础，利用关联规则挖掘得到有效的规则知识来辅助故障定位，发掘隐藏在大量原始告警信息中的故障定位知识，用得到有价值的知识来指导网络故障诊断，从而更高层次、全方位的、更准确的去管理网络故障，提高网管效率和智能化水平，降低成本。

由于网络故障的发生是随机的，因此网络中的告警信息具有突发性，即告警时间序列具有突发性，为避免对大量空告警事务的提取，在对告警时间序列进行告警事务提取时，通常先利用时间段划分算法将告警时间序列划分为多个时间段，然后再对每一个时间段进行告警事务的提取，从而提高对告警进行关联分析的效率。在利用时间段划分算法将告警时间序列划分为多个时间段时，由于实际情况中相关性比较大的告警数据总是比较密集地出现在一个时间段内，因此如果告警时间序列的划分所产生的告警时间段相对密集度不高，不能很好地反映出实际情况，就会在很大程度上限制告警事务提取的有效性和高效性，因此对于提取告警事务而言，时间段划分质量的优劣具有极为重要的作用。然而，在已有的时间段划分质量评价方法中，由于存在时间距离重复计算等因素，导致对告警时间序列的时间段划分质量进行评价时，评价方法的适应性和稳定性均有限，致使寻找最优划分方法困难，不利于告警事务提取效率的进一步提高。

发明内容

基于此，有必要针对告警事务提取效率低下的问题，提供一种告警事务提取方法及系统，该方法及系统首先对时间段划分质量进行评价，确定告警时间序列的最优划分后，再对最优划分获得的各个时间段进行告警事务的提取，从而提高了对告警时间序列进行告警事务提取的效率，为告警分析提供有力支持。

在本发明所提供的实施例中，包括如下技术方案：

一种告警事务提取方法，该方法包括如下步骤：

将告警时间序列划分成若干个时间段；

根据各个相邻的所述时间段中心时间点确定所述告警时间序列的段间差异，同时根据每一所述时间段内的各个时间点确定所述告警时间序列的段内差异；

根据所述段间差异和所述段内差异的比值确定所述告警时间序列的最优划分；

利用滑动时间窗口法提取所述最优划分下每一时间段内的告警事务。

同时，本发明还提供一种告警事务提取系统，该系统包括：

划分单元，用于将告警时间序列划分成若干个时间段；

计算单元，用于根据各个相邻的所述时间段中心时间点确定所述告警时间序列的段间差异，同时根据每一所述时间段内的各个时间点确定所述告警时间序列的段内差异；

判断单元，用于根据所述段间差异和所述段内差异的比值确定所述告警时间序列的最优划分；

提取单元，用于利用滑动时间窗口法提取所述最优划分下每一时间段内的告警事务。

本发明根据对告警时间序列进行划分后得到的若干个时间段，确定告警时间序列的段间差异和段内差异，由于段间差异和段内差异的比值同时反映出段间差异和段内差异二者的变化趋势，因此根据段间差异和段内差异的比值能够确定告警时间序列的最优划分，而在最优划分下获得的各个时间段彼此之间具有较高的孤立性，同时每一时间段内的告警时刻具有较高的内聚性，即最优划分能够最大程度将发生告警的时间点全部集中于某几个时间段内，因此对最优划分下的各个时间段进行告警事务提取时，告警事务提取效率较高，进一步地为告警分析提供了有力支持。

附图说明

图1为本发明其中一个实施例中告警事务提取方法的流程示意图；

图2为从原始告警数据中任意获取的一个告警时间序列V；

图3为在不同划分算法下告警时间序列V的划分质量评价曲线图；

图4为在最优划分下将告警时间序列V划分成时间段；

图5为告警时间序列I的示意图；

图6为告警时间序列II的示意图；

图7为告警时间序列III的示意图；

图8为在基于双约束划分算法下根据其中一个划分质量评价函数获得的告警时间序列I的划分质量评价曲线图；

图9为在基于双约束划分算法下根据另一个划分质量评价函数获得的告警时间序列I的划分质量评价曲线图；

图10为在K-平均划分算法下根据其中一个划分质量评价函数获得的告警时间序列I的划分质量评价曲线图；

图11为在K-平均划分算法下根据另一个划分质量评价函数获得的告警时间序列I的划分质量评价曲线图；

图12为在不同划分算法下告警时间序列II的划分质量评价曲线图；

图13为在不同划分算法下告警时间序列III的划分质量评价曲线图；

图14为本发明其中一个实施例中告警事务提取系统的结构示意图。

具体实施方式

下面将结合附图及较佳实施例对本发明的技术方案进行详细描述。

在其中一个实施例中，参见图1所示的告警事务提取方法的流程示意图，该方法具体包括如下步骤：

S100将告警时间序列划分成若干个时间段；

告警时间序列是网络中原始告警数据中发生告警的时间点的集合，即告警时间序列是由告警时刻或者告警时间点组成的，例如告警时间序列V＝{t_i},i＝1,2,...,K，其中，t_i表示第个i告警发生的时刻，在该告警时间序列中共有K个告警；所谓告警时间序列的划分，是指利用一定的算法根据告警时间序列的分布特征将各个告警时刻聚类为若干个时间段。

S110根据各个相邻的时间段中心时间点确定告警时间序列的段间差异，同时根据每一时间段内的各个时间点确定告警时间序列的段内差异；

告警时间序列的段间差异是表征告警时间序列划分后得到的各个时间段的孤立性，段内差异是表征各个时间段的内聚性的物理量，在计算告警时间序列的段间差异和段内差异时，实际可以采用多种计算方式，而作为一种优选的实施方式，本发明提出根据各个相邻的时间段中心时间点确定告警时间序列的段间差异，以及根据每一时间段内的各个时间点确定告警时间序列的段内差异的计算方式，具体如下：

作为一种具体的实施方式，段间差异为各个相邻的时间段中心时间点之间距离的平均值。如果用公式来表示段间差异I₀(t)，如公式(1)所示

其中，k为告警时间序列所划分的时间段的数量，为第i个时间段的中心时间点，的计算公式为

其中，N_i为第i个时间段内总的告警数量，t_ij为第i个时间段内第j个告警发生的时刻。本实施方式通过求取划分告警时间序列后得到的各个时间段的中心时间点，对各个时间段的中心时间点求取平均值，并以该平均值作为告警时间序列的段间差异，不仅能够表征时间段的孤立性，而且避免了时间距离重复计算的问题，提高了告警时间序列的时间段划分质量评价的效率。

作为一种具体的实施方式，段内差异为各个时间段的平均距离的平均值，每一时间段的所述平均距离为该时间段内各个时间点到该时间段的中心时间点的平均距离。如果用公式来表示段内差异C₀(t)，参见公式(3)所示

其中，k为告警时间序列所划分的时间段的数量，N_i为第i个时间段内总的告警数量，t_ij为第i个时间段内第j个告警发生的时刻，为第i个时间段的中心时间点，见公式(2)。本实施方式首先求取每一时间段内的各个时间点即告警时刻到该时间段的中心时间点的平均距离，该平均距离代表了该时间段内各个时间点相对于中心时间点的分布聚拢程度，即平均距离越小，代表各个时间点越靠近中心时间点，相对于中心时间点的分布越是聚拢的；其次，在求取平均距离的基础之上，由于每一时间段均对应一个平均距离，因此为表征告警时间序列的时间段的内敛性，公式(3)对各个时间段的平均距离求取平均值，以该平均值作为告警时间序列的段内差异，不仅能够表征时间段的内敛性，而且同样避免了时间距离重复计算的问题，提高了告警时间序列的时间段划分质量评价的效率。

S120根据段间差异和段内差异的比值确定所述告警时间序列的最优划分。

由于理想的告警时间序列的时间段划分，应该是使各个时间段的中心时间点之间的时间距离尽可能的大，即时间段的孤立性强，而每一时间段内各个时间点到该时间段的中心时间点之间的时间距离尽可能的小，即时间段的内敛性强，上述理想的时间段划分能够把发生告警的时间点全部集中于某几个时间段内，因此在对告警时间序列进行告警事务的提取时，可仅对时间段进行告警事务的提取，而忽略未出现告警的空告警时间段，因此可以极大地提高对告警关联分析的效率，从而进一步提高对定位网络故障的效率。故本实施例中以告警时间序列的段间差异和段内差异的比值作为评价告警时间序列的时间段划分质量的参数，例如，根据告警时间序列的段间差异I₀(t)和段内差异C₀(t)构建划分质量评价函数Q，如公式(4)所示，根据划分质量评价函数确定告警时间序列的最优划分，能够使得对告警时间序列的时间段划分质量的评价结果更合理，同时由于该划分质量评价函数适用于对不同划分算法的评价，因此增强了告警时间序列的时间段划分质量评价的适应性。

S130利用滑动时间窗口法提取最优划分下每一时间段内的告警事务。

在本实施例中，首先利用告警时间序列的段间差异和段内差异的比值确定最优划分，即根据告警时间序列的段间差异和段内差异的比值的最大值确定对应的时间段的数量，该时间段数量所对应的划分即为时间段的最优划分，继而在最优划分下，利用滑动时间窗口法提取每一时间段内的告警事务，具体而言，时间窗口的窗口宽度w的取值范围为p_max≤w≤Δw，时间窗口的滑动步长的取值范围为Q_min≤s≤Δw，其中Δw为时间段的宽度，p_max为时间段内不同告警情景之间的最大距离的最大值，Q_min为时间段内不同告警情景之间的最小距离的最小值；设定满足上述条件的时间窗口的窗口宽度和滑动步长后，根据设定的窗口宽度和滑动步长提取每一时间段的告警事务，即依次向前滑动时间窗口，每次滑动的时间长度为滑动步长的距离，且每滑动一次时间窗口，都将此时间窗口内的所有告警事件看成一个告警事务，直到时间窗口遍历所有的时间段，既完成对告警时间序列的告警事务的提取。本发明所提出的告警时间序列的告警事务提取方法，在提取告警事务之前，首先对告警时间序列的时间段划分质量进行评价，以获取能够将发生告警的时间点全部集中于某几个时间段内的最优划分结果，从而提高告警事务提取的效率，同时在最优划分下利用滑动时间窗口对各个时间段分别提取告警事务，不仅能够将频繁发生的告警从告警时间序列中提取出来，而且通过滑动步长的设置能够将全部的告警信息转化为告警事务，从而为告警分析提供有力支持。

下面将结合实例详细说明利用滑动时间窗口法提取最优划分下每一时间段内的告警事务案的可行性。从原始告警数据中任意获取的一个告警时间序列V＝{1,2,3,4,6,10,11,12,15,17,18,19,20,23,24,25,27,38,40,41,42,43,44,45,46}，参见图2所示，该告警时间序列包含25个告警时间点，其中的A、B、C、D分别表示不同的告警事件；利用基于双约束划分算法和K-平均划分算法对告警时间序列V分别进行时间段的划分，模拟计算结果如图3所示，由图3所示的不同划分算法下划分质量评价曲线图可知，基于双约束划分算法下在k＝3时的Q值为最大值，表明k＝3是最优划分获得的时间段数量；根据k＝3时的基于双约束划分算法，将告警时间序列V划分成3个时间段，如图4所示，分别为T₁＝{1,2,3,4,6,10,11,12}，T₂＝{15,17,18,19,20,23,24,25,27}和T₃＝{38,40,41,42,43,44,45,46}；确定最优划分获得的各个时间段之后，利用滑动时间窗口法提取最优划分获得的每一时间段内的告警事务，例如，设定时间窗口的窗口宽度为6秒、滑动步长为4秒时，以该时间窗口提取时间段T₁＝{1,2,3,4,6,10,11,12}的告警事务，提取的告警事务为ABC和AB；设定时间窗口的窗口宽度为5秒、滑动步长为2秒时，以该时间窗口提取时间段T₂＝{15,17,18,19,20,23,24,25,27}的告警事务，提取的告警事务为ABCD、ACD、AB和ABC，同样以该时间窗口提取时间段T₃＝{38,40,41,42,43,44,45,46}的告警事务时，提取的告警事务为ABD和ABCD，告警事务的提取结果如表1所示。

表1

作为一种具体的实施方式，时间段的数量对应于段间差异和段内差异的比值，当比值为最大值时，最大值对应的时间段的数量为最优划分获得的时间段的数量。利用划分算法将告警时间序列划分成若干个时间段时，时间段的数量可以不同，而且时间段的数量对时间段划分质量具有重要影响，通常情况下时间段的数量不同，时间段划分质量也不相同，因此在本实施方式中，利用划分算法将告警时间序列划分成不同数量的时间段时，由于每一次划分都对应于一个告警时间序列的段间差异和段内差异，因此实际上时间段的数量与段间差异和段内差异的比值一一对应，当段间差异和段内差异的比值为最大值时，此时最大值所对应的时间段的数量，就是最优划分获得的时间段的数量，即根据该最优划分对告警时间序列进行划分所得到的各个时间段，相比于其他划分方式是较为理想的，此时，该最优划分下的告警时间序列最利于提高告警事务的提取效率。

为进一步阐述本发明所提出的告警事务提取方法，并检验本发明所提供的方法的合理性以及正确性，下面将在MATLAB 2011b数值仿真平台的基础之上，对本发明的技术方案进行完整详细的举例说明。

首先，为便于对本发明所提供的方法进行检验，分别取特征比较明显的三组告警时间序列，分别记为告警时间序列I(图5)、告警时间序列II(图6)和告警时间序列III(图7)，图5～图7的纵坐标均为告警的属性，表示在某一时刻告警发生，将其属性设置为1。告警时间序列I、告警时间序列II和告警时间序列III分别包括30个、40个、50个告警时间点，由图5～图7可知，对于告警时间序列I、告警时间序列II和告警时间序列III而言，当划分的时间段的数量分别为3、4和5时，得到的时间段划分结果是最优的划分结果，因为此时各个时间段均得到了很好的聚类，也最符合实际情况。

接下来，以两种常用的时间段划分算法——基于双约束划分算法和K-平均划分算法为例，利用两种划分算法分别对告警时间序列I进行多次的时间段划分，获得具有不同数量的时间段的划分结果，对于不同数量的时间段，分别计算相应的划分质量评价函数(以下简称为评价函数)，并绘制划分质量评价函数值随时间段数量变化的划分质量评价曲线，在划分质量评价曲线的基础之上分析不同划分质量评价函数对时间段划分质量评价的差异。

对于基于双约束划分算法，其一种划分质量评价函数为

其中，k为告警时间序列划分的时间段的数量，为第j个时间段的中心时间点，为第l个时间段的中心时间点。

通常情况下，M值越大，说明时间段划分的结果越好。经数值模拟后，分别得到如图8～图9所示的划分质量评价函数值随时间段数量变化的划分质量评价曲线图，其中图8是利用公式(5)得到的划分质量评价曲线图，图9是利用本发明所提出的公式(4)得到的划分质量评价曲线图。从图8的仿真结果可以看出：划分质量评价函数M随着划分的时间段数量k值的增大呈增长趋势，在k＝3时M值并不是最大值，其原因在于，公式(5)所示的划分质量评价函数考虑了每一个时间段与其他各时间段中心时间点之间的距离，这大大增加了段间差异，而段内差异却随着k的增大而一直减小，因此M一直处于上升的趋势，即表示时间段划分的数量越大，划分结果越好，这显然与图5所示的实际情况不符，也进一步说明公式(5)所示的划分质量评价函数对告警时间序列的时间段划分并没有很好的适应性。实际上，告警时间序列的划分可以抽象为一维数据的聚类，而公式(5)所示的划分质量评价函数却更适合在二维及高维数据中使用。同样是基于双约束划分算法对时间段进行不同时间段数量的划分，利用本发明所提出的划分质量评价函数，得到如图9所示的划分质量评价曲线图，由图9可知，Q值随着k值的增大呈现先增大后减小的趋势，并且在k＝3时达到最大，说明此时的划分结果最优，与告警时间序列I的实际情况相符合。同时由于本发明所提供的划分质量评价函数中段间差异的计算减弱了其在Q中的增长速度，因而使得Q在合理的划分时间段数量下取得最大值，从而很好地符合时间段划分的实际情况，对告警时间序列的时间段划分具有较佳的适应性。

在K-平均划分算法中，通常以距离代价函数F作为划分质量评价函数，并根据距离代价最小准则求解最优划分下的时间段数量，即时间段数量k的最优选择为距离代价函数F的具体计算方法为：

F＝L+D (6)

其中，为段间距离，为段内距离，k为告警时间序列划分的时间段的数量，为第j个时间段的中心时间点，t₀为告警时间序列中全部告警时间点的中心时间点。

经数值模拟后，分别得到如图10～图11所示的划分质量评价函数值随时间段数量变化的划分质量评价曲线图，其中图10是利用公式(6)得到的划分质量评价曲线图，图11是利用本发明所提出的公式(4)得到的划分质量评价曲线图。从图10的仿真结果可以看出：F值随着划分的时间段数量k值的增大呈不稳定趋势，其在k＝3时F值并不是最小值，即该划分质量评价函数在告警时间序列的时间段划分质量评价中，效果不是最优的。而利用本发明所提出的划分质量评价函数，得到如图11所示的划分质量评价曲线图，由图11可知，Q值随着k值的增大呈现先增大后减小的趋势，并且在k＝3时达到最大，说明此时的划分结果最优，与告警时间序列A的实际情况相符，也说明本发明所提出的划分质量评价函数对告警时间序列的时间段划分具有较佳的适应性。

除分别利用基于双约束划分算法和K-平均划分算法对告警时间序列I进行时间段划分，获得不同划分质量评价函数的数值模拟结果并以此说明本发明所提出的时间段划分质量评价函数的优越性之外，本发明还分别对告警时间序列II和告警时间序列III也分别进行了数值模拟，根据本发明所提出的划分质量评价函数，得到如图12～图13所示的划分质量评价曲线图，其中，图12是基于上述两种划分算法对告警时间序列II的不同数量的时间段划分结果的数值模拟，图13基于上述两种划分算法对告警时间序列III的不同数量的时间段的划分结果的数值模拟。从仿真结果可以看出：Q值随着划分的时间段数量k值的增大呈不稳定趋势而非递增趋势，其分别在图12中k＝4和图13中k＝5时Q达到最大值，即k＝4和k＝5分别是告警时间序列II和告警时间序列III的最优划分，这与告警时间序列II和告警时间序列III的实际情况相符，也进一步说明本发明所提出的告警时间序列的时间段划分质量评价方法具有一定的普适性。

相应地，本发明还提出一种告警事务提取系统，在其中一个实施例中，参见图14，告警事务提取系统包括划分单元1400、计算单元1410、判断单元1420和提取单元1430，下面对各个单元分别予以说明：

划分单元1400，用于将告警时间序列划分成若干个时间段；

告警时间序列是网络中原始告警数据中发生告警的时间点的集合，即告警时间序列是由告警时刻或者告警时间点组成的，例如告警时间序列V＝{t_i},i＝1,2,...,K，其中，t_i表示第个i告警发生的时刻，在该告警时间序列中共有K个告警；划分单元1400对告警时间序列进行所谓的划分，是指划分单元1400利用一定的算法根据告警时间序列的分布特征将各个告警时刻聚类为若干个时间段。

计算单元1410，用于根据各个相邻的所述时间段中心时间点确定告警时间序列的段间差异，同时根据每一时间段内的各个时间点确定告警时间序列的段内差异；

告警时间序列的段间差异表征的是划分单元1400将告警时间序列划分后得到的各个时间段的孤立性，段内差异表征的是各个时间段的内聚性，计算单元1410在计算告警时间序列的段间差异和段内差异时，实际可以采用多种计算方式，而作为一种优选的实施方式，计算单元1410根据各个相邻的时间段中心时间点确定告警时间序列的段间差异，以及根据每一时间段内的各个时间点确定告警时间序列的段内差异的计算方式，具体如下：

作为一种具体的实施方式，计算单元1410确定的段间差异为各个相邻的时间段中心时间点之间距离的平均值，参见公式(1)所示。本实施方式通过求取划分告警时间序列后得到的各个时间段的中心时间点，对各个时间段的中心时间点求取平均值，并以该平均值作为告警时间序列的段间差异，不仅能够表征时间段的孤立性，而且避免了时间距离重复计算的问题，提高了告警时间序列的时间段划分质量评价的效率。

作为一种具体的实施方式，计算单元1410确定的段内差异为各个时间段的平均距离的平均值，每一时间段的所述平均距离为该时间段内各个时间点到该时间段的中心时间点的平均距离，参见公式(3)所示。本实施方式首先求取每一时间段内的各个时间点即告警时刻到该时间段的中心时间点的平均距离，该平均距离代表了该时间段内各个时间点相对于中心时间点的分布聚拢程度，即平均距离越小，代表各个时间点越靠近中心时间点，相对于中心时间点的分布越是聚拢的；其次，在求取平均距离的基础之上，由于每一时间段均对应一个平均距离，因此为表征告警时间序列的时间段的内敛性，公式(3)对各个时间段的平均距离求取平均值，以该平均值作为告警时间序列的段内差异，不仅能够表征时间段的内敛性，而且同样避免了时间距离重复计算的问题，提高了告警时间序列的时间段划分质量评价的效率。

判断单元1420，用于根据段间差异和所述段内差异的比值确定所述告警时间序列的最优划分。

由于理想的告警时间序列的时间段划分，应该是使各个时间段的中心时间点之间的时间距离尽可能的大，即时间段的孤立性强，而每一时间段内各个时间点到该时间段的中心时间点之间的时间距离尽可能的小，即时间段的内敛性强，上述理想的时间段划分能够把发生告警的时间点全部集中于某几个时间段内，因此在对告警时间序列进行告警事务的提取时，可仅对时间段进行告警事务的提取，而忽略未出现告警的空告警时间段，因此可以极大地提高对告警关联分析的效率，从而进一步提高对定位网络故障的效率。故本实施例中判断单元1420以告警时间序列的段间差异和段内差异的比值作为评价告警时间序列的时间段划分质量的参数，例如，根据告警时间序列的段间差异I₀(t)和段内差异C₀(t)构建划分质量评价函数Q，如公式(4)所示，根据划分质量评价函数确定告警时间序列的最优划分，使其对告警时间序列的时间段划分质量的评价结果更合理，同时由于该划分质量评价函数适用于对不同划分算法的评价，因此增强了告警时间序列的时间段划分质量评价的适应性。

提取单元1430，用于利用滑动时间窗口法提取最优划分算法下每一时间段内的告警事务。

在本实施例中，首先判断单元1420利用告警时间序列的段间差异和段内差异的比值确定最优划分，即根据告警时间序列的段间差异和段内差异的比值的最大值确定对应的时间段的数量，该时间段数量所对应的划分即为时间段的最划分；在最优划分下，提取单元1430利用滑动时间窗口法提取每一时间段内的告警事务，具体而言，时间窗口的窗口宽度w的取值范围为p_max≤w≤Δw，时间窗口的滑动步长的取值范围为Q_min≤s≤Δw，其中Δw为时间段的宽度，p_max为时间段内不同告警情景之间的最大距离的最大值，Q_min为时间段内不同告警情景之间的最小距离的最小值；设定满足上述条件的时间窗口的窗口宽度和滑动步长后，提取单元1430根据设定的窗口宽度和滑动步长提取每一时间段的告警事务，即依次向前滑动时间窗口，每次滑动的时间长度为滑动步长的距离，且每滑动一次时间窗口，都将此时间窗口内的所有告警事件看成一个告警事务，直到时间窗口遍历所有的时间段，提取单元1430既完成对告警时间序列的告警事务的提取。本发明所提出的告警时间序列的告警事务提取系统，在提取单元1430提取告警事务之前，判断单元1420对告警时间序列的时间段划分质量进行评价，以获取告警时间序列的最优划分结果，将发生告警的时间点全部集中于某几个时间段内，从而提高告警事务提取的效率，同时提取单元1430在最优划分下利用滑动时间窗口对各个时间段分别提取告警事务，不仅能够将频繁发生的告警从告警时间序列中提取出来，而且通过滑动步长的设置能够将全部的告警信息转化为告警事务，从而为告警分析提供有力支持。

作为一种具体的实施方式，时间段的数量对应于段间差异和段内差异的比值，当比值为最大值时，判断单元判定最大值对应的时间段的数量为最优划分获得的时间段的数量。划分单元利用划分算法将告警时间序列划分成若干个时间段时，时间段的数量可以不同，而且时间段的数量对时间段划分质量具有重要影响，通常情况下时间段的数量不同，时间段划分质量也不相同，因此在本实施方式中，划分单元利用划分算法将告警时间序列划分成不同数量的时间段时，由于每一次划分都对应于一个告警时间序列的段间差异和段内差异，因此实际上时间段的数量与段间差异和段内差异的比值一一对应，当段间差异和段内差异的比值为最大值时，此时判断单元判定最大值所对应的时间段的数量，就是最优划分获得的时间段的数量，即划分单元根据该最优划分对告警时间序列进行划分所得到的各个时间段，相比于其他划分方式是较为理想的，此时，该最优划分下的告警时间序列最利于提高告警事务的提取效率。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种告警事务提取方法，其特征在于，包括以下步骤：

将告警时间序列划分成若干个时间段；

利用滑动时间窗口法提取所述最优划分下每一时间段内的告警事务；

所述段间差异为各个相邻的时间段中心时间点之间距离的平均值；

所述段内差异为各个时间段的平均距离的平均值，每一时间段的所述平均距离为该时间段内各个时间点到该时间段的中心时间点的平均距离。

2.根据权利要求1所述的告警事务提取方法，其特征在于，

所述时间段的数量与所述段间差异和段内差异的比值对应，当所述比值为最大值时，所述最大值对应的所述时间段的数量为最优划分获得的时间段的数量。

3.一种告警事务提取系统，其特征在于，包括：

划分单元，用于将告警时间序列划分成若干个时间段；

提取单元，用于利用滑动时间窗口法提取所述最优划分下每一时间段内的告警事务；

所述计算单元确定的所述段间差异为各个相邻的时间段中心时间点之间距离的平均值；

所述计算单元确定的所述段内差异为各个时间段的平均距离的平均值，每一时间段的所述平均距离为该时间段内各个时间点到该时间段的中心时间点的平均距离。

4.根据权利要求3所述的告警事务提取系统，其特征在于，

所述时间段的数量与所述段间差异和段内差异的比值对应，当所述比值为最大值时，所述判断单元判定所述最大值对应的所述时间段的数量为最优划分获得的时间段的数量。