CN117112609B

CN117112609B - 一种使用关键元素矩阵提高监控历史数据检索效率的方法

Info

Publication number: CN117112609B
Application number: CN202310786996.2A
Authority: CN
Inventors: 经玉健; 郝勇; 祁皓冉; 姜万
Original assignee: Nanjing Sac Rail Traffic Engineering Co ltd
Current assignee: Nanjing Sac Rail Traffic Engineering Co ltd
Priority date: 2023-06-29
Filing date: 2023-06-29
Publication date: 2024-05-10
Anticipated expiration: 2043-06-29
Also published as: CN117112609A

Abstract

一种使用关键元素矩阵提高监控历史数据检索效率的方法，涉及工业自动化领域大型监控系统软件历史故障报警数据多条件检索，对待检索的多个条件一一进行逻辑预解析，提取关键元素，按条件按次序排列形成关键元素矩阵。通过对关键元素矩阵赋值来完成对历史数据记录的多条件检索，对矩阵赋值即对每个元素进行单独检索，赋值以行为单位，从左往右进行，碰到负值的元素跳转到下一行重新开始赋值，相同的元素仅需检索一次，直到某行值为均为非负值则表明该条历史数据记录满足条件，如整个矩阵赋值完毕没有行满足，则该条历史数据记录不满足条件。

Description

一种使用关键元素矩阵提高监控历史数据检索效率的方法

技术领域

本发明涉及工业自动化领域监控系统软件，尤其涉及大型监控系统集成平台中多条件历史数据查询检索、筛选匹配等相关技术。涵盖综合监控、电力监控、环境与设备监控系统、火灾监控、煤矿、冶金、石油等自动化工业监控行业。

背景技术

随着大型工业监控系统平台的集成化程度越来越高，其所管理的数据量和逻辑复杂度也水涨船高，对系统运行所产生的历史数据筛选检索的难度也显著增加。以地铁综合监控系统为例，每个地下车站各控制专业大约一天合计产生2千条报警，一条20个车站的地铁线每天约产生4万条报警。这样的集成监控系统每月仅报警历史数据就有超过一百万条，这样庞大的历史数据，如果我们还沿用过去的普通数据检索方式(纯字符串检索方式)效率将会非常低。尤其某些基于对历史数据分析计算的高阶应用模块，提出了对历史数据筛选检索更高的要求。以地铁运营的行车可用性指标计算模块为例，该模块需要从每月百万计的报警数据中把真正影响行车的故障报警数据筛选出来，以计算每月的系统行车可用性比例。这就需要地铁运营人员把可能影响到行车的几十类故障报警描述列出来，一条一条按次序交给计算模块去海量的报警数据库中匹配检索，找出每类故障报警发生过的历史记录再综合计算。

我们用A_total来表示历史故障报警数据集，用M_template来表示运营人员整理出的可能影响行车可用性的故障报警全集(待检索条件全集，检索条件之间为“逻辑或”的关系，数据记录满足条件之一即可)，R_e为检索匹配的结果集。

假设库中一条故障报警描述的长度为m，历史报警数目为k，可能影响到行车的故障类型关键描述长度为n，可能影响行车的故障类型数目为l，普通的检索算法为：

从上述算法可以看出，要知道每条历史故障报警是否影响到行车可用性，需要按次序遍历每条报警记录，用行车可用性故障报警的所有可能性故障去一一匹配，这样算法的时间复杂度为O(mnkl)。(说明：底层字符串的查找算法已经非常成熟，不在本设计的讨论范围之内，为了说明方便，本文统一使用最基本的朴素搜索算法来说明算法复杂度。)

从算法复杂度可以看出，随着故障报警历史数据量的增加，尤其是有多条待检索条件(多条待检索条件为或的关系)时，原有的算法会变得非常低效。为了提高效率，根据工业监控历史故障报警数据的特点出发，找到了一种利用逻辑预解析关键元素矩阵来进行多条件历史报警数据检索的设计。

发明内容

本发明的目的是：利用工业监控故障报警数据的特殊性，通过对历史报警数据内容的经验和理解，把待检索条件一一进行预解析提取，形成关键元素矩阵，把完整的多条件检索模板信息化整为零，从而避免重复检索和不必要的检索工作提高检索效率。

为了实现上述目的，本发明所采用的技术方案为：一种使用关键元素矩阵提高监控历史数据检索效率的方法，利用工业监控故障报警数据的特殊性(工业监控故障报警数据是一般是由模板组态定义好的格式文本，诸如“XX设备/系统发生了XX故障”此类)从待检索条件里提取检索关键元素，关键元素以条目为纵向，以次序为横向排列形成关键元素矩阵，通过对关键元素矩阵里关键元素的检索获得最终检索结果，具体包括：

步骤一：逻辑分析，对待检索条件信息一一进行逻辑分析，抽象提取共通性的关键信息，如XX设备/系统名称，XX故障内容或原因等。

假设某历史报警检索条件为“MVB与#1端手动控制器DX或AX模块的通信失败或手动控制器信号超限”，从中可提取出5项关键信息，其中三项设备信息分别是“MVB”、“手动控制器”、“AX模块”，另两项是故障信息：“通信失败”和“信号超限”。

步骤二：创建关键元素矩阵，按照关键信息在原检索条件中出现的位置从左往右排列，将一条条原待检索条件逻辑重构成一行行独立分离的有序信息元素集，这样多行有序的元素集合就形成了关键元素矩阵；

步骤三：赋值，对关键元素矩阵进行赋值，从第一行第一列的关键元素开始，以从左往右，从上往下的顺序依次从历史故障报警记录中检索关键元素，找出满足检索条件的历史记录。

所述关键元素矩阵的赋值过程包括：

对每一个关键元素单独进行find操作，该元素在当前这条故障报警记录中首次出现的位置即为矩阵对应元素位置的值，若未在当前故障报警记录中找到该元素，则值为-1；从第一行最左边第一个元素Element_0,0开始赋值，遵循从左往右、从上往下的顺序，每行第一个元素从历史数据记录最左侧开始检索，当它被检索到，则将该结果序号(历史记录中关键元素被查找到的位置序号)记录到矩阵对应的元素位置上，并以该序号为同行下一个元素的查找起点，继续检索同行下一个的关键元素，若某个关键元素未被找到，则放弃继续检索该行剩余元素，转向下一行第一个元素开始检索，若矩阵某行所有值均大于0，则说明该条历史故障报警记录为满足检索条件的历史记录，保存结果，结束后续查找；若整个矩阵赋值完成，也没有非负值行，则该条历史记录不满足检索条件。

从矩阵的第二行元素开始检索时，首先检查本列是否有相同元素已经存在，若有，则直接复制它的值，若不存在，再进行继续后续赋值过程。

若矩阵元素空缺，分两种情况处理，第一种情况是最左侧元素空缺，矩阵该处值填0；第二种情况为非最左侧元素空缺，此时复制相邻左侧元素值即可。

与现有技术相比，本发明所采用的技术方案具有以下有益效果：

1、本发明把n长度的待查询条件转化为短小有限数目的关键元素，不仅避免了对关键信息的重复查询，一旦发现左侧元素检索结果为否定情况，则及时放弃该条件，避免了不必要的后续检索操作，大大节约了系统资源。

2、本发明中由于关键元素长度可控，单个元素的查找效率为O(m)，这样整个设计的时间复杂度为O(mkl)，相比传统方法的效率大大提高。

3、本发明为大型工业监控系统历史故障报警数据的多条件检索问题提供了高效可靠的解决方案，通过对历史报警数据内容的经验和理解，把待检索条件一一进行预解析提取，形成了关键元素矩阵，把完整的多条件检索模板信息化整为零，避免了重复检索和不必要的检索工作，从而大大提高了检索效率。

附图说明

图1为本实施例中关键元素矩阵转化示意图。

图2为本实施例中关键元素矩阵赋值过程示意图。

图3为本实施例中关键元素矩阵赋值结果举例示意图。

图4为本实施例中步骤流程图。

具体实施方式

为了更好地体现本发明的创造性，下面结合附图和具体实施例对本发明的技术方案做进一步的解释。

本实施例使用了一种使用关键元素矩阵提高监控历史数据检索效率的方法，包括：

逻辑预解析步骤：利用工业监控故障报警数据处理的经验，对待检索故障报警条件进行逻辑分析和预解析，从中提取关键数据元素：如待检索故障模板信息(待检索条件)一般均包含报警/故障主体，报警/故障动作，报警/故障描述……等；

创建关键元素矩阵步骤：对每条待检索故障报警条件的检索需求就转为了对一定数量的关键数据元素的检索结果并集，根据对工业监控故障报警数据高阶应用的理解，这种转化保留了检索条件的全部关键信息，能满足检索结果的需求。同时，通过转化还能把检索结果化整为零，找到看似独立的各个检索条件之间的联系。

进一步的，待检索的多个查询条件经过预解析转化的过程如图1所示，一般故障报警历史数据的关键元素为【报警/故障主体，报警/故障动作，报警/故障描述……】，以n来表示检索条件的数目，m表示待检索故障报警条件最大可提取关键数据元素数目，这样查询条件经过解析抽取，就形成了由关键元素构成的m*n的二维矩阵。该矩阵的横向元素为每条待检索故障报警条件抽取的关键待检索元素，而纵向元素在历史故障报警数据里承担完全相同的逻辑角色，例如，第一列均为每条待检索故障报警条件的报警主体/设备。

进一步的，由于故障报警数据的特殊性，每个待检索故障报警条件虽然互不相同，但它们的关键元素却有极高的重合概率，例如下面的三条与地铁行车可用性相关的待检索故障报警条件：

条件1：“ATC转速表故障”→【ATC转速表故障】

条件2：“手动控制器通信故障”→【手动控制器通信故障】

条件3：“ATC在车站扣车”→【ATC扣车】

检索条件1与检索条件3的报警主体相同，均为“ATC”，而检索条件1与检索条件2的报警原因相同，均为“故障”，这样的关键元素重合就给检索提供了提高效率的空间。

进一步的，某些检索条件提取的关键元素较少，如上述例子中条件3缺少列3，此处矩阵值仅需复制相邻左侧元素值即可。

给关键元素矩阵赋值步骤：关键元素矩阵的赋值从第一行第一列的关键元素开始，以从左往右，从上往下的顺序依次从一条历史故障报警记录中检索关键元素。当某行的第一列元素在记录中被检索到，则将该结果序号(历史记录中关键元素被查找到的位置序号)记录到矩阵对应的元素位置上，并以该序号为报警记录起点，检索同行下一列的关键元素，如某一列关键元素未被找到，则放弃继续检索该行剩余元素，转向下一行第一个元素开始检索，如矩阵某行均大于0(全部关键元素均能在历史记录中被找到)，则说明该条历史故障报警记录为满足检索条件的历史记录，保存结果，结束后续查找。如整个矩阵检索完成，也没有整行数值大于1，则该条历史记录不满足检索条件需求。

进一步的，从矩阵的第二行元素开始检索时，第一步先查找本列已查找过的关键元素，如有相同的元素已经存在，则直接记录它的检索结果，继续后续检索。

完整的伪代码如下：

说明：我们用A_total来表示历史故障报警数据集，用M_matrix来表示待检索故障报警条件集(条件集中的条件为或的关系，即历史记录满足其中的一个条件即可)，ResultSet_final为检索匹配的结果集。

假设库中一条故障报警描述的长度为m，历史报警数目为k，待检索的故障报警条件长度为n，待检索条件数目为l。

本实施例把n长度的待查询条件转化为短小有限数目的关键元素，不仅避免了对关键信息的重复查询，一旦发现左侧元素检索结果为否定情况，则及时放弃该条件，避免了不必要的后续检索操作，大大节约了系统资源。由于关键元素长度可控，单个元素的查找效率为O(m)，这样整个设计的时间复杂度为O(mkl)。相比传统方法的效率大大提高。

与现有技术相比，本实施例为大型工业监控系统历史故障报警数据的多条件检索问题提供了高效可靠的解决方案，通过对历史报警数据内容的经验和理解，把待检索条件一一进行预解析提取，形成了关键元素矩阵，把完整的多条件检索模板信息化整为零，避免了重复检索和不必要的检索工作，从而大大提高了检索效率。

虽然本发明已以较佳实施例揭露如上，然其并非用以限定本发明。本发明所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作各种的更动与润饰。因此，本发明的保护范围当视权利要求书所界定者为准。

Claims

1.一种使用关键元素矩阵提高监控历史数据检索效率的方法，其特征在于：利用工业监控故障报警数据的特殊性，从待检索条件里提取检索关键元素，关键元素以条目为纵向，以次序为横向排列形成关键元素矩阵，通过对关键元素矩阵里关键元素的检索获得最终检索结果，具体包括：

步骤一：逻辑分析，对待检索条件信息一一进行逻辑分析，抽取待检索条件中具有共性/重复频率高的关键信息；

步骤三：赋值，对关键元素矩阵进行赋值，从第一行第一列的关键元素开始，以从左往右，从上往下的顺序依次从历史故障报警记录中检索关键元素，找出满足检索条件的历史记录；

所述关键元素矩阵的赋值过程包括：

对每一个关键元素单独进行find操作，该元素在当前这条故障报警记录中首次出现的位置即为矩阵对应元素位置的值，若未在当前故障报警记录中找到该元素，则值为-1；从第一行最左边第一个元素Element_0,0开始赋值，遵循从左往右、从上往下的顺序，每行第一个关键元素从历史数据记录最左侧开始检索，当它被检索到，则将结果序号记录到矩阵对应的元素位置上，并以该序号为同行下一个元素的查找起点，继续检索同行下一个的关键元素，若某个关键元素未被找到，则放弃继续检索该行剩余元素，转向下一行第一个元素开始检索，若矩阵某行所有值均大于0，则说明该条历史故障报警记录为满足检索条件的历史记录，保存结果，结束后续查找；若整个矩阵赋值完成，也没有非负值行，则该条历史记录不满足检索条件；

所述结果序号为历史记录中关键元素被查找到的位置序号。

2.根据权利要求1所述的一种使用关键元素矩阵提高监控历史数据检索效率的方法，其特征在于：所述关键信息包括报警/故障主体，报警/故障动作和报警/故障描述。

3.根据权利要求1所述的一种使用关键元素矩阵提高监控历史数据检索效率的方法，其特征在于：所述步骤二中，以n来表示检索条件的数目，m表示待检索故障报警条件最大可提取关键数据元素数目，这样查询条件经过解析抽取，就形成了由关键元素构成的m*n的二维矩阵。

4.根据权利要求1所述的一种使用关键元素矩阵提高监控历史数据检索效率的方法，其特征在于：

5.根据权利要求4所述的一种使用关键元素矩阵提高监控历史数据检索效率的方法，其特征在于：若矩阵元素空缺，分两种情况处理，第一种情况是最左侧元素空缺，矩阵该处值填0；第二种情况为非最左侧元素空缺，此时复制相邻左侧元素值即可。