CN110689050B - 一种多个报警浪涌序列的对齐方法 - Google Patents

一种多个报警浪涌序列的对齐方法 Download PDF

Info

Publication number
CN110689050B
CN110689050B CN201910832072.5A CN201910832072A CN110689050B CN 110689050 B CN110689050 B CN 110689050B CN 201910832072 A CN201910832072 A CN 201910832072A CN 110689050 B CN110689050 B CN 110689050B
Authority
CN
China
Prior art keywords
alarm
sequences
alarms
seed
alignment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910832072.5A
Other languages
English (en)
Other versions
CN110689050A (zh
Inventor
夏浩
段雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201910832072.5A priority Critical patent/CN110689050B/zh
Publication of CN110689050A publication Critical patent/CN110689050A/zh
Application granted granted Critical
Publication of CN110689050B publication Critical patent/CN110689050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Emergency Alarm Devices (AREA)

Abstract

本发明属于工业报警技术领域,提供了一种多个报警浪涌序列的对齐方法,根据报警浪涌序列之间的相似性分数,将多个不同长度的报警浪涌序列通过插入空隙、删除无关报警等方法,变成具有相同长度的一组报警序列,进而发现频繁报警序列模式。在报警浪涌分析的过程中添加了对三个报警序列进行对齐的步骤,进而可以找出报警浪涌的模板序列,为在线预测报警的发生提供了匹配的模板。本发明中的算法在不影响对齐准确度的基础上,降低了计算复杂度,缩短了计算时间,为在线预测报警时的快速匹配提供了准备工作。

Description

一种多个报警浪涌序列的对齐方法
技术领域
本发明属于工业报警技术领域,涉及到报警浪涌相关知识,特别涉及多个报警浪涌序列的对齐方法。
背景技术
报警系统是确保工业生产过程安全、有效运行的重要组成部分。随着分布式控制系统的发展,报警配置变的越来越简单,使得工业过程中涌现大量的报警。按照EEMUA和ISA-18.2工业标准的定义,当每10分钟发生10次以上的报警时就认为出现了报警浪涌。报警系统中存在大量的误报警和滋扰报警组成了报警浪涌。
报警浪涌可能由许多因素引起,例如,异常状况,不恰当的报警系统设计和操作状态的转换。报警浪涌淹没了许多关键报警,同时过量的报警大大增加了操作人员工作的难度,影响了操作人员的决策和诊断,甚至可能引发灾难性的工业事故,因此对报警浪涌的分析成为工业过程报警管理的一项重要任务。
报警浪涌的分析可以分为离线和在线两部分,离线部分的主要目的是建立一个用于在线匹配的模式数据库。在线部分则是利用获得的模式数据库进行报警浪涌的在线匹配并动态管理报警信息。离线报警浪涌的分析步骤主要包括:删除报警消息日志中的抖动报警、提取报警浪涌序列、成对相似度计算并聚类、类内的模式挖掘。
Ahmed等人在文献“Similarity Analysis of Industrial Alarm Flood Data[J].IEEE Transactions on Automation Science&Engineering,2013,10(2):452-457”中提出了一种从历史报警数据中发现相似报警浪涌,并将他们按照报警发生的模式进行分组的新分析方法。该方法采用凝聚层次聚类(AHC)方法对报警浪涌进行聚类,并使用动态时间规整(DTW)技术对报警序列进行对齐。Cheng等人在文献“Pattern matching of alarmflood sequences by a modified Smith–Waterman algorithm[J].ChemicalEngineering Research and Design,2013,91(6):1085-1094”中改进了传统的Smith-Waterman算法,在计算报警浪涌的相似性指标时考虑报警的时间信息。该算法可以抗干扰以及时间顺序的变化,但仅限于成对序列使用。
Lai等人在文献“A method for pattern mining in multiple alarm floodsequences[J].Chemical Engineering Research and Design,2015:S0263876215002257”中将上一篇文献中的算法扩展到了多个报警浪涌序列的模式挖掘,弥补了报警浪涌分析中缺失的一个步骤。但该文献的算法也存在着缺陷,算法的计算时间会随着要对齐序列的长度和数量的增加而快速增加,此外参数的调节也是算法的困难之处。Hu等人在文献“Alocal alignment approach to similarity analysis of industrial alarm floodsequences[J].Control Engineering Practice,2016,55:13-25”中提出了一种新的局部对齐算法,该算法基于基本局部对齐搜索工具(BLAST)。与Smith-Waterman算法相比,该算法可以缩短计算时间并提高序列对齐的准确性。但是该算法也存在着局限性,仅限于两个报警浪涌序列的对齐,无法找出多个报警浪涌序列的模板。
发明内容
为解决现有技术的不足,本发明的目的是提供一种多个报警浪涌序列的对齐算法,该算法基于基本局部对齐搜索工具(BLAST),通过序列的对齐找出报警浪涌的故障模板,进而为报警浪涌序列的在线预测做准备。
本发明的技术方案:
一种多个报警浪涌序列的对齐方法,步骤如下:
根据报警浪涌序列之间的相似性分数,将多个不同长度的报警浪涌序列通过插入空隙、删除无关报警等方法,变成具有相同长度的一组报警序列,进而发现频繁报警序列模式;具体实现步骤包括:
(1)计算两个报警之间的相似性分数
根据两个报警的报警标签是否相同,以及报警优先级信息,两个报警之间的相似性分数按下式进行计算:
Figure BDA0002191037810000031
其中,
Figure BDA0002191037810000032
分别表示报警序列x的第i个报警消息记录和报警序列y的第j个报警消息记录,e表示报警标签,t和p分别表示报警时间和报警优先级信息;匹配分数
Figure BDA0002191037810000033
是报警优先级的函数,不匹配分数μ是一个负常数;
φ(pl)=α+β(L-l)
其中,α和β是两个正的常数;L是所有报警优先级的数量,l表示当前的优先级;
对于有间隙的对齐来说,报警xi和一个空格“--”对齐,而不是和不同类型的报警yi对齐;此时,相似性分数就是一个固定的惩罚值δ<0,即
s(xi,-)=δ
(2)计算三个报警之间的相似性分数
在对三个报警浪涌序列进行对齐时,需使用三个报警之间的相似性分数,而三个报警之间的相似性分数是由两个报警之间的相似性分数计算得到的,即
Figure BDA0002191037810000041
式中
Figure BDA0002191037810000042
表示报警序列z的第k个报警消息记录;
(3)找出公共子序列
为了缩短对齐的时间,提高匹配的效率,首先找出三个序列中的公共子序列,然后再进行对齐;在三个序列之间找出完全匹配的公共子序列,公共子序列应满足两个条件:匹配短片段在三个报警序列中的报警类型应该分别对应相同;任一匹配的片段不应包含与其他片段相重合的部分;
(4)筛选种子片段
找出来的公共子序列并不能都用于对齐,需要根据子序列的相似性分数进行筛选,选出相似性分数大于某一设定的阈值的片段进行接下来的对齐;挑选出来的片段即被称为种子片段;种子片段Z(i)由其在三个报警序列中的首尾位置索引和片段长度表示:
Z(i)=(Zi,1,Zi,2,Zi,3,Zi,4)
其中,Zi,1,Zi,2,Zi,3分别是种子片段在序列A、B、C中的起始位置,Zi,4表示种子片段的长度;
(5)延伸
在得到种子片段之后,将对种子片段沿两个方向进行延伸,即进行两次对齐;延伸的主要依据是相似性分数矩阵的计算,不同于两个序列在平面内的矩阵计算,三个序列的计算是在三维坐标系下完成的;相似性分数矩阵按照下式进行计算:
Hi,j,k=max{Hi-1,j-1,k-1+S(xi,yj,zk),
Hi,j-1,k-1+δ+S(yj,zk),
Hi-1,j,k-1+δ+S(xi,zk),
Hi-1,j-1,k+δ+S(xi,yj),
Hi-1,j,k+2*δ,
Hi,j-1,k+2*δ,
Hi,j,k-1+2*δ,0}
Figure BDA0002191037810000051
时,延伸即停止;其中,Hmax表示当前延伸矩阵中相似性分数的最大值,U是用来停止延伸的截止阈值;
(6)回溯
当获得延伸矩阵之后,通过回溯找到最佳对齐的路径;首先找到矩阵元素的最大值,通过看该最大值是从哪一个位置计算得到的来找到回溯的第一步,接下来的步骤也按照此方法进行回溯,直到回溯到起点位置。
本发明的效果和益处是在报警浪涌分析的过程中添加了对三个报警序列进行对齐的步骤,进而可以找出报警浪涌的模板序列,为在线预测报警的发生提供了匹配的模板。本发明中的算法在不影响对齐准确度的基础上,降低了计算复杂度,缩短了计算时间,为在线预测报警时的快速匹配提供了准备工作。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面对本发明的具体实施方式作进一步的详细描述。
需要对齐的三个报警序列如表1所示:
表1待对齐的报警序列
Figure BDA0002191037810000061
找出公共的子序列后,设置种子阈值为7,可以得到如表2所示的种子片段:
表2种子片段
Figure BDA0002191037810000071
得到的种子片段向两侧延伸并回溯即可以得到对齐的结果,此例选择第一个种子进行说明。
将种子片段<9,8,6,5>分别向前和向后延伸即可得到如下的对齐结果:
Figure BDA0002191037810000072
根据此对齐结果,可以选择<3,7,9,8,6,5,6,5,1,5,7>作为报警浪涌的一个模板序列,当在线预测报警时,通过将到来的报警序列与模板序列进行匹配,来判断接下来可能会发生的报警,进而提前采取措施,防止事故的发生。

Claims (1)

1.一种多个报警浪涌序列的对齐方法,其特征在于,步骤如下:
(1)计算两个报警之间的相似性分数
根据两个报警的报警标签是否相同,以及报警优先级信息,两个报警之间的相似性分数按下式进行计算:
Figure FDA0002191037800000011
其中,
Figure FDA0002191037800000012
分别表示报警序列x的第i个报警消息记录和报警序列y的第j个报警消息记录,e表示报警标签,t和p分别表示报警时间和报警优先级信息;匹配分数
Figure FDA0002191037800000013
是报警优先级的函数,不匹配分数μ是一个负常数;
φ(pl)=α+β(L-l)
其中,α和β是两个正的常数;L是所有报警优先级的数量,l表示当前的优先级;
对于有间隙的对齐来说,报警xi和一个空格“--”对齐,而不是和不同类型的报警yj对齐;此时,相似性分数就是一个固定的惩罚值δ<0,即
s(xi,-)=δ
(2)计算三个报警之间的相似性分数
在对三个报警浪涌序列进行对齐时,需使用三个报警之间的相似性分数,而三个报警之间的相似性分数是由两个报警之间的相似性分数计算得到的,即
Figure FDA0002191037800000021
式中
Figure FDA0002191037800000022
表示报警序列z的第k个报警消息记录;
(3)找出公共子序列
为了缩短对齐的时间,提高匹配的效率,首先找出三个序列中的公共子序列,然后再进行对齐;在三个序列之间找出完全匹配的公共子序列,公共子序列应满足两个条件:匹配短片段在三个报警序列中的报警类型应该分别对应相同;任一匹配的片段不应包含与其他片段相重合的部分;
(4)筛选种子片段
找出来的公共子序列并不能都用于对齐,需要根据子序列的相似性分数进行筛选,选出相似性分数大于某一设定的阈值的片段进行接下来的对齐;挑选出来的片段即被称为种子片段;种子片段Z(i)由其在三个报警序列中的首尾位置索引和片段长度表示:
Z(i)=(Zi,1,Zi,2,Zi,3,Zi,4)
其中,Zi,1,Zi,2,Zi,3分别是种子片段在序列A、B、C中的起始位置,Zi,4表示种子片段的长度;
(5)延伸
在得到种子片段之后,将对种子片段沿两个方向进行延伸,即进行两次对齐;延伸的主要依据是相似性分数矩阵的计算,不同于两个序列在平面内的矩阵计算,三个序列的计算是在三维坐标系下完成的;相似性分数矩阵按照下式进行计算:
Hi,j,k=max{Hi-1,j-1,k-1+S(xi,yj,zk),
Hi,j-1,k-1+δ+S(yj,zk),
Hi-1,j,k-1+δ+S(xi,zk),
Hi-1,j-1,k+δ+S(xi,yj),
Hi-1,j,k+2*δ,
Hi,j-1,k+2*δ,
Hi,j,k-1+2*δ,0}
Figure FDA0002191037800000031
时,延伸即停止;其中,Hmax表示当前延伸矩阵中相似性分数的最大值,U是用来停止延伸的截止阈值;
(6)回溯
当获得延伸矩阵之后,通过回溯找到最佳对齐的路径;首先找到矩阵元素的最大值,通过看该最大值是从哪一个位置计算得到的来找到回溯的第一步,接下来的步骤也按照此方法进行回溯,直到回溯到起点位置。
CN201910832072.5A 2019-09-04 2019-09-04 一种多个报警浪涌序列的对齐方法 Active CN110689050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910832072.5A CN110689050B (zh) 2019-09-04 2019-09-04 一种多个报警浪涌序列的对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910832072.5A CN110689050B (zh) 2019-09-04 2019-09-04 一种多个报警浪涌序列的对齐方法

Publications (2)

Publication Number Publication Date
CN110689050A CN110689050A (zh) 2020-01-14
CN110689050B true CN110689050B (zh) 2022-03-04

Family

ID=69107765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910832072.5A Active CN110689050B (zh) 2019-09-04 2019-09-04 一种多个报警浪涌序列的对齐方法

Country Status (1)

Country Link
CN (1) CN110689050B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3026518A1 (en) * 2014-11-25 2016-06-01 ABB Technology AG Method for Root analysis of an alarm flood sequence
CN105701256A (zh) * 2016-03-23 2016-06-22 南京南瑞继保电气有限公司 一种通讯点表文件比较方法
CN105975748A (zh) * 2016-04-27 2016-09-28 大连理工大学 一种基于历史数据的工业报警系统
CN108120437A (zh) * 2017-12-08 2018-06-05 中国科学院光电研究院 一种基于地磁场强度序列特征点对齐的行人路径匹配方法
CN108319677A (zh) * 2018-01-30 2018-07-24 中南大学 动态变化的网络关系图的对齐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3287960B1 (en) * 2016-08-25 2024-05-15 ABB Schweiz AG Computer system and method to process alarm signals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3026518A1 (en) * 2014-11-25 2016-06-01 ABB Technology AG Method for Root analysis of an alarm flood sequence
CN105701256A (zh) * 2016-03-23 2016-06-22 南京南瑞继保电气有限公司 一种通讯点表文件比较方法
CN105975748A (zh) * 2016-04-27 2016-09-28 大连理工大学 一种基于历史数据的工业报警系统
CN108120437A (zh) * 2017-12-08 2018-06-05 中国科学院光电研究院 一种基于地磁场强度序列特征点对齐的行人路径匹配方法
CN108319677A (zh) * 2018-01-30 2018-07-24 中南大学 动态变化的网络关系图的对齐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Similarity Analysis of Industrial Alarm Flood Data;Kabir Ahmed etal.;《 IEEE Transactions on Automation Science and Engineering》;20130124;第10卷(第2期);全文 *
光纤激光网络中的浪涌突变数据调度方法设计;陈莉莉等;《激光杂志》;20171231;第38卷(第1期);全文 *

Also Published As

Publication number Publication date
CN110689050A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN112039196A (zh) 一种基于协议逆向工程的电力监控系统私有协议解析方法
CN109784668B (zh) 一种用于电力监控系统异常行为检测的样本特征降维处理方法
CN111277469B (zh) 网络诊断处理方法、装置、网络系统及服务器
CN105955214A (zh) 基于样本时序和近邻相似性信息的间歇过程故障检测方法
CN114281864A (zh) 一种面向电力网络告警信息的关联分析方法
JP6190539B2 (ja) ログ分析装置、ログ分析システム、ログ分析方法及びコンピュータプログラム
CN110879802A (zh) 一种日志模式提取及匹配方法
CN110689050B (zh) 一种多个报警浪涌序列的对齐方法
CN111460144A (zh) 基于时序切分与融合的谣言早期检测算法
Lai et al. Methodology and application of pattern mining in multiple alarm flood sequences
CN111913874B (zh) 一种基于语法结构变更分析的软件缺陷溯源方法
CN113204914A (zh) 一种基于多架次飞行数据表征建模的飞行数据异常判读方法
Li et al. Improving performance of log anomaly detection with semantic and time features based on bilstm-attention
CN109783698A (zh) 基于Merkle-tree的工业生产数据实体识别方法
CN114168373A (zh) 一种基于nlp的容灾系统异常点检测方法
CN104463137A (zh) 基于特征空间分裂的异常人脸图像检测方法及系统
CN104751059A (zh) 基于函数模板的软件行为分析方法
CN112464648B (zh) 基于多源数据分析的行业标准空白特征识别系统及方法
CN114969761A (zh) 一种基于lda主题特征的日志异常检测方法
Che et al. An efficient intrusion detection approach based on hidden markov model and rough set
CN110175200A (zh) 一种基于人工智能算法的异常用能分析方法及系统
CN112180886B (zh) 针对过程工业具体生产装置的工艺参数临界值的确定方法
Li et al. Efficient Multi-source Contact Event Query Processing for Moving Objects
CN114020593B (zh) 一种基于轨迹聚类的异质流程日志采样方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant