CN112766426B - 一种基于时间约束的故障类型识别方法 - Google Patents

一种基于时间约束的故障类型识别方法 Download PDF

Info

Publication number
CN112766426B
CN112766426B CN202110364923.5A CN202110364923A CN112766426B CN 112766426 B CN112766426 B CN 112766426B CN 202110364923 A CN202110364923 A CN 202110364923A CN 112766426 B CN112766426 B CN 112766426B
Authority
CN
China
Prior art keywords
matched
matching
time
mode
total
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110364923.5A
Other languages
English (en)
Other versions
CN112766426A (zh
Inventor
白广争
郜洪民
王琳
滕达
邢科家
白春娜
孟军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Railway Sciences Corp Ltd CARS
Signal and Communication Research Institute of CARS
Beijing Ruichi Guotie Intelligent Transport Systems Engineering Technology Co Ltd
Beijing Huatie Information Technology Co Ltd
Original Assignee
China Academy of Railway Sciences Corp Ltd CARS
Signal and Communication Research Institute of CARS
Beijing Ruichi Guotie Intelligent Transport Systems Engineering Technology Co Ltd
Beijing Huatie Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Railway Sciences Corp Ltd CARS, Signal and Communication Research Institute of CARS, Beijing Ruichi Guotie Intelligent Transport Systems Engineering Technology Co Ltd, Beijing Huatie Information Technology Co Ltd filed Critical China Academy of Railway Sciences Corp Ltd CARS
Priority to CN202110364923.5A priority Critical patent/CN112766426B/zh
Publication of CN112766426A publication Critical patent/CN112766426A/zh
Application granted granted Critical
Publication of CN112766426B publication Critical patent/CN112766426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于时间约束的故障类型识别方法。从子模式对应的实时序列开始,确定总模式集合,计算时间围栏;在时间围栏内,从初筛总模式集合A中任意选取一总模式,分别在其他各实时序列中逐个搜索,构建过滤集合B;若过滤集合B非空,对过滤集合B中的总模式进行匹配;并遍历过滤集合B中其他总模式。本发明提出的基于时间约束的故障类型识别方法,匹配过程中考虑了时间因素限制,提高了匹配方法的运算效率;能够适用于实时控制系统的通信周期、故障处理反馈时间等功能需求方面存在差异,且在故障诊断时存在多系统之间的数据同步处理问题的模式匹配场景,提高了模式匹配的准确度,扩大了模式匹配方法的适用场景。

Description

一种基于时间约束的故障类型识别方法
技术领域
本发明涉及人工智能模式匹配技术领域,尤其涉及一种基于时间约束的故障类型识别方法。
背景技术
智能化是工业4.0时代发展的一个重要标志,人工智能的模式匹配、模式识别领域,在经过多年的发展后,取得了很多相对成熟的理论研究成果。模式匹配多应用于入侵检测、信息检索、生物信息学等领域,字符串之间的模式匹配是模式匹配中的热点研究领域。字符串的模式匹配问题通常可描述为:设T和P是两个给定的字符串,在串T中查找等于P的子串的过程称为模式匹配,其中,T称为主串,P称为模式串。如果能够在T中找到P,称为匹配成功,否则称为匹配失败。
从功能角度对字符串模式匹配方法进行分类可分为精确匹配和模糊匹配两大类。其中,模糊匹配是在文本串中查找与模式串相似的字符串,主要应用于关键词查询、拼写或搜索内容提示等方面。字符串模糊匹配的一个主要研究方向是基于计算错误因素的编辑距离进行匹配,编辑距离称为ED(Edit Distance)距离。当两个字符串的ED距离不超过给定的阈值MD(Max Distance)时,则称两个字符串是相似的,ED距离越小,两字符串的相似度就越高,反之,相似度越低。MD设置越大,匹配效率越低,匹配成功率增大;反之,匹配效率越高,但匹配成功率降低。正则表达式匹配是应用于字符串模糊匹配的另一类热门方法,正则表达式由一系列普通字符和元字符构成,用于描述具有某一确定特征或符合某一语法规则的字符串公式,满足该公式特征的字符串,均符合匹配条件要求。在正则表达式描述完成后,现有技术中构造有限自动机来表示正则表达式所描述的语法规则,有限自动机可转化为计算机直接执行的语言。
然而在实际工业生产中,从通信网络中采集到的实时数据,往往存在各种干扰因素,比如:心跳信息、不同含义的信息块在时间上叠加出现、数据延时等,此时实时数据存在干扰因素,现有技术中的字符串模糊匹配方法难以从包含干扰因素的信息中提取有价值的信息,从而无法准确实现字符串模糊匹配,现有技术中对于存在各种不同干扰的数据,难以准确识别并匹配;对于存在时间干扰的信息,现有的字符串模糊匹配方法没有考虑时间因素对模糊匹配的影响,在时间约束范围内,干扰字符数量会因为系统的规模不同而存在较大差异,无法确定;对于分布式的系统,当不同子系统之间的数据信息同时参与某一模式匹配的情况下,时间的同步同样会影响模糊匹配的结果;现有技术中的字符串模糊匹配方法未考虑时间干扰、时间同步因素,难以满足现有技术中字符串模糊匹配的要求。
发明内容
本发明的目的是基于现有技术中存在的上述问题,提供一种基于时间约束的故障类型识别方法。
本发明的目的是通过以下技术方案实现的:
一种基于时间约束的故障类型识别方法,包括如下步骤:
步骤S1:待匹配对象选择步骤;选定第1个待匹配总模式的第j 0个子模式对应的实时序列Q,选取实时序列Q的第一个字符
Figure 100002_DEST_PATH_IMAGE001
作为待匹配对象,待匹配对象的发生时刻
Figure 153179DEST_PATH_IMAGE002
步骤S2:根据步骤S1获得的待匹配对象,在模式库中搜索所有总模式中第j 0个子模式
Figure 100002_DEST_PATH_IMAGE003
(1≤i≤N)的首字符
Figure 663795DEST_PATH_IMAGE004
,N为总模式的数量,选出所有总模式中第j 0个子模式
Figure 443532DEST_PATH_IMAGE003
首字符
Figure 838742DEST_PATH_IMAGE004
与步骤S1获得的待匹配对象匹配的所有总模式,从而筛选出与步骤S1获得的待匹配对象匹配成功的初筛总模式集合A,A={a 1a 2,…,a p }(1≤p≤N);
步骤S3:判断初筛总模式集合A是否为空,若为空,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则,跳转至步骤S4;
步骤S4:根据待匹配对象的发生时刻计算时间围栏T=[
Figure 100002_DEST_PATH_IMAGE005
-t 1
Figure 685737DEST_PATH_IMAGE005
+t 1],t 1为设定的常数;
步骤S5: 在时间围栏T内,针对初筛总模式集合A中的任一个总模式a i (1≤ip),分别在总模式a i 中除第j 0个子模式外的各子模式所对应的实时序列中搜索子模式的首字符
Figure 508200DEST_PATH_IMAGE006
(1≤j≤K且jj 0),K为总模式中子模式的数量;若在时间围栏T内,存在任意j使得总模式a i 中除第j 0个子模式外的任一子模式的首字符
Figure 103129DEST_PATH_IMAGE006
其对应的实时序列中未搜索到,则从初筛总模式集合A中删除a i ;否则,将a i 加入过滤集合B,B={b1,b2,…,b q }(1≤qp),重复上述匹配过程,遍历初筛总模式集合A中所有总模式;
步骤S6:判断过滤集合B是否为空,若集合B非空,则跳转至步骤S7;否则,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;
步骤S7:对过滤集合B中的总模式b1进行匹配:对于总模式b1中第j个子模式(1≤j≤K)对应的实时序列,在
Figure 100002_DEST_PATH_IMAGE007
(1<m
Figure 833188DEST_PATH_IMAGE008
)的时间范围内匹配搜索
Figure 100002_DEST_PATH_IMAGE009
,其中,
Figure 502066DEST_PATH_IMAGE010
表示总模式b1中第j个子模式的第(m-1)个字符的发生时刻,
Figure 761009DEST_PATH_IMAGE008
表示总模式b1中第j个子模式所包含的字符数,t 0表示设定的常数;若存在任意的jm,使得
Figure 515339DEST_PATH_IMAGE009
未搜索到,则b1匹配失败;否则,b1匹配成功;
步骤S8:判断b1是否匹配成功,若b1匹配成功,输出总模式b1,将b1作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中与模式b1匹配成功的所有字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若b1匹配失败,从过滤集合B中删除b1
步骤S9:判断过滤集合B是否为空集合,若为空,则未能识别故障类型,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则以过滤集合B中下一个总模式作为当前总模式,返回步骤S7。
进一步地,所述步骤S9还包括:
在过滤集合B中搜索包含步骤S7中已完成匹配的字符
Figure 783509DEST_PATH_IMAGE009
(1≤jj 1,1≤mm 1)的总模式,所述包含指与已完成匹配的字符
Figure 306894DEST_PATH_IMAGE009
的位置和字符值均相同;若搜索到总模式b i ,使得
Figure 100002_DEST_PATH_IMAGE011
(对于
Figure 64635DEST_PATH_IMAGE012
1≤jj 1,1≤mm 1),则在总模式b i 的第j 1个子模式的第m 1个字符
Figure 100002_DEST_PATH_IMAGE013
处对b i 进行剩余字符的匹配。
进一步地,所述在
Figure 306260DEST_PATH_IMAGE014
处对b i 进行剩余字符的匹配之后:
若再次发生字符匹配失败,返回失败点为j2、m2,然后继续在过滤集合B中搜索包含已完成匹配字符
Figure 100002_DEST_PATH_IMAGE015
(1≤jj 2,1≤mm 2)的总模式,如此循环直到遍历过滤集合B;
若存在某一总模式匹配成功,则输出匹配成功的总模式,将匹配成功的总模式作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中已匹配成功的字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若未搜索到,则表示匹配失败,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1。
由上述本发明提供的技术方案主要具有如下有益效果:
本发明提出的基于时间约束的故障类型识别方法,匹配过程中考虑了时间因素限制,时间限制以外的字符不能进行匹配;模式匹配方法考虑了时间因素,能够适用于时间同步的大型分布式软件多点监测控制系统的故障检测、智能故障诊断、故障预测等领域,对于实时控制系统的通信周期、故障处理反馈时间等功能需求方面存在差异,且在故障诊断时存在多系统之间的数据同步处理问题等,本发明的模式匹配的过程考虑时间因素限制,超出时间约束或者出现的顺序发生变化,均会导致字符失配,提高了模式匹配的准确度,扩大了模式匹配方法的适用场景。
具体实施方式
下面结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
故障诊断系统包括大型监控系统,故障诊断系统实时对大型监控系统中的多个子系统信息进行监测,采集各子系统之间的通信信息,包括报警信息、应用层信息等,故障诊断系统对采集到各子系统的信息进行汇总、综合逻辑判断,借助专家知识库,实现对当前系统的运行状态进行实时诊断的功能。
当特定故障发生时,为了给出建议处理方案与措施,故障诊断系统根据采集到的交互数据信息特征,利用模式匹配方法,与预先制定好的专家知识库中的知识标签进行匹配,若能够实现匹配,则给出故障诊断及相应的处理方案与措施。对于分布式架构的故障检测系统,其各子系统之间所交互的信息在进行故障模式匹配过程中,为了提高模式匹配的准确度,需要采用考虑时间同步的模式匹配方法。现有技术中若考虑不同时期、或者超出时间范围的数据进行故障模式匹配,即使能够成功匹配到某一确定的故障模式,但其匹配得到的数据因为不符合当前时期的实际情况,往往不具有实际意义。因此,只有在规定时间范围内的各方信息参与故障模式匹配,所做出的诊断结果才有效。
本发明实施例提供一种基于时间约束的故障类型识别方法。
其中:1次完整的匹配对应1个总模式,总模式匹配成功,即完成了模式对象的匹配过程。如表1所示,1个总模式由K个子模式组合而成,每个子模式对应的文本串是一个实时数据序列,K个子模式对应K个实时数据序列,总模式中各子模式中的字符在文本串中出现时均具有时间属性,匹配过程受时间约束。
表1 模式库定义
Figure DEST_PATH_IMAGE017
基于时间约束的故障类型识别方法具体包括如下步骤:
步骤S1:待匹配对象选择步骤;选定第1个待匹配总模式的第j 0个子模式对应的实时序列Q,选取实时序列Q的第一个字符
Figure 876657DEST_PATH_IMAGE018
作为待匹配对象,待匹配对象的发生时刻
Figure DEST_PATH_IMAGE019
待匹配对象选择步骤中,获取待匹配的实时模式序列,待匹配的总模式共存在N个,依序从待匹配的总模式中选择各个总模式的各个子模式对应的各个实时序列。1个总模式由K个子模式组合而成,每个子模式对应的文本串是一个实时序列,每个实时序列为一字符串。
步骤S2:根据步骤S1获得的待匹配对象,在模式库中搜索所有总模式中第j 0个子模式
Figure 520127DEST_PATH_IMAGE020
(1≤i≤N)的首字符
Figure DEST_PATH_IMAGE021
,N为总模式的数量,选出所有总模式中第j 0个子模式
Figure 183190DEST_PATH_IMAGE020
首字符
Figure 443270DEST_PATH_IMAGE021
与步骤S1获得的待匹配对象匹配的所有总模式,从而筛选出与步骤S1获得的待匹配对象匹配成功的初筛总模式集合A,A={a 1a 2,…,a p }(1≤p≤N)。
步骤S3:判断初筛总模式集合A是否为空,若为空,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则,跳转至步骤S4。
步骤S4:根据待匹配对象的发生时刻计算时间围栏T=[
Figure 522084DEST_PATH_IMAGE022
-t 1
Figure 20062DEST_PATH_IMAGE022
+t 1],t 1为设定的常数。
步骤S5: 在时间围栏T内,针对初筛总模式集合A中的任一个总模式a i (1≤ip),分别在总模式a i 中除第j 0个子模式外的各子模式所对应的实时序列中搜索子模式的首字符
Figure DEST_PATH_IMAGE023
(1≤j≤K且jj 0),其中,K为总模式中子模式的数量;若在时间围栏T内,存在任意j使得总模式a i 中除第j 0个子模式外的任一子模式的首字符
Figure 57288DEST_PATH_IMAGE024
在其对应的实时序列中未搜索到,则从初筛总模式集合A中删除a i ;否则,将a i 加入过滤集合B,B={b1,b2,…,b q }(1≤qp),重复上述匹配过程,遍历初筛总模式集合A中所有总模式。
步骤S6:判断过滤集合B是否为空,若集合B非空,则跳转至步骤S7;否则,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1。
步骤S7:对过滤集合B中的总模式b1进行匹配:对于总模式b1中第j个子模式(1≤j≤K)应的实时序列,在
Figure DEST_PATH_IMAGE025
(1<m
Figure 539085DEST_PATH_IMAGE026
)的时间范围内匹配搜索
Figure 421590DEST_PATH_IMAGE027
,其中,
Figure 603435DEST_PATH_IMAGE028
表示总模式b1中第j个子模式的第(m-1)个字符的发生时刻,
Figure 545983DEST_PATH_IMAGE026
表示总模式b1中第j个子模式所包含的字符数,t 0表示设定的常数;若存在任意的jm,使得
Figure 983918DEST_PATH_IMAGE027
未搜索到,则b1匹配失败;否则,b1匹配成功。
步骤S8:判断b1是否匹配成功,若b1匹配成功,输出总模式b1,将b1作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中与模式b1匹配成功的所有字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若b1匹配失败,从过滤集合B中删除b1
步骤S9:判断过滤集合B是否为空集合,若为空,则未能识别故障类型,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则以过滤集合B中下一个总模式作为当前总模式,返回步骤S7。
实施例一提供基于时间约束的故障类型识别方法的时间复杂度:①针对模式库中所有模式,最多需进行N次比较;②针对一个总模式的各子模式首字符匹配,最多需进行
Figure DEST_PATH_IMAGE029
次比较,
Figure 935694DEST_PATH_IMAGE030
表示时间围栏T i 内的字符数,
Figure DEST_PATH_IMAGE031
=f(t 1),且
Figure 673842DEST_PATH_IMAGE032
;③针对每个子模式的非首字符匹配,最多需进行
Figure DEST_PATH_IMAGE033
次比较,其中
Figure 115188DEST_PATH_IMAGE034
表示字符
Figure DEST_PATH_IMAGE035
对应的搜索时间范围
Figure 571577DEST_PATH_IMAGE036
内的字符数,
Figure DEST_PATH_IMAGE037
由此可知,总比较次数最多为
Figure 61464DEST_PATH_IMAGE038
,其中
Figure DEST_PATH_IMAGE039
表示单个总模式进行匹配所需要的总比较次数,方法的时间复杂度为O((
Figure 654120DEST_PATH_IMAGE040
)3)。方法的运算量与时间围栏的设置t 1及模式字符之间的时间间隔t 0设置有关。
为进一步提高匹配效率,降低模式库的规模对方法耗时影响,可针对模式库中的模式进行恰当分类,分类的标准为:各子模式串的首字符对应相同的总模式可划归在同一子类库中,并将子模式串的首字符作为该子类库的标签。在进行匹配时,首先进行子类库标签匹配,完成匹配后,再在该子类库下进行模式匹配搜索。有效缩小对模式库的搜索范围,进一步提高了搜索效率。
本发明提出的实时模式匹配方法中进行了子模式和总模式的划分,且其匹配过程中考虑了时间因素限制,超出时间约束或者出现的顺序发生变化,均会导致字符失配,一方面提高了匹配方法的运算效率,另一方面,本发明提供的模式匹配方法考虑了时间因素,能够适用于时间同步的大型分布式软件多点监测控制系统的故障检测、智能故障诊断、故障预测等领域,对于实时控制系统的通信周期、故障处理反馈时间等功能需求方面存在差异,且在故障诊断时存在多系统之间的数据同步处理问题等,本发明的模式匹配的过程考虑时间因素限制,超出时间约束或者出现的顺序发生变化,均会导致字符失配,提高了模式匹配的准确度。
本发明实施例二提供了一种改进的基于时间约束的实时模式匹配方法,与实施例一相同的部分不再赘述。
当模式库中的一个总模式与实时序列中数据进行匹配时,若匹配到中间的某个字符
Figure DEST_PATH_IMAGE041
(1≤i≤N;1≤j≤K;1≤x l x j )成功,但在匹配
Figure 938470DEST_PATH_IMAGE042
时失败,此时,若直接删除该条匹配失败的总模式,并对模式库中下一个总模式进行匹配,上述删除方法会损失已进行比较且匹配成功了的字符信息。为此,本发明实施例二提供的实时模式匹配方法可通过记录总模式匹配失败的字符的位置,并在模式库中进行搜索,查找出包含本模式中已匹配成功字符的总模式,再对这些查找出的总模式之一与实时序列中数据继续进行匹配,初始匹配位置为
Figure 177429DEST_PATH_IMAGE042
。遍历模式库,直到完成一个总模式的完全匹配后停止。本发明有效利用了每一次匹配成功的信息,避免了匹配方法的回溯搜索,提高了模式匹配方法的运算速度。具体方法步骤如下:
与实施例一相同的步骤在此不再赘述,相较于实施例一,实施例二提供的方法中,进一步改进的步骤包括步骤S7-S9,步骤S7-S9的具体实现方式如下:
步骤S7:对过滤集合B中的总模式b1按照如下过程进行匹配:对总模式b1中第j (1≤j≤K)个子模式
Figure 205427DEST_PATH_IMAGE043
对应的实时序列,在
Figure DEST_PATH_IMAGE044
(1<m
Figure 918168DEST_PATH_IMAGE045
)的时间范围内匹配搜索
Figure DEST_PATH_IMAGE046
,若存在某一确定的
Figure 373421DEST_PATH_IMAGE047
(1≤j 1≤K)、
Figure DEST_PATH_IMAGE048
(1<m 1
Figure 273243DEST_PATH_IMAGE049
),使得
Figure DEST_PATH_IMAGE050
未搜索到,则b1匹配失败;否则,b1匹配成功。
步骤S8:判断b1是否匹配成功,若b1匹配成功,输出总模式b1,将b1作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中与模式b1匹配成功的所有字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若b1匹配失败,从过滤集合B中删除b1
步骤S9:在过滤集合B中搜索包含步骤S7中已完成匹配的字符
Figure 370512DEST_PATH_IMAGE051
(1≤jj 1,1≤mm 1) 的总模式,所述包含指与已完成匹配的字符
Figure 77DEST_PATH_IMAGE051
的位置和字符值均相同。若搜索到总模式b i ,使得
Figure DEST_PATH_IMAGE052
(对于
Figure 360651DEST_PATH_IMAGE053
1≤jj 1,1≤mm 1),则在总模式b i 的第j 1个子模式的第m 1个字符
Figure DEST_PATH_IMAGE054
处对b i 继续进行剩余字符的匹配,直到再次发生字符匹配失败为止,返回失败点为j 2m 2,然后继续在过滤集合B中搜索包含已完成匹配字符
Figure 13349DEST_PATH_IMAGE051
(对于
Figure 415774DEST_PATH_IMAGE053
1≤jj 2,1≤mm 2)的总模式,如此循环直到遍历过滤集合B;若存在某一总模式匹配成功,则输出匹配成功的总模式,将匹配成功的总模式作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中已匹配成功的字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若未搜索到,则表示匹配失败,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1。
实施例二提供模式匹配方法的时间复杂度:①模式库内模式之间的比较,最多需进行N次。②针对一个总模式各首字符匹配,最多需进行
Figure 306370DEST_PATH_IMAGE055
次比较。③针对总模式内各子模式的非首字符匹配,最多需进行
Figure 103424DEST_PATH_IMAGE056
次比较。总比较次数为N+
Figure DEST_PATH_IMAGE057
+
Figure 40156DEST_PATH_IMAGE058
,方法的时间复杂度为O((
Figure DEST_PATH_IMAGE059
)2)。
进一步的,在进行实时匹配前,对专家知识库中的知识标签进行预处理,所述预处理具体包括:遍历专家知识库中的知识标签,若知识库中存在知识标签X的前x个字符与当前知识标签的前x个字符相同,则将知识标签X的所在位置与本知识标签相关联,遍历标签库中所有标签完成预处理。
对专家知识库中的知识标签预处理后,再进入实时模式匹配过程,能够避免每次在故障标签库内进行标签之间的比较,总比较次数下降为
Figure 744807DEST_PATH_IMAGE060
+
Figure 755489DEST_PATH_IMAGE058
,进一步提高了方法效率,能够最大限度降低模式库内总模式数量增大所带来的匹配效率降低问题。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (3)

1.一种基于时间约束的故障类型识别方法,其特征在于,所述故障类型识别方法包括如下步骤:
步骤S1:待匹配对象选择步骤;选定第1个待匹配总模式的第j 0个子模式对应的实时序列Q,选取实时序列Q的第一个字符
Figure DEST_PATH_IMAGE001
作为待匹配对象,待匹配对象的发生时刻
Figure DEST_PATH_IMAGE002
步骤S2:根据步骤S1获得的待匹配对象,在模式库中搜索所有总模式中第j 0个子模式
Figure DEST_PATH_IMAGE003
(1≤i≤N)的首字符
Figure DEST_PATH_IMAGE004
,N为总模式的数量,选出所有总模式中第j 0个子模式
Figure DEST_PATH_IMAGE005
首字符
Figure 712643DEST_PATH_IMAGE004
与步骤S1获得的待匹配对象匹配的所有总模式,从而筛选出与步骤S1获得的待匹配对象匹配成功的初筛总模式集合A,A={a 1a 2,…,a p }(1≤p≤N);
步骤S3:判断初筛总模式集合A是否为空,若为空,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则,跳转至步骤S4;
步骤S4:根据待匹配对象的发生时刻计算时间围栏T=[
Figure DEST_PATH_IMAGE006
-t 1
Figure 160942DEST_PATH_IMAGE006
+t 1],t 1为设定的常数;
步骤S5: 在时间围栏T内,针对初筛总模式集合A中的任一个总模式a i (1≤ip),分别在总模式a i 中除第j 0个子模式外的各子模式所对应的实时序列中搜索子模式的首字符
Figure DEST_PATH_IMAGE007
(1≤j≤K且jj 0),K为总模式中子模式的数量;若在时间围栏T内,存在任意j使得总模式a i 中除第j 0个子模式外的任一子模式的首字符
Figure 455526DEST_PATH_IMAGE007
在其对应的实时序列中未搜索到,则从初筛总模式集合A中删除a i ;否则,将a i 加入过滤集合B,B={b1,b2,…,b q }(1≤qp),重复上述匹配过程,遍历初筛总模式集合A中所有总模式;
步骤S6:判断过滤集合B是否为空,若集合B非空,则跳转至步骤S7;否则,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;
步骤S7:对过滤集合B中的总模式b1进行匹配:对于总模式b1中第j个子模式(1≤j≤K)对应的实时序列,在
Figure DEST_PATH_IMAGE008
(1<m
Figure DEST_PATH_IMAGE009
)的时间范围内匹配搜索
Figure DEST_PATH_IMAGE010
,其中,
Figure DEST_PATH_IMAGE011
表示总模式b1中第j个子模式的第(m-1)个字符的发生时刻,
Figure 709790DEST_PATH_IMAGE009
表示总模式b1中第j个子模式所包含的字符数,t 0表示设定的常数;若存在任意的jm,使得
Figure 806053DEST_PATH_IMAGE010
未搜索到,则b1匹配失败;否则,b1匹配成功;
步骤S8:判断b1是否匹配成功,若b1匹配成功,输出总模式b1,将b1作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中与模式b1匹配成功的所有字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若b1匹配失败,从过滤集合B中删除b1
步骤S9:判断过滤集合B是否为空集合,若为空,则未能识别故障类型,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1;否则以过滤集合B中下一个总模式作为当前总模式,返回步骤S7。
2.根据如权利要求1所述的基于时间约束的故障类型识别方法,其特征在于,所述步骤S9还包括:
在过滤集合B中搜索包含步骤S7中已完成匹配的字符
Figure 628515DEST_PATH_IMAGE010
(1≤jj 1,1≤mm 1) 的总模式,所述包含指与已完成匹配的字符
Figure 895548DEST_PATH_IMAGE010
的位置和字符值均相同;若搜索到总模式b i ,使得
Figure DEST_PATH_IMAGE012
(对于
Figure DEST_PATH_IMAGE013
1≤jj 1,1≤mm 1),则在总模式b i 的第j 1个子模式的第m 1个字符
Figure DEST_PATH_IMAGE014
处对b i 进行剩余字符的匹配。
3.根据如权利要求2所述的基于时间约束的故障类型识别方法,其特征在于,所述
Figure DEST_PATH_IMAGE015
处对b i 进行剩余字符的匹配之后:
若再次发生字符匹配失败,返回失败点为j2、m2,然后继续在过滤集合B中搜索包含已完成匹配字符
Figure 891186DEST_PATH_IMAGE015
(1≤jj 2,1≤mm 2)的总模式,如此循环直到遍历过滤集合B;
若存在某一总模式匹配成功,则输出匹配成功的总模式,将匹配成功的总模式作为待匹配的实时模式序列对应的故障类型,删除步骤S1中选取的待匹配对象及各实时序列中已匹配成功的字符,选取下一待匹配对象,返回步骤S1,执行故障类型识别方法,以匹配下一待匹配对象的故障类型;若未搜索到,则表示匹配失败,删除步骤S1中选取的待匹配对象,以实时序列Q中下一个字符作为待匹配对象,返回步骤S1。
CN202110364923.5A 2021-04-06 2021-04-06 一种基于时间约束的故障类型识别方法 Active CN112766426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110364923.5A CN112766426B (zh) 2021-04-06 2021-04-06 一种基于时间约束的故障类型识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110364923.5A CN112766426B (zh) 2021-04-06 2021-04-06 一种基于时间约束的故障类型识别方法

Publications (2)

Publication Number Publication Date
CN112766426A CN112766426A (zh) 2021-05-07
CN112766426B true CN112766426B (zh) 2021-09-07

Family

ID=75691137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110364923.5A Active CN112766426B (zh) 2021-04-06 2021-04-06 一种基于时间约束的故障类型识别方法

Country Status (1)

Country Link
CN (1) CN112766426B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463235A (zh) * 2014-11-18 2015-03-25 中国铁道科学研究院电子计算技术研究所 基于动车组运行图像的故障识别方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3493074A1 (en) * 2006-10-05 2019-06-05 Splunk Inc. Time series search engine
CN105759169B (zh) * 2016-03-07 2018-07-06 华中科技大学 一种基于wams时间断面信息和拓扑信息的故障诊断方法
CN107992840B (zh) * 2017-12-12 2019-02-05 清华大学 多分段多阈值约束的时间序列模式查找方法和系统
US11294921B2 (en) * 2019-03-12 2022-04-05 General Electric Company Multivariate time-series data search
CN110427996B (zh) * 2019-07-24 2022-03-15 清华大学 基于模糊匹配的时间序列异常模式识别方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463235A (zh) * 2014-11-18 2015-03-25 中国铁道科学研究院电子计算技术研究所 基于动车组运行图像的故障识别方法及装置

Also Published As

Publication number Publication date
CN112766426A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
Rama-Maneiro et al. Deep learning for predictive business process monitoring: Review and benchmark
US20210192389A1 (en) Method for ai optimization data governance
CN112612902A (zh) 一种电网主设备的知识图谱构建方法及设备
CN108509654A (zh) 动态知识图谱的构建方法
CN110442847B (zh) 基于代码仓库过程管理的代码相似性检测方法及装置
CN114281809B (zh) 一种多源异构数据清洗方法及装置
CN106991446A (zh) 一种互信息的组策略嵌入式动态特征选择方法
CN114968727B (zh) 基于人工智能运维的数据库贯穿基础设施的故障定位方法
CN113626400A (zh) 基于日志树和解析树的日志事件提取方法及系统
CN110162632A (zh) 一种新闻专题事件发现的方法
CN113591485A (zh) 一种基于数据科学的智能化数据质量稽核系统及方法
CN104750673B (zh) 文本匹配过滤方法及装置
CN113268370A (zh) 一种根因告警分析方法、系统、设备及存储介质
CN114564726A (zh) 一种基于大数据办公的软件漏洞分析方法及系统
CN110059126B (zh) 基于lkj异常值数据的复杂关联网络分析方法及系统
CN109472484A (zh) 一种基于流程图的生产过程异常记录方法
CN113485878B (zh) 一种多数据中心故障检测方法
CN118260689A (zh) 一种基于自适应低秩参数高效微调的日志异常检测方法
Aydin et al. Synthesis of monitoring rules with STL
CN114708472A (zh) 面向ai实训的多模态数据集标注方法、装置及电子设备
CN112766426B (zh) 一种基于时间约束的故障类型识别方法
CN113569005B (zh) 一种基于数据内容的大规模数据特征智能化提取方法
CN112738724B (zh) 一种区域目标人群的精准识别方法、装置、设备和介质
CN110727538B (zh) 一种基于模型命中概率分布的故障定位系统及方法
EP3547154B1 (en) Constraint satisfaction software tool for database tables

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant