CN107992840A - 多分段多阈值约束的时间序列模式查找方法和系统 - Google Patents

多分段多阈值约束的时间序列模式查找方法和系统 Download PDF

Info

Publication number
CN107992840A
CN107992840A CN201711322649.5A CN201711322649A CN107992840A CN 107992840 A CN107992840 A CN 107992840A CN 201711322649 A CN201711322649 A CN 201711322649A CN 107992840 A CN107992840 A CN 107992840A
Authority
CN
China
Prior art keywords
window
time sequence
sliding window
point
sliding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711322649.5A
Other languages
English (en)
Other versions
CN107992840B (zh
Inventor
王建民
康荣
黄向东
王晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201711322649.5A priority Critical patent/CN107992840B/zh
Publication of CN107992840A publication Critical patent/CN107992840A/zh
Application granted granted Critical
Publication of CN107992840B publication Critical patent/CN107992840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种多分段多阈值约束的时间序列模式查找方法和系统,查找方法包括:S1、将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取时间序列模式的指定个窗口块的特征,其中,时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;S2、获取滑动窗口在流式时序数据上滑动至任一窗口时,滑动窗口的指定个窗口块的特征;S3、若判断获知任一窗口不能跳过,则从任一窗口开始,判断与滑动窗口的跳跃步长数相等的窗口块的流式时序数据和时间序列模式是否匹配,若匹配,则获取与滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。本发明能够对特征进行高效提取。并且,本发明可以高效的完成多阈值模式的精确比较。

Description

多分段多阈值约束的时间序列模式查找方法和系统
技术领域
本发明涉及计算机数据管理领域,更具体地,涉及一种多分段多阈值约束的时间序列模式查找方法和系统。
背景技术
随着工业4.0和工业物联网(IIoT)的发展,处理来自传感器的流式时间序列数据变得越来越重要。一个重要的应用场景就是给定一个时间序列片段,即模式,在流式到达的时间序列中实时地发现给定的模式。这种模式往往代表了一种特定的故障现象或者其他有意义的事件,因此这种模式的实时发现(称为模式匹配)在实际应用中具有重大意义。
传统的时间序列模式匹配问题中,模式是简单的一个序列,并允许用户指定一个误差值(称为阈值)表示模式和流式时间序列之间的可容忍差异。此外,在比较模式和流式时间序列的时候,往往采用欧氏距离进行度量。上述基于单阈值和欧式距离的模式匹配过于简单,无法满足一些实际场景中的需求。
发明内容
本发明提供一种克服上述问题的一种多分段多阈值约束的时间序列模式查找方法和系统。
根据本发明的一个方面,提供一种多分段多阈值约束的时间序列模式查找方法,包括:S1、将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;S2、获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;S3、基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
优选地,步骤S3之后还包括:S4、将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;持续执行步骤S2至步骤S3,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
优选地,步骤S1之前还包括:S0、获取所述时间序列模式;其中,所述时间序列模式的任意两个时间上相邻的子模式的时间分界点为分界区域中的任意值。
优选地,步骤S1中所述提取所述时间序列模式的指定个窗口块的特征进一步包括:提取所述时间序列模式指定个窗口块的上边界特征和下边界特征,所述上边界特征为:
其中,为第j个窗口块的上边界特征,w为滑动窗口的步长,j表示第j个窗口块,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw},u表示上边界,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离;
所述下边界特征为:
其中,为第j个窗口块的下边界特征,l表示下边界,w为滑动窗口的步长,j表示第j个窗口块,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw}。
优选地,步骤S2进一步包括:获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口所述指定个窗口块的如下特征:
其中,为流式数据上的窗口Wt的第j个块的特征值,st,jw为该流数据窗口的第jw个点,f代表特征,t为所属窗口的起始时间,j为第j个窗口块,包含w个点{{s(j-1)w+1,…sjw}},jw为第j个窗口块的最后一个点。
优选地,步骤S3进一步包括:判断所述滑动窗口的指定个窗口块的特征是否落入所述上边界特征和所述下边界特征构成的区间;若所述滑动窗口的指定个窗口块的特征落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口不能跳过,从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果;若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过。
优选地,所述若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过之后还包括:将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口,持续步骤S2至步骤S3,直至滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
优选地,步骤S3中所述从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配进一步包括:根据所述时间序列模式的多个子模式的任一分界点,确定所述任一分界点的上一分界点的候选集合;根据所述任一分界点的上一分界点的候选集合,确定所述任一分界点的候选集合;基于所述任一分界点的上一分界点的候选集合和所述任一分界点的候选集合,确定所述任一分界点对应的子模式;根据所述任一分界点的上一分界点的候选集合中的任一第一分界点,以及所述任一分界点与所述任一分界点的上一分界点间的分界区域中的任一第二分界点,获取所述任一第一分界点和所述任一第二分界点的平均L-Norm距离;判断所述平均L-Norm距离是否小于所述任一分界点对应的子模式的预设阈值;若所述距离小于所述任一分界点对应的子模式的预设阈值,则将所述任一第二分界点添加至所述任一分界点的候选集合;重复执行上述步骤,若存在分界点的候选集合为空集,则匹配;若所有候选集均包含分界点,则不匹配。
根据本发明的另一个方面,提供一种多分段多阈值约束的时间序列模式查找系统,包括:提取模式特征模块,用于将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;提取滑动窗口特征模块,用于获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;判断匹配模块,用于基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
优选地,所述查找系统还包括:完成查找模块,用于将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;持续调用所述提取滑动窗口特征模块和所述判断匹配模块,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
本发明提供的一种多分段多阈值约束的时间序列模式查找方法和系统,通过设置多窗口块获取特征,能够对特征进行高效提取。并且,本发明提出了高效的后处理算法,可以高效的完成多阈值模式的精确比较,能够满足实际场景中的需求。通过设置等长分段表示法,能够有效地提升过滤效率,保证没有漏解。设置多子模式多阈值,定义了新的更细粒度的模式模型,可以更加精确地描述带匹配的模式。
附图说明
图1为本发明实施例中的一种多分段多阈值约束的时间序列模式查找方法的流程图;
图2为本发明实施例中的一种多分段多阈值约束的时间序列模式查找方法的特征提取示意图;
图3为本发明实施例中的一种多分段多阈值约束的时间序列模式查找系统的模块图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
针对现有技术存在的采用欧氏距离作为距离度量的模式,难以满足在工业实际中所需要的“各个子部分有不同的阈值、边界也允许有一定范围的模糊”的问题,本发明实施例提供一种多分段多阈值约束的时间序列模式查找方法,用一种更细粒度的模型来提升了时间序列模式的表述能力,这种模式匹配允许用户对一个给定的模式的不同时间段设置不同的阈值(每个拥有不同阈值的时间段内的时间序列称为一个子模式),同时各子模式之间的时间分界点可以在一定时间范围内移动,在这种情况下在流式的时序数据上寻找模式。
图1为本发明实施例中的一种多分段多阈值约束的时间序列模式查找方法的流程图,如图1所示,包括:S1、将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;S2、获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;S3、基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
具体地,时间序列模式的指定个窗口块的特征和滑动窗口的所述指定个窗口块的特征是数值上相等的窗口块,举例来说,即为时间序列模式第n个窗口块和滑动窗口第n个窗口块。
进一步地,本发明实施例的方法是分成两个阶段的,首先在剪枝阶段,根据等长分段表示法(Equal Length Block,简称ELB)将时间序列模式和滑动窗口分别划分成同样多个数的窗口块,并且提取所述时间序列模式的指定个窗口块的特征;获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征。
然后基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则进入后处理阶段,从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
本发明提供的一种多分段多阈值约束的时间序列模式查找方法,通过设置多窗口块获取特征,能够对特征进行高效提取。并且,本发明提出了高效的后处理算法,可以高效的完成多阈值模式的精确比较,能够满足实际场景中的需求。通过设置等长分段表示法,能够有效地提升过滤效率,保证没有漏解。设置多子模式多阈值,定义了新的更细粒度的模式模型,可以更加精确地描述带匹配的模式。
基于上述实施例,步骤S3之后还包括:S4、将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;持续执行步骤S2至步骤S3,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
基于上述实施例,步骤S1之前还包括:S0、获取所述时间序列模式;其中,所述时间序列模式的任意两个时间上相邻的子模式的时间分界点为分界区域中的任意值。
具体地,本实施例可通过以下说明具体解释。
形式化定义多阈值的时间序列模式P。
P是一个长度为n的序列:{p},其中p表示一个数据点。P可以被划分为多个互不重叠的子模式,记做{P1,P2,…,Pb},两个时间上相邻的子模式之间的时间分界点(breakpoint)可以在一段时间区域内任意取值,该区域称为分界区域(break region,简称为br),例如,Pk与Pk+1之间的分界区域定义为brk=[lk,rk]。其中lk是区域的左边界,rk是右边界。
对于P的各个子模式Pk,用户可以设置相应的阈值εk。距离度量方式采用平均L-Norm距离,即对于两段长度均为n的序列X和Y,两者之间的距离定义为:
这是因为,考虑到每个子模式的长度不定,为了保证每个点的松紧程度不变(即每个点的平均阈值不变),采用平均L-Norm距离。
在流式时序数据S上,维护一个与该模式P等长的滑动窗口Wt,其中t是该窗口的起始时间戳。对于一个滑动窗口Wt,如果Wt和P相比较,存在一种边界点的组合方式,使得Wt与P的所有相对齐的子模式之间的距离都满足用户预设的阈值,则Wt是P的一个多分段多阈值匹配。滑动窗口以w的步长在S上跳跃滑动。
本发明提供的一种多分段多阈值约束的时间序列模式查找方法,设置多子模式多阈值,定义了新的更细粒度的模式模型,可以更加精确地描述带匹配的模式。
基于上述实施例,步骤S1中所述提取所述时间序列模式的指定个窗口块的特征进一步包括:
提取所述时间序列模式指定个窗口块的上边界特征和下边界特征,所述上边界特征为:
其中,为第j个窗口块的上边界特征,w为滑动窗口的步长,j表示第j个窗口块,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw},u为upper,u表示上边界,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离;如果某个流窗口(如Wt,代表数据流上起始时间为t的滑动窗口)是该模式的正确匹配,那么,流窗口上第i个点(即st,i)与模式的第i个点(即pi)的最大允许距离。换句话说,如果点对之间的距离超过θ(i),那么这个流窗口不可能是模式的一个正确匹配。
所述下边界特征为:
其中,为第j个窗口块的下边界特征,l为lower,l表示下边界,w为滑动窗口的步长,j表示第j个窗口块,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw}。下边界的公式与上边界完全对应,区别仅在于加/减最大可能距离θ(i)。
获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口所述指定个窗口块的如下特征:
其中,为流式数据上的窗口Wt的第j个块的特征值,st,jw为该流数据窗口的第jw个点,f为feature,f代表特征,t为所属窗口的起始时间,j为第j个窗口块,包含w个点{s(j-1)w+1,…sjw},jw为第j个窗口块的最后一个点。
具体地,通过一个具体的例子来进一步说明本实施例。
在剪枝阶段,采用ELB表示法,将P划分为定长的N个窗口块{PB1,PB2,…,PBN},滑动窗口被以同样的方式划分为N个窗口块{WBt,1,WBt,2,…,WBt,N}。块的划分和子模式是互相独立的。对于模式的第j个块PBj,提取特征的过程包含以下步骤:
由于子模式Pk的平均距离下的阈值为εk,则在Pk的长度达到最大时,最大允许的norm距离阈值为md(k)=(rk-lk-1)1/pεk
对于模式的每个点pi,要么属于确定的子模式Pk,要么处于分界区域,可能属于Pk或者Pk+1。因此,对于点pi来说,滑动窗口中相对应的点距离它的最大允许距离定义为:
对于模式的第j个块PBj,定义它的两个特征,上边界 下边界为 其中,为第j个窗口块的上边界特征,w为滑动窗口的步长,j表示第j个窗口块。可以计算得知,第j个窗口块包含的数据点为{{p(j-1)w+1,…pjw}}。u意为upper,表示上边界。θ(i)代表的是第i个“流窗口-模式”点对的最大允许距离。如果某个流窗口(如Wt,代表数据流上起始时间为t的滑动窗口)是该模式的正确匹配,那么,流窗口上第i个点(即st,i)与模式的第i个点(即pi)的最大允许距离。换句话说,如果点对之间的距离超过θ(i),那么这个流窗口不可能是模式的一个正确匹配。为第j个窗口块的下边界特征,l意为lower,表示下边界。w为滑动窗口的步长,j表示第j个窗口块。下边界的公式与上边界完全对应,区别仅在于加/减最大可能距离θ(i)。
基于上述实施例,步骤S2进一步包括:获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口所述指定个窗口块的如下特征:
其中,为流式数据上的窗口Wt的第j个块的特征值,st,jw为该流数据窗口的第jw个点,f为feature,f代表特征,t为所属窗口的起始时间,j为第j个窗口块,包含w个点{{s(j-1)w+1,…sjw}},jw为第j个窗口块的最后一个点。
基于上述实施例,步骤S3进一步包括:判断所述滑动窗口的指定个窗口块的特征是否落入所述上边界特征和所述下边界特征构成的区间;若所述滑动窗口的指定个窗口块的特征落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口不能跳过,从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果;若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过。
基于上述实施例,所述若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过之后还包括:将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口,持续步骤S2至步骤S3,直至滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
基于上述实施例,步骤S3中所述从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配进一步包括:根据所述时间序列模式的多个子模式的任一分界点,确定所述任一分界点的上一分界点的候选集合;根据所述任一分界点的上一分界点的候选集合,确定所述任一分界点的候选集合;基于所述任一分界点的上一分界点的候选集合和所述任一分界点的候选集合,确定所述任一分界点对应的子模式;根据所述任一分界点的上一分界点的候选集合中的任一第一分界点,以及所述任一分界点与所述任一分界点的上一分界点间的分界区域中的任一第二分界点,获取所述任一第一分界点和所述任一第二分界点的平均L-Norm距离;判断所述平均L-Norm距离是否小于所述任一分界点对应的子模式的预设阈值;若所述距离小于所述任一分界点对应的子模式的预设阈值,则将所述任一第二分界点添加至所述任一分界点的候选集合;重复执行上述步骤,若存在分界点的候选集合为空集,则匹配;若所有候选集均包含分界点,则不匹配。
进一步地,通过下述说明进一步解释本实施例。
(1-1)对于每个候选窗口W和模式P,从左向右确定子模式之间的分界点(bp1到bpb-1)。在确定第k个时间分界点bpk时,第k-1个分界点的候选集合已经确定,记为BSk-1
(1-2)基于BSk-1,我们确定下一个分界点的候选集BSk。这两个候选集界定了第k个子模式(该子模式的阈值为εk)。
(1-3)对于BSk-1中的每个点i,以及分界点可能的区域brk中的每个点j,计算W[i:j-1]和P[i:j-1]之间的距离D,即从第i个点到第j-1个点组成的子片段。所有D<εk的点j均加入到BSk
(1-4)重复(1-3),直到某个分界点的候选集为空,则该序列不匹配;或者所有分界点都有候选集,则该序列匹配。
作为一个优选实施例,图2为本发明实施例中的一种多分段多阈值约束的时间序列模式查找方法的特征提取示意图,本实施例请参考图2。
(2-1)如图2,该模式包含3个片段,其中第一个边界点区域是br1=[4,5],第二个边界点区域是br2=[11,13]。例如,第一个子模式可能是P[1:4]或者是P[1:5]。
(2-2)在模式处理阶段,P被划分为5个模式块{PB1,PB2,…,PBb}。Wt也被相应的分为五个窗口块。每个窗口块PBi,都提取了上下边界而对于第j个块WBt,j,我们提取它的特征为
(2-3)在模式匹配的过程中,滑动窗口以w的步长跳跃滑动。在某个窗口Wt中,将窗口内的序列划分为多个块,并提取其特征。
(2-4)对于每个WBt,j,如果没有落在之间,则当前窗口可以直接跳过,否则继续检查,直到5个相应的块都符合条件为止。
(2-5)如果在步骤(2-4)中不能跳过Wt,则进入后处理阶段。对于Wt,我们要检测w个连续的窗口Wt,Wt+1…,Wt+4
(2-5-1)对于每个候选窗口W和模式P,从左向右确定子模式之间的分界点(bp1到bpb-1)。在确定第k个时间分界点bpk时,第k-1个分界点的候选集合已经确定,记为BSk-1
(2-5-2)基于BSk-1,确定下一个分界点的候选集BSk。这两个候选集界定了第k个子模式(该子模式的阈值为εk)。
(2-5-3)对于BSk-1中的每个点i,以及分界点可能的区域brk中的每个点j,我们计算W[i:j-1]和P[i:j-1]之间的距离D,即从第i个点到第j-1个点组成的子片段。所有D<εk的点j均加入到BSk
(2-5-4)重复(2-5-3),直到某个分界点的候选集为空,则该序列不匹配;或者所有分界点都有候选集,则该序列匹配。
(2-6)不断重复步骤(2-3)到步骤(2-5)。
基于上述实施例,图3为本发明实施例中的一种多分段多阈值约束的时间序列模式查找系统的模块图,如图3所示,包括:提取模式特征模块,用于将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;提取滑动窗口特征模块,用于获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;判断匹配模块,用于基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
基于上述实施例,所述查找系统还包括:完成查找模块,用于将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;持续调用所述提取滑动窗口特征模块和所述判断匹配模块,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
本发明提供的一种多分段多阈值约束的时间序列模式查找方法和系统,通过设置多窗口块获取特征,能够对特征进行高效提取。并且,本发明提出了高效的后处理算法,可以高效的完成多阈值模式的精确比较,无漏报、无误报,能够满足实际场景中的需求。设置多子模式多阈值,定义了新的更细粒度的模式模型,可以更加精确地描述带匹配的模式。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多分段多阈值约束的时间序列模式查找方法,其特征在于,包括:
S1、将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;
S2、获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;
S3、基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
2.根据权利要求1所述的查找方法,其特征在于,步骤S3之后还包括:
S4、将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;
持续执行步骤S2至步骤S3,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
3.根据权利要求1所述的查找方法,其特征在于,步骤S1之前还包括:
S0、获取所述时间序列模式;其中,所述时间序列模式的任意两个时间上相邻的子模式的时间分界点为分界区域中的任意值。
4.根据权利要求1所述的查找方法,其特征在于,步骤S1中所述提取所述时间序列模式的指定个窗口块的特征进一步包括:
提取所述时间序列模式指定个窗口块的上边界特征和下边界特征,所述上边界特征为:
<mrow> <msubsup> <mi>PB</mi> <mi>j</mi> <mi>u</mi> </msubsup> <mo>=</mo> <msub> <mi>max</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>w</mi> <mo>+</mo> <mn>1</mn> <mo>&lt;</mo> <mi>i</mi> <mo>&lt;</mo> <mi>j</mi> <mi>w</mi> </mrow> </msub> <mo>{</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>+</mo> <mi>&amp;theta;</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>}</mo> <mo>;</mo> </mrow>
其中,为第j个窗口块的上边界特征,w为滑动窗口的步长,j表示第j个窗口块,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw},u为upper,u表示上边界,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离;
所述下边界特征为:
<mrow> <msubsup> <mi>PB</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mo>=</mo> <msub> <mi>max</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>w</mi> <mo>+</mo> <mn>1</mn> <mo>&lt;</mo> <mi>i</mi> <mo>&lt;</mo> <mi>j</mi> <mi>w</mi> </mrow> </msub> <mo>{</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>-</mo> <mi>&amp;theta;</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>}</mo> <mo>;</mo> </mrow>
其中,为第j个窗口块的下边界特征,l表示下边界,w为滑动窗口的步长,j表示第j个窗口块,θ(i)代表的是第i个“流窗口-模式”点对之间的最大允许距离,第j个窗口块包含的数据点为{p(j-1)w+1,…pjw}。
5.根据权利要求4所述的查找方法,其特征在于,步骤S2进一步包括:
获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口所述指定个窗口块的如下特征:
<mrow> <msubsup> <mi>WB</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>f</mi> </msubsup> <mo>=</mo> <msub> <mi>s</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>j</mi> <mi>w</mi> </mrow> </msub> <mo>;</mo> </mrow>
其中,为流式数据上的窗口Wt的第j个块的特征值,st,jw为该流数据窗口的第jw个点,f代表特征,t为所属窗口的起始时间,j为第j个窗口块,包含w个点{s(j-1)w+1,…sjw},jw为第j个窗口块的最后一个点。
6.根据权利要求5所述的查找方法,其特征在于,步骤S3进一步包括:
判断所述滑动窗口的指定个窗口块的特征是否落入所述上边界特征和所述下边界特征构成的区间;
若所述滑动窗口的指定个窗口块的特征落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口不能跳过,从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果;
若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过。
7.根据权利要求6所述的查找方法,其特征在于,所述若所述滑动窗口的指定个窗口块的特征不落入所述上边界特征和所述下边界特征构成的区间,则所述任一窗口跳过之后还包括:
将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口,持续步骤S2至步骤S3,直至滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
8.根据权利要求1所述的查找方法,其特征在于,步骤S3中所述从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配进一步包括:
根据所述时间序列模式的多个子模式的任一分界点,确定所述任一分界点的上一分界点的候选集合;
根据所述任一分界点的上一分界点的候选集合,确定所述任一分界点的候选集合;
基于所述任一分界点的上一分界点的候选集合和所述任一分界点的候选集合,确定所述任一分界点对应的子模式;
根据所述任一分界点的上一分界点的候选集合中的任一第一分界点,以及所述任一分界点与所述任一分界点的上一分界点间的分界区域中的任一第二分界点,获取所述任一第一分界点和所述任一第二分界点的平均L-Norm距离;
判断所述平均L-Norm距离是否小于所述任一分界点对应的子模式的预设阈值;
若所述距离小于所述任一分界点对应的子模式的预设阈值,则将所述任一第二分界点添加至所述任一分界点的候选集合;
重复执行上述步骤,若存在分界点的候选集合为空集,则匹配;若所有候选集均包含分界点,则不匹配。
9.一种多分段多阈值约束的时间序列模式查找系统,其特征在于,包括:
提取模式特征模块,用于将时间序列模式和滑动窗口分别划分成数目相等的窗口块,并且提取所述时间序列模式的指定个窗口块的特征,其中,所述时间序列模式由多个互不重叠的包括对应的预设阈值的子模式构成;
提取滑动窗口特征模块,用于获取所述滑动窗口在流式时序数据上滑动至任一窗口时,所述滑动窗口的所述指定个窗口块的特征;
判断匹配模块,用于基于所述时间序列模式的指定个窗口块的特征以及所述滑动窗口的指定个窗口块的特征,若判断获知所述任一窗口不能跳过,则从所述任一窗口开始,判断与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据和所述时间序列模式是否匹配,若匹配,则获取所述与所述滑动窗口的跳跃步长数相等的窗口块的流式时序数据作为查找结果。
10.根据权利要求9所述的查找系统,其特征在于,所述查找系统还包括:
完成查找模块,用于将所述滑动窗口在流式时序数据上滑动至所述任一窗口的下一窗口;持续调用所述提取滑动窗口特征模块和所述判断匹配模块,直至所述滑动窗口滑动至所述流式时序数据末,完成对于匹配所述时间序列模式的流式时序数据的查找。
CN201711322649.5A 2017-12-12 2017-12-12 多分段多阈值约束的时间序列模式查找方法和系统 Active CN107992840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711322649.5A CN107992840B (zh) 2017-12-12 2017-12-12 多分段多阈值约束的时间序列模式查找方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711322649.5A CN107992840B (zh) 2017-12-12 2017-12-12 多分段多阈值约束的时间序列模式查找方法和系统

Publications (2)

Publication Number Publication Date
CN107992840A true CN107992840A (zh) 2018-05-04
CN107992840B CN107992840B (zh) 2019-02-05

Family

ID=62037317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711322649.5A Active CN107992840B (zh) 2017-12-12 2017-12-12 多分段多阈值约束的时间序列模式查找方法和系统

Country Status (1)

Country Link
CN (1) CN107992840B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829755A (zh) * 2018-05-25 2018-11-16 国网山东省电力公司青岛供电公司 基于迭代最近点的变压器故障案例匹配搜索方法
CN110443216A (zh) * 2019-08-13 2019-11-12 树根互联技术有限公司 一种生产设备的生产模式识别方法及装置
CN112766426A (zh) * 2021-04-06 2021-05-07 中国铁道科学研究院集团有限公司通信信号研究所 一种基于时间约束的故障类型识别方法
CN114722014A (zh) * 2022-06-09 2022-07-08 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214304A (zh) * 2010-04-09 2011-10-12 索尼公司 信息处理设备、信息处理方法、和程序
CN102306302A (zh) * 2011-08-29 2012-01-04 哈尔滨工业大学 基于emd与garch模型的卫星时钟误差预报方法
US8494234B1 (en) * 2007-03-07 2013-07-23 MotionDSP, Inc. Video hashing system and method
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN104516914A (zh) * 2013-09-30 2015-04-15 日电(中国)有限公司 识别时间序列模式的方法和装置
CN103309966B (zh) * 2013-06-04 2016-02-24 中国科学院信息工程研究所 基于时间滑动窗口的数据流点连接查询方法
CN106056849A (zh) * 2016-07-15 2016-10-26 西安电子科技大学 老人跌倒智能检测与定位的主被动告警系统及方法
CN106547851A (zh) * 2016-10-19 2017-03-29 贵州大学 基于模糊序列模式发掘的网页内容提取方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494234B1 (en) * 2007-03-07 2013-07-23 MotionDSP, Inc. Video hashing system and method
CN102214304A (zh) * 2010-04-09 2011-10-12 索尼公司 信息处理设备、信息处理方法、和程序
CN102306302A (zh) * 2011-08-29 2012-01-04 哈尔滨工业大学 基于emd与garch模型的卫星时钟误差预报方法
CN103309966B (zh) * 2013-06-04 2016-02-24 中国科学院信息工程研究所 基于时间滑动窗口的数据流点连接查询方法
CN104516914A (zh) * 2013-09-30 2015-04-15 日电(中国)有限公司 识别时间序列模式的方法和装置
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN106056849A (zh) * 2016-07-15 2016-10-26 西安电子科技大学 老人跌倒智能检测与定位的主被动告警系统及方法
CN106547851A (zh) * 2016-10-19 2017-03-29 贵州大学 基于模糊序列模式发掘的网页内容提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨锋等: "LVS:高效的时间序列上的语义窗口查询算法", 《计算机研究与发展》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829755A (zh) * 2018-05-25 2018-11-16 国网山东省电力公司青岛供电公司 基于迭代最近点的变压器故障案例匹配搜索方法
CN108829755B (zh) * 2018-05-25 2021-04-13 国网山东省电力公司青岛供电公司 基于迭代最近点的变压器故障案例匹配搜索方法
CN110443216A (zh) * 2019-08-13 2019-11-12 树根互联技术有限公司 一种生产设备的生产模式识别方法及装置
CN112766426A (zh) * 2021-04-06 2021-05-07 中国铁道科学研究院集团有限公司通信信号研究所 一种基于时间约束的故障类型识别方法
CN114722014A (zh) * 2022-06-09 2022-07-08 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统
CN114722014B (zh) * 2022-06-09 2022-09-02 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统

Also Published As

Publication number Publication date
CN107992840B (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
CN107992840A (zh) 多分段多阈值约束的时间序列模式查找方法和系统
Grabusts The choice of metrics for clustering algorithms
US20130138355A1 (en) Method and system for evaluating sequences
CN110826418B (zh) 脸部特征提取方法及装置
CN109002784B (zh) 街景识别方法和系统
US10671831B2 (en) High speed reference point independent database filtering for fingerprint identification
CN109841264B (zh) 一种序列比对滤波处理方法、系统、装置及可读存储介质
CN111243601A (zh) 声纹聚类方法、装置、电子设备和计算机可读存储介质
CN111625683A (zh) 基于图结构差异分析的视频摘要自动生成方法及系统
CN102722732B (zh) 一种基于数据二阶统计量建模的图像集合匹配方法
CN107527356B (zh) 一种基于懒交互方式的视频跟踪方法
CN107077617B (zh) 指纹提取方法及装置
CN115527610B (zh) 一种单细胞组学数据的聚类分析方法
CN109886151B (zh) 一种虚假身份属性检测方法
CN111553476B (zh) 基于记忆分值的神经网络训练方法、装置及存储介质
CN114547286A (zh) 一种信息搜索方法、装置及电子设备
CN111680175B (zh) 人脸数据库建库方法、计算机设备和计算机可读存储介质
CN112738724A (zh) 一种区域目标人群的精准识别方法、装置、设备和介质
CN112434656A (zh) 一种物联网设备的图像识别方法、装置及计算机设备
CN111160391A (zh) 基于空间划分的快速相对密度噪声检测方法及存储介质
Sakarya et al. Video scene detection using dominant sets
CN113239236B (zh) 视频处理方法、装置、电子设备及存储介质
Malod-Dognin et al. Using dominances for solving the protein family identification problem
US11386706B1 (en) Device and method for classifying biometric authentication data
CN111044813B (zh) 充电模式的识别方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant