CN110647647B - 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法 - Google Patents

一种基于时间序列复杂度差异性的封闭图形相似性搜索方法 Download PDF

Info

Publication number
CN110647647B
CN110647647B CN201910826882.XA CN201910826882A CN110647647B CN 110647647 B CN110647647 B CN 110647647B CN 201910826882 A CN201910826882 A CN 201910826882A CN 110647647 B CN110647647 B CN 110647647B
Authority
CN
China
Prior art keywords
complexity
time
time series
difference
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910826882.XA
Other languages
English (en)
Other versions
CN110647647A (zh
Inventor
梁建海
宋新海
方英武
苗壮
景斌强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian International University
Original Assignee
Xian International University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian International University filed Critical Xian International University
Priority to CN201910826882.XA priority Critical patent/CN110647647B/zh
Publication of CN110647647A publication Critical patent/CN110647647A/zh
Application granted granted Critical
Publication of CN110647647B publication Critical patent/CN110647647B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,包括以下步骤:S1、观测封闭图形,获得封闭图形的时间序列。S2、设定两个时间序列的复杂度差异性CO;S3、设定复杂度时间度量标准TSD;S4、采用穷近法对S3中的复杂度时间度量标准完成近邻搜索;S5、采用三角不等式对距离值进行修正;S6、在系列化的索引数据结构中获得二维相对图的封闭位置,解决了现有的图形相似性搜索方法无法实现二维图形的相似性搜索,同时时间序列的时间维度武大得到解决,确保图形旋转在度量过程中的有效性,对不同复杂度的时间序列给出度量标准,最终实现二维封闭图形的相似性搜索。

Description

一种基于时间序列复杂度差异性的封闭图形相似性搜索方法
技术领域
本发明属于人工智能搜索方法技术领域,具体涉及一种基于时间序列复杂度差异性的封闭图形相似性搜索方法。
背景技术
相似性搜索是对二维封闭图进行外形匹配的有效方法。相似性搜索最初应用于时间序列搜索过程中,首先通过索引将时间序列映射到单维空间,其次使用欧氏距离进行度量,最终在顺序扫描等方法的基础上获得最终的匹配结果。相似性搜索方法的局限性是改变查询的样本长度会获得更快的搜索结果,但会导致精度降低。二维封闭图的相似性样本序列是否具有代表性取决于对采样方式和距离的计算方式信赖极高,尤其当二维封闭图形存在非规则外形时进行相似性搜索,难以获得准确的结果。
依据时间序列相似性搜索进行外形匹配算法研究,开始逐步被研究人员所接受。这类基于外形的方法能够解决非对称状态下的图形匹配问题,确保在统一距离度量标准下,克服数据类型变化所带来的各种问题,确保在更高的精度上获得分类结果。在相似性度量过程中,基于外形的搜索方式可以与基于范数距离、基于动态弯曲距离、基于编辑距离等多种差异性度量方法有效结合,避免形态的剧烈变化影响分类的准确性。在封闭二维图形的相似性匹配研究中,需要对封闭图形下新的度量模式、投影和比例缩放等实际问题进行分析,在确保不损失图形外部特点的情况下,排除细节中非主要特征产生的干扰。
在计算机大规模辅助设计等行业,进行封闭图的相似性匹配具有现实意义。早期对封闭二维图形的匹配过程中,需要进行含直线、圆弧线基本图形的拆解,最终获得对应的树状图。一般是采用广度优先的遍历算法对树结构进行单向搜索,确定在度量标准下合理的图形集,并映射成数据集,最终以数据集的形式传输给其他图形算法。
但是这类广度优先的遍历算法无法实现二维图形的相似性搜索,同时时间序列的时间维度无法得到解决,图形旋转在度量过程中的有效性不能确保,对于不同复杂度的时间序列不能给出度量标准,影响二维图形时间维度或属性的确定。
发明内容
本发明所要解决的技术问题在于针对上述现有技术的不足,提供一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,以解决上述背景技术中提出的现有的图形相似性搜索方法无法实现二维图形的相似性搜索,同时时间序列的时间维度武大得到解决,从而不能确保旋转方式的有效性,还不能给出复杂度时间度量标准,影响二维图形时间维度或属性的确定问题。
为解决上述技术问题,本发明采用的技术方案是:
一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,包括以下步骤:
S1、观测封闭图形,获得封闭图形的时间序列,其中的自变量为观测轨迹,因变量是观测点到封闭图形沿弧线观测获得的距离;
S2、设定两个时间序列的复杂度差异性CO;
S3、设定复杂度时间度量标准TSD;
S4、采用穷近法对S3中的复杂度时间度量标准完成近邻搜索;
S5、采用三角不等式对距离值进行修正;
S6、在系列化的索引数据结构中获得二维封闭图的相对位置,从相对位置对应的时间序列集中,获得与目标对应的相似性时间序列。
做为优选的,在S2中,复杂度差异性是将两个时间序列S和T复杂度的差别,设定为现有距离度量的差异因子OF(S,T),ED(S,T)是欧氏距离,两个时间序列实际复杂度差异性定义为:
CO(S,T)=ED(S,T)×OF(S,T)。
做为优选的,所述差异因子OF确保最终度量的合理性,欧氏距离只起到在标准坐标系内的度量作用,而差异因子OF检验时间序列相对度量的作用,OF将具有不同复杂性的时间序列二次分类,当所有时间序列都具有相同复杂度差异性的情况下,CO等同于欧氏距离。
做为优选的,所述复杂度时间度量标准TSD是时间序列T的复杂度时间度量,用于标识在时间尺度下序列复杂度的差异性,全面度量波动时间序列,包括直线型时间序列:
Figure GDA0003395125340000031
做为优选的,所述复杂度时间度量标准TSD在采用穷近法的近邻搜索中,要与时间序列典型数据库进行全部比较。
本发明与现有技术相比具有以下优点:
本发明首先从二维封闭图的相似性特征、相似性的内涵以及相似性的性质出发,同时给出了基于复杂度不变性度量和复杂度估计图形相似度的计算方法;其次,借助图的方式对图形的相似性特征进行描述,并提出了统一的图形特征编码方式,以此实现图形由图形到计数的转换;而且,提出了一种具有层次性的、以图形特征编码为基础、以相似度为依据的图形相似性分类算法;最后,将该方法应用于基于二维的图形模式识别中,以多个时间序列的降维过程为例说明了该方法的具体应用环节,与传统的识别方法相比较,该方法在二维图形的识别过程中,可以在模式的搜索以及模式的匹配速度等几个方面取得了较大进展,同时这种基于多个相似性特征的图形识别方法具有更强的识别能力。
附图说明
图1是本发明整体方法流程图;
图2从圆的视角观察等边三角形,获得相应时间序列的计算过程。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供一种技术方案:一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,包括以下步骤:
S1、观测封闭图形,获得封闭图形的时间序列,其中的自变量为观测轨迹,因变量是观测点到封闭图形沿弧线观测获得的距离;
如图2所示,从圆的视角观察等边三角形,获得相应时间序列的计算过程。
其中,弧长
Figure GDA0003395125340000051
其中C是周长,K为弧度
圆角度
Figure GDA0003395125340000052
交点
Figure GDA0003395125340000053
长度z=r-A。
示例中,弧长L是时间序列对应的X值,长度z是时间序列对应的Y值。
S2、设定两个时间序列的复杂度差异性CO;复杂度差异性是将两个时间序列S和T复杂度的差别,设定为现有距离度量的差异因子OF(S,T),ED(S,T)是欧氏距离,两个时间序列实际复杂度差异性定义为:
CO(S,T)=ED(S,T)×OF(S,T)
所述差异因子OF确保最终度量的合理性,
Figure GDA0003395125340000054
欧氏距离只起到在标准坐标系内的度量作用,而差异因子OF检验时间序列相对度量的作用,OF将具有不同复杂性的时间序列二次分类,当所有时间序列都具有相同复杂度差异性的情况下,CO等同于欧氏距离;
S3、设定复杂度时间度量标准TSD;复杂度时间度量标准TSD是时间序列T的复杂度时间度量,用于标识在时间尺度下序列复杂度的差异性,全面度量波动时间序列,包括直线型时间序列:
Figure GDA0003395125340000061
期望精度增益:
Figure GDA0003395125340000062
大于1的增益值epg表明OF将优于欧几里德距离;而小于1的增益值则相反;
S4、采用穷近法对S3中的复杂度时间度量标准完成近邻搜索;所述复杂度时间度量标准TSD在采用穷近法的近邻搜索中,要与时间序列典型数据库全部进行比较;
S5、采用三角不等式对距离值进行修正;
S6、在系列化的索引数据结构中获得二维相对图的封闭位置,从相对位置对应的时间序列集中,获得与目标对应的相似性时间序列。
综上,在具体实施过程中分一下几个阶段;
在具体的实施过程中,需要分成多个阶段和步骤实现。
第一阶段:对二维图所对应的时间序列数据进行索引,建立相应的多维索引结构,具体是将二维图形投影到单维时间序列,对时间序列的原始值进行平移,获得时间序列中的最低值,
Dreduceddata(A,B)≤Doriginaldata(A,B)
其中,DreduceddataA,B代表最低值在X轴的的数据,Doriginaldata(A,B)代表原始数据,A和B分别代表两类时间序列,由于CO只能大于或等于ED,如果无法获得大于ED的值,就需要采用ED进行表示,然后采用反向旋转的方法,对二维图进行二次索引,获得相应的时间序列,并对原始空间进行重新度量,如果索引图对应的CO值与ED值完全一致,时间序列索引过程将变成穷尽搜索,需要对涉及时间序列的下界距离进行预先估计,利用三角不等式需要计算Q序列值和经典时间序列之间的距离,从最近邻的角度出发,为了确保所获得的距离值符合图形放大或变化的需要,需要计算Q序列与标准多边形图形之间的距离D(Q,Ci),利用D(Q,Ci)和三角不等式性质,确定Q在距离实例库中的实际位置和距离。
其中,距离的定位方式是使用三角形不等式:
D(Ci,Cj)≤D(Ci,Q)+D(Q,Cj)
第二阶段,将现有的二维图逐步与典型的多边形二维图进行比较,明确现有图形距离的范围:先建立典型多边形的距离表,如果当用于查询的的Ci时间序列和Cj时间序列之间的距离是Ci与Q之间距离的两倍以上,Cj归类到则以Ci确定的距离位置,设计常量距离表格,分类时不需要进行距离计算,只需查找常量距离表格。这是因为D(Ci,Cj)是已知的量,其中包含了所有训练实例之间的距离。
第三阶段:采用三角不等式对距离值进行修正,具体是在OF空间中进行实际的度量定位,度量索引可以通过更改排列方式来计算OF(Q,Ci)的距离,确保实例Ci进入最小值区间:用n=CF(Ci,Cj)来对D(Q,Cj)的计算结果进行调整,为了使算法适应于TSD,进行相应的修改:将数据库所存储的距离实例进行标识,存储相应的复杂性估计OF。
空间开销存储的复杂度估计是O(m),其中M是数据库对象的数量,可以用于大多数典型开销小型索引数据结构,为了确保这种修剪的紧密性,认可TSD下的三角不等式的有效性,最终采用随机数据库获得系列化的索引数据结构。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,
其特征在于,包括以下步骤:
S1、观测封闭图形,获得封闭图形的时间序列,其中的自变量为观测轨迹,因变量是观测点到封闭图形沿弧线观测获得的距离;
S2、设定两个时间序列的复杂度差异性CO;
S3、设定复杂度时间度量标准TSD;
S4、采用穷近法对S3中的复杂度时间度量标准完成近邻搜索;
S5、采用三角不等式对距离值进行修正;
S6、在系列化的索引数据结构中获得二维封闭图的相对位置,从相对位置对应的时间序列集中,获得与目标对应的相似性时间序列。
2.根据权利要求1所述的一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,其特征在于,在S2中,复杂度差异性是将两个时间序列S和T复杂度的差别,设定为现有距离度量的差异因子OF(S,T),ED(S,T)是欧氏距离,两个时间序列实际复杂度差异性定义为:
CO(S,T)=ED(S,T)×OF(S,T)。
3.根据权利要求2所述的一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,其特征在于,所述差异因子OF确保最终度量的合理性,欧氏距离只起到在标准坐标系内的度量作用,而差异因子OF检验时间序列相对度量的作用,OF将具有不同复杂性的时间序列二次分类,当所有时间序列都具有相同复杂度差异性的情况下,CO等同于欧氏距离。
4.根据权利要求1所述的一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,其特征在于,所述复杂度时间度量标准TSD是时间序列T的复杂度时间度量,用于标识在时间尺度下序列复杂度的差异性,全面度量波动时间序列,包括直线型时间序列:
Figure FDA0003395125330000021
5.根据权利要求1所述的一种基于时间序列复杂度差异性的封闭图形相似性搜索方法,其特征在于,所述复杂度时间度量标准TSD在采用穷近法的近邻搜索中,要与时间序列典型数据库进行全部比较。
CN201910826882.XA 2019-09-03 2019-09-03 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法 Expired - Fee Related CN110647647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910826882.XA CN110647647B (zh) 2019-09-03 2019-09-03 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910826882.XA CN110647647B (zh) 2019-09-03 2019-09-03 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法

Publications (2)

Publication Number Publication Date
CN110647647A CN110647647A (zh) 2020-01-03
CN110647647B true CN110647647B (zh) 2022-02-08

Family

ID=69010132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910826882.XA Expired - Fee Related CN110647647B (zh) 2019-09-03 2019-09-03 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法

Country Status (1)

Country Link
CN (1) CN110647647B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783851B (zh) * 2020-06-16 2023-08-11 西安外事学院 一种基于中枢点的时间序列趋势动态分段方法
CN111783567B (zh) * 2020-06-16 2023-07-25 西安外事学院 一种基于极值标识的时间序列分类方法
CN116912534B (zh) * 2023-09-14 2023-12-22 中国地质大学(武汉) 自适应搜索匹配的热液矿床成矿系统空间结构识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130996A1 (en) * 2001-12-21 2003-07-10 International Business Machines Corporation Interactive mining of time series data
US20140195474A1 (en) * 2012-12-18 2014-07-10 Xavier Anguera Miró Method and system for improved pattern matching
CN104462217A (zh) * 2014-11-09 2015-03-25 浙江大学 一种基于分段统计近似表示的时间序列相似性度量方法
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
WO2017187401A1 (en) * 2016-04-29 2017-11-02 Ecole Polytechnique Federale De Lausanne (Epfl) System, device, and method for contextual knowledge retrieval and display
US20180025303A1 (en) * 2016-07-20 2018-01-25 Plenarium Inc. System and method for computerized predictive performance analysis of natural language
CN109359135A (zh) * 2018-09-04 2019-02-19 河海大学 一种基于分段权重的时间序列相似性搜索方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN110069134A (zh) * 2019-03-29 2019-07-30 北京大学 一种利用无线电射频信号还原手部空中移动轨迹的方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130996A1 (en) * 2001-12-21 2003-07-10 International Business Machines Corporation Interactive mining of time series data
US20140195474A1 (en) * 2012-12-18 2014-07-10 Xavier Anguera Miró Method and system for improved pattern matching
CN104462217A (zh) * 2014-11-09 2015-03-25 浙江大学 一种基于分段统计近似表示的时间序列相似性度量方法
WO2017187401A1 (en) * 2016-04-29 2017-11-02 Ecole Polytechnique Federale De Lausanne (Epfl) System, device, and method for contextual knowledge retrieval and display
US20180025303A1 (en) * 2016-07-20 2018-01-25 Plenarium Inc. System and method for computerized predictive performance analysis of natural language
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
CN109359135A (zh) * 2018-09-04 2019-02-19 河海大学 一种基于分段权重的时间序列相似性搜索方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN110069134A (zh) * 2019-03-29 2019-07-30 北京大学 一种利用无线电射频信号还原手部空中移动轨迹的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于斜率偏离的时间序列相似性搜索方法研究;梁建海等;《计算机应用研究》;20100115(第01期);54-55 *
时间序列模式匹配技术研究;张勇;《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》;20130715;A002-27 *

Also Published As

Publication number Publication date
CN110647647A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN110647647B (zh) 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法
CN111080684B (zh) 一种点邻域尺度差异描述的点云配准方法
CN108376408B (zh) 一种基于曲率特征的三维点云数据快速加权配准方法
Schlegel et al. HBST: A hamming distance embedding binary search tree for feature-based visual place recognition
CN111831660B (zh) 度量空间划分方式评价方法、装置、计算机设备及存储介质
CN111553409A (zh) 一种基于体素形状描述符的点云识别方法
Song et al. Solutions for processing k nearest neighbor joins for massive data on mapreduce
CN109000656B (zh) 基于空间聚类的水下地形匹配导航适配区选择方法
CN105654483A (zh) 三维点云全自动配准方法
Li et al. Spatio-temporal trajectory simplification for inferring travel paths
CN111652855A (zh) 一种基于存活概率的点云精简方法
CN105574265B (zh) 面向模型检索的装配体模型定量描述方法
CN104850712A (zh) 实物表面采样数据拓扑邻域查询方法
CN117668583A (zh) 一种基于人工智能投资研究的投资优化方法
CN112766385B (zh) 一种众源矢量线数据几何匹配与属性融合方法
CN109035311A (zh) 一种弯骨骨折自动配准及内固定钢板预弯建模方法
Mustafic et al. A new method for improving content-based image retrieval using deep learning
CN114419294A (zh) 一种曲面变分阈值的自适应确定方法
Hasan et al. Piecemeal Clustering: a Self-Driven Data Clustering Algorithm
CN104978729A (zh) 一种基于数据感知的图像哈希方法
CN114547358A (zh) 一种多尺度特征融合的图像检索方法
Wu et al. Similar image retrieval in large-scale trademark databases based on regional and boundary fusion feature
CN116757025B (zh) 一种基于dxf格式的船舶舱室图形自动拾取方法
CN117131102B (zh) 一种在混合索引数据库中对相似时序数据高速检索的方法
CN118196327B (zh) 一种智能绿色建筑施工信息管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220208