CN114490797A - 一种时间序列的定性趋势分析方法和装置 - Google Patents

一种时间序列的定性趋势分析方法和装置 Download PDF

Info

Publication number
CN114490797A
CN114490797A CN202011155555.5A CN202011155555A CN114490797A CN 114490797 A CN114490797 A CN 114490797A CN 202011155555 A CN202011155555 A CN 202011155555A CN 114490797 A CN114490797 A CN 114490797A
Authority
CN
China
Prior art keywords
primitive
primitives
time series
time
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011155555.5A
Other languages
English (en)
Inventor
余彦
刘洋
陈远方
张利剑
魏小倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Machinery Equipment Research Institute
Original Assignee
Beijing Machinery Equipment Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Machinery Equipment Research Institute filed Critical Beijing Machinery Equipment Research Institute
Priority to CN202011155555.5A priority Critical patent/CN114490797A/zh
Publication of CN114490797A publication Critical patent/CN114490797A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种时间序列的定性趋势分析方法和装置,属于数据处理技术领域,解决了时间序列的时间间隔很大时很难准确判断时间序列在这段时间内的变化趋势的问题。该方法包括:将时间序列划分为多个最小基元;基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;计算各个分段数对应的基元与时间序列的拟合度指数,获取最大拟合度指数,以及根据最大拟合度指数确定最优分段数;重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于最优分段数;以及输出所有基元作为时间序列的分段线性表示结果,并根据分段线性表示结果确定时间序列的定性趋势。确定了时间序列在时间段内的变化趋势。

Description

一种时间序列的定性趋势分析方法和装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种时间序列的定性趋势分析方法和装置。
背景技术
在现代工业报警系统中,需要监控的过程变量数以千计,与这些过程变量相关联的过程变量数量则更为庞大,这些过程变量的时间序列数据具有“大容量、多样性、变化性、真实性、高价值”的特点。针对过程变量时间序列数据的特点,从大量时间序列数据中发掘属于同类典型模式的相似数据段,利用数据段的模式特性进行报警监控,将有助于更好地实现对工业过程运行状况的监控。
因此,在时间序列分析领域,定性的判断时间序列在一段时间内的变化趋势是一个关键的问题。但是当时间序列的时间间隔很大时,通过肉眼很难准确判断时间序列在这段时间内的变化趋势。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种时间序列的定性趋势分析方法和装置,用以解决当时间序列的时间间隔很大时,通过肉眼很难准确判断时间序列在这段时间内的变化趋势的问题。
一方面,本发明实施例提供了一种时间序列的定性趋势分析方法,包括:将待处理的时间序列划分为多个最小基元,其中,所述最小基元为单位采样时间内的线段;基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;计算各个分段数对应的基元与所述时间序列的拟合度指数,获取最大拟合度指数,以及根据所述最大拟合度指数确定最优分段数;重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于所述最优分段数;以及输出所有基元作为所述时间序列的分段线性表示结果,并根据所述分段线性表示结果确定所述时间序列的定性趋势。
上述技术方案的有益效果如下:通过本发明实施例的时间序列的定性趋势分析方法,将时间序列用一系列的基元来分段线性表示,并能够确定或准确判断时间序列在这段时间内的变化趋势。
基于上述方法的进一步改进,将时间序列划分为多个最小基元进一步包括:将以时间t为自变量的数据规范化为[0,1]区间内的值以获取以下所述时间序列T:T=[x(t)],t=1,2,…,n,其中,x(t)为样本点;将所述时间序列划分为n-1个最小基元,其中,所述最小基元分别为:T[1,2],T[2,3],…,T[n-1,n]。
基于上述方法的进一步改进,基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并进一步包括:从所述多个最小基元的中间基元中选择任一基元,计算所述任一基元与左侧相邻基元的第一融合误差和所述任一基元与右侧相邻基元的第二融合误差;将所述第一融合误差与所述第二融合误差相比较,以确定融合误差小的左相邻基元或右相邻基元;以及将所述任一基元与融合误差小的所述左相邻基元或所述右相邻基元合并。
基于上述方法的进一步改进,计算所述任一基元与左侧相邻基元的第一融合误差和所述任一基元与右侧相邻基元的第二融合误差进一步包括:所述任一基元为第j个基元T[j,j+1]、其左相邻基元为T[j-1,j]和其右相邻基元为T[j+1,j+2];计算所述时间序列T在T[j-1,j+1]内的第一方差αjl和在T[j,j+2]内的第二方差为αjr;基于所述多个最小基元内的所有样本点通过最小二乘法获取回归直线;计算所述第j个基元与所述左相邻基元合并后的所有样本点与所述回归直线的距离之和作为第一拟合误差εjl,并且计算所述第j个基元与所述右相邻基元合并后的所有样本点与所述回归直线的距离之和作为第二拟合误差εjr;以及计算所述第一方差与所述第一拟合误差的乘积αjlεjl作为所述第一融合误差以及所述第二方差与所述第二拟合误差的乘积αjrεjr作为所述第二融合误差。
基于上述方法的进一步改进,计算各个分段数对应的基元与所述时间序列的拟合度指数进一步包括:通过先验知识确定时间序列T的最大分段数为K,其中,分段数的取值范围为S={1,2,…,K};以及通过以下公式计算拟合度指数Fitness:
Figure BDA0002742668730000031
其中,I(·)表示指示函数,如果括号内的条件成立,该函数的取值为1,否则为0;符号|Ci|表示集合Ci中所含元素的个数,其中,通过DBSCAN密度聚类算法对样本点进行分类,所述集合Ci是由每一类中的样本点构成的集合;d(t)表示某个基元内的样本点x(t)到基元对应的回归直线的距离,其中,基于合并后的基元与所述多个最小基元内的所有样本点通过最小二乘法获取回归直线;以及γi为预先设定的距离阈值。
上述技术方案的有益效果如下:通过计算拟合度指数,能够剔除时间序列中的异常数据,以便于提高拟合效果。
基于上述方法的进一步改进,根据所述最大拟合度指数确定最优分段数进一步包括:当拟合度指数Fitness的值越大时,更多的样本点分布在所述回归直线附近;以及根据获取的拟合度指数Fitness的最大值,确定所述最优分段数kopt
上述技术方案的有益效果如下:根据拟合度指数的值越大来确定的最优分段数,拟合效果达到最佳,以便于准确判断时间序列在这段时间内的变化趋势。
基于上述方法的进一步改进,输出所有基元作为所述时间序列的分段线性表示结果进一步包括:在显示器上显示所述多个最小基元和合并完成后的基元作为所述时间序列的分段线性表示结果。
基于上述方法的进一步改进,所述时间序列为温度、电流、电压、流量、压力或功率时间序列。
基于上述方法的进一步改进,时间序列的定性趋势分析方法进一步包括:确定第一时间序列和第二时间序列的定性趋势;以及根据所述第一时间序列的定性趋势和所述第二时间序列的定性趋势,确定所述第一时间序列与所述第二时间序列之间的关系,其中,所述关系包括正比例关系和反比例关系。
另一方面,本发明实施例提供了一种时间序列的定性趋势分析装置,包括:时间序列分割模块,用于将待处理的时间序列划分为多个最小基元,其中,所述最小基元为单位采样时间内的线段;合并模块,用于基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;最优分段数确定模块,用于计算各个分段数对应的基元与所述时间序列的拟合度指数,获取最大拟合度指数,以及根据所述最大拟合度指数确定最优分段数;所述合并模块,还用于在从所述最优分段数确定模块接收所述最优分段数之后,重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于所述最优分段数;以及结果确定模块,用于输出所有基元作为所述时间序列的分段线性表示结果,并根据所述分段线性表示结果确定所述时间序列的定性趋势。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、将时间序列用一系列的基元来分段线性表示,能够判断时间序列在这段时间内的变化趋势。
2、通过计算拟合度指数,能够剔除时间序列中的异常数据,以便于提高拟合效果。
3、通过计算机的强大计算能力获取拟合度指数的最大值并根据拟合度指数的最大值来确定的最优分段数,拟合效果达到最佳,以便于准确判断时间序列在这段时间内的变化趋势。
4、利用各个基元的变化趋势来判断时间序列的定性趋势,避免了肉眼识别的方法带来的精度不高和效率低下的问题,更能适应大数据分析的任务需求。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为根据本发明实施例的时间序列的定性趋势分析方法的流程图。
图2为根据本发明实施例的拟合度指数随分段数的变化趋势。
图3为根据本发明实施例的时间序列的分段线性表示结果。
图4为根据本发明实施例的时间序列的定性趋势分析装置的框图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的一个具体实施例,公开了一种时间序列的定性趋势分析方法。如图1所示。时间序列的定性趋势分析方法包括:步骤S102,将待处理的时间序列划分为多个最小基元,其中,最小基元为单位采样时间内的线段;步骤S104,基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;步骤S106,计算各个分段数对应的基元与时间序列的拟合度指数,获取最大拟合度指数,以及根据最大拟合度指数确定最优分段数;步骤S108,重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于最优分段数;以及步骤S110,输出所有基元作为时间序列的分段线性表示结果,并根据分段线性表示结果确定时间序列的定性趋势。
与现有技术相比,本实施例提供的将时间序列用一系列的基元来分段线性表示,能够判断时间序列在这段时间内的变化趋势,从而能够避免在时间序列的时间间隔很大时,无法通过肉眼准确判断时间序列在这段时间内的变化趋势的问题。
下文中,将参考图1至图3,对时间序列的定性趋势分析方法进行详细描述。
参考图1,时间序列的定性趋势分析方法,包括:步骤S102,将待处理的时间序列划分为多个最小基元,其中,最小基元为单位采样时间内的线段。时间序列为温度、电流、电压、流量、压力或功率时间序列等。具体地,将时间序列划分为多个最小基元进一步包括:将以时间t为自变量的数据规范化为[0,1]区间内的值以获取以下时间序列T:T=[x(t)],t=1,2,…,n,其中,x(t)为样本点,例如,可以通过以下公式进行数据规范化:
Figure BDA0002742668730000061
其中,yi为第i个样本点x(t)的规化范的值;
将时间序列划分为n-1个最小基元,其中,最小基元分别为:
T[1,2],T[2,3],…,T[n-1,n]。
在将时间序列划分为多个最小基元之后,进入步骤S104,基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并。具体地,基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并进一步包括:从多个最小基元的中间基元中选择任一基元,计算任一基元与左侧相邻基元的第一融合误差和任一基元与右侧相邻基元的第二融合误差;将第一融合误差与第二融合误差相比较,以确定融合误差小的左相邻基元或右相邻基元;以及将任一基元与融合误差小的左相邻基元或右相邻基元合并。计算任一基元与左侧相邻基元的第一融合误差和任一基元与右侧相邻基元的第二融合误差进一步包括:任一基元为第j个基元T[j,j+1]、其左相邻基元为T[j-1,j]和其右相邻基元为T[j+1,j+2];计算时间序列T在T[j-1,j+1]内的第一方差αjl和在T[j,j+2]内的第二方差为αjr;基于多个最小基元内的所有样本点通过最小二乘法获取回归直线;计算第j个基元与左相邻基元合并后的所有样本点与回归直线的距离之和作为第一拟合误差εjl,并且计算第j个基元与右相邻基元合并后的所有样本点与回归直线的距离之和作为第二拟合误差εjr;以及计算第一方差与第一拟合误差的乘积αjlεjl作为第一融合误差以及第二方差与第二拟合误差的乘积αjrεjr作为第二融合误差。
将任一基元与左相邻基元或右相邻基元合并后,进入步骤S106,计算各个分段数对应的基元与时间序列的拟合度指数,获取最大拟合度指数,以及根据最大拟合度指数确定最优分段数。具体地,计算各个分段数对应的基元与时间序列的拟合度指数进一步包括:通过先验知识确定时间序列T的最大分段数为K,其中,分段数的取值范围为S={1,2,…,K};以及通过以下公式计算拟合度指数Fitness:
Figure BDA0002742668730000071
其中,I(·)表示指示函数,如果括号内的条件成立,该函数的取值为1,否则为0;符号|Ci|表示集合Ci中所含元素的个数,其中,通过DBSCAN密度聚类算法对样本点进行分类,集合Ci是由每一类中的样本点构成的集合;d(t)表示某个基元内的样本点x(t)到基元对应的回归直线的距离,其中,基于合并后的基元与多个最小基元内的所有样本点通过最小二乘法获取回归直线;以及γi为预先设定的距离阈值。在实施例中,根据最大拟合度指数确定最优分段数进一步包括:当拟合度指数Fitness的值越大时,更多的样本点分布在回归直线附近;以及根据获取的拟合度指数Fitness的最大值,确定最优分段数kopt
在根据最大拟合度指数确定最优分段数,步骤S108,重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于最优分段数。
任一基元与左相邻基元或右相邻基元合并的步骤停止后,进入在步骤S110,输出所有基元作为时间序列的分段线性表示结果,并根据分段线性表示结果确定时间序列的定性趋势。输出所有基元作为时间序列的分段线性表示结果进一步包括:在显示器上显示多个最小基元和合并完成后的基元作为时间序列的分段线性表示结果。
另外,时间序列的定性趋势分析方法还包括:确定第一时间序列和第二时间序列的定性趋势;以及根据第一时间序列的定性趋势和第二时间序列的定性趋势,确定第一时间序列与第二时间序列之间的关系,其中,关系包括正比例关系和反比例关系。
与现有技术相比,通过本实施例提供的时间序列的定性趋势分析方法能够确定不同数据之间的正比例、反比例或不变等关系,以便于在信号分析、模式匹配和数据挖掘方面的应用。
下文中,参考图2和图3,以具体实例的方式对时间序列的定性趋势分析方法进行详细描述。
时间序列的定性趋势分析方法又称为基于分段线性表示的时间序列定性趋势分析方法,具体包括以下步骤:
步骤S1.将时间序列划分为一系列的最小基元;
时间序列被定义为(时间序列已经规范化到0和1之间):
T=[x(t)],t=1,2,…,n.
将时间序列T用一系列的最小基元来线性表示,其中最小基元的数目为n-1,各个最小基元分别为:
T[1,2],T[2,3],…,T[n-1,n].
步骤S2.按照融合误差最小原则合并相邻的基元;
设时间序列T的第j-1,j,j+1个最小基元分别为T[j-1,j],T[j,j+1],T[j+1,j+2]。其中,时间序列T在T[j-1,j+1]内的方差为αjl,在T[j,j+2]内的方差为αjr。并且,时间序列T的T[j,j+1]基元与T[j-1,j]基元合并后的拟合误差为εjl,与T[j+1,j+2]基元合并后的拟合误差为εjr
如果αjlεjl的值小于αjrεjr的值,那么T[j,j+1]基元就与左相邻基元T[j-1,j]合并,否则就与右相邻基元T[j+1,j+2]合并;
步骤S3.设计拟合度指数来选择最优分段数;
选择一个合适的分段数取值范围。例如,通过先验知识确定时间序列T的最大分段数为K,那么合适的分段数取值范围就为S={1,2,…,K}。
设计拟合度指数Fitness,它的数学表达式为:
Figure BDA0002742668730000091
其中,I(·)表示指示函数,如果括号内的条件成立,该函数的取值为1,否则为0。符号|Ci|表示集合Ci中所含元素的个数;并且,集合Ci通过DBSCAN密度聚类算法得到,它是由每一类中的样本点构成的集合。d(t)表示某个基元内的样本点x(t)到该基元对应的回归直线的距离,其中回归直线由该基元内的所有样本点通过最小二乘法计算得到。γi为预先设定的距离阈值。拟合度指数Fitness的值越大就说明有更多的样本点分布在回归直线附近。也就是说,分段线性表示对原始时间序列的拟合效果越好。因此,最优的分段数kopt是使得拟合度指数Fitness的值最大。
步骤S4.重复执行步骤S2直到基元的数量等于最优的分段数。
按照步骤S2中的合并策略重复迭代合并相邻基元,直到基元的数目等于步骤S3中计算得到的最优分段数kopt。输出所有的基元作为原始时间序列的分段线性表示,通过判断各个基元的变化趋势,来确定时间序列的定性趋势;
至此,实现了时间序列的定性趋势的自动识别方法。
表1符号定义表
符号 符号的含义
T[a,b] 时间序列T从时刻a到时刻b的部分
K 时间序列T的最大分段数
C<sub>i</sub> 将时间序列T进行DBSCAN密度聚类以后形成的第i类
n 时间序列T样本数
d(t) 时间序列T的第t个样本x(t)到回归直线的距离
基于分段线性表示的时间序列定性趋势分析方法,解决了时间间隔过大时肉眼无法准确识别时间序列的定性趋势的问题。通过将时间序列用一系列的基元来分段线性表示,并利用各个基元的变化趋势来判断时间序列的定性趋势,避免了肉眼识别的方法带来的精度不高和效率低下的问题,更能适应大数据分析的任务需求。
本发明的另一个具体实施例,公开了一种时间序列的定性趋势分析装置。参考图4,时间序列的定性趋势分析装置包括:时间序列分割模块402,用于将待处理的时间序列划分为多个最小基元,其中,最小基元为单位采样时间内的线段;合并模块404,用于基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并,还用于在从最优分段数确定模块接收最优分段数之后,重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于最优分段数;最优分段数确定模块406,用于计算各个分段数对应的基元与时间序列的拟合度指数,获取最大拟合度指数,以及根据最大拟合度指数确定最优分段数;以及结果确定模块408,用于输出所有基元作为时间序列的分段线性表示结果,并根据分段线性表示结果确定时间序列的定性趋势。
间序列的定性趋势分析装置还包括多个其他模块,由于间序列的定性趋势分析装置与间序列的定性趋势分析方法相对应,所以为了避免赘述,省略了多个其他模块的详细描述。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、将时间序列用一系列的基元来分段线性表示,能够判断时间序列在这段时间内的变化趋势。
2、通过计算拟合度指数,能够剔除时间序列中的异常数据,以便于提高拟合效果。
3、通过计算机的强大计算能力获取拟合度指数的最大值并根据拟合度指数的最大值来确定的最优分段数,拟合效果达到最佳,以便于准确判断时间序列在这段时间内的变化趋势。
4、利用各个基元的变化趋势来判断时间序列的定性趋势,避免了肉眼识别的方法带来的精度不高和效率低下的问题,更能适应大数据分析的任务需求。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种时间序列的定性趋势分析方法,其特征在于,包括:
将待处理的时间序列划分为多个最小基元,其中,所述最小基元为单位采样时间内的线段;
基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;
计算各个分段数对应的基元与所述时间序列的拟合度指数,获取最大拟合度指数,以及根据所述最大拟合度指数确定最优分段数;
重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于所述最优分段数;以及
输出所有基元作为所述时间序列的分段线性表示结果,并根据所述分段线性表示结果确定所述时间序列的定性趋势。
2.根据权利要求1所述的时间序列的定性趋势分析方法,其特征在于,将时间序列划分为多个最小基元进一步包括:
将以时间t为自变量的数据规范化为[0,1]区间内的值以获取以下所述时间序列T:
T=[x(t)],t=1,2,…,n,其中,x(t)为样本点;
将所述时间序列划分为n-1个最小基元,其中,所述最小基元分别为:
T[1,2],T[2,3],…,T[n-1,n]。
3.根据权利要求1所述的时间序列的定性趋势分析方法,其特征在于,基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并进一步包括:
从所述多个最小基元的中间基元中选择任一基元,
计算所述任一基元与左侧相邻基元的第一融合误差和所述任一基元与右侧相邻基元的第二融合误差;
将所述第一融合误差与所述第二融合误差相比较,以确定融合误差小的左相邻基元或右相邻基元;以及
将所述任一基元与融合误差小的所述左相邻基元或所述右相邻基元合并。
4.根据权利要求2所述的时间序列的定性趋势分析方法,其特征在于,计算所述任一基元与左侧相邻基元的第一融合误差和所述任一基元与右侧相邻基元的第二融合误差进一步包括:
所述任一基元为第j个基元T[j,j+1]、其左相邻基元为T[j-1,j]和其右相邻基元为T[j+1,j+2];
计算所述时间序列T在T[j-1,j+1]内的第一方差αjl和在T[j,j+2]内的第二方差为αjr
基于所述多个最小基元内的所有样本点通过最小二乘法获取回归直线;
计算所述第j个基元与所述左相邻基元合并后的所有样本点与所述回归直线的距离之和作为第一拟合误差εjl,并且计算所述第j个基元与所述右相邻基元合并后的所有样本点与所述回归直线的距离之和作为第二拟合误差εjr;以及
计算所述第一方差与所述第一拟合误差的乘积αjlεjl作为所述第一融合误差以及所述第二方差与所述第二拟合误差的乘积αjrεjr作为所述第二融合误差。
5.根据权利要求2所述的时间序列的定性趋势分析方法,其特征在于,计算各个分段数对应的基元与所述时间序列的拟合度指数进一步包括:
通过先验知识确定时间序列T的最大分段数为K,其中,分段数的取值范围为S={1,2,…,K};以及
通过以下公式计算拟合度指数Fitness:
Figure FDA0002742668720000021
其中,I(·)表示指示函数,如果括号内的条件成立,该函数的取值为1,否则为0;
符号|Ci|表示集合Ci中所含元素的个数,其中,通过DBSCAN密度聚类算法对样本点进行分类,所述集合Ci是由每一类中的样本点构成的集合;
d(t)表示某个基元内的样本点x(t)到基元对应的回归直线的距离,其中,基于合并后的基元与所述多个最小基元内的所有样本点通过最小二乘法获取回归直线;以及
γi为预先设定的距离阈值。
6.根据权利要求5所述的时间序列的定性趋势分析方法,其特征在于,根据所述最大拟合度指数确定最优分段数进一步包括:
当拟合度指数Fitness的值越大时,更多的样本点分布在所述回归直线附近;以及
根据获取的拟合度指数Fitness的最大值,确定所述最优分段数kopt
7.根据权利要求5所述的时间序列的定性趋势分析方法,其特征在于,输出所有基元作为所述时间序列的分段线性表示结果进一步包括:
在显示器上显示所述多个最小基元和合并完成后的基元作为所述时间序列的分段线性表示结果。
8.根据以上权利要求1-7中的任一项所述的时间序列的定性趋势分析方法,其特征在于,所述时间序列为温度、电流、电压、流量、压力或功率时间序列。
9.根据以上权利要求8中的任一项所述的时间序列的定性趋势分析方法,其特征在于,
确定第一时间序列和第二时间序列的定性趋势;以及
根据所述第一时间序列的定性趋势和所述第二时间序列的定性趋势,确定所述第一时间序列与所述第二时间序列之间的关系,其中,所述关系包括正比例关系和反比例关系。
10.一种时间序列的定性趋势分析装置,其特征在于,包括:
时间序列分割模块,用于将待处理的时间序列划分为多个最小基元,其中,所述最小基元为单位采样时间内的线段;
合并模块,用于基于相邻基元的融合误差最小原则,将任一基元与左相邻基元或右相邻基元合并;
最优分段数确定模块,用于计算各个分段数对应的基元与所述时间序列的拟合度指数,获取最大拟合度指数,以及根据所述最大拟合度指数确定最优分段数;
所述合并模块,还用于在从所述最优分段数确定模块接收所述最优分段数之后,重复执行将任一基元与左相邻基元或右相邻基元合并的步骤,直到基元的数量等于所述最优分段数;以及
结果确定模块,用于输出所有基元作为所述时间序列的分段线性表示结果,并根据所述分段线性表示结果确定所述时间序列的定性趋势。
CN202011155555.5A 2020-10-26 2020-10-26 一种时间序列的定性趋势分析方法和装置 Pending CN114490797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011155555.5A CN114490797A (zh) 2020-10-26 2020-10-26 一种时间序列的定性趋势分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011155555.5A CN114490797A (zh) 2020-10-26 2020-10-26 一种时间序列的定性趋势分析方法和装置

Publications (1)

Publication Number Publication Date
CN114490797A true CN114490797A (zh) 2022-05-13

Family

ID=81470254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011155555.5A Pending CN114490797A (zh) 2020-10-26 2020-10-26 一种时间序列的定性趋势分析方法和装置

Country Status (1)

Country Link
CN (1) CN114490797A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781278A (zh) * 2022-06-17 2022-07-22 天津理工大学 一种基于数据驱动的机电设备寿命预测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781278A (zh) * 2022-06-17 2022-07-22 天津理工大学 一种基于数据驱动的机电设备寿命预测方法及系统

Similar Documents

Publication Publication Date Title
CN111931868B (zh) 时间序列数据异常检测方法和装置
US6507669B1 (en) Method of selecting clusters of items using a fuzzy histogram analysis
Bulnes et al. An efficient method for defect detection during the manufacturing of web materials
CN116188475B (zh) 一种外观缺陷自动光学检测的智慧控制方法、系统及介质
CN110333962B (zh) 一种基于数据分析预测的电子元器件故障诊断模型
CN112766301B (zh) 一种采油机示功图相似性判断方法
Graß et al. Unsupervised anomaly detection in production lines
CN111340086A (zh) 无标签数据的处理方法、系统、介质及终端
US20230385699A1 (en) Data boundary deriving system and method
CN114490797A (zh) 一种时间序列的定性趋势分析方法和装置
CN117152119A (zh) 一种基于图像处理的型材瑕疵视觉检测方法
US10043108B2 (en) Method and apparatus for detecting and classifying active matrix organic light emitting diode panel
Keats et al. Statistical process control scheme design
CN115485740A (zh) 异常晶片图像分类
Zhu et al. Profile Abstract: An Optimization-based Subset Selection and Summarization Method for Profile Data Mining
CN108268467B (zh) 一种基于属性的异常数据检测方法和装置
CN107067034B (zh) 一种快速识别红外光谱数据分类的方法及系统
Zhang et al. Determining statistical process control baseline periods in long historical data streams
Klyachkin et al. Analysis of stable functioning of objects using machine learning
CN113515554A (zh) 用于不规则采样的时间序列的异常检测方法和系统
CN114580982B (zh) 一种工业设备的数据质量的评估方法、装置及设备
Madrakhimov et al. Data preprocessing on input
CN111626586B (zh) 数据质量检测方法、装置、计算机设备和存储介质
CN117135663A (zh) 基站节能指标数据的异常识别方法、装置、计算机设备和存储介质
US11763446B2 (en) Wafer bin map based root cause analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination