CN111104438A - 时间序列的周期性确定方法、装置及电子设备 - Google Patents

时间序列的周期性确定方法、装置及电子设备 Download PDF

Info

Publication number
CN111104438A
CN111104438A CN201911149306.2A CN201911149306A CN111104438A CN 111104438 A CN111104438 A CN 111104438A CN 201911149306 A CN201911149306 A CN 201911149306A CN 111104438 A CN111104438 A CN 111104438A
Authority
CN
China
Prior art keywords
time
sub
similarity
time sequence
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911149306.2A
Other languages
English (en)
Inventor
胡悦
邱春武
李涛
高鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sina Technology China Co Ltd
Original Assignee
Sina Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sina Technology China Co Ltd filed Critical Sina Technology China Co Ltd
Priority to CN201911149306.2A priority Critical patent/CN111104438A/zh
Publication of CN111104438A publication Critical patent/CN111104438A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种时间序列的周期性确定方法、装置及电子设备,以解决相关技术中采用人工识别方式导致的效率、准确度以及可靠性低的问题。所述方法包括:基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。

Description

时间序列的周期性确定方法、装置及电子设备
技术领域
本申请涉及数据挖掘领域,尤其涉及一种时间序列的周期性确定方法、装置及电子设备。
背景技术
时间序列是数据分析中常见的一种依照时间先后顺序构建的有序数据集。时间序列周期性的判别是时间序列数据分析中的一项重要内容,通过确定时间序列的周期性特征,可以确定后续采用的数据处理方法,以确保数据分析和数据处理的正确性和可靠性。
相关技术中,通常采用人工识别的方式,即由业务人员绘制时间序列图,通过观察时间序列图来判断时间序列是否具有周期性特征,或者,依据对不同业务的不同统计指标历史数据的积累实现对同类时间序列的周期性进行判断。然而,人工识别的方式效率低,需要耗费大量的时间和人力成本,并且主要依赖于业务人员的经验,准确度和可靠性低。
发明内容
本申请实施例提供一种时间序列的周期性确定方法、装置及电子设备,以解决相关技术中采用人工识别方式导致的效率、准确度以及可靠性低的问题。
本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种时间序列的周期性确定方法,包括:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
可选地,所述基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度,包括:
对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于所述动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系;
基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离;
基于所述规整路径距离确定所述两个子时间序列之间的相似度。
可选地,在所述基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度之前,对所述时间序列进行ADF单位根检验;以及,根据ADF单位根检验结果判定所述时间序列为非平稳的时间序列。
可选地,所述方法还包括:
若根据ADF单位根检验结果判定所述时间序列为平稳的时间序列,则确定所述时间序列不具有周期性特征。
可选地,所述基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征,包括:
基于所述时间序列中每两个时序相邻的子时间序列之间的相似度,确定所述时序相邻的子时间序列之间的相似度特征值,所述相似度特征值包括各相似度的平均值、中位数、方差中的一者或多者;
基于所述相似度特征值确定所述时间序列是否具有周期性特征。
第二方面,本申请实施例还提供一种时间序列的周期性确定装置,包括:
划分模块,用于基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
计算模块,用于基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
第一确定模块,用于基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
可选地,所述计算模块具体用于:
对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于所述动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系;
基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离;
基于所述规整路径距离确定所述两个子时间序列之间的相似度。
可选地,所述装置还包括:
检验模块,用于对所述时间序列进行ADF单位根检验,若根据ADF单位根检验结果判定所述时间序列为非平稳的时间序列,则触发所述计算模块。
可选地,所述装置还包括:
第二确定模块,用于若所述检验模块根据ADF单位根检验结果判定所述时间序列为平稳的时间序列,则确定所述时间序列不具有周期性特征。
可选地,所述第一确定模块具体用于:
基于所述时间序列中每两个时序相邻的子时间序列之间的相似度,确定所述时序相邻的子时间序列之间的相似度特征值,所述相似度特征值包括各相似度的平均值、中位数、方差中的一者或多者;
基于所述相似度特征值确定所述时间序列是否具有周期性特征。
第三方面,本申请实施例还提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过基于预设的时间间隔将时间序列划分为多个子时间序列,基于动态时间规划算法计算时序相邻的子时间序列之间的相似度,通过对时序相邻的子时间序列之间的相似度确定时间序列是否具有周期性特征,可以实现对时间序列的周期性特征的自动化判断,相比于相关技术的人工识别方式,效率、准确度以及可靠性更高,且解决了依赖业务人员经验导致的无法对新增业务、指标等的时间序列进行周期性判断的问题,具有普遍适用性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种时间序列的周期性确定方法的流程图。
图2为本申请实施例提供的另一种时间序列的周期性确定方法的流程图。
图3为本申请实施例提供的一种时间序列中时序相邻的两个子时间序列在动态规整前的示意图。
图4为本申请实施例提供的一种时间序列中时序相邻的两个子时间序列在动态规整后的示意图。
图5为本申请实施例提供的另一种时间序列的周期性确定方法的流程图。
图6为本申请实施例提供的一种时间序列的周期性确定装置的框图。
图7为本申请实施例提供的另一种时间序列的周期性确定装置的框图。
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
请参考图1,图1示出了本申请实施例提供的一种时间序列的周期性确定方法的流程图。如图1所示,该方法可以包括如下步骤:
S101、基于预设的时间间隔将待分析的时间序列划分为多个子时间序列。
其中,时间间隔可以根据所应用的业务场景自定义设置。
S102、基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度。
S103、基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
考虑到具有周期性特征的时间序列通常在相同的时间间隔里存在相似的波动,因而可基于时间序列中相同时间间隔的子时间序列之间的相似度来判断该时间序列是否具有周期性特征。
可见,本申请实施例所述的时间序列的周期性确定方法,通过基于预设的时间间隔将时间序列划分为多个子时间序列,基于动态时间规划算法计算时序相邻的子时间序列之间的相似度,通过对时序相邻的子时间序列之间的相似度确定时间序列是否具有周期性特征,可以实现对时间序列的周期性特征的自动化判断,相比于相关技术的人工识别方式,效率、准确度以及可靠性更高,且解决了依赖业务人员经验导致的无法对新增业务、指标等的时间序列进行周期性判断的问题,具有普遍适用性。
为了使本领域技术人员更加理解本申请实施例提供的技术方案,下面对本申请实施例提供的时间序列的周期性确定方法进行详细说明。
针对上述步骤S102,在一种可选的实施方式中,如图2所示,其具体可以包括如下步骤:
S121、对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系。
由于时间序列可能存在部分数据点缺失以及在时间轴上偏移的问题,致使划分得到的时序相邻的子时间序列之间无法对应,因而可基于动态时间规划算法(Dynamic TimeWrapping,DTW)将任意时序相邻的两个子时间序列在时间轴上进行伸缩变形,获得所述两个子时间序列中各数据点的最优映射关系,即所述两个子时间序列的元素对应关系。其中,所述两个子时间序列的元素对应关系可以例如包括一对一、多对一、一对多等一种或多种映射关系。
具体地,以时序相邻的子时间序列X=x1,x2,......,xi,......,x|x|和子时间序列Y=y1,y2,......,yi,......,y|x|为例,首先计算子时间序列X和子时间序列Y之间的距离(如欧式距离),得到子时间序列X和Y的距离矩阵M,其中,距离矩阵M中的元素dij表示子时间序列X中的第i个数据点与子时间序列Y中的第j个数据点之间的距离。接着,基于预先设定的约束条件从距离矩阵M中从(1,1)到(|X|,|y|)的多条路径中选取累计距离D(i,j)最小的路径作为规整路径,该规整路径则包含子时间序列X与子时间序列Y之间的元素对应关系。其中,所述约束条件包括:①规整路径必须以w1=(1,1)开始,以wK=(|X|,|Y|)结束,从而保证X和Y两个时间序列中的每个数据点都在规整路径中出现;②规整路径必须单调递增,即i、j需满足wK=(i,j),wK+1=(i',j'),i<=i'<=i+1,j<=j'<=j+1。
示例地,图3示出了规整前的子时间序列X和子时间序列Y,基于动态时间规划算法对这两个子时间序列在时间轴上的对应关系进行规整,将子时间序列Y进行平移后得到子时间序列Y’(如图4所示),规整后的子时间序列X和子时间序列Y’之间的各数据点之间的映射关系,即子时间序列X和子时间序列Y的规整路径包含的元素对应关系(如图4中的两条子时间序列之间的虚线)。
S122、基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离。
示例地,在获取所述两个子时间序列的元素对应关系后,可基于下述公式(1)计算所述两个子时间序列之间的规整路径距离。
Figure BDA0002283090210000071
其中,Dist(W)为所述两个子时间序列之间的规整路径距离;Dist(wki,wkj)为所述规整路径中的第k组元素对应关系Wk(i,j)的距离;K为所述规整路径中的元素对应关系的组数;i表示所述两个子时间序列中的子时间序列X中的第i个数据点,X=x1,x2,......,xi,......,x|x|;j表示所述两个子时间序列中的子时间序列Y中的第j个数据点,Y=y1,y2,......,yi,......,y|x|
需要说明的是,所述第k组元素对应关系Wk(i,j)的距离可以采用欧式距离,或者,也可以根据实际业务场景采用其他的距离计算方式,本申请实施例对此不做限定。
S123、基于所述规整路径距离确定所述两个子时间序列之间的相似度。
示例地,可基于规整路径距离与相似度之间的对应关系以及获取到的所述规整路径距离,确定所述两个子时间序列之间的相似度。其中,若所述规整路径距离越小,则表示所述两个子时间序列的相似度越高;反之,则表示所述两个子时间序列的相似度越低。
可以理解,通过动态时间规划算法对时序相邻的子时间序列在时间轴上的对应关系进行调整获得规整路径并计算规整路径距离,基于规整路径距离确定所述时序相邻的子时间序列之间的相似性,可以避免实际数据采集中存在的偶发数据点缺失、时序相邻的子时间序列在时间轴上存在偏移等问题导致的所述时序相邻的子时间序列之间的相似度的判断不准确的问题。进一步地,基于此方式计算出的时序相邻子时间序列之间的相似度判断时间序列是否具有周期性特征,使得对时间序列的周期性识别结果更准确。
针对上述步骤S103,在一种可选的实施方式中,在确定出时间序列中每两个时序相邻的子时间序列之间的相似度后,可基于所述每两个时序相邻的子时间序列之间的相似度,确定所述时间序列中时序相邻的子时间序列之间的相似度特征值,基于所述相似度特征值确定所述时间序列是否具有周期性特征。其中,所述相似度特征可以包括各相似度的平均值、中位数、方差等中的一者或多者。
示例地,以所述相似度特征值包括各相似度的平均值为例,若该平均值大于或等于预设阈值,则表明所述时间序列在相同的时间间隔里存在相似的波动,进而可确定所述时间序列具有周期性特征;若该平均值小于所述预设阈值,则表明所述时间序列在相同的时间间隔里不存在周期性波动,进而可确定所述时间序列不具有周期性特征。
当然,在其他一些可选的实施方式中,也可以通过确定出的每两个时序相邻的子时间序列之间的相似度的中位数、方差等参数来判断所述时间序列是否具有周期性特征,本申请实施例对此不做限定。
另外,在另一些可选的实施方式中,还可以根据所述相似度特征值中的多个值共同判定所述时间序列是否具有周期性特征。示例地,以所述相似度特征值包括各相似度的平均值和方差为例,对于各相似度的平均值,可按照上述实施方式判断所述时间序列是否具有周期性特征,得到第一判定结果;对于各相似度的方差,可将该方差与预设的方差阈值进行比对,若该方差小于所述预设的方差阈值,则表明所述时间序列在相同的时间间隔里波动较小,则可确定所述时间序列不具有周期性特征;若该方差大于或等于所述预设的方差阈值,则表明所述时间序列在相同的时间间隔里波动较大,则可确定所述时间序列具有周期性特征,由此,可得到第二判定结果。进一步地,基于所述第一判定结果和所述第二判定结果得到所述时间序列是否具有周期性特征的最终判定结果,比如分别对所述第一判定结果和所述第二判定结果设定相应的权重值,对所述第一判定结果和所述第二判定结果进行加权求和,根据加权求和结果确定所述时间序列是否具有周期性特征;或者,若所述第一判定结果与所述第二判定结果相同,则确定所述时间序列具有周期性特征;否则,则确定所述时间序列不具有周期性特征。
在本申请的另一个实施例中,考虑到具有周期性特征的时间序列通常是非平稳变化的,因而在执行上述步骤S102之前,可首先对所述时间序列进行平稳性判断。具体地,请参考图5,图5示出了本申请实施例提供的另一种时间序列的周期性确定方法的流程图。如图5所示,该方法可以包括如下步骤:
S501、基于预设的时间间隔将待分析的时间序列划分为多个子时间序列。
S502、对所述时间序列进行ADF单位根检验,以确定所述时间序列是否为平稳的时间序列。
其中,ADF(Augmented Dickey-Fuller Test,增项DF单位根)检验是假设检验的一种,其通过判断时间序列是否存在单位根来判断时间序列是否为平稳的时间序列。示例地,ADF单位根检验的原假设为所述时间序列存在单位根,被择假设为不存在单位根。ADF检验返回结构为ADF统计量和给定显著水平下的ADF统计量的临界值;如果ADF统计量小于给定显著水平的临界值,则可在该显著水平下,拒绝所述时间序列存在单位根的假设,即所述时间序列不存在单位根,进而可确定所述时间序列为平稳的时间序列;否则,可确定所述时间序列为非平稳变化的时间序列。
若所述时间序列为非平稳的时间序列,则执行下述步骤S503至S504。
S503、基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度。
S504、基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
需要说明的是,上述步骤S501、S503以及S504分别与上文实施例所述的步骤S101、S102以及S103相似,具体请参照上文对步骤S101至S103的描述,为了减少冗余,此处不再赘述。
可以理解,通过在确定所述多个子时间序列中时序相邻的子时间序列会之前,引入ADF单位根检验来判断所述时间序列是否为平稳的时间序列,在所述时间序列为非平稳的时间序列的情况下再基于DTW算法计算所述时间序列中时序相邻的子时间序列之间的相似度,可以避免平稳变化的时间序列因其时序相邻的子时间序列的相似度较高而被判别为具有周期性特征,进而可以进一步提升时间序列的周期性识别结果的准确度。
可选地,若所述时间序列为平稳的时间序列,则执行下述步骤S505。
S505、确定所述时间序列不具有周期性特征。
由于具有周期性特征的时间序列通常是非平稳变化的,因而若待分析的时间序列是平稳的时间序列,则可确定所述时间序列不具有周期性特征。
可以理解,通过在待分析的时间序列为平稳的时间序列时确定所述时间序列不具有周期性特征,可以快速滤除不具有周期性特征的时间序列,进而避免直接对平稳的时间序列进行时序相邻的子时间序列的相似度计算而导致的计算出的相似度较高,从而可以避免将这类平稳的时间序列误判为具有周期性特征,进而可以进一步提升时间序列的周期性识别结果的准确度和效率。
需要说明的是,上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
请参考图6,图6示出了本申请实施例提供的一种时间序列的周期性确定装置的框图。如图6所示,该装置600可以包括:划分模块601、计算模块602和第一确定模块603。
该划分模块601,用于基于预设的时间间隔将待分析的时间序列划分为多个子时间序列。
该计算模块602,用于基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度。
该第一确定模块603,用于基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
本申请实施例所述的时间序列的周期性确定装置,通过基于预设的时间间隔将时间序列划分为多个子时间序列,基于动态时间规划算法计算时序相邻的子时间序列之间的相似度,通过对时序相邻的子时间序列之间的相似度确定时间序列是否具有周期性特征,可以实现对时间序列的周期性特征的自动化判断,相比于相关技术的人工识别方式,效率、准确度以及可靠性更高,且解决了依赖业务人员经验导致的无法对新增业务、指标等的时间序列进行周期性判断的问题,具有普遍适用性。
可选地,所述计算模块602具体用于:
对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于所述动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系;
基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离;
基于所述规整路径距离确定所述两个子时间序列之间的相似度。
可以理解,通过动态时间规划算法对时序相邻的子时间序列在时间轴上的对应关系进行调整获得规整路径并计算规整路径距离,基于规整路径距离确定所述时序相邻的子时间序列之间的相似性,可以避免实际数据采集中存在的偶发数据点缺失、时序相邻的子时间序列在时间轴上存在偏移等问题导致的所述时序相邻的子时间序列之间的相似度的判断不准确的问题。进一步地,基于此方式计算出的时序相邻子时间序列之间的相似度判断时间序列是否具有周期性特征,使得对时间序列的周期性识别结果更准确。
可选地,如图7所示,所述装置600还包括:
检验模块604,用于对所述时间序列进行ADF单位根检验,若根据ADF单位根检验结果判定所述时间序列为非平稳的时间序列,则触发所述计算模块602。
可以理解,通过在确定所述多个子时间序列中时序相邻的子时间序列会之前,引入ADF单位根检验来判断所述时间序列是否为平稳的时间序列,在所述时间序列为非平稳的时间序列的情况下再基于DTW算法计算所述时间序列中时序相邻的子时间序列之间的相似度,可以避免平稳变化的时间序列因其时序相邻的子时间序列的相似度较高而被判别为具有周期性特征,进而可以进一步提升时间序列的周期性识别结果的准确度。
可选地,如图7所示,所述装置600还包括:
第二确定模块605,用于若所述检验模块604根据ADF单位根检验结果判定所述时间序列为平稳的时间序列,则确定所述时间序列不具有周期性特征。
可以理解,通过在待分析的时间序列为平稳的时间序列时确定所述时间序列不具有周期性特征,可以快速滤除不具有周期性特征的时间序列,进而避免直接对平稳的时间序列进行时序相邻的子时间序列的相似度计算而导致的计算出的相似度较高,从而可以避免将这类平稳的时间序列误判为具有周期性特征,进而可以进一步提升时间序列的周期性识别结果的准确度和效率。
可选地,所述第一确定模块603具体用于:
基于所述时间序列中每两个时序相邻的子时间序列之间的相似度,确定所述时序相邻的子时间序列之间的相似度特征值,所述相似度特征值包括各相似度的平均值、中位数、方差中的一者或多者;
基于所述相似度特征值确定所述时间序列是否具有周期性特征。
关于上述实施例中的装置,其各个模块执行操作的具体方式已经在该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8为本申请实施例提供的一种电子设备的结构示意图。请参考图8,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成时间序列的周期性确定装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
上述如本申请图6和图7所示实施例揭示的时间序列的周期性确定装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1、图2和图5的方法,并实现时间序列的周期性确定装置在图6、图7所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1、图2和图5所示实施例的方法,并具体用于执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
本申请实施例还提供一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (12)

1.一种时间序列的周期性确定方法,其特征在于,包括:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
2.根据权利要求1所述的方法,其特征在于,所述基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度,包括:
对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于所述动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系;
基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离;
基于所述规整路径距离确定所述两个子时间序列之间的相似度。
3.根据权利要求1所述的方法,其特征在于,在所述基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度之前,所述方法还包括:
对所述时间序列进行ADF单位根检验;以及,
根据ADF单位根检验结果判定所述时间序列为非平稳的时间序列。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若根据ADF单位根检验结果判定所述时间序列为平稳的时间序列,则确定所述时间序列不具有周期性特征。
5.根据权利要求1所述的方法,其特征在于,所述基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征,包括:
基于所述时间序列中每两个时序相邻的子时间序列之间的相似度,确定所述时序相邻的子时间序列之间的相似度特征值,所述相似度特征值包括各相似度的平均值、中位数、方差中的一者或多者;
基于所述相似度特征值确定所述时间序列是否具有周期性特征。
6.一种时间序列的周期性确定装置,其特征在于,包括:
划分模块,用于基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
计算模块,用于基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
第一确定模块,用于基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
7.根据权利要求6所述的装置,其特征在于,所述计算模块具体用于:
对于所述多个子时间序列中任意时序相邻的两个子时间序列,基于所述动态时间规划算法确定所述两个子时间序列之间的规整路径,所述规整路径包括所述两个子时间序列的元素对应关系;
基于所述两个子时间序列的元素对应关系计算所述两个子时间序列之间的规整路径距离;
基于所述规整路径距离确定所述两个子时间序列之间的相似度。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
检验模块,用于对所述时间序列进行ADF单位根检验,若根据ADF单位根检验结果判定所述时间序列为非平稳的时间序列,则触发所述计算模块。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于若所述检验模块根据ADF单位根检验结果判定所述时间序列为平稳的时间序列,则确定所述时间序列不具有周期性特征。
10.根据权利要求6所述的装置,其特征在于,所述第一确定模块具体用于:
基于所述时间序列中每两个时序相邻的子时间序列之间的相似度,确定所述时序相邻的子时间序列之间的相似度特征值,所述相似度特征值包括各相似度的平均值、中位数、方差中的一者或多者;
基于所述相似度特征值确定所述时间序列是否具有周期性特征。
11.一种电子设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
12.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于预设的时间间隔将待分析的时间序列划分为多个子时间序列;
基于动态时间规划算法确定所述多个子时间序列中时序相邻的子时间序列之间的相似度;
基于所述时序相邻的子时间序列之间的相似度,确定所述时间序列是否具有周期性特征。
CN201911149306.2A 2019-11-21 2019-11-21 时间序列的周期性确定方法、装置及电子设备 Pending CN111104438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911149306.2A CN111104438A (zh) 2019-11-21 2019-11-21 时间序列的周期性确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911149306.2A CN111104438A (zh) 2019-11-21 2019-11-21 时间序列的周期性确定方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN111104438A true CN111104438A (zh) 2020-05-05

Family

ID=70420475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911149306.2A Pending CN111104438A (zh) 2019-11-21 2019-11-21 时间序列的周期性确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111104438A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695829A (zh) * 2020-06-17 2020-09-22 南京星邺汇捷网络科技有限公司 一种指标波动周期计算方法、装置、存储介质及电子设备
CN112465546A (zh) * 2020-11-26 2021-03-09 中诚信征信有限公司 一种用户识别方法、装置及设备
CN112529708A (zh) * 2020-12-25 2021-03-19 深圳前海微众银行股份有限公司 一种客户识别方法及装置、电子设备
CN116069471A (zh) * 2023-01-12 2023-05-05 苏州畅行智驾汽车科技有限公司 一种任务的确定性调度方法、装置及电子设备
CN112529708B (zh) * 2020-12-25 2024-06-04 深圳前海微众银行股份有限公司 一种客户识别方法及装置、电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915434A (zh) * 2015-06-24 2015-09-16 哈尔滨工业大学 一种基于马氏距离dtw的多维时间序列分类方法
US20150347568A1 (en) * 2014-05-30 2015-12-03 International Business Machines Corporation Processing time series
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
CN109783051A (zh) * 2019-01-28 2019-05-21 中科驭数(北京)科技有限公司 一种时间序列相似性计算装置和方法
CN109783903A (zh) * 2018-12-28 2019-05-21 佛山科学技术学院 一种基于时间序列的工业用水管道故障诊断方法及系统
CN109919255A (zh) * 2019-03-29 2019-06-21 客如云科技(成都)有限责任公司 一种基于dtw和周期提取的时间序列聚类方法
CN110008247A (zh) * 2018-12-13 2019-07-12 阿里巴巴集团控股有限公司 异常来源确定方法、装置、设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150347568A1 (en) * 2014-05-30 2015-12-03 International Business Machines Corporation Processing time series
CN104915434A (zh) * 2015-06-24 2015-09-16 哈尔滨工业大学 一种基于马氏距离dtw的多维时间序列分类方法
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
CN110008247A (zh) * 2018-12-13 2019-07-12 阿里巴巴集团控股有限公司 异常来源确定方法、装置、设备及计算机可读存储介质
CN109783903A (zh) * 2018-12-28 2019-05-21 佛山科学技术学院 一种基于时间序列的工业用水管道故障诊断方法及系统
CN109783051A (zh) * 2019-01-28 2019-05-21 中科驭数(北京)科技有限公司 一种时间序列相似性计算装置和方法
CN109919255A (zh) * 2019-03-29 2019-06-21 客如云科技(成都)有限责任公司 一种基于dtw和周期提取的时间序列聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
姜睿: "《外国直接投资的产业结构、市场结构效应研究》", 上海财经大学出版社, pages: 130 - 135 *
李文海等: "基于DTW相似判定的周期性时间序列预测方法", 《计算机科学》, vol. 46, no. 5 *
计萍等: "一种新的时间序列周期检测算法", 《湖南文理学院学报(自然科学版)》, vol. 29, no. 1 *
郭龙: "时间序列数据的周期性研究", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 1, pages 1 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695829A (zh) * 2020-06-17 2020-09-22 南京星邺汇捷网络科技有限公司 一种指标波动周期计算方法、装置、存储介质及电子设备
CN111695829B (zh) * 2020-06-17 2023-08-29 南京星邺汇捷网络科技有限公司 一种指标波动周期计算方法、装置、存储介质及电子设备
CN112465546A (zh) * 2020-11-26 2021-03-09 中诚信征信有限公司 一种用户识别方法、装置及设备
CN112465546B (zh) * 2020-11-26 2024-04-19 中诚信征信有限公司 一种用户识别方法、装置及设备
CN112529708A (zh) * 2020-12-25 2021-03-19 深圳前海微众银行股份有限公司 一种客户识别方法及装置、电子设备
CN112529708B (zh) * 2020-12-25 2024-06-04 深圳前海微众银行股份有限公司 一种客户识别方法及装置、电子设备
CN116069471A (zh) * 2023-01-12 2023-05-05 苏州畅行智驾汽车科技有限公司 一种任务的确定性调度方法、装置及电子设备
CN116069471B (zh) * 2023-01-12 2024-03-19 苏州畅行智驾汽车科技有限公司 一种任务的确定性调度方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN110008080B (zh) 基于时间序列的业务指标异常检测方法、装置和电子设备
CN109587008B (zh) 检测异常流量数据的方法、装置及存储介质
CN111104438A (zh) 时间序列的周期性确定方法、装置及电子设备
CN109711440B (zh) 一种数据异常检测方法和装置
CN109086734B (zh) 一种对人眼图像中瞳孔图像进行定位的方法及装置
CN109165691B (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN110083475B (zh) 一种异常数据的检测方法及装置
CN110008247B (zh) 异常来源确定方法、装置、设备及计算机可读存储介质
CN110188862B (zh) 用于数据处理的模型超参数的搜索方法、装置、系统
CN108399115B (zh) 一种运维操作检测方法、装置及电子设备
CN111488289A (zh) 一种故障定位方法、装置和设备
CN114091281A (zh) 产品寿命预测方法、装置、电子设备及存储介质
CN110334104B (zh) 一种榜单更新方法、装置、电子设备及存储介质
CN109271453B (zh) 一种数据库容量的确定方法和装置
CN115563449A (zh) 个人轨迹检测方法、装置、电子设备和存储介质
CN111159169B (zh) 数据治理方法及设备
CN110189178B (zh) 异常交易监测方法、装置及电子设备
CN113064930A (zh) 数据仓库的冷热数据识别方法、装置及电子设备
CN111783883A (zh) 一种异常数据的检测方法及装置
CN109145821B (zh) 一种对人眼图像中瞳孔图像进行定位的方法及装置
CN110765005B (zh) 软件可靠性评估方法和装置
CN116703222A (zh) 物料检测的方法、装置、电子设备和计算机可读介质
CN110661913A (zh) 一种用户排序方法、装置及电子设备
CN109145996B (zh) 异常环境下的指标数据生成方法、装置及电子设备
CN115794473A (zh) 一种根因告警的定位方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230307

Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Applicant after: Sina Technology (China) Co.,Ltd.

Address before: 100193 7th floor, scientific research building, Sina headquarters, plot n-1, n-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Applicant before: Sina.com Technology (China) Co.,Ltd.

TA01 Transfer of patent application right