CN106127220A - 一种时间序列分类方法及装置 - Google Patents

一种时间序列分类方法及装置 Download PDF

Info

Publication number
CN106127220A
CN106127220A CN201610381743.7A CN201610381743A CN106127220A CN 106127220 A CN106127220 A CN 106127220A CN 201610381743 A CN201610381743 A CN 201610381743A CN 106127220 A CN106127220 A CN 106127220A
Authority
CN
China
Prior art keywords
time sequence
training
training time
matrix
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610381743.7A
Other languages
English (en)
Inventor
张莉
陶志伟
王邦军
张召
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201610381743.7A priority Critical patent/CN106127220A/zh
Publication of CN106127220A publication Critical patent/CN106127220A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种时间序列分类方法及装置。该方法包括以下步骤:针对待分类的测试时间序列,确定测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离;针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得测试时间序列的高斯核变换矩阵;根据高斯核变换矩阵和预先生成的训练时间序列集的字典矩阵,获得测试时间序列的稀疏表示系数矩阵;针对每种类别,根据字典矩阵中与该类别位置对应的原子和稀疏表示系数矩阵,确定测试时间序列与该类别的残差;将最小残差对应的类别确定为测试时间序列的类别。应用本发明实施例所提供的技术方案,可以提高时间序列的分类精确度。

Description

一种时间序列分类方法及装置
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种时间序列分类方法及装置。
背景技术
时间序列,是指某种现象或者统计指标在不同时间点上的各个数值按照时间顺序排列而成的有序序列。时间序列的分类问题一直是时间序列数据挖掘技术领域研究人员关注的重点。
目前,常根据基于欧氏距离的高斯核函数对时间序列进行分类。由于欧氏距离对时间序列没有较好的适应性,所以基于欧氏距离的高斯核函数难以为时间序列的分类提供较好的字典,使得对时间序列分类的精准度较低。
发明内容
本发明的目的是提供一种时间序列分类方法及装置,以快速有效地确定测试时间序列的类别,提高对测试时间序列分类的精准度。
一种时间序列分类方法,包括:
针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;
针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;
根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;
针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;
将最小残差对应的类别确定为所述测试时间序列的类别。
在本发明的一种具体实施方式中,所述针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,包括:
针对待分类的测试时间序列,根据公式
d d t w ( ( x i ) 1 m , ( y ) 1 m ) = | x i m - y m | + min ( d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( y ) 1 m - 1 ) ) ,
确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离
其中,xi∈Rm为所述训练时间序列集中的第i个训练时间序列,y∈Rm为所述测试时间序列,为训练时间序列xi的子序列,为测试时间序列y的子序列,|xim-ym|表示训练时间序列xi的第m个元素和测试时间序列y的第m个元素的欧氏距离。
在本发明的一种具体实施方式中,所述针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,包括:
针对确定的每个第一动态时间规整距离,根据公式
K d t w ( x i , y ) = exp ( - d d t w ( x i , y ) 2 σ 2 ) ,
确定基于该第一动态时间规整距离的第一高斯核函数Kdtw(xi,y);
其中,σ2为函数宽度参数。
在本发明的一种具体实施方式中,通过以下步骤预先生成所述训练时间序列集的字典矩阵:
针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离;
针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;
根据获得的第二高斯核函数,生成所述训练时间序列集的字典矩阵。
在本发明的一种具体实施方式中,所述针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离,包括:
针对所述训练时间序列集中的每个训练时间序列,根据公式
d d t w ( ( x i ) 1 m , ( x j ) 1 m ) = | x i m - x j m | + min ( d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( x j ) 1 m - 1 ) ) ,
确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离
其中,xj∈Rm为所述训练时间序列集中的第j个训练时间序列,|xim-xjm|表示训练时间序列xi的第m个元素和训练时间序列xj的第m个元素的欧氏距离。
在本发明的一种具体实施方式中,所述针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数,包括:
针对确定的每个第二动态时间规整距离,根据公式
K d t w ( x i , x j ) = exp ( - d d t w ( x i , x j ) 2 σ 2 ) ,
确定基于该第二动态时间规整距离的第二高斯核函数。
在本发明的一种具体实施方式中,所述训练时间序列集的字典矩阵为:
其中,Dj为所述训练时间序列集的第j个原子,
Dj=[Kdtw(x1,xj) Kdtw(x2,xj) … Kdtw(xi,xj) … Kdtw(xn,xj)]T
在本发明的一种具体实施方式中,所述针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差,包括:
针对每种类别,从所述字典矩阵中提取与该类别位置对应的原子矩阵Dv,从所述稀疏表示系数矩阵中提取与该类别位置对应的系数矩阵alphav
根据所述原子矩阵Dv和所述系数矩阵确定所述测试时间序列与该类别的残差为:Y-Dv*alphav
其中,测试时间序列y的高斯核变换矩阵Y为:
Y=[Kdtw(x1,y) Kdtw(x2,y) … Kdtw(xi,y) … Kdtw(xn,y)]T
一种时间序列分类装置,包括:
第一动态时间规整距离确定模块,用于针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;
高斯核变换矩阵获得模块,用于针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;
稀疏表示系数矩阵获得模块,用于根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;
残差确定模块,用于针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;
类别确定模块,用于将最小残差对应的类别确定为所述测试时间序列的类别。
在本发明的一种具体实施方式中,所述装置还包括:字典矩阵生成模块,用于通过以下步骤预先生成所述训练时间序列集的字典矩阵:
针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离;
针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;
根据获得的第二高斯核函数,生成所述训练时间序列集的字典矩阵。
应用本发明实施例所提供的技术方案,将动态时间规整距离引入到高斯核函数中,可以克服欧氏距离对时间序列的不适应性,提高时间序列的分类精确度。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中训练时间序列集的字典生成方法的一种实施流程图;
图2为本发明实施例中时间序列分类方法的一种实施流程图;
图3为本发明实施例中时间序列分类装置的一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明具体实施之前,需要预先获得训练时间序列集并生成该训练时间序列集的字典矩阵。
具体的,可以通过收集、整理、构建等方式,预先获得训练时间序列集,该训练时间序列集中包含若干个已知类别的训练时间序列。
假设预先获得的训练时间序列集Xtrn={(x1,v1),…,(xi,vi),…,(xn,vn)}。
其中,xi表示该训练时间序列集中第i个训练时间序列,xi∈Rm,为m维向量;
vi为xi的类别标签,两个不同的训练时间序列可以归属于相同或不同的类别。在本发明实施例中,该训练时间序列集包含的训练时间序列共归属于C种类别,即vi∈{1,2,…,C}。
参见图1所示,在本发明实施例中,可以通过以下步骤预先生成该训练时间序列集的字典矩阵:
S110:针对训练时间序列集中的每个训练时间序列,确定该训练时间序列与训练时间序列集中每一个训练时间序列的第二动态时间规整距离。
大量的研究数据表明,欧氏距离对时间序列没有较好的适应性,难以适应时间序列的偏移性,所以,基于欧氏距离的高斯核函数难以对时间序列的分类提供较好的字典,从而使得对时间序列的分类的精准度不高。
在本发明实施例中,将动态时间规整(Dynamic Time Warping,DTW)距离引入到高斯核函数中,即使用动态时间规整距离代替欧氏距离。
具体的,对于时间序列样例a=[a1,a2,…,am]和b=[b1,b2,…,bn],可以定义二者的动态时间规整距离,如公式(1)所示:
其中,为时间序列样例a的子序列,为时间序列样例b的子序列,|am-bn|表示时间序列样例a的第m个元素am和时间序列样例b的第n个元素bn间的欧氏距离。
通过公式(1),可以确定任意两个时间序列的动态时间规整距离。
根据公式(1),可以获得公式(2),即:
针对训练时间序列集中的每个训练时间序列,根据公式(2)可以确定该训练时间序列与训练时间序列集中每一个训练时间序列的第二动态时间规整距离即ddtw(x1,x1),ddtw(x1,x2),…,ddtw(xi,xj),…。
在公式(2)中,xj∈Rm为训练时间序列集中的第j个训练时间序列,|xim-xjm|表示训练时间序列xi的第m个元素和训练时间序列xj的第m个元素的欧氏距离。
S120:针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数。
仍以上述的时间序列样例a=[a1,a2,…,am]和b=[b1,b2,…,bn]为例说明,基于动态时间规整距离,获得的高斯核函数如公式(3)所示:
其中,ddtw(a,b)为根据公式(1)确定的时间序列样例a和时间序列样例b的动态时间规整距离,σ2为函数宽度参数。
同理,针对确定的每个第二动态时间规整距离,可以确定基于该第二动态时间规整距离的第二高斯核函数。
根据公式(3),可以获得公式(4),即:
针对确定的每个第二动态时间规整距离,根据公式(4)可以确定基于该第二动态时间规整距离的第二高斯核函数,即Kdtw(x1,x1),Kdtw(x1,x2),…,Kdtw(xi,xj),…。
S130:根据获得的第二高斯核函数,生成训练时间序列集的字典矩阵。
在本发明实施例中,对于训练时间序列集Xtrn,根据获得的第二高斯核函数,可以生成该训练时间序列集的字典矩阵D,该字典矩阵D如公式(5)所示:
其中,Dj为该训练时间序列集的第j个原子,
Dj=[Kdtw(x1,xj) Kdtw(x2,xj) … Kdtw(xi,xj) … Kdtw(xn,xj)]T
该字典矩阵包含多个原子。
至此,获得了训练时间序列集,并生成了该训练时间序列集的字典矩阵。在此基础上,可以执行本发明实施例的具体方案,对测试时间序列进行分类处理。
参见图2所示,为本发明实施例所提供的时间序列分类方法的实施流程图,该方法可以包括以下步骤:
S210:针对待分类的测试时间序列,确定测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离。
如前所述,该训练时间序列集中包含若干个已知类别的训练时间序列。
测试时间序列即为待分类的时间序列,在本发明实施例中,测试时间序列可以表示为y∈Rm
根据公式(1),可以获得公式(6),即:
针对测试时间序列,根据公式(6),可以确定该测试时间序列与训练时间序列集中每个训练时间序列的第一动态时间规整距离即ddtw(x1,y),ddtw(x1,y),…,ddtw(xi,y),…。
在公式(6)中,xi∈Rm为训练时间序列集中的第i个训练时间序列,y∈Rm为测试时间序列,为训练时间序列xi的子序列,为测试时间序列y的子序列,|xim-ym|表示训练时间序列xi的第m个元素和测试时间序列y的第m个元素的欧氏距离。
S220:针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得测试时间序列的高斯核变换矩阵。
根据公式(3),可以获得公式(7),即:
针对确定的每个第一动态时间规整距离,根据公式(7)可以确定基于该第一动态时间规整距离的第一高斯核函数,即Kdtw(x1,y),Kdtw(x2,y),…,Kdtw(xi,y),…Kdtw(xn,y)。
其中,σ2为函数宽度参数。
根据确定的第一高斯核函数,可以进一步确定测试时间序列的高斯核变换矩阵Y。
测试时间序列的高斯核变换矩阵Y可以表示为:
Y=[Kdtw(x1,y) Kdtw(x2,y) … Kdtw(xi,y) … Kdtw(xn,y)]T
S230:根据高斯核变换矩阵和预先生成的训练时间序列集的字典矩阵,获得测试时间序列的稀疏表示系数矩阵。
如前所述,训练时间序列集的字典矩阵为,根据基于第二动态时间规整距离的第二高斯核函数预先生成的,具体可以通过步骤S110至步骤S130生成。该字典矩阵中包含多个原子。
根据测试时间序列的高斯核变换矩阵Y和预先生成的训练时间序列集的字典矩阵D,可以获得测试时间序列的稀疏表示系数矩阵。具体的,可以通过OMP(OrthogonalMatching Pursuit,正交匹配追踪)算法获得测试时间序列的稀疏表示系数矩阵,此为现有技术,本发明实施例对此不再赘述。
S240:针对每种类别,根据字典矩阵中与该类别位置对应的原子和稀疏表示系数矩阵,确定测试时间序列与该类别的残差。
训练时间序列集包含若干个已知类别的训练时间序列。在本发明的一种具体实施方式中,可以针对每种类别,从字典矩阵中提取与该类别位置对应的原子矩阵Dv,并从稀疏表示系数矩阵中提取与该类别位置对应的系数矩阵根据原子矩阵Dv和系数矩阵确定测试时间序列与该类别的残差为:Y-Dv*alphav
为方便理解,举例说明。
假设训练时间序列集中训练时间序列x1、x2、x5和x8归属于第一类别,则从字典矩阵D中提取与该第一类别位置对应的原子矩阵Dv=1为:Dv=1=[D1 D2 D5 D8]。从稀疏表示系数矩阵中提取第1、2、5、8行对应的元素,构成系数矩阵
根据原子矩阵Dv=1和系数矩阵可以确定测试时间序列与该第一类别的残差。
同理,可以确定测试时间序列与第二类别、第三类别等的残差。
S250:将最小残差对应的类别确定为测试时间序列的类别。
针对每种类别,测试时间序列与该类别的残差越小,表明测试时间序列的类别越与该类别相似。所以,在本发明实施例中,可以将最小残差对应的类别确定为测试时间序列的类别。
在本发明实施例中,可以根据公式(8)确定最小残差。
其中,Dv=D(:,inv),alphav=alpha(inv),inv表示测试时间序列中第v类数据的位置。
使用Control Chart database时间序列数据库中的Trace数据集进行测试。Control Chart database时间序列数据库是目前研究时间序列分类、聚类等使用较为广泛的数据库之一。Trace数据集共有4类共200个时间序列,分为100个训练时间序列和100个测试时间序列,每个时间序列的长度为275。
在本例中,训练时间序列集Xtrn={(x1,v1),…,(xi,vi),…,(x100,v100)},xi∈R275,vi∈{1,2,…,C},C=4。
首先应用本发明实施例所提供的技术方案对测试时间序列进行分类处理。
针对该训练时间序列集中的每个训练时间序列,可以确定该训练时间序列与训练时间序列集中的每一个训练时间序列的第二动态时间规整距离,并获得基于该第二动态时间规整距离的第二高斯核函数,根据获得的第二高斯核函数,可以生成该训练时间序列集的字典矩阵D:
D = K d t w ( x 1 , x 1 ) K d t w ( x 1 , x 2 ) ... K d t w ( x 1 , x j ) ... K d t w ( x 1 , x 100 ) K d t w ( x 2 , x 1 ) K d t w ( x 2 , x 2 ) ... K d t w ( x 2 , x j ) ... K d t w ( x 2 , x 100 ) ... ... ... ... ... ... K d t w ( x 100 , x 1 ) K d t w ( x 100 , x 2 ) ... K d t w ( x 100 , x j ) ... K d t w ( x 100 , x 100 )
对于100个测试时间序列中的任意一个测试时间序列y∈R275,可以确定该测试时间序列与训练时间序列集中每个训练时间序列的基于第一动态时间规整距离的第一高斯核函数,并根据确定的第一高斯核函数,确定该测试时间序列的高斯核变换矩阵:
Y=[Kdtw(x1,y) Kdtw(x2,y) … Kdtw(xi,y) … Kdtw(x100,y)]T
根据该测试时间序列的高斯核变换矩阵Y和训练时间序列集的字典矩阵D,可以获得该测试时间序列的稀疏表示系数矩阵,并根据公式(8)可以得到该测试时间序列与各个类别的最小残差,将该最小残差对应的类别确定为该测试时间序列的类别。
其次,应用基于欧氏距离的高斯核函数对这100个测试时间序列进行分类处理,将错误率作为性能衡量指标,可以得到表1所示的实验结果。
表1
从表1可以看出,本发明方法的分类错误率较低,可以对测试时间序列进行较为准确的分类。
应用本发明实施例所提供的方法,将动态时间规整距离引入到高斯核函数中,可以克服欧氏距离对时间序列的不适应性,提高时间序列的分类精确度。
相应于上面的方法实施例,本发明实施例还提供了一种时间序列分类装置。下面对本发明实施例提供的时间序列分类装置进行介绍,下文描述的时间序列分类装置与上文描述的时间序列分类方法可相互对应参照。
参见图3所示,为本发明实施例提供的时间序列分类装置的结构示意图,该装置可以包括以下模块:
第一动态时间规整距离确定模块310,用于针对待分类的测试时间序列,确定测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,训练时间序列集中包含若干个已知类别的训练时间序列;
高斯核变换矩阵获得模块320,用于针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得测试时间序列的高斯核变换矩阵;
稀疏表示系数矩阵获得模块330,用于根据高斯核变换矩阵和预先生成的训练时间序列集的字典矩阵,获得测试时间序列的稀疏表示系数矩阵,字典矩阵包含多个原子;
残差确定模块340,用于针对每种类别,根据字典矩阵中与该类别位置对应的原子和稀疏表示系数矩阵,确定测试时间序列与该类别的残差;
类别确定模块350,用于将最小残差对应的类别确定为测试时间序列的类别。
应用本发明实施例所提供的装置,将动态时间规整距离引入到高斯核函数中,可以克服欧氏距离对时间序列的不适应性,提高时间序列的分类精确度。
在本发明的一种具体实施方式中,第一动态时间规整距离确定模块310,可以具体用于:
针对待分类的测试时间序列,根据公式
d d t w ( ( x i ) 1 m , ( y ) 1 m ) = | x i m - y m | + min ( d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( y ) 1 m - 1 ) ) ,
确定测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离
其中,xi∈Rm为训练时间序列集中的第i个训练时间序列,y∈Rm为测试时间序列,为训练时间序列xi的子序列,为测试时间序列y的子序列,|xim-ym|表示训练时间序列xi的第m个元素和测试时间序列y的第m个元素的欧氏距离。
在本发明的一种具体实施方式中,高斯核变换矩阵获得模块320,可以具体用于:
针对确定的每个第一动态时间规整距离,根据公式
K d t w ( x i , y ) = exp ( - d d t w ( x i , y ) 2 σ 2 ) ,
确定基于该第一动态时间规整距离的第一高斯核函数Kdtw(xi,y);
其中,σ2为函数宽度参数。
在本发明的一个实施例中,该装置还可以包括:字典矩阵生成模块,用于通过以下步骤预先生成训练时间序列集的字典矩阵:
针对训练时间序列集中的每个训练时间序列,确定该训练时间序列与训练时间序列集中每一个训练时间序列的第二动态时间规整距离;
针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;
根据获得的第二高斯核函数,生成训练时间序列集的字典矩阵。
在本发明的一种具体实施方式中,字典矩阵生成模块,可以具体用于:
针对训练时间序列集中的每个训练时间序列,根据公式
d d t w ( ( x i ) 1 m , ( x j ) 1 m ) = | x i m - x j m | + min ( d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( x j ) 1 m - 1 ) ) ,
确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离
其中,xj∈Rm为训练时间序列集中的第j个训练时间序列,|xim-xjm|表示训练时间序列xi的第m个元素和训练时间序列xj的第m个元素的欧氏距离。
在本发明的一种具体实施方式中,字典矩阵生成模块,可以具体用于:
针对确定的每个第二动态时间规整距离,根据公式
K d t w ( x i , x j ) = exp ( - d d t w ( x i , x j ) 2 σ 2 ) ,
确定基于该第二动态时间规整距离的第二高斯核函数。
在本发明的一种具体实施方式中,训练时间序列集的字典矩阵为:
其中,Dj为训练时间序列集的第j个原子,
Dj=[Kdtw(x1,xj) Kdtw(x2,xj) … Kdtw(xi,xj) … Kdtw(xn,xj)]T
在本发明的一种具体实施方式中,字典矩阵生成模块,可以具体用于:
针对每种类别,从字典矩阵中提取与该类别位置对应的原子矩阵Dv,从稀疏表示系数矩阵中提取与该类别位置对应的系数矩阵alphav
根据原子矩阵Dv和系数矩阵确定测试时间序列与该类别的残差为:Y-Dv*alphav
其中,测试时间序列y的高斯核变换矩阵Y为:
Y=[Kdtw(x1,y) Kdtw(x2,y) … Kdtw(xi,y) … Kdtw(xn,y)]T
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种时间序列分类方法及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种时间序列分类方法,其特征在于,包括:
针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;
针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;
根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;
针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;
将最小残差对应的类别确定为所述测试时间序列的类别。
2.根据权利要求1所述的方法,其特征在于,所述针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,包括:
针对待分类的测试时间序列,根据公式
d d t w ( ( x i ) 1 m , ( y ) 1 m ) = | x i m - y m | + min ( d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( y ) 1 m - 1 ) ) ,
确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离
其中,xi∈Rm为所述训练时间序列集中的第i个训练时间序列,y∈Rm为所述测试时间序列,为训练时间序列xi的子序列,为测试时间序列y的子序列,|xim-ym|表示训练时间序列xi的第m个元素和测试时间序列y的第m个元素的欧氏距离。
3.根据权利要求2所述的方法,其特征在于,所述针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,包括:
针对确定的每个第一动态时间规整距离,根据公式
K d t w ( x i , y ) = exp ( - d d t w ( x i , y ) 2 σ 2 ) ,
确定基于该第一动态时间规整距离的第一高斯核函数Kdtw(xi,y);
其中,σ2为函数宽度参数。
4.根据权利要求1至3任一项所述的方法,其特征在于,通过以下步骤预先生成所述训练时间序列集的字典矩阵:
针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离;
针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;
根据获得的第二高斯核函数,生成所述训练时间序列集的字典矩阵。
5.根据权利要求4所述的方法,其特征在于,所述针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离,包括:
针对所述训练时间序列集中的每个训练时间序列,根据公式
d d t w ( ( x i ) 1 m , ( x j ) 1 m ) = | x i m - x j m | + min ( d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( x j ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( x j ) 1 m - 1 ) ) ,
确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离
其中,xj∈Rm为所述训练时间序列集中的第j个训练时间序列,|xim-xjm|表示训练时间序列xi的第m个元素和训练时间序列xj的第m个元素的欧氏距离。
6.根据权利要求5所述的方法,其特征在于,所述针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数,包括:
针对确定的每个第二动态时间规整距离,根据公式
K d t w ( x i , x j ) = exp ( - d d t w ( x i , x j ) 2 σ 2 ) ,
确定基于该第二动态时间规整距离的第二高斯核函数。
7.根据权利要求6所述的方法,其特征在于,所述训练时间序列集的字典矩阵为:
其中,Dj为所述训练时间序列集的第j个原子,
Dj=[Kdtw(x1,xj) Kdtw(x2,xj) ... Kdtw(xi,xj) ... Kdtw(xn,xj)]T
8.根据权利要求7所述的方法,其特征在于,所述针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差,包括:
针对每种类别,从所述字典矩阵中提取与该类别位置对应的原子矩阵Dv,从所述稀疏表示系数矩阵中提取与该类别位置对应的系数矩阵alphav
根据所述原子矩阵Dv和所述系数矩阵确定所述测试时间序列与该类别的残差为:Y-Dv*alphav
其中,测试时间序列y的高斯核变换矩阵Y为:
Y=[Kdtw(x1,y) Kdtw(x2,y) … Kdtw(xi,y) … Kdtw(xn,y)]T
9.一种时间序列分类装置,其特征在于,包括:
第一动态时间规整距离确定模块,用于针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;
高斯核变换矩阵获得模块,用于针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;
稀疏表示系数矩阵获得模块,用于根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;
残差确定模块,用于针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;
类别确定模块,用于将最小残差对应的类别确定为所述测试时间序列的类别。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:字典矩阵生成模块,用于通过以下步骤预先生成所述训练时间序列集的字典矩阵:
针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离;
针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;
根据获得的第二高斯核函数,生成所述训练时间序列集的字典矩阵。
CN201610381743.7A 2016-06-01 2016-06-01 一种时间序列分类方法及装置 Pending CN106127220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610381743.7A CN106127220A (zh) 2016-06-01 2016-06-01 一种时间序列分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610381743.7A CN106127220A (zh) 2016-06-01 2016-06-01 一种时间序列分类方法及装置

Publications (1)

Publication Number Publication Date
CN106127220A true CN106127220A (zh) 2016-11-16

Family

ID=57270617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610381743.7A Pending CN106127220A (zh) 2016-06-01 2016-06-01 一种时间序列分类方法及装置

Country Status (1)

Country Link
CN (1) CN106127220A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193969A (zh) * 2017-05-25 2017-09-22 南京大学 一种自动生成小说文本情感曲线并预测推荐的方法
CN109034179A (zh) * 2018-05-30 2018-12-18 河南理工大学 一种基于马氏距离idtw的岩层分类方法
CN109815857A (zh) * 2019-01-09 2019-05-28 浙江工业大学 一种电离辐射时间序列的聚类方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193969A (zh) * 2017-05-25 2017-09-22 南京大学 一种自动生成小说文本情感曲线并预测推荐的方法
CN109034179A (zh) * 2018-05-30 2018-12-18 河南理工大学 一种基于马氏距离idtw的岩层分类方法
CN109815857A (zh) * 2019-01-09 2019-05-28 浙江工业大学 一种电离辐射时间序列的聚类方法
CN109815857B (zh) * 2019-01-09 2021-05-18 浙江工业大学 一种电离辐射时间序列的聚类方法

Similar Documents

Publication Publication Date Title
CN103810264B (zh) 基于特征选择的网页文本分类方法
CN103049446B (zh) 一种图像检索方法及装置
CN103902702B (zh) 一种数据存储系统和存储方法
CN103902698B (zh) 一种数据存储系统和存储方法
CN103902701B (zh) 一种数据存储系统和存储方法
CN107527065B (zh) 一种基于卷积神经网络的花卉品种识别模型建立方法
CN106547826A (zh) 一种跨模态检索方法、装置及计算机可读介质
CN102750347B (zh) 一种用于图像或视频搜索重排序的方法
CN105740404A (zh) 标签关联方法及装置
CN106127220A (zh) 一种时间序列分类方法及装置
CN105320764A (zh) 一种基于增量慢特征的3d模型检索方法及其检索装置
CN103473308B (zh) 基于最大间隔张量学习的高维多媒体数据分类方法
CN107545038A (zh) 一种文本分类方法与设备
CN105654122A (zh) 基于核函数匹配的空间金字塔物体识别方法
CN102968813A (zh) 一种三角面片网格模型的表面采样方法
CN102193646A (zh) 人名候选词的生成方法及装置
CN107122395B (zh) 数据抽样方法和装置
Bekki Quantifying the fine structures of disk galaxies with deep learning: Segmentation of spiral arms in different Hubble types
CN104965928A (zh) 一种基于形状匹配的汉字图像检索方法
CN108021985A (zh) 一种模型参数训练方法及装置
CN106202045A (zh) 基于车联网的专项语音识别方法
CN106295711A (zh) 一种时间序列分类方法及系统
CN110019637A (zh) 一种标准文献检索的排序算法
CN104778202B (zh) 基于关键词的事件演化过程的分析方法及系统
CN107273509B (zh) 一种神经网络数据存储器、数据存储方法及数据查找方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161116

RJ01 Rejection of invention patent application after publication