CN108182260B - 一种基于语义选择的多变量时间序列分类方法 - Google Patents

一种基于语义选择的多变量时间序列分类方法 Download PDF

Info

Publication number
CN108182260B
CN108182260B CN201810004240.7A CN201810004240A CN108182260B CN 108182260 B CN108182260 B CN 108182260B CN 201810004240 A CN201810004240 A CN 201810004240A CN 108182260 B CN108182260 B CN 108182260B
Authority
CN
China
Prior art keywords
time
semantic
matrix
sequence
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810004240.7A
Other languages
English (en)
Other versions
CN108182260A (zh
Inventor
马千里
田帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201810004240.7A priority Critical patent/CN108182260B/zh
Publication of CN108182260A publication Critical patent/CN108182260A/zh
Application granted granted Critical
Publication of CN108182260B publication Critical patent/CN108182260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义选择的多变量时间序列分类方法,时间序列分类作为机器学习热门的一个研究分支拥有广泛的应用前景,例如计算机视觉、金融分析、生物统计学等等。本发明提出的稀疏自适应语义学习网络SA‑SLN采用稀疏卷积核同时提取多变量时间序列空间上的语义概念和时间上的短时依赖关系,并提出一种注意力转移方法用于选择语义概念,最后通过LSTMs对序列的长时间依赖关系进行建模。该稀疏自适应语义学习网络SA‑SLN基于帧内属性具有相关性的事实,实现了自动提取空间特征和时序依赖多步建模,解决了目前方法所存在的缺陷并在三个公开的数据集上达到了目前最好的结果。

Description

一种基于语义选择的多变量时间序列分类方法
技术领域
本发明涉及时间序列建模技术领域,具体涉及一种基于语义选择的多变量时间序列分类方法。
背景技术
随着信息科技的发展,感知器变得更加廉价和普遍,越来越多的时间序列数据将被收集,如何挖掘时间序列中的模式特征已经成为研究热点。现如今,时间序列分类方法可以大致分成两类:基于动态系统和基于特征表示。第一种方法假设数据都产生于隐性的动态系统,例如:层次最大熵马尔可夫模型,隐马尔可夫模型(HMMs),条件随机场和长短期记忆神经网络。然而这些方法都没有考虑帧内特征。第二种方法是提取合适的特征或特征表示,例如:3D关节位置直方图(HOJ3D),相对几何特征等,或动态时间规整(DTW),黎曼流形方法等。基于特征的方法虽然有效,但是没有考虑时间依赖性,并且人工设计特征费时易错。因此如何结合上述两种方法并自动的提取帧内特征成为新的突破口,W.Zhu等“Cooccurrence feature learning for skeleton based action recognition usingregularized deep lstm networks.”in AAAI,vol.2,2016,p.8.中提出的共同出现特征方法解决了上述问题,但是其对不同类样本提取的都是相同的空间组合特征,无法做到面向样本提取。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于语义选择的多变量时间序列分类方法,该方法提出一种稀疏卷积网络来自动学习时空域中的语义概念;并提出一种适应性选择和学习动作语义的注意力方法;模型SA-SLN结合CNNs和LSTMs实现语义概念的自动学习和选择,可用于各种多变量时间序列分类领域,例如:基于3D的骨骼节点序列,交通流序列,轨迹序列等;该方法在3个数据集上达到了当前目前最好的效果。
本发明的目的可以通过采取如下技术方案达到:
一种基于语义选择的多变量时间序列分类方法,所述的多变量时间序列分类方法包括下列步骤:
S1、收集时间序列数据集;
S2、对数据进行预处理操作,然后按照数据集定义的验证方法划分训练集,验证集和测试集;
S3、将一个样本的数据组织成矩阵形式,用稀疏的卷积核来提取语义特征,此处卷积核用于滤波,也称为滤波器;
S4、对卷积后的特征图谱在时间维度上进行局部最大池化,获取时间段特征;
S5、将步骤S4产生的特征按照时间段顺序输入LSTMs,每一时刻的隐含层状态输入维度等于滤波器个数的Softmax层,并由维度等于滤波器个数的Softmax层计算产生下一时刻选择语义概念的注意力权重;
S6、取LSTMs最后时刻的隐含层状态输入维度等于类别个数的 Softmax层进行概率归一化;
S7、修改交叉熵损失函数,加入卷积核稀疏项约束,通过最小化损失函数获得梯度,从而更新参数并自动学习语义概念;
S8、使用步骤S2中划分的验证集测试训练后的模型,选取在验证集上表现最好的超参数对步骤S2中划分的测试集进行测试,获得最终准确率。
进一步地,所述的步骤S2中对数据进行预处理操作包括去中心化、平滑滤波、归一化。
进一步地,所述的步骤S3过程如下:
将每个样本序列组织成矩阵形式,时间序列的属性全集表示为 A={αi},i=1,2,…,|A|,所有属性在样本每一时刻的值构成矩阵X,X∈RT×|A|,其中T是帧的数量,|A|是属性的数量,其矩阵形式如下所示:
Figure GDA0003015666780000031
以稀疏的卷积核来提取时间序列的属性组合特征,每一种组合特征被称为该时间序列的一种语义,卷积核权重矩阵Wk∈Rt×|A|是宽为
Figure GDA0003015666780000032
的第k个卷积核的参数,当滑动步长为1时,矩阵X将被分成
Figure GDA0003015666780000033
个时间窗口:
Figure GDA0003015666780000034
因此使用滤波器Wk作用于全部时间窗口的结果为:
Figure GDA0003015666780000035
其中
Figure GDA0003015666780000036
为将第k个稀疏卷积核作用于第m个滑动窗口的结果,由于CNNs权重共享的特性,卷积核k在所有时间窗口上提取到相同的语义概念,定义 cm,k=f(Wk*Zm:m+t-1+bk),其中f是激活函数,*代表点乘算子,bk代表第 k个核的偏置;
通过多个稀疏卷积核获得多种语义概念,同时对相邻行的卷积获得时间序列的短时依赖性。
进一步地,所述的步骤S4过程如下:
进行局部最大池化,以p代表池化窗口的大小,s代表时间维度上的步长,cm,k代表第m行,第k列的激活值,将步骤S3得到的特征图谱作为池化层的输入,yj,k代表第k个滤波器的第j个池化窗口的输出,局部最大池化层按照下式计算:
Figure GDA0003015666780000041
式中c*=(1+(j-1)*s,2+(j-1)*s,···,p+(j-1)*s)T,池化后得到矩阵 O∈RL ×K
Figure GDA0003015666780000042
K是滤波器数量,ceil(·)是向上取整函数。
进一步地,所述的步骤S5过程如下:
将每个时间步的隐含层状态输入维度等于滤波器个数的Softmax层,在每个时间步,模型产生预测向量lt+1∈RK用于选取重要的语义概念,其中,预测向量为注意力权重,向量lt中的每个元素反映对应语义概念的重要程度,获得t时刻的注意力权重后,则下一时刻的输入可以被改写为:
Figure GDA0003015666780000043
其中
Figure GDA0003015666780000044
代表池化后的矩阵O的第t行,经过LSTMs递归迭代和注意力机制选取语义概念后,得到样本n的最终特征向量
Figure GDA0003015666780000045
进一步地,所述的步骤S7过程如下:
加入卷积核稀疏项约束项,因此修改交叉熵损失函数如下:
Figure GDA0003015666780000046
上式中第一项是最大似然损失函数,u代表训练数据,Cs是数据集中的第s个类,N代表训练集样本数量,δ(·)是Kronecker delta函数,r是样本un的真实标签,概率p(Cs|un)由步骤S5中产生的
Figure GDA0003015666780000047
经过维度为类别个数的Softmax层归一化后产生;上式中第二项是矩阵WT的l21范式,用反向传播算法和ADAM梯度优化算法最小化损失函数,更新参数直到收敛。
本发明相对于现有技术具有如下的优点及效果:
本发明提出的稀疏自适应语义学习网络(Sparse and Adaptive SemanticsLearning Network,SA-SLN)采用稀疏卷积核同时提取多变量时间序列空间上的语义概念和时间上的短时依赖关系,并提出一种注意力转移方法用于选择语义概念,最后通过LSTMs对序列的长时间依赖关系进行建模。本发明采用稀疏规则约束卷积核实现完全自动地语义概念提取,并结合注意力机制实现面向样本的语义概念选择。本发明提出的基于稀疏自适应语义学习的网络SA-SLN基于帧内属性具有相关性的事实,实现了自动提取空间特征和时序依赖多步建模,解决了目前方法所存在的缺陷并在三个公开的数据集上达到了目前最好的结果。
附图说明
图1是本发明提出的一种基于语义选择的多变量时间序列分类方法的流程步骤图;
图2是本发明中多变量高维骨骼节点序列示意图;
图3是本发明中语义解释图;
图4是本发明中方法实施概要图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
时间序列分类作为机器学习热门的一个研究分支拥有广泛的应用前景,例如计算机视觉、金融分析、生物统计学等等。本发明提出的稀疏自适应语义学习网络(Sparse andAdaptive Semantics Learning Network,SA- SLN)采用稀疏卷积核同时提取多变量时间序列空间上的语义概念和时间上的短时依赖关系,并提出一种注意力转移方法用于选择语义概念,最后通过LSTMs对序列的长时间依赖关系进行建模。现有的时间序列分类方法需要依靠人工特征工程设计特征或半自动地提取空间特征,且对同一集合的不同样本采取相同的特征提取方法。本实施例采用稀疏规则约束卷积核实现完全自动地语义概念提取,并结合注意力机制实现面向样本的语义概念选择。SA-SLN解决了目前方法所存在的缺陷并在三个公开的数据集上达到了目前最好的结果。
如图1的模型流程图所示,本发明利用CNNs提取语义特征的同时也对短期时序依赖建模,由于卷积核的稀疏性,语义概念不需要人工特征工程设计就可以被自动学习,且通过设置不同大小的卷积窗口可以解决多时间尺度问题,最后结合LSTMs和语义注意力机制实现长期时序依赖关系建模和面向样本的语义选择。
实验中的骨骼节点动作时间序列由深度感知设备Kinect提取,如图2 所示,该图说明如何将骨骼序列看作一种多变量高维时间序列,其记录了人体关键节点随时间变化的三维坐标信息,每一个节点的每一维坐标可以看成一个单变量时间序列,因此多个节点的三维信息将被组合看作一种多变量时间序列。图3为语义解释图,可以明显看出每个动作由一个或者多个语义组成,例如右臂投掷动作执行过程是先抬起整只右手,然后右前臂投掷,最后整只右手放下,因此可以看成由整个右臂语义和右前臂语义组成。图4是本发明中方法实施概要图,从中可以看出稀疏卷积核如何提取动作语义以及注意力权重是如何面向样本选择这些语义概念。
本实施例公开的一种基于语义选择的多变量时间序列分类方法具体步骤如下:
S1、收集时间序列数据集;
S2、对数据进行去中心化、平滑滤波、归一化等预处理操作,然后按照数据集定义的验证方法划分训练集,验证集和测试集;
S3、将一个样本的数据组织成矩阵形式,用稀疏的卷积核来提取语义特征;
其中,所述的步骤S3中将每个样本序列组织成矩阵形式,时间序列的属性全集可以表示为A={αi},i=1,2,…,|A|,所有属性在样本每一时刻的值构成矩阵X,X∈RT×|A|,其中T是帧的数量,|A|是属性的数量,其矩阵形式如下所示:
Figure GDA0003015666780000071
以稀疏的卷积核来提取时间序列的属性组合特征,每一种组合特征被称为该时间序列的一种语义,卷积核权重矩阵Wk∈Rt×|A|是宽为
Figure GDA0003015666780000072
的第k个卷积核的参数,当滑动步长为1时,矩阵X将被分成
Figure GDA0003015666780000073
个时间窗口:
Figure GDA0003015666780000074
因此使用滤波器Wk作用于全部时间窗口的结果为:
Figure GDA0003015666780000075
其中
Figure GDA0003015666780000076
为将第k个稀疏卷积核作用于第m个滑动窗口的结果,由于CNNs权重共享的特性,卷积核k在所有时间窗口上提取到相同的语义概念,定义 cm,k=f(Wk*Zm:m+t-1+bk),其中f是激活函数,*代表点乘算子,bk代表第 k个核的偏置。通过多个稀疏卷积核可以获得多种语义概念,同时对相邻行的卷积获得时间序列的短时依赖性。如何获得稀疏卷积核将在步骤S7中描述。
S4、对卷积后的特征图谱在时间维度上进行局部最大池化,获取时间段特征;
其中,所述的步骤S4中进行局部最大池化,以p代表池化窗口的大小,s代表时间维度上的步长。cm,k代表矩阵ck的第m行,第k列的激活值,将步骤S3得到的特征图谱作为池化层的输入。yj,k代表第k个滤波器的第 j个池化窗口的输出。局部最大池化层按照下式计算:
Figure GDA0003015666780000081
式中c*=(1+(j-1)*s,2+(j-1)*s,···,p+(j-1)*s)T,池化后得到矩阵 O∈RL ×K
Figure GDA0003015666780000082
K是滤波器数量,ceil(·)是向上取整函数。
S5、将步骤S4产生的特征按照时间段顺序输入LSTMs,每一时刻的隐含层状态输入维度等于滤波器个数的Softmax层,并产生下一时刻选择语义概念的注意力权重;
其中,所述的步骤S5中将每个时间步的隐含层状态输入维度等于滤波器个数的Softmax层,在每个时间步,模型产生预测向量(注意力权重) lt+1∈RK用于选取重要的语义概念。向量lt中的每个元素反映了对应语义概念的重要程度,获得t时刻的注意力权重后,则下一时刻的输入可以被改写为:
Figure GDA0003015666780000083
其中
Figure GDA0003015666780000084
代表池化后的矩阵O的第t行。经过LSTMs递归迭代和注意力机制选取语义概念后,得到样本n的最终特征向量
Figure GDA0003015666780000085
S6、取LSTMs最后时刻的隐含层状态输入维度等于类别个数的 Softmax层进行概率归一化;
S7、修改交叉熵损失函数,加入卷积核稀疏项约束,最小化损失函数更新参数并自动学习语义概念;
其中,所述的步骤S7需要加入卷积核稀疏项约束项,因此修改交叉熵损失函数如下:
Figure GDA0003015666780000091
第一项是最大似然损失函数,u代表训练数据,Cs是数据集中的第s个类,N代表训练集样本数量,δ(·)是Kronecker delta函数,r是样本un的真实标签,概率p(Cs|un)由
Figure GDA0003015666780000092
(所述的步骤S5产生)经过维度为类别个数的 Softmax层归一化后产生;第二项是矩阵WT的l21范式。用反向传播算法和 ADAM梯度优化算法最小化损失函数,更新参数直到收敛。
S8、使用步骤S2中划分的验证集测试训练后的模型,选取在验证集上表现最好的超参数对步骤S2中划分的测试集进行测试,获得最终准确率。
实施例二
图1是本实施例的流程图,如图1所示,本实施例公开一种基于语义选择的多变量时间序列分类方法,该方法具体包括以下步骤:
S1、收集UTD-MHAD动作序列数据集;
S2、因为是骨骼节点动作序列数据集,所以以左右臀部和中心节点坐标的平均值为原点进行去中心化操作,并以0补齐到121帧和平滑滤波去除噪声。最后遵守文献中定义的验证方法,进行跨主题验证方式,将全集 861个样本划分为431个样本的训练集和430个样本的测试集;
S3、如图2所示,动作序列可以被看作一种高维多变量时间序列,将该序列组织成矩阵形式,用稀疏的卷积核来提取语义特征。每一种变量(属性)的组合特征可以被称为该时间序列的一种语义,所有属性在样本每一时刻的值构成一个样本矩阵X。如图4所示,以矩阵X作为动作序列节点矩阵,对其进行稀疏卷积操作。设滤波器权重矩阵Wk时间维度为t,属性维度为60(骨骼节点数20,坐标3维),滑动步长设为1,滤波器个数为 K,矩阵X将被映射成(121-t+1)×K的特征图谱。
S4、对卷积后的特征图谱在时间维度上进行局部最大池化,获取时间段特征,以p代表池化窗口的大小,s代表时间维度上的步长。cm,k代表第 m行,第k列的激活值,将步骤S3得到的特征图谱作为池化层的输入。yj,k代表第k个滤波器的第j个池化窗口的输出。局部最大池化层按照下式计算:
Figure GDA0003015666780000101
其中c*=(1+(j-1)*s,2+(j-1)*s,···,p+(j-1)*s)T,池化后得到矩阵 O∈RL ×K
Figure GDA0003015666780000102
ceil(·)是向上取整函数。
S5、如图4所示将步骤S4产生的时间段特征逐时间段输入LSTMs,每一时刻得到的隐含层状态输入维度为K的softmax层,并产生下一时刻选择语义概念的注意力权重。在LSTMs的每个时间步t,模型产生预测向量(注意力权重)lt+1∈RK用于选取重要的语义概念。除最后时刻外,每个时刻的隐藏层状态都通过softmax层进行归一化,归一化过程如下所示:
Figure GDA0003015666780000103
其中
Figure GDA0003015666780000104
是映射到第k个标量的权重,k ∈(1,2,...,K),向量lt中的每个元素反映了对应语义概念的重要程度,获得t时刻的注意力权重后,则下一时刻的输入可以被改写为:
Figure GDA0003015666780000105
其中
Figure GDA0003015666780000106
代表池化后的矩阵O的第t行。经过LSTMs递归迭代和注意力机制选取语义概念后,得到样本n的最终特征向量
Figure GDA0003015666780000107
S6、取LSTMs最后时刻的隐含层状态p(Cs|un)输入维度为27(类别个数)的softmax层进行归一化。
S7、修改交叉熵损失函数,加入卷积核稀疏项约束,修改交叉熵损失函数如下:
Figure GDA0003015666780000111
第一项是最大似然损失函数,u代表训练数据,Cs是数据集中的第s个类,N等于431,δ(·)是Kronecker delta函数,γ是样本un的真实标签,第二项是矩阵WT的l21范式,定义为
Figure GDA0003015666780000113
其中W定义为: W=(W1,W2,···,WK)T,因此Wk,k∈(1,2,...,K)的每一行都是稀疏的。用反向传播算法和ADAM梯度优化算法最小化损失函数,更新参数直到收敛。
S8、当模型在步骤S2中划分的训练集上收敛后,保存下参数对步骤 S2中划分的测试集进行测试,最终在UTD-MHAD数据集上5次实验的平均准确率为95.11%,在UCF数据集上的平均准确率为99.45%,在UTKA数据集上达到了100%的准确率,都刷新了相应数据集的最好结果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于语义选择的多变量时间序列分类方法,其特征在于,所述的多变量时间序列分类方法包括下列步骤:
S1、收集时间序列数据集;
S2、对数据进行预处理操作,然后按照数据集定义的验证方法划分训练集,验证集和测试集;
S3、将一个样本的数据组织成矩阵形式,用稀疏的卷积核来提取语义特征,此处卷积核用于滤波,也称为滤波器;
所述的步骤S3过程如下:
将每个样本序列组织成矩阵形式,时间序列的属性全集表示为A={αi},i=1,2,…,|A|,所有属性在样本每一时刻的值构成矩阵X,X∈RT×|A|,其中T是帧的数量,|A|是属性的数量,其矩阵形式如下所示:
Figure FDA0003015666770000011
以稀疏的卷积核来提取时间序列的属性组合特征,每一种组合特征被称为该时间序列的一种语义,卷积核权重矩阵Wk∈Rt×|A|是宽为
Figure FDA0003015666770000012
的第k个卷积核的参数,当滑动步长为1时,矩阵X将被分成
Figure FDA0003015666770000013
个时间窗口:
Figure FDA0003015666770000014
因此使用滤波器Wk作用于全部时间窗口的结果为:
Figure FDA0003015666770000015
其中
Figure FDA0003015666770000016
为将第k个稀疏卷积核作用于第m个滑动窗口的结果,同时激活值cm,k位于矩阵ck的第m行,第k列,由于CNNs权重共享的特性,卷积核k在所有时间窗口上提取到相同的语义概念,定义cm,k=f(Wk*Zm:m+t-1+bk),其中f是激活函数,*代表点乘算子,bk代表第k个核的偏置;
通过多个稀疏卷积核获得多种语义概念,同时对相邻行的卷积获得时间序列的短时依赖性;
S4、对卷积后的特征图谱在时间维度上进行局部最大池化,获取时间段特征;
S5、将步骤S4产生的特征按照时间段顺序输入LSTMs,每一时刻的隐含层状态输入维度等于滤波器个数的Softmax层,并由维度等于滤波器个数的Softmax层计算产生下一时刻选择语义概念的注意力权重;
S6、取LSTMs最后时刻的隐含层状态输入维度等于类别个数的Softmax层进行概率归一化;
S7、修改交叉熵损失函数,加入卷积核稀疏项约束,通过最小化损失函数获得梯度,从而更新参数并自动学习语义概念;
S8、使用步骤S2中划分的验证集测试训练后的模型,选取在验证集上表现最好的超参数对步骤S2中划分的测试集进行测试,获得最终准确率。
2.根据权利要求1所述的一种基于语义选择的多变量时间序列分类方法,其特征在于,所述的步骤S2中对数据进行预处理操作包括去中心化、平滑滤波、归一化。
3.根据权利要求1所述的一种基于语义选择的多变量时间序列分类方法,其特征在于,所述的步骤S4过程如下:
进行局部最大池化,以p代表池化窗口的大小,s代表时间维度上的步长,cm,k代表矩阵ck的第m行,第k列的激活值,将步骤S3得到的特征图谱作为池化层的输入,yj,k代表第k个滤波器的第j个池化窗口的输出,局部最大池化层按照下式计算:
Figure FDA0003015666770000031
式中c*=(1+(j-1)*s,2+(j-1)*s,···,p+(j-1)*s)T,池化后得到矩阵O∈RL×K
Figure FDA0003015666770000032
K是滤波器数量,ceil(·)是向上取整函数。
4.根据权利要求1所述的一种基于语义选择的多变量时间序列分类方法,其特征在于,所述的步骤S5过程如下:
将每个时间步的隐含层状态输入维度等于滤波器个数的Softmax层,在每个时间步,模型产生预测向量lt+1∈RK用于选取重要的语义概念,其中,预测向量为注意力权重,向量lt中的每个元素反映对应语义概念的重要程度,获得t时刻的注意力权重后,则下一时刻的输入可以被改写为:
Figure FDA0003015666770000033
其中
Figure FDA0003015666770000034
代表池化后的矩阵O的第t行,同时矩阵O的第t行对应t时刻的预测值,经过LSTMs递归迭代和注意力机制选取语义概念后,得到样本n的最终特征向量
Figure FDA0003015666770000035
5.根据权利要求4所述的一种基于语义选择的多变量时间序列分类方法,其特征在于,所述的步骤S7过程如下:
加入卷积核稀疏项约束项,因此修改交叉熵损失函数如下:
Figure FDA0003015666770000036
上式中第一项是最大似然损失函数,u代表训练数据,Cs是数据集中的第s个类,N代表训练集样本数量,δ(·)是Kronecker delta函数,r是样本un的真实标签,概率p(Cs|un)由步骤S5中产生的
Figure FDA0003015666770000037
经过维度为类别个数的Softmax层归一化后产生;上式中第二项是矩阵WT的l21范式,用反向传播算法和ADAM梯度优化算法最小化损失函数,更新参数直到收敛。
CN201810004240.7A 2018-01-03 2018-01-03 一种基于语义选择的多变量时间序列分类方法 Active CN108182260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810004240.7A CN108182260B (zh) 2018-01-03 2018-01-03 一种基于语义选择的多变量时间序列分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810004240.7A CN108182260B (zh) 2018-01-03 2018-01-03 一种基于语义选择的多变量时间序列分类方法

Publications (2)

Publication Number Publication Date
CN108182260A CN108182260A (zh) 2018-06-19
CN108182260B true CN108182260B (zh) 2021-06-08

Family

ID=62549939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810004240.7A Active CN108182260B (zh) 2018-01-03 2018-01-03 一种基于语义选择的多变量时间序列分类方法

Country Status (1)

Country Link
CN (1) CN108182260B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740481B (zh) * 2018-12-26 2019-12-10 山东科技大学 基于跳跃连接的cnn与lstm结合的房颤信号分类系统
CN110222840B (zh) * 2019-05-17 2023-05-05 中山大学 一种基于注意力机制的集群资源预测方法和装置
CN110196946B (zh) * 2019-05-29 2021-03-30 华南理工大学 一种基于深度学习的个性化推荐方法
CN110263916B (zh) * 2019-05-31 2021-09-10 腾讯科技(深圳)有限公司 数据处理方法和装置、存储介质及电子装置
CN112565200B (zh) * 2020-11-16 2022-02-11 浙江大学 基于边缘智能的工控网络误用入侵检测预警系统
CN112686881B (zh) * 2020-11-25 2023-06-06 西安石油大学 基于影像统计特征和lstm复合网络的颗粒物料混合均匀性检测方法
CN112508173B (zh) * 2020-12-02 2024-06-28 中南大学 交通时空序列多步预测方法、系统及存储介质
CN112465054B (zh) * 2020-12-07 2023-07-11 深圳市检验检疫科学研究院 一种基于fcn的多变量时间序列数据分类方法
CN112712117B (zh) * 2020-12-30 2024-03-26 银江技术股份有限公司 一种基于全卷积注意力的多元时间序列分类方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273800A (zh) * 2017-05-17 2017-10-20 大连理工大学 一种基于注意机制的卷积递归神经网络的动作识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350653A1 (en) * 2015-06-01 2016-12-01 Salesforce.Com, Inc. Dynamic Memory Network
US20170294091A1 (en) * 2016-04-06 2017-10-12 Nec Laboratories America, Inc. Video-based action recognition security system
CN106096568B (zh) * 2016-06-21 2019-06-11 同济大学 一种基于cnn和卷积lstm网络的行人再识别方法
CN107506712B (zh) * 2017-08-15 2021-05-18 成都考拉悠然科技有限公司 一种基于3d深度卷积网络的人类行为识别的方法
CN107506722A (zh) * 2017-08-18 2017-12-22 中国地质大学(武汉) 一种基于深度稀疏卷积神经网络人脸情感识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273800A (zh) * 2017-05-17 2017-10-20 大连理工大学 一种基于注意机制的卷积递归神经网络的动作识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Global Context-Aware Attention LSTM Networks for 3D Action Recognition;Jun Liu et al;《IEEE Xplore》;20171109;第1647-1654页 *

Also Published As

Publication number Publication date
CN108182260A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
CN108182260B (zh) 一种基于语义选择的多变量时间序列分类方法
US11501192B2 (en) Systems and methods for Bayesian optimization using non-linear mapping of input
US10019629B2 (en) Skeleton-based action detection using recurrent neural network
CN108062505B (zh) 用于基于神经网络的动作检测的方法和设备
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN111339942B (zh) 基于视点调整的图卷积循环网络骨骼动作识别方法及系统
CN111091045A (zh) 一种基于时空注意力机制的手语识别方法
CN109190537A (zh) 一种基于掩码感知深度强化学习的多人物姿态估计方法
CN103544496B (zh) 基于空间与时间信息融合的机器人场景识别方法
CN108171318B (zh) 一种基于模拟退火—高斯函数的卷积神经网络集成方法
CN111291556A (zh) 基于实体义项的字和词特征融合的中文实体关系抽取方法
CN113111814A (zh) 基于正则化约束的半监督行人重识别方法及装置
CN111783754B (zh) 基于部位上下文的人体属性图像分类方法、系统和装置
CN109753897A (zh) 基于记忆单元强化-时序动态学习的行为识别方法
Ning et al. Conditional generative adversarial networks based on the principle of homologycontinuity for face aging
CN113158815A (zh) 一种无监督行人重识别方法、系统及计算机可读介质
CN110264407A (zh) 图像超分辨模型训练及重建方法、装置、设备及存储介质
CN113158861A (zh) 一种基于原型对比学习的运动分析方法
CN112749737A (zh) 图像分类方法及装置、电子设备、存储介质
CN116229179A (zh) 基于宽度学习系统的双松弛图像分类方法
CN113407820B (zh) 利用模型进行数据处理的方法及相关系统、存储介质
CN110990630B (zh) 一种基于图建模视觉信息的利用问题指导的视频问答方法
CN116543237B (zh) 无源域无监督域适应的图像分类方法、系统、设备及介质
CN113408721A (zh) 神经网络结构搜索方法、装置、计算机设备和存储介质
CN110993121A (zh) 一种基于双协同线性流形的药物关联预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant