CN116257786A - 一种基于多元时序图结构的异步时间序列分类方法 - Google Patents
一种基于多元时序图结构的异步时间序列分类方法 Download PDFInfo
- Publication number
- CN116257786A CN116257786A CN202211093387.0A CN202211093387A CN116257786A CN 116257786 A CN116257786 A CN 116257786A CN 202211093387 A CN202211093387 A CN 202211093387A CN 116257786 A CN116257786 A CN 116257786A
- Authority
- CN
- China
- Prior art keywords
- time
- sample
- node
- sensor
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于图计算与时间序列序列分类领域,公开了一种基于多元时序图网络的异步时间序列分类方法,该方法构建了一个多元交互模块来处理缺失信息,并自动提取图结构关系,设计了一种新的邻接图传播机制来聚合当前和以前的多步快照的邻居信息,并构建了基于掩码时间感知的注意力模块用于学习观测值之间的时间相关性。本发明在对异步时序数据进行分类的过程中,实现了对缺失观测值的填充以及信息在不同传感器间相互传播,提高了算法在数据大量缺失下的鲁棒性,同时考虑时序数据在时间戳上下文的绝对意义和时间间隔的异步性,提高了多维异步时序数据的分类效果。
Description
技术领域
本发明属于图计算与时间序列序列分类领域,尤其涉及一种基于多元时序图网络的异步时间序列分类方法。
背景技术
多维异步时间序列常出现在医学、金融学、气候科学等日常领域,它是观测时间间隔不规则的采样序列,序列之间的采样率通常也是异步的,且数据中存在较多不规则缺失。多维异步时间序列一般用于分类、预测等任务,例如,基于医疗中的非规则的健康记录数据分析,进行患者死亡风险预测、疾病早期检测、患者分型等等。
传统的分类算法,如机器学习、神经网络等都要求数据是规则的,具体包括固定的数据维度,连续且固定的时间采样。当前学者们主要通过研究填充对齐数据的方法,补全缺失信息,将数据处理成规则的时间序列后,再使用经典的分类算法进行分析。这些方法数据处理的方法,仅仅在单数据维度中结合时间依赖性进行简单的数据填充、插值补全,没有充分考虑到多个数据维度之间(传感器之间)存在的相互依赖性,导致最后的分类效果鲁棒性不强。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于多元时序图网络的异步时间序列分类方法。
本发明的目的是通过以下技术方案来实现的:
一种基于多元时序图网络的异步时间序列分类方法,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新;
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
进一步地,所述步骤二通过以下子步骤来实现:
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络。
进一步地,所述步骤二包括如下具体步骤:
将每个样本看作一个有向图其中/>表示d个传感器构成的节点集合,节点vi表示第i个传感器,/>是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边,/> 其中/>表示在时刻t节点vi对vj的重要性;
对于样本sk在第i个传感器上t时刻被观测到的数据使用非线性映射将其映射到更高维空间/>其中/>为样本sk节点vi在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
在获得节点的初始表示后,通过匹配节点的嵌入来计算注意系数,即时刻t节点vi对vj的重要性:
根据学习到的注意力系数,即时刻t节点vi对vj的重要性,对样本两两节点的连接及相关权重进行重构:
通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
进一步地,所述步骤三通过以下子步骤来实现:
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息。
进一步地,所述步骤三包括如下具体步骤:
对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息,使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
其中W(l)和为可训练参数,R=2表示最长时间步,为预定义参数,/>表示节点vi在时刻t-r的邻居节点,t-r表示时刻t前第r个时刻,t-0=t,/>表示在第l层节点vi在t时刻和其在t-r时刻的邻居vj的注意力得分,其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得,图卷积模块总层数L=2,从而获得节点多跳邻居节点信息。
进一步地,所述步骤四通过以下子步骤来实现:
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达。
进一步地,所述步骤四包括如下具体步骤:
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
其中为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt),/>为规范化的时间间隔矩阵,其元素/>表示嵌入表达/>和/>之间的规范化的时间间隔,其中表示除0外最小的时间间隔;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
进一步地,所述步骤五通过以下子步骤来实现:
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征进行拼接操作,获得单个样本的嵌入表达;
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
进一步地,所述步骤五包括如下具体步骤:
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。
本发明的有益效果是:本发明是面向图计算与时序数据分类领域的基于掩码时间感知注意力机制的异步时序数据分类方法,具有如下优势:
(1)本发明提出一种基于多元时序图网络的异步时间序列分类方法。通过多元交互模块来处理缺失信息,并自动提取多传感器间图结构关系,使用图神经网络实现传感器数据信息间的互相传播,在传感器数据大量缺失的情况下,算法鲁棒性高。
(2)本发明提出使用基于掩码时间感知注意力机制,考虑时序数据在时序上的相关性,学习了传感器中不同时刻间的相互关系,提高了算法的分类效果。
附图说明
图1为本发明的基于多元时序图结构的异步时间序列分类方法整体框架图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例仅用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明的一种基于多元时序图网络的异步时间序列分类方法,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
对于给出的K个异步时序样本数据其中yk∈{1,2,...,C}是样本sk的标签,每个单一样本在d个传感器上有观测序列sk={sk,i∣i=1,...,d},其中/>表示样本sk在第i个传感器上的观测序列,xk,i,m表示样本sk在第i个传感器上的第m个观测值(观测时间为/>),样本sk在第i个传感器上一共有Nk,i个观测值,一般对于任意两个传感器i≠j,有/>且Nk,i≠Nk,j。
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
我们将每个样本(例如样本sk)看作一个有向图其中/>表示d个传感器构成的节点集合,节点vi表示第i个传感器。/>是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边。
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
对于样本sk在第i个传感器上t时刻被观测到的数据使用非线性映射将其映射到更高维空间/>其中/>为样本sk节点vj在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络;
在获得节点的初始表示后,我们考虑时间间隔不规则性的影响,通过匹配节点的嵌入来计算注意系数(即时刻t节点vi对vj的重要性):
根据学习到的注意力系数(即时刻t节点vi对vj的重要性),可对样本两两节点的连接及相关权重进行重构:
进一步,我们通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新。
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息;
邻接图邻居聚合模块,对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息。我们使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
其中W(l)和/>为可训练参数,R=2表示最长时间步,为预定义参数,/>表示节点vi在时刻t-r(t-r表示时刻t前第r个时刻,t-0=t)的邻居节点,/>表示在第l层节点vi在t时刻和其在t-r时刻的邻居vj的注意力得分,其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得。图卷积模块总层数L=2,从而获得节点多跳邻居节点信息。
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
其中为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt)。/>为规范化的时间间隔矩阵,其元素/>表示嵌入表达/>和/>之间的规范化的时间间隔,其中表示除0外最小的时间间隔。
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征(当数据样本存在静态属性时)进行拼接操作,获得单个样本的嵌入表达;
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,例如求和、求均值、拼接操作,此处使用拼接操作。
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。
Claims (9)
1.一种基于多元时序图网络的异步时间序列分类方法,其特征在于,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新;
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
2.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤二通过以下子步骤来实现:
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络。
3.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤二包括如下具体步骤:
将每个样本看作一个有向图其中/>表示d个传感器构成的节点集合,节点vi表示第i个传感器,/>是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边,/> 其中/>表示在时刻t节点vi对vj的重要性;
对于样本sk在第i个传感器上t时刻被观测到的数据使用非线性映射将其映射到更高维空间/>其中/>为样本sk节点vi在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
在获得节点的初始表示后,通过匹配节点的嵌入来计算注意系数,即时刻t节点vi对vj的重要性:
根据学习到的注意力系数,即时刻t节点vi对vj的重要性,对样本两两节点的连接及相关权重进行重构:
通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
4.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤三通过以下子步骤来实现:
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息。
5.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤三包括如下具体步骤:
对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息,使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
6.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤四通过以下子步骤来实现:
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达。
7.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤四包括如下具体步骤:
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
其中为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt),/>为规范化的时间间隔矩阵,其元素/>表示嵌入表达/>和/>之间的规范化的时间间隔,其中表示除0外最小的时间间隔;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
8.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤五通过以下子步骤来实现:
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征进行拼接操作,获得单个样本的嵌入表达;
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
9.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤五包括如下具体步骤:
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211093387.0A CN116257786A (zh) | 2022-09-08 | 2022-09-08 | 一种基于多元时序图结构的异步时间序列分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211093387.0A CN116257786A (zh) | 2022-09-08 | 2022-09-08 | 一种基于多元时序图结构的异步时间序列分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116257786A true CN116257786A (zh) | 2023-06-13 |
Family
ID=86679887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211093387.0A Pending CN116257786A (zh) | 2022-09-08 | 2022-09-08 | 一种基于多元时序图结构的异步时间序列分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116257786A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079815A (zh) * | 2023-08-21 | 2023-11-17 | 哈尔滨工业大学 | 一种基于图神经网络的心血管疾病风险预测模型构建方法 |
-
2022
- 2022-09-08 CN CN202211093387.0A patent/CN116257786A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079815A (zh) * | 2023-08-21 | 2023-11-17 | 哈尔滨工业大学 | 一种基于图神经网络的心血管疾病风险预测模型构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
CN111538761A (zh) | 基于注意力机制的点击率预测方法 | |
CN111861756B (zh) | 一种基于金融交易网络的团伙检测方法及其实现装置 | |
CN113808693A (zh) | 一种基于图神经网络和注意力机制的药物推荐方法 | |
CN113688253B (zh) | 一种层次感知的时态知识图谱表示学习方法 | |
CN113190654A (zh) | 一种基于实体联合嵌入和概率模型的知识图谱补全方法 | |
CN109344992A (zh) | 一种融合时空因素的智能家居用户操控行为习惯建模方法 | |
CN116844041A (zh) | 一种基于双向卷积时间自注意力机制的耕地提取方法 | |
CN117196763A (zh) | 基于时序感知自注意力和对比学习的商品序列推荐方法 | |
CN112163020A (zh) | 一种多维时间序列异常检测方法及检测系统 | |
CN116257786A (zh) | 一种基于多元时序图结构的异步时间序列分类方法 | |
CN110289987B (zh) | 基于表征学习的多智能体系统网络抗攻击能力评估方法 | |
CN115204509A (zh) | 一种呼吸系统住院病人数量预测方法 | |
CN117194763A (zh) | 基于用户偏好与时空上下文信息的下一个poi推荐方法 | |
CN115391563A (zh) | 一种基于多源异构数据融合的知识图谱链路预测方法 | |
CN115205782A (zh) | 一种基于数字孪生技术的喂饭机器人集群监测管理方法 | |
CN113298131B (zh) | 一种基于注意力机制的时序数据缺失值插补方法 | |
CN116306780B (zh) | 一种动态图链接生成方法 | |
CN112529637B (zh) | 基于情景感知的服务需求动态预测方法及系统 | |
CN114169433A (zh) | 一种基于联邦学习+图学习+cnn的工业故障预测方法 | |
CN115293249A (zh) | 一种基于动态时序预测的电力系统典型场景概率预测方法 | |
CN113870241A (zh) | 一种基于胶囊神经网络的药片缺陷识别方法和装置 | |
CN113935458A (zh) | 基于卷积自编码深度学习的空气污染多站点联合预测方法 | |
CN111126364A (zh) | 一种基于分组卷积神经网络的表情识别方法 | |
CN114863356B (zh) | 一种基于残差聚合图网络的群体活动识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |