CN116257786A - 一种基于多元时序图结构的异步时间序列分类方法 - Google Patents

一种基于多元时序图结构的异步时间序列分类方法 Download PDF

Info

Publication number
CN116257786A
CN116257786A CN202211093387.0A CN202211093387A CN116257786A CN 116257786 A CN116257786 A CN 116257786A CN 202211093387 A CN202211093387 A CN 202211093387A CN 116257786 A CN116257786 A CN 116257786A
Authority
CN
China
Prior art keywords
time
sample
node
sensor
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211093387.0A
Other languages
English (en)
Inventor
王振
姜婷
许增辉
张吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202211093387.0A priority Critical patent/CN116257786A/zh
Publication of CN116257786A publication Critical patent/CN116257786A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于图计算与时间序列序列分类领域,公开了一种基于多元时序图网络的异步时间序列分类方法,该方法构建了一个多元交互模块来处理缺失信息,并自动提取图结构关系,设计了一种新的邻接图传播机制来聚合当前和以前的多步快照的邻居信息,并构建了基于掩码时间感知的注意力模块用于学习观测值之间的时间相关性。本发明在对异步时序数据进行分类的过程中,实现了对缺失观测值的填充以及信息在不同传感器间相互传播,提高了算法在数据大量缺失下的鲁棒性,同时考虑时序数据在时间戳上下文的绝对意义和时间间隔的异步性,提高了多维异步时序数据的分类效果。

Description

一种基于多元时序图结构的异步时间序列分类方法
技术领域
本发明属于图计算与时间序列序列分类领域,尤其涉及一种基于多元时序图网络的异步时间序列分类方法。
背景技术
多维异步时间序列常出现在医学、金融学、气候科学等日常领域,它是观测时间间隔不规则的采样序列,序列之间的采样率通常也是异步的,且数据中存在较多不规则缺失。多维异步时间序列一般用于分类、预测等任务,例如,基于医疗中的非规则的健康记录数据分析,进行患者死亡风险预测、疾病早期检测、患者分型等等。
传统的分类算法,如机器学习、神经网络等都要求数据是规则的,具体包括固定的数据维度,连续且固定的时间采样。当前学者们主要通过研究填充对齐数据的方法,补全缺失信息,将数据处理成规则的时间序列后,再使用经典的分类算法进行分析。这些方法数据处理的方法,仅仅在单数据维度中结合时间依赖性进行简单的数据填充、插值补全,没有充分考虑到多个数据维度之间(传感器之间)存在的相互依赖性,导致最后的分类效果鲁棒性不强。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于多元时序图网络的异步时间序列分类方法。
本发明的目的是通过以下技术方案来实现的:
一种基于多元时序图网络的异步时间序列分类方法,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新;
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
进一步地,所述步骤二通过以下子步骤来实现:
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络。
进一步地,所述步骤二包括如下具体步骤:
将每个样本看作一个有向图
Figure BDA0003837924730000021
其中/>
Figure BDA0003837924730000022
表示d个传感器构成的节点集合,节点vi表示第i个传感器,/>
Figure BDA0003837924730000023
是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边,/>
Figure BDA0003837924730000024
Figure BDA0003837924730000025
其中/>
Figure BDA0003837924730000026
表示在时刻t节点vi对vj的重要性;
对于样本sk在第i个传感器上t时刻被观测到的数据
Figure BDA0003837924730000027
使用非线性映射将其映射到更高维空间/>
Figure BDA0003837924730000028
其中/>
Figure BDA0003837924730000029
为样本sk节点vi在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
Figure BDA00038379247300000210
其中
Figure BDA00038379247300000211
是其最近时间τ<t的观测值,/>
Figure BDA00038379247300000212
为第j个传感器观测值的经验均值,衰变率/>
Figure BDA00038379247300000213
为可训练变量,wλ、bλ为可训练参数;
在获得节点的初始表示后,通过匹配节点的嵌入来计算注意系数,即时刻t节点vi对vj的重要性:
Figure BDA00038379247300000214
其中c和Wα为可训练参数,σ为sigmoid激活函数,
Figure BDA00038379247300000215
为时刻t的时间戳编码向量表示,dt=12表示向量的维度,为预定义的参数,计算方式如下:
Figure BDA0003837924730000031
其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值,
Figure BDA0003837924730000032
为可训练参数集合;
根据学习到的注意力系数,即时刻t节点vi对vj的重要性,对样本两两节点的连接及相关权重进行重构:
Figure BDA0003837924730000033
通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
进一步地,所述步骤三通过以下子步骤来实现:
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息。
进一步地,所述步骤三包括如下具体步骤:
对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息,使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
Figure BDA0003837924730000034
其中W(l)
Figure BDA0003837924730000035
为可训练参数,R=2表示最长时间步,为预定义参数,/>
Figure BDA0003837924730000036
表示节点vi在时刻t-r的邻居节点,t-r表示时刻t前第r个时刻,t-0=t,/>
Figure BDA0003837924730000037
表示在第l层节点vi在t时刻和其在t-r时刻的邻居vj的注意力得分,其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得,图卷积模块总层数L=2,从而获得节点多跳邻居节点信息。
进一步地,所述步骤四通过以下子步骤来实现:
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达。
进一步地,所述步骤四包括如下具体步骤:
针对样本sk中节点vi在上一步最后一层,即第L=2层获得的长度
Figure BDA0003837924730000041
的嵌入表达序列/>
Figure BDA0003837924730000042
将其与对应时间戳编码向量进行拼接,获得包含时间位置信息的嵌入表达矩阵/>
Figure BDA0003837924730000043
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
Figure BDA0003837924730000044
其中
Figure BDA0003837924730000045
为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt),/>
Figure BDA0003837924730000046
为规范化的时间间隔矩阵,其元素/>
Figure BDA0003837924730000047
表示嵌入表达/>
Figure BDA0003837924730000048
和/>
Figure BDA0003837924730000049
之间的规范化的时间间隔,其中
Figure BDA00038379247300000410
表示除0外最小的时间间隔;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
Figure BDA00038379247300000411
其中⊙表示表示点乘运算,
Figure BDA00038379247300000412
表示元素全为1的列向量,Mk,i为样本sk在第i个传感器上的掩码矩阵,表示样本sk在第i个传感器上的观测值哪一部分是缺失值,如:
Figure BDA00038379247300000413
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
进一步地,所述步骤五通过以下子步骤来实现:
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征进行拼接操作,获得单个样本的嵌入表达;
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
进一步地,所述步骤五包括如下具体步骤:
对存在静态属性/特征xk,0的样本sk,使用一个额外的非线性映射将静态属性特征映射到统一空间:ak=σ(W0xk,0),其中
Figure BDA0003837924730000051
d=4为预定义参数,σ为Relu非线性激活函数;
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,
使用一组全连接层将样本图级特征转换到目标空间
Figure BDA0003837924730000052
其中/>
Figure BDA0003837924730000053
为模型对样本sk的分类结果,最后使用随机梯度下降的优化方法,对模型进行训练,模型的损失函数为:
Figure BDA0003837924730000054
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。
本发明的有益效果是:本发明是面向图计算与时序数据分类领域的基于掩码时间感知注意力机制的异步时序数据分类方法,具有如下优势:
(1)本发明提出一种基于多元时序图网络的异步时间序列分类方法。通过多元交互模块来处理缺失信息,并自动提取多传感器间图结构关系,使用图神经网络实现传感器数据信息间的互相传播,在传感器数据大量缺失的情况下,算法鲁棒性高。
(2)本发明提出使用基于掩码时间感知注意力机制,考虑时序数据在时序上的相关性,学习了传感器中不同时刻间的相互关系,提高了算法的分类效果。
附图说明
图1为本发明的基于多元时序图结构的异步时间序列分类方法整体框架图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例仅用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明的一种基于多元时序图网络的异步时间序列分类方法,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
对于给出的K个异步时序样本数据
Figure BDA0003837924730000061
其中yk∈{1,2,...,C}是样本sk的标签,每个单一样本在d个传感器上有观测序列sk={sk,i∣i=1,...,d},其中/>
Figure BDA0003837924730000062
表示样本sk在第i个传感器上的观测序列,xk,i,m表示样本sk在第i个传感器上的第m个观测值(观测时间为/>
Figure BDA0003837924730000063
),样本sk在第i个传感器上一共有Nk,i个观测值,一般对于任意两个传感器i≠j,有/>
Figure BDA0003837924730000064
且Nk,i≠Nk,j
Figure BDA0003837924730000065
表示样本sk在所有传感器下的观测时间点,将所有传感器上的观测值在时间/>
Figure BDA0003837924730000066
上进行对齐,缺失时进行标记,从而有/>
Figure BDA0003837924730000067
亦记为/>
Figure BDA0003837924730000068
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
我们将每个样本(例如样本sk)看作一个有向图
Figure BDA0003837924730000069
其中/>
Figure BDA00038379247300000610
表示d个传感器构成的节点集合,节点vi表示第i个传感器。/>
Figure BDA00038379247300000611
是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边。
Figure BDA00038379247300000612
其中/>
Figure BDA00038379247300000613
表示在时刻t节点vi对vj的重要性。
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
对于样本sk在第i个传感器上t时刻被观测到的数据
Figure BDA00038379247300000614
使用非线性映射将其映射到更高维空间/>
Figure BDA00038379247300000615
其中/>
Figure BDA00038379247300000616
为样本sk节点vj在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
Figure BDA00038379247300000617
其中
Figure BDA00038379247300000618
是其最近时间τ<t的观测值,/>
Figure BDA00038379247300000619
为第j个传感器观测值的经验均值,衰变率/>
Figure BDA0003837924730000071
为可训练变量,wλ、bλ为可训练参数。/>
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络;
在获得节点的初始表示后,我们考虑时间间隔不规则性的影响,通过匹配节点的嵌入来计算注意系数(即时刻t节点vi对vj的重要性):
Figure BDA0003837924730000072
其中c和Wα为可训练参数,σ为sigmoid激活函数,
Figure BDA0003837924730000073
为时刻t的时间戳编码向量表示,dt=12表示向量的维度,为预定义的参数,计算方式如下:
Figure BDA0003837924730000074
其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值,
Figure BDA0003837924730000075
为可训练参数集合。
根据学习到的注意力系数(即时刻t节点vi对vj的重要性),可对样本两两节点的连接及相关权重进行重构:
Figure BDA0003837924730000076
进一步,我们通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新。
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息;
邻接图邻居聚合模块,对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息。我们使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
Figure BDA0003837924730000077
其中W(l)和/>
Figure BDA0003837924730000081
为可训练参数,R=2表示最长时间步,为预定义参数,/>
Figure BDA0003837924730000082
表示节点vi在时刻t-r(t-r表示时刻t前第r个时刻,t-0=t)的邻居节点,/>
Figure BDA0003837924730000083
表示在第l层节点vi在t时刻和其在t-r时刻的邻居vj的注意力得分,其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得。图卷积模块总层数L=2,从而获得节点多跳邻居节点信息。
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
针对样本sk中节点vi在上一步最后一层(第L=2层)获得的长度
Figure BDA0003837924730000084
的嵌入表达序列/>
Figure BDA0003837924730000085
将其与对应时间戳编码向量进行拼接,获得包含时间位置信息的嵌入表达矩阵/>
Figure BDA0003837924730000086
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
Figure BDA0003837924730000087
其中
Figure BDA0003837924730000088
为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt)。/>
Figure BDA0003837924730000089
为规范化的时间间隔矩阵,其元素/>
Figure BDA00038379247300000810
表示嵌入表达/>
Figure BDA00038379247300000811
和/>
Figure BDA00038379247300000812
之间的规范化的时间间隔,其中
Figure BDA00038379247300000815
表示除0外最小的时间间隔。
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
Figure BDA00038379247300000814
其中⊙表示表示点乘运算,
Figure BDA0003837924730000091
表示元素全为1的列向量,Mk,i为样本sk在第i个传感器上的掩码矩阵(0-1矩阵),表示样本sk在第i个传感器上的观测值哪一部分是缺失值,如:
Figure BDA0003837924730000092
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征(当数据样本存在静态属性时)进行拼接操作,获得单个样本的嵌入表达;
对存在静态属性/特征xk,0的样本sk,使用一个额外的非线性映射将静态属性特征映射到统一空间:ak=σ(W0xk,0),其中
Figure BDA0003837924730000093
(d=4为预定义参数),σ为Relu非线性激活函数。
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,例如求和、求均值、拼接操作,此处使用拼接操作。
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
使用一组全连接层将样本图级特征转换到目标空间
Figure BDA0003837924730000094
其中/>
Figure BDA0003837924730000095
为模型对样本sk的分类结果。最后使用随机梯度下降(SGD)的优化方法,对模型进行训练。模型的损失函数为:
Figure BDA0003837924730000096
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。

Claims (9)

1.一种基于多元时序图网络的异步时间序列分类方法,其特征在于,包括以下步骤:
步骤一:根据单个异步时序样本数据情况,将时序数据在单个样本上对齐,没有观测值的时刻定义为观测值缺失;
步骤二:针对每个样本,在多元交互模块中,学习所有传感器之间的关联权重,构建有向时序图网络;
步骤三:针对每个样本,在邻接图邻居聚合模块中,通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新;
步骤四:考虑样本中每个传感器不同时间前后的关联,构建基于掩码时间感知的注意力模块,学习观测值间的时间相关性,集成传感器各个时间点的数据,生成单个传感器嵌入表达;
步骤五:将样本各传感器的数据与样本静态特征进行结合,获得样本最终特征,最后使用线性分类方法对样本进行分类训练。
2.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤二通过以下子步骤来实现:
步骤2.1:使用可训练衰减机制捕捉变量的缺失模式,对缺失的观测值进行填充;
步骤2.2:将样本在传感器上的观测值映射到高维空间,获得节点的初始表示;
步骤2.3:通过匹配节点的嵌入来计算注意力系数,即学习传感器间的关联权重,从而构建有向时序图网络。
3.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤二包括如下具体步骤:
将每个样本看作一个有向图
Figure FDA0003837924720000011
其中/>
Figure FDA0003837924720000012
表示d个传感器构成的节点集合,节点vi表示第i个传感器,/>
Figure FDA0003837924720000013
是有向图的带权有向边,其中ek,ij>0表示从节点vi到vj边的权重,ek,ij=0表示从节点vi到vj之间不存在边,/>
Figure FDA0003837924720000014
Figure FDA0003837924720000015
其中/>
Figure FDA0003837924720000016
表示在时刻t节点vi对vj的重要性;
对于样本sk在第i个传感器上t时刻被观测到的数据
Figure FDA0003837924720000017
使用非线性映射将其映射到更高维空间/>
Figure FDA0003837924720000018
其中/>
Figure FDA0003837924720000019
为样本sk节点vi在t时刻的初始表示,dh=4表示向量维度;如果样本sk在第i个传感器上t时刻的值未被观测到,则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间:
Figure FDA0003837924720000021
其中
Figure FDA0003837924720000022
是其最近时间τ<t的观测值,/>
Figure FDA0003837924720000023
为第j个传感器观测值的经验均值,衰变率/>
Figure FDA0003837924720000024
为可训练变量,wλ、bλ为可训练参数;
在获得节点的初始表示后,通过匹配节点的嵌入来计算注意系数,即时刻t节点vi对vj的重要性:
Figure FDA0003837924720000025
/>
其中c和Wα为可训练参数,σ为sigmoid激活函数,
Figure FDA0003837924720000026
为时刻t的时间戳编码向量表示,dt=12表示向量的维度,为预定义的参数,计算方式如下:
Figure FDA0003837924720000027
其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值,
Figure FDA0003837924720000028
为可训练参数集合;
根据学习到的注意力系数,即时刻t节点vi对vj的重要性,对样本两两节点的连接及相关权重进行重构:
Figure FDA0003837924720000029
通过对每个样本前K%最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性,其中K=50为预定义的参数。
4.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤三通过以下子步骤来实现:
步骤3.1:使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重;
步骤3.2:聚合当前时刻和前R步时刻的邻居信息,对当前节点的信息进行更新,从而更新每个时间点上所有传感器数据的信息。
5.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤三包括如下具体步骤:
对每个邻居的影响进行建模,并在此影响下聚集邻居节点信息,使用一种特殊的R步马尔可夫性质的图卷积模块,来建模同一时刻内和跨时域间的依赖,学习邻接图的时间和结构信息,第l层的聚合过程如下:
Figure FDA0003837924720000031
其中W(l)
Figure FDA0003837924720000032
为可训练参数,R=2表示最长时间步,为预定义参数,/>
Figure FDA0003837924720000033
表示节点vi在时刻t-r的邻居节点,t-r表示时刻t前第r个时刻,t-0=t,/>
Figure FDA0003837924720000034
表示在第l层节点vi在t时刻和其在t-r时刻的邻居vj的注意力得分,其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得,图卷积模块总层数L=2,从而获得节点多跳邻居节点信息。
6.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤四通过以下子步骤来实现:
步骤4.1:将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接,获得包含时间位置信息的嵌入表达;
步骤4.2:使用基于时间间隔的Tansformer机制,学习各个时间步间的相互影响后信息;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达。
7.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤四包括如下具体步骤:
针对样本sk中节点vi在上一步最后一层,即第L=2层获得的长度
Figure FDA0003837924720000035
的嵌入表达序列
Figure FDA0003837924720000036
将其与对应时间戳编码向量进行拼接,获得包含时间位置信息的嵌入表达矩阵/>
Figure FDA0003837924720000037
使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达,计算过程如下:
Figure FDA0003837924720000038
其中
Figure FDA0003837924720000039
为计算query,key和value的可训练映射矩阵参数(dh=4,dt=12,dq=dk=dv=dh×dt),/>
Figure FDA00038379247200000310
为规范化的时间间隔矩阵,其元素/>
Figure FDA00038379247200000311
表示嵌入表达/>
Figure FDA00038379247200000312
和/>
Figure FDA00038379247200000313
之间的规范化的时间间隔,其中
Figure FDA00038379247200000314
表示除0外最小的时间间隔;
步骤4.3:将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均,获得最终各个样本每个传感器对应的掩码传感器嵌入表达;
计算Uk,i的元素的掩码平均值获得样本节点级别的嵌入表达:
Figure FDA0003837924720000041
其中⊙表示表示点乘运算,
Figure FDA0003837924720000042
表示元素全为1的列向量,Mk,i为样本sk在第i个传感器上的掩码矩阵,表示样本sk在第i个传感器上的观测值哪一部分是缺失值,如:
Figure FDA0003837924720000043
uk,i为样本sk的第i个传感器的单变量时间序列变量sk,i的最终节点级表示。
8.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤五通过以下子步骤来实现:
步骤5.1:将各个样本所有传感器上的嵌入表达与样本的静态属性特征进行拼接操作,获得单个样本的嵌入表达;
步骤5.2:使用分类器对样本进行分类,并使用SDG梯度下降方法对模型进行训练,在模型训练的过程中优化交叉熵损失函数。
9.根据权利要求1所述的异步时序数据分类方法,其特征在于,所述步骤五包括如下具体步骤:
对存在静态属性/特征xk,0的样本sk,使用一个额外的非线性映射将静态属性特征映射到统一空间:ak=σ(W0xk,0),其中
Figure FDA0003837924720000044
d=4为预定义参数,σ为Relu非线性激活函数;
然后对节点级嵌入表示信息以及静态属性表示信息进行汇总,获得多元时序序列的样本图级表示:
gk=Aggregate(uk,1,uk,2,...,uk,d,ak)
其中Aggregate表示任意的聚合操作,
使用一组全连接层将样本图级特征转换到目标空间
Figure FDA0003837924720000045
其中/>
Figure FDA0003837924720000046
为模型对样本sk的分类结果,最后使用随机梯度下降的优化方法,对模型进行训练,模型的损失函数为:
Figure FDA0003837924720000047
表示交叉熵损失函数,其中C表示样本类别个数,K表示样本个数。
CN202211093387.0A 2022-09-08 2022-09-08 一种基于多元时序图结构的异步时间序列分类方法 Pending CN116257786A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211093387.0A CN116257786A (zh) 2022-09-08 2022-09-08 一种基于多元时序图结构的异步时间序列分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211093387.0A CN116257786A (zh) 2022-09-08 2022-09-08 一种基于多元时序图结构的异步时间序列分类方法

Publications (1)

Publication Number Publication Date
CN116257786A true CN116257786A (zh) 2023-06-13

Family

ID=86679887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211093387.0A Pending CN116257786A (zh) 2022-09-08 2022-09-08 一种基于多元时序图结构的异步时间序列分类方法

Country Status (1)

Country Link
CN (1) CN116257786A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079815A (zh) * 2023-08-21 2023-11-17 哈尔滨工业大学 一种基于图神经网络的心血管疾病风险预测模型构建方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079815A (zh) * 2023-08-21 2023-11-17 哈尔滨工业大学 一种基于图神经网络的心血管疾病风险预测模型构建方法

Similar Documents

Publication Publication Date Title
CN111161535B (zh) 基于注意力机制的图神经网络交通流量预测方法及系统
CN111538761A (zh) 基于注意力机制的点击率预测方法
CN111861756B (zh) 一种基于金融交易网络的团伙检测方法及其实现装置
CN113808693A (zh) 一种基于图神经网络和注意力机制的药物推荐方法
CN113688253B (zh) 一种层次感知的时态知识图谱表示学习方法
CN113190654A (zh) 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN109344992A (zh) 一种融合时空因素的智能家居用户操控行为习惯建模方法
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
CN117196763A (zh) 基于时序感知自注意力和对比学习的商品序列推荐方法
CN112163020A (zh) 一种多维时间序列异常检测方法及检测系统
CN116257786A (zh) 一种基于多元时序图结构的异步时间序列分类方法
CN110289987B (zh) 基于表征学习的多智能体系统网络抗攻击能力评估方法
CN115204509A (zh) 一种呼吸系统住院病人数量预测方法
CN117194763A (zh) 基于用户偏好与时空上下文信息的下一个poi推荐方法
CN115391563A (zh) 一种基于多源异构数据融合的知识图谱链路预测方法
CN115205782A (zh) 一种基于数字孪生技术的喂饭机器人集群监测管理方法
CN113298131B (zh) 一种基于注意力机制的时序数据缺失值插补方法
CN116306780B (zh) 一种动态图链接生成方法
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
CN114169433A (zh) 一种基于联邦学习+图学习+cnn的工业故障预测方法
CN115293249A (zh) 一种基于动态时序预测的电力系统典型场景概率预测方法
CN113870241A (zh) 一种基于胶囊神经网络的药片缺陷识别方法和装置
CN113935458A (zh) 基于卷积自编码深度学习的空气污染多站点联合预测方法
CN111126364A (zh) 一种基于分组卷积神经网络的表情识别方法
CN114863356B (zh) 一种基于残差聚合图网络的群体活动识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination