CN116257786A

CN116257786A - 一种基于多元时序图结构的异步时间序列分类方法

Info

Publication number: CN116257786A
Application number: CN202211093387.0A
Authority: CN
Inventors: 王振; 姜婷; 许增辉; 张吉
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2022-09-08
Filing date: 2022-09-08
Publication date: 2023-06-13

Abstract

本发明属于图计算与时间序列序列分类领域，公开了一种基于多元时序图网络的异步时间序列分类方法，该方法构建了一个多元交互模块来处理缺失信息，并自动提取图结构关系，设计了一种新的邻接图传播机制来聚合当前和以前的多步快照的邻居信息，并构建了基于掩码时间感知的注意力模块用于学习观测值之间的时间相关性。本发明在对异步时序数据进行分类的过程中，实现了对缺失观测值的填充以及信息在不同传感器间相互传播，提高了算法在数据大量缺失下的鲁棒性，同时考虑时序数据在时间戳上下文的绝对意义和时间间隔的异步性，提高了多维异步时序数据的分类效果。

Description

一种基于多元时序图结构的异步时间序列分类方法

技术领域

本发明属于图计算与时间序列序列分类领域，尤其涉及一种基于多元时序图网络的异步时间序列分类方法。

背景技术

多维异步时间序列常出现在医学、金融学、气候科学等日常领域，它是观测时间间隔不规则的采样序列，序列之间的采样率通常也是异步的，且数据中存在较多不规则缺失。多维异步时间序列一般用于分类、预测等任务，例如，基于医疗中的非规则的健康记录数据分析，进行患者死亡风险预测、疾病早期检测、患者分型等等。

传统的分类算法，如机器学习、神经网络等都要求数据是规则的，具体包括固定的数据维度，连续且固定的时间采样。当前学者们主要通过研究填充对齐数据的方法，补全缺失信息，将数据处理成规则的时间序列后，再使用经典的分类算法进行分析。这些方法数据处理的方法，仅仅在单数据维度中结合时间依赖性进行简单的数据填充、插值补全，没有充分考虑到多个数据维度之间(传感器之间)存在的相互依赖性，导致最后的分类效果鲁棒性不强。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于多元时序图网络的异步时间序列分类方法。

本发明的目的是通过以下技术方案来实现的：

一种基于多元时序图网络的异步时间序列分类方法，包括以下步骤：

步骤一：根据单个异步时序样本数据情况，将时序数据在单个样本上对齐，没有观测值的时刻定义为观测值缺失；

步骤二：针对每个样本，在多元交互模块中，学习所有传感器之间的关联权重，构建有向时序图网络；

步骤三：针对每个样本，在邻接图邻居聚合模块中，通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新；

步骤四：考虑样本中每个传感器不同时间前后的关联，构建基于掩码时间感知的注意力模块，学习观测值间的时间相关性，集成传感器各个时间点的数据，生成单个传感器嵌入表达；

步骤五：将样本各传感器的数据与样本静态特征进行结合，获得样本最终特征，最后使用线性分类方法对样本进行分类训练。

进一步地，所述步骤二通过以下子步骤来实现：

步骤2.1：使用可训练衰减机制捕捉变量的缺失模式，对缺失的观测值进行填充；

步骤2.2：将样本在传感器上的观测值映射到高维空间，获得节点的初始表示；

步骤2.3：通过匹配节点的嵌入来计算注意力系数，即学习传感器间的关联权重，从而构建有向时序图网络。

进一步地，所述步骤二包括如下具体步骤：

将每个样本看作一个有向图

其中/>

表示d个传感器构成的节点集合，节点v_i表示第i个传感器，/>

是有向图的带权有向边，其中e_k,ij＞0表示从节点v_i到v_j边的权重，e_k,ij＝0表示从节点v_i到v_j之间不存在边，/>

其中/>

表示在时刻t节点v_i对v_j的重要性；

对于样本s_k在第i个传感器上t时刻被观测到的数据

使用非线性映射将其映射到更高维空间/>

其中/>

为样本s_k节点v_i在t时刻的初始表示，d_h＝4表示向量维度；如果样本s_k在第i个传感器上t时刻的值未被观测到，则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间：

其中

是其最近时间τ＜t的观测值，/>

为第j个传感器观测值的经验均值，衰变率/>

为可训练变量，w_λ、b_λ为可训练参数；

在获得节点的初始表示后，通过匹配节点的嵌入来计算注意系数，即时刻t节点v_i对v_j的重要性：

其中c和W_α为可训练参数，σ为sigmoid激活函数，

为时刻t的时间戳编码向量表示，d_t＝12表示向量的维度，为预定义的参数，计算方式如下：

其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值，

为可训练参数集合；

根据学习到的注意力系数，即时刻t节点v_i对v_j的重要性，对样本两两节点的连接及相关权重进行重构：

通过对每个样本前K％最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性，其中K＝50为预定义的参数。

进一步地，所述步骤三通过以下子步骤来实现：

步骤3.1：使用图注意力机制学习当前时刻和前R步时刻的邻居节点对当前节点的影响权重；

步骤3.2：聚合当前时刻和前R步时刻的邻居信息，对当前节点的信息进行更新，从而更新每个时间点上所有传感器数据的信息。

进一步地，所述步骤三包括如下具体步骤：

对每个邻居的影响进行建模，并在此影响下聚集邻居节点信息，使用一种特殊的R步马尔可夫性质的图卷积模块，来建模同一时刻内和跨时域间的依赖，学习邻接图的时间和结构信息，第l层的聚合过程如下：

其中W^(l)和

为可训练参数，R＝2表示最长时间步，为预定义参数，/>

表示节点v_i在时刻t_-r的邻居节点，t_-r表示时刻t前第r个时刻，t_-0＝t，/>

表示在第l层节点v_i在t时刻和其在t_-r时刻的邻居v_j的注意力得分，其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得，图卷积模块总层数L＝2，从而获得节点多跳邻居节点信息。

进一步地，所述步骤四通过以下子步骤来实现：

步骤4.1：将样本在每个传感器上每个时刻的嵌入表达信息与时间位置编码信息进行拼接，获得包含时间位置信息的嵌入表达；

步骤4.2：使用基于时间间隔的Tansformer机制，学习各个时间步间的相互影响后信息；

步骤4.3：将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均，获得最终各个样本每个传感器对应的掩码传感器嵌入表达。

进一步地，所述步骤四包括如下具体步骤：

针对样本s_k中节点v_i在上一步最后一层，即第L＝2层获得的长度

的嵌入表达序列/>

将其与对应时间戳编码向量进行拼接，获得包含时间位置信息的嵌入表达矩阵/>

使用基于时间间隔的Tansformer机制学习时间步间的相互影响后个时间步下节点的嵌入表达，计算过程如下：

其中

为计算query，key和value的可训练映射矩阵参数(d_h＝4,d_t＝12,d_q＝d_k＝d_v＝d_h×d_t)，/>

为规范化的时间间隔矩阵，其元素/>

表示嵌入表达/>

和/>

之间的规范化的时间间隔，其中

表示除0外最小的时间间隔；

步骤4.3：将各个样本每个传感器上有观测值的时间点的嵌入表达进行求和平均，获得最终各个样本每个传感器对应的掩码传感器嵌入表达；

计算U_k,i的元素的掩码平均值获得样本节点级别的嵌入表达：

其中⊙表示表示点乘运算，

表示元素全为1的列向量，M_k,i为样本s_k在第i个传感器上的掩码矩阵，表示样本s_k在第i个传感器上的观测值哪一部分是缺失值，如：

u_k,i为样本s_k的第i个传感器的单变量时间序列变量s_k,i的最终节点级表示。

进一步地，所述步骤五通过以下子步骤来实现：

步骤5.1：将各个样本所有传感器上的嵌入表达与样本的静态属性特征进行拼接操作，获得单个样本的嵌入表达；

步骤5.2：使用分类器对样本进行分类，并使用SDG梯度下降方法对模型进行训练，在模型训练的过程中优化交叉熵损失函数。

进一步地，所述步骤五包括如下具体步骤：

对存在静态属性/特征x_k,0的样本s_k，使用一个额外的非线性映射将静态属性特征映射到统一空间：a_k＝σ(W₀x_k,0)，其中

d＝4为预定义参数，σ为Relu非线性激活函数；

然后对节点级嵌入表示信息以及静态属性表示信息进行汇总，获得多元时序序列的样本图级表示：

g_k＝Aggregate(u_k,1,u_k,2,...,u_k,d,a_k)

其中Aggregate表示任意的聚合操作，

使用一组全连接层将样本图级特征转换到目标空间

其中/>

为模型对样本s_k的分类结果，最后使用随机梯度下降的优化方法，对模型进行训练，模型的损失函数为：

表示交叉熵损失函数，其中C表示样本类别个数，K表示样本个数。

本发明的有益效果是：本发明是面向图计算与时序数据分类领域的基于掩码时间感知注意力机制的异步时序数据分类方法，具有如下优势：

(1)本发明提出一种基于多元时序图网络的异步时间序列分类方法。通过多元交互模块来处理缺失信息，并自动提取多传感器间图结构关系，使用图神经网络实现传感器数据信息间的互相传播，在传感器数据大量缺失的情况下，算法鲁棒性高。

(2)本发明提出使用基于掩码时间感知注意力机制，考虑时序数据在时序上的相关性，学习了传感器中不同时刻间的相互关系，提高了算法的分类效果。

附图说明

图1为本发明的基于多元时序图结构的异步时间序列分类方法整体框架图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例仅用于解释本发明，并非用于限定本发明的范围。

如图1所示，本发明的一种基于多元时序图网络的异步时间序列分类方法，包括以下步骤：

对于给出的K个异步时序样本数据

其中y_k∈{1,2,...,C}是样本s_k的标签，每个单一样本在d个传感器上有观测序列s_k＝{s_k,i∣i＝1,...,d}，其中/>

表示样本s_k在第i个传感器上的观测序列，x_k,_i,m表示样本s_k在第i个传感器上的第m个观测值(观测时间为/>

)，样本s_k在第i个传感器上一共有N_k,i个观测值，一般对于任意两个传感器i≠j，有/>

且N_k,i≠N_k,j。

令

表示样本s_k在所有传感器下的观测时间点，将所有传感器上的观测值在时间/>

上进行对齐，缺失时进行标记，从而有/>

亦记为/>

我们将每个样本(例如样本s_k)看作一个有向图

其中/>

表示d个传感器构成的节点集合，节点v_i表示第i个传感器。/>

是有向图的带权有向边，其中e_k,ij＞0表示从节点v_i到v_j边的权重，e_k,ij＝0表示从节点v_i到v_j之间不存在边。

其中/>

表示在时刻t节点v_i对v_j的重要性。

对于样本s_k在第i个传感器上t时刻被观测到的数据

使用非线性映射将其映射到更高维空间/>

其中/>

为样本s_k节点v_j在t时刻的初始表示，d_h＝4表示向量维度；如果样本s_k在第i个传感器上t时刻的值未被观测到，则通过引入可训练衰减机制对缺失值进行填充后将其映射到高维空间：

其中

是其最近时间τ＜t的观测值，/>

为第j个传感器观测值的经验均值，衰变率/>

为可训练变量，w_λ、b_λ为可训练参数。/>

步骤2.3：通过匹配节点的嵌入来计算注意力系数，即学习传感器间的关联权重，从而构建有向时序图网络；

在获得节点的初始表示后，我们考虑时间间隔不规则性的影响，通过匹配节点的嵌入来计算注意系数(即时刻t节点v_i对v_j的重要性)：

其中c和W_α为可训练参数，σ为sigmoid激活函数，

其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值,

为可训练参数集合。

根据学习到的注意力系数(即时刻t节点v_i对v_j的重要性)，可对样本两两节点的连接及相关权重进行重构：

进一步，我们通过对每个样本前K％最小的权重的边进行剪枝的方式减少信息冗余并加强数据的稀疏性，其中K＝50为预定义的参数。

步骤三：针对每个样本，在邻接图邻居聚合模块中，通过邻接图消息传播机制对样本每个时间点上所有传感器数据信息进行更新。

步骤3.2：聚合当前时刻和前R步时刻的邻居信息，对当前节点的信息进行更新，从而更新每个时间点上所有传感器数据的信息；

邻接图邻居聚合模块，对每个邻居的影响进行建模，并在此影响下聚集邻居节点信息。我们使用一种特殊的R步马尔可夫性质的图卷积模块，来建模同一时刻内和跨时域间的依赖，学习邻接图的时间和结构信息，第l层的聚合过程如下：

其中W^(l)和/>

为可训练参数，R＝2表示最长时间步，为预定义参数，/>

表示节点v_i在时刻t-_r(t-_r表示时刻t前第r个时刻，t-₀＝t)的邻居节点，/>

表示在第l层节点v_i在t时刻和其在t-_r时刻的邻居v_j的注意力得分，其中注意力得分根据节点的嵌入表达使用全连接神经网络和softmax函数获得。图卷积模块总层数L＝2，从而获得节点多跳邻居节点信息。

针对样本s_k中节点v_i在上一步最后一层(第L＝2层)获得的长度

的嵌入表达序列/>

其中

为计算query，key和value的可训练映射矩阵参数(d_h＝4,d_t＝12,d_q＝d_k＝d_v＝d_h×d_t)。/>

为规范化的时间间隔矩阵，其元素/>

表示嵌入表达/>

和/>

之间的规范化的时间间隔，其中

表示除0外最小的时间间隔。

其中⊙表示表示点乘运算，

表示元素全为1的列向量，M_k,i为样本s_k在第i个传感器上的掩码矩阵(0-1矩阵)，表示样本s_k在第i个传感器上的观测值哪一部分是缺失值，如：

步骤5.1：将各个样本所有传感器上的嵌入表达与样本的静态属性特征(当数据样本存在静态属性时)进行拼接操作，获得单个样本的嵌入表达；

(d＝4为预定义参数)，σ为Relu非线性激活函数。

g_k＝Aggregate(u_k,1,u_k,2,...,u_k,d,a_k)

其中Aggregate表示任意的聚合操作，例如求和、求均值、拼接操作，此处使用拼接操作。

使用一组全连接层将样本图级特征转换到目标空间

其中/>

为模型对样本s_k的分类结果。最后使用随机梯度下降(SGD)的优化方法，对模型进行训练。模型的损失函数为：

Claims

1.一种基于多元时序图网络的异步时间序列分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤二通过以下子步骤来实现：

3.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤二包括如下具体步骤：

将每个样本看作一个有向图

其中/>

表示d个传感器构成的节点集合，节点v_i表示第i个传感器，/>

其中/>

表示在时刻t节点v_i对v_j的重要性；

对于样本s_k在第i个传感器上t时刻被观测到的数据

使用非线性映射将其映射到更高维空间/>

其中/>

其中

是其最近时间τ＜t的观测值，/>

为第j个传感器观测值的经验均值，衰变率/>

为可训练变量，w_λ、b_λ为可训练参数；

/>

其中c和W_α为可训练参数，σ为sigmoid激活函数，

其中φ(t)[u]表示时间戳t编码向量φ(t)的第u维值，

为可训练参数集合；

4.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤三通过以下子步骤来实现：

5.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤三包括如下具体步骤：

其中W^(l)和

为可训练参数，R＝2表示最长时间步，为预定义参数，/>

6.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤四通过以下子步骤来实现：

7.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤四包括如下具体步骤：

的嵌入表达序列

其中

为规范化的时间间隔矩阵，其元素/>

表示嵌入表达/>

和/>

之间的规范化的时间间隔，其中

表示除0外最小的时间间隔；

其中⊙表示表示点乘运算，

8.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤五通过以下子步骤来实现：

9.根据权利要求1所述的异步时序数据分类方法，其特征在于，所述步骤五包括如下具体步骤：

d＝4为预定义参数，σ为Relu非线性激活函数；

g_k＝Aggregate(u_k,1,u_k,2,...,u_k,d,a_k)

其中Aggregate表示任意的聚合操作，

使用一组全连接层将样本图级特征转换到目标空间

其中/>