CN116110588B

CN116110588B - 基于动态邻接矩阵和时空注意力的医学时间序列预测方法

Info

Publication number: CN116110588B
Application number: CN202211452111.7A
Authority: CN
Inventors: 张春霞; 于敬楠; 薛新月; 艾丹妮; 宋红; 臧梓硕; 牛振东
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2022-05-10
Filing date: 2022-11-21
Publication date: 2024-04-26
Anticipated expiration: 2042-11-21
Also published as: CN116110588A

Abstract

本发明涉及一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，属于大数据挖掘和医学人工智能数据预测技术领域。该方法对于疾病暴露人口数医学时间序列历史数据，构建静态空间邻接矩阵捕获空间外部数据，构建动态时间邻接矩阵挖掘疾病暴露人口数在时间维度上的关联特征，利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵，采用图卷积神经网络和门控循环单元框架来预测未来时间步的疾病暴露人口数。本发明引入空间外部数据，学习动态时间邻接矩阵，引入时空注意力机制，能够捕获发病地区之间空间相关性，疾病暴露人口数在时间维度上的关联特征，实现时空信息相关性的融合，从提高医学时间序列预测方法的性能。

Description

基于动态邻接矩阵和时空注意力的医学时间序列预测方法

技术领域

本发明涉及一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，属于大数据挖掘和医学人工智能数据预测技术领域。

背景技术

医学时间序列预测是医学人工智能领域的重要研究问题。医学时间序列预测问题受到学术界和工业界的广泛关注和研究。疾病暴露人口数的精准预测有助于为科学预防和治疗提供依据。医学时间序列预测任务是指以若干地区历史时间步的疾病暴露人口数等医学数据作为观测数据，由此来预测未来多个时间步的疾病暴露人口数等医学数据。

杨静等在《ARIMA模型在成都市成华区狂犬病暴露监测数据分析中的应用》(中国卫生统计，2016)中，利用成都市成华区2009-2015年的狂犬病暴露数建立季节性自回归积分滑动平均模型(Seasonal Autoregressive Integrated Moving Average,简称SARIMAX)，预测未来时间步的狂犬病暴露数。Yogesh Kumar等在《Predicting utilizationof healthcare services from individual disease trajectories using RNNs withmulti-headed attention》(NeurIPS，2019)中，采用循环神经网络(Recurrent NeuralNetwork，简称RNN)和多头注意力机制处理电子健康记录(Electronic Health Record，简称EHR)，预测下一年份患者的医疗保健服务使用情况。

图卷积神经网络(Graph Convolutional Network，简称GCN)能够用于图结构学习。图卷积神经网络获得邻接矩阵的拉普拉斯形式，计算与特征矩阵的乘积并更新卷积层参数，获取邻接矩阵中表示的不同节点之间相关性，在预测结果中融合相邻地区的历史信息。长短期记忆网络(Long Short-Term Memory，简称LSTM)旨在于解决循环神经网络(Recurrent Neural Network，简称RNN)中的长期依赖问题。门控循环单元(GateRecurrent Unit，简称GRU)是LSTM的变体，引入更新门来代替遗忘门和输入门。GRU的特点是模型参数相对较少，降低了模型过拟合的可能性。

当前的医学时间序列预测方法，主要存在如下问题，第一，主要关注疾病暴露人口数等医学数据在时间维度的相关性，忽略了发病地区之间的空间相关性。第二，由于疾病的发病原因繁杂多样，发病原因可能包括气候、海拔、经纬度等因素，通过单一的空间信息难以对未来疾病暴露人口数进行准确建模，降低了方法应用于不同类型疾病暴露人口数预测的扩展性。第三，现有方法较少引入时间信息和空间信息的融合，以及时间信息与空间信息之间的关联关系。

发明内容

本发明的目的是为了解决现有医学时间序列预测方法扩展性较弱，忽略空间相关性、时空信息相关性问题，提出了一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法。该方法对于疾病暴露人口数的医学时间序列历史数据，构建静态空间邻接矩阵捕获空间外部数据，构建动态时间邻接矩阵挖掘疾病暴露人口数在时间维度上的关联特征，利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵，采用图卷积神经网络和门控循环单元框架来预测未来时间步的疾病暴露人口数。

一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，该方法的步骤包括：

步骤1：获取疾病暴露人口数数据，采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据；

首先，获取的疾病暴露人口数数据为：若干省份或地区相同时间间隔的历史疾病暴露人口数X，

其中，q表示历史时间步步长，k是自然数，N表示地区数量，表示地区i时间步t的疾病暴露人口数，t≤k；

然后，采集地区边界线长度、地区中心城市经纬度、地区间人口流动三种外部数据，用于表示发病地区之间的空间关系；

地区边界线长度A_length为相邻的发病地区之间邻接边界线的长度，边界线越长表明相邻地区的空间相关性越大，维度为N×N，其中N是地区的数目。

地区间人口流动A_people表示相邻发病地区之间人口迁移的数量或比例，人口流动数量越大表明相邻地区的空间相关性越大，维度为N×N。

地区中心城市经纬度A_longitude表示每一个发病地区的经纬度信息，其维度为N×2。

步骤2：对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理，构建静态空间邻接矩阵：

步骤2.1：构建特征数据和标签数据，划分训练集、验证集和测试集；

构建特征数据和标签数据的方法为：设seq_len表示历史时间步长，pre_len表示预测时间步长，将历史数据构建为大小是(group_num×seq_len×N)的特征数据，以及大小为(group_num×pre_len×N)的标签数据，其中，group_num是数据组数；

划分训练集、验证集和测试集的方法为：

根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据，训练集、验证集和测试集的所占比例之和为1，将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘，获得训练集、验证集和测试集的大小，由此将特征数据和标签数据分割为训练集、验证集和测试集，按照设定的Batch值，将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练；

步骤2.2中，构建静态空间邻接矩阵；

首先，利用步骤1中获得的地区中心城市经纬度A_longitude，采用欧氏距离计算不同地区中心城市之间的距离，获得地区欧氏距离A_eucilide，如公式(1)所示：

其中，A_longitude[i][0]和A_longitude[j][0]表示地区i和地区j的经度，A_longitude[i][1]和A_longitude[j][1]表示地区i和地区j的纬度；

欧氏距离表示发病地区之间的距离，不同地区之间的位置关系越近，则这些地区的空间相关性越大；

然后，将地区边界线长度A_length、地区间人口流动A_people，以及地区欧氏距离A_eucilide的倒数相加，获得静态空间邻接矩阵A_sta，A_sta表示疾病发病地区之间的空间相关性，旨在于解决现有方法忽略空间相关性的问题；

步骤2.3：对历史数据和静态空间邻接矩阵进行归一化；

由于不同地区的疾病暴露人口数数值不同，并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大，因此，需要对历史数据和静态空间邻接矩阵进行归一化操作，将其数值范围归一至[0,1]区间，从而时间序列预测模型训练时提高收敛速度，获得时间序列预测模型的最优参数；

步骤3：采用基于动态邻接矩阵和时空注意力机制的方法获得医学时间序列预测结果，即获得预测时间步的医学疾病暴露人口数；

本发明的医学时间序列预测模型包括动态邻接矩阵学习层(步骤3.1)、时空信息融合层(步骤3.2)、时序预测层(步骤3.3和3.4)。

步骤3.1：学习动态时间邻接矩阵；

在动态邻接矩阵学习层中，学习动态时间邻接矩阵。动态时间邻接矩阵A_dyn的计算方法如下：

首先，将特征数据输入全连接层，学习获得特征数据的特征嵌入矩阵V_init，如公式(2)所示：

V_init＝dropout(ReLU(WX+b)), (2)

其中，X表示历史数据，W表示权重矩阵，b表示偏移量，RELU是激活函数，dropout是随机失活函数；

其次，对特征嵌入矩阵V_init计算L2范数，如公式(3)所示：

其中，表示时间步i的L2范数；

然后，将每一个时间步的L2范数向量进行拼接，获得L2范数矩阵V_normal，如公式(4)所示：

最后，将特征嵌入矩阵V_init与其转置矩阵相乘，用于表示历史数据的特征信息，将L2范数矩阵V_normal与其转置矩阵相乘，表示不同时间步历史数据之间的距离，动态时间邻接矩阵的计算方法，如公式(5)所示：

动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息；

步骤3.2：利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵：

现有的时间序列预测方法通常分别学习历史数据的时间信息和空间信息，然后通过拼接获得预测结果，这些方法难以挖掘时间信息与空间信息之间的相关性，因此本发明引入时空注意力机制融合时间和空间信息；

首先，将静态空间邻接矩阵A_sta与动态时间邻接矩阵A_dyn拼接得到A_concat，如公式(6)所示：

A_concat＝concat(A_sta,A_dyn)， (6)

然后，分别在时间维度与空间维度上计算多头注意力矩阵，多头注意力机制中的查询query、键key和值value为A_concat的不同线性表示，空间多头注意力的计算方法如公式(7)和(8)所示：

Attn_sta＝MultiHead(Q_spa,K_spa,V_spa)＝concat(head_s1,...,head_sn)W_AttSOut, (7)

head_si＝Attention(Q_spaW_i ^Qs,K_spaW_i ^Ks,V_spaW_i ^Vs), (8)

时间多头注意力的计算方法如公式(9)和(10)所示：

Attn_dyn＝MultiHead(Q_tem,K_tem,V_tem)＝concat(head_t1,...,head_tn)W_AttTOut, (9)

head_ti＝Attention(Q_temW_i ^Qt,K_temW_i ^Kt,V_temW_i ^Vt), (10)

注意力机制的计算方法如公式(11)所示：

其中，Attn_sta为静态空间注意力矩阵，Attn_dyn为动态时间注意力矩阵；head_si表示空间第i头注意力，head_ti表示时间第i头注意力；Q_spa表示空间注意力的查询，K_spa表示空间注意力的键，V_spa表示空间注意力的值；Q_tem表示时间注意力的查询，K_tem表示时间注意力的键，V_tem表示时间注意力的值；W_AttSOut、W_i ^Qs、W_i ^Ks、W_i ^Vs、W_AttTOut、W_i ^Qt、W_i ^Kt、W_i ^Vt为可学习的参数；concat为拼接函数，softmax为分类器，d_k是输入数据的维度。

通过时间多头注意力矩阵、空间多头注意力矩阵，以及拼接邻接矩阵A_concat的乘积得到时空邻接矩阵A，如公式(12)所示：

A＝Attn_sta×A_concat×Attn_dyn, (12)

该邻接矩阵A作为时序预测层的邻接矩阵，用于时间序列数据的预测；

步骤3.3：采用图卷积神经网络GCN和门控循环单元GRU框架预测未来时间步的隐层状态；

首先，对于每一个历史时间步，将步骤3.1中生成的历史数据的特征嵌入矩阵V_init、步骤3.2中生成的时空邻接矩阵A，作为图卷积神经网络的输入进行卷积计算，其中，动态时间邻接矩阵A_dyn针对每个Batch(批处理)进行计算，因此，每个Batch时间步的时空邻接矩阵都是不同的，需要分别计算邻接矩阵的拉普拉斯形式；

然后，图卷积神经网络包括两层图卷积网络，在每层图卷积网络中，对特征嵌入矩阵V_init进行卷积计算；

最后，将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入，计算预测时间步的隐层状态；

步骤3.4：生成预测时间步的疾病暴露人口数的方法为：

将门控循环单元GRU得到的隐层状态输入到全连接层中，将隐层状态的时间维度通过线性层转换为预测时间步长，生成疾病暴露人口数的预测值；将每个Batch的预测结果进行反归一化，计算时间序列预测模型的损失值；其中，归一化是指将原始数据归一到[0,1]之间，反归一化是归一化的逆过程，即将[0,1]之间的数值恢复到原始数据。

有益效果

本发明针对医学时间序列预测问题，提出了一种动态邻接矩阵和时空注意力机制的医学时间序列预测方法，与现有技术相比，具有如下有益效果：

1.所述方法引入医学时间序列历史数据的外部数据，包括地区边界线长度、地区中心城市经纬度、地区间人口流动三类外部数据，构建静态空间邻接矩阵，捕获不同发病地区之间的多种空间相关信息，解决现有方法忽略发病地区之间空间相关性的问题，从而提高医学时间序列预测的性能。

2.所述方法通过在历史数据的时间维度学习动态时间邻接矩阵，挖掘疾病暴露人口数在时间维度上的关联特征，解决单一的空间信息难以对未来疾病暴露人口数准确建模的问题，增强了医学时间序列预测方法应用于不同类型疾病暴露人口数预测的扩展性。

3.所述方法引入时空注意力机制，利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵，生成时空邻接矩阵。该时空邻接矩阵融合时间相关性与空间相关性，有助于解决现有时间序列预测方法分别对时间维度和空间维度进行预测，通过简单拼接获得时间序列预测结果，忽略时间与空间信息相互影响的问题，同时提高医学时间序列预测的性能。

附图说明

图1为本发明一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法的流程示意图。

具体实施方式

基于本发明方法的医学时间序列预测方法，以PyCharm为开发工具，Python为开发语言。下面结合实施例对本发明一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的优选实施方式进行详细说明。

如图1所示，一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，包括以下步骤：

步骤1：获取疾病暴露人口数的数据，采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据；

其中，q表示历史时间步步长，k是自然数，N表示地区数量，表示地区i时间步t的疾病暴露人口数，t≤k。

步骤2：对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理，构建静态空间邻接矩阵；

构建特征数据和标签数据的方法为：设seq_len表示历史时间步长，pre_len表示预测时间步长，将历史数据构建为大小是(group_num×seq_len×N)的特征数据，以及大小为(group_num×pre_len×N)的标签数据，其中，group_num是数据组数。

然后，划分训练集、验证集和测试集。

根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据。训练集、验证集和测试集的所占比例之和为1。将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘，获得训练集、验证集和测试集的大小，由此将特征数据和标签数据分割为训练集、验证集和测试集。

按照设定的Batch值，将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练。

步骤2.2：构建静态空间邻接矩阵；

其中，A_longitude[i][0]和A_longitude[j][0]表示地区i和地区j的经度，A_longitude[i][1]和A_longitude[j][1]表示地区i和地区j的纬度。

欧氏距离表示发病地区之间的距离，不同地区之间的位置关系越近，则这些地区的空间相关性越大。

然后，将地区边界线长度A_length、地区间人口流动A_people，以及地区欧氏距离A_eucilide的倒数相加，获得静态空间邻接矩阵A_sta。A_sta表示疾病发病地区之间的空间相关性，旨在于解决现有方法忽略空间相关性的问题。

步骤2.3：对历史数据和静态空间邻接矩阵进行归一化；

由于不同地区的疾病暴露人口数数值不同，并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大。因此，需要对历史数据和静态空间邻接矩阵进行归一化操作，将其数值范围归一至[0,1]区间，从而时间序列预测模型训练时提高收敛速度，获得时间序列预测模型的最优参数。

步骤3：采用基于动态邻接矩阵和时空注意力机制的预测模型获得医学时间序列预测结果，即获得预测时间步的医学疾病暴露人口数；

步骤3.1：学习动态时间邻接矩阵；

在动态邻接矩阵学习层中，学习动态时间邻接矩阵。动态时间邻接矩阵A_dyn的计算方法如下。

V_init＝dropout(ReLU(WX+b))， (2)

其中，X表示历史数据，W表示权重矩阵，b表示偏移量，RELU是激活函数，dropout是随机失活函数。

其次，对特征嵌入矩阵V_init计算L2范数，如公式(3)所示：

其中，表示时间步i的L2-范数。

最后，将特征嵌入矩阵V_init与其转置矩阵相乘，用于表示历史数据的特征信息。将L2范数矩阵V_normal与其转置矩阵相乘，表示不同时间步历史数据之间的距离。动态时间邻接矩阵的计算方法，如公式(5)所示：

步骤3.2：利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵；

现有的时间序列预测方法通常分别学习历史数据的时间信息和空间信息，然后通过拼接获得预测结果。这些方法难以挖掘时间信息与空间信息之间的相关性，因此本发明引入时空注意力机制融合时间和空间信息。

在时空信息融合层，首先，将静态空间邻接矩阵A_sta与动态时间邻接矩阵A_dyn拼接得到A_concat，如公式(6)所示：

A_concat＝concat(A_sta,A_dyn), (6)

然后，分别在时间维度与空间维度上计算多头注意力矩阵。多头注意力机制中的查询query、键key和值value为A_concat的不同线性表示，空间多头注意力的计算方法如公式(7)和(8)所示：

head_si＝Attention(Q_spaW_i ^Qs,K_spaW_i ^Ks,V_spaW_i ^Vs), (8)

时间多头注意力的计算方法如公式(9)和(10)所示：

Attn_dyn＝MultiHead(Q_tem,K_tem,V_tem)＝concat(head_t1,...,head_tn)W_AttTOut,(9)

head_ti＝Attention(Q_temW_i ^Qt,K_temW_i ^Kt,V_temW_i ^Vt), (10)

注意力机制的计算方法如公式(11)所示：

A＝Attn_sta×A_concat×Attn_dyn, (12)

该邻接矩阵A作为时序预测层的邻接矩阵，用于时间序列数据的预测。

首先，对于每一个历史时间步，将步骤3.1中生成的历史数据的特征嵌入矩阵V_init、步骤3.2中生成的时空邻接矩阵A，作为图卷积神经网络的输入进行卷积计算。其中，动态时间邻接矩阵A_dyn针对每个Batch(批处理)进行计算，因此，每个Batch的时空邻接矩阵都是不同的，需要分别计算邻接矩阵的拉普拉斯形式。

然后，图卷积神经网络包括两层图卷积网络。在每层图卷积网络中，对特征嵌入矩阵V_init进行卷积计算。

最后，将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入，计算预测时间步的隐层状态。

步骤3.4：将隐层状态作为输入至全连接层，生成预测时间步的疾病暴露人口数；

在时序预测层，将门控循环单元GRU得到的隐层状态输入到全连接层中，将隐层状态的时间维度通过线性层转换为预测时间步长，生成疾病暴露人口数的预测值。将每个Batch的预测结果进行反归一化，计算时间序列预测模型的损失值。其中，归一化是指将原始数据归一到[0,1]之间，反归一化是归一化的逆过程，即将[0,1]之间的数值恢复到原始数据。

实施例

本实施例叙述了采用本发明所述的一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的流程，如图1所示，包括如下步骤：

本实施例中使用的历史疾病暴露人口数数据集为2004至2018年中国31个省份、直辖市和自治区的传染病暴露数。该数据集是对于31个地区(即省份、直辖市和自治区)的传染病暴露数的统计数据，以月为统计单位，每个地区包括180个月的传染病暴露数。

地区边界线长度利用百度地图，通过测距功能获得边界线长度，矩阵维度为31×31。

地区中心城市经纬度数据来源于如下网址：https://blog.csdn.net/hot_boom_dog/article/details/100121745？ops_request_misc＝％257B％2522request％255Fid％2522％253A％2522162804457316780264099819％2522％252C％2522scm％2522％253A％252220140713.130102334..％2522％257D&request_id＝162804457316780264099819&biz_id＝0&utm_medium＝distribute.pc_search_result.none-task-blog-2～all～sobaiduend～default-1-100121745.first_rank_v2_pc_rank_v29&utm_term＝％E4％B8％AD％E5％9B％BD％E5％90％84％E7％9C％81％E7％BB％8F％E7％BA％AC％E5％BA％A6&spm＝1018.2226.3001.4187，维度为31×2。

地区间人口流动数据来自百度人口迁徙大数据，数值为不同省份之间人口迁徙的比例，维度为31×31。

然后，划分训练集、验证集和测试集。

本实施例中，预设历史时间步长为6，预测时间步长为1。以180个时间步31个地区的训练数据为例，如果以6个历史时间步预测1个未来时间步，那么数据组数group_num为175，每一组特征数据的维度为6×31，每一组标签数据的维度为1×31。

将历史数据分割为时间步长为12的特征数据和时间步长为1的标签数据。训练集、验证集和测试集的所占比例为(0.6，0.2，0.2)，将特征数据和标签数据按照该比例分割为训练集、验证集和测试集。

步骤2.2：构建静态空间邻接矩阵；

本实施例中，首先，获得维度为(31×31)的地区欧氏距离矩阵。然后，将地区边界线长度、地区间人口流动、以及地区欧氏距离矩阵的倒数相加，构建静态空间邻接矩阵，其维度为(31×31)。

步骤2.3：对历史数据和静态空间邻接矩阵进行归一化；

本实施例中，使用机器学习中MinMaxScaler函数对历史数据、静态空间邻接矩阵的数值进行归一化操作，将其数值范围统一为[0,1]。

步骤3.1：学习动态时间邻接矩阵；

首先，将特征数据输入全连接层，学习获得特征数据的特征嵌入矩阵V_init，如公式(2)所示。

V_init＝dropout(ReLU(WX+b))， (2)

其次，对特征嵌入矩阵V_init计算L2范数，如公式(3)所示。

其中，表示时间步i的L2-范数。

然后，将每一个时间步的L2范数向量进行拼接，获得L2范数矩阵V_normal，如公式(4)所示。

最后，将特征嵌入矩阵V_init与其转置矩阵相乘，用于表示历史数据的特征信息。将L2范数矩阵V_normal与其转置矩阵相乘，表示不同时间步历史数据之间的距离。动态时间邻接矩阵的计算方法，如公式(5)所示。

动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息。

本实施例中，动态时间邻接矩阵A_dyn的维度为(6×6)，其中，6是历史时间步长。

在时空信息融合层，首先，将静态空间邻接矩阵A_sta与动态时间邻接矩阵A_dyn拼接得到A_concat，如公式(6)所示。

A_concat＝concat(A_sta,A_dyn), (6)

head_si＝Attention(Q_spaW_i ^Qs,K_spaW_i ^Ks,V_spaW_i ^Vs), (8)

时间多头注意力的计算方法如公式(9)和(10)所示：

head_ti＝Attention(Q_temW_i ^Qt,K_temW_i ^Kt,V_temW_i ^Vt), (10)

注意力机制的计算方法如公式(11)所示：

通过时间多头注意力矩阵、空间多头注意力矩阵，以及拼接邻接矩阵A_concat的乘积得到时空邻接矩阵A，如公式(12)所示。该邻接矩阵A作为时序预测层的邻接矩阵，用于时间序列数据的预测。

A＝Attn_sta×A_concat×Attn_dyn, (12)

为说明本发明的医学时间序列预测效果，即对若干地区的未来时间步的疾病暴露人口数进行预测。本实验是在同等条件下，以相同的训练集、验证集和测试集分别采用三种方法进行比较。

第一种方法是基于时间图卷积网络T-GCN的医学时间序列预测方法。第二种是基于图信号的动态线性模型预测方法GraphSAGE。第三种是本发明的基于动态邻接矩阵和时空注意力的医学时间序列预测方法。

采用的评测指标为：平均绝对误差MAE(Mean Absolute Error)、平均绝对百分比误差MAPE(Mean Absolute Percent Error)、均方根误差RMSE(Root Mean Square Error)。这三个指标均表示预测数据与真实数据之间的误差，因此，MAE、MAPE、RMSE的值越小，表示时间序列预测方法的预测效果越好。

(1)基于时间图卷积网络T-GCN的时间序列预测方法中隐层维度为256，平均绝对误差MAE为1.3525，平均绝对百分比误差MAPE为0.6489、均方根误差RMSE为1.5376；(2)基于图信号的动态线性模型预测方法GraphSAGE中隐层维度为256，平均绝对误差MAE为1.6387，平均绝对百分比误差MAPE为0.7829、均方根误差RMSE为1.9783；(3)基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法中隐层维度为256，平均绝对误差MAE为1.0758，平均绝对百分比误差MAPE为0.6125，均方根误差RMSE为1.2796。实验结果表明，本发明提出的基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的性能优于另外两种方法的性能，即表明了本发明方法的有效性。

以上所述为本发明的较佳实施例而已，本发明不应局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改，都落入本发明保护的范围。

Claims

1.一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，其特征在于该方法的步骤包括：

构建特征数据和标签数据的方法为：设seq_len表示历史时间步长，pre_len表示预测时间步长，将历史数据构建为大小是(group_num×seq_len×N)的特征数据，以及大小为(group_num×pre_len×N)的标签数据，其中，group_num是数据组数，N是地区数量；

划分训练集、验证集和测试集的方法为：

步骤2.2中，构建静态空间邻接矩阵；

然后，将地区边界线长度A_length、地区间人口流动A_people，以及地区欧氏距离A_eucilide的倒数相加，获得静态空间邻接矩阵A_sta，A_sta表示疾病发病地区之间的空间相关性；

步骤2.3：对历史数据和静态空间邻接矩阵进行归一化；

步骤3：采用基于动态邻接矩阵和时空注意力的方法获得医学时间序列预测结果；

医学时间序列预测模型包括动态邻接矩阵学习层、时空信息融合层、时序预测层；

步骤3.1：学习动态时间邻接矩阵；

在动态邻接矩阵学习层中，学习动态时间邻接矩阵，动态时间邻接矩阵A_dyn的计算方法如下；

V_init＝dropout(ReLU(WX+b))， (2)

其次，对特征嵌入矩阵V_init计算L2范数，如公式(3)所示：

其中，表示时间步i的L2-范数；

引入时空注意力机制融合时间和空间信息；

A_concat＝concat(A_sta,A_dyn), (6)

head_si＝Attention(Q_spaW_i ^Qs,K_spaW_i ^Ks,V_spaW_i ^Vs), (8)

时间多头注意力的计算方法如公式(9)和(10)所示：

注意力机制的计算方法如公式(11)所示：

其中，Attn_sta为静态空间注意力矩阵，Attn_dyn为动态时间注意力矩阵；head_si表示空间第i头注意力，head_ti表示时间第i头注意力；Q_spa表示空间注意力的查询，K_spa表示空间注意力的键，V_spa表示空间注意力的值；Q_tem表示时间注意力的查询，K_tem表示时间注意力的键，V_tem表示时间注意力的值；W_AttSOut、W_i ^Qs、W_i ^Ks、W_i ^Vs、W_AttTOut、W_i ^Qt、W_i ^Kt、W_i ^Vt为可学习的参数；concat为拼接函数，softmax为分类器，d_k是输入数据的维度；

A＝Attn_sta×A_concat×Attn_dyn, (12)

首先，对于每一个历史时间步，将步骤3.1中生成的历史数据的特征嵌入矩阵V_init、步骤3.2中生成的时空邻接矩阵A，作为图卷积神经网络的输入进行卷积计算，其中，动态时间邻接矩阵A_dyn针对每个Batch进行计算，因此，每个Batch的时空邻接矩阵都是不同的，需要分别计算邻接矩阵的拉普拉斯形式；

在时序预测层，将门控循环单元GRU得到的隐层状态输入到全连接层中，将隐层状态的时间维度通过线性层转换为预测时间步长，生成疾病暴露人口数的预测值，将每个Batch的预测结果进行反归一化，计算时间序列预测模型的损失值，其中，归一化是指将原始数据归一到[0,1]之间，反归一化是归一化的逆过程，即将[0,1]之间的数值恢复到原始数据。

2.根据权利要求1所述的一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，其特征在于：

所述的步骤1中，获取的疾病暴露人口数数据为：若干省份或地区相同时间间隔的历史疾病暴露人口数X，

3.根据权利要求2所述的一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法，其特征在于：

所述的步骤1中，地区边界线长度A_length为相邻的发病地区之间邻接边界线的长度，维度为N×N，其中，N是地区的数量；

地区中心城市经纬度A_longitude表示每一个发病地区的经纬度信息，其维度为N×2；

地区间人口流动数据A_people表示相邻发病地区之间人口迁移的数量或比例，维度为N×N。