CN116110588B - 基于动态邻接矩阵和时空注意力的医学时间序列预测方法 - Google Patents
基于动态邻接矩阵和时空注意力的医学时间序列预测方法 Download PDFInfo
- Publication number
- CN116110588B CN116110588B CN202211452111.7A CN202211452111A CN116110588B CN 116110588 B CN116110588 B CN 116110588B CN 202211452111 A CN202211452111 A CN 202211452111A CN 116110588 B CN116110588 B CN 116110588B
- Authority
- CN
- China
- Prior art keywords
- time
- matrix
- data
- space
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 201
- 238000000034 method Methods 0.000 title claims abstract description 64
- 201000010099 disease Diseases 0.000 claims abstract description 67
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 67
- 230000003068 static effect Effects 0.000 claims abstract description 48
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 46
- 238000012360 testing method Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000012795 verification Methods 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 14
- 230000002123 temporal effect Effects 0.000 claims description 12
- 238000005096 rolling process Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000009849 deactivation Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 2
- 208000037919 acquired disease Diseases 0.000 claims 1
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000000306 recurrent effect Effects 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 4
- 208000035473 Communicable disease Diseases 0.000 description 3
- 206010037742 Rabies Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,属于大数据挖掘和医学人工智能数据预测技术领域。该方法对于疾病暴露人口数医学时间序列历史数据,构建静态空间邻接矩阵捕获空间外部数据,构建动态时间邻接矩阵挖掘疾病暴露人口数在时间维度上的关联特征,利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵,采用图卷积神经网络和门控循环单元框架来预测未来时间步的疾病暴露人口数。本发明引入空间外部数据,学习动态时间邻接矩阵,引入时空注意力机制,能够捕获发病地区之间空间相关性,疾病暴露人口数在时间维度上的关联特征,实现时空信息相关性的融合,从提高医学时间序列预测方法的性能。
Description
技术领域
本发明涉及一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,属于大数据挖掘和医学人工智能数据预测技术领域。
背景技术
医学时间序列预测是医学人工智能领域的重要研究问题。医学时间序列预测问题受到学术界和工业界的广泛关注和研究。疾病暴露人口数的精准预测有助于为科学预防和治疗提供依据。医学时间序列预测任务是指以若干地区历史时间步的疾病暴露人口数等医学数据作为观测数据,由此来预测未来多个时间步的疾病暴露人口数等医学数据。
杨静等在《ARIMA模型在成都市成华区狂犬病暴露监测数据分析中的应用》(中国卫生统计,2016)中,利用成都市成华区2009-2015年的狂犬病暴露数建立季节性自回归积分滑动平均模型(Seasonal Autoregressive Integrated Moving Average,简称SARIMAX),预测未来时间步的狂犬病暴露数。Yogesh Kumar等在《Predicting utilizationof healthcare services from individual disease trajectories using RNNs withmulti-headed attention》(NeurIPS,2019)中,采用循环神经网络(Recurrent NeuralNetwork,简称RNN)和多头注意力机制处理电子健康记录(Electronic Health Record,简称EHR),预测下一年份患者的医疗保健服务使用情况。
图卷积神经网络(Graph Convolutional Network,简称GCN)能够用于图结构学习。图卷积神经网络获得邻接矩阵的拉普拉斯形式,计算与特征矩阵的乘积并更新卷积层参数,获取邻接矩阵中表示的不同节点之间相关性,在预测结果中融合相邻地区的历史信息。长短期记忆网络(Long Short-Term Memory,简称LSTM)旨在于解决循环神经网络(Recurrent Neural Network,简称RNN)中的长期依赖问题。门控循环单元(GateRecurrent Unit,简称GRU)是LSTM的变体,引入更新门来代替遗忘门和输入门。GRU的特点是模型参数相对较少,降低了模型过拟合的可能性。
当前的医学时间序列预测方法,主要存在如下问题,第一,主要关注疾病暴露人口数等医学数据在时间维度的相关性,忽略了发病地区之间的空间相关性。第二,由于疾病的发病原因繁杂多样,发病原因可能包括气候、海拔、经纬度等因素,通过单一的空间信息难以对未来疾病暴露人口数进行准确建模,降低了方法应用于不同类型疾病暴露人口数预测的扩展性。第三,现有方法较少引入时间信息和空间信息的融合,以及时间信息与空间信息之间的关联关系。
发明内容
本发明的目的是为了解决现有医学时间序列预测方法扩展性较弱,忽略空间相关性、时空信息相关性问题,提出了一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法。该方法对于疾病暴露人口数的医学时间序列历史数据,构建静态空间邻接矩阵捕获空间外部数据,构建动态时间邻接矩阵挖掘疾病暴露人口数在时间维度上的关联特征,利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵,采用图卷积神经网络和门控循环单元框架来预测未来时间步的疾病暴露人口数。
一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,该方法的步骤包括:
步骤1:获取疾病暴露人口数数据,采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据;
首先,获取的疾病暴露人口数数据为:若干省份或地区相同时间间隔的历史疾病暴露人口数X,
其中,q表示历史时间步步长,k是自然数,N表示地区数量,表示地区i时间步t的疾病暴露人口数,t≤k;
然后,采集地区边界线长度、地区中心城市经纬度、地区间人口流动三种外部数据,用于表示发病地区之间的空间关系;
地区边界线长度Alength为相邻的发病地区之间邻接边界线的长度,边界线越长表明相邻地区的空间相关性越大,维度为N×N,其中N是地区的数目。
地区间人口流动Apeople表示相邻发病地区之间人口迁移的数量或比例,人口流动数量越大表明相邻地区的空间相关性越大,维度为N×N。
地区中心城市经纬度Alongitude表示每一个发病地区的经纬度信息,其维度为N×2。
步骤2:对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理,构建静态空间邻接矩阵:
步骤2.1:构建特征数据和标签数据,划分训练集、验证集和测试集;
构建特征数据和标签数据的方法为:设seq_len表示历史时间步长,pre_len表示预测时间步长,将历史数据构建为大小是(group_num×seq_len×N)的特征数据,以及大小为(group_num×pre_len×N)的标签数据,其中,group_num是数据组数;
划分训练集、验证集和测试集的方法为:
根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据,训练集、验证集和测试集的所占比例之和为1,将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘,获得训练集、验证集和测试集的大小,由此将特征数据和标签数据分割为训练集、验证集和测试集,按照设定的Batch值,将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练;
步骤2.2中,构建静态空间邻接矩阵;
首先,利用步骤1中获得的地区中心城市经纬度Alongitude,采用欧氏距离计算不同地区中心城市之间的距离,获得地区欧氏距离Aeucilide,如公式(1)所示:
其中,Alongitude[i][0]和Alongitude[j][0]表示地区i和地区j的经度,Alongitude[i][1]和Alongitude[j][1]表示地区i和地区j的纬度;
欧氏距离表示发病地区之间的距离,不同地区之间的位置关系越近,则这些地区的空间相关性越大;
然后,将地区边界线长度Alength、地区间人口流动Apeople,以及地区欧氏距离Aeucilide的倒数相加,获得静态空间邻接矩阵Asta,Asta表示疾病发病地区之间的空间相关性,旨在于解决现有方法忽略空间相关性的问题;
步骤2.3:对历史数据和静态空间邻接矩阵进行归一化;
由于不同地区的疾病暴露人口数数值不同,并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大,因此,需要对历史数据和静态空间邻接矩阵进行归一化操作,将其数值范围归一至[0,1]区间,从而时间序列预测模型训练时提高收敛速度,获得时间序列预测模型的最优参数;
步骤3:采用基于动态邻接矩阵和时空注意力机制的方法获得医学时间序列预测结果,即获得预测时间步的医学疾病暴露人口数;
本发明的医学时间序列预测模型包括动态邻接矩阵学习层(步骤3.1)、时空信息融合层(步骤3.2)、时序预测层(步骤3.3和3.4)。
步骤3.1:学习动态时间邻接矩阵;
在动态邻接矩阵学习层中,学习动态时间邻接矩阵。动态时间邻接矩阵Adyn的计算方法如下:
首先,将特征数据输入全连接层,学习获得特征数据的特征嵌入矩阵Vinit,如公式(2)所示:
Vinit=dropout(ReLU(WX+b)), (2)
其中,X表示历史数据,W表示权重矩阵,b表示偏移量,RELU是激活函数,dropout是随机失活函数;
其次,对特征嵌入矩阵Vinit计算L2范数,如公式(3)所示:
其中,表示时间步i的L2范数;
然后,将每一个时间步的L2范数向量进行拼接,获得L2范数矩阵Vnormal,如公式(4)所示:
最后,将特征嵌入矩阵Vinit与其转置矩阵相乘,用于表示历史数据的特征信息,将L2范数矩阵Vnormal与其转置矩阵相乘,表示不同时间步历史数据之间的距离,动态时间邻接矩阵的计算方法,如公式(5)所示:
动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息;
步骤3.2:利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵:
现有的时间序列预测方法通常分别学习历史数据的时间信息和空间信息,然后通过拼接获得预测结果,这些方法难以挖掘时间信息与空间信息之间的相关性,因此本发明引入时空注意力机制融合时间和空间信息;
首先,将静态空间邻接矩阵Asta与动态时间邻接矩阵Adyn拼接得到Aconcat,如公式(6)所示:
Aconcat=concat(Asta,Adyn), (6)
然后,分别在时间维度与空间维度上计算多头注意力矩阵,多头注意力机制中的查询query、键key和值value为Aconcat的不同线性表示,空间多头注意力的计算方法如公式(7)和(8)所示:
Attnsta=MultiHead(Qspa,Kspa,Vspa)=concat(heads1,...,headsn)WAttSOut, (7)
headsi=Attention(QspaWi Qs,KspaWi Ks,VspaWi Vs), (8)
时间多头注意力的计算方法如公式(9)和(10)所示:
Attndyn=MultiHead(Qtem,Ktem,Vtem)=concat(headt1,...,headtn)WAttTOut, (9)
headti=Attention(QtemWi Qt,KtemWi Kt,VtemWi Vt), (10)
注意力机制的计算方法如公式(11)所示:
其中,Attnsta为静态空间注意力矩阵,Attndyn为动态时间注意力矩阵;headsi表示空间第i头注意力,headti表示时间第i头注意力;Qspa表示空间注意力的查询,Kspa表示空间注意力的键,Vspa表示空间注意力的值;Qtem表示时间注意力的查询,Ktem表示时间注意力的键,Vtem表示时间注意力的值;WAttSOut、Wi Qs、Wi Ks、Wi Vs、WAttTOut、Wi Qt、Wi Kt、Wi Vt为可学习的参数;concat为拼接函数,softmax为分类器,dk是输入数据的维度。
通过时间多头注意力矩阵、空间多头注意力矩阵,以及拼接邻接矩阵Aconcat的乘积得到时空邻接矩阵A,如公式(12)所示:
A=Attnsta×Aconcat×Attndyn, (12)
该邻接矩阵A作为时序预测层的邻接矩阵,用于时间序列数据的预测;
步骤3.3:采用图卷积神经网络GCN和门控循环单元GRU框架预测未来时间步的隐层状态;
首先,对于每一个历史时间步,将步骤3.1中生成的历史数据的特征嵌入矩阵Vinit、步骤3.2中生成的时空邻接矩阵A,作为图卷积神经网络的输入进行卷积计算,其中,动态时间邻接矩阵Adyn针对每个Batch(批处理)进行计算,因此,每个Batch时间步的时空邻接矩阵都是不同的,需要分别计算邻接矩阵的拉普拉斯形式;
然后,图卷积神经网络包括两层图卷积网络,在每层图卷积网络中,对特征嵌入矩阵Vinit进行卷积计算;
最后,将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入,计算预测时间步的隐层状态;
步骤3.4:生成预测时间步的疾病暴露人口数的方法为:
将门控循环单元GRU得到的隐层状态输入到全连接层中,将隐层状态的时间维度通过线性层转换为预测时间步长,生成疾病暴露人口数的预测值;将每个Batch的预测结果进行反归一化,计算时间序列预测模型的损失值;其中,归一化是指将原始数据归一到[0,1]之间,反归一化是归一化的逆过程,即将[0,1]之间的数值恢复到原始数据。
有益效果
本发明针对医学时间序列预测问题,提出了一种动态邻接矩阵和时空注意力机制的医学时间序列预测方法,与现有技术相比,具有如下有益效果:
1.所述方法引入医学时间序列历史数据的外部数据,包括地区边界线长度、地区中心城市经纬度、地区间人口流动三类外部数据,构建静态空间邻接矩阵,捕获不同发病地区之间的多种空间相关信息,解决现有方法忽略发病地区之间空间相关性的问题,从而提高医学时间序列预测的性能。
2.所述方法通过在历史数据的时间维度学习动态时间邻接矩阵,挖掘疾病暴露人口数在时间维度上的关联特征,解决单一的空间信息难以对未来疾病暴露人口数准确建模的问题,增强了医学时间序列预测方法应用于不同类型疾病暴露人口数预测的扩展性。
3.所述方法引入时空注意力机制,利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵,生成时空邻接矩阵。该时空邻接矩阵融合时间相关性与空间相关性,有助于解决现有时间序列预测方法分别对时间维度和空间维度进行预测,通过简单拼接获得时间序列预测结果,忽略时间与空间信息相互影响的问题,同时提高医学时间序列预测的性能。
附图说明
图1为本发明一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法的流程示意图。
具体实施方式
基于本发明方法的医学时间序列预测方法,以PyCharm为开发工具,Python为开发语言。下面结合实施例对本发明一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的优选实施方式进行详细说明。
如图1所示,一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,包括以下步骤:
步骤1:获取疾病暴露人口数的数据,采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据;
首先,获取的疾病暴露人口数数据为:若干省份或地区相同时间间隔的历史疾病暴露人口数X,
其中,q表示历史时间步步长,k是自然数,N表示地区数量,表示地区i时间步t的疾病暴露人口数,t≤k。
然后,采集地区边界线长度、地区中心城市经纬度、地区间人口流动三种外部数据,用于表示发病地区之间的空间关系;
地区边界线长度Alength为相邻的发病地区之间邻接边界线的长度,边界线越长表明相邻地区的空间相关性越大,维度为N×N,其中N是地区的数目。
地区间人口流动Apeople表示相邻发病地区之间人口迁移的数量或比例,人口流动数量越大表明相邻地区的空间相关性越大,维度为N×N。
地区中心城市经纬度Alongitude表示每一个发病地区的经纬度信息,其维度为N×2。
步骤2:对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理,构建静态空间邻接矩阵;
步骤2.1:构建特征数据和标签数据,划分训练集、验证集和测试集;
构建特征数据和标签数据的方法为:设seq_len表示历史时间步长,pre_len表示预测时间步长,将历史数据构建为大小是(group_num×seq_len×N)的特征数据,以及大小为(group_num×pre_len×N)的标签数据,其中,group_num是数据组数。
然后,划分训练集、验证集和测试集。
根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据。训练集、验证集和测试集的所占比例之和为1。将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘,获得训练集、验证集和测试集的大小,由此将特征数据和标签数据分割为训练集、验证集和测试集。
按照设定的Batch值,将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练。
步骤2.2:构建静态空间邻接矩阵;
首先,利用步骤1中获得的地区中心城市经纬度Alongitude,采用欧氏距离计算不同地区中心城市之间的距离,获得地区欧氏距离Aeucilide,如公式(1)所示:
其中,Alongitude[i][0]和Alongitude[j][0]表示地区i和地区j的经度,Alongitude[i][1]和Alongitude[j][1]表示地区i和地区j的纬度。
欧氏距离表示发病地区之间的距离,不同地区之间的位置关系越近,则这些地区的空间相关性越大。
然后,将地区边界线长度Alength、地区间人口流动Apeople,以及地区欧氏距离Aeucilide的倒数相加,获得静态空间邻接矩阵Asta。Asta表示疾病发病地区之间的空间相关性,旨在于解决现有方法忽略空间相关性的问题。
步骤2.3:对历史数据和静态空间邻接矩阵进行归一化;
由于不同地区的疾病暴露人口数数值不同,并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大。因此,需要对历史数据和静态空间邻接矩阵进行归一化操作,将其数值范围归一至[0,1]区间,从而时间序列预测模型训练时提高收敛速度,获得时间序列预测模型的最优参数。
步骤3:采用基于动态邻接矩阵和时空注意力机制的预测模型获得医学时间序列预测结果,即获得预测时间步的医学疾病暴露人口数;
本发明的医学时间序列预测模型包括动态邻接矩阵学习层(步骤3.1)、时空信息融合层(步骤3.2)、时序预测层(步骤3.3和3.4)。
步骤3.1:学习动态时间邻接矩阵;
在动态邻接矩阵学习层中,学习动态时间邻接矩阵。动态时间邻接矩阵Adyn的计算方法如下。
首先,将特征数据输入全连接层,学习获得特征数据的特征嵌入矩阵Vinit,如公式(2)所示:
Vinit=dropout(ReLU(WX+b)), (2)
其中,X表示历史数据,W表示权重矩阵,b表示偏移量,RELU是激活函数,dropout是随机失活函数。
其次,对特征嵌入矩阵Vinit计算L2范数,如公式(3)所示:
其中,表示时间步i的L2-范数。
然后,将每一个时间步的L2范数向量进行拼接,获得L2范数矩阵Vnormal,如公式(4)所示:
最后,将特征嵌入矩阵Vinit与其转置矩阵相乘,用于表示历史数据的特征信息。将L2范数矩阵Vnormal与其转置矩阵相乘,表示不同时间步历史数据之间的距离。动态时间邻接矩阵的计算方法,如公式(5)所示:
动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息;
步骤3.2:利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵;
现有的时间序列预测方法通常分别学习历史数据的时间信息和空间信息,然后通过拼接获得预测结果。这些方法难以挖掘时间信息与空间信息之间的相关性,因此本发明引入时空注意力机制融合时间和空间信息。
在时空信息融合层,首先,将静态空间邻接矩阵Asta与动态时间邻接矩阵Adyn拼接得到Aconcat,如公式(6)所示:
Aconcat=concat(Asta,Adyn), (6)
然后,分别在时间维度与空间维度上计算多头注意力矩阵。多头注意力机制中的查询query、键key和值value为Aconcat的不同线性表示,空间多头注意力的计算方法如公式(7)和(8)所示:
Attnsta=MultiHead(Qspa,Kspa,Vspa)=concat(heads1,...,headsn)WAttSOut, (7)
headsi=Attention(QspaWi Qs,KspaWi Ks,VspaWi Vs), (8)
时间多头注意力的计算方法如公式(9)和(10)所示:
Attndyn=MultiHead(Qtem,Ktem,Vtem)=concat(headt1,...,headtn)WAttTOut,(9)
headti=Attention(QtemWi Qt,KtemWi Kt,VtemWi Vt), (10)
注意力机制的计算方法如公式(11)所示:
其中,Attnsta为静态空间注意力矩阵,Attndyn为动态时间注意力矩阵;headsi表示空间第i头注意力,headti表示时间第i头注意力;Qspa表示空间注意力的查询,Kspa表示空间注意力的键,Vspa表示空间注意力的值;Qtem表示时间注意力的查询,Ktem表示时间注意力的键,Vtem表示时间注意力的值;WAttSOut、Wi Qs、Wi Ks、Wi Vs、WAttTOut、Wi Qt、Wi Kt、Wi Vt为可学习的参数;concat为拼接函数,softmax为分类器,dk是输入数据的维度。
通过时间多头注意力矩阵、空间多头注意力矩阵,以及拼接邻接矩阵Aconcat的乘积得到时空邻接矩阵A,如公式(12)所示:
A=Attnsta×Aconcat×Attndyn, (12)
该邻接矩阵A作为时序预测层的邻接矩阵,用于时间序列数据的预测。
步骤3.3:采用图卷积神经网络GCN和门控循环单元GRU框架预测未来时间步的隐层状态;
首先,对于每一个历史时间步,将步骤3.1中生成的历史数据的特征嵌入矩阵Vinit、步骤3.2中生成的时空邻接矩阵A,作为图卷积神经网络的输入进行卷积计算。其中,动态时间邻接矩阵Adyn针对每个Batch(批处理)进行计算,因此,每个Batch的时空邻接矩阵都是不同的,需要分别计算邻接矩阵的拉普拉斯形式。
然后,图卷积神经网络包括两层图卷积网络。在每层图卷积网络中,对特征嵌入矩阵Vinit进行卷积计算。
最后,将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入,计算预测时间步的隐层状态。
步骤3.4:将隐层状态作为输入至全连接层,生成预测时间步的疾病暴露人口数;
在时序预测层,将门控循环单元GRU得到的隐层状态输入到全连接层中,将隐层状态的时间维度通过线性层转换为预测时间步长,生成疾病暴露人口数的预测值。将每个Batch的预测结果进行反归一化,计算时间序列预测模型的损失值。其中,归一化是指将原始数据归一到[0,1]之间,反归一化是归一化的逆过程,即将[0,1]之间的数值恢复到原始数据。
实施例
本实施例叙述了采用本发明所述的一种基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的流程,如图1所示,包括如下步骤:
步骤1:获取疾病暴露人口数数据,采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据;
首先,获取的疾病暴露人口数数据为:若干省份或地区相同时间间隔的历史疾病暴露人口数X,
其中,q表示历史时间步步长,k是自然数,N表示地区数量,表示地区i时间步t的疾病暴露人口数,t≤k。
本实施例中使用的历史疾病暴露人口数数据集为2004至2018年中国31个省份、直辖市和自治区的传染病暴露数。该数据集是对于31个地区(即省份、直辖市和自治区)的传染病暴露数的统计数据,以月为统计单位,每个地区包括180个月的传染病暴露数。
然后,采集地区边界线长度、地区中心城市经纬度、地区间人口流动三种外部数据,用于表示发病地区之间的空间关系;
地区边界线长度Alength为相邻的发病地区之间邻接边界线的长度,边界线越长表明相邻地区的空间相关性越大,维度为N×N,其中N是地区的数目。
地区间人口流动Apeople表示相邻发病地区之间人口迁移的数量或比例,人口流动数量越大表明相邻地区的空间相关性越大,维度为N×N。
地区中心城市经纬度Alongitude表示每一个发病地区的经纬度信息,其维度为N×2。
地区边界线长度利用百度地图,通过测距功能获得边界线长度,矩阵维度为31×31。
地区中心城市经纬度数据来源于如下网址:https://blog.csdn.net/hot_boom_dog/article/details/100121745?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162804457316780264099819%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162804457316780264099819&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-100121745.first_rank_v2_pc_rank_v29&utm_term=%E4%B8%AD%E5%9B%BD%E5%90%84%E7%9C%81%E7%BB%8F%E7%BA%AC%E5%BA%A6&spm=1018.2226.3001.4187,维度为31×2。
地区间人口流动数据来自百度人口迁徙大数据,数值为不同省份之间人口迁徙的比例,维度为31×31。
步骤2:对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理,构建静态空间邻接矩阵;
步骤2.1:构建特征数据和标签数据,划分训练集、验证集和测试集;
构建特征数据和标签数据的方法为:设seq_len表示历史时间步长,pre_len表示预测时间步长,将历史数据构建为大小是(group_num×seq_len×N)的特征数据,以及大小为(group_num×pre_len×N)的标签数据,其中,group_num是数据组数。
然后,划分训练集、验证集和测试集。
根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据。训练集、验证集和测试集的所占比例之和为1。将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘,获得训练集、验证集和测试集的大小,由此将特征数据和标签数据分割为训练集、验证集和测试集。
本实施例中,预设历史时间步长为6,预测时间步长为1。以180个时间步31个地区的训练数据为例,如果以6个历史时间步预测1个未来时间步,那么数据组数group_num为175,每一组特征数据的维度为6×31,每一组标签数据的维度为1×31。
将历史数据分割为时间步长为12的特征数据和时间步长为1的标签数据。训练集、验证集和测试集的所占比例为(0.6,0.2,0.2),将特征数据和标签数据按照该比例分割为训练集、验证集和测试集。
按照设定的Batch值,将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练。
步骤2.2:构建静态空间邻接矩阵;
首先,利用步骤1中获得的地区中心城市经纬度Alongitude,采用欧氏距离计算不同地区中心城市之间的距离,获得地区欧氏距离Aeucilide,如公式(1)所示:
其中,Alongitude[i][0]和Alongitude[j][0]表示地区i和地区j的经度,Alongitude[i][1]和Alongitude[j][1]表示地区i和地区j的纬度。
欧氏距离表示发病地区之间的距离,不同地区之间的位置关系越近,则这些地区的空间相关性越大。
然后,将地区边界线长度Alength、地区间人口流动Apeople,以及地区欧氏距离Aeucilide的倒数相加,获得静态空间邻接矩阵Asta。Asta表示疾病发病地区之间的空间相关性,旨在于解决现有方法忽略空间相关性的问题。
本实施例中,首先,获得维度为(31×31)的地区欧氏距离矩阵。然后,将地区边界线长度、地区间人口流动、以及地区欧氏距离矩阵的倒数相加,构建静态空间邻接矩阵,其维度为(31×31)。
步骤2.3:对历史数据和静态空间邻接矩阵进行归一化;
由于不同地区的疾病暴露人口数数值不同,并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大。因此,需要对历史数据和静态空间邻接矩阵进行归一化操作,将其数值范围归一至[0,1]区间,从而时间序列预测模型训练时提高收敛速度,获得时间序列预测模型的最优参数。
本实施例中,使用机器学习中MinMaxScaler函数对历史数据、静态空间邻接矩阵的数值进行归一化操作,将其数值范围统一为[0,1]。
步骤3:采用基于动态邻接矩阵和时空注意力机制的预测模型获得医学时间序列预测结果,即获得预测时间步的医学疾病暴露人口数;
本发明的医学时间序列预测模型包括动态邻接矩阵学习层(步骤3.1)、时空信息融合层(步骤3.2)、时序预测层(步骤3.3和3.4)。
步骤3.1:学习动态时间邻接矩阵;
在动态邻接矩阵学习层中,学习动态时间邻接矩阵。动态时间邻接矩阵Adyn的计算方法如下。
首先,将特征数据输入全连接层,学习获得特征数据的特征嵌入矩阵Vinit,如公式(2)所示。
Vinit=dropout(ReLU(WX+b)), (2)
其中,X表示历史数据,W表示权重矩阵,b表示偏移量,RELU是激活函数,dropout是随机失活函数。
其次,对特征嵌入矩阵Vinit计算L2范数,如公式(3)所示。
其中,表示时间步i的L2-范数。
然后,将每一个时间步的L2范数向量进行拼接,获得L2范数矩阵Vnormal,如公式(4)所示。
最后,将特征嵌入矩阵Vinit与其转置矩阵相乘,用于表示历史数据的特征信息。将L2范数矩阵Vnormal与其转置矩阵相乘,表示不同时间步历史数据之间的距离。动态时间邻接矩阵的计算方法,如公式(5)所示。
动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息。
本实施例中,动态时间邻接矩阵Adyn的维度为(6×6),其中,6是历史时间步长。
步骤3.2:利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵;
现有的时间序列预测方法通常分别学习历史数据的时间信息和空间信息,然后通过拼接获得预测结果。这些方法难以挖掘时间信息与空间信息之间的相关性,因此本发明引入时空注意力机制融合时间和空间信息。
在时空信息融合层,首先,将静态空间邻接矩阵Asta与动态时间邻接矩阵Adyn拼接得到Aconcat,如公式(6)所示。
Aconcat=concat(Asta,Adyn), (6)
然后,分别在时间维度与空间维度上计算多头注意力矩阵。多头注意力机制中的查询query、键key和值value为Aconcat的不同线性表示,空间多头注意力的计算方法如公式(7)和(8)所示:
Attnsta=MultiHead(Qspa,Kspa,Vspa)=concat(heads1,...,headsn)WAttSOut, (7)
headsi=Attention(QspaWi Qs,KspaWi Ks,VspaWi Vs), (8)
时间多头注意力的计算方法如公式(9)和(10)所示:
Attndyn=MultiHead(Qtem,Ktem,Vtem)=concat(headt1,...,headtn)WAttTOut, (9)
headti=Attention(QtemWi Qt,KtemWi Kt,VtemWi Vt), (10)
注意力机制的计算方法如公式(11)所示:
其中,Attnsta为静态空间注意力矩阵,Attndyn为动态时间注意力矩阵;headsi表示空间第i头注意力,headti表示时间第i头注意力;Qspa表示空间注意力的查询,Kspa表示空间注意力的键,Vspa表示空间注意力的值;Qtem表示时间注意力的查询,Ktem表示时间注意力的键,Vtem表示时间注意力的值;WAttSOut、Wi Qs、Wi Ks、Wi Vs、WAttTOut、Wi Qt、Wi Kt、Wi Vt为可学习的参数;concat为拼接函数,softmax为分类器,dk是输入数据的维度。
通过时间多头注意力矩阵、空间多头注意力矩阵,以及拼接邻接矩阵Aconcat的乘积得到时空邻接矩阵A,如公式(12)所示。该邻接矩阵A作为时序预测层的邻接矩阵,用于时间序列数据的预测。
A=Attnsta×Aconcat×Attndyn, (12)
步骤3.3:采用图卷积神经网络GCN和门控循环单元GRU框架预测未来时间步的隐层状态;
首先,对于每一个历史时间步,将步骤3.1中生成的历史数据的特征嵌入矩阵Vinit、步骤3.2中生成的时空邻接矩阵A,作为图卷积神经网络的输入进行卷积计算。其中,动态时间邻接矩阵Adyn针对每个Batch(批处理)进行计算,因此,每个Batch的时空邻接矩阵都是不同的,需要分别计算邻接矩阵的拉普拉斯形式。
然后,图卷积神经网络包括两层图卷积网络。在每层图卷积网络中,对特征嵌入矩阵Vinit进行卷积计算。
最后,将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入,计算预测时间步的隐层状态。
步骤3.4:将隐层状态作为输入至全连接层,生成预测时间步的疾病暴露人口数;
在时序预测层,将门控循环单元GRU得到的隐层状态输入到全连接层中,将隐层状态的时间维度通过线性层转换为预测时间步长,生成疾病暴露人口数的预测值。将每个Batch的预测结果进行反归一化,计算时间序列预测模型的损失值。其中,归一化是指将原始数据归一到[0,1]之间,反归一化是归一化的逆过程,即将[0,1]之间的数值恢复到原始数据。
为说明本发明的医学时间序列预测效果,即对若干地区的未来时间步的疾病暴露人口数进行预测。本实验是在同等条件下,以相同的训练集、验证集和测试集分别采用三种方法进行比较。
第一种方法是基于时间图卷积网络T-GCN的医学时间序列预测方法。第二种是基于图信号的动态线性模型预测方法GraphSAGE。第三种是本发明的基于动态邻接矩阵和时空注意力的医学时间序列预测方法。
采用的评测指标为:平均绝对误差MAE(Mean Absolute Error)、平均绝对百分比误差MAPE(Mean Absolute Percent Error)、均方根误差RMSE(Root Mean Square Error)。这三个指标均表示预测数据与真实数据之间的误差,因此,MAE、MAPE、RMSE的值越小,表示时间序列预测方法的预测效果越好。
(1)基于时间图卷积网络T-GCN的时间序列预测方法中隐层维度为256,平均绝对误差MAE为1.3525,平均绝对百分比误差MAPE为0.6489、均方根误差RMSE为1.5376;(2)基于图信号的动态线性模型预测方法GraphSAGE中隐层维度为256,平均绝对误差MAE为1.6387,平均绝对百分比误差MAPE为0.7829、均方根误差RMSE为1.9783;(3)基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法中隐层维度为256,平均绝对误差MAE为1.0758,平均绝对百分比误差MAPE为0.6125,均方根误差RMSE为1.2796。实验结果表明,本发明提出的基于动态邻接矩阵和时空注意力机制的医学时间序列预测方法的性能优于另外两种方法的性能,即表明了本发明方法的有效性。
以上所述为本发明的较佳实施例而已,本发明不应局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。
Claims (3)
1.一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,其特征在于该方法的步骤包括:
步骤1:获取疾病暴露人口数数据,采集地区边界线长度、地区中心城市经纬度、地区间人口流动数据;
步骤2:对步骤1获取的疾病暴露人口数数据以及采集到的地区边界线长度、地区中心城市经纬度、地区间人口流动数据进行预处理,构建静态空间邻接矩阵;
步骤2.1:构建特征数据和标签数据,划分训练集、验证集和测试集;
构建特征数据和标签数据的方法为:设seq_len表示历史时间步长,pre_len表示预测时间步长,将历史数据构建为大小是(group_num×seq_len×N)的特征数据,以及大小为(group_num×pre_len×N)的标签数据,其中,group_num是数据组数,N是地区数量;
划分训练集、验证集和测试集的方法为:
根据训练集、验证集和测试集的预设所占比例分割特征数据和标签数据,训练集、验证集和测试集的所占比例之和为1,将训练集、验证集和测试集各自的所占比例与数据组数group_num相乘,获得训练集、验证集和测试集的大小,由此将特征数据和标签数据分割为训练集、验证集和测试集,按照设定的Batch值,将大小为Batch值的训练数据作为输入数据分批进行时间序列预测模型训练;
步骤2.2中,构建静态空间邻接矩阵;
首先,利用步骤1中获得的地区中心城市经纬度Alongitude,采用欧氏距离计算不同地区中心城市之间的距离,获得地区欧氏距离Aeucilide,如公式(1)所示:
其中,Alongitude[i][0]和Alongitude[j][0]表示地区i和地区j的经度,Alongitude[i][1]和Alongitude[j][1]表示地区i和地区j的纬度;
欧氏距离表示发病地区之间的距离,不同地区之间的位置关系越近,则这些地区的空间相关性越大;
然后,将地区边界线长度Alength、地区间人口流动Apeople,以及地区欧氏距离Aeucilide的倒数相加,获得静态空间邻接矩阵Asta,Asta表示疾病发病地区之间的空间相关性;
步骤2.3:对历史数据和静态空间邻接矩阵进行归一化;
由于不同地区的疾病暴露人口数数值不同,并且静态空间邻接矩阵之间的数值差距会随着网络训练而增大,因此,需要对历史数据和静态空间邻接矩阵进行归一化操作,将其数值范围归一至[0,1]区间,从而时间序列预测模型训练时提高收敛速度,获得时间序列预测模型的最优参数;
步骤3:采用基于动态邻接矩阵和时空注意力的方法获得医学时间序列预测结果;
医学时间序列预测模型包括动态邻接矩阵学习层、时空信息融合层、时序预测层;
步骤3.1:学习动态时间邻接矩阵;
在动态邻接矩阵学习层中,学习动态时间邻接矩阵,动态时间邻接矩阵Adyn的计算方法如下;
首先,将特征数据输入全连接层,学习获得特征数据的特征嵌入矩阵Vinit,如公式(2)所示:
Vinit=dropout(ReLU(WX+b)), (2)
其中,X表示历史数据,W表示权重矩阵,b表示偏移量,RELU是激活函数,dropout是随机失活函数;
其次,对特征嵌入矩阵Vinit计算L2范数,如公式(3)所示:
其中,表示时间步i的L2-范数;
然后,将每一个时间步的L2范数向量进行拼接,获得L2范数矩阵Vnormal,如公式(4)所示:
最后,将特征嵌入矩阵Vinit与其转置矩阵相乘,用于表示历史数据的特征信息,将L2范数矩阵Vnormal与其转置矩阵相乘,表示不同时间步历史数据之间的距离,动态时间邻接矩阵的计算方法,如公式(5)所示:
动态时间邻接矩阵表示不同时间步之间相互影响的时间维度信息;
步骤3.2:利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵;
引入时空注意力机制融合时间和空间信息;
在时空信息融合层,首先,将静态空间邻接矩阵Asta与动态时间邻接矩阵Adyn拼接得到Aconcat,如公式(6)所示:
Aconcat=concat(Asta,Adyn), (6)
然后,分别在时间维度与空间维度上计算多头注意力矩阵,多头注意力机制中的查询query、键key和值value为Aconcat的不同线性表示,空间多头注意力的计算方法如公式(7)和(8)所示:
Attnsta=MultiHead(Qspa,Kspa,Vspa)=concat(heads1,...,headsn)WAttSOut, (7)
headsi=Attention(QspaWi Qs,KspaWi Ks,VspaWi Vs), (8)
时间多头注意力的计算方法如公式(9)和(10)所示:
Attndyn=MultiHead(Qtem,Ktem,Vtem)=concat(headt1,...,headtn)WAttTOut, (9)
注意力机制的计算方法如公式(11)所示:
其中,Attnsta为静态空间注意力矩阵,Attndyn为动态时间注意力矩阵;headsi表示空间第i头注意力,headti表示时间第i头注意力;Qspa表示空间注意力的查询,Kspa表示空间注意力的键,Vspa表示空间注意力的值;Qtem表示时间注意力的查询,Ktem表示时间注意力的键,Vtem表示时间注意力的值;WAttSOut、Wi Qs、Wi Ks、Wi Vs、WAttTOut、Wi Qt、Wi Kt、Wi Vt为可学习的参数;concat为拼接函数,softmax为分类器,dk是输入数据的维度;
通过时间多头注意力矩阵、空间多头注意力矩阵,以及拼接邻接矩阵Aconcat的乘积得到时空邻接矩阵A,如公式(12)所示:
A=Attnsta×Aconcat×Attndyn, (12)
该邻接矩阵A作为时序预测层的邻接矩阵,用于时间序列数据的预测;
步骤3.3:采用图卷积神经网络GCN和门控循环单元GRU框架预测未来时间步的隐层状态;
首先,对于每一个历史时间步,将步骤3.1中生成的历史数据的特征嵌入矩阵Vinit、步骤3.2中生成的时空邻接矩阵A,作为图卷积神经网络的输入进行卷积计算,其中,动态时间邻接矩阵Adyn针对每个Batch进行计算,因此,每个Batch的时空邻接矩阵都是不同的,需要分别计算邻接矩阵的拉普拉斯形式;
然后,图卷积神经网络包括两层图卷积网络,在每层图卷积网络中,对特征嵌入矩阵Vinit进行卷积计算;
最后,将图卷积神经网络GCN的输出嵌入作为每一个门控循环单元GRU时间步的输入,计算预测时间步的隐层状态;
步骤3.4:将隐层状态作为输入至全连接层,生成预测时间步的疾病暴露人口数;
在时序预测层,将门控循环单元GRU得到的隐层状态输入到全连接层中,将隐层状态的时间维度通过线性层转换为预测时间步长,生成疾病暴露人口数的预测值,将每个Batch的预测结果进行反归一化,计算时间序列预测模型的损失值,其中,归一化是指将原始数据归一到[0,1]之间,反归一化是归一化的逆过程,即将[0,1]之间的数值恢复到原始数据。
2.根据权利要求1所述的一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,其特征在于:
所述的步骤1中,获取的疾病暴露人口数数据为:若干省份或地区相同时间间隔的历史疾病暴露人口数X,
其中,q表示历史时间步步长,k是自然数,N表示地区数量,表示地区i时间步t的疾病暴露人口数,t≤k。
3.根据权利要求2所述的一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,其特征在于:
所述的步骤1中,地区边界线长度Alength为相邻的发病地区之间邻接边界线的长度,维度为N×N,其中,N是地区的数量;
地区中心城市经纬度Alongitude表示每一个发病地区的经纬度信息,其维度为N×2;
地区间人口流动数据Apeople表示相邻发病地区之间人口迁移的数量或比例,维度为N×N。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022105063181 | 2022-05-10 | ||
CN202210506318 | 2022-05-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116110588A CN116110588A (zh) | 2023-05-12 |
CN116110588B true CN116110588B (zh) | 2024-04-26 |
Family
ID=86260549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211452111.7A Active CN116110588B (zh) | 2022-05-10 | 2022-11-21 | 基于动态邻接矩阵和时空注意力的医学时间序列预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116110588B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117438023B (zh) * | 2023-10-31 | 2024-04-26 | 灌云县南岗镇卫生院 | 基于大数据的医院信息管理方法及系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
CN111738535A (zh) * | 2020-08-25 | 2020-10-02 | 北京交通大学 | 轨道交通时空短时客流预测方法、装置、设备及存储介质 |
CN111918321A (zh) * | 2020-07-22 | 2020-11-10 | 湖北工业大学 | 一种基于时空注意卷积网络的移动流量预测方法 |
CN112580859A (zh) * | 2020-06-01 | 2021-03-30 | 北京理工大学 | 一种基于全局注意力机制的雾霾预测方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
CN112988723A (zh) * | 2021-02-09 | 2021-06-18 | 北京工业大学 | 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 |
WO2021151325A1 (zh) * | 2020-09-09 | 2021-08-05 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊模型训练方法、装置及设备 |
CN113314231A (zh) * | 2021-05-28 | 2021-08-27 | 北京航空航天大学 | 一种融合时空信息的传染病传播预测系统和装置 |
WO2021174876A1 (zh) * | 2020-09-18 | 2021-09-10 | 平安科技(深圳)有限公司 | 基于智能决策的人口流动预测方法、装置及计算机设备 |
CN113487088A (zh) * | 2021-07-06 | 2021-10-08 | 哈尔滨工业大学(深圳) | 基于动态时空图卷积注意力模型的交通预测方法及装置 |
CN113808693A (zh) * | 2021-09-10 | 2021-12-17 | 浙江科技学院 | 一种基于图神经网络和注意力机制的药物推荐方法 |
CN114124734A (zh) * | 2021-11-20 | 2022-03-01 | 四川大学 | 一种基于GCN-Transformer集成模型的网络流量预测方法 |
CN114299728A (zh) * | 2021-12-29 | 2022-04-08 | 杭州电子科技大学 | 结合注意力机制与动态时空卷积模型的车辆流量预测方法 |
CN114330868A (zh) * | 2021-12-27 | 2022-04-12 | 西北工业大学 | 基于自注意力的个性化增强图卷积网络的客流预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11651860B2 (en) * | 2019-05-15 | 2023-05-16 | International Business Machines Corporation | Drug efficacy prediction for treatment of genetic disease |
-
2022
- 2022-11-21 CN CN202211452111.7A patent/CN116110588B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
CN112580859A (zh) * | 2020-06-01 | 2021-03-30 | 北京理工大学 | 一种基于全局注意力机制的雾霾预测方法 |
CN111918321A (zh) * | 2020-07-22 | 2020-11-10 | 湖北工业大学 | 一种基于时空注意卷积网络的移动流量预测方法 |
CN111738535A (zh) * | 2020-08-25 | 2020-10-02 | 北京交通大学 | 轨道交通时空短时客流预测方法、装置、设备及存储介质 |
WO2021151325A1 (zh) * | 2020-09-09 | 2021-08-05 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊模型训练方法、装置及设备 |
WO2021174876A1 (zh) * | 2020-09-18 | 2021-09-10 | 平安科技(深圳)有限公司 | 基于智能决策的人口流动预测方法、装置及计算机设备 |
CN112988723A (zh) * | 2021-02-09 | 2021-06-18 | 北京工业大学 | 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
CN113314231A (zh) * | 2021-05-28 | 2021-08-27 | 北京航空航天大学 | 一种融合时空信息的传染病传播预测系统和装置 |
CN113487088A (zh) * | 2021-07-06 | 2021-10-08 | 哈尔滨工业大学(深圳) | 基于动态时空图卷积注意力模型的交通预测方法及装置 |
CN113808693A (zh) * | 2021-09-10 | 2021-12-17 | 浙江科技学院 | 一种基于图神经网络和注意力机制的药物推荐方法 |
CN114124734A (zh) * | 2021-11-20 | 2022-03-01 | 四川大学 | 一种基于GCN-Transformer集成模型的网络流量预测方法 |
CN114330868A (zh) * | 2021-12-27 | 2022-04-12 | 西北工业大学 | 基于自注意力的个性化增强图卷积网络的客流预测方法 |
CN114299728A (zh) * | 2021-12-29 | 2022-04-08 | 杭州电子科技大学 | 结合注意力机制与动态时空卷积模型的车辆流量预测方法 |
Non-Patent Citations (2)
Title |
---|
一种基于序列到序列时空注意力学习的交通流预测模型;杜圣东;李天瑞;杨燕;王浩;谢鹏;洪西进;;计算机研究与发展(第08期);149-162 * |
基于图卷积嵌入与特征交叉的文献被引量预测方法:以交通运输领域为例;张思凡, 牛振东, 陆浩等;数据分析与知识发现;第4卷(第9期);56-67 * |
Also Published As
Publication number | Publication date |
---|---|
CN116110588A (zh) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223301B (zh) | 一种基于图注意力卷积网络的交通流量预测方法 | |
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
CN112532439B (zh) | 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法 | |
CN115240425B (zh) | 一种基于多尺度时空融合图网络的交通预测方法 | |
CN111738535A (zh) | 轨道交通时空短时客流预测方法、装置、设备及存储介质 | |
CN112910711B (zh) | 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质 | |
Yin et al. | Experimental study of multivariate time series forecasting models | |
CN116504060B (zh) | 基于Transformer的扩散图注意力网络交通流预测方法 | |
Fu et al. | Spatial–temporal convolutional model for urban crowd density prediction based on mobile-phone signaling data | |
CN113688253B (zh) | 一种层次感知的时态知识图谱表示学习方法 | |
CN116110588B (zh) | 基于动态邻接矩阵和时空注意力的医学时间序列预测方法 | |
CN114388137A (zh) | 城市流感发病趋势预测方法、系统、终端以及存储介质 | |
CN114169649A (zh) | 一种基于时空数据嵌入的交通流量预测方法 | |
Deng et al. | The pulse of urban transport: Exploring the co-evolving pattern for spatio-temporal forecasting | |
CN112418508B (zh) | 基于物理空间与社交网络空间交互的人口分布预测方法 | |
Jiang et al. | Bi‐GRCN: A Spatio‐Temporal Traffic Flow Prediction Model Based on Graph Neural Network | |
Song et al. | Graph attention convolutional network: Spatiotemporal modeling for urban traffic prediction | |
CN116311939A (zh) | 基于动态时空相关性的od需求预测方法及系统 | |
CN117116045A (zh) | 一种基于时空序列深度学习的交通流量预测方法及装置 | |
Shuai et al. | Relationship analysis of short-term origin–destination prediction performance and spatiotemporal characteristics in urban rail transit | |
CN109102698B (zh) | 基于集成lssvr模型的路网中短时交通流的预测方法 | |
CN117271899A (zh) | 一种基于时空感知的兴趣点推荐方法 | |
Kong et al. | A novel ConvLSTM with multifeature fusion for financial intelligent trading | |
ABBAS | A survey of research into artificial neural networks for crime prediction | |
Pang et al. | A robust approach for multivariate time series forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |