CN113161002A - 一种基于深度时空残差网络预测登革热疾病的方法 - Google Patents

一种基于深度时空残差网络预测登革热疾病的方法 Download PDF

Info

Publication number
CN113161002A
CN113161002A CN202010073432.0A CN202010073432A CN113161002A CN 113161002 A CN113161002 A CN 113161002A CN 202010073432 A CN202010073432 A CN 202010073432A CN 113161002 A CN113161002 A CN 113161002A
Authority
CN
China
Prior art keywords
time
data
dengue fever
space
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010073432.0A
Other languages
English (en)
Inventor
常伟
余捷全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Yuxiu Technology Co ltd
Original Assignee
Guangdong Yuxiu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Yuxiu Technology Co ltd filed Critical Guangdong Yuxiu Technology Co ltd
Priority to CN202010073432.0A priority Critical patent/CN113161002A/zh
Publication of CN113161002A publication Critical patent/CN113161002A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于深度时空残差网络预测登革热疾病的方法,利用所采集数据的时空属性以及深度学习方法强大的拟合能力,构建了基于深度时空残差网络,以预测特定时空下的登革热疾病。通过登革热传感器采集城市登革热发病的时空数据,同时考虑房价信息、气象数据、个人收入信息、即时通讯软件的聊天数据等外部条件数据,进行数据的深度时空残差网络训练,本发明能更加准确地对登革热疾病进行预测,克服了疾病预测难、发现慢等现有问题。

Description

一种基于深度时空残差网络预测登革热疾病的方法
技术领域
本发明属于疾病预防技术领域,涉及一种预测登革热疾病的方法,具体是一种基于深度时空残差网络预测登革热疾病的方法。
背景技术
有效的登革热疾病检测方法有利于及早发现和控制疾病传播,目前,传统的筛查登革热病例主要是通过核酸检测和抗体阳性检测。核酸检测需要两个小时才出结果,而抗体阳性检测一个小时则可以出结果了,但是专家们一致认为用核酸检测对疫情控制更有效,因为核酸一旦感染了就能检测出来,准确率达95%,而抗体阳性检测发病后五天内的检出率为50%,可能会漏诊登革热病例,也不利于疫情控制。
针对传统登革热疾病检测方法的不足,我们可以引入深度学习的技术来预测登革热疾病,但引入深度学习技术要考虑到数据的时空属性,以及样本的不充裕等因素。
发明内容
针对现有技术的不足,本发明提供一种基于深度时空残差网络预测登革热疾病的方法,通过登革热传感器采集城市登革热发病的时空数据,同时考虑房价信息、气象数据、个人收入信息、即时通讯软件的聊天数据等外部条件数据,进行数据的深度时空残差网络训练,本发明能更加准确地对登革热疾病进行预测,克服了疾病预测难、发现慢等现有问题。
本发明的技术方案为:
基于深度时空残差网络预测登革热疾病的方法,通过采集指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据,并构造基于深度时空残差网络结构;对基于深度时空残差网络中进行网络训练、验证和测试,得到的深度时空残差网络作为最终的登革热疾病预测模型,将指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据输入最终的登革热疾病预测模型,可得到未来某一时刻某区域的登革热疾病预测结果。
基于深度时空残差网络预测登革热疾病的方法在采集登革热疾病的发病时空数据时,具体为采集三年时间内,每1小时的城市登革热疾病的发病时空数据,首先根据经纬度将一个城市划分为I×J网格地图,其中网格表示一个区域,接着采集每个网格每1个小时的登革热疾病的发病数据,可得到一个单通道的矩阵Xt∈RI×J
另外,外部条件数据为与登革热疾病的发病时空数据相同时间内的房价数据,收入指数,气候数据,假期数据和微信事件数据。具体上,房价数据的数据格式为小区编号,小区名,经度,纬度;收入指数的数据格式为收入,半径;气候数据的数据格式为日期,温度,风速,天气;假期数据的数据格式为日期;微信事件的数据格式为日期,小时,事件;
基于深度时空残差网络预测登革热疾病的方法中,基于深度时空残差网络结构包括拟合登革热疾病发病的时间特征和空间特征的时空残差网络、拟合外部条件影响登革热疾病的外部条件神经网络以及输出融合部分。在构造时空残差网络时,将时间轴划分为三个片段,表示最近时间、稍远时间和遥远时间,每一个片段分别被输入到三个结构相同的时空残差子网络中来提取提取时间邻近性、周期性、趋势性;三个时间片段下的时空残差子网络结构相同,共L+2层,第1层为卷积层Conv1,第2层到第L层为残差单元,第L+2层为卷积层Conv2;最近时间、稍远时间和遥远时间三个时间片段的数据序列分别可由多个时间点的时空数据组合而成,再经过时空残差子网络后得到的输出分别为
Figure RE-GDA0002505611450000021
外部条件神经网络中,输入为外部条件数据组成的特征向量Et,结构上将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层,第二层用于将上一层的输出进行维度转化,以便于融合。在输出融合部分,最近时间、稍远时间和遥远时间三个时间片段下的时空残差子网络输出以及外部条件神经网络输出的融合,融合方法按以下公式:
Figure RE-GDA0002505611450000022
本发明的有益效果为:本发明提供一种基于深度时空残差网络预测登革热疾病的方法,通过登革热传感器采集城市登革热发病的时空数据,训练得到深度时空残差网络,由于同时考虑房价信息、气象数据、个人收入信息、即时通讯软件的聊天数据等外部条件数据,本发明能更加准确地对登革热疾病进行预测,克服了疾病预测难、发现慢等现有问题。
本发明与深度学习技术相结合,主要有五个难点:
第一,我们在城市获得上述数据的时候,往往拿到的是不一定是真实数据,或者数据不全;
第二,入口流动,导致预测样本量较大;
第三,实时数据,数据无法实时收集汇总;
第四,资源有限,如何布置有限的登革热传感器,使得数据感知的效果最大化;
第五,登革热疾病预测是一个空间细粒度加时间细粒度的预测,影响因素多,另外,在登革热中有一个拐点,就是当出现极端天气状况的时候,登革热疾病变化就不可控。这个拐点是一个小样本事件,因而预测非常困难。
附图说明
图1为本发明基于深度时空残差网络结构示意图。
图2为本发明登革热发病空间示意图。
图3为本发明基于深度时空残差网络中的残差单位示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1所示,基于深度时空残差网络预测登革热疾病的方法,通过采集指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据,并构造基于深度时空残差网络结构(如图1所示)。对基于深度时空残差网络中进行网络训练、验证和测试,得到的深度时空残差网络作为最终的登革热疾病预测模型,网络的训练、验证和测试需要对采集得到的数据集按照70%:10%:20%的比例进行划分,验证集可对训练过程模型进行微调。最终,将指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据输入最终的登革热疾病预测模型,可得到未来某一时刻某区域的登革热疾病预测结果。
如图2所示,基于深度时空残差网络预测登革热疾病的方法在通过登革热传感器采集城市登革热发病的时空数据时,具体为采集三年时间内,每1小时的城市登革热疾病的发病时空数据,首先根据经纬度将一个城市划分为11×11网格地图,其中网格表示一个区域,接着采集每个网格每1个小时的登革热疾病的发病数据,可得到登革热发病空间示意图,也可以用单通道的矩阵Xt∈R11×11表示,登革热发病空间示意图中每个网格的深浅代表登革热发病病例的人数,比如黑色网格代表发病人数大于10,深灰色网格代表发病人数大于5小于10,,浅灰色网格代表发病人数小于5,白色网格代表发病人数为0。
另外,外部条件数据为与登革热疾病的发病时空数据相同时间内的房价数据,收入指数,气候数据,假期数据和微信事件数据。具体上,房价数据的数据格式为小区编号,小区名,经度,纬度;收入指数的数据格式为收入,半径;气候数据的数据格式为日期,温度,风速,天气;假期数据的数据格式为日期;微信事件的数据格式为日期,小时,事件;
基于深度时空残差网络预测登革热疾病的方法中,基于深度时空残差网络结构包括拟合登革热疾病发病的时间特征和空间特征的时空残差网络、拟合外部条件影响登革热疾病的外部条件神经网络以及输出融合部分。在构造时空残差网络时,将时间轴划分为三个片段,表示最近时间、稍远时间和遥远时间,每一个片段分别被输入到三个结构相同的时空残差子网络中来提取提取时间邻近性、周期性、趋势性;三个时间片段下的时空残差子网络结构相同,共L+2层,第1层为卷积层Conv1,第2层到第L层为残差单元,第L+2层为卷积层Conv2;最近时间、稍远时间和遥远时间三个时间片段的数据序列分别可由多个时间点的时空数据组合而成,在本实施例中三个时间片段的数据序列分别采用了6个时间点的时空数据(比如最近时间片段数据可采用前1-6个小时的数据,稍远时间片段数据可采用20天前6个时间点的数据,遥远时间片段数据可采用1年前6个时间点的数据),再经过时空残差子网络后得到的输出分别为
Figure RE-GDA0002505611450000041
其中第2层到第L层采用如图3所示的残差单元,为ReLu 函数与卷积层Conv的组合。
外部条件神经网络中,输入为外部条件数据组成的特征向量Et,结构上将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层,第二层用于将上一层的输出进行维度转化,以便于融合,如图1中的FCs表示两个全连接层。在输出融合部分,最近时间、稍远时间和遥远时间三个时间片段下的时空残差子网络输出以及外部条件神经网络输出的融合,融合方法按以下公式:
Figure RE-GDA0002505611450000042
如图1所示,训练模型时,具体采用的损失函数Loss为均方误差MSE。
在经过训练和调整得到最终的登革热疾病预测模型后,可将指定城市2017-2019三年内每隔1个小时的登革热疾病的发病时空数据,和外部条件数据输入最终的登革热疾病预测模型,可得到2020年1月1日00:00后某时刻t某区域的登革热疾病预测结果。外部条件数据可采用t时段内近期的房价数据,收入指数,气候数据和微信事件数据,对于未来时间t,某些外部条件是未知的,此时可以使用时间t时外部条件的预测值。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (6)

1.基于深度时空残差网络预测登革热疾病的方法,其特征在于,通过采集指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据,并构造基于深度时空残差网络结构;对基于深度时空残差网络中进行网络训练、验证和测试,得到的深度时空残差网络作为最终的登革热疾病预测模型,将指定城市特定时间段内一定的时间间隔下的登革热疾病的发病时空数据和外部条件数据输入最终的登革热疾病预测模型,可得到未来某一时刻某区域的登革热疾病预测结果。
2.根据权利要求1中的基于深度时空残差网络预测登革热疾病的方法,其特征在于,所述的采集登革热疾病的发病时空数据具体为采集三年时间内,每1小时的城市登革热疾病的发病时空数据,首先根据经纬度将一个城市划分为I×J网格地图,其中网格表示一个区域,接着采集每个网格每1个小时的登革热疾病的发病数据,可得到一个单通道的矩阵Xt∈RI×J
所述的外部条件数据为与登革热疾病的发病时空数据相同时间内的房价数据,收入指数,气候数据,假期数据和微信事件数据。
3.根据权利要求1中的基于深度时空残差网络预测登革热疾病的方法,其特征在于,所述的基于深度时空残差网络结构包括拟合登革热疾病发病的时间特征和空间特征的时空残差网络、拟合外部条件影响登革热疾病的外部条件神经网络以及输出融合部分。
4.根据权利要求3中的基于深度时空残差网络预测登革热疾病的方法,其特征在于,所述的时空残差网络,将时间轴划分为三个片段,表示最近时间、稍远时间和遥远时间,每一个片段分别被输入到三个结构相同的时空残差子网络中来提取提取时间邻近性、周期性、趋势性;
三个时间片段下的时空残差子网络结构相同,共L+2层,第1层为卷积层Conv1,第2层到第L层为残差单元,第L+2层为卷积层Conv2;最近时间、稍远时间和遥远时间三个时间片段的数据序列分别可由多个时间点的时空数据组合而成,再经过时空残差子网络后得到的输出分别为
Figure FDA0002377849510000011
5.根据权利要求3中的基于深度时空残差网络预测登革热疾病的方法,其特征在于,所述的外部条件神经网络,输入为外部条件数据组成的特征向量Et,结构上将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层,第二层用于将上一层的输出进行维度转化,以便于融合。
6.根据权利要求3中的基于深度时空残差网络预测登革热疾病的方法,其特征在于,所述的输出融合部分,最近时间、稍远时间和遥远时间三个时间片段下的时空残差子网络输出以及外部条件神经网络输出的融合,融合方法按以下公式:
Figure FDA0002377849510000012
CN202010073432.0A 2020-01-22 2020-01-22 一种基于深度时空残差网络预测登革热疾病的方法 Pending CN113161002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010073432.0A CN113161002A (zh) 2020-01-22 2020-01-22 一种基于深度时空残差网络预测登革热疾病的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010073432.0A CN113161002A (zh) 2020-01-22 2020-01-22 一种基于深度时空残差网络预测登革热疾病的方法

Publications (1)

Publication Number Publication Date
CN113161002A true CN113161002A (zh) 2021-07-23

Family

ID=76881751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010073432.0A Pending CN113161002A (zh) 2020-01-22 2020-01-22 一种基于深度时空残差网络预测登革热疾病的方法

Country Status (1)

Country Link
CN (1) CN113161002A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170308678A1 (en) * 2014-02-19 2017-10-26 Hrl Laboratories, Llc Disease prediction system using open source data
CN108288109A (zh) * 2018-01-11 2018-07-17 安徽优思天成智能科技有限公司 基于lstm深度时空残差网络的机动车尾气浓度预测方法
CN108389201A (zh) * 2018-03-16 2018-08-10 北京推想科技有限公司 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法
CN109300121A (zh) * 2018-09-13 2019-02-01 华南理工大学 一种心血管疾病诊断模型的构建方法、系统及该诊断模型
US20190110753A1 (en) * 2017-10-13 2019-04-18 Ai Technologies Inc. Deep learning-based diagnosis and referral of ophthalmic diseases and disorders
WO2019196286A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
CN110610767A (zh) * 2019-08-01 2019-12-24 平安科技(深圳)有限公司 发病率监测方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170308678A1 (en) * 2014-02-19 2017-10-26 Hrl Laboratories, Llc Disease prediction system using open source data
US20190110753A1 (en) * 2017-10-13 2019-04-18 Ai Technologies Inc. Deep learning-based diagnosis and referral of ophthalmic diseases and disorders
CN108288109A (zh) * 2018-01-11 2018-07-17 安徽优思天成智能科技有限公司 基于lstm深度时空残差网络的机动车尾气浓度预测方法
CN108389201A (zh) * 2018-03-16 2018-08-10 北京推想科技有限公司 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法
WO2019196286A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
CN109300121A (zh) * 2018-09-13 2019-02-01 华南理工大学 一种心血管疾病诊断模型的构建方法、系统及该诊断模型
CN110610767A (zh) * 2019-08-01 2019-12-24 平安科技(深圳)有限公司 发病率监测方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNBO ZHANG ET AL: "Deep spatio-temporal residual networks for citywide crowd flows prediction", PROCEEDINGS OF THE THIRTY-FIRST AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, vol. 31, no. 1, 12 February 2017 (2017-02-12), pages 1655 - 1661 *
任红艳 等: "基于反向传播神经网络模型的广东省登革热疫情预测研究", 中国媒介生物学及控制杂志, vol. 29, no. 3, 30 June 2018 (2018-06-30), pages 221 - 225 *

Similar Documents

Publication Publication Date Title
Wang et al. Deep learning for real time crime forecasting
CN109658695B (zh) 一种多因素的短时交通流预测方法
CN110009046B (zh) 一种基于大数据的城市社区安全预测方法
CN109165690A (zh) 一种城市路网尾气污染分布预测的方法及系统
CN113673769B (zh) 基于多元时间序列插补的图神经网络交通流预测方法
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN115578851A (zh) 一种基于mgcn的交通预测方法
Sampathkumar et al. Majority voting based hybrid ensemble classification approach for predicting parking availability in smart city based on IoT
CN116052427B (zh) 基于私家车出行轨迹数据的城市间跨区域移动性预测方法及装置
CN114936691A (zh) 一种融合关联度加权与时空注意力的温度预报方法
CN113327417B (zh) 基于3d动态时空残差卷积关联网络的交通流预测方法
CN113112791A (zh) 一种基于滑动窗口长短时记忆网络的交通流量预测方法
CN111343650A (zh) 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法
CN104850677A (zh) 基于地理信息系统的深度学习元胞自动机仿真分析方法
CN115051925B (zh) 一种基于迁移学习的时空序列预测方法
CN110287995B (zh) 全天高架交通拥堵情况分级的多特征学习网络模型方法
CN116612645A (zh) 一种高速公路服务区车流量预测方法
CN113744888B (zh) 区域流行病趋势预测预警方法及系统
CN114462313A (zh) 交通事故风险预测方法、装置、设备、介质及产品
CN114385611A (zh) 一种基于人工智能算法和知识图谱的降水预测方法和系统
CN113161002A (zh) 一种基于深度时空残差网络预测登革热疾病的方法
Ye et al. Short-term traffic flow prediction at isolated intersections based on parallel multi-task learning
CN116629460A (zh) 一种基于ST-RANet模型的地铁客流预测方法
Luo et al. Robust precipitation bias correction through an ordinal distribution autoencoder
Du et al. Prediction of tunnel mechanical behaviour using multi-task deep learning under the external condition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination