CN114388137A - 城市流感发病趋势预测方法、系统、终端以及存储介质 - Google Patents

城市流感发病趋势预测方法、系统、终端以及存储介质 Download PDF

Info

Publication number
CN114388137A
CN114388137A CN202111670090.1A CN202111670090A CN114388137A CN 114388137 A CN114388137 A CN 114388137A CN 202111670090 A CN202111670090 A CN 202111670090A CN 114388137 A CN114388137 A CN 114388137A
Authority
CN
China
Prior art keywords
influenza
data
urban
individual
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111670090.1A
Other languages
English (en)
Inventor
李子垠
尹凌
刘康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN202111670090.1A priority Critical patent/CN114388137A/zh
Priority to PCT/CN2022/076294 priority patent/WO2023123624A1/zh
Publication of CN114388137A publication Critical patent/CN114388137A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/35Services specially adapted for particular environments, situations or purposes for the management of goods or merchandise

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种城市流感发病趋势预测方法、系统、终端以及存储介质。方法包括:获取城市内流感病例数据,并收集城市内个体移动轨迹数据;通过数据驱动方法对个体移动轨迹数据进行处理,获取人口移动关系;基于人口移动关系,利用图神经网络提取流感病例数据的空间尺度信息,并利用长短期记忆网络提取流感病例数据的时间序列关系;根据流感病例数据的空间尺度信息和时间序列关系得到流感城市流感发病趋势预测结果。本申请实施例实现了城市内部流感发展态势更高空间分辨率的预测,完成对流感的精细化分析,帮助政府和公共卫生部门及时、准确地洞察城市内部的流感发展态势,有针对性地进行疫情防控干预,可以最大化的保障人民的生命健康安全。

Description

城市流感发病趋势预测方法、系统、终端以及存储介质
技术领域
本申请属于流感计算技术领域,特别涉及一种流感城市流感发病趋势预测方法、系统、终端以及存储介质。
背景技术
2019年末到2021年初,新冠肺炎从局部爆发发展为全球性大流行,已有超过1亿人感染,并导致全球超过252万人死亡。此次疫情的爆发警醒我们,公共卫生风险依然是人类面临的主要社会风险之一。以流行性感冒(简称流感)为例,是由流行性感冒病毒引起的急性呼吸道流感,流感病毒能在短时间内爆发流行,严重威胁着群众身体健康。
当前,世界各国流感防控和预警手段主要依赖于传统的流感监测,流感监测系统可以提供大量对流感防控有用的信息和数据,包括感染病例数、死亡病例数、临床症状和住院人员信息等。政府和公共卫生部门根据流感监测系统的上报信息评估近期流感活动趋势,并做出相应的公共卫生决策和应急预案响应。但由于基层监测数据的核查与上报往往需要花费大量时间(几周甚至数月),监测数据会滞后于实际状况,且大多数国家由于缺少完备的信息采集技术,只能做到省/州或城市一级的预警。因此,亟需针对城市内部流感发病趋势进行实时精准快速预测,帮助政府和公共卫生部门及时、准确地洞察城市内部的流感发展态势,最大化的保障人民的生命健康安全。
人的交互和移动会导致流感的传播与扩散,为了更好地实现城市内部流感发病趋势的实时精准快速预测,有必要深入研究城市内部人口移动过程中的空间交互作用,构建耦合空间交互作用的城市流感发病趋势时空预测模型。现有的流感预测建模方法包括基于高斯过程模型、基于LSTM神经网络模型等。然而,现有的大部分流感发病趋势预测方法往往只依靠流感样疾病统计数据的时间序列特征进行预测,没有考虑到不同区域之间的空间依赖关系,以及人口移动与流感传播之间的空间交互效应,此类方法由于信息的缺失很难在城市内部准确预测流感的发病趋势。其它的流感预测方法虽然综合利用了特定位置的时空特征信息,但空间特征提取方法并不完善,提取出的空间特征信息的准确度有待提升。
随着城市内部人类移动网络复杂性的不断加深,传统的理论模型方法无法精细化模拟城市内部的人口移动与交互,已经难以适应当前城市内部空间交互作用建模的需求。此外,基于OD(交通出行量)流量的空间交互作用建模方法往往以较低的空间分辨率进行研究,例如国家、省/州或城市级别发挥作用,在城市尺度下该方法构建的图结构流量过于分散,导致对流感爆发的时空模式预测出现偏差。
发明内容
本申请提供了一种城市流感发病趋势流感预测方法、系统、终端以及存储介质,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种城市流感发病趋势预测方法,包括:
获取城市内流感病例数据,并收集城市内个体移动轨迹数据;
通过数据驱动方法对所述个体移动轨迹数据进行处理,获取每个个体的家庭住址,将所述家庭住址设定为每个个体移动轨迹的起始点,并提取每个个体从所述起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
基于所述人口移动关系,利用图神经网络提取所述流感病例数据的空间尺度信息,并利用长短期记忆网络提取所述流感病例数据的时间序列关系;
根据所述流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果。
本申请实施例采取的技术方案还包括:所述收集城市内个体移动轨迹数据包括:
利用移动设备收集城市内个体移动轨迹数据;所述移动设备包括手机或智能手表;所述个体移动轨迹数据包括每个个体的手机号码、信令时间戳以及基站经纬度。
本申请实施例采取的技术方案还包括:所述通过数据驱动方法对个体移动轨迹数据进行处理具体为:
对设定时间段以及设定距离的格网区域内城市基站建立的原始泰森多边形进行合并;将所述个体移动轨迹数据按照停留时间进行划分,将每个个体夜间停留时间最长的位置设定为该个体的家庭住址,并提取设定距离的格网区域内设定间隔时间的OD流量和家庭中心流量。
本申请实施例采取的技术方案还包括:所述通过数据驱动方法对所述个体移动轨迹数据进行处理还包括:
根据人口普查数据中城市各街道的人口分布信息和地理位置信息,通过理论模型方法对所述个体移动轨迹数据进行网络流提取;所述理论模型方法包括引力模型、辐射模型或空间邻近关系模型。
本申请实施例采取的技术方案还包括:所述利用图神经网络提取所述流感病例数据的空间尺度信息具体为:
所述图神经网络的框架为消息传播神经网络,所述消息传播神经网络基于空域图卷积提取空间尺度信息;定义无向图G,节点v的特征向量为xv,边的特征为evw,连接节点v和w,N(v)表示图G中节点v的邻居节点,t为运行的时间步,将结点v的特征xv作为其隐藏状态的初始态
Figure BDA0003449247380000043
后,所述空域图卷积对隐藏状态的更新表示为:
Figure BDA0003449247380000041
Figure BDA0003449247380000042
所述消息传播神经网络将空域图卷积分解为消息传递与状态更新操作两个部分,分别由消息函数Ml和节点更新函数Ul完成;所述消息函数Ml用于聚合邻居节点的特征,形成一个消息向量,准备传递给中心节点;所述节点更新函数Ul用于更新当前时刻的节点表示,将当前时刻的节点表示以及从消息函数中获得的消息进行组合,获得空间尺度信息。
本申请实施例采取的技术方案还包括:所述利用图神经网络提取所述流感病例数据的空间尺度信息具体为:
将设定时间范围的个体移动轨迹数据转换为加权有向图,顶点表示街道级区域,边用于捕获移动模式;在时间t时,区域u和v之间的流动形成一个边,该边乘以时间t时区域u的病例数
Figure BDA0003449247380000051
表示有多少感染者可能从区域u移动到区域v;设
Figure BDA0003449247380000052
为节点属性的向量,其中包含区域u过去w周中每一周的病例数;通过消息传播神经网络传递的消息使用来自所有区域的综合得分计算每个区域的特征向量:
Figure BDA0003449247380000053
其中A代表区域人口移动流量的邻接矩阵,Xt是其行包含不同区域的属性的矩阵;xu∈Rww是一个将区域u内和朝向区域u移动的流感病例数结合起来的向量,xu的表示公式为:
xu=(xuwj,u+xuwi,u+…xuwv,u)+xuwu,u
其中xu∈Rw表示u区域中新潜在病例数量的估计值。
本申请实施例采取的技术方案还包括:所述利用长短期记忆网络提取所述流感病例数据的时间序列关系具体为:
所述长短期记忆网络基于当前时刻的输入xt和上一个时间段隐含层的输出ht-1来计算当前时刻隐含层的输出ht,所述长短期记忆网络的计算公式为:
yi,t=LSTM(hi,t-n,hi,t-n,...,hi,t-1)
其中,hi,t-1表示第i个区域在第t-1个时间段的流感病例数据表示,yi,t表示第i个区域在第t个时间段预测的流感病例数据。
本申请实施例采取的另一技术方案为:一种城市流感发病趋势预测系统,包括:
数据收集模块:用于获取城市内流感病例数据,并收集城市内个体移动轨迹数据;
数据处理模块:用于通过数据驱动方法对所述个体移动轨迹数据进行处理,获取每个个体的家庭住址,将所述家庭住址设定为每个个体移动轨迹的起始点,并提取每个个体从所述起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
时空特征提取模块:用于基于所述人口移动关系,利用图神经网络提取所述流感病例数据的空间尺度信息,并利用长短期记忆网络提取所述流感病例数据的时间序列关系;
流感预测模块:用于根据所述流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果。
本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现所述城市流感发病趋势预测方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制城市流感发病趋势预测。
本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述城市流感发病趋势预测方法。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的城市流感发病趋势预测方法、系统、终端以及存储介质通过城市内个体移动轨迹数据提取人口移动关系,基于人口移动关系,采用图卷积神经网络获取流感病例数据的空间尺度信息,并采用长短期记忆网络提取流感病例数据的时间序列关系,根据空间尺度信息和时间序列关系对流感趋势做出精细化预测。本申请实施例实现了城市内部流感发展态势更高空间分辨率的预测,完成对流感的精细化分析,帮助政府和公共卫生部门及时、准确地洞察城市内部的流感发展态势,有针对性地进行疫情防控干预,可以最大化的保障人民的生命健康安全。相对于现有技术,本申请至少具有以下有益效果:
(1)、融入大规模手机位置数据后,改善了传统的理论模型方法无法精细化模拟城市内部的人口移动与交互的缺陷,个体的移动性得到更真实的还原。
(2)采用家庭中心流的空间交互作用建模方法,相较于基于OD流量的空间交互作用建模方法等其他数据驱动模型方法,能够在较高的空间分辨率,在城市尺度下构建的图结构流量更加集中,可以明显地捕捉到多个较强的通勤流量,进而有效地提升城市内部流感深度学习模型的预测精度。
(3)本发明仅需要获取手机位置信息,无需获取每周平均气温、气压、降雨量、相对湿度、最大温差和日照时间等多个维度的信息,降低了数据的获取和处理难度。
附图说明
图1是本申请实施例的城市流感发病趋势预测方法的流程图;
图2为本申请实施例的城市流感发病趋势预测系统结构示意图;
图3为本申请实施例的终端结构示意图;
图4为本申请实施例的存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的城市流感发病趋势预测方法的流程图。本申请实施例的城市流感发病趋势预测方法包括以下步骤:
S1:获取城市内流感病例数据,并利用移动设备收集城市内个体移动轨迹数据;
本步骤中,移动设备包括但不限于手机或智能手表等设备。本申请实施例中,个体移动轨迹数据包括但不限于每个个体的手机号码、信令时间戳、识别到的基站经纬度等信息,个体移动轨迹数据集的获取方式具体为:基于联通HDFS+Hive+Spark大数据平台,获取560万用户手机信令携带的位置信息,对位置信息进行去重处理,并去除位置信息中缺失关键信息的记录,得到个体移动轨迹数据。
S2:通过数据驱动方法和理论模型方法对个体移动轨迹数据进行处理,获取每个个体的家庭住址,并将家庭住址设定为每个个体所有移动轨迹的起始点,提取每个个体从起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
本步骤中,通过数据驱动方法将个体移动轨迹数据按照停留时间进行划分,将夜间停留时间最长的位置设定为该个体的家庭住址,并将家庭住址设定为该个体所有移动轨迹的起始点;然后提取每个个体从起始点去往其他区域(如工作、娱乐场所)的流量数据,得到不同区域之间的人口移动关系。
进一步地,通过数据驱动方法对个体移动轨迹数据进行处理具体为:对一定时间段内500米格网区域内城市基站建立的原始泰森多边形进行合并,将各用户夜间停留时间最长时间的位置设定为该用户的家庭住址,提取得到城市500米格网区域内每半个小时的OD流量和家庭中心流量;然后映射到各街道单元得到一定时间段内500米格网区域每半个小时的OD流量和家庭中心流量。
其次,通过理论模型方法对个体移动轨迹数据进行处理具体为:根据人口普查数据中城市各街道的人口分布信息和地理位置信息,通过引力模型、辐射模型和空间邻近关系模型等理论模型方法对个体移动轨迹数据集进行网络流提取,其中:
引力模型认为两个区域之间的人口流动强度与它们各自的人口分布成正比,与它们之间的距离成反比。两个城市区域之间的引力模型公式通常可表现为:
Figure BDA0003449247380000091
上式中,Tij为城市内区域i与区域j之间的人口流动强度,mi和nj分别为区域i与区域j的人口分布,rij为区域i与区域j之间的距离,a为常量,可取值为1。
辐射模型将人口流动看做一个受联合概率支配的随机过程,取决于出发地、目的地和影响范围的人口分布。辐射模型公式为:
Figure BDA0003449247380000101
Ti=mi(Nc/N) (3)
上式中,sij代表以区域i为中心、区域i与区域j之间的距离为半径的区域范围内的人口总数。N是区域i的总人口,Nc是区域i的通勤人口。
空间邻近关系模型基于地理学第一定律,所有的事物都与其他事物相关,但是距离相近的事物比远处的事物更相关。因此,本发明考虑了距离相近的事物之间的空间关系,即邻近关系。基于区域的邻近关系,本发明根据两个区域之间是否相互接触判定两个区域(节点)之间是否有连边,得到对应邻近关系的邻接矩阵。
S3:将流感病例数据和人口移动关系输入图神经网络(Graph Neural Networks,GNN),图神经网络根据人口移动关系对流感病例数据进行空间特征提取,获得流感病例数据的空间尺度信息;
本步骤中,采用图神经网络进行空间依赖性建模,具有更广的应用范围和更好的泛化能力。图神经网络的核心思想是学习一个函数,使得每个节点能够聚合它自己的特征和它的邻居特征来生成该节点新的特征表示。构建包含多个图卷积层的神经网络模型,通过不断迭代和学习,最终可以利用图上的拓扑关系学习到每个节点的输入特征并进行预测。图神经网络是一个邻居聚合策略,一个节点的表示向量由它的邻居节点通过循环的聚合和转移表示向量计算得到。图神经网络的框架为消息传播神经网络(Message PassingNeural Network,MPNN)。消息传播神经网络是一种空域图卷积的形式化框架。首先定义无向图G,节点v的特征向量为xv,边的特征为evw,连接节点v和w,N(v)表示图G中节点v的邻居节点,t为运行的时间步,将结点v的特征xv作为其隐藏状态的初始态
Figure BDA0003449247380000111
后,空域图卷积对隐藏状态的更新由如下公式表示:
Figure BDA0003449247380000112
Figure BDA0003449247380000113
消息传播神经网络将空域图卷积分解为消息传递与状态更新操作两个部分,分别由消息函数Ml和节点更新函数Ul完成。消息函数Ml的作用是聚合邻居节点的特征,形成一个消息向量,准备传递给中心节点。节点更新函数Ul的作用是更新当前时刻的节点表示,将当前时刻的节点表示以及从消息函数中获得的消息进行组合,从而获得流感病例数据的空间尺度信息。
具体的,图神经网络根据人口移动关系对流感病例数据进行空间特征提取,获得流感病例数据的空间尺度信息具体为:将设定时间范围的个体移动轨迹数据转换为加权有向图,其顶点表示街道级区域,边用来捕获移动模式。例如,从顶点v到顶点u的边(v,u)的权重wv,w表示在时间t以区域v为家庭住址的个体移动到区域u的总人数。在时间t时,区域u和v之间的流动形成一个边缘,该边缘乘以时间t时区域u的病例数
Figure BDA0003449247380000114
提供了一个相对分教,表示有多少感染者可能从区域u移动到区域v。设
Figure BDA0003449247380000115
为节点属性的向量,其中包含区域u过去w周中每一周的病例数。通过该网络传递的消息使用来自所有区域的综合得分计算每个区域的特征向量,计算公式如下:
Figure BDA0003449247380000121
其中A代表区域人口移动流量的邻接矩阵,Xt是其行包含不同区域的属性的矩阵。xu∈Rw是一个将区域u内和朝向区域u移动的流感病例数结合起来的向量。xu的表示公式为:
xu=(xuwj,u+xuwi,u+…xuwv,u)+xuwu,u (7)
其中区域u接收来自不同区域的人,Xt包含该区域中过去案例的向量。xu∈Rw表示u区域中新潜在病例数量的估计值,并细分为从其他区域收到的病例和因区域u内流动性引起的新病例。为了更新每个输入图的顶点表示,本申请实施例使用以下邻域聚合方案:
Figure BDA0003449247380000122
上式中,Hi是一个矩阵,其中包含上一层的节点表示,H0=X,W0是第一层可训练参数的矩阵,f是非线性激活函数,如ReLU。通过归一化邻接矩阵A,使得每个节点传入边的权重之和等于1。基于一个具有K阶邻域聚合层的模型,随着邻域聚合层阶数的增加,最终节点将捕获越来越多的全局信息。
S4:将流感病例数据以及空间尺度信息输入长短期记忆网络(Long short-termmemory,LSTM),通过长短期记忆网络提取流感病例数据的时间序列关系;
本步骤中,长短期记忆网络是一种可以用于处理序列数据的循环神经网络(Recurrent Neural Network,RNN)可以解决长序列训练过程中的梯度消失和梯度爆炸问题。相比普通的RNN,LSTM能够在更长的序列中获得更好的表现。LSTM包括忘记、选择记忆以及输出三个阶段,忘记阶段用于对上一个节点传送的输入进行选择性忘记。选择记忆阶段用于将当前阶段的输入有选择性地进行“记忆”。输出阶段用于决定哪些将会被当成当前状态的输出,并通过一个tanh激活函数对上一阶段得到的输出进行放缩。LSTM计算公式可表示为:
yi,t=LSTM(hi,t-n,hi,t-n,...,hi,t-1) (9)
其中,hi,t-1表示第i个区域在第t-1个时间段的流感病例数据表示,yi,t表示第i个区域在第t个时间段预测的流感病例数据。
本申请实施例中,通过长短期记忆网络提取流感病例数据的时间序列关系具体为:长短期记忆网络基于当前时刻的输入xt和上一个时间段隐含层的输出ht-1来计算当前时刻隐含层的输出ht,并新加入了输入门it、遗忘门ft、输出门ot和记忆单元ct。其中,通过对输入xt和上一步隐含层的输出ht-1进行线性变换,再经过激活函数计算得到输入门,用于控制当前计算的新状态以多大程度更新到记忆单元中。遗忘门和输出门的计算方式与输入门类似,分别用于控制前一步记忆单元中的信息有多大程度被遗忘掉以及当前的输出有多大程度上取决于当前的记忆单元。输入门、遗忘门和输出门均具有各自的参数W和b,记忆单元则主要由输入门和遗忘门共同控制:输入门控制当前输入序列中需要记忆的信息,遗忘门控制之前的历史记忆中需要遗忘的信息。该长短期记忆网络在第t时刻隐含层的输出ht最终由输出门和记忆单元决定,长短期记忆网络的各计算单元更新公式如下:
it=σ(Wi[ht-1,xt]+bi) (10)
ft=σ(Wf[ht-1,xt]+bf) (11)
ot=σ(Wo[ht-1,xt]+bo) (12)
Figure BDA0003449247380000141
Figure BDA0003449247380000142
ht=ot*tanh(Ct) (15)
基于上述,对于每个输入时刻的信息Xt,先用图神经网络提取每个区域的空间尺度信息,然后利用每个区域新得到的输入序列作为长短期记忆网络的输入,通过训练和学习得到每个区域对应的隐含特征。此时,每个区域都共享同一个长短期记忆网络模型,有助于提高模型泛化能力,同时减少模型参数进而降低模型的复杂度。在学习时间序列关系中的原始特征的同时,也在充分利用引入的空间上下文信息,使得预测模型的效果更好。随着网络层数的加深,最终节点功能将捕获越来越多的全局信息。但为了保留局部中间信息,本发明将两个LSTM层最后一个时间步长的隐藏状态H1,H2和输入的历史信息进行拼接,公式如下:
H=CONCAT(Xt-n,Xt-n+1,...,Xt-1,H1,H2) (16)
矩阵H的行可以被视为编码多尺度结构信息(包括节点的初始特征)的顶点表示,然后将该顶点表示传递到由两层全连接网络构成的输出层。
S5:根据流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果;
其中,由于本申请实施例采用人工智能深度学习的方式进行流感发病趋势预测,可以在多次预测后通过学习新的数据更新模型参数,使得模型更加智能高效。
基于上述,本申请实施例的城市流感发病趋势预测方法通过城市内个体移动轨迹数据提取人口移动关系,基于人口移动关系,采用图卷积神经网络获取流感病例数据的空间尺度信息,并采用长短期记忆网络提取流感病例数据的时间序列关系,根据空间尺度信息和时间序列关系对流感趋势做出精细化预测。本申请实施例实现了城市内部流感发展态势更高空间分辨率的预测,完成对流感的精细化分析,帮助政府和公共卫生部门及时、准确地洞察城市内部的流感发展态势,有针对性地进行疫情防控干预,可以最大化的保障人民的生命健康安全。相对于现有技术,本申请至少具有以下有益效果:
(1)、融入大规模手机位置数据后,改善了传统的理论模型方法无法精细化模拟城市内部的人口移动与交互的缺陷,个体的移动性得到更真实的还原。
(2)采用家庭中心流的空间交互作用建模方法,相较于基于OD流量的空间交互作用建模方法等其他数据驱动模型方法,能够在较高的空间分辨率,在城市尺度下构建的图结构流量更加集中,可以明显地捕捉到多个较强的通勤流量,进而有效地提升城市内部流感深度学习模型的预测精度。
(3)本发明仅需要获取手机位置信息,无需获取每周平均气温、气压、降雨量、相对湿度、最大温差和日照时间等多个维度的信息,降低了数据的获取和处理难度。
请参阅图2,为本申请实施例的城市流感发病趋势预测系统结构示意图。本申请实施例的城市流感发病趋势预测系统40包括:
数据收集模块41:用于获取城市内流感病例数据,并收集城市内个体移动轨迹数据;
数据处理模块42:用于通过数据驱动方法对个体移动轨迹数据集进行处理,获取每个个体的家庭住址,并将家庭住址设定为每个个体所有移动轨迹的起始点,提取每个个体从起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
时空特征提取模块43:用于基于人口移动关系,利用图神经网络提取流感病例数据的空间尺度信息,并利用长短期记忆网络提取流感病例数据的时间序列关系;
流感预测模块44:用于根据流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果。
请参阅图3,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。
存储器52存储有用于实现上述城市流感发病趋势预测方法的程序指令。
处理器51用于执行存储器52存储的程序指令以控制城市流感发病趋势预测。
其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图4,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种城市流感发病趋势预测方法,其特征在于,包括:
获取城市内流感病例数据,并收集城市内个体移动轨迹数据;
通过数据驱动方法对所述个体移动轨迹数据进行处理,获取每个个体的家庭住址,将所述家庭住址设定为每个个体移动轨迹的起始点,并提取每个个体从所述起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
基于所述人口移动关系,利用图神经网络提取所述流感病例数据的空间尺度信息,并利用长短期记忆网络提取所述流感病例数据的时间序列关系;
根据所述流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果。
2.根据权利要求1所述的城市流感发病趋势预测方法,其特征在于,所述收集城市内个体移动轨迹数据包括:
利用移动设备收集城市内个体移动轨迹数据;所述移动设备包括手机或智能手表;所述个体移动轨迹数据包括每个个体的手机号码、信令时间戳以及基站经纬度。
3.根据权利要求2所述的城市流感发病趋势预测方法,其特征在于,所述通过数据驱动方法对所述个体移动轨迹数据进行处理具体为:
对设定时间段以及设定距离的格网区域内城市基站建立的原始泰森多边形进行合并;将所述个体移动轨迹数据按照停留时间进行划分,将每个个体夜间停留时间最长的位置设定为该个体的家庭住址,并提取设定距离的格网区域内设定间隔时间的OD流量和家庭中心流量。
4.根据权利要求1所述的城市流感发病趋势预测方法,其特征在于,所述通过数据驱动方法对所述个体移动轨迹数据进行处理还包括:
根据人口普查数据中城市各街道的人口分布信息和地理位置信息,通过理论模型方法对所述个体移动轨迹数据进行网络流提取;所述理论模型方法包括引力模型、辐射模型或空间邻近关系模型。
5.根据权利要求1至4任一项所述的城市流感发病趋势预测方法,其特征在于,所述利用图神经网络提取所述流感病例数据的空间尺度信息具体为:
所述图神经网络的框架为消息传播神经网络,所述消息传播神经网络基于空域图卷积提取空间尺度信息;定义无向图G,节点v的特征向量为xv,边的特征为evw,连接节点v和w,N(v)表示图G中节点v的邻居节点,t为运行的时间步,将结点v的特征xv作为其隐藏状态的初始态
Figure FDA0003449247370000021
后,所述空域图卷积对隐藏状态的更新表示为:
Figure FDA0003449247370000022
Figure FDA0003449247370000023
所述消息传播神经网络将空域图卷积分解为消息传递与状态更新操作两个部分,分别由消息函数Ml和节点更新函数Ul完成;所述消息函数Ml用于聚合邻居节点的特征,形成一个消息向量,准备传递给中心节点;所述节点更新函数Ul用于更新当前时刻的节点表示,将当前时刻的节点表示以及从消息函数中获得的消息进行组合,获得空间尺度信息。
6.根据权利要求5所述的流感城市流感发病趋势预测方法,其特征在于,所述利用图神经网络提取所述流感病例数据的空间尺度信息具体为:
将设定时间范围的个体移动轨迹数据转换为加权有向图,顶点表示街道级区域,边用于捕获移动模式;在时间t时,区域u和v之间的流动形成一个边,该边乘以时间t时区域u的病例数
Figure FDA0003449247370000031
表示有多少感染者可能从区域u移动到区域v;设
Figure FDA0003449247370000032
为节点属性的向量,其中包含区域u过去w周中每一周的病例数;通过消息传播神经网络传递的消息使用来自所有区域的综合得分计算每个区域的特征向量:
Figure FDA0003449247370000033
其中A代表区域人口移动流量的邻接矩阵,Xt是其行包含不同区域的属性的矩阵;xu∈Rw是一个将区域u内和朝向区域u移动的流感病例数结合起来的向量,xu的表示公式为:
xu=(xuwj,u+xuwi,u+…xuwv,u)+xuwu,u
其中xu∈Rw表示u区域中新潜在病例数量的估计值。
7.根据权利要求6所述的流感城市流感发病趋势预测方法,其特征在于,所述利用长短期记忆网络提取所述流感病例数据的时间序列关系具体为:
所述长短期记忆网络基于当前时刻的输入xt和上一个时间段隐含层的输出ht-1来计算当前时刻隐含层的输出ht,所述长短期记忆网络的计算公式为:
yi,t=LSTM(hi,t-n,hi,t-n,...,hi,t-1)
其中,hi,t-1表示第i个区域在第t-1个时间段的流感病例数据表示,yi,t表示第i个区域在第t个时间段预测的流感病例数据。
8.一种城市流感发病趋势预测系统,其特征在于,包括:
数据收集模块:用于获取城市内流感病例数据,并收集城市内个体移动轨迹数据;
数据处理模块:用于通过数据驱动方法对所述个体移动轨迹数据进行处理,获取每个个体的家庭住址,将所述家庭住址设定为每个个体移动轨迹的起始点,并提取每个个体从所述起始点去往其他区域的流量数据,得到各个区域之间的人口移动关系;
时空特征提取模块:用于基于所述人口移动关系,利用图神经网络提取所述流感病例数据的空间尺度信息,并利用长短期记忆网络提取所述流感病例数据的时间序列关系;
流感预测模块:用于根据所述流感病例数据的空间尺度信息和时间序列关系得到城市流感发病趋势预测结果。
9.一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现权利要求1-7任一项所述的城市流感发病趋势预测方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制流感城市流感发病趋势预测。
10.一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至7任一项所述城市流感发病趋势预测方法。
CN202111670090.1A 2021-12-31 2021-12-31 城市流感发病趋势预测方法、系统、终端以及存储介质 Pending CN114388137A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111670090.1A CN114388137A (zh) 2021-12-31 2021-12-31 城市流感发病趋势预测方法、系统、终端以及存储介质
PCT/CN2022/076294 WO2023123624A1 (zh) 2021-12-31 2022-02-15 城市流感发病趋势预测方法、系统、终端以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111670090.1A CN114388137A (zh) 2021-12-31 2021-12-31 城市流感发病趋势预测方法、系统、终端以及存储介质

Publications (1)

Publication Number Publication Date
CN114388137A true CN114388137A (zh) 2022-04-22

Family

ID=81199598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111670090.1A Pending CN114388137A (zh) 2021-12-31 2021-12-31 城市流感发病趋势预测方法、系统、终端以及存储介质

Country Status (2)

Country Link
CN (1) CN114388137A (zh)
WO (1) WO2023123624A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115966313A (zh) * 2023-03-09 2023-04-14 创意信息技术股份有限公司 基于人脸识别的一体化管理平台
CN116525135A (zh) * 2023-04-27 2023-08-01 兰州大学 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN116823572A (zh) * 2023-06-16 2023-09-29 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116561385B (zh) * 2023-07-10 2023-10-13 中国人民解放军军事科学院系统工程研究院 基于知识表示的预案快速匹配推荐方法
CN117079148B (zh) * 2023-10-17 2024-01-05 腾讯科技(深圳)有限公司 城市功能区的识别方法、装置、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111403050A (zh) * 2020-04-02 2020-07-10 广东高航知识产权运营有限公司 一种基于大数据的城市人口疾病监测系统
CN112116155A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于智能决策的人口流动预测方法、装置及计算机设备
CN113450923A (zh) * 2020-03-27 2021-09-28 中国科学院深圳先进技术研究院 大规模轨迹数据模拟流感时空传播过程的方法及系统
CN113496781A (zh) * 2020-04-01 2021-10-12 中国科学院深圳先进技术研究院 城市内部传染病扩散模拟方法、系统及电子设备
CN113780635A (zh) * 2021-08-24 2021-12-10 广东省公共卫生研究院 一种小空间尺度传染病时空传播模式的预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10394776B2 (en) * 2012-02-13 2019-08-27 Bluedot Inc. Warning system for infectious diseases and method therefor
EP3659156A1 (en) * 2017-07-28 2020-06-03 Koninklijke Philips N.V. Monitoring direct and indirect transmission of infections in a healthcare facility using a real-time locating system
CN113111581B (zh) * 2021-04-09 2022-03-11 重庆邮电大学 结合时空因素和基于图神经网络的lstm轨迹预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450923A (zh) * 2020-03-27 2021-09-28 中国科学院深圳先进技术研究院 大规模轨迹数据模拟流感时空传播过程的方法及系统
CN113496781A (zh) * 2020-04-01 2021-10-12 中国科学院深圳先进技术研究院 城市内部传染病扩散模拟方法、系统及电子设备
CN111403050A (zh) * 2020-04-02 2020-07-10 广东高航知识产权运营有限公司 一种基于大数据的城市人口疾病监测系统
CN112116155A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于智能决策的人口流动预测方法、装置及计算机设备
CN113780635A (zh) * 2021-08-24 2021-12-10 广东省公共卫生研究院 一种小空间尺度传染病时空传播模式的预测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115966313A (zh) * 2023-03-09 2023-04-14 创意信息技术股份有限公司 基于人脸识别的一体化管理平台
CN115966313B (zh) * 2023-03-09 2023-06-09 创意信息技术股份有限公司 基于人脸识别的一体化管理平台
CN116525135A (zh) * 2023-04-27 2023-08-01 兰州大学 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN116525135B (zh) * 2023-04-27 2024-03-19 兰州大学 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN116823572A (zh) * 2023-06-16 2023-09-29 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质
CN116823572B (zh) * 2023-06-16 2023-12-19 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
WO2023123624A1 (zh) 2023-07-06

Similar Documents

Publication Publication Date Title
CN114388137A (zh) 城市流感发病趋势预测方法、系统、终端以及存储介质
Zhang et al. Predicting citywide crowd flows using deep spatio-temporal residual networks
Tang et al. Multi-community passenger demand prediction at region level based on spatio-temporal graph convolutional network
Ma et al. Spatiotemporal prediction of PM2. 5 concentrations at different time granularities using IDW-BLSTM
Ivanov et al. Digital twin of city: Concept overview
WO2023123625A1 (zh) 一种城市疫情时空预测方法、系统、终端以及存储介质
Lv et al. Blind travel prediction based on obstacle avoidance in indoor scene
CN105493109A (zh) 使用多个数据源的空气质量推断
Shang et al. A new ensemble deep graph reinforcement learning network for spatio-temporal traffic volume forecasting in a freeway network
Zhang et al. Multistep speed prediction on traffic networks: A graph convolutional sequence-to-sequence learning approach with attention mechanism
CN115775085B (zh) 一种基于数字孪生的智慧城市管理方法及系统
CN106447109B (zh) 一种基于深度学习算法的社区治安巡逻路径优化设计方法
He et al. Extracting human perceptions from street view images for better assessing urban renewal potential
Zhang et al. Urban spatial risk prediction and optimization analysis of POI based on deep learning from the perspective of an epidemic
CN112862177A (zh) 一种基于深度神经网络的城市区域聚集度预测方法、设备及介质
CN116502763A (zh) 一种基于时空图神经网络的人群拥堵预测方法及系统
Yu et al. Passenger flow prediction for new line using region dividing and fuzzy boundary processing
Wang et al. Weather condition-based hybrid models for multiple air pollutants forecasting and minimisation
CN110443408A (zh) 出行预测方法和装置
Andersson et al. Towards predicting dengue fever rates using convolutional neural networks and street-level images
Zhang et al. Off-deployment traffic estimation—a traffic generative adversarial networks approach
Yang et al. Short‐Term Forecasting of Dockless Bike‐Sharing Demand with the Built Environment and Weather
CN112766240B (zh) 基于时空关系的残差多图卷积人群分布预测方法及系统
ABBAS A survey of research into artificial neural networks for crime prediction
CN115456238A (zh) 一种基于动态多视图耦合图卷积的城市出行需求预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination