CN113784292A - 一种基于手机信令数据的城市疫情风险评估方法 - Google Patents

一种基于手机信令数据的城市疫情风险评估方法 Download PDF

Info

Publication number
CN113784292A
CN113784292A CN202110974920.3A CN202110974920A CN113784292A CN 113784292 A CN113784292 A CN 113784292A CN 202110974920 A CN202110974920 A CN 202110974920A CN 113784292 A CN113784292 A CN 113784292A
Authority
CN
China
Prior art keywords
risk
grid
mobile phone
data
signaling data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110974920.3A
Other languages
English (en)
Other versions
CN113784292B (zh
Inventor
李健
甘田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202110974920.3A priority Critical patent/CN113784292B/zh
Publication of CN113784292A publication Critical patent/CN113784292A/zh
Application granted granted Critical
Publication of CN113784292B publication Critical patent/CN113784292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)

Abstract

本发明涉及一种基于手机信令数据的城市内部流行病传播风险评估方法。首先,通过手机信令数据提取手机用户的多日活动链,根据历史活动地点识别潜在高风险人员;其次,在对研究区域进行栅格化的基础上,以栅格为单位对各类人口分布特征和人口流动特征进行集计,从而构建每日的人员流动网络;最后,将城市疫情风险划分为内部暴露风险和对外传播风险,基于聚类分析和社会网络分析理论提出两类风险的量化方法,并利用时间序列分析方法反映疫情风险的时变特性及规律。与现有技术相比,本发明具有提高城市疫情风险评估分析结果的准确性和稳定性等优点。

Description

一种基于手机信令数据的城市疫情风险评估方法
技术领域
本发明涉及时空数据挖掘与城市应急管理领域,尤其是涉及一种基于手机信令数据的城市疫情风险评估方法。
背景技术
自2019年12月以来,新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)在全球范围内迅速传播。截至2020年9月30日,全球确诊病例达到33563030例,死亡病例达到1005218例。作为一次重大突发卫生事件,新型冠状病毒肺炎的爆发对社会、经济和环境等方面造成了极大的损失和破坏。在疫情爆发时期,相关研究主要关注于新型冠状病毒肺炎的流行病学特征和临床特征,通过传染病动力学模型和机器学习方法对病毒传播进行模拟和预测。随着疫情防控进入常态化阶段,研究者开始反思如何提高公共卫生体系的应急能力,利用多源时空大数据从不同尺度对新型冠状病毒肺炎传播的时空模式进行分析,挖掘影响传播的潜在因素。然而,现有研究较少利用高精度手机信令数据,提出城市尺度的疫情风险分析方法。更重要的是,由于如新型冠状病毒肺炎的全球性大流行病在爆发初期以输入性病例为主,控制输入的高风险人员能够有效遏制病毒在城市内部的传播扩散,但是现有研究中并没有形成一个针对疫情爆发初期的城市疫情风险评估方法。
人口流动性一直是影响流行病传播的关键因素之一。在经典流行病动力学模型中,人群被划分为易感者和感染者等不同群体。其中,感染率与感染者比例和易感者比例的乘积成正比。由于仓室模型没有考虑地理空间异质性,因此研究者引入了生态学的复合种群模型,以反映人口在不同地理空间之间的移动。此外,研究者从以下两个角度对人口流动性与流行病传播之间的关系进行了更深入的探究。第一类研究针对传播过程构建理论模型,关注于多样的网络拓扑结构和传播动力学特征,例如节点异质性、传播过程中的随机环境扰动、交叉扩散引起的图灵不稳定性、以及个体网络中的双向运动等。第二类研究基于交通出行数据挖掘出行特征,结合流行病传播的时空特征分析交通管控措施对流行病传播的影响。所使用的数据包括居民出行调查数据、民航和铁路出行数据、大规模移动位置数据(出租车浮动车数据和手机数据)等。
一方面,人群聚集可能增加易感者与感染者之间的接触概率,从而提高暴露风险;另一方面,感染者的出行活动可能加速病毒的传播扩散。因此,在进行风险评估时,需要从暴露和传播两个角度进行分析。并且,在现有研究的基础上,需要一个一般化的城市疫情风险评估框架,以在未来面对全球性大流行病时快速形成防控应急预案。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于手机信令数据的城市疫情风险评估方法,提取不同人群的空间分布和出行特征,实现对城市疫情风险的评估分析,提高城市疫情风险评估评估分析结果的准确性和稳定性。
本发明的目的可以通过以下技术方案来实现:
一种基于手机信令数据的城市疫情风险评估方法,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
所述步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区位置信息和病毒潜伏期长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
进一步地,所述步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
所述步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
进一步地,所述活动时段为每天的早上6点到晚上9点。
所述步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
进一步地,所述步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
进一步地,所述接近中心性的计算公式如下所示:
Figure BDA0003227311020000041
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离。
进一步地,所述节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
Figure BDA0003227311020000042
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量。
进一步地,所述每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
所述步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
进一步地,所述基于动态时间规整算法的时间序列相似性D(Ai,Bj)的计算公式如下所示:
Figure BDA0003227311020000043
其中,Ai表示序列<a1,…,ai>,Bj表示序列<b1,…,bj>,δ(ai,bj)表示ai和bj之间的距离。
进一步地,用于所述类簇中心的中心化SUSUM-SQ统计量Dk的计算公式如下所示:
Figure BDA0003227311020000051
其中,T为序列长度,k=1,2,3……,T,Ck为迭代残差序列的平方和。
与现有技术相比,本发明具有以下有益效果:
本发明通过用户的手机信令数据来生成用户活动数据,根据用户历史活动点的位置信息区分高风险人员和正常人员,建立城市内部的人员流动网络;从暴露和传播两个角度,基于聚类分析和社会网络分析理论计算疫情风险指数;基于时间序列分析方法挖掘疫情风险的时变特性及规律;充分利用了居民在城市内部活动时所附带的手机信令数据,有效提高了城市疫情风险评估分析结果的准确性和稳定性。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于手机信令数据的城市疫情风险评估方法,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区位置信息和病毒潜伏期长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
本实施例中,时间阈值为30min。
步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
活动时段为每天的早上6点到晚上9点。
步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
接近中心性的计算公式如下所示:
Figure BDA0003227311020000071
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离。
节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
Figure BDA0003227311020000072
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量。
每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
基于动态时间规整算法的时间序列相似性D(Ai,Bj)的计算公式如下所示:
Figure BDA0003227311020000073
其中,Ai表示序列<a1,…,ai>,Bj表示序列<b1,…,bj>,δ(ai,bj)表示ai和bj之间的距离。
用于类簇中心的中心化SUSUM-SQ统计量Dk的计算公式如下所示:
Figure BDA0003227311020000081
其中,T为序列长度,k=1,2,3……,T,Ck为迭代残差序列的平方和。
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种基于手机信令数据的城市疫情风险评估方法,其特征在于,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
2.根据权利要求1所述的一种基于手机信令数据的城市内部流行病传播风险评估方法,其特征在于,所述步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
3.根据权利要求2所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
4.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
5.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
6.根据权利要求5所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
7.根据权利要求5所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述接近中心性的计算公式如下所示:
Figure FDA0003227311010000021
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离;
所述节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
Figure FDA0003227311010000031
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量;
所述每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
8.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
9.根据权利要求8所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述基于动态时间规整算法的时间序列相似性D(Ai,Bj)的计算公式如下所示:
Figure FDA0003227311010000032
其中,Ai表示序列<a1,...,ai>,Bj表示序列<bi,...,bj>,δ(ai,bj)表示ai和bj之间的距离。
10.根据权利要求8所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,用于所述类簇中心的中心化SUSUM-SQ统计量Dk的计算公式如下所示:
Figure FDA0003227311010000033
其中,T为序列长度,k=1,2,3......,T,Ck为迭代残差序列的平方和。
CN202110974920.3A 2021-08-24 2021-08-24 一种基于手机信令数据的城市疫情风险评估方法 Active CN113784292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110974920.3A CN113784292B (zh) 2021-08-24 2021-08-24 一种基于手机信令数据的城市疫情风险评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110974920.3A CN113784292B (zh) 2021-08-24 2021-08-24 一种基于手机信令数据的城市疫情风险评估方法

Publications (2)

Publication Number Publication Date
CN113784292A true CN113784292A (zh) 2021-12-10
CN113784292B CN113784292B (zh) 2022-07-26

Family

ID=78838784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110974920.3A Active CN113784292B (zh) 2021-08-24 2021-08-24 一种基于手机信令数据的城市疫情风险评估方法

Country Status (1)

Country Link
CN (1) CN113784292B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113993120A (zh) * 2021-12-30 2022-01-28 中国移动紫金(江苏)创新研究院有限公司 一种基于无线用户信令的人口统计方法及系统
CN114357096A (zh) * 2021-12-27 2022-04-15 中建电子商务有限责任公司 一种基于双差集的疫情风险识别算法
CN114708985A (zh) * 2022-03-14 2022-07-05 中国人民解放军总医院第八医学中心 呼吸道传染病预警方法及系统
CN117880856A (zh) * 2024-03-11 2024-04-12 武汉众诚华鑫科技有限公司 一种基于人工智能的电信基站安全预警方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826193A (zh) * 2009-06-18 2010-09-08 张艳红 金融保险第三方海量数据与红指数池管理智能tpa平台
WO2017127732A1 (en) * 2016-01-21 2017-07-27 Indiana University Research And Technology Corporation Treatment and prevention of retinal vascular disease by photocoagulation
CN107133901A (zh) * 2017-05-05 2017-09-05 中国科学院深圳先进技术研究院 一种传染病防控方法及系统
CN109360660A (zh) * 2018-10-31 2019-02-19 河南省疾病预防控制中心 一种疾控与出行信息互联的防控方法及防控系统
CN111125184A (zh) * 2019-11-23 2020-05-08 同济大学 基于时间序列结构性变点识别的公交客流动态监测方法
CN111180070A (zh) * 2019-12-30 2020-05-19 腾讯科技(深圳)有限公司 病历数据分析方法及装置
CN111933297A (zh) * 2020-08-05 2020-11-13 河南牧业经济学院 一种基于近场通信的人员密接情况调查方法
US20210016006A1 (en) * 2019-07-16 2021-01-21 Beta Bionics, Inc. Blood glucose control system with carbohydrate therapy indication
CN112530601A (zh) * 2020-12-09 2021-03-19 北京红山信息科技研究院有限公司 一种校园疫情监控方法、装置、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826193A (zh) * 2009-06-18 2010-09-08 张艳红 金融保险第三方海量数据与红指数池管理智能tpa平台
WO2017127732A1 (en) * 2016-01-21 2017-07-27 Indiana University Research And Technology Corporation Treatment and prevention of retinal vascular disease by photocoagulation
CN107133901A (zh) * 2017-05-05 2017-09-05 中国科学院深圳先进技术研究院 一种传染病防控方法及系统
CN109360660A (zh) * 2018-10-31 2019-02-19 河南省疾病预防控制中心 一种疾控与出行信息互联的防控方法及防控系统
US20210016006A1 (en) * 2019-07-16 2021-01-21 Beta Bionics, Inc. Blood glucose control system with carbohydrate therapy indication
CN111125184A (zh) * 2019-11-23 2020-05-08 同济大学 基于时间序列结构性变点识别的公交客流动态监测方法
CN111180070A (zh) * 2019-12-30 2020-05-19 腾讯科技(深圳)有限公司 病历数据分析方法及装置
CN111933297A (zh) * 2020-08-05 2020-11-13 河南牧业经济学院 一种基于近场通信的人员密接情况调查方法
CN112530601A (zh) * 2020-12-09 2021-03-19 北京红山信息科技研究院有限公司 一种校园疫情监控方法、装置、计算机设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ABHINAV BHATELE;JAE-SEUNG YEOM;NIKHIL JAIN: "Massively Parallel Simulations of Spread of Infectious Diseases over Realistic Social Networks", 《2017 17TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID)》 *
LEI WANG;ZHU-HONG YOU;DE-SHUANG HUANG;JIAN-QIANG LI: "MGRCDA: Metagraph Recommendation Method for Predicting CircRNA-Disease Association", 《IEEE TRANSACTIONS ON CYBERNETICS》 *
刘瑜;姚欣;龚咏喜;康朝贵;施迅: "大数据时代的空间交互分析方法和应用再论", 《地理学报》 *
李健: "非常态交通管控与韧性交通系统构建", 《城市交通》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114357096A (zh) * 2021-12-27 2022-04-15 中建电子商务有限责任公司 一种基于双差集的疫情风险识别算法
CN114357096B (zh) * 2021-12-27 2023-01-10 中建电子商务有限责任公司 一种基于双差集的疫情风险识别方法
CN113993120A (zh) * 2021-12-30 2022-01-28 中国移动紫金(江苏)创新研究院有限公司 一种基于无线用户信令的人口统计方法及系统
CN114708985A (zh) * 2022-03-14 2022-07-05 中国人民解放军总医院第八医学中心 呼吸道传染病预警方法及系统
CN114708985B (zh) * 2022-03-14 2023-01-24 中国人民解放军总医院第八医学中心 呼吸道传染病预警方法及系统
CN117880856A (zh) * 2024-03-11 2024-04-12 武汉众诚华鑫科技有限公司 一种基于人工智能的电信基站安全预警方法及系统
CN117880856B (zh) * 2024-03-11 2024-05-31 武汉众诚华鑫科技有限公司 一种基于人工智能的电信基站安全预警方法及系统

Also Published As

Publication number Publication date
CN113784292B (zh) 2022-07-26

Similar Documents

Publication Publication Date Title
CN113784292B (zh) 一种基于手机信令数据的城市疫情风险评估方法
CN111261302B (zh) 基于时空轨迹数据的流行传染病病毒场可视化方法及系统
Meyer et al. Power-law models for infectious disease spread
CN111383771A (zh) 基于流行传染病病毒场的防控系统
CN113780635A (zh) 一种小空间尺度传染病时空传播模式的预测方法
US20150039364A1 (en) Optimizing emergency resources in case of disaster
CN106910151A (zh) 一种社会保障大数据平台
Azzolina et al. Regional differences in mortality rates during the COVID-19 epidemic in Italy
CN112885483A (zh) 传染病传播趋势的模拟方法、装置、电子设备以及存储介质
Zhou et al. Risk assessment for precise intervention of COVID-19 epidemic based on available big data and spatio-temporal simulation method: Empirical evidence from different public places in Guangzhou, China
CN111446000A (zh) 基于流行传染病病毒场追溯传染源的系统
Pan et al. Quantifying human mobility behavior changes in response to non-pharmaceutical interventions during the COVID-19 outbreak in the United States
CN113096785B (zh) 一种疫情时期医疗资源分配方法
CN115169814A (zh) 一种城市公共服务灾害韧性的表征测度方法
Shen What roles do population and migration flows play in the spatial diffusion of COVID-19 from Wuhan City to provincial regions in China?
Li et al. Temporal-spatial risk assessment of COVID-19 under the influence of urban spatial environmental parameters: The case of Shenyang city
Aseeri et al. Modelling-based simulator for forecasting the spread of COVID-19: A case study of Saudi Arabia
Li et al. Impact of traffic exposure and land use patterns on the risk of COVID-19 spread at the community level
CN113641749A (zh) 一种基于二部图的人口流动网络估计方法及系统
CN112259248A (zh) 一种covid-19境外输入风险评估预测方法
Chen et al. The application framework of big data technology during the COVID-19 pandemic in China
US20230056370A1 (en) Construction method of fine-grained infectious disease simulation model
WO2022082993A1 (zh) 城市内部传染病时空扩散建模方法及系统
CN113255028B (zh) 一种过街盲道有效性测度方法
CN115442748A (zh) 一种使用手机信令数据进行城市空间结构识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant