CN113784292A - 一种基于手机信令数据的城市疫情风险评估方法 - Google Patents
一种基于手机信令数据的城市疫情风险评估方法 Download PDFInfo
- Publication number
- CN113784292A CN113784292A CN202110974920.3A CN202110974920A CN113784292A CN 113784292 A CN113784292 A CN 113784292A CN 202110974920 A CN202110974920 A CN 202110974920A CN 113784292 A CN113784292 A CN 113784292A
- Authority
- CN
- China
- Prior art keywords
- risk
- grid
- mobile phone
- data
- signaling data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012502 risk assessment Methods 0.000 title claims abstract description 17
- 230000000694 effects Effects 0.000 claims abstract description 43
- 230000005540 biological transmission Effects 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000007733 viral latency Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 238000005192 partition Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 6
- 238000012300 Sequence Analysis Methods 0.000 abstract description 2
- 238000003012 network analysis Methods 0.000 abstract description 2
- 238000011002 quantification Methods 0.000 abstract 1
- 241000711573 Coronaviridae Species 0.000 description 5
- 206010035664 Pneumonia Diseases 0.000 description 5
- 241000700605 Viruses Species 0.000 description 3
- 208000025721 COVID-19 Diseases 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Computer Networks & Wireless Communication (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Fuzzy Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
Abstract
本发明涉及一种基于手机信令数据的城市内部流行病传播风险评估方法。首先,通过手机信令数据提取手机用户的多日活动链,根据历史活动地点识别潜在高风险人员;其次,在对研究区域进行栅格化的基础上,以栅格为单位对各类人口分布特征和人口流动特征进行集计,从而构建每日的人员流动网络;最后,将城市疫情风险划分为内部暴露风险和对外传播风险,基于聚类分析和社会网络分析理论提出两类风险的量化方法,并利用时间序列分析方法反映疫情风险的时变特性及规律。与现有技术相比,本发明具有提高城市疫情风险评估分析结果的准确性和稳定性等优点。
Description
技术领域
本发明涉及时空数据挖掘与城市应急管理领域,尤其是涉及一种基于手机信令数据的城市疫情风险评估方法。
背景技术
自2019年12月以来,新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)在全球范围内迅速传播。截至2020年9月30日,全球确诊病例达到33563030例,死亡病例达到1005218例。作为一次重大突发卫生事件,新型冠状病毒肺炎的爆发对社会、经济和环境等方面造成了极大的损失和破坏。在疫情爆发时期,相关研究主要关注于新型冠状病毒肺炎的流行病学特征和临床特征,通过传染病动力学模型和机器学习方法对病毒传播进行模拟和预测。随着疫情防控进入常态化阶段,研究者开始反思如何提高公共卫生体系的应急能力,利用多源时空大数据从不同尺度对新型冠状病毒肺炎传播的时空模式进行分析,挖掘影响传播的潜在因素。然而,现有研究较少利用高精度手机信令数据,提出城市尺度的疫情风险分析方法。更重要的是,由于如新型冠状病毒肺炎的全球性大流行病在爆发初期以输入性病例为主,控制输入的高风险人员能够有效遏制病毒在城市内部的传播扩散,但是现有研究中并没有形成一个针对疫情爆发初期的城市疫情风险评估方法。
人口流动性一直是影响流行病传播的关键因素之一。在经典流行病动力学模型中,人群被划分为易感者和感染者等不同群体。其中,感染率与感染者比例和易感者比例的乘积成正比。由于仓室模型没有考虑地理空间异质性,因此研究者引入了生态学的复合种群模型,以反映人口在不同地理空间之间的移动。此外,研究者从以下两个角度对人口流动性与流行病传播之间的关系进行了更深入的探究。第一类研究针对传播过程构建理论模型,关注于多样的网络拓扑结构和传播动力学特征,例如节点异质性、传播过程中的随机环境扰动、交叉扩散引起的图灵不稳定性、以及个体网络中的双向运动等。第二类研究基于交通出行数据挖掘出行特征,结合流行病传播的时空特征分析交通管控措施对流行病传播的影响。所使用的数据包括居民出行调查数据、民航和铁路出行数据、大规模移动位置数据(出租车浮动车数据和手机数据)等。
一方面,人群聚集可能增加易感者与感染者之间的接触概率,从而提高暴露风险;另一方面,感染者的出行活动可能加速病毒的传播扩散。因此,在进行风险评估时,需要从暴露和传播两个角度进行分析。并且,在现有研究的基础上,需要一个一般化的城市疫情风险评估框架,以在未来面对全球性大流行病时快速形成防控应急预案。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于手机信令数据的城市疫情风险评估方法,提取不同人群的空间分布和出行特征,实现对城市疫情风险的评估分析,提高城市疫情风险评估评估分析结果的准确性和稳定性。
本发明的目的可以通过以下技术方案来实现:
一种基于手机信令数据的城市疫情风险评估方法,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
所述步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区位置信息和病毒潜伏期长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
进一步地,所述步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
所述步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
进一步地,所述活动时段为每天的早上6点到晚上9点。
所述步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
进一步地,所述步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
进一步地,所述接近中心性的计算公式如下所示:
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离。
进一步地,所述节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量。
进一步地,所述每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
所述步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
进一步地,所述基于动态时间规整算法的时间序列相似性D(Ai,Bj)的计算公式如下所示:
其中,Ai表示序列<a1,…,ai>,Bj表示序列<b1,…,bj>,δ(ai,bj)表示ai和bj之间的距离。
进一步地,用于所述类簇中心的中心化SUSUM-SQ统计量Dk的计算公式如下所示:
其中,T为序列长度,k=1,2,3……,T,Ck为迭代残差序列的平方和。
与现有技术相比,本发明具有以下有益效果:
本发明通过用户的手机信令数据来生成用户活动数据,根据用户历史活动点的位置信息区分高风险人员和正常人员,建立城市内部的人员流动网络;从暴露和传播两个角度,基于聚类分析和社会网络分析理论计算疫情风险指数;基于时间序列分析方法挖掘疫情风险的时变特性及规律;充分利用了居民在城市内部活动时所附带的手机信令数据,有效提高了城市疫情风险评估分析结果的准确性和稳定性。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于手机信令数据的城市疫情风险评估方法,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区位置信息和病毒潜伏期长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
本实施例中,时间阈值为30min。
步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
活动时段为每天的早上6点到晚上9点。
步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
接近中心性的计算公式如下所示:
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离。
节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量。
每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
基于动态时间规整算法的时间序列相似性D(Ai,Bj)的计算公式如下所示:
其中,Ai表示序列<a1,…,ai>,Bj表示序列<b1,…,bj>,δ(ai,bj)表示ai和bj之间的距离。
用于类簇中心的中心化SUSUM-SQ统计量Dk的计算公式如下所示:
其中,T为序列长度,k=1,2,3……,T,Ck为迭代残差序列的平方和。
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种基于手机信令数据的城市疫情风险评估方法,其特征在于,具体包括以下步骤:
S1、获取目标区域中用户的手机信令数据,根据用户的手机信令数据提取用户的驻留点的位置信息和移动轨迹,并根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在病毒潜伏期内驻留点与高风险地区重合的用户标记为高风险人员,其余为正常人员;
S2、根据用户的驻留点的位置信息,计算目标区域形成的各栅格内的当日平均活动人口数量,包括当日活动时段内在栅格内驻留的高风险人员和正常人员的平均数量,从而形成每日的出行流量矩阵,进而建立反映人员流动的空间交互网络;
S3、针对目标区域的每个栅格,将城市疫情风险划分为内部暴露风险和对外传播风险,对于内部暴露风险,根据经典仓室模型理论,通过高风险人员和正常人员的数量关系确定栅格的暴露风险等级;对于对外传播风险,基于人口流动网络,计算栅格与其他栅格之间的联系强度,从而确定传播风险指数;
S4、针对对外传播风险,以栅格为基本单元,根据风险时变规律进行分区;在对风险时变特性相似的栅格进行聚类的基础上,对各分区时间序列类簇中心的结构性变点进行识别,从而生成城市疫情风险评估结果。
2.根据权利要求1所述的一种基于手机信令数据的城市内部流行病传播风险评估方法,其特征在于,所述步骤S1具体包括以下步骤:
S11、获取目标区域中用户的手机信令数据,并对其中包含的无效数据进行清洗;
S12、基于预处理后的手机信令数据,检测同一用户在同一地点停留是否超过最小时间阈值,若是则判定其产生一次驻留或活动,从而将手机信令数据中的短时间停留记录转换为用户的活动数据,并计算每次活动的开始时间和结束时间;
S13、根据预设的高风险地区的位置信息和病毒潜伏期的长度,将在由当日起回溯至病毒潜伏期内,用户活动数据中驻留点经纬度坐标与高风险地区位置信息发生重合的用户标记为高风险人员,其余为正常人员。
3.根据权利要求2所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S11中的无效数据包括在数据采集和传输过程中产生的重复数据、缺失数据、乒乓数据、漂移数据等噪声数据。
4.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S2具体包括以下步骤:
S21、将目标区域划分为等尺寸栅格单元,在活动时段内按小时分别统计各栅格的实时人口数量,计算每个栅格的每小时平均人口数量作为当日平均活动人口数量,再分别计算活动时段内各栅格高风险人员和正常人员的每小时平均人口数量;
S22、针对同一用户,根据活动数据判断其在相邻的两个时间点时是否位于不同的栅格内,若是则判定用户完成一次出行,从而对栅格之间的出行次数进行求和,得到目前区域的每日出行流量矩阵;
S23、根据每日出行流量矩阵,将每个栅格视作一个节点,根据栅格之间的出行联系和出行流量大小生成无向加权图,构建出目标区域的每日人员流动网络。
5.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S3具体包括以下步骤:
S31、根据经典仓室模型,以栅格作为基本单元,将活动时段内各栅格的高风险人员和正常人员的每小时平均人口数量作为特征,使用K-means进行聚类,确定栅格的暴露风险等级;
S32、基于以栅格为节点的人员流动网络,计算各栅格的接近中心性,将接近中心性作为栅格向外输出高风险人员的概率,结合活动时段内栅格的高风险人员每小时平均人口数量,计算栅格的对外传播风险指数。
6.根据权利要求5所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S31中K-means聚类采用的k值为最佳k值,最佳k值的筛选过程包括:根据预设的k值取值区间进行多次实验,在每次聚类后计算各样本与其所属类簇中心的距离总和;根据k值和对应总距离绘制散点图并进行拟合,计算出曲率最大的点所对应的k,即为最优k值。
7.根据权利要求5所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述接近中心性的计算公式如下所示:
其中,C(v)为节点v的亲密度中心性,n为人口流动网络的节点数量,sd(v,u)为节点v和u之间的最短路距离;
所述节点v和u之间的最短路距离根据无向加权图中节点之间的连边的长度进行相加后得到,两个节点之间的连边的长度如下所示:
其中,d(i)为节点s和t之间连边e(i)的长度,w(i)为连边e(i)的权重,即出行流量;
所述每个节点的对外传播风险指数的计算公式如下所示:
R(v)=HHG(v)×C(v)
其中,R(v)为节点v的对外传播风险,HHG(v)为节点v内当日处于活动状态的高风险人员平均数量。
8.根据权利要求1所述的一种基于手机信令数据的城市疫情风险评估方法,其特征在于,所述步骤S4具体包括以下步骤:
S41、对每个栅格,将连续多日的对外传播风险指数构建为一个时间序列,通过动态时间规整方法衡量任意两个时间序列之间的相似性,基于相似性使用K-means对时间序列进行聚类,实现对栅格的分区;
S42、针对分区后每类栅格的对外传播风险指数时间序列的类簇中心,使用迭代累积平方和算法对时间序列中存在的结构性方差变点进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974920.3A CN113784292B (zh) | 2021-08-24 | 2021-08-24 | 一种基于手机信令数据的城市疫情风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974920.3A CN113784292B (zh) | 2021-08-24 | 2021-08-24 | 一种基于手机信令数据的城市疫情风险评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113784292A true CN113784292A (zh) | 2021-12-10 |
CN113784292B CN113784292B (zh) | 2022-07-26 |
Family
ID=78838784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110974920.3A Active CN113784292B (zh) | 2021-08-24 | 2021-08-24 | 一种基于手机信令数据的城市疫情风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113784292B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113993120A (zh) * | 2021-12-30 | 2022-01-28 | 中国移动紫金(江苏)创新研究院有限公司 | 一种基于无线用户信令的人口统计方法及系统 |
CN114357096A (zh) * | 2021-12-27 | 2022-04-15 | 中建电子商务有限责任公司 | 一种基于双差集的疫情风险识别算法 |
CN114708985A (zh) * | 2022-03-14 | 2022-07-05 | 中国人民解放军总医院第八医学中心 | 呼吸道传染病预警方法及系统 |
CN117880856A (zh) * | 2024-03-11 | 2024-04-12 | 武汉众诚华鑫科技有限公司 | 一种基于人工智能的电信基站安全预警方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826193A (zh) * | 2009-06-18 | 2010-09-08 | 张艳红 | 金融保险第三方海量数据与红指数池管理智能tpa平台 |
WO2017127732A1 (en) * | 2016-01-21 | 2017-07-27 | Indiana University Research And Technology Corporation | Treatment and prevention of retinal vascular disease by photocoagulation |
CN107133901A (zh) * | 2017-05-05 | 2017-09-05 | 中国科学院深圳先进技术研究院 | 一种传染病防控方法及系统 |
CN109360660A (zh) * | 2018-10-31 | 2019-02-19 | 河南省疾病预防控制中心 | 一种疾控与出行信息互联的防控方法及防控系统 |
CN111125184A (zh) * | 2019-11-23 | 2020-05-08 | 同济大学 | 基于时间序列结构性变点识别的公交客流动态监测方法 |
CN111180070A (zh) * | 2019-12-30 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 病历数据分析方法及装置 |
CN111933297A (zh) * | 2020-08-05 | 2020-11-13 | 河南牧业经济学院 | 一种基于近场通信的人员密接情况调查方法 |
US20210016006A1 (en) * | 2019-07-16 | 2021-01-21 | Beta Bionics, Inc. | Blood glucose control system with carbohydrate therapy indication |
CN112530601A (zh) * | 2020-12-09 | 2021-03-19 | 北京红山信息科技研究院有限公司 | 一种校园疫情监控方法、装置、计算机设备及存储介质 |
-
2021
- 2021-08-24 CN CN202110974920.3A patent/CN113784292B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826193A (zh) * | 2009-06-18 | 2010-09-08 | 张艳红 | 金融保险第三方海量数据与红指数池管理智能tpa平台 |
WO2017127732A1 (en) * | 2016-01-21 | 2017-07-27 | Indiana University Research And Technology Corporation | Treatment and prevention of retinal vascular disease by photocoagulation |
CN107133901A (zh) * | 2017-05-05 | 2017-09-05 | 中国科学院深圳先进技术研究院 | 一种传染病防控方法及系统 |
CN109360660A (zh) * | 2018-10-31 | 2019-02-19 | 河南省疾病预防控制中心 | 一种疾控与出行信息互联的防控方法及防控系统 |
US20210016006A1 (en) * | 2019-07-16 | 2021-01-21 | Beta Bionics, Inc. | Blood glucose control system with carbohydrate therapy indication |
CN111125184A (zh) * | 2019-11-23 | 2020-05-08 | 同济大学 | 基于时间序列结构性变点识别的公交客流动态监测方法 |
CN111180070A (zh) * | 2019-12-30 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 病历数据分析方法及装置 |
CN111933297A (zh) * | 2020-08-05 | 2020-11-13 | 河南牧业经济学院 | 一种基于近场通信的人员密接情况调查方法 |
CN112530601A (zh) * | 2020-12-09 | 2021-03-19 | 北京红山信息科技研究院有限公司 | 一种校园疫情监控方法、装置、计算机设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
ABHINAV BHATELE;JAE-SEUNG YEOM;NIKHIL JAIN: "Massively Parallel Simulations of Spread of Infectious Diseases over Realistic Social Networks", 《2017 17TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID)》 * |
LEI WANG;ZHU-HONG YOU;DE-SHUANG HUANG;JIAN-QIANG LI: "MGRCDA: Metagraph Recommendation Method for Predicting CircRNA-Disease Association", 《IEEE TRANSACTIONS ON CYBERNETICS》 * |
刘瑜;姚欣;龚咏喜;康朝贵;施迅: "大数据时代的空间交互分析方法和应用再论", 《地理学报》 * |
李健: "非常态交通管控与韧性交通系统构建", 《城市交通》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357096A (zh) * | 2021-12-27 | 2022-04-15 | 中建电子商务有限责任公司 | 一种基于双差集的疫情风险识别算法 |
CN114357096B (zh) * | 2021-12-27 | 2023-01-10 | 中建电子商务有限责任公司 | 一种基于双差集的疫情风险识别方法 |
CN113993120A (zh) * | 2021-12-30 | 2022-01-28 | 中国移动紫金(江苏)创新研究院有限公司 | 一种基于无线用户信令的人口统计方法及系统 |
CN114708985A (zh) * | 2022-03-14 | 2022-07-05 | 中国人民解放军总医院第八医学中心 | 呼吸道传染病预警方法及系统 |
CN114708985B (zh) * | 2022-03-14 | 2023-01-24 | 中国人民解放军总医院第八医学中心 | 呼吸道传染病预警方法及系统 |
CN117880856A (zh) * | 2024-03-11 | 2024-04-12 | 武汉众诚华鑫科技有限公司 | 一种基于人工智能的电信基站安全预警方法及系统 |
CN117880856B (zh) * | 2024-03-11 | 2024-05-31 | 武汉众诚华鑫科技有限公司 | 一种基于人工智能的电信基站安全预警方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113784292B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113784292B (zh) | 一种基于手机信令数据的城市疫情风险评估方法 | |
CN111261302B (zh) | 基于时空轨迹数据的流行传染病病毒场可视化方法及系统 | |
Meyer et al. | Power-law models for infectious disease spread | |
CN111383771A (zh) | 基于流行传染病病毒场的防控系统 | |
CN113780635A (zh) | 一种小空间尺度传染病时空传播模式的预测方法 | |
US20150039364A1 (en) | Optimizing emergency resources in case of disaster | |
CN106910151A (zh) | 一种社会保障大数据平台 | |
Azzolina et al. | Regional differences in mortality rates during the COVID-19 epidemic in Italy | |
CN112885483A (zh) | 传染病传播趋势的模拟方法、装置、电子设备以及存储介质 | |
Zhou et al. | Risk assessment for precise intervention of COVID-19 epidemic based on available big data and spatio-temporal simulation method: Empirical evidence from different public places in Guangzhou, China | |
CN111446000A (zh) | 基于流行传染病病毒场追溯传染源的系统 | |
Pan et al. | Quantifying human mobility behavior changes in response to non-pharmaceutical interventions during the COVID-19 outbreak in the United States | |
CN113096785B (zh) | 一种疫情时期医疗资源分配方法 | |
CN115169814A (zh) | 一种城市公共服务灾害韧性的表征测度方法 | |
Shen | What roles do population and migration flows play in the spatial diffusion of COVID-19 from Wuhan City to provincial regions in China? | |
Li et al. | Temporal-spatial risk assessment of COVID-19 under the influence of urban spatial environmental parameters: The case of Shenyang city | |
Aseeri et al. | Modelling-based simulator for forecasting the spread of COVID-19: A case study of Saudi Arabia | |
Li et al. | Impact of traffic exposure and land use patterns on the risk of COVID-19 spread at the community level | |
CN113641749A (zh) | 一种基于二部图的人口流动网络估计方法及系统 | |
CN112259248A (zh) | 一种covid-19境外输入风险评估预测方法 | |
Chen et al. | The application framework of big data technology during the COVID-19 pandemic in China | |
US20230056370A1 (en) | Construction method of fine-grained infectious disease simulation model | |
WO2022082993A1 (zh) | 城市内部传染病时空扩散建模方法及系统 | |
CN113255028B (zh) | 一种过街盲道有效性测度方法 | |
CN115442748A (zh) | 一种使用手机信令数据进行城市空间结构识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |