CN111145917A - 一种面向流行病防控的大规模人口接触网络建模方法 - Google Patents
一种面向流行病防控的大规模人口接触网络建模方法 Download PDFInfo
- Publication number
- CN111145917A CN111145917A CN202010065785.6A CN202010065785A CN111145917A CN 111145917 A CN111145917 A CN 111145917A CN 202010065785 A CN202010065785 A CN 202010065785A CN 111145917 A CN111145917 A CN 111145917A
- Authority
- CN
- China
- Prior art keywords
- virtual
- contact
- population
- representing
- contact network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000002265 prevention Effects 0.000 title claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 230000001575 pathological effect Effects 0.000 claims abstract description 7
- 230000003993 interaction Effects 0.000 claims abstract description 5
- 238000010276 construction Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 37
- 239000000758 substrate Substances 0.000 claims description 20
- 201000010099 disease Diseases 0.000 claims description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 14
- 150000001875 compounds Chemical class 0.000 claims description 12
- 238000004088 simulation Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 230000009977 dual effect Effects 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000000474 nursing effect Effects 0.000 claims description 3
- 230000008929 regeneration Effects 0.000 claims description 3
- 238000011069 regeneration method Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 17
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2291—User-Defined Types; Storage management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Pathology (AREA)
- Human Resources & Organizations (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种面向流行病防控的大规模人口接触网络建模方法,包括:采用张量建模动态人口接触网络,其中采用空间的基底表示动态人口接触网络的空间模式,采用基底的线性组合系数表示动态人口接触网络的时间模式;构建包含多个虚拟场景的虚拟社会;并基于虚拟场景计算各场景中各虚拟个体之间的交互概率,构成动态人口接触网络的空间模式;根据选定的流行病传播模型以及相应的病理学参数,结合动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数;使用双重迭代优化算法求解估算动态人口接触网络时间模式。本发明提出了一套完整的建模方案,能够实现大规模人口接触网络构建的需要。
Description
技术领域
本发明涉及人工智能软件领域,特别是一种面向流行病防控的大规模人口接触网络建模方法。
背景技术
流行性传染病(简称流行病)的每次爆发都会给人类社会带来巨大损失。因此,建立行之有效的流行病防控措施意义重大。在计算流行病中学中,人与人之间的接触也成为“社会接触”。人口的接触结构显著影响着流行病传播的时空模式,准确把握人口接触结构不尽可以帮助人们定量的分析和预测流行病传播的过程、途径和趋势,还能够帮助相关部门的决策者更好的指定和评估疫情控制措施。
现有技术中,流行病学、社会学和计算机科学等多个领域的学者对如何准确获取人口接触结构做了很多尝试,然而,由于成本过高等问题,这些研究都局限于特定的小规模样本中,难以获得大规模人口的接触结构,因此如何能够准确构建出大规模人口在个体水平上的接触结构成为了亟待解决的问题。
发明内容
针对上述问题,本发明旨在提供一种面向流行病防控的大规模人口接触网络建模方法。
本发明的目的采用以下技术方案来实现:
提供一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,包括:
根据选定的流行病传播模型以及相应的病理学参数,结合动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数;使用双重迭代优化算法求解估算动态人口接触网络时间模式W={w1,…,wR},其中wr表示场景r下各虚拟个体之间的接触强度。
在一种实施方式中,该方法还包括,基于包括人口普查数据、公交信息卡数据、社会医院统计信息的多元数据构建虚拟社会,其中虚拟社会包含家庭、学校、工作、通勤、医院、公共场所的虚拟场景;
其中,构建虚拟社会的方法包括:
虚拟行政区:根据人口普查数据中的行政区域划分和各个行政区内的人口统计数据,建立虚拟行政区,为每个虚拟行政区分配相应数量的虚拟个体;根据各个行政区性别比例和年龄分布数据,为各虚拟行政区中的虚拟个体指定性别和年龄。
虚拟家庭:根据各行政区家庭户数统计数量为每个虚拟行政区分配相应数量的家庭。根据户主年龄分布、家庭成员数量和家庭组成结构等统计数量将每个虚拟个体分配到不同的虚拟家庭中;
虚拟校园:根据各行政区包含学校数量和种类的统计数据,为每个虚拟行政区分配相应数量和种类的学校;根据学校类型、人数、位置及就读率等统计数据为每个适龄虚拟个体分配就读学校;
虚拟工作场所:依据各行政区的就业率数据将适龄虚拟个体指定为就业或赋闲状态;根据工作区域与生活区域的联合分布数据为就业个体分配虚拟工作区域,根据行业类型和个体年龄的联合分布数据为就业个体指定虚拟工作类型;
虚拟通勤轨迹:根据交通信息卡数据,从中得到每张交通信息卡的移动路线,进而根据交通信息卡的注册资料,为每个虚拟个体构造出相应的虚拟通勤轨迹;
虚拟社区医院:根据各行政区社区医院和诊所基本统计信息,将各虚拟行政区中的个体分配到不同的虚拟医院和诊所中。
在一种实施方式中,该方法还包括:采用复合人口模型表示不同场景下的接触结构,依据虚拟社会中个体的年龄,每5岁一组,将0到85岁的个体划分为17个年龄组中,将85岁以上的个体划分到第18个年龄组中,将每个虚拟场景的群体接触结构建模为一个18×18的二位矩阵,以描述不同年龄组之间的接触概率;其中不同场景内各年龄组之间的接触概率由以下函数获得:
在一种实施方式中,针对社区医院场景的接触信息的获取方法包括:1)从医院中抽样选择医生、护士、病人、保洁和护理人员作为目标对象,同时为每个目标独享设置唯一ID,其中包含年龄、职位、性别等信息,在目标对象身上的智能设备中预装有蓝牙程序;设置该蓝牙程序的扫描间隔和扫描范围,蓝牙程序按照设置的扫描间隔和扫描范围扫描其他预装有该蓝牙程序的蓝牙设备,若在扫描范围内扫描其他蓝牙设备,则认为目标对象之间产生接触,记录所有的接触事件。
基于上述采集的接触事件信息,计算社区医院场景下的接触概率,其中采用的接触概率函数为:
采用Mt表示张量M在t时刻的快照,表示t时刻G个年龄组的人口的接触结构,其中Mt的表示函数为:
其中,Ur和Vr∈RG。
采用矩阵的表示方式,将M表示为如下的外积形式:
在一种实施方式中,该方法中采用的流行病传播模型为:
It=KtIt-1=StABtCIt-1
式中,向量It表示t时刻各个年龄组的新增病例数,K表示再生矩阵,向量It和对角矩阵St分别表示t时刻的感染人数和尚未被感染的易感人数。矩阵A和C表示两个基本的流行病学参数,分别表示未感染者的易感程度和已感染者的感染能力。Bt表示t时刻的接触矩阵,Bt(i,j)表示t时刻亚人群i和亚人群j的接触概率,与人口动态接触结构M对应。
在一种实施方式中,该方法中,根据选定的流行病传播模型以及相应的病理学参数,结合动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数为:
其中
U和V满足
式中,N表示设定的流行病种类的总数,T表示动态人口接触网络时间窗的长度,表示第i种流行病在t时刻不同年龄组的新增病例数,其为流行病传播模型生成的模拟数据,P表示总人口数,Ai和Ci分别表示第i种流行病中两个基本的流行病学参数,Ur和Vr表示场景r下的特征矩阵,表示t′时刻r场景下的接触强度变化量,Ω1,…,ΩR表示基底矩阵中具有数据项的位置,ε表示松弛参数,表示r场景下年龄组u和年龄组v之间的接触概率;
本发明的有益效果为:1)提出了采用张量表示动态人口接触网络,基于动态人口接触网络中个体的接触概率和接触强度构建动态人口接触网络的空间模式和时间模式、并分别表示为张量的基底和组合系数的建模方式,并提出了一套完整的建模方案,能够实现动态人口接触网络构建的需要。
2)基于人口普查数据、交通信息卡数据以及医院基本统计数据构建包括六大虚拟场景的虚拟社会用于构建得到大规模人口接触网络的空间模式Φ,特别是在加入了虚拟通勤轨迹和虚拟社区医院等场景后,使得研究接触模式的虚拟场景更加丰富,提高了空间模式构建的性能。
3)采用稀疏表示的方式对动态人口接触网络时间模的表示进行优化,从而提高了动态人口接触网络演化过程中的性能。
4)根据动态人口接触网络以及流行病传染模型,提出了新的获取动态人口接触网络时间模式的优化目标函数,能够解决传统动态接触网络中存在的数据缺失、噪声数据等问题,提高了优化目标函数的拟合性能,从而提高了对动态人口接触网络时间模式估计的可靠性,间接提高了动态人口接触网络建模的准确性和可靠性。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明方法的流程图。
具体实施方式
结合以下应用场景对本发明作进一步描述。
参见图1,其示出一种面向流行病防控的大规模人口接触网络建模方法,包括:
S13根据选定的流行病传播模型以及相应的病理学参数,结合动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数;使用双重迭代优化算法求解估算动态人口接触网络时间模式W={w1,…,wR},其中wr表示场景r下各虚拟个体之间的接触强度。
采用张量表示动态人口接触网络,基于动态人口接触网络中个体的接触概率和接触强度构建动态人口接触网络的空间模式和时间模式、并分别表示为张量的基底和组合系数的建模方式,并提出了一套完整的建模方案,能够实现大规模人口接触网络构建的需要。
本发明中,令张量M∈RG×G×T表示负荷群体在时间窗[1,T]内的动态接触网络,表示空间RG×G×T的基底,W=(w1,…,wR)表示基底的线性组合系数,则动态接触网络M的构建问题可建模为基底Φ和组合系数W的学习方法。
由于不同场景中的接触模式具有明显不同的特征结构,因此采用基底Φ刻画这种空间异构性,其中基底中的每个元素是一个二维的接触概率矩阵,表示群体在场景r种的接触结构特征,R个基底矩阵刻画了R个主要场景中各不相同的群体接触模式,张量空间RG ×G×T中任意M都可由这R种基本接触模式在时间维上线性组合而成。因此Φ可作为动态接触网络M的空间模式。组合系数W={w1,…,wR}刻画了各个基底矩阵在组合中发挥的作用,即W刻画了各基底场景中的接触强度随时间的变化,wr则表示场景r中群体接触强度在时间窗[1,T]内的变化情况。
本发明方法中动态人口接触网络空间模式的挖掘研究方法还包括:
基于人口普查数据、公交信息卡数据、社区医院/诊所统计信息、无线传感器等多源数据,构建各个场景基底的接触结构。其中采用的人口普查数据主要包括如下信息:1)地理信息,包括行政区划分,家庭、学校、工作单位等的地理分布;2)人口统计信息,包括人口数、人口分布、年龄分布、性别比例等;3)家庭信息,包括家庭数量、组成、大小、户主信息等;4)就业信息,包括就业率、行业数量、行业分类、行业人数分布、工作区域分布等;5)教育信息,包括学校类型、学校数量、入学率、学校分布等。
首先为总体研究对象构建一个虚拟社会,其中包含家庭、学校、工作、通勤、医院、公共场所等虚拟场景,然后计算各个亚人口之间在各个虚拟场景中的交互概率作为他们在不同场景下的接触概率。
虚拟行政区。根据人口普查数据中的行政区域划分和各个行政区内的人口统计数据,建立虚拟行政区,为每个虚拟行政区分配相应数量的虚拟个体;根据各个行政区性别比例和年龄分布数据,为各虚拟行政区中的虚拟个体指定性别和年龄。
虚拟家庭。根据各行政区家庭户数统计数量为每个虚拟行政区分配相应数量的家庭。根据户主年龄分布、家庭成员数量和家庭组成结构等统计数量将每个虚拟个体分配到不同的虚拟家庭中。
虚拟校园。根据各行政区包含学校数量和种类的统计数据,为每个虚拟行政区分配相应数量和种类的学校。根据学校类型、人数、位置及就读率等统计数据为每个适龄虚拟个体分配就读学校。
虚拟工作场所。依据各行政区的就业率数据将适龄虚拟个体指定为就业或赋闲状态。根据工作区域与生活区域的联合分布数据为就业个体分配虚拟工作区域,根据行业类型和个体年龄的联合分布数据为就业个体指定虚拟工作类型。
虚拟通勤轨迹。根据交通信息卡数据,从中得到每张交通信息卡的移动路线,进而根据交通信息卡的注册资料,为每个虚拟个体构造出相应的虚拟通勤轨迹。
虚拟社区医院和诊所。根据各行政区社区医院和诊所基本统计信息(如位置分布、客户年龄分布等信息),将各虚拟行政区中的个体分配到不同的虚拟医院和诊所中。
通过以上步骤,构建包含行政区、家庭、校园、工作场所、通勤轨迹、社会医院6个基本社会场景的虚拟社会。其中,虚拟社会中每个个体被指定了年龄、性别、学校、职业、通勤、社会医院等与接触行为相关的基本特征。
其中采用复合人口模型表示不同场景下的接触结构。依据个体年龄,每5岁一组,将0到85岁的个体划分为17个年龄组中,将85岁以上的个体划分到第18个年龄组中。将每个场景的群体接触结构建模为一个18×18的二位矩阵,描述不同年龄组之间的接触概率。其中不同场景内各年龄组之间的接触概率由以下函数获得:
本发明中,还提出了一种特别针对通勤轨迹场景的接触信息的获取方法:
通勤是接触行为多发场景之一,准确获取通勤场景的接触模式是构造基底的重要一环。本申请发现,受年龄、性别、收入、置业等社会特征影响,个体通勤行为具有差异性。由于人流量大灯原因,采用传统的调查问卷等方式难以获取足够多且足够好的数据用来估计同期场景接触结构。随着公共交通信息系统的发展,越来越多的乘客使用交通卡乘车,因此他们的刷卡记录为研究通勤场景的接触结构提供了新途径。
因此,基于获取的交通信息卡的数据,本方法采用如下方案构建通勤场景基底:1)首先为群其中每个个体构造出虚拟的通勤轨迹,包括:乘坐车辆、乘车时间、乘车区间等;2)通过设计的算法检索出个体间的接触事件,匹配出同时乘坐统一通勤车辆的个体对;3)结合交通卡的相关注册信息(如年龄),计算出通勤场景中不同年龄组间的接触概率。具体包括:
将虚拟社会内的公共交通工具设置为公交车和地铁两大类;
针对公交车的通勤信息,通过公交车信息卡的刷卡时间记录上车的时间和地点,同时,结合虚拟个体的身份信息推测出乘车目的,进而结合沿途各站的附近设施信息与人口密度信息推测出其下车地点和乘车时间。基于个体上下车的时间和地点,结合所乘公交车的运营线路,为个体建立虚拟的公交车通勤轨迹。
针对地铁的通勤信息,通过公交信息卡的进出站刷卡数据记录进站和出站的地点和时间,同时考虑进站和出站之间的地铁运行轨迹,可得出该进出站之间的换乘车站的停留信息;通过结合刷卡数据和地铁运营线路可为个体建立虚拟的地铁通勤轨迹。
本发明中,还提出一种针对社区医院场景的接触信息的获取方法:1)从医院中抽样选择医生、护士、病人、保洁和护理人员作为目标对象,同时为每个目标设置唯一ID,其中包含年龄、职位、性别等信息,在目标对象身上的智能设备中预装有蓝牙程序;设置该蓝牙程序的扫描间隔和扫描范围,蓝牙程序按照设置的扫描间隔和扫描范围扫描其他预装有该蓝牙程序的蓝牙设备,若在扫描范围内扫描其他蓝牙设备,则认为目标对象之间产生接触,记录所有的接触事件。
基于上述采集的接触事件信息,计算社区医院场景下的接触概率,其中采用的接触概率函数为:
基于人口普查数据、交通信息卡数据以及医院基本统计数据构建包括六大虚拟场景的虚拟社会用于构建得到大规模人口接触网络的空间模式Φ,特别是在加入了虚拟通勤轨迹和虚拟社区医院等场景后,使得研究接触模式的虚拟场景更加丰富,提高了空间模式构建的性能。
本发明中,还提出一种针对组合系数W的系数表示优化方法:
张量M的演化过程会呈现多阶段性,阶段内的接触模式变化缓慢平滑,阶段间的变化突然显著,为了能建模这种动态演化特性,采用稀疏的表示方式对W进行建模,用0元素表示接触强度当前时刻没有发生变化,用正或负的非0元素表示接触强度相对于前一时刻增强或减弱,非0元素的绝对值越大表示变化越激烈。采用稀疏表示的方式对动态人口接触网络时间模的表示进行优化,从而提高了动态人口接触网络演化过程中的性能。
本发明方法还提出一种张量M的模型分解方法:
采用Mt表示张量M在t时刻的快照,表示t时刻G个年龄组的人口的接触结构,其中Mt的表示函数为:
其中,Ur和Vr∈RG。
采用矩阵的表示方式,将M表示为如下的外积形式:
本发明方法中采用的流行病传播模型为:
It=KtIt-1=StABtCIt-1
式中,向量It表示t时刻各个年龄组的新增病例数,K表示再生矩阵,向量It和对角矩阵St分别表示t时刻的感染人数和尚未被感染的易感人数。矩阵A和C表示两个基本的流行病学参数,分别表示未感染者的易感程度和已感染者的感染能力。Bt表示t时刻的接触矩阵,Bt(i,j)表示t时刻亚人群i和亚人群j的接触概率,与人口动态接触结构M对应。
采用上述张量M分解模型,能够有效地解决了基底矩阵中包含噪声或者缺失数据项的问题。
在一种实施方式中,该方法中,根据选定的流行病传播模型以及相应的病理学参数,结合动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数为:
其中
U和V满足
式中,N表示设定的流行病种类的总数,T表示动态人口接触网络时间窗的长度,表示第i种流行病在t时刻不同年龄组的新增病例数,其为流行病传播模型生成的模拟数据,P表示总人口数,Ai和Ci分别表示第i种流行病中两个基本的流行病学参数,Ur和Vr表示场景r下的特征矩阵,表示t′时刻r场景下的接触强度变化量,Ω1,…,ΩR表示基底矩阵中具有数据项的位置,ε表示松弛参数,表示r场景下年龄组u和年龄组v之间的接触概率;
根据动态人口接触网络以及流行病传染模型,提出了新的获取动态人口接触网络时间模式的优化目标函数,能够解决传统动态接触网络中存在的数据缺失、噪声数据等问题,提高了优化目标函数的拟合性能,从而提高了对动态人口接触网络时间模式估计的可靠性,间接提高了动态人口接触网络建模的准确性和可靠性。
根据动态人口接触网络时间模式的优化目标函数以及约束条件构造一个Lagrange方程:
式中,L表示构造的Lagrange方程,αr表示针对不同场景下特征向量的约束系数,γ和ρ约束条件的约束系数;
采用Lasso稀疏优化技术针对上述Lagrange方程构造优化算法;在该优化过程中,需要计算L关于各变量的偏导数和而在计算上述偏导数时,需要计算流行病模型集合F中各个流行病模型关于它们的偏导数和令是各流行病模型集合F基于U,V,所产生的模拟数据。在计算偏导数和会用到的值,于是这些偏导数可以表示成与有关的形式:
基于以上分析,可得到一个基于流行病模型的双重迭代稀疏优化算法。在一重迭代中,基于当前的参数U,V,模拟N种流行病爆发,产生模拟数据在另一重迭代中,基于新产生的模拟数据计算L关于各变量的偏导数和进而采用Lasso技术处理L以更新参数U,V,重复执行以上过程直到收敛。获取最终输出的优化参数
采用本发明方法构建的大规模动态接触网络,能够适应于流行病防控方面的应用,通过发现大规模动态接触网络中的周期性变化规律,能够模拟未来一段时间内各种流行病的爆发趋势,并根据模拟情况计算相应的预警指示,进行早期预警。
同时,目前流行病监控系统大多采用被动监控的方式手机流行病的传播数据,而被动监控得到的流行病监控数据常常有缺失、不全面,而采用本发明构建的动态接触网络对疾病传播进行模拟,能够弥补数据不全面、有缺失等问题的不足,提供可靠程度更高的参考数据。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当分析,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (9)
1.一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,包括:
根据选定的流行病传播模型以及相应的病理学参数,结合所述动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数;使用双重迭代优化算法求解估算动态人口接触网络时间模式W={w1,…,wR},其中wr表示场景r下各虚拟个体之间的接触强度。
2.根据权利要求1所述的一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,所述方法还包括,基于包括人口普查数据、公交信息卡数据、社会医院统计信息的多元数据构建虚拟社会,其中所述虚拟社会包含家庭、学校、工作、通勤、医院、公共场所的虚拟场景;
其中,构建所述虚拟社会的方法包括:
虚拟行政区:根据人口普查数据中的行政区域划分和各个行政区内的人口统计数据,建立虚拟行政区,为每个虚拟行政区分配相应数量的虚拟个体;根据各个行政区性别比例和年龄分布数据,为各虚拟行政区中的虚拟个体指定性别和年龄;
虚拟家庭:根据各行政区家庭户数统计数量为每个虚拟行政区分配相应数量的家庭;根据户主年龄分布、家庭成员数量和家庭组成结构等统计数量将每个虚拟个体分配到不同的虚拟家庭中;
虚拟校园:根据各行政区包含学校数量和种类的统计数据,为每个虚拟行政区分配相应数量和种类的学校;根据学校类型、人数、位置及就读率等统计数据为每个适龄虚拟个体分配就读学校;
虚拟工作场所:依据各行政区的就业率数据将适龄虚拟个体指定为就业或赋闲状态;根据工作区域与生活区域的联合分布数据为就业个体分配虚拟工作区域,根据行业类型和个体年龄的联合分布数据为就业个体指定虚拟工作类型;
虚拟通勤轨迹:根据交通信息卡数据,从中得到每张交通信息卡的移动路线,进而根据交通信息卡的注册资料,为每个虚拟个体构造出相应的虚拟通勤轨迹;
虚拟社区医院:根据各行政区社区医院和诊所基本统计信息,将各虚拟行政区中的个体分配到不同的虚拟医院和诊所中。
3.根据权利要求2所述的一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,所述方法还包括:采用复合人口模型表示不同场景下的接触结构,依据虚拟社会中个体的年龄,每5岁一组,将0到85岁的个体划分为17个年龄组中,将85岁以上的个体划分到第18个年龄组中,将每个虚拟场景的群体接触结构建模为一个18×18的二维矩阵,以描述不同年龄组之间的接触概率;其中不同场景内各年龄组之间的接触概率由以下函数获得:
4.根据权利要求3所述的一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,针对社区医院场景的接触信息的获取方法包括:1)从医院中抽样选择医生、护士、病人、保洁和护理人员作为目标对象,同时为每个目标设置唯一ID,其中包含年龄、职位、性别等信息,在目标对象身上的智能设备中预装有蓝牙程序;设置该蓝牙程序的扫描间隔和扫描范围,蓝牙程序按照设置的扫描间隔和扫描范围扫描其他预装有该蓝牙程序的蓝牙设备,若在扫描范围内扫描其他蓝牙设备,则认为目标对象之间产生接触,记录所有的接触事件;
基于上述采集的接触事件信息,计算社区医院场景下的接触概率,其中采用的接触概率函数为:
采用Mt表示张量M在t时刻的快照,表示t时刻G个年龄组的人口的接触结构,其中Mt的表示函数为:
其中,Ur和Vr∈RG;
采用矩阵的表示方式,将M表示为如下的外积形式:
7.根据权利要求6所述的一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,其中采用的流行病传播模型为:
It=KtIt-1=StABtCIt-1
式中,向量It表示t时刻各个年龄组的新增病例数,K表示再生矩阵,向量It和对角矩阵St分别表示t时刻的感染人数和尚未被感染的易感人数;矩阵A和C表示两个基本的流行病学参数,分别表示未感染者的易感程度和已感染者的感染能力;Bt表示t时刻的接触矩阵,Bt(i,j)表示t时刻亚人群i和亚人群j的接触概率,与人口动态接触结构M对应。
8.根据权利要求7所述的一种面向流行病防控的大规模人口接触网络建模方法,其特征在于,其中,根据选定的流行病传播模型以及相应的病理学参数,结合所述动态人口接触网络建立获取动态人口接触网络时间模式的优化目标函数为:
其中
U和V满足
式中,N表示设定的流行病种类的总数,T表示动态人口接触网络时间窗的长度,表示第i种流行病在t时刻不同年龄组的新增病例数,其为流行病传播模型生成的模拟数据,P表示总人口数,Ai和Ci分别表示第i种流行病中两个基本的流行病学参数,Ur和Vr表示场景r下的特征矩阵,表示t′时刻r场景下的接触强度变化量,Ω1,…,ΩR表示基底矩阵中具有数据项的位置,ε表示松弛参数,表示r场景下年龄组u和年龄组v之间的接触概率;
根据动态人口接触网络时间模式的优化目标函数以及约束条件构造一个Lagrange方程:
式中,L表示构造的Lagrange方程,αr表示针对不同场景下特征向量的约束系数,γ和ρ约束条件的约束系数;
采用Lasso稀疏优化技术针对上述Lagrange方程构造优化算法;在该优化过程中,需要计算L关于各变量的偏导数和而在计算上述偏导数时,需要计算流行病模型集合F中各个流行病模型关于它们的偏导数和令是各流行病模型集合F基于U,V,所产生的模拟数据;在计算偏导数和会用到的值,于是这些偏导数可以表示成与有关的形式:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065785.6A CN111145917B (zh) | 2020-01-20 | 2020-01-20 | 一种面向流行病防控的大规模人口接触网络建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065785.6A CN111145917B (zh) | 2020-01-20 | 2020-01-20 | 一种面向流行病防控的大规模人口接触网络建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111145917A true CN111145917A (zh) | 2020-05-12 |
CN111145917B CN111145917B (zh) | 2021-05-04 |
Family
ID=70526478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010065785.6A Active CN111145917B (zh) | 2020-01-20 | 2020-01-20 | 一种面向流行病防控的大规模人口接触网络建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111145917B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111933298A (zh) * | 2020-08-14 | 2020-11-13 | 医渡云(北京)技术有限公司 | 人群关系确定方法、装置、电子设备及介质 |
CN112735605A (zh) * | 2021-01-22 | 2021-04-30 | 中国银行股份有限公司 | 人员密切接触识别追踪分析方法及装置 |
CN113052425A (zh) * | 2020-10-14 | 2021-06-29 | 中国联合网络通信集团有限公司 | 基于大数据的复工风险指数确定方法和装置 |
CN113299401A (zh) * | 2021-05-28 | 2021-08-24 | 平安科技(深圳)有限公司 | 传染病数据的传播监测方法、装置、计算机设备及介质 |
CN114068034A (zh) * | 2021-11-16 | 2022-02-18 | 医渡云(北京)技术有限公司 | 数据的预测方法、装置、电子设备及计算机可读介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794342A (zh) * | 2009-09-30 | 2010-08-04 | 中国人民解放军防化指挥工程学院 | 基于非线性、变系数预测模型的传染病疫情预测分析方法 |
KR20120103926A (ko) * | 2011-03-11 | 2012-09-20 | 신민호 | 방역 관리용 차량 단말 장치 및 차량 통제 방법 |
CN103390089A (zh) * | 2012-05-07 | 2013-11-13 | 中国人民解放军防化学院 | 一种具有控制变量的传染病疫情预测方法 |
US20140372159A1 (en) * | 2013-03-15 | 2014-12-18 | David Bain | System for optimization of group interaction |
CN105335604A (zh) * | 2015-08-31 | 2016-02-17 | 吉林大学 | 面向流行病防控的人口动态接触结构建模与发现方法 |
CN106096075A (zh) * | 2016-05-25 | 2016-11-09 | 中山大学 | 一种基于社交网络的消息传播模型 |
CN106777935A (zh) * | 2016-12-05 | 2017-05-31 | 广东石油化工学院 | 一种基于网络结构的疾病动态预测方法 |
CN108630321A (zh) * | 2018-04-11 | 2018-10-09 | 平安科技(深圳)有限公司 | 流行病预测方法、计算机装置及计算机可读存储介质 |
CN109816544A (zh) * | 2019-02-18 | 2019-05-28 | 国家计算机网络与信息安全管理中心 | 基于接触概率的信息传播模型实现方法及装置 |
-
2020
- 2020-01-20 CN CN202010065785.6A patent/CN111145917B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794342A (zh) * | 2009-09-30 | 2010-08-04 | 中国人民解放军防化指挥工程学院 | 基于非线性、变系数预测模型的传染病疫情预测分析方法 |
KR20120103926A (ko) * | 2011-03-11 | 2012-09-20 | 신민호 | 방역 관리용 차량 단말 장치 및 차량 통제 방법 |
CN103390089A (zh) * | 2012-05-07 | 2013-11-13 | 中国人民解放军防化学院 | 一种具有控制变量的传染病疫情预测方法 |
US20140372159A1 (en) * | 2013-03-15 | 2014-12-18 | David Bain | System for optimization of group interaction |
CN105335604A (zh) * | 2015-08-31 | 2016-02-17 | 吉林大学 | 面向流行病防控的人口动态接触结构建模与发现方法 |
CN106096075A (zh) * | 2016-05-25 | 2016-11-09 | 中山大学 | 一种基于社交网络的消息传播模型 |
CN106777935A (zh) * | 2016-12-05 | 2017-05-31 | 广东石油化工学院 | 一种基于网络结构的疾病动态预测方法 |
CN108630321A (zh) * | 2018-04-11 | 2018-10-09 | 平安科技(深圳)有限公司 | 流行病预测方法、计算机装置及计算机可读存储介质 |
CN109816544A (zh) * | 2019-02-18 | 2019-05-28 | 国家计算机网络与信息安全管理中心 | 基于接触概率的信息传播模型实现方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111933298A (zh) * | 2020-08-14 | 2020-11-13 | 医渡云(北京)技术有限公司 | 人群关系确定方法、装置、电子设备及介质 |
CN111933298B (zh) * | 2020-08-14 | 2024-02-13 | 医渡云(北京)技术有限公司 | 人群关系确定方法、装置、电子设备及介质 |
CN113052425A (zh) * | 2020-10-14 | 2021-06-29 | 中国联合网络通信集团有限公司 | 基于大数据的复工风险指数确定方法和装置 |
CN112735605A (zh) * | 2021-01-22 | 2021-04-30 | 中国银行股份有限公司 | 人员密切接触识别追踪分析方法及装置 |
CN113299401A (zh) * | 2021-05-28 | 2021-08-24 | 平安科技(深圳)有限公司 | 传染病数据的传播监测方法、装置、计算机设备及介质 |
CN113299401B (zh) * | 2021-05-28 | 2023-04-07 | 平安科技(深圳)有限公司 | 传染病数据的传播监测方法、装置、计算机设备及介质 |
CN114068034A (zh) * | 2021-11-16 | 2022-02-18 | 医渡云(北京)技术有限公司 | 数据的预测方法、装置、电子设备及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111145917B (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111145917B (zh) | 一种面向流行病防控的大规模人口接触网络建模方法 | |
Kose et al. | Identifying technology convergence in the field of robotics research | |
Nsoesie et al. | A simulation optimization approach to epidemic forecasting | |
Del Valle et al. | Mixing patterns between age groups in social networks | |
Osaba et al. | Good practice proposal for the implementation, presentation, and comparison of metaheuristics for solving routing problems | |
Aleman et al. | A nonhomogeneous agent-based simulation approach to modeling the spread of disease in a pandemic outbreak | |
CN111403050A (zh) | 一种基于大数据的城市人口疾病监测系统 | |
Nsoesie et al. | Sensitivity analysis of an individual-based model for simulation of influenza epidemics | |
CN111081383A (zh) | 一种基于云计算的流行病监控系统 | |
Dong et al. | Modeling infection with multi-agent dynamics | |
Yang et al. | Characterizing and discovering spatiotemporal social contact patterns for healthcare | |
CN111063449A (zh) | 一种基于大数据的流行病预测防控系统 | |
Sharma et al. | Data pre-processing using neural processes for modeling personalized vital-sign time-series data | |
Giacopelli | A full-scale agent-based model to hypothetically explore the impact of lockdown, social distancing, and vaccination during the COVID-19 pandemic in Lombardy, Italy: Model development | |
Hy et al. | Temporal multiresolution graph neural networks for epidemic prediction | |
US20180285758A1 (en) | Methods for creating and analyzing dynamic trail networks | |
Choi et al. | Spatiotemporal statistical analysis of influenza mortality risk in the State of California during the period 1997–2001 | |
Qian et al. | Applying a Probabilistic Infection Model for studying contagion processes in contact networks | |
Mizuno et al. | Optimizing intra-facility crowding in Wi-Fi environments using continuous-time Markov chains | |
Aicha et al. | How busy is my supervisor? Detecting the visits in the office of my supervisor using a sensor network | |
Barat et al. | Agent based simulatable city digital twin to explore dynamics of covid-19 pandemic | |
Cristóbal et al. | Using Data Mining to Estimate Patterns of Contagion-Risk Interactions in an Intercity Public Road Transport System | |
CN114372114B (zh) | 一种基于矩阵分解模型的出行轨迹还原方法及系统 | |
Lee et al. | Modeling latent spatio-temporal disease incidence using penalized composite link models | |
Balcells et al. | SARS-CoV-2 epidemiological model based on socio-economic variables in Switzerland |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |