CN114639487A - 流行病传播模型构建方法、终端和存储介质 - Google Patents

流行病传播模型构建方法、终端和存储介质 Download PDF

Info

Publication number
CN114639487A
CN114639487A CN202210204156.6A CN202210204156A CN114639487A CN 114639487 A CN114639487 A CN 114639487A CN 202210204156 A CN202210204156 A CN 202210204156A CN 114639487 A CN114639487 A CN 114639487A
Authority
CN
China
Prior art keywords
time
collision
propagation
grid
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210204156.6A
Other languages
English (en)
Inventor
蒋志鹏
王建华
戴帅夫
刘丙双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiuqi Technology Co ltd
Original Assignee
Beijing Jiuqi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiuqi Technology Co ltd filed Critical Beijing Jiuqi Technology Co ltd
Priority to CN202210204156.6A priority Critical patent/CN114639487A/zh
Publication of CN114639487A publication Critical patent/CN114639487A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种流行病传播模型构建方法、终端和存储介质,方法包括:基于用户信令数据,得到一定周期内的轨迹数据;将轨迹数据转变为Geohash网格序列,并生成时空碰撞网格;筛选出累加停留时长超过一定阈值的所述时空碰撞网格;根据未感染者与筛选出的不同所述时空碰撞网格的碰撞次数,评估未感染者被传染的风险;将筛选出的所述时空碰撞网格进行串联,生成传播网络结点集合;遍历所述传播网络结点集合,生成传播森林,将所述传播森林中每棵传播树的根节点作为该传播树各子结点的传染源。本发明利用信令数据进行轨迹碰撞,描绘省内感染病例与输入型病例的传播关系、未感染者与确诊病例之间的接触情况,以达到追溯传染源、发现高危人群的目的。

Description

流行病传播模型构建方法、终端和存储介质
技术领域
本发明涉及通信数据分析技术领域,更具体的说是涉及一种基于信令数据的流行病传播模型构建方法、终端和存储介质。
背景技术
目前,针对流行病普遍采用流行病学调查,简称流调,是通过询问、信访、问卷填写、现场查看、测量和检测等多种手段,全面系统地收集和疾病事件有关的各种资料和数据,并进行综合分析,得出合乎逻辑的病因结论或病因假设的线索,提出疾病防控策略和措施建议的行为。流调的主要内容包括病例基本信息、发病诊疗和报告情况、相关活动情况、可疑暴露史情况、实验室检测情况等。
以新换肺炎为例,其潜伏期一般为14天,所以流调主要调查确诊或疑似病例在生病前14天至就医期间的活动轨迹,例如接触过什么人,去过什么地方,主要调查对象是感染源和感染途径尚不明确的病例,相比确诊病例的数量,感染源和感染途径不明确病例数量的增加更令人警惕。随着大数据分析技术的日益成熟,流行病学调查除了依靠患者或疑似患者的口述,很多时候还要依托大数据分析技术的协助。国内外科研人员就基于大数据分析技术,对新型冠状病毒的扩散趋势、传播模型和流行病学特点等做了大量研究和报道。同时也产生了一系列为流行病学调查服务的定制化产品,腾讯、百度等互联网巨头基于GPS数据公开确诊患者的轨迹并发现轨迹重合的人群,加强对感染的评估。三大运营商基于信令数据授权通过用户手机号判断是否有与疫情确认人员接触,或者通过短信查询近期出行轨迹。中国电子科技集团通过接入铁路、飞机及客运大巴的乘客身份证数据查询最近14天内是否与新冠肺炎确诊或疑似病例同乘火车、飞机位于其前后三排以及同乘大巴。相比互联网定位数据和铁路公路数据,信令数据的覆盖人群最广,但受基站范围影响定位误差也比较大。对于流行病的传播源头追溯方面,追溯省内感染病例与疫区输入型病例的关联关系对于流行病学调查尤为重要。
发明内容
有鉴于此,本发明提供了一种流行病传播模型构建方法、终端和存储介质,利用信令数据进行轨迹碰撞,描绘省内感染病例与疫区输入型病例的传播关系、未感染者与确诊病例之间的接触情况,以达到追溯传染源、发现高危人群的目的。
为了实现上述目的,本发明采用如下技术方案:
一种基于信令数据的流行病传播模型构建方法,包括:
基于用户信令数据,得到一定周期内的轨迹数据;
将所述轨迹数据中每条轨迹中的轨迹点的经纬度编码为特定位数的Geohash字符串,将轨迹数据转变为Geohash网格序列;如果确诊病例在一定时间段内,与另一确诊病例或未感染者处于同一Geohash网格,则将该Geohash网格作为一个时空碰撞网格;
筛选出累加停留时长超过一定阈值的所述时空碰撞网格;
根据未感染者与筛选出的不同所述时空碰撞网格的碰撞次数,评估未感染者被传染的风险;
将筛选出的所述时空碰撞网格进行串联,生成传播网络结点集合;
按照最早接触原则和最多覆盖原则遍历所述传播网络结点集合,生成传播森林,将所述传播森林中每棵传播树的根节点作为该传播树各子结点的传染源。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于信令数据的流行病传播模型构建方法,首先提取用户信令轨迹数据并按时间排序,然后计算与确诊病例发生轨迹碰撞的时空网格,通过串联多个时空碰撞网格,一方面评估未感染者的被传染风险,另一方面形成最大生成树用于追溯新增病例的传染源头。本发明基于用户信令轨迹数据,利用大数据分析技术构建流行病传播模型,通过对输入型病例、省内感染病例及未感染者进行特定时空的轨迹碰撞,支撑流行病学调查中的传染源追溯、高危人群发现等关键环节,为防控措施的制定提供重要依据。
进一步的,所述基于用户信令数据,提取一定周期内的轨迹数据,包括:
将用户分为输入型病例、省内感染病例和未感染者;
获取用户的实时信令数据,并基于所述实时信令数据确定用户的实时位置数据;
按照用户的唯一标识对所述实时位置数据进行分组,存储该用户发生位置切换时的时空信息,形成离线轨迹库;
从所述离线轨迹库中提取一定周期内的轨迹数据。
进一步的,所述一定周期设定为流行病的潜伏期。
进一步的,所述轨迹数据的表示形式为:ci=<ui,xi,yi,ti>,其中,ui为用户唯一标识,xi为基站经度,yi为基站维度,ti为时间戳。
进一步的,所述时空碰撞网格以多元组表示,其表示形式为:<ti,gi,si>,其中,ti为碰撞事件发生时间,gi为碰撞事件发生Geohash网格,si为碰撞用户集合。
进一步的,所述根据未感染者与不同所述时空碰撞网格的碰撞次数,评估未感染者被传染的风险,包括:
根据预设规则确定高危区域和高危碰撞事件;所述预设规则为:如果某一时空碰撞网格内至少出现两名确诊病例,则将该Geohash网格升级为高危区域;如果在一定时间段内,未感染者处于所述高危区域,则认为发生一次高危碰撞事件;
确定未感染者在不同高危区域中所发生的高危碰撞事件次数,并按照预先构建的传染风险评估模型对未感染者被传染和风险进行评估。
进一步的,所述预先构建的传染风险评估模型为:
用户K的被传染风险=|{位置|位置∈网格集K}∩{位置|位置∈高危区域集}|;
其中,
Figure BDA0003530766190000031
Figure BDA0003530766190000032
Figure BDA0003530766190000033
网格集K={<时间,位置>|<时间,位置>∈TK},
TK为用户K在一定周期内的Geohash网格序列。
所述将筛选出的所述时空碰撞网格进行串联,生成传播网络结点集合,包括:
以筛选出的所述时空碰撞网格作为输入,按照碰撞时间从小到大排序,遍历包含输入型病例的时空碰撞网格集合,生成输入型病例的直接碰撞关系对;
遍历不包含输入型病例的时空碰撞网格集合,补全所述直接碰撞关系对,串联补全后的所有所述直接碰撞关系对,形成所述传播网络结点集合。
本发明还提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行上述所述的基于信令数据的流行病传播模型构建方法的步骤。
本发明还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述所述的基于信令数据的流行病传播模型构建方法的步骤。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的基于信令数据的流行病传播模型构建方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例公开了一种基于信令数据的流行病传播模型构建方法,包括以下步骤:
S1、基于用户信令数据,得到一定周期内的轨迹数据;
S2、将轨迹数据中每条轨迹中的轨迹点的经纬度编码为特定位数的Geohash字符串,将轨迹数据转变为Geohash网格序列;如果确诊病例在一定时间段内,与另一确诊病例或未感染者处于同一Geohash网格,则将该Geohash网格作为一个时空碰撞网格;
S3、筛选出累加停留时长超过一定阈值的时空碰撞网格;
S4、根据未感染者与筛选出的不同时空碰撞网格的碰撞次数,评估未感染者被传染的风险;
S5、将筛选出的时空碰撞网格进行串联,生成传播网络结点集合;
S6、按照最早接触原则和最多覆盖原则遍历传播网络结点集合,生成传播森林,将传播森林中每棵传播树的根节点作为该传播树各子结点的传染源。
下面,对上述各步骤进行进一步说明。
S1、基于用户信令数据,得到一定周期内的轨迹数据。具体为:
将用户分为输入型病例、省内感染病例和未感染者,获取用户的实时信令数据,并基于实时信令数据确定用户的实时位置数据;并对实时接入的位置数据按用户唯一标识分组,只存储该用户发生位置切换时的时空信息,形成离线轨迹库,从中提取一定周期内(可选但不限于该病例确诊前14天)的轨迹数据,每一条轨迹数据可以形式化为ci=<ui,xi,yi,ti>,其中ui为用户唯一标识,xi为基站经度,yi为基站维度,ti为时间戳。
S2、将轨迹数据中每条轨迹中的轨迹点的经纬度编码为特定位数的Geohash字符串,将轨迹数据转变为Geohash网格序列;如果确诊病例在一定时间段内,与另一确诊病例或未感染者处于同一Geohash网格,则将该Geohash网格作为一个时空碰撞网格。具体为:
统一每条用户轨迹中轨迹点的经纬度坐标系,并将经纬度编码为5~7位的Geohash字符串,按Geohash网格汇总经纬度的停留时长,则轨迹数据转变为Geohash网格序列L={g|g∈{geohash(dt,t)},t2≤t≤t1},其中geohash(dt,t)为该设备的全部Geohash网格,t为信令时间,t1和t2为每天任意时间段,dt为在t时刻处于该Geohash网格的停留时长。
如果确诊病例在一定时间段内,与另一确诊病例或未感染者处于同一Geohash网格,则发生一次碰撞事件,该网格定义为时空碰撞网格,形式化为多元组<ti,gi,si>,其中ti为碰撞事件发生时间,gi为发生碰撞事件的Geohash网格,si为碰撞用户集合.
S3、筛选出累加停留时长超过一定阈值的时空碰撞网格。具体为:
对时空碰撞网格的停留时长进行累加,当用户离开某一网格并在一定时间内再次返回该网格则继续累加停留时长,最终输出停留时长超过一定阈值的时空碰撞网格
S4、根据未感染者与筛选出的不同时空碰撞网格的碰撞次数,评估未感染者被传染的风险。具体为:
根据预设规则确定高危区域和高危碰撞事件;预设规则为:如果某一时空碰撞网格内至少出现两名确诊病例,则将该Geohash网格升级为高危区域;如果在一定时间段内,未感染者处于高危区域,则认为发生一次高危碰撞事件;
确定未感染者在不同高危区域中所发生的高危碰撞事件次数,并按照预先构建的传染风险评估模型对未感染者被传染和风险进行评估。
其中,预先构建的传染风险评估模型为:
用户K的被传染风险=|{位置|位置∈网格集K}∩{位置|位置∈高危区域集}|;
其中,
Figure BDA0003530766190000061
Figure BDA0003530766190000062
网格集K={<时间,位置>|<时间,位置>∈TK},
TK为用户K在一定周期内的Geohash网格序列。
S5、将筛选出的时空碰撞网格进行串联,生成传播网络结点集合。具体为:
以筛选出的过滤停留时长后的时空碰撞网格作为输入,按照碰撞时间从小到大排序,遍历包含输入型病例的时空碰撞网格集合,生成输入型病例的直接碰撞关系对;
遍历不包含输入型病例的时空碰撞网格集合,补全直接碰撞关系对,串联补全后的所有直接碰撞关系对,形成传播网络结点集合。
S6、按照最早接触原则和最多覆盖原则遍历传播网络结点集合,生成传播森林,将传播森林中每棵传播树的根节点作为该传播树各子结点的传染源。
其中,最多覆盖为尽可能覆盖全部确诊病例的传播关系,最早接触原则以传播序列为<ni-1,ti-1>→<ni,ti>→<ni+1,ti+1>为例,应满足ti>ti-1、ti+1>ti,且ti-1为ni-1与ni的最早接触时间,ti为ni与ni+1的最早接触时间,其中ni-1、ni、ni+1为确诊病例唯一标识,ti-1、ti、ti+1为传染时间。
下面,结合具体实例对上述各步骤进行进一步说明。
S1、将用户分为输入型病例imported_case、省内感染病例native_case和未感染者user,并对实时接入的位置数据按用户唯一标识分组,只存储该用户发生位置切换时的时空信息,形成离线轨迹库,从中提取一定周期内的轨迹数据,至少包含用户唯一标识、经度、纬度、时间,设备轨迹数据示例如表1所示。
表1设备轨迹数据示例
用户唯一标识 经度 纬度 时间
imported_case1 lon1 lat1 time1
imported_case2 lon4 lat4 time4
native_case1 lon1 lat1 time1
native_case1 lon2 lat2 time2
native_case1 lon5 lat5 time5
native_case2 lon2 lat2 time2
native_case2 lon3 lat3 time3
native_case3 lon3 lat3 time3
native_case3 lon5 lat5 time5
native_case4 lon4 lat4 time4
user1 lon2 lat2 time2
user2 lon2 lat2 time2
user2 lon3 lat3 time3
user3 lon4 lat4 time4
S2、统一每条设备轨迹中轨迹点的经纬度坐标系,并将经纬度编码为6位Geohash字符串,按Geohash网格汇总经纬度的停留时长,则轨迹数据转变为Geohash网格序列,记为L={g|g∈{geohash(dt,t)},t2≤t≤t1},其中geohash(dt,t)为该设备的全部Geohash网格,t为信令时间,t1和t2为每天任意时刻,dt为在t时刻处于该Geohash网格的停留时长,Geohash网格化之后的用户轨迹数据示例如表2所示。
表2设备Geohash网格轨迹示例
用户唯一标识 Geohash网格 时间 停留时长
imported_case1 geohash1 time1 duration1
imported_case2 geohash4 time4 duration2
native_case1 geohash1 time1 duration3
native_case1 geohash2 time2 duration4
native_case1 geohash5 time5 duration5
native_case2 geohash2 time2 duration6
native_case2 geohash3 time3 duration7
native_case3 geohash3 time3 duration8
native_case3 geohash5 time5 duration9
native_case4 geohash4 time4 duration10
user1 geohash2 time2 duration11
user2 geohash2 time2 duration12
user2 geohash3 time3 duration13
user3 geohash4 time4 duration14
如果确诊病例在1分钟内,与另一确诊病例或未感染者处于同一Geohash网格,则发生一次碰撞事件,该网格定义为时空碰撞网格,形式化为多元组<ti,gi,si>,其中ti为碰撞事件发生时间,gi为发生碰撞事件的Geohash网格,si为碰撞用户集合。时空碰撞网格如表3所示。
表3时空碰撞网格
Figure BDA0003530766190000081
Figure BDA0003530766190000091
S3、筛选出累加停留时长超过一定阈值的时空碰撞网格。
以表1中的imported_case1为例,Geohash网格轨迹的生成方法如下:
S31、将表1中imported_case1的轨迹点按时间从小到大排序;
S32、遍历imported_case1排序后轨迹点,只保留出现在不同Geohash网格的时空信息,当连续出现在同一Geohash网格时,时间t为该网格首次出现时间;
S33、网格停留时长d为S22中相邻次序网格的出现时间差,例如表2中duration2=time2-time1;
S34、对Geohash网格的停留时长进行累加,当用户离开某一网格并在30秒内再次返回该网格则继续累加停留时长,最终输出停留时长超过5分钟的Geohash网格。
S4、如果某一时空碰撞网格至少出现两名确诊病例,则该Geohash网格升级为高危区域,当时空碰撞网格中的未感染者处于高危区域即发生了一次高危碰撞,最终以不同高危区域的高危碰撞次数评估未感染者被传染的风险,形式化表述为:
用户K的被传染风险=|{位置|位置∈网格集K}∩{位置|位置∈高危区域集}|;
其中,
Figure BDA0003530766190000092
Figure BDA0003530766190000093
网格集K={<时间,位置>|<时间,位置>∈TK},
TK为用户K在一定周期内的Geohash网格序列。
用户被传染风险如表4所示:
表4用户被传染风险示例
Figure BDA0003530766190000094
Figure BDA0003530766190000101
S5、以过滤停留时长后的时空碰撞网格作为输入,按碰撞时间从小到大排序,遍历包含输入型病例的时空碰撞网格集合,生成输入型病例的直接碰撞关系对;输入型病例直接碰撞关系对示例如表6所示。
表6输入型病例直接碰撞关系对
Geohash网格 碰撞时间 输入型病例直接碰撞关系对
geohash1 time1 imported_case1,native_case1
geohash4 time4 imported_case2,native_case4
遍历不包含输入型病例的时空碰撞网格集合,补全直接碰撞关系对,串联所有直接碰撞关系对形成传播网络结点集合;补全碰撞关系对和传播网络结点集合分别如表7和表8所示。
表7补全碰撞关系对
Geohash网格 碰撞时间 碰撞关系对
geohash1 time1 imported_case1,native_case1
geohash4 time4 imported_case2,native_case4
geohash2 time2 native_case1,native_case2
geohash3 time3 native_case2,native_case3
geohash5 time5 native_case1,native_case3
表8传播网络结点集合
传播网络结点集合
imported_case1→native_case1→native_case3→native_case2
imported_case1→native_case1→native_case2→native_case3
imported_case2→native_case4
S6、遵循最早接触原则和最多覆盖原则遍历传播网络结点集合生成传播森林,传播森林中每棵传播树的根结点即该传播树各子结点的传染源,其中最多覆盖为尽可能覆盖全部确诊病例的传播关系,最早接触原则以传播序列为<ni-1,ti-1>→<ni,ti>→<ni+1,ti+1>为例,应满足ti>ti-1、ti+1>ti,且ti-1为ni-1与ni的最早接触时间,ti为ni与ni+1的最早接触时间,其中ni-1、ni、ni+1为确诊病例唯一标识,ti-1、ti、ti+1为传染时间。传播森林如表9所示。
表9传播森林
传播森林
imported_case1→native_case1→native_case2→native_case3
imported_case2→native_case4
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于信令数据的流行病传播模型构建方法,其特征在于,包括:
基于用户信令数据,得到一定周期内的轨迹数据;
将所述轨迹数据中每条轨迹中的轨迹点的经纬度编码为特定位数的Geohash字符串,将轨迹数据转变为Geohash网格序列;如果确诊病例在一定时间段内,与另一确诊病例或未感染者处于同一Geohash网格,则将该Geohash网格作为一个时空碰撞网格;
筛选出累加停留时长超过一定阈值的所述时空碰撞网格;
根据未感染者与筛选出的不同所述时空碰撞网格的碰撞次数,评估未感染者被传染的风险;
将筛选出的所述时空碰撞网格进行串联,生成传播网络结点集合;
按照最早接触原则和最多覆盖原则遍历所述传播网络结点集合,生成传播森林,将所述传播森林中每棵传播树的根节点作为该传播树各子结点的传染源。
2.根据权利要求1所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述基于用户信令数据,提取一定周期内的轨迹数据,包括:
将用户分为输入型病例、省内感染病例和未感染者;
获取用户的实时信令数据,并基于所述实时信令数据确定用户的实时位置数据;
按照用户的唯一标识对所述实时位置数据进行分组,存储该用户发生位置切换时的时空信息,形成离线轨迹库;
从所述离线轨迹库中提取一定周期内的轨迹数据。
3.根据权利要求2所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述一定周期设定为流行病的潜伏期。
4.根据权利要求2所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述轨迹数据的表示形式为:ci=<ui,xi,yi,ti>,其中,ui为用户唯一标识,xi为基站经度,yi为基站维度,ti为时间戳。
5.根据权利要求1所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述时空碰撞网格以多元组表示,其表示形式为:<ti,gi,si>,其中,ti为碰撞事件发生时间,gi为碰撞事件发生Geohash网格,si为碰撞用户集合。
6.根据权利要求1所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述根据未感染者与不同所述时空碰撞网格的碰撞次数,评估未感染者被传染的风险,包括:
根据预设规则确定高危区域和高危碰撞事件;所述预设规则为:如果某一时空碰撞网格内至少出现两名确诊病例,则将该Geohash网格升级为高危区域;如果在一定时间段内,未感染者处于所述高危区域,则认为发生一次高危碰撞事件;
确定未感染者在不同高危区域中所发生的高危碰撞事件次数,并按照预先构建的传染风险评估模型对未感染者被传染和风险进行评估。
7.根据权利要求6所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述预先构建的传染风险评估模型为:
用户K的被传染风险=|{位置|位置∈网格集K}∩{位置|位置∈高危区域集}|;
其中,
Figure FDA0003530766180000021
Figure FDA0003530766180000022
Figure FDA0003530766180000023
网格集K={<时间,位置>|<时间,位置>∈TK},
TK为用户K在一定周期内的Geohash网格序列。
8.根据权利要求1所述的一种基于信令数据的流行病传播模型构建方法,其特征在于,所述将筛选出的所述时空碰撞网格进行串联,生成传播网络结点集合,包括:
以筛选出的所述时空碰撞网格作为输入,按照碰撞时间从小到大排序,遍历包含输入型病例的时空碰撞网格集合,生成输入型病例的直接碰撞关系对;
遍历不包含输入型病例的时空碰撞网格集合,补全所述直接碰撞关系对,串联补全后的所有所述直接碰撞关系对,形成所述传播网络结点集合。
9.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时,执行如权利要求1-8任一项所述基于信令数据的流行病传播模型构建方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行如权利要求1-8任一项所述基于信令数据的流行病传播模型构建方法的步骤。
CN202210204156.6A 2022-03-03 2022-03-03 流行病传播模型构建方法、终端和存储介质 Pending CN114639487A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210204156.6A CN114639487A (zh) 2022-03-03 2022-03-03 流行病传播模型构建方法、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210204156.6A CN114639487A (zh) 2022-03-03 2022-03-03 流行病传播模型构建方法、终端和存储介质

Publications (1)

Publication Number Publication Date
CN114639487A true CN114639487A (zh) 2022-06-17

Family

ID=81948104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210204156.6A Pending CN114639487A (zh) 2022-03-03 2022-03-03 流行病传播模型构建方法、终端和存储介质

Country Status (1)

Country Link
CN (1) CN114639487A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115116622A (zh) * 2022-07-25 2022-09-27 深圳市腾云数据系统有限公司 一种传染病溯源分析系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115116622A (zh) * 2022-07-25 2022-09-27 深圳市腾云数据系统有限公司 一种传染病溯源分析系统及方法

Similar Documents

Publication Publication Date Title
CN113450923B (zh) 大规模轨迹数据模拟流感时空传播过程的方法及系统
Di Francescomarino et al. Clustering-based predictive process monitoring
CN106657410B (zh) 基于用户访问序列的异常行为检测方法
Ioannidis et al. Semi-blind inference of topologies and dynamical processes over dynamic graphs
Comito How COVID-19 information spread in US? The role of Twitter as early indicator of epidemics
Rodriguez et al. Patent clustering and outlier ranking methodologies for attributed patent citation networks for technology opportunity discovery
CN106127590A (zh) 一种基于节点影响力的信息态势感知及传播管控模型
CN107292751B (zh) 一种时序网络中节点重要性的挖掘方法和装置
CN112365171A (zh) 基于知识图谱的风险预测方法、装置、设备及存储介质
Cao et al. Analysis of spatiotemporal characteristics of pandemic SARS spread in mainland China
CN114639487A (zh) 流行病传播模型构建方法、终端和存储介质
Brattig Correia et al. Contact networks have small metric backbones that maintain community structure and are primary transmission subgraphs
Fränti et al. Averaging GPS segments competition 2019
Bao et al. Estimating the sizes of populations at risk of HIV infection from multiple data sources using a Bayesian hierarchical model
CN102779126B (zh) 基于博弈理论的互联网虚拟空间用户可信度评价方法
Canzani et al. Insights from Modeling Epidemics of Infectious Diseases-A Literature Review.
CN109472115B (zh) 基于地理信息的大规模复杂网络建模方法及装置
CN117542540A (zh) 传染病风险预测方法、装置、电子设备及存储介质
Rodilitz et al. Snapshot models of undocumented immigration
Wu et al. Markov-modulated Hawkes processes for modeling sporadic and bursty event occurrences in social interactions
White et al. Agent-based simulations using genetic algorithm calibration: A children’s services application
Kumar et al. Predictive analysis of novel coronavirus using machine learning model-a graph mining approach
Li et al. Can multiple social ties help improve human location prediction?
CN113822188A (zh) 一种时间因果诱导的斗殴行为的识别方法
Ding et al. Contagion Processes on Time‐Varying Networks with Homophily‐Driven Group Interactions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination