CN113470835B - 传染病的传播路径确定方法、装置、存储介质与电子设备 - Google Patents

传染病的传播路径确定方法、装置、存储介质与电子设备 Download PDF

Info

Publication number
CN113470835B
CN113470835B CN202110827266.3A CN202110827266A CN113470835B CN 113470835 B CN113470835 B CN 113470835B CN 202110827266 A CN202110827266 A CN 202110827266A CN 113470835 B CN113470835 B CN 113470835B
Authority
CN
China
Prior art keywords
patients
infection
determining
edge
graph model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110827266.3A
Other languages
English (en)
Other versions
CN113470835A (zh
Inventor
焦晓康
李林峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN202110827266.3A priority Critical patent/CN113470835B/zh
Publication of CN113470835A publication Critical patent/CN113470835A/zh
Application granted granted Critical
Publication of CN113470835B publication Critical patent/CN113470835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Abstract

本公开提供了一种传染病的传播路径确定方法、装置、存储介质与电子设备,涉及数据处理技术领域。该方法包括:获取多位患者的防疫信息以及多位患者之间的关系;根据多位患者的防疫信息、多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;若是,则将具有潜在传染关系的每一位患者形成一个节点,根据患者之间的潜在传染关系形成节点之间的边,以构建图模型;根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定两位患者所对应的两个节点之间的边的权重;基于边的权重对图模型进行优化,以通过优化后的图模型确定传播路径。本公开提供了自动化确定传播路径的方案,提高传播路径溯源的准确性。

Description

传染病的传播路径确定方法、装置、存储介质与电子设备
技术领域
本公开涉及数据处理技术领域,尤其涉及一种传染病的传播路径确定方法、传染病的传播路径确定装置、计算机可读存储介质与电子设备。
背景技术
在传染病传播事件中,确定传播路径具有重大的意义。例如,在呼吸道传染病毒造成的传播事件中,追溯病毒传播的路径,能够明确传染来源和潜在风险,以便于实施针对性的管控措施,防止传染病的进一步传播。
发明内容
本公开提供了一种传染病的传播路径确定方法、传染病的传播路径确定装置、计算机可读存储介质与电子设备,进而至少在一定程度上提高传染病传播溯源的准确性,并降低人力与时间成本。
根据本公开的第一方面,提供一种传染病的传播路径确定方法,包括:获取多位患者的防疫信息以及所述多位患者之间的关系;根据所述多位患者的防疫信息、所述多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;若是,则将具有潜在传染关系的每一位患者形成一个节点,根据所述患者之间的潜在传染关系形成所述节点之间的边,以构建图模型;根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重;基于所述边的权重对所述图模型进行优化,以通过优化后的所述图模型确定传播路径。
可选的,所述防疫信息包括:患者的感染时间、传播时间区间、症状信息;所述患者之间的关系包括:接触关系。
可选的,所述根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重,包括:根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系,确定所述两位患者所对应的两个节点之间的边的权重;或者,根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系,确定所述两位患者所对应的两个节点之间的边的权重;或者,根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系、所述传染者的症状信息,确定所述两位患者所对应的两个节点之间的边的权重。
可选的,所述根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系、所述传染者的症状信息,确定所述两位患者所对应的两个节点之间的边的权重,包括:根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子;根据所述被传染者与所述传染者的接触关系确定第二风险因子;根据所述传染者的症状信息确定第三风险因子;通过所述第一风险因子、第二风险因子、第三风险因子,确定所述两位患者所对应的两个节点之间的边的权重。
可选的,所述根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子,包括:确定所述被传染者的感染时间在所述传染者的传播时间区间中所处的子区间,并根据所述子区间对应的风险值确定所述第一风险因子。
可选的,所述方法还包括:获取历史传播事件中的传染者在其传播时间区间的各子区间内的传染数据;统计所述各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值。
可选的,所述统计所述各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值,包括:统计每个子区间内的被传染者数量与传染者数量之比,得到每个子区间对应的初始风险值;基于先验约束条件对所述初始风险值进行迭代调整,使调整后的风险值满足所述先验约束条件,以得到所述风险值。
可选的,所述根据所述被传染者与所述传染者的接触关系确定第二风险因子,包括:确定所述被传染者与所述传染者的接触关系类别,并根据所述接触关系类别对应的风险值确定所述第二风险因子。
可选的,所述方法还包括:获取历史传播事件中不同接触关系类别下的单次接触感染率、平均接触指数;通过对不同接触关系类别下的单次接触感染率、平均接触指数进行对比,得到不同接触关系类别间的相对风险值;对不同接触关系类别间的相对风险值进行标准化处理,得到每种接触关系类别对应的风险值。
可选的,所述根据所述传染者的症状信息确定第三风险因子,包括:当根据所述传染者的症状信息确定所述传染者为有症状患者时,确定所述第三风险因子为第一预设值;当根据所述传染者的症状信息确定所述传染者为无症状患者时,确定所述第三风险因子为第二预设值。
可选的,所述图模型的边为有向边,所述有向边由传染者对应的节点指向被传染者对应的节点;所述基于所述边的权重对所述图模型进行优化,包括:当检测到所述图模型中存在连接有至少两条入边的节点时,基于所述至少两条入边的权重对所述至少两条入边进行裁剪,以保留其中一条入边。
可选的,所述基于所述至少两条入边的权重对所述至少两条入边进行裁剪,包括:在所述至少两条入边中裁剪掉权重较低的入边;如果存在权重相同的多条入边,则获取其中每条入边对应的第一风险因子,根据所述第一风险因子对所述多条入边进行裁剪;所述第一风险因子根据所述入边对应的具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定。
可选的,所述通过优化后的所述图模型确定传播路径,包括:分别以优化后的图模型的每个节点为起点,在优化后的图模型中遍历所述起点的所有路径;将所遍历的路径中最长的路径确定为所述传播路径。
根据本公开的第二方面,提供一种传染病的传播路径确定装置,包括:信息获取模块,被配置为获取多位患者的防疫信息以及所述多位患者之间的关系;潜在传染关系确定模块,被配置为根据所述多位患者的防疫信息、所述多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;图模型构建模块,被配置为若两位患者之间具有潜在传染关系,则将具有潜在传染关系的每一位患者形成一个节点,根据所述患者之间的潜在传染关系形成所述节点之间的边,以构建图模型;边权重确定模块,被配置为根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重;图模型优化模块,被配置为基于所述边的权重对所述图模型进行优化,以通过优化后的所述图模型确定传播路径。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的传染病的传播路径确定方法及其可能的实现方式。
根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面的传染病的传播路径确定方法及其可能的实现方式。
本公开的技术方案具有以下有益效果:
构建了由患者以及患者间的潜在传染关系所形成的图模型,根据具有潜在传染关系的两位患者中的防疫信息以及患者之间的关系确定图模型的边的权重,进而基于边的权重对图模型进行优化,以保留图模型中的有效连接,便于最终从图模型中确定传播路径。一方面,提供了一种自动化实现传播路径分析的方案,具有较高的处理效率,能够降低人力与时间成本,具有较高的时效性,能够在传染病传播事件中实现快速溯源,便于及时采取防控措施。另一方面,通过对具有潜在传染关系的两位患者中的防疫信息以及患者之间的关系进行解析,确定两个节点之间的边的权重,能够保证该权重的准确性以及基于该权重进行图模型优化的准确性,以保证图模型中连接关系的有效性,从而提高传播路径溯源的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
图1示出本示例性实施方式中一种传染病的传播路径确定方法的流程图;
图2示出本示例性实施方式中一种确定边的权重的流程图;
图3示出本示例性实施方式中一种确定子区间对应的风险值的流程图;
图4示出本示例性实施方式中另一种确定子区间对应的风险值的流程图;
图5示出本示例性实施方式中一种确定接触关系类别对应的风险值的流程图;
图6示出本示例性实施方式中图模型的局部示意图;
图7示出本示例性实施方式中一种图模型剪枝的流程图;
图8示出本示例性实施方式中一种确定传播路径的流程图;
图9示出本示例性实施方式中另一种传染病的传播路径确定方法的流程图;
图10示出本示例性实施方式中一种传染病的传播路径确定装置的结构示意图;
图11示出本示例性实施方式中一种电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
目前,对传染病传播路径的确定大多依赖于人工排查,例如调查相关人员的活动轨迹,根据不同人员之间的活动交集来寻找与排查潜在的传播源,最终确定传播路径。然而,该方法需要耗费大量的人力与时间成本,且难以保证排查结果的准确性。
鉴于上述问题,本公开的示例性实施方式提供一种传染病的传播路径确定方法。图1示出了该传播路径确定方法的示例性流程,可以包括:
步骤S110,获取多位患者的防疫信息以及多位患者之间的关系;
步骤S120,根据上述多位患者的防疫信息、所述多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;
步骤S130,若是,则将具有潜在传染关系的每一位患者形成一个节点,根据患者之间的潜在传染关系形成节点之间的边,以构建图模型;
步骤S140,根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定两位患者所对应的两个节点之间的边的权重;
步骤S150,基于边的权重对图模型进行优化,以通过优化后的图模型确定传播路径。
通过上述方法,构建了由患者以及患者间的潜在传染关系所形成的图模型,根据具有潜在传染关系的两位患者中的防疫信息以及患者之间的关系确定图模型的边的权重,进而基于边的权重对图模型进行优化,以保留图模型中的有效连接,便于最终从图模型中确定传播路径。一方面,提供了一种自动化实现传播路径分析的方案,具有较高的处理效率,能够降低人力与时间成本,具有较高的时效性,能够在传染病传播事件中实现快速溯源,便于及时采取防控措施。另一方面,通过对具有潜在传染关系的两位患者中的防疫信息以及患者之间的关系进行解析,确定两个节点之间的边的权重,能够保证该权重的准确性以及基于该权重进行图模型优化的准确性,以保证图模型中连接关系的有效性,从而提高传播路径溯源的准确性。
下面分别对图1中的每个步骤进行具体说明。
参考图1,在步骤S110中,获取多位患者的防疫信息以及多位患者之间的关系。
其中,患者的防疫信息属于患者个体信息,可以包括:患者的感染时间、传播时间区间、症状信息等。患者的感染时间理论上是一个时间点,但是在得到明确的传播路径前,难以确定患者是在何时、何地感染,即难以确定该时间点。因此,可以通过“感染时间=发病时间-潜伏期”,推算出感染时间的大致区间。传播时间区间指的是患者具备传染性的时间区间,是从开始具备传染性到不具备传染性(通常为最后一次暴露的时间或自愈的时间)的时间区间。例如,对于某呼吸道传染病毒,患者一般在发病时间的前四天和后五天内具备明显的传染性,这一段时间为患者的传播时间区间。症状信息是指患者感染、发病后的具体症状,例如患者的症状信息可以包括是否为无症状患者。此外,还可以可以获取患者个体信息中的患者基本信息,包括姓名、性别、年龄、职业、证件号等。
患者之间的关系可以包括:接触关系。接触关系具体是指两位患者之间属于下列那种关系:同住,同班,临近同事,共同聚餐,共同出行,交易,面对面接触,同楼层,同楼,同小区,同校,同园区等。此外,接触关系还可以包括两位患者之间的接触时间,可以根据两位患者的活动信息确定。
在一种实施方式中,可以针对一次传播事件进行溯源,将该传播事件称为目标传播事件,获取目标传播事件范围内的相关信息。示例性的,首先,获取该目标传播事件中的相关调查信息,可以是流行病学调查报告等。例如,在某呼吸道传染病毒的传播事件中,发现本土确诊病例后,从当前时间向前推算,获取一定时间范围内(如28天、一个月等)所有相关人员的调查信息。然后,可以对相关调查信息进行自然语言处理,并对其中的地理位置信息进行标准化,以得到患者的防疫信息以及患者之间的关系信息。
步骤S110中的患者可以包括有症状患者(如轻症状患者、严重症状患者)、无症状患者。在一种实施方式中,步骤S110中的患者可以包括潜在患者,如潜在的感染者、密切接触者等,甚至可以包括上述相关调查信息中涉及到的所有人员。
继续参考图1,在步骤S120中,根据上述多位患者的防疫信息、多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系。
潜在传染关系是指两位患者之间存在可能的传染关系。在确定出传播路径前,无法确定患者之间明确的传染关系。因此,本示例性实施方式先确定患者之间的潜在传染关系,作为后续处理的基础。可以基于上述防疫信息、患者之间的关系以及预设的传染规则来确定潜在传染关系。传染规则是指两位患者之间满足怎样的规则时,判断两位患者存在潜在传染关系。本公开对于传染规则的具体内容不做限定,一般来说,传染规则越严苛,满足规则的情况越少,所检测出的潜在传染关系的范围越小,后续进一步的排查处理所需的算力或人力成本越少,但有可能存在漏检的情况;传染关系规则越松弛,满足规则的情况越多,所检测出的潜在传染关系的范围越大,后续进一步的排查处理所需的算力或人力成本越多,但能够较好地避免漏检的情况。因此,可以根据实际需求,平衡算力、人力成本与检测范围两方面因素,确定合适的传染规则,例如传播情况较严重时,倾向于更大的检测范围,可以设置较松弛的传染规则。示例性的,传染规则如下所示:
对于患者A与患者B,如果同时满足以下三个条件,则存在由患者A 到患者B的潜在传染关系:
①患者A与患者B的接触时间处于患者A的传播时间区间内,表示为:tcon(A/B)∈Tspr(A)。其中,tcon(A/B)表示患者A与患者B的接触时间,Tspr(A)表示患者A的传播时间区间。示例性的,对于某呼吸道传染病毒,患者一般在发病时间的前四天和后五天内具备明显的传染性,以 t0(A)表示患者A的发病时间,则有:Tspr(A)=[t0(A)-4,t0(A)+5]。
在一些情况下,患者可能持续具备传染性,可以将患者的核酸检测阳性时间作为患者的最后一次暴露时间(一般在核酸检测阳性后会对患者进行隔离),如以tnat(A)表示患者A的核酸检测阳性时间,则患者A的传播时间区间可以是:Tspr(A)=[t0(A)-4,tnat(A)]。该传播时间区间包括 [t0(A)+5,tnat(A)],即患者A在发病5天后的一段时间内也具有一定的传染性。
对于上述呼吸道传染病毒的抗体阳性患者,其传播时间区间可以是感染时间后的3天到10天。
如果患者A与患者B存在多个接触时间,则其中的一个接触时间位于患者A的传播时间区间内时,满足条件①。
②患者B的感染时间处于患者A的传播时间区间内。通过“感染时间=发病时间-潜伏期”,推算出感染时间的大致区间。举例如下:
对于上述呼吸道传染病毒的有症状患者,感染时间约为发病时间的3- 14天前,表示为:Tinf(B)=[t0(B)-14,t0(B)-3]。其中,Tinf(B)表示患者B的感染时间,为一个区间。
对于上述呼吸道传染病毒的无症状患者,感染时间约为核酸检测时间阳性的3-14天前,表示为:Tinf(B)=[tnat(B)-14,tnat(B)-3]。
对于上述呼吸道传染病毒的核酸检测阴性、抗体阳性的患者,具体分为以下三种情况:
当患者IgG抗体阴性,IgM抗体阳性时,患者的感染时间为抗体阳性时间的14天前,表示为:Tinf(B)=tig(B)-14。其中,tig(B)表示患者B 的抗体阳性时间。
当患者IgG抗体阳性,IgM抗体阴阳时,患者的感染时间为抗体阳性时间的21天前,表示为:Tinf(B)=tig(B)-21。
当患者IgG抗体阳性,IgM抗体阴性时,患者的感染时间为抗体阳性时间的28前,表示为:Tinf(B)=tig(B)-28。
患者B的感染时间处于患者A的传播时间区间内,表示为:
Figure RE-GDA0003247767330000091
Figure RE-GDA0003247767330000092
由于Tinf(B)大多数情况下为一个区间,当该区间与患者A的传播时间区间的交集不为空时,说明患者B的感染与患者A的传播在时间上有交集,满足条件②。
③患者A的发病时间早于患者B的发病时间,表示为:t0(A)<t0(B)。如果反过来,则患者A无法向患者B传染病毒。
通过上述条件①~③,可以确定存在由患者A到患者B的潜在传染关系。
继续参考图1,在步骤S130中,若是,则将具有潜在传染关系的每一位患者形成一个节点,根据患者之间的潜在传染关系形成节点之间的边,以构建图模型。
判断潜在传染关系后,可以将具有潜在传染关系的每一位患者形成为图模型的一个节点,无论该患者在潜在传染关系中是传染还是被传染。例如,可以将具有潜在传染关系的每一位患者的姓名作为患者的标识符,生成每个标识符对应的节点。
在生成节点后,可以根据潜在传染关系在不同患者所对应的节点之间形成边。例如通过上述条件①~③确定存在由患者A到患者B的潜在传染关系后,可以生成节点A与节点B,以及在节点A与节点B之间生成一条边。在一种实施方式中,所生成的边可以是有向边,由节点A指向节点 B,记为边A→B,表示A向B传染。
本示例性实施方式可以遍历每两位患者,判定是否存在潜在传染关系,若是,则将两位患者生成对应的两个节点,并在两个节点之间生成边。由此,在所有的节点之间形成了大量的边,从而构建了图模型。在一种实施方式中,所生成的边均为有向边,则所构建的图模型为有向图。
继续参考图1,在步骤S140中,根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定该两位患者所对应的两个节点之间的边的权重。
其中,边的权重可视为对两位患者之间的传染概率进行定量表示,边的权重越高,表示两位患者之间的传染概率越高。一般的,两位患者的防疫信息相关性越高,两位患者之间的关系越紧密,则两位患者对应的两个节点之间的边的权重越高。
在一种实施方式中,上述根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定该两位患者所对应的两个节点之间的边的权重,可以通过以下三种方式实现:
方式一:根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系,确定该两位患者所对应的两个节点之间的边的权重。
在具有潜在传染关系的两位患者中,一般将发病时间较早的那一位作为传染者,另一位作为被传染者(严格来说,应当是潜在传染者与潜在被传染者,本文为便于表述,对此不做特别区分)。当两个节点之间的边为有向边时,将有向边起点一端的节点对应的患者作为传染者,终点一端的节点对应的患者作为被传染者。
本示例性实施方式中,根据被传染者的感染时间与传染者的传播时间区间的关系,确定边的权重。被传染者的感染时间与传染者的传播时间区间,已经在上述条件①~③部分进行了说明。需要注意的是,被传染者的感染时间可以采用上述条件②部分的表达式所计算的感染时间,如Tinf(B),该感染时间是根据被传染者自身的感染信息(如发病时间、核酸检测阳性时间、抗体阳性时间等)所计算的感染时间。考虑到在特定两位患者的潜在传染关系中,被传染者的感染时间与传染者有关系,由此可以对被传染者的感染时间做进一步限定,例如,患者B被患者A传染病毒而感染的时间,应当处于与患者A接触的时间内,表示为:Tinf(A→B)=Tinf(B)∩ tcon(A/B)。其中,Tinf(A→B)表示由患者A传染而引起的患者B的感染时间。
在传播时间区间内的不同时间,传染性一般是不同的。例如,在患者 A的传播时间区间内,越接近患者A的发病时间,患者A的传染性越强。将患者A的传播时间区间划分为多个子区间,对每个子区间的传染性分别进行定量表示,如可以记为每个子区间对应的风险值;进而,可以确定 Tinf(A→B)在Tspr(A)中具体处于哪个子区间,根据该子区间对应的风险值确定边A→B的权重。
方式二:根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、被传染者与传染者的接触关系,确定该两位患者所对应的两个节点之间的边的权重。
也就是说,相比于方式一,可以增加被传染者与传染者的接触关系这一因素,以纳入到计算边权重的考量范围内。一般的,被传染者与传染者的接触关系越亲密,传染概率越高。例如,可以对不同类别的接触关系预先确定对应的风险值,如上述同住,同班,临近同事,共同聚餐,共同出行,交易,同楼层,同楼,同小区,同校,同园区等不同类别的接触关系具有不同的风险值,其中同住关系的密切程度最高,风险值也最高。获取被传染者与传染者的接触关系,根据其所属的类别,确定对应的风险值。
进而,可以将根据感染时间与传播时间区间的关系所确定的风险值,与根据接触关系确定的风险值进行综合,得到边的权重。
方式三:根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、被传染者与传染者的接触关系、传染者的症状信息,确定该两位患者所对应的两个节点之间的边的权重。
也就是说,相比于方式二,可以进一步增加传染者的症状信息这一因素。一般的,传染者的症状越严重,传染概率越高。例如,可以将症状信息按照严重程度来分级,不同级别对应不同的风险值。获取传染者的症状信息后,根据其所属的级别,确定对应的风险值。
在方式三中,同时考虑三种因素,包括:两位患者中被传染者的感染时间与传染者的传播时间区间的关系(简称为时间因素),被传染者与传染者的接触关系(简称为接触关系因素),传染者的症状信息(简称为症状因素)。可以将三种因素分别定量表示,如表征为风险值,再综合三种因素的定量结果,确定边的权重。相对来说,考虑的因素越充分,得到的边的权重越准确。
在一种实施方式中,参考图2所示,上述根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、被传染者与传染者的接触关系、传染者的症状信息,确定该两位患者所对应的两个节点之间的边的权重,可以包括:
步骤S210,根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子;
步骤S220,根据被传染者与传染者的接触关系确定第二风险因子;
步骤S230,根据传染者的症状信息确定第三风险因子;
步骤S240,通过第一风险因子、第二风险因子、第三风险因子,确定两位患者所对应的两个节点之间的边的权重。
其中,对由时间因素所确定的传染概率用第一风险因子定量表示,对由接触关系因素所确定的传染概率用第二风险因子定量表示,对由症状因素所确定的传染概率用第三风险因子定量表示。
下面分别对如何确定第一风险因子、第二风险因子、第三风险因子进行说明。
第一风险因子
在一种实施方式中,步骤S210可以包括:
确定被传染者的感染时间在传染者的传播时间区间中所处的子区间,并根据该子区间对应的风险值确定第一风险因子。
举例来说,将呼吸道传染病毒患者A的传播时间区间划分为3个子区间,分别为发病前4天(t0(A)-4,t0(A))、发病后5天(t0(A),t0(A)+5)、其他时间段(t0(A)+5,end)(end表示患者A传播时间区间的结束时间),在这3个子区间内,患者A传染的风险值是不同的,如下所示:
Figure RE-GDA0003247767330000131
其中,r1为第一风险因子。a、b、c分别为三个子区间对应的风险值,是对传染的风险程度的量化值,可以根据相关的医学数据统计结果确定a、 b、c的值。示例性的,对于呼吸道传染病毒的传播,根据临床实验结果,有b>a>c的关系。在公式(1)中,将子区间对应的风险值直接作为第一风险因子,例如,确定Tinf(A→B)处于上述哪个子区间内,如处于 (t0(A),t0(A)+5)内,则将对应的风险值b作为第一风险因子r1。在一种实施方式中,还可以在风险值的基础上做进一步的处理,例如进行标准化处理或者通过特定的第一系数进行修正等,得到第一风险因子。
在一种实施方式中,参考图3所示,可以通过以下步骤S310和S320 来确定每个子区间对应的风险值:
步骤S310,获取历史传播事件中的传染者在其传播时间区间的各子区间内的传染数据;
步骤S320,统计上述各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值。
其中,历史传播事件与本次处理的目标传播事件应当为同一传染病,例如均为同一呼吸道传染病毒毒株引起的传播事件,这样历史传播事件中的传染数据对于本次传播事件更具有参考性。
在将传播时间区间划分子区间时,可以根据所获取的传染数据的数量、有效性、丰富性等确定划分标准,一般的,传染数据数量越多、有效性与丰富性越高,有利于实现越精确的传染数据细粒度分析,可以将子区间划分地越精细。示例性的,在呼吸道传染病毒的传播事件中,具有明确发病时间与传染关系的数据较为有限,难以非常精细地推算传播时间区间中每一天的传染概率,因此采用上述三个子区间这样相对粗粒度的划分方式。
在划分子区间后,统计每个子区间内的传染数据,可以采用一种或多种表征传染概率的指标,包括但不限于:被传染者数量,被传染者数量与传染者数量之比,被传染者数量与子区间的时长(天数)之比,被传染者数量与传染者数量及子区间的时长(天数)之比。对不同子区间的指标值的分布特征进行分析,例如将不同子区间的指标值拟合为基于时间分布的函数关系,根据该函数关系确定每个子区间对应的风险值。
在一种实施方式中,参考图4所示,步骤S320可以通过以下步骤实现:
步骤S410,统计每个子区间内的被传染者数量与传染者数量之比,得到每个子区间对应的初始风险值;
步骤S420,基于先验约束条件对初始风险值进行迭代调整,使调整后的风险值满足先验约束条件,以得到风险值。
其中,先验约束条件是指基于先验知识所确定的约束条件。例如,针对上述呼吸道传染病毒传播时间区间中的三个子区间所对应的风险值a、 b、c,参考该呼吸道传染病毒其他毒株的先验知识,一般有b=1.3a=2c的关系。在此基础上,设置一定的容忍度,即a、b、c不需要严格满足b=1.3a=2c,在容忍度区间内满足即可。由此得到先验约束条件为:
Figure RE-GDA0003247767330000141
或者为:
Figure RE-GDA0003247767330000142
其中,tol表示容忍度,可以是经验值,也可以根据实际情况设置。示例性的,本次传播事件中的毒株与上述先验知识中的其他毒株相似性越高, tol值越小。
将上述先验约束条件表示为先验映射的函数关系,则有:
Figure RE-GDA0003247767330000151
其中,R表示风险值;(t0ta3t,te5d)表示一个子区间;sum(Patient(t)) 表示在该子区间内被传染者的数量;sum(Infector(t))表示该子区间内传染者的数量;可见,
Figure RE-GDA0003247767330000152
表示该子区间内被传染者数量与传染者数量之比,可以作为该子区间对应的初始风险值,即a、b、c的初始值;Rule表示先验映射的函数,即不同子区间对应的风险值应当满足tol下的先验约束条件。
当a、b、c不满足先验约束条件时,如不满足上述(2)或(3)时,可以对a、b、c中的一个或多个进行迭代调整。在调整时,可以设置一定的步长,如每次增加或减小10%,通过多次迭代调整,使最终的a、b、c 满足先验约束条件。示例性的,可以固定b的值,当不满足上述(2)时,将a的值增加10%,c的值减小10%,并重复多次调整,直到满足(2)。完成调整后,得到每个子区间对应的风险值。
第二风险因子
在一种实施方式中,步骤S220可以包括:
确定被传染者与传染者的接触关系类别,并根据该接触关系类别对应的风险值确定第二风险因子。
举例来说,可以将两位患者的接触关系划分为不同的类别,包括但不限于:同住,同班,临近同事,共同聚餐,共同出行,交易,同楼层,同楼,同小区,同校,同园区等。不同的接触关系类别具有不同的密切程度,因而也对应于不同的风险值,如同住关系的密切程度最高,风险值也最高。预先对每种接触关系类别的风险值进行定量表示,进而可以根据本次传播事件中每一对被传染者与传染者的接触关系类别,确定对应的风险值,进而确定第二风险因子。可以将所确定的接触关系类别对应的风险值直接作为第二风险因子,也可以在风险值的基础上做进一步的处理,例如进行标准化处理或者通过特定的第二系数进行修正等,得到第二风险因子。
在一种实施方式中,参考图5所示,可以通过以下步骤S510至S530 来确定每种接触关系类别对应的风险值:
步骤S510,获取历史传播事件中不同接触关系类别下的单次接触感染率、平均接触指数;
步骤S520,通过对不同接触关系类别下的单次接触感染率、平均接触指数进行对比,得到不同接触关系类别间的相对风险值;
步骤S530,对不同接触关系类别间的相对风险值进行标准化处理,得到每种接触关系类别对应的风险值。
其中,单次接触感染率可以是被感染者和感染者单次接触被传染的概率。平均接触指数可以传染者在单位时间内(如每天)传染的平均人数。本示例性实施方式统计每种接触关系类别下的单次接触感染率与平均接触指数,这两个指标均与风险值密切相关。
在一种实施方式中,还可以加入其他与风险值相关的指标,如传染者的传播时间区间的时长。由此,可以将风险值表示如下:
R∝b·k·range (5)
其中,R表示风险值,b表示单次接触感染率,k表示平均接触指数, range表示传播时间区间的时长。公式(5)表示R与b、k、range成正比。以某一种接触关系类别的b、k、range为基准值,通过不同接触关系类别间的对比,计算出相对值,进而对风险值进行量化。举例来说,以同园区关系类别下的b、k、range分别为基准值b0、k0、range0,则可以计算基准风险值如下:
RO=bO·kO·rangeO (6)
比对其他接触关系类别下的b、k、range与b0、k0、range0,例如同楼关系类别下的b=1.2b0,k=1.4k0、range=range0(不同接触关系类别下的传播时间区间的时长相差不大,所以也可以忽略这一指标),则得到同楼关系类别下的相对风险值为:R=1.2bO·1.4kO·rangeO=1.68RO。由此可以得到每种接触关系类别的相对风险值。进而,对相对风险值进行标准化处理,将其转换至0~1数值区间内,得到每种接触关系类别对应的风险值,其可以作为第二风险因子r2。
在一种实施方式中,对于某些接触关系类别,可能难以获取其单次接触感染率与平均接触指数。例如在流行病学调查中按照时空轨迹碰撞挖掘出的接触关系,如某一时刻患者A出地铁站,患者B进地铁站,这类接触关系具有极大的不确定性,因此难以统计单次接触感染率与平均接触指数。对此,可以参考其他接触关系类别对应的风险值,为该接触关系类别设置一个合理的风险值,如上述按照时空轨迹碰撞挖掘出的接触关系类别,其对应的风险值应当显著低于其他接触关系类别对应的风险值。
第三风险因子
在一种实施方式中,可以将传染病的症状量化为不同的症状等级,表示不同的严重程度。由此,根据上述传染者的患者信息确定其症状等级,进而确定对应的第三风险因子,症状等级越高,第三风险因子越大。
在一种实施方式中,可以将传染病的症状与传染相关的症状量化为不同的症状等级,包括但不限于咳嗽、打喷嚏等症状。相应的,可以从上述传染者的患者信息中提取与传染相关的症状,确定症状等级,进而确定对应的第三风险因子。
在一种实施方式中,可以将传染病的症状划分为有症状与无症状。具体地,步骤S230可以包括:
当根据上述传染者的症状信息确定该传染者为有症状患者时,确定第三风险因子为第一预设值;
当根据上述传染者的症状信息确定该传染者为无症状患者时,确定第三风险因子为第二预设值。
其中,第一预设值一般大于第二预设值,表示有症状患者的传染概率高于无症状患者。示例性的,对于上述呼吸道传染病毒,有症状患者对应的第三风险因子r3可以是1,无症状患者对应的第三风险因子r3可以是 0.3。
通过以上方式得到第一风险因子、第二风险因子、第三风险因子后,可以进一步将三个风险因子综合起来,通过加权、相乘等方式计算得到综合性的风险因子,以作为边的权重。如下所示:
w=r1·r2·r3 (7)
其中,w表示边的权重,其可以是三个风险因子的乘积。
在一种实施方式中,同一对患者之间可能存在多种接触关系,按照不同的接触关系可以计算得到不同的边权重,可以选取其中的最大值,作为最终的边权重。
继续参考图1,在步骤S150中,基于边的权重对图模型进行优化,以通过优化后的图模型确定传播路径。
其中,对图模型的优化可以包括对图模型的边进行剪枝或重构。剪枝是指从图模型中裁减掉一部分边,使得图模型中的信息更加精简、有效。例如,可以裁剪掉权重值过低(如低于预设的权重阈值)的边。重构是指恢复一部分边,以避免过度剪枝。
在一种实施方式中,图模型的边均为有向边,由传染者对应的节点指向被传染者对应的节点,即图模型为有向图。基于此,步骤S150可以通过以下方式实现:
当检测到图模型中存在连接有至少两条入边的节点时,基于该至少两条入边的权重对该至少两条入边进行裁剪,以保留其中一条入边。
其中,入边是指向节点的边,相对应的概念为出边,是由节点指出的边。例如,节点A指向节点B的边A→B,是节点A的出边,是节点B的入边。如果图模型中存在连接有至少两条入边的节点,即有至少两条边指向该节点,说明存在传染给该节点的至少两条潜在传播路径,其中只有一条是实际的传播路径,因此通过裁剪以保留概率最高的传播路径。
图6示出了图模型的局部示意图。参考图6举例来说,对于节点C,存在两条入边A→C与B→C,对应两条潜在传播路径A→C与A→B→C。可以对两条入边进行裁剪。
在一种实施方式中,参考图7所示,上述基于至少两条入边的权重对至少两条入边进行裁剪,可以包括:
步骤S710,在上述至少两条入边中裁剪掉权重较低的入边;
步骤S720,如果存在权重相同的多条入边,则获取其中每条入边对应的第一风险因子,根据第一风险因子对该多条入边进行裁剪。
其中,第一风险因子可以根据入边对应的具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定,具体参考上述第一风险因子部分的内容。
举例来说,在图6中,如果边A→C的权重低于边B→C的权重,则裁剪掉边A→C。如果两条边的权重相同,则进一步确定边A→C对应的第一风险因子与边B→C对应的第一风险因子,裁剪掉第一风险因子较小的那条边。如果两条边的权重、第一风险因子均相同,则可以保留该两条边。
在一种实施方式中,传染病的传播路径确定方法还可以包括以下步骤:
如果在对图模型进行优化时裁剪图模型的边,则对被裁剪的边进行保存;
如果优化后的图模型中存在孤立节点,则从被裁减的边中获取该孤立节点的旧边,并将该旧边添加回优化后的图模型中,使该孤立节点通过旧边连接到其他节点。
其中,被裁剪的边可以保存在特定的数组中。例如,在图6中,裁减掉边A→C与边E→F,可以分别保存两条边的标识、权重、所连接的起点与终点等信息。
孤立节点是指未与图模型中的其他节点连接的节点,孤立节点的旧边是指在优化前与孤立节点连接的边。一般的,每位患者都是由于被传染而患病,与其他患者必然存在一定的传染关系。图模型中存在孤立节点,通常是由于过度剪枝导致的。例如,在图6中,裁减掉边A→C与边E→F 后,节点E与其他节点均不相连,成为孤立节点。可以将一些被裁减的边添加回去,以消除图模型中的孤立节点。具体地,可以在所保存的被裁减的边中按照孤立节点的标识进行检索,例如在被裁减的边中过滤出起点或终点为孤立节点的旧边,即与孤立节点具有连接关系的旧边,将其添加回图模型的原位置中。添加旧边,实际上是指根据所保存的旧边的数据,在图模型中重构出旧边。
在一种实施方式中,在获取孤立节点的旧边时,可以从被裁减的边中获取孤立节点的权重最大的旧边,即优先在图模型中重构权重最大的旧边,而并非重构所有的旧边。
通过在图模型中重构旧边以消除孤立节点的方式,可以对过度剪枝的情况进行补偿,进一步提高图模型中信息的全面性。
通过优化后的图模型可以确定传染病的完整传播路径或局部传播路径。例如,可以针对某一患者,从图模型中提取以该患者对应的节点为终点的传播路径,以梳理该患者的感染原因,或者提取以该患者对应的节点为起点的传播路径,以梳理该患者的传播关系。
在一种实施方式中,参考图8所示,上述通过优化后的图模型确定传播路径,可以包括以下步骤:
步骤S810,分别以优化后的图模型的每个节点为起点,在优化后的图模型中遍历该起点的所有路径;
步骤S820,将所遍历的路径中最长的路径确定为传播路径。
举例来说,在图6中,先以节点A为起点,遍历出该起点的所有路径,包括A→B→C→D→F与A→F;再以节点B为起点,遍历出该起点的所有路径;…;直到遍历完最后一个节点,得到图模型中的所有路径,在其中确定最长的路径,即包含节点数量最多的路径,为该图模型中的完整传播路径,该传播路径的起点是本次传播事件的传染源。
本公开对于遍历路径的具体方法不做限定,例如可以采用BFS (Breadth FirstSearch,广度优先)算法,优先搜索较长的路径,也可以采用DFS(Depth First Search,深度优先)算法,优先搜索较短的路径,具体采用哪种算法,可以根据实际需求来决定。
图9示出了传染病的传播路径确定方法的另一种示例性流程,包括:
步骤S901,开始,首先获取流行病学调查报告,可以对其进行自然语言处理,并对其中的地理位置信息进行标准化;
步骤S902,从上述流行病学调查报告的信息中提取患者个体信息,参考表1所示;
步骤S903,从上述流行病学调查报告的信息中患者间关系,参考表1 所示;
表1
Figure RE-GDA0003247767330000201
Figure RE-GDA0003247767330000211
步骤S904,判断每两位患者之间是否存在潜在传染关系,若是,则将其中每一位患者形成一个节点,将存在潜在传染关系的两位患者所对应的两个节点之间形成边,构建图模型。
步骤S905,根据具有潜在传染关系的两位患者中的防疫信息与两位患者的关系,确定图模型中每条边的权重。
步骤S906,基于边的权重进行边的剪枝与重构,以优化图模型。
步骤S907,从图模型中确定传染病的传播路径,结束。
在一种实施方式中,还可以根据图模型中边的权重确定任意两位患者间的传染概率,以便于分析最有可能发生传染的时间,以实现更加准确地传染病溯源。
本公开的示例性实施方式还提供一种传染病的传播路径确定装置。参考图10所示,该传播路径确定装置1000可以包括:
信息获取模块1010,被配置为获取多位患者的防疫信息以及所述多位患者之间的关系;
潜在传染关系确定模块1020,被配置为根据上述多位患者的防疫信息、多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;
图模型构建模块1030,被配置为若两位患者之间具有潜在传染关系,则将具有潜在传染关系的每一位患者形成一个节点,根据患者之间的潜在传染关系形成所述节点之间的边,以构建图模型;
边权重确定模块1040,被配置为根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定两位患者所对应的两个节点之间的边的权重;
图模型优化模块1050,被配置为基于边的权重对图模型进行优化,以通过优化后图模型确定传播路径。
在一种实施方式中,防疫信息包括:患者的感染时间、传播时间区间、症状信息;患者之间的关系包括:接触关系。
在一种实施方式中,边权重确定模块1030,被配置为:
根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系,确定所述两位患者所对应的两个节点之间的边的权重;
或者,根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、被传染者与传染者的接触关系,确定两位患者所对应的两个节点之间的边的权重;
或者,根据具有传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、被传染者与传染者的接触关系、传染者的症状信息,确定两位患者所对应的两个节点之间的边的权重。
在一种实施方式中,边权重确定模块1030包括:
第一风险因子确定子模块,被配置为根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子;
第二风险因子确定子模块,被配置为根据被传染者与传染者的接触关系确定第二风险因子;
第二风险因子确定子模块,被配置为根据传染者的症状信息确定第三风险因子;
边权重确定子模块,被配置为通过第一风险因子、第二风险因子、第三风险因子,确定两位患者所对应的两个节点之间的边的权重。
在一种实施方式中,第一风险因子确定子模块,被配置为:
确定被传染者的感染时间在传染者的传播时间区间中所处的子区间,并根据子区间对应的风险值确定第一风险因子。
在一种实施方式中,第一风险因子确定子模块,海被配置为:
获取历史传播事件中的传染者在其传播时间区间的各子区间内的传染数据;
统计各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值。
在一种实施方式中,第一风险因子确定子模块,被配置为:
统计每个子区间内的被传染者数量与传染者数量之比,得到每个子区间对应的初始风险值;
基于先验约束条件对初始风险值进行迭代调整,使调整后的风险值满足先验约束条件,以得到上述风险值。
在一种实施方式中,第二风险因子确定子模块,被配置为:
确定被传染者与传染者的接触关系类别,并根据接触关系类别对应的风险值确定第二风险因子。
在一种实施方式中,第二风险因子确定子模块,还被配置为:
获取历史传播事件中不同接触关系类别下的单次接触感染率、平均接触指数;
通过对不同接触关系类别下的单次接触感染率、平均接触指数进行对比,得到不同接触关系类别间的相对风险值;
对不同接触关系类别间的相对风险值进行标准化处理,得到每种接触关系类别对应的风险值。
在一种实施方式中,第三风险因子确定子模块,被配置为:
当根据传染者的症状信息确定传染者为有症状患者时,确定第三风险因子为第一预设值;
当根据传染者的症状信息确定传染者为无症状患者时,确定第三风险因子为第二预设值。
在一种实施方式中,图模型的边为有向边,有向边由传染者对应的节点指向被传染者对应的节点。
图模型优化模块1040,被配置为:
当检测到图模型中存在连接有至少两条入边的节点时,基于至少两条入边的权重对至少两条入边进行裁剪,以保留其中一条入边。
在一种实施方式中,图模型优化模块1040,被配置为:
在至少两条入边中裁剪掉权重较低的入边;
如果存在权重相同的多条入边,则获取其中每条入边对应的第一风险因子,根据第一风险因子对多条入边进行裁剪;第一风险因子根据入边对应的具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定。
在一种实施方式中,图模型优化模块1040,被配置为
分别以图模型的每个节点为起点,在图模型中遍历起点的所有路径;
将所遍历的路径中最长的路径确定为传播路径。
上述装置中各部分的细节在方法部分实施方式中已经详细说明,因而不再赘述。
本公开的示例性实施方式还提供了一种计算机可读存储介质,可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。在一种实施方式中,该程序产品可以实现为便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、 C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开的示例性实施方式还提供一种电子设备,下面参考图11对该电子设备进行说明。应当理解,图11显示的电子设备1100仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来任何限制。
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备 1100的组件可以包括但不限于:至少一个处理单元1110、至少一个存储单元1120、连接不同系统组件(包括处理单元1110和存储单元1120)的总线1130。
其中,存储单元存储有程序代码,程序代码可以被处理单元1110执行,使得处理单元1110执行本示例性实施方式中的传播路径确定方法,如执行图1的方法步骤。
存储单元1120可以包括易失性存储单元,例如随机存取存储单元 (RAM)1121和/或高速缓存存储单元1122,还可以进一步包括只读存储单元(ROM)1123。
存储单元1120还可以包括具有一组(至少一个)程序模块1125的程序/实用工具1124,这样的程序模块1125包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1130可以包括数据总线、地址总线和控制总线。
电子设备1100也可以与一个或多个外部设备1200(例如键盘、指向设备、蓝牙设备等)通信,这种通信可以通过输入/输出(I/O)接口1140 进行。电子设备1100还可以通过网络适配器1150与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图11所示,网络适配器1150通过总线1130与电子设备1100的其它模块通信。应当理解,尽管图11中未示出,可以在电子设备1100中设置其它硬件和/或软件模块,包括但不限于:显示器、微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。

Claims (16)

1.一种传染病的传播路径确定方法,其特征在于,包括:
获取多位患者的防疫信息以及所述多位患者之间的关系;
根据所述多位患者的防疫信息、所述多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;
若是,则将具有潜在传染关系的每一位患者形成一个节点,根据所述患者之间的潜在传染关系形成所述节点之间的边,以构建图模型;
根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重;
基于所述边的权重对所述图模型进行优化,以通过优化后的所述图模型确定传播路径;
其中,所述图模型的边为有向边,所述有向边由传染者对应的节点指向被传染者对应的节点;所述基于所述边的权重对所述图模型进行优化,包括:
当检测到所述图模型中存在连接有至少两条入边的节点时,在所述至少两条入边中裁剪掉权重较低的入边;如果存在权重相同的多条入边,则获取其中每条入边对应的第一风险因子,根据所述第一风险因子对所述多条入边进行裁剪;所述第一风险因子根据所述入边对应的具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定。
2.根据权利要求1所述的方法,其特征在于,所述防疫信息包括:患者的感染时间、传播时间区间、症状信息;
所述患者之间的关系包括:接触关系。
3.根据权利要求2所述的方法,其特征在于,所述根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重,包括:
根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系,确定所述两位患者所对应的两个节点之间的边的权重;或者,
根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系,确定所述两位患者所对应的两个节点之间的边的权重;或者,
根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系、所述传染者的症状信息,确定所述两位患者所对应的两个节点之间的边的权重。
4.根据权利要求3所述的方法,其特征在于,所述根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系、所述被传染者与所述传染者的接触关系、所述传染者的症状信息,确定所述两位患者所对应的两个节点之间的边的权重,包括:
根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子;
根据所述被传染者与所述传染者的接触关系确定第二风险因子;
根据所述传染者的症状信息确定第三风险因子;
通过所述第一风险因子、第二风险因子、第三风险因子,确定所述两位患者所对应的两个节点之间的边的权重。
5.根据权利要求4所述的方法,其特征在于,所述根据具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定第一风险因子,包括:
确定所述被传染者的感染时间在所述传染者的传播时间区间中所处的子区间,并根据所述子区间对应的风险值确定所述第一风险因子。
6.根据权利要求5所述的方法,其特征在于,所述子区间对应的风险值是通过如下方式确定:
获取历史传播事件中的传染者在其传播时间区间的各子区间内的传染数据;
统计所述各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值。
7.根据权利要求6所述的方法,其特征在于,所述统计所述各子区间内的传染数据的分布特征,以得到每个子区间对应的风险值,包括:
统计每个子区间内的被传染者数量与传染者数量之比,得到每个子区间对应的初始风险值;
基于先验约束条件对所述初始风险值进行迭代调整,使调整后的风险值满足所述先验约束条件,以得到所述风险值。
8.根据权利要求4所述的方法,其特征在于,所述根据所述被传染者与所述传染者的接触关系确定第二风险因子,包括:
确定所述被传染者与所述传染者的接触关系类别,并根据所述接触关系类别对应的风险值确定所述第二风险因子。
9.根据权利要求8所述的方法,其特征在于,所述接触关系类别对应的风险值是通过如下方式确定:
获取历史传播事件中不同接触关系类别下的单次接触感染率、平均接触指数;
通过对不同接触关系类别下的单次接触感染率、平均接触指数进行对比,得到不同接触关系类别间的相对风险值;
对不同接触关系类别间的相对风险值进行标准化处理,得到每种接触关系类别对应的风险值。
10.根据权利要求4所述的方法,其特征在于,所述根据所述传染者的症状信息确定第三风险因子,包括:
当根据所述传染者的症状信息确定所述传染者为有症状患者时,确定所述第三风险因子为第一预设值;
当根据所述传染者的症状信息确定所述传染者为无症状患者时,确定所述第三风险因子为第二预设值。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果在对所述图模型进行优化时裁剪所述图模型的边,则对被裁剪的边进行保存;
如果优化后的所述图模型中存在孤立节点,则从被裁减的边中获取所述孤立节点的旧边,并将所述旧边添加回优化后的所述图模型中,使所述孤立节点通过所述旧边连接到优化后的所述图模型中的其他节点;所述孤立节点的旧边是指在优化前的所述图模型中与所述孤立节点连接的边。
12.根据权利要求11所述的方法,其特征在于,所述从被裁减的边中获取所述孤立节点的旧边,包括:
从被裁减的边中获取所述孤立节点的权重最大的旧边。
13.根据权利要求1所述的方法,其特征在于,所述通过优化后的所述图模型确定传播路径,包括:
分别以优化后的图模型的每个节点为起点,在优化后的图模型中遍历所述起点的所有路径;
将所遍历的路径中最长的路径确定为所述传播路径。
14.一种传染病的传播路径确定装置,其特征在于,包括:
信息获取模块,被配置为获取多位患者的防疫信息以及所述多位患者之间的关系;
潜在传染关系确定模块,被配置为根据所述多位患者的防疫信息、所述多位患者之间的关系以及预设的传染规则判断任意两位患者之间是否具有潜在传染关系;
图模型构建模块,被配置为若两位患者之间具有潜在传染关系,则将具有潜在传染关系的每一位患者形成一个节点,根据所述患者之间的潜在传染关系形成所述节点之间的边,以构建图模型;
边权重确定模块,被配置为根据具有潜在传染关系的两位患者中的防疫信息以及两位患者之间的关系,确定所述两位患者所对应的两个节点之间的边的权重;
图模型优化模块,被配置为基于所述边的权重对所述图模型进行优化,以通过优化后的所述图模型确定传播路径;
其中,所述图模型的边为有向边,所述有向边由传染者对应的节点指向被传染者对应的节点;所述基于所述边的权重对所述图模型进行优化,包括:
当检测到所述图模型中存在连接有至少两条入边的节点时,在所述至少两条入边中裁剪掉权重较低的入边;如果存在权重相同的多条入边,则获取其中每条入边对应的第一风险因子,根据所述第一风险因子对所述多条入边进行裁剪;所述第一风险因子根据所述入边对应的具有潜在传染关系的两位患者中被传染者的感染时间与传染者的传播时间区间的关系确定。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13任一项所述的方法。
16.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至13任一项所述的方法。
CN202110827266.3A 2021-07-21 2021-07-21 传染病的传播路径确定方法、装置、存储介质与电子设备 Active CN113470835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110827266.3A CN113470835B (zh) 2021-07-21 2021-07-21 传染病的传播路径确定方法、装置、存储介质与电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110827266.3A CN113470835B (zh) 2021-07-21 2021-07-21 传染病的传播路径确定方法、装置、存储介质与电子设备

Publications (2)

Publication Number Publication Date
CN113470835A CN113470835A (zh) 2021-10-01
CN113470835B true CN113470835B (zh) 2023-01-24

Family

ID=77881735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110827266.3A Active CN113470835B (zh) 2021-07-21 2021-07-21 传染病的传播路径确定方法、装置、存储介质与电子设备

Country Status (1)

Country Link
CN (1) CN113470835B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114613506B (zh) * 2022-03-02 2022-11-15 杭州杏林信息科技有限公司 基于大数据的路径预测管控方法、装置及存储介质
CN115587593B (zh) * 2022-06-16 2023-06-13 中关村科学城城市大脑股份有限公司 信息抽取方法、装置、电子设备和计算机可读介质
CN115862888B (zh) * 2023-02-17 2023-05-16 之江实验室 传染病感染情况预测方法、系统、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475297A (zh) * 2015-10-30 2018-08-31 皇家飞利浦有限公司 确定传染原的传播途径的方法、系统和过程
CN111247593A (zh) * 2017-08-21 2020-06-05 皇家飞利浦有限公司 使用实时定位系统和下一代测序在健康护理机构中预测、预防和控制感染传播
CN112599253A (zh) * 2020-12-29 2021-04-02 医渡云(北京)技术有限公司 根据密接图谱确定疫情传播路径方法、装置、设备和介质
CN112786205A (zh) * 2020-12-31 2021-05-11 医渡云(北京)技术有限公司 基于数据模型的症候群预警方法、装置、介质及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3659156A1 (en) * 2017-07-28 2020-06-03 Koninklijke Philips N.V. Monitoring direct and indirect transmission of infections in a healthcare facility using a real-time locating system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475297A (zh) * 2015-10-30 2018-08-31 皇家飞利浦有限公司 确定传染原的传播途径的方法、系统和过程
CN111247593A (zh) * 2017-08-21 2020-06-05 皇家飞利浦有限公司 使用实时定位系统和下一代测序在健康护理机构中预测、预防和控制感染传播
CN112599253A (zh) * 2020-12-29 2021-04-02 医渡云(北京)技术有限公司 根据密接图谱确定疫情传播路径方法、装置、设备和介质
CN112786205A (zh) * 2020-12-31 2021-05-11 医渡云(北京)技术有限公司 基于数据模型的症候群预警方法、装置、介质及设备

Also Published As

Publication number Publication date
CN113470835A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN113470835B (zh) 传染病的传播路径确定方法、装置、存储介质与电子设备
McNeill et al. Estimating local commuting patterns from geolocated Twitter data
JP5042667B2 (ja) 情報出力装置、情報出力方法、及び、情報出力プログラム
US20170286429A1 (en) Computer System for Automated Assessment at Scale of Topic-Specific Social Media Impact
JP4920023B2 (ja) オブジェクト間競合指標計算方法およびシステム
CN106529711B (zh) 用户行为预测方法及装置
US20060179050A1 (en) Probabilistic model for record linkage
CN110175691B (zh) 规划区域交通运营线路的方法、装置和电子设备
Eldeeb et al. Quantifying preference heterogeneity in transit service desired quality using a latent class choice model
CN112530600A (zh) 传染病的溯源方法、装置、电子设备及存储介质
CN111899821A (zh) 处理医疗机构数据的方法、构建数据库的方法和装置
Konigsberg et al. Status of mandibular third molar development as evidence in legal age threshold cases
CN112509699A (zh) 健康识别码的生成方法及装置、存储介质、电子设备
CN110737673B (zh) 一种数据处理的方法及系统
Ennis et al. When race and Hispanic origin reporting are discrepant across administrative records and third party sources: Exploring methods to assign responses
CN109166315A (zh) 一种基于区块链技术的交通事故信息实时共享方法
CN110990384B (zh) 一种大数据平台bi分析方法
Borradaile et al. Whose tweets are surveilled for the police: an audit of a social-media monitoring tool via log files
Roy et al. Comparing driving cycle development methods based on markov chains
CN112163127B (zh) 关系图谱构建方法、装置、电子设备及存储介质
Fan et al. Does the built environment of settlements affect our sentiments? A multi-level and non-linear analysis of Xiamen, China, using social media data
Giorgi et al. Correcting sociodemographic selection biases for accurate population prediction from social media
Menda et al. Forecasting confirmed Malaria cases in northwestern province of Zambia: a time series analysis using 2014–2020 routine data
Allen et al. Gypsy, Roma and Traveller children in child welfare services in England
Sahri et al. Customized eager-lazy data cleansing for satisfactory big data veracity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant