CN111785380A - 传染性疾病患病风险等级的预测方法及装置、介质、设备 - Google Patents

传染性疾病患病风险等级的预测方法及装置、介质、设备 Download PDF

Info

Publication number
CN111785380A
CN111785380A CN202010632741.7A CN202010632741A CN111785380A CN 111785380 A CN111785380 A CN 111785380A CN 202010632741 A CN202010632741 A CN 202010632741A CN 111785380 A CN111785380 A CN 111785380A
Authority
CN
China
Prior art keywords
risk
risk level
quantization
infectious disease
infectious diseases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010632741.7A
Other languages
English (en)
Other versions
CN111785380B (zh
Inventor
郭潇宇
穆钰
亓玉雪
冯卉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN202010632741.7A priority Critical patent/CN111785380B/zh
Publication of CN111785380A publication Critical patent/CN111785380A/zh
Application granted granted Critical
Publication of CN111785380B publication Critical patent/CN111785380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本公开涉及计算机技术领域,提供了传染性疾病患病风险等级的预测方法及装置、计算机存储可读存储介质和电子设备。其中,上述方法包括:获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;对该相关信息进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值;将该量化值输入到传染性疾病的患病风险等级预测模型中,以根据传染性疾病的患病风险等级预测模型的预测结果确定当前用户的患病风险等级。本公开可以提高传染性疾病的预测效率和预测的准确性。

Description

传染性疾病患病风险等级的预测方法及装置、介质、设备
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种传染性疾病患病风险等级的预测方法、传染性疾病患病风险等级的预测装置、计算机可读存储介质、电子设备。
背景技术
传染性疾病由于具有较强的传播能力,在短时间内会造成群体发病的可能,从而引起社会的恐慌,以及对人们的日常生活造成混乱。
识别预测高风险人群并控制高风险人员的流动,可以有效的控制传染性疾病的传播,以降低其对人们生活造成的危害。以新冠肺炎发防控过程为例。相关技术中,主要通过人工对采集的数据进行分析评估,以确定当前人员是否为高风险人员。
然而,人工评估的方式,评估周期长、效率低下,且需要耗费较大的人力成本,同时,人工评估存在一定的偏差,会降低评估结果的准确性。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种传染性疾病患病风险等级的预测方法及装置、计算机可读存储介质及电子设备,进而至少在一定程度上改善传染性疾病患病风险等级的预测效率和预测准确性。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供了一种传染性疾病患病风险等级的预测方法,包括:
获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
在本公开的一种示例性实施例中,基于前述方案,所述传染性疾病的患病风险等级预测模型通过以下方式确定:
对获取的多个维度的传染性疾病的影响因子进行量化处理,以得到所述各维度的传染性疾病的影响因子的量化等级;
确定所述各维度的传染性疾病的影响因子的量化等级所对应的风险等级,以生成所述各维度的传染性疾病的影响因子的标签样本数据;
根据所述各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型。
在本公开的一种示例性实施例中,基于前述方案,所述多个维度的传染性疾病的影响因子包括基础慢性病患病状况、预设时间内的个人临床症状、个人出行状况、通过蓝牙数据确定的与风险等级已确定人员的接触状况、通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况中的任意组合。
在本公开的一种示例性实施例中,基于前述方案,所述预设三元组关系通过以下形式确定:
(第一人员标识,第二人员标识,亲属关系)
其中,所述预设三元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间包括亲属关系。
在本公开的一种示例性实施例中,基于前述方案,所述预设四元组关系通过以下形式确定:
(第一人员标识,第二人员标识,关系,关系发生时间)
其中,所述预设四元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的关系包括雇主关系、活动轨迹关系、教育关系中的至少一种。
在本公开的一种示例性实施例中,基于前述方案,所述通过蓝牙数据确定的与风险等级已确定人员的接触状况包括通过蓝牙数据确定的与风险等级已确定人员的接触距离、接触持续时间中的至少一种。
在本公开的一种示例性实施例中,基于前述方案,所述根据所述各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型,包括:
将所述各维度的传染性疾病的影响因子的量化等级的阈值作为变量,生成不同阈值的各维度的传染性疾病的影响因子的量化等级所对应的不同的标签样本数据;
根据所述不同的标签样本数据对所述预设的机器学习模型进行训练,以得到所述传染性疾病的患病风险等级预测模型。
根据本公开的第二方面,提供了一种传染性疾病患病风险等级的预测方法,包括:
获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
确定各所述量化值所对应的量化等级,根据各量化等级确定各量化值所对应的风险等级;
获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
在本公开的一种示例性实施例中,基于前述方案,所述确定所述各维度的传染性疾病的影响因子的量化等级对其所对应的风险等级的影响权重包括:
获取历史数据中各维度的传染性疾病的影响因子所对应的风险等级的频率分布;
根据所述频率分布确定所述各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
根据本公开的第三方面,提供了一种传染性疾病患病风险等级的预测装置,包括:
影响因子的相关信息获取模块,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
量化处理模块,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
风险等级预测模块,被配置为将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
根据本公开的第四方面,提供了一种传染性疾病患病风险等级的预测装置,包括:
影响因子相关信息获取模块,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
量化处理模块,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
量化等级确定模块,被配置为确定各所述量化值所对应的量化等级,根据各量化等级确定各量化值所对应的风险等级;
风险等级确定模块,被配置为获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
根据本公开的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面和/或第二方面所述的传染性疾病患病风险等级的预测方法。
根据本公开实施例的第六方面,提供了一种电子设备,包括:处理器;以及,存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面和/或第二方面所述的传染性疾病患病风险等级的预测方法。
由上述技术方案可知,本公开示例性实施例中的传染性疾病患病风险等级的预测方法、传染性疾病患病风险等级的预测装置,以及实现所述传染性疾病患病风险等级的预测方法的计算机可读存储介质及电子设备,至少具备以下优点和积极效果:
在本公开的一些实施例所提供的技术方案中,首先,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;然后,对该相关信息进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值;最后,将该量化值输入到传染性疾病的患病风险等级预测模型中,从而可以根据传染性疾病的患病风险等级的预测结果确定当前用户的患病风险等级。与相关技术相比,一方面,本公开基于获取的当前用户关于多个维度的传染性疾病影响因子的相关信息,可以提高传染性疾病患病风险等级预测的准确性和全面性;另一方面,本公开基于传染性疾病患病风险预测模型,可以实现对患病风险等级的自动确定,从而可以提高传染性疾病患病风险等级预测的效率,同时,可以节省传染性疾病患病风险等级预测中的人工成本。
本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开一示例性实施例中传染性疾病患病风险等级的预测方法的流程示意图;
图2示出本公开一示例性实施例中训练预设的机器学习模型的方法的流程示意图;
图3示出本公开一示例性实施例中优化预测模型的方法的流程示意图;
图4示出本公开一示例性实施例中另一种传染性疾病患病风险等级的预测方法的流程示意图;
图5示出本公开一示例性实施例中确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重的方法的流程示意图;
图6示出本公开一示例性实施例中传染性疾病患病风险等级的预测装置的结构示意图;
图7示出本公开一示例性实施例中另一种传染性疾病患病风险等级的预测装置的结构示意图;
图8示出本公开示例性实施例中计算机可读存储介质的结构示意图;以及,
图9示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
在本公开的实施例中,首先提供了一种传染性疾病患病风险等级的预测方法,参考图1,该方法包括:
步骤S110,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
步骤S120,对各相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
步骤S130,将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
在图1所示实施例所提供的技术方案中,首先,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;然后,对该相关信息进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值;最后,将该量化值输入到传染性疾病的患病风险等级预测模型中,从而可以根据传染性疾病的患病风险等级的预测结果确定当前用户的患病风险等级。与相关技术相比,一方面,本公开基于获取的当前用户关于多个维度的传染性疾病影响因子的相关信息,可以提高传染性疾病患病风险等级预测的准确性和全面性;另一方面,本公开基于传染性疾病患病风险预测模型,可以实现对患病风险等级的自动确定,提高传染性疾病患病风险等级预测的效率,同时,可以节省传染性疾病患病风险等级预测中的人工成本。
以下对图1所示实施例中各个步骤的具体实施方式进行详细阐述:
在步骤S110中,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息。
在示例性的实施方式中,多个维度的传染性疾病的影响因子可以包括基础慢性病患病状况、预设时间内的个人临床症状、个人出行状况、通过蓝牙数据确定的与风险等级已确定人员的接触状况、通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况中的任意组合。
其中,基础慢性病患病状况可以通过医学诊疗确定,基础慢性病患病状况可以包括常规的基础慢性病的患病状况,还可以包括与传染性疾病的症状等相关的基础慢性病的患病状况。以新冠肺炎这一传染性疾病为例,基础慢性病患病状况可以是通过医疗数据确定的在预设时间范围内患有恶性肿瘤、心机梗塞、糖尿病、慢性阻塞性肺疾病、肺炎、中风、终末期肾病等中的一种或多种的状况。
一般而言,患有基础慢性病的人员的身体抵抗力较差,在同等条件下,其更易感染传染性疾病。因此,将基础慢性病的患病状况作为传染性疾病的影响因子可以提高传染性疾病风险等级预测的全面性和准确性。
其中,预设时间内的个人临床症状可以通过个人自筛和/或医学诊疗数据确定,预设时间内的个人临床症状可以包括与传染性疾病相关的症状、普通症状等。例如,以新冠肺炎这一传染性疾病为例,与新冠肺炎相关的症状可以包括发热、乏力、干咳、呼吸困难等症状、普通症状可以包括普通感冒、普通流感的症状,如头痛、鼻塞、流涕等症状。
其中,个人出行状况可以通过个人旅行记录确定,个人出行状况可以包括个人到达的地方、到达某个地方的时间等状况,通过个人出行状况可以确定该人员是否到达过传染性疾病的高危地区。具体的,可以根据飞机、游轮、边检等入境数据确定个人出行状况,或者根据火车、动车、高铁、长途汽车、私家车等活动轨迹数据确定个人出行状况。
在示例性的实施方式中,上述的预设三元组关系可以通过以下形式确定:
(第一人员标识,第二人员标识,亲属关系)
其中,预设三元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间包括亲属关系。
举例而言,可以根据户口本中与户主的关系确定第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的亲属关系。例如,第一人员标识所对应的第一人员和户主的关系为配偶、第二人员标识所对应的第二人员和户主的关系为子女,则可以映射得出三元组关系为(第一人员标识,第二人员标识,子女),该三元组关系可以表示第一人员和第二人员之间的亲属关系为子女。
一般而言,当家人中有传染性疾病的患病人员或者患病风险较高人员时,由于家庭成员之间存在密切接触的情况,那么,其他家庭成员感染传染性疾病的风险也就越高。通过预设三元组关系,可以提高数据采集的效率,从而自动的确定家庭成员中风险等级已确定人员对另外家庭成员的患病风险的影响,进而提高传染性疾病患病风险等级的预测效率。
在示例性的实施方式中,上述的预设四元组关系可以通过以下形成确定:
(第一人员标识,第二人员标识,关系,关系发生时间)
其中,预设四元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的关系包括雇主关系、活动轨迹关系、教育关系中的至少一种。
具体的,雇主关系可以包括第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的任何的雇佣关系。活动轨迹关系可以包括第一人员标识所对应的第一人员和第二人员标识所对应的第二人员是否具有同航班关系、同车次关系、同邮轮关系等,以航班关系为例,同一个航班的任意两人存在同航班关系,且关系发生时间可以是航班时间。教育关系可以包括第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的任何教育关系,例如,第一人员在A年A月A日成为第二人员的老师,那么预设四元组关系可以为(第一人员标识,第二人员标识,师生,A年A月A日)。
通过预设的四元组关系,可以自动的确定四元组关系中的两个人员之间的接触状况,以提高数据的采集效率,当确定其中一个人具有较高的患病风险时,另一个人的患病风险也可以通过预设的四元组关系自动的预测,进而可以提高传染性疾病患病风险的预测效率。同时,预设四元组关系中的关系可以包括任何能够使两个人员进行接触的关系,从而在提高预测效率的同时保证预测的全面性和准确性。
在示例性的实施方式中,上述通过蓝牙数据确定的与风险等级已确定人员的接触状况可以包括通过蓝牙数据确定的与风险等级已确定人员的接触距离、接触持续时间中的至少一种。
示例性的,上述的预设四元组关系中还可以包括预设的蓝牙四元组关系,可以根据预设的蓝牙四元组关系通过蓝牙数据确定与风险等级已确定人员的接触状况。其中,预设的蓝牙四元组关系可以是(第一人员标识,第二人员标识,蓝牙接触距离,开始/结束接触时间),还可以是(第一人员标识,第二人员标识,蓝牙接触距离,接触持续时间)。当然,也可以根据其它的任何方式通过蓝牙数据确定与风险等级已确定人员的接触状况。本示例性实施方式对此不做特殊限制。
通过上述的预设四元组关系可以自动的确定当前用户在大范围活动时的传染病患病风险,例如跨国、跨省、跨市、跨区县等,而通过预设的蓝牙四元组关系可以自动的当前用户在小范围内活动时的传染病患病风险,例如,室内聚集场所、室外聚集场所等。从而可以保证预测的全面性。
示例性的,上述步骤S110的具体实施方式可以是,获取当前用户的基础慢性病患病状况、预设时间内的个人临床症状、个人出行状况、通过蓝牙数据确定的与风险等级已确定人员的接触状况、通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况中的任意组合的相关信息。
获取当前用户关于多个维度的传染性疾病的影响因子的相关信息后,在步骤S120中,对各相关信息进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值。
示例性的,上述步骤S120的具体实施方式可以是,根据各维度的传染性疾病的影响因子的特性对各维度的传染性疾病影响因子进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值。
具体的,在示例性性的实施方式中,可以根据是否患病对上述的基础慢性病患病状况进行量化处理。例如,未患病时,对应的量化值为1;患有至少一种基础慢性病时,对应的量化值为0。
在示例性的实施方式中,可以根据症状个数对预设时间内的个人临床症状进行量化处理。例如,7天内,没有任何临床症状时,对应的量化值分别为0、0;7天内,有1个普通症状、2个与传染性疾病相关的症状时,对应的量化值分别为1、2等。
在示例性的实施方式中,可以根据时间长度对个人出行状况进行量化处理。例如,以外出旅行为例,入境21天,对应的量化值为21;入境12天,对应的量化值为12等。
在示例性的实施方式中,可以根据接触持续时间、接触距离中的一种或多种对通过蓝牙数据确定的与风险等级已确定人员的接触状况进行量化处理。例如,接触持续时间为5分钟,对应的量化值为5,接触距离为1.2米,对应的量化值为1.2等。
在示例性的实施方式中,可以根据当前时间戳和与风险等级已确定人员接触时的接触时间戳的差值的大小对通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况进行量化处理。
例如,当家庭成员中有确诊的患病人员时,此时,该人员的风险等级是已经确定的,一般而言,家庭成员之间随时都存在接触的可能性,因此,可以把患病人员确诊时的时间戳作为接触时间戳,若当前时间戳和该患病人员确诊时的时间戳的差值在21天,则对应的量化值为21天。当然,也可以按照其它的时间单位进行量化处理,以得到对应的量化值,例如,时间戳的差值为5小时所对应的量化值为5小时,时间戳的差值为100分钟所对应的量化值为100分钟等,本示例性实施方式对此不做特殊限制。
得到各维度的传染性疾病的影响因子的量化值后,在步骤S130中,将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
其中,在将各所述量化值输入到传染性疾病的患病风险等级预测模型之前,可以对传染性疾病的患病风险等级预测模型进行训练,以得到传染性疾病的患病风险等级的预测模型。示例性的,传染性疾病的患病风险等级的预测模型的训练方法可以参考图2所示,该方法可以包括步骤S210-步骤S230。
在步骤S210中,对获取的多个维度的传染性疾病的影响因子进行量化处理,以得到各维度的传染性疾病的影响因子的量化等级。
在示例性的实施方式中,步骤S210中的多个维度的传染性疾病的影响因子和上述的步骤S110中的相同,此处不再进行赘述。
示例性的,上述的步骤S210的具体实施方式可以是,根据各维度的传染性疾病的影响因子的特性对各维度的传染性疾病影响因子进行量化处理,并确定各维度的传染性疾病的影响因子的量化等级。其中,量化等级的个数可以根据实际情况进行设置,量化等级的个数为大于等于2的正整数。
举例而言,在示例性的实施方式中,可以根据是否患病对上述的基础慢性病患病状况进行量化处理,然后根据是否患病确定量化等级。例如,当未患有上述的基础慢性病时,量化等级为零级;当患有上述的基础慢性病中的至少一种时,对应的量化等级为一级。
在示例性的实施方式中,可以根据症状个数对预设时间内的个人临床症状进行量化处理,然后根据不同的症状个数确定量化等级。例如,7天内,当没有任何临床症状时,对应的量化等级为零级;当有2个以内的普通症状时,对应的量化等级为一级;当有1个与传染性疾病相关的症状或3个及以上普通症状时,对应的量化等级为二级。当然,也可以根据实际需求,根据不同的症状个数确定不同的量化等级,如,当有2个以内的传染性疾病相关的症状时,对应的量化等级为二级等,本示例性实施方式对此不做特殊限定。
在示例性的实施方式中,可以根据时间长度对个人出行状况进行量化处理,然后根据不同的时间长度确定量化等级。以外出旅行为例,根据入境数据,入境21天以上时,对应的量化等级为零级,入境15-21天时,对应的量化等级为一级,入境14天以内对应的量化等级为二级等等。当然,其中,21天、15-21天、14天以内只是作为示例性说明,也可以根据实际情况设置其它的时间长度来划分量化等级,例如,入境20天以上时,对应的量化等级为零级等,本示例性实施方式对此不做特殊限定。
在示例性的实施方式中,可以根据接触持续时间、接触距离中的一种或多种对通过蓝牙数据确定的与风险等级已确定人员的接触状况进行量化处理,然后根据不同的接触时间长度、接触距离确定量化等级。例如,当接触距离在1米以上,且持续时间大于5分钟时,对应的量化等级为零级;当接触距离在1米以内,且持续时间小于5分钟时,对应的量化等级为一级;当接触距离在1米以内,且持续时间大于5分钟时,对应的量化等级为二级等。
在示例性的实施方式中,可以根据当前时间戳和与风险等级已确定人员接触时的接触时间戳的差值的大小对通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况进行量化处理,然后根据不同的差值确定量化等级。其中,在预设四元组关系中接触时间戳可以是四元组关系中的关系发生时间。
例如,当家庭成员中有确诊的患病的人员时,此时,该人员的风险等级是已经确定的,一般而言,家庭成员之间随时都存在接触的可能性,因此,可以把患病人员确诊时的时间戳作为接触时间戳,若当前时间戳和该患病人员确诊时的时间戳的差值在21天以上,对应的量化等级为零级;当前时间戳和该患病人员确诊时间戳的差值在15-21天时,对应的量化等级为一级;当前时间戳和该患病人员确诊时间戳的差值在14天以内,对应的量化等级为二级等。再例如,当同航班中有确诊的患病人员时,当前时间戳和航班起飞时间戳的差值在21天以上时,对应的量化等级为零级;当前时间戳和航班起飞时间戳的差值在15-21天时,对应的量化等级为一级;当前时间戳和航班起飞时间戳的差值在14天以内时,对应的量化等级为二级等。
示例性的,多个维度的传染性疾病的影响因子还可以从整体上划分为包括时间维度、空间维度、人际关系维度等多个维度的传染性疾病的影响因子。以新冠肺炎这一传染性疾病为例,时间维度的传染性疾病的影响因子可以是去过疫区的次数以及时间的长短,或者当前时间戳和与确诊人员接触时的时间戳的差值的长短等;空间维度的传染性疾病的影响因子可以是去过的地方是否为疫情重灾区等;人际关系维度的传染性疾病的影响因子可以为与已确诊患者的接触状态等。
得到各维度的传染性疾病的影响因子的量化等级之后,在步骤S220中,确定各维度的传染性疾病的影响因子的量化等级所对应的风险等级,以生成各维度的传染性疾病的影响因子的标签样本数据。
在示例性的实施方式中,风险等级的数量可以根据实际情况进行设置,本示例性实施方式对此不做特殊限定。一般而言,风险等级的数量和上述的量化等级的数量相同。其中,不同的风险等级对应不同的患病可能性,以风险等级的数量是3为例,零级可以表示没有患病,一级可以表示疑似患病,二级可以表示高度疑似患病等。
示例性的,确定各维度的传染性疾病的影响因子的量化等级所对应的风险等级的具体实施方式可以是,根据各量化等级的患病风险确定各维度的传染性疾病的影响因子的各量化等级所对应的风险等级。
举例而言,以风险等级的数量是3为例,在步骤210中,各维度的传染性疾病的影响因子的量化等级中的零级的患病风险最低,可以确定量化等级为零级时对应的风险等级为零级,即患病风险最低;各维度的传染性疾病的影响因子的量化等级中的一级的患病风险较高,可以确定量化等级为一级时对应的风险等级为一级,即患病风险较高;各维度的传染性疾病的影响因子的量化等级中的二级的患病风险最高,可以确定量化等级为二级时对应的风险等级为二级,即患病风险最高。
确定各维度的传染性疾病的影响因子的量化等级所对应的风险等级后,就可以生成各维度的传染性疾病的影响因子的标签样本数据。
在示例性的实施方式中,各维度的传染性疾病的影响因子的标签样本数据可以包括各维度的传染性疾病的影响因子在各风险等级的标签样本数据。然后,将多个维度的传染性疾病的影响因子在各风险等级的标签样本数据的集合作为最终训练的标签样本数据。
其中,各维度的传染性疾病的影响因子在各风险等级的标签样本数据可以是多个,其可以根据各风险等级对应的量化阈值包括的量化值的个数确定。
具体的,以上述的预设时间内的个人临床症状这一维度的影响因子为例,例如,当没有任何临床症状时,对应的量化等级为零级,该量化等级对应的风险等级为零级,该量化等级对应的量化阈值为0(普通症状)、0(与传染性疾病相关的症状,以下简称相关症状),那么,预设时间内的个人临床症状的零级风险对应的标签样本数据可以是:0个普通症状、0个相关症状-零级风险;当有2个以内的普通症状时,对应的量化等级为一级,该量化等级对应的风险等级为一级,该量化等级对应的量化阈值为2(普通症状)、0(相关症状),那么,预设时间内的个人临床症状的一级风险对应的标签样本数据可以是:1个普通症状、0个相关症状-一级风险,2个普通症状、0个相关症状-一级风险;当有至少1个与传染性疾病相关的症状或3个及以上普通症状时,对应的量化等级为二级,该量化等级对应的风险等级为二级,该量化等级对应的量化阈值分别为0(普通症状)、1(相关症状),或3(普通症状)、0(相关症状),那么,设时间内的个人临床症状的二级风险对应的标签样本数据可以是:任意数值的普通症状、1个及以上的相关症状-二级风险;3个及以上的普通症状、任意数值的相关症状-二级风险。其中,任意数值为非负整数,可见,各维度的各风险等级的标签样本数据可以是多个。
进一步的,最终,预设时间内的个人临床症状的样本标签数据可以确定为:0个普通症状、0个相关症状-零级风险;1个普通症状、0个相关症状-一级风险,2个普通症状、0个相关症状-一级风险;任意数值的普通症状、1个及以上的相关症状-二级风险;3个及以上的普通症状、任意数值的相关症状-二级风险。
其它维度的影响因子对应的样本标签数据的生成方法和预设时间内的个人临床症状的样本标签数据的生成方法类似,此处不再进行赘述。
需要说明的是,本示例性实施方式中从零级、一级到二级的风险等级对应的患病风险逐渐增大。当然,也可以设置从一级到二级的风险等级对应的患病风险逐渐减小,本示例性实施方式对此不做特殊限定。
生成各维度的传染性疾病的影响因子的标签样本数据后,在步骤S230中,根据各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型。
在示例性的实施方式中,预设的机器学习可以是任何的能够实现分类的模型,例如朴素贝叶斯模型、逻辑回归模型、支持向量机模型、GBDT模型(Gradient BoostingDecisionTree,梯度下降树)等。
示例性的,步骤S230的具体实施方式可以是,将各维度的多个样本标签数据作为输入,预测的风险等级作为输出,对预设的机器学习模型进行有监督学习训练,以得到传染性疾病的患病风险等级预测模型。
进一步的,可以对上述步骤S210-步骤S230得到的传染性疾病的患病风险等级预测模型进行优化,以提高预测的准确性。
示例性的,优化传染性疾病的患病风险等级预测模型的方法可以如图3所示。参考图3,该方法可以包括步骤S310-步骤S320。
在步骤S310中,将各维度的传染性疾病的影响因子的量化等级的阈值作为变量,生成不同阈值的各维度的传染性疾病的影响因子的量化等级所对应的不同的标签样本数据。
在示例性的实施方式中,可以将区分量化等级的阈值作为变量,生成不同的样本标签数据。
以预设时间内的个人临床症状这一影响因子为例,在上述的步骤S220中,确定的预设时间内的个人临床症状的样本标签数据为:0个普通症状、0个相关症状-零级风险;1个普通症状、0个相关症状-一级风险,2个普通症状、0个相关症状-一级风险;任意数值的普通症状、1个及以上的相关症状-二级风险;3个及以上的普通症状、任意数值的相关症状-二级风险。其中,0、1、2、3可以理解为区分该影响因子的量化等级的阈值,可以改变不同量化等级的阈值,以生成不同的样本标签数据。例如,0个症状对应的量化等级为零级,小于等于4个普通症状、0个相关症状对应的量化等级为一级,2个相关症状或大于等于5个普通症状对应的量化等级为二级,重新生成一组样本标签数据,即:0个普通症状、0个相关症状-零级风险;小于等于4个普通症状、0个相关症状-一级风险;2个相关症状、任意数值的普通症状-二级风险;5个普通症状、任意数值的相关症状-二级风险。
生成不同的样本标签数据后,在步骤S320中,根据不同的标签样本数据对预设的机器学习模型进行训练,以得到所述传染性疾病的患病风险等级预测模型。
示例性的,可以根据上述的不同的样本标签数据对预设的机器学习模型进行有监督学习训练,然后对不同的机器学习模型的预测效果进行评估,将评估性能最好的机器学习模型作为最终的传染性疾病的患病风险等级预测模型。
以新冠肺炎数据为例,可以将当天采集的数据作为测试数据,例如,当天的确诊患者、疑似患者等的在各维度的量化数据作为测试数据,输入训练的机器学习模型,以得到机器学习模型的预测结果,将机器学习模型的预测结果和真实的结果进行相似度对比,确定相似度最高的机器学习模型为最终的传染性疾病的患病风险等级预测模型。
其中,相似度可以通过ROC(Receiver Operating Characteristic Curve,受试者工作特征曲线)曲线的AUC(Area Under Curve,曲线下面积)来确定,AUC越大,相似度越高,模型预测效果越好。当然,也可以通过其他的方式来确定相似度,本示例性实施方式对此不做特殊限定。
通过上述的步骤S310-步骤S320,可以对机器学习模型进行优化,以提高传染性疾病的患病风险等级预测模型的预测准确度。
示例性的,还可以通过SMOTE(Synthetic Minority Over-SamplingTechnique,人工少数类过采样法)降低样本标签数据不均衡的问题,以进一步优化训练过程,提升模型的预测准确度。
在本公开示例性的实施例中,在上述的步骤S110-步骤S130所提供的方法中,通过预设三元组关系、预设四元组关系等可以提高传染性疾病的影响因子的相关数据的采集效率,从而提高传染性疾病风险等级的预测效率;通过各维度的传染性疾病的影响因子的采集,可以提高传染性疾病的患病风险等级预测的全面性和准确性。
进一步的,在本示例性实施例中,还提供了另一种传染性疾病患病风险等级的预测方法,参考图4所示,该方法可以包括步骤S410-步骤S420。
在步骤S410中,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息。
其中,步骤S410的具体实施方式和上述的步骤S110相同,此处不再进行赘述。
在步骤S420中,对各相关信息进行量化处理,以得到当前用户在各维度的传染性疾病的影响因子的量化值。
其中,步骤S420的具体实施方式和上述的步骤S120相同,此处不再进行赘述。
在步骤S430中,确定各量化值所对应的量化等级,根据各量化等级确定各量化值所对应的风险等级。
示例性的,在确定各量化值所对应的量化等级之前,可以先对多个维度的传染性疾病的影响因子进行量化处理,以得到各维度的传染性疾病的影响因子的量化等级。
其中,对多个维度的传染性疾病的影响因子进行量化处理,以得到各维度的传染性疾病的影响因子的量化等级的具体实施细节已在上述的步骤S210中进行说明,此处不再进行赘述。
示例性的,在根据各量等级确定各量化值所对应的风险等级之前,可以先确定各维度的传染性疾病的影响因子的量化等级所对应的风险等级。
其中,确定各维度的传染性疾病的影响因子的量化等级所对应的风险等级的具体实施细节已在上述的步骤S220中的相关部分进行说明,此处不再进行赘述。
得到各维度的传染性疾病的影响因子的量化等级和其所对应的风险等级之后,步骤S430的具体实施方式可以是,确定各维度的传染性疾病的影响因子的量化值所属的量化等级,根据其所述的量化等级所对应的风险等级确定各量化值所对应的风险等级。
确定各量化值所对应的风险等级之后,在步骤S440中,获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
示例性的,在获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重之前,可以先确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
其中,确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重的方法可以如图5所示。参考图5,该方法可以包括步骤S510-步骤S520。
在步骤S510中,获取历史数据中各维度的传染性疾病的影响因子所对应的风险等级的频率分布。
在示例性的实施方式中,历史数据可以是所有风险等级已确定人员的相关数据,也可以是部分风险等级已确定人员的相关数据。
示例性的,步骤S510的具体实施实施方式可以是,获取风险等级已确定人员的相关数据,解析各风险等级已确定人员所具有的传染性疾病的影响因子,根据解析结果,统计各风险等级中出现的不同传染性疾病的影响因子的频次,根据该频次确定各维度的传染性疾病的影响因子所对应的风险等级的频率分布。
例如,通过对历史数据进行解析,得到一级风险的人员所具有的传染性疾病的影响因子的分布情况为:100个人有基础慢性病、100个人具有预设时间内的个人临床症状、15个人有个人出行记录、10个人通过蓝牙数据确定与确诊患者接触、10个人通过预设三元组关系确定与确诊患者接触、10个人通过预设四元组关系确定的与确诊患者接触;二级风险的人员所具有的传染性疾病的影响因子的分布情况为:10个人有基础慢性病患病、10个人具有预设时间内的个人临床症状、15个人有个人出行记录、100个人通过蓝牙数据确定与确诊患者接触、100个人通过预设三元组关系确定与确诊患者接触、100个人通过预设四元组关系确定的与确诊患者接触。
以基础慢性病患病状况这一影响因子为例,则可以确定其在一级风险中的出现频率为100/(100+100+15+10+10+10)=0.4,在二级风险中的出现频率为10/(10+10+15+100+100+100)=0.02。
获取历史数据中各维度的传染性疾病的影响因子所对应的风险等级的频率分布后,在步骤S520中,根据频率分布确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
示例性的,步骤S520的具体实施方式可以是,确定各风险等级的预设系数和影响因子在各风险等级的出现频率的乘积和确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
其中,各风险等级的预设系数随着患病风险的增大而增大,例如,当二级风险的患病风险最大时,对应的二级风险的预设系数最大。
在示例性的实施方式中,也可以在步骤S510中直接确定各维度的传染性疾病的影响因子在已确诊的患者中的频率分布,然后将频率值确定为权重值,本示例性实施方式对此不做特殊限定。
以新冠肺炎为例,例如,确诊患者中有40%的人有其他确诊患者接触过,有2%的人患有基础慢性病,则可以确定与确诊患者接触对新冠肺炎患病的影响权重为0.4,患有基础慢性病对新冠肺炎患病的影响权重为0.02。
此外,还可以根据专家知识确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重之后,可以根据各维度的传染性疾病的影响因子量化值所对应的风险等级和该影响权重确定当前用户的风险等级。
示例性的,根据各维度的传染性疾病的影响因子量化值所对应的风险等级和影响权重确定当前用户的风险等级的具体实施方式可以是,将各维度的量化值所对应的风险等级和各维度的影响因子对该风险等级的影响权重进行加权平均,以确定当前用户的风险等级。
通过上述的步骤S410-步骤S440,根据获取的各维度的传染性疾病的影响因子的影响权重,可以对各个维度的影响因子为传染性疾病造成的患病风险进行衡量,以提高风险等级预测的准确性。
本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,图6示出本公开示例性实施例中传染性疾病患病风险等级的预测装置的结构示意图。参考图6,该传染性疾病患病风险等级的预测装置600可以包括:影响因子的相关信息获取模块610、量化处理模块620、风险等级预测模块630。其中:
上述的影响因子的相关信息获取模块610,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
上述的量化处理模块620,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
上述的风险等级预测模块630,被配置为将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
在本公开一示例性的实施例中,基于前述方案,上述的装置600还包括:影响因子量化处理模块、标签样本数据生成模块、预测模型训练模块。其中:
上述的影响因子量化处理模块,被配置为对获取的多个维度的传染性疾病的影响因子进行量化处理,以得到所述各维度的传染性疾病的影响因子的量化等级;
上述的标签样本数据生成模块,被配置为确定所述各维度的传染性疾病的影响因子的量化等级所对应的风险等级,以生成所述各维度的传染性疾病的影响因子的标签样本数据;
上述的预测模型训练模块,被配置为根据所述各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型。
在本公开一示例性的实施例中,基于前述方案,上述的影响因子的相关信息获取模块610中的多个维度的传染性疾病的影响因子包括基础慢性病患病状况、预设时间内的个人临床症状、个人出行状况、通过蓝牙数据确定的与风险等级已确定人员的接触状况、通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况中的任意组合。
在本公开一示例性的实施例中,基于前述方案,上述的预设三元组关系通过以下形式确定:
(第一人员标识,第二人员标识,亲属关系)
其中,预设三元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间包括亲属关系。
在本公开一示例性的实施例中,基于前述方案,上述的预设四元组关系通过以下形式确定:
(第一人员标识,第二人员标识,关系,关系发生时间)
其中,预设四元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的关系包括雇主关系、活动轨迹关系、教育关系中的至少一种。
在本公开一示例性的实施例中,基于前述方案,上述的通过蓝牙数据确定的与风险等级已确定人员的接触状况包括通过蓝牙数据确定的与风险等级已确定人员的接触距离、接触持续时间中的至少一种。
在本公开一示例性的实施例中,基于前述方案,上述的预测模型训练模块,还被具体配置为:
将各维度的传染性疾病的影响因子的量化等级的阈值作为变量,生成不同阈值的各维度的传染性疾病的影响因子的量化等级所对应的不同的标签样本数据;
根据不同的标签样本数据对所述预设的机器学习模型进行训练,以得到所述传染性疾病的患病风险等级预测模型。
图7示出本公开示例性实施例中另一种传染性疾病患病风险等级的预测装置的结构示意图。参考图7,该传染性疾病患病风险等级的预测装置700可以包括:影响因子相关信息获取模块710、量化处理模块720、量化等级确定模块730、以及风险等级确定模块740。其中:
上述的影响因子相关信息获取模块710,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
上述的量化处理模块720,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
上述的量化等级确定模块730,被配置为确定各所述量化值所对应的量化等级,根据各量化等级确定各量化值所对应的风险等级;
上述的风险等级确定模块740,被配置为获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
在本公开一示例性的实施例中,基于前述方案,上述的风险等级确定模块740还包括权重确定单元,该单元被配置为:
获取历史数据中各维度的传染性疾病的影响因子所对应的风险等级的频率分布;
根据频率分布确定各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
上述传染性疾病患病风险等级的预测装置600和700中各模块的具体细节已经在对应的方法中进行了详细的描述,因此,此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图8所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930以及显示单元940。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元910执行,使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元910可以执行如图1中所示的:步骤S110,获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;步骤S120,对各相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;步骤S130,将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
又如,所述处理单元910可以执行如图2-图5中的各个步骤。
存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(ROM)9203。
存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (13)

1.一种传染性疾病患病风险等级的预测方法,其特征在于,包括:
获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
2.根据权利要求1所述的传染性疾病患病风险等级的预测方法,其特征在于,所述传染性疾病的患病风险等级预测模型通过以下方式确定:
对获取的多个维度的传染性疾病的影响因子进行量化处理,以得到所述各维度的传染性疾病的影响因子的量化等级;
确定所述各维度的传染性疾病的影响因子的量化等级所对应的风险等级,以生成所述各维度的传染性疾病的影响因子的标签样本数据;
根据所述各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型。
3.根据权利要求1或2所述的传染性疾病患病风险等级的预测方法,其特征在于,所述多个维度的传染性疾病的影响因子包括基础慢性病患病状况、预设时间内的个人临床症状、个人出行状况、通过蓝牙数据确定的与风险等级已确定人员的接触状况、通过预设三元组关系确定的与风险等级已确定人员的接触状况、通过预设四元组关系确定的与风险等级已确定人员的接触状况中的任意组合。
4.根据权利要求3所述的传染性疾病患病风险等级的预测方法,其特征在于,所述预设三元组关系通过以下形式确定:
(第一人员标识,第二人员标识,亲属关系)
其中,所述预设三元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间包括亲属关系。
5.根据权利要求3所述的传染性疾病患病风险等级的预测方法,其特征在于,所述预设四元组关系通过以下形式确定:
(第一人员标识,第二人员标识,关系,关系发生时间)
其中,所述预设四元组关系中的第一人员标识所对应的第一人员和第二人员标识所对应的第二人员之间的关系包括雇主关系、活动轨迹关系、教育关系中的至少一种。
6.根据权利要求3所述的传染性疾病患病风险等级的预测方法,其特征在于,所述通过蓝牙数据确定的与风险等级已确定人员的接触状况包括通过蓝牙数据确定的与风险等级已确定人员的接触距离、接触持续时间中的至少一种。
7.根据权利要求2所述的传染性疾病患病风险等级的预测方法,其特征在于,所述根据所述各维度的传染性疾病的影响因子的标签样本数据训练预设的机器学习模型,以得到传染性疾病的患病风险等级预测模型,包括:
将所述各维度的传染性疾病的影响因子的量化等级的阈值作为变量,生成不同阈值的各维度的传染性疾病的影响因子的量化等级所对应的不同的标签样本数据;
根据所述不同的标签样本数据对所述预设的机器学习模型进行训练,以得到所述传染性疾病的患病风险等级预测模型。
8.一种传染性疾病患病风险等级的预测方法,其特征在于,包括:
获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
确定各所述量化值所对应的量化等级,根据各所述量化等级确定各量化值所对应的风险等级;
获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
9.根据权利要求8所述的传染性疾病患病风险等级的预测方法,其特征在于,在获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重之前,所述方法还包括:获取历史数据中各维度的传染性疾病的影响因子所对应的风险等级的频率分布;
根据所述频率分布确定所述各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重。
10.一种传染性疾病患病风险等级的预测装置,其特征在于,包括:
影响因子的相关信息获取模块,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
量化处理模块,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
风险等级预测模块,被配置为将各所述量化值输入到传染性疾病的患病风险等级预测模型中,以根据所述传染性疾病的患病风险等级预测模型的预测结果确定所述当前用户的患病风险等级。
11.一种传染性疾病患病风险等级的预测装置,其特征在于,包括:
影响因子相关信息获取模块,被配置为获取当前用户关于多个维度的传染性疾病的影响因子的相关信息;
量化处理模块,被配置为对各所述相关信息进行量化处理,以得到所述当前用户在各维度的传染性疾病的影响因子的量化值;
量化等级确定模块,被配置为确定各所述量化值所对应的量化等级,根据各量化等级确定各量化值所对应的风险等级;
风险等级确定模块,被配置为获取各维度的传染性疾病的影响因子对其所对应的风险等级的影响权重,根据所述各量化值所对应的风险等级和所述影响权重确定所述当前用户的风险等级。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的传染性疾病患病风险等级的预测方法和/或如权利要求8或9所述的传染性疾病患病风险等级的预测方法。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的传染性疾病患病风险等级的预测方法和/或如权利要求8或9所述的传染性疾病患病风险等级的预测方法。
CN202010632741.7A 2020-07-01 2020-07-01 传染性疾病患病风险等级的预测方法及装置、介质、设备 Active CN111785380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010632741.7A CN111785380B (zh) 2020-07-01 2020-07-01 传染性疾病患病风险等级的预测方法及装置、介质、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010632741.7A CN111785380B (zh) 2020-07-01 2020-07-01 传染性疾病患病风险等级的预测方法及装置、介质、设备

Publications (2)

Publication Number Publication Date
CN111785380A true CN111785380A (zh) 2020-10-16
CN111785380B CN111785380B (zh) 2022-12-02

Family

ID=72759363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010632741.7A Active CN111785380B (zh) 2020-07-01 2020-07-01 传染性疾病患病风险等级的预测方法及装置、介质、设备

Country Status (1)

Country Link
CN (1) CN111785380B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112242201A (zh) * 2020-10-28 2021-01-19 中国人民解放军国防科技大学 一种基于图计算的病毒传播风险预警方法、装置及设备
CN112309529A (zh) * 2020-11-02 2021-02-02 常州市第一人民医院 一种基于人工智能的感染控制管理方法及系统
CN112509699A (zh) * 2020-12-28 2021-03-16 医渡云(北京)技术有限公司 健康识别码的生成方法及装置、存储介质、电子设备
CN112669986A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于相似大数据深度学习的传染病协同预测方法和机器人
CN112768074A (zh) * 2021-01-19 2021-05-07 大禹(上海)医疗健康科技有限公司 一种基于人工智能的重疾风险预测方法及系统
CN113113154A (zh) * 2021-04-16 2021-07-13 南方科技大学 一种传染病防控方法、装置、计算机设备及存储介质
CN113948219A (zh) * 2021-10-26 2022-01-18 平安科技(深圳)有限公司 传染病数据处理方法、装置、计算机及存储介质
CN114067935A (zh) * 2021-11-03 2022-02-18 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN114121301A (zh) * 2021-11-26 2022-03-01 中科麦迪人工智能研究院(苏州)有限公司 传染病应急预案构建方法、装置、电子设备及存储介质
WO2022100687A1 (zh) * 2020-11-12 2022-05-19 医渡云(北京)技术有限公司 融合决策方法及装置、计算机可读存储介质及电子设备
WO2022100062A1 (zh) * 2020-11-12 2022-05-19 平安科技(深圳)有限公司 风险管控方法、装置、电子设备和存储介质
WO2022148051A1 (zh) * 2021-01-07 2022-07-14 南方科技大学 区块链风险值管理方法、装置、电子设备及存储介质
WO2022217713A1 (zh) * 2021-04-16 2022-10-20 平安科技(深圳)有限公司 症候群监测预警方法、装置、计算机设备及存储介质
WO2022246707A1 (zh) * 2021-05-26 2022-12-01 京东方科技集团股份有限公司 疾病风险预测方法、装置、存储介质及电子设备
CN116721781A (zh) * 2023-07-11 2023-09-08 中国科学院地理科学与资源研究所 虫媒传染病传播风险的预测方法、装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389465A (zh) * 2015-10-29 2016-03-09 徐翼 病历数据处理方法、装置以及系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置
CN110838366A (zh) * 2019-10-15 2020-02-25 平安科技(深圳)有限公司 一种患病风险的预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389465A (zh) * 2015-10-29 2016-03-09 徐翼 病历数据处理方法、装置以及系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置
CN110838366A (zh) * 2019-10-15 2020-02-25 平安科技(深圳)有限公司 一种患病风险的预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
应申等: "地理位置关联的COVID‑19 传播时空分析", 《武汉大学学报》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112242201A (zh) * 2020-10-28 2021-01-19 中国人民解放军国防科技大学 一种基于图计算的病毒传播风险预警方法、装置及设备
CN112309529A (zh) * 2020-11-02 2021-02-02 常州市第一人民医院 一种基于人工智能的感染控制管理方法及系统
WO2022100687A1 (zh) * 2020-11-12 2022-05-19 医渡云(北京)技术有限公司 融合决策方法及装置、计算机可读存储介质及电子设备
WO2022100062A1 (zh) * 2020-11-12 2022-05-19 平安科技(深圳)有限公司 风险管控方法、装置、电子设备和存储介质
CN112509699A (zh) * 2020-12-28 2021-03-16 医渡云(北京)技术有限公司 健康识别码的生成方法及装置、存储介质、电子设备
CN112669986A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于相似大数据深度学习的传染病协同预测方法和机器人
WO2022148051A1 (zh) * 2021-01-07 2022-07-14 南方科技大学 区块链风险值管理方法、装置、电子设备及存储介质
CN112768074A (zh) * 2021-01-19 2021-05-07 大禹(上海)医疗健康科技有限公司 一种基于人工智能的重疾风险预测方法及系统
CN113113154A (zh) * 2021-04-16 2021-07-13 南方科技大学 一种传染病防控方法、装置、计算机设备及存储介质
WO2022217713A1 (zh) * 2021-04-16 2022-10-20 平安科技(深圳)有限公司 症候群监测预警方法、装置、计算机设备及存储介质
WO2022246707A1 (zh) * 2021-05-26 2022-12-01 京东方科技集团股份有限公司 疾病风险预测方法、装置、存储介质及电子设备
CN113948219A (zh) * 2021-10-26 2022-01-18 平安科技(深圳)有限公司 传染病数据处理方法、装置、计算机及存储介质
CN114067935A (zh) * 2021-11-03 2022-02-18 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN114067935B (zh) * 2021-11-03 2022-05-20 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN114121301A (zh) * 2021-11-26 2022-03-01 中科麦迪人工智能研究院(苏州)有限公司 传染病应急预案构建方法、装置、电子设备及存储介质
CN116721781A (zh) * 2023-07-11 2023-09-08 中国科学院地理科学与资源研究所 虫媒传染病传播风险的预测方法、装置、电子设备及介质
CN116721781B (zh) * 2023-07-11 2024-08-20 中国科学院地理科学与资源研究所 虫媒传染病传播风险的预测方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN111785380B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN111785380B (zh) 传染性疾病患病风险等级的预测方法及装置、介质、设备
Muscatello et al. An automated, broad-based, near real-time public health surveillance system using presentations to hospital Emergency Departments in New South Wales, Australia
CN109492858B (zh) 基于机器学习的员工绩效预测方法及装置、设备、介质
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
Pizzo et al. IATos: AI-powered pre-screening tool for COVID-19 from cough audio samples
CN112509699A (zh) 健康识别码的生成方法及装置、存储介质、电子设备
CN112562863A (zh) 流行病监测预警方法、装置、电子设备
CN111582645B (zh) 基于因子分解机的app风险评估方法、装置和电子设备
CN111161884A (zh) 针对不平衡数据的疾病预测方法、装置、设备及介质
Zheng et al. Autism classification based on logistic regression model
CN115330435A (zh) 一种碳排放权价格指标体系建立方法、装置、设备及介质
CN115130232A (zh) 零件的寿命预测方法、装置、设备、存储介质及程序产品
CN110782128A (zh) 一种用户职业标签生成方法、装置和电子设备
Subbotin et al. Application of recurrent neural networks with controlled elements for accuracy enhancement in recognition of sound events in a fog computing environment
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
CN116012205B (zh) 一种老年护理师的智能培训管理方法及系统
CN114743690A (zh) 传染病的预警方法、装置、介质及电子设备
CN114864037B (zh) 医疗辅具推荐方法及装置、可读存储介质及电子设备
CN112288117A (zh) 目标客户的成交概率预测方法、装置与电子设备
Pickles The analysis of residence histories and other longitudinal panel data: A continuous time mixed markov renewal model incorporating exogeneous variables
CN115293636A (zh) 基于综合pis与权重的fmea的复杂装备评估方法
CN117035388A (zh) 目标场所的风险评估方法及系统、终端设备、存储介质
CN115376692A (zh) 一种健康数据的处理方法、装置、电子设备及存储介质
CN113128739B (zh) 用户触达时间的预测方法、预测模型训练方法及相关装置
CN113516398A (zh) 基于分层抽样的风险设备识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant