CN108597617A - 流行病分级预测方法及装置、计算机装置和可读存储介质 - Google Patents

流行病分级预测方法及装置、计算机装置和可读存储介质 Download PDF

Info

Publication number
CN108597617A
CN108597617A CN201810322432.2A CN201810322432A CN108597617A CN 108597617 A CN108597617 A CN 108597617A CN 201810322432 A CN201810322432 A CN 201810322432A CN 108597617 A CN108597617 A CN 108597617A
Authority
CN
China
Prior art keywords
epidemic disease
model
time point
epiphytotics
forecast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810322432.2A
Other languages
English (en)
Other versions
CN108597617B (zh
Inventor
阮晓雯
徐亮
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810322432.2A priority Critical patent/CN108597617B/zh
Priority to PCT/CN2018/099649 priority patent/WO2019196281A1/zh
Priority to JP2019572829A priority patent/JP6893259B2/ja
Publication of CN108597617A publication Critical patent/CN108597617A/zh
Application granted granted Critical
Publication of CN108597617B publication Critical patent/CN108597617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种流行病分级预测方法,所述方法对流行病预测模型进行训练和测试,得到优化后的流行病预测模型,利用优化后的流行病预测模型对待测时间点之前的流行病监测数据进行预测,基于所述流行病预测模型确定分级时间窗大小,根据待测时间点之前的各个时间点的预测结果及所述分级时间窗大小对待测时间点的流行病风险等级进行判定。本发明还提供一种流行病分级预测装置、计算机装置及可读存储介质。本发明可以提高流行病风险等级判定的准确性。

Description

流行病分级预测方法及装置、计算机装置和可读存储介质
技术领域
本发明涉及疾病预测技术领域,具体涉及一种流行病分级预测方法及装置、计算机装置和计算机可读存储介质。
背景技术
流行病预测预警是根据收集到的流行病疫情报告和疫情监测资料,对疫情发生的区域、规模等进行综合评估和预测,然后在一定范围内,采取适当的方式预先发布事件威胁警告,进而及时发现爆发和流行苗头。目前,流行病疫情预测已成为疾病监测信息体系的重要内容。
然而,现有的流行病分级预测方法无法获得较好的分级预测结果。
发明内容
鉴于以上内容,有必要提出一种流行病分级预测方法及装置、计算机装置和计算机可读存储介质,其可以提高流行病风险等级判定的准确性。
本申请的第一方面提供一种流行病分级预测方法,所述方法包括:
(1)建立流行病预测模型;
(2)利用第一训练数据对所述流行病预测模型进行训练;
(3)利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果满足预设条件,则执行(5);
(4)若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调,然后执行(5);
(5)利用第二训练数据确定基于所述流行病预测模型进行流行病风险等级判定的分级时间窗大小,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内;
(6)利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期;
(7)计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;
(8)根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值;
(9)根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
另一种可能的实现方式中,所述步骤(5)包括:
利用所述流行病预测模型对预设时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述预设时间点之前分级时间窗大小时间内的流行病流行期与流行病非流行期;
根据所述第二训练数据计算所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;
根据所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差,计算流行病风险等级划分阈值;
根据所述流行病风险等级划分阈值判定所述预设时间点的流行病风险等级;
若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,则判断所述预设时间点是否在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,则判断所述预设时间点是否在真实的流行病非流行期内;
若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,且所述预设时间点在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,且所述预设时间点在真实的流行病非流行期内,则调整所述分级时间窗大小。
另一种可能的实现方式中,所述流行病预测模型包括累积和预测模型、指数加权移动平均值预测模型和移动百分位预测模型。
另一种可能的实现方式中,所述步骤(2)包括:
利用所述流行病预测模型对所述第一训练数据进行预测,将所述第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数。
另一种可能的实现方式中,所述将所述第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数包括:
计算所述流行病预测模型对所述第一训练数据的预测结果的准确度、特异度、及时性,基于所述准确度、特异度、及时性调整或选取所述流行病预测模型的参数。
另一种可能的实现方式中,所述流行病监测数据通过在预设区域建立由多个监测点组成的流行病监测网络,从所述监测点获取得到。
另一种可能的实现方式中,所述监测点包括满足预设人数或规模的医疗机构、学校和幼托机构、药店。
本申请的第二方面提供一种流行病分级预测装置,所述装置包括:
建立单元,用于建立流行病预测模型;
训练单元,用于利用第一训练数据对所述流行病预测模型进行训练;
测试单元,用于利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调;
确定单元,用于利用第二训练数据确定基于所述流行病预测模型进行流行病风险等级判定的分级时间窗大小,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内;
预测单元,用于利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期;计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值;根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序以实现所述流行病分级预测方法。
本申请的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述流行病分级预测方法。
本发明对流行病预测模型进行训练和测试,得到优化后的流行病预测模型,利用优化后的流行病预测模型对待测时间点之前的流行病监测数据进行预测,基于所述流行病预测模型确定分级时间窗大小,根据待测时间点之前的各个时间点的预测结果及所述分级时间窗大小对待测时间点的流行病风险等级进行判定。由于流行病风险等级判定所使用的时间窗大小是基于所述流行病预测模型确定的,因此,本发明可以提高流行病风险等级判定的准确性。
附图说明
图1是本发明实施例一提供的流行病分级预测方法的流程图。
图2是图1中步骤105的细化流程图。
图3是本发明实施例二提供的流行病分级预测装置的结构图。
图4是本发明实施例三提供的计算机装置的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
优选地,本发明的流行病分级预测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一
图1是本发明实施例一提供的流行病分级预测方法的流程图。所述流行病分级预测方法应用于计算机装置。所述流行病分级预测方法可以根据待测时间点之前的流行病监测数据,预测待测时间点的流行病风险等级。
如图1所示,所述流行病分级预测方法具体包括以下步骤:
步骤101,建立流行病预测模型。
所述流行病预测模型用于根据流行病监测数据预测流行病流行期与流行病非流行期。
所述流行病监测数据为时间序列数据。所述流行病监测数据可以包括流行病的就诊数、就诊率、发病数、发病率等流行病患病数据。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。又如,可以从学校获取学生的流行病(例如流感)的每日发病数,将流行病(例如流感)的每日发病数作为流行病监测数据。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。
可以在预设区域(例如省、市、地区)建立由多个监测点组成的流行病监测网络,从所述监测点获取所述流行病监测数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行流行病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。
不同时间点的流行病患病数据构成所述流行病监测数据(即时间序列数据)。例如,可以将以日为单位采集到的流行病患病数据作为流行病监测数据。或者,可以将以周为单位采集到的流行病患病数据作为流行病监测数据。
医疗机构(主要包括医院)是最能捕捉流行病早期暴发预兆的场所,是开展流行病监测的首选。可以根据病人就诊情况,获取流行病监测数据。
一部分流行病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取流行病监测数据。
儿童和青少年是流行病的高危人群以及流行病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年流行病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得流行病监测数据。
因此,本发明中主要选择医疗机构、学校和幼托机构、药店这三类场所进行流行病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入流行病监测范围,获取宾馆入住人员的流行病监测数据。
根据需要,可以只取任意一类监控点(例如医疗机构)采集的流行病监测数据。例如,可以只取医院采集的流行病监测数据。或者,可以结合多类监控点采集的流行病监测数据。例如,可以以医院采集的流行病监测数据为主,以药店参加的流行病监测数据作为补充。
所述流行病预测模型可以包括CUSUM(Cumulative Sum,累积和)预测模型、EWMA(Exponentially Weighted Moving-Average,指数加权移动平均值)预测模型和移动百分位预测模型。以下分别对这三种模型进行介绍。
(1)CUSUM预测模型
CUSUM预测模型通过将实际值(即流行病监测数据)与参考值之间的小偏差累加起来,达到放大的效果,提高了预测过程中小偏差的灵敏度,当偏差累积到一定程度超过阈值时,则认为出现转折,即流行病从非流行期转到了流行期。
设流行病监测数据X服从正态分布,w为CUSUM预测模型的时间窗大小,初始CUSUM值为C0=0,则时间点t的CUSUM值Ct和阈值Ht为:
Ct=max{0,Xt-(μw+k1σw)+Ct-1}
Ht=hσt
w为CUSUM预测模型的时间窗大小,例如,流行病监测数据X为每日的流行病患病数据时,w可以取7,表示7天(即一周)。μw为时间点t-w到t-1(长度为w)X的均值,σw为时间点t-w到t-1(长度为w)X的标准差。k1为可调参数,一般在(0,3]内取值。
若Ct大于阈值Ht=hσt,则认为进入流行病流行期。h为可调参数,一般取1、2、3。σt为时间点t的历史数据的标准差。
Ct是基于上一时间点的值生成的下一时间点的值,根据Ct与Ht,可以快速判定流行病流行期与流行病非流行期的起始。若CUSUM值Ct大于阈值Ht,则进入流行病流行期。若CUSUM值Ct小于或等于阈值Ht,则进入流行病非流行期。
(2)EWMA预测模型
EWMA是以指数式递减加权的移动平均。各数值的加权影响力随时间而指数式递减,越近期的数据加权影响力越重,但较旧的数据也给予一定的加权值。
设流行病监测数据X服从正态分布Xt~N(μ,σ2),初始值Z0=X0,则时间点t的EWMA值为:
Zt=λ×Xt+(1-λ)×Zt-1
若时间点t下的EWMA值Zt大于UCL,则认为进入流行病流行期。
常数λ为权重系数,一般在(0,1)内取值。
k2为可调参数,一般在(0,3]内取值。
Zt是基于上一时间点的值生成下一时间点的值,根据Zt和UCL,可以快速判定流行期与非流行期起始。若Zt大于UCL,则进入流行病流行期。若CUSUM值Zt小于或等于UCL,则进入流行病非流行期。
(3)移动百分位预测模型
移动百分位数预测模型是以观察周的往年同期周及其前后预设周(例如前后2周)的流行病监测数据为基线数据,计算指定的百分位数(例如P5,P10,…,P90,P95,P100)作为候选预警阈值,建立预警模型。
例如,流感ILI指数2014年第3周的P80值表示2012-2013年第1-5周共10个周发病率的第80百分位数,取这个值作为2014年第3周的预警阈值。2014第20周的P75值表示2012-2013年第18-22周共10个周发病率的第75百分位数,取这个值作为2014年第3周的预警阈值。
将流行病监测数据和预警阈值作比较,如果流行病监测数据大于预警阈值,则进入流行病流行期。若流行病监测数据小于或等于预警阈值,则进入流行病非流行期。
步骤102,利用第一训练数据对所述流行病预测模型进行训练。
第一训练数据是流行病监测数据。利用第一训练数据对所述流行病预测模型进行训练,就是利用所述流行病预测模型对第一训练数据进行预测,根据第一训练数据的预测结果调整或选取所述流行病预测模型的参数。
例如,利用CUSUM预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果调整所述CUSUM预测模型的时间窗大小w、参数k1和h。
又如,利用EWMA预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果调整所述EWMA预测模型的权重系数λ和参数k2
再如,利用移动百分位预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果选取适合的百分位数(例如第80百分位数)作为所述移动百分位预测模型的预警阈值。
具体地,可以利用所述流行病预测模型对第一训练数据进行预测,将第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数。
真实的流行病流行期/非流行期是通过医学方法来定义的。可以计算所述流行病预测模型对第一训练数据的预测结果的预设指标,根据所述预设指标调整或选取所述流行病预测模型的参数。例如,可以计算所述流行病预测模型对第一训练数据的预测结果的准确度、特异度、及时性三个指标,基于所述三个指标调整或选取所述流行病预测模型的参数。
准确度、特异度、及时性三个指标的计算方法可以如下所示:
准确度=有效预警的天数/真实的流行病流行期的总天数x100%;
特异度=无预警产生的天数/真实的流行病非流行期的总天数x100%;
及时性(即滞后期)=有效预警的流行病流行期的起始日期-真实的流行病流行期的起始日期。
利用所述流行病预测模型来对第一训练数据预测流行病流行期时,如果预测某一天是流行病流行期,同时它落在真实的流行病流行期的范围时间内,则记为有效预警。
步骤103,利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果满足预设条件,则执行步骤105。
所述测试数据是流行病监测数据。利用所述流行病预测模型对测试数据进行预测,目的是验证训练后的流行病预测模型是否满足要求。
可以计算所述测试数据的预测结果的预设指标(例如准确度、特异度、及时性),根据所述测试数据的预测结果的预设指标判断训练后的流行病预测模型是否满足预设条件。例如,判断所述测试数据的预测结果的准确度是否达到预设准确度,和/或判断所述测试数据的预测结果的特异度是否达到预设特异度,和/或判断所述测试数据的预测结果的及时性是否达到预设及时性。若所述测试数据的预测结果的准确度达到预设准确度,和/或所述测试数据的预测结果的特异度达到预设特异度,和/或所述测试数据的预测结果的及时性达到预设及时性,则判断所述流行病预测模型满足预设条件,得到优化好的流行病预测模型。
步骤104,若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调,然后执行步骤105。
若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型的参数进行进一步调整。
例如,若所述CUSUM预测模型对所述测试数据的预测结果不满足预设条件,则进一步调整所述CUSUM预测模型的时间窗大小w、参数k1和h。
又如,若所述EWMA预测模型对所述测试数据的预测结果不满足预设条件,则进一步调整所述EWMA预测模型的权重系数λ、参数k2
再如,若所述EWMA预测模型对所述测试数据的预测结果不满足预设条件,则取第75百分位数(将第80百分位数调整为第75百分位数)作为所述移动百分位预测模型的预警阈值。
步骤105,利用第二训练数据确定基于所述流行病预测模型进行流行病风险等级判定的时间窗大小(以下称分级时间窗大小),使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内。
所述第二训练数据是流行病监测数据。所述第二训练数据可以与所述第一训练数据相同,也可以不同。
确定分级时间窗大小,目的是保证基于所述流行病预测模型判定流行病风险等级的准确性。
在确定分级时间窗大小的过程中,要对分级时间窗大小进行调整,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,利用所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内。
参阅图2所示,确定分级时间窗大小具体可以包括以下步骤:
步骤201,利用所述流行病预测模型对预设时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述预设时间点之前分级时间窗大小时间内的流行病流行期与流行病非流行期。
所述分级时间窗大小的初始值为预设值,例如为3,经过步骤201-205调整为适合的大小,例如为7。
步骤202,根据所述第二训练数据计算所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差。
步骤203,根据所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差,计算流行病风险等级划分阈值。该步骤可以参考后面步骤108的描述。
步骤204,根据所述第二训练数据对应的流行病风险等级划分阈值判定所述预设时间点的流行病风险等级。该步骤可以参考后面步骤109的描述。
步骤205,若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,则判断所述预设时间点是否在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,则判断所述预设时间点是否在真实的流行病非流行期内。
步骤206,若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,且所述预设时间点在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,且所述预设时间点在真实的流行病非流行期内,则调整所述分级时间窗大小。
可以利用不同的第二训练数据按照上述方式对分级时间窗大小进行多次调整,以将分级时间窗大小调整为最佳值。
步骤106,利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。
例如,利用所述CUSUM预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。又如,利用所述CUSUM预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。再如,利用所述移动百分位模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。
步骤107,计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差。
步骤107中,对所述待测时间点之前所述分级时间窗大小时间内的所有流行病非流行期进行统计,计算所述待测时间点之前所述分级时间窗大小时间内所有流行病非流行期的流行病监测数据的均值与标准差。例如,待测时间点之前所述分级时间窗大小时间内包括三个流行病非流行期,则计算所述三个流行病非流行内流行病监测数据的均值与标准差。所述均值与标准差是对所述待测时间点之前所述分级时间窗大小时间内所有流行病非流行期的流行病监测数据计算得到的一个均值和一个标准差。
步骤108,根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值。
所述流行病风险等级划分阈值可以包括高中等级划分阈值、中低等级划分阈值、低/极低等级划分阈值。所述高中等级划分阈值用于划分高风险等级与中风险等级,所述中低等级划分阈值用于划分中风险等级与低风险等级,所述低极等级划分阈值用于划分低风险等级与极低风险等级。
在一具体实施例中,所述非流行期内流行病监测数据的均值为μw,,标准差为σw,,所述高中等级划分阈值为μw,+k′1w′,其中6≤k′1≤9,所述中低等级划分阈值为μw′+k2′*σw′,其中4≤k′2<6,所述中低等级划分阈值为μw'+k3′*σw',2≤k'3<4。例如,所述高中等级划分阈值为μw,+6*σw′,所述中低等级划分阈值为μw′+4*σw′,所述中低等级划分阈值为μw′+2*σw′
在其他的实施例中,所述流行病风险等级划分阈值可以包括其他数量和类型。例如,所述流行病风险等级划分阈值可以包括高中等级划分阈值和中低等级划分阈值。又如,所述流行病风险等级划分阈值可以包括极高/高等级划分阈值、高中等级划分阈值、中低等级划分阈值、低/极低等级划分阈值。
步骤109,根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
例如,若待测时间点的流行病监测数据大于或等于所述高中等级划分阈值,则判定所述待测时间点的流行病风险等级为高风险等级。若待测时间点的流行病监测数据小于所述高中等级划分阈值并且大于或等于所述高中等级划分阈值,则判定所述待测时间点的流行病风险等级为中风险等级。若待测时间点的流行病监测数据小于所述中低等级划分阈值并且大于或等于所述低/极低等级划分阈值,则判定所述待测时间点的流行病风险等级为低风险等级。若待测时间点的流行病监测数据小于所述低/极低等级划分阈值,则判定所述待测时间点的流行病风险等级为极低风险等级。
在一实施例中,可以结合CUSUM预测模型、EWMA预测模型和移动百分位预测模型进行流行病分级预测。具体地,根据步骤101-109的方法,基于CUSUM预测模型判定待测时间点为第一流行病风险等级,基于EWMA预测模型判定待测时间点为第二流行病风险等级,基于移动百分位预测模型判定待测时间点为第三流行病风险等级,根据所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级得到最终的流行病风险等级。可以判断所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级是否有至少两个流行病风险等级一致,若所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级中至少有两个流行病风险等级一致,则以该一致的流行病风险等级作为最终的流行病风险等级。
实施例一的流行病分级预测方法对流行病预测模型进行训练和测试,得到优化后的流行病预测模型,利用优化后的流行病预测模型对待测时间点之前的流行病监测数据进行预测,基于所述流行病预测模型确定分级时间窗大小,根据待测时间点之前的各个时间点的预测结果及所述分级时间窗大小对待测时间点的流行病风险等级进行判定。由于流行病风险等级判定所使用的时间窗大小是基于所述流行病预测模型确定的,因此,实施例一可以提高流行病风险等级判定的准确性。
实施例二
图3为本发明实施例二提供的流行病分级预测装置的结构图。如图3所示,所述流行病分级预测装置10可以包括:建立单元301、训练单元302、测试单元303、确定单元304、预测单元305。
建立单元301,用于建立流行病预测模型。
所述流行病预测模型用于根据流行病监测数据预测流行病流行期与流行病非流行期。
所述流行病监测数据为时间序列数据。所述流行病监测数据可以包括流行病的就诊数、就诊率、发病数、发病率等流行病患病数据。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。又如,可以从学校获取学生的流行病(例如流感)的每日发病数,将流行病(例如流感)的每日发病数作为流行病监测数据。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。
可以在预设区域(例如省、市、地区)建立由多个监测点组成的流行病监测网络,从所述监测点获取所述流行病监测数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行流行病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。
不同时间点的流行病患病数据构成所述流行病监测数据(即时间序列数据)。例如,可以将以日为单位采集到的流行病患病数据作为流行病监测数据。或者,可以将以周为单位采集到的流行病患病数据作为流行病监测数据。
医疗机构(主要包括医院)是最能捕捉流行病早期暴发预兆的场所,是开展流行病监测的首选。可以根据病人就诊情况,获取流行病监测数据。
一部分流行病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取流行病监测数据。
儿童和青少年是流行病的高危人群以及流行病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年流行病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得流行病监测数据。
因此,本发明中主要选择医疗机构、学校和幼托机构、药店这三类场所进行流行病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入流行病监测范围,获取宾馆入住人员的流行病监测数据。
根据需要,可以只取任意一类监控点(例如医疗机构)采集的流行病监测数据。例如,可以只取医院采集的流行病监测数据。或者,可以结合多类监控点采集的流行病监测数据。例如,可以以医院采集的流行病监测数据为主,以药店参加的流行病监测数据作为补充。
所述流行病预测模型可以包括CUSUM(Cumulative Sum,累积和)预测模型、EWMA(Exponentially Weighted Moving-Average,指数加权移动平均值)预测模型和移动百分位预测模型。以下分别对这三种模型进行介绍。
(1)CUSUM预测模型
CUSUM预测模型通过将实际值(即流行病监测数据)与参考值之间的小偏差累加起来,达到放大的效果,提高了预测过程中小偏差的灵敏度,当偏差累积到一定程度超过阈值时,则认为出现转折,即流行病从非流行期转到了流行期。
设流行病监测数据X服从正态分布,w为CUSUM预测模型的时间窗大小,初始CUSUM值为C0=0,则时间点t的CUSUM值Ct和阈值Ht为:
Ct=max{0,Xt-(μw+k1σw)+Ct-1}
Ht=hσt
w为CUSUM预测模型的时间窗大小,例如,流行病监测数据X为每日的流行病患病数据时,w可以取7,表示7天(即一周)。μw为时间点t-w到t-1(长度为w)X的均值,σw为时间点t-w到t-1(长度为w)X的标准差。k1为可调参数,一般在(0,3]内取值。
若Ct大于阈值Ht=hσt,则认为进入流行病流行期。h为可调参数,一般取1、2、3。σt为时间点t的历史数据的标准差。
Ct是基于上一时间点的值生成的下一时间点的值,根据Ct与Ht,可以快速判定流行病流行期与流行病非流行期的起始。若CUSUM值Ct大于阈值Ht,则进入流行病流行期。若CUSUM值Ct小于或等于阈值Ht,则进入流行病非流行期。
(2)EWMA预测模型
EWMA是以指数式递减加权的移动平均。各数值的加权影响力随时间而指数式递减,越近期的数据加权影响力越重,但较旧的数据也给予一定的加权值。
设流行病监测数据X服从正态分布Xt~N(μ,σ2),初始值Z0=X0,则时间点t的EWMA值为:
Zt=λ×Xt+(1-λ)×Zt-1
若时间点t下的EWMA值Zt大于UCL,则认为进入流行病流行期。
常数λ为权重系数,一般在(0,1)内取值。
k2为可调参数,一般在(0,3]内取值。
Zt是基于上一时间点的值生成下一时间点的值,根据Zt和UCL,可以快速判定流行期与非流行期起始。若Zt大于UCL,则进入流行病流行期。若CUSUM值Zt小于或等于UCL,则进入流行病非流行期。
(3)移动百分位预测模型
移动百分位数预测模型是以观察周的往年同期周及其前后预设周(例如前后2周)的流行病监测数据为基线数据,计算指定的百分位数(例如P5,P10,…,P90,P95,P100)作为候选预警阈值,建立预警模型。
例如,流感ILI指数2014年第3周的P80值表示2012-2013年第1-5周共10个周发病率的第80百分位数,取这个值作为2014年第3周的预警阈值。2014第20周的P75值表示2012-2013年第18-22周共10个周发病率的第75百分位数,取这个值作为2014年第3周的预警阈值。
将流行病监测数据和预警阈值作比较,如果流行病监测数据大于预警阈值,则进入流行病流行期。若流行病监测数据小于或等于预警阈值,则进入流行病非流行期。
训练单元302,用于利用第一训练数据对所述流行病预测模型进行训练。
第一训练数据是流行病监测数据。利用第一训练数据对所述流行病预测模型进行训练,就是利用所述流行病预测模型对第一训练数据进行预测,根据第一训练数据的预测结果调整或选取所述流行病预测模型的参数。
例如,利用CUSUM预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果调整所述CUSUM预测模型的时间窗大小w、参数k1和h。
又如,利用EWMA预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果调整所述EWMA预测模型的权重系数λ和参数k2
再如,利用移动百分位预测模型对第一训练数据进行流行病预测,根据第一训练数据的预测结果选取适合的百分位数(例如第80百分位数)作为所述移动百分位预测模型的预警阈值。
具体地,可以利用所述流行病预测模型对第一训练数据进行预测,将第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数。
真实的流行病流行期/非流行期是通过医学方法来定义的。可以计算所述流行病预测模型对第一训练数据的预测结果的预设指标,根据所述预设指标调整或选取所述流行病预测模型的参数。例如,可以计算所述流行病预测模型对第一训练数据的预测结果的准确度、特异度、及时性三个指标,基于所述三个指标调整或选取所述流行病预测模型的参数。
准确度、特异度、及时性三个指标的计算方法可以如下所示:
准确度=有效预警的天数/真实的流行病流行期的总天数x100%;
特异度=无预警产生的天数/真实的流行病非流行期的总天数x100%;
及时性(即滞后期)=有效预警的流行病流行期的起始日期-真实的流行病流行期的起始日期。
利用所述流行病预测模型来对第一训练数据预测流行病流行期时,如果预测某一天是流行病流行期,同时它落在真实的流行病流行期的范围时间内,则记为有效预警。
测试单元303,用于利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调。
所述测试数据是流行病监测数据。利用所述流行病预测模型对测试数据进行预测,目的是验证训练后的流行病预测模型是否满足要求。
可以计算所述测试数据的预测结果的预设指标(例如准确度、特异度、及时性),根据所述测试数据的预测结果的预设指标判断训练后的流行病预测模型是否满足预设条件。例如,判断所述测试数据的预测结果的准确度是否达到预设准确度,和/或判断所述测试数据的预测结果的特异度是否达到预设特异度,和/或判断所述测试数据的预测结果的及时性是否达到预设及时性。若所述测试数据的预测结果的准确度达到预设准确度,和/或所述测试数据的预测结果的特异度达到预设特异度,和/或所述测试数据的预测结果的及时性达到预设及时性,则判断所述流行病预测模型满足预设条件,得到优化好的流行病预测模型。
若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型的参数进行进一步调整。
例如,若所述CUSUM预测模型对所述测试数据的预测结果不满足预设条件,则进一步调整所述CUSUM预测模型的时间窗大小w、参数k1和h。
又如,若所述EWMA预测模型对所述测试数据的预测结果不满足预设条件,则进一步调整所述EWMA预测模型的权重系数λ、参数k2
再如,若所述EWMA预测模型对所述测试数据的预测结果不满足预设条件,则取第75百分位数(将第80百分位数调整为第75百分位数)作为所述移动百分位预测模型的预警阈值。
确定单元304,用于利用第二训练数据,确定基于所述流行病预测模型进行流行病风险等级判定的时间窗大小(以下称分级时间窗大小),使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内。
所述第二训练数据为流行病监测数据。所述第二训练数据可以与所述第一训练数据相同,也可以不同。
确定分级时间窗大小,目的是保证基于所述流行病预测模型判定流行病风险等级的准确性。
在确定分级时间窗大小的过程中,要对分级时间窗大小进行调整,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,利用所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内。
确定单元304可以按照如下方法确定分级时间窗大小:
(1)根据第二训练数据,利用所述流行病预测模型对预设时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述预设时间点之前分级时间窗大小时间内的流行病流行期与流行病非流行期。
所述分级时间窗大小的初始值为预设值,例如为3,确定单元304调整后为适合的大小,例如为7。
(2)根据所述第二训练数据计算所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差。
(3)根据所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差,计算流行病风险等级划分阈值。
(4)根据所述流行病风险等级划分阈值判定所述预设时间点的流行病风险等级。
(5)若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,则判断所述预设时间点是否在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,则判断所述预设时间点是否在真实的流行病非流行期内。
(6)若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,且所述预设时间点在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,且所述预设时间点在真实的流行病非流行期内,则调整所述分级时间窗大小。
可以利用不同的第二训练数据按照上述方式对分级时间窗大小进行多次调整,以将分级时间窗大小调整为最佳值。
预测单元305,用于利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。
例如,利用所述CUSUM预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。又如,利用所述CUSUM预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。再如,利用所述移动百分位模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期。
预测单元305,还用于计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差。
对所述待测时间点之前所述分级时间窗大小时间内的所有流行病非流行期进行统计,计算所述待测时间点之前所述分级时间窗大小时间内所有流行病非流行期的流行病监测数据的均值与标准差。例如,待测时间点之前所述分级时间窗大小时间内包括三个流行病非流行期,则计算所述三个流行病非流行内流行病监测数据的均值与标准差。所述均值与标准差是对所述待测时间点之前所述分级时间窗大小时间内所有流行病非流行期的流行病监测数据计算得到的一个均值和一个标准差。
预测单元305,还用于根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值。
所述流行病风险等级划分阈值可以包括高中等级划分阈值、中低等级划分阈值、低/极低等级划分阈值。所述高中等级划分阈值用于划分高风险等级与中风险等级,所述中低等级划分阈值用于划分中风险等级与低风险等级,所述低极等级划分阈值用于划分低风险等级与极低风险等级。
在一具体实施例中,所述非流行期内流行病监测数据的均值为μw′,标准差为σw′,所述高中等级划分阈值为μw′+k′1w′,其中6≤k′1≤9,所述中低等级划分阈值为μw′+k2′*σw′,其中4≤k′2<6,所述中低等级划分阈值为μw′+k3′*σw',2≤k'3<4。例如,所述高中等级划分阈值为μw'+6*σw′,所述中低等级划分阈值为μw′+4*σw′,所述中低等级划分阈值为μw′+2*σw′
在其他的实施例中,所述流行病风险等级划分阈值可以包括其他数量和类型。例如,所述流行病风险等级划分阈值可以包括高中等级划分阈值和中低等级划分阈值。又如,所述流行病风险等级划分阈值可以包括极高/高等级划分阈值、高中等级划分阈值、中低等级划分阈值、低/极低等级划分阈值。
预测单元305,还用于根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
例如,若待测时间点的流行病监测数据大于或等于所述高中等级划分阈值,则判定所述待测时间点的流行病风险等级为高风险等级。若待测时间点的流行病监测数据小于所述高中等级划分阈值并且大于或等于所述高中等级划分阈值,则判定所述待测时间点的流行病风险等级为中风险等级。若待测时间点的流行病监测数据小于所述中低等级划分阈值并且大于或等于所述低/极低等级划分阈值,则判定所述待测时间点的流行病风险等级为低风险等级。若待测时间点的流行病监测数据小于所述低/极低等级划分阈值,则判定所述待测时间点的流行病风险等级为极低风险等级。
在一实施例中,所述流行病分级预测装置10可以结合CUSUM预测模型、EWMA预测模型和移动百分位预测模型进行流行病分级预测。具体地,所述流行病分级预测装置10基于CUSUM预测模型判定待测时间点为第一流行病风险等级,基于EWMA预测模型判定待测时间点为第二流行病风险等级,基于移动百分位预测模型判定待测时间点为第三流行病风险等级,根据所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级得到最终的流行病风险等级。可以判断所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级是否有至少两个一致,若所述第一流行病风险等级、所述第二流行病风险等级和所述第三流行病风险等级中至少有两个一致,则以该一致的流行病风险等级作为最终的流行病风险等级。
实施例二的流行病分级预测装置10对流行病预测模型进行训练和测试,得到优化后的流行病预测模型,利用优化后的流行病预测模型对待测时间点之前的流行病监测数据进行预测,基于所述流行病预测模型确定分级时间窗大小,根据待测时间点之前的各个时间点的预测结果及所述分级时间窗大小对待测时间点的流行病风险等级进行判定。由于流行病风险等级判定所使用的时间窗大小是基于所述流行病预测模型确定的,因此,实施例二可以提高流行病风险等级判定的准确性。
实施例三
图4为本发明实施例三提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如流行病分级预测程序。所述处理器30执行所述计算机程序40时实现上述流行病分级预测方法实施例中的步骤,例如图1所示的步骤101-109。或者,所述处理器30执行所述计算机程序40时实现上述装置实施例中各模块/单元的功能,例如图3中的单元301-305。
示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图3中的建立单元301、训练单元302、测试单元303、确定单元304、预测单元305,各单元具体功能参见实施例二。
所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图4仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种流行病分级预测方法,其特征在于,所述方法包括:
(1)建立流行病预测模型;
(2)利用第一训练数据对所述流行病预测模型进行训练;
(3)利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果满足预设条件,则执行(5);
(4)若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调,然后执行(5);
(5)利用第二训练数据确定基于所述流行病预测模型进行流行病风险等级判定的分级时间窗大小,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内;
(6)利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期;
(7)计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;
(8)根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值;
(9)根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
2.如权利要求1所述的方法,其特征在于,所述步骤(5)包括:
利用所述流行病预测模型对预设时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述预设时间点之前分级时间窗大小时间内的流行病流行期与流行病非流行期;
根据所述第二训练数据计算所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;
根据所述预设时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差,计算流行病风险等级划分阈值;
根据所述流行病风险等级划分阈值判定所述预设时间点的流行病风险等级;
若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,则判断所述预设时间点是否在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,则判断所述预设时间点是否在真实的流行病非流行期内;
若所述预设时间点的流行病风险等级为中风险等级及中风险以上等级,且所述预设时间点在真实的流行病流行期内,或者,若所述预设时间点的流行病风险等级为低风险及中风险以下等级,且所述预设时间点在真实的流行病非流行期内,则调整所述分级时间窗大小。
3.如权利要求1所述的方法,其特征在于,所述流行病预测模型包括累积和预测模型、指数加权移动平均值预测模型和移动百分位预测模型。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述步骤(2)包括:
利用所述流行病预测模型对所述第一训练数据进行预测,将所述第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数。
5.如权利要求4所述的方法,其特征在于,所述将所述第一训练数据的预测结果与真实的流行病流行期/非流行期划分结果进行比较,根据比较结果调整或选取所述流行病预测模型的参数包括:
计算所述流行病预测模型对所述第一训练数据的预测结果的准确度、特异度、及时性,基于所述准确度、特异度、及时性调整或选取所述流行病预测模型的参数。
6.如权利要求1至3中任一项所述的方法,其特征在于,所述流行病监测数据通过在预设区域建立由多个监测点组成的流行病监测网络,从所述监测点获取得到。
7.如权利要求6所述的方法,其特征在于,所述监测点包括满足预设人数或规模的医疗机构、学校和幼托机构、药店。
8.一种流行病分级预测装置,其特征在于,所述装置包括:
建立单元,用于建立流行病预测模型;
训练单元,用于利用第一训练数据对所述流行病预测模型进行训练;
测试单元,用于利用所述流行病预测模型对测试数据进行预测,判断所述测试数据的预测结果是否满足预设条件,若所述测试数据的预测结果不满足预设条件,则对所述流行病预测模型进行微调;
确定单元,用于利用第二训练数据确定基于所述流行病预测模型进行流行病风险等级判定的分级时间窗大小,使基于所述流行病预测模型判定为中风险等级及中风险以上等级的时间点在真实的流行病流行期内,基于所述流行病预测模型判定为低风险等级及中风险以下等级的时间点在真实的流行病非流行期内;
预测单元,用于利用所述流行病预测模型对待测时间点之前所述分级时间窗大小时间内的各个时间点进行预测,划分出所述待测时间点之前所述分级时间窗大小时间内的流行病流行期与流行病非流行期;计算所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差;根据所述待测时间点之前所述分级时间窗大小时间内流行病非流行期的流行病监测数据的均值与标准差计算流行病风险等级划分阈值;根据所述流行病风险等级划分阈值判定所述待测时间点的流行病风险等级。
9.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-7中任一项所述流行病分级预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述流行病分级预测方法。
CN201810322432.2A 2018-04-11 2018-04-11 流行病分级预测方法及装置、计算机装置和可读存储介质 Active CN108597617B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810322432.2A CN108597617B (zh) 2018-04-11 2018-04-11 流行病分级预测方法及装置、计算机装置和可读存储介质
PCT/CN2018/099649 WO2019196281A1 (zh) 2018-04-11 2018-08-09 流行病分级预测方法及装置、计算机装置及可读存储介质
JP2019572829A JP6893259B2 (ja) 2018-04-11 2018-08-09 コンピューター装置による感染症クラス分け予測方法、感染症クラス分け予測装置、コンピューター装置、および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810322432.2A CN108597617B (zh) 2018-04-11 2018-04-11 流行病分级预测方法及装置、计算机装置和可读存储介质

Publications (2)

Publication Number Publication Date
CN108597617A true CN108597617A (zh) 2018-09-28
CN108597617B CN108597617B (zh) 2022-05-20

Family

ID=63622046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810322432.2A Active CN108597617B (zh) 2018-04-11 2018-04-11 流行病分级预测方法及装置、计算机装置和可读存储介质

Country Status (3)

Country Link
JP (1) JP6893259B2 (zh)
CN (1) CN108597617B (zh)
WO (1) WO2019196281A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109473180A (zh) * 2018-11-20 2019-03-15 河南省疾病预防控制中心 一种基于b/s架构的疾控机构信息系统
CN109817342A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 流行季预测模型的参数调整方法、装置、设备及存储介质
CN109979601A (zh) * 2018-10-12 2019-07-05 王龙 一种具有自动学习功能的流感预测摄像机
CN110047593A (zh) * 2019-04-12 2019-07-23 平安科技(深圳)有限公司 疾病流行季等级的确定方法、装置、设备及可读存储介质
WO2021114631A1 (zh) * 2020-05-26 2021-06-17 平安科技(深圳)有限公司 数据处理方法、装置、电子设备及可读存储介质
CN113707336A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于数据分析的传染病防治预警方法、装置、设备及介质
CN117095831A (zh) * 2023-10-17 2023-11-21 厦门畅享信息技术有限公司 突发流行病趋势监测方法、系统、介质及电子设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496780B (zh) * 2020-03-19 2023-11-03 北京中科闻歌科技股份有限公司 传染病确诊者数量预测方法、装置、服务器及存储介质
CN111611297B (zh) * 2020-05-21 2023-09-15 中南大学 顾及参数时变性的传播模型建立方法及其预测方法
CN112117010A (zh) * 2020-07-13 2020-12-22 北京大瑞集思技术有限公司 一种传染病智能预警系统及管理平台
CN112509706B (zh) * 2020-11-16 2023-06-06 鹏城实验室 传染病预警方法、装置、设备及计算机可读存储介质
CN112669984B (zh) * 2020-12-30 2023-09-12 华南师范大学 基于大数据人工智能的传染病协同递进监测预警应对方法
CN113793689B (zh) * 2021-08-06 2023-10-24 兰州理工大学 一种基于累积和控制图的流行疾病监控方法
CN114724730B (zh) * 2022-02-18 2024-04-30 深圳平安智慧医健科技有限公司 基于人工智能的传染病预警方法、装置、电子设备及介质
CN115798734B (zh) * 2023-01-09 2023-07-14 杭州杏林信息科技有限公司 基于大数据的新发突发传染病防控方法、装置及储存介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794342A (zh) * 2009-09-30 2010-08-04 中国人民解放军防化指挥工程学院 基于非线性、变系数预测模型的传染病疫情预测分析方法
CN101894309A (zh) * 2009-11-05 2010-11-24 南京医科大学 传染病疫情预测预警方法
CN103310083A (zh) * 2012-03-09 2013-09-18 李晓松 一种传染病聚集性探测与早期预警系统
CN103390091A (zh) * 2012-05-08 2013-11-13 中国人民解放军防化学院 一种传染病疫情优化控制方法
CN107688872A (zh) * 2017-08-20 2018-02-13 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质
CN107871538A (zh) * 2016-12-19 2018-04-03 平安科技(深圳)有限公司 基于宏观因子的大数据预测方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1881227A (zh) * 2006-05-16 2006-12-20 中国人民解放军第三军医大学 传染病疫情诊断及危害度分类智能分析模型技术
JP2011128935A (ja) * 2009-12-18 2011-06-30 Noriaki Aoki 感染症予測システム
WO2013120199A1 (en) * 2012-02-13 2013-08-22 Kamran Khan Warning system for infectious diseases and method therefor
US20140095417A1 (en) * 2012-10-01 2014-04-03 Frederick S.M. Herz Sdi (sdi for epi-demics)
CN105095614A (zh) * 2014-04-18 2015-11-25 国际商业机器公司 更新预测模型的方法和装置
JP6823379B2 (ja) * 2016-04-26 2021-02-03 シスメックス株式会社 モニタリング方法、情報処理装置、情報処理システム、及びコンピュータプログラム
CN107220482B (zh) * 2017-05-09 2019-09-17 清华大学 呼吸道传染病风险评估系统及评估方法
CN107680676B (zh) * 2017-09-26 2021-04-27 电子科技大学 一种基于电子病历数据驱动的妊娠期糖尿病预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794342A (zh) * 2009-09-30 2010-08-04 中国人民解放军防化指挥工程学院 基于非线性、变系数预测模型的传染病疫情预测分析方法
CN101894309A (zh) * 2009-11-05 2010-11-24 南京医科大学 传染病疫情预测预警方法
CN103310083A (zh) * 2012-03-09 2013-09-18 李晓松 一种传染病聚集性探测与早期预警系统
CN103390091A (zh) * 2012-05-08 2013-11-13 中国人民解放军防化学院 一种传染病疫情优化控制方法
CN107871538A (zh) * 2016-12-19 2018-04-03 平安科技(深圳)有限公司 基于宏观因子的大数据预测方法及系统
CN107688872A (zh) * 2017-08-20 2018-02-13 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979601A (zh) * 2018-10-12 2019-07-05 王龙 一种具有自动学习功能的流感预测摄像机
CN109473180A (zh) * 2018-11-20 2019-03-15 河南省疾病预防控制中心 一种基于b/s架构的疾控机构信息系统
CN109817342A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 流行季预测模型的参数调整方法、装置、设备及存储介质
CN110047593A (zh) * 2019-04-12 2019-07-23 平安科技(深圳)有限公司 疾病流行季等级的确定方法、装置、设备及可读存储介质
WO2021114631A1 (zh) * 2020-05-26 2021-06-17 平安科技(深圳)有限公司 数据处理方法、装置、电子设备及可读存储介质
CN113707336A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于数据分析的传染病防治预警方法、装置、设备及介质
CN117095831A (zh) * 2023-10-17 2023-11-21 厦门畅享信息技术有限公司 突发流行病趋势监测方法、系统、介质及电子设备
CN117095831B (zh) * 2023-10-17 2024-01-16 厦门畅享信息技术有限公司 突发流行病趋势监测方法、系统、介质及电子设备

Also Published As

Publication number Publication date
WO2019196281A1 (zh) 2019-10-17
CN108597617B (zh) 2022-05-20
JP6893259B2 (ja) 2021-06-23
JP2020527786A (ja) 2020-09-10

Similar Documents

Publication Publication Date Title
CN108597617A (zh) 流行病分级预测方法及装置、计算机装置和可读存储介质
Fong et al. Composite Monte Carlo decision making under high uncertainty of novel coronavirus epidemic using hybridized deep learning and fuzzy rule induction
Varkevisser et al. Do patients choose hospitals with high quality ratings? Empirical evidence from the market for angioplasty in the Netherlands
US20230237329A1 (en) Method and System Using a Neural Network for Prediction of Stocks and/or Other Market Instruments Price Volatility, Movements and Future Pricing
US20070260563A1 (en) Method to continuously diagnose and model changes of real-valued streaming variables
Moreira et al. A preeclampsia diagnosis approach using Bayesian networks
CN112074915A (zh) 生物医学预测的可视化
Tsoulos et al. Application of machine learning in a Parkinson's disease digital biomarker dataset using neural network construction (NNC) methodology discriminates patient motor status
Trivedi et al. The Impact of Artificial Intelligence Integration on Minimizing Patient Wait Time in Hospitals
CN116029395B (zh) 商业区域的人流预警方法、装置、电子设备及存储介质
CN112992375A (zh) 一种疾病的预警方法、预警装置、设备及介质
Manocha et al. IoT-inspired machine learning-assisted sedentary behavior analysis in smart healthcare industry
Cao et al. Blockchain-enabled HMM model for sports performance prediction
Cao et al. Cluster-based correlation of severe driving events with time and location
Sovia et al. Backpropagation neural network prediction for cryptocurrency bitcoin prices
CN108597616A (zh) 疾病异常数据检测方法及装置、计算机装置及存储介质
US20170140115A1 (en) Intelligent stroke risk prediction and monitoring system
CN114068036B (zh) 一种基于物联网感知的传染传播预测方法及系统
EP4120148A1 (en) Parameter adjusting device, inference device, parameter adjusting method, and parameter adjusting program
Cox Jr What is an exposure-response curve?
Pang et al. Wt model & applications in loan platform customer default prediction based on decision tree algorithms
Fatma et al. Outpatient Diversion using Real-time Length-of-Stay Predictions
Al Mamlook Advanced risk models to predict surgical site infections using machine learning approaches and risk-adjusted control charts
CN117476250B (zh) 基于多目标跟踪的流行病调查预测方法、装置及可读介质
Paliwal Predicting Long-term Outcome of Intracranial Aneurysms Treated with Flow Diverters Using CFD and Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant