CN111564221A - 一种由统计数据驱动的传染病疫情预测方法 - Google Patents

一种由统计数据驱动的传染病疫情预测方法 Download PDF

Info

Publication number
CN111564221A
CN111564221A CN202010192098.0A CN202010192098A CN111564221A CN 111564221 A CN111564221 A CN 111564221A CN 202010192098 A CN202010192098 A CN 202010192098A CN 111564221 A CN111564221 A CN 111564221A
Authority
CN
China
Prior art keywords
epidemic situation
cases
epidemic
time
newly added
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010192098.0A
Other languages
English (en)
Other versions
CN111564221B (zh
Inventor
黄锷
乔方利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Institute of Oceanography MNR
Original Assignee
First Institute of Oceanography MNR
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Institute of Oceanography MNR filed Critical First Institute of Oceanography MNR
Priority to CN202010192098.0A priority Critical patent/CN111564221B/zh
Publication of CN111564221A publication Critical patent/CN111564221A/zh
Application granted granted Critical
Publication of CN111564221B publication Critical patent/CN111564221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种由统计数据驱动的传染病疫情预测方法,包括:获取疫情统计数据步骤,用于获取疫情期间每日的新增确诊病例数量、新增治愈病例数量及病例的潜伏期预估,所述新增确诊病例数量表示为时间序列N(t),所述新增治愈病例数量表示为时间序列R(t);预处理疫情统计数据步骤,用于根据获取的疫情统计数据获得用于预测疫情拐点的NR比;预测疫情拐点步骤,用于定义疫情拐点,并根据所述NR比来预测疫情拐点时间及现存最大确诊病例数量,所述疫情拐点时间表示为tp。采用上述方案实现了更为精确的拐点预测和疫情结束时间预测,不仅可行、易于实施,并且鲁棒性好,是一种由实际数据驱动的、普适的传染病发展预测方法。

Description

一种由统计数据驱动的传染病疫情预测方法
技术领域
本发明属于传染病预测技术领域,尤其涉及一种由统计数据驱动的传染病疫情预测方法。
背景技术
新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19,简称“新冠肺炎”)感染所引发的急性呼吸道传染病呈现致死率低、传染性强的特点。疫情拐点是指传染病现存确诊病例总数达到峰值并开始下降的状态。疫情拐点何时出现对于疫情应对、回归正常社会秩序等决策过程有重要参考意义。平均住院天数直接关系到医疗资源的总体调配。
疫情在每个地区的暴发进程中都需要一个可靠的预测,为防疫工作提供科学参考,减少民众恐慌,降低对金融市场的不利影响。目前对传染病疫情的预测大多采用与SIR模型(易感者-感染者-康复者模型)或类似的动力学模型。该类模型考虑多个复杂的传染病动力因素,如接触数、感染率、潜伏期等。然而,突发疫情(例如新型冠状病毒COVID-19疫情)往往具有许多未知特征,其接触数、感染率、潜伏期等参数难以确知。这使得现有模型对疫情拐点的预测变动很大,拐点出现时间从2月中到下半年,拐点时刻累计感染者从数万到上亿人。据Nature杂志2020年2月18日的报道(David Cyranoski),有的模型甚至预测COVID-19疫情将会造成6.5亿人感染。这样发散的预测难以为疫情管控提供实质性的科技支撑。
事实上,传染病疫情的很多经验信息已经包含在每日的统计数据(如:新增确诊数,新增治愈数等)中,却没有被充分挖掘起来。还有些模型仅依赖于每日新增确诊病例数据来对疫情发展做出预测,这是不够的。因为即使每日新增确诊病例数达到峰值并开始下降,累计确诊病例仍有可能在增加,医疗设置和床位等需求也仍然可能在增加,这不足以说明疫情出现了拐点。
发明内容
为解决上述的技术问题,本发明提出一种由统计数据驱动的传染病疫情预测方法,采用新增确诊病例和新增治愈病例进行数据统计分析,实现了精确的拐点预测,并进一步建立了疫情最大现存确诊病例数量、疫情结束时间等关键参数的预测方法。该方法不仅可应用于当前暴发于世界各地的COVID-19疫情,还可以用于未来其他可能暴发的传染病疫情。
本发明公开了一种由统计数据驱动的传染病疫情预测方法,包括:
获取疫情统计数据步骤,用于获取疫情期间每日的新增确诊病例数、每日新增治愈病例数及病例的潜伏期预估,其中,所述新增确诊病例数表示为时间序列N(t),所述新增治愈病例数表示为时间序列R(t);
预处理疫情统计数据步骤,用于根据获取的阶段时间内疫情统计数据进行计算,并获得用于预测疫情拐点的参数;
预测疫情拐点步骤,用于定义疫情拐点,并根据所述预处理疫情统计数据步骤得到的参数预测疫情拐点时间及最大现存确诊病例数量,其中,所述疫情拐点时间表示为tp
进一步地,所述追踪预测方法还包括:
预测疫情结束步骤,用于根据疫情统计数据定义疫情结束时间模型,并根据所述疫情结束时间模型计算预测疫情结束时间。
进一步地,所述疫情拐点定义为现存确诊病例数量EIC的峰值,所述现存确诊病例数量为累计确诊病例数与累计治愈病例数的差值,记为公式(1):
Figure BDA0002416296280000021
假设确诊病例经过平均住院时间T天后会完全康复,即R(t)=N(t-T),此时,公式(1)进一步表示为公式(2):
Figure BDA0002416296280000031
其中,当疫情到达拐点时,新增确诊病例数与新增治愈病例数相等,即N(tp)=R(tp)。
进一步地,所述预处理疫情统计数据步骤包括:
获取所述每日新增确诊病例数与每日新增治愈病例数之比,记为NR比:NR(t)=N(t)/R(t),并对所述NR比取对数,得到NR比在对数坐标中的表达式,记为:lnNR(t);
采用最小二乘法对所述lnNR(t)进行拟合,得到NR比在对数坐标中的拟合直线yNR
进一步地,所述预测疫情拐点步骤包括:延伸所述拟合直线yNR的趋势线使该拟合直线与NR比在对数坐标中0所在的横轴相交,其中,该相交处的时间为所述疫情拐点时间tp,对应的疫情状态处于拐点,所述EIC(tp)为最大现存确诊病例数量,所述EIC(tp)对应于所需最大医疗资源。
进一步地,所述预测疫情结束步骤包括:
定义并计算疫情结束时间模型E0,其中,所述疫情结束时间模型E0=t0+3σ0+2×潜伏期,其中,所述t0为新增确诊病例数N(t)的峰值时间,σ0为新增确诊病例数N(t)的标准差。
进一步地,所述预测疫情结束步骤包括:
定义并计算疫情结束时间模型E1,其中,所述疫情结束时间模型E1=t1+3σ1+2×潜伏期,其中,所述t1为新增治愈病例数R(t)的峰值时间,所述σ1新增治愈病例数R(t)的标准差。
进一步地,所述预测疫情结束步骤包括:
定义并计算疫情结束时间模型E2,其中,所述疫情结束时间模型E2=(E0+E1)/2。
进一步地,所述预处理疫情统计数据步骤还包括:
对所述新增确诊病例数N(t)、新增治愈病例数R(t)分别取对数并求差分得到新增确诊病例数和新增治愈病例数的增长率分布曲线,然后采用最小二乘法对所述增长率分布曲线中增长率数据进行拟合,分别得到N(t)、R(t)增长率的拟合直线yN和yR
进一步地,所述预处理疫情统计数据步骤还包括:
假设所述新增确诊病例数N(t)、新增治愈病例数R(t)满足高斯分布,则有:
Figure BDA0002416296280000041
Figure BDA0002416296280000042
对N(t)和R(t)分别取对数并求导,则得到拟合直线yN和yR的公式(5)和(6),
Figure BDA0002416296280000043
Figure BDA0002416296280000044
其中,公式(5)、(6)中,所述拟合直线yN的斜率近似为
Figure BDA0002416296280000045
所述拟合直线yR的斜率近似为
Figure BDA0002416296280000046
根据拟合直线yN、yR斜率获得新增确诊病例数N(t)的标准差σ0,新增治愈病例数R(t)的标准差σ1;所述峰值时间t0为延伸拟合直线yN的趋势线与其所在坐标中0所在的横轴相交处的时间,所述峰值时间t1为延伸拟合直线yR的趋势线与其所在坐标中0所在的横轴相交处的时间,平均住院天数T=t1-t0
与现有技术相比,本发明的优点和积极效果在于:
本发明根据官方公布的统计确诊病例数据与治愈病例数据进行数据挖掘较为精确地得到确诊病例峰值、治愈病例峰值等参数,从而预测疫情的拐点时间、疫情结束时间、平均住院天数、最大现存感染者人数等关键参数。本发明的预测方法不仅可行、易于实施,能精准预测拐点(时间误差仅在1-3天),并且更具鲁棒性,该方法可用于其他突发疫情发展的预测中;
本发明建立了实际数据驱动的、普适的传染病演化过程理论模型,其预测信息可为疫情防控及医疗资源调配等国家宏观决策提供强有力的科技支撑,尤其是总体医疗资源包括医院总体床位需求、人力资源需求、防护物品和药品资源需求等的宏观统筹,不仅可应用于当前暴发于世界各地的COVID-19疫情,还可以用于未来其他可能暴发的疫情。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例追踪预测方法的流程示意图;
图2为本发明实施例新增确诊病例和新增治愈病例随时间的变化示意图;
图3为全国、湖北新增确诊病例数和新增治愈病例数之比(NR比)在对数坐标中的分布示意图;
图4为本发明实施例全国、湖北、武汉范围NR比的对数随时间的变化示意图;
图5为本发明实施例湖北以外全国NR比的对数随时间的变化示意图;
图6为本发明实施例武汉以外湖北NR比的对数随时间的变化示意图;
图7为本发明实施例优选预测结果随所用数据结束时间变化示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。
具体实施例一:
参考图1所示的一种由统计数据驱动的传染病疫情关键参数预测方法,包括:
S1:获取疫情统计数据步骤,用于获取疫情期间每日的新增确诊病例数量、新增治愈病例数量及病例的潜伏期预估,其中,新增确诊病例数量表示为时间序列N(t),新增治愈病例数量表示为时间序列R(t),值得注意的是,当疫情死亡率不高时,R(t)与N(t-T)近似相等。这里T是患者平均住院时间。
S2:预处理疫情统计数据步骤,用于对获取的阶段时间内疫情统计数据进行计算,并获得用于预测疫情拐点的参数。
S2:预处理疫情统计数据步骤包括:
S21:对所述新增确诊病例数N(t)、新增治愈病例数R(t)分别取对数并求差分,得到新增确诊病例数和新增治愈病例数的增长率分布曲线;然后采用最小二乘法对分布曲线中增长率数据进行拟合,分别得到N(t)、R(t)增长率的拟合直线yN、yR
S22:假设所述新增确诊病例数N(t)、新增治愈病例数R(t)满足高斯分布,则:
Figure BDA0002416296280000061
Figure BDA0002416296280000062
对N(t)和R(t)分别取对数并求导,则得到拟合直线yN和yR的公式(5)和(6),
Figure BDA0002416296280000071
Figure BDA0002416296280000072
其中,公式(5)、(6)中,拟合直线yN的斜率近似为
Figure BDA0002416296280000073
拟合直线yR的斜率近似为
Figure BDA0002416296280000074
根据拟合直线yN、yR斜率获得新增确诊病例数N(t)的标准差σ0,新增治愈病例数R(t)的标准差σ1,具体地,设yN和yR的斜率分别为s0、s1,则
Figure BDA0002416296280000075
同时,根据拟合直线yN、yR得到新增确诊病例数N(t)的峰值时间t0及新增治愈病例数R(t)的峰值时间t1,其中,峰值时间t0为延伸拟合直线yN的趋势线与其所在坐标中0所在的横轴相交处的时间,峰值时间t1为延伸拟合直线yR的趋势线与其所在坐标中0所在的横轴相交处的时间,当疫情死亡率不高时,平均住院时间T=t1-t0成立。
S23:获取新增确诊病例数与新增治愈病例数之比,记为NR比:NR(t)=N(t)/R(t),并对所述NR比取对数,得到NR比在对数坐标中的表达式,记为:lnNR(t)。
S24:采用最小二乘法对lnNR(t)的曲线进行拟合,得到NR比在对数坐标中的拟合直线yNR
S3:预测疫情拐点步骤,用于定义疫情拐点,并根据预处理疫情统计数据步骤得到的参数预测疫情拐点时间,其中,疫情拐点时间表示为tp。本发明实施例的拐点定义为现存确诊病例数量(EIC)的峰值,现存确诊病例数量为累计确诊病例数与累计治愈病例数的差值,记为公式(1):
Figure BDA0002416296280000076
假设确诊病例经过平均住院时间T天后会完全康复,即R(t)=N(t-T),此时,公式(1)进一步表示为公式(2):
Figure BDA0002416296280000081
其中,当疫情到达拐点时,新增确诊病例数与新增治愈病例数相等,即N(tp)=R(tp)。
S3:预测疫情拐点步骤具体包括:延伸拟合直线yNR的趋势线使该拟合直线与NR比对数坐标中0所在的横轴相交,该相交处的时间为所述疫情拐点时间tp,对应的疫情状态处于拐点,所述EIC(tp)为最大现存确诊病例数量,所述EIC(tp)对应于所需最大医疗资源。
S4:预测疫情结束步骤,用于根据疫情统计数据定义疫情结束时间模型并根据疫情结束时间模型计算预测疫情结束时间。
预测疫情结束步骤还包括:
定义并计算疫情结束时间模型E0,其中,疫情结束时间模型E0=t0+3σ0+2×潜伏期。
定义并计算疫情结束时间模型E1,其中,疫情结束时间模型E1=t1+3σ1+2×潜伏期。
定义并计算疫情结束时间模型E2,其中,疫情结束时间模型E2=(E0+E1)/2。
可采用上述预测疫情结束步骤定义的疫情结束时间模型E0、E1、E2或其组合预测疫情结束时间,本实施例采用模型E2预测疫情结束时间。
本发明以全国多个地区的数据对该预测方法做了验证,如图2所示为获取的1月20日到3月10日期间新增确诊病例和新增治愈病例数量随时间的变化示意图,包括全国、湖北、湖北以外全国每日新增确诊病例(实线)和每日新增治愈病例(虚线)的数量曲线。其中,由于湖北在2月12日改变了单一依靠核酸检测确诊病例的做法,将临床诊断同时作为确诊依据,导致湖北(以及全国)的确诊病例数据在2月12日出现异常跳跃点。根据COVID-19实际数据统计分析,N(t)和R(t)确实满足高斯分布。
在疫情开始阶段,新增治愈病例可能为0,这会导致NR比为无穷大,从而对预测结果产生影响。为避免该问题,需要设置一个NR比的最低阈值,该阈值可取为0.1,直接舍弃该阈值之前时期的数据。本实施例舍弃疫情开始阶段的数据,采用从1月24日开始的统计数据做预测。
如图3所示,为本实施例全国、湖北新增确诊病例数和新增治愈病例数的增长率分布曲线,采用步骤S21得到虚线所示的拟合直线趋势线,根据拟合直线趋势线与坐标中0所在的横轴相交处的时间分别得到新增确诊病例数和新增治愈病例数的峰值日期,根据趋势线的斜率得到标准差,其中全国每日新增病例数峰值时间为2月14日,全国每日治愈病例数峰值时间为3月1日,全国每日新增病例数标准差σ0=7.5,全国每日治愈病例数标准差σ1=7.7,两者可以取为一个值。
如图4所示为本实施例优选全国、湖北、武汉范围NR比的对数随时间的变化示意图。对其分别采用步骤S32拟合得到的拟合直线yNR,图中点线表示拟合直线yNR,其分布变动范围较小且外延趋势线与NR对数坐标中的0所在的横轴相交,该相交处为预测的疫情拐点时间。
如图5-6所示分别为本实施例优选湖北以外全国、武汉以外湖北范围NR比的对数随时间的变化示意图,点线表示采用从1月24日到特定日期的数据做出拟合直线yNR的线性趋势,点折线表示统计数据。
如表1所示为本发明实施例预测的全国不同区域的疫情拐点时间及其误差:
表1:
Figure BDA0002416296280000101
如上表所示,本实施例以全国、湖北、湖北以外全国及武汉以外湖北的数据对该预测方法做了验证。经过验证发现,预测得到的拐点与真实拐点出现的时间相差不超过3天,相较于以往的预测模型,更接近真实拐点时间。我们的结果不仅可应用于当前暴发于世界各地的COVID-19疫情,还可以用于未来其他可能暴发的疫情。
采用不同日期作为结束日期,得到的预测结果略有不同。参考图7所示为本实施例的预测结果随所用数据结束时间变化示意图,横轴为预测中使用数据的结束日期,例如:2月6日表示预测中仅使用1月24日到2月6日之间的统计数据,纵轴表示预测结果,即预测的疫情拐点出现时间,其中,湖北以外全国采用2月6日前数据预测疫情拐点出现时间为2月14日,比真实拐点出现时间晚2天;采用2月8日前数据预测的疫情拐点出现时间收敛到2月12日。
本实施例预测的疫情结束时间采用全国每日新增病例数峰值时间为2月14日,σ0=7.5;采用全国每日治愈病例数拐点时间为3月1日,σ1=7.7,潜伏期取为14天。采用模型E0预测的全国疫情结束时间为4月5日,采用模型E1预测的全国疫情结束时间为4月21日,采用模型E2预测的全国疫情结束时间为4月13日。本实施例优选地采用模型E2,结论为:全国疫情结束时间为4月13日,湖北以外省份结束时间略早,湖北结束时间略迟,尤其是武汉市。
需要指出的是,我们提出的方法可以应用于不同级别的行政区域,例如全国、疫情中心湖北省或其他省份或区域。全国80%的病例来自于湖北省,因而全国和湖北省的疫情有相似的特征。湖北以外全国的统计特征与全国(因而与湖北省)不同。
值得注意的是,如果出现国外病例大量输入我国,或者我国内部管控措施放松导致疫情反弹,均会影响疫情的分布曲线,那时需要重新估计。除上述两种情况外,上述估计是可信的。其他省份或地区的疫情结束时间可以按照本实施例类似推算。
本实施例的预测方法参考数据通过以下渠道获取:(1)世界卫生组织(WHO)官方网站;(2)中华人民共和国国家卫生健康委员会官方公告。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其他形式的限制。任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其他领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (10)

1.一种由统计数据驱动的传染病疫情预测方法,其特征在于,包括:
获取疫情统计数据步骤,用于获取疫情期间每日的新增确诊病例数、新增治愈病例数及病例的潜伏期预估,其中,所述新增确诊病例数表示为时间序列N(t),所述新增治愈病例数表示为时间序列R(t);
预处理疫情统计数据步骤,用于根据获取的阶段时间内疫情统计数据进行计算,并获得用于预测疫情拐点的参数;
预测疫情拐点步骤,用于定义疫情拐点,并根据所述预处理疫情统计数据步骤得到的参数预测疫情拐点时间及最大现存确诊病例数量,其中,所述疫情拐点时间表示为tp
2.如权利要求1所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述追踪预测方法进一步包括:
预测疫情结束步骤,用于根据疫情统计数据定义疫情结束时间模型并根据所述疫情结束时间模型计算预测疫情结束时间。
3.如权利要求1或2所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述疫情拐点定义为现存确诊病例数量EIC的峰值,所述现存确诊病例数量为累计确诊病例数与累计治愈病例数的差值,记为公式(1):
Figure FDA0002416296270000011
假设确诊病例经过平均住院时间T天后会完全康复,即R(t)=N(t-T),此时,公式(1)进一步表示为公式(2):
Figure FDA0002416296270000012
其中,当疫情到达拐点时,新增确诊病例数与新增治愈病例数相等,即N(tp)=R(tp)。
4.如权利要求3所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预处理疫情统计数据步骤包括:
获取所述每日新增确诊病例数与新增治愈病例数之比,记为NR比:NR(t)=N(t)/R(t),并对所述NR比取对数,得到NR比在对数坐标中的表达式,记为:lnNR(t);
采用最小二乘法对所述lnNR(t)进行拟合,得到NR比在对数坐标中的拟合直线yNR
5.如权利要求4所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预测疫情拐点步骤包括:
延伸所述拟合直线yNR的趋势线使该拟合直线与NR比在对数坐标中0所在的横轴相交,其中,该相交处的时间为所述疫情拐点时间tp,对应的疫情状态处于拐点,所述EIC(tp)为最大现存确诊病例数量。
6.如权利要求2所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预测疫情结束步骤包括:
定义并计算疫情结束时间模型E0,其中,所述疫情结束时间模型E0=t0+3σ0+2×潜伏期,其中,所述t0为新增确诊病例数N(t)的峰值时间,σ0为新增确诊病例数N(t)的标准差。
7.如权利要求6所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预测疫情结束步骤进一步包括:
定义并计算疫情结束时间模型E1,其中,所述疫情结束时间模型E1=t1+3σ1+2×潜伏期,其中,所述t1为新增治愈病例数R(t)的峰值时间,所述σ1新增治愈病例数R(t)的标准差。
8.如权利要求7所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预测疫情结束步骤进一步包括:
定义并计算疫情结束时间模型E2,其中,所述疫情结束时间模型E2=(E0+E1)/2。
9.如权利要求6-8中任一项所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预处理疫情统计数据步骤进一步包括:
对所述新增确诊病例数N(t)、新增治愈病例数R(t)分别取对数并求差分得到新增确诊病例数和新增治愈病例数的增长率分布曲线,然后采用最小二乘法对所述增长率分布曲线中增长率数据进行拟合,分别得到N(t)、R(t)增长率的拟合直线yN、yR
10.如权利要求9所述的由统计数据驱动的传染病疫情预测方法,其特征在于,所述预处理疫情统计数据步骤进一步包括:
假设所述新增确诊病例数N(t)、新增治愈病例数R(t)满足高斯分布,则有:
Figure FDA0002416296270000031
Figure FDA0002416296270000032
对N(t)和R(t)分别取对数并求导,则得到拟合直线yN和yR的公式(5)和(6),
Figure FDA0002416296270000033
Figure FDA0002416296270000034
其中,公式(5)、(6)中,所述拟合直线yN的斜率近似为
Figure FDA0002416296270000035
所述拟合直线yR的斜率近似为
Figure FDA0002416296270000036
根据拟合直线yN、yR斜率获得新增确诊病例数N(t)的标准差σ0,新增治愈病例数R(t)的标准差σ1;所述峰值时间t0为延伸拟合直线yN的趋势线与其所在坐标中0所在的横轴相交处的时间,所述峰值时间t1为延伸拟合直线yR的趋势线与其所在坐标中0所在的横轴相交处的时间,平均住院天数T=t1-t0
CN202010192098.0A 2020-03-18 2020-03-18 一种由统计数据驱动的传染病疫情预测方法 Active CN111564221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010192098.0A CN111564221B (zh) 2020-03-18 2020-03-18 一种由统计数据驱动的传染病疫情预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010192098.0A CN111564221B (zh) 2020-03-18 2020-03-18 一种由统计数据驱动的传染病疫情预测方法

Publications (2)

Publication Number Publication Date
CN111564221A true CN111564221A (zh) 2020-08-21
CN111564221B CN111564221B (zh) 2023-07-21

Family

ID=72071381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010192098.0A Active CN111564221B (zh) 2020-03-18 2020-03-18 一种由统计数据驱动的传染病疫情预测方法

Country Status (1)

Country Link
CN (1) CN111564221B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037930A (zh) * 2020-11-02 2020-12-04 平安科技(深圳)有限公司 一种传染病预测设备、方法、装置及存储介质
CN112700884A (zh) * 2020-12-31 2021-04-23 医渡云(北京)技术有限公司 疫情防控有效性确定方法、装置、电子设备及介质
CN112967811A (zh) * 2020-12-15 2021-06-15 广州呼吸健康研究院 新型冠状病毒各地疫情各地累积感染人数预测方法、系统及装置
CN113096787A (zh) * 2021-04-19 2021-07-09 大连理工大学 数据驱动疫情检测和医疗资源分配的联合决策系统与方法
CN113539500A (zh) * 2021-05-31 2021-10-22 诺滨科技(北京)有限公司 一种流行病流行估计方法、设备及计算机可读介质
CN113539500B (zh) * 2021-05-31 2024-05-31 诺滨科技(北京)有限公司 一种流行病流行估计方法、设备及计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794342A (zh) * 2009-09-30 2010-08-04 中国人民解放军防化指挥工程学院 基于非线性、变系数预测模型的传染病疫情预测分析方法
CN102222163A (zh) * 2011-05-25 2011-10-19 中国人民解放军防化指挥工程学院 一种具有免疫期且受季节影响的传染病疫情预测方法
CN103390089A (zh) * 2012-05-07 2013-11-13 中国人民解放军防化学院 一种具有控制变量的传染病疫情预测方法
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794342A (zh) * 2009-09-30 2010-08-04 中国人民解放军防化指挥工程学院 基于非线性、变系数预测模型的传染病疫情预测分析方法
CN102222163A (zh) * 2011-05-25 2011-10-19 中国人民解放军防化指挥工程学院 一种具有免疫期且受季节影响的传染病疫情预测方法
CN103390089A (zh) * 2012-05-07 2013-11-13 中国人民解放军防化学院 一种具有控制变量的传染病疫情预测方法
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
庞凤蕊: "《传染病动力学模型在长沙市水痘疫情预警及干预措施效果评价中的应用》" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037930A (zh) * 2020-11-02 2020-12-04 平安科技(深圳)有限公司 一种传染病预测设备、方法、装置及存储介质
CN112037930B (zh) * 2020-11-02 2021-02-05 平安科技(深圳)有限公司 一种传染病预测设备、方法、装置及存储介质
CN112967811A (zh) * 2020-12-15 2021-06-15 广州呼吸健康研究院 新型冠状病毒各地疫情各地累积感染人数预测方法、系统及装置
CN112700884A (zh) * 2020-12-31 2021-04-23 医渡云(北京)技术有限公司 疫情防控有效性确定方法、装置、电子设备及介质
CN112700884B (zh) * 2020-12-31 2024-03-29 医渡云(北京)技术有限公司 疫情防控有效性确定方法、装置、电子设备及介质
CN113096787A (zh) * 2021-04-19 2021-07-09 大连理工大学 数据驱动疫情检测和医疗资源分配的联合决策系统与方法
CN113539500A (zh) * 2021-05-31 2021-10-22 诺滨科技(北京)有限公司 一种流行病流行估计方法、设备及计算机可读介质
CN113539500B (zh) * 2021-05-31 2024-05-31 诺滨科技(北京)有限公司 一种流行病流行估计方法、设备及计算机可读介质

Also Published As

Publication number Publication date
CN111564221B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN111564221A (zh) 一种由统计数据驱动的传染病疫情预测方法
WO2020140377A1 (zh) 神经网络模型训练方法、装置、计算机设备及存储介质
CN111524611A (zh) 构建传染病趋势预测模型的方法、预测方法、装置及设备
Yan et al. An improved method for the fitting and prediction of the number of covid-19 confirmed cases based on lstm
CN102045358A (zh) 一种基于整合相关性分析与分级聚类的入侵检测方法
Zhang et al. Comparison of ARIMA and LSTM for prediction of hemorrhagic fever at different time scales in China
CN108021636B (zh) 一种不依赖时间信息的传播网络结构重构方法
CN110335160B (zh) 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及系统
Shchur et al. Detecting anomalous event sequences with temporal point processes
CN108198627A (zh) 一种基于潜伏期传染病预警的方法
CN112259248B (zh) 一种covid-19境外输入风险评估预测方法
Satten et al. Marginal estimation for multi‐stage models: waiting time distributions and competing risks analyses
Ma et al. Influenza-like symptom prediction by analyzing self-reported health status and human mobility behaviors
Li et al. Analysis of failure time using threshold regression with semi‐parametric varying coefficients
Rosenstrom et al. Could Earlier Availability of Boosters and Pediatric Vaccines Have Reduced Impact of COVID-19?
Lin et al. Control strategies against COVID-19 in China: Significance of effective testing in the long run
Brooks Pancasting: forecasting epidemics from provisional data
Chakrabarti et al. Behavioral epidemiology: An economic model to evaluate optimal policy in the midst of a pandemic
Balan et al. Ascertainment correction in frailty models for recurrent events data
CN112992374A (zh) 基于传播动力学和多项式回归的新冠病毒传播预测方法
Junker et al. Development of a prototype for high-frequency mental health surveillance in Germany: data infrastructure and statistical methods
Akram et al. Approximeter: Automatically finding and quantifying code sections for approximation
Yuan et al. Analysis of the relationship between intestinal infectious diseases and socioeconomic factors based on machine learning model
Zhang et al. Forecasting and Analysis of Time Variation of Parameters of COVID-19 Infection in China Using An Improved SEIR Model
Huang et al. Kernel density estimation and Metropolis-Hastings sampling in process capability analysis of unknown distributions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant