CN111968751B - 一种使用多基线校正模型的传染病趋势预测方法与系统 - Google Patents

一种使用多基线校正模型的传染病趋势预测方法与系统 Download PDF

Info

Publication number
CN111968751B
CN111968751B CN202010604560.3A CN202010604560A CN111968751B CN 111968751 B CN111968751 B CN 111968751B CN 202010604560 A CN202010604560 A CN 202010604560A CN 111968751 B CN111968751 B CN 111968751B
Authority
CN
China
Prior art keywords
baseline
data
epidemic situation
infectious disease
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010604560.3A
Other languages
English (en)
Other versions
CN111968751A (zh
Inventor
曹鸿强
赵鹏
冷巍
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3golden Beijing Information Technology Co ltd
Original Assignee
3golden Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3golden Beijing Information Technology Co ltd filed Critical 3golden Beijing Information Technology Co ltd
Priority to CN202010604560.3A priority Critical patent/CN111968751B/zh
Publication of CN111968751A publication Critical patent/CN111968751A/zh
Application granted granted Critical
Publication of CN111968751B publication Critical patent/CN111968751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于互联网的数据采集系统,包括如下步骤:获取传染病疫情数据;数据预处理;判断疫情发展阶段;自回归基线预测区间值;指数基线校准上限值;生长基线校准下限值;计算和校准,将所述主基线、所述悲观情况辅助基线、所述乐观情况辅助基线相互校准;预测结果输出。本发明的有益效果在于,相对于传染病专业模型分析方法而言,本发明对数据的要求比较低,仅需要时间、国别、累计确诊数量等历史基础数据,大大降低了传染病预测的数据需求门槛,使疫情预测的难度明显降低;相对于时间序列模型分析方法而言,采用基于多基线校准的传染病趋势预测,能够在降低人为因素造成的时间序列不平稳性的影响,得到比较准确地短期预测结果。

Description

一种使用多基线校正模型的传染病趋势预测方法与系统
技术领域
本发明属于预测数据处理系统领域,特别涉及一种使用多基线校正模型的传染病趋势预测方法与系统。
背景技术
人类在进入21世纪的今天所面临的的威胁有很多种,如自然环境及气候的逐渐恶化、各种疾病的流行等。不论环境还是气候对人类社会的影响都是逐渐形成的,是一种循序渐进的积累过程,其危害往往不具有突发性。相反,传染性疾病的发生既有渐进性又有突发性,而其危害往往比较明显。在传染病爆发期间,各国的研究人员都进行了传染病传播速度、空间范围、传播途径、动力学机理等研究。其中,对传染病传播趋势进行数学建模,通过对传染病模型的定性、定量分析和数值模拟,来分析疾病的发展过程、揭示流行规律、预测变化趋势,对于政府提前做好准备、制定有效预防控制措施具有非常重要的意义。根据在传染病传播趋势预测中采用的模型种类划分,可以分为传染病专业模型和时间序列模型两大类。其中,传染病专业模型又分为SI、SIR、SIRS、SEIR、SEIJR等模型;时间序列模型又分为AR、MA、 ARMA、ARIMA等模型。在传染病专业模型中,人群划分方法包括以下几类:易感人群S、潜伏人群E、已感染人群I、超级传播者J、病愈/死亡的移出者R;传染病传播参数包括:日接触率β、日治愈率μ、平均传染期1/μ、传染期接触的有效人数为σ=β/μ、疾病传播期内所考察地区的总人数K。在SI模型中,仅考虑易感人群S、已感染人群I,涉及的参数有日接触率β和总人数K,并假设总人数K不变,即不考虑生死、治愈和迁移等情况。SIS模型在SI模型上增加考虑了治愈情况,即已感染人群I可以治愈后转变为易感人群S。SIR模型将病愈/死亡的移出者人群归为R。SEIR模型在SIR模型的基础上增加了潜伏人群E。 SEIJR模型在SEIR模型的基础上增加了超级传播者J人群。上述模型都假设总人数K不变。在上述假设条件下,分别建立各自模型的微分方程组,求解时间与各人群数量变化之间的函数关系,从而实现传染病传播趋势预测。在时间序列模型中,设若时间序列的任一元素yt与其前期元素(yt-1、yt-2等)之间存在着某种关联,则我们可以根据该时间序列的既往观测值来预测其在未来的取值。具体如下:(1)自回归AR模型是使用同一变量的历史数据来预测当期或未来数据,并假设它们为线性关系。(2)移动平均MA模型与自回归AR模型类似,不同之处在于移动平均是以过去的残差项也就是白噪声来做线性组合,而AR模型是以过去的观察值来做线性组合。MA的出发点是通过组合残差项来观察残差的振动。(3)向量自回归VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。VAR模型用来估计联合内生变量的动态关系,而不带有任何事先约束条件。它是AR 模型的推广将单变量自回归模型推广到由多元时间序列变量组成的向量自回归模型。VAR模型描述在同一样本期间内的n个变量可以作为它们过去值的线性函数。(4)自回归滑动平均ARMA模型是由自回归AR 模型与移动平均MA模型为基础的组合。一个ARMA过程可能是AR与MA 过程、多个AR过程、AR与ARMA过程的迭加。(5)差分自回归滑动平均模型ARIMA模型是在平稳的时间序列基础上建立起来的,因此时间序列的平稳性是建模的重要前提。检验时间序列模型平稳的方法一般采用ADF单位根检验模型去检验。当然如果时间序列不稳定,也可以通过一些操作去使得时间序列稳定(比如取对数,差分),然后进行 ARIMA模型预测,得到稳定的时间序列的预测结果,然后对预测结果进行之前使序列稳定的操作的逆操作(取指数,差分的逆操作),就可以得到原始数据的预测结果。通过对技术现状的分析和实际实验发现,使用现有模型进行传染病疫情预测时,均存在一些问题。例如,使用 SI、SIS、SEIR等传染病专业模型进行传播趋势建模时,需要指定日接触率β、日治愈率μ、平均传染期1/μ、传染期接触的有效人数为σ=β/μ、疾病传播期内所考察地区的总人数K等参数,而获取所有这些参数具有很大的难度。这些参数一般只有官方才可能拥有最新、权威、准确的数据,由于其专业性,一般没必要对大众开放,但给民间传染病传播建模缺带来了不可逾越的难度。而使用时间序列模型进行传染病疫情建模时,会面临传染病疫情并非平稳时间序列系统的问题。尤其是考虑政府管控力度和民众配合程度等因素,更非平稳时间序列,数据差分之后也非平稳状态。非平稳序列没有不变的中心趋势,不能用时间序列的样本均值和方差推断各时点随机变量的分布特征,使用时间序列模型进行疫情发展预测就都遇到了问题。
发明内容
为了解决上述问题,本发明一方面提供了使用多基线校正模型的传染病趋势预测方法,包括如下步骤:
获取传染病疫情数据,从传染病数据源获取传染病疫情数据;
数据预处理,将数据源字段进行筛选,删除不需要的字段,保留有用的字段;
判断疫情发展阶段,根据每日新增确诊数来判断疫情发展阶段,所述疫情发展阶段判断结果分别与累计确诊预测区间上限值和下限值的校准方法进行关联;
自回归基线预测区间值,使用自回归基线计算未来累计确诊数的区间值,所述自回归基线作为主基线;
指数基线校准上限值,使用指数基线校准区间上限值,所述指数基线作为悲观情况辅助基线;
生长基线校准下限值,使用生长基线校准区间下限值,所述生长基线作为乐观情况辅助基线;
计算和校准,将所述主基线、所述悲观情况辅助基线、所述乐观情况辅助基线相互校准;
预测结果输出,输出未来第n天的累计确诊预测结果:{[预测下限值,预测上限值],极端情况值}。
本发明的另外一个方面提供了使用多基线校正模型的传染病趋势预测装置,所述装置中计算机程序被执行时,按照本发明所提供的方法进行配置。
本发明的有益效果在于,相对于传染病专业模型分析方法而言,本发明对数据的要求比较低,仅需要时间、国别、累计确诊数量等历史基础数据,大大降低了传染病预测的数据需求门槛,使疫情预测的难度明显降低;相对于时间序列模型分析方法而言,采用基于多基线校准的传染病趋势预测,能够在降低人为因素造成的时间序列不平稳性的影响,得到比较准确地短期预测结果。
附图说明
图1.基于多基线校准的传染病疫情发展趋势预测流程图。
具体实施方式
本发明的使用多基线校正模型的传染病趋势预测方法的一些实施例中,包括如下步骤:
获取传染病疫情数据,从传染病数据源获取传染病疫情数据;
数据预处理,将数据源字段进行筛选,删除不需要的字段,保留有用的字段;
判断疫情发展阶段,根据每日新增确诊数来判断疫情发展阶段,所述疫情发展阶段判断结果分别与累计确诊预测区间上限值和下限值的校准方法进行关联;
自回归基线预测区间值,使用自回归基线计算未来累计确诊数的区间值,所述自回归基线作为主基线;
指数基线校准上限值,使用指数基线校准区间上限值,所述指数基线作为悲观情况辅助基线;
生长基线校准下限值,使用生长基线校准区间下限值,所述生长基线作为乐观情况辅助基线;
计算和校准,将所述主基线、所述悲观情况辅助基线、所述乐观情况辅助基线相互校准;
预测结果输出,输出未来第n天的累计确诊预测结果:{[预测下限值,预测上限值],极端情况值}。
本发明的获取传染病疫情数据的一些实施例中,使用数据读取接口读取传染病疫情数据源,所述传染病疫情数据格式包括csv、txt、 excel、mysql中的一种或多种,所述传染病疫情数据包括时间数据、国别数据、累计确诊数量数据中的一种或多种。
本发明的数据预处理步骤的一些实施例中:包括格式统一、空缺值填充、冗余删除、移动窗口平滑处理。
本发明的疫情发展阶段判定步骤的一些实施例中,根据每日累计确诊数量计算每日新增确诊数量,并对每日新增确诊数量进行移动窗口均值化处理;
根据一定周期内每日新增确诊数的增减情况,判断疫情发展阶段,所述疫情发展阶段包括好转趋势和恶化趋势。
本发明的自回归基线预测区间值的一些实施例中,将每日新增确诊数作为自变量进行自回归拟合,公式如下:
若未来某日的新增数y=f(x;b1,…,bn)。其中x为历史每日新增数,常量系数bi(i=1,2,…,n);使用拟合后的函数预测未来第n天的新增确诊数量M;根据疫情发展阶段,如果疫情发展呈现好转趋势,则M 的累计确诊值作为预测区间下限值,上限值为每日新增延续最近每日新增值的累计确诊值;如果疫情发展呈现恶化趋势,则M的累计确诊值作为预测区间上限值,下限值为每日新增延续最近每日新增值的累计确诊值。
本发明的一些实施例中,所述指数基线的指数函数公式表示为:
Y=aebX+k (1)
其中,x表示传播次数,y表示第x次传播得到新病例数,a为常数且以a>0,a≠1,b为常数系数,用于专家调节传播强度,k表示未知常量。
本发明的另外一些实施例中,
所述指数函数公式表示为:
y=ax (2)
其中,x表示传播次数,y表示第x次传播得到新病例数,a为常数且以a>0,a≠1。
本发明的另外一些具体实施例中,
所述指数函数公式表示为:
y=2x (3)
其中,x表示传播次数,y表示第x次传播得到新病例数。
本发明的一些实施例中,所述AR模型使用同一变数例如x的之前各期,亦即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系;
xt=a1xt-1+a2xt-2+...+apxt-p+ut
其中的a1、a2、...、ap是p个待求参数;p是滞后期限的数目; ut为白噪声,即经典计量经济模型的随机误差项。
下面的多个实施例结合附图进一步解释本发明。
1.多基线校准模型
(1)指数基线
传染病病毒传播呈指数函数增长。例如,某种病毒在传播时,1 个人传播2个人,2个传播成4个人……因此,第x次传播得到新病例数y与传播次数x的函数关系式即为:y=2x。这个函数便是指函数的形式,自变量为幂指数。一般地,函数y=ax(a为常数且以a>0,a≠1) 叫做指数函数,函数的定义域是R。对于一切指数函数来讲,值域为(0, +∞)。更一般的指数函数Y=aebX+k。其中k为未知常量。
(2)生长基线
生长曲线函数,即描述生长曲线(S曲线)的函数,也被称为 Logistic函数模型。一般来说,事物总是经过发生、发展、成熟三个阶段,而每一个阶段的发展速度各不相同。通常在发生阶段,变化速度较为缓慢;在发展阶段,变化速度加快;在成熟阶段,变化速度又趋缓慢,按上述三个阶段发展规律得到的变化曲线称为生长曲线。
2.基于多基线校准模型的传染病趋势预测方法
(1)预测流程
图1给出了基于多基线校准模型的传染病趋势预测方法。该方法共包括6个步骤:首先获取传染病疫情数据,重点是获取日期、国别、累计确诊数;然后进行格式统一、空缺值填充、冗余删除等数据预处理;其次根据每日新增确诊数确定疫情发展阶段判定;继而使用自回归基线预测未来累计确诊数的区间值,并使用指数基线校准区间上限值,使用生长基线校准区间下限值。
(2)数据获取
使用数据读取接口读取传染病疫情数据源。支持的格式包括:csv、 txt、excel、mysql等。
(3)数据预处理
读取传染病疫情数据之后,需要对传染病疫情数据进行预处理。预处理的过程包括:数据格式统一、空缺值填充、移动窗口平滑处理。数据源可能包括的数据字段要比我们需要的多,因此需要对数据源字段进行筛选,删除我们不需要的字段,保留有用的字段。在一些具体新冠肺炎疫情预测实例中,仅保留国家、时间和累计确诊数三个字段。
(4)疫情发展阶段判定
根据每日累计确诊数量计算每日新增确诊数量,并对每日新增确诊数量进行移动窗口均值化处理。根据一定周期内每日新增确诊数的增减情况,判定疫情发展阶段,即短期内是好转还是恶化。疫情发展阶段决定了累计确诊预测区间上下限值的校准方法。
(5)自回归基线预测区间值
将每日新增确诊数作为自变量进行自回归拟合,公式如下:若未来某日的新增数y=f(x;b1,…,bn)。其中x为历史每日新增数,常量系数 bi(i=1,2,…,n)。使用拟合后的函数预测未来第n天的新增确诊数量M。根据疫情发展阶段,如果疫情发展呈现好转趋势,则M的累计确诊值作为预测区间下限值,上限值为每日新增延续最近每日新增值的累计确诊值;如果疫情发展呈现恶化趋势,则M的累计确诊值作为预测区间上限值,下限值为每日新增延续最近每日新增值的累计确诊值。
(6)指数基线校准上限值
作为最恶劣的极端情况,累计确诊的数量会呈现指数级增长。这对于某些放弃管控或者没有能力管控疫情的国家或者区域,这种情况出现的可能性较大。对于管控疫情意识有松懈倾向的国家或地区,给出疫情发展的指数基线预测结果,也能起到一种警示作用。
(7)生长基线校准下限值
假设目前疫情已经进入拐点,则未来疫情发展趋势符合生长曲线,这是一种乐观情况的预测。因此,使用生长基线校准预测区间的下限值。在自回归预测的区间下限值的基础上,结合疫情发展阶段判定,使用生长基线对预测区间下限值进行校准。
(8)预测结果输出
通过上述的多基线计算与校准,输出未来第n天的累计确诊预测结果:{[预测下限值,预测上限值],极端情况值}。
3、实验结果与分析
数据源使用美国约翰斯·霍普金斯大学公布的数据源。该数据源为约翰斯·霍普金斯大学汇总各种渠道并对数据进行了清理之后的统计数据,相对其他数据源,该数据源具有较高的准确性和权威性。
自2020年3月份起,随着国外疫情发展的加剧,我们开始了对国外疫情发展趋势的预测。我们以7天为周期,每7天预测一次,预测七天之后的新冠肺炎累计确诊数,并将预测结果公布在公司微信公众号上。回测结果显示:实际值均位于预测区间内。
本说明书中描述的主题的实施方式和功能性操作可以在以下中实施:有形实施的计算机软件或者固件,计算机硬件,包括本说明书中公开的结构及其结构等同体,或者上述中的一者以上的组合。本说明书中描述的主题的实施方式可以被实施为一个或多个计算机程序,即,一个或多个有形非暂时性程序载体上编码的计算机程序指令的一个或多个模块,用以被数据处理设备执行或者控制数据处理设备的操作。
作为替代或者附加,程序指令可以被编码在人工生成的传播信号上,例如,数字信号,上述信号被生成为编码信息以传递到用数据处理设备执行的适当的接收器设备。计算机存储介质可以是机器可读存储装置、机器可读的存储基片、随机或者串行存取存储器装置或者上述装置中的一种或多种的组合。
计算机程序(还可以被称为或者描述为程序、软件、软件应用、模块、软件模块、脚本或者代码)可以以任意形式的编程语言而被写出,包括编译语言或者解释语言或者声明性语言或过程式语言,并且计算机程序可以以任意形式展开,包括作为独立程序或者作为模块、组件、子程序或者适于在计算环境中使用的其他单元。计算机程序可以但不必须对应于文件系统中的文件。程序可以被存储在保存其他程序或者数据的文件的一部分中,例如,存储在如下中的一个或多个脚本:在标记语言文档中;在专用于相关程序的单个文件中;或者在多个协同文件中,例如,存储一个或多个模块、子程序或者代码部分的文件。计算机程序可以被展开为执行在一个计算机或者多个计算机上,所述计算机位于一处,或者分布至多个场所并且通过通信网络而互相连接。
为了发送与用户的交互,本说明书中描述的主题的实施方式可以被实施在计算机上,该计算机具有:显示装置,例如,CRT(阴极射线管) 或者LCD(液晶显示器)监控器,用于向用户显示信息;以及键盘和例如鼠标或者追踪球这样的定位装置,用户利用它们可以将输入发送到计算机。其他种类的装置也可以用于发送与用户的交互;例如,提供给用户的反馈可以是任意形式的传感反馈,例如,视觉反馈等;以及来自用户的输入可以以任意形式接收到,包括键盘输入等。另外,计算机可以通过将文档发送至由用户使用的装置并且接收来自该装置的文档而与用户交互;例如,通过响应于接收到的来自网络浏览器的请求,而将网页发送到用户的采集客户端装置上的网络浏览器。
本说明书中描述的主题的实施方式可以在计算系统中实施,该计算系统包括例如数据采集服务器这样的后端组件,或者包括例如应用采集服务器这样的中间组件,或者包括例如采集客户端计算机这样的前端组件,该采集客户端计算机具有图形用户界面或者网络浏览器,用户可以通过图形用户界面或者网络浏览器而与本说明书中描述的主题的实施进行交互,或者该计算机系统包括一个或多个这种后端组件、中间组件或者前端组件的任意组合。系统中的组件可以通过例如通信网络的任意形式或介质的数字数据通信而互相连接。通信网络的实例包括局域网络 (“LAN”)和广域网络(“WAN”),例如,因特网。计算系统可以包括采集客户端和采集服务器。采集客户端和采集服务器通常彼此远离,并且通常通过通信网络而交互。采集客户端与采集服务器之间的关系利用在各自的计算机上运行并且具有彼此之间的采集客户端-采集服务器关系的计算机程序而产生。

Claims (10)

1.一种使用多基线校正模型的传染病趋势预测方法,其特征在于,包括如下步骤:
获取传染病疫情数据,从传染病数据源获取传染病疫情数据;
数据预处理,将数据源字段进行筛选,删除不需要的字段,保留有用的字段;
判断疫情发展阶段,根据每日新增确诊数来判断疫情发展阶段,所述疫情发展阶段判断结果分别与累计确诊预测区间上限值和下限值的校准方法进行关联;
自回归基线预测区间值,使用自回归基线计算未来累计确诊数的区间值,所述自回归基线作为主基线;
指数基线校准上限值,使用指数基线校准区间上限值,所述指数基线作为悲观情况辅助基线;
生长基线校准下限值,使用生长基线校准区间下限值,所述生长基线作为乐观情况辅助基线;
计算和校准,将所述主基线、所述悲观情况辅助基线、所述乐观情况辅助基线相互校准;
预测结果输出,输出未来第n天的累计确诊预测结果:{[预测下限值,预测上限值],极端情况值}。
2.如权利要求1所述方法,其特征在于,
所述获取传染病疫情数据中,使用数据读取接口读取传染病疫情数据源,所述传染病疫情数据的数据格式包括csv、txt、excel、mysql中的一种或多种,所述传染病疫情数据包括时间数据、国别数据、累计确诊数量数据中的一种或多种。
3.如权利要求2所述方法,其特征在于,所述数据预处理步骤中:包括格式统一、空缺值填充、冗余删除、移动窗口平滑处理。
4.如权利要求3所述方法,其特征在于,所述疫情发展阶段判定步骤中,根据每日累计确诊数量计算每日新增确诊数量,并对每日新增确诊数量进行移动窗口均值化处理;
根据一定周期内每日新增确诊数的增减情况,判断疫情发展阶段,所述疫情发展阶段包括好转趋势和恶化趋势。
5.如权利要求4所述方法,其特征在于,所述自回归基线预测区间值,公式如下:
若未来某日的新增数
Figure FDA0003182453190000021
其中x为历史每日新增数,常量系数bi(i=1,2,…,n);使用拟合后的函数预测未来第n天的新增确诊数量M;根据疫情发展阶段,如果疫情发展呈现好转趋势,则M的累计确诊值作为预测区间下限值,上限值为每日新增延续最近每日新增值的累计确诊值;如果疫情发展呈现恶化趋势,则M的累计确诊值作为预测区间上限值,下限值为每日新增延续最近每日新增值的累计确诊值。
6.如权利要求5所述方法,其特征在于,所述指数基线的指数函数公式表示为:
Figure FDA0003182453190000022
其中,x表示传播次数,y表示第x次传播得到新病例数,a为常数且以a>0,a≠1,b表示常数,用于专家调整传播程度,k表示未知常量。
7.如权利要求6所述方法,其特征在于,
所述指数函数公式表示为:
y=ax (2)
其中,x表示传播次数,y表示第x次传播得到新病例数,a为常数且以a>0,a≠1。
8.如权利要求7所述方法,其特征在于,
所述指数函数公式表示为:
y=2x (3)
其中,x表示传播次数,y表示第x次传播得到新病例数。
9.如权利要求1所述方法,其特征在于,AR模型使用同一变数x的之前各期,亦即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系;
xt=a1xt-1+a2xt-2+...+apxt-p+ut
其中的a1、a2、...、ap是p个待求参数;p是滞后期限的数目;ut为白噪声,即经典计量经济模型的随机误差项。
10.一种使用多基线校正模型的传染病趋势预测装置,其特征在于,所述装置中计算机程序被执行时,按照如权利要求1-9所述的方法进行配置。
CN202010604560.3A 2020-06-29 2020-06-29 一种使用多基线校正模型的传染病趋势预测方法与系统 Active CN111968751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010604560.3A CN111968751B (zh) 2020-06-29 2020-06-29 一种使用多基线校正模型的传染病趋势预测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010604560.3A CN111968751B (zh) 2020-06-29 2020-06-29 一种使用多基线校正模型的传染病趋势预测方法与系统

Publications (2)

Publication Number Publication Date
CN111968751A CN111968751A (zh) 2020-11-20
CN111968751B true CN111968751B (zh) 2021-10-19

Family

ID=73360728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010604560.3A Active CN111968751B (zh) 2020-06-29 2020-06-29 一种使用多基线校正模型的传染病趋势预测方法与系统

Country Status (1)

Country Link
CN (1) CN111968751B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967811A (zh) * 2020-12-15 2021-06-15 广州呼吸健康研究院 新型冠状病毒各地疫情各地累积感染人数预测方法、系统及装置
CN112820414B (zh) * 2021-01-29 2021-11-09 南威软件股份有限公司 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法
US11948694B2 (en) 2021-05-12 2024-04-02 Merative Us L.P. Controlling compartmental flows in epidemiological modeling based on mobility data
CN113314231B (zh) * 2021-05-28 2022-04-22 北京航空航天大学 一种融合时空信息的传染病传播预测系统和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1315998A (zh) * 1998-07-14 2001-10-03 科里克萨有限公司 用于治疗和诊断前列腺癌的组合物和方法
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法
CN110136842A (zh) * 2019-04-04 2019-08-16 平安科技(深圳)有限公司 急性传染病的发病预测方法、装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11238989B2 (en) * 2017-11-08 2022-02-01 International Business Machines Corporation Personalized risk prediction based on intrinsic and extrinsic factors

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1315998A (zh) * 1998-07-14 2001-10-03 科里克萨有限公司 用于治疗和诊断前列腺癌的组合物和方法
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法
CN110136842A (zh) * 2019-04-04 2019-08-16 平安科技(深圳)有限公司 急性传染病的发病预测方法、装置及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Modelling Logistic Growth Model for COVID-19 Pandemic in India;Minni Jain 等;《2020 5th International Conference on Communication and Electronics Systems (ICCES)》;20200612;第1-6页 *
多曲线季节指数模型分析广东省登革热流行时间特征及应用探讨;曾四清 等;《实用预防医学》;20180904;第25卷(第9期);第1137-1141页 *

Also Published As

Publication number Publication date
CN111968751A (zh) 2020-11-20

Similar Documents

Publication Publication Date Title
CN111968751B (zh) 一种使用多基线校正模型的传染病趋势预测方法与系统
CN111524611B (zh) 构建传染病趋势预测模型的方法、预测方法、装置及设备
Huerta et al. Time-varying models for extreme values
CN108304355B (zh) 一种基于sarima-wnn模型预测弹性云计算资源的方法
Li et al. Coherent forecasting of mortality rates: A sparse vector-autoregression approach
US8589329B2 (en) Method and apparatus for incremental tracking of multiple quantiles
Katz et al. Mixture model for overdispersion of precipitation
Tang et al. A sparse semismooth Newton based proximal majorization-minimization algorithm for nonconvex square-root-loss regression problems
Taylor et al. Building price-level forecasting: an examination of techniques and applications
Mammen et al. In-sample forecasting applied to reserving and mesothelioma mortality
Pang et al. On interval estimation of the coefficient of variation for the three-parameter Weibull, lognormal and gamma distribution: A simulation-based approach
Chakraborty Prediction accuracy of a sample-size estimation method for ROC studies
Patterson et al. Comparative performance of ADAPT and Laurec–Shepherd methods for estimating fish population parameters and in stock management
Garai et al. An MRA Based MLR Model for Forecasting Indian Annual Rainfall Using Large Scale Climate Indices
CN113161004B (zh) 一种疫情预测系统及方法
CN116107854A (zh) 一种计算机运行维护指标预测方法、系统、设备及介质
Jewson Application of uncertain hurricane climate change projections to catastrophe risk models
Ediev On the existence and uniqueness of the remaining life expectancy in the model of a stable population
Debón et al. A comparison of models for dynamic life tables. Application to mortality data from the Valencia Region (Spain)
Olanrewaju et al. Kullback-Leibler Divergence of Mixture Autoregressive Random Processes via Extreme-Value-Distributions (EVDs) Noise with Application of the Processes to Climate Change
Liu et al. Fast estimators for the mean function for functional data with detection limits
Monteiro et al. Modelling preferential sampling in time
CN114758761A (zh) 基于两步回归的医院门诊就诊人数的预测方法、装置、设备和存储介质
Lee et al. Generalised additive dependency inflated models including aggregated covariates
Shtossel et al. Sampling bias minimization in disease frequency estimates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant