CN112820414A - 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法 - Google Patents

基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法 Download PDF

Info

Publication number
CN112820414A
CN112820414A CN202110129756.6A CN202110129756A CN112820414A CN 112820414 A CN112820414 A CN 112820414A CN 202110129756 A CN202110129756 A CN 202110129756A CN 112820414 A CN112820414 A CN 112820414A
Authority
CN
China
Prior art keywords
model
confirmed
exponential smoothing
lstm
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110129756.6A
Other languages
English (en)
Other versions
CN112820414B (zh
Inventor
吴志雄
甘建武
李晓琼
黄鼎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linewell Software Co Ltd
Original Assignee
Linewell Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linewell Software Co Ltd filed Critical Linewell Software Co Ltd
Priority to CN202110129756.6A priority Critical patent/CN112820414B/zh
Priority to PCT/CN2021/075404 priority patent/WO2022160370A1/zh
Publication of CN112820414A publication Critical patent/CN112820414A/zh
Application granted granted Critical
Publication of CN112820414B publication Critical patent/CN112820414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,具体包括以下步骤:爬取全国各个地区的疫情数据;将全国与各地区疫情的现存确诊人数、日新增确诊人数分别构成两组时间序列数据,形成现存确诊人数、日新增确诊人数预测数据集;使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型分别进行现存确诊人数、日新增确诊人数的预测;使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存确诊人数、日新增确诊人数的预测;结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺炎疫情风险指数,并以此划分风险等级。本发明能够提高预测的精度。

Description

基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警 方法
技术领域
本发明涉及疫情预警技术领域,特别是基于改进的三次指数平滑模型及LSTM模型在新冠 疫情的预警方法。
背景技术
新冠肺炎的大多数患者症状轻微,预后良好,但也有部分患者迅速发展至危重状态,各地 区进入紧急“备战”状态。因此,若能够对新冠肺炎进行准确预警,便能够辅助公共卫生、应 急、疾控等部门和其他相关决策者制定疫情防控策略,比如落实在具体时间地点上的医疗投入、 是否限制流动、对个人采取的防护建议、复工复学的可能性。
目前,对新冠肺炎的预测预警方法从数据来源角度主要分为两种。
其一,通过LASSO回归对72个临床因素进行筛选,发现10个关键的独立风险因子,包括: 胸部X光异常、年龄、咯血、气促、意识障碍、基础疾病数量、既往癌症史、中性粒细胞与淋 巴细胞比值、乳酸脱氢酶和直接胆红素,随后根据每个风险因子的权重构建多因素预测模型, 内部验证准确度达到88%,可用于患者就诊时的分流处理,提高医疗资源分配的效率,但该方 法需要拥有患者的临床检查数据,数据获取难度大。
其二,通过研发大数据预测模型希望对疫情防控这件事情做到有的放矢、未雨绸缪。第一 类模型从数据本身观察预测,包括自回归和机器学习(深度学习)两种,从数据本身观察预测 比较简单易于实施,对近期预测效果尚可,但长期预测性能显著下降,并且只能给出变量预测 结果,并不能够揭示疫情发展更深层次的规律;第二类模型是融合传染病动力学的模型,考虑 了随时间变化的抗疫措施的动态影响,因此可以预测较长时间的值,准确率明显提升,但其缺 陷在于模型参数太多而已知数据太少,拟合过程中容易受噪音干扰,鲁棒性差。此外,没有疫 情直报数据、百度人口迁徙数据以外的其他数据,以及各省独立建模等都影响模型性能。
发明内容
有鉴于此,本发明的目的是提出一种基于改进的三次指数平滑模型及LSTM模型在新冠疫 情的预警方法,能够提高预测的精度。
本发明采用以下方案实现:一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的 预警方法,具体包括以下步骤:
爬取全国各个地区的疫情数据;
将全国与各地区疫情的现存确诊人数、日新增确诊人数分别构成两组时间序列数据,形成 现存确诊人数、日新增确诊人数预测数据集,用于模型训练及模型评估的比值为4:1;
使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型分别进行现存确 诊人数、日新增确诊人数的预测;
使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存确诊人数、日新 增确诊人数的预测;
结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺炎疫情风险指数, 并以此划分风险等级。
进一步地,所述爬取全国各个地区的疫情数据具体为:
利用爬虫工具爬取全国各地每日包括新冠肺炎确诊人数、疑似人数、死亡人数、恢复人数 数据在内的相关疫情数据,并汇聚各地包括人口密集度、人均地区生产总值在内的数据,存储 至数据库中。
进一步地,所述使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型 分别进行现存确诊人数、日新增确诊人数的预测具体包括以下步骤:
获取各地区以及全国的现存确诊人数或日新增确诊人数的时间序列,对原始数据进行一次 指数平滑处理:
Figure BDA0002925058110000021
式中,
Figure BDA0002925058110000022
为第t期的一次指数平滑值;yt第t期的实际值;
Figure BDA0002925058110000023
第t-1期的一次指数平滑值, α为一次平滑系数;
将第二次、第三次平滑系数更改为自适应动态平滑系数,在一次指数平滑的基础上,进行 二次和三次指数平滑:
Figure BDA0002925058110000031
Figure BDA0002925058110000032
Figure BDA0002925058110000033
式中,
Figure BDA0002925058110000034
为第t、t-1期的二次指数平滑值,n为期数总数;
Figure BDA0002925058110000035
为第t、t-1 期的三次指数平滑值;
Figure BDA0002925058110000036
为二、三次第t期自适应动态平滑系数, α为一次平滑系数;yt、yt-1第t、t-1期的实际值;
建立预测方程:
Figure BDA0002925058110000037
Figure BDA0002925058110000038
Figure BDA0002925058110000039
Figure BDA00029250581100000310
Figure BDA00029250581100000311
为在t时刻预测T时刻后的预测值;
Figure BDA00029250581100000312
为第t期的一次指数平滑值;
Figure BDA00029250581100000313
为第t期的二 次指数平滑值;
Figure BDA00029250581100000314
为第t期的三次指数平滑值;α为一次平滑系数;
根据上面的预测方程来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均 绝对误差ε1
Figure BDA00029250581100000315
式中,
Figure BDA00029250581100000316
为改进的三次指数平滑模型在t0时刻预测T时刻后的预测值;
Figure BDA00029250581100000317
为t0时刻T时 刻后的实际值,即t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练 数据集的最后一期。
进一步地,所述使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存 确诊人数、日新增确诊人数的预测具体为:
将预测数据集划分为训练集和测试集,采用训练集对LSTM网络进行训练,采用训练好的 LSTM网络来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均绝对误差ε2
Figure BDA0002925058110000041
式中,
Figure BDA0002925058110000042
为LSTM模型在t0+T时刻的预测值;
Figure BDA0002925058110000043
为t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练数据集的最后一期。
进一步地,所述结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺 炎疫情风险指数具体为:
计算现存确诊人数风险指数YIndexarea,t
Figure BDA0002925058110000044
式中,εy1、εy2分别为三次指数平滑模型、LSTM网络对地区现存确诊人数预测的平均绝对 误差;εY1、εY2分别为三次指数平滑模型、LSTM模型对全国现存确诊人数预测的平均绝对误差;
Figure BDA0002925058110000045
分别为现存确诊人数三次指数平滑模型、LSTM网络t时地区新冠现存确诊人数预测 值;
Figure BDA0002925058110000046
分别为三次指数平滑模型、LSTM网络t时全国新冠现存确诊人数预测值;
计算日新增确诊人数风险指数XIndexarea,t
Figure BDA0002925058110000051
式中,εx1、εx2分别为三次指数平滑模型、LSTM网络对地区日新增确诊人数预测的平均绝 对误差;εX1、εX2分别为三次指数平滑模型、LSTM网络对全国日新增确诊人数预测的平均绝对 误差;
Figure BDA0002925058110000052
分别为日新增确诊人数三次指数平滑模型、LSTM网络t时地区新冠日新增确 诊人数预测值;
Figure BDA0002925058110000053
分别为三次指数平滑模型、LSTM网络t时全国新冠日新增确诊人 数预测值;
计算地区基础风险指数BaseIndexarea
Figure BDA0002925058110000054
式中,PDarea为地区的人口密度;max{PD}、min{PD}为与同一地区级别区域的人口密度 最大值、最小值;PerGDParea为地区的人均地区生产总值;max{PerGDP}、min{PerGDP}为与 同一地区级别区域的均地区生产总值最大值、最小值;
结合现存确诊人数风险指数、日新增确诊人数风险指数、基础风险指数,计算得到地区综 合风险指数RiskIndexarea,t
RiskIndexarea,t=(η·YIndexarea,t+(1-η)XIndexarea,t)×BaseIndexarea
式中,η为超参数。
进一步地,所述超参数η取值为0.5。
进一步地,所述划分风险等级具体如下:
将RiskIndexarea,t为0的地区等级设为无风险,将RiskIndexarea,t范围为(0,0.2)的地区等级设 为低风险,将RiskIndexarea,t范围为[0.2,0.4)的地区等级设为中风险,将RiskIndexarea,t范围为[0.4,0.6)的地区等级设为中高风险,将RiskIndexarea,t范围为[0.6,1)的地区等级设为高风险。
本发明还提供了一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警系统, 包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运 行该计算机程序指令时,能够实现如上文所述的方法步骤。
本发明还提供了一种计算机可读存储介质,其上存储有能够被处理器运行的计算机程序指 令,当处理器运行该计算机程序指令时,能够实现如上文方法步骤。
与现有技术相比,本发明有以下有益效果:本发明中的三次指数平滑模型在二次、三次指 数平滑时,提出的自适应平滑指数的应用能够很好满足未知时间变化的要求,提高预测精确度。 同时,本发明模型的学习和预警能够自动运行,无需现场操作人员操作。给出的两种方法预测 出的全国或地区现存确诊人数、日新增确诊人数、风险指数、风险等级易于理解,方便操作人 员进行判断。
附图说明
图1为本发明实施例的原理示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明, 本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含 义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请 的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括 复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指 明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情 的预警方法,具体包括以下步骤:
爬取全国各个地区的疫情数据;
将全国与各地区疫情的现存确诊人数、日新增确诊人数分别构成两组时间序列数据,形成 现存确诊人数、日新增确诊人数预测数据集,用于模型训练及模型评估的比值为4:1;
使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型分别进行现存确 诊人数、日新增确诊人数的预测;
使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存确诊人数、日新 增确诊人数的预测;
结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺炎疫情风险指数, 并以此划分风险等级。
在本实施例中,所述爬取全国各个地区的疫情数据具体为:
利用爬虫工具爬取全国各地每日包括新冠肺炎确诊人数、疑似人数、死亡人数、恢复人数 数据在内的相关疫情数据,并汇聚各地包括人口密集度、人均地区生产总值在内的数据,存储 至数据库中。
在本实施例中,所述使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑 模型分别进行现存确诊人数、日新增确诊人数的预测具体为:由于三次平滑指数模型依赖于平 滑系数和初始值,其平滑系数为固定值,这对时间序列的变化存在一定的适应性问题,不能很 好的满足时间变化的要求,预测精度不高,而改进的三次平滑指数,则在二、三次进行平滑时, 采用自适应动态平滑系数,以满足时间变化的要求,提高预测精确度。具体包括以下步骤:
获取各地区以及全国的现存确诊人数或日新增确诊人数的时间序列,具体取该地区(全国) 新冠肺炎现存确诊人数(或日新增确诊人数)时间序列{y0,y1,y2,…,yn},选取合适的平滑系数 α∈[0,1],以及初始值S0=y0
对原始数据进行一次指数平滑处理:
Figure BDA0002925058110000071
式中,
Figure BDA0002925058110000072
为第t期的一次指数平滑值;yt第t期的实际值;
Figure BDA0002925058110000073
第t-1期的一次指数平滑值, α为一次平滑系数;
将第二次、第三次平滑系数更改为自适应动态平滑系数,以满足时间变化的要求,提高预 测精确度。在一次指数平滑的基础上,进行二次和三次指数平滑:
Figure BDA0002925058110000081
Figure BDA0002925058110000082
Figure BDA0002925058110000083
式中,
Figure BDA0002925058110000084
为第t、t-1期的二次指数平滑值,n为期数总数;
Figure BDA0002925058110000085
为第t、t-1 期的三次指数平滑值;
Figure BDA0002925058110000086
为二、三次第t期自适应动态平滑系数, α为一次平滑系数;yt、yt-1第t、t-1期的实际值;
建立预测方程:
Figure BDA0002925058110000087
Figure BDA0002925058110000088
Figure BDA0002925058110000089
Figure BDA00029250581100000810
Figure BDA00029250581100000811
为在t时刻预测T时刻后的预测值;
Figure BDA00029250581100000812
为第t期的一次指数平滑值;
Figure BDA00029250581100000813
为第t期的二 次指数平滑值;
Figure BDA00029250581100000814
为第t期的三次指数平滑值;α为一次平滑系数;
根据上面的预测方程来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均 绝对误差ε1
Figure BDA00029250581100000815
式中,
Figure BDA00029250581100000816
为改进的三次指数平滑模型在t0时刻预测T时刻后的预测值;
Figure BDA00029250581100000817
为t0时刻T时 刻后的实际值,即t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练 数据集的最后一期。
在本实施例中,所述使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行 现存确诊人数、日新增确诊人数的预测具体为:通过人工神经网络库Keras,利用Keras中包含 的LSTM网络模块构建LSTM模型分别进行新冠肺炎现存确诊人数、日新增确诊人数的预测。 构建LSTM模型:通过人工神经网络库Keras,利用Keras中包含的LSTM网络模块以及损失函数、 层数和Dropout模块,将训练集数据输入到LSTM网络中进行训练,损失函数选取均方误差函数 (MSE),优化器选取Adam,通过设置迭代次数epoch、批处理大小batch_size以及时间步长n_lag, 不断优化LSTM网络,并使损失函数降到最低,获得LSTM的参数设置(迭代次数epoch为100、 批处理大小batch_size为1以及时间步长n_lag为12)。此时,认定训练模型已是最优,然后 保存模型参数。具体包括以下步骤:
将预测数据集按照4:1的比例划分为训练集和测试集,采用训练集对LSTM网络进行训练, 采用训练好的LSTM网络来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均 绝对误差ε2
Figure BDA0002925058110000091
式中,
Figure BDA0002925058110000092
为LSTM模型在t0+T时刻的预测值;
Figure BDA0002925058110000093
为t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练数据集的最后一期。
重复以上两个步骤对全国、指定地区现存确诊人数、日新增确诊人数分别进行改进的三次 指数平滑模型和LSTM模型预测,得出现存确诊人数、日新增确诊人数的预测模型、参数和预 测结果。
在本实施例中,所述结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新 冠肺炎疫情风险指数具体为:
计算现存确诊人数风险指数YIndexarea,t
Figure BDA0002925058110000101
式中,εy1、εy2分别为三次指数平滑模型、LSTM网络对地区现存确诊人数预测的平均绝对 误差;εY1、εY2分别为三次指数平滑模型、LSTM模型对全国现存确诊人数预测的平均绝对误差;
Figure BDA0002925058110000102
分别为现存确诊人数三次指数平滑模型、LSTM网络t时地区新冠现存确诊人数预测 值;
Figure BDA0002925058110000103
分别为三次指数平滑模型、LSTM网络t时全国新冠现存确诊人数预测值;
计算日新增确诊人数风险指数XIndexarea,t
Figure BDA0002925058110000104
式中,εx1、εx2分别为三次指数平滑模型、LSTM网络对地区日新增确诊人数预测的平均绝 对误差;εX1、εX2分别为三次指数平滑模型、LSTM网络对全国日新增确诊人数预测的平均绝对 误差;
Figure BDA0002925058110000105
分别为日新增确诊人数三次指数平滑模型、LSTM网络t时地区新冠日新增确 诊人数预测值;
Figure BDA0002925058110000106
分别为三次指数平滑模型、LSTM网络t时全国新冠日新增确诊人 数预测值;
计算地区基础风险指数BaseIndexarea
Figure BDA0002925058110000107
式中,PDarea为地区的人口密度,单位:人/每平方公里;max{PD}、min{PD}为与同一地 区级别区域的人口密度最大值、最小值;PerGDParea为地区的人均地区生产总值;max{PerGDP}、 min{PerGDP}为与同一地区级别区域的均地区生产总值最大值、最小值;
结合现存确诊人数风险指数、日新增确诊人数风险指数、基础风险指数,计算得到地区综 合风险指数RiskIndexarea,t
RiskIndexarea,t=(η·YIndexarea,t+(1-η)XIndexarea,t)×BaseIndexarea
式中,η为超参数,且满足η∈[0,1]。优选的,本实施例中,所述超参数η取值为0.5。
在本实施例中,所述划分风险等级具体如下:
将RiskIndexarea,t为0的地区等级设为无风险,将RiskIndexarea,t范围为(0,0.2)的地区等级设 为低风险,将RiskIndexarea,t范围为[0.2,0.4)的地区等级设为中风险,将RiskIndexarea,t范围为[0.4, 0.6)的地区等级设为中高风险,将RiskIndexarea,t范围为[0.6,1)的地区等级设为高风险。具体 如下表:
riskIndex 0 (0,0.2) [0.2,0.4) [0.4,0.60) [0.60,1]
风险等级 无风险P4 低风险P3 中风险P2 中高风险P1 高风险P0
本实施例还提供了一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警系统, 包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运 行该计算机程序指令时,能够实现如上文所述的方法步骤。
本实施例还提供了一种计算机可读存储介质,其上存储有能够被处理器运行的计算机程序 指令,当处理器运行该计算机程序指令时,能够实现如上文方法步骤。
特别的,本实施例不仅仅展示模型对时间序列预测的结果,同时根据实时疫情状况预警地 区风险等级,综合考虑城市与城市、城市与全国之间的联系,能够更直观展示地区疫情状况。 辅助公共卫生、应急、疾控等部门和其他相关决策者制定疫情防控策略,比如落实在具体时间 地点上的医疗投入、是否限制流动、对个人采取的防护建议、复工复学的可能性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。 因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形 式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或 方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方 框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用 计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使 得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程 或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作 的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品, 该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其 他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设 备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框 中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉 本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但 是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、 等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (9)

1.一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,包括以下步骤:
爬取全国各个地区的疫情数据;
将全国与各地区疫情的现存确诊人数、日新增确诊人数分别构成两组时间序列数据,形成现存确诊人数、日新增确诊人数预测数据集,用于模型训练及模型评估数据集的比值为4:1;
使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型分别进行现存确诊人数、日新增确诊人数的预测;
使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存确诊人数、日新增确诊人数的预测;
结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺炎疫情风险指数,并以此划分风险等级。
2.根据权利要求1所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述爬取全国各个地区的疫情数据具体为:
利用爬虫工具爬取全国各地每日包括新冠肺炎确诊人数、疑似人数、死亡人数、恢复人数数据在内的相关疫情数据,并汇聚各地包括人口密集度、人均地区生产总值在内的数据,存储至数据库中。
3.根据权利要求1所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述使用预测数据集构建改进的指数平滑模型,采用构建的三次指数平滑模型分别进行现存确诊人数、日新增确诊人数的预测具体包括以下步骤:
获取各地区以及全国的现存确诊人数或日新增确诊人数的时间序列,对原始数据进行一次指数平滑处理:
Figure FDA0002925058100000011
式中,
Figure FDA0002925058100000012
为第t期的一次指数平滑值;yt第t期的实际值;
Figure FDA0002925058100000013
第t-1期的一次指数平滑值,α为一次平滑系数;
将第二次、第三次平滑系数更改为自适应动态平滑系数,在一次指数平滑的基础上,进行二次和三次指数平滑:
Figure FDA0002925058100000021
Figure FDA0002925058100000022
Figure FDA0002925058100000023
式中,
Figure FDA0002925058100000024
为第t、t-1期的二次指数平滑值,n为期数总数;
Figure FDA0002925058100000025
为第t、t-1期的三次指数平滑值;
Figure FDA0002925058100000026
Figure FDA0002925058100000027
为二、三次第t期自适应动态平滑系数,α为一次平滑系数;yt、yt-1第t、t-1期的实际值;
建立预测方程:
Figure FDA0002925058100000028
Figure FDA0002925058100000029
Figure FDA00029250581000000210
为在t时刻预测T时刻后的预测值;
Figure FDA00029250581000000211
为第t期的一次指数平滑值;
Figure FDA00029250581000000212
为第t期的二次指数平滑值;
Figure FDA00029250581000000213
为第t期的三次指数平滑值;α为一次平滑系数;
根据上面的预测方程来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均绝对误差ε1
Figure FDA00029250581000000214
式中,
Figure FDA0002925058100000031
为改进的三次指数平滑模型在t0时刻预测T时刻后的预测值;
Figure FDA0002925058100000032
为t0时刻T时刻后的实际值,即t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练数据集的最后一期。
4.根据权利要求1所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述使用预测数据集训练LSTM模型,采用训练好的LSTM模型分别进行现存确诊人数、日新增确诊人数的预测具体为:
将预测数据集划分为训练集和测试集,采用训练集对LSTM网络进行训练,采用训练好的LSTM网络来预测各地区或全国的现存确诊人数或日新增确诊人数,并计算平均绝对误差ε2
Figure FDA0002925058100000033
式中,
Figure FDA0002925058100000037
为LSTM模型在t0+T时刻的预测值;
Figure FDA0002925058100000034
为t0+T时刻的实际值;n为用于模型评估数据集的总期数,t0为用于模型训练数据集的最后一期。
5.根据权利要求1所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述结合三次指数平滑模型与LSTM模型预测的结果,计算地区某天的新冠肺炎疫情风险指数具体为:
计算现存确诊人数风险指数YIndexarea,t
Figure FDA0002925058100000035
式中,εy1、εy2分别为三次指数平滑模型、LSTM网络对地区现存确诊人数预测的平均绝对误差;εY1、εY2分别为三次指数平滑模型、LSTM模型对全国现存确诊人数预测的平均绝对误差;
Figure FDA0002925058100000036
分别为现存确诊人数三次指数平滑模型、LSTM网络t时地区新冠现存确诊人数预测值;
Figure FDA0002925058100000041
分别为三次指数平滑模型、LSTM网络t时全国新冠现存确诊人数预测值;
计算日新增确诊人数风险指数XIndexarea,t
Figure FDA0002925058100000042
式中,εx1、εx2分别为三次指数平滑模型、LSTM网络对地区日新增确诊人数预测的平均绝对误差;εX1、εX2分别为三次指数平滑模型、LSTM网络对全国日新增确诊人数预测的平均绝对误差;
Figure FDA0002925058100000043
分别为日新增确诊人数三次指数平滑模型、LSTM网络t时地区新冠日新增确诊人数预测值;
Figure FDA0002925058100000044
分别为三次指数平滑模型、LSTM网络t时全国新冠日新增确诊人数预测值;
计算地区基础风险指数BaseIndexarea
Figure FDA0002925058100000045
式中,PDarea为地区的人口密度;max{PD}、min{PD}为与同一地区级别区域的人口密度最大值、最小值;PerGDParea为地区的人均地区生产总值;max{PerGDP}、min{PerGDP}为与同一地区级别区域的均地区生产总值最大值、最小值;
结合现存确诊人数风险指数、日新增确诊人数风险指数、基础风险指数,计算得到地区综合风险指数RiskIndexarea,t
RiskIndexarea,t=(η·YIndexarea,t+(1-η)XIndexarea,t)×BaseIndexarea
式中,η为超参数。
6.根据权利要求5所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述超参数η取值为0.5。
7.根据权利要求1所述的一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警方法,其特征在于,所述划分风险等级具体如下:
将RiskIndexarea,t为0的地区等级设为无风险,将RiskIndexarea,t范围为(0,0.2)的地区等级设为低风险,将RiskIndexarea,t范围为[0.2,0.4)的地区等级设为中风险,将RiskIndexarea,t范围为[0.4,0.6)的地区等级设为中高风险,将RiskIndexarea,t范围为[0.6,1)的地区等级设为高风险。
8.一种基于改进的三次指数平滑模型及LSTM模型在新冠疫情的预警系统,其特征在于,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-7所述的方法步骤。
9.一种计算机可读存储介质,其上存储有能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-7所述的方法步骤。
CN202110129756.6A 2021-01-29 2021-01-29 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法 Active CN112820414B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110129756.6A CN112820414B (zh) 2021-01-29 2021-01-29 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法
PCT/CN2021/075404 WO2022160370A1 (zh) 2021-01-29 2021-02-05 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110129756.6A CN112820414B (zh) 2021-01-29 2021-01-29 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法

Publications (2)

Publication Number Publication Date
CN112820414A true CN112820414A (zh) 2021-05-18
CN112820414B CN112820414B (zh) 2021-11-09

Family

ID=75860476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110129756.6A Active CN112820414B (zh) 2021-01-29 2021-01-29 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法

Country Status (2)

Country Link
CN (1) CN112820414B (zh)
WO (1) WO2022160370A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342972A (zh) * 2021-05-24 2021-09-03 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统
CN113707336A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于数据分析的传染病防治预警方法、装置、设备及介质
CN114596966A (zh) * 2022-01-11 2022-06-07 南京邮电大学 一种面向流行病智能监测系统的疫情预测分析方法及系统
CN116167250A (zh) * 2023-04-23 2023-05-26 南京群顶科技股份有限公司 一种基于温差加权和时间序列算法的机房环境评估方法
CN117172501A (zh) * 2023-09-21 2023-12-05 奇点数联(北京)科技有限公司 一种基于数据挖掘的物资分配系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116071114B (zh) * 2023-04-04 2023-07-28 广州携旅信息科技有限公司 一种酒店电视媒体广告的流量预估方法和系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239849A (zh) * 2017-04-17 2017-10-10 西安电子科技大学 一种基于改进的指数平滑灰色模型电力负荷预测方法
CN109272142A (zh) * 2018-08-14 2019-01-25 苏州朗动网络科技有限公司 基于事件的数据预测方法、装置、计算机设备和存储介质
CN109360625A (zh) * 2018-11-12 2019-02-19 四川骏逸富顿科技有限公司 用于互联网中短期用药咨询业务量的预测系统及预测方法
CN109785003A (zh) * 2019-01-17 2019-05-21 四川骏逸富顿科技有限公司 一种药品零售行业药品销售预测系统及方法
CN111429006A (zh) * 2020-03-24 2020-07-17 北京明略软件系统有限公司 金融风险指标预测模型构建、风险态势预测方法和装置
CN111798991A (zh) * 2020-07-09 2020-10-20 重庆邮电大学 基于lstm的新冠肺炎疫情群体态势预测方法
CN111883262A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 疫情趋势预测方法、装置、电子设备及存储介质
CN111968751A (zh) * 2020-06-29 2020-11-20 金电联行(北京)信息技术有限公司 一种使用多基线校正模型的传染病趋势预测方法与系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4004863A1 (en) * 2019-07-23 2022-06-01 The Broad Institute, Inc. Health data aggregation and outbreak modeling
CN112201361A (zh) * 2020-09-01 2021-01-08 浙江大学山东工业技术研究院 一种基于lstm模型的covid-19疫情预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239849A (zh) * 2017-04-17 2017-10-10 西安电子科技大学 一种基于改进的指数平滑灰色模型电力负荷预测方法
CN109272142A (zh) * 2018-08-14 2019-01-25 苏州朗动网络科技有限公司 基于事件的数据预测方法、装置、计算机设备和存储介质
CN109360625A (zh) * 2018-11-12 2019-02-19 四川骏逸富顿科技有限公司 用于互联网中短期用药咨询业务量的预测系统及预测方法
CN109785003A (zh) * 2019-01-17 2019-05-21 四川骏逸富顿科技有限公司 一种药品零售行业药品销售预测系统及方法
CN111429006A (zh) * 2020-03-24 2020-07-17 北京明略软件系统有限公司 金融风险指标预测模型构建、风险态势预测方法和装置
CN111968751A (zh) * 2020-06-29 2020-11-20 金电联行(北京)信息技术有限公司 一种使用多基线校正模型的传染病趋势预测方法与系统
CN111798991A (zh) * 2020-07-09 2020-10-20 重庆邮电大学 基于lstm的新冠肺炎疫情群体态势预测方法
CN111883262A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 疫情趋势预测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王国权等: "基于自适应的动态三次指数平滑法的风电场风速预测", 《电力系统保护与控制》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342972A (zh) * 2021-05-24 2021-09-03 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统
CN113342972B (zh) * 2021-05-24 2023-02-28 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统
CN113707336A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于数据分析的传染病防治预警方法、装置、设备及介质
CN114596966A (zh) * 2022-01-11 2022-06-07 南京邮电大学 一种面向流行病智能监测系统的疫情预测分析方法及系统
CN114596966B (zh) * 2022-01-11 2024-04-19 南京邮电大学 一种面向流行病智能监测系统的疫情预测分析方法及系统
CN116167250A (zh) * 2023-04-23 2023-05-26 南京群顶科技股份有限公司 一种基于温差加权和时间序列算法的机房环境评估方法
CN117172501A (zh) * 2023-09-21 2023-12-05 奇点数联(北京)科技有限公司 一种基于数据挖掘的物资分配系统

Also Published As

Publication number Publication date
WO2022160370A1 (zh) 2022-08-04
CN112820414B (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN112820414B (zh) 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法
Vásquez-Morales et al. Explainable prediction of chronic renal disease in the colombian population using neural networks and case-based reasoning
US10872131B2 (en) Progression analytics system
CN110334843B (zh) 一种时变注意力改进Bi-LSTM的住院就医行为预测方法及装置
CN109002904B (zh) 一种基于Prophet-ARMA的医院门诊就诊量预测方法
Alkema et al. Global estimation of child mortality using a Bayesian B-spline bias-reduction model
Zandonà et al. A dynamic Bayesian network model for the simulation of amyotrophic lateral sclerosis progression
CN112201330A (zh) 结合DRGs工具和贝叶斯模型的医疗质量监测评估方法
CN108682457A (zh) 患者长期预后定量预测和干预系统及方法
KR20220053642A (ko) 유전자 데이터 분석을 위한 컴퓨터 구현 방법 및 장치
Valton et al. Recommendations for Bayesian hierarchical model specifications for case-control studies in mental health
Zanna et al. Bias reducing multitask learning on mental health prediction
CN108446841A (zh) 一种利用灰色关联确定事故因素层次结构的系统方法
Gromicho et al. Dynamic Bayesian networks for stratification of disease progression in amyotrophic lateral sclerosis
Shaghaghi et al. evision: Influenza forecasting using cdc, who, and google trends data
CN113520319A (zh) 一种基于逻辑回归的癫痫事件风险管理方法和系统
CN113782197B (zh) 基于可解释性机器学习算法的新冠肺炎患者转归预测方法
Devarapalli et al. Identification of AIDS disease severity based on computational intelligence techniques using clonal selection algorithm
Nguyen Gradient boosting for survival analysis with applications in oncology
CN115019960A (zh) 一种基于个性化状态空间进展模型的疾病辅助决策系统
CN115769300A (zh) 变体致病性评分和分类及其用途
Pan et al. Spatial homogeneity learning for spatially correlated functional data with application to COVID-19 growth rate curves
Pedroto et al. Predicting age of onset in TTR-FAP patients with genealogical features
CN112562854A (zh) 一种高龄人员精准医疗关怀服务推荐方法及系统
Zhu et al. Design and development of a readmission risk assessment system for patients with cardiovascular disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant