CN111968755A - 一种基于lstm深度学习网络模型的疫情预测模型 - Google Patents

一种基于lstm深度学习网络模型的疫情预测模型 Download PDF

Info

Publication number
CN111968755A
CN111968755A CN202010846548.3A CN202010846548A CN111968755A CN 111968755 A CN111968755 A CN 111968755A CN 202010846548 A CN202010846548 A CN 202010846548A CN 111968755 A CN111968755 A CN 111968755A
Authority
CN
China
Prior art keywords
layer
term memory
short term
long
memory network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010846548.3A
Other languages
English (en)
Inventor
洪中华
凡紫阳
栾奎峰
童小华
冯永玖
谢欢
陈鹏
刘世杰
金雁敏
许雄
柳思聪
王超
肖长江
晏雄锋
郭艺友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Shanghai Ocean University
Original Assignee
Tongji University
Shanghai Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University, Shanghai Ocean University filed Critical Tongji University
Priority to CN202010846548.3A priority Critical patent/CN111968755A/zh
Publication of CN111968755A publication Critical patent/CN111968755A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。本发明将2*LSTM层连接模型对序列化数据进行建模,充分考虑疫情序列数据之间变化的影响,使得模型拟合效果更好。疫情序列数据在经过1层LSTM训练后,记忆信息得以保留并传输入下一层LSTM,使得模型能充分学习序列间的变化信息,无需考虑除疫情变化记录外的其他参数,预测误差相对较低,对于后期疫情发展趋势存在参考价值。

Description

一种基于LSTM深度学习网络模型的疫情预测模型
技术领域
本发明涉及深度学习算法领域,具体地说,特别涉及到一种基于LSTM深度学习网络模型的疫情预测模型。
背景技术
随着全国各地进行疫情防控,疫情逐渐得到控制。预测疫情在未来几个月的发展趋势,对于社会是否放松疫情防控起到一定参考作用。疫情数据的变化与政府政策和群众的疫情防控情况息息相关,存在一定幅度的抖动情况。各个地区的疫情状况大致上相同,但由于与地区监管程度和人流量存在联系,数据浮动略有差异。
目前疫情预测运用最多的SEIR(susceptible-exposed-infected-removed) 模型,但该模型往往需要考虑不同感染程度的人群之间的相互转移,使用较多参数,不同区域的传染率、基本再生数等参数不同,为数据建模带来困难。而 LSTM是一种循环神经网络,可直接用于对含有规律信息的序列数据进行建模,广泛应用于语音识别和文字翻译等领域。目前已使用在疫情预测中的单层的 LSTM网络模型的训练结果一般,预测值与真实值之间存在较大差异。
发明内容
本发明的目的在于针对现有技术中的不足,提供一种基于LSTM深度学习网络模型的疫情预测模型,以解决现有技术中存在的问题。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;
所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。
进一步的,所述疫情预测模型用于输入疫情数据和输出预测结果,疫情数据在输入前经过序列化处理,所述数据序列化是将单独的数据以给定的长度封装成序列数据,所述序列数据具有用于疫情预测模型学习的内部变化规律。
进一步的,所述具有内部变化规律序列数据可在两层长短期记忆网络层和长短期记忆网络层内部循环单元进行传输,长短期记忆网络层内部循环单元在每一时刻t都有输入xt和输出ht
所述第一层长短期记忆网络层的输出为
Figure RE-GDA0002717754980000021
所述第二层长短期记忆网络层的输出为
Figure RE-GDA0002717754980000022
其中,m和n分别为第一层长短期记忆网络层和第二层长短期记忆网络层的输出维度,
Figure RE-GDA0002717754980000023
为第l层长短期记忆网络层第t时刻的输出,上一层长短期记忆网络层的输出均作为下一层长短期记忆网络层的输入。
与现有技术相比,本发明的有益效果在于:
1)将2*LSTM层连接模型对序列化数据进行建模,充分考虑疫情序列数据之间变化的影响,使得模型拟合效果更好。
2)疫情序列数据在经过1层LSTM训练后,记忆信息得以保留并传输入下一层LSTM,使得模型能充分学习序列间的变化信息,无需考虑除疫情变化记录外的其他参数,预测误差相对较低,对于后期疫情发展趋势存在参考价值。
附图说明
图1为本发明的基于LSTM的神经网络模型示意图。
图2为本发明的实施例每日新增数据预测结果示意图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
实施例
本实施例提供一种基于LSTM深度学习网络模型的疫情预测方法。该方法中主要将2020年1月16日至2020年7月6日的疫情每日新增病例数据封装为序列化数据,然后经过3*LSTM神经网络模型进行训练,疫情数据序列化后通过以 LSTM为核心部分的神经网络模型学习规律,并预测截止至2020年12月底的疫情发展趋势。该网络模型包括2个连接的LSTM层、全连接(Dense)层和激活层(Activation)层,所述LSTM用于提取序列数据中的规律信息,所述Dense 层用于拟定输出维度,所述Activation层用于调整预测数据与标签数据之间的拟合程度。
具体描述如下:
(1)疫情数据原本为单独个体,个体没有变化规律,故而需要将单独的疫情数据个体序列化,生成序列数据,可提供模型学习序列内部变化规律。数据序列化是将单独的173日每日疫情数据以时间步长为7封装成164条序列数据。
(2)将疫情序列数据输入基于LSTM的神经网络模型(如图1所示)中根据标签数据进行监督式训练,并输出预测值。再使用该模型预测未来疫情发展趋势。在2*LSTM模型中,带有变化规律的信息流可在LSTM内部循环单元和2个连接的LSTM层之间进行传输。内部循环单元在每一时刻t都有输入xt和输出ht
所述第一层长短期记忆网络层的输出为
Figure RE-GDA0002717754980000041
所述第二层长短期记忆网络层的输出为
Figure RE-GDA0002717754980000042
其中,m和n分别为第一层长短期记忆网络层和第二层长短期记忆网络层的输出维度,
Figure RE-GDA0002717754980000043
为第l层长短期记忆网络层第t时刻的输出,上一层长短期记忆网络层的输出均作为下一层长短期记忆网络层的输入。
本实施例的疫情预测方法将疫情每日新增病例数据封装为序列化数据,然后经过3*LSTM神经网络模型进行训练,自主学习序列中的规律信息并进行建模,最后输出预测值,预测截止至2020年12月底的疫情发展趋势,如图2所示,其中标签train为真实疫情数据,train_predict为有监督的数据预测, trend_forecast为无监督的疫情趋势预测,该模型RMSE(Root Mean Square Error)) 为17.24。
本实施例的疫情预测方法可解决以下问题:
1、可充分学习存在抖动的疫情数据的变化情况,解决了抖动数据规律不易获取的问题。
2、可根据学习到的规律信息进行建模,模型拟合度高,并预测未来趋势,解决了模型拟合效果差的问题。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (3)

1.一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;其特征在于:
所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。
2.根据权利要求1所述的基于LSTM深度学习网络模型的疫情预测模型,其特征在于:所述疫情预测模型用于输入疫情数据和输出预测结果,疫情数据在输入前经过序列化处理,所述数据序列化是将单独的数据以给定的长度封装成序列数据,所述序列数据具有用于疫情预测模型学习的内部变化规律。
3.根据权利要求2所述的基于LSTM深度学习网络模型的疫情预测模型,其特征在于:所述具有内部变化规律序列数据可在两层长短期记忆网络层和长短期记忆网络层内部循环单元进行传输,长短期记忆网络层内部循环单元在每一时刻t都有输入xt和输出ht
所述第一层长短期记忆网络层的输出为
Figure FDA0002643211030000011
所述第二层长短期记忆网络层的输出为
Figure FDA0002643211030000012
其中,m和n分别为第一层长短期记忆网络层和第二层长短期记忆网络层的输出维度,
Figure FDA0002643211030000013
为第l层长短期记忆网络层第t时刻的输出,上一层长短期记忆网络层的输出均作为下一层长短期记忆网络层的输入。
CN202010846548.3A 2020-08-21 2020-08-21 一种基于lstm深度学习网络模型的疫情预测模型 Pending CN111968755A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010846548.3A CN111968755A (zh) 2020-08-21 2020-08-21 一种基于lstm深度学习网络模型的疫情预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010846548.3A CN111968755A (zh) 2020-08-21 2020-08-21 一种基于lstm深度学习网络模型的疫情预测模型

Publications (1)

Publication Number Publication Date
CN111968755A true CN111968755A (zh) 2020-11-20

Family

ID=73389873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010846548.3A Pending CN111968755A (zh) 2020-08-21 2020-08-21 一种基于lstm深度学习网络模型的疫情预测模型

Country Status (1)

Country Link
CN (1) CN111968755A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529329A (zh) * 2020-12-21 2021-03-19 广东珠江智联信息科技股份有限公司 基于bp算法和seir模型的传染病预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545386A (zh) * 2018-11-02 2019-03-29 深圳先进技术研究院 一种基于深度学习的流感时空预测方法及装置
CN109829587A (zh) * 2019-02-12 2019-05-31 国网山东省电力公司电力科学研究院 基于深度lstm网络的小区域级超短期负荷预测及可视化方法
CN109858937A (zh) * 2018-05-14 2019-06-07 上海源庐加佳信息科技有限公司 基于深度学习的期货商品价格趋势预测方法
CN110085327A (zh) * 2019-04-01 2019-08-02 东莞理工学院 基于注意力机制的多通道lstm神经网络流感疫情预测方法
CN110163421A (zh) * 2019-04-29 2019-08-23 广东电网有限责任公司电网规划研究中心 中长期电力负荷预测方法
CN111524611A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 构建传染病趋势预测模型的方法、预测方法、装置及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858937A (zh) * 2018-05-14 2019-06-07 上海源庐加佳信息科技有限公司 基于深度学习的期货商品价格趋势预测方法
CN109545386A (zh) * 2018-11-02 2019-03-29 深圳先进技术研究院 一种基于深度学习的流感时空预测方法及装置
CN109829587A (zh) * 2019-02-12 2019-05-31 国网山东省电力公司电力科学研究院 基于深度lstm网络的小区域级超短期负荷预测及可视化方法
CN110085327A (zh) * 2019-04-01 2019-08-02 东莞理工学院 基于注意力机制的多通道lstm神经网络流感疫情预测方法
CN110163421A (zh) * 2019-04-29 2019-08-23 广东电网有限责任公司电网规划研究中心 中长期电力负荷预测方法
CN111524611A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 构建传染病趋势预测模型的方法、预测方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529329A (zh) * 2020-12-21 2021-03-19 广东珠江智联信息科技股份有限公司 基于bp算法和seir模型的传染病预测方法

Similar Documents

Publication Publication Date Title
CN110413785B (zh) 一种基于bert和特征融合的文本自动分类方法
CN108733792B (zh) 一种实体关系抽取方法
WO2022068314A1 (zh) 神经网络训练的方法、神经网络的压缩方法以及相关设备
CN108416065B (zh) 基于层级神经网络的图像-句子描述生成系统及方法
CN109992773A (zh) 基于多任务学习的词向量训练方法、系统、设备及介质
WO2016145676A1 (zh) 基于满足k度稀疏约束的深度学习模型的大数据处理方法
CN110110122A (zh) 基于多层语义深度哈希算法的图像-文本跨模态检索
CN116415654A (zh) 一种数据处理方法及相关设备
Smith et al. Astronomia ex machina: a history, primer and outlook on neural networks in astronomy
US11562204B2 (en) Method and apparatus for performing recognition using recurrent model and training recurrent model
CN115391563B (zh) 一种基于多源异构数据融合的知识图谱链路预测方法
Ren Learning fuzzy cognitive maps by a hybrid method using nonlinear Hebbian learning and extended great deluge algorithm
CN111653275A (zh) 基于lstm-ctc尾部卷积的语音识别模型的构建方法及装置、语音识别方法
CN109948159A (zh) 一种文本数据生成方法、装置、设备及可读存储介质
CN114663962A (zh) 一种基于图像补全的唇形同步人脸伪造生成方法及系统
Liang et al. An Improved Double Channel Long Short‐Term Memory Model for Medical Text Classification
CN111968755A (zh) 一种基于lstm深度学习网络模型的疫情预测模型
CN111191461A (zh) 一种基于课程学习的远程监督关系抽取方法
Tesfagergish et al. Part-of-speech tagging via deep neural networks for northern-Ethiopic languages
CN117272195A (zh) 基于图卷积注意力网络的区块链异常节点检测方法及系统
CN114511023A (zh) 分类模型训练方法以及分类方法
CN110889505A (zh) 一种图文序列匹配的跨媒体综合推理方法和系统
Liu et al. Iterative deep neighborhood: a deep learning model which involves both input data points and their neighbors
WO2022193412A1 (zh) 基于人体骨架点云交互学习的视频暴力识别方法、系统及介质
Zhang et al. Hybrid deep feature fusion of 2D CNN and 3D CNN for vestibule segmentation from CT images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination