CN111968755A - 一种基于lstm深度学习网络模型的疫情预测模型 - Google Patents
一种基于lstm深度学习网络模型的疫情预测模型 Download PDFInfo
- Publication number
- CN111968755A CN111968755A CN202010846548.3A CN202010846548A CN111968755A CN 111968755 A CN111968755 A CN 111968755A CN 202010846548 A CN202010846548 A CN 202010846548A CN 111968755 A CN111968755 A CN 111968755A
- Authority
- CN
- China
- Prior art keywords
- layer
- term memory
- short term
- long
- memory network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 230000015654 memory Effects 0.000 claims abstract description 33
- 230000004913 activation Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 5
- 230000007787 long-term memory Effects 0.000 claims 4
- 230000006403 short-term memory Effects 0.000 claims 4
- 238000011161 development Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 47
- 230000018109 developmental process Effects 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 230000002265 prevention Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。本发明将2*LSTM层连接模型对序列化数据进行建模,充分考虑疫情序列数据之间变化的影响,使得模型拟合效果更好。疫情序列数据在经过1层LSTM训练后,记忆信息得以保留并传输入下一层LSTM,使得模型能充分学习序列间的变化信息,无需考虑除疫情变化记录外的其他参数,预测误差相对较低,对于后期疫情发展趋势存在参考价值。
Description
技术领域
本发明涉及深度学习算法领域,具体地说,特别涉及到一种基于LSTM深度学习网络模型的疫情预测模型。
背景技术
随着全国各地进行疫情防控,疫情逐渐得到控制。预测疫情在未来几个月的发展趋势,对于社会是否放松疫情防控起到一定参考作用。疫情数据的变化与政府政策和群众的疫情防控情况息息相关,存在一定幅度的抖动情况。各个地区的疫情状况大致上相同,但由于与地区监管程度和人流量存在联系,数据浮动略有差异。
目前疫情预测运用最多的SEIR(susceptible-exposed-infected-removed) 模型,但该模型往往需要考虑不同感染程度的人群之间的相互转移,使用较多参数,不同区域的传染率、基本再生数等参数不同,为数据建模带来困难。而 LSTM是一种循环神经网络,可直接用于对含有规律信息的序列数据进行建模,广泛应用于语音识别和文字翻译等领域。目前已使用在疫情预测中的单层的 LSTM网络模型的训练结果一般,预测值与真实值之间存在较大差异。
发明内容
本发明的目的在于针对现有技术中的不足,提供一种基于LSTM深度学习网络模型的疫情预测模型,以解决现有技术中存在的问题。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;
所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。
进一步的,所述疫情预测模型用于输入疫情数据和输出预测结果,疫情数据在输入前经过序列化处理,所述数据序列化是将单独的数据以给定的长度封装成序列数据,所述序列数据具有用于疫情预测模型学习的内部变化规律。
进一步的,所述具有内部变化规律序列数据可在两层长短期记忆网络层和长短期记忆网络层内部循环单元进行传输,长短期记忆网络层内部循环单元在每一时刻t都有输入xt和输出ht;
与现有技术相比,本发明的有益效果在于:
1)将2*LSTM层连接模型对序列化数据进行建模,充分考虑疫情序列数据之间变化的影响,使得模型拟合效果更好。
2)疫情序列数据在经过1层LSTM训练后,记忆信息得以保留并传输入下一层LSTM,使得模型能充分学习序列间的变化信息,无需考虑除疫情变化记录外的其他参数,预测误差相对较低,对于后期疫情发展趋势存在参考价值。
附图说明
图1为本发明的基于LSTM的神经网络模型示意图。
图2为本发明的实施例每日新增数据预测结果示意图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
实施例
本实施例提供一种基于LSTM深度学习网络模型的疫情预测方法。该方法中主要将2020年1月16日至2020年7月6日的疫情每日新增病例数据封装为序列化数据,然后经过3*LSTM神经网络模型进行训练,疫情数据序列化后通过以 LSTM为核心部分的神经网络模型学习规律,并预测截止至2020年12月底的疫情发展趋势。该网络模型包括2个连接的LSTM层、全连接(Dense)层和激活层(Activation)层,所述LSTM用于提取序列数据中的规律信息,所述Dense 层用于拟定输出维度,所述Activation层用于调整预测数据与标签数据之间的拟合程度。
具体描述如下:
(1)疫情数据原本为单独个体,个体没有变化规律,故而需要将单独的疫情数据个体序列化,生成序列数据,可提供模型学习序列内部变化规律。数据序列化是将单独的173日每日疫情数据以时间步长为7封装成164条序列数据。
(2)将疫情序列数据输入基于LSTM的神经网络模型(如图1所示)中根据标签数据进行监督式训练,并输出预测值。再使用该模型预测未来疫情发展趋势。在2*LSTM模型中,带有变化规律的信息流可在LSTM内部循环单元和2个连接的LSTM层之间进行传输。内部循环单元在每一时刻t都有输入xt和输出ht;
本实施例的疫情预测方法将疫情每日新增病例数据封装为序列化数据,然后经过3*LSTM神经网络模型进行训练,自主学习序列中的规律信息并进行建模,最后输出预测值,预测截止至2020年12月底的疫情发展趋势,如图2所示,其中标签train为真实疫情数据,train_predict为有监督的数据预测, trend_forecast为无监督的疫情趋势预测,该模型RMSE(Root Mean Square Error)) 为17.24。
本实施例的疫情预测方法可解决以下问题:
1、可充分学习存在抖动的疫情数据的变化情况,解决了抖动数据规律不易获取的问题。
2、可根据学习到的规律信息进行建模,模型拟合度高,并预测未来趋势,解决了模型拟合效果差的问题。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (3)
1.一种基于LSTM深度学习网络模型的疫情预测模型,包括LSTM用于提取序列数据中的规律信息的长短期记忆网络层、用于拟定输出维度的全连接层、以及用于调整预测数据与标签数据之间的拟合程度的激活层;其特征在于:
所述疫情预测模型包含两层连接的长短期记忆网络层,第一层长短期记忆网络层的输出作为第二层长短期记忆网络层的输入。
2.根据权利要求1所述的基于LSTM深度学习网络模型的疫情预测模型,其特征在于:所述疫情预测模型用于输入疫情数据和输出预测结果,疫情数据在输入前经过序列化处理,所述数据序列化是将单独的数据以给定的长度封装成序列数据,所述序列数据具有用于疫情预测模型学习的内部变化规律。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010846548.3A CN111968755A (zh) | 2020-08-21 | 2020-08-21 | 一种基于lstm深度学习网络模型的疫情预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010846548.3A CN111968755A (zh) | 2020-08-21 | 2020-08-21 | 一种基于lstm深度学习网络模型的疫情预测模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111968755A true CN111968755A (zh) | 2020-11-20 |
Family
ID=73389873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010846548.3A Pending CN111968755A (zh) | 2020-08-21 | 2020-08-21 | 一种基于lstm深度学习网络模型的疫情预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111968755A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529329A (zh) * | 2020-12-21 | 2021-03-19 | 广东珠江智联信息科技股份有限公司 | 基于bp算法和seir模型的传染病预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
CN109829587A (zh) * | 2019-02-12 | 2019-05-31 | 国网山东省电力公司电力科学研究院 | 基于深度lstm网络的小区域级超短期负荷预测及可视化方法 |
CN109858937A (zh) * | 2018-05-14 | 2019-06-07 | 上海源庐加佳信息科技有限公司 | 基于深度学习的期货商品价格趋势预测方法 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110163421A (zh) * | 2019-04-29 | 2019-08-23 | 广东电网有限责任公司电网规划研究中心 | 中长期电力负荷预测方法 |
CN111524611A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 构建传染病趋势预测模型的方法、预测方法、装置及设备 |
-
2020
- 2020-08-21 CN CN202010846548.3A patent/CN111968755A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858937A (zh) * | 2018-05-14 | 2019-06-07 | 上海源庐加佳信息科技有限公司 | 基于深度学习的期货商品价格趋势预测方法 |
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
CN109829587A (zh) * | 2019-02-12 | 2019-05-31 | 国网山东省电力公司电力科学研究院 | 基于深度lstm网络的小区域级超短期负荷预测及可视化方法 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110163421A (zh) * | 2019-04-29 | 2019-08-23 | 广东电网有限责任公司电网规划研究中心 | 中长期电力负荷预测方法 |
CN111524611A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 构建传染病趋势预测模型的方法、预测方法、装置及设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529329A (zh) * | 2020-12-21 | 2021-03-19 | 广东珠江智联信息科技股份有限公司 | 基于bp算法和seir模型的传染病预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413785B (zh) | 一种基于bert和特征融合的文本自动分类方法 | |
CN108733792B (zh) | 一种实体关系抽取方法 | |
WO2022068314A1 (zh) | 神经网络训练的方法、神经网络的压缩方法以及相关设备 | |
CN108416065B (zh) | 基于层级神经网络的图像-句子描述生成系统及方法 | |
CN109992773A (zh) | 基于多任务学习的词向量训练方法、系统、设备及介质 | |
WO2016145676A1 (zh) | 基于满足k度稀疏约束的深度学习模型的大数据处理方法 | |
CN110110122A (zh) | 基于多层语义深度哈希算法的图像-文本跨模态检索 | |
CN116415654A (zh) | 一种数据处理方法及相关设备 | |
Smith et al. | Astronomia ex machina: a history, primer and outlook on neural networks in astronomy | |
US11562204B2 (en) | Method and apparatus for performing recognition using recurrent model and training recurrent model | |
CN115391563B (zh) | 一种基于多源异构数据融合的知识图谱链路预测方法 | |
Ren | Learning fuzzy cognitive maps by a hybrid method using nonlinear Hebbian learning and extended great deluge algorithm | |
CN111653275A (zh) | 基于lstm-ctc尾部卷积的语音识别模型的构建方法及装置、语音识别方法 | |
CN109948159A (zh) | 一种文本数据生成方法、装置、设备及可读存储介质 | |
CN114663962A (zh) | 一种基于图像补全的唇形同步人脸伪造生成方法及系统 | |
Liang et al. | An Improved Double Channel Long Short‐Term Memory Model for Medical Text Classification | |
CN111968755A (zh) | 一种基于lstm深度学习网络模型的疫情预测模型 | |
CN111191461A (zh) | 一种基于课程学习的远程监督关系抽取方法 | |
Tesfagergish et al. | Part-of-speech tagging via deep neural networks for northern-Ethiopic languages | |
CN117272195A (zh) | 基于图卷积注意力网络的区块链异常节点检测方法及系统 | |
CN114511023A (zh) | 分类模型训练方法以及分类方法 | |
CN110889505A (zh) | 一种图文序列匹配的跨媒体综合推理方法和系统 | |
Liu et al. | Iterative deep neighborhood: a deep learning model which involves both input data points and their neighbors | |
WO2022193412A1 (zh) | 基于人体骨架点云交互学习的视频暴力识别方法、系统及介质 | |
Zhang et al. | Hybrid deep feature fusion of 2D CNN and 3D CNN for vestibule segmentation from CT images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |