CN113744888B - 区域流行病趋势预测预警方法及系统 - Google Patents
区域流行病趋势预测预警方法及系统 Download PDFInfo
- Publication number
- CN113744888B CN113744888B CN202111024174.8A CN202111024174A CN113744888B CN 113744888 B CN113744888 B CN 113744888B CN 202111024174 A CN202111024174 A CN 202111024174A CN 113744888 B CN113744888 B CN 113744888B
- Authority
- CN
- China
- Prior art keywords
- epidemic
- trend
- data
- sub
- early warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种区域流行病趋势预测预警方法及系统,方法包括:获取样本流行病的趋势预警数据,对样本流行病的趋势预警数据进行处理得到样本数据,根据样本数据训练多个子网络模型,将多个子网络模型进行融合得到样本流行病趋势预测模型。本申请中还获取全部区域内全部流行病的趋势预警数据,根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型,根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。本申请能够提升模型在预测步长较大时的预测精度,且趋势预警数据均为原始数据,准确易获取。
Description
技术领域
本申请涉及模型训练技术领域,尤其涉及一种区域流行病趋势预测预警方法及系统。
背景技术
随着互联网信息技术的快速发展和网络覆盖率的不断提高,互联网“大数据”已经渗透到社会的各个行业、领域,各种社交软件及搜索引擎早已成为人们发布和了解各种信息的主要渠道,使得利用互联网“大数据”对流行病趋势进行预测成为可能。但是现有技术中基于互联网“大数据”对流行病趋势进行预测的预测模型未能做到对流行病发展趋势进行较为准确的长期预测。且现有技术中采用的LSTM神经网络预测模型对样本数据需求较大,但并未提供一个简单的数据采集方法。
发明内容
为至少在一定程度上克服相关技术中预测模型未能做到对流行病发展趋势进行较为准确的长期预测且数据采集困难的问题,本申请提供一种区域流行病趋势预测预警方法及系统。
本申请的方案如下:
根据本申请实施例的第一方面,提供一种区域流行病趋势预测预警方法,包括:
获取样本流行病的趋势预警数据;所述趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
对所述样本流行病的趋势预警数据进行处理得到样本数据;
根据所述样本数据训练多个子网络模型;
将多个所述子网络模型进行融合得到样本流行病趋势预测模型;
获取全部区域内全部流行病的趋势预警数据;
根据所述全部区域内全部流行病的趋势预警数据,对所述样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
根据所述全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。
优选的,在本申请一种可实现的方式中,还包括:
将各区域内全部流行病各自对应的流行病趋势预测模型分别部署到远程医疗平台各区域项目点的应用空间中;
定期更新各区域内全部流行病各自对应的流行病趋势预测模型。
优选的,在本申请一种可实现的方式中,还包括:
在用户登录后获取用户登录区域及当前系统时间;
根据用户登录区域内全部流行病各自对应的流行病趋势预测模型,以所述当前系统时间为基准,进行用户登录区域内全部流行病的流行趋势预测,并生成可视化的预测结果;
根据所述预测结果生成对应的流行病传播趋势预警和防控建议,并展示给用户。
优选的,在本申请一种可实现的方式中,所述对所述趋势预警数据进行处理得到样本数据,包括:
对选取的趋势预警数据进行数据清洗、特征筛选、数据分析、缺失值处理、on-hot编码和归一化处理;
将处理后的趋势预警数据根据时间顺序划分数据集;所述数据集包括:训练集、验证集和测试集;
将所述训练集作为训练所述子网络模型的样本数据。
优选的,在本申请一种可实现的方式中,所述根据所述样本数据训练多个子网络模型,包括:
建立第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;
基于所述样本数据,使所述第一子网络模型学习与所述待预测流行病相关关键词的搜索趋势指数对未来疾病发病人数的影响;使所述第二子网络模型学习区域历史气象数据对未来疾病发病人数的影响;使所述第三子网络模型学习流行病公共监控数据对未来疾病发病人数的影响;使所述第四子网络模型学习所述训练数据之间的潜在联系。
优选的,在本申请一种可实现的方式中,还包括:
使所述第一子网络模型、所述第二子网络模型、所述第三子网络模型和所述第四子网络模型进行并行学习。
优选的,在本申请一种可实现的方式中,所述将多个所述子网络模型进行融合得到样本流行病趋势预测模型,包括:
将所述第一子网络模型、所述第二子网络模型、所述第三子网络模型和所述第四子网络模型学习得到的信息向量进行拼接得到总信息向量;
训练所述样本流行病趋势预测模型,使所述样本流行病趋势预测模型通过残差网络和全连接网络对所述总信息向量进行融合,得到所述样本数据对应的流行趋势预测结果。
优选的,在本申请一种可实现的方式中,所述训练所述样本流行病趋势预测模型,包括:
基于Early Stopping和Dropput方法,训练所述流行病趋势预测模型。
优选的,在本申请一种可实现的方式中,还包括:基于均方根误差、决定系数和平均绝对误差指标对所述样本流行病趋势预测模型的预测能力进行评价。
根据本申请实施例的第二方面,提供一种区域流行病趋势预测预警系统,包括:
获取模块,用于获取样本流行病的趋势预警数据;还用于获取全部区域内全部流行病的趋势预警数据;所述趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
处理模块,用于对所述样本流行病的趋势预警数据进行处理得到样本数据;
模型训练模块,用于根据所述样本数据训练多个子网络模型;
模型融合模块,用于将多个所述子网络模型进行融合得到样本流行病趋势预测模型;
迁移学习训练模块,用于根据所述全部区域内全部流行病的趋势预警数据,对所述样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
预测模块,用于根据所述全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。
本申请提供的技术方案可以包括以下有益效果:本申请中的区域流行病趋势预测预警方法包括:获取样本流行病的趋势预警数据,对样本流行病的趋势预警数据进行处理得到样本数据,根据样本数据训练多个子网络模型,将多个子网络模型进行融合得到样本流行病趋势预测模型。本申请中采用了分布式深度学习框架,融合了多个子网络模型,各子网络模型用来学习不同变量与预测结果的关系,和所有变量之间的潜在联系,从而提升模型在预测步长较大时的预测精度。本申请中还获取全部区域内全部流行病的趋势预警数据,根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型,根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。本申请中能够对全部区域内全部流行病进行长期的流行病预警预测服务,还能在有新增流行病时通过模型迁移学习训练快速地为新增的流行病提供本地化长期的流行病预警预测服务。本申请中的趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据,以上数据均为原始数据,准确易获取,且不涉及用户隐私数据。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种区域流行病趋势预测预警方法的流程示意图;
图2是本申请另一个实施例提供的一种区域流行病趋势预测预警方法的流程示意图;
图3是本申请又一个实施例提供的一种区域流行病趋势预测预警方法的流程示意图;
图4是本申请又一个实施例提供的一种区域流行病趋势预测预警方法的流程示意图;
图5是本申请一个实施例提供的一种区域流行病趋势预测预警系统的结构示意图;
图6是本申请一个实施例提供的一种区域流行病趋势预测预警设备的结构示意图。
附图标记:获取模块-41;处理模块-42;模型训练模块-43;模型融合模块-44;迁移学习训练模块-45;预测模块-46;处理器-51;存储器-52。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
一种区域流行病趋势预测预警方法,参照图1,包括:
S11:获取样本流行病的趋势预警数据;趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
趋势预警数据主要包括:与流行病相关关键词的搜索趋势指数(谷歌搜索指数或百度搜索指数等)、区域历史气象数据(主要有气象数据包括温差、平均气温、最高露点与最低露点之差、平均露点、最高湿度与最低湿度之差、平均湿度、最高气压与最低气压之差、平均气压、最高能见度与最低能见度之差、平均能见度、最高风速、平均风速和降雨量等主要的气象数据)和定期公布的流行病公共监控数据(由全球各国及地方政府权威机构定期发布的重点传染病及健康相关的监测数据和防控建议,包括重点传染病周报、健康相关疾病监测数据、全球传染病暴发疫情信息等,主要选择重点地区特定流行病每日发病人数、患者年龄分布)。
趋势预警数据可以通过编写爬虫从门户网站上进行获取。趋势预警数据融合了季节与气象因素、流行病社会传播因素、以及官方报告数据等原始数据,准确且易获取,不涉及用户隐私数据。
S12:对样本流行病的趋势预警数据进行处理得到样本数据;
S13:根据样本数据训练多个子网络模型;
具体包括:
建立第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;
基于样本数据,使第一子网络模型学习与待预测流行病相关关键词的搜索趋势指数对未来疾病发病人数的影响;使第二子网络模型学习区域历史气象数据对未来疾病发病人数的影响;使第三子网络模型学习流行病公共监控数据对未来疾病发病人数的影响;使第四子网络模型学习训练数据之间的潜在联系。
当预测步长增加时,单独的预测模型没有能力捕捉到历史发病人数、气象因素、搜索引擎指数与未来发病人数之间更复杂的联系,为了解决这一问题,本实施例采用融合多个子网络模型搭建时序模型。各种主要的流行病可通过直接接触或间接接触传染其他人,气象因素则是能够影响病毒的繁殖与活动能力,影响人群的活动与交流方式,从而间接影响流行病的传播,而与流行病名称及症状相关的关键字的搜索热度指数在一定程度上反应了流行病传播的严重程度,因此流行病趋势预测模型设置了四个子网络模型,这四个子网络模型被用来并行地学习与待预测流行病相关关键词的搜索趋势指数对未来疾病发病人数的影响,区域历史气象数据对未来疾病发病人数的影响,流行病公共监控数据对未来疾病发病人数的影响,训练数据之间的潜在联系。
优选的,子网络模型选用基于深度学习的长短期忆模型(long short-termmemory,LSTM)。
优选的,使第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型进行并行学习,可以减少第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型的训练所需时间。
S14:将多个子网络模型进行融合得到初代流行病趋势预测模型;
将多个子网络模型进行融合得到初代流行病趋势预测模型,包括:
将第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型学习得到的信息向量进行拼接得到总信息向量;
训练初代流行病趋势预测模型,使初代流行病趋势预测模型通过残差网络和全连接网络对总信息向量进行融合,得到样本数据对应的流行趋势预测结果。
本实施例中,将第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型学习得到的信息向量进行拼接得到总信息向量,通过残差网络和全连接网络对总信息向量进行融合,得到最终预测值,即样本数据据对应的流行趋势预测结果。
进一步的,训练初代流行病趋势预测模型,包括:基于Early Stopping和Dropput方法,训练流行病趋势预测模型。
现有技术中对于流行病的预测模型未考虑深层神经网络中由于参数多和模型复杂而带来的过拟合问题。本实施例中,为了防止模型训练中出现过拟合现象,在训练过程中使用Early Stopping和Dropput方法。
模型训练过程的参数设置如下:
参数 | 设置 |
batch | 256 |
dropout1 | 0.5 |
dropout2 | 0.2 |
optimizer | Adam |
loss | RMSE |
learningrate | 0.02 |
dropout1表示模型训练过程中针对LSTM循环神经网络选择的dropout值,dropout2表示融合网络中的全连接层选择的dropout值,LSTM网络隐藏状态的维度l和用于预测的历史数据的天数k的选择使用网格搜索的方法进行确定,l的搜索范围是[1,11]的整数,k的搜索范围是[4,14]的整数。模型在训练集上使用了所有的样本训练的次数epoch取5;最终模型在预测步长为1天、2天、4天、6天、8天时的RMSE值均低于0.1。
S15:获取全部区域内全部流行病的趋势预警数据;
本实施例的最终目的是对全部区域内全部流行病进行流行趋势预测,所以需要获取全部区域内全部流行病的趋势预警数据来进行下一步的模型迁移学习训练。
S16:根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
训练好一个流行病趋势预测模型后,使用少量的本区域其他主要流行病的趋势预警数据,即可进行迁移学习的训练,进而构建各个重点项目点区域的全部流行病预测模型。
S17:根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。
本实施例中,可以通过任务调度和监控子系统,整合数据采集、模型训练、模型发布、报告生成的工作流,每天定时为每个热点区域进行区域内全部流行病的流行趋势预测,并生成可视化的预测结果。
本实施例中的区域流行病趋势预测预警方法,包括:获获取样本流行病的趋势预警数据,对样本流行病的趋势预警数据进行处理得到样本数据,根据样本数据训练多个子网络模型,将多个子网络模型进行融合得到样本流行病趋势预测模型。本申请中采用了分布式深度学习框架,融合了多个子网络模型,各子网络模型用来学习不同变量与预测结果的关系,和所有变量之间的潜在联系,从而提升模型在预测步长较大时的预测精度。本申请中还获取全部区域内全部流行病的趋势预警数据,根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型,根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。本申请中能够对全部区域内全部流行病进行长期的流行病预警预测服务,还能在有新增流行病时通过模型迁移学习训练快速地为新增的流行病提供本地化长期的流行病预警预测服务。本申请中的趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据,以上数据均为原始数据,准确易获取,且不涉及用户隐私数据。
一些实施例中的区域流行病趋势预测预警方法,参照图2,还包括:
S21:将各区域内全部流行病各自对应的流行病趋势预测模型分别部署到远程医疗平台各区域项目点的应用空间中;
S22:定期更新各区域内全部流行病各自对应的流行病趋势预测模型。
本实施例中,还将各区域内全部流行病各自对应的流行病趋势预测模型分别部署到远程医疗平台各区域项目点的应用空间中,并定期更新各区域内全部流行病各自对应的流行病趋势预测模型,从而提升原有流行病趋势预测模型的预测精度,还能在出现新增流行病时,及时根据新增流行病的趋势预警数据为其训练对应的流行病趋势预测模型,并对其传播趋势进行预测。
一些实施例中的区域流行病趋势预测预警方法,参照图3-图4,还包括:
S31:在用户登录后获取用户登录区域及当前系统时间;
S32:根据用户登录区域内全部流行病各自对应的流行病趋势预测模型,以当前系统时间为基准,进行用户登录区域内全部流行病的流行趋势预测,并生成可视化的预测结果;
S33:根据预测结果生成对应的流行病传播趋势预警和防控建议,并展示给用户。
本实施例中,还提供用户登录途径,在用户登录后获取用户登录区域及当前系统时间,根据用户登录区域内全部流行病各自对应的流行病趋势预测模型,以当前系统时间为基准,进行区域内全部流行病的流行趋势预测,并生成可视化的预测结果。优选的,预测结果以图表的形式呈现给用户,使用户可以直观的了解自己所在地的全部流行病各自的流行病趋势预测结果。
优选的,用户登录途径可以为手机APP登录或者客户端网页登录。
本实施中,还根据预测结果生成对应的流行病传播趋势预警和防控建议,并展示给用户,不仅提升了用户的使用体验,还加强了流行病防控工作。
一些实施例中的区域流行病趋势预测预警方法,对样本流行病的趋势预警数据进行处理得到样本数据,包括:
对选取的趋势预警数据进行数据清洗、特征筛选、数据分析、缺失值处理、on-hot编码和归一化处理;
将处理后的趋势预警数据根据时间顺序划分数据集;数据集包括:训练集、验证集和测试集;
将训练集作为训练子网络模型的样本数据。
由于数据的数量级差距大会导致模型训练变慢,并且梯度下降路线容易成为“之”字形而导致增加迭代次数,优选的,本实施例中通过最大最小法对数据进行归一化处理,不仅可以改善这种情况,而且可以消除预测结果中由于数据间量纲不同而引起的误差。
本实施例中还将处理后的数据根据时间顺序划分数据集;数据集包括:训练集、验证集和测试集;
优选的,数据的60%作为训练集,20%作为验证集,20%作为测试集。
将训练集作为训练子网络模型的样本数据。在训练完成后通过验证集对子网络模型进行验证,通过测试集对子网络模型进行测试。
一些实施例中的区域流行病趋势预测预警方法,还包括:基于均方根误差、决定系数和平均绝对误差指标对初代流行病趋势预测模型的预测能力进行评价。
本实施例中,基于均方根误差(RMSE)、决定系数(R2)和平均绝对误差(MAE)三个指标对初代流行病趋势预测模型的预测能力进行评价,这三个指标的计算公式分别如下:
其中“x”表示的是预测目标的真实值,“x′”表示预测目标的预测值,“x”表示预测目标真实值的平均值。模型评价指标RMSE衡量的是预测值和真实值之间的偏差,取值范围是[0,∞),RMSE的值越小,表示模型预测结果越接近真实值。模型评价指标R2衡量的是模型拟合效果,取值范围是[0,1],R2值越接近1,表明模型拟合效果越好。MAE衡量的是预测值与真实值之间的平均距离,取值范围是[0,∞),MAE的值越小,表示模型预测效果越好。
一种区域流行病趋势预测预警系统,参照图5,包括:
获取模块41,用于获取样本流行病的趋势预警数据;还用于获取全部区域内全部流行病的趋势预警数据;趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
处理模块42,用于对样本流行病的趋势预警数据进行处理得到样本数据;
模型训练模块43,用于根据样本数据训练多个子网络模型;
模型融合模块44,用于将多个子网络模型进行融合得到样本流行病趋势预测模型;
迁移学习训练模块45,用于根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
预测模块46,用于根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。
本实施例中的区域流行病趋势预测预警系统,包括:获取模块41,处理模块42,模型训练模块43,模型融合模块44,迁移学习训练模块45和预测模块46。通过获取模块41获取样本流行病的趋势预警数据,通过处理模块42对样本流行病的趋势预警数据进行处理得到样本数据,通过模型训练模块43根据样本数据训练多个子网络模型,通过模型融合模块44将多个子网络模型进行融合得到样本流行病趋势预测模型。本申请中采用了分布式深度学习框架,融合了多个子网络模型,各子网络模型用来学习不同变量与预测结果的关系,和所有变量之间的潜在联系,从而提升模型在预测步长较大时的预测精度。本申请中还获取全部区域内全部流行病的趋势预警数据,通过迁移学习训练模块25根据全部区域内全部流行病的趋势预警数据,对样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型,最终通过预测模块46根据全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果。本申请中能够对全部区域内全部流行病进行长期的流行病预警预测服务,还能在有新增流行病时通过模型迁移学习训练快速地为新增的流行病提供本地化长期的流行病预警预测服务。本申请中的趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据,以上数据均为原始数据,准确易获取,且不涉及用户隐私数据。
一些实施例中的区域流行病趋势预测预警系统,还包括:
部署模块,用于将各区域内全部流行病各自对应的流行病趋势预测模型分别部署到远程医疗平台各区域项目点的应用空间中;
更新模块,用于定期更新各区域内全部流行病各自对应的流行病趋势预测模型。
一些实施例中的区域流行病趋势预测预警系统,还包括:评价模块,用于基于均方根误差、决定系数和平均绝对误差指标对初代流行病趋势预测模型的预测能力进行评价。
一种区域流行病趋势预测预警设备,参照图6,包括:
处理器51和存储器52;
处理器51与存储器52通过通信总线相连接:
其中,处理器51,用于调用并执行存储器52中存储的程序;
存储器52,用于存储程序,程序至少用于以上任一实施例中的一种区域流行病趋势预测预警方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种区域流行病趋势预测预警方法,其特征在于,包括:
获取样本流行病的趋势预警数据;所述趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
对所述样本流行病的趋势预警数据进行处理得到样本数据;
根据所述样本数据训练多个子网络模型;
将多个所述子网络模型进行融合得到样本流行病趋势预测模型;
获取全部区域内全部流行病的趋势预警数据;
根据所述全部区域内全部流行病的趋势预警数据,对所述样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
根据所述全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果;
所述对所述样本流行病的趋势预警数据进行处理得到样本数据,包括:
对选取的趋势预警数据进行数据清洗、特征筛选、数据分析、缺失值处理、on-hot编码和归一化处理;
将处理后的趋势预警数据根据时间顺序划分数据集;所述数据集包括:训练集、验证集和测试集;
将所述训练集作为训练所述子网络模型的样本数;
所述根据所述样本数据训练多个子网络模型,包括:
建立第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;
基于所述样本数据,使所述第一子网络模型学习与待预测流行病相关关键词的搜索趋势指数对未来疾病发病人数的影响;使所述第二子网络模型学习区域历史气象数据对未来疾病发病人数的影响;使所述第三子网络模型学习流行病公共监控数据对未来疾病发病人数的影响;使所述第四子网络模型学习训练数据之间的潜在联系。
2.根据权利要求1所述的方法,其特征在于,还包括:
将各区域内全部流行病各自对应的流行病趋势预测模型分别部署到远程医疗平台各区域项目点的应用空间中;
定期更新各区域内全部流行病各自对应的流行病趋势预测模型。
3.根据权利要求1所述的方法,其特征在于,还包括:
在用户登录后获取用户登录区域及当前系统时间;
根据用户登录区域内全部流行病各自对应的流行病趋势预测模型,以所述当前系统时间为基准,进行用户登录区域内全部流行病的流行趋势预测,并生成可视化的预测结果;
根据所述预测结果生成对应的流行病传播趋势预警和防控建议,并展示给用户。
4.根据权利要求1所述的方法,其特征在于,还包括:
使所述第一子网络模型、所述第二子网络模型、所述第三子网络模型和所述第四子网络模型进行并行学习。
5.根据权利要求1所述的方法,其特征在于,所述将多个所述子网络模型进行融合得到样本流行病趋势预测模型,包括:
将所述第一子网络模型、所述第二子网络模型、所述第三子网络模型和所述第四子网络模型学习得到的信息向量进行拼接得到总信息向量;
训练所述样本流行病趋势预测模型,使所述样本流行病趋势预测模型通过残差网络和全连接网络对所述总信息向量进行融合,得到所述样本数据对应的流行趋势预测结果。
6.根据权利要求5所述的方法,其特征在于,所述训练所述样本流行病趋势预测模型,包括:
基于Early Stopping和Dropput方法,训练所述流行病趋势预测模型。
7.根据权利要求1所述的方法,其特征在于,还包括:基于均方根误差、决定系数和平均绝对误差指标对所述样本流行病趋势预测模型的预测能力进行评价。
8.一种区域流行病趋势预测预警系统,其特征在于,包括:
获取模块,用于获取样本流行病的趋势预警数据;还用于获取全部区域内全部流行病的趋势预警数据;所述趋势预警数据至少包括:流行病相关关键词的搜索趋势指数、区域历史气象数据和定期公布的流行病公共监控数据;
处理模块,用于对所述样本流行病的趋势预警数据进行处理得到样本数据;
模型训练模块,用于根据所述样本数据训练多个子网络模型;
模型融合模块,用于将多个所述子网络模型进行融合得到样本流行病趋势预测模型;
迁移学习训练模块,用于根据所述全部区域内全部流行病的趋势预警数据,对所述样本流行病趋势预测模型进行迁移学习训练,得到全部区域内全部流行病各自对应的流行病趋势预测模型;
预测模块,用于根据所述全部区域内全部流行病各自对应的流行病趋势预测模型,进行全部区域内全部流行病的流行趋势预测,并生成可视化的预测结果;
所述对所述样本流行病的趋势预警数据进行处理得到样本数据,包括:
对选取的趋势预警数据进行数据清洗、特征筛选、数据分析、缺失值处理、on-hot编码和归一化处理;
将处理后的趋势预警数据根据时间顺序划分数据集;所述数据集包括:训练集、验证集和测试集;
将所述训练集作为训练所述子网络模型的样本数;
所述根据所述样本数据训练多个子网络模型,包括:
建立第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;
基于所述样本数据,使所述第一子网络模型学习与待预测流行病相关关键词的搜索趋势指数对未来疾病发病人数的影响;使所述第二子网络模型学习区域历史气象数据对未来疾病发病人数的影响;使所述第三子网络模型学习流行病公共监控数据对未来疾病发病人数的影响;使所述第四子网络模型学习训练数据之间的潜在联系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024174.8A CN113744888B (zh) | 2021-09-02 | 2021-09-02 | 区域流行病趋势预测预警方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024174.8A CN113744888B (zh) | 2021-09-02 | 2021-09-02 | 区域流行病趋势预测预警方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113744888A CN113744888A (zh) | 2021-12-03 |
CN113744888B true CN113744888B (zh) | 2023-09-22 |
Family
ID=78734778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111024174.8A Active CN113744888B (zh) | 2021-09-02 | 2021-09-02 | 区域流行病趋势预测预警方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113744888B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421596A (zh) * | 2023-10-27 | 2024-01-19 | 上海采日能源科技有限公司 | 储能集装箱故障预警系统及储能系统 |
CN117690601B (zh) * | 2024-02-02 | 2024-05-24 | 江西省胸科医院(江西省第三人民医院) | 基于大数据分析的结核病流行趋势预测系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777092A (zh) * | 2009-12-18 | 2010-07-14 | 中国人民解放军防化指挥工程学院 | 基于考虑空间非均匀性的传染病传播模型疫情预测方法 |
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、系统及设备 |
CN109656918A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 流行病发病指数的预测方法、装置、设备及可读存储介质 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110379522A (zh) * | 2019-07-23 | 2019-10-25 | 四川骏逸富顿科技有限公司 | 一种疾病流行趋势预测系统及方法 |
KR102088296B1 (ko) * | 2019-07-25 | 2020-05-29 | 백정현 | 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치 |
KR102140096B1 (ko) * | 2019-09-20 | 2020-07-31 | 한국과학기술정보연구원 | 전염병확산예측장치 및 그 동작 방법 |
KR102144720B1 (ko) * | 2020-03-31 | 2020-08-14 | 주식회사 휴런 | 기계 학습을 통해 분류된 나이그로좀 1 영역과 복수의 학습 모델에 의한 다중 예측 결과를 이용하는 인공지능 기반 파킨슨 병 진단을 위한 정보제공 방법 |
CN111639787A (zh) * | 2020-04-28 | 2020-09-08 | 北京工商大学 | 一种基于图卷积网络的时空数据预测方法 |
CN112508300A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 建立风险预测模型的方法、区域风险预测方法及对应装置 |
CN112562863A (zh) * | 2020-12-17 | 2021-03-26 | 北京三快在线科技有限公司 | 流行病监测预警方法、装置、电子设备 |
CN112992375A (zh) * | 2021-04-25 | 2021-06-18 | 南京汉卫公共卫生研究院有限公司 | 一种疾病的预警方法、预警装置、设备及介质 |
CN112992373A (zh) * | 2021-03-10 | 2021-06-18 | 山东大学 | 一种传染病的流行趋势预判方法及系统 |
CN113113155A (zh) * | 2021-06-15 | 2021-07-13 | 四川大学 | 一种基于神经网络与seir模型的传染病趋势预测方法 |
-
2021
- 2021-09-02 CN CN202111024174.8A patent/CN113744888B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777092A (zh) * | 2009-12-18 | 2010-07-14 | 中国人民解放军防化指挥工程学院 | 基于考虑空间非均匀性的传染病传播模型疫情预测方法 |
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、系统及设备 |
CN109656918A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 流行病发病指数的预测方法、装置、设备及可读存储介质 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110379522A (zh) * | 2019-07-23 | 2019-10-25 | 四川骏逸富顿科技有限公司 | 一种疾病流行趋势预测系统及方法 |
KR102088296B1 (ko) * | 2019-07-25 | 2020-05-29 | 백정현 | 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치 |
KR102140096B1 (ko) * | 2019-09-20 | 2020-07-31 | 한국과학기술정보연구원 | 전염병확산예측장치 및 그 동작 방법 |
KR102144720B1 (ko) * | 2020-03-31 | 2020-08-14 | 주식회사 휴런 | 기계 학습을 통해 분류된 나이그로좀 1 영역과 복수의 학습 모델에 의한 다중 예측 결과를 이용하는 인공지능 기반 파킨슨 병 진단을 위한 정보제공 방법 |
CN111639787A (zh) * | 2020-04-28 | 2020-09-08 | 北京工商大学 | 一种基于图卷积网络的时空数据预测方法 |
CN112562863A (zh) * | 2020-12-17 | 2021-03-26 | 北京三快在线科技有限公司 | 流行病监测预警方法、装置、电子设备 |
CN112508300A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 建立风险预测模型的方法、区域风险预测方法及对应装置 |
CN112992373A (zh) * | 2021-03-10 | 2021-06-18 | 山东大学 | 一种传染病的流行趋势预判方法及系统 |
CN112992375A (zh) * | 2021-04-25 | 2021-06-18 | 南京汉卫公共卫生研究院有限公司 | 一种疾病的预警方法、预警装置、设备及介质 |
CN113113155A (zh) * | 2021-06-15 | 2021-07-13 | 四川大学 | 一种基于神经网络与seir模型的传染病趋势预测方法 |
Non-Patent Citations (2)
Title |
---|
应用SARIMA模型分析湖北省肺结核时间分布特征及发病趋势;黄淑琼;蔡晶;杨雯雯;;现代预防医学(第03期);全文 * |
重庆市法定报告传染病预测与监测的ARIMA模型;叶孟良;张多西;王润华;;重庆医科大学学报(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113744888A (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Probabilistic framework with bayesian optimization for predicting typhoon-induced dynamic responses of a long-span bridge | |
Alamdari et al. | A spectral-based clustering for structural health monitoring of the Sydney Harbour Bridge | |
CN113744888B (zh) | 区域流行病趋势预测预警方法及系统 | |
Ermagun et al. | Using temporal detrending to observe the spatial correlation of traffic | |
KR102009574B1 (ko) | 하천에서의 홍수범람 대응 관리 방법 및 하천에서의 홍수범람 대응 관리 시스템 | |
CN104077445B (zh) | 基于模糊理论的加速寿命试验统计分析方法 | |
Li et al. | Structural damage identification based on integration of information fusion and shannon entropy | |
CN111967712B (zh) | 一种基于复杂网络理论的交通风险预测方法 | |
CN113011455B (zh) | 一种空气质量预测svm模型构建方法 | |
Ni et al. | Systematic approach for validating traffic simulation models | |
CN115278741A (zh) | 一种基于多模态数据依赖关系的故障诊断方法和装置 | |
Ye et al. | A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring | |
CN117994728B (zh) | 基于数字孪生的高铁动车智能运维管理系统 | |
CN116415481A (zh) | 区域滑坡灾害风险预测方法、装置、计算机设备及存储介质 | |
Kajbaf et al. | Temporal downscaling of precipitation from climate model projections using machine learning | |
CN116720098A (zh) | 一种异常行为敏感的学生行为时序建模及学业预警方法 | |
CN117572534A (zh) | 一种基于多源数据和人工智能的能见度短临预报方法 | |
CN117540329A (zh) | 基于机器学习的排水管网缺陷在线预警方法及系统 | |
CN116913098B (zh) | 一种融合空气质量与车流量数据的短时交通流预测方法 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
Noor et al. | Prediction map of rainfall classification using random forest and inverse distance weighted (IDW) | |
CN113496305A (zh) | 数据处理方法及装置 | |
Zhang et al. | Structural Vibration Data Anomaly Detection Based on Multiple Feature Information Using CNN‐LSTM Model | |
CN112650949B (zh) | 基于多源特征融合协同过滤的区域poi需求识别方法 | |
Růžička et al. | Smart application for traffic excess prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |