CN111916218A

CN111916218A - 一种新型冠状病毒肺炎疫情多级预警方法及系统

Info

Publication number: CN111916218A
Application number: CN202010796553.8A
Authority: CN
Inventors: 张学旺; 冯家琦; 崔一辉; 李洋洋; 殷梓杰; 付康
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-08-10
Filing date: 2020-08-10
Publication date: 2020-11-10
Anticipated expiration: 2040-08-10
Also published as: CN111916218B

Abstract

本发明涉及一种新型冠状病毒肺炎疫情多级预警方法及系统，属于公共卫生信息化领域。本发明采用基于长短期记忆网络LSTM的新型冠状病毒肺炎疫情群体态势预测算法得出的新冠肺炎疫情群体态势每日新增确诊预测数据，结合百度地图迁徙大数据平台获取的全国城市之间的每天人口流动比例数据以及各城市的行政区划代码数据，经过编码、归一化和坐标映射等处理，通过扩展的K‑均值聚类算法得出全国、各城市之间的新冠肺炎疫情多级预警数据。利用多点数据串联，针对实时新冠肺炎疫情信息智能生成预警信息内容，通过网络发送至Web客户端和移动客户端并以可视化方式呈现，为全国各城市区域新冠肺炎疫情多级预警提供数据支持。

Description

一种新型冠状病毒肺炎疫情多级预警方法及系统

技术领域

本发明属于公共卫生信息化领域，涉及一种新型冠状病毒肺炎疫情多级预警方法及系统。

背景技术

现在市场上有大量的新型冠状病毒肺炎疫情(简称新冠肺炎疫情，以下同)数据实时数据展示平台，这些平台虽然可以很好的帮助我们获取新冠肺炎疫情的事实信息，但是这些产品并没有对新冠肺炎疫情未来发展的态势进行多级预警的功能。而新冠肺炎疫情预警分析可以帮助决策者更快更好地做出决策，提前做出合理的决策能够在很大程度上降低新冠肺炎疫情对经济发展、社会进步、民生等多方面的影响。截止2020年7月，尚未发现可以对新冠肺炎疫情进行(多级)预警的软件产品，因此，研发新冠肺炎疫情多级预警系统具有紧迫性和重要作用。

聚类算法一种经典的机器学习算法，主要是将一堆没有标签的数据自动分类的方法，属于无监督学习方法，该方法保证同一类的数据有相似的特征。K-Means Clustering算法是聚类算法的一种，对未标记的数据(即没有定义类别或组的数据)进行分类，算法的目标是在数据中找到由变量K标记的组。该算法迭代的工作基于所提供的特征，将每个数据点分配给K个组中的一个；基于特征相似性对数据点进行聚类。K-MeansClustering算法的结果是：

(1)K簇的质心，可用于标记新数据；

(2)训练数据的标签(每个数据点分配给一个集群)。

K均值聚类算法用于查找未在数据中明确标记的组。这可用于判别存在哪些类别特征或用于识别复杂数据集中的未知组。

K-MeansClustering算法思想：

(1)随机选取k个点，作为聚类中心；

(2)计算每个点分别到k个聚类中心的聚类，然后将该点分配到最近的聚类中心，这样就形成了k个簇；

(3)再重新计算每个簇的聚类中心(均值)；

(4)重复上述(1)～(3)步，直到聚类中心的位置不再发生变化或者达到设定的迭代次数。

发明内容

有鉴于此，本发明的目的在于提供一种新型冠状病毒肺炎疫情多级预警方法及系统。新冠肺炎疫情多级预警方法采用新冠肺炎疫情群体态势预测算法得出的新冠肺炎疫情群体态势每日新增确诊预测数据，结合百度地图迁徙大数据平台获取的全国、各省市和城市之间的每天人口流动比例数据以及各省市、城市的行政区划代码数据，经过编码、归一化和坐标映射等处理，通过扩展的K-均值聚类(K-Means Clustering)算法得出全国、各省市和城市之间的新冠肺炎疫情预警数据。

为达到上述目的，本发明提供如下技术方案：

一种新型冠状病毒肺炎疫情多级预警系统，该系统分为服务器端和客户端，两者之间以Http/Https协议通信；

服务器端采取分层结构，从上至下依次为接口层、业务层、数据层和算法层，而且接口层、业务层和数据层的技术架构采用的是SpringBoot+Mybatis框架；

客户端有两种，分别是Web客户端和移动端；

新冠肺炎疫情多级预警方法对应算法层，其生成的新冠肺炎疫情预警数据通过TCP通信协议上传至数据层的MySQL数据库；系统扩展Spring Security接口实现访问控制。

一种新型冠状病毒肺炎疫情多级预警方法，该方法包括以下步骤：

步骤一：获取全国、省市、自治区、直辖市以及城市每日人口流动比例数据；

步骤11：从百度地图迁徙大数据平台网址：http://qianxi.baidu.com/获取源代码；

步骤12：利用Python集成开发环境Pycharm，采用Python爬虫库Requests、Urllib库，分别获取百度地图迁徙大数据平台全国、省市以及城市之间每日人口流动数据，并生成csv格式的文件保存在本地主机；

步骤二：获取全国新冠肺炎疫情预警数据

获取全国每日人口流动比例数据后，结合新冠肺炎疫情群体态势预测算法获取的全国每日新增确诊数据以及各省市行政区划代码数据，通过扩展的K-Means Clustering算法得出全国新冠肺炎疫情预警数据：

步骤21：将生成的csv格式的百度地图迁徙大数据平台全国每日人口流动数据与全国新冠肺炎疫情群体态势确诊病例预测数据相乘，得到各省市受到新冠肺炎疫情影响的数据；

步骤22：将全国34个省市进行编码处理，每个处理成一个34维的向量，只包含0和1，并与步骤21得到的新冠肺炎影响数据构成一个坐标点，34个省市坐标点构成一个数据集；

步骤23：采用欧式距离计算任意两个省市之间的距离：

步骤24：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤25：对数据集中每一个坐标点，采用公式(1)计算其与每一个聚类中心的欧式距离，并将其划分到欧式距离近的聚类中心所属的集合；

步骤26：把所有数据归好集合后，共有k个集合；然后重新计算每个集合的聚类中心；如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-Means Clustering已经达到期望的结果，算法终止；如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤24～25，直到收敛；

步骤27：根据K-Means Clustering算法收敛后得到的结果，得出全国各省市新冠肺炎疫情等级，根据新冠肺炎疫情等级提前进行预警；

步骤三：获取省市新冠肺炎疫情预警数据

获取省市每日人口流动比例数据后，结合新冠肺炎疫情群体态势预测算法获取的省市每日新增确诊数据以及各省市行政区划代码数据，通过扩展的K-Means Clustering算法得出各省市新冠肺炎疫情预警数据：

步骤31：将生成的csv格式的百度地图迁徙大数据平台各省市每日人口流动比例数据与各省市新冠肺炎疫情群体态势确诊病例预测数据相乘，得到各省市受到其他省市新冠肺炎疫情影响的数据；

步骤32：将全国34个省市进行编码处理，每个省市处理成一个34维的向量，将目标省市编码向量与其影响的其他33个省市编码向量相加，标记具体是某个省市新冠肺炎疫情产生的影响数据，并与步骤41得到的新冠肺炎影响数据构成一个坐标点，这些坐标点构成一个数据集；

步骤33：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤34：对数据集中每一个坐标点，采用公式(1)计算其与每一个聚类中心的欧式距离，并将其划分到欧式距离近的聚类中心所属的集合；

步骤35：把所有数据归好集合后，共有k个集合；然后重新计算每个集合的聚类中心；如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，认为K-MeansClustering已经达到期望的结果，算法终止；如果新聚类中心和原聚类中心欧式距离变化很大，需要迭代步骤34～35，直到收敛；

步骤36：根据K-Means Clustering算法收敛后得到的结果，分别得出各省市受到其他省市新冠肺炎疫情影响等级，根据新冠肺炎疫情等级提前进行预警；

步骤四：城市新冠肺炎疫情预警数据

获取各城市每日人口流动比例数据后，结合新冠肺炎疫情群体态势预测算法获取的城市每日新增确诊数据以及城市行政区划代码数据，通过扩展的K-Means Clustering算法得出城市新冠肺炎疫情预警数据；

步骤41：将生成的csv格式的百度地图迁徙大数据平台城市之间每日人口流动比例数据与城市新冠肺炎疫情群体态势确诊病例预测数据相乘，得到各城市受到其他城市新冠肺炎疫情影响数据；

步骤42：将全国334个城市进行编码处理，每个城市处理成一个334维的向量，其次将目标城市编码向量与其影响的其他333个城市编码向量相加，标记具体是某个城市新冠肺炎疫情产生的影响数据，并与步骤41得到的新冠肺炎影响数据构成一个坐标点，这些坐标点构成一个数据集；

步骤43：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤44：对数据集中每一个坐标点，采用公式(1)计算其与每一个聚类中心的欧式距离，并将其划分到欧式距离近的聚类中心所属的集合；

步骤45：把所有数据归好集合后，共有k个集合；然后重新计算每个集合的聚类中心；如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-Means Clustering已经达到期望的结果，算法终止；如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤44～45，直到收敛；

步骤46：根据K-Means Clustering算法收敛后得到的结果，得出全国各城市受到其他城市新冠肺炎疫情影响等级，根据新冠肺炎疫情等级提前进行预警；

步骤五：建立新冠肺炎疫情多级预警系统

新冠肺炎疫情多级预警系统采用服务器端和客户端分离模式开发；服务器端和各种类型的客户端通过接口API的形式进行交互；Web客户端使用Vue.js框架、通过Axios获取服务器端的新冠肺炎疫情预警数据，通过Model-View-ViewModel，即MVVM的开发模式来实现业务逻辑；使用百度开源库Echarts对数据进行可视化展现；移动客户端与Web客户端采用Echarts对数据进行可视化展现；服务器端的接口层、业务层和数据层使用Java语言开发，技术框架采用SpringBoot+Mybatis框架；服务器端的算法层使用Python语言开发，数据存储和存取控制选择MySQL数据库；利用Spring Security技术实现系统的访问控制，只允许授权用户访问系统。

可选的，所述新冠肺炎疫情多级预警系统工作流程如下：

步骤1：新冠肺炎疫情多级预警算法按照设置的计划自动运行，生成新冠肺炎疫情多级预警数据并上传至数据层的MySQL数据库；

步骤2：客户端，包括Web客户端和移动客户端，通过API接口调用服务器端登录接口，发送身份认证信息，请求获取调用获取服务器端接口的调用权限；

步骤3：服务器端根据客户端发送的身份认证信息，判断其是否有权限调用服务器端接口，如果有权限返回给客户端Token，如果认证失败则拒绝使用系统；

步骤4：客户端在获取到服务器端接口的访问权限后，通过API接口发送获取新冠肺炎疫情的多级预警数据的请求，该请求携带客户端请求的参数，根据请求的URL发送到对应的服务器端API接口；

步骤5：服务器端获取到客户端请求后，根据请求的参数调用对应的服务器端业务流程，从数据库中获取到符合客户端要求的新冠疫情多级预警数据后，封装成JSON返回给客户端；

步骤6：客户端获取到需要的数据后，使用百度开源库Echarts对数据进行可视化展现；

上述步骤2至步骤6，允许多个客户端不限次数使用。

本发明的有益效果在于：

1、现有的百度新冠肺炎疫情平台等新冠肺炎疫情平台缺少对新冠肺炎疫情未来发展态势做出多级预警的功能。本发明综合考虑新冠肺炎疫情爆发城市对全国、各省市以及其他城市的影响，而准确的新冠肺炎疫情多级预警分析可以帮助决策者更快更好地做出决策，及时预警防范，从而减少疫情带来的各种损失。

2、本发明利用扩展的K-Means Clustering算法得出全国、各省市和城市之间的新冠肺炎疫情多级预警数据，扩展的K-Means Clustering具有易于实现、收敛速度快等特点，使得此方案容易实现，预警数据准确。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为本发明的系统框图；

图2为本发明使用的K-Means Clustering算法流程图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省市略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省市略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

一种新冠肺炎疫情多级预警方法，并基于该方法构建一个新冠肺炎疫情多级预警系统。利用扩展的K-Means Clustering算法得出全国、各省市和各城市的新冠肺炎疫情多级预警数据，构建由服务器端、Web客户端(即浏览器)和移动客户端(即微信小程序)等组成的新冠肺炎疫情多级预警系统，可以分别在Web客户端(即浏览器)和移动客户端(即微信小程序)上以可视化的方式呈现新冠肺炎疫情多级预警数据。以下结合附图和具体实例对本发明的具体实施说明如下。

一、新冠肺炎疫情多级预警方法

本发明采用Python爬虫技术，利用Python中的Requests库和Urllib库对百度地图迁徙大数据平台的全国、各省市和城市之间每天的人口流动比例数据进行爬取，并生成csv格式的文件保存在本地主机。

(一)全国、省市以及城市每日人口流动比例数据

步骤12：利用Python集成开发环境Pycharm，采用Python爬虫库Requests、Urllib库，分别获取百度地图迁徙大数据平台全国、省市以及城市每日人口流动数据，并生成csv格式的文件保存在本地主机。

(二)全国新冠肺炎疫情预警数据

获取全国每日人口流动比例数据后，结合新冠肺炎疫情群体态势预测算法获取的全国每日新增确诊数据以及各省市行政区划代码数据，通过扩展的K-Means Clustering算法得出全国新冠肺炎疫情预警数据。图2为本发明使用的K-Means Clustering算法流程图。

步骤22：将全国34个省市进行编码处理，每个(自治区、直辖市)处理成一个34维(只包含0和1)的向量，例北京市编码为[1,0,…,0]，并与步骤21得到的新冠肺炎影响数据构成一个坐标点，例([1,0,…,0]，10)，34个省市坐标点构成一个数据集；

步骤23：确定K＝3值，随机选取3个省市份的坐标作为聚类中心；

步骤24：对数据集中每一个坐标点，采用公式(1)计算其与每一个聚类中心的欧式距离，并将其划分到欧式距离近的聚类中心所属的集合；

步骤25：把所有数据归好集合后，共有3个集合。然后重新计算每个集合的聚类中心。如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-Means Clustering已经达到期望的结果，算法终止。如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤24～25，直到收敛；

步骤26：根据K-Means Clustering算法收敛后得到的结果，可以得出全国各省市新冠肺炎疫情等级(低风险，中度风险和高风险)，政府部门可以根据新冠肺炎疫情等级提前进行预警。

(三)省市新冠肺炎疫情预警数据

步骤32：将全国34个省市进行编码处理，每个省市处理成一个34维(只包含0和1)的向量，例北京市编码为[1,0,…,0]其次将目标省市编码向量与其影响的其他33个省市编码向量相加，例北京市对天津市新冠肺炎疫情影响编码为[1,1,…,0]，这样可以标记具体是某个省市新冠肺炎疫情产生的影响数据，并与步骤31得到的新冠肺炎影响数据构成一个坐标点([1,1,…,0]，5)，这些坐标点构成了一个数据集；

步骤33：确定K＝3值，随机选取3个省市的坐标作为聚类中心；

步骤35：把所有数据归好集合后，共有3个集合。然后重新计算每个集合的聚类中心。如果新的聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-Means Clustering已经达到期望的结果，算法终止。如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤34～35，直到收敛；

步骤36：根据K-Means Clustering算法收敛后得到的结果，可以分别得出各省市受到其他省市新冠肺炎疫情影响等级(低风险，中度风险和高风险)，政府部门可以根据新冠肺炎疫情等级提前进行预警。

(四)城市新冠肺炎疫情预警数据

获取城市(即地市级行政区域)每日人口流动比例数据后，结合新冠肺炎疫情群体态势预测算法获取的城市每日新增确诊数据以及城市行政区划代码数据，通过扩展的K-Means Clustering算法得出城市新冠肺炎疫情预警数据：

步骤42：将全国334个城市进行编码处理，每个城市处理成一个334维的向量，例南岸区编码为[0,1,…,0]，其次将目标城市编码向量与其影响的其他333个城市编码向量相加，这样可以标记具体是某个城市新冠肺炎疫情产生的影响数据，例南岸区对江北区新冠肺炎疫情的影响编码为[0,1,0，…,1]，并与步骤41得到的新冠肺炎影响数据构成一个坐标点([0,1,0，…,1]，10)，这些坐标点构成了一个数据集；

步骤43：确定K＝3值，随机选取3个城市的坐标作为聚类中心；

步骤45：把所有数据归好集合后，共有3个集合。然后重新计算每个集合的聚类中心。如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-Means Clustering已经达到期望的结果，算法终止。如果新聚类中心和原聚类中心距离变化很大，需要重复迭代步骤44～45，直到收敛；

步骤46：根据K-Means Clustering算法收敛后得到的结果，可以得出全国各城市受到其他城市新冠肺炎疫情影响等级(低风险，中度风险和高风险)，政府部门可以根据新冠肺炎疫情等级提前进行预警。

二、新冠肺炎疫情多级预警系统

新冠肺炎疫情多级预警系统结构如图1所示，分为服务器端(接口层、业务层、数据层和算法层)和客户端(Web客户端/浏览器、移动端/微信小程序)。

服务器端的部署可灵活多样，既可以部署在接入互联网的局域网中的一台高性能服务器上，或者是部署在接入互联网的局域网中的服务器集群上；又可以部署在云服务器。

服务器端和各种类型的客户端通过接口API的形式进行交互。Web客户端(即浏览器)使用Vue.js框架、通过Axios获取服务器端的新冠肺炎疫情预警数据，通过MVVM(Model-View-ViewModel)的开发模式来实现业务逻辑；使用百度开源库Echarts对数据进行可视化展现。移动客户端(即微信小程序)与Web客户端(即浏览器)类似，都是采用Echarts对数据进行可视化展现。

服务器端的接口层、业务层和数据层使用Java语言开发，技术框架采用SpringBoot+Mybatis框架；服务器端的算法层使用Python语言开发，数据存储和存取控制选择MySQL数据库；考虑到服务器端新冠肺炎疫情预警信息不适合面向公众开放，利用Spring Security等技术实现了系统的访问控制，只允许授权用户访问系统。

新冠肺炎疫情多级预警系统，使用的主要步骤如下：

步骤1：新冠肺炎疫情多级预警算法按照设置的计划(比如：每天一次)自动运行，采用新冠肺炎疫情群体态势预测算法得出的新冠肺炎疫情群体态势每日新增确诊预测数据，结合百度地图迁徙大数据平台获取的全国、各省市和城市之间的每天人口流动比例数据以及各省市、城市的行政区划代码数据，通过K-均值聚类(K-Means Clustering)算法得到全国、各省市和城市之间的新冠肺炎疫情多级预警数据，并通过网络通信(TCP通信协议)上传至数据层的MySQL数据库中。

步骤2：客户端，包括Web客户端(即浏览器)和移动客户端(即微信小程序)，通过API接口调用服务器端登录接口，发送身份认证信息，请求获取调用获取服务器端接口的调用权限；

步骤5：服务器端获取到客户端请求后，根据请求的参数调用对应的服务器端业务流程，从数据库中查询到符合客户端要求的新冠疫情多级预警数据后，封装成JSON返回给客户端；

步骤6：客户端获取到需要的数据后，使用百度开源库Echarts对数据进行可视化的展现。

上述步骤2至步骤6，允许多个客户端不限次数使用。

综上所述，本方案旨在利用扩展的K-Means Clustering算法易于实现、收敛速度快的特点，对全国、各省市和各城市(地市级行政区域)范围进行新冠肺炎疫情多级预警，分别提供Web客户端(即浏览器)、移动客户端(即微信小程序)等的可视化方式展现新冠肺炎疫情多级预警数据，为各级政府及时应对新冠肺炎疫情提供数据支持。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种新型冠状病毒肺炎疫情多级预警系统，其特征在于：该系统分为服务器端和客户端，两者之间以Http/Https协议通信；

客户端有两种，分别是Web客户端和移动端；

2.一种新型冠状病毒肺炎疫情多级预警方法，其特征在于：该方法包括以下步骤：

步骤二：获取全国新冠肺炎疫情预警数据

步骤23：采用欧式距离计算任意两个省市之间的距离：

步骤24：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤26：把所有数据归好集合后，共有k个集合；然后重新计算每个集合的聚类中心；如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-MeansClustering已经达到期望的结果，算法终止；如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤24～25，直到收敛；

步骤三：获取省市新冠肺炎疫情预警数据

步骤33：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤四：城市新冠肺炎疫情预警数据

步骤43：确定K值，随机选取K个省市份的坐标作为聚类中心；

步骤45：把所有数据归好集合后，共有k个集合；然后重新计算每个集合的聚类中心；如果新聚类中心和原聚类中心之间的欧式距离变化不大，并且趋于收敛，就认为K-MeansClustering已经达到期望的结果，算法终止；如果新聚类中心和原聚类中心欧式距离变化很大，需要重复迭代步骤44～45，直到收敛；

步骤五：建立新冠肺炎疫情多级预警系统

3.根据权利要求2所述的一种新型冠状病毒肺炎疫情多级预警方法，其特征在于：所述新冠肺炎疫情多级预警系统工作流程如下：

上述步骤2至步骤6，允许多个客户端不限次数使用。