CN111462917A - 基于空间地理分析和机器学习的疫情预警方法及系统 - Google Patents

基于空间地理分析和机器学习的疫情预警方法及系统 Download PDF

Info

Publication number
CN111462917A
CN111462917A CN202010135150.9A CN202010135150A CN111462917A CN 111462917 A CN111462917 A CN 111462917A CN 202010135150 A CN202010135150 A CN 202010135150A CN 111462917 A CN111462917 A CN 111462917A
Authority
CN
China
Prior art keywords
data
geographic
analysis
epidemic situation
epidemic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010135150.9A
Other languages
English (en)
Other versions
CN111462917B (zh
Inventor
王涵
吴锋
柯俊龙
周肖树
黄业坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Institute Of Advanced Technology Chinese Academy Of Sciences Co ltd
Original Assignee
Zhuhai Institute Of Advanced Technology Chinese Academy Of Sciences Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Institute Of Advanced Technology Chinese Academy Of Sciences Co ltd filed Critical Zhuhai Institute Of Advanced Technology Chinese Academy Of Sciences Co ltd
Priority to CN202010135150.9A priority Critical patent/CN111462917B/zh
Publication of CN111462917A publication Critical patent/CN111462917A/zh
Application granted granted Critical
Publication of CN111462917B publication Critical patent/CN111462917B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于空间地理分析和机器学习的疫情预警方法及系统,涉及大数据及机器学习领域,用于实现:通过疫区进行数据采集,快速预测未来时间段内疫情发展走向和疫情发展程度,结合所述数据便于制定更加合理有效的进行防疫控制措施。本发明的有益效果为:快速预测未来时间段内疫情发展走向和疫情发展程度,当控制政策、药物出台后,可以根据不同地区普及的情况,预测地区疫情控制请情况,衡量不同政策实施的效果,以重点实时防控措施,同时将分析结果与社交媒体结合,使得居民在家就能得知疫情控制和发展情况,约束出行行为。

Description

基于空间地理分析和机器学习的疫情预警方法及系统
技术领域
本发明涉及大数据及机器学习领域,特别涉及一种基于空间地理分析和机器学习的疫情预警方法及系统。
背景技术
2019年12月起在湖北省武汉市出现的病毒性肺炎病例群组个案,根据卫生部门的调查,病原体为一种新型冠状病毒,该病毒的传染性极强,经呼吸道飞沫传播是主要的传播途径,亦可通过接触传播,其潜伏期的估计大多是1到14天,最常见的是五天左右,由于其在潜伏期不发病且仍具有传染性的特点,根据现有技术的导致疫情防控难度较大。
就迅速发展蔓延的传染性疾病,疫情往往在短时间实现大面积的传播,对传播情况的无法了解、无法监测、无法预测更使得疫情传染控制难度更大,因此如何实现疫情在地理空间上的传播速度、方向及感染程度的检测与预测,是解决此类问题的重点。
发明内容
为至少解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于空间地理分析和机器学习的疫情预警方法及系统,通过疫区进行数据采集,快速预测未来时间段内疫情发展走向和疫情发展程度,结合所述数据便于制定更加合理有效的进行防疫控制措施。
本发明解决其问题所采用的技术方案第一方面是:一种基于空间地理分析和机器学习的疫情预警方法,其特征在于,包括以下步骤:数据采集步骤,基于预设的检测时间段对疫情数据进行周期性采集,其中所述疫情数据包括但不限于疫情感染情况数据、疫情防护情况数据、环境安全数据以及社会人文数据;空间分析步骤,基于地理空间分析程序在所述检测时间段内对指定地理单位进行全局自相关及局部自相关检测分析,得到全局自相关系数及检验结果;数据处理步骤,根据所述疫情数据、所述全局自相关系数以及检验结果进行归一化处理,得到标准数据;模型建立步骤,基于指定算法构建机器学习模型,并基于所述标准数据对所述机器学习模型进行训练、验证以及预测数据,得到预测模型;预测数据步骤,基于所述数据采集的步骤获取的数据作为所述预测模型的输入数据,所述预测模型根据空间分析步骤及数据处理步骤的输出数据进行参数修正后输出预测数据,其中所述预测数据包括所述指定地理单位在所述检测时间段内的感染人数以及各地理单位之间的疫情蔓延走向趋势。
有益效果:基于别的人工智能和大数据平台,快速预测未来时间段内疫情发展走向和疫情发展程度,当控制政策、药物出台后,可以根据不同地区普及的情况,预测地区疫情控制请情况,衡量不同政策实施的效果,以重点实时防控措施,同时将分析结果与社交媒体结合,使得居民在家就能得知疫情控制和发展情况,约束出行行为。
根据本发明第一方面所述的,采集步骤具体包括:疫情感染情况数据采集,在所述检测时间段内检测所述地理单位的感染人数、感染程度以及在指定时间内到访的所述地理单位和接触人员信息;疫情防护情况数据采集,在所述检测时间段内检测所述地理单位的疫情防护医疗器械用品采购数量、疫情监测道路通行人数、疫情监测道路劝返人数、疫情宣传页分发张数以及道路消毒次数;环境安全数据采集,在所述检测时间段内检测所述地理单位的温度、湿度、酸碱性PH值、空气污染程度以及雾霾程度;社会人文数据采集,在所述检测时间段内检测所述地理单位的节假日信息、犯罪违法案件起数、当地居民生活物资采购金额以及当地居民生活物资需求量。
根据本发明第一方面所述的,当地居民生活物资采购金额通过网络购物平台发往该地区的物品金额以及当地超市售卖生活物品金额进行计算;所述当地居民生活物资需求量通过在网络购物平台要求补货商品单价以及与补货次数进行计算。
根据本发明第一方面所述的,空间分析步骤具体包括:基于所述地理空间分析程序对所述指定地理单位与多个所述地理单位的全局自相关和局部自相关进行分析,其中所述地理空间分析程序包括但不限于Argis、Arcmap、Geoda以及Python地理空间分析程序。
根据本发明第一方面所述的,归一化处理包括但不限于min-max标准化、log函数转换、atan函数转换、z-score标准化、Decimal scaling小数定标标准化、Logistic/Softmax变换以及模糊量化模式。
根据本发明第一方面所述的,指定算法包括但不限于BP神经网络、卷积神经网络、决策树、朴素贝叶斯、最小二乘法、逻辑回归、支持向量机、集成方法、ARIMA及其衍生算法。
本发明解决其问题所采用的技术方案第二方面是:一种基于空间地理分析和机器学习的疫情预警系统,其特征在于,包括:数据采集模块,用于基于预设的检测时间段对疫情数据进行周期性采集,其中所述疫情数据包括但不限于疫情感染情况数据、疫情防护情况数据、环境安全数据以及社会人文数据;空间分析模块,用于基于地理空间分析程序在所述检测时间段内对指定地理单位进行全局自相关及局部自相关检测分析,得到全局自相关系数及检验结果;数据处理模块,用于根据所述疫情数据、所述全局自相关系数以及检验结果进行归一化处理,得到标准数据;模型建立模块,用于基于指定算法构建机器学习模型,并基于所述标准数据对所述机器学习模型进行训练、验证以及预测数据,得到预测模型;预测数据模块,用于基于所述数据采集的步骤获取的数据作为所述预测模型的输入数据,所述预测模型根据空间分析步骤及数据处理步骤的输出数据进行参数修正后输出预测数据,其中所述预测数据包括所述指定地理单位在所述检测时间段内的感染人数以及各地理单位之间的疫情蔓延走向趋势。
有益效果:基于别的人工智能和大数据平台,快速预测未来时间段内疫情发展走向和疫情发展程度,当控制政策、药物出台后,可以根据不同地区普及的情况,预测地区疫情控制请情况,衡量不同政策实施的效果,以重点实时防控措施,同时将分析结果与社交媒体结合,使得居民在家就能得知疫情控制和发展情况,约束出行行为。
根据本发明第二方面所述的,空间分析模块具体包括:全局自相关分析单元,用于对所述地理单位进行全局自相关分析,获取全局自相关系数及检验结果;局部自相关分析单元,用于对所述地理单位进行局部自相关分析,获取各个所述地理单位之间自相关属性;分析程序调用单元,用于调用包括但不限于Argis、Arcmap、Geoda以及Python地理空间分析程序对所述地理单位进行分析。
根据本发明第二方面所述的,数据处理模块还包括:归一化处理单元,用于使用包括但不限于min-max标准化、log函数转换、atan函数转换、z-score标准化、Decimalscaling小数定标标准化、Logistic/Softmax变换以及模糊量化模式对目标数据线进行处理,得到标准数据。
根据本发明第二方面所述的,模型建立模块还包括:算法调用模块,用于使用包括但不限于BP神经网络、卷积神经网络、决策树、朴素贝叶斯、最小二乘法、逻辑回归、支持向量机、集成方法、ARIMA及其衍生算法进行模型构建。
附图说明
图1是根据本发明实施例的方法流程图;
图2是根据本发明实施例的处理流程图;
图3是根据本发明实施例的基于神经网络构建的模型结构示意图;
图4是根据本发明实施例的预测模型结构示意图;
图5是根据本发明实施例的预测疫情传染方向示意图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本公开范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。本文所提供的任何以及所有实例或示例性语言(“例如”、“如”等)的使用仅意图更好地说明本发明的实施例,并且除非另外要求,否则不会对本发明的范围施加限制。
参照图1是根据本发明实施例的方法流程图;
本发明分为6个步骤,数据收集及预处理、地理空间分析、数据归一化、建立机器学习模型、训练及验证机器学习模型。
参照图2是根据本发明实施例的处理流程图;
1.1、收集数据主要有:四类数据,分别为:疫情感染情况数据、疫情防护情况数据、环境安全数据、社会人文数据,检测或研究地理单位可以为国家、省、市、区、镇、村甚至精化至街道等。
由于疫情的传染速度与传染程度不同,检测时间段可以为1周、1天、1小时、1分钟甚至是10秒、1秒内。
疫情感染情况数据主要包括:检测时间段内检测目标地点内检测疫情指标为阳性的感染者人数、检测时间段内检测疫情指标为阳性的病人感染程度(轻微感染(-1)、中度感染(0)、重度感染(1),该指标由不同疫情病种决定)、检测时间段内检测疫情指标为阳性的病人14天内所到访的地区(地区单位可以为国家、省、市、区、镇、村甚至精化至街道等)、检测时间段内检测疫情指标为阳性的病人14天内接触人员等其他与疫情感染情况相关数据。
疫情防护情况数据主要包括卫生局统计当地疫情防护医疗器械用品采购数量、疫情监测道路通行人数、疫情监测道路劝返人数、疫情宣传页分发张数、道路消毒次数等。
环境安全数据包括当地测量时间段温度、湿度、酸碱性PH值、空气污染程度、雾霾程度等。
社会人文数据包括是否为节假日或周末(是则标记为1,否则标记为0),人民群众是否发生暴乱骚动、犯罪违法案件起数、当地居民生活物资采购金额、当地居民生活物资需求量(转化为金额)等。
其中,检测时间段内检测疫情指标为阳性的病人14天内接触人员计算方式为:14天内同屋/同车亲友/同事等超过5分钟人数、14天内当次火车同车箱人数、14天内同班飞机旅客人数、14天内同班轮船旅客人数等其他情况下面对面接触人数之和。
其中当地居民生活物资采购金额计算方式为:京东、天猫、淘宝等大型网络购物平台发往该地区的物品金额、当地超市售卖生活物品金额等其他渠道购买生活物品总金额。
其中当地居民生活物资需求量计算方式为:该地区居民在京东、天猫、淘宝等大型网络购物平台要求补货商品单价*要求补货次数。
预处理主要包括,将上述收集数据转化为可衡量的数字,例如:病人感染程度中,轻微感染标记为-1,中度感染标记为0,重度感染标记为1。其中,检测时间段内检测疫情指标为阳性的病人14天内所到访的地区(地区单位可以为国家、省、市、区、镇、村甚至精化至街道等)转化为,已有数据库中,到目前为止,研究目的地被感染人员14天内到访的人数。
1.2、地理空间分析主要包括使用但不仅限于Argis、Arcmap、Geoda、Python地理空间分析程序包,实现对检测时间段内,检测地理单位高一级或多级地理单位(例如,统计疫情情况地理单位为武汉市,则此处为实现湖北省或者中国各市的地理空间分析)的全局自相关和局部自相关分析。
其中,全局自相关中计算时间对地的全局自相关系数计算公式()如下,并且随机验证999999次,得到T检验结果P-value值。
Figure BDA0002397018290000051
其中,局部自相关分析中计算时间t对i地的局部自相关系数计算公式(LMIti)如下,该方法主要包括,以目标地理区域高一级地理区域为研究对象(例如,研究对象为河南省,则以中国各省为研究对象),设置空间权重,“是否包含低阶的邻居”分别选择“是”和“否”,临界值(order)从[0,∞]逐一增加,直到得到检测地理单位的局部自相关属性,该属性可能为“高-高”、“高-低”、“低-高”、“低-低”,若临界值已曾到上线,仍未能得到其局部自相关属性,则放弃该检测地理单位的局部自相关属性,改为研究该地理单位的低一级相邻地理单位的局部自相关(例如,河南省的局部自相关属性无法显现,则研究河南省与其他省份相互接壤的市级地区局部自相关,即河南省和安徽省的交界处襄阳、随州、信阳、商丘、周口等市、河南与山东交界处两省市级地区、河南省与湖北省交界两省市级地区、河南省与陕西交界两省市级地区、河南省与山西交界两省市级地区),若低一级别地理单位中,与上一级别地理单位临界地域有多个局部自相关属性,则选取多位数,若仍无法体现,则选取再低一级别的临界地域,以此类推。并将局部相关分析的结果数字化。例如“高-高”标即为“4”、“高-低”标记为“3”、“低-高”标记为“2”、“低-低”标记为“1”。
Figure BDA0002397018290000052
1.3数据归一化(标准化)包括,将1.1收集数据,与1.2中全局自相关系数及T检验结果P-value值进行归一化处理,归一化的方法不仅限于:min-max标准化、log函数转换、atan函数转换、z-score标准化、Decimal scaling小数定标标准化、Logistic/Softmax变换、模糊量化模式。
1.4建立机器学习模型包括,采用但不仅限于BP神经网络、卷积神经网络、决策树、朴素贝叶斯、最小二乘法、逻辑回归、支持向量机、集成方法、ARIMA及其衍生算法。
该模型基于大数据多线程多进程开发基础上进行。
1.5训练、验证模型、预测数据
以神经网络及其类似模型为例,参照图3是根据本发明实施例的基于神经网络构建的模型结构示意图;
输入层节点为(1.1收集数据)+(1.2收集数据)-(检测时间段内检测目标地点内检测疫情指标为阳性的感染者人数),输入层节点个数=(1.1收集数据种类数)+(1.2收集数据种类数)-1,此处1.2收集数据种类数为3,分别为全局自相关系数、T检验结果P-value值、局部自相关结果。最后减1代表着检测时间段内检测目标地点内检测疫情指标为阳性的感染者人数;输出层节点为检测时间段后[n,1]个时间段内检测目标地点内检测疫情指标为阳性的感染者人数。隐藏层节点选择[0,∞],选择误差值最小的值作为隐藏层节点数。训练数据及验证数据不仅限于下列分法:将上述数据集随机选取2/3和1/3作为训练数据和验证数据集。
其中,预测过程如图4所示,参照图4是根据本发明实施例的预测模型结构示意图;
若有一条数据:关于预测地点A,时间段P的数据,时间段间隔为m,另有一条数据为最近统计的一条数据:关于预测地点A,时间段Q的数据,时间间隔为m。则,线程1到n即为预测[P+1,P+m]的过程,线程中,输入层节点数据均相同,均为预测地点A,时间段P的输入节点数据;输出层节点分别为预测地点A,时间段[P+m,P+n*m]输出节点数据,预测结果分别为预测地点A,时间段[Q+m,Q+n*m]的输出节点数据。例如,若检测地点为武汉,目标为预测2020.2.10,00:00-24:00每个小时的感染人数,此处n=24,m=1小时,Q=2020.2.9
23:00-24:00(为数据库中最后一条数据记录时间段),数据库有一条数据为:武汉2020.2.823:00-24:00的收集数据,应用该条数据进行训练或验证数据:线程中输入层节点均为武汉2020.2.8 23:00-24:00的收集数据输入层节点部分,线程一中输出层该节点数据为武汉2020.2.9 00:00-01:00时间段检测疫情指标为阳性的感染者人数,线程二中输出层该节点数据为武汉2020.2.9 02:00-03:00时间段检测疫情指标为阳性的感染者人数,以此类推,线程24中输出层该节点数据为武汉2020.2.10 23:00-24:00时间段检测疫情指标为阳性的感染者人数,然后和真实值进行比较计算误差,模型自行调整权重等参数,不断迭代计算直到得到误差低于误差阈值的参数。最后预测过程则为输入武汉2020.2.9 23:00-24:00的收集数据输入层节点部分,24各线程的输出节点即为预测结果,即预测武汉2020.2.10,00:00-24:00每个小时的感染人数。
1.6输出预测结果
输出预测结果分为两部分,非别为输出目标地点预测时间段检测疫情指标为阳性的感染者人数、预测区域高一级区域的疫情发展蔓延走向。
其中,输出目标地点预测时间段检测疫情指标为阳性的感染者人数即为1.5输出的预测结果。并以柱状图、折线图等形式进行展示。
其中,预测区域高一级区域的疫情发展蔓延走向分为两条线:分别为疫情发展走向线和疫情控制走向线。如图4所示,疫情蔓延发展走向线和疫情控制走向线均是基于1.2中局部自相关结果进行分析得出的结果。疫情蔓延发展走向线向高-高,或者低-高方向发展,疫情控制走向线向高-低,低-低方向发展。参照图5是根据本发明实施例的预测疫情传染方向示意图,为中国云南省的疫情情况图,以普洱市为研究对象,临沧、普尔、玉溪、红河均为低-高,即疫情传染方向为普尔-临沧,普尔-玉溪-红河,普尔-红河-玉溪;昆明和景洪为高-低,则疫情控制方向为普尔-景洪。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。
计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

Claims (10)

1.一种基于空间地理分析和机器学习的疫情预警方法,其特征在于,包括以下步骤:
数据采集步骤,基于预设的检测时间段对疫情数据进行周期性采集,其中所述疫情数据包括但不限于疫情感染情况数据、疫情防护情况数据、环境安全数据以及社会人文数据;
空间分析步骤,基于地理空间分析程序在所述检测时间段内对指定地理单位进行全局自相关及局部自相关检测分析,得到全局自相关系数及检验结果;
数据处理步骤,根据所述疫情数据、所述全局自相关系数以及检验结果进行归一化处理,得到标准数据;
模型建立步骤,基于指定算法构建机器学习模型,并基于所述标准数据对所述机器学习模型进行训练、验证以及预测数据,得到预测模型;
预测数据步骤,基于所述数据采集的步骤获取的数据作为所述预测模型的输入数据,所述预测模型根据空间分析步骤及数据处理步骤的输出数据进行参数修正后输出预测数据,其中所述预测数据包括所述指定地理单位在所述检测时间段内的感染人数以及各地理单位之间的疫情蔓延走向趋势。
2.根据权利要求1所述的基于空间地理分析和机器学习的疫情预警方法,其特征在于,所述数据采集步骤具体包括:
疫情感染情况数据采集,在所述检测时间段内检测所述地理单位的感染人数、感染程度以及在指定时间内到访的所述地理单位和接触人员信息;
疫情防护情况数据采集,在所述检测时间段内检测所述地理单位的疫情防护医疗器械用品采购数量、疫情监测道路通行人数、疫情监测道路劝返人数、疫情宣传页分发张数以及道路消毒次数;
环境安全数据采集,在所述检测时间段内检测所述地理单位的温度、湿度、酸碱性PH值、空气污染程度以及雾霾程度;
社会人文数据采集,在所述检测时间段内检测所述地理单位的节假日信息、犯罪违法案件起数、当地居民生活物资采购金额以及当地居民生活物资需求量。
3.根据权利要求2所述的基于空间地理分析和机器学习的疫情预警方法,其特征在于:
所述当地居民生活物资采购金额通过网络购物平台发往该地区的物品金额以及当地超市售卖生活物品金额进行计算;
所述当地居民生活物资需求量通过在网络购物平台要求补货商品单价以及与补货次数进行计算。
4.根据权利要求1所述的基于空间地理分析和机器学习的疫情预警方法,其特征在于,所述空间分析步骤具体包括:
基于所述地理空间分析程序对所述指定地理单位与多个所述地理单位的全局自相关和局部自相关进行分析,其中所述地理空间分析程序包括但不限于Argis、Arcmap、Geoda以及Python地理空间分析程序。
5.根据权利要求1所述的基于空间地理分析和机器学习的疫情预警方法,其特征在于,所述归一化处理包括但不限于min-max标准化、log函数转换、atan函数转换、z-score标准化、Decimal scaling小数定标标准化、Logistic/Softmax变换以及模糊量化模式。
6.根据权利要求1所述的基于空间地理分析和机器学习的疫情预警方法,其特征在于,所述指定算法包括但不限于BP神经网络、卷积神经网络、决策树、朴素贝叶斯、最小二乘法、逻辑回归、支持向量机、集成方法、ARIMA及其衍生算法。
7.一种基于空间地理分析和机器学习的疫情预警系统,其特征在于,包括:
数据采集模块,用于基于预设的检测时间段对疫情数据进行周期性采集,其中所述疫情数据包括但不限于疫情感染情况数据、疫情防护情况数据、环境安全数据以及社会人文数据;
空间分析模块,用于基于地理空间分析程序在所述检测时间段内对指定地理单位进行全局自相关及局部自相关检测分析,得到全局自相关系数及检验结果;
数据处理模块,用于根据所述疫情数据、所述全局自相关系数以及检验结果进行归一化处理,得到标准数据;
模型建立模块,用于基于指定算法构建机器学习模型,并基于所述标准数据对所述机器学习模型进行训练、验证以及预测数据,得到预测模型;
预测数据模块,用于基于所述数据采集的步骤获取的数据作为所述预测模型的输入数据,所述预测模型根据空间分析步骤及数据处理步骤的输出数据进行参数修正后输出预测数据,其中所述预测数据包括所述指定地理单位在所述检测时间段内的感染人数以及各地理单位之间的疫情蔓延走向趋势。
8.根据权利要求7所述的基于空间地理分析和机器学习的疫情预警系统,所述空间分析模块具体包括:
全局自相关分析单元,用于对所述地理单位进行全局自相关分析,获取全局自相关系数及检验结果;
局部自相关分析单元,用于对所述地理单位进行局部自相关分析,获取各个所述地理单位之间自相关属性;
分析程序调用单元,用于调用包括但不限于Argis、Arcmap、Geoda以及Python地理空间分析程序对所述地理单位进行分析。
9.根据权利要求7所述的基于空间地理分析和机器学习的疫情预警系统,所述数据处理模块还包括:
归一化处理单元,用于使用包括但不限于min-max标准化、log函数转换、atan函数转换、z-score标准化、Decimal scaling小数定标标准化、Logistic/Softmax变换以及模糊量化模式对目标数据线进行处理,得到标准数据。
10.根据权利要求7所述的基于空间地理分析和机器学习的疫情预警系统,所述模型建立模块还包括:
算法调用模块,用于使用包括但不限于BP神经网络、卷积神经网络、决策树、朴素贝叶斯、最小二乘法、逻辑回归、支持向量机、集成方法、ARIMA及其衍生算法进行模型构建。
CN202010135150.9A 2020-03-02 2020-03-02 基于空间地理分析和机器学习的疫情预警方法及系统 Active CN111462917B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010135150.9A CN111462917B (zh) 2020-03-02 2020-03-02 基于空间地理分析和机器学习的疫情预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010135150.9A CN111462917B (zh) 2020-03-02 2020-03-02 基于空间地理分析和机器学习的疫情预警方法及系统

Publications (2)

Publication Number Publication Date
CN111462917A true CN111462917A (zh) 2020-07-28
CN111462917B CN111462917B (zh) 2023-05-30

Family

ID=71682460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010135150.9A Active CN111462917B (zh) 2020-03-02 2020-03-02 基于空间地理分析和机器学习的疫情预警方法及系统

Country Status (1)

Country Link
CN (1) CN111462917B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916218A (zh) * 2020-08-10 2020-11-10 重庆邮电大学 一种新型冠状病毒肺炎疫情多级预警方法及系统
CN111933300A (zh) * 2020-09-28 2020-11-13 平安科技(深圳)有限公司 疫情防控效果预测方法、装置、服务器及存储介质
CN112185566A (zh) * 2020-10-14 2021-01-05 上海玺翎智能科技有限公司 一种基于机器学习预测预警感染性疾病就医人数突增的方法
CN112185583A (zh) * 2020-10-14 2021-01-05 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
KR102232807B1 (ko) * 2020-09-28 2021-03-25 이다은 감염병 관리 어플리케이션 제공 시스템
CN112652403A (zh) * 2020-12-25 2021-04-13 中国科学技术大学 疫情预测方法及装置
CN113161005A (zh) * 2021-03-17 2021-07-23 第四范式(北京)技术有限公司 目标区域的疫情推演方法和目标区域疫情推演模拟器
CN113327684A (zh) * 2021-06-07 2021-08-31 航天科工智能运筹与信息安全研究院(武汉)有限公司 基于兵棋推演的疫情模拟方法、装置及计算机可读介质
CN113380420A (zh) * 2020-10-13 2021-09-10 深圳云天励飞技术股份有限公司 一种疫情预测方法、装置、电子设备及存储介质
WO2021180245A1 (zh) * 2020-11-02 2021-09-16 平安科技(深圳)有限公司 一种服务器、数据处理方法、装置及可读存储介质
CN113539514A (zh) * 2021-08-31 2021-10-22 重庆工商大学 一种多维度精细粒度疫情数据自动采集方法及系统
CN113611430A (zh) * 2021-07-28 2021-11-05 广东省科学院智能制造研究所 一种基于贝叶斯神经网络的疫情预测方法及装置
CN116522248A (zh) * 2023-03-22 2023-08-01 新疆维吾尔自治区疾病预防控制中心 基于机器学习的核酸异常数据智能研判系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020038307A1 (en) * 2000-01-03 2002-03-28 Zoran Obradovic Systems and methods for knowledge discovery in spatial data
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020038307A1 (en) * 2000-01-03 2002-03-28 Zoran Obradovic Systems and methods for knowledge discovery in spatial data
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FARZANEH S.TABATABA: "Epidemic Forecasting Framework Combining Agent-Based Models and Smart Beam Particle Filtering", 《2017 IEEE INTERNATIONL CONFERENCE ON DATA MINING》 *
任红艳等: "基于反向传播神经网络模型的广东省登革热疫情预测研究", 《中国媒介生物学及控制杂志》 *
成月佳等: "基于GIS技术的江苏省伤寒、副伤寒疫情空间分析", 《中国卫生统计》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916218A (zh) * 2020-08-10 2020-11-10 重庆邮电大学 一种新型冠状病毒肺炎疫情多级预警方法及系统
CN111916218B (zh) * 2020-08-10 2022-07-22 重庆邮电大学 一种新型冠状病毒肺炎疫情多级预警方法及系统
KR102232807B1 (ko) * 2020-09-28 2021-03-25 이다은 감염병 관리 어플리케이션 제공 시스템
CN111933300B (zh) * 2020-09-28 2021-02-12 平安科技(深圳)有限公司 疫情防控效果预测方法、装置、服务器及存储介质
CN111933300A (zh) * 2020-09-28 2020-11-13 平安科技(深圳)有限公司 疫情防控效果预测方法、装置、服务器及存储介质
CN113380420B (zh) * 2020-10-13 2023-10-17 深圳云天励飞技术股份有限公司 一种疫情预测方法、装置、电子设备及存储介质
CN113380420A (zh) * 2020-10-13 2021-09-10 深圳云天励飞技术股份有限公司 一种疫情预测方法、装置、电子设备及存储介质
CN112185583A (zh) * 2020-10-14 2021-01-05 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
CN112185566A (zh) * 2020-10-14 2021-01-05 上海玺翎智能科技有限公司 一种基于机器学习预测预警感染性疾病就医人数突增的方法
CN112185566B (zh) * 2020-10-14 2021-08-13 上海玺翎智能科技有限公司 一种基于机器学习预测预警感染性疾病就医人数突增的方法
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
WO2021180245A1 (zh) * 2020-11-02 2021-09-16 平安科技(深圳)有限公司 一种服务器、数据处理方法、装置及可读存储介质
CN112652403B (zh) * 2020-12-25 2023-07-14 中国科学技术大学 疫情预测方法及装置
CN112652403A (zh) * 2020-12-25 2021-04-13 中国科学技术大学 疫情预测方法及装置
CN113161005A (zh) * 2021-03-17 2021-07-23 第四范式(北京)技术有限公司 目标区域的疫情推演方法和目标区域疫情推演模拟器
CN113327684A (zh) * 2021-06-07 2021-08-31 航天科工智能运筹与信息安全研究院(武汉)有限公司 基于兵棋推演的疫情模拟方法、装置及计算机可读介质
CN113327684B (zh) * 2021-06-07 2023-10-20 航天科工智能运筹与信息安全研究院(武汉)有限公司 基于兵棋推演的疫情模拟方法、装置及计算机可读介质
CN113611430A (zh) * 2021-07-28 2021-11-05 广东省科学院智能制造研究所 一种基于贝叶斯神经网络的疫情预测方法及装置
CN113539514A (zh) * 2021-08-31 2021-10-22 重庆工商大学 一种多维度精细粒度疫情数据自动采集方法及系统
CN116522248A (zh) * 2023-03-22 2023-08-01 新疆维吾尔自治区疾病预防控制中心 基于机器学习的核酸异常数据智能研判系统
CN116522248B (zh) * 2023-03-22 2023-12-15 新疆维吾尔自治区疾病预防控制中心 基于机器学习的核酸异常数据智能研判系统

Also Published As

Publication number Publication date
CN111462917B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN111462917A (zh) 基于空间地理分析和机器学习的疫情预警方法及系统
Lee et al. Application of an artificial neural network (ANN) model for predicting mosquito abundances in urban areas
Anderson Real vs. artefactual absences in species distributions: tests for Oryzomys albigularis (Rodentia: Muridae) in Venezuela
Wang et al. Fine-scale estimation of carbon monoxide and fine particulate matter concentrations in proximity to a road intersection by using wavelet neural network with genetic algorithm
Xu et al. Probabilistic electrical load forecasting for buildings using Bayesian deep neural networks
Durao et al. Forecasting O3 levels in industrial area surroundings up to 24 h in advance, combining classification trees and MLP models
Yan et al. An improved method for the fitting and prediction of the number of covid-19 confirmed cases based on lstm
Tang et al. Integration of diverse data sources for spatial PM2. 5 data interpolation
Lee et al. Cultural heritage and the intelligent internet of things
CA2679716C (en) Simulation cache to expedite complex modeling and simulation processes
Feng et al. Improving neural network prediction accuracy for PM10 individual air quality index pollution levels
Grover et al. Twitter data based prediction model for influenza epidemic
Jamei et al. Air quality monitoring based on chemical and meteorological drivers: Application of a novel data filtering-based hybridized deep learning model
CN114141385A (zh) 一种用于传染病的预警方法、系统和可读存储介质
Hernandez et al. Analysis of the information obtained from PM 2.5 concentration measurements in an urban park
Domańska et al. Explorative forecasting of air pollution
Cui et al. Forecasting the transmission trends of respiratory infectious diseases with an exposure-risk-based model at the microscopic level
Kshirsagar et al. Anatomization of air quality prediction using neural networks, regression and hybrid models
KR101775237B1 (ko) 특정 공간영역 내에 위치하는 방문자들의 관계망을 분석하는 방법 및 시스템
Bebortta et al. Characterizing the epidemiological dynamics of COVID-19 using a non-parametric framework
Preis et al. Multi-objective optimization for conjunctive placement of hydraulic and water quality sensors in water distribution systems
Dao et al. The SpatialARMED framework: Handling complex spatial components in spatial association rule mining
Asadollahfardi et al. Predicting Particulate Matter (PM2. 5) Concentrations in the Air of Shahr‐e Ray City, Iran, by Using an Artificial Neural Network
KR102509851B1 (ko) 감염병 감시를 위한 하수측정망 최적화 및 하수역학 기반 감염규모 예측 방법 및 시스템
Li et al. Building occupancy estimation with people flow modeling in AnyLogic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant