基于人口迁徙大数据的流行病疫区返程人群规模预测方法
技术领域
本发明涉及数据分析领域,特别是涉及一种基于人口迁徙大数据的流行病疫区返程人群规模预测方法。
背景技术
目前,新型冠状病毒感染肺炎(Corona Virus Disease 2019,COVID-19)具有潜伏期不固定,潜伏期内亦具有传染性的特点,部分人群在潜伏期内并没有明显的临床症状,因此,并不能准确地进行自我隔离,对社会公共卫生安全造成严重的影响。并且,由于流行病疫区的人群迁出规模相对较大,会对输入地区造成较大的传播风险。若各地区能对春节后流行病疫区的返程人群规模进行预测,则能制定详细的防控方案,减低疫情的扩散,同时减少经济损失。
现有的方法中,需要大量的人力物力进行上门逐户排查,该方法效率低下,而且经常会遇到例如住户不合作或不在的情况,并且,也没有相应的模型能够准确预测出各地区的返程人群规模。
发明内容
为克服相关技术中存在的问题,本发明实施例提供了一种基于人口迁徙大数据的流行病疫区返程人群规模预测方法、装置及设备。
根据本发明实施例的第一方面,提供了一种基于人口迁徙大数据的流行病疫区返程人群规模预测方法,包括如下步骤:
从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j 的常住人口
;
根据所述迁入规模指数
、所述来源地占比
以及所述疫区j 的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
;
获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
可选的,获取所述百度地图迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
可选的,从所述百度地图迁徙大数据中获取非春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
;
根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取非春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
;
根据所述非返乡人群规模
和非春运期间的天数
,获取非春运期间的日平均人群规模
,并根据所述日平均人群规模
以及春运期间的天数
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,从中国旅游与经济社会发展统计数据库中获取所述疫区j的旅游统计数据;
遍历所述旅游统计数据的来源地信息,得到春运期间来源地信息为目标地区i的旅游人群规模;
根据所述旅游人群规模,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,从各地统计年鉴中获取所述疫区j每年的常住人口
;
将每年的常住人口
输入拟合工具中进行曲线拟合,得到常住人口拟合函数P;
通过所述常住人口拟合函数P,得到2019年的所述疫区的常住人口
。
可选的,获取所述目标地区i的常住人口
和所述目标地区i的行政区域面积;
根据所述目标地区i的常住人口
和所述目标地区i的行政区域面积,得到所述目标地区i的人口密集度;
根据所述目标地区i的人口密集度和所述春节后的返程人群规模,得到所述春节后的目标地区i的疫情风险等级。
可选的,根据所述目标地区i疫情风险和所述春节后的返程人群规模,生成柱状图,通过所述目标地区i疫情风险等级指示所述柱状图的色彩属性,通过所述春节后的返程人群规模指示所述柱状图的高度属性。
根据本发明实施例的第二方面,提供一种基于人口迁徙大数据的流行病疫区返程人群规模预测装置,包括:
数据获取单元,用于从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j的常住人口
;
第一处理单元,用于根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
;
第二处理单元,用于获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
根据本发明实施例的第三方面,提供一种基于人口迁徙大数据的流行病疫区返程人群规模预测设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的步骤。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的步骤。
相对于现有技术,本发明实施例通过百度地区迁徙大数据获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j的常住人口
,从而根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
;之后,通过春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,通过非返乡人群规模
预估春节前的返程人群规模;从而根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模,进而准确地掌握各地区的返程情况,提高获取春节后返程人群的效率,确保各地区可通过自身情况开展复工。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的流程示意图;
图2为本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法步骤S103的流程示意图;
图3为本发明另一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法步骤S103的流程示意图;
图4为本发明另一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的流程示意图;
图5为本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测装置的结构示意图;
图6为本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的流程示意图,所述方法由基于人口迁徙大数据的流行病疫区返程人群规模预测设备执行(以下简称预测设备),包括如下步骤:
S101:从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j的常住人口
。
在本申请实施例中,结合COVID-19的疫情特点,预测设备从从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
。
其中,所述春运期间指春节运输期间,其中春运特指中国在农历春节前后发生的一种大规模的高交通运输压力的现象,在一个可选的实施例中,将所述春运期间选定为2020年1月10日至2020年1月27日。在其他可选的实施例中,可以将该期间进行合理化调整,在此不做限制。
所述疫区为疫情发病率较高的地区,在一个可选的实施例中,所述疫区指湖北地区,具体包括武汉市、孝感市和黄冈市等,在另一个可选实施例中,所述疫区也可以为发病率大于预设阈值的地区,所述发病率指确诊人数与该地区常住人口的比值,预设阈值可以根据疫情状况进行设置。
所述百度迁徙大数据为百度地图提供的定位大数据可视化软件,百度迁徙大数据的网址为:http://qianxi.baidu.com,其通过界面向用户展示迁徙规模指数、迁入来源地占比以及迁出目的地占比。该迁徙规模指数分为迁入规模指数和迁出规模指数,迁入规模指数为迁入人口数量与该地区常住人口数量的比值,迁出规模指数为迁出人口数量与该地区常住人口数量的比值。
所述春运期间疫区j的迁入规模指数
指在春运期间从全国各地迁入至疫区j的迁入规模指数,即春运期间从全国各地迁入至疫区j的人口数量与疫区常住人口数量的比值。
所述迁入所述疫区j的来源地占比
指在春运期间每个地区迁入至疫区j的人口数量与全国各地区迁入至疫区j的总人口数量的比值。
具体地,预测设备可以通过如下方式获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
:
预测设备获取所述百度地图迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
其中,统一资源定位符(Uniform Resourse Locator,URL)为信息资源在万维网服务程序上指定的唯一地址,预测设备通过URL链接百度迁徙大数据的数据资源,爬取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
除此之外,预测设备也可以对网络上发布的百度迁徙大数据整理文档进行文档分析,获取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
在一个可选的实施例中,预测设备首先从各地统计年鉴中获取所述疫区j每年的常住人口
。
其中,所述统计年鉴为国家统计局在门户网站上公布的各地统计数据,包括各地区的常住人口数量,但是由于统计年鉴具有一定的时差性,因而疫情发生时无法获取2019年的统计年鉴,确定本次疫情发生时的疫区的常住人口。具体地,所述疫区j每年的常住人口
可以为从1999年至2018年疫区j的常住人口。
之后,预测设备将每年的常住人口
输入拟合工具中进行曲线拟合得到常住人口拟合函数P,通过所述常住人口拟合函数P,得到2019年的所述疫区的常住人口
。
其中,该拟合工具可以为任意能够进行线性拟合的工具,在本申请实施例中,选用MATLAB拟合工具进行常住人口拟合,得到常住人口拟合函数P,从而预估出2019年的所述疫区的常住人口
。
在另一个可选的实施例中,预测设备可直接从各地统计年鉴中获取所述疫区j
的2018年的常住人口作为疫区j的常住人口
。
S102:根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
。
在本申请实施例中,预测设备可将春运期间每天获得的所述迁入规模指数
与所述疫区j的常住人口
相乘,得到所述疫区j每天的迁入人群规模,再将每天的迁入人群规模与该天的来源地占比
相乘累加,进而得到春运期间由所述目标地区i迁入所述疫区j的人群规模
。
S103:获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
预测设备获取春运期间所述目标地区i迁入所述疫区j的非返乡人群规模
。其中,所述非返乡人群为在春运期间从目标地区i迁入疫区j且在春运期间已回到目标地区i的人群。在获取非返乡人群规模
后,预测设备根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
下面针对预测设备获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
的方式进行阐述:
在一个可选的实施例中,请参阅图2,为准确获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,步骤S103包括步骤S1031~S1032,具体如下:
S1031:从所述百度地图迁徙大数据中获取非春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
。
所述非春运期间为春运期间以外的时间段,为准确得到非返乡人群规模
,本申请实施例将非春运期间设置为与2020年春运期间相隔较近的时间段,具体为2019年12月2日至2019年12月8日。在其他可选的实施例中,所述非春运期间可以为任意春运期间以外的时间段,该时间段的长度可以进行任意设定,在此不做限制。
所述非春运期间疫区j的迁入规模指数
指在非春运期间从全国各地迁入至疫区j的迁入规模指数,即非春运期间从全国各地迁入至疫区j的人口数量与疫区常住人口数量的比值。
所述迁入所述疫区j的来源地占比
指在非春运期间每个地区迁入至疫区j的人口数量与全国各地区迁入至疫区j的总人口数量的比值。
具体地,关于预测设备从所述百度地图迁徙大数据中获取非春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
的方式与步骤S101中预测设备从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
的方式相同,在此不再赘述。
S1032:根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
预测设备可将非春运期间每天获得的所述迁入规模指数
与所述疫区j的常住人口
相乘,得到所述疫区j每天的迁入人群规模,再将每天的迁入人群规模与该天的来源地占比
相乘累加,进而得到非春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
S1033:根据所述非返乡人群规模
和非春运期间的天数
,获取非春运期间的日平均人群规模
,并根据所述日平均人群规模
以及春运期间的天数
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
所述非返乡人群规模
为非春运期间由所述目标地区i迁入所述疫区j的总人群规模,该非返乡人群规模表示在非春运期间由所述目标地区i迁入所述疫区j进行旅游或出差的人群规模。
首先,预测设备根据所述非返乡人群规模
和非春运期间的天数
,获取非春运期间的日平均人群规模
。
其中,所述非春运期间的天数
为本实施例中非春运期间的间隔天数,当所述非春运期间指2019年12月2日至2019年12月8日时,非春运期间的天数
为7天;所述日平均人群规模
表示非春运期间由所述目标地区i迁入所述疫区j进行旅游或出差的日平均人群规模。
之后,预测设备根据所述日平均人群规模
以及春运期间的天数
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
其中,所述春运期间的天数
为本实施例中运期间的间隔天数,当所述春运期间指2020年1月10号至2020年1月27时,春运期间的天数
为18天。
预测设备利用非春运期间的日平均人群规模
和春运期间的天数
,预估在春运期间可能会至疫区j进行旅游或出差的人群规模,该部分人群规模即为目标地区i迁入所述疫区j的非返乡人群规模
。
在另一个可选的实施例中,请参阅图3,为准确获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,步骤S103包括步骤S1034~S1036,具体如下:
S1034:从中国旅游与经济社会发展统计数据库中获取所述疫区j的旅游统计数据。
其中,所述中国旅游与经济社会发展统计数据库提供各地区的旅游统计数据。所述旅游统计数据包括各地区的旅游人数、旅游者的来源地以及热门风景区等数据。
预测设备可以通过获取中国旅游与经济社会发展统计数据库的访问权限,从所述中国旅游与经济社会发展统计数据库获取所述疫区j的旅游统计数据。
此外,预测设备还可以利用python或其他语言撰写的爬虫程序,获取中国旅游与经济社会发展统计网站上的所述疫区j的旅游统计数据。
S1035:遍历所述旅游统计数据的来源地信息,得到春运期间来源地信息为目标地区i的旅游人群规模。
预测设备遍历所述旅游统计数据的来源地信息,直接得到春运期间来源地信息为目标地区i的旅游人群规模,即预测设备从旅游统计数据中获取从目标地区i迁入疫区j进行旅游的人群规模。
S1036:根据所述旅游人群规模,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
预测设备根据所述旅游人群规模,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
步骤S1034~S1036中所公开的获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
的方式,相较于步骤S1031~S1033所公开的方式存在一定的劣势,其无法统计进行出差的非返乡人群,使最后获取到的结果存在一定误差。
在其他实施例中,预测设备也可以通过获取春运期间疫区j所在辖区内的酒店入住人数和酒店入住人员的来源地占比,预估春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
请参阅图4,图4为本发明另一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测方法的流程示意图,所述方法由预测设备执行,包括步骤S201~S207,步骤S201~S203与步骤S101~S103相同,步骤S204~S207如下所示:
S204:获取所述目标地区i的常住人口
和所述目标地区i的行政区域面积;
预测设备从各地区统计年鉴中获取所述目标地区i的常住人口
,从所述地理国情监测云平台中获取所述目标地区i的行政区域面积。其中,所述行政区域面积至按照全国行政区域划分标准,所述目标地区i的占地面积。
S205:根据所述目标地区i的常住人口
和所述目标地区i的行政区域面积,得到所述目标地区i的人口密集度;
预测设备根据所述目标地区i的常住人口
和所述目标地区i的行政区域面积,得到所述目标地区i的人口密集度。所述人口密集度反应人口密集的程度。
具体地,预测设备可以将所述目标地区i的常住人口
与所述目标地区i的行政区域面积进行相除,得到所述目标地区i的人口密集度。
S206:根据所述目标地区i的人口密集度和所述春节后的返程人群规模,得到所述春节后的目标地区i的疫情风险等级。
在一个可选的实施例中,预测设备根据所述目标地区i的人口密集度得到目标地区i在人口密集度上的第一疫情风险等级,具体地,可以在预测设备中预先设置不同等级的划分标准,例如人口密度大于A的第一疫情风险等级为1级,人口密度在【A,B】区间的第一疫情风险等级为2级,并以此类推,具体关于划分标准的细致程度在此不做限制。
预测设备根据春节后的返程人群规模得到目标地区i在返程人群规模上的第二疫情风险等级,具体地,可以在预测设备中预先设置不同等级的划分标准,例如返程人群规模大于M的第二疫情风险等级为1级,人口密度在【M,N】区间的第二疫情风险等级为2级,并以此类推,具体关于划分标准的细致程度在此不做限制。
在获得第一疫情风险等级和第二疫情风险等级之后,预测设备可以对第一疫情风险等级和第二疫情风险等级进行加权运算,得到所述春节后的目标地区i的疫情风险等级。在某些情况下,加权值可以设置为1。
此外,还可以在其他设备中预先建立疫情风险等级模型,预测设备将述目标地区i的人口密集度和所述春节后的返程人群规模输入所述其他设备中,再从该设备中获得疫情风险等级结果。
S207:根据所述目标地区i疫情风险和所述春节后的返程人群规模,生成柱状图,通过所述目标地区i疫情风险等级指示所述柱状图的色彩属性,通过所述春节后的返程人群规模指示所述柱状图的高度属性。
预测设备根据所述目标地区i疫情风险和所述春节后的返程人群规模,生成柱状图。通过柱状图的色彩表示疫情风险等级,通过柱状图的高度表示春节后的返程人群规模。预测设备在生成柱状图后,将柱状图在用户交互界面进行展示,使用户能够直观获取到目标地区
的疫情风险和返程人群规模。
请参见图5,图5为本发明一个示例性实施例示出的基于人口迁徙大数据的流行病疫区返程人群规模预测装置的结构示意图。包括的各单元用于执行图1和图4对应的实施例中的各步骤,具体请参阅图1和图4各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,基于人口迁徙大数据的流行病疫区返程人群规模预测装置3包括:
数据获取单元31,用于从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j的常住人口
;
第一处理单元32,用于根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
;
第二处理单元33,用于获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
可选的,所述数据获取单元31包括:
爬取单元311,用于获取所述百度地图迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
可选的,所述第二处理单元33包括:
迁徙数据获取单元331,用于从所述百度地图迁徙大数据中获取非春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
;
第一运算单元332,用于根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取非春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
;
第二运算单元333,用于根据所述非返乡人群规模
和非春运期间的天数
,获取非春运期间的日平均人群规模
,并根据所述日平均人群规模
以及春运期间的天数
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,所述第二处理单元33还包括:
旅游数据获取单元334,用于从中国旅游与经济社会发展统计数据库中获取所述疫区j的旅游统计数据;
遍历单元335,用于遍历所述旅游统计数据的来源地信息,得到春运期间来源地信息为目标地区i的旅游人群规模;
第三运算单元336,用于根据所述旅游人群规模,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,所述数据获取单元31还包括:
常住人口获取单元312,用于从各地统计年鉴中获取所述疫区j每年的常住人口
;
拟合单元313,用于将每年的常住人口
输入拟合工具中进行曲线拟合,得到常住人口拟合函数P;
第四运算单元314,用于通过所述常住人口拟合函数P,得到2019年的所述疫区的常住人口
。
可选的,所述染病疫区返程人群规模预测装置3还包括:
面积获取单元34,用于获取所述目标地区i的常住人口
和所述目标地区i的行政区域面积;
密度运算单元35,用于根据所述目标地区i的常住人口
和所述目标地区i的行政区域面积,得到所述目标地区i的人口密集度;
等级评估单元36,用于根据所述目标地区i的人口密集度和所述春节后的返程人群规模,得到所述春节后的目标地区i的疫情风险等级。
可选的,所述染病疫区返程人群规模预测装置3还包括:
显示单元37,用于根据所述目标地区i疫情风险和所述春节后的返程人群规模,生成柱状图,通过所述目标地区i疫情风险等级指示所述柱状图的色彩属性,通过所述春节后的返程人群规模指示所述柱状图的高度属性。
请参见图6,图6是本发明一个示例性实施例提供的基于人口迁徙大数据的流行病疫区返程人群规模预测设备的示意图。如图6所示,该实施例的基于人口迁徙大数据的流行病疫区返程人群规模预测设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42,例如基于人口迁徙大数据的流行病疫区返程人群规模预测程序。所述处理器40执行所述计算机程序42时实现上述各个基于人口迁徙大数据的流行病疫区返程人群规模预测方法实施例中的步骤,例如图1所示的步骤S101至S103。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图5所示单元31至33的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4中的执行过程。例如,所述计算机程序42可以被分割成数据获取单元、第一处理单元和第二处理单元,各单元功能如下:
数据获取单元,用于从百度地图迁徙大数据中获取春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
,以及获取所述疫区j的常住人口
;
第一处理单元,用于根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取春运期间由目标地区i迁入所述疫区j的人群规模
;
第二处理单元,用于获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
,根据所述人群规模
和所述非返乡人群规模
,得到春节后的返程人群规模。
可选的,所述数据获取单元包括:
爬取单元,用于获取所述百度地图迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述春运期间疫区的迁入规模指数
和迁入所述疫区的来源地占比
。
可选的,所述第二处理单元包括:
迁徙数据获取单元,用于从所述百度地图迁徙大数据中获取非春运期间疫区j的迁入规模指数
和迁入所述疫区j的来源地占比
;
第一运算单元,用于根据所述迁入规模指数
、所述来源地占比
以及所述疫区j的常住人口
,获取非春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
;
第二运算单元,用于根据所述非返乡人群规模
和非春运期间的天数
,获取非春运期间的日平均人群规模
,并根据所述日平均人群规模
以及春运期间的天数
,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,所述第二处理单元还包括:
旅游数据获取单元,用于从中国旅游与经济社会发展统计数据库中获取所述疫区j的旅游统计数据;
遍历单元,用于遍历所述旅游统计数据的来源地信息,得到春运期间来源地信息为目标地区i的旅游人群规模;
第三运算单元,用于根据所述旅游人群规模,获取春运期间由所述目标地区i迁入所述疫区j的非返乡人群规模
。
可选的,所述数据获取单元还包括:
常住人口获取单元,用于从各地统计年鉴中获取所述疫区j每年的常住人口
;
拟合单元,用于将每年的常住人口
输入拟合工具中进行曲线拟合,得到常住人口拟合函数P;
第四运算单元,用于通过所述常住人口拟合函数P,得到2019年的所述疫区的常住人口
。
可选的,所述染病疫区返程人群规模预测装置还包括:
面积获取单元,用于获取所述目标地区i的常住人口
和所述目标地区i的行政区域面积;
密度运算单元,用于根据所述目标地区i的常住人口
和所述目标地区i的行政区域面积,得到所述目标地区i的人口密集度;
等级评估单元,用于根据所述目标地区i的人口密集度和所述春节后的返程人群规模,得到所述春节后的目标地区i的疫情风险等级。
可选的,所述染病疫区返程人群规模预测装置还包括:
显示单元,用于根据所述目标地区i疫情风险和所述春节后的返程人群规模,生成柱状图,通过所述目标地区i疫情风险等级指示所述柱状图的色彩属性,通过所述春节后的返程人群规模指示所述柱状图的高度属性。
所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图6仅仅是基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的示例,并不构成对基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的内部存储单元,例如基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的硬盘或内存。所述存储器41也可以是所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的外部存储设备,例如所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备4上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所基于人口迁徙大数据的流行病疫区返程人群规模预测设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述基于人口迁徙大数据的流行病疫区返程人群规模预测设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。