CN115878964B - 常住人口确定方法、装置、设备和存储介质 - Google Patents
常住人口确定方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN115878964B CN115878964B CN202310182296.2A CN202310182296A CN115878964B CN 115878964 B CN115878964 B CN 115878964B CN 202310182296 A CN202310182296 A CN 202310182296A CN 115878964 B CN115878964 B CN 115878964B
- Authority
- CN
- China
- Prior art keywords
- population
- period
- data
- age group
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000004891 communication Methods 0.000 claims abstract description 138
- 230000008685 targeting Effects 0.000 claims abstract description 10
- 230000035558 fertility Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 238000011835 investigation Methods 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 9
- 238000012545 processing Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种常住人口确定方法、装置、设备和存储介质,涉及数据处理技术领域,该方法包括:根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。本发明实施例的方法达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种常住人口确定方法、装置、设备和存储介质。
背景技术
相关技术中,利用传统的统计调查方法获得人口数据,但人口统计的过程需要耗费大量的人工成本和时间成本,导致人口统计的效率较低,无法快速准确的获取人口信息。
发明内容
针对现有技术中的问题,本发明实施例提供一种常住人口确定方法、装置、设备和存储介质。
具体地,本发明实施例提供了以下技术方案:
第一方面,本发明实施例提供了一种常住人口确定方法,包括:
根据目标区域的通信大数据,获取在第一时段中所述目标区域的统计人口数据;
基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量;所述目标模型是基于第二时段中所述目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;所述人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;所述第二时段早于所述第一时段。
进一步地,所述目标模型包括以下至少一项:
第一目标子模型,所述第一目标子模型用于基于第二时段中所述目标区域的人口普查数据,确定在第一时段中所述目标区域中的第一年龄段的常住人口数量;所述人口普查数据包括以下至少一项:各个年龄的人口数量、各个年龄的女性数量和各个年龄女性的生育率;
第二目标子模型,所述第二目标子模型用于基于第一时段中所述目标区域的统计人口数据中各个居住区域的第二年龄段的人口数量、第一时段中所述目标区域的统计人口数据中各个居住区域的第二年龄段的人口性别比例和第二时段中所述目标区域的人口普查数据中各个居住区域的第二年龄段的人口性别比例,确定在第一时段中所述目标区域中第二年龄段的常住人口数量;
第三目标子模型,所述第三目标子模型用于基于第一时段中所述目标区域的统计人口数据中各个居住区域的第三年龄段的人口数量,确定在第一时段中所述目标区域中第三年龄段的常住人口数量。
进一步地,所述目标模型中的第二目标子模型是基于第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量拟合确定的;所述第三时段早于所述第二时段;
所述目标模型中的第三目标子模型是基于第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合确定的。
进一步地,所述基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量,包括:
根据第二时段中所述目标区域的人口普查数据和第一目标子模型,确定在第一时段中所述目标区域中第一年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中所述目标区域中第二年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中所述目标区域中第三年龄段的常住人口数量;
根据所述第一时段中所述目标区域中第一年龄段的常住人口数量、第一时段中所述目标区域中第二年龄段的常住人口数量和第一时段中所述目标区域中第三年龄段的常住人口数量,确定第一时段中所述目标区域的常住人口数量。
进一步地,所述根据第二时段中所述目标区域的人口普查数据和第一目标子模型,确定在第一时段中所述目标区域中第一年龄段的常住人口数量,包括:
利用如下第一目标子模型确定第一时段中所述目标区域中第一年龄段的常住人口数量:
A=(B+C)×D;
所述A表示在第一时段中所述目标区域中第一年龄段的常住人口数量;所述第一年龄段为0至14岁;所述B表示新生儿数量,所述新生儿数量是基于第二时段的人口普查数据中的各个年龄的女性数量和各个年龄女性的生育率确定的;所述C表示第二时段的人口普查数据中的目标年龄段的人口数量;所述目标年龄段为0至13岁;所述D表示第一权值。
进一步地,所述根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中所述目标区域中第二年龄段的常住人口数量,包括:
利用如下第二目标子模型确定第一时段中所述目标区域中第二年龄段的常住人口数量:
y=y1+y2+y3+y4+y5+y6;
其中,所述y表示在第一时段中目标区域中第二年龄段的常住人口数量;所述第二年龄段为15-64岁;
y1=18050.849812*x1+2.406191*x2-26277.873013*x3+22544.613608;
所述y1表示在第一时段中所述目标区域中的第一居住区域的第二年龄段的常住人口数量;所述x1表示第二时段的人口普查数据中的第一居住区域的第二年龄段的人口性别比例;所述x2表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第二年龄段的人口数量;所述x3表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第二年龄段的人口性别比例;所述第一居住区域为基于人口密度和/或地理位置预规划的;
y2=-8942.980183*x4+1.896493*x5-259.803014*x6+22965.540060;
所述y2表示在第一时段中所述目标区域中的第二居住区域的第二年龄段的常住人口数量;所述x4表示第二时段的人口普查数据中的第二居住区域的第二年龄段的人口性别比例;所述x5表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第二年龄段的人口数量;所述x6表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第二年龄段的人口性别比例;所述第二居住区域为基于人口密度和/或地理位置预规划的;
y3=-16144.939717*x7+2.673506*x8+7250.167953*x9+14770.706126;
所述y3表示在第一时段中所述目标区域中的第三居住区域的第二年龄段的常住人口数量;所述x7表示第二时段的人口普查数据中的第三居住区域的第二年龄段的人口性别比例;所述x8表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第二年龄段的人口数量;所述x9表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第二年龄段的人口性别比例;所述第三居住区域为基于人口密度和/或地理位置预规划的;
y4=15694.410356*x10+2.946597*x11+2207.373408*x12+16432.09326;
所述y4表示在第一时段中所述目标区域中的第四居住区域的第二年龄段的常住人口数量;所述x10表示第二时段的人口普查数据中的第四居住区域的第二年龄段的人口性别比例;所述x11表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第二年龄段的人口数量;所述x12表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第二年龄段的人口性别比例;所述第四居住区域为基于人口密度和/或地理位置预规划的;
y5=-7666.681590*x13+1.905188*x14-5387.157283*x15+33376.382163;
所述y5表示在第一时段中所述目标区域中的第五居住区域的第二年龄段的常住人口数量;所述x13表示第二时段的人口普查数据中的第五居住区域的第二年龄段的人口性别比例;所述x14表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第二年龄段的人口数量;所述x15表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第二年龄段的人口性别比例;所述第五居住区域为基于人口密度和/或地理位置预规划的;
y6=-6718.780983*x16+2.772362*x17+2286.440264*x18+4936.625039;
所述y6表示在第一时段中所述目标区域中的第六居住区域的第二年龄段的常住人口数量;所述x16表示第二时段的人口普查数据中的第六居住区域的第二年龄段的人口性别比例;所述x17表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第二年龄段的人口数量;所述x18表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第二年龄段的人口性别比例;所述第六居住区域为基于人口密度和/或地理位置预规划的。
进一步地,所述根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中所述目标区域中第三年龄段的常住人口数量,包括:
利用如下第三目标子模型确定第一时段中所述目标区域中第三年龄段的常住人口数量:
m=m1+m2+m3+m4+m5+m6;
其中,所述m表示第一时段中所述目标区域中第三年龄段的常住人口数量;所述第三年龄段为65至120岁;
m1=5.982490337883496*n1+589.2650928480234;
所述m1表示第一时段中所述目标区域中第一居住区域的第三年龄段的常住人口数量,所述n1表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第三年龄段的人口数量;
m2=4.7877767268444416*n2+4059.376718685815;
所述m2表示第一时段中所述目标区域中第二居住区域的第三年龄段的常住人口数量,所述n2表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第三年龄段的人口数量;
m3=7.65644626116791*n3+808.7551731002804;
所述m3表示第一时段中所述目标区域中第三居住区域的第三年龄段的常住人口数量,所述n3表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第三年龄段的人口数量;
m4=6.397067540320549*n4+2049.075382057734;
所述m4表示第一时段中所述目标区域中第四居住区域的第三年龄段的常住人口数量,所述n4表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第三年龄段的人口数量;
m5=4.997371259012173*n5+1630.7652073659965;
所述m5表示第一时段中所述目标区域中第五居住区域的第三年龄段的常住人口数量,所述n5表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第三年龄段的人口数量;
m6=7.811643930095783*n6+889.6988876527159;
所述m6表示第一时段中所述目标区域中第六居住区域的第三年龄段的常住人口数量,所述n6表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第三年龄段的人口数量。
第二方面,本发明实施例还提供了一种常住人口确定装置,包括:
获取模块,用于根据目标区域的通信大数据,获取在第一时段中所述目标区域的统计人口数据;
确定模块,用于基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量;所述目标模型是基于第二时段中所述目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;所述人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;所述第二时段早于所述第一时段。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述常住人口确定方法。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述常住人口确定方法。
第五方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述常住人口确定方法。
本发明实施例提供的常住人口确定方法、装置、设备和存储介质,通过通信大数据获取目标区域的统计人口数据,并充分考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大等问题,基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息和性别比例信息,构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型;也就是通过将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与普查人口数据的关系模型,进而利用第一时段的目标区域的通信大数据与普查人口数据的拟合结果及第一时段的目标区域的统计人口数据,就可以快速准确确定在第一时段中目标区域中第二年龄段的常住人口数量。也就是在充分利用通信大数据在人口样本量和高分辨率时空间识别的优势的同时,克服了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,使得基于目标模型和第一时段中目标区域的统计人口数据,可以快速准确地确定第一时段中目标区域的常住人口数量,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的常住人口确定方法的流程示意图;
图2是本发明实施例提供的常住人口确定装置的结构示意图;
图3是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的方法可以应用于获取人口数据的场景中,准确快速地获取和确定人口数据。
相关技术中,利用传统的统计调查方法获得人口数据,但人口统计的过程需要耗费大量的人工成本和时间成本,导致人口统计的效率较低,无法快速准确的获取人口信息。
本发明实施例的常住人口确定方法,通过通信大数据获取目标区域的统计人口数据,并充分考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大等问题,基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息和性别比例信息,构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型;也就是通过将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与普查人口数据的关系模型,进而利用第一时段的目标区域的通信大数据与普查人口数据的拟合结果及第一时段的目标区域的统计人口数据,就可以快速准确确定在第一时段中目标区域中第二年龄段的常住人口数量。也就是在充分利用通信大数据在人口样本量和高分辨率时空间识别的优势的同时,克服了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,使得基于目标模型和第一时段中目标区域的统计人口数据,可以快速准确地确定第一时段中目标区域的常住人口数量,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
下面结合图1-图3以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1是本发明实施例提供的常住人口确定方法一实施例的流程示意图。如图1所示,本实施例提供的方法,包括:
步骤101、根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;
具体地,相关技术中,利用传统的统计调查方法获得人口数据,但人口统计的过程需要耗费大量的人工成本和时间成本,导致人口统计的效率较低,无法快速准确的获取人口信息。
为了解决上述问题,本发明实施例中首先获取目标区域的通信大数据,并根据通信大数据得到在第一时段中目标区域的统计人口数据;
可选地,通信大数据可以为通信运营商的数据;可选地,通信大数据包括通信用户的注册的信息,如用户的年龄、性别、居住地址等信息;可选地,通过通信大数据中的通信信令也可以获取用户的居住位置信息;可选地,根据通信大数据获取的第一时段中目标区域的统计人口数据包括目标区域的人口数量、人口性别比例、各个年龄段的人口数量、各个年龄段的人口性别比例、目标区域中各个居住区域的人口数量;可选地,可以基于人口密度和/或地理位置将目标区域划分为多个居住区域,如将目标区域划分为城市核心区居住区域、郊区居住区域、农村居住区域、山区居住区域等;可选地,第一时段中目标区域的统计人口数据可以为某一年份的统计人口数据。
例如,随着互联网、计算机技术的发展,尤其是数据挖掘技术的进步,可以基于手机信令大数据对人口分布进行分析。相比传统的人口统计调查,大数据内容体现出大样本量、实时动态、微观详细等特征,且增加了研究对象地理位置的坐标定位信息,对于呈现人口的空间分布特征具有明显优势。可选地,利用手机信令大数据在人口样本量和高分辨率时空间识别的优势,根据城市A的通信大数据,可以得到2020年城市A的统计人口数据;可选地,城市A的统计人口数据包括城市A的总的人口数量、城市A的各个年龄的人口数量、城市A的各个年龄的人口性别比例、城市A的预规划的核心区居住区域的各个年龄的人口数量、城市A的预规划的农村居住区域的各个年龄的人口性别比例等。
步骤102、基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。
具体地,利用通信大数据在人口样本量和高分辨率时空间识别的优势可以快速地获取统计人口数据,但大数据统计的人口数据也存在有一些突出的劣势,如存在部分年龄段人员无手机(如0-6岁儿童或老人)导致老人和儿童样本缺失;各个居住区域的人口模型相差较大(如城市人口模型和农村人口模型存在明显差异)、大数据中性别比例误差较大(如由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口)等问题。
因而,本申请通过第二时段中目标区域的统计人口数据的目标特征信息(年龄信息、居住区域信息和性别比例信息)和第二时段中人口普查数据中的目标特征信息(年龄信息、居住区域信息和性别比例信息),构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型(目标模型),进而基于目标模型和第一时段中目标区域的统计人口数据,就可以准确快速的确定第一时段中目标区域的常住人口数量,并解决大数据统计的人口数据中存在的老人和儿童样本缺失、大数据中人口性别比例误差大、大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大的问题。可选地,可以将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与普查人口数据的关系模型,进而基于校准后的模型就可以准确的确定目标区域的常住人口数量。可选地,利用python实现Logistic,多元回归分析拟合得到常住人口数据与大数据居住人口的关系。
例如,儿童、老人未使用手机或者手机号由家中年轻人代办等原因,使得大数据统计的人口数据中儿童和老人的数量明显少于目标区域的常住人口数量;另外由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口;最后,通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,同时,不同人口结构在空间上的差异也十分显著,例如全市范围内生态涵养区和核心区的老龄化程度远高于其他地区。因而构建目标模型时,需要考虑到年龄因素、性别比例因素和空间因素,从而使得基于通信大数据统计的人口数据和目标模型,可以准确地确定出目标区域的常住人口数量。
上述实施例的方法,通过通信大数据获取目标区域的统计人口数据,并充分考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大等问题,基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息和性别比例信息,构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型;也就是通过将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与普查人口数据的关系模型,进而利用第一时段的目标区域的通信大数据与普查人口数据的拟合结果及第一时段的目标区域的统计人口数据,就可以快速准确确定在第一时段中目标区域中第二年龄段的常住人口数量。也就是在充分利用通信大数据在人口样本量和高分辨率时空间识别的优势的同时,克服了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,使得基于目标模型和第一时段中目标区域的统计人口数据,可以快速准确地确定第一时段中目标区域的常住人口数量,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
在一实施例中,目标模型包括以下至少一项:
第一目标子模型,第一目标子模型用于基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量;人口普查数据包括以下至少一项:各个年龄的人口数量、各个年龄的女性数量和各个年龄女性的生育率;
第二目标子模型,第二目标子模型用于基于第一时段中目标区域的统计人口数据中各个居住区域的第二年龄段的人口数量、第一时段中目标区域的统计人口数据中各个居住区域的第二年龄段的人口性别比例和第二时段中目标区域的人口普查数据中各个居住区域的第二年龄段的人口性别比例,确定在第一时段中目标区域中第二年龄段的常住人口数量;
第三目标子模型,第三目标子模型用于基于第一时段中目标区域的统计人口数据中各个居住区域的第三年龄段的人口数量,确定在第一时段中目标区域中第三年龄段的常住人口数量。
具体地,为了准确确定在第一时段中目标区域的常住人口数量,本申请在构建目标模型时,充分考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大等问题,通过第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息和性别比例信息,构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,进而基于目标模型和第一时段中目标区域的统计人口数据,就可以准确快速的确定第一时段中目标区域的常住人口数量,并解决大数据统计的人口数据中存在的老人和儿童样本缺失、大数据中人口性别比例误差大、大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大的问题。
例如,本申请在构建目标模型时,考虑到年龄因素,即在通信大数据中第一年龄段(如0-14岁)的人口数据几乎完全缺失,本申请实施例中通过构建目标模型中的第一目标子模型来确定第一时段中目标区域的第一年龄段的常住人口数量。其中,第一目标子模型是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量;其中,第二时段早于第一时段,如第二时段为2019年,第二时段为2020年。可选地,在确定第一时段的新生儿童数量时,本发明实施例中通过第二时段中目标区域的各个年龄的女性数量和各个年龄女性的生育率,可以准确的确定第一时段中目标区域的新生儿童数量。
在通信大数据中第二年龄段(如15-64岁)的人口数据中,考虑到一方面由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口,另外考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,不同人口结构在空间上的差异也十分显著,使得通信大数据和传统人口调查数据在市、区、街道等空间层级上的统计特征存在差异,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息、和性别比例等因素构建目标模型中的第二目标子模型,也就是构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,可选地,可以将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与人口数据的关系模型(第二目标子模型),进而利用第二目标子模型中的通信大数据与人口数据的拟合结果,就可以准确确定在第一时段中目标区域中第二年龄段的常住人口数量。
与此同时,在通信大数据中第三年龄段(如大于等于65岁)老年人的遗漏比例较高,并考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息等因素构建目标模型中的第三目标子模型,从而使得第三目标子模型基于第一时段中目标区域的统计人口数据中各个居住区域的第三年龄段的人口数量,就可以准确确定在第一时段中目标区域中第三年龄段的常住人口数量。
上述实施例的方法,为了解决通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,本申请实施例中基于统计人口数据和人口普查数据中人口中的年龄信息、居住区域信息和性别比例信息,构建目标模型中的第一目标子模型、第二目标子模型和第三目标子模型,从而基于目标模型和第一时段中目标区域的统计人口数据,可以快速准确地确定目标区域的常住人口数量。也就是在充分利用通信大数据在人口样本量和高分辨率时空间识别的优势的同时,克服了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
在一实施例中,目标模型中的第二目标子模型是基于第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量拟合确定的;第三时段早于第二时段;
目标模型中的第三目标子模型是基于第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合确定的。
具体地,在通信大数据中第二年龄段(如15-64岁)的人口数据中,考虑到一方面由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口,另外考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,不同人口结构在空间上的差异也十分显著,使得通信大数据和传统人口调查数据在市、区、街道等空间层级上的统计特征存在差异,因而本申请实施例中基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息、和性别比例等因素构建目标模型中的第二目标子模型,也就构建了可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,可选地,可以将第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量进行拟合,从而得到通信大数据与普查人口数据的关系模型,也就确定了第二目标子模型。
在通信大数据中第三年龄段(如大于等于65岁)老年人的遗漏比例较高,并考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息等因素构建目标模型中的第三目标子模型,可选地,将第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合,确定第三目标子模型。
上述实施例的方法,基于统计人口数据和人口普查数据中人口中的年龄信息、居住区域信息和性别比例信息,构建目标模型中的第一目标子模型、第二目标子模型和第三目标子模型,从而基于目标模型和第一时段中目标区域的统计人口数据,可以快速准确地确定目标区域的常住人口数量。也就是构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,通过将人口普查数据中人口目标特征信息和通信大数据统计的人口数据中人口目标特征信息进行拟合和校准,从而得到通信大数据与普查人口数据的关系模型,进而利用通信大数据与普查人口数据的拟合结果,就可以快速准确确定在第一时段中目标区域中的常住人口数量,解决了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
在一实施例中,基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量,包括:
根据第二时段中目标区域的人口普查数据和第一目标子模型,确定在第一时段中目标区域中第一年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中目标区域中第二年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中目标区域中第三年龄段的常住人口数量;
根据第一时段中目标区域中第一年龄段的常住人口数量、第一时段中目标区域中第二年龄段的常住人口数量和第一时段中目标区域中第三年龄段的常住人口数量,确定第一时段中目标区域的常住人口数量。
具体地,本申请在构建目标模型时,考虑到年龄因素,即在通信大数据中第一年龄段(如0-14岁)的人口数据几乎完全缺失,本申请实施例中通过构建目标模型中的第一目标子模型来确定第一时段中目标区域的第一年龄段的常住人口数量。其中,第一目标子模型是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量。因而在获取第二时段中目标区域的人口普查数据,也就是获取第二时段中各个年龄的人口数量、各个年龄的女性人口数量和各个年龄的女性生育率后,就可以基于第一目标子模型,确定在第一时段中目标区域中第一年龄段的常住人口数量。可选地,在确定第一时段的新生儿童数量时,本发明实施例中通过第二时段中目标区域的各个年龄的女性数量和各个年龄女性的生育率,可以准确的确定第一时段中目标区域的新生儿童数量。
在通信大数据中第二年龄段(如15-64岁)的人口数据中,考虑到一方面由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口,另外考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,不同人口结构在空间上的差异也十分显著,使得通信大数据和传统人口调查数据在市、区、街道等空间层级上的统计特征存在差异,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息、和性别比例等因素构建目标模型中的第二目标子模型,也就是构建可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,可选地,可以将第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量进行拟合,从而得到通信大数据与普查人口数据的关系模型,也就确定了第二目标子模型,进而利用第二目标子模型和第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例,就可以准确确定在第一时段中目标区域中第二年龄段的常住人口数量。
在通信大数据中第三年龄段(如大于等于65岁)老年人的遗漏比例较高,并考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息等因素构建目标模型中的第三目标子模型,可选地,将第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合,确定第三目标子模型;进而基于第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,就可以准确确定在第一时段中目标区域中第三年龄段的常住人口数量。
在基于第一目标子模型确定第一时段中目标区域中第一年龄段的常住人口数量,基于第二目标子模型确定在第一时段中目标区域中第二年龄段的常住人口数量,基于第三目标模型确定在第一时段中目标区域中第三年龄段的常住人口数量后,将各个年龄段的常住人口数量相加求和,也就可以准确的确定第一时段中目标区域的常住人口数量。
上述实施例的方法,利用目标模型和目标区域的统计人口数据,分别获取各个年龄段的常住人口数量后,将各个年龄段的常住人口数量相加求和,也就可以快速准确地确定目标区域的常住人口数量。其中,目标模型是基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息和性别比例信息,构建的可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,从而基于目标模型和第一时段中目标区域的统计人口数据,就可以准确快速的确定目标区域的常住人口数量。也就是在充分利用通信大数据在人口样本量和高分辨率时空间识别的优势的同时,克服了通信大数据中在不同人口密度的空间上数据代表性和扩样系数准确性差异较大、通信大数据中老人和儿童样本缺失、通信大数据中人口性别比例误差大的问题,达到了利用通信大数据方式替代传统人口调查方式快速准确确定目标区域常住人口数量的效果。
在一实施例中,根据第二时段中目标区域的人口普查数据和第一目标子模型,确定在第一时段中目标区域中第一年龄段的常住人口数量,包括:
利用如下第一目标子模型确定第一时段中目标区域中第一年龄段的常住人口数量:
A=(B+C)×D;
A表示在第一时段中目标区域中第一年龄段的常住人口数量;B表示新生儿数量,新生儿数量是基于第二时段的人口普查数据中的各个年龄的女性数量和各个年龄女性的生育率确定的;C表示第二时段的人口普查数据中的目标年龄段的人口数量;第一年龄段为0至14岁,目标年龄段为0至13岁;D表示第一权值。
具体地,本申请在构建目标模型时,考虑到年龄因素,即在通信大数据中第一年龄段(如0-14岁)的人口数据几乎完全缺失,本申请实施例中通过构建目标模型中的第一目标子模型来确定第一时段中目标区域的第一年龄段的常住人口数量。其中,第一目标子模型是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量。
因而在获取第二时段中目标区域的人口普查数据,也就是获取第二时段中各个年龄的人口数量、各个年龄的女性人口数量和各个年龄的女性生育率后,就可以基于第一目标子模型,确定在第一时段中目标区域中第一年龄段的常住人口数量。可选地,第一年龄段为0-14岁。
可选地,第一时段的0岁新生儿数量=第二时段的各个年龄段育龄妇女数*生育率;可选地,第二时段的育龄妇女数采用15岁-64岁的人口数据,生育率采用第二时段的各个年龄育龄妇女的生育率;
可选地,第一时段的1-14岁的人口数量=第二时段的0-13岁的人口数量。
可选地,D表示第一权值,可以根据经验进行调整。
例如,统计第二时段(2020年)的0-13岁的人口数量为10000人,第二时段的育龄妇女数采用15岁-64岁的人口数据为50000人,第二时段的各个年龄育龄妇女的生育率都为1%,则第一时段的0岁新生儿数量=500;则第一时段中目标区域中第一年龄段(0-14岁)的常住人口数量为500+10000=10500;其中,第一时段中目标区域的0岁的新生儿的数量为500;第一时段中目标区域的1-14岁的常住人口数量为10000人。可选地,第一时段中目标区域的1-14岁的常住人口数量为10000的基础上可以考虑各个年龄段的死亡率,从而使得确定出的第一时段中目标区域的1-14岁的常住人口数量更加的准确。
上述实施例的方法,本发明实施例中通过第一目标子模型确定第一时段中目标区域中第一年龄段的常住人口数量,也就是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量,避免了通信大数据中儿童样本缺失的问题,使得最终基于目标模型确定出的目标区域的常住人口数量更加的准确,克服了通信大数据中儿童样本缺失的问题。
在一实施例中,根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中目标区域中第二年龄段的常住人口数量,包括:
利用如下第二目标子模型确定第一时段中目标区域中第二年龄段的常住人口数量:
y=y1+y2+y3+y4+y5+y6;
其中,y表示在第一时段中目标区域中第二年龄段的常住人口数量;第二年龄段为15-64岁;
y1=18050.849812*x1+2.406191*x2-26277.873013*x3+22544.613608;
y1表示在第一时段中目标区域中的第一居住区域的第二年龄段的常住人口数量;x1表示第二时段的人口普查数据中的第一居住区域的第二年龄段的人口性别比例;x2表示第一时段中目标区域的统计人口数据中的第一居住区域的第二年龄段的人口数量;x3表示第一时段中目标区域的统计人口数据中的第一居住区域的第二年龄段的人口性别比例;第一居住区域为基于人口密度和/或地理位置预规划的;
y2=-8942.980183*x4+1.896493*x5-259.803014*x6+22965.540060;
y2表示在第一时段中目标区域中的第二居住区域的第二年龄段的常住人口数量;x4表示第二时段的人口普查数据中的第二居住区域的第二年龄段的人口性别比例;x5表示第一时段中目标区域的统计人口数据中的第二居住区域的第二年龄段的人口数量;x6表示第一时段中目标区域的统计人口数据中的第二居住区域的第二年龄段的人口性别比例;第二居住区域为基于人口密度和/或地理位置预规划的;
y3=-16144.939717*x7+2.673506*x8+7250.167953*x9+14770.706126;
y3表示在第一时段中目标区域中的第三居住区域的第二年龄段的常住人口数量;x7表示第二时段的人口普查数据中的第三居住区域的第二年龄段的人口性别比例;x8表示第一时段中目标区域的统计人口数据中的第三居住区域的第二年龄段的人口数量;x9表示第一时段中目标区域的统计人口数据中的第三居住区域的第二年龄段的人口性别比例;第三居住区域为基于人口密度和/或地理位置预规划的;
y4=15694.410356*x10+2.946597*x11+2207.373408*x12+16432.09326;
y4表示在第一时段中目标区域中的第四居住区域的第二年龄段的常住人口数量;x10表示第二时段的人口普查数据中的第四居住区域的第二年龄段的人口性别比例;x11表示第一时段中目标区域的统计人口数据中的第四居住区域的第二年龄段的人口数量;x12表示第一时段中目标区域的统计人口数据中的第四居住区域的第二年龄段的人口性别比例;第四居住区域为基于人口密度和/或地理位置预规划的;
y5=-7666.681590*x13+1.905188*x14-5387.157283*x15+33376.382163;
y5表示在第一时段中目标区域中的第五居住区域的第二年龄段的常住人口数量;x13表示第二时段的人口普查数据中的第五居住区域的第二年龄段的人口性别比例;x14表示第一时段中目标区域的统计人口数据中的第五居住区域的第二年龄段的人口数量;x15表示第一时段中目标区域的统计人口数据中的第五居住区域的第二年龄段的人口性别比例;第五居住区域为基于人口密度和/或地理位置预规划的;
y6=-6718.780983*x16+2.772362*x17+2286.440264*x18+4936.625039;
y6表示在第一时段中目标区域中的第六居住区域的第二年龄段的常住人口数量;x16表示第二时段的人口普查数据中的第六居住区域的第二年龄段的人口性别比例;x17表示第一时段中目标区域的统计人口数据中的第六居住区域的第二年龄段的人口数量;x18表示第一时段中目标区域的统计人口数据中的第六居住区域的第二年龄段的人口性别比例;第六居住区域为基于人口密度和/或地理位置预规划的。
具体地,在通信大数据中第二年龄段(如15-64岁)的人口数据中,考虑到一方面由于代办卡等原因,通信大数据中男性人口规模普遍高于女性人口,另外考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,不同人口结构在空间上的差异也十分显著,使得通信大数据和传统人口调查数据在市、区、街道等空间层级上的统计特征存在差异,因而本申请实施例中基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息、和性别比例等因素构建目标模型中的第二目标子模型,也就构建了可验证、可依赖、可操作、可应用的通信大数据与人口数据的关系模型,可选地,可以将第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量进行拟合,从而得到通信大数据与普查人口数据的关系模型,也就确定了第二目标子模型。
可选地,本发明实施例中将目标区域预划分为6个居住区域,并基于目标特征信息(年龄信息、居住区域信息和性别比例信息)进行6个不同居住区域的统计人口数据和普查数据的拟合后,就可以得到第二目标子模型中各个居住区域的第二年龄段的常住人口数量计算模型y1、y2、y3、y4、y5和y6,进而将第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例、第一时段中目标区域的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段中目标区域的统计人口数据中的各个居住区域的第二年龄段的人口性别比例输入至模型y1、y2、y3、y4、y5和y6中,也就可以准确的确定各个居住区域的第二年龄段的常住人口数量。可选地,6个居住区域分别为:老城区核心区域、老城区普通区域、新城区核心区域、新城区普通区域、郊区、山区;可选地,也可以基于其他维度进行空间和居住区域的划分,本发明实施例中不做限制。
上述实施例的方法,通过将目标区域预划分为6个居住区域,并基于目标特征信息(年龄信息、居住区域信息和性别比例信息)进行6个不同居住区域的统计人口数据和普查数据的拟合后,就可以得到第二目标子模型中各个居住区域的第二年龄段的常住人口数量计算模型,进而将第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例、第一时段中目标区域的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段中目标区域的统计人口数据中的各个居住区域的第二年龄段的人口性别比例输入至模型中,也就可以准确的确定各个居住区域的第二年龄段的常住人口数量。
在一实施例中,根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中目标区域中第三年龄段的常住人口数量,包括:
利用如下第三目标子模型确定第一时段中目标区域中第三年龄段的常住人口数量:
m=m1+m2+m3+m4+m5+m6;
其中,m表示第一时段中目标区域中第三年龄段的常住人口数量;第三年龄段为65至120岁;
m1=5.982490337883496*n1+589.2650928480234;
m1表示第一时段中目标区域中第一居住区域的第三年龄段的常住人口数量,n1表示第一时段中目标区域的统计人口数据中的第一居住区域的第三年龄段的人口数量;
m2=4.7877767268444416*n2+4059.376718685815;
m2表示第一时段中目标区域中第二居住区域的第三年龄段的常住人口数量,n2表示第一时段中目标区域的统计人口数据中的第二居住区域的第三年龄段的人口数量;
m3=7.65644626116791*n3+808.7551731002804;
m3表示第一时段中目标区域中第三居住区域的第三年龄段的常住人口数量,n3表示第一时段中目标区域的统计人口数据中的第三居住区域的第三年龄段的人口数量;
m4=6.397067540320549*n4+2049.075382057734;
m4表示第一时段中目标区域中第四居住区域的第三年龄段的常住人口数量,n4表示第一时段中目标区域的统计人口数据中的第四居住区域的第三年龄段的人口数量;
m5=4.997371259012173*n5+1630.7652073659965;
m5表示第一时段中目标区域中第五居住区域的第三年龄段的常住人口数量,n5表示第一时段中目标区域的统计人口数据中的第五居住区域的第三年龄段的人口数量;
m6=7.811643930095783*n6+889.6988876527159;
m6表示第一时段中目标区域中第六居住区域的第三年龄段的常住人口数量,n6表示第一时段中目标区域的统计人口数据中的第六居住区域的第三年龄段的人口数量。
具体地,在通信大数据中第三年龄段(如大于等于65岁)老年人的遗漏比例较高,并考虑到通信大数据在不同人口密度的空间上数据代表性和扩样系数准确性差异较大,因而本申请基于第二时段中目标区域的统计人口数据和人口普查数据中的年龄信息、居住区域信息等因素构建目标模型中的第三目标子模型,可选地,将第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合,确定第三目标子模型。
可选地,本发明实施例中将目标区域预划分为6个居住区域,并进行不同居住区域的统计人口数据和普查数据的拟合后,就可以得到第三目标子模型中各个居住区域的第三年龄段的常住人口数量计算模型m1、m2、m3、m4、m5、m6,进而将第一时段中目标区域的统计人口数据中的各个居住区域的第三年龄段的人口数量输入至模型中,也就可以准确的确定各个居住区域的第三年龄段的常住人口数量。可选地,6个居住区域分别为:老城区核心区域、老城区普通区域、新城区核心区域、新城区普通区域、郊区、山区;可选地,也可以基于其他维度进行空间和居住区域的划分,本发明实施例中不做限制。
上述实施例的方法,通过将目标区域预划分为6个居住区域,并进行不同居住区域的统计人口数据和普查数据的拟合后,就可以得到第三目标子模型中各个居住区域的第三年龄段的常住人口数量计算模型,进而将第一时段中目标区域的统计人口数据中的各个居住区域的第三年龄段的人口数量输入至模型中,也就可以准确的确定各个居住区域的第三年龄段的常住人口数量。
示例性的,本发明实施例中,将北京市区分为6个居住区域,分别为老城区核心区域、老城区普通区域、新城区核心区域、新城区普通区域、郊区、山区;其中,老城区核心区域包括:核心区32个街道;老城区普通区域包括:朝海丰石102个街乡;新城区核心区域包括:通州、大兴、房山、昌平、顺义的新城主要涵盖街乡;新城区普通区域包括:通州、大兴、房山、昌平、顺义的新城以外街乡;郊区包括:门头沟、怀柔、密云、平谷、延庆的新城主要涵盖街乡;山区包括:门头沟、怀柔、密云、平谷、延庆的新城以外街乡。
本申请实施例中,北京市区本年度0-14岁规模=(0岁新生儿规模+1-14岁规模)*机械增长系数;其中,0岁新生儿=分年龄段育龄妇女数*生育率,育龄妇女数采用15岁-64岁人口数量;1-14岁=上年度0-13岁;可选地,可以不考虑机械增长。
将北京市区分成上述6个居住区域,以第3个居住为例,通过利用python实现Logistic,多元回归分析拟合得到常住人口与大数据居住人口的关系参数如下:
y=-16144.939717x1+2.673506x2+7250.167953x3+14770.706126(14<x<65)
f(x)=7.65644626116791*x+808.7551731002804(x大于或等于65)
其中y表示15-64岁普查常住人口数,x1表示普查数据中,不同居住区域的15-64岁常住人口性别比例,x2表示大数据15-64岁居住人口总数,x3表示联通大数据中15-64岁居住人口性别比例,其决定系数R^2=0.852。
f(x)表示65岁及以上普查常住人口数,x表示大数据中65岁及以上居住人口数,其决定系数R^2=0.842。
本发明实施例的方法,克服了将大数据技术方法与传统统计调查方法获得的人口数据作为独立的两套数据体系来看待,建立了大数据与传统数据之间的联系路径,建立了大数据统计的人口数据与传统普查确定的人口数据之间相应的换算标准,通过利用人口普查中的常住人口详细结构数据,与手机大数据监测结果进行比对,在各个居住区域分层级进行细致分析,建立手机大数据与普查人口数据的关系模型,并在充分区域、年龄、性别比例等因素的基础上,建立可验证、可依赖、可操作、可应用的手机大数据与普查人口数据的关系模型,形成基于大数据确定常住人口的算法体系,实现了利用手机大数据方式替代传统人口调查方法的效果。
下面对本发明提供的常住人口确定装置进行描述,下文描述的常住人口确定装置与上文描述的常住人口确定方法可相互对应参照。
图2是本发明提供的常住人口确定装置的结构示意图。本实施例提供的常住人口确定装置,包括:
获取模块710,用于根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;
确定模块720,用于基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。
本发明实施例的装置,其用于执行前述任一方法实施例中的方法,其实现原理和技术效果类似,此次不再赘述。
需要说明的是,本申请所获得数据均征得本人同意或通过合法途径取得。
图3示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行常住人口确定方法,该方法包括:根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的常住人口确定方法,该方法包括:根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的常住人口确定方法,该方法包括:根据目标区域的通信大数据,获取在第一时段中目标区域的统计人口数据;基于统计人口数据和目标模型,确定在第一时段中目标区域的常住人口数量;目标模型是基于第二时段中目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;第二时段早于第一时段。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种常住人口确定方法,其特征在于,包括:
根据目标区域的通信大数据,获取在第一时段中所述目标区域的统计人口数据;
基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量;所述目标模型是基于第二时段中所述目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;所述人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;所述第二时段早于所述第一时段;其中,所述目标模型包括:
第一目标子模型,是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量;人口普查数据包括以下至少一项:各个年龄的人口数量、各个年龄的女性数量和各个年龄女性的生育率;第一年龄段为0-14岁;
第二目标子模型,是基于第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量拟合确定的;第三时段早于第二时段;第二年龄段为15-64岁;
第三目标子模型,是基于第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合确定的;第三年龄段为65岁以上。
2.根据权利要求1所述的常住人口确定方法,其特征在于,所述基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量,包括:
根据第二时段中所述目标区域的人口普查数据和第一目标子模型,确定在第一时段中所述目标区域中第一年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中所述目标区域中第二年龄段的常住人口数量;
根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中所述目标区域中第三年龄段的常住人口数量;
根据所述第一时段中所述目标区域中第一年龄段的常住人口数量、第一时段中所述目标区域中第二年龄段的常住人口数量和第一时段中所述目标区域中第三年龄段的常住人口数量,确定第一时段中所述目标区域的常住人口数量。
3.根据权利要求2所述的常住人口确定方法,其特征在于,所述根据第二时段中所述目标区域的人口普查数据和第一目标子模型,确定在第一时段中所述目标区域中第一年龄段的常住人口数量,包括:
利用如下第一目标子模型确定第一时段中所述目标区域中第一年龄段的常住人口数量:
A=(B+C)×D;
其中,A表示在第一时段中所述目标区域中第一年龄段的常住人口数量;B表示新生儿数量,所述新生儿数量是基于第二时段的人口普查数据中的各个年龄的女性数量和各个年龄女性的生育率确定的;C表示第二时段的人口普查数据中的目标年龄段的人口数量;所述第一年龄段为0至14岁,所述目标年龄段为0至13岁;D表示第一权值。
4.根据权利要求3所述的常住人口确定方法,其特征在于,所述根据第一时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第一时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第二时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二目标子模型,确定在第一时段中所述目标区域中第二年龄段的常住人口数量,包括:
利用如下第二目标子模型确定第一时段中所述目标区域中第二年龄段的常住人口数量:
y=y1+y2+y3+y4+y5+y6;
其中,y表示在第一时段中目标区域中第二年龄段的常住人口数量;所述第二年龄段为15-64岁;
y1=18050.849812*x1+2.406191*x2-26277.873013*x3+22544.613608;
y1表示在第一时段中所述目标区域中的第一居住区域的第二年龄段的常住人口数量;x1表示第二时段的人口普查数据中的第一居住区域的第二年龄段的人口性别比例;x2表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第二年龄段的人口数量;x3表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第二年龄段的人口性别比例;所述第一居住区域为基于人口密度和/或地理位置预规划的;
y2=-8942.980183*x4+1.896493*x5-259.803014*x6+22965.540060;
y2表示在第一时段中所述目标区域中的第二居住区域的第二年龄段的常住人口数量;x4表示第二时段的人口普查数据中的第二居住区域的第二年龄段的人口性别比例;x5表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第二年龄段的人口数量;x6表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第二年龄段的人口性别比例;所述第二居住区域为基于人口密度和/或地理位置预规划的;
y3=-16144.939717*x7+2.673506*x8+7250.167953*x9+14770.706126;
y3表示在第一时段中所述目标区域中的第三居住区域的第二年龄段的常住人口数量;x7表示第二时段的人口普查数据中的第三居住区域的第二年龄段的人口性别比例;x8表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第二年龄段的人口数量;x9表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第二年龄段的人口性别比例;所述第三居住区域为基于人口密度和/或地理位置预规划的;
y4=15694.410356*x10+2.946597*x11+2207.373408*x12+16432.09326;
y4表示在第一时段中所述目标区域中的第四居住区域的第二年龄段的常住人口数量;x10表示第二时段的人口普查数据中的第四居住区域的第二年龄段的人口性别比例;x11表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第二年龄段的人口数量;x12表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第二年龄段的人口性别比例;所述第四居住区域为基于人口密度和/或地理位置预规划的;
y5=-7666.681590*x13+1.905188*x14-5387.157283*x15+33376.382163;
y5表示在第一时段中所述目标区域中的第五居住区域的第二年龄段的常住人口数量;x13表示第二时段的人口普查数据中的第五居住区域的第二年龄段的人口性别比例;x14表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第二年龄段的人口数量;x15表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第二年龄段的人口性别比例;所述第五居住区域为基于人口密度和/或地理位置预规划的;
y6=-6718.780983*x16+2.772362*x17+2286.440264*x18+4936.625039;
y6表示在第一时段中所述目标区域中的第六居住区域的第二年龄段的常住人口数量;x16表示第二时段的人口普查数据中的第六居住区域的第二年龄段的人口性别比例;x17表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第二年龄段的人口数量;x18表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第二年龄段的人口性别比例;所述第六居住区域为基于人口密度和/或地理位置预规划的。
5.根据权利要求4所述的常住人口确定方法,其特征在于,所述根据第一时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第三目标子模型,确定在第一时段中所述目标区域中第三年龄段的常住人口数量,包括:
利用如下第三目标子模型确定第一时段中所述目标区域中第三年龄段的常住人口数量:
m=m1+m2+m3+m4+m5+m6;
其中,m表示第一时段中所述目标区域中第三年龄段的常住人口数量;所述第三年龄段为65至120岁;
m1=5.982490337883496*n1+589.2650928480234;
m1表示第一时段中所述目标区域中第一居住区域的第三年龄段的常住人口数量,n1表示第一时段中所述目标区域的统计人口数据中的第一居住区域的第三年龄段的人口数量;
m2=4.7877767268444416*n2+4059.376718685815;
m2表示第一时段中所述目标区域中第二居住区域的第三年龄段的常住人口数量,n2表示第一时段中所述目标区域的统计人口数据中的第二居住区域的第三年龄段的人口数量;
m3=7.65644626116791*n3+808.7551731002804;
m3表示第一时段中所述目标区域中第三居住区域的第三年龄段的常住人口数量,n3表示第一时段中所述目标区域的统计人口数据中的第三居住区域的第三年龄段的人口数量;
m4=6.397067540320549*n4+2049.075382057734;
m4表示第一时段中所述目标区域中第四居住区域的第三年龄段的常住人口数量,n4表示第一时段中所述目标区域的统计人口数据中的第四居住区域的第三年龄段的人口数量;
m5=4.997371259012173*n5+1630.7652073659965;
m5表示第一时段中所述目标区域中第五居住区域的第三年龄段的常住人口数量,n5表示第一时段中所述目标区域的统计人口数据中的第五居住区域的第三年龄段的人口数量;
m6=7.811643930095783*n6+889.6988876527159;
m6表示第一时段中所述目标区域中第六居住区域的第三年龄段的常住人口数量,n6表示第一时段中所述目标区域的统计人口数据中的第六居住区域的第三年龄段的人口数量。
6.一种常住人口确定装置,其特征在于,包括:
获取模块,用于根据目标区域的通信大数据,获取在第一时段中所述目标区域的统计人口数据;
确定模块,用于基于所述统计人口数据和目标模型,确定在所述第一时段中所述目标区域的常住人口数量;所述目标模型是基于第二时段中所述目标区域的统计人口数据中人口目标特征信息和人口普查数据中人口目标特征信息确定的;所述人口目标特征信息包括以下至少一项:年龄信息、居住区域信息和性别比例信息;所述第二时段早于所述第一时段;其中,所述目标模型包括:
第一目标子模型,是基于第二时段中目标区域的人口普查数据,确定在第一时段中目标区域中的第一年龄段的常住人口数量;人口普查数据包括以下至少一项:各个年龄的人口数量、各个年龄的女性数量和各个年龄女性的生育率;第一年龄段为0-14岁;
第二目标子模型,是基于第二时段的统计人口数据中的各个居住区域的第二年龄段的人口数量、第二时段的统计人口数据中的各个居住区域的第二年龄段的人口性别比例、第三时段的人口普查数据中的各个居住区域的第二年龄段的人口性别比例和第二时段的人口普查数据中的各个居住区域的人口数量拟合确定的;第三时段早于第二时段;第二年龄段为15-64岁;
第三目标子模型,是基于第二时段的统计人口数据中的各个居住区域的第三年龄段的人口数量和第二时段的普查人口数据中的各个居住区域的第三年龄段的人口数量拟合确定的;第三年龄段为65岁以上。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的常住人口确定方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述的常住人口确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310182296.2A CN115878964B (zh) | 2023-03-01 | 2023-03-01 | 常住人口确定方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310182296.2A CN115878964B (zh) | 2023-03-01 | 2023-03-01 | 常住人口确定方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115878964A CN115878964A (zh) | 2023-03-31 |
CN115878964B true CN115878964B (zh) | 2023-11-24 |
Family
ID=85761741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310182296.2A Active CN115878964B (zh) | 2023-03-01 | 2023-03-01 | 常住人口确定方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115878964B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106257473A (zh) * | 2015-06-18 | 2016-12-28 | 富士通株式会社 | 人口推测方法及人口推测设备 |
KR20170011780A (ko) * | 2015-07-24 | 2017-02-02 | 울산과학기술원 | 인구통계 시뮬레이션 방법 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
CN111212383A (zh) * | 2018-11-01 | 2020-05-29 | 百度在线网络技术(北京)有限公司 | 区域常住人口数量的确定方法、装置、服务器和介质 |
CN112069235A (zh) * | 2020-11-16 | 2020-12-11 | 脉策(上海)智能科技有限公司 | 用于呈现目标区域人口数据的方法、设备和存储介质 |
CN112990530A (zh) * | 2020-12-23 | 2021-06-18 | 北京软通智慧城市科技有限公司 | 区域人口数量预测方法、装置、电子设备和存储介质 |
CN115049159A (zh) * | 2022-08-12 | 2022-09-13 | 北京大学 | 人口分布预测方法和装置、存储介质及电子设备 |
CN115633311A (zh) * | 2022-09-30 | 2023-01-20 | 中山大学 | 一种基于手机信令数据的道路交通噪声人群影响计量方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017040578A1 (en) * | 2015-09-01 | 2017-03-09 | Mastercard International Incorporated | Method and system for sizing of demographic markets |
-
2023
- 2023-03-01 CN CN202310182296.2A patent/CN115878964B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106257473A (zh) * | 2015-06-18 | 2016-12-28 | 富士通株式会社 | 人口推测方法及人口推测设备 |
KR20170011780A (ko) * | 2015-07-24 | 2017-02-02 | 울산과학기술원 | 인구통계 시뮬레이션 방법 |
CN111212383A (zh) * | 2018-11-01 | 2020-05-29 | 百度在线网络技术(北京)有限公司 | 区域常住人口数量的确定方法、装置、服务器和介质 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
CN112069235A (zh) * | 2020-11-16 | 2020-12-11 | 脉策(上海)智能科技有限公司 | 用于呈现目标区域人口数据的方法、设备和存储介质 |
CN112990530A (zh) * | 2020-12-23 | 2021-06-18 | 北京软通智慧城市科技有限公司 | 区域人口数量预测方法、装置、电子设备和存储介质 |
CN115049159A (zh) * | 2022-08-12 | 2022-09-13 | 北京大学 | 人口分布预测方法和装置、存储介质及电子设备 |
CN115633311A (zh) * | 2022-09-30 | 2023-01-20 | 中山大学 | 一种基于手机信令数据的道路交通噪声人群影响计量方法 |
Non-Patent Citations (2)
Title |
---|
Yuling Xia 等.Dynamic Analysis and Prediction of Food Nitrogen Footprint of Urban and Rural Residents in Shanghai.《Environmental Regeneration for Healthier Lives》.2020,第1-13页. * |
王蓓 等.基于手机信令数据的北京市职住空间 分布格局及匹配特征.《地理科学进展》.2020,第39卷(第12期),第2028-2042页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115878964A (zh) | 2023-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Malizia et al. | Elevation and latitude drives structure and tree species composition in Andean forests: Results from a large-scale plot network | |
CN111932036B (zh) | 基于位置大数据的精细时空尺度动态人口预测方法及系统 | |
Fiorio et al. | Using twitter data to estimate the relationship between short-term mobility and long-term migration | |
WO2020237539A1 (zh) | 电力负荷的预测方法、装置及存储介质 | |
Oliveira et al. | Evaluation of two methods for identifying trip purpose in GPS-based household travel surveys | |
CN107657015A (zh) | 一种兴趣点推荐方法、装置、电子设备及存储介质 | |
CN104254865A (zh) | 凭经验的专家确定和问题路由系统和方法 | |
CN109151995A (zh) | 一种基于信号强度的深度学习回归融合定位方法 | |
CN103177189B (zh) | 一种众源位置签到数据质量分析方法 | |
Guo et al. | A combined model based on sparrow search optimized BP neural network and Markov chain for precipitation prediction in Zhengzhou City, China | |
Song et al. | Building-level urban functional area identification based on multi-attribute aggregated data from cell phones—A method combining multidimensional time series with a som neural network | |
CN115878964B (zh) | 常住人口确定方法、装置、设备和存储介质 | |
CN106779181B (zh) | 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 | |
Teng et al. | Localization reliability improvement using deep Gaussian process regression model | |
Yoo et al. | Diurnal urban heat risk assessment using extreme air temperatures and real-time population data in Seoul | |
CN115829163B (zh) | 基于多模式集成的长江中下游流域径流预测方法和系统 | |
Ma et al. | Empirical orthogonal function analysis and modeling of global tropospheric delay spherical harmonic coefficients | |
Li et al. | Data error propagation in stacked bioclimatic envelope models | |
CN110633890A (zh) | 一种土地利用效率判断方法和系统 | |
CN115641498A (zh) | 基于空间多尺度卷积神经网络的中期降水预报后处理订正方法 | |
CN115713691A (zh) | 一种基于夜光遥感的像元级电力普及率估算方法及装置 | |
CN114595764A (zh) | 用于获取城市要素对内涝灾害损失影响程度的方法及系统 | |
CN110113053A (zh) | 一种分布式压缩感知稀疏信号重建方法 | |
CN107169088B (zh) | 一种基于时空交互的用户社交关系强度计算方法及系统 | |
Chen et al. | Modeling the Spatial Distribution of Population Based on Random Forest and Parameter Optimization Methods: A Case Study of Sichuan, China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |