CN112925870A - 一种人口空间化方法及系统 - Google Patents

一种人口空间化方法及系统 Download PDF

Info

Publication number
CN112925870A
CN112925870A CN202110273451.2A CN202110273451A CN112925870A CN 112925870 A CN112925870 A CN 112925870A CN 202110273451 A CN202110273451 A CN 202110273451A CN 112925870 A CN112925870 A CN 112925870A
Authority
CN
China
Prior art keywords
data
population
influence factor
grid
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110273451.2A
Other languages
English (en)
Other versions
CN112925870B (zh
Inventor
潘耀忠
董海燕
朱秀芳
王金云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN202110273451.2A priority Critical patent/CN112925870B/zh
Publication of CN112925870A publication Critical patent/CN112925870A/zh
Application granted granted Critical
Publication of CN112925870B publication Critical patent/CN112925870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种人口空间化方法及系统,先根据研究区域的实际情况,选取多种类型的数据作为影响因子,分别对每一影响因子进行预处理,得到影响因子对应的空间栅格数据,然后利用主成分分析法计算每一影响因子的权重,最后根据空间栅格数据、权重以及研究区域的人口总数计算每一栅格内的人口数,得到研究区域的人口空间化结果,利用客观科学的主成分分析法计算各个影响因子的权重,能够避免人的主观意识对权重划分的影响,大大提高了人口空间化结果的精度,空间化结构精度高,且尺度精细。

Description

一种人口空间化方法及系统
技术领域
本发明涉及人口空间化技术领域,特别是涉及一种城市精细化人口空间化方法及系统。
背景技术
人口统计数据是以行政区域为基础统计单元,通过逐级统计汇总而来,人口统计数据更新慢,时空分辨率低,难以反映统计单元内的人口分布差异,人口空间化成为解决上述问题的重要途径。人口空间化目前所采用的方法主要分为空间插值法、单因子建模法、机器学习法和多源数据融合法四类。
常见的空间插值法包括点插值法和面插值法。该方法简便易行,能够快速实现地理格网的人口分布转换,但没有考虑行政区域内部人口分布的差异。且空间插值法的结果的分辨率一般为几十千米,随着对人口空间化精细尺度研究的加深,大大限制了该方法的发展与应用。
单因子建模法主要分为土地利用类型法和夜间灯光建模法。基于土地利用类型建立人口空间化模型是应用较为广泛的方法,该方法假设研究区内土地利用类型一致的区域人口密度相同,优点是所需参数少,模型易于建立且一定程度上反映了行政区域内人口的分布差异,缺点是仅考虑了土地利用数据对人口的影响,在人口分布复杂区域,其结果不具有说服力。夜间灯光建模法是通过建立灯光强度与人口密度之间的线性关系来模拟研究区人口分布情况。该方法容易实现且近年来较为流行,但是需要解决像元饱和、灯光溢出等问题。同时,由于其空间分辨率较低,因此适合大尺度人口建模。
随着大数据时代的到来,机器学习方法被广泛应用,一些学者将随机森林模型应用于人口空间化。该方法的优点是能够快速准确实现大规模人口空间化的精细研究,但需要有大量的人口分布样本数据,模型受算法优劣、样本大小、样本类型影响很大,在小样本数据区域难以应用。
但许多人口密集的中大型城市人口分布状况复杂,受多种因素影响,单因子建模法并不适用,且由于人口统计数据空间分辨率低、可获取数据有限造成样本较少,导致数据样本量受限,也无法使用需求大数据量的机器学习方法。因此选择科学合理的方法融合多源数据进行人口空间化是实现中大型人口密集城市空间化的唯一方法。
多源数据融合是近年来进行精细尺度空间化模拟人口估算的主要方式,该方法统一多种要素和模型,模拟结果精度较高,能比较真实地反映人口数据的空间分布情况,其缺点在于因子权重确定的过程较为复杂,而目前大多采用专家打分法、层次分析法确定因子权重,这些方法具有一定的主观性,会因人的主观意识而改变权重导致对最后的结果产生影响。因此,就目前而言,缺少一种客观科学的确定权重的方法来进行多源数据融合,无法实现中大型人口密集城市的精细尺度空间化。
发明内容
本发明的目的是提供一种人口空间化方法及系统,利用多种类型的数据作为影响因子,并采用客观科学的主成分分析法计算各影响因子的权重,实现了中大型人口密集城市的精细尺度人口空间化,且取得了较好的精度。
为实现上述目的,本发明提供了如下方案:
一种人口空间化方法,所述方法包括如下步骤:
根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
利用主成分分析法计算每一所述影响因子的权重;
根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
一种人口空间化系统,所述系统包括:
影响因子确定模块,用于根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
空间栅格数据计算模块,用于分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
权重计算模块,用于利用主成分分析法计算每一所述影响因子的权重;
人口空间化模块,用于根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种人口空间化方法及系统,先根据研究区域的实际情况,选取多种类型的数据作为影响因子,再分别对每一影响因子进行预处理,得到每一影响因子对应的空间栅格数据,然后利用主成分分析法计算每一影响因子的权重,最后根据空间栅格数据、权重以及研究区域的人口总数计算每一栅格内的人口数,得到研究区域的人口空间化结果,利用客观科学的主成分分析法计算各个影响因子的权重,能够避免人的主观意识对权重划分的影响,大大提高了人口空间化结果的精度,另外,根据研究区域的实际情况选取多个影响因子,并分别计算各个影响因子的权重,最终进行加权融合来进行人口空间化,能够从多个角度来进行人口空间化,空间化结构精度高,且尺度精细。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的人口空间化方法的方法流程图。
图2为本发明实施例1所提供的人口空间化方法的原理图。
图3为本发明实施例1所提供的对各个影响因子进行预处理的方法流程图。
图4为本发明实施例1所提供的影响因子的空间栅格数据示意图。
图5为本发明实施例1所提供的影响因子权重的计算方法流程图。
图6为本发明实施例1所提供的相关性分析结果示意图。
图7为本发明实施例2所提供的人口空间化系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种人口空间化方法及系统,利用多种类型的数据作为影响因子,并采用客观科学的主成分分析法计算各影响因子的权重,实现了中大型人口密集城市的精细尺度人口空间化,且取得了较好的精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
本实施例用于提供一种人口空间化方法,如图1和图2所示,所述方法包括如下步骤:
S1:根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
在选择影响因子时,要充分考虑所要研究的研究区域的实际情况和各个影响因子的数据可获得性,选取既容易获得数据又能体现研究区域人口分布情况的多种类型的数据作为影响因子。
作为一种可选的实施方式,在确定影响因子所包括的POI数据的数据类型时,先利用Python获取多种类型的POI数据,然后对每一类型的POI数据和人口统计数据进行相关性分析,得到每一类型的POI数据与人口统计数据之间的相关值,最后选取相关值大于预设相关值的POI数据作为影响因子所包括的POI数据。预设相关值根据用户需求而确定,本实施例中选取预设相关值为0.85。举例而言,利用Python从高德地图获得2018年的23类POI数据(兴趣点数据),共计近150万条,经过数据清洗与相关性分析后,选择与人口统计数据相关性大于0.85的9类POI数据作为影响因子,分别为:餐饮服务类、公司企业类、购物服务类、交通设施类、科教文化类、商务住宅类、生活服务类、医疗保健类、政府机构类。
S2:分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
空间栅格数据的精度根据用户需求而定,若想得到更精细化的人口空间化结果则选取面积更小的栅格,但在确定空间栅格数据的精度时,同样要考虑人口空间化的速度,兼顾精度与速度进行选择。本实施例选取30m×30m的栅格。
具体的,如图3所示,S2可以包括:
S21:采用双线性内插法将所述夜间灯光数据重采样到预设精度的栅格内,得到所述夜间灯光数据对应的空间栅格数据;
具体的,夜间灯光数据采用珞珈一号(LJ1-01)夜间灯光数据,LJ1-01夜间灯光数据来自武汉大学“珞珈一号”01星搭载的CMOS传感器所获得的数据,其分辨率约为133m。选择2018年完整覆盖研究区域的影像数据,研究区域影像可见像素值为0~1111267。若研究区域内某个范围的像素值异常高,则利用这个范围所处统计单元的灯光平均值对这个范围进行平滑处理,具体利用Arcgis将这个范围内高于平均值的像元用平均值进行代替,得到初步处理后的夜间灯光数据。然后将初步处理后的夜间灯光数据采用双线性内插法重采样至30m×30m栅格,得到夜间灯光数据对应的空间栅格数据。
S22:利用专家打分法对所述土地覆盖类型数据中的每一土地覆盖类型进行打分,得到每一所述土地覆盖类型的分值;根据所述土地覆盖类型的分值,采用Arcgis重分类工具对预设精度的栅格进行赋值,得到所述土地覆盖类型数据对应的空间栅格数据;
具体的,土地覆盖类型数据来自2020年Global Land 30全球土地覆盖数据集,土地覆盖类型主要分为耕地、林地、草地、灌丛、湿地、水体、人造地表、裸地、苔原和永久性冰雪十种类型,一般情况下研究区域的范围内无苔原和永久性冰雪这两种土地覆盖类型,故利用专家打分法对其他8种土地覆盖类型进行打分,得到每一土地覆盖类型的分值,耕地、林地、草地、灌丛、湿地、水体、人造地表、裸地的分值分别为3,2,1,2,0,0,9,1。然后利用Arcgis重分类工具,根据每一个栅格内的土地覆盖类型,对每一个栅格进行赋值,得到土地覆盖类型数据对应的空间栅格数据。需要说明的是,土地覆盖类型数据对应的栅格同样为30m×30m。
S23:采用Arcgis工具分别对所述河流数据和所述路网数据进行缓冲区分析,得到所述河流数据对应的空间栅格数据和所述路网数据对应的空间栅格数据;
具体的,河流、道路数据来自OSM官方网站下载的2018年数据集,将道路、河流线状矢量数据利用Arcgis工具进行缓冲区分析,并转换成30m×30m栅格数据,得到河流数据对应的空间栅格数据和路网数据对应的空间栅格数据。缓冲区分析是指以点、线、面实体为基础,自动建立其周围一定宽度范围内的缓冲区多边形图层,然后建立该图层与目标图层的叠加,进行分析得到所需结果,用来解决邻近度问题的空间分析工具之一,邻近度用于表示地理空间中两个地物距离相近的程度。
S24:采用Arcgis坡度提取工具提取所述DEM数据的坡度,得到所述DEM数据对应的空间栅格数据;
具体的,数字高程模型(DEM)数据来自于中国科学院计算机网络信息中心地理空间数据云平台下载的ASTER GDEMV2全球数字高程数据集,分辨率为30m×30m。利用Arcgis坡度提取工具将DEM数据转换成坡度栅格数据,得到DEM数据对应的空间栅格数据。
S25:采用Arcgis核密度分析工具对所述POI数据进行处理,得到所述POI数据对应的空间栅格数据。
在得到每一影响因子对应的空间栅格数据后,利用Arcgis将每一影响因子对应的空间栅格数据均转换到统一的坐标系,具体的,可统一转换到WGS-84坐标系中。另外,理论上水体区域无人口,因此还可以利用掩膜工具剔除所有空间栅格数据中的水体区域。
为了便于计算,本实施例还可将除土地覆盖类型数据外的其他影响因子所对应的空间栅格数据均进行归一化处理,具体的,将除土地覆盖类型数据外的其他影响因子对应的空间栅格数据通过Arcgis进行归一化,值域为0-10,其中坡度进行反向归一化,即坡度越低值越高。
如图4所示,其给出了6个影响因子对应的空间栅格数据示意图。(a)为夜间灯光强度分布图,一般来说,灯光强度值越高,经济越发达,人口越聚集,使得分配人口数越多。(b)为土地覆盖类型分布图,对每种土地覆盖类型进行打分,其中人造地表分值最高,为9分,即人造地表人类活动最多,人口较为聚集,分值越高代表分配的人口数越多。(c)、(d)分别为道路缓冲区距离、河流缓冲区距离分布图,距离道路河流越近,交通景观等越优越,分值越高,分配人口数越多。(e)为坡度分布图,坡度越低,值越高,越为平坦,分配人口数越多。(f)为POI数据中的医疗保健密度分布图,密度值越高,此处医疗保健类服务设施越密集,大大满足人们生活所需,使得分配人口数越多。
另外,还可将影响因子分为自然地理因子和人文地理因子,构成人口空间化评价指标体系。人口空间化评价指标体系如表1所示。
表1人口空间化评价指标体系
Figure BDA0002975553090000071
需要说明的是,表1中的评价指标与上述的多个影响因子一一对应。
S3:利用主成分分析法计算每一所述影响因子的权重;
具体的,如图5所示,S3可以包括:
S31:对每一所述影响因子对应的空间栅格数据分别进行标准化,得到每一所述影响因子对应的标准化数据;
对于每一影响因子,其所用的标准化公式均为:
Figure BDA0002975553090000081
式1中,X为标准化数据;x为原始数据;xmax为原始数据中的最大值;xmin为原始数据中的最小值。
S32:利用SPSS对所有所述标准化数据进行主成分分析,得到每一主成分的特征值、贡献率以及旋转成分矩阵;
S33:根据所述旋转成分矩阵和所述特征值计算每一所述影响因子在每一所述主成分的得分模型中的第一系数;
具体的,先根据旋转成分矩阵确定每一影响因子在每一主成分中的载荷。
再利用
Figure BDA0002975553090000082
计算每一影响因子在每一主成分的得分模型中的第一系数。其中,ami为第m个影响因子在第i个主成分的得分模型中的第一系数;m=1,2,...,M;i=1,2,...,I;M为影响因子的个数;I为主成分的个数;αmi为第m个影响因子在第i个主成分中的载荷;λi为第i个主成分的特征值。
第i个主成分的得分模型为:
Fi=a1iX1+a2iX2+...+amiXm+...+aMiXM; (2)
式2中,Fi为第i个主成分的得分,Xm为第m个影响因子的标准化数据。
S34:根据所述第一系数和所述贡献率计算每一所述影响因子在综合得分模型中的第二系数;
具体的,第二系数的计算公式为:
Figure BDA0002975553090000083
式3中,ωm为第m个影响因子在综合得分模型中的第二系数;si为第i个主成分的贡献率。
综合得分模型为:
F=ω1X12X2+...+ωmXm+...+ωMXM; (4)
式4中,F为综合得分。
S35:根据所述第二系数计算每一所述影响因子的权重。
权重的计算公式为:
Figure BDA0002975553090000091
式5中,Pm为第m个影响因子的权重。
利用S3,采用客观科学的主成分分析法挖掘各个影响因子的特征,计算得到各个影响因子的权重,可充分整合多个影响因子的特征信息,能够避免人的主观意识对权重划分的影响,大大提高了人口空间化结果的精度,并且根据各个影响因子的权重,对多个影响因子进行加权融合来进行人口空间化,能够从多个角度来进行人口空间化,空间化结果精度高,且尺度精细,提高了人口空间化的精度和效率。
S4:根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
每一栅格内的人口数的计算公式为:
Figure BDA0002975553090000092
式6中,POPj为第j个栅格的人口数;j=1,2,...,J;J为研究区域内的栅格数量;POP为研究区域的人口总数;m=1,2,...,M;M为影响因子的个数;Pm为第m个影响因子的权重;Lmj为第j个栅格内的第m个影响因子的值;Lm为研究区域所有栅格内的第m个影响因子的总值。
为了使本领域技术人员更清楚的了解本实施例的技术方案,并具体展示本实施例所用人口空间化方法的优越性,本实施例以北京市作为研究区域,进行详细说明。
利用2019年北京市统计年鉴获取北京市区县常住人口统计数据,利用中国县域统计年鉴2018乡镇卷获取北京市乡镇常住人口统计数据,选取Worldpop数据集中的北京市2018年100m人口数据来进行精度验证对比。
按照S1、S2、S3所述的方法,获取北京市中各个影响因子的空间栅格数据,并利用客观科学的主成分分析法计算各个影响因子的权重。根据空间栅格数据、权重以及北京市各区县人口总数计算每一栅格内的人口数,此时,获取的是北京市各个区县的人口总数,所以在计算每一栅格的人口数时,需要将各区县的人口总数分配到各区县所包括的栅格内,其所用的公式如下:
Figure BDA0002975553090000101
式7中,POPa,b为第b个区县内第a个栅格的人口数,即某个30m×30m栅格内的人口数;a=1,2,...,A;A为第b个区县内的栅格数量;b=1,2,...,B;B为北京市内的区县数量;POPb为第b个区县内的人口总数,即北京市某个区县的人口总数,例如海淀区人口总数。m=1,2,...,M;M为影响因子的个数,本实施例中M为14;Pm为第m个影响因子的权重;Lma为第a个栅格内的第m个影响因子的值;Lmab为第a个栅格所在的第b个区县内的第m个影响因子的总值,此值通过Arcgis的Zonal statistics(区域统计)工具进行分区县统计得到。经过上述步骤后便可得到北京市每个30m×30m栅格中的人口数,即北京市人口空间化结果。
为了展示本实施例所用人口空间化方法的优越性,根据上述计算得到的北京市人口空间化结果,计算北京市内各个乡镇的人口总数,然后将该各个乡镇的人口总数计算结果与根据Worldpop数据集中北京市2018年100m人口数据得到的各个乡镇的人口总数计算结果进行精度验证对比。为了方便描述,记依据本实施例的人口空间化结果所得到的各个乡镇的人口总数计算结果为第一计算人口数,记依据Worldpop数据集中北京市2018年100m人口数据所得到的各个乡镇的人口总数计算结果为第二计算人口数,记利用中国县域统计年鉴2018乡镇卷所获取的北京市乡镇常住人口统计数据为统计人口数。
选取相对误差RE、平均相对误差MRE、均方根误差RMSE作为精度验证的评价指标。
具体的,相对误差RE的计算公式为:
Figure BDA0002975553090000111
式8中,POPn,c为第n个乡镇的计算人口数;POPn,d为第n个乡镇的统计人口数。n=1,2,...,N;N为北京市内的乡镇数量。
平均相对误差MRE的计算公式为:
Figure BDA0002975553090000112
均方根误差RMSE的计算公式为:
Figure BDA0002975553090000113
将本实施例的第一计算人口数与统计人口数进行相关性分析,将Worldpop数据集的第二计算人口数与统计人口数进行相关性分析,分析结果如图6所示,(a)为本实施例的第一计算人口数与统计人口数之间的相关性,R2=0.85。(b)为Worldpop数据集的第二计算人口数与统计人口数之间的相关性,R2=0.67。由此可见,本实施例的第一计算人口数与统计人口数之间的相关性高于Worldpop数据集的第二计算人口数与统计人口数之间的相关性。
另外,依据上述公式(8)、(9)、(10),计算本实施例的第一计算人口数与统计人口数之间的误差值,计算Worldpop数据集的第二计算人口数与统计人口数之间的误差值,误差计算结果如表2所示。本实施例在50%-100%这一误差区间内的乡镇数远少于Worldpop数据集,而在50%以内的所有误差区间内的乡镇个数均高于Worldopop数据集,证明本实施例相比于Worldopop数据集而言,高误差乡镇数大大减少,都以较低误差聚集。本实施例的平均相对误差MRE为0.28,低于Worldpop数据集的平均相对误差0.48,并且均方根误差RMSE也远低于Worldpop数据集。
综上可以看出,本实施例的人口空间化结果的精度优于Worldpop数据集,能更好的反映真实人口空间分布。
表2精度验证结果
Figure BDA0002975553090000121
实施例2:
本实施例用于提供一种人口空间化系统,如图7所示,所述系统包括:
影响因子确定模块M1,用于根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
空间栅格数据计算模块M2,用于分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
权重计算模块M3,用于利用主成分分析法计算每一所述影响因子的权重;
人口空间化模块M4,用于根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种人口空间化方法,其特征在于,所述方法包括如下步骤:
根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
利用主成分分析法计算每一所述影响因子的权重;
根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
2.根据权利要求1所述的一种人口空间化方法,其特征在于,所述方法还包括确定所述影响因子所包括的POI数据的类型,具体包括:
利用Python获取多种类型的POI数据;
对每一类型的POI数据和人口统计数据进行相关性分析,得到每一类型的POI数据与人口统计数据之间的相关值;
选取所述相关值大于预设相关值的POI数据作为所述影响因子所包括的POI数据。
3.根据权利要求1所述的一种人口空间化方法,其特征在于,所述分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据具体包括:
采用双线性内插法将所述夜间灯光数据重采样到预设精度的栅格内,得到所述夜间灯光数据对应的空间栅格数据;
利用专家打分法对所述土地覆盖类型数据中的每一土地覆盖类型进行打分,得到每一所述土地覆盖类型的分值;根据所述土地覆盖类型的分值,采用Arcgis重分类工具对预设精度的栅格进行赋值,得到所述土地覆盖类型数据对应的空间栅格数据;
采用Arcgis工具分别对所述河流数据和所述路网数据进行缓冲区分析,得到所述河流数据对应的空间栅格数据和所述路网数据对应的空间栅格数据;
采用Arcgis坡度提取工具提取所述DEM数据的坡度,得到所述DEM数据对应的空间栅格数据;
采用Arcgis核密度分析工具对所述POI数据进行处理,得到所述POI数据对应的空间栅格数据。
4.根据权利要求1所述的一种人口空间化方法,其特征在于,在得到每一所述影响因子对应的空间栅格数据后,所述方法还包括:
利用Arcgis将每一所述影响因子对应的空间栅格数据均转换到统一的坐标系;
将除所述土地覆盖类型数据外的其他影响因子所对应的空间栅格数据均进行归一化处理。
5.根据权利要求1所述的一种人口空间化方法,其特征在于,所述利用主成分分析法计算每一所述影响因子的权重具体包括:
对每一所述影响因子对应的空间栅格数据分别进行标准化,得到每一所述影响因子对应的标准化数据;
利用SPSS对所有所述标准化数据进行主成分分析,得到每一主成分的特征值、贡献率以及旋转成分矩阵;
根据所述旋转成分矩阵和所述特征值计算每一所述影响因子在每一所述主成分的得分模型中的第一系数;
根据所述第一系数和所述贡献率计算每一所述影响因子在综合得分模型中的第二系数;
根据所述第二系数计算每一所述影响因子的权重。
6.根据权利要求5所述的一种人口空间化方法,其特征在于,所述根据所述旋转成分矩阵和所述特征值计算每一所述影响因子在每一所述主成分的得分模型中的第一系数具体包括:
根据所述旋转成分矩阵确定每一所述影响因子在每一所述主成分中的载荷;
利用
Figure FDA0002975553080000021
计算每一所述影响因子在每一所述主成分的得分模型中的第一系数;
其中,ami为第m个影响因子在第i个主成分的得分模型中的第一系数;m=1,2,...,M;i=1,2,...,I;M为影响因子的个数;I为主成分的个数;αmi为第m个影响因子在第i个主成分中的载荷;λi为第i个主成分的特征值。
7.根据权利要求6所述的一种人口空间化方法,其特征在于,所述根据所述第一系数和所述贡献率计算每一所述影响因子在综合得分模型中的第二系数具体包括:
Figure FDA0002975553080000031
其中,ωm为第m个影响因子在综合得分模型中的第二系数;si为第i个主成分的贡献率。
8.根据权利要求7所述的一种人口空间化方法,其特征在于,所述根据所述第二系数计算每一所述影响因子的权重具体包括:
Figure FDA0002975553080000032
其中,Pm为第m个影响因子的权重。
9.根据权利要求1所述的一种人口空间化方法,其特征在于,所述根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数具体包括:
Figure FDA0002975553080000033
其中,POPj为第j个栅格的人口数;j=1,2,...,J;J为研究区域内的栅格数量;POP为研究区域的人口总数;m=1,2,...,M;M为影响因子的个数;Pm为第m个影响因子的权重;Lmj为第j个栅格内的第m个影响因子的值;Lm为研究区域所有栅格内的第m个影响因子的总值。
10.一种人口空间化系统,其特征在于,所述系统包括:
影响因子确定模块,用于根据研究区域的实际情况,选取多种类型的数据作为影响因子;所述影响因子包括夜间灯光数据、土地覆盖类型数据、河流数据、路网数据、DEM数据和POI数据;所述POI数据包括餐饮服务数据、公司企业数据、购物服务数据、交通设施数据、科教文化数据、商务住宅数据、生活服务数据、医疗保健数据和政府机构数据;
空间栅格数据计算模块,用于分别对每一所述影响因子进行预处理,得到每一所述影响因子对应的空间栅格数据;各个所述影响因子对应的空间栅格数据的精度相同;
权重计算模块,用于利用主成分分析法计算每一所述影响因子的权重;
人口空间化模块,用于根据所述空间栅格数据、所述权重以及所述研究区域的人口总数计算每一栅格内的人口数,得到所述研究区域的人口空间化结果。
CN202110273451.2A 2021-03-15 2021-03-15 一种人口空间化方法及系统 Active CN112925870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110273451.2A CN112925870B (zh) 2021-03-15 2021-03-15 一种人口空间化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110273451.2A CN112925870B (zh) 2021-03-15 2021-03-15 一种人口空间化方法及系统

Publications (2)

Publication Number Publication Date
CN112925870A true CN112925870A (zh) 2021-06-08
CN112925870B CN112925870B (zh) 2023-06-02

Family

ID=76174906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110273451.2A Active CN112925870B (zh) 2021-03-15 2021-03-15 一种人口空间化方法及系统

Country Status (1)

Country Link
CN (1) CN112925870B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642773A (zh) * 2021-07-13 2021-11-12 中国科学院空天信息创新研究院 城市绿地格局优化方法、装置、电子设备及存储介质
CN114331790A (zh) * 2022-03-09 2022-04-12 中国测绘科学研究院 一种人口数据边缘不完整格网处理方法及系统
CN115186009A (zh) * 2022-07-13 2022-10-14 中国科学院地理科学与资源研究所 基于兴趣点数据的城市人口日内变化空间化方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090292549A1 (en) * 2008-05-21 2009-11-26 Honeywell International Inc. Social network construction based on data association
US20110209418A1 (en) * 2010-02-26 2011-09-01 Drake Lawrence V Modular enclosure for utility trailers and pickup trucks
CN108764702A (zh) * 2018-05-23 2018-11-06 中水东北勘测设计研究有限责任公司 考虑防洪工程安全性的防洪保护区洪水风险评价方法
CN109142679A (zh) * 2018-08-13 2019-01-04 中国科学院东北地理与农业生态研究所 基于人工神经网络克里金插值的森林土壤养分的空间预测方法
CN109598202A (zh) * 2018-11-05 2019-04-09 中国科学院遥感与数字地球研究所 一种基于对象的卫星图像多指标建成区自动提取方法
CN110428126A (zh) * 2019-06-18 2019-11-08 华南农业大学 一种基于多源开放数据的城市人口空间化处理方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090292549A1 (en) * 2008-05-21 2009-11-26 Honeywell International Inc. Social network construction based on data association
US20110209418A1 (en) * 2010-02-26 2011-09-01 Drake Lawrence V Modular enclosure for utility trailers and pickup trucks
CN108764702A (zh) * 2018-05-23 2018-11-06 中水东北勘测设计研究有限责任公司 考虑防洪工程安全性的防洪保护区洪水风险评价方法
CN109142679A (zh) * 2018-08-13 2019-01-04 中国科学院东北地理与农业生态研究所 基于人工神经网络克里金插值的森林土壤养分的空间预测方法
CN109598202A (zh) * 2018-11-05 2019-04-09 中国科学院遥感与数字地球研究所 一种基于对象的卫星图像多指标建成区自动提取方法
CN110428126A (zh) * 2019-06-18 2019-11-08 华南农业大学 一种基于多源开放数据的城市人口空间化处理方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JINGYUAN CHEN等: "A Spatial Distribution Equilibrium Evaluation of Health Service Resources at Community Grid Scale in Yichang, China", 《SUSTAINABILITY》, pages 1 - 28 *
李宁: "基于机会约束模型与空间适宜度竞争法的区域土地资源不确定优化", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》, no. 8, pages 149 - 42 *
王琼等: "基于主成分分析和熵权法的河流生境质量评价方法——以清河为例", vol. 36, no. 4, pages 185 - 193 *
董海燕等: "多因子贡献率权重的城市精细人口空间化方法:以北京市为例", vol. 58, no. 1, pages 135 - 142 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642773A (zh) * 2021-07-13 2021-11-12 中国科学院空天信息创新研究院 城市绿地格局优化方法、装置、电子设备及存储介质
CN114331790A (zh) * 2022-03-09 2022-04-12 中国测绘科学研究院 一种人口数据边缘不完整格网处理方法及系统
CN115186009A (zh) * 2022-07-13 2022-10-14 中国科学院地理科学与资源研究所 基于兴趣点数据的城市人口日内变化空间化方法及系统

Also Published As

Publication number Publication date
CN112925870B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN112925870B (zh) 一种人口空间化方法及系统
Xu et al. Classification of local climate zones using ASTER and Landsat data for high-density cities
Zhu et al. Flood disaster risk assessment based on random forest algorithm
Yue et al. Numerical simulation of population distribution in China
CN110428126B (zh) 一种基于多源开放数据的城市人口空间化处理方法及系统
Li et al. Rainfall and earthquake-induced landslide susceptibility assessment using GIS and Artificial Neural Network
CN107688906B (zh) 多方法融合的输电线路气象要素降尺度分析系统及方法
CN114547017B (zh) 一种基于深度学习的气象大数据融合方法
Dmowska et al. High resolution dasymetric model of US demographics with application to spatial distribution of racial diversity
Cheng et al. Remote sensing and social sensing data fusion for fine-resolution population mapping with a multimodel neural network
CN112131731B (zh) 一种基于空间特征向量滤波的城市生长元胞模拟方法
CN111523804B (zh) 一种基于实景三维的应急避难场所效能评估方法
CN110263109A (zh) 一种融合互联网信息及gis技术的家庭户数估算方法
CN111833224A (zh) 一种基于人口栅格数据的城市主副中心边界识别方法
CN111914137B (zh) 一种基于遥感数据和poi数据的gdp空间化方法
CN107341558A (zh) 共乘路径的计算方法及使用此方法的计算装置与记录媒体
CN117710508A (zh) 基于改进条件生成对抗网络的近地表温度反演方法和装置
Li et al. Landscape management and planning as a spatial organization method connecting CES supply-demand assessment and sustainable tourism development
CN103605988A (zh) 一种基于空间金字塔随机映射的地基云图分类方法
CN106844626A (zh) 利用微博关键词和位置信息模拟空气质量的方法及系统
CN114154789A (zh) 一种结合多源数据的建设用地适宜性评价方法及装置
CN114782255A (zh) 一种基于语义的夜光遥感影像高分辨率重建方法
CN113361852A (zh) 场址选择的方法、装置、电子设备及存储介质
Mendel et al. Assessing temporal changes in the reservation of the natural aesthetic resource using pictorial content analysis and a grid-based scoring system–The example of Tasmania, Australia
Antoni Urban sprawl modelling: a methodological approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant