CN114138926B - 一种人口分布格网大小确定方法及系统 - Google Patents
一种人口分布格网大小确定方法及系统 Download PDFInfo
- Publication number
- CN114138926B CN114138926B CN202210099086.2A CN202210099086A CN114138926B CN 114138926 B CN114138926 B CN 114138926B CN 202210099086 A CN202210099086 A CN 202210099086A CN 114138926 B CN114138926 B CN 114138926B
- Authority
- CN
- China
- Prior art keywords
- grid
- population
- area
- data
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 230000008859 change Effects 0.000 claims description 70
- 238000004364 calculation method Methods 0.000 claims description 68
- 238000004458 analytical method Methods 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 12
- 238000012952 Resampling Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000005520 cutting process Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004513 sizing Methods 0.000 claims description 4
- 238000011160 research Methods 0.000 description 13
- 125000004432 carbon atom Chemical group C* 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Library & Information Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人口分布格网大小确定方法及系统,该方法包括:获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑;获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑;将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积;基于所述图斑相交面积计算人口分布格网尺度。该方法实现了在不使用人口数据的前提下确定研究区域内的人口格网尺度。
Description
技术领域
本发明涉及数据挖掘技术领域,具体是一种人口分布格网大小确定方法及系统。
背景技术
近年来大数据与信息化技术快速发展,带来的是越来越多的数据与可视化技术相结合,大大提高了数据的可读性。其中,关于人口的统计数据常常是在行政区划内逐级汇总,配合严谨的统计理论与方法,使其具备权威性、系统性、规范性,而人口数据空间化的研究从通过人口统计和行政区划数据进行空间插值的操作到使用高分辨率影像、地形地貌数据、交通道路数据、地表覆盖数据以及夜光遥感数据等与人口空间分布具有高度空间相关性的多种参考数据和多要素模型,这使人口空间化数据的结果在精确性和表现详细性上有了大幅度的提升。但是由于人口的分布规律存在一定的复杂性并且各个模型都有着各自的局限性,这就导致了现阶段人口空间化的研究仍然存在一定的问题,其中就包括不同空间尺度所带来的尺度效应问题。
2003年,廖顺宝等人提出了多源数据融合进行人口空间化的技术,但是并没有提出与解决人口栅格尺度的问题;Briggs等(2007)利用克里金插值和反距离插值将DMSP-OLS夜间灯光数据处理为200m格网,结合土地利用数据,利用多元回归法生成了欧盟地区20世纪90年代和2000年左右的公里格网数据;2014年,李月娇等人提出利用景观生态指数对省级行政区人口空间数据的格网尺度进行了研究,并确定400m为最佳尺度;2017年,董南等人提出利用景观指数和统计学标准对乡村地区进行人口空间数据的适宜格网尺度研究。上述研究只专注于大范围的省级行政区域或者是小范围的村庄区域,对于重要的城市区域还没有一套证实可行的评级方法,并且人口空间化数据的最佳格网尺度和所研究区域的属性有直接联系,而人口格网尺度也并不是越小越好,即以国家为单位的研究区域与以省、市为单位的研究区域相比,前者所适合的格网尺度应当要大于后者所适合的格网尺度,而目前关于人口数据尺度效应的研究较少。
因此,如何在不使用人口数据的前提下确定研究区域内的人口格网尺度是本领域技术人员亟待解决的问题。
发明内容
鉴于上述问题,本发明的目的是为了解决面对人口数据空间化过程中研究区域和人口数据过大导致分析时间较长,无法确定合适人口格网尺度的问题。
本发明实施例提供一种人口分布格网大小确定方法,包括:
获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑;
获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑;
将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积;
基于所述图斑相交面积计算人口分布格网尺度。
在一个实施例中,所述基于所述图斑相交面积计算所述人口分布格网尺度,包括:
将所述图斑相交面积按照格网尺度进行排序,并计算所述图斑相交面积之间的相对变化率;
基于所述相对变化率计算几何平均值;
计算所述相对变化率与所述几何平均值的差值;
将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
在一个实施例中,还包括:
利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
在一个实施例中,所述利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度,包括:
获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值;
利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔;
将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
在一个实施例中,所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
第二方面,本发明还提供一种人口分布格网大小确定系统,包括:
第一预处理模块,用于获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑;
第二预处理模块,用于获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑;
相交叠加模块,用于将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积;
计算模块,用于基于所述图斑相交面积计算人口分布格网尺度。
在一个实施例中,所述计算模块,包括:
排序单元,用于将所述图斑相交面积按照格网尺度进行排序,并计算所述图斑相交面积之间的相对变化率;
第一计算单元,用于基于所述相对变化率计算几何平均值;
第二计算单元,用于计算所述相对变化率与所述几何平均值的差值;
比较单元,用于将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
在一个实施例中,还包括:
验证分析模块,用于利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
在一个实施例中,所述验证分析模块,包括:
赋予单元,用于获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值;
分析单元,用于利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔;
生成单元,用于将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
在一个实施例中,所述分析单元中的所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的一种人口分布格网大小确定方法,本方法对夜光遥感数据和地表覆盖数据进行预处理,将生成的夜光遥感图斑与各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积,利用图斑叠相交面积生成人口分布格网尺度,实现了在不使用人口数据的前提下确定研究区域内的人口格网尺度;然后利用地理国情数据及人口数据创建不同尺度下的人口格网,并以反距离权重法将人口数分配至研究区格网中,最后建立了空间相关性、位置一致性、数值信息差异性和空间差异性四方面的指标评价体系,对不同尺度格网进行四个方面的分析并得出最适宜人口格网尺度,验证人口格网尺度确定方法的可行性,建立了不依赖景观指数的人口格网尺度评价体系,提高了人口格网尺度的准确度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步地详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的一种人口分布格网大小确定方法的流程图;
图2为本发明实施例提供的人口分布格网大小确定及验证方法的流程图;
图3为本发明实施例提供的步骤S104流程图;
图4为本发明实施例提供的步骤S105流程图;
图5为本发明实施例1提供的图斑相交面积在不同格网尺度下的变化示意图;
图7为本发明实施例1提供的形心距离指数变化示意图;
图8为本发明实施例1提供的变异系数指数变化示意图;
图9为本发明实施例1提供的地理探测器q值指数变化示意图;
图10为本发明实施例提供的一种人口分布格网大小确定系统的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1所示,本发明实施例提供的一种人口分布格网大小确定方法,该方法包括:步骤S101~S104;
S101、获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑。
具体的,参照图2所示,利用地理国情数据中的行政区划图斑对夜光遥感数据进行裁剪,进而利用自然间断点分级法对夜光遥感数据进行重分类为6类,包括:耕地、森林、草地、水体、人造地表和裸地。
进一步地,所述自然间断点分级法对夜光遥感数据进行重分类的步骤为:将N个夜光遥感数据分为k类,分类结果相应划分为k个子集、、...、,分别计算每个子集的总偏差平方和,,...,,总偏差平方和计算过程为:均值的计算公式如下所示:
则其总偏差平方和(SDAM)的计算公式为:
进一步地,根据分类的间隔值提取发亮区域并将其转换为夜光遥感图斑,并单独存储。
S102、获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑。
具体的,参照图2所示,利用地理国情数据中的行政区划图斑对地表覆盖数据进行裁剪,将地表覆盖数据栅格化至目标格网大小的栅格数据,获得地表覆盖栅格化数据,对地表覆盖栅格化数据按确定步长(例如,5m)进行重采样(所述重采样是指从高分辨率遥感影像中提取出低分辨率影像的过程),使得地表覆盖栅格化数据与夜光遥感数据分辨率相同,进而利用ArcGIS技术,根据栅格属性值对各级房屋建筑区栅格数据进行提取并矢量化,生成各级房屋建筑区图斑。
S103、将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积。
具体的,将夜光遥感矢量图斑与各级房屋建筑区矢量图斑一一进行相交叠加分析,并计算不同尺度下的相交面积。
进一步地,根据图斑叠相交面积选择对应的格网层级;根据图斑叠相交面积的外接矩形过滤对应的格网层级中不相关的格网单元;若各个格网单元与图斑叠相交面积相交,则计算该相交面积并将其纳入有效面积,若所述各个格网单元包含在图斑叠相交面积内,则将该格网单元面积纳入有效面积,若所述各个格网单元在图斑叠相交面积外部,则忽略该格网单元面积;根据汇总的有效面积与汇总的各个格网单元面积之比,计算图斑叠相交面积内所述各个格网单元的各个属性面积,并进行累加,其计算公式如下:
上式中,N表示与图斑叠相交面积的外接矩形拓扑相交的格网总数量,i表示地类的类别,g表示格网序号,表示图斑叠相交面积内第i地类的汇总面积,表示第g个格网面积,表示第g个格网落在图斑叠相交面积内的面积,表示第g个格网中第i地类面积。其中,所述第g个格网中第i地类面积,例如,根据计算,第g个格网地类0100的面积为1582.33平方米,第g个格网地类0200的面积为335.89平方米,同理计算各个地类面积以及其他各个属性面积。
S104、基于所述图斑相交面积计算人口分布格网尺度。
本实施例中,对夜光遥感数据和地表覆盖数据进行预处理,将生成的夜光遥感图斑与各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积,利用图斑叠相交面积生成人口分布格网尺度,实现了在不使用人口数据的前提下确定研究区域内的人口格网尺度;然后利用地理国情数据及人口数据创建不同尺度下的人口格网,并以反距离权重法将人口数分配至研究区格网中,最后建立了空间相关性、位置一致性、数值信息差异性和空间差异性四方面的指标评价体系,对不同尺度格网进行四个方面的分析并得出最适宜人口格网尺度,验证人口格网尺度确定方法的可行性,建立了不依赖景观指数的人口格网尺度评价体系,提高了人口格网尺度的准确度。
需要说明的是,地理国情数据是由地理国情监测云平台或国家发布的地理数据中获取;狭义上,地理国情数据是指与地理空间紧密相连的自然环境、自然资源基本情况和特点的总和;广义上,地理国情数据是指通过地理空间属性将包括自然环境与自然资源、科技教育状况、经济发展状况、政治状况、社会状况、文化传统、国际环境和国际关系等在内的各类国情进行关联与分析,从而得出能够深入揭示经济社会发展的时空演变和内在关系的综合国情。
在一个实施例中,参照图3所示,上述步骤S104中所述基于所述图斑相交面积计算人口分布格网尺度,包括:
S1041、将所述图斑相交面积按照格网尺度(或图斑叠相交面积的数值)进行排序,并计算所述图斑相交面积之间的相对变化率。
具体的,所述相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的图斑相交面积对于前一个格网尺度的相对变化率,表示格网尺度k对应的图斑相交面积,表示相对于格网尺度k的前一个网格尺度k-1对应的图斑相交面积。
S1042、基于所述相对变化率计算几何平均值。
具体的,所述几何平均值G的计算公式如下所示:
S1043、计算所述相对变化率与所述几何平均值的差值。
S1044、将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
具体的,当差值符合预设阈值时,则将图斑相交面积对应的格网尺度作为平稳变化的间隔,将该平稳变化的间隔作为人口分布格网尺度;当差值不符合预设阈值时,则将图斑相交面积对应的格网尺度作为左右拐点进行存储。
在一个实施例中,还包括:
S105、利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
在一个实施例中,参照图4所示,上述步骤S105中所述利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度,包括:
S1051、获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值。
具体的,所述住宅数据包括住宅单元的面积与长度,进而以最大面积与长度的住宅单元与最小面积与长度的住宅单元为界限,按10m或5m步长从10m格网开始建立不同尺度格网(如10m、15m、...、190m、200m)。
S1052、利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔。
具体的,所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用位置一致性对人口数值进行分析的具体步骤为:提取地理国情数据中住宅建筑图斑的形心点,利用ArcGIS将不同尺度的人口格网数据按所属建筑编码进行类别的要素转面操作,进而按照聚类分类提取各个面的形心点,并计算同一个类别下地理国情数据住宅建筑图斑和人口格网数据图斑的形心距离d,其计算公式为:
进而计算其形心距离相对变化率的计算公式如下:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的形心距离对于前一个格网尺度的相对变化率,表示格网尺度k对应的形心距离,表示相对于格网尺度k的前一个网格尺度k-1对应的形心距离。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用数值信息差异性对人口数值进行分析的具体步骤为:将人口格网数据中的人口数值除以格网面积计算人口密度值,然后提取该值计算其变异系数F,其计算公式如下:
其中,a表示人口密度值,b表示人口格网数据中的人口数值。
进而,基于变异系数计算相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的变异系数对于前一个格网尺度的相对变化率,表示格网尺度k对应的变异系数,表示相对于格网尺度k的前一个网格尺度k-1对应的变异系数。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用空间差异性对人口数值进行分析的具体步骤为:
由于人口空间数据的分布存在一定的聚落式分布,所以按照每个格网所属住宅建筑编号为类别号,提取不同尺度人口格网数据中的人口数据和类别号,进而计算每个格网尺度下的地理探测器q值,其计算公式如下所示:
上式中,h=1,2,3,...L,H表示类别号,表示类别号为h对应的人口数据,N表示全部格网对应的人口数据,表示类别号为h对应的离散方差,表示全部格网对应的离散方差。q取值为,q值越大说明该格网尺度下的人口数据对空间差异性的解释更强,反之更弱。
进而,基于地理探测器q值计算相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的地理探测器q值对于前一个格网尺度的相对变化率,表示格网尺度k对应的地理探测器q值,表示相对于格网尺度k的前一个网格尺度k-1对应的地理探测器q值。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
S1053、将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
具体的,计算上述4个预设指标对应的适宜尺度间隔的重叠尺度,生成最适宜人口格网尺度范围,将最适宜人口格网尺度范围与人口分布格网尺度取交集,确定人口适宜格网尺度。
下面通过一个完整的实施例来说明一种人口分布格网大小确定方法的。
实施例1:
将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积,参照图5所示,基于图斑相交面积(即重叠面积)与格网尺度生成幂函数曲线,由幂函数曲线可知随着格网尺度增大,图斑相交面积也在增大并趋于稳定,记录平稳变化区间80m-105m为人口分布格网尺度。
计算第一个预设指标空间自相关性所得出的值,并基于值与其相对变化率生成幂函数曲线,参照图6所示,由幂函数曲线可以看出随着格网尺度增大,值出现减小的趋势,说明该研究区域格网尺度的增大会降低人口格网数据的空间自相关性,而人口数据作为一种具有较高自相关性的数据,空间自相关性降低说明该数据的无法较好的表现出该地区人口在空间分布上的聚集性;进而通过分析相对变化率可以看出随着格网尺度增大,相对变化越来越不稳定,在40m至60m以及100m至120m为最稳定区域,140m之后便出现了极大的不稳定变化。因此,通过空间自相关性值可以看出人口空间数据适宜尺度间隔为40m-60m和100m-120m区间。
计算第二个指标空间一致性,提取地理国情数据中住宅建筑图斑的形心点,利用ArcGIS将不同尺度的人口格网数据按所属建筑编码进行类别的要素转面操作,进而按照聚类分类提取各个面的形心点,并计算同一个类别下地理国情数据住宅建筑图斑和人口格网数据图斑的形心距离,参照图7所示,由形心距离值的幂函数曲线可知,随着格网尺度的增大,同一类别下人口图斑与住宅建筑图斑的空间一致性越来越差,在50m至90m区间以及110m至150m区间为平稳变化区间,在形心距离指标下人口空间数据适宜尺度间隔为50m-100m和130m-150m区间。
计算第三个指标数值信息表达性,将人口格网数据中的人口数除以格网面积计算人口密度值,然后提取该值计算其变异系数;参照图8所示,由变异系数的幂函数曲线可知,随着格网尺度的增大,人口格网数据在数值上的信息表达性差异越来越小,说明人口格网数据尺度越大,数值之间的差异性越小,60m至100m为平稳变化区间,在50m尺度以下变异系数变化最大,说明该区间数值信息差异明显,但也证明其有存在数据冗余的可能性,而在130m尺度以上变异系数变化出现一定波动性,且变异系数持续降低,数值间的差异性持续性降低,在变异系数指标下人口空间数据适宜尺度间隔为60m-100m区间。
计算第四个指标空间差异性,由于人口空间数据的分布存在一定的聚落式分布,所以按照每个格网所属住宅建筑编号为类别号,提取不同尺度人口格网数据中的人口数据和类别号,然后将其导入至R语言处理环境当中计算每个尺度下的地理探测器q值,参照图9所示,由地理探测器q值的幂函数曲线可知,随格网尺度的变化,q值缓慢增大且无限趋近于0.95,且从图9中可知总体q值都保持着一个高值分布,说明不同尺度下的人口格网数据都具有不错的地理空间差异性,70m至130m为平稳变化区间,在140m之后其相对变化率趋近于0,进而在地理探测器q值指标下人口空间数据适宜尺度间隔为70m-130m区间。
根据上述四个指标之下所确定的人口空间数据适宜尺度间隔(m)分别为:(40,60)∪(100,120),(50,100)∪(130,150),(60,100)和(70,130),
根据四个指标之下所确定的人口空间数据适宜尺度间隔中的重叠尺度得出最适宜人口格网尺度范围为80m-100m,而利用格网尺度确定方法所确定的人口分布格网尺度范围为80m-105m,这证明了人口格网尺度确定方法的可行性,精度保证在95%左右。
基于同一发明构思,本发明实施例还提供了一种人口分布格网大小确定系统,由于该系统所解决问题的原理与前述一种人口分布格网大小确定方法相似,因此该系统的实施可以参见前述方法的实施,重复之处不再赘述。
本发明实施例提供的一种人口分布格网大小确定系统,参照图10所示,包括:
第一预处理模块101,用于获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑。
具体的,利用地理国情数据中的行政区划图斑对夜光遥感数据进行裁剪,进而利用自然间断点分级法对夜光遥感数据进行重分类为6类,包括:耕地、森林、草地、水体、人造地表和裸地。
进一步地,所述自然间断点分级法对夜光遥感数据进行重分类的步骤为:将N个夜光遥感数据分为k类,分类结果相应划分为k个子集、、...、,分别计算每个子集的总偏差平方和,,...,,总偏差平方和计算过程为:均值的计算公式如下所示:
则其总偏差平方和(SDAM)的计算公式为:
进一步地,根据分类的间隔值提取发亮区域并将其转换为夜光遥感图斑,并单独存储。
第二预处理模块102,用于获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑。
具体的,利用地理国情数据中的行政区划图斑对地表覆盖数据进行裁剪,将地表覆盖数据栅格化至目标格网大小的栅格数据,获得地表覆盖栅格化数据,对地表覆盖栅格化数据按确定步长(例如,5m)进行重采样(所述重采样是指从高分辨率遥感影像中提取出低分辨率影像的过程),使得地表覆盖栅格化数据与夜光遥感数据分辨率相同,进而利用ArcGIS技术,根据栅格属性值对各级房屋建筑区栅格数据进行提取并矢量化,生成各级房屋建筑区图斑。
相交叠加模块103,用于将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积。
具体的,将夜光遥感矢量图斑与各级房屋建筑区矢量图斑一一进行相交叠加分析,并计算不同尺度下的相交面积。
进一步地,根据图斑叠相交面积选择对应的格网层级;根据图斑叠相交面积的外接矩形过滤对应的格网层级中不相关的格网单元;若各个格网单元与图斑叠相交面积相交,则计算该相交面积并将其纳入有效面积,若所述各个格网单元包含在图斑叠相交面积内,则将该格网单元面积纳入有效面积,若所述各个格网单元在图斑叠相交面积外部,则忽略该格网单元面积;根据汇总的有效面积与汇总的各个格网单元面积之比,计算图斑叠相交面积内所述各个格网单元的各个属性面积,并进行累加,其计算公式如下:
上式中,N表示与图斑叠相交面积的外接矩形拓扑相交的格网总数量,i表示地类的类别,g表示格网序号,表示图斑叠相交面积内第i地类的汇总面积,表示第g个格网面积,表示第g个格网落在图斑叠相交面积内的面积,表示第g个格网中第i地类面积。其中,所述第g个格网中第i地类面积,例如,根据计算,第g个格网地类0100的面积为1582.33平方米,第g个格网地类0200的面积为335.89平方米,同理计算各个地类面积以及其他各个属性面积。
计算模块104,用于基于所述图斑相交面积计算人口分布格网尺度。
在一个实施例中,所述计算模块104,包括:
排序单元1041,用于将所述图斑相交面积按照格网尺度进行排序,并计算所述图斑相交面积之间的相对变化率。
具体的,所述相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的图斑相交面积对于前一个格网尺度的相对变化率,表示格网尺度k对应的图斑相交面积,表示相对于格网尺度k的前一个网格尺度k-1对应的图斑相交面积。
第一计算单元1042,用于基于所述相对变化率计算几何平均值。
具体的,所述几何平均值G的计算公式如下所示:
第二计算单元1043,用于计算所述相对变化率与所述几何平均值的差值。
比较单元1044,用于将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
具体的,当差值符合预设阈值时,则将图斑相交面积对应的格网尺度作为平稳变化的间隔,将该平稳变化的间隔作为人口分布格网尺度;当差值不符合预设阈值时,则将图斑相交面积对应的格网尺度作为左右拐点进行存储。
在一个实施例中,还包括:
验证分析模块105,用于利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
在一个实施例中,所述验证分析模块105,包括:
赋予单元1051,用于获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值。
具体的,所述住宅数据包括住宅单元的面积与长度,进而以最大面积与长度的住宅单元与最小面积与长度的住宅单元为界限,按10m或5m步长从10m格网开始建立不同尺度格网(如10m、15m、...、190m、200m)。
分析单元1052,用于利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔。
具体的,所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用位置一致性对人口数值进行分析的具体步骤为:提取地理国情数据中住宅建筑图斑的形心点,利用ArcGIS将不同尺度的人口格网数据按所属建筑编码进行类别的要素转面操作,进而按照聚类分类提取各个面的形心点,并计算同一个类别下地理国情数据住宅建筑图斑和人口格网数据图斑的形心距离d,其计算公式为:
进而计算其形心距离相对变化率的计算公式如下:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的形心距离对于前一个格网尺度的相对变化率,表示格网尺度k对应的形心距离,表示相对于格网尺度k的前一个网格尺度k-1对应的形心距离。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用数值信息差异性对人口数值进行分析的具体步骤为:将人口格网数据中的人口数值除以格网面积计算人口密度值,然后提取该值计算其变异系数F,其计算公式如下:
其中,a表示人口密度值,b表示人口格网数据中的人口数值。
进而,基于变异系数计算相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的变异系数对于前一个格网尺度的相对变化率,表示格网尺度k对应的变异系数,表示相对于格网尺度k的前一个网格尺度k-1对应的变异系数。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
进一步地,利用空间差异性对人口数值进行分析的具体步骤为:
由于人口空间数据的分布存在一定的聚落式分布,所以按照每个格网所属住宅建筑编号为类别号,提取不同尺度人口格网数据中的人口数据和类别号,进而计算每个格网尺度下的地理探测器q值,其计算公式如下所示:
上式中,h=1,2,3,...L,H表示类别号,表示类别号为h对应的人口数据,N表示全部格网对应的人口数据,表示类别号为h对应的离散方差,表示全部格网对应的离散方差。q取值为,q值越大说明该格网尺度下的人口数据对空间差异性的解释更强,反之更弱。
进而,基于地理探测器q值计算相对变化率的计算公式如下所示:
上式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的地理探测器q值对于前一个格网尺度的相对变化率,表示格网尺度k对应的地理探测器q值,表示相对于格网尺度k的前一个网格尺度k-1对应的地理探测器q值。
进而,基于所述相对变化率计算几何平均值的计算公式如下所示:
生成单元1053,用于将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种人口分布格网大小确定方法,其特征在于,包括:
获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑;
获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑,具体为:利用地理国情数据中的行政区划图斑对地表覆盖数据进行裁剪,将地表覆盖数据栅格化至目标格网大小的栅格数据,获得地表覆盖栅格化数据,对地表覆盖栅格化数据按确定步长,进行重采样,所述重采样是指从高分辨率遥感影像中提取出低分辨率影像的过程,使得地表覆盖栅格化数据与夜光遥感数据分辨率相同,进而利用ArcGIS技术,根据栅格属性值对各级房屋建筑区栅格数据进行提取并矢量化,生成各级房屋建筑区图斑;
将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积;根据图斑叠相交面积选择对应的格网层级;根据图斑叠相交面积的外接矩形过滤对应的格网层级中不相关的格网单元;若各个格网单元与图斑叠相交面积相交,则计算该相交面积并将其纳入有效面积,若所述各个格网单元包含在图斑叠相交面积内,则将该格网单元面积纳入有效面积,若所述各个格网单元在图斑叠相交面积外部,则忽略该格网单元面积;根据汇总的有效面积与汇总的各个格网单元面积之比,计算图斑叠相交面积内所述各个格网单元的各个属性面积,并进行累加,其计算公式如下:
式中,N表示与图斑叠相交面积的外接矩形拓扑相交的格网总数量,i表示地类的类别,g表示格网序号,表示图斑叠相交面积内第i地类的汇总面积,表示第g个格网面积,表示第g个格网落在图斑叠相交面积内的面积,表示第g个格网中第i地类面积;
基于所述图斑相交面积计算人口分布格网尺度,包括:
式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的图斑相交面积对于前一个格网尺度的相对变化率, 表示格网尺度k对应的图斑相交面积, 表示相对于格网尺度k的前一个网格尺度k-1对应的图斑相交面积;
基于所述相对变化率计算几何平均值G:
将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
2.如权利要求1所述的方法,其特征在于,还包括:
利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
3.如权利要求2所述的方法,其特征在于,所述利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度,包括:
获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值;
利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔;
将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
4.如权利要求2或3所述的方法,其特征在于,所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
5.一种人口分布格网大小确定系统,其特征在于,包括:
第一预处理模块,用于获取夜光遥感数据,对所述夜光遥感数据进行第一预处理,生成夜光遥感图斑;
第二预处理模块,用于获取地表覆盖数据,对所述地表覆盖数据进行第二预处理,生成各级房屋建筑区图斑;具体为:利用地理国情数据中的行政区划图斑对地表覆盖数据进行裁剪,将地表覆盖数据栅格化至目标格网大小的栅格数据,获得地表覆盖栅格化数据,对地表覆盖栅格化数据按确定步长,进行重采样,所述重采样是指从高分辨率遥感影像中提取出低分辨率影像的过程,使得地表覆盖栅格化数据与夜光遥感数据分辨率相同,进而利用ArcGIS技术,根据栅格属性值对各级房屋建筑区栅格数据进行提取并矢量化,生成各级房屋建筑区图斑;
相交叠加模块,用于将所述夜光遥感图斑与所述各级房屋建筑区图斑进行相交叠加,生成图斑叠相交面积;根据图斑叠相交面积选择对应的格网层级;根据图斑叠相交面积的外接矩形过滤对应的格网层级中不相关的格网单元;若各个格网单元与图斑叠相交面积相交,则计算该相交面积并将其纳入有效面积,若所述各个格网单元包含在图斑叠相交面积内,则将该格网单元面积纳入有效面积,若所述各个格网单元在图斑叠相交面积外部,则忽略该格网单元面积;根据汇总的有效面积与汇总的各个格网单元面积之比,计算图斑叠相交面积内所述各个格网单元的各个属性面积,并进行累加,其计算公式如下:
式中,N表示与图斑叠相交面积的外接矩形拓扑相交的格网总数量,i表示地类的类别,g表示格网序号,表示图斑叠相交面积内第i地类的汇总面积,表示第g个格网面积,表示第g个格网落在图斑叠相交面积内的面积,表示第g个格网中第i地类面积;
计算模块,用于基于所述图斑相交面积计算人口分布格网尺度;
所述计算模块,包括:
排序单元,用于将所述图斑相交面积按照格网尺度进行排序,并计算所述图斑相交面积之间的相对变化率,
式中,表示不同格网尺度k(k=30,50,70,...,190m)下对应的图斑相交面积对于前一个格网尺度的相对变化率, 表示格网尺度k对应的图斑相交面积, 表示相对于格网尺度k的前一个网格尺度k-1对应的图斑相交面积;
第一计算单元,用于基于所述相对变化率计算几何平均值G:
比较单元,用于将所述差值与预设阈值进行比较,基于比较结果确定所述人口分布格网尺度。
6.如权利要求5所述的系统,其特征在于,还包括:
验证分析模块,用于利用预设指标对所述人口格网尺度进行验证分析,确定人口适宜格网尺度。
7.如权利要求6所述的系统,其特征在于,所述验证分析模块,包括:
赋予单元,用于获取住宅数据,基于所述住宅数据构建人口格网,并利用预设算法为所述人口格网赋予人口数值;
分析单元,用于利用所述预设指标对不同人口格网对应的所述人口数值进行分析,生成适宜尺度间隔;
生成单元,用于将所述人口分布格网尺度与所述适宜尺度间隔的交集作为人口适宜格网尺度。
8.如权利要求6或7所述的系统,其特征在于,所述预设指标,包括:空间相关性、位置一致性、数值信息差异性和空间差异性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099086.2A CN114138926B (zh) | 2022-01-27 | 2022-01-27 | 一种人口分布格网大小确定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099086.2A CN114138926B (zh) | 2022-01-27 | 2022-01-27 | 一种人口分布格网大小确定方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114138926A CN114138926A (zh) | 2022-03-04 |
CN114138926B true CN114138926B (zh) | 2022-05-10 |
Family
ID=80382080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210099086.2A Active CN114138926B (zh) | 2022-01-27 | 2022-01-27 | 一种人口分布格网大小确定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114138926B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114331790B (zh) * | 2022-03-09 | 2022-07-12 | 中国测绘科学研究院 | 一种人口数据边缘不完整格网处理方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408463B (zh) * | 2014-10-15 | 2020-05-12 | 中国土地勘测规划院 | 一种高分辨率建设用地图斑识别方法 |
CN108256015A (zh) * | 2018-01-08 | 2018-07-06 | 中国科学院遥感与数字地球研究所 | 一种基于夜间灯光数据的中国人口空间格网化方法 |
US10909388B2 (en) * | 2019-05-03 | 2021-02-02 | Royal Caribbean Cruises Ltd. | Population density determination from multi-camera sourced imagery |
CN110458048A (zh) * | 2019-07-23 | 2019-11-15 | 南京林业大学 | 顾及城镇格局特征的人口分布时空演变与认知 |
CN110704565B (zh) * | 2019-09-27 | 2022-12-20 | 泉州师范学院 | 一种基于遥感与gis的人口统计数据网格化建模方法 |
CN112765296B (zh) * | 2021-01-14 | 2022-05-27 | 武汉光庭信息技术股份有限公司 | 一种网格化图斑核查方法及系统 |
KR102297195B1 (ko) * | 2021-03-17 | 2021-09-01 | 국립생태원 | 개체군 분산 모사 모델 기반 개체군 분산 예측 장치 및 이를 이용한 개체군 분산 예측 방법 |
-
2022
- 2022-01-27 CN CN202210099086.2A patent/CN114138926B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114138926A (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Modelling urban expansion guided by land ecological suitability: A case study of Changzhou City, China | |
Jiao et al. | Multi-order landscape expansion index: Characterizing urban expansion dynamics | |
Sun et al. | Estimating the spatial distribution of solar photovoltaic power generation potential on different types of rural rooftops using a deep learning network applied to satellite images | |
Mesev | The use of census data in urban image classification | |
Ehrlich et al. | Extracting building stock information from optical satellite imagery for mapping earthquake exposure and its vulnerability | |
Li et al. | Exploring spatial-temporal change and gravity center movement of construction land in the Chang-Zhu-Tan urban agglomeration | |
Dutta et al. | Exploring the dynamics of urban sprawl using geo-spatial indices: a study of English Bazar Urban Agglomeration, West Bengal | |
CN111898315A (zh) | 基于分形—机器学习混合模型的滑坡易发性评估方法 | |
CN115759883B (zh) | 基于网络群组特征的生态管理分区方法 | |
Zhang et al. | Identification and extraction of a current urban ecological network in Minhang District of Shanghai based on an optimization method | |
CN102289581A (zh) | 一种基于空间作用划分的模拟城市扩展的方法 | |
Zhang et al. | Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis | |
CN111985389A (zh) | 一种基于流域属性距离的流域相似判别方法 | |
CN114138926B (zh) | 一种人口分布格网大小确定方法及系统 | |
CN118094196B (zh) | 基于数据分析的土地利用规划方法及规划系统 | |
Fan | Simulation of land-cover change in Jing-Jin-Ji region under different scenarios of SSP-RCP | |
CN116911055B (zh) | 一种基于数字孪生的智慧城市规划治理系统 | |
Zhou et al. | Automatic responsive-generation of 3D urban morphology coupled with local climate zones using generative adversarial network | |
Crols et al. | Downdating high-resolution population density maps using sealed surface cover time series | |
CN117151499A (zh) | 一种国土空间规划的监测评估方法及系统 | |
Şimşek et al. | Spatial analysis of two different urban landscapes using satellite images and landscape metrics | |
Li et al. | Comparing the three-dimensional morphologies of urban buildings along the urban-rural gradients of 91 cities in China | |
CN116167661A (zh) | 一种基于空间错位的土地利用变化模拟可信度评估方法 | |
CN115829351A (zh) | 融合地理空间和互联网数据的精细尺度人口空间化方法 | |
Liu et al. | Second-order texton feature extraction and pattern recognition of building polygon cluster using CNN network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |