CN112395383A - 基于多源信息融合的人口数据空间化方法、装置和设备 - Google Patents

基于多源信息融合的人口数据空间化方法、装置和设备 Download PDF

Info

Publication number
CN112395383A
CN112395383A CN202011371075.2A CN202011371075A CN112395383A CN 112395383 A CN112395383 A CN 112395383A CN 202011371075 A CN202011371075 A CN 202011371075A CN 112395383 A CN112395383 A CN 112395383A
Authority
CN
China
Prior art keywords
data
population
spatial distribution
administrative area
administrative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011371075.2A
Other languages
English (en)
Other versions
CN112395383B (zh
Inventor
石东平
谢承煜
熊立春
王新丰
何利文
张孝强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangtan University
Original Assignee
Xiangtan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangtan University filed Critical Xiangtan University
Priority to CN202011371075.2A priority Critical patent/CN112395383B/zh
Publication of CN112395383A publication Critical patent/CN112395383A/zh
Application granted granted Critical
Publication of CN112395383B publication Critical patent/CN112395383B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Remote Sensing (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及POI大数据处理技术领域,具体涉及一种基于多源信息融合的人口数据空间化方法、装置和设备,获取研究区域的夜间灯光数据、城市POI数据和人口数据,按照预设规则在研究区域内划分空间分布格网,建立以子人口数据为因变量,子夜间灯光数据为自变量的多元线性回归模型,根据多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值,将行政区域的子人口数据作为约束条件对行政区域内的空间分布格网的初始预估值进行修正,确定人口预测值。本发明将夜间灯光数据同POI数据相结合,依据人口统计数据,构建回归分析模型,开展人口空间化建模,实现人口空间分布模拟及预测,数据不存在滞后性,且模型精确度较高。

Description

基于多源信息融合的人口数据空间化方法、装置和设备
技术领域
本发明涉及POI大数据处理技术领域,具体涉及一种基于多源信息融合的人口数据空间化方法、装置和设备。
背景技术
目前“空间数据社会化”是研究的热点,人口数据空间化研究作为其重要领域,可有效对人口数据进行离散化处理,挖掘隐藏空间信息。人口数据空间化的研究核心是人口统计数据离散化处理。早期人口数据空间分析研究为传统静态格网化,目前研究方向正逐渐向动态空间化演变。静态格网化方法应用空间差值法或人口分布模型法等将人口统计数据投影到单元尺寸格网中,仅单一考虑人口分布影响。伴随着遥感技术的发展,动态空间化研究将夜间灯光、土地利用、道路路网等同人口分布相结合,实现在一定空间尺度的栅格单元分配人口数据。
但是,利用夜间灯光数据可有效进行人口空间化分析,其研究方向多是同土地利用数据相结合,依据人口统计数据构建人口空间分布模型,但因土地利用数据的滞后性,其模型精确度较低,导致人口空间化分析的可靠性较低。
发明内容
有鉴于此,本发明的目的在于提供一种基于多源信息融合的人口数据空间化方法、装置和设备,以克服目前人口空间化分析的可靠性较低的问题。
为实现以上目的,本发明采用如下技术方案:
一种基于多源信息融合的人口数据空间化方法,包括:
获取研究区域的夜间灯光数据、城市POI数据和人口数据;
按照预设规则在所述研究区域内划分空间分布格网,确定所述空间分布格网、所述研究区域内的行政区域、所述城市POI数据和所述夜间灯光数据的对应关系;
根据每个所述行政区域中的子人口数据、每个所述行政区域中每类城市POI数据对应的子夜间灯光数据,建立以所述子人口数据为因变量,所述子夜间灯光数据为自变量的多元线性回归模型;
根据所述多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;
将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值,包括:
确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值;
确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述获取研究区域的夜间灯光数据,包括:
获取夜间灯光遥感数据;
将所述夜间灯光遥感数据的投影坐标系转换为UTM投影坐标系并进行辐值矫正,得到标准夜间灯光数据;
在所述标准夜间灯光数据中截取所述研究区域的夜间灯光数据。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述城市POI数据的获取过程包括:
调用预设地图网站的接口以获取初始城市POI数据;
对所述初始城市POI数据进行数据筛选、UTM投影坐标系转换以及重复的POI数据清理,得到标准城市POI数据;
在所述标准城市POI数据中截取所述研究区域的城市POI数据。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述子夜间灯光数据包括灯光总亮度、灯光亮元数和灯光暗元数;
所述多元线性回归模型为:
Figure BDA0002806685300000031
其中,Pi为第i个行政区域内的子人口数据;LEij为第i行政区域内,第j个类型的城市POI数据对应的灯光总亮度;NUij为第i个行政区域内,第j个类型的城市POI数据对应的灯光亮元数;NLij为第i个行政区域内,第j个类型的城市POI数据对应的暗元数;CO为调整系数;aj,bj,cj为回归系数。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述根据所述多元线性回归模型,确定所述研究区域中每个预先划分的空间分布格网中人口分布的初始预估值,包括:
通过如下公式确定所述初始预估值:
Figure BDA0002806685300000032
其中,gridPigm为第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的初始预估值;LEigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光总亮度;NUigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的的亮元数;NLigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光暗元数;Ki为第i个行政区域的空间分布格网个数。
进一步地,以上所述基于多源信息融合的人口数据空间化方法,所述确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值,确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值,包括:
通过如下公式确定所述人口预测值:
Figure BDA0002806685300000041
式中,gridPigm′第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的人口预测值;gridPijk第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网最终人口预估值;Pi为第i个行政区域的子人口数据;Ki为第i个行政区域的空间分布格网个数。
本发明还提供了一种基于多源信息融合的人口数据空间化装置,包括获取模块、确定模块、模型建立模块和修正模块;
所述获取模块,用于获取研究区域的夜间灯光数据、城市POI数据和人口数据;
所述确定模块,用于按照预设规则在所述研究区域内划分空间分布格网,确定所述空间分布格网、所述研究区域内的行政区域、所述城市POI数据和所述夜间灯光数据的对应关系;
所述模型建立模块,用于根据每个所述行政区域中的子人口数据、每个所述行政区域中每类城市POI数据对应的子夜间灯光数据,建立以所述子人口数据为因变量,所述子夜间灯光数据为自变量的多元线性回归模型;
所述确定模块,还用于根据所述多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;
所述修正模块,用于将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值。
进一步地,以上所述基于多源信息融合的人口数据空间化装置,所述修正模块,具体用于确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值,确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值。
本发明还提供了一种基于多源信息融合的人口数据空间化设备,包括处理器和存储器,所述处理器与所述存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行以上任一项所述的基于多源信息融合的人口数据空间化方法。
本发明的基于多源信息融合的人口数据空间化方法、装置和设备,获取研究区域的夜间灯光数据、城市POI数据和人口数据;按照预设规则在研究区域内划分空间分布格网,确定空间分布格网、研究区域内的行政区域、城市POI数据和夜间灯光数据的对应关系;根据每个行政区域中的子人口数据、每个行政区域中每类城市POI数据对应的子夜间灯光数据,建立以子人口数据为因变量,子夜间灯光数据为自变量的多元线性回归模型;根据多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;将行政区域的子人口数据作为约束条件对行政区域内的空间分布格网的初始预估值进行修正,确定每个空间分布格网人的人口预测值。本发明提供的技术方案,将夜间灯光数据同POI数据相结合,依据人口统计数据,构建回归分析模型,开展人口空间化建模,实现人口空间分布模拟及预测,数据不存在滞后性,且模型精确度较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于多源信息融合的人口数据空间化方法一种实施例提供的流程图;
图2是本发明基于多源信息融合的人口数据空间化装置一种实施例提供的结构示意图;
图3是本发明基于多源信息融合的人口数据空间化设备一种实施例提供的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明基于多源信息融合的人口数据空间化方法一种实施例提供的流程图。请参阅图1,本实施例可以包括以下步骤:
S1O1、获取研究区域的夜间灯光数据、城市POI数据和人口数据。
在一种具体地实施方式中,以城市A作为研究区域,对人口数据空间化进行研究。
本实施例中,可以通过如下子步骤获取研究区域的夜间灯光数据:
子步骤一:获取夜间灯光遥感数据;
子步骤二:将夜间灯光遥感数据的投影坐标系转换为UTM投影坐标系并进行辐值矫正,得到标准夜间灯光数据;
子步骤三:在标准夜间灯光数据中截取研究区域的夜间灯光数据。
具体地,可以调用武汉大学“珞珈一号”LJ1-01科学实验卫星,以获取夜间灯光遥感数据,其空间参考系统为WGS84,地面空间分辨率为130m。将夜间灯光遥感数据的投影坐标系转换为UTM投影,对其进行辐射校正,得到标准夜间灯光数据。考虑到研究区域的范围,对标准夜间灯光数据以研究区域作为掩膜进行裁剪,得到夜间灯光数据。
本实施例中,可以通过如下子步骤获取研究区域的信息点(Point ofInformation,POI)数据:
子步骤一:调用预设地图网站的接口以获取初始城市POI数据;
子步骤二:对初始城市POI数据进行数据筛选、UTM投影坐标系转换以及重复的POI数据清理,得到标准城市POI数据;
子步骤三:在标准城市POI数据中截取研究区域的城市POI数据。
具体地,可以调用预设地图网站的接口爬取初始城市POI数据。在一种具体地实施方式中,可以调用高德地图、百度地图等地图网站的API接口获取初始城市POI数据。其中,初始城市POI数据涉及20个大类,分别为:汽车服务、汽车销售、汽车维修、摩托车服务、餐饮服务、购物服务、生活服务、体育休闲服务、医疗保健服务、住宿服务、风景名胜、商务住宅、政府机构及社会团体、科教文化服务、交通设施服务、金融保险服务、公司企业、道路附属设施、地名地址信息、公共设施。同时,每个大类别都还有二级以及三级的细小划分。
对初始城市POI数据进行筛选,筛选其中小区、住宅、商场、医院、学校等人口活动相关的类别,然后进行UTM投影坐标转换及数据清理。其中,数据清理指的是删除爬取的重复数据与乱码数据。一般地,爬取工作完成后,能够得到一系列带有坐标的POI数据,但是在爬取POI时为了避免遗漏,半径的设置及关键词的设置等可能会偏大,就会出现重复的POI点,而且爬取过程中有可能会出现乱码,本实施例将重复数据与乱码数据删除,得到标准城市POI数据。考虑到研究区域的范围,对标准城市POI数据以研究区域作为掩膜进行裁剪,得到城市POI数据。
本实施例中,可以通过如下子步骤获取研究区域的人口数据:
可以获取统计局发布的统计年鉴,将行政区划作为为底图,将人口数量投影到行政区划,形成人口数据。
S1O2、按照预设规则在研究区域内划分空间分布格网,确定空间分布格网、研究区域内的行政区域、城市POI数据和夜间灯光数据的对应关系。
本实施例中,首先建立研究区域范围内的格网矢量数据,即在研究区域内划分空间分布格网。其中,空间分布格网的边长可以按照预设规则确定。在一种具体地实施方式中,建立研究区域范围内200m的格网矢量数据。
可以确定空间分布格网、研究区域内的行政区域、城市POI数据和夜间灯光数据的对应关系。在一种具体地实施方式中,若以街道作为行政区域,那么可以确定每个街道对应的空间分布格网、每个街道内的城市POI数据类型、城市POI数据的分布、每类城市POI数据对应的夜间灯光数据等。
S1O3、根据每个行政区域中的子人口数据、每个行政区域中每类城市POI数据对应的子夜间灯光数据,建立以子人口数据为因变量,子夜间灯光数据为自变量的多元线性回归模型。
本实施例中,可以应用夜间灯光数据和城市POI数据作为数据源,基于人口数据,构建多元回归分析模型进行人口数据格网空间化。
本实施例中,子夜间灯光数据包括灯光总亮度、灯光亮元数和灯光暗元数。回归模型因变量为子人口数据,自变量为灯光总亮度、灯光亮元数和灯光暗元数。应用多元线性回归模型建立子夜间灯光数据、每个行政区域中每类城市POI数据对应的子夜间灯光数据同子人口数据之间的反演关系,其多元线性回归模型的具体表达为:
Figure BDA0002806685300000091
其中,Pi为第i个行政区域内的子人口数据;LEij为第i行政区域内,第j个类型的城市POI数据对应的灯光总亮度;NUij为第i个行政区域内,第j个类型的城市POI数据对应的灯光亮元数;NLij为第i个行政区域内,第j个类型的城市POI数据对应的暗元数;CO为调整系数;aj,bj,cj为回归系数。
S1O4、根据多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值。
利用上述步骤得到的多元线性回归模型,得到格网尺度内的人口计算公式,以确定每个空间分布格网的人口分布的初始预估值。公式如下:
Figure BDA0002806685300000092
其中,gridPigm为第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的初始预估值;LEigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光总亮度;NUigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的的亮元数;NLigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光暗元数;Ki为第i个行政区域的空间分布格网个数。
S1O5、将行政区域的子人口数据作为约束条件对行政区域内的空间分布格网的初始预估值进行修正,确定每个空间分布格网的人口预测值。
需保证研究区域内,所有格网累积后的人口总数同人口统计数据一致,因此将研究区域内的总人口数据作为约束条件对初始预估值进行修正,以确定每个空间分布格网的人口预测值。具体地,确定每个行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值;确定该行政区域内,每个初始预估值和城市POI数据类型与初始预估值对应的总初始预估值的比值,将比值与该行政区域内的子人口数据的乘积作为人口预测值。
修正公式为:
Figure BDA0002806685300000101
式中,gridPigm′第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的人口预测值;gridPijk第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网最终人口预估值;Pi为第i个行政区域的子人口数据;Ki为第i个行政区域的空间分布格网个数。
由于本实施例基于街道区域范围建立多元回归模型,验证模型精度时,若依靠格网数据实际人口开展验证,无法获取格网级别的实际人口数据。故选用街道区域下一级的行政社区范围来验证多元回归模型。将行政社区单元内的格网数据预测值及统计值进行对比。应用平均绝对误差、均方根误差(及平均相对误差三个指标开展精度分析。
Figure BDA0002806685300000102
Figure BDA0002806685300000103
Figure BDA0002806685300000104
其中,Pi′为第i个社区的回归预测人口,为第Ri个社区的实际统计人口,N为社区综述。MAE为回归预测值同实际统计值间的平均误差,可反应人口预测误差的实际情况。RMSE为回归预测值同实际统计值间的均方根误差,可反应人口预测同真实统计间的偏差程度。MRE为回归预测值同实际统计值间的平均相对误差,可反应回归预测值的可信程度。
基于一个总的发明构思,本发明还提供了一种基于多源信息融合的人口数据空间化装置,用于实现上述方法实施例。图2是本发明基于多源信息融合的人口数据空间化装置一种实施例提供的结构示意图。如图2所示,本实施例的装置包括:获取模块11、确定模块12、模型建立模块13和修正模块14;
获取模块11,用于获取研究区域的夜间灯光数据、城市POI数据和人口数据;
确定模块12,用于按照预设规则在研究区域内划分空间分布格网,确定空间分布格网、研究区域内的行政区域、城市POI数据和夜间灯光数据的对应关系;
模型建立模块13,用于根据每个行政区域中的子人口数据、每个行政区域中每类城市POI数据对应的子夜间灯光数据,建立以子人口数据为因变量,子夜间灯光数据为自变量的多元线性回归模型;
确定模块12,还用于根据多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;
修正模块14,用于将行政区域的子人口数据作为约束条件对行政区域内的空间分布格网的初始预估值进行修正,确定每个空间分布格网的人口预测值。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,修正模块14,具体用于确定每个行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值,确定该行政区域内,每个初始预估值和城市POI数据类型与初始预估值对应的总初始预估值的比值,将比值与该行政区域内的子人口数据的乘积作为人口预测值。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,获取模块11,具体用于获取夜间灯光遥感数据,将夜间灯光遥感数据的投影坐标系转换为UTM投影坐标系并进行辐值矫正,得到标准夜间灯光数据,在标准夜间灯光数据中截取研究区域的夜间灯光数据。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,获取模块11,具体还用于调用预设地图网站的接口以获取初始城市POI数据,对初始城市POI数据进行数据筛选、UTM投影坐标系转换以及重复的POI数据清理,得到标准城市POI数据,在标准城市POI数据中截取研究区域的城市POI数据。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,子夜间灯光数据包括灯光总亮度、灯光亮元数和灯光暗元数;
多元线性回归模型为:
Figure BDA0002806685300000121
其中,Pi为第i个行政区域内的子人口数据;LEij为第i行政区域内,第j个类型的城市POI数据对应的灯光总亮度;NUij为第i个行政区域内,第j个类型的城市POI数据对应的灯光亮元数;NLij为第i个行政区域内,第j个类型的城市POI数据对应的暗元数;CO为调整系数;aj,bj,cj为回归系数。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,确定模块12,具体用于通过如下公式确定初始预估值:
Figure BDA0002806685300000122
其中,gridPigm为第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的初始预估值;LEigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光总亮度;NUigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的的亮元数;NLigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光暗元数;Ki为第i个行政区域的空间分布格网个数。
进一步地,本实施例的基于多源信息融合的人口数据空间化装置,修正模块14,具体用于通过如下公式确定人口预测值:
Figure BDA0002806685300000123
式中,gridPigm′第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的人口预测值;gridPijk第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网最终人口预估值;Pi为第i个行政区域的子人口数据;Ki为第i个行政区域的空间分布格网个数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于一个总的发明构思,本发明还提供了一种基于多源信息融合的人口数据空间化设备,用于实现上述方法实施例。图3是本发明基于多源信息融合的人口数据空间化设备一种实施例提供的结构示意图。如图3所示,本实施例的基于多源信息融合的人口数据空间化设备包括处理器21和存储器22,处理器21与存储器22相连。其中,处理器21用于调用并执行存储器22中存储的程序;存储器22用于存储程序,程序至少用于执行以上实施例中的基于多源信息融合的人口数据空间化方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于多源信息融合的人口数据空间化方法,其特征在于,包括:
获取研究区域的夜间灯光数据、城市POI数据和人口数据;
按照预设规则在所述研究区域内划分空间分布格网,确定所述空间分布格网、所述研究区域内的行政区域、所述城市POI数据和所述夜间灯光数据的对应关系;
根据每个所述行政区域中的子人口数据、每个所述行政区域中每类城市POI数据对应的子夜间灯光数据,建立以所述子人口数据为因变量,所述子夜间灯光数据为自变量的多元线性回归模型;
根据所述多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;
将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值。
2.根据权利要求1所述基于多源信息融合的人口数据空间化方法,其特征在于,所述将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值,包括:
确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值;
确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值。
3.根据权利要求1所述基于多源信息融合的人口数据空间化方法,其特征在于,所述获取研究区域的夜间灯光数据,包括:
获取夜间灯光遥感数据;
将所述夜间灯光遥感数据的投影坐标系转换为UTM投影坐标系并进行辐值矫正,得到标准夜间灯光数据;
在所述标准夜间灯光数据中截取所述研究区域的夜间灯光数据。
4.根据权利要求1所述基于多源信息融合的人口数据空间化方法,其特征在于,所述城市POI数据的获取过程包括:
调用预设地图网站的接口以获取初始城市POI数据;
对所述初始城市POI数据进行数据筛选、UTM投影坐标系转换以及重复的POI数据清理,得到标准城市POI数据;
在所述标准城市POI数据中截取所述研究区域的城市POI数据。
5.根据权利要求2所述基于多源信息融合的人口数据空间化方法,其特征在于,所述子夜间灯光数据包括灯光总亮度、灯光亮元数和灯光暗元数;
所述多元线性回归模型为:
Figure FDA0002806685290000021
其中,Pi为第i个行政区域内的子人口数据;LEij为第i行政区域内,第j个类型的城市POI数据对应的灯光总亮度;NUij为第i个行政区域内,第j个类型的城市POI数据对应的灯光亮元数;NLij为第i个行政区域内,第j个类型的城市POI数据对应的暗元数;CO为调整系数;aj,bj,cj为回归系数。
6.根据权利要求5所述基于多源信息融合的人口数据空间化方法,其特征在于,所述根据所述多元线性回归模型,确定所述研究区域中每个预先划分的空间分布格网中人口分布的初始预估值,包括:
通过如下公式确定所述初始预估值:
Figure FDA0002806685290000022
其中,gridPigm为第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的初始预估值;LEigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光总亮度;NUigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的的亮元数;NLigm为第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网对应的灯光暗元数;Ki为第i个行政区域的空间分布格网个数。
7.根据权利要求6所述基于多源信息融合的人口数据空间化方法,其特征在于,所述确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值,确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值,包括:
通过如下公式确定所述人口预测值:
Figure FDA0002806685290000031
式中,gridPigm′第i个行政区域内第j个类型的城市POI数据中第m个空间分布格网上的人口预测值;gridPijk第i个行政区域内,第j个类型的城市POI数据中第m个空间分布格网最终人口预估值;Pi为第i个行政区域的子人口数据;Ki为第i个行政区域的空间分布格网个数。
8.一种基于多源信息融合的人口数据空间化装置,其特征在于,包括获取模块、确定模块、模型建立模块和修正模块;
所述获取模块,用于获取研究区域的夜间灯光数据、城市POI数据和人口数据;
所述确定模块,用于按照预设规则在所述研究区域内划分空间分布格网,确定所述空间分布格网、所述研究区域内的行政区域、所述城市POI数据和所述夜间灯光数据的对应关系;
所述模型建立模块,用于根据每个所述行政区域中的子人口数据、每个所述行政区域中每类城市POI数据对应的子夜间灯光数据,建立以所述子人口数据为因变量,所述子夜间灯光数据为自变量的多元线性回归模型;
所述确定模块,还用于根据所述多元线性回归模型,确定每个空间分布格网的人口分布的初始预估值;
所述修正模块,用于将所述行政区域的子人口数据作为约束条件对所述行政区域内的所述空间分布格网的初始预估值进行修正,确定每个所述空间分布格网的人口预测值。
9.根据权利要求8所述的基于多源信息融合的人口数据空间化装置,其特征在于,所述修正模块,具体用于确定每个所述行政区域内每类城市POI数据对应的所有初始预估值之和,作为该行政区域该类城市POI数据的总初始预估值,确定该行政区域内,每个所述初始预估值和城市POI数据类型与所述初始预估值对应的总初始预估值的比值,将所述比值与该行政区域内的子人口数据的乘积作为所述人口预测值。
10.一种基于多源信息融合的人口数据空间化设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行权利要求1-7任一项所述的基于多源信息融合的人口数据空间化方法。
CN202011371075.2A 2020-11-30 2020-11-30 基于多源信息融合的人口数据空间化方法、装置和设备 Active CN112395383B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011371075.2A CN112395383B (zh) 2020-11-30 2020-11-30 基于多源信息融合的人口数据空间化方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011371075.2A CN112395383B (zh) 2020-11-30 2020-11-30 基于多源信息融合的人口数据空间化方法、装置和设备

Publications (2)

Publication Number Publication Date
CN112395383A true CN112395383A (zh) 2021-02-23
CN112395383B CN112395383B (zh) 2024-03-22

Family

ID=74604791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011371075.2A Active CN112395383B (zh) 2020-11-30 2020-11-30 基于多源信息融合的人口数据空间化方法、装置和设备

Country Status (1)

Country Link
CN (1) CN112395383B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554356A (zh) * 2021-09-18 2021-10-26 中国地质大学(武汉) 基于多模型融合的人口分布估计方法、装置及存储介质
CN114385884A (zh) * 2022-01-06 2022-04-22 深圳大学 一种公交乘客居住地分布预测方法、终端设备及存储介质
CN114580975A (zh) * 2022-05-05 2022-06-03 成都数联云算科技有限公司 街区活力获得方法及系统及装置及介质
CN115238584A (zh) * 2022-07-29 2022-10-25 湖南大学 一种基于多源大数据的人口分布识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978249A (zh) * 2019-03-19 2019-07-05 广州大学 基于分区建模的人口数据空间化方法、系统及介质
WO2020063461A1 (zh) * 2018-09-30 2020-04-02 广州地理研究所 基于随机森林分类算法的城市范围提取方法、装置及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020063461A1 (zh) * 2018-09-30 2020-04-02 广州地理研究所 基于随机森林分类算法的城市范围提取方法、装置及电子设备
CN109978249A (zh) * 2019-03-19 2019-07-05 广州大学 基于分区建模的人口数据空间化方法、系统及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
成方龙;赵冠伟;杨木壮;刘月亮;李芳;: "集成地理探测器与随机森林模型的城市人口分布格网模拟", 测绘通报, no. 01 *
邹雅婧;闫庆武;黄杰;厉飞;: "基于LJ1-01夜间灯光影像的苏锡常地区人口空间化研究", 长江流域资源与环境, no. 05 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554356A (zh) * 2021-09-18 2021-10-26 中国地质大学(武汉) 基于多模型融合的人口分布估计方法、装置及存储介质
CN114385884A (zh) * 2022-01-06 2022-04-22 深圳大学 一种公交乘客居住地分布预测方法、终端设备及存储介质
CN114385884B (zh) * 2022-01-06 2024-03-26 深圳大学 一种公交乘客居住地分布预测方法、终端设备及存储介质
CN114580975A (zh) * 2022-05-05 2022-06-03 成都数联云算科技有限公司 街区活力获得方法及系统及装置及介质
CN115238584A (zh) * 2022-07-29 2022-10-25 湖南大学 一种基于多源大数据的人口分布识别方法

Also Published As

Publication number Publication date
CN112395383B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
CN112395383B (zh) 基于多源信息融合的人口数据空间化方法、装置和设备
Zhou et al. High-resolution global urban growth projection based on multiple applications of the SLEUTH urban growth model
Yao et al. Mapping fine-scale population distributions at the building level by integrating multisource geospatial big data
Yu et al. Integration of nighttime light remote sensing images and taxi GPS tracking data for population surface enhancement
Sinha et al. Assessing the spatial sensitivity of a random forest model: Application in gridded population modeling
US10372705B2 (en) Parallel querying of adjustable resolution geospatial database
CN108876792B (zh) 语义分割方法、装置和系统及存储介质
Ren et al. Developing a rapid method for 3-dimensional urban morphology extraction using open-source data
US11703352B2 (en) Vector tile pyramiding
Qiang et al. Visibility analysis of oceanic blue space using digital elevation models
Amarsaikhan et al. Applications of remote sensing and geographic information systems for urban land-cover change studies in Mongolia
Kostrikov et al. Geoinformation approach to the urban geographic system research (case studies of Kharkiv region)
Muttaqin et al. MaxEnt (Maximum Entropy) model for predicting prehistoric cave sites in Karst area of Gunung Sewu, Gunung Kidul, Yogyakarta
Prastacos et al. Using the Urban Atlas dataset for estimating spatial metrics. Methodology and application in urban areas of Greece
Mast et al. Mapping urban villages using fully convolutional neural networks
CN117079148B (zh) 城市功能区的识别方法、装置、设备和介质
Wate et al. Implementation of CityGML energy application domain extension (ADE) for integration of urban solar potential indicators using object-oriented modelling approach
Hu et al. Adaptive multi-scale population spatialization model constrained by multiple factors: A case study of Russia
CN112115844A (zh) 基于多源遥感影像和路网数据的城市人口数据分析方法
Eyelade et al. Impacts of spatiotemporal resolution and tiling on SLEUTH model calibration and forecasting for urban areas with unregulated growth patterns
Brenner et al. Continuous generalization for small mobile displays
Nice et al. The nature of human settlement: building an understanding of high performance city design
WO2021014541A1 (ja) 学習装置、推論装置、学習方法、推論方法、及び学習プログラム
KR102652863B1 (ko) Cnn 알고리즘을 이용한 지역 기후 구역 분류 시스템 및 방법
KR20200040457A (ko) 이미지 기반 교통 정보 예측 방법, 장치 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant