CN109948737A - 基于大数据和机器学习的贫困空间分类识别方法和装置 - Google Patents

基于大数据和机器学习的贫困空间分类识别方法和装置 Download PDF

Info

Publication number
CN109948737A
CN109948737A CN201910276600.3A CN201910276600A CN109948737A CN 109948737 A CN109948737 A CN 109948737A CN 201910276600 A CN201910276600 A CN 201910276600A CN 109948737 A CN109948737 A CN 109948737A
Authority
CN
China
Prior art keywords
minimum space
space unit
urban
city
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910276600.3A
Other languages
English (en)
Inventor
王坤
张丽君
秦耀辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN201910276600.3A priority Critical patent/CN109948737A/zh
Publication of CN109948737A publication Critical patent/CN109948737A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

本申请涉及一种基于大数据和机器学习的城市贫困空间分类识别方法和装置,通过多种类型遥感卫星获取目标城市遥感数据,对目标城市内部进行区域网格化划分;对遥感数据提取地表绿地和水体,建立土地绿色覆盖模型;通过获取目标城市的POI数据,判别各区域包含城市POI的类型和数量,建立城市活跃度模型;再获取目标城市内部区域范围的房租数据;根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型,根据城市贫困指数模型进行分类,确定识别城市贫困区域,具有识别准确、操作可行性强的优点。

Description

基于大数据和机器学习的贫困空间分类识别方法和装置
技术领域
本发明涉及地理信息技术和大数据分析领域,特别涉及一种基于大数据和机器学习的贫困空间分类识别方法和装置。
背景技术
随着我国城市化进程不断加快,农业人口转向非农业人口的比例不断增加,大量农业务工人口也不断涌向城市,由于我国户籍制度的管理方式,大量农业务工人口在城市的住房、医疗、教育等政策得不到保障,这部分农业务工人口的低收入者会聚集在城市核心区的边缘地带和基础设施薄弱、居住环境质量较差的居住小区和城中村中;此外,由于我国市场经济的不断完善,产业结构的调整,国企制度的改革,在城市衰落的老工业区中遗留下较多退休下岗的职业工人,这部分退休职业工人大多会聚集在老工业区周围;联合国开发计划署(UNDP)预测,到2035年,世界上大多数贫困人口将生活在城市地区。目前,数据收集方法和贫困措施没有跟上日益城市化的现实,早期的城市贫困识别研究主要采用人口经济普查和调查问卷等数据,这些普查数据时间周期较长,多以抽样调查为主,受数据的约束,不能全部覆盖城市范围内。近年来随着大数据的发展和应用,为城市贫困空间的精确识别提供了条件。
POI数据能体现社会经济发展的状况,也是城市活跃的重要体现,如何从中挖掘出城市社会经济发展状况和城市贫困之间的关联是采用POI数据研究城市贫困的关键。现有技术对城市贫困空间的识别方法是利用夜间灯光遥感数据,通过夜间灯光的亮度值来研究城市贫困,这种方式是从宏观上来识别城市贫困,数据量较少,效率高,但从微观上进行识别城市贫困的每个空间位置,单一的夜间灯光遥感数据是不能够识别的。
发明内容
本发明的主要目的是提供一种基于大数据和机器学习的城市贫困空间分类识别方法,能从微观上更准确的进行城市贫困空间识别方法。
本发明解决其技术问题所采用的技术方案是:
一种基于大数据和机器学习的城市贫困空间分类识别方法,包括:
步骤1:根据获取到的高精度遥感卫星影像,对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积;
步骤2:基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,计算出土地绿色覆盖率;
步骤3:获取城市的POI数据,并根据最小空间单元范围内的POI的类型和数量计算出城市活跃度模型;
步骤4:获得城市内部区域范围的房租数据,获得每个最小空间单元范围的平均单位房租价格;
步骤5:根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型;
步骤6:根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,土地绿色覆盖率为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,步骤3中,利用土地利用混合度的熵模型建立城市活跃度模型,城市活跃度模型为:
其中,Vj为最小空间单元区域范围j中的城市活跃度,Mij为最小空间单元区域范围j中i类POI所占的比例,Nj为最小空间单元区域范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,获得目标城市房租数据的包括租房价格、房屋面积、房屋位置和经纬度,通过房屋位置和经纬度确定房租数据对应的房屋属于哪个最小空间单元,当其中某些最小空间单元的房租数据缺失时,基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,并在预测过程中考虑夜间平均灯光亮度值、归一化差值植被指数和基础设施核密度。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,步骤5中的城市贫困指数模型为:
其中,P为区域单元范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为最小空间单元区域范围的平均单位房租价格。
本发明还提供一种基于大数据和机器学习的城市贫困空间分类识别装置,包括:
图像分块模块:用于根据获取到的高精度遥感卫星影像对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积;
土地绿色覆盖率计算模块:基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,计算出土地绿色覆盖率;
城市活跃度计算模块:获取城市的POI数据,并根据最小空间单元范围内的POI的类型和数量计算出城市活跃度模型;
房租数据获取模块:获得城市内部区域范围的房租数据,获得每个最小空间单元范围的平均单位房租价格;
城市贫困指数模型建立模块:根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型;
城市贫困区域划分模块:根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,土地绿色覆盖率计算模块中土地绿色覆盖率为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,城市活跃度计算模块中,利用土地利用混合度的熵模型建立城市活跃度模型,城市活跃度模型为:
其中,Vj为最小空间单元区域范围j中的城市活跃度,Mij为最小空间单元区域范围j中i类POI所占的比例,Nj为最小空间单元区域范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,获得目标城市房租数据的包括租房价格、房屋面积、房屋位置和经纬度,房租数据获取模块中通过房屋位置和经纬度确定房租数据对应的房屋属于哪个最小空间单元,当其中某些最小空间单元的房租数据缺失时,基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,并在预测过程中考虑夜间平均灯光亮度值、归一化差值植被指数和基础设施核密度。
优选地,本发明的基于大数据和机器学习的城市贫困空间分类识别方法,城市贫困指数模型建立模块中的城市贫困指数模型为:
其中,P为区域单元范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为最小空间单元区域范围的平均单位房租价格。
本发明的有益效果是:
本发明提供的一种基于大数据和机器学习的城市贫困空间分类识别方法和装置,通过多种类型遥感卫星获取目标城市遥感数据,对目标城市内部进行区域网格化划分;对遥感数据提取地表绿地和水体,建立土地绿色覆盖模型;通过获取目标城市的POI数据,判别各区域包含城市POI的类型和数量,建立城市活跃度模型;再获取目标城市内部区域范围的房租数据;根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型,根据城市贫困指数模型进行分类,确定识别城市贫困区域,具有识别准确、操作可行性强的优点。
附图说明
下面结合附图和实施例对本申请的技术方案进一步说明。
图1为本发明一种基于大数据和机器学习的贫困空间分类识别方法的基本流程示意图。
图2为本发明提供实施例中城市最小单元划分结果示意图。
图3为本发明提供实施例中提取的绿地和水体结果示意图。
图4为本发明提供实例中POI数据分布的类型和数量。
图5为本发明提供实例中机器学习预测房租数据模型的基本流程示意图。
图6为本发明提供实例中机器学习的训练数据和测数数据相同样本的SOM算法分类结果示意图。
图7为本发明提供实例中机器学习的训练数据和测数数据66%分割样本的SOM算法分类结果示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本申请的技术方案。
实施例1
本实施例提供的一种基于大数据和机器学习的城市贫困空间分类识别方法,基本流程请参阅图1,具体的实施进一步阐释说明包括:
步骤1:根据获取到的高精度遥感卫星影像,对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积Z;
基于高精度遥感卫星影像,进行最小空间单元范围的划分,空间单元的划分要以最小居住单元或末级道路相围合的区域作为划分依据,每个最小居住单元或末级道路相围合的区域为一个最小空间单元,图2就是按照末级道路围合及最小居住单元进行划分的最小空间单元范围图,然后在Arcgis中转换为投影坐标,计算各空间单元范围的面积。
步骤2,基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,在ENVI中,利用最大似然值法,进行监督分类,在Arcgis中,利用属性特征值栅格提取,提取每个最小空间单元范围的绿地和水体,图3就是按照所述进行绿地和水体的提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,然后建立土地绿色覆盖模型,建立的土地绿色覆盖模型(计算出土地绿色覆盖指数)为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
步骤3,基于网络电子地图获取目标城市的POI数据(Point of Interest的缩写,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等),利用Python语言编辑进行POI提取,POI数据能反映社会经济的活跃度,POI是在空间上显示各种设施的点,POI的数据内容主要包括:经纬度坐标和POI各类型的两级分类,如图4就是POI在城市中的分布、数量和类型,在Arcgis中,通过空间连接计算最小空间单元范围内的POI的类型和数量,利用土地利用混合度的熵模型,建立城市活跃度模型,建立的城市活跃度模型为:
其中,Vj为最小空间单元范围j中的城市活跃度,Mij为最小空间单元范围j中i类POI所占的比例,Nj为最小空间单元范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当最小空间单元范围区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
步骤4,基于网络电子平台的房源数据,通过Python编辑语言爬取房租数据,获得目标城市房租数据的主要内容包括租房价格、房屋面积、房屋位置和经纬度等,但爬取的房租数据往往是有缺失的。
基于机器学习的缺失值预测,大致流程如图5所示,通过历史数据输入模型中进行训练,得到预测模型后,将新的数据输入预测模型中,进行预测缺失值的属性和具体数值。
基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,为了更准确预测缺失值,预测过程中加入了夜间灯光遥感数据的夜间平均灯光亮度值、遥感卫星影像数据提取的归一化差值植被指数(NDVI)和POI数据的基础设施核密度(交通服务设施、教育、商业等),为了避免过度拟合,对训练数据选取房租较为完整的数据,然后进行机器学习算法,实例中选用如表1所示训练数据的分类器,选用相关系数较好的进行单个分类器的测试,用缺失数据作为测试数据,然后用分类器进行的测试数据评估检验,表1中训练数据分类器较好的有K-NN、RandomForest和SVR,SVR算法是分类器中较稳定的分类器,表2是用单个分类器K-NN算法进行评估的结果,表3是用Bagging集成学习进行评估,交叉验证使用的也是训练数据中分类器相关系数较好的,为了准确预测缺失值,使用单个分类器较好的算法和集成学习算法进行比较,选择较好的算法,进行预测缺失值,最终使用的是Bagging集成学习算法进行缺失房租数据的预测。
表1训练数据的分类器相关系数
表2单个分类器K-NN算法评估
表3 Bagging集成学习评估
步骤5,根据上述步骤的土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型,建立的城市贫困指数模型为:
其中,P为最小空间单元区域范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为区域单元范围的平均单位房租价格(每平米的房租)。
步骤6,根据城市贫困指数模型进行分类,基于开源机器学习平台Weka,利用自组织映射网络(SOM)获得城市贫困空间分类,自组织网络的测试与有监督学习中的测试不同,本实例中,利用训练数据和测试数据一样的,与训练数据和测试数据66%的分割进行比较,也就是样本总量的66%是训练数据,剩下的是测试数据,采用竞争层的结构为2*2的自组织映射网络,迭代次数为1000,初始的学习效率为1,排序阶段步数为2000。因为每个城市的贫困空间范围的样本和经济发展程度不同,城市贫困空间的分类也会有差别,本发明提供了一个基于机器学习的城市贫困空间分类方法,选择适合研究范围的分类,本实例选择了66%训练数据进行训练,其余的是测试数据,表4是通过训练数据和测试数据相同的SOM算法分成四类城市贫困空间,表5是训练数据和测试数据66%的分割SOM算法分成四类城市贫困空间。
表4训练数据和测试数据相同的SOM算法分类
表5训练数据和测试数据66%分割的SOM算法分类
步骤7,根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
本发明提供的一种基于大数据和机器学习的城市贫困空间分类识别方法和装置,通过多种类型遥感卫星获取目标城市遥感数据,对目标城市内部进行区域划分,获得目标城市贫困识别的范围;对遥感数据提取地表绿地和水体,建立土地绿色覆盖模型;通过网络电子地图获取目标城市的POI数据,判别各区域包含城市POI的类型和数量,建立城市活跃度模型;通过网络电子平台的房源数据,获取目标城市内部区域范围的房租数据,并利用夜间灯光遥感数据的夜间平均灯光亮度值、遥感卫星影像数据的归一化差值植被指数(NDVI)和POI数据的基础设施核密度(交通服务设施、教育、商业等),预测网络电子平台的缺失房租数据;根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型,根据城市贫困指数模型进行分类,确定识别城市贫困区域,具有识别准确、操作可行性强的优点。
本实施例还提供一种基于大数据和机器学习的城市贫困空间分类识别装置,与方法相对应,包括:
图像分块模块:用于根据获取到的高精度遥感卫星影像对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积;
土地绿色覆盖率计算模块:基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,计算出土地绿色覆盖率;
城市活跃度计算模块:获取城市的POI数据,并根据最小空间单元范围内的POI的类型和数量计算出城市活跃度模型;
房租数据获取模块:获得城市内部区域范围的房租数据,获得每个最小空间单元范围的平均单位房租价格;
城市贫困指数模型建立模块:根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型;
城市贫困区域划分模块:根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
土地绿色覆盖率计算模块中土地绿色覆盖率为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
城市活跃度计算模块中,利用土地利用混合度的熵模型建立城市活跃度模型,城市活跃度模型为:
其中,Vj为最小空间单元区域范围j中的城市活跃度,Mij为最小空间单元区域范围j中i类POI所占的比例,Nj为最小空间单元区域范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
获得目标城市房租数据的包括租房价格、房屋面积、房屋位置和经纬度,房租数据获取模块中通过房屋位置和经纬度确定房租数据对应的房屋属于哪个最小空间单元,当其中某些最小空间单元的房租数据缺失时,基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,并在预测过程中考虑夜间平均灯光亮度值、归一化差值植被指数和基础设施核密度。
城市贫困指数模型建立模块中的城市贫困指数模型为:
其中,P为区域单元范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为最小空间单元区域范围的平均单位房租价格。
以上述依据本申请的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项申请技术思想的范围内,进行多样的变更以及修改。本项申请的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (10)

1.一种基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,包括:
步骤1:根据获取到的高精度遥感卫星影像,对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积;
步骤2:基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,计算出土地绿色覆盖率;
步骤3:获取城市的POI数据,并根据最小空间单元范围内的POI的类型和数量计算出城市活跃度模型;
步骤4:获得城市内部区域范围的房租数据,获得每个最小空间单元范围的平均单位房租价格;
步骤5:根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型;
步骤6:根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
2.根据权利要求1所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,土地绿色覆盖率为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
3.根据权利要求1或2所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,步骤3中,利用土地利用混合度的熵模型建立城市活跃度模型,城市活跃度模型为:
其中,Vj为最小空间单元区域范围j中的城市活跃度,Mij为最小空间单元区域范围j中i类POI所占的比例,Nj为最小空间单元区域范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
4.根据权利要求1-3任一项所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,获得目标城市房租数据的包括租房价格、房屋面积、房屋位置和经纬度,通过房屋位置和经纬度确定房租数据对应的房屋属于哪个最小空间单元,当其中某些最小空间单元的房租数据缺失时,基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,并在预测过程中考虑夜间平均灯光亮度值、归一化差值植被指数和基础设施核密度。
5.根据权利要求1-4任一项所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,步骤5中的城市贫困指数模型为:
其中,P为区域单元范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为最小空间单元区域范围的平均单位房租价格。
6.一种基于大数据和机器学习的城市贫困空间分类识别装置,其特征在于,包括:
图像分块模块:用于根据获取到的高精度遥感卫星影像对城市内部进行区域划分,将城市区域划分为由若干格组成的最小空间单元,并计算出各最小空间单元的面积;
土地绿色覆盖率计算模块:基于遥感卫星影像,对每个最小空间单元范围的绿地和水体进行识别提取,并计算所提取最小空间单元区域范围的绿地和水体的面积,计算出土地绿色覆盖率;
城市活跃度计算模块:获取城市的POI数据,并根据最小空间单元范围内的POI的类型和数量计算出城市活跃度模型;
房租数据获取模块:获得城市内部区域范围的房租数据,获得每个最小空间单元范围的平均单位房租价格;
城市贫困指数模型建立模块:根据土地绿色覆盖模型、城市活跃度模型、房租数据,建立城市贫困指数模型;
城市贫困区域划分模块:根据城市贫困指数模型对每个最小空间单元进行贫困程度分类,合并贫困程度分类相同的相邻的最小空间单元,确定城市贫困区域。
7.根据权利要求6所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,土地绿色覆盖率计算模块中土地绿色覆盖率为:
其中,L为土地绿色覆盖指数,W为最小空间单元区域范围的水体面积,G为最小空间单元区域范围的绿地面积,Z为最小空间单元区域范围的面积。
8.根据权利要求6或7所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,城市活跃度计算模块中,利用土地利用混合度的熵模型建立城市活跃度模型,城市活跃度模型为:
其中,Vj为最小空间单元区域范围j中的城市活跃度,Mij为最小空间单元区域范围j中i类POI所占的比例,Nj为最小空间单元区域范围j中POI类型的数量,城市活跃度Vj在[0,1]之间,当区域内只有一种POI时,其值为0;当区域内各POI比例相等时,其值为1。
9.根据权利要求6-8任一项所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,获得目标城市房租数据的包括租房价格、房屋面积、房屋位置和经纬度,房租数据获取模块中通过房屋位置和经纬度确定房租数据对应的房屋属于哪个最小空间单元,当其中某些最小空间单元的房租数据缺失时,基于开源机器学习平台Weka或者Python的Scikit-learn模块,进行缺失房租数据的预测,并在预测过程中考虑夜间平均灯光亮度值、归一化差值植被指数和基础设施核密度。
10.根据权利要求6-9任一项所述的基于大数据和机器学习的城市贫困空间分类识别方法,其特征在于,城市贫困指数模型建立模块中的城市贫困指数模型为:
其中,P为区域单元范围的城市贫困指数,L为最小空间单元区域范围的土地绿色覆盖指数,V为最小空间单元区域范围的城市活跃度,R为最小空间单元区域范围的平均单位房租价格。
CN201910276600.3A 2019-04-08 2019-04-08 基于大数据和机器学习的贫困空间分类识别方法和装置 Withdrawn CN109948737A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910276600.3A CN109948737A (zh) 2019-04-08 2019-04-08 基于大数据和机器学习的贫困空间分类识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910276600.3A CN109948737A (zh) 2019-04-08 2019-04-08 基于大数据和机器学习的贫困空间分类识别方法和装置

Publications (1)

Publication Number Publication Date
CN109948737A true CN109948737A (zh) 2019-06-28

Family

ID=67012639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910276600.3A Withdrawn CN109948737A (zh) 2019-04-08 2019-04-08 基于大数据和机器学习的贫困空间分类识别方法和装置

Country Status (1)

Country Link
CN (1) CN109948737A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689230A (zh) * 2019-09-02 2020-01-14 平安科技(深圳)有限公司 一种区域的贫困程度确定方法、电子装置及存储介质
CN111415057A (zh) * 2019-12-04 2020-07-14 信阳师范学院 一种区域贫困程度分级图的生成方法及装置
CN111937016A (zh) * 2020-06-09 2020-11-13 中山大学 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统
CN112215059A (zh) * 2020-08-26 2021-01-12 厦门大学 一种基于深度学习的城中村识别和人口估计方法、系统及计算机可读存储介质
CN112347926A (zh) * 2020-11-06 2021-02-09 天津市勘察设计院集团有限公司 基于建筑形态分布的高分辨率影像城中村检测方法
CN113111691A (zh) * 2020-01-13 2021-07-13 四川大学 一种基于遥感图片与兴趣点数据的城市用地功能识别方法
CN113392859A (zh) * 2020-03-11 2021-09-14 Tcl科技集团股份有限公司 一种确定城市功能区域的类型的方法及装置
CN114282934A (zh) * 2021-03-30 2022-04-05 华南理工大学 一种基于手机信令数据的城市低收入人群分布预测方法、系统及存储介质
CN115620165A (zh) * 2022-11-07 2023-01-17 中国科学院空天信息创新研究院 城市建成区慢行系统设施评价方法、装置、设备及介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689230A (zh) * 2019-09-02 2020-01-14 平安科技(深圳)有限公司 一种区域的贫困程度确定方法、电子装置及存储介质
CN110689230B (zh) * 2019-09-02 2024-01-09 平安科技(深圳)有限公司 一种区域的贫困程度确定方法、电子装置及存储介质
CN111415057A (zh) * 2019-12-04 2020-07-14 信阳师范学院 一种区域贫困程度分级图的生成方法及装置
CN111415057B (zh) * 2019-12-04 2024-02-20 信阳师范学院 一种区域贫困程度分级图的生成方法及装置
CN113111691B (zh) * 2020-01-13 2022-04-05 四川大学 一种基于遥感图片与兴趣点数据的城市用地功能识别方法
CN113111691A (zh) * 2020-01-13 2021-07-13 四川大学 一种基于遥感图片与兴趣点数据的城市用地功能识别方法
CN113392859A (zh) * 2020-03-11 2021-09-14 Tcl科技集团股份有限公司 一种确定城市功能区域的类型的方法及装置
WO2021248335A1 (zh) * 2020-06-09 2021-12-16 中山大学 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统
CN111937016A (zh) * 2020-06-09 2020-11-13 中山大学 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统
CN112215059B (zh) * 2020-08-26 2023-10-27 厦门大学 一种基于深度学习的城中村识别和人口估计方法、系统及计算机可读存储介质
CN112215059A (zh) * 2020-08-26 2021-01-12 厦门大学 一种基于深度学习的城中村识别和人口估计方法、系统及计算机可读存储介质
CN112347926A (zh) * 2020-11-06 2021-02-09 天津市勘察设计院集团有限公司 基于建筑形态分布的高分辨率影像城中村检测方法
CN112347926B (zh) * 2020-11-06 2023-05-23 天津市勘察设计院集团有限公司 基于建筑形态分布的高分辨率影像城中村检测方法
CN114282934A (zh) * 2021-03-30 2022-04-05 华南理工大学 一种基于手机信令数据的城市低收入人群分布预测方法、系统及存储介质
CN115620165A (zh) * 2022-11-07 2023-01-17 中国科学院空天信息创新研究院 城市建成区慢行系统设施评价方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN109948737A (zh) 基于大数据和机器学习的贫困空间分类识别方法和装置
Huang et al. Multi-level monitoring of subtle urban changes for the megacities of China using high-resolution multi-view satellite imagery
Shang et al. Estimating building-scale population using multi-source spatial data
Yao et al. Discovering the homogeneous geographic domain of human perceptions from street view images
CN108764193A (zh) 融合poi和遥感影像的城市功能区划分方法
Zhuo et al. Compatibility mix degree index: A novel measure to characterize urban land use mix pattern
Shirowzhan et al. Spatial compactness metrics and Constrained Voxel Automata development for analyzing 3D densification and applying to point clouds: A synthetic review
Tian et al. Suburban identification based on multi-source data and landscape analysis of its construction land: A case study of Jiangsu Province, China
Song et al. Identifying urban candidate brownfield sites using multi-source data: The case of Changchun City, China
Werder et al. Semi-automatic interpretation of buildings and settlement areas in user-generated spatial data
Taubenböck et al. Remote sensing—An effective data source for urban monitoring
Yuan et al. From design to digital model: A quantitative analysis approach to Garden Cities theory
Tian et al. Suburban sprawl measurement and landscape analysis of cropland and ecological land: A case study of Jiangsu Province, China
Crols et al. Downdating high-resolution population density maps using sealed surface cover time series
Şimşek et al. Spatial analysis of two different urban landscapes using satellite images and landscape metrics
Guindon et al. Using satellite remote sensing to survey transport-related urban sustainability: Part II. Results of a Canadian urban assessment
Amati et al. Using machine learning to identify urban forest crown bounding boxes (CBB): Exploring a new method to develop urban forest policy
CN113191553A (zh) 基于建筑物尺度的人口空间分布估算方法及系统
Ghahremanlou et al. Mechanism of the effect of urban form and land use on transportation and air pollution in Tehran
Malikov et al. Development of a methodology for complex monitoring of the development of urban and suburban areas based on the intellectual analysis of earth remote sensing data and geospatial technologies
Azzopardi Effect of distance measures and feature representations on distance-based accessibility measures
Duwal Modelling urban growth in Kathmandu Valley
Hajiheidari et al. Cadastral and urban maps enrichments using smart spatial data fusion
Kazawa et al. Possible correlation between nighttime lighting data and building height
Abdullahi et al. Assessing the relationship between city compactness and residential land use growth

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190628

WW01 Invention patent application withdrawn after publication