CN111937016B - 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统 - Google Patents

一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统 Download PDF

Info

Publication number
CN111937016B
CN111937016B CN202080001052.4A CN202080001052A CN111937016B CN 111937016 B CN111937016 B CN 111937016B CN 202080001052 A CN202080001052 A CN 202080001052A CN 111937016 B CN111937016 B CN 111937016B
Authority
CN
China
Prior art keywords
street view
image data
following formula
poverty
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080001052.4A
Other languages
English (en)
Other versions
CN111937016A (zh
Inventor
袁媛
刘颖
牛通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Publication of CN111937016A publication Critical patent/CN111937016A/zh
Application granted granted Critical
Publication of CN111937016B publication Critical patent/CN111937016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/182Network patterns, e.g. roads or rivers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Multimedia (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

为了构建新型的城市贫困评估方法,本发明公开一种基于街景图片及机器学习的城市内部贫困空间测度方法,包括以下步骤:根据人口普查数据构建多重剥夺指数IMD;在地图信息数据库中获取目标区域的街景图像数据;通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据;基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子;将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数。根据城市贫困分数对城市的贫困程度进行评估。本发明还公开了基于上述方法的一种基于街景图片及机器学习的城市内部贫困空间测度系统。本发明不仅推进城市贫困研究精细化,而且丰富城市贫困度量指标的维度。

Description

一种基于街景图片及机器学习的城市内部贫困空间测度方法 及系统
技术领域
本发明涉及人工智能机器学习领域,更具体地,涉及一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统。
背景技术
20世纪60~70年代以来,以多重贫困(Multiple Deprivation)为代表的传统城市贫困测度虽已日渐成熟,但基于社会经济统计数据构建的指标体系,往往存在更新周期长、可获得性低、数据来源单一等不足。随着信息化时代的到来,西方学界开始借助遥感影像、夜间灯光、公交刷卡、在线房租、地图兴趣点等大数据识别贫困空间。而国内现有研究仅在乡村贫困中较常使用卫星影像数据,利用遥感影像、夜间灯光等单一类型分析广大区域或城乡地带,而在城市贫困测度上新型数据和技术的使用较少,需要寻找适用于城市区域的数据来拓展城市贫困的指标范围、细化测度尺度,以深入挖掘贫困空间现象。
专利(2019102766003)公开了一种通过遥感卫星获取目标城市遥感数据,结合POI数据进行贫困评估的一种方法。上述方法没有利用现有的城市街景图像进行结合评估,评估的指标维度较少。
发明内容
为克服上述现有技术与方法的不足,本发明提出了一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统。本发明有效地弥补了已有研究的缺陷,不仅推进了城市贫困研究精细化,而且丰富城市贫困度量指标的维度,对改善贫困社区、推进更新规划具有实际的意义,是测度城市内部贫困准确可靠、切实可行的方法。
为解决上述技术问题,本发明的技术方案如下:
一种基于街景图片及机器学习的城市内部贫困空间测度方法,包括以下步骤:
根据人口普查数据构建多重剥夺指数IMD;
在地图信息数据库(如百度地图、高德地图、google地图等)中获取目标区域的街景图像数据;
通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据;
基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子;
将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数;
根据城市贫困分数对城市的贫困程度进行评估。
本发明从地图信息数据库收集街景图像数据,使用图片分割技术充分挖掘了街景图像数据中的要素信息,同时结合数理模型和计算机算法,构建测度城市贫困程度的机器学习模型。本发明有效地弥补了已有测度的缺陷,不仅推进了城市贫困研究精细化,而且丰富城市贫困度量指标的维度,对改善贫困社区、推进更新规划具有实际的意义,是测度城市内部贫困准确可靠、切实可行的方法。
在一种优选的方案中,所述的“根据人口普查数据构建多重剥夺指数IMD”包括以下子内容:
根据人口普查数据得到P个维度数据,每个维度的数据对应一个比例权重λ;
所述的多重剥夺指数IMD通过下式进行表达:
Figure BDA0002550960630000021
式中,所述的Ej表示第j个纬度数据的数值。
在一种优选的方案中,所述的P=4,所述的4个维度数据分别是收入领域数据、教育领域数据、就业领域数据和住房领域数据,所述的收入领域数据的数值是E1,收入领域数据的比重是0.303;所述的教育领域数据的数值是E2,教育领域数据的比重是0.212;所述的就业领域数据的数值是E3,就业领域数据的比重是0.182;所述的住房领域数据的数值是E4,住房领域数据的比重是0.303;所述的多重剥夺指数IMD通过下式进行表达:
IMD=E1*0.303+E2*0.212+E3*0.182+E4*0.303。
在一种优选的方案中,所述的E1通过下式进行表达:
E1=产业工人比例j11+低端服务业比例j12+离婚丧偶比例j13
所述的产业工人比例j11通过下式进行表达:
产业工人比例j11=(采矿业的人口数+制造业的人口数)/就业总人数
所述的产业工人比例j11通过下式进行表达:
低端服务业比例j121=(电力、煤气及水的生产和供应业的人口数+批发和零售业的人口数+住宿和餐饮业的人口数+房地产业的人口数)/就业总人数
所述的离婚丧偶比例j13通过下式进行表达:
离婚丧偶比例j13=离婚及丧偶人口数/15岁及以上未婚人口与有配偶人口数之和。
在一种优选的方案中,所述的E2通过下式进行表达:
E2=低教育水平j21+离校没有文凭比例j22
所述的低教育水平j21通过下式进行表达:
低教育水平j21=未上过学、小学、初中的人口数/总人口
所述的离校没有文凭比例j22通过下式进行表达:
离校没有文凭比例j22=没有文凭的人口数/总人口。
在一种优选的方案中,所述的E3通过下式进行表达:
E3=失业比例j31=没有工作的人口数/总人口。
在一种优选的方案中,所述的E4通过下式进行表达:
E4=每平方米住的人口比例j41+无清洁能源比例j42+无自来水比例j43+无厨房比例j44+无厕所比例j45+无热水比例j46
所述的每平方米住的人口比例j41通过下式进行表达:
每平方米住的人口比例j41=1/人均住房建筑面积(平方米/人)
所述的无清洁能源比例j42通过下式进行表达:
无清洁能源比例j42=煤炭、柴草、其他能源使用的家庭户数/总家庭户数
所述的无自来水比例j43通过下式进行表达:
无自来水比例j43=无自来水的家庭户数/总家庭户数
所述的无厨房比例j44通过下式进行表达:
无厨房比例j44=无厨房的家庭户数/总家庭户数
所述的无厕所比例j45通过下式进行表达:
无厕所比例j45=无厕所的家庭户数/总家庭户数
所述的无热水比例j46通过下式进行表达:
无热水比例j46=无热水的家庭户数/总家庭户数。
在一种优选的方案中,所述的“在地图信息数据库中获取目标区域的街景图像数据”包括以下子步骤:
在地图信息数据库中获取目标区域的路网信息;
根据目标区域的路网信息,按照距离D进行间隔性采样,得到目标区域的采样点;
针对每一个目标区域的采样点得到M*L张图像数据,定义所有目标区域的采样点的图像数据的结合集合为目标区域的街景图像数据集合,所述的M*L张图像数据表示每一个竖直方向视角下取M张相互不同方向的图像数据,有L个竖直方向视角。
在一种优选的方案中,所述的距离D=100米。
在一种优选的方案中,所述的M=4,L=2;所述的采样点按照第一个竖直方向视角的前后左右四个方向和第二个竖直方向视角的前后左右四个方向取得8张图像数据。
在一种优选的方案中,所述的“通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据”包括以下子步骤:
对目标区域的街景图像数据集合进行抽样,得到抽样结果;
在抽样结果中,将每一个抽样点的每一个竖直方向视角的M张相互不同方向的图像数据进行拼合,得到对应抽样点在设定竖直方向视角的全域图像;
将所有抽样点的每一个竖直方向视角的全域图像的集合定义为目标区域的采样点的抽样集合;
通过现有的图像分割技术,判断最适合目标区域的采样点的抽样集合的图像分割技术,所得的结果定义为目标区域的采样点的最佳图像分割技术;
通过目标区域的采样点的最佳图像分割技术将目标区域的采样点对应的目标区域的街景图像数据集合进行图像分割,所得的结果定义为若干块街景图像数据。
在一种优选的方案中,所述的“基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子”包括以下子步骤:
基于若干块街景图像数据,得到街景指标,所述的街景指标包括天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure、色彩要素、显著区域特征SRS、视觉熵VE,其中,所述的色彩要素包括街景图像数据的名度和饱和度;
所述的天空开敞指数Psky通过下式进行计算:
Figure BDA0002550960630000051
式中,所述的NSi为第i块街景图像数据中天空的像素数;所述的Ni是第i块街景图像数据中的总像素数;
所述的绿视率Pgreen通过下式进行计算:
Figure BDA0002550960630000052
式中,所述的NGi为第i块街景图像数据中植被的像素数;
所述的路面占比Proad通过下式进行计算:
Figure BDA0002550960630000053
式中,所述的NRi为第i块街景图像数据中道路的像素数;
所述的建筑占比Pbuilding通过下式进行计算:
Figure BDA0002550960630000054
式中,所述的NBi为第i块街景图像数据中建筑的像素数;
所述的界面围合度Penclosure通过下式进行计算:
Penclosure=Pgreen+Pbuilding
所述的显著区域特征SRS通过下式进行计算:
Figure BDA0002550960630000055
所述的max(R,G,B)表示第i块街景图像数据中颜色分量中的最大值;所述的min(R,G,B)表示第i块街景图像数据中颜色分量中的最小值;
所述的视觉熵VE通过下式进行计算:
Figure BDA0002550960630000056
所述的Pi表示第i块街景图像数据的概率,用于表征熵枝值;
将街景指标作为主成分分析法的输入变量,得到输出变量主因子。
在一种优选的方案中,所述的“机器学习算法”是随机森林算法。
本优选方案中,随机森林算法利用随机重复采样和节点随机分裂技术,并基于大量树状结构的集成学习来进行分类和预测,是一种简单稳定、准确率较高的算法。而街景指标受方位、区位、视角等影响很大,本发明使用属于非线性模型的随机森林算法,以实现复杂多维的街景数据对城市贫困分值的模拟预测。由于随机森林算法可以评估所有变量,无需顾虑变量之间的多元共线性问题。
本发明还公开了基于上述方法的一种基于街景图片及机器学习的城市内部贫困空间测度系统,包括图像获取模块、图像分割模块、图片组合模块、街景指标模块和城市贫困分数计算模块,其中,
所述的图像获取模块用于获取目标区域的街景图像数据;;
所述的图片组合模块用于将采样点的相同的竖直方向视角的M张不同方向的图像数据进行拼合,得到目标区域的街景图像数据;
所述的图像分割模块用于将目标区域的街景图像数据分割为若干块街景图像数据;
所述的街景指标模块用于计算目标区域的街景指标;
所述的城市贫困分数计算模块将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数。
在一种优选的方案中,所述的街景指标模块包括图像要素像元占比计算模块和色彩复杂程度计算模块,其中,
所述的图像要素像元占比计算模块用于计算天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure
所述的色彩复杂程度计算模块用于计算视觉熵VE。
与现有技术相比,本发明技术方案的有益效果是:
本发明从地图信息数据库收集街景图像数据,使用图片分割技术充分挖掘了街景图像数据中的要素信息,同时结合数理模型和计算机算法,构建测度城市贫困程度的机器学习模型。本发明有效地弥补了已有测度的缺陷,不仅推进了城市贫困研究精细化,而且丰富城市贫困度量指标的维度,对改善贫困社区、推进更新规划具有实际的意义,是测度城市内部贫困准确可靠、切实可行的方法。
附图说明
图1为实施例1的流程图;
图2是多重剥夺指数IMD城市贫困等级分布图。
图3是街景图片采样点分布图。
图4是街景图像分割解译的流程示意图。
图5是三种模型分割街景结果示例对比图。
图6是街景建筑围合感空间分布格局图。
图7是街景植被围合感空间分布格局图。
图8是街景天空开阔感空间分布格局图。
图9是街景道路开阔感空间分布格局图。
图10是街景色彩复杂感空间分布格局图。
图11是街景预测城市贫困等级分布图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于街景图片及机器学习的城市内部贫困空间测度方法,包括以下步骤:
根据人口普查数据构建多重剥夺指数IMD;
在地图信息数据库(如百度地图、高德地图、google地图等)中获取目标区域的街景图像数据;
通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据;
基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子;
将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数。
根据城市贫困分数对城市的贫困程度进行评估。
实施例1从地图信息数据库收集街景图像数据,使用图片分割技术充分挖掘了街景图像数据中的要素信息,同时结合数理模型和计算机算法,构建测度城市贫困程度的机器学习模型。本发明有效地弥补了已有测度的缺陷,不仅推进了城市贫困研究精细化,而且丰富城市贫困度量指标的维度,对改善贫困社区、推进更新规划具有实际的意义,是测度城市内部贫困准确可靠、切实可行的方法。
在实施例1中,还可以进行以下扩展:“根据人口普查数据构建多重剥夺指数IMD”包括以下子内容:
根据人口普查数据得到P个维度数据,每个维度的数据对应一个比例权重λ;
多重剥夺指数IMD通过下式进行表达:
Figure BDA0002550960630000081
式中,Ej表示第j个纬度数据的数值。
在实施例1及上述改进实施例1中,还可以进行以下扩展:P=4,4个维度数据分别是收入领域数据、教育领域数据、就业领域数据和住房领域数据,收入领域数据的数值是E1,收入领域数据的比重是0.303;教育领域数据的数值是E2,教育领域数据的比重是0.212;就业领域数据的数值是E3,就业领域数据的比重是0.182;住房领域数据的数值是E4,住房领域数据的比重是0.303;多重剥夺指数IMD通过下式进行表达:
IMD=E1*0.303+E2*0.212+E3*0.182+E4*0.303。
在实施例1及上述改进实施例1中,还可以进行以下扩展:E1通过下式进行表达:
E1=产业工人比例j11+低端服务业比例j12+离婚丧偶比例j13
产业工人比例j11通过下式进行表达:
产业工人比例j11=(采矿业的人口数+制造业的人口数)/就业总人数
产业工人比例j11通过下式进行表达:
低端服务业比例j121=(电力、煤气及水的生产和供应业的人口数+批发和零售业的人口数+住宿和餐饮业的人口数+房地产业的人口数)/就业总人数
离婚丧偶比例j13通过下式进行表达:
离婚丧偶比例j13=离婚及丧偶人口数/15岁及以上未婚人口与有配偶人口数之和。
在实施例1及上述改进实施例1中,还可以进行以下扩展:E2通过下式进行表达:
E2=低教育水平j21+离校没有文凭比例j22
低教育水平j21通过下式进行表达:
低教育水平j21=未上过学、小学、初中的人口数/总人口
离校没有文凭比例j22通过下式进行表达:
离校没有文凭比例j22=没有文凭的人口数/总人口。
在实施例1及上述改进实施例1中,还可以进行以下扩展:E3通过下式进行表达:
E3=失业比例j31=没有工作的人口数/总人口。
在实施例1及上述改进实施例1中,还可以进行以下扩展:E4通过下式进行表达:
E4=每平方米住的人口比例j41+无清洁能源比例j42+无自来水比例j43+无厨房比例j44+无厕所比例j45+无热水比例j46
每平方米住的人口比例j41通过下式进行表达:
每平方米住的人口比例j41=1/人均住房建筑面积(平方米/人)
无清洁能源比例j42通过下式进行表达:
无清洁能源比例j42=煤炭、柴草、其他能源使用的家庭户数/总家庭户数
无自来水比例j43通过下式进行表达:
无自来水比例j43=无自来水的家庭户数/总家庭户数
无厨房比例j44通过下式进行表达:
无厨房比例j44=无厨房的家庭户数/总家庭户数
无厕所比例j45通过下式进行表达:
无厕所比例j45=无厕所的家庭户数/总家庭户数
无热水比例j46通过下式进行表达:
无热水比例j46=无热水的家庭户数/总家庭户数。
在实施例1及上述改进实施例1中,还可以进行以下扩展:“在地图信息数据库中获取目标区域的街景图像数据”包括以下子步骤:
在地图信息数据库中获取目标区域的路网信息;
根据目标区域的路网信息,按照距离D进行间隔性采样,得到目标区域的采样点;
针对每一个目标区域的采样点得到M*L张图像数据,定义所有目标区域的采样点的图像数据的结合集合为目标区域的街景图像数据集合,M*L张图像数据表示每一个竖直方向视角下取M张相互不同方向的图像数据,有L个竖直方向视角。
在实施例1及上述改进实施例1中,还可以进行以下扩展:距离D=100米。
在实施例1及上述改进实施例1中,还可以进行以下扩展:M=4,L=2;采样点按照第一个竖直方向视角的前后左右四个方向和第二个竖直方向视角的前后左右四个方向取得8张图像数据。
在实施例1及上述改进实施例1中,还可以进行以下扩展:“通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据”包括以下子步骤:
对目标区域的街景图像数据集合进行抽样,得到抽样结果;
在抽样结果中,将每一个抽样点的每一个竖直方向视角的M张相互不同方向的图像数据进行拼合,得到对应抽样点在设定竖直方向视角的全域图像;
将所有抽样点的每一个竖直方向视角的全域图像的集合定义为目标区域的采样点的抽样集合;
通过现有的图像分割技术,判断最适合目标区域的采样点的抽样集合的图像分割技术,所得的结果定义为目标区域的采样点的最佳图像分割技术;
通过目标区域的采样点的最佳图像分割技术将目标区域的采样点对应的目标区域的街景图像数据集合进行图像分割,所得的结果定义为若干块街景图像数据。
在实施例1及上述改进实施例1中,还可以进行以下扩展:“基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子”包括以下子步骤:
基于若干块街景图像数据,得到街景指标,街景指标包括天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure、色彩要素、显著区域特征SRS、视觉熵VE,其中,色彩要素包括街景图像数据的名度和饱和度;
天空开敞指数Psky通过下式进行计算:
Figure BDA0002550960630000101
式中,NSi为第i块街景图像数据中天空的像素数;Ni是第i块街景图像数据中的总像素数;
绿视率Pgreen通过下式进行计算:
Figure BDA0002550960630000111
式中,NGi为第i块街景图像数据中植被的像素数;
路面占比Proad通过下式进行计算:
Figure BDA0002550960630000112
式中,NRi为第i块街景图像数据中道路的像素数;
建筑占比Pbuilding通过下式进行计算:
Figure BDA0002550960630000113
式中,NBi为第i块街景图像数据中建筑的像素数;
界面围合度Penclosure通过下式进行计算:
Penclosure=Pgreen+Pbuilding
显著区域特征SRS通过下式进行计算:
Figure BDA0002550960630000114
max(R,G,B)表示第i块街景图像数据中颜色分量中的最大值;min(R,G,B)表示第i块街景图像数据中颜色分量中的最小值;
视觉熵VE通过下式进行计算:
Figure BDA0002550960630000115
Pi表示第i块街景图像数据的概率,用于表征熵枝值;
将街景指标作为主成分分析法的输入变量,得到输出变量主因子。
在实施例1及上述改进实施例1中,还可以进行以下扩展:“机器学习算法”是随机森林算法。
本改进实施例1中,随机森林算法利用随机重复采样和节点随机分裂技术,并基于大量树状结构的集成学习来进行分类和预测,是一种简单稳定、准确率较高的算法。而街景指标受方位、区位、视角等影响很大,本发明使用属于非线性模型的随机森林算法,以实现复杂多维的街景数据对城市贫困分值的模拟预测。由于随机森林算法可以评估所有变量,无需顾虑变量之间的多元共线性问题。
实施例1的演示
演示环境:
抽样选取位于广州市、中心四区(越秀、荔湾、海珠、天河)的社区作为研究对象,涵盖各类具备不同建成环境的贫困和非贫困社区。一方面是因为作为华南区域的政治、经济、文化中心,广州市一直是城市贫困研究的典型案例区域。另一方面,参考行政边界、分区职能、发展阶段等方面的差异,越秀、海珠、荔湾、天河区适合作为研究对象。经2010年第六次人口普查数据整理统计,中心四区共包含914个居委会/村委会(社区),总统计人口数为483.3万人,占广州市全部人数的40%,研究对象具有典型代表性。
演示过程:
一种基于街景图片及机器学习的城市内部贫困空间测度方法,包括以下步骤:
第1步:从第六次全国人口普查数据中计算得到11个指标,构建传统测度城市贫困程度的指标体系,并计算多重剥夺指数(IMD),如图2所示;
第2步:沿着主干路、次干路、支路,将街景采样间隔确定为100米的均匀距离,每个采样点分别从0°、90°、180°、270°四个方向、0°水平视角和20°仰角两个视角,采集时间接近于第六次全国人口普查的时间,获取了涵盖8536个采样点、286个社区的百度地图街景,共计61864张图片,其空间分布如图3所示;
第3步:随机抽样出一半数量案例社区的街景图片,借助视觉领域中经常使用的TensorFlow深度学习网络框架进行支持,使用基于FCN、SegNet、PSPNet的人工智能模型进行解译(如图4所示)。计算像素精度PA(Pixel Accuracy)、平均像素精度MPA(Mean PixelAccuracy)、平均并交比MIOU(Mean Intersection Over Union)三种效率评估指标,选出图像分割技术准确度最高的模型分割所有街景图片(如图5所示)。
第4步:总结典型贫困社区的街景指标特征,并使用相关分析的方法,确定与城市贫困程度相关的街景要素。在计算重要街景要素的相应指标基础上,通过主成分分析法,降维处理多视角、多要素的街景指标,并旋转因子载荷矩阵,以提取出贡献度高、重要的街景因子进行命名,即建筑围合感、植被围合感、天空开阔感、道路开阔感、色彩复杂感如图6~10所示。
第5步:将上一步获得的重要街景因子作为自变量,以多重剥夺指数(IMD)作为参考变量,构建随机森林(Random Forest)预测模型。经剩余50%的样本数据进行测试后,反复循环此步骤生成大量决策树,当模型误差趋于最小和稳定状态时,就终止形成随机森林的生长,进行城市贫困程度判别,最终输出频次最高的分类结果,作为街景测度城市贫困程度的最终输出结果,经统计模型平均正确率达到82.48%,具体结果如图11所示。
本演示过程中,对城市贫困程度从0到5赋值,数字越大代表越贫困。随后按比例分层到每一等级的社区,抽取出50%的数据作为训练样本。同时采用随机重复采样、有放回地随机抽取N个,与已有训练数据规模相等的数据子集,以生长出N棵独立的决策树模型。经计算模型预测结果正确率和总模型误差发现,当树节点个数为6时,模型预测的错误率平均达到最小;同时让树的棵数从0-100取值,可以看出生成55棵决策树后模型总误差趋于稳定。因此本演示过程中随机森林模型的参数得以确定。其中,树节点的产生是通过逐一增加变量比较误判率的高低来决定的,即从M个已有可能属性中选取出,最具有代表性的随机特征变量进行分割。本演示过程将0°和20°的8个指标两两对比,将更重要的街景指标放入模型中,允许所有决策树尽可能地生长,并且在模型构建过程中不修改任何参数。这样有利于可以降低用于分类与回归的决策树之间的相关性,丰富模型的全面性和提高分类能力。
经剩余50%的样本数据进行测试后,反复循环此步骤以生成大量决策树,当模型误差趋于最小和稳定状态时,就终止形成随机森林的生长。进行城市贫困程度判别,最终输出频率最高的类型,作为随机森林模型的最终输出值,具体如表1所示。在优化模型的过程中发现,对于基于要素来计算的街景指标如天空开敞指数、绿视率等来说,0°视角拼合优度更佳,而基于颜色计算的色彩要素、显著区域特征等来说,20°视角的指标对模型正确预测的贡献度越大。同时由于属性种类的增加,模型预测能力随之提高,在加入第八个街景指标后,模型平均正确率达到82.48%,超过前两种模型的预测效果。而且增加不同的属性种类,模型预测准确率上升幅度不同。综合所有分析显示,0°天空开敞指数、0°绿视率、20°色彩要素、0°建筑占比、0°路面占比、20°视觉熵对城市贫困的预测影响程度比较高。
表1随机森林模型评价参数结果
Figure BDA0002550960630000141
实施例2
实施例2是基于实施例1的一种应用,一种基于街景图片及机器学习的城市内部贫困空间测度系统,包括图像获取模块、图像分割模块、图片组合模块、街景指标模块和城市贫困分数计算模块,其中,
图像获取模块用于获取目标区域的街景图像数据;;
图片组合模块用于将采样点的相同的竖直方向视角的M张不同方向的图像数据进行拼合,得到目标区域的街景图像数据;
图像分割模块用于将目标区域的街景图像数据分割为若干块街景图像数据;
街景指标模块用于计算目标区域的街景指标;
城市贫困分数计算模块将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数。
在实施例2中,还可以进行以下扩展:街景指标模块包括图像要素像元占比计算模块和色彩复杂程度计算模块,其中,
图像要素像元占比计算模块用于计算天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure
色彩复杂程度计算模块用于计算视觉熵VE。
在上述具体实施方式的具体内容中,各技术特征可以进行任意不矛盾的组合,为使描述简洁,未对上述各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;例如实施例中水流量传感器的计算公式并不仅限于实施例中举例的公式,不同的种类的水流量传感器的计算公式各不相同。上述的是实施例的限定并不能理解为对本专利的限制。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (15)

1.一种基于街景图片及机器学习的城市内部贫困空间测度方法,其特征在于,包括以下步骤:
根据人口普查数据构建多重剥夺指数IMD;
在地图信息数据库中获取目标区域的街景图像数据;
通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据;
基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子;
将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数;
根据城市贫困分数对城市的贫困程度进行评估。
2.根据权利要求1所述的城市内部贫困空间测度方法,其特征在于,所述的“根据人口普查数据构建多重剥夺指数IMD”包括以下子内容:
根据人口普查数据得到P个维度数据,每个维度的数据对应一个比例权重λ;
所述的多重剥夺指数IMD通过下式进行表达:
Figure FDA0003575705870000011
式中,所述的Ej表示第j个纬度数据的数值。
3.根据权利要求2所述的城市内部贫困空间测度方法,其特征在于,所述的P=4,所述的4个维度数据分别是收入领域数据、教育领域数据、就业领域数据和住房领域数据,所述的收入领域数据的数值是E1,收入领域数据的比例权重是0.303;所述的教育领域数据的数值是E2,教育领域数据的比例权重是0.212;所述的就业领域数据的数值是E3,就业领域数据的比例权重是0.182;所述的住房领域数据的数值是E4,住房领域数据的比例权重是0.303;所述的多重剥夺指数IMD通过下式进行表达:
IMD=E1*0.303+E2*0.212+E3*0.182+E4*0.303。
4.根据权利要求3所述的城市内部贫困空间测度方法,其特征在于,所述的E1通过下式进行表达:
E1=产业工人比例j11+低端服务业比例j12+离婚丧偶比例j13
所述的产业工人比例j11通过下式进行表达:
产业工人比例j11=(采矿业的人口数+制造业的人口数)/就业总人数
所述的低端服务业比例j12通过下式进行表达:
低端服务业比例j12=(电力、煤气及水的生产和供应业的人口数+批发和零售业的人口数+住宿和餐饮业的人口数+房地产业的人口数)/就业总人数
所述的离婚丧偶比例j13通过下式进行表达:
离婚丧偶比例j13=离婚及丧偶人口数/15岁及以上未婚人口与有配偶人口数之和。
5.根据权利要求3所述的城市内部贫困空间测度方法,其特征在于,所述的E2通过下式进行表达:
E2=低教育水平j21+离校没有文凭比例j22
所述的低教育水平j21通过下式进行表达:
低教育水平j21=未上过学、小学、初中的人口数/总人口
所述的离校没有文凭比例j22通过下式进行表达:
离校没有文凭比例j22=没有文凭的人口数/总人口。
6.根据权利要求3所述的城市内部贫困空间测度方法,其特征在于,所述的E3通过下式进行表达:
E3=失业比例j31=没有工作的人口数/总人口。
7.根据权利要求3所述的城市内部贫困空间测度方法,其特征在于,所述的E4通过下式进行表达:
E4=每平方米住的人口比例j41+无清洁能源比例j42+无自来水比例j43+无厨房比例j44+无厕所比例j45+无热水比例j46
所述的每平方米住的人口比例j41通过下式进行表达:
每平方米住的人口比例j41=1/人均住房建筑面积(平方米/人)
所述的无清洁能源比例j42通过下式进行表达:
无清洁能源比例j42=煤炭、柴草、其他能源使用的家庭户数/总家庭户数
所述的无自来水比例j43通过下式进行表达:
无自来水比例j43=无自来水的家庭户数/总家庭户数
所述的无厨房比例j44通过下式进行表达:
无厨房比例j44=无厨房的家庭户数/总家庭户数
所述的无厕所比例j45通过下式进行表达:
无厕所比例j45=无厕所的家庭户数/总家庭户数
所述的无热水比例j46通过下式进行表达:
无热水比例j46=无热水的家庭户数/总家庭户数。
8.根据权利要求1至7中任一权利要求所述的城市内部贫困空间测度方法,其特征在于,所述的“在地图信息数据库中获取目标区域的街景图像数据”包括以下子步骤:
在地图信息数据库中获取目标区域的路网信息;
根据目标区域的路网信息,按照距离D进行间隔性采样,得到目标区域的采样点;
针对每一个目标区域的采样点得到M*L张图像数据,定义所有目标区域的采样点的图像数据的结合集合为目标区域的街景图像数据集合,所述的M*L张图像数据表示每一个竖直方向视角下取M张相互不同方向的图像数据,有L个竖直方向视角。
9.根据权利要求8所述的城市内部贫困空间测度方法,其特征在于,所述的距离D=100米。
10.根据权利要求8所述的城市内部贫困空间测度方法,其特征在于,所述的M=4,L=2;所述的采样点按照第一个竖直方向视角的前后左右四个方向和第二个竖直方向视角的前后左右四个方向取得8张图像数据。
11.根据权利要求8所述的城市内部贫困空间测度方法,其特征在于,所述的“通过图像分割技术,将目标区域的街景图像数据分割为若干块街景图像数据”包括以下子步骤:
对目标区域的街景图像数据集合进行抽样,得到抽样结果;
在抽样结果中,将每一个抽样点的每一个竖直方向视角的M张相互不同方向的图像数据进行拼合,得到对应抽样点在设定竖直方向视角的全域图像;
将所有抽样点的每一个竖直方向视角的全域图像的集合定义为目标区域的采样点的抽样集合;
通过现有的图像分割技术,判断最适合目标区域的采样点的抽样集合的图像分割技术,所得的结果定义为目标区域的采样点的最佳图像分割技术;
通过目标区域的采样点的最佳图像分割技术将目标区域的采样点对应的目标区域的街景图像数据集合进行图像分割,所得的结果定义为若干块街景图像数据。
12.根据权利要求8所述的城市内部贫困空间测度方法,其特征在于,所述的“基于若干块街景图像数据,结合主成分分析法,得到主因子,将主因子定义为街景因子”包括以下子步骤:
基于若干块街景图像数据,得到街景指标,所述的街景指标包括天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure、色彩要素、显著区域特征SRS、视觉熵VE,其中,所述的色彩要素包括街景图像数据的明度和饱和度;
所述的天空开敞指数Psky通过下式进行计算:
Figure FDA0003575705870000041
式中,所述的NSi为第i块街景图像数据中天空的像素数;所述的Ni是第i块街景图像数据中的总像素数;
所述的绿视率Pgreen通过下式进行计算:
Figure FDA0003575705870000042
式中,所述的NGi为第i块街景图像数据中植被的像素数;
所述的路面占比Proad通过下式进行计算:
Figure FDA0003575705870000043
式中,所述的NRi为第i块街景图像数据中道路的像素数;
所述的建筑占比Pbuilding通过下式进行计算:
Figure FDA0003575705870000044
式中,所述的NBi为第i块街景图像数据中建筑的像素数;
所述的界面围合度Penclosure通过下式进行计算:
Penclosure=Pgreen+Pbuilding
所述的显著区域特征SRS通过下式进行计算:
Figure FDA0003575705870000051
所述的max(R,G,B)表示第i块街景图像数据中颜色分量中的最大值;所述的min(R,G,B)表示第i块街景图像数据中颜色分量中的最小值;
所述的视觉熵VE通过下式进行计算:
Figure FDA0003575705870000052
所述的Pi表示第i块街景图像数据的概率,用于表征熵枝值;
将街景指标作为主成分分析法的输入变量,得到输出变量主因子。
13.根据权利要求1、2、3、4、5、6、7、9、10、11或12所述的城市内部贫困空间测度方法,其特征在于,所述的“机器学习算法”是随机森林算法。
14.基于权利要求1~13中任一权利要求所述的城市内部贫困空间测度方法的一种基于街景图片及机器学习的城市内部贫困空间测度系统,其特征在于,包括图像获取模块、图像分割模块、图片组合模块、街景指标模块和城市贫困分数计算模块,其中,
所述的图像获取模块用于获取目标区域的街景图像数据;
所述的图片组合模块用于将采样点的相同的竖直方向视角的M张不同方向的图像数据进行拼合,得到目标区域的街景图像数据;
所述的图像分割模块用于将目标区域的街景图像数据分割为若干块街景图像数据;
所述的街景指标模块用于计算目标区域的街景指标;
所述的城市贫困分数计算模块将多重剥夺指数IMD和街景因子作为机器学习算法的输入变量,得到城市贫困分数。
15.根据权利要求14所述的城市内部贫困空间测度系统,其特征在于,所述的街景指标模块包括图像要素像元占比计算模块和色彩复杂程度计算模块,其中,
所述的图像要素像元占比计算模块用于计算天空开敞指数Psky、绿视率Pgreen、路面占比Proad、建筑占比Pbuilding、界面围合度Penclosure
所述的色彩复杂程度计算模块用于计算视觉熵VE。
CN202080001052.4A 2020-06-09 2020-06-09 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统 Active CN111937016B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/095204 WO2021248335A1 (zh) 2020-06-09 2020-06-09 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统

Publications (2)

Publication Number Publication Date
CN111937016A CN111937016A (zh) 2020-11-13
CN111937016B true CN111937016B (zh) 2022-05-17

Family

ID=73333858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080001052.4A Active CN111937016B (zh) 2020-06-09 2020-06-09 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统

Country Status (2)

Country Link
CN (1) CN111937016B (zh)
WO (1) WO2021248335A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282934A (zh) * 2021-03-30 2022-04-05 华南理工大学 一种基于手机信令数据的城市低收入人群分布预测方法、系统及存储介质
CN114565300B (zh) * 2022-03-04 2022-12-23 中国科学院生态环境研究中心 一种公众主观情感量化方法、系统及电子设备
CN114358660B (zh) * 2022-03-10 2023-01-24 武汉市规划研究院 一种城市街道品质评估方法、系统及存储介质
CN117079124B (zh) * 2023-07-14 2024-04-30 北京大学 一种基于社群差异化的城乡景观意象量化及提升方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101830522B1 (ko) * 2016-08-22 2018-02-21 가톨릭대학교 산학협력단 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법
CN107944750A (zh) * 2017-12-12 2018-04-20 中国石油大学(华东) 一种贫困深度分析方法及系统
CN109523125A (zh) * 2018-10-15 2019-03-26 广州地理研究所 一种基于dmsp/ols夜间灯光数据的贫困测度方法
CN109886103A (zh) * 2019-01-14 2019-06-14 中山大学 城市贫困分布测度方法
CN109948737A (zh) * 2019-04-08 2019-06-28 河南大学 基于大数据和机器学习的贫困空间分类识别方法和装置

Also Published As

Publication number Publication date
WO2021248335A1 (zh) 2021-12-16
CN111937016A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111937016B (zh) 一种基于街景图片及机器学习的城市内部贫困空间测度方法及系统
Chen et al. Delineating seasonal relationships between Suomi NPP-VIIRS nighttime light and human activity across Shanghai, China
CN111896680B (zh) 基于卫星遥感数据的温室气体排放分析方法及系统
WO2023168781A1 (zh) 一种基于时空交互关系的土壤镉风险预测方法
Xin et al. Monitoring urban expansion using time series of night-time light data: a case study in Wuhan, China
CN107688818A (zh) 一种基于卫星遥感影像特征分析的路径智能选择方法及系统
Yang et al. The impact analysis of water body landscape pattern on urban heat island: a case study of Wuhan City
Zheng et al. The desaturation method of DMSP/OLS nighttime light data based on vector data: Taking the rapidly urbanized China as an example
Amarsaikhan et al. Applications of remote sensing and geographic information systems for urban land-cover change studies in Mongolia
CN114005048A (zh) 基于多时相数据的土地覆盖变化与热环境影响研究方法
Pan et al. Spatiotemporal dynamics of electricity consumption in China
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
Bao et al. High‐resolution quantification of building stock using multi‐source remote sensing imagery and deep learning
CN113901348A (zh) 一种基于数学模型的钉螺分布影响因素识别与预测方法
Feng et al. Research on the construction of intelligent management platform of garden landscape environment system based on remote sensing images
CN114626966A (zh) 一种基于景观格局量化城市大型蓝绿空间降温规模的方法
CN110321528B (zh) 一种基于半监督地理空间回归分析的高光谱影像土壤重金属浓度评估方法
CN117131441A (zh) 夜间光污染监测方法、装置、计算机设备和存储介质
Sharma et al. Urban Green Space Planning and Development in Urban Cities Using Geospatial Technology: A Case Study of Noida
CN115829163A (zh) 基于多模式集成的长江中下游流域径流预测方法和系统
Chen et al. Urban land surface temperature retrieval from high spatial resolution thermal infrared image using a modified split-window algorithm
CN115238967A (zh) 一种结合云图和相邻电站集群的光伏功率预测方法及装置
Kazazi et al. Emerging paradigm shift in urban indicators: Integration of the vertical dimension
Haghparast et al. Comprehensive Environmental Monitoring based on Stations of Environmental Pollutants (Air, Water and Soil) in Tehran
Wang et al. A framework for analyzing energy consumption in urban built-up areas based on single photonic radar and spatial big data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant