CN112183879A - 一种城市功能区的分类方法及装置、电子设备和存储介质 - Google Patents

一种城市功能区的分类方法及装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112183879A
CN112183879A CN202011096085.XA CN202011096085A CN112183879A CN 112183879 A CN112183879 A CN 112183879A CN 202011096085 A CN202011096085 A CN 202011096085A CN 112183879 A CN112183879 A CN 112183879A
Authority
CN
China
Prior art keywords
urban
functional
characteristic
city
characteristic word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011096085.XA
Other languages
English (en)
Inventor
杜世宏
杜守基
张修远
刘波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202011096085.XA priority Critical patent/CN112183879A/zh
Publication of CN112183879A publication Critical patent/CN112183879A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/043Optimisation of two dimensional placement, e.g. cutting of clothes or wood
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/176Urban or other man-made structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种城市功能区的分类方法及装置、电子设备和存储介质,其中,城市功能区的分类方法包括:获取遥感影像数据的多个特征单词组,其中,特征单词组包括自然属性特征单词组和社会属性特征单词组,对遥感影像数据进行分割,生成至少一个城市功能区;在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据城市功能区的目标特征单词确定城市功能区的主题分布;基于城市功能区的主题分布,对城市功能区进行分类。由于本方法中的目标特征单词融合了自然属性特征数据和社会属性特征数据,所以确定的城市功能区的主题分布会更加全面和客观,可以在城市功能区的分类过程中获得更高的精度。

Description

一种城市功能区的分类方法及装置、电子设备和存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种城市功能区的分类方法及装置、电子设备和存储介质。
背景技术
城市化进程使得城市内部产生了各种功能区,作为不同社会经济活动的空间载体,满足人们对生活、工作、教育和公共服务的多样化需求,如居民区、商业区、工业区、棚户区以及学校等。城市功能区通常被用作城市规划和管理的基本单元,对于揭示城市的社会和物理特征至关重要,并且可以实现各种有价值的应用,例如住宅搬迁、商业选址和城市交通规划等,此外还被用于经济影响评估和人口统计学研究等。
现有的城市功能区分类方法基于高分辨率遥感影像进行分类。影像数据提供了丰富的自然属性特征数据,如光谱、纹理、形状等,因此自然属性特征数据常被用于功能区分类。但是对于一个功能区,其往往由各种不同的地物组成,环境复杂,土地利用性质与人类的社会经济活动具有更强的相关性,仅仅利用影像数据进行功能区的分类较为困难。
另外,随着大数据时代的到来,越来越多的社会属性特征数据可以被用于城市功能区分析,如手机定位数据、POI数据以及出租车轨迹数据等。社会属性特征数据的采用可以提高功能区的识别精度,尤其是商业区、居住区等,但是社会感知数据往往是有偏差的,比如POI数据中商业类POI更多,而且偏远地区的POI数据很少,因此,仅仅利用社会感知数据进行功能区的分析具有一定的局限性。
如何融合自然属性特征数据与社会属性特征数据,从而在城市功能区的分类过程中获得更高的精度,是目前急需解决的问题。
发明内容
针对现有技术中存在的技术问题,本发明实施例提供了一种城市功能区的分类方法及装置、电子设备和存储介质,以解决现有技术中存在的技术缺陷。
本发明实施例提供了一种城市功能区的分类方法,所述方法包括:
获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
对遥感影像数据进行分割,生成至少一个城市功能区;
在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
基于所述城市功能区的主题分布,对所述城市功能区进行分类。
根据本发明一个实施例的城市功能区的分类方法,获取遥感影像数据的多个特征单词组,包括:
在所述遥感影像数据中设置滑动窗口,提取每个滑动窗口中的影像数据的光谱特征和至少一类景观指数特征;
对所述光谱特征和至少一类景观指数特征分别进行聚类,得到每一类特征对应的特征单词,将每一类特征单词作为一个自然属性特征单词组。
根据本发明一个实施例的城市功能区的分类方法,获取遥感影像数据的多个特征单词组,包括:
获取所述遥感影像数据对应的多个类别的兴趣点数据;
将每个类别的兴趣点数据作为一个特征单词,并基于所述特征单词生成社会属性特征单词组。
根据本发明一个实施例的城市功能区的分类方法,在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,包括:
选取每个城市功能区的目标像素,获取以该目标像素为中心的影像窗口,计算所述影像窗口的光谱特征和至少一类景观指数特征;
将所述影像窗口的光谱特征和至少一类景观指数特征分别与对应类别的所述自然属性特征组内的特征单词进行欧氏距离对比,在每个自然属性特征组内将欧氏距离最近的特征单词作为所述城市功能区的目标特征单词。
根据本发明一个实施例的城市功能区的分类方法,在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,包括:将社会属性特征单词组内与所述城市功能区包含的至少一个兴趣点数据对应的特征单词作为所述城市功能区的目标特征单词。
根据本发明一个实施例的城市功能区的分类方法,根据每个城市功能区的目标特征单词确定所述城市功能区的主题分布,包括:
将所述城市功能区的目标特征单词输入至文档主题生成模型,生成所述城市功能区的主题分布。
根据本发明一个实施例的城市功能区的分类方法,基于所述城市功能区的主题分布,对所述城市功能区进行分类,包括:
将所述城市功能区的主题分布输入至训练好的分类器中,对所述城市功能区进行分类。
本发明实施例提供了一种城市功能区的分类装置,包括:
提取模块,用于获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
分割模块,用于对遥感影像数据进行分割,生成至少一个城市功能区;
确定模块,用于在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
分类模块,用于基于所述城市功能区的主题分布,对所述城市功能区进行分类。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述城市功能区的分类方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述城市功能区的分类方法的步骤。
本发明实施例提供的城市功能区的分类方法及装置,通过获取遥感影像数据的多组自然属性特征数据和社会属性特征数据,然后根据每组特征数据提取特征单词,再确定用于表达每个城市功能区的目标特征单词,并根据每个城市功能区的目标特征单词确定所述城市功能区的主题分布,由于目标特征单词融合了自然属性特征数据和社会属性特征数据,所以确定的城市功能区的主题分布会更加全面和客观,最后基于城市功能区的主题分布对城市功能区进行分类,从而可以在城市功能区的分类过程中获得更高的精度。
附图说明
图1是本发明一实施例提供的城市功能区的分类方法的流程示意图;
图2是本发明另一实施例提供的城市功能区的分类方法的流程示意图;
图3是本发明一实施例提供的城市功能区的主题分布示意图;
图4是本发明一个具体实例中示出的试验区域示意图;
图5是本发明一个具体实例中的分类结果示意图;
图6是图5所示的分类结果中两个局部区域的示意图;
图7是本发明一实施例提供的城市功能区的分类装置的结构示意图;
图8是本发明一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
遥感影像(Remote Sensing Image):指的是纪录各种地物电磁波大小的胶片或相片,在遥感领域中主要是指航空图像和卫星图像。用计算机处理的遥感图像为数字图像。
自然属性特征数据:用于标识遥感影像自然地理以及物理属性的特征数据,例如光谱数据、纹理数据、形状数据、景观数据等。
社会属性特征数据:用于标识遥感影像的社会属性的数据,例如手机定位数据、POI数据以及出租车轨迹数据等。
SVM(Support Vector Machine,支持向量机):是常见的一种判别模型,用于二分类。在机器学习领域,SVM模型是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。
LDA(Latent Dirichlet Allocation,文档主题生成模型):也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语的过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。
在本发明实施例中,提供了一种城市功能区的分类方法及装置、电子设备及非暂态计算机可读存储介质,在下面的实施例中逐一进行详细说明。
本发明实施例公开了一种城市功能区的分类方法,参见图1,包括:
101、获取遥感影像数据的多个特征单词组。
其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词。
本实施例中,自然属性特征单词组和社会属性特征单词组均可以为多种,本实施例中可以选择光谱特征单词组、景观指数特征单词组作为自然属性特征单词组,选择兴趣点特征单词作为社会属性特征单词组。
其中,景观指数特征可以包括多种,例如包括PLAND(斑块所占景观面积的比例)、AI(斑块聚合度)、PD(斑块密度)、PAFRAC(周长面积分维数)等。本实施例可以选择其中的一种或多种。
其中,PLAND度量的是景观的组分。它计算的是某一斑块类型占整个景观的面积的相对比例;是帮助确定景观中优势景观元素的依据之一。其值趋于0时,说明景观中此斑块类型变得十分稀少,其值等于100时,说明整个景观只由一类斑块组成。
AI基于同类型斑块像元间公共边界长度来计算。当某类型中所有像元间不存在公共边界时,该类型的聚合程度最低;而当类型中所有像元间存在的公共边界达到最大值时,具有最大的聚合指数。
PD是景观格局分析的基本的指数,其单位为斑块数/100公顷,它表达的是单位面积上的斑块数,有利于不同大小景观间的比较。
PAFRAC反映了不同空间尺度的性状的复杂性。分维数取值范围一般应在1~2之间,其值越接近1,则斑块的形状就越有规律,或者说斑块就越简单,表明受人为干扰的程度越大;反之,其值越接近2,斑块形状就越复杂,受人为干扰程度就越小。
本实施例中,通过获取遥感影像数据的分别包含有自然属性和社会属性的特征单词,可以保证后续处理步骤中两种数据的有效融合,从而在城市功能区的分类过程中获得更高的精度。
102、对遥感影像数据进行分割,生成至少一个城市功能区。
本实施例中,城市功能区的获取方式可以有多种,例如直接通过在存储有城市功能区的存储区域下载获得、从网络中爬取获得或者根据遥感影像数据分割而得。
本实施例中,以根据遥感影像分割而得为例,将获取的遥感影像数据进行多分辨率分割,根据多分辨率分割的结果生成至少一个城市功能区。
其中,对于较大的城市,城市功能区较多,可以包括:中心商业区、行政区、工业区、文化(娱乐)区、居住区、仓库码头区、游憩区和郊区。中小城市的分区则相对简单或不明显。工业区、居住区和商业区是各类城市共有的、基本的功能区。
103、在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布。
例如,特征单词组包括4组,其中包括3组自然属性特征单词组和1组社会属性特征单词组。那么,就在每一组中选择用于表达每个城市功能区的目标特征单词。
其中,每一组选择的目标特征单词可以为1个,也可以为多个,本实施例中,可以在每组自然属性特征单词组中选择1个目标特征单词,在社会属性特征单词组中选择多个目标特征单词。
通过选择的目标特征单词,联合起来表达该城市功能区,进而根据选择的目标特征单词生成城市功能区的主题分布。
可选地,可以通过训练好的LDA模型来根据选择的目标特征单词生成城市功能区的主题分布。
104、基于所述城市功能区的主题分布,对所述城市功能区进行分类。
具体使用时,可以通过分类器基于城市功能区的主题分布对城市功能区进行分类。其中,分类器可以为多种,例如SVM分类器。
对于SVM分类器的训练,可以在城市功能区划分完毕后,人工选择一部分城市功能区作为样本,然后人工判断作为样本的城市功能区的类别,然后用这些标注好的城市功能区作为样本训练分类器,以分类剩余的未分类的城市功能区。
本发明实施例提供的城市功能区的分类方法,通过获取遥感影像数据的多组自然属性特征数据和社会属性特征数据,然后根据每组特征数据提取特征单词,再确定用于表达每个城市功能区的目标特征单词,并根据每个城市功能区的目标特征单词确定所述城市功能区的主题分布,由于目标特征单词融合了自然属性特征数据和社会属性特征数据,所以确定的城市功能区的主题分布会更加全面和客观,最后基于城市功能区的主题分布对城市功能区进行分类,从而可以在城市功能区的分类过程中获得更高的精度。
为了更详尽地对本发明实施例的方法进行说明,本发明实施例公开了一种城市功能区的分类方法,参见图2,包括:
201、获取遥感影像数据的多个特征单词组。
其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词。
具体地,对于自然属性特征单词组,步骤201包括:
S211、在所述遥感影像数据中设置滑动窗口,提取每个滑动窗口中的影像数据的光谱特征和至少一类景观指数特征。
以滑动窗口的形式在影像上计算每个窗口内的光谱特征:像素光谱的均值和方差,以及两个景观指数特征:PLAND和AI。设窗口大小为w,滑动步长为w,每个窗口计算的特征可表示为:
Speci={mean_1,std_1,mean_2,std_2,…,mean_m,std_m}
PLANDi={PLAND_1,PLAND_2,…,PLAND_c}
AIi={AI_1,AI_2,…,AI_c}
其中i为第i个窗口,mean和std是均值和方差,m是影像波段数,c是影像聚类类别数。
S212、对所述光谱特征和至少一类景观指数特征分别进行聚类,得到每一类特征对应的特征单词,将每一类特征单词作为一个自然属性特征单词组。
采用K-Means聚类方法对所计算的光谱特征,PLAND和AI分别进行聚类,每一个聚类中心作为一个单词,设每一类特征的聚类中心数目为k。
需要注意的是,聚类中心数目k与前述的第i个窗口之间并无关联。例如有50000个滑动窗口,i就是0-49999,而设置的聚类中心可能只有50,也就是k=50。
具体地,对于社会属性特征单词组,步骤201包括:
S213、获取遥感影像数据对应的多个类别的兴趣点数据。
S214、将每个类别的兴趣点数据作为一个特征单词,并基于所述特征单词生成社会属性特征单词组。
每一类兴趣点数据也作为一个特征单词。例如,兴趣点数据包括:公司、居民小区、机构、景点、饭店、商店等。兴趣点数据,不是根据影像分类获取的,而是从地图等平台上爬取的。例如在地图上搜索超市,上面会显示很多地点,这些点就是包括社会属性特征的兴趣点数据。
最终根据生成的自然属性特征单词组和社会属性特征单词组构建词汇表,如表1所示。从表1中可以看出,词汇表中共有3k+p个特征单词,其中p为兴趣点数据的类别数。
表1
类别 特征单词
光谱特征 Spec<sub>0</sub>,Spec<sub>1</sub>,Spec<sub>2</sub>,…,Spec<sub>k</sub>
PLAND PLAND<sub>0</sub>,PLAND<sub>1</sub>,PLAND<sub>2</sub>,…,PLAND<sub>k</sub>
AI AI<sub>0</sub>,AI<sub>1</sub>,AI<sub>2</sub>,…,AI<sub>k</sub>
兴趣点数据 公司,区民小区,机构,景点,饭店,商店,办公楼…
202、对遥感影像数据进行分割,生成至少一个城市功能区。
本实施例中,根据遥感影像进行分割,将获取的遥感影像数据进行多分辨率分割,根据多分辨率分割的结果生成至少一个城市功能区。
203、在每个特征单词组中确定用于表达每个城市功能区的目标特征单词。
具体地,对于自然属性特征组内的特征单词,步骤203包括:
S231、选取每个城市功能区的目标像素,获取以该目标像素为中心的影像窗口,计算影像窗口的光谱特征和至少一类景观指数特征。
S232、将所述影像窗口的光谱特征和至少一类景观指数特征分别与对应类别的所述自然属性特征组内的特征单词进行欧氏距离对比,在每个自然属性特征组内将欧氏距离最近的特征单词作为所述城市功能区的目标特征单词。
具体地,对于每一个功能区,按照一定的像素采样间隔选取一定数量的像素,然后获取以该像素为中心的影像窗口,窗口大小为w,计算该窗口的光谱特征PLAND和AI,将计算的三类特征与词汇表中相对应类别的单词分别计算欧式距离,距离最近的单词作为该窗口对应的单词,即每个窗口将对应3个单词。
每一个功能区的像素采样间隔采用下式(1)进行确定:
Figure BDA0002723779200000101
其中,Si是第i个城市功能区的像素采样间隔,Ni是第i个城市功能区包含的兴趣点数量,ANi是所有城市功能区平均兴趣点数量,Sb是预先设置的基本采样间隔。因此,一个城市功能区包含的兴趣点数量越多,基于影像的单词将会越少。假设一个城市功能区包含a个像素和b个兴趣点数据,那么最终该城市功能区将包含a/Si×3+b个单词。
具体地,对于社会属性特征组内的特征单词,处理流程相对较简单,步骤203包括:将社会属性特征单词组内与城市功能区包含的至少一个兴趣点数据对应的特征单词作为城市功能区的目标特征单词。
最终,将所有的单词联合起来表达该城市功能区,参见表2。
表2
Figure BDA0002723779200000111
204、将所述城市功能区的目标特征单词输入至文档主题生成模型,生成所述城市功能区的主题分布。
具体地,将上述表2中的数据输入至LDA模型,利用LDA获取每一个功能区的主题分布,将该主题分布作为功能区的语义特征。以其中一个城市功能区为例,城市功能区的主题分布如图3所示。
205、将所述城市功能区的主题分布输入至训练好的分类器中,对所述城市功能区进行分类。
本实施例中,可以选择训练好的SVM分类器,对城市功能区进行分类。
为了验证本发明实施例的方法的有效性,下面以一个具体实例对本发明实施例的城市功能区的分类方法进行验证。
为了验证本发明的效果,采用空间分辨率为2.1米的ZY-3影像以及从网络爬取的兴趣点数据进行实验,所在地区包括北京海淀、昌平以及朝阳部分地区,范围约为550平方公里,该区域包括了城市建成区、郊区以及农村,建筑风格复杂多样,包括居民区、商业区、工业区、棚户区、学校、开放区域等不同的功能区,有助于准确评价所提出方法的性能。实验区域如图4所示。
本方法分类结果如图5所示,并选择了两个局部区域来证明所提方法的有效性,如图6中的局部区域A和B所示。如图5所示,居住区占该区域的三分之一以上,大部分机构区(主要包括学校校园)位于南部建成区,而工业区、棚户区和开放区域主要位于北部郊区。对于图6中的两个局部区域A和B,环境较为复杂,包括住宅区、工业区、开放区域和棚户区等,结果表明,该分类方法对大多数功能区都有较好的识别效果。
混淆矩阵如表3所示。总体精度为85.9%,Kappa为0.82,表明该方法在功能区分类方面具有很大的可行性。开放区域由于其均匀的光谱和景观特征,获得了98.3%的最高生产者精度。居住区也获得了91.6%的较高生产者精度,因为居住区通常具有规则的空间模式,导致光谱和景观特征值相似。机构区的准确性最低,为72.7%。
其中,Kappa系数是一个用于一致性检验的指标,也可以用于衡量分类的效果。因为对于分类问题,所谓一致性就是模型预测结果和实际分类结果是否一致。Kappa系数的计算是基于混淆矩阵的,取值为-1到1之间,通常大于0。
从表3还可以看出,6个机构区被误分为居住区,6个居住区被误分为机构区,说明这两类功能区容易混淆,主要原因是大部分的机构区为高校校园,而校园内的许多宿舍与住宅楼混淆。10个工业区被错误地分为棚户区,这是因为在很多地区,工业区和棚户区通常混合在一起,而且在光谱特征上相似(建筑物通常有蓝色的屋顶)。
表3
Figure BDA0002723779200000121
其中,PA代表生产者精度,UA代表用户精度,OA代表总体精度。
本发明实施例采用LDA模型来提取城市功能区的主题分布。为了说明引入LDA模型的有效性,不采用LDA模型的结果如表4所示。当不采用LDA模型时,将词汇表中各单词的频率作为每一个功能区的特征。由表4可以看出,总体精度为79.9%,Kappa为0.75,且所有类别的功能区的精度都低于采用LDA模型的结果。由此可以说明,本发明实施例的方法采用LDA模型获取了较高的功能区分类精度。
表4
Figure BDA0002723779200000131
下面对本发明实施例提供的城市功能区的分类装置进行描述,下文描述的城市功能区的分类装置与上文描述的城市功能区的分类方法可相互对应参照。
本发明实施例提供的城市功能区的分类装置,参见图7,包括:
提取模块701,用于获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
分割模块702,用于对遥感影像数据进行分割,生成至少一个城市功能区;
确定模块703,用于在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
分类模块704,用于基于所述城市功能区的主题分布,对所述城市功能区进行分类。
可选地,提取模块701,具体用于:在所述遥感影像数据中设置滑动窗口,提取每个滑动窗口中的影像数据的光谱特征和至少一类景观指数特征;
对所述光谱特征和至少一类景观指数特征分别进行聚类,得到每一类特征对应的特征单词,将每一类特征单词作为一个自然属性特征单词组。
可选地,提取模块701,具体用于:获取所述遥感影像数据对应的多个类别的兴趣点数据;
将每个类别的兴趣点数据作为一个特征单词,并基于所述特征单词生成社会属性特征单词组。
可选地,确定模块703,具体用于:
选取每个城市功能区的目标像素,获取以该目标像素为中心的影像窗口,计算所述影像窗口的光谱特征和至少一类景观指数特征;
将所述影像窗口的光谱特征和至少一类景观指数特征分别与对应类别的所述自然属性特征组内的特征单词进行欧氏距离对比,在每个自然属性特征组内将欧氏距离最近的特征单词作为所述城市功能区的目标特征单词。
可选地,确定模块703,具体用于:将社会属性特征单词组内与所述城市功能区包含的至少一个兴趣点数据对应的特征单词作为所述城市功能区的目标特征单词。
可选地,确定模块703,具体用于:将所述城市功能区的目标特征单词输入至文档主题生成模型,生成所述城市功能区的主题分布。
可选地,分类模块704,具体用于:将所述城市功能区的主题分布输入至训练好的分类器中,对所述城市功能区进行分类。
本发明实施例提供的城市功能区的分类装置,通过获取遥感影像数据的多组自然属性特征数据和社会属性特征数据,然后根据每组特征数据提取特征单词,再确定用于表达每个城市功能区的目标特征单词,并根据每个城市功能区的目标特征单词确定所述城市功能区的主题分布,由于目标特征单词融合了自然属性特征数据和社会属性特征数据,所以确定的城市功能区的主题分布会更加全面和客观,最后基于城市功能区的主题分布对城市功能区进行分类,从而可以在城市功能区的分类过程中获得更高的精度。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行城市功能区的分类方法,包括:
获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
对遥感影像数据进行分割,生成至少一个城市功能区;
在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
基于所述城市功能区的主题分布,对所述城市功能区进行分类。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的城市功能区的分类方法,包括:
获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
对遥感影像数据进行分割,生成至少一个城市功能区;
在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
基于所述城市功能区的主题分布,对所述城市功能区进行分类。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例所提供的城市功能区的分类方法,包括:
获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
对遥感影像数据进行分割,生成至少一个城市功能区;
在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
基于所述城市功能区的主题分布,对所述城市功能区进行分类。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种城市功能区的分类方法,其特征在于,所述方法包括:
获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
对遥感影像数据进行分割,生成至少一个城市功能区;
在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
基于所述城市功能区的主题分布,对所述城市功能区进行分类。
2.根据权利要求1所述的城市功能区的分类方法,其特征在于,获取遥感影像数据的多个特征单词组,包括:
在所述遥感影像数据中设置滑动窗口,提取每个滑动窗口中的影像数据的光谱特征和至少一类景观指数特征;
对所述光谱特征和至少一类景观指数特征分别进行聚类,得到每一类特征对应的特征单词,将每一类特征单词作为一个自然属性特征单词组。
3.根据权利要求1所述的城市功能区的分类方法,其特征在于,获取遥感影像数据的多个特征单词组,包括:
获取所述遥感影像数据对应的多个类别的兴趣点数据;
将每个类别的兴趣点数据作为一个特征单词,并基于所述特征单词生成社会属性特征单词组。
4.根据权利要求2所述的城市功能区的分类方法,其特征在于,在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,包括:
选取每个城市功能区的目标像素,获取以所述目标像素为中心的影像窗口,计算所述影像窗口的光谱特征和至少一类景观指数特征;
将所述影像窗口的光谱特征和至少一类景观指数特征分别与对应类别的所述自然属性特征组内的特征单词进行欧氏距离对比,在每个自然属性特征组内将欧氏距离最近的特征单词作为所述城市功能区的目标特征单词。
5.根据权利要求3所述的城市功能区的分类方法,其特征在于,在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,包括:将社会属性特征单词组内与所述城市功能区包含的至少一个兴趣点数据对应的特征单词作为所述城市功能区的目标特征单词。
6.根据权利要求1所述的城市功能区的分类方法,其特征在于,根据每个城市功能区的目标特征单词确定所述城市功能区的主题分布,包括:
将所述城市功能区的目标特征单词输入至文档主题生成模型,生成所述城市功能区的主题分布。
7.根据权利要求1所述的城市功能区的分类方法,其特征在于,基于所述城市功能区的主题分布,对所述城市功能区进行分类,包括:
将所述城市功能区的主题分布输入至训练好的分类器中,对所述城市功能区进行分类。
8.一种城市功能区的分类装置,其特征在于,包括:
提取模块,用于获取遥感影像数据的多个特征单词组,其中,所述特征单词组包括自然属性特征单词组和社会属性特征单词组,每个特征单词组包括多个特征单词;
分割模块,用于对遥感影像数据进行分割,生成至少一个城市功能区;
确定模块,用于在每个特征单词组中确定用于表达每个城市功能区的目标特征单词,并根据所述城市功能区的目标特征单词确定所述城市功能区的主题分布;
分类模块,用于基于所述城市功能区的主题分布,对所述城市功能区进行分类。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述城市功能区的分类方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述城市功能区的分类方法的步骤。
CN202011096085.XA 2020-10-14 2020-10-14 一种城市功能区的分类方法及装置、电子设备和存储介质 Pending CN112183879A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011096085.XA CN112183879A (zh) 2020-10-14 2020-10-14 一种城市功能区的分类方法及装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011096085.XA CN112183879A (zh) 2020-10-14 2020-10-14 一种城市功能区的分类方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112183879A true CN112183879A (zh) 2021-01-05

Family

ID=73950013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011096085.XA Pending CN112183879A (zh) 2020-10-14 2020-10-14 一种城市功能区的分类方法及装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112183879A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733781A (zh) * 2021-01-20 2021-04-30 中国科学院地理科学与资源研究所 结合poi数据的城市功能区识别方法、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764193A (zh) * 2018-06-04 2018-11-06 北京师范大学 融合poi和遥感影像的城市功能区划分方法
CN109508585A (zh) * 2017-09-15 2019-03-22 中国科学院城市环境研究所 一种基于poi和高分辨率遥感影像提取城市功能区的方法
CN111582146A (zh) * 2020-05-06 2020-08-25 宁波大学 一种基于多特征融合的高分辨率遥感影像城市功能分区方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508585A (zh) * 2017-09-15 2019-03-22 中国科学院城市环境研究所 一种基于poi和高分辨率遥感影像提取城市功能区的方法
CN108764193A (zh) * 2018-06-04 2018-11-06 北京师范大学 融合poi和遥感影像的城市功能区划分方法
CN111582146A (zh) * 2020-05-06 2020-08-25 宁波大学 一种基于多特征融合的高分辨率遥感影像城市功能分区方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHOUJI DU等: "Large-scale urban functional zone mapping by integrating remote sensing images and open social data", 《GISCIENCE & REMOTE SENSING》, vol. 57, no. 3, pages 411 - 428 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733781A (zh) * 2021-01-20 2021-04-30 中国科学院地理科学与资源研究所 结合poi数据的城市功能区识别方法、存储介质和电子设备

Similar Documents

Publication Publication Date Title
Liu et al. Visualizing and exploring POI configurations of urban regions on POI-type semantic space
Pei et al. A new insight into land use classification based on aggregated mobile phone data
CN105045858B (zh) 基于投票的出租车载客点推荐方法
Hu et al. A framework for extracting urban functional regions based on multiprototype word embeddings using points-of-interest data
CN107247938A (zh) 一种高分辨率遥感影像城市建筑物功能分类的方法
CN110111338A (zh) 一种基于超像素时空显著性分割的视觉跟踪方法
CN108052966A (zh) 基于卷积神经网络的遥感图像场景自动提取和分类方法
CN111737605A (zh) 一种基于手机信令数据的出行目的识别方法及装置
CN106101222A (zh) 信息的推送方法和装置
Xu et al. Application of a graph convolutional network with visual and semantic features to classify urban scenes
CN109033944A (zh) 一种全天空极光图像分类与关键局部结构定位方法及系统
KR20180038169A (ko) 딥 러닝 기반의 데이터특징을 이용한 도시영상의 안전도 분류방법
Xiao et al. Building segmentation and modeling from airborne LiDAR data
CN109949063A (zh) 一种地址确定方法、装置、电子设备及可读存储介质
Wu et al. SALT: A multifeature ensemble learning framework for mapping urban functional zones from VGI data and VHR images
CN108898244B (zh) 一种耦合多源要素的数字标牌位置推荐方法
Tu et al. Scale effect on fusing remote sensing and human sensing to portray urban functions
Cho et al. Classifying tourists’ photos and exploring tourism destination image using a deep learning model
Hu et al. A framework to detect and understand thematic places of a city using geospatial data
CN115393666A (zh) 图像分类中基于原型补全的小样本扩充方法及系统
Ye et al. Land use classification from social media data and satellite imagery
CN114329240A (zh) 选址特征筛选方法、装置、电子设备及存储介质
CN117726884A (zh) 对象类别识别模型的训练方法、对象类别识别方法及装置
Zhou et al. Evaluating building color harmoniousness in a historic district intelligently: An algorithm-driven approach using street-view images
CN112183879A (zh) 一种城市功能区的分类方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination