CN111639672A - 一种基于多数投票的深度学习城市功能区分类方法 - Google Patents

一种基于多数投票的深度学习城市功能区分类方法 Download PDF

Info

Publication number
CN111639672A
CN111639672A CN202010329285.9A CN202010329285A CN111639672A CN 111639672 A CN111639672 A CN 111639672A CN 202010329285 A CN202010329285 A CN 202010329285A CN 111639672 A CN111639672 A CN 111639672A
Authority
CN
China
Prior art keywords
block
classification
deep learning
functional area
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010329285.9A
Other languages
English (en)
Other versions
CN111639672B (zh
Inventor
孟庆岩
孙震辉
赵茂帆
张颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202010329285.9A priority Critical patent/CN111639672B/zh
Publication of CN111639672A publication Critical patent/CN111639672A/zh
Application granted granted Critical
Publication of CN111639672B publication Critical patent/CN111639672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

城市功能区分类以往研究多基于POI等社会属性数据与其他数据融合,但基于社会属性数据进行功能区分类存在一些不容忽视的问题。本发明针对上述问题,公开了一种基于多数投票的深度学习城市功能区分类方法,用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。本发明的目的通过以下技术步骤实现:步骤1)图像和矢量的预处理。步骤2)为针对深度学习需要大量的样本问题,进行样本制作。步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于GoogLeNet进行迁移学习。步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。步骤5)利用多数投票策略确定最终分类结果。

Description

一种基于多数投票的深度学习城市功能区分类方法
技术领域
本发明设计了一种基于多数投票的深度学习城市功能区分类方法,对城市功能区分类取得很好分类效果,能较好地形成城市功能区分类流程,具有较高实用价值,为功能区分类提供了参考依据。
背景技术
城市功能区(如商业,住宅和工业区)是城市规划的基本单元,含有很强的人文社会属性,往往是城市规划部门十分关注的对象。在以往基于高分辨率遥感城市的研究中,往往侧重于对城市地表覆盖的分类。而对于功能区的分类也通常依赖于POI等社会属性的数据。近期,研究人员尝试从高分辨率卫星图像中自动提取功能区,并取得了很好效果,但基于高分卫星进行城市功能区自动分类工作研究不多。
基于高空间分辨率遥感数据的城市功能区分类是指仅使用单一的高空间分辨率遥感数据完成建成区分类。目前尽管相关研究较少,但逐渐成为功能区分类的一个热点分支,其中张修远和杜世宏等做了大量工作。Zhang等(Zhang,et al.,2018)针对城市功能区分类提出了一种新的分割方法——地理场景分割方法,它可以通过考虑其特征和空间模式聚合不同城市物体来识别多尺度的功能区。该方法首先提取空间模式特征以表征不同对象的空间排列,其中对象由经典的面向对象方法生成。其次,使用地理场景分割方法来提取城市功能区。它聚合不同级别、不同类型的对象,然后覆盖多级对象簇以生成地理场景。进而,使用不同尺度的参数进行地理场景分割,选择合适参数完成城市功能区分类。Zhang等(Zhang,et al.,2018)基于HSC方法提出了一种迭代的功能区分类方法,该方法集成了自下而上和自上而下的土地覆盖和功能区分类过程。其首先采用分HSC对土地覆盖和功能区进行自下而上的分类。HSC本质上是一个分层贝叶斯模型,它将视觉特征、土地覆盖、空间对象模式和功能区域与分层结构联系起来。然后,提出了一种自上而下的反馈方法,即逆层次语义认知(IHSC)来优化初始分类结果。最后,迭代执行这两个过程以产生越来越精确的结果,完成功能区的分类。作者以北京为例使用该方法进行功能区分类,发现分类结果的精度提高了6.5%。 Zhang等(Zhang,et al.,2018)提出了一种新的场景特征来测量空间物体关系,然后将其与主题模型结合进行城市场景分类。该方法首先提出语义和空间共现概率(SSCP)的场景特征,通过考虑它们的方向、距离和语义来测量物体间的空间关系,从而解决测量空间物体关系中的三个关键问题,即各向异性、尺度和语义依赖性。然后,采用半单元Dirichlet对场景进行分类。得益于深度学习场景分类的优势,Huang等(Huang,et al.,2018)提出了一种基于STDCNN的城市功能区分类方法。该方法首先对街区和道路的高空间分辨率图像和矢量数据进行预处理,并基于预设的功能区类别对STDCNN模型进行训练。然后使用基于骨架的分解方法将大的高空间分辨率多光谱图像分解成小的处理单元。随后,将训练的 STDCNN模型用于不同的土地利用类别的分类。最后,根据街区矢量数据,将处理单元的土地利用标签合并到大的土地利用地图中,完成功能区分类。Yao等 (Yao,et al.,2017)基于迁移学习的遥感图像方法提取特征和分类,从而完成城市功能区分类。该方法首先基于标准的土地覆盖数据集(UC-Merced和WHU-SIRI) 对GoogLeNet模型进行迁移学习来对土地覆盖图像进行分类。然后将土地覆盖类型的每个多尺度样本转换为单词,并以地块为单位计算单词频率。最后,使用TF-IDF算法将每个地块中的单词频率转换为语义特征,并通过随机森林(RFA) 分类器完成城市功能区分类。
本发明结合深度学习技术,提出了一种街区单元约束下多数投票的深度学习功能区分类方法,用于从高分影像中进行城市功能区分类。
发明内容
针对现有技术中存在的问题,本发明的目的在于提出一种基于多数投票的深度学习城市功能区分类方法,用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。
本发明的目的通过以下技术步骤实现:
步骤1)图像和矢量的预处理。
步骤2)为针对深度学习需要大量的样本问题,进行样本制作。
步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于 GoogLeNet进行迁移学习。
步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。
步骤5)利用多数投票策略确定最终分类结果。
进一步,所述步骤2)的具体方法为:利用多尺度随机采样策略制作不同尺度的样本。
进一步,所述步骤3)的具体方法为:选用GoogLeNet作为城市功能区分类的基本框架,并将全连接层输出类的数量由1000改为6。
附图说明
图1技术路线图;
图2多尺度的随机采样图;
图3随机点生成图。
图4保定分类结果图
具体实施方式
下面结合附图1对本发明“一种基于多数投票的深度学习城市功能区分类方法”作进一步阐述说明。
(一)图像和矢量的预处理
首先,将高分辨率影像与矢量文件投影到相同的地理参考坐标系中,本研究中采用的地理参考坐标系为UTM/WGS84。然后,将矢量文件与该坐标系中的影像进行配置。对于影像,图像的分辨率首先被重采样到1米,然后使用z-score 法对图像各个波段进行归一化。在归一化图像中,低于-1的值被设置为-1,高于 1的值被设置为1。最后,图像被线性地拉伸到[0,255]。这种归一化方法不仅减少了数据量,而且还为影像的城市功能区分类保留了足够的空间和光谱信息。由于高分相机幅宽较窄,因此部分矢量超出了影像范围,同时为了和外围的一些主要干道的矢量保持一致,因此需要对轮廓矢量进行必要的编辑。
(二)样本的制作
为方便样本制作,采用如下公式获取不同的尺度,
S=Rα
其中,R为深度学习模型需要的尺寸,α为尺度变化因子。一旦α确定以后,就可以获得S的尺寸,从而可以获得尺寸为S大小的样本。最后将尺度S的样本拉伸到R的尺寸以满足深度学习模型的输入要求。通过调整尺度变化因子以获得不同尺度的样本,如附图2所示。
(三)迁移学习
考虑到GoogLeNet训练速度快,占用内存小的优势,选用GoogLeNet作为城市功能区分类的基本框架。由于Image Net图像数据和高分遥感影像数据具有很强的相关性,因此可以使用模型更加深层的特征,“冻结”全连接层之前的所有层,并将全连接层输出类的数量由1000改为6,以适合分类要求。
(四)随机采样
确定随机点的个数为图像总像素大小的万分之五,假如图像的尺寸为100× 100,那么随机点的个数就是5个,附图3展示了随机点(蓝色十字)在街区上的分布。
多尺度的采样策略步骤如下:(1)设置不同采样窗口的大小;(2)获取随机点的位置,判断随机点的采样窗口是否超出街区的外接矩形,并将超出范围的随机点的坐标进行调整,确保采样窗口在街区的外接矩阵内;(3)判断采样窗口是否包含街区内部足够的像素,如果采样窗口包含了80%以上本街区的像素点,则认为该采样单元有效,对于小于输入尺寸的街区,且有效像素小于80%,首先需要重采样,以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸,以便于模型的预测。通过以上随机点密集采样的策略,可以有效的判断该街区的功能区类别。
(五)多数投票
利用了密集随机采样策略获得大量候选处理单元,每个候处理单元被送入深度学习模型之后,可以获得一个唯一的类别,如果街区单元被标定为某一类别次数最多,即某一类别获得的票数最高,则该街区单元被标为该类别,结果如附图4。

Claims (4)

1.一种基于多数投票的深度学习城市功能区分类方法,该方法包括如下步骤:
步骤1)图像和矢量的预处理
步骤2)为针对深度学习需要大量的样本问题,进行样本制作
步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于GoogLeNet进行迁移学习
步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理
步骤5)利用多数投票策略确定最终分类结果。
2.如权利要求书1所述的方法,其特征在于,所述步骤3)的具体方法为:
选用GoogLeNet作为城市功能区分类的基本框架,并将全连接层输出类的数量由1000改为6。
3.如权利要求书1所述的方法,其特征在于,所述步骤4)的具体方法为:
a)设置不同采样窗口的大小;b)获取随机点的位置,判断随机点的采样窗口是否超出街区的外接矩形,并将超出范围的随机点的坐标进行调整,确保采样窗口在街区的外接矩阵内;c)判断采样窗口是否包含街区内部足够的像素,如果采样窗口包含了80%以上本街区的像素点,则认为该采样单元有效,对于小于输入尺寸的街区,且有效像素小于80%,首先需要重采样,以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸,以便于模型的预测。通过以上随机点密集采样的策略,可以有效的判断该街区的功能区类别。
4.如权利要求书1所述的方法,其特征在于,所述步骤5)的具体方法为:
利用了密集随机采样策略获得大量候选处理单元,每个候处理单元被送入深度学习模型之后,可以获得一个唯一的类别,如果街区单元被标定为某一类别次数最多,即某一类别获得的票数最高,则该街区单元被标为该类别。
CN202010329285.9A 2020-04-23 2020-04-23 一种基于多数投票的深度学习城市功能区分类方法 Active CN111639672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010329285.9A CN111639672B (zh) 2020-04-23 2020-04-23 一种基于多数投票的深度学习城市功能区分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010329285.9A CN111639672B (zh) 2020-04-23 2020-04-23 一种基于多数投票的深度学习城市功能区分类方法

Publications (2)

Publication Number Publication Date
CN111639672A true CN111639672A (zh) 2020-09-08
CN111639672B CN111639672B (zh) 2023-12-19

Family

ID=72331885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010329285.9A Active CN111639672B (zh) 2020-04-23 2020-04-23 一种基于多数投票的深度学习城市功能区分类方法

Country Status (1)

Country Link
CN (1) CN111639672B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657324A (zh) * 2021-08-24 2021-11-16 速度时空信息科技股份有限公司 基于遥感影像地物分类的城市功能区识别方法
CN116956133A (zh) * 2023-07-26 2023-10-27 中国地震局地质研究所 基于时序手机信令数据和机器学习的建筑功能识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991382A (zh) * 2017-03-13 2017-07-28 南京信息工程大学 一种遥感场景分类方法
CN107704864A (zh) * 2016-07-11 2018-02-16 大连海事大学 基于图像对象性语义检测的显著目标检测方法
US20190114510A1 (en) * 2017-10-12 2019-04-18 Lawrence Livermore National Security, Llc Multi-scale deep learning system
CN111008575A (zh) * 2019-11-25 2020-04-14 南京邮电大学 一种基于多尺度上下文信息融合的鲁棒人脸识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704864A (zh) * 2016-07-11 2018-02-16 大连海事大学 基于图像对象性语义检测的显著目标检测方法
CN106991382A (zh) * 2017-03-13 2017-07-28 南京信息工程大学 一种遥感场景分类方法
US20190114510A1 (en) * 2017-10-12 2019-04-18 Lawrence Livermore National Security, Llc Multi-scale deep learning system
CN111008575A (zh) * 2019-11-25 2020-04-14 南京邮电大学 一种基于多尺度上下文信息融合的鲁棒人脸识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YANSHENG LI 等: "Learning Deep Networks under Noisy Labels for Remote Sensing Image Scene Classification", IGARSS 2019 - 2019 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM *
蒋树龙: ""基于深度学习的遥感影像场景分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
蒋树龙: ""基于深度学习的遥感影像场景分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 April 2020 (2020-04-15), pages 27 - 33 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657324A (zh) * 2021-08-24 2021-11-16 速度时空信息科技股份有限公司 基于遥感影像地物分类的城市功能区识别方法
CN116956133A (zh) * 2023-07-26 2023-10-27 中国地震局地质研究所 基于时序手机信令数据和机器学习的建筑功能识别方法
CN116956133B (zh) * 2023-07-26 2024-02-27 中国地震局地质研究所 基于时序手机信令数据和机器学习的建筑功能识别方法

Also Published As

Publication number Publication date
CN111639672B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
Huang et al. Urban land-use mapping using a deep convolutional neural network with high spatial resolution multispectral remote sensing imagery
CN110263717B (zh) 一种融入街景影像的土地利用类别确定方法
CN110929607B (zh) 一种城市建筑物施工进度的遥感识别方法和系统
Huang et al. Urban functional zone mapping by integrating high spatial resolution nighttime light and daytime multi-view imagery
Hu et al. Impervious surface area extraction from IKONOS imagery using an object-based fuzzy method
CN111598101B (zh) 基于遥感影像场景分割的城区智能提取方法、系统及设备
CN109325502B (zh) 基于视频渐进区域提取的共享单车停放检测方法和系统
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
Liu et al. Deep multi-level fusion network for multi-source image pixel-wise classification
CN113223042B (zh) 一种遥感影像深度学习样本智能采集方法及设备
Su et al. Urban scene understanding based on semantic and socioeconomic features: From high-resolution remote sensing imagery to multi-source geographic datasets
Wang et al. Urban development analysis using built-up area maps based on multiple high-resolution satellite data
CN116935226B (zh) 一种基于HRNet的改进型遥感图像道路提取方法、系统、设备及介质
CN111639672B (zh) 一种基于多数投票的深度学习城市功能区分类方法
CN111242223B (zh) 一种基于街景影像多特征融合的街道空间品质评价方法
Zhang et al. Impervious surface extraction from high-resolution satellite image using pixel-and object-based hybrid analysis
Xiu et al. 3D semantic segmentation for high-resolution aerial survey derived point clouds using deep learning
CN102945550B (zh) 一种基于高斯尺度空间构建遥感影像语义的方法
CN114332921A (zh) 基于改进聚类算法的Faster R-CNN网络的行人检测方法
Liu et al. Density saliency for clustered building detection and population capacity estimation
CN114898089A (zh) 一种融合高分影像和poi数据的功能区提取与分类方法
Chen et al. Mapping urban functional areas using multi-source remote sensing images and open big data
Li et al. Learning to holistically detect bridges from large-size vhr remote sensing imagery
Engstrom et al. Evaluating the Relationship between Contextual Features Derived from Very High Spatial Resolution Imagery and Urban Attributes: A Case Study in Sri Lanka
Zhang et al. Semantic segmentation of traffic scene based on DeepLabv3+ and attention mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant