CN111639672A - 一种基于多数投票的深度学习城市功能区分类方法 - Google Patents
一种基于多数投票的深度学习城市功能区分类方法 Download PDFInfo
- Publication number
- CN111639672A CN111639672A CN202010329285.9A CN202010329285A CN111639672A CN 111639672 A CN111639672 A CN 111639672A CN 202010329285 A CN202010329285 A CN 202010329285A CN 111639672 A CN111639672 A CN 111639672A
- Authority
- CN
- China
- Prior art keywords
- block
- classification
- deep learning
- functional area
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 239000013598 vector Substances 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000013526 transfer learning Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000002360 preparation method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims abstract description 5
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 4
- 238000005070 sampling Methods 0.000 claims description 22
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 230000004927 fusion Effects 0.000 abstract 1
- 238000011160 research Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
城市功能区分类以往研究多基于POI等社会属性数据与其他数据融合,但基于社会属性数据进行功能区分类存在一些不容忽视的问题。本发明针对上述问题,公开了一种基于多数投票的深度学习城市功能区分类方法,用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。本发明的目的通过以下技术步骤实现:步骤1)图像和矢量的预处理。步骤2)为针对深度学习需要大量的样本问题,进行样本制作。步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于GoogLeNet进行迁移学习。步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。步骤5)利用多数投票策略确定最终分类结果。
Description
技术领域
本发明设计了一种基于多数投票的深度学习城市功能区分类方法,对城市功能区分类取得很好分类效果,能较好地形成城市功能区分类流程,具有较高实用价值,为功能区分类提供了参考依据。
背景技术
城市功能区(如商业,住宅和工业区)是城市规划的基本单元,含有很强的人文社会属性,往往是城市规划部门十分关注的对象。在以往基于高分辨率遥感城市的研究中,往往侧重于对城市地表覆盖的分类。而对于功能区的分类也通常依赖于POI等社会属性的数据。近期,研究人员尝试从高分辨率卫星图像中自动提取功能区,并取得了很好效果,但基于高分卫星进行城市功能区自动分类工作研究不多。
基于高空间分辨率遥感数据的城市功能区分类是指仅使用单一的高空间分辨率遥感数据完成建成区分类。目前尽管相关研究较少,但逐渐成为功能区分类的一个热点分支,其中张修远和杜世宏等做了大量工作。Zhang等(Zhang,et al.,2018)针对城市功能区分类提出了一种新的分割方法——地理场景分割方法,它可以通过考虑其特征和空间模式聚合不同城市物体来识别多尺度的功能区。该方法首先提取空间模式特征以表征不同对象的空间排列,其中对象由经典的面向对象方法生成。其次,使用地理场景分割方法来提取城市功能区。它聚合不同级别、不同类型的对象,然后覆盖多级对象簇以生成地理场景。进而,使用不同尺度的参数进行地理场景分割,选择合适参数完成城市功能区分类。Zhang等(Zhang,et al.,2018)基于HSC方法提出了一种迭代的功能区分类方法,该方法集成了自下而上和自上而下的土地覆盖和功能区分类过程。其首先采用分HSC对土地覆盖和功能区进行自下而上的分类。HSC本质上是一个分层贝叶斯模型,它将视觉特征、土地覆盖、空间对象模式和功能区域与分层结构联系起来。然后,提出了一种自上而下的反馈方法,即逆层次语义认知(IHSC)来优化初始分类结果。最后,迭代执行这两个过程以产生越来越精确的结果,完成功能区的分类。作者以北京为例使用该方法进行功能区分类,发现分类结果的精度提高了6.5%。 Zhang等(Zhang,et al.,2018)提出了一种新的场景特征来测量空间物体关系,然后将其与主题模型结合进行城市场景分类。该方法首先提出语义和空间共现概率(SSCP)的场景特征,通过考虑它们的方向、距离和语义来测量物体间的空间关系,从而解决测量空间物体关系中的三个关键问题,即各向异性、尺度和语义依赖性。然后,采用半单元Dirichlet对场景进行分类。得益于深度学习场景分类的优势,Huang等(Huang,et al.,2018)提出了一种基于STDCNN的城市功能区分类方法。该方法首先对街区和道路的高空间分辨率图像和矢量数据进行预处理,并基于预设的功能区类别对STDCNN模型进行训练。然后使用基于骨架的分解方法将大的高空间分辨率多光谱图像分解成小的处理单元。随后,将训练的 STDCNN模型用于不同的土地利用类别的分类。最后,根据街区矢量数据,将处理单元的土地利用标签合并到大的土地利用地图中,完成功能区分类。Yao等 (Yao,et al.,2017)基于迁移学习的遥感图像方法提取特征和分类,从而完成城市功能区分类。该方法首先基于标准的土地覆盖数据集(UC-Merced和WHU-SIRI) 对GoogLeNet模型进行迁移学习来对土地覆盖图像进行分类。然后将土地覆盖类型的每个多尺度样本转换为单词,并以地块为单位计算单词频率。最后,使用TF-IDF算法将每个地块中的单词频率转换为语义特征,并通过随机森林(RFA) 分类器完成城市功能区分类。
本发明结合深度学习技术,提出了一种街区单元约束下多数投票的深度学习功能区分类方法,用于从高分影像中进行城市功能区分类。
发明内容
针对现有技术中存在的问题,本发明的目的在于提出一种基于多数投票的深度学习城市功能区分类方法,用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。
本发明的目的通过以下技术步骤实现:
步骤1)图像和矢量的预处理。
步骤2)为针对深度学习需要大量的样本问题,进行样本制作。
步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于 GoogLeNet进行迁移学习。
步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。
步骤5)利用多数投票策略确定最终分类结果。
进一步,所述步骤2)的具体方法为:利用多尺度随机采样策略制作不同尺度的样本。
进一步,所述步骤3)的具体方法为:选用GoogLeNet作为城市功能区分类的基本框架,并将全连接层输出类的数量由1000改为6。
附图说明
图1技术路线图;
图2多尺度的随机采样图;
图3随机点生成图。
图4保定分类结果图
具体实施方式
下面结合附图1对本发明“一种基于多数投票的深度学习城市功能区分类方法”作进一步阐述说明。
(一)图像和矢量的预处理
首先,将高分辨率影像与矢量文件投影到相同的地理参考坐标系中,本研究中采用的地理参考坐标系为UTM/WGS84。然后,将矢量文件与该坐标系中的影像进行配置。对于影像,图像的分辨率首先被重采样到1米,然后使用z-score 法对图像各个波段进行归一化。在归一化图像中,低于-1的值被设置为-1,高于 1的值被设置为1。最后,图像被线性地拉伸到[0,255]。这种归一化方法不仅减少了数据量,而且还为影像的城市功能区分类保留了足够的空间和光谱信息。由于高分相机幅宽较窄,因此部分矢量超出了影像范围,同时为了和外围的一些主要干道的矢量保持一致,因此需要对轮廓矢量进行必要的编辑。
(二)样本的制作
为方便样本制作,采用如下公式获取不同的尺度,
S=Rα
其中,R为深度学习模型需要的尺寸,α为尺度变化因子。一旦α确定以后,就可以获得S的尺寸,从而可以获得尺寸为S大小的样本。最后将尺度S的样本拉伸到R的尺寸以满足深度学习模型的输入要求。通过调整尺度变化因子以获得不同尺度的样本,如附图2所示。
(三)迁移学习
考虑到GoogLeNet训练速度快,占用内存小的优势,选用GoogLeNet作为城市功能区分类的基本框架。由于Image Net图像数据和高分遥感影像数据具有很强的相关性,因此可以使用模型更加深层的特征,“冻结”全连接层之前的所有层,并将全连接层输出类的数量由1000改为6,以适合分类要求。
(四)随机采样
确定随机点的个数为图像总像素大小的万分之五,假如图像的尺寸为100× 100,那么随机点的个数就是5个,附图3展示了随机点(蓝色十字)在街区上的分布。
多尺度的采样策略步骤如下:(1)设置不同采样窗口的大小;(2)获取随机点的位置,判断随机点的采样窗口是否超出街区的外接矩形,并将超出范围的随机点的坐标进行调整,确保采样窗口在街区的外接矩阵内;(3)判断采样窗口是否包含街区内部足够的像素,如果采样窗口包含了80%以上本街区的像素点,则认为该采样单元有效,对于小于输入尺寸的街区,且有效像素小于80%,首先需要重采样,以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸,以便于模型的预测。通过以上随机点密集采样的策略,可以有效的判断该街区的功能区类别。
(五)多数投票
利用了密集随机采样策略获得大量候选处理单元,每个候处理单元被送入深度学习模型之后,可以获得一个唯一的类别,如果街区单元被标定为某一类别次数最多,即某一类别获得的票数最高,则该街区单元被标为该类别,结果如附图4。
Claims (4)
1.一种基于多数投票的深度学习城市功能区分类方法,该方法包括如下步骤:
步骤1)图像和矢量的预处理
步骤2)为针对深度学习需要大量的样本问题,进行样本制作
步骤3)针对在遥感领域,具体分类任务的海量训练样本的收集十分困难,而且复杂昂贵,构建大规模、高质量的带标注数据集几乎无法实现的问题,基于GoogLeNet进行迁移学习
步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理
步骤5)利用多数投票策略确定最终分类结果。
2.如权利要求书1所述的方法,其特征在于,所述步骤3)的具体方法为:
选用GoogLeNet作为城市功能区分类的基本框架,并将全连接层输出类的数量由1000改为6。
3.如权利要求书1所述的方法,其特征在于,所述步骤4)的具体方法为:
a)设置不同采样窗口的大小;b)获取随机点的位置,判断随机点的采样窗口是否超出街区的外接矩形,并将超出范围的随机点的坐标进行调整,确保采样窗口在街区的外接矩阵内;c)判断采样窗口是否包含街区内部足够的像素,如果采样窗口包含了80%以上本街区的像素点,则认为该采样单元有效,对于小于输入尺寸的街区,且有效像素小于80%,首先需要重采样,以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸,以便于模型的预测。通过以上随机点密集采样的策略,可以有效的判断该街区的功能区类别。
4.如权利要求书1所述的方法,其特征在于,所述步骤5)的具体方法为:
利用了密集随机采样策略获得大量候选处理单元,每个候处理单元被送入深度学习模型之后,可以获得一个唯一的类别,如果街区单元被标定为某一类别次数最多,即某一类别获得的票数最高,则该街区单元被标为该类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329285.9A CN111639672B (zh) | 2020-04-23 | 2020-04-23 | 一种基于多数投票的深度学习城市功能区分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329285.9A CN111639672B (zh) | 2020-04-23 | 2020-04-23 | 一种基于多数投票的深度学习城市功能区分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111639672A true CN111639672A (zh) | 2020-09-08 |
CN111639672B CN111639672B (zh) | 2023-12-19 |
Family
ID=72331885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010329285.9A Active CN111639672B (zh) | 2020-04-23 | 2020-04-23 | 一种基于多数投票的深度学习城市功能区分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639672B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657324A (zh) * | 2021-08-24 | 2021-11-16 | 速度时空信息科技股份有限公司 | 基于遥感影像地物分类的城市功能区识别方法 |
CN116956133A (zh) * | 2023-07-26 | 2023-10-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991382A (zh) * | 2017-03-13 | 2017-07-28 | 南京信息工程大学 | 一种遥感场景分类方法 |
CN107704864A (zh) * | 2016-07-11 | 2018-02-16 | 大连海事大学 | 基于图像对象性语义检测的显著目标检测方法 |
US20190114510A1 (en) * | 2017-10-12 | 2019-04-18 | Lawrence Livermore National Security, Llc | Multi-scale deep learning system |
CN111008575A (zh) * | 2019-11-25 | 2020-04-14 | 南京邮电大学 | 一种基于多尺度上下文信息融合的鲁棒人脸识别方法 |
-
2020
- 2020-04-23 CN CN202010329285.9A patent/CN111639672B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704864A (zh) * | 2016-07-11 | 2018-02-16 | 大连海事大学 | 基于图像对象性语义检测的显著目标检测方法 |
CN106991382A (zh) * | 2017-03-13 | 2017-07-28 | 南京信息工程大学 | 一种遥感场景分类方法 |
US20190114510A1 (en) * | 2017-10-12 | 2019-04-18 | Lawrence Livermore National Security, Llc | Multi-scale deep learning system |
CN111008575A (zh) * | 2019-11-25 | 2020-04-14 | 南京邮电大学 | 一种基于多尺度上下文信息融合的鲁棒人脸识别方法 |
Non-Patent Citations (3)
Title |
---|
YANSHENG LI 等: "Learning Deep Networks under Noisy Labels for Remote Sensing Image Scene Classification", IGARSS 2019 - 2019 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM * |
蒋树龙: ""基于深度学习的遥感影像场景分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
蒋树龙: ""基于深度学习的遥感影像场景分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 April 2020 (2020-04-15), pages 27 - 33 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657324A (zh) * | 2021-08-24 | 2021-11-16 | 速度时空信息科技股份有限公司 | 基于遥感影像地物分类的城市功能区识别方法 |
CN116956133A (zh) * | 2023-07-26 | 2023-10-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
CN116956133B (zh) * | 2023-07-26 | 2024-02-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111639672B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Urban land-use mapping using a deep convolutional neural network with high spatial resolution multispectral remote sensing imagery | |
CN110263717B (zh) | 一种融入街景影像的土地利用类别确定方法 | |
CN110929607B (zh) | 一种城市建筑物施工进度的遥感识别方法和系统 | |
Huang et al. | Urban functional zone mapping by integrating high spatial resolution nighttime light and daytime multi-view imagery | |
Hu et al. | Impervious surface area extraction from IKONOS imagery using an object-based fuzzy method | |
CN111598101B (zh) | 基于遥感影像场景分割的城区智能提取方法、系统及设备 | |
CN109325502B (zh) | 基于视频渐进区域提取的共享单车停放检测方法和系统 | |
CN109871875B (zh) | 一种基于深度学习的建筑物变化检测方法 | |
Liu et al. | Deep multi-level fusion network for multi-source image pixel-wise classification | |
CN113223042B (zh) | 一种遥感影像深度学习样本智能采集方法及设备 | |
Su et al. | Urban scene understanding based on semantic and socioeconomic features: From high-resolution remote sensing imagery to multi-source geographic datasets | |
Wang et al. | Urban development analysis using built-up area maps based on multiple high-resolution satellite data | |
CN116935226B (zh) | 一种基于HRNet的改进型遥感图像道路提取方法、系统、设备及介质 | |
CN111639672B (zh) | 一种基于多数投票的深度学习城市功能区分类方法 | |
CN111242223B (zh) | 一种基于街景影像多特征融合的街道空间品质评价方法 | |
Zhang et al. | Impervious surface extraction from high-resolution satellite image using pixel-and object-based hybrid analysis | |
Xiu et al. | 3D semantic segmentation for high-resolution aerial survey derived point clouds using deep learning | |
CN102945550B (zh) | 一种基于高斯尺度空间构建遥感影像语义的方法 | |
CN114332921A (zh) | 基于改进聚类算法的Faster R-CNN网络的行人检测方法 | |
Liu et al. | Density saliency for clustered building detection and population capacity estimation | |
CN114898089A (zh) | 一种融合高分影像和poi数据的功能区提取与分类方法 | |
Chen et al. | Mapping urban functional areas using multi-source remote sensing images and open big data | |
Li et al. | Learning to holistically detect bridges from large-size vhr remote sensing imagery | |
Engstrom et al. | Evaluating the Relationship between Contextual Features Derived from Very High Spatial Resolution Imagery and Urban Attributes: A Case Study in Sri Lanka | |
Zhang et al. | Semantic segmentation of traffic scene based on DeepLabv3+ and attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |