CN111639672A

CN111639672A - 一种基于多数投票的深度学习城市功能区分类方法

Info

Publication number: CN111639672A
Application number: CN202010329285.9A
Authority: CN
Inventors: 孟庆岩; 孙震辉; 赵茂帆; 张颖
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2020-04-23
Filing date: 2020-04-23
Publication date: 2020-09-08
Anticipated expiration: 2040-04-23
Also published as: CN111639672B

Abstract

城市功能区分类以往研究多基于POI等社会属性数据与其他数据融合，但基于社会属性数据进行功能区分类存在一些不容忽视的问题。本发明针对上述问题，公开了一种基于多数投票的深度学习城市功能区分类方法，用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。本发明的目的通过以下技术步骤实现：步骤1)图像和矢量的预处理。步骤2)为针对深度学习需要大量的样本问题，进行样本制作。步骤3)针对在遥感领域，具体分类任务的海量训练样本的收集十分困难，而且复杂昂贵，构建大规模、高质量的带标注数据集几乎无法实现的问题，基于GoogLeNet进行迁移学习。步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。步骤5)利用多数投票策略确定最终分类结果。

Description

一种基于多数投票的深度学习城市功能区分类方法

技术领域

本发明设计了一种基于多数投票的深度学习城市功能区分类方法，对城市功能区分类取得很好分类效果，能较好地形成城市功能区分类流程，具有较高实用价值，为功能区分类提供了参考依据。

背景技术

城市功能区(如商业，住宅和工业区)是城市规划的基本单元，含有很强的人文社会属性，往往是城市规划部门十分关注的对象。在以往基于高分辨率遥感城市的研究中，往往侧重于对城市地表覆盖的分类。而对于功能区的分类也通常依赖于POI等社会属性的数据。近期，研究人员尝试从高分辨率卫星图像中自动提取功能区，并取得了很好效果，但基于高分卫星进行城市功能区自动分类工作研究不多。

基于高空间分辨率遥感数据的城市功能区分类是指仅使用单一的高空间分辨率遥感数据完成建成区分类。目前尽管相关研究较少，但逐渐成为功能区分类的一个热点分支，其中张修远和杜世宏等做了大量工作。Zhang等(Zhang,et al.,2018)针对城市功能区分类提出了一种新的分割方法——地理场景分割方法，它可以通过考虑其特征和空间模式聚合不同城市物体来识别多尺度的功能区。该方法首先提取空间模式特征以表征不同对象的空间排列，其中对象由经典的面向对象方法生成。其次，使用地理场景分割方法来提取城市功能区。它聚合不同级别、不同类型的对象，然后覆盖多级对象簇以生成地理场景。进而，使用不同尺度的参数进行地理场景分割，选择合适参数完成城市功能区分类。Zhang等(Zhang,et al.,2018)基于HSC方法提出了一种迭代的功能区分类方法，该方法集成了自下而上和自上而下的土地覆盖和功能区分类过程。其首先采用分HSC对土地覆盖和功能区进行自下而上的分类。HSC本质上是一个分层贝叶斯模型，它将视觉特征、土地覆盖、空间对象模式和功能区域与分层结构联系起来。然后，提出了一种自上而下的反馈方法，即逆层次语义认知(IHSC)来优化初始分类结果。最后，迭代执行这两个过程以产生越来越精确的结果，完成功能区的分类。作者以北京为例使用该方法进行功能区分类，发现分类结果的精度提高了6.5％。 Zhang等(Zhang,et al.,2018)提出了一种新的场景特征来测量空间物体关系，然后将其与主题模型结合进行城市场景分类。该方法首先提出语义和空间共现概率(SSCP)的场景特征，通过考虑它们的方向、距离和语义来测量物体间的空间关系，从而解决测量空间物体关系中的三个关键问题，即各向异性、尺度和语义依赖性。然后，采用半单元Dirichlet对场景进行分类。得益于深度学习场景分类的优势，Huang等(Huang,et al.,2018)提出了一种基于STDCNN的城市功能区分类方法。该方法首先对街区和道路的高空间分辨率图像和矢量数据进行预处理，并基于预设的功能区类别对STDCNN模型进行训练。然后使用基于骨架的分解方法将大的高空间分辨率多光谱图像分解成小的处理单元。随后，将训练的 STDCNN模型用于不同的土地利用类别的分类。最后，根据街区矢量数据，将处理单元的土地利用标签合并到大的土地利用地图中，完成功能区分类。Yao等 (Yao,et al.,2017)基于迁移学习的遥感图像方法提取特征和分类，从而完成城市功能区分类。该方法首先基于标准的土地覆盖数据集(UC-Merced和WHU-SIRI) 对GoogLeNet模型进行迁移学习来对土地覆盖图像进行分类。然后将土地覆盖类型的每个多尺度样本转换为单词，并以地块为单位计算单词频率。最后，使用TF-IDF算法将每个地块中的单词频率转换为语义特征，并通过随机森林(RFA) 分类器完成城市功能区分类。

本发明结合深度学习技术，提出了一种街区单元约束下多数投票的深度学习功能区分类方法，用于从高分影像中进行城市功能区分类。

发明内容

针对现有技术中存在的问题，本发明的目的在于提出一种基于多数投票的深度学习城市功能区分类方法，用于稳健准确的从高分辨率遥感影像中对城市功能区进行分类。

本发明的目的通过以下技术步骤实现：

步骤1)图像和矢量的预处理。

步骤2)为针对深度学习需要大量的样本问题，进行样本制作。

步骤3)针对在遥感领域，具体分类任务的海量训练样本的收集十分困难，而且复杂昂贵，构建大规模、高质量的带标注数据集几乎无法实现的问题，基于 GoogLeNet进行迁移学习。

步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理。

步骤5)利用多数投票策略确定最终分类结果。

进一步，所述步骤2)的具体方法为：利用多尺度随机采样策略制作不同尺度的样本。

进一步，所述步骤3)的具体方法为：选用GoogLeNet作为城市功能区分类的基本框架，并将全连接层输出类的数量由1000改为6。

附图说明

图1技术路线图；

图2多尺度的随机采样图；

图3随机点生成图。

图4保定分类结果图

具体实施方式

下面结合附图1对本发明“一种基于多数投票的深度学习城市功能区分类方法”作进一步阐述说明。

(一)图像和矢量的预处理

首先，将高分辨率影像与矢量文件投影到相同的地理参考坐标系中，本研究中采用的地理参考坐标系为UTM/WGS84。然后，将矢量文件与该坐标系中的影像进行配置。对于影像，图像的分辨率首先被重采样到1米，然后使用z-score 法对图像各个波段进行归一化。在归一化图像中，低于-1的值被设置为-1，高于 1的值被设置为1。最后，图像被线性地拉伸到[0,255]。这种归一化方法不仅减少了数据量，而且还为影像的城市功能区分类保留了足够的空间和光谱信息。由于高分相机幅宽较窄，因此部分矢量超出了影像范围，同时为了和外围的一些主要干道的矢量保持一致，因此需要对轮廓矢量进行必要的编辑。

(二)样本的制作

为方便样本制作，采用如下公式获取不同的尺度，

S＝Rα

其中，R为深度学习模型需要的尺寸，α为尺度变化因子。一旦α确定以后，就可以获得S的尺寸，从而可以获得尺寸为S大小的样本。最后将尺度S的样本拉伸到R的尺寸以满足深度学习模型的输入要求。通过调整尺度变化因子以获得不同尺度的样本，如附图2所示。

(三)迁移学习

考虑到GoogLeNet训练速度快，占用内存小的优势，选用GoogLeNet作为城市功能区分类的基本框架。由于Image Net图像数据和高分遥感影像数据具有很强的相关性，因此可以使用模型更加深层的特征，“冻结”全连接层之前的所有层，并将全连接层输出类的数量由1000改为6，以适合分类要求。

(四)随机采样

确定随机点的个数为图像总像素大小的万分之五，假如图像的尺寸为100× 100，那么随机点的个数就是5个，附图3展示了随机点(蓝色十字)在街区上的分布。

多尺度的采样策略步骤如下：(1)设置不同采样窗口的大小；(2)获取随机点的位置，判断随机点的采样窗口是否超出街区的外接矩形，并将超出范围的随机点的坐标进行调整，确保采样窗口在街区的外接矩阵内；(3)判断采样窗口是否包含街区内部足够的像素，如果采样窗口包含了80％以上本街区的像素点，则认为该采样单元有效，对于小于输入尺寸的街区，且有效像素小于80％，首先需要重采样，以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸，以便于模型的预测。通过以上随机点密集采样的策略，可以有效的判断该街区的功能区类别。

(五)多数投票

利用了密集随机采样策略获得大量候选处理单元，每个候处理单元被送入深度学习模型之后，可以获得一个唯一的类别，如果街区单元被标定为某一类别次数最多，即某一类别获得的票数最高，则该街区单元被标为该类别，结果如附图4。

Claims

1.一种基于多数投票的深度学习城市功能区分类方法，该方法包括如下步骤：

步骤1)图像和矢量的预处理

步骤2)为针对深度学习需要大量的样本问题，进行样本制作

步骤3)针对在遥感领域，具体分类任务的海量训练样本的收集十分困难，而且复杂昂贵，构建大规模、高质量的带标注数据集几乎无法实现的问题，基于GoogLeNet进行迁移学习

步骤4)利用分解的方法将大尺寸的图像分割成尺寸较小的单元进行处理

步骤5)利用多数投票策略确定最终分类结果。

2.如权利要求书1所述的方法，其特征在于，所述步骤3)的具体方法为：

选用GoogLeNet作为城市功能区分类的基本框架，并将全连接层输出类的数量由1000改为6。

3.如权利要求书1所述的方法，其特征在于，所述步骤4)的具体方法为：

a)设置不同采样窗口的大小；b)获取随机点的位置，判断随机点的采样窗口是否超出街区的外接矩形，并将超出范围的随机点的坐标进行调整，确保采样窗口在街区的外接矩阵内；c)判断采样窗口是否包含街区内部足够的像素，如果采样窗口包含了80％以上本街区的像素点，则认为该采样单元有效，对于小于输入尺寸的街区，且有效像素小于80％，首先需要重采样，以满足要求。最后将不同的采样窗口获取的分块大小拉伸到可以送入深度模型的尺寸，以便于模型的预测。通过以上随机点密集采样的策略，可以有效的判断该街区的功能区类别。

4.如权利要求书1所述的方法，其特征在于，所述步骤5)的具体方法为：

利用了密集随机采样策略获得大量候选处理单元，每个候处理单元被送入深度学习模型之后，可以获得一个唯一的类别，如果街区单元被标定为某一类别次数最多，即某一类别获得的票数最高，则该街区单元被标为该类别。