CN112507888A

CN112507888A - 建筑物识别方法及装置

Info

Publication number: CN112507888A
Application number: CN202011461596.7A
Authority: CN
Inventors: 刘建华; 刘媛; 冯国强; 宁小禾
Original assignee: Beijing University of Civil Engineering and Architecture
Current assignee: Beijing University of Civil Engineering and Architecture
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-03-16

Abstract

本发明提供一种建筑物识别方法及装置，其方法包括：将待识别图像输入特征提取模型，获得多个不同尺度的特征图；将每一特征图输入识别模型，获得所述待识别图像的建筑物识别结果；其中，特征提取模型和识别模型是基于样本图像以及对应的识别标签进行训练后得到；样本图像包括多个不同尺度的建筑物样本的图像；识别标签是根据多个不同尺度的建筑物样本预先确定的，并与样本图像一一对应；每一特征图，分别包括不同尺度的建筑物目标的特征。本发明提供的建筑物识别方法及装置，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能通过训练好的识别模型实现待识别图像中多尺度建筑物的共生识别，能提高多尺度建筑物识别的准确率。

Description

建筑物识别方法及装置

技术领域

本发明涉及目标识别技术领域，尤其涉及一种建筑物识别方法及装置。

背景技术

现有技术中，对图像进行建筑物目标识别的方法可以分为两类。一是基于候选区域的目标识别方法，二是基于回归的目标识别方法。前者通过算法生成一系列作为测试样本的候选框后，利用卷积神经网络对测试样本分类，并进一步进行建筑物目标的识别；后者无需产生候选框，直接将目标边框定位的问题转化为回归问题，利用卷积神经网络提取样本特征后，通过回归分析获得建筑物目标的类别概率和位置信息。

多尺度的建筑物目标，指存在尺度差异较大的多个尺度的建筑物目标。通过上述两种现有技术对存在多尺度的建筑物目标的待识别图像进行图像识别时，尺度较小的建筑物目标在识别过程中易被丢失，尺度较大的建筑物目标会因为特征信息不全而无法识别，导致对多尺度的建筑物目标的识别准确率较低。

发明内容

本发明提供一种建筑物识别方法及装置，用以解决现有技术中对多尺度的建筑物目标图像的识别准确率较低的缺陷，实现更准确的识别多尺度的建筑物目标。

本发明提供一种建筑物识别方法，包括：

将待识别图像输入特征提取模型，获得多个不同尺度的特征图；

将每一所述特征图输入识别模型，获得所述待识别图像的建筑物识别结果；

其中，所述特征提取模型和所述识别模型是基于样本图像以及对应的识别标签进行训练后得到；所述样本图像包括多个不同尺度的建筑物样本的图像；所述识别标签是根据所述多个不同尺度的建筑物样本预先确定的，并与所述样本图像一一对应；每一所述特征图，分别包括不同尺度的建筑物目标的特征。

根据本发明提供的一种建筑物识别方法，所述将待识别图像输入特征提取模型，获得多个不同尺度的特征图，具体包括：

将所述待识别图像输入所述特征提取模型中的特征提取子模型，获得多个不同尺度的原始特征图；

根据尺度由小到大相邻的每两个所述原始特征图，获得所述多个不同尺度的特征图。

根据本发明提供的一种建筑物识别方法，所述将所述待识别图像输入所述特征提取模型包括的特征提取子模型，获得多个不同尺度的原始特征图，具体包括：

将第n个原始特征图输入所述特征提取子模型中的第(n+1)个特征提取卷积单元，获得第(n+1)个原始特征图；

其中，1≤n≤N，N为所述特征提取子模型包括的所述特征提取卷积单元的个数，n用于表示原始特征图尺度由大到小的顺序。

根据本发明提供的一种建筑物识别方法，所述特征提取卷积单元，包括：

顺次连接的一个卷积残差块和若干个恒等残差块。

根据本发明提供的一种建筑物识别方法，所述卷积残差块的主路径包括顺次连接的第一多尺度卷积单元、第二多尺度卷积单元和第三多尺度卷积单元；

所述第二多尺度卷积单元，包括特征分组子单元、特征叠加子单元和特征融合子单元；

所述特征分组子单元，用于将所述第一多尺度卷积单元的输出分组，获得多个多尺度特征子集作为分组结果；

所述特征叠加子单元，用于根据所述分组结果，按照预设的规则进行卷积计算，获得多个多尺度输出子集；

所述特征融合子单元，用于将所述多个多尺度输出子集融合。

根据本发明提供的一种建筑物识别方法，所述特征叠加子单元，具体用于：

将第一个多尺度特征子集作为第一个多尺度输出子集；

将第(x+1)个多尺度特征子集与第x个多尺度输出子集叠加后，进行卷积计算，获得第(x+1)个多尺度输出子集；

其中，1≤x≤X，X为预设的尺度参数。

将第一个多尺度特征子集作为第一个多尺度输出子集；

将第二个多尺度特征子集进行卷积计算，获得第二个多尺度输出子集；

其中，2≤x≤X，X为预设的尺度参数。

本发明还提供一种建筑物识别装置，包括：

特征提取模块，用于将待识别图像输入特征提取模型，获得多个不同尺度的特征图；

图像识别模块，用于将每一所述特征图输入识别模型，获得所述待识别图像的建筑物识别结果；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述建筑物识别方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述建筑物识别方法的步骤。

本发明提供的建筑物识别方法及装置，通过将待识别图像输入训练好的特征提取模型后，在特征提取模型中对待识别图像进行卷积计算，以获得多个不同尺度的特征图，将每一特征图输入训练好的识别模型，获得待识别图像的建筑物识别结果，能基于深度学习算法训练得到特征提取模型和识别模型，能通过训练好的特征提取模型获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能通过训练好的识别模型实现待识别图像中多尺度建筑物的共生识别，能提高多尺度建筑物识别的准确率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的建筑物识别方法的流程示意图之一；

图2是本发明提供的建筑物识别方法的流程示意图之二；

图3是本发明提供的建筑物识别方法中的特征提取模型的结构示意图；

图4是本发明提供的建筑物识别方法中的卷积残差块的结构示意图；

图5是本发明提供的建筑物识别装置的结构示意图；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

为了克服现有技术的上述问题，本发明提供一种建筑物识别方法及装置，其发明构思是，将待识别图像输入训练好的特征提取模型，获得多个不同尺度的特征图后，将每一特征图输入训练好的识别模型，获得待识别图像的建筑物识别结果，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能提高多尺度建筑物识别的准确率

图1是本发明提供的建筑物识别方法的流程示意图之一。下面结合图1描述本发明的建筑物识别方法。如图1所示，该方法包括：步骤S101、将待识别图像输入特征提取模型，获得多个不同尺度的特征图。

本发明实施例中待识别图像可以是高分遥感影像。

遥感技术具有观测范围广、信息量大、获取信息快、更新周期短、节省人力物力和人为干扰因素少等诸多优势。通过遥感技术获得的高分遥感影像，可以包括多个不同尺度的建筑物。

若高分遥感影像中包括的建筑物目标尺度差异较大，例如：建筑物目标为低矮建筑物和紧密排列的一排大型厂房，并且高分遥感影像中上下文信息可能比建筑物目标本身占据的区域更大，则传统的建筑物识别方法对上述高分遥感影像进行建筑物识别时，识别准确率较低。

本发明实施例中待识别的高分遥感影像输入特征提取模型后，可以在特征提取模型中对待识别的高分遥感影像进行卷积计算，获得多个不同尺度的特征图。其中，每一特征图，分别包括不同尺度建筑物目标的特征。通过多个不同尺度的特征图，可以保留待识别高分遥感影像中所有尺度建筑物目标的特征，从而避免尺度较小的建筑物目标在识别过程丢失，尺度较大的建筑物目标因为特征不全而无法识别。

需要说明的是，待识别图像还可以是通过飞机航拍或无人机等飞行器航拍获得的影像。

步骤S102、将每一特征图输入识别模型，获得待识别图像的建筑物识别结果。

具体地，将基于待识别图像获得的每一特征图输入识别模型，分别针对每一特征图进行建筑物识别，获得每一基于特征图的建筑物识别结果。将所有基于特征图获得的建筑物识别结果进行叠加后，可以获得待识别图像的建筑物识别结果。

需要说明的是，待识别图像的建筑物识别结果可以包括但不限于：确定建筑物目标的分类、建筑物目标的边界框和建筑物目标对应的掩码中的任意若干种。

图2是本发明提供的建筑物识别方法的流程示意图之二。下面结合图2描述本发明的建筑物识别方法。如图2所示，待识别图像输入特征提取模型201后，可以获得多个不同尺度的第一特征图。将上述多个不同尺度的特征图输入识别模型202中，获得待识别图像的建筑物目标种类、建筑物目标的边界框和建筑物目标对应的掩码。

具体地，将每一第一特征图输入识别模型202中的区域提议网络(RegionProposal Network，RPN)，可以在每一第一特征图中生成目标候选框，并对感兴趣区域(Region of Interest，RoI)的目标候选框进行修正，获得多个包括目标候选框的不同尺度的第二特征图。其中，第二特征图是已标记出目标候选框的第一特征图。

将每一第二特征图输入RoIAlign层后，可以获得多个固定尺度的第三特征图，其中第三特征图中包括第二特征图中目标候选框对应的特征。

将第三特征图输入第一全连接层后，将第一全连接层的输出分别输入第二全连接层和第三全连接层，可以分别确定建筑物目标的分类和建筑物目标的边界框。

将第三特征图输入图像分割算法子模型(Fully Convolutional Networks forSemantic Segmentation，FCNs)，可以获得建筑物目标对应的掩码。

其中，特征提取模型和识别模型是基于样本图像以及对应的识别标签进行训练后得到；样本图像包括多个不同尺度的建筑物样本的图像；识别标签是根据多个不同尺度的建筑物样本预先确定的，并与样本图像一一对应；每一特征图，分别包括不同尺度的建筑物目标的特征。

具体地，获取样本区域的样本图像。其中，样本图像中包括样本区域内的多个不同尺度的建筑物样本。

使用图像标注工具提取样本图像中不同尺度的建筑物样本。

根据样本图像中不同尺度的建筑物样本的特征，可以生成包含建筑物样本的特征的Json格式文件。

解析上述Json格式文件，可以生成不同尺度的建筑物样本对应的特征和识别标签。

基于上述不同尺度的建筑物样本对应的特征和识别标签，可以构建标准的COCO格式的多尺度建筑物特征样本集。

基于上述多尺度建筑物特征样本集可以训练得到特征提取模型和识别模型。

需要说明的是，根据样本图像构建多尺度建筑物特征样本集时，需要注意以下几点：首先，注意多角度拍摄影像中，影像地物语义粒度的划分与影像地物对应；其次，提取建筑物样本的特征时，保留目标地物的多尺度特征，特别是保留小尺度建筑物的特征，使得特征提取模型和识别模型可以学习多尺度的建筑物样本的特征；最后，在进行建筑物样本提取时，应避开被阴影或植被遮挡的部分，以避免对建筑物识别结果造成干扰。

需要说明的是，本发明实施例中样本图像可以是高分遥感影像，还可以是通过飞机航拍或无人机等飞行器航拍获得的影像。

需要说明的是，待识别图像和样本图像可以为经过图像预处理的高分遥感影像，可以适用于本发明实施例中基于深度学习算法的建筑物识别方法。

本发明实施例中图像预处理方法可以包括：图像融合、图像分幅、线性拉伸和图像滤波处理。

以下以对高分遥感影像进行图像预处理，获得样本图像为例，说明本发明实施例中的图像预处理方法。

具体地，将样本区域的原始高分遥感图像进行图像融合，可以将空间分辨率和光谱分辨率不同的原始高分遥感影像，转换为高空间分辨率和高光谱分辨率的第一高分遥感影像，同时还可以保留原始高分遥感影像的高分辨率全色图像的空间信息，以及较低分辨率多光谱图像的光谱特征。

本发明实施例通过Gram-Schmidt光谱锐化方法(Gram-Schmidt Pan Sharpening，GS)对原始高分遥感影像进行图像融合。该方法在保持最大化图像清晰度和避免最小化光谱失真等方面性能优越，并且该方法对需要融合的高分遥感影像的波段数没有限制。

经过图像融合的第一高分遥感影像仍包含丰富的空间-光谱信息，使得第一高分遥感影像较大。若在对特征提取模型和识别模型训练时，输入的样本图像过大，则将导致训练特征提取模型和识别模型的训练效率较低和训练时间较长。另一方面，对特征提取模型和识别模型的训练过程中，包括将固定尺度的样本图像输入全连接层。若输入的样本图像的尺度大小不一，则全连接层对应的卷积层获得的特征的大小也会发生变化，从而影响最终的识别准确率。

结合神经网络算法的负荷能力、模型训练效率和训练所需图像性质等因素，可以对经过图像融合的第一高分遥感影像分幅，将第一高分遥感影像分割为预设尺度的多幅第二高分遥感影像。

需要说明的是，预设尺度可以根据实际情况确定，例如：预设尺度可以为500*500，预设尺度的具体取值在本发明实施例中不作具体限定。

由于第二高分遥感影像为16位的标签图像文件格式(Tag Image File Format，TIFF)影像，考虑到数据容量的因素。本发明实施例采用2％-98％最大最小值拉伸对第二高峰遥感影像进行图像处理，可以将16位的第二高分遥感影像量化为8位第三高分遥感影像，从而可以在保证训练效率的同时获得最快的训练速度。另一方面，通过2％-98％最大最小值拉伸还可以使得第三高分遥感影像具备更好的视觉效果，进而使得最终获得的样本图像能够更好的保留建筑物样本的特征。

图像滤波可以在对图像进行噪声抑制的同时较好保留图像中的细节特征，图像滤波的效果可以直接影响样本图像的有效性和可靠性。本发明实施例采取了双边滤波对第三高分遥感影像进行处理，获得样本图像。

本发明实施例通过将待识别图像输入训练好的特征提取模型后，在特征提取模型中对待识别图像进行卷积计算，以获得多个不同尺度的特征图，将每一特征图输入训练好的识别模型，获得待识别图像的建筑物识别结果，能基于深度学习算法训练得到特征提取模型和识别模型，能通过训练好的特征提取模型获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能通过训练好的识别模型实现待识别图像中多尺度建筑物的共生识别，能提高多尺度建筑物识别的准确率。

基于上述各实施例的内容，将待识别图像输入特征提取模型，获得多个不同尺度的特征图，具体包括：将待识别图像输入特征提取模型中的特征提取子模型，获得多个不同尺度的原始特征图。

具体地，将待识别图像输入特征提取模型中的特征提取子模型，在特征提取子模型中对待识别图像进行卷积计算，根据卷积计算的结果，可以获得多个不同尺度原始特征图。

在特征提取子模型中对待识别图像进行的卷积计算的类型可以包括如下两种。

一是对待识别图像进行卷积计算可以为级联卷积计算。

具体地，特征提取子模型中可以包括多个卷积层，待识别图像输入第一个卷积层后，将每一个卷积层的输出作为下一个卷积层的输入。每一个卷积层的输出可以对应一个尺度的原始特征图。

需要说明的是，特征提取子模型中包括的卷积层的个数越多，对待识别图像进行级联卷积计算的次数越多，可以获得的原始特征图的尺度越小。

二是对待识别图像进行的卷积计算还可以为基于图像分割的卷积计算。

具体地，根据不同的尺度分别对待识别图像进行分割，获得多个不同尺度大小的分割图像，所有分割图像可以组成的多个待识别图像。对每一分割图像进行卷积计算，并将同一尺度的分割图像的卷积计算结果进行特征叠加，获得多个不同尺度的原始特征图。

需要说明的是，对待识别图像分割的尺度越小，可以获得的原始特征图的尺度越小。

根据尺度由小到大相邻的每两个原始特征图，获得多个不同尺度的特征图。

优选地，本发明实施例中对待识别图像进行级联卷积计算。

具体地，对尺度由小到大相邻的每两个原始特征图中尺度较小的原始特征图对应的融合特征图上采样后，与经过(1*1)卷积计算的尺度较大的原始特征图进行特征融合，可以获得尺度较大的原始特征图对应的融合特征图。其中，融合特征图的尺度与对应的原始特征图的尺度相同。

需要说明的是，尺度最小的原始特征图经过(1*1)卷积计算后，可以直接作为尺度最小的融合特征图。

对不同尺度的每一融合特征图进行卷积计算，可以获得多个不同尺度的特征图。每一尺度的特征图，包括所有小于该尺度的特征图中的特征。

为了便于对本发明实施例的理解，下面通过一个实例进行说明。

图3是本发明提供的建筑物识别方法中的特征提取模型的结构示意图。如图3所示，特征提取模型201包括特征提取子模型301。

待识别图像输入特征提取子模型301后，对待识别图像进行级联卷积计算。根据卷积计算的结果，可以获得多个不同尺度的原始特征图C1、原始特征图C2、原始特征图C3和原始特征图C4。

其中，原始特征图C4的尺度＜原始特征图C3的尺度＜原始特征图C2的尺度＜原始特征图C1的尺度。

对原始特征图C4进行卷积核为(1*1)，卷积核个数为256的卷积计算，可以得到融合特征图D4。

对自上向下对尺度较小的原始特征图对应的融合特征图上采样后，与经过(1*1)卷积计算的尺度较大的原始特征图进行特征融合，获得尺度较大的原始特征图对应的融合特征图。

具体地，对融合特征图D4进行上采样后，与经过卷积核为(1*1)卷积核个数为256的卷积计算的原始特征图C3进行特征融合，获得融合特征图D3。对融合特征图D3进行上采样后，与经过卷积核为(1*1)，卷积核个数为256的卷积计算的原始特征图C2进行特征融合，获得融合特征图D2。以此类推，获得融合特征图D1。

分别对融合特征图D4、融合特征图D3、融合特征图D2和融合特征图D1进行卷积核为(3*3)，卷积核个数为256的卷积计算，获得特征图P4、特征图P3、特征图P2和特征图P1。

需要说明的是，对特征图P4进行最大化池化(MaxPooling)，可以获得特征图P5。

其中，特征图P5的尺度＜特征图P4的尺度＜特征图P3的尺度＜特征图P2的尺度＜特征图P1的尺度。

本发明实施例通过将待识别图像输入特征提取模型中的特征提取子模型，获得多个不同尺度的原始特征图，能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础。

基于上述各实施例的内容，将待识别图像输入特征提取模型包括的特征提取子模型，获得多个不同尺度的原始特征图，具体包括：第n个原始特征图输入特征提取子模型中的第(n+1)个特征提取卷积单元，获得第(n+1)个原始特征图。

其中，1≤n≤N，N为特征提取子模型包括的特征提取卷积单元的个数，n用于表示原始特征图尺度由大到小的顺序。

具体地，特征提取子模型中可以包括多个特征提取卷积单元，每一特征提取卷积单元可以对待识别图像进行级联卷积计算。

待识别图像输入第1个特征提取子模型中，进行第一次级联卷积计算，可以获得第1个原始特征图。

将第1个原始特征图输入第2个特征提取卷积单元中，进行第二次级联卷积计算，可以获取第2个原始特征图。

依次类推，将第n个原始特征图输入第(n+1)个特征提取卷积单元，进行第n次级联卷积计算，可以获取第(n+1)个原始特征图。

需要说明的是，n可以用来表述原始特征图尺度的大小，n的取值越小，第n个原始特征图和第(n+1)个原始特征图的尺度就越大。

需要说明的是，可以对待识别图像进行卷积计算后，再输入第1个特征提取子模型。通过对待识别图像进行卷积计算，可以对待识别图像中的特征进行初步提取，以使得后续级联卷积计算的计算量减少。

需要说明的是，在对第n个原始特征图进行第n次级联卷积计算之后，还可以对第n次级联卷积计算的计算结果进行一次卷积核为(1*1)的卷积计算，以使得原始特征图中包括的特征降维。

如图3所述，特征提取子模型301中，包括5个特征提取卷积单元302，即N为5。

首先对待识别图像进行卷积核为(7*7)，卷积核个数为64的卷积计算，将上述卷积计算的计算结果输入第1个特征提取卷积单元302，进行第一次级联卷积计算，得到第1个原始特征图C1。

将第1个原始特征图C1输入第2个特征提取卷积单元302，进行第二次级联卷积计算，得到第2个原始特征图C2。

当n的取值为2和3时。将第2个和第3个原始特征图分别输入第3个和第4个特征提取卷积单元302，进行第3次和第4次级联卷积计算，得到第3个原始特征图C3、第4个原始特征图C4。

本发明实施例通过将当前特征提取子模型中获得的原始特征图，输入下一个特征提取子模型中，获取下一个特征提取子模型对应的原始特征图，能获取多个不同尺度的原始特征图，能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础。

基于上述各实施例的内容，特征提取卷积单元包括：顺次连接的一个卷积残差块和若干个恒等残差块。

具体地，任一原始特征图首先输入特征提取卷积单元中的卷积残差块，在卷积残差块中对上述原始特征图进行卷积计算后，将上述卷积残差块的输出输入与卷积残差块连接的恒等残差块。

若特征提取卷积单元中只包括一个恒等残差块，则将卷积残差块的输出输入恒等残差块后，在恒等残差块中对卷积残差块的输出进行卷积计算后，恒等残差块的输出即为上述原始特征图对应的下一尺度的原始特征图。

若特征提取卷积单元中包括多个恒等残差块，则将当前恒等残差块的输出，作为下一个恒等残差块的输入。特征提取卷积单元中包括的最后一个恒等残差块的输出即为上述原始特征图对应的下一尺度的原始特征图。

需要说明的是，本发明实施例中的卷积残差块，可以是常规的卷积残差块，还可以是特定的卷积残差块。

需要说明的是，本发明实施例中的恒等残差块，可以是常规的恒等残差块。

本发明实施例通过将任一原始特征图输入特征提取卷积单元包括的卷积残差块后，将卷积残差块的输出与卷积残差块连接的恒等残差块，并将当前恒等残差块的输出作为下一个恒等残差块的输入，能获得多个不同尺度的原始特征图，能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础。

基于上述各实施例的内容，卷积残差块的主路径包括顺次连接的第一多尺度卷积单元、第二多尺度卷积单元和第三多尺度卷积单元。

具体地，将任一原始特征图输入卷积残差块中的第一多尺度卷积单元后，在第一多尺度卷积单元中对该原始特征图进行卷积核为(1*1)的卷积计算，并将上述卷积计算的结果进行批标准化处理和应用ReLU激活函数，获得对应的卷积输出特征。将上述卷积输出特征输入第二多尺度卷积单元。

需要说明的是，卷积残差块包括主路径和shortcut路径。

第二多尺度卷积单元，包括特征分组子单元、特征叠加子单元和特征融合子单元。

其中，特征分组子单元、特征叠加子单元和特征融合子单元顺次连接。

特征分组子单元，用于将第一多尺度卷积单元的输出分组，获得多个多尺度特征子集作为分组结果。

将任一原始特征图对应的卷积输出特征输入第二多尺度卷积单元中的特征分组子单元后，可以对上述卷积输出特征的通道进行均匀分组，将上述卷积输出特征分为多个多尺度特征子集，并将上述多个多尺度特征子集作为分组结果。将上述多个多尺度特征子集分别输入特征叠加子单元。

需要说明的是，对任一原始特征图对应的卷积输出特征分组的规则，可以是均匀分组。分组后的组数可以根据预设的尺度参数确定。

需要说明的是，预设的尺度参数可以根据实际情况确定。预设的尺度参数的具体取值在本发明实施例中不作具体限定。

特征叠加子单元，用于根据分组结果，按照预设的规则进行卷积计算，获得多个多尺度输出子集。

具体地，预设的规则，用于将各个分组表示的特征按照需要进行叠加。

特征融合子单元，用于将多个多尺度输出子集融合。

具体地，将任一原始特征图对应的多个多尺度输出子集输入特征融合子单元，在特征融合子单元中，将所有多尺度输出子集拼接为一个特征向量。

将任一原始特征图对应的特征向量输入第三多尺度卷积单元。在第三多尺度卷积单元中，对上述特征向量进行卷积核为(1*1)的卷积计算，并对上述卷积计算的计算结果进行批标准化处理，得到卷积残差块的主路径的输出。

将卷积残差块主路径的输出与卷积残差块shortcut路径的输出进行特征叠加后，应用ReLU激活函数，获得卷积残差块的输出。

本发明实施例通过将第一多尺度卷积单元输出的卷积输出特征分为多个多尺度特征子集，将多个多尺度特征子集输入特征叠加子单元，按照预设的规则进行卷积计算后，获得多个多尺度输出子集，能通过对卷积输出特征分组使得在维度层面以多尺度的形式拆分建筑物目标的特征，能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础。

基于上述各实施例的内容，特征叠加子单元，具体用于：将第一个多尺度特征子集作为第一个多尺度输出子集。

将第(x+1)个多尺度特征子集与第x个多尺度输出子集叠加后，进行卷积计算，获得第(x+1)个多尺度输出子集。

其中，1≤x≤X，X为预设的尺度参数。

具体地，将任一原始特征图对应的任一多尺度特征子集输入特征叠加子单元后，对上述任一多尺度特征子集进行卷积计算，获得上述多尺度特征子集对应的特征多尺度输出子集的计算公式如下：

式中，x_i为第x个多尺度特征子集，y_i为第x个多尺度输出子集，K_i()表示卷积计算，X为预设的尺度参数。

需要说明的是，当(i＝1)时，表示第一个多尺度特征子集x₁。第一个多尺度特征子集x₁不进行卷积计算，将第一个多尺度特征子集x₁作为第一个多尺度输出子集y₁，可以在获得的特征图中增加多尺度建筑物目标的特征的同时，减少后续计算的数据量。

其中，卷积计算K_i()的内容可以根据实际情况确定，例如，K_i()可以是卷积核为(3*3)的卷积计算。K_i()的具体取值在本发明实施例中不作具体限定。

本发明实施例通过将当前多尺度输出子集与当前多尺度输出子集对应的后一个多尺度特征子集叠加后，进行卷积计算，获得当前多尺度输出子集的后一个多尺度输出子集，能使得每一多尺度输出子集都包含所有小于该尺度的多尺度输出子集中的特征，能使得每一多尺度输出子集都包含更加多元化和更丰富的多尺度建筑物目标的特征，能通过不同的多尺度输出子集代表不同尺度的建筑物目标的不同权重，能扩大每一特征图的感受野，能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础，通过对第一个多尺度特征子集不进行卷积计算，能在获得的特征图中增加多尺度建筑物目标的特征的同时，减少后续计算的数据量。

图4是本发明提供的建筑物识别方法中的卷积残差块的结构示意图。下面结合图4来描述本发明实施例的卷积残差块的特征叠加子单元。如图4所述，特征叠加子单元402，具体用于：将第一个多尺度特征子集作为第一个多尺度输出子集。

需要说明的是，本发明实施例中的卷积残差块为多尺度卷积残差块。

对第二个多尺度特征子集进行卷积计算，获得第二个多尺度输出子集。

其中，2≤x≤X，X为预设的尺度参数。

需要说明的是，当(i＝1)时，表示第一个多尺度特征子集x₁。第一个多尺度特征子集x₁不进行卷积计算，将第一个多尺度特征子集x₁作为第一个多尺度输出子集y₁。

第二个多尺度特征子集x₂，不与第一个多尺度输出子集y₁进行叠加。对第二个多尺度特征子集x₂进行卷积计算，获得第二个多尺度输出子集y₂。

将第一个多尺度特征子集x₁作为第一个多尺度输出子集y₁，以及第二个多尺度特征子集x₂，不与第一个多尺度输出子集y₁进行叠加，可以在获得的特征图中增加多尺度建筑物目标的特征的同时，减少后续计算的数据量。

需要说明的是，如图4所述，卷积残差块的主路径303还包括顺次连接的第一多尺度卷积单元401、第二多尺度卷积单元402和第三多尺度卷积单元403。

采用2017年WorldView-3卫星获取的北京城市副中心高分遥感影像作为样本图像和待识别图像。上述高分遥感影像包括空间分辨率为0.3m的全色影像和空间分辨率为1.24m的多光谱影像。经纬度范围为nwLat＝39°96'，nwLong＝116°63'，seLat＝39°84'，seLong＝116°78'。

软硬件环境为Ubuntu14.0系统，CUDA驱动，语言环境为Python，基于Tensorflow、Keras、Anaconda等开源的深度学习库，使用NVIDIA GeForce GTX 1060单GPU进行特征提取模型和识别模型的训练。

基于样本图像以及对应的识别标签训练特征提取模型和识别模型，根据模型评估的结果将上述特征提取模型和识别模型调整至最优，以使得上述特征提取模型和识别模型可以达到良好的识别效果与精度。

将样本图像和样本图像对应的识别标签输入到构建好的特征提取模型和识别模型中，并将COCO数据集上预训练的特征权重映射至上述特征提取模型和识别模型。

需要说明的是，在高分遥感影像输入网络的过程中，影像的R、G、B对应三个通道作为模型的输入。

特征提取模型和识别模型训练前需要进行超参数设置。特征提取模型和识别模型的主要参数包括：锚框尺寸，Batch Size，迭代次数Epoch，学习率等。

如图3所述，本发明实施例中获得的特征图P1至P5分别对应的锚框尺寸大小为(32,64,128,256,512)。

本发明实施例中Batch Size设置为1，Epoch设置为30，学习率设置为0.0001。

基于上述过程对特征提取模型和识别模型进行训练，得到训练好的特征提取模型和识别模型后。利用训练好的特征提取模型和识别模型对待识别图像进行目标识别。可以准确识别同一张待识别图像中的大、中、小等多尺度建筑物，可以共生识别多尺度建筑物目标，并且识别出的建筑物目标具有优良的边缘分割效果。

本发明实施例通过将当前多尺度输出子集与当前多尺度输出子集对应的后一个多尺度特征子集叠加后，进行卷积计算，获得当前多尺度输出子集的后一个多尺度输出子集，能使得每一多尺度输出子集都包含所有小于该尺度的多尺度输出子集中的特征，能使得每一多尺度输出子集都包含更加多元化和更丰富的多尺度建筑物目标的特征，能通过不同的多尺度输出子集代表不同尺度的建筑物目标的不同权重，能扩大每一特征图的感受野能获取待识别图像中的不同尺度的建筑物目标的特征，能更完整的提取待识别图像中的多尺度建筑物目标的特征，能为准确识别多尺度的建筑物提供数据基础，通过对第一个多尺度特征子集不进行卷积计算和第二个多尺度输出子集不与第一个多尺度特征子集进行特征叠加，能在获得的特征图中增加多尺度建筑物目标的特征的同时，减少后续计算的数据量。

图5是本发明提供的建筑物识别装置的结构示意图。下面结合图5对本发明提供的建筑物识别装置进行描述，下文描述的建筑物识别装置与上文描述的建筑物识别方法可相互对应参照。如图5所示，该装置包括：特征提取模块501和图像识别模块502，其中：

特征提取模块501，用于将待识别图像输入特征提取模型，获得多个不同尺度的特征图。

图像识别模块502，用于将每一特征图输入识别模型，获得待识别图像的建筑物识别结果。

具体地，特征提取模块501和图像识别模块502电连接。

特征提取模块501通过将待识别的高分遥感影像输入特征提取模型后，可以在特征提取模型中对待识别的高分遥感影像进行卷积计算，获得多个不同尺度的特征图。其中，每一特征图，分别包括不同尺度建筑物目标的特征。通过多个不同尺度的特征图，可以保留待识别高分遥感影像中所有尺度建筑物目标的特征，从而避免尺度较小的建筑物目标在识别过程丢失，尺度较大的建筑物目标因为特征不全而无法识别。

需要说明的是，本发明实施例中待识别图像可以是高分遥感影像，还可以是通过飞机航拍或无人机等飞行器航拍获得的影像。

图像识别模块502通过将基于待识别图像获得的每一特征图输入识别模型，可以分别针对每一特征图进行建筑物识别，获得每一基于特征图的建筑物识别结果。并可以将所有基于特征图的建筑物识别结果进行叠加后，可以获得待识别图像的建筑物识别结果。

图6示例了一种电子设备的实体结构示意图，如图6所示，该电子设备可以包括：处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640，其中，处理器610，通信接口620，存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令，以执行建筑物识别方法，该方法包括：将待识别图像输入特征提取模型，获得多个不同尺度的特征图；将每一特征图输入识别模型，获得待识别图像的建筑物识别结果；其中，特征提取模型和识别模型是基于样本图像以及对应的识别标签进行训练后得到；样本图像包括多个不同尺度的建筑物样本的图像；识别标签是根据多个不同尺度的建筑物样本预先确定的，并与样本图像一一对应；每一特征图，分别包括不同尺度的建筑物目标的特征。

此外，上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的建筑物识别方法，该方法包括：将待识别图像输入特征提取模型，获得多个不同尺度的特征图；将每一特征图输入识别模型，获得待识别图像的建筑物识别结果；其中，特征提取模型和识别模型是基于样本图像以及对应的识别标签进行训练后得到；样本图像包括多个不同尺度的建筑物样本的图像；识别标签是根据多个不同尺度的建筑物样本预先确定的，并与样本图像一一对应；每一特征图，分别包括不同尺度的建筑物目标的特征。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的建筑物识别方法，该方法包括：将待识别图像输入特征提取模型，获得多个不同尺度的特征图；将每一特征图输入识别模型，获得待识别图像的建筑物识别结果；其中，特征提取模型和识别模型是基于样本图像以及对应的识别标签进行训练后得到；样本图像包括多个不同尺度的建筑物样本的图像；识别标签是根据多个不同尺度的建筑物样本预先确定的，并与样本图像一一对应；每一特征图，分别包括不同尺度的建筑物目标的特征。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种建筑物识别方法，其特征在于，包括：

2.根据权利要求1所述的建筑物识别方法，其特征在于，所述将待识别图像输入特征提取模型，获得多个不同尺度的特征图，具体包括：

3.根据权利要求2所述的建筑物识别方法，其特征在于，所述将所述待识别图像输入所述特征提取模型包括的特征提取子模型，获得多个不同尺度的原始特征图，具体包括：

4.根据权利要求3所述的建筑物识别方法，其特征在于，所述特征提取卷积单元，包括：

顺次连接的一个卷积残差块和若干个恒等残差块。

5.根据权利要求4所述的建筑物识别方法，其特征在于，所述卷积残差块的主路径包括顺次连接的第一多尺度卷积单元、第二多尺度卷积单元和第三多尺度卷积单元；

6.根据权利要求5所述的建筑物识别方法，其特征在于，所述特征叠加子单元，具体用于：

将第一个多尺度特征子集作为第一个多尺度输出子集；

其中，1≤x≤X，X为预设的尺度参数。

7.根据权利要求5所述的建筑物识别方法，其特征在于，所述特征叠加子单元，具体用于：

将第一个多尺度特征子集作为第一个多尺度输出子集；

其中，2≤x≤X，X为预设的尺度参数。

8.一种建筑物识别装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述建筑物识别方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述建筑物识别方法的步骤。