CN116665053A

CN116665053A - 顾及阴影信息的高分辨遥感影像建筑物识别方法及系统

Info

Publication number: CN116665053A
Application number: CN202310629451.0A
Authority: CN
Inventors: 储国中; 舒弥; 游林; 董恒
Original assignee: Zhejiang Shizizhizi Big Data Co ltd
Current assignee: Zhejiang Shizizhizi Big Data Co ltd
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-08-29
Anticipated expiration: 2043-05-30
Also published as: CN116665053B

Abstract

本发明公开了一种顾及阴影信息的高分辨遥感影像建筑物识别方法及系统，其方法包括：S1、通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征转化成单波段模糊景观图，生成顾及阴影方向性关系的融合影像数据；S2、构建改进型TransUnet网络模型对融合影像数据进行特征识别、分割处理得到影像特征图；S3、对分割后的影像特征图进行二值化栅格处理得到包括若干个栅格化建筑图斑的二值化建筑栅格数据，然后规则化、矢量化处理并得到建筑物矢量数据。本发明提高了建筑位置信息和边界信息的识别精度，对建筑结果的规则化和矢量化处理，保证了建筑矢量轮廓与原始建筑物的形状一致性与完整性。

Description

顾及阴影信息的高分辨遥感影像建筑物识别方法及系统

技术领域

本发明涉及遥感图像处理技术领域，尤其涉及一种顾及阴影信息的高分辨遥感影像建筑物识别方法及系统。

背景技术

房屋建筑物是人类生活的重要场所，也是城市建设发展过程中最重要的基础设施，其数量信息和空间分布情况在人口估计、防灾减灾、城市功能区识别、城市用地规划等应用领域有重要作用。早期的建筑物矢量数据通常由实地考察并目视解译获取，随着高分辨遥感卫星技术的快速发展和商业高分辨卫星数据获取渠道的增加，借助卫星遥感数据获取建筑物轮廓信息成为更加高效的手段。

传统的遥感影像建筑物识别方法多基于光谱特征、几何形状特征以及形态学特征等低维特征，这些方法在面对高分辨遥感影像存在的“同物异谱，异物同普”情况时，难以获取较高的精度。而且，不同时相、不同区域以及不同传感器拍摄的影像之间存在差异性，面对复杂的地物情况，准确度高、迁移性强的建筑轮廓识别仍旧具有挑战性。仅使用RGB三波段信息进行深度学习模型训练会丢失影像的特征丰富度，建筑和其它人造物的误分类会影像识别结果，建筑阴影也会影响建筑边界的识别。此外，建筑边缘识别误差会一定程度带来建筑轮廓的扭曲和不贴合，往往无法获取到规则的、准确的建筑轮廓数据。

发明内容

本发明的目的在于解决背景技术所指出的技术问题，提供一种顾及阴影信息的高分辨遥感影像建筑物识别方法及系统，充分考虑了建筑物及其阴影的方向性和拓扑邻接性关系，能够减少建筑物和其它地物的误分类，提高了建筑位置信息和边界信息的识别精度；对建筑结果的规则化和矢量化处理，保证了建筑矢量轮廓与原始建筑物的形状一致性与结构完整性，矢量形式的数据也更有利于数据入库与使用。

本发明的目的通过下述技术方案实现：

一种顾及阴影信息的高分辨遥感影像建筑物识别方法，其方法包括：

S1、获取高分辨遥感影像数据，通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征，提取阴影对象及建筑特征转化成单波段模糊景观图；将单波段模糊景观图与高分辨遥感影像数据融合生成顾及阴影方向性关系的融合影像数据；

S2、基于Unet编解码架构构建改进型TransUnet网络模型，改进型TransUnet网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器和卷积注意力机制模块，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A；卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，卷积注意力机制模块经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图，通道注意力特征图与特征图A相乘获得合并输出的特征向量f’，将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图M_fs；将空间注意力特征图M_fs与特征向量f’相乘得到最终的精细特征图层f″；解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图；

S3、对分割后的影像特征图进行二值化栅格处理得到二值化建筑栅格数据，二值化建筑栅格数据包括若干个栅格化建筑图斑，按照如下方法进行规则化处理：

S31、基于多边形建筑规则化算法对二值化建筑栅格数据的栅格化建筑图斑进行曲线简化处理：

提取栅格化建筑图斑的轮廓曲线，对曲线进行删减曲线点处理：将轮廓曲线的首末两个关键点形成直线，计算曲线上所有关键点与直线的距离并找出最大距离值d_max，设定阈值D，比较d_max和阈值D的大小，若d_max＞D，则以d_max坐标点为界点，将曲线拆分成两部分，若d_max＜D，则舍去曲线上的点；

对曲线拆分后的两部分曲线分别进行删减曲线点处理，依次保留界点并重复处理，将保留的界点依次连接并得到简化后的多边形轮廓线；

S32、对多边形轮廓线进行如下矢量化处理：从多边形轮廓线上的某个节点出发，沿除了轮廓进入方向外的其它多个方向搜索下一个边界点并去除多余点直到连接成完整的边界弧段，判断边界弧段与相邻多边形轮廓线的空间关系以形成具有拓扑完整性的结果，接着去除多余点并对曲线进行圆滑处理后得到建筑物矢量数据。

为了更好地实现本发明，本发明单波段模糊景观图生成方法如下：

S11、根据参考对象R和角度β指定的方向，沿给定方向β、参考对象R周围的模糊景观L_β(R)定义为图像空间中隶属度值的模糊集，景观隶属度值定义在0和1的范围内，参考对象R为阴影对象；采用模糊形态学膨胀操作来生成模糊景观L_β(R)并使用参考对象的边界像素δR用于模糊形态学膨胀操作，参考对象R的模糊景观隶属度L_β(R)(x)表达式如下：

式中：/>代表形态学膨胀操作，x为像素，R^c为参考对象R的补集，v为一个非平面模糊结构元素；

S12、将建筑物特征与阴影对象的方向性关系转化成对象间的方向特征，方向特征Drt(R_i)可以表示为：

式中：n_i是参考对象R_i的像素个数，x_p表示参考对象R_i的一个像素；

S13、将建筑物特征与阴影对象的方向性关系用模糊景观隶属度量化并转化成单波段模糊景观图。

优选地，一个非平面模糊结构元素v由一个角度相关的结构元素v_β和一个距离相关的结构元素v_d组成，

v＝v_β(x)×v_d(x)，

式中：o是v_β的中心像素；θ_β(x，o)是x到o的矢量与沿方向角β的矢量之间的夹角；d(x，o)是x和o之间的距离；k代表结构元素v_d的大小，方向角β根据高分辨遥感影像数据的太阳方位角信息计算得到。

优选地，改进型TransUnet网络模型中深度可分离卷积操作包括深度卷积和逐点卷积；对于输入尺寸为(H，W，C)的图像，完整的深度可分离卷积操作的计算量为C×H×W×(K²+N)，参数量为K²×C+C×1×1×N。

优选地，改进型TransUnet网络模型中通道注意力特征图M_fc表达式如下：

M_fc＝σ(MLP(GAvgPool(f))+MLP(GMaxPool(f)))，

式中：f代表图像特征图，σ代表sigmoid激活函数，GAvgPool代表平均池化运算，GMaxPool代表最大池化运算；

改进型TransUnet网络模型中空间注意力特征图M_fs表达式如下：

M_fs＝σ(f^7×7([GAvgPool(f′)；GMaxPool(f′)]))。

优选地，改进型TransUnet网络模型训练方法如下：

制作融合影像数据样本数据，融合影像数据样本数据包括融合影像数据样本及标签数据，对融合影像数据样本数据采用如下方式进行样本扩容：

A1、将对融合影像数据样本数据按照相同的重叠度采用滑动窗口裁剪的方式获取切片，并计算切片中建筑样本像素占比，剔除建筑样本占比小于10％的样本对，样本对由单个融合影像数据样本及单个标签数据构成；

A2、对融合影像数据样本数据或切片后保留的样本对进行数据翻转、彩色变换以或添加噪声处理；

将扩容后的融合影像数据样本数据的遥感图像和标签图像划分成训练集、验证集和测试集，训练集用于改进型TransUnet网络模型训练，验证集用于评估训练阶段模型的性能，测试集用于评估模型训练完成时网络的识别效果和精度。

优选地，对分割后的影像特征图的二值化栅格处理采用建筑物二值化栅格模型实现，方法如下：构建建筑物二值化栅格模型，建筑物二值化栅格模型采用滑窗预测和测试时增强的方法进行结果识别预测，滑窗预测处理按照影像特征图逐像元或逐裁剪影像块预测处理并拼接成遥感影像所对应的二值化建筑栅格数据。

优选地，二值化建筑栅格数据的栅格化建筑图斑进行曲线简化处理还包括采用基于道格拉斯-普克算法进行规则化简化处理。

一种顾及阴影信息的高分辨遥感影像建筑物识别系统，包括数据采集模块、融合影像数据生成模块、建筑物识别处理系统和输出模块，数据采集模块用于采集高分辨遥感影像数据；融合影像数据生成模块用于通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征，提取阴影对象及建筑特征转化成单波段模糊景观图，将单波段模糊景观图与高分辨遥感影像数据融合生成顾及阴影方向性关系的融合影像数据；建筑物识别处理系统包括改进型TransUnet网络模型和规则化及矢量化处理模块，改进型TransUnet网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器和卷积注意力机制模块，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A；卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，卷积注意力机制模块经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图，通道注意力特征图与特征图A相乘获得合并输出的特征向量f’，将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图M_fs；将空间注意力特征图M_fs与特征向量f’相乘得到最终的精细特征图层f″；解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图；规则化及矢量化处理模块用于对割后的影像特征图进行二值化栅格处理得到二值化建筑栅格数据并进行曲线简化处理得到简化后的多边形轮廓线，对多边形轮廓线进行矢量化处理并得到建筑物矢量数据；输出模块用于输出建筑物矢量数据结果。

本发明较现有技术相比，具有以下优点及有益效果：

(1)本发明充分考虑了建筑物及其阴影的方向性和拓扑邻接性关系，能够减少建筑物和其它地物的误分类，提高了建筑位置信息和边界信息的识别精度；对建筑结果的规则化和矢量化处理，保证了建筑矢量轮廓与原始建筑物的形状一致性与结构完整性，矢量形式的数据也更有利于数据入库与使用。

(2)本发明通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征，提取阴影对象及建筑特征转化成单波段模糊景观图并与高分辨遥感影像数据融合生成顾及阴影方向性关系的融合影像数据，将融合影像数据输入改进型TransUnet网络模型得到融合影像数据分割后的影像特征图，增加了模型的特征丰富度，有助于提高高分辨遥感影像建筑物的提取精度。

(3)本发明改进型TransUnet网络模型在编码阶段增加了注意力机制、解码阶段引入了可分离卷积操作，提高了模型特征提取能力、优化了对小尺寸建筑识别效果，减少了数据参数量和轻量化了模型其大小。

(4)本发明对基于像素识别的建筑轮廓进一步进行规则化处理和矢量化处理，保证了建筑矢量轮廓与原始建筑物的形状一致性与结构完整性，矢量形式的数据也更有利于数据入库及使用。

附图说明

图1为本发明高分辨遥感影像建筑物识别方法的流程示意图；

图2为实施例中高分辨遥感影像建筑物识别方法的方法流程图；

图3为实施例中改进型TransUnet网络模型的原理结构图；

图4为实施例中感影像建筑物识别、处理演变过程中的案例效果对比图；

图5为本发明高分辨遥感影像建筑物识别系统的原理结构框图。

具体实施方式

下面结合实施例对本发明作进一步地详细说明：

实施例

如图1～图4所示，一种顾及阴影信息的高分辨遥感影像建筑物识别方法，其方法包括：

S1、获取高分辨遥感影像数据，通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征(通过多分辨率分割算法对高分辨遥感影像进行过分割作为初始分割，接着使用机器学习分类方法在此分割级别基于光谱特征识别阴影对象)，提取阴影对象及建筑特征转化成单波段模糊景观图。在一些实施例中，单波段模糊景观图生成方法如下：

S11、根据参考对象R和角度β指定的方向，沿给定方向β、参考对象R周围的模糊景观L_β(R)定义为图像空间中隶属度值的模糊集，景观隶属度值定义在0和1的范围内，参考对象R为阴影对象。本发明通过角度θ_β(x，b)和距离d(x，b)对隶属度值L_β(R)(x)进行量化处理，其中像素x∈I(I为高分辨遥感影像数据的像素集)，像素b∈R；角度θ_β(x，b)是x到b的向量与沿方向β的单位向量相对于水平轴的夹角；d(x，b)是x和b之间的欧氏距离。采用模糊形态学膨胀操作来生成模糊景观L_β(R)并使用参考对象的边界像素δR用于模糊形态学膨胀操作，参考对象R的模糊景观隶属度L_β(R)(x)表达式如下：

式中：/>代表形态学膨胀操作，x为像素，R^c为参考对象R的补集，v为一个非平面模糊结构元素。

一个非平面模糊结构元素v由一个角度相关的结构元素v_β和一个距离相关的结构元素v_d组成，

v＝v_β(x)×v_d(x)，

式中：o是v_β的中心像素；θ_β(x，o)是x到o的矢量与沿方向角β的矢量之间的夹角；d(x，o)是x和o之间的距离；k代表结构元素v_d的大小，方向角β根据高分辨遥感影像数据的太阳方位角信息计算得到(进一步的，高分辨遥感影像数据的元数据文件中提供有关太阳方位角/>的信息，可用于推断相对于水平轴的方向角β)。

将单波段模糊景观图与高分辨遥感影像数据融合(采用波段组合的融合方法)生成顾及阴影方向性关系的融合影像数据。

S2、基于Unet编解码架构构建改进型TransUnet网络模型，改进型TransUnet网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器(优选采用CNN-Transformer的混合编码器)和卷积注意力机制模块(优选地，本发明也可以在所构建的混合编码器CNN卷积操作后嵌入卷积注意力机制模块CBAM)，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A。Transformer编码器由CNN算法提取浅层特征，然后使用图像块嵌入对位置信息进行编码。Transformer编码器包含多个Transformer层，来自编码器的跳跃连接和Transformer的输出迭代到解码器(即解码器部分)，解码器与U-Net类似，由多个卷积层和上采样层组成，在解码器架构中，来自Transformers的重构输出与不同空间维度的CNN模块连接，以增强局部和全局空间上下文。在编码器部分和解码器部分中，为了匹配输入张量的空间维度，将执行级联上采样(CUP)操作，CUP由4个上采样模块组成，用于对编码器的输出特征进行解码以获得最终的分割图；同时TransUNet保留了U-Net的跳跃连接，有助于通过恢复低级空间信息来增强更精细的分割细节。

卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成(卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，特征图A经过全局最大池化和全局平均池化后对空间信息进行聚合和压缩，得到两个C×1×1的特征图)，卷积注意力机制模块(又称卷积注意力机制模块CBAM)经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图。在一些实施例中，改进型TransUnet网络模型中通道注意力特征图M_fc表达式如下：

M_fc＝σ(MLP(GAvgPool(f))+MLP(GMaxPool(f)))，

式中：f代表图像特征图，σ代表sigmoid激活函数，GAvgPool代表平均池化运算，GMaxPool代表最大池化运算。

通道注意力特征图与特征图A相乘获得合并输出的特征向量f’，

即

将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图M_fs；将空间注意力特征图M_fs与特征向量f′相乘得到最终的精细特征图层f″；改进型TransUnet网络模型中空间注意力特征图M_fs表达式如下：

M_fs＝σ(f^7×7([GAvgPool(f′)；GMaxPool(f′)]))。

解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图。本发明改进型TransUnet网络模型在解码阶段采用深度可分离卷积操作，深度可分离卷积将常规卷积操作拆分为两个独立的操作：深度卷积和逐点卷积。在一些实施例中，改进型TransUnet网络模型中深度可分离卷积操作包括深度卷积和逐点卷积；对于输入尺寸为(H，W，C)的图像，完整的深度可分离卷积操作的计算量为C×H×W×(K²+N)，参数量为K²×C+C×1×1×N，由此本发迷茫计算量和参数量是普通卷积操作的能够让模型更加轻量化。

在一些实施例中，改进型TransUnet网络模型训练方法如下：

A1、将对融合影像数据样本数据按照相同的重叠度采用滑动窗口裁剪的方式获取切片，并计算切片中建筑样本像素占比，剔除建筑样本占比小于10％的样本对，样本对由单个融合影像数据样本及单个标签数据构成。

A2、对融合影像数据样本数据或切片后保留的样本对进行数据翻转、彩色变换以或添加噪声处理。将扩容后的融合影像数据样本数据的遥感图像和标签图像划分成训练集、验证集和测试集，训练集用于改进型TransUnet网络模型训练，验证集用于评估训练阶段模型的性能，测试集用于评估模型训练完成时网络的识别效果和精度。

本发明改进型TransUnet网络模型在模型训练时，对融合后的影像数据和标签数据按照相同的重叠度采用滑动窗口裁剪的方式获取切片，并计算切片中建筑样本像素占比，剔除建筑样本占比小于10％的样本对；对裁剪后的影像和标签切片进行数据增强，扩大样本量和样本多样性。所述数据增强操作包括：数据翻转(对影像和标签进行水平翻转、垂直翻转、镜像翻转)、彩色变换以及添加噪声。将数据增强后的遥感图像和标签图像划分成训练集、验证集和测试集。训练集用于模型训练，进行特征学习；验证集用于评估训练阶段模型的性能，便于调整训练参数；测试集用于评估模型训练完成时网络的识别效果和精度。本发明将扩容后的融合影像数据样本数据的遥感图像和标签图像划分成训练集、验证集和测试集，训练集用于模型训练，进行特征学习；验证集用于评估训练阶段模型的性能，便于调整训练参数；测试集用于评估模型训练完成时网络的识别效果和精度。

本发明模型训练过程中，初始迭代次数时使用较小的学习率，待模型趋于稳定后使用预先设置的学习率进行训练，以此使模型快速且稳定收敛；通过监测模型在验证集的损失值和精度，当验证集精度达到一定阈值且损失值减少的程度连续小于给定阈值时，保存训练过程中的最优模型。基于获取的最优模型权重文件，采用滑窗预测和测试时增强的方法进行结果预测。具体的，用给定的重叠度对影像裁剪并进行逐块预测，每次预测结果只保留中心区域，舍弃图像边缘的预测结果。同时对预测图像进行不同形式的增强并对预测结果取平均得到无拼接痕迹的大尺寸遥感影像的预测结果。在一些实施例中，模型训练过程中，模型预计最大迭代此时为150个批次，前十个迭代次数时使用较小的学习率，待模型趋于稳定后使用预先设置的学习率(0.0001)进行训练，当验证集精度达到90％一定阈值且损失值减少的程度连续小于0.05时，保存训练过程中的最优模型。基于获取的最优模型权重文件，采用滑窗预测和测试时增强的方法进行结果预测。具体的，按照50％的重叠度对影像裁剪成512×512的像素大小，并进行逐块预测，每次预测结果只保留中心区域，舍弃图像边缘的预测结果。

在一些实施例中，二值化建筑栅格数据的栅格化建筑图斑进行曲线简化处理还包括采用基于道格拉斯-普克算法进行规则化简化处理(本实施例主要用于获取栅格化建筑图斑及规则化初步处理)。

如图5所示，一种顾及阴影信息的高分辨遥感影像建筑物识别系统，包括数据采集模块、融合影像数据生成模块、建筑物识别处理系统和输出模块，数据采集模块用于采集高分辨遥感影像数据；融合影像数据生成模块用于通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征，提取阴影对象及建筑特征转化成单波段模糊景观图，将单波段模糊景观图与高分辨遥感影像数据融合生成顾及阴影方向性关系的融合影像数据。

建筑物识别处理系统包括改进型TransUnet网络模型和规则化及矢量化处理模块，改进型TransUnet网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器和卷积注意力机制模块，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A；卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，卷积注意力机制模块经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图，通道注意力特征图与特征图A相乘获得合并输出的特征向量f’，将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图M_fs；将空间注意力特征图M_fs与特征向量f’相乘得到最终的精细特征图层f″；解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图。

本发明基于Unet编解码架构进行改进型TransUnet网络模型的构建，如图3所示，改进型TransUnet网络模型左侧部分的编码器部分采用CNN-Transformer的混合编码器，由CNN算法提取浅层特征，然后使用图像块嵌入对位置信息进行编码。Transformer编码器包含多个Transformer层，来自编码器的跳跃连接和Transformer的输出迭代到解码器，解码器与U-Net类似，由多个卷积层和上采样层组成，在解码器架构中，来自Transformers的重构输出与不同空间维度的CNN模块连接，以增强局部和全局空间上下文。为了匹配输入张量的空间维度，将执行级联上采样(CUP)操作，CUP由4个上采样模块组成，用于对编码器的输出特征进行解码以获得最终的分割图。同时TransUNet保留了U-Net的跳跃连接，有助于通过恢复低级空间信息来增强更精细的分割细节。

本发明在改进型TransUnet网络模型的混合编码器CNN卷积操作后嵌入卷积注意力机制模块(CBAM)。卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，特征图f经过全局最大池化和全局平均池化后对空间信息进行聚合和压缩，得到两个C×1×1的特征图，其在共享网络中经过多层感知机进行特征加权求和，再经过sigmoid激活函数生成通道注意力特征图M_fc：通道注意力特征图M_fc表达式如下：

M_fc＝σ(MLP(GAvgPool(f))+MLP(GMaxPool(f)))，

式中：f代表图像特征图，σ代表sigmoid激活函数，GAvgPool代表平均池化运算，GMaxPool代表最大池化运算。在此基础上，与原输入特征图相乘获得合并输出的特征向量f’：

特征向量f’继续经过全局最大池化和全局平均池化得到两个H×W×1的特征图，对其进行特征图连接和激活后生成空间注意力特征图M_fs：空间注意力特征图M_fs表达式如下：

M_fs＝σ(f^7×7([GAvgPool(f′)；GMaxPool(f′)]))。

最后将获取的空间注意力特征图与输入特征图f′相乘得到最终的精细特征图层f″：

本发明改进型TransUnet网络模型在解码阶段采用深度可分离卷积操作代替普通的卷积操作。深度可分离卷积将常规卷积操作拆分为两个独立的操作：深度卷积和逐点卷积。对于输入尺寸为(H,W，C)的图像，完整的深度可分离卷积操作的计算量为C×H×W×(K²+N)，参数量为K²×C+C×1×1×N，其计算量和参数量是普通卷积操做的因此深度可分离卷积可以是模型更加轻量化。

规则化及矢量化处理模块用于对割后的影像特征图进行二值化栅格处理得到二值化建筑栅格数据并进行曲线简化处理得到简化后的多边形轮廓线，对多边形轮廓线进行矢量化处理并得到建筑物矢量数据。基于道格拉斯-普克算法对获取的栅格化建筑图斑进行规则化处理，多边形建筑规则化算法可以看作是建筑边界轮廓线的简化过程，连接曲线的首末两个关键点形成直线，计算曲线上所有关键点与直线的距离并找出最大距离值d_max。比较d_max和阈值D的大小，若d_max＞D，则以d_max坐标点为界，将曲线拆分成两部分，若d_max＜D，则舍去曲线上的中间点，将所得曲线简化为最终线段。重复上述步骤，依次连接保留的点，从而获得简化后的多边形轮廓。规则化及矢量化处理模块对规则化后的二值化建筑栅格数据进行矢量化处理，具体为：从建筑多边形轮廓上的某个节点出发，沿除了轮廓进入方向的其它七个方向搜索下一个边界点，直到连接成边界弧段。判断边界弧段与其它多边形的空间关系以形成具有拓扑完整性的结果。进一步去除多余点并对曲线进行圆滑后得到建筑物矢量数据。

输出模块用于输出建筑物矢量数据结果。

以上所述权为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：其方法包括：

S2、基于Unet编解码架构构建改进型TransUnet网络模型，改进型TransUnet网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器和卷积注意力机制模块，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A；卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，卷积注意力机制模块经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图，通道注意力特征图与特征图A相乘获得合并输出的特征向量f′，将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图M_fs；将空间注意力特征图M_fs与特征向量f′相乘得到量终的精细特征图层f″；解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图；

提取栅格化建筑图斑的轮廓曲线，对曲线进行删减曲线点处理：将轮廓曲线的首未两个关键点形成直线，计算曲线上所有关键点与直线的距离并找出最大距离值d_max，设定阈值D，比较d_max和阈值D的大小，若d_max>D，则以d_max坐标点为界点，将曲线拆分成两部分，若d_max＜D，则舍去曲线上的点；

2.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征右于：单波段模糊景观图生成方法如下：

S11、根据参考对象R和角度β指定的方向，沿给定方向β、参考对象R周围的模糊景观L_β(R)定义为图像空间中隶属度值的模糊集，景观隶属度值定义在0和1的范围内，参考对象R为阴影对象；采用模糊形态学膨胀操作来生成模糊景观L_β(R)并使用参考对象的边界像表δR用于模糊形态学膨胀操作，参考对象R的模糊景观隶属度L_β(R)(x)表达式如下：

式中：/>代表形态学膨胀操作.x为像素，R^c为参考对象R的补集，v为一个非平面模糊结构元素；

3.按照权利要求2所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：一个非平面模糊结构元素v由一个角度相关的结构元素v_β和一个距离相关的结构元素v_d组成，

v＝v_β(x)×v_d(x)，

4.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：改进型TransUnet网络模型中深度可分离卷积操作包括深度卷积和逐点卷积；对于输入尺寸为(H，W，C)的图像，完整的深度可分离卷积操作的计算量为C×H×W×(K²+N)，参数量为K²×C+C×1×1×N。

5.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：改进型TransUnet网络模型中通道注意力特征图M_fc表达式如下：

M_fc＝σ(MLP(GAvgPool(f))+MLP(GMaxPool(f)))，

改进型TransUnet网络模型中空间注意力特征图M_fs表达式如下：

M_fs＝σ(f^7×7([GAvgPool(f′)；GMaxPool(f′)]))。

6.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：改进型TransUnet网络模型训练方法如下：

将扩容后的融合影像数据样本数据的遥感图像和标签图像划分成训练集、验证集和测试集，训练集用于改进型TransUnet网络模型训练，验证集用于评估训练阶段模型内性能，测试集用于评估模型训练完成时网络的识别效果和精度。

7.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：对分割后的影像特征图的二值化栅格处理采用建筑物二值化栅格模型实现，方法如下：构建建筑物二值化栅格模型，建筑物二值化栅格模型采用滑窗预测和测试时增强的方法进行结果识别预测，滑窗预测处理按照影像特征图逐像元或逐裁剪影像块预测处理并拼接成遥感影像所对应的二值化建筑栅格数据。

8.按照权利要求1所述的顾及阴影信息的高分辨遥感影像建筑物识别方法，其特征在于：二值化建筑栅格数据的栅格化建筑图斑进行曲线简化处理还包括采用基于道格拉斯-普克算法进行规则化简化处理。

9.一种顾及阴影信息的高分辨遥感影像建筑物识别系统，其特征在于：包括数据采集模块、融合影像数据生成模块、建筑物识别处理系统和输出模块，数据采集模块用于采集高分辨遥感影像数据；融合影像数据生成模块用于通过多分辨率分割算法对高分辨遥感影像数据进行初始分割并基于光谱特征识别出阴影对象及建筑特征，提取阴影对象及建筑特征转化成单波段模糊景观图，将单波段模糊景观图与高分辨遥感影像数据融合生成顾及阴影方向性关系的融合影像数据；建筑物识别处理系统包括改进型TransUnet网络模型和规则化及矢量化处理模块，改进型TransUnet 网络模型包括编码器部分和解码器部分，编码器部分包括Transformer编码器和卷积注意力机制模块，Transformer编码器包括若干个卷积层和上采样层，Transformer编码器采用CNN-Transformer算法对融合影像数据提取浅层特征及位置信息进行编码并得到特征图A；卷积注意力机制模块由通道注意力模块和空间注意力模块串联组成，卷积注意力机制模块经过多层感知机进行特征加权求和、sigmoid激活函数对特征图A处理并生成通道注意力特征图，通道注意力特征图与特征图A相乘获得合并输出的特征向量f′，将特征向量f’经过全局最大池化、全局平均池化处理、特征图连接处理得到空间注意力特征图Mfs；将空间注意力特征图Mfs与特征向量f’相乘得到最终的精细特征图层f″；解码器部分包括若干个卷积层和上采样层，解码器部分的卷积层采用深度可分离卷积操作，解码器部分输出融合影像数据分割后的影像特征图；规则化及矢量化处理模块用于对割后的影像特征图进行二值化栅格处理得到二值化建筑栅格数据并进行曲线简化处理得到简化后的多边形轮廓线，对多边形轮廓线进行矢量化处理并得到建筑物矢量数据；输出模块用于输出建筑物矢量数据结果。