CN114998662B

CN114998662B - 实景三维地理信息数据识别与提取方法

Info

Publication number: CN114998662B
Application number: CN202210728774.0A
Authority: CN
Inventors: 罗易智; 廖亚东; 罗旭; 张果; 苏豁达
Original assignee: Sichuan Chuanjianyandi Technology Co ltd
Current assignee: Sichuan Chuanjianyandi Technology Co ltd
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2024-05-03
Anticipated expiration: 2042-06-24
Also published as: CN114998662A

Abstract

本发明公开了一种实景三维地理信息数据识别与提取方法，包括选取一测区包括基础地理信息要素分类中的所有类别，且每个类别至少包含100个地物，对该测区进行测绘，生成像素点一一对应的DOM图、DSM图、DLG图，DLG图包含每个地物的类别和边界；将DOM图和DSM图构成四通道图像，所述四通道图像中的每个像素点为一个4维特征向量；构建网络模型；训练网络模型；图像识别。本发明适用于大图幅影像中，地物的类别和边界的识别，训练时采用DLG构造选区，训练CNN0和CNN1，识别时结合SelectiveSearch单元构造选区。从而能实现高精度、快速准确的勾绘要素边界。

Description

实景三维地理信息数据识别与提取方法

技术领域

本发明涉及一种地理信息数据的识别与提取方法，尤其涉及一种实景三维地理信息数据识别与提取方法。

背景技术

地理信息中三维信息在局部反映了地物地类在垂直方向上的分布，也反映了地物地类在顶层表面的粗糙程度、坡度及其纹理密度的关系，这类信息引入机器识别一定会提高识别精度。

在地理信息中每张图片都是以测区为单位，尤其是高清晰DOM构成了海量的像素数据。当下流行的CNN算法都是基于照片、或视频帧作为图像数据源，仅仅适合处理数量巨大的小图片。对DOM来说如何处理大图幅影像，防止机器崩溃也是必须解决的问题。

在地理信息中要素的边界更具有复杂性、准确性，传统的解译软件主要依靠影像颜色识别地理要素特征，这类软件仅仅适合大尺度、低分辨力影像。对于高清晰影像必须提取纹理特征才能分类和识别地理要素。当下流行的CNN算法完美的解决了纹理特征提取难题，但是仅能提取要素的边框坐标(四个角的坐标)，不能满足高精度勾绘要素边界的要求。

发明内容

本发明的目的就在于提供一种解决上述问题，适用于大图幅影像、能准确高精度勾绘要素边界的实景三维地理信息数据识别与提取方法。

为了实现上述目的，本发明采用的技术方案是这样的：一种实景三维地理信息数据识别与提取方法，包括以下步骤；

(1)选取一测区包括基础地理信息要素分类中的所有类别，且每个类别至少包含100个地物，对该测区进行测绘，生成像素点一一对应的DOM图、DSM图、DLG图，DLG图包含每个地物的类别和边界；

(2)将DOM图和DSM图构成四通道图像，所述四通道图像中的每个像素点为一个4维特征向量；

(3)构建网络模型；

所述网络模型包括依次设置的两个神经元网络CNN0、融合单元、CNN1，和SelectiveSearch单元、池化层、第一全连接层、第二全连接层、Softmax分类器；

CNN0：采用VGG16网络构架，用于输入像素点为4维特征向量的四通道图像，输出像素点为512维特征向量的第一特征图；

融合单元：用于将四通道图像和第一特征图叠加为融合图，所述融合图中每个像素点为516维征向量，由同一位置的像素点的4维特征向量和512维向量叠加得到；

CNN1：用于输入融合图，将516维的特征向量的像素点降维，输出像素点为128维特征向量的第二特征图；

Selective Search单元：用于通过相似度计算在第二特征图上生成第二选区，每个第二选区对应一个地物，得到第二选区的范围；

池化层：用于对第二选区的范围对应在第一特征图中像素点的特征向量进行最大池化操作，输出512维的向量；

所述第一全连接层：输入通道为512，输出通道为512；

所述第二全连接层：输入通道为512，输出通道为200；

所述Softmax分类器：用于根据第二全连接层的输出得到分类结果；

(4)训练网络模型；

(41)CNN0训练：

将四通道图像经CNN0输出第一特征图，按DLG图中每个地物的边界，将第一特征图切割成多张独立的地物，并标记每个地物的类别，得到训练样本；

将训练样本依次送入池化层、第一全连接层、第二全连接层，softmax分类器，以该训练样本的类别为期望输出，训练CNN0，得到训练好的CNN0；

(42)CNN1训练：

将融合单元得到的融合图输入CNN1，输出像素点为128维特征向量的第二特征图；

按DLG图中每个地物的边界，在第二特征图上构造数个第一选区，每个第一选区对应一地物，对每个第一选区，以该第一选区内像素点的特征向量的均方差最小值为损失函数，采用梯度下降法修正CNN1权阵，得到训练好的CNN1；

(5)图像识别；

(51)选定一需要识别地物的边界和分类的待测区域，获取待测区域的DOM图和DSM图，并构成待测区域的四通道图像；

(52)将(51)得到的四通道图像，依次经训练好的CNN0、CNN1输出第一特征图、第二特征图；

(53)将第二特征图送入SelectiveSearch单元进行相似度计算，构造数个第二选区；

(54)将(52)得到的第一特征图、(52)得到的数个第二选区，依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后，输出其分类结果。

作为优选：所述测区为已经完成的天然气管道项目区域。

作为优选：将DOM图和DSM图构成四通道图像，具体为DOM图包括RGB三通道灰度值，所述DSM图包括表面高程值，四通道图像中的每个像素点为一个4维特征向量，包含表面高程值和RGB三通道灰度值。

作为优选：所述相似度计算具体为：

根据下式计算融合图中像素点的相似度S，构造第二选区；

式中：U表示当前第二选区边界上的一个像素点，V表示不在当前第二选区但与U相邻的像素点，每个像素点均为128维，U_i V_i分别为像素点U、V的第i个分量，i＝1～128；若s>0.7,则V被纳入U所在的第二选区。

关于：DOM图、DSM图、DLG图；

DOM图和DSM图都是图像数据，DOM图的像素点与DSM图的像素点一一对应。DOM图是包含RGB灰度的真彩色图像，DSM是只包含表面高程的假单色图像，因为它们组合在一起能构成四通道图像，该图像的每个像素点包含4个通道，也就是4个分量。

DLG图中，含有每个地物的类别和边界，边界包围的区域为则为地物的范围，例如，地物的类别有耕地、房屋、道路、河流、电线杆等，每个地物的范围采用多边形表示，描述多边形的顶点坐标和排列顺序。因此，DLG图描述了每个地物在DOM图和DSM图中分别包含哪些像素点。

CNN0是一个神经元网络，输出分类特征向量，参照VGG16网络结构修改使其参与四通道运算，具体见说明书附图的图3。CNN0训练时，要用到DLG图中每个地物的边界，在CNN0输出第一特征图按DLG图中每个地物的边界，将第一特征图切割成多张独立的地物，并标记每个地物的类别，得到训练样本，训练时，以该训练样本标记类别为期望输出，训练CNN0。

CNN1是一个神经元网络，将输入的特征向量降维以降低相似度计算量，输出纹理特征向量，使得相同地理要素输出的特征相似。CNN1训练时，先将融合图降维成为128维特征向量的第二特征图；结合DLG图中每个地物的边界，在第二特征图上构造数个第一选区，再用第一选区内像素点的特征向量的均方差最小值为损失函数，采用梯度下降法修正CNN1权阵，训练CNN1。此时训练时，利用DLG图构造第一选区。

训练结束，识别时，将四通道图像依次经训练好的CNN0、CNN1输出第一特征图、第二特征图；

此时，不存在可用的DLG图构造第一选区，而是采用SelectiveSearch单元构造二选区；再将第一特征图、数个第二选区范围，依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后，输出其分类结果。

与现有技术相比，本发明的优点在于：本发明适用于大图幅影像中，地物的类别和边界的识别，训练时采用DLG构造选区，训练CNN0和CNN1，识别时结合Selective Search单元构造选区。从而能实现高精度、快速准确的勾绘要素边界。

附图说明

图1为本发明流程图；

图2为本发明架构图；

图3为CNN0架构图；

图4为CNN1架构图；

图5为CNN0训练流程图；

图6为CNN1训练流程图。

具体实施方式

下面将结合附图对本发明作进一步说明。

实施例1：参见图1到图6，一种实景三维地理信息数据识别与提取方法，包括以下步骤；

(2)将DOM图和DSM图构成四通道图像，所述四通道图像中的每个像素点为一个4维特征向量；具体为DOM图包括RGB三通道灰度值，所述DSM图包括表面高程值，四通道图像中的每个像素点为一个4维特征向量，包含表面高程值和RGB三通道灰度值；

(3)构建网络模型；

所述第一全连接层：输入通道为512，输出通道为512；

所述第二全连接层：输入通道为512，输出通道为200；

(4)训练网络模型；

(41)CNN0训练：

(42)CNN1训练：

(5)图像识别；

所述测区为已经完成的天然气管道项目区域。

所述相似度计算具体为：

根据下式计算融合图中像素点的相似度S，构造第二选区；

关于训练：训练过程就是配置CNN0、CNN1、全连接层的权重矩阵的过程，其中的池化层不需要训练，只需要正向和反向传递不符值。每个训练层的损失函数都采用特征向量不符值的二次范数取最小值。每次训练包含特征值正向传递、不符值的计算并修正权阵、不符值反向传递。采用最大梯度下降法修改权阵。

CNN0的结构参见图3，包含Conv3*3M*N Relu和MaxPool 2*2 128；

Conv3*3M*N Relu，表示单层卷积运算之后采用Relu作为激活函数输出信号，卷积核为3*3，输入的特征向量维数为M，输出的特征向量维数为N。由于输入特征向量维数为M卷积核应该有N层，每核的大小为3*3*M个权值，输出N维特征向量需要N个核,这些核就是需要训练的权阵。

卷积运算就是以核为模版，依次掩盖在输入层上的每个特征向量上，将每个权值与被掩盖的特征向量相乘求和。假设输入特征向量构成的矩阵为S_i，j，每个S_i，j是M维特征向量，每个特征向量元素为S_i，j，k；输出特征向量构成的矩阵为R_i，j，每个R_i，j是N维特征向量，每个特征向量元素为R_i，j，k；第K个卷积核为H_k构成矩阵H_{k，i，j，t}，那么卷积结果为:

其中k＝1～N，然后R_i，j，k经过激活函数Relu将R_i，j，k中的负数全部置为0，该单层卷积运算至此完成。

MaxPool 2*2 128：表示最大池化。将输入的特征向量矩阵分块，每个块包含2*2特征向量取每个块中二次范数最大的特征向量作为该块的输出。

实施例2：参见图1到图6，如果遇到测区的DOM图、DSM图过大的情况，在进行单幅图处理时，实际操作并不现实，为了解决特大图幅处理的问题，我们采用分块处理、多任务处理的方法。

我们将经DOM图和DSM图得到的四通道图像，划分成多个网格，参见图4，图4中长条形的封闭区域为我们的测区，其余区域的块可以忽略不计。包含测区的每个块可以按顺序按需加载到内存，一旦某块完成了所有步骤即可从内存中释放。因此可以对所有块的位置、步骤进行标识，将所有的块送入流水线中处理，还以设置多个流水线对块相同步骤的块并行处理，进入下一步骤时再进行同步控制。特别地，当测区为带状时可以按照每个块中心的里程顺序加载块到内存，这样可以使得同时加载到内存的块个数达到最小值。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种实景三维地理信息数据识别与提取方法，其特征在于：包括以下步骤；

（1）选取一测区包括基础地理信息要素分类中的所有类别，且每个类别至少包含100个地物，对该测区进行测绘，生成像素点一一对应的DOM图、DSM图、DLG图，DLG图包含每个地物的类别和边界；

（2）将DOM图和DSM图构成四通道图像，所述四通道图像中的每个像素点为一个4维特征向量；

（3）构建网络模型；

所述网络模型包括依次设置的神经元网络CNN0、融合单元、神经元网络CNN1，和SelectiveSearch单元、池化层、第一全连接层、第二全连接层、Softmax分类器；

所述第一全连接层：输入通道为512，输出通道为512；

所述第二全连接层：输入通道为512，输出通道为200；

（4）训练网络模型；

（41）CNN0训练：

（42）CNN1训练：

（5）图像识别；

（51）选定一需要识别地物的边界和分类的待测区域，获取待测区域的DOM图和DSM图，并构成待测区域的四通道图像；

（52）将（51）得到的四通道图像，依次经训练好的CNN0、CNN1输出第一特征图、第二特征图；

（53）将第二特征图送入SelectiveSearch单元进行相似度计算，构造数个第二选区；

（54）将（52）得到的第一特征图、（53）得到的数个第二选区，依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后，输出其分类结果；

将DOM图和DSM图构成四通道图像，具体为DOM图包括RGB三通道灰度值，所述DSM图包括表面高程值，四通道图像中的每个像素点为一个4维特征向量，包含表面高程值和RGB三通道灰度值；

所述相似度计算具体为：

根据下式计算融合图中像素点的相似度S，构造第二选区；

式中：U表示当前第二选区边界上的一个像素点，V表示不在当前第二选区但与U相邻的像素点，每个像素点均为128维，U_i V_i分别为像素点U、V的第i个分量，i=1~128；若s>0.7,则V被纳入U所在的第二选区。

2.根据权利要求1所述的实景三维地理信息数据识别与提取方法，其特征在于：所述测区为已经完成的天然气管道项目区域。