CN114998662B - 实景三维地理信息数据识别与提取方法 - Google Patents

实景三维地理信息数据识别与提取方法 Download PDF

Info

Publication number
CN114998662B
CN114998662B CN202210728774.0A CN202210728774A CN114998662B CN 114998662 B CN114998662 B CN 114998662B CN 202210728774 A CN202210728774 A CN 202210728774A CN 114998662 B CN114998662 B CN 114998662B
Authority
CN
China
Prior art keywords
image
feature
map
dimensional
cnn0
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210728774.0A
Other languages
English (en)
Other versions
CN114998662A (zh
Inventor
罗易智
廖亚东
罗旭
张果
苏豁达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Chuanjianyandi Technology Co ltd
Original Assignee
Sichuan Chuanjianyandi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Chuanjianyandi Technology Co ltd filed Critical Sichuan Chuanjianyandi Technology Co ltd
Priority to CN202210728774.0A priority Critical patent/CN114998662B/zh
Publication of CN114998662A publication Critical patent/CN114998662A/zh
Application granted granted Critical
Publication of CN114998662B publication Critical patent/CN114998662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种实景三维地理信息数据识别与提取方法,包括选取一测区包括基础地理信息要素分类中的所有类别,且每个类别至少包含100个地物,对该测区进行测绘,生成像素点一一对应的DOM图、DSM图、DLG图,DLG图包含每个地物的类别和边界;将DOM图和DSM图构成四通道图像,所述四通道图像中的每个像素点为一个4维特征向量;构建网络模型;训练网络模型;图像识别。本发明适用于大图幅影像中,地物的类别和边界的识别,训练时采用DLG构造选区,训练CNN0和CNN1,识别时结合SelectiveSearch单元构造选区。从而能实现高精度、快速准确的勾绘要素边界。

Description

实景三维地理信息数据识别与提取方法
技术领域
本发明涉及一种地理信息数据的识别与提取方法,尤其涉及一种实景三维地理信息数据识别与提取方法。
背景技术
地理信息中三维信息在局部反映了地物地类在垂直方向上的分布,也反映了地物地类在顶层表面的粗糙程度、坡度及其纹理密度的关系,这类信息引入机器识别一定会提高识别精度。
在地理信息中每张图片都是以测区为单位,尤其是高清晰DOM构成了海量的像素数据。当下流行的CNN算法都是基于照片、或视频帧作为图像数据源,仅仅适合处理数量巨大的小图片。对DOM来说如何处理大图幅影像,防止机器崩溃也是必须解决的问题。
在地理信息中要素的边界更具有复杂性、准确性,传统的解译软件主要依靠影像颜色识别地理要素特征,这类软件仅仅适合大尺度、低分辨力影像。对于高清晰影像必须提取纹理特征才能分类和识别地理要素。当下流行的CNN算法完美的解决了纹理特征提取难题,但是仅能提取要素的边框坐标(四个角的坐标),不能满足高精度勾绘要素边界的要求。
发明内容
本发明的目的就在于提供一种解决上述问题,适用于大图幅影像、能准确高精度勾绘要素边界的实景三维地理信息数据识别与提取方法。
为了实现上述目的,本发明采用的技术方案是这样的:一种实景三维地理信息数据识别与提取方法,包括以下步骤;
(1)选取一测区包括基础地理信息要素分类中的所有类别,且每个类别至少包含100个地物,对该测区进行测绘,生成像素点一一对应的DOM图、DSM图、DLG图,DLG图包含每个地物的类别和边界;
(2)将DOM图和DSM图构成四通道图像,所述四通道图像中的每个像素点为一个4维特征向量;
(3)构建网络模型;
所述网络模型包括依次设置的两个神经元网络CNN0、融合单元、CNN1,和SelectiveSearch单元、池化层、第一全连接层、第二全连接层、Softmax分类器;
CNN0:采用VGG16网络构架,用于输入像素点为4维特征向量的四通道图像,输出像素点为512维特征向量的第一特征图;
融合单元:用于将四通道图像和第一特征图叠加为融合图,所述融合图中每个像素点为516维征向量,由同一位置的像素点的4维特征向量和512维向量叠加得到;
CNN1:用于输入融合图,将516维的特征向量的像素点降维,输出像素点为128维特征向量的第二特征图;
Selective Search单元:用于通过相似度计算在第二特征图上生成第二选区,每个第二选区对应一个地物,得到第二选区的范围;
池化层:用于对第二选区的范围对应在第一特征图中像素点的特征向量进行最大池化操作,输出512维的向量;
所述第一全连接层:输入通道为512,输出通道为512;
所述第二全连接层:输入通道为512,输出通道为200;
所述Softmax分类器:用于根据第二全连接层的输出得到分类结果;
(4)训练网络模型;
(41)CNN0训练:
将四通道图像经CNN0输出第一特征图,按DLG图中每个地物的边界,将第一特征图切割成多张独立的地物,并标记每个地物的类别,得到训练样本;
将训练样本依次送入池化层、第一全连接层、第二全连接层,softmax分类器,以该训练样本的类别为期望输出,训练CNN0,得到训练好的CNN0;
(42)CNN1训练:
将融合单元得到的融合图输入CNN1,输出像素点为128维特征向量的第二特征图;
按DLG图中每个地物的边界,在第二特征图上构造数个第一选区,每个第一选区对应一地物,对每个第一选区,以该第一选区内像素点的特征向量的均方差最小值为损失函数,采用梯度下降法修正CNN1权阵,得到训练好的CNN1;
(5)图像识别;
(51)选定一需要识别地物的边界和分类的待测区域,获取待测区域的DOM图和DSM图,并构成待测区域的四通道图像;
(52)将(51)得到的四通道图像,依次经训练好的CNN0、CNN1输出第一特征图、第二特征图;
(53)将第二特征图送入SelectiveSearch单元进行相似度计算,构造数个第二选区;
(54)将(52)得到的第一特征图、(52)得到的数个第二选区,依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后,输出其分类结果。
作为优选:所述测区为已经完成的天然气管道项目区域。
作为优选:将DOM图和DSM图构成四通道图像,具体为DOM图包括RGB三通道灰度值,所述DSM图包括表面高程值,四通道图像中的每个像素点为一个4维特征向量,包含表面高程值和RGB三通道灰度值。
作为优选:所述相似度计算具体为:
根据下式计算融合图中像素点的相似度S,构造第二选区;
式中:U表示当前第二选区边界上的一个像素点,V表示不在当前第二选区但与U相邻的像素点,每个像素点均为128维,Ui Vi分别为像素点U、V的第i个分量,i=1~128;若s>0.7,则V被纳入U所在的第二选区。
关于:DOM图、DSM图、DLG图;
DOM图和DSM图都是图像数据,DOM图的像素点与DSM图的像素点一一对应。DOM图是包含RGB灰度的真彩色图像,DSM是只包含表面高程的假单色图像,因为它们组合在一起能构成四通道图像,该图像的每个像素点包含4个通道,也就是4个分量。
DLG图中,含有每个地物的类别和边界,边界包围的区域为则为地物的范围,例如,地物的类别有耕地、房屋、道路、河流、电线杆等,每个地物的范围采用多边形表示,描述多边形的顶点坐标和排列顺序。因此,DLG图描述了每个地物在DOM图和DSM图中分别包含哪些像素点。
CNN0是一个神经元网络,输出分类特征向量,参照VGG16网络结构修改使其参与四通道运算,具体见说明书附图的图3。CNN0训练时,要用到DLG图中每个地物的边界,在CNN0输出第一特征图按DLG图中每个地物的边界,将第一特征图切割成多张独立的地物,并标记每个地物的类别,得到训练样本,训练时,以该训练样本标记类别为期望输出,训练CNN0。
CNN1是一个神经元网络,将输入的特征向量降维以降低相似度计算量,输出纹理特征向量,使得相同地理要素输出的特征相似。CNN1训练时,先将融合图降维成为128维特征向量的第二特征图;结合DLG图中每个地物的边界,在第二特征图上构造数个第一选区,再用第一选区内像素点的特征向量的均方差最小值为损失函数,采用梯度下降法修正CNN1权阵,训练CNN1。此时训练时,利用DLG图构造第一选区。
训练结束,识别时,将四通道图像依次经训练好的CNN0、CNN1输出第一特征图、第二特征图;
此时,不存在可用的DLG图构造第一选区,而是采用SelectiveSearch单元构造二选区;再将第一特征图、数个第二选区范围,依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后,输出其分类结果。
与现有技术相比,本发明的优点在于:本发明适用于大图幅影像中,地物的类别和边界的识别,训练时采用DLG构造选区,训练CNN0和CNN1,识别时结合Selective Search单元构造选区。从而能实现高精度、快速准确的勾绘要素边界。
附图说明
图1为本发明流程图;
图2为本发明架构图;
图3为CNN0架构图;
图4为CNN1架构图;
图5为CNN0训练流程图;
图6为CNN1训练流程图。
具体实施方式
下面将结合附图对本发明作进一步说明。
实施例1:参见图1到图6,一种实景三维地理信息数据识别与提取方法,包括以下步骤;
(1)选取一测区包括基础地理信息要素分类中的所有类别,且每个类别至少包含100个地物,对该测区进行测绘,生成像素点一一对应的DOM图、DSM图、DLG图,DLG图包含每个地物的类别和边界;
(2)将DOM图和DSM图构成四通道图像,所述四通道图像中的每个像素点为一个4维特征向量;具体为DOM图包括RGB三通道灰度值,所述DSM图包括表面高程值,四通道图像中的每个像素点为一个4维特征向量,包含表面高程值和RGB三通道灰度值;
(3)构建网络模型;
所述网络模型包括依次设置的两个神经元网络CNN0、融合单元、CNN1,和SelectiveSearch单元、池化层、第一全连接层、第二全连接层、Softmax分类器;
CNN0:采用VGG16网络构架,用于输入像素点为4维特征向量的四通道图像,输出像素点为512维特征向量的第一特征图;
融合单元:用于将四通道图像和第一特征图叠加为融合图,所述融合图中每个像素点为516维征向量,由同一位置的像素点的4维特征向量和512维向量叠加得到;
CNN1:用于输入融合图,将516维的特征向量的像素点降维,输出像素点为128维特征向量的第二特征图;
Selective Search单元:用于通过相似度计算在第二特征图上生成第二选区,每个第二选区对应一个地物,得到第二选区的范围;
池化层:用于对第二选区的范围对应在第一特征图中像素点的特征向量进行最大池化操作,输出512维的向量;
所述第一全连接层:输入通道为512,输出通道为512;
所述第二全连接层:输入通道为512,输出通道为200;
所述Softmax分类器:用于根据第二全连接层的输出得到分类结果;
(4)训练网络模型;
(41)CNN0训练:
将四通道图像经CNN0输出第一特征图,按DLG图中每个地物的边界,将第一特征图切割成多张独立的地物,并标记每个地物的类别,得到训练样本;
将训练样本依次送入池化层、第一全连接层、第二全连接层,softmax分类器,以该训练样本的类别为期望输出,训练CNN0,得到训练好的CNN0;
(42)CNN1训练:
将融合单元得到的融合图输入CNN1,输出像素点为128维特征向量的第二特征图;
按DLG图中每个地物的边界,在第二特征图上构造数个第一选区,每个第一选区对应一地物,对每个第一选区,以该第一选区内像素点的特征向量的均方差最小值为损失函数,采用梯度下降法修正CNN1权阵,得到训练好的CNN1;
(5)图像识别;
(51)选定一需要识别地物的边界和分类的待测区域,获取待测区域的DOM图和DSM图,并构成待测区域的四通道图像;
(52)将(51)得到的四通道图像,依次经训练好的CNN0、CNN1输出第一特征图、第二特征图;
(53)将第二特征图送入SelectiveSearch单元进行相似度计算,构造数个第二选区;
(54)将(52)得到的第一特征图、(52)得到的数个第二选区,依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后,输出其分类结果。
所述测区为已经完成的天然气管道项目区域。
所述相似度计算具体为:
根据下式计算融合图中像素点的相似度S,构造第二选区;
式中:U表示当前第二选区边界上的一个像素点,V表示不在当前第二选区但与U相邻的像素点,每个像素点均为128维,Ui Vi分别为像素点U、V的第i个分量,i=1~128;若s>0.7,则V被纳入U所在的第二选区。
关于训练:训练过程就是配置CNN0、CNN1、全连接层的权重矩阵的过程,其中的池化层不需要训练,只需要正向和反向传递不符值。每个训练层的损失函数都采用特征向量不符值的二次范数取最小值。每次训练包含特征值正向传递、不符值的计算并修正权阵、不符值反向传递。采用最大梯度下降法修改权阵。
CNN0的结构参见图3,包含Conv3*3M*N Relu和MaxPool 2*2 128;
Conv3*3M*N Relu,表示单层卷积运算之后采用Relu作为激活函数输出信号,卷积核为3*3,输入的特征向量维数为M,输出的特征向量维数为N。由于输入特征向量维数为M卷积核应该有N层,每核的大小为3*3*M个权值,输出N维特征向量需要N个核,这些核就是需要训练的权阵。
卷积运算就是以核为模版,依次掩盖在输入层上的每个特征向量上,将每个权值与被掩盖的特征向量相乘求和。假设输入特征向量构成的矩阵为Si,j,每个Si,j是M维特征向量,每个特征向量元素为Si,j,k;输出特征向量构成的矩阵为Ri,j,每个Ri,j是N维特征向量,每个特征向量元素为Ri,j,k;第K个卷积核为Hk构成矩阵Hk,i,j,t,那么卷积结果为:
其中k=1~N,然后Ri,j,k经过激活函数Relu将Ri,j,k中的负数全部置为0,该单层卷积运算至此完成。
MaxPool 2*2 128:表示最大池化。将输入的特征向量矩阵分块,每个块包含2*2特征向量取每个块中二次范数最大的特征向量作为该块的输出。
实施例2:参见图1到图6,如果遇到测区的DOM图、DSM图过大的情况,在进行单幅图处理时,实际操作并不现实,为了解决特大图幅处理的问题,我们采用分块处理、多任务处理的方法。
我们将经DOM图和DSM图得到的四通道图像,划分成多个网格,参见图4,图4中长条形的封闭区域为我们的测区,其余区域的块可以忽略不计。包含测区的每个块可以按顺序按需加载到内存,一旦某块完成了所有步骤即可从内存中释放。因此可以对所有块的位置、步骤进行标识,将所有的块送入流水线中处理,还以设置多个流水线对块相同步骤的块并行处理,进入下一步骤时再进行同步控制。特别地,当测区为带状时可以按照每个块中心的里程顺序加载块到内存,这样可以使得同时加载到内存的块个数达到最小值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种实景三维地理信息数据识别与提取方法,其特征在于:包括以下步骤;
(1)选取一测区包括基础地理信息要素分类中的所有类别,且每个类别至少包含100个地物,对该测区进行测绘,生成像素点一一对应的DOM图、DSM图、DLG图,DLG图包含每个地物的类别和边界;
(2)将DOM图和DSM图构成四通道图像,所述四通道图像中的每个像素点为一个4维特征向量;
(3)构建网络模型;
所述网络模型包括依次设置的神经元网络CNN0、融合单元、神经元网络CNN1,和SelectiveSearch单元、池化层、第一全连接层、第二全连接层、Softmax分类器;
CNN0:采用VGG16网络构架,用于输入像素点为4维特征向量的四通道图像,输出像素点为512维特征向量的第一特征图;
融合单元:用于将四通道图像和第一特征图叠加为融合图,所述融合图中每个像素点为516维征向量,由同一位置的像素点的4维特征向量和512维向量叠加得到;
CNN1:用于输入融合图,将516维的特征向量的像素点降维,输出像素点为128维特征向量的第二特征图;
Selective Search单元:用于通过相似度计算在第二特征图上生成第二选区,每个第二选区对应一个地物,得到第二选区的范围;
池化层:用于对第二选区的范围对应在第一特征图中像素点的特征向量进行最大池化操作,输出512维的向量;
所述第一全连接层:输入通道为512,输出通道为512;
所述第二全连接层:输入通道为512,输出通道为200;
所述Softmax分类器:用于根据第二全连接层的输出得到分类结果;
(4)训练网络模型;
(41)CNN0训练:
将四通道图像经CNN0输出第一特征图,按DLG图中每个地物的边界,将第一特征图切割成多张独立的地物,并标记每个地物的类别,得到训练样本;
将训练样本依次送入池化层、第一全连接层、第二全连接层,softmax分类器,以该训练样本的类别为期望输出,训练CNN0,得到训练好的CNN0;
(42)CNN1训练:
将融合单元得到的融合图输入CNN1,输出像素点为128维特征向量的第二特征图;
按DLG图中每个地物的边界,在第二特征图上构造数个第一选区,每个第一选区对应一地物,对每个第一选区,以该第一选区内像素点的特征向量的均方差最小值为损失函数,采用梯度下降法修正CNN1权阵,得到训练好的CNN1;
(5)图像识别;
(51)选定一需要识别地物的边界和分类的待测区域,获取待测区域的DOM图和DSM图,并构成待测区域的四通道图像;
(52)将(51)得到的四通道图像,依次经训练好的CNN0、CNN1输出第一特征图、第二特征图;
(53)将第二特征图送入SelectiveSearch单元进行相似度计算,构造数个第二选区;
(54)将(52)得到的第一特征图、(53)得到的数个第二选区,依次送入池化层、第一全连接层、第二全连接层、Softmax分类器后,输出其分类结果;
将DOM图和DSM图构成四通道图像,具体为DOM图包括RGB三通道灰度值,所述DSM图包括表面高程值,四通道图像中的每个像素点为一个4维特征向量,包含表面高程值和RGB三通道灰度值;
所述相似度计算具体为:
根据下式计算融合图中像素点的相似度S,构造第二选区;
式中:U表示当前第二选区边界上的一个像素点,V表示不在当前第二选区但与U相邻的像素点,每个像素点均为128维,Ui Vi分别为像素点U、V的第i个分量,i=1~128;若s>0.7,则V被纳入U所在的第二选区。
2.根据权利要求1所述的实景三维地理信息数据识别与提取方法,其特征在于:所述测区为已经完成的天然气管道项目区域。
CN202210728774.0A 2022-06-24 2022-06-24 实景三维地理信息数据识别与提取方法 Active CN114998662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210728774.0A CN114998662B (zh) 2022-06-24 2022-06-24 实景三维地理信息数据识别与提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210728774.0A CN114998662B (zh) 2022-06-24 2022-06-24 实景三维地理信息数据识别与提取方法

Publications (2)

Publication Number Publication Date
CN114998662A CN114998662A (zh) 2022-09-02
CN114998662B true CN114998662B (zh) 2024-05-03

Family

ID=83037940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210728774.0A Active CN114998662B (zh) 2022-06-24 2022-06-24 实景三维地理信息数据识别与提取方法

Country Status (1)

Country Link
CN (1) CN114998662B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777189A (zh) * 2009-12-30 2010-07-14 武汉大学 LiDAR三维立体环境下测图和质量检查方法
CN108154192A (zh) * 2018-01-12 2018-06-12 西安电子科技大学 基于多尺度卷积与特征融合的高分辨sar地物分类方法
CN110135354A (zh) * 2019-05-17 2019-08-16 武汉大势智慧科技有限公司 一种基于实景三维模型的变化检测方法
CN111598174A (zh) * 2020-05-19 2020-08-28 中国科学院空天信息创新研究院 图像地物要素分类模型的训练方法、图像分析方法及系统
CN111967511A (zh) * 2020-08-04 2020-11-20 河海大学 一种基于异构特征融合网络的地基云图分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2559566B (en) * 2017-02-08 2022-01-12 Ordnance Survey Ltd Topographic data machine learning method and system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777189A (zh) * 2009-12-30 2010-07-14 武汉大学 LiDAR三维立体环境下测图和质量检查方法
CN108154192A (zh) * 2018-01-12 2018-06-12 西安电子科技大学 基于多尺度卷积与特征融合的高分辨sar地物分类方法
CN110135354A (zh) * 2019-05-17 2019-08-16 武汉大势智慧科技有限公司 一种基于实景三维模型的变化检测方法
CN111598174A (zh) * 2020-05-19 2020-08-28 中国科学院空天信息创新研究院 图像地物要素分类模型的训练方法、图像分析方法及系统
CN111967511A (zh) * 2020-08-04 2020-11-20 河海大学 一种基于异构特征融合网络的地基云图分类方法

Also Published As

Publication number Publication date
CN114998662A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN108492343B (zh) 一种扩充目标识别的训练数据的图像合成方法
CN115601549B (zh) 基于可变形卷积和自注意力模型的河湖遥感图像分割方法
CN112052839A (zh) 图像数据处理方法、装置、设备以及介质
CN109583483A (zh) 一种基于卷积神经网络的目标检测方法和系统
CN105354248A (zh) 基于灰度的分布式图像底层特征识别方法及系统
CN112347970A (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN111414954B (zh) 一种岩石图像检索方法及其系统
CN111507275B (zh) 一种基于深度学习的视频数据时序信息提取方法及装置
CN111640116B (zh) 基于深层卷积残差网络的航拍图建筑物分割方法及装置
CN114022408A (zh) 基于多尺度卷积神经网络的遥感图像云检测方法
CN113449691A (zh) 一种基于非局部注意力机制的人形识别系统及方法
CN117671509B (zh) 遥感目标检测方法、装置、电子设备及存储介质
CN108491863A (zh) 基于非负矩阵分解和卷积神经网络的彩色图像处理方法
CN106408009B (zh) 基于深度置信网络的邻域加权平均高光谱图像分类方法
CN111739037B (zh) 一种针对室内场景rgb-d图像的语义分割方法
CN103353941A (zh) 基于视角分类的自然标志物注册方法
CN110851627B (zh) 一种用于描述全日面图像中太阳黑子群的方法
CN118154603A (zh) 基于级联多层特征融合网络的显示屏缺陷检测方法及系统
CN118351410A (zh) 一种基于稀疏代理注意力的多模态三维检测方法
CN111080754A (zh) 一种头部肢体特征点连线的人物动画制作方法及装置
CN114677558A (zh) 一种基于方向梯度直方图与改进胶囊网络的目标检测方法
CN113673621A (zh) 一种基于卷积神经网络和maml算法的类圆目标检测方法
CN114998662B (zh) 实景三维地理信息数据识别与提取方法
CN115953330B (zh) 虚拟场景图像的纹理优化方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant