CN110197255A - 一种基于深度学习的可变形卷积网络 - Google Patents
一种基于深度学习的可变形卷积网络 Download PDFInfo
- Publication number
- CN110197255A CN110197255A CN201910356575.XA CN201910356575A CN110197255A CN 110197255 A CN110197255 A CN 110197255A CN 201910356575 A CN201910356575 A CN 201910356575A CN 110197255 A CN110197255 A CN 110197255A
- Authority
- CN
- China
- Prior art keywords
- deformable
- offset
- pond
- layer
- roi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的可变形卷积网络,包括可变形卷积模块和可变形的ROI池化层模块;所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。本发明的两个新的模块可以代替现有主流的网络中的普通模块,并且可以通过标准的反向传播进行端到端的训练,从而产生可变形的卷积网络,在处理复杂目标情况时,大大提高了检测精度。
Description
技术领域
本发明涉及可变形卷积网络,具体涉及一种基于深度学习的可变形卷积网络。
背景技术
目前,在计算机视觉的任务中一个关键的挑战是网络架构如何适应由目标尺寸,姿态,角度和变形带来的几何变化或者模型的几何转换。针对上述的问题,目前主要有两种解决的办法。第一种是构建具有足够期望变化的训练数据集。这通常是通过增加现有的数据样本来进行实现,如将现有的数据样本进行尺寸变化或剪裁、旋转等方式。稳定的拟合表示可以从数据中学习,但通常是以昂贵的训练和复杂的模型参数为代价的;第二种是使用变换不变性的特征和算法。以上的方法有两个缺点,首先,假设几何变换是固定已知的,并且利用这些先验知识对数据进行扩充,设计特征和算法。这种假设阻止了对具有未知几何变换的新任务的泛化,使得建立的模型没有很好的泛化性能。其次,对于过于复杂的转换,设计的具有变换不变特性的特征和算法的难度提高,可行性极低。近年来,卷积神经网络在图像分类,语义分割,目标检测等视觉识别任务中取得了显著的成功。然而,它们仍然有上述的两个缺点。
基于卷积神经网络的模型对几何变换建模的能力主要来自广泛的数据扩充、大的模型容量和一些简单的手工设计模块。简而言之,CNN局限于大型未知转换的建模。这种局限性源于CNN模块的固定几何结构:卷积单元对于固定位置的输入特征进行采样;池化层以固定比例降低空间的分辨率; ROI(region-of-interest)池化层将感兴趣区域划分为固定的空间容器等,这些都缺乏处理几何变换的内部机制。在过往的卷积神经网路中,同一层的网络中所有激活单元的感受野大小是相同的,这对于在空间位置上编码语义的深层卷积神经网路层来说是不可取的,由于不同的位置可能对应不同尺度的或者变形的目标,对于需要进行精细定位的视觉识别需要自适应确定尺度或感受野的大小。另一方面,近年来,虽然目标检测取得了长足的进步,但所有的检测方法仍然依赖于基于原始检测框的特征提取。这并不是最优的方法,特别是在处理复杂目标情况时,如复杂的目标轮廓,多重目标叠合等。
发明内容
本发明的主要目的在于提供一种基于深度学习的可变形卷积网络。
本发明采用的技术方案是:一种基于深度学习的可变形卷积网络,包括可变形卷积模块和可变形的ROI池化层模块;
所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;
所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。
进一步地,所述可变形卷积模块包括两个步骤:
S1,在输入的映射特征x上使用规则的网格R进行采样;
S2,用w代表加权采样之和,网格R定义感受野大小和扩张,R用数组坐标代表卷积核位置。
更进一步地,所述步骤S1和S2具体为:
对于输出映射特征y上的每个位置p0,有:
其中,pn枚举R中的位置;
在可变形的卷积中,规则网格R用偏移量进行增广{Δpn|n=1,...,N},其中N=|R|,因此有:
此时,采样是在不规则和偏移的位置pn+Δpn,由于Δpn常常会以小数的形式出现。
更进一步地,所述步骤S1和S2还包括:
对Δpn进行处理:
其中,p代表任意位置(p=p0+pn+Δpn),q枚举了映射特征x所有完整的空间位置,G(·,·)代表着双线性插值的内核;G是二维的,随即被分为两个一维的核:
G(q,p)=g(qx,px)·g(qy,py)
其中,g(a,b)=max(0,1-|a-b|);
其中的偏移量是通过在相同的输入映射特征上应用卷积层得到的,输出的偏移量与输入的映射特征具有相同的空间分辨率;在训练过程中,卷积核的输出特征和偏移量是同时学习的。
更进一步地,所述可变形的ROI池化层模块将任意大小的输入矩形检测框转换成固定大小的特征,给予任意一个输入的映射特征x,一个尺寸为 w×h的ROI矩形检测框以及左上角p0;ROI池化将ROI矩形检测框T划分为k×k个小区域,其中k为自由参数;并且输出一个k×k的映射特征y,对于第(i,j)个小区域(0≤i,j<k),有
其中,nij是第(i,j)个小区域的像素点,且第(i,j)个小区域贯穿的范围为:
以及
在可变形的ROI池化层中,偏移量{Δpij|0≤i,j<k}被添加到空间小区域的位置当中,从而有
y(i,j)=∑p∈T(i,j)x(p0+p+Δpij)/nij。
更进一步地,所述可变形的ROI池化层模块还包括:
对Δpij的处理:
G(q,p)=g(qx,px)·g(qy,py)
对于可变形的ROI池化层,首先通过池化生成池化的映射特征,生成的映射特征通过全连接层生成标准化的偏移量并随后通过元素级别的计算,利用检测框的宽和高转换为Δpij,具体为:
这里的γ是通过预先设定好的标量,用来调节偏移量的大小;可变形ROI 池化层通过卷积层,首先将每个目标类别的所有输入映射特征转换为k2个分数的映射;不需要对每个类别进行区分,这样的分数映射表示为{xi,j},其中(i,j)枚举检测框中每个小区域;在这些分数的映射上进行池化,对于第(i,j)个小区域的输出值是通过对应于该小区域的一个映射特征{xi,j}求和所得。
本发明的优点:
本发明通过发明了两个新模块来增强了卷积神经网络的转换建模能力。这两个模块都是基于使用额外偏移量来增加模块中的空间采样位置,并从目标任务中不断学习偏移量,而不需要额外的监督学习。这两个新的模块可以代替现有主流的网络中的普通模块,并且可以通过标准的反向传播进行端到端的训练,从而产生可变形的卷积网络,在处理复杂目标情况时,如复杂的目标轮廓,多重目标叠合等,大大提高了检测精度。
本发明提出可变形的卷积神经网络,是建立在增加卷积中空间采样位置和ROI池化层中的额外的偏移量,并从目标任务中学习偏移量的基础思想,当可变形卷积叠加时,复合变形的影响是深远的,它们可以在变形卷积中根据目标比例和形状进行自适应调整,大大提高了在复杂情况下的目标检测,语义分割等的检测精度。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明的一种一种基于深度学习的可变形卷积网络框架图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参考图1,如图1所示,一种基于深度学习的可变形卷积网络,包括可变形卷积模块和可变形的ROI池化层模块;
提出的两个新的模块,极大地增强了卷积神经网路对于几何变换建模的能力。第所述可变形卷积模块,它将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形。偏移量是从前面映射特征中通过额外的卷积层得到的,因此,变形卷积网络是一种由输入特征制约的以一种局部,密集和自适应的方式来进行。所述可变形的ROI池化层模块,它为池化层中每一个小分区位置添加一个偏移量。类似地,偏移量可以从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。两个模块都为轻量级的模块,它们为偏移学习提供了少量的参数和计算。它们可以很容易在深度卷积神经网路中替换普通的对等点,并且可以很容易地使用标准反向传播进行端到端训练。
首先对于可变形卷积,一般二维卷积包括两个步骤:(1)在输入的映射特征x上使用规则的网格R进行采样;(2)用w代表加权采样之和,网格R定义感受野大小和扩张。R用数组坐标代表卷积核位置,如定义一个3×3且扩张参数为1的卷积核:
R={(-1,-1),(-1,0),...,(0,1),(1,1)}
对于输出映射特征y上的每个位置p0,有:
其中,pn枚举R中的位置。
在可变形的卷积中,规则网格R用偏移量进行增广{Δpn|n=1,...,N},其中N=|R|,因此有:
此时,采样是在不规则和偏移的位置pn+Δpn,由于Δpn常常会以小数的形式出现,本专利通过以下方法进行处理:
其中,p代表任意位置(p=p0+pn+Δpn),q枚举了映射特征x所有完整的空间位置,G(·,·)代表着双线性插值的内核。G是二维的,随即被分为两个一维的核:
G(q,p)=g(qx,px)·g(qy,py)
其中,g(a,b)=max(0,1-|a-b|)。
偏移量是通过在相同的输入映射特征上应用卷积层得到的,输出的偏移量与输入的映射特征具有相同的空间分辨率。在训练过程中,卷积核的输出特征和偏移量是同时学习的。
对于第二个模块,可变形的ROI池化层。所有基于区域提议的目标检测方法都采用ROI池化的方法,它将任意大小的输入矩形检测框转换成固定大小的特征。给予任意一个输入的映射特征x,一个尺寸为w×h的ROI矩形检测框以及左上角p0。ROI池化将ROI矩形检测框T划分为k×k个小区域(k为自由参数),并且输出一个k×k的映射特征y,对于第(i,j)个小区域(0≤i,j<k),有
其中,nij是第(i,j)个小区域的像素点,且第(i,j)个小区域贯穿的范围为:
以及
在可变形的ROI池化层中,偏移量{Δpij|0≤i,j<k}被添加到空间小区域的位置当中,从而有
同理,对于Δpij大多数情况也是小数,同样通过上述的方法进行处理:
G(q,p)=g(qx,px)·g(qy,py)
对于可变形的ROI池化层,首先通过池化生成池化的映射特征,生成的映射特征通过全连接层生成标准化的偏移量并随后通过元素级别的计算,利用检测框的宽和高转换为Δpij,具体为:
这里的γ是通过预先设定好的标量,用来调节偏移量的大小。可变形ROI 池化层通过卷积层,首先将每个目标类别的所有输入映射特征转换为k2个分数的映射。不需要对每个类别进行区分,这样的分数映射表示为{xi,j},其中(i,j)枚举检测框中每个小区域。在这些分数的映射上进行池化,对于第(i,j)个小区域的输出值是通过对应于该小区域的一个映射特征{xi,j}求和所得。
总体而言,可变形卷积和可变形ROI池化的输出和输入与其他普通模块相同,因此,它们可以很容易地替换现有卷积神经网路中的普通对等项,从而提高了整个检测算法的检测精度。
在本发明中,通过发明了两个新模块来增强了卷积神经网络的转换建模能力。这两个模块都是基于使用额外偏移量来增加模块中的空间采样位置,并从目标任务中不断学习偏移量,而不需要额外的监督学习。这两个新的模块可以代替现有主流的网络中的普通模块,并且可以通过标准的反向传播进行端到端的训练,从而产生可变形的卷积网络,在处理复杂目标情况时,如复杂的目标轮廓,多重目标叠合等,大大提高了检测精度。
STN(Spatial Transform Networks)算法第一次在深度学习框架中利用数据来学习空间转换,它通过全局参数变换的仿射变换来扭曲映射特征。这种扭曲的代价是昂贵的,而且已知的转换参数的学习是十分困难的。STN 在小尺度图像的分类难题上取得了成功。而STN的逆方法用有效的变换参数传播代替了代价昂贵的特征扭曲,但是却需要众多的模型参数,而本专利中的可变形卷积网络不采用全局参数变换和特征扭曲,是以一种局部和密集的方式对映射特征进行采样,并且通过加权求和来生成新的映射特征,可变形的卷积网络容易集成到其他的CNN框架中,且训练简单。
Active Convolution网络是目前主流的方法,利用偏移量增大卷积中的采样位置,并通过端到端的反向传播来学习偏移量,但是该方法的通用性和适应性较差。首先,它在不同的空间位置共享偏移量;其次,该种方法中的偏移量是每个任务或每个训练的静态模型参数,而在本专利中通过可变形卷积网络生成的偏移量是根据图像位置变化的动态模型输出。
ERF(Effective Receptive Field)发现感受野内的像素对输出相应的贡献并不相同,靠近中心的像素有更大的影响,有效的感受野只占理论感受野的一小部分,且呈现高斯分布。虽然理论感受野大小随卷积层线性增加,但是,有效感受野的大小随着卷积层数平方根线性增加,因此,即使是深层的CNN的顶层单位也可能没有足够大的感受野,说明了适应性感受野学习的需要。而专利中提出的变形卷积具有自适应学习感受野的能力。
TIF(Transformation invariant features)在设计变换不变性特征方面已经取得了一定的效果,如尺寸不变特征变换和ORB等,但是这些设计都是基于先验的转换,这些先验的知识用于手工化制作特征提取算法的结构,或者固定在SIFT中,或者具有基于CNN的可学习参数。它们不能处理新任务中的未知转换。
本发明提出的可变形模块概括了各种转换,而这种转换是从目标任务中学习得到的。
综上,本专利提出可变形的卷积神经网络,是建立在增加卷积中空间采样位置和ROI池化层中的额外的偏移量,并从目标任务中学习偏移量的基础思想,当可变形卷积叠加时,复合变形的影响是深远的,它们可以在变形卷积中根据目标比例和形状进行自适应调整,大大提高了在复杂情况下的目标检测,语义分割等的检测精度。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于深度学习的可变形卷积网络,其特征在于,包括可变形卷积模块和可变形的ROI池化层模块;
所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;
所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。
2.根据权利要求1所述的基于深度学习的可变形卷积网络,其特征在于,所述可变形卷积模块包括两个步骤:
S1,在输入的映射特征x上使用规则的网格R进行采样;
S2,用w代表加权采样之和,网格R定义感受野大小和扩张,R用数组坐标代表卷积核位置。
3.根据权利要求2所述的基于深度学习的可变形卷积网络,其特征在于,所述步骤S1和S2具体为:
对于输出映射特征y上的每个位置p0,有:
其中,pn枚举R中的位置;
在可变形的卷积中,规则网格R用偏移量进行增广{Δpn|n=1,...,N},其中N=|R|,因此有:
此时,采样是在不规则和偏移的位置pn+Δpn,由于Δpn常常会以小数的形式出现。
4.根据权利要求2所述的基于深度学习的可变形卷积网络,其特征在于,所述步骤S1和S2还包括:
对Δpn进行处理:
其中,p代表任意位置(p=p0+pn+Δpn),q枚举了映射特征x所有完整的空间位置,G(·,·)代表着双线性插值的内核;G是二维的,随即被分为两个一维的核:
G(q,p)=g(qx,px)·g(qy,py)
其中,g(a,b)=max(0,1-|a-b|);
其中的偏移量是通过在相同的输入映射特征上应用卷积层得到的,输出的偏移量与输入的映射特征具有相同的空间分辨率;在训练过程中,卷积核的输出特征和偏移量是同时学习的。
5.根据权利要求1所述的基于深度学习的可变形卷积网络,其特征在于,所述可变形的ROI池化层模块将任意大小的输入矩形检测框转换成固定大小的特征,给予任意一个输入的映射特征x,一个尺寸为w×h的ROI矩形检测框以及左上角p0;ROI池化将ROI矩形检测框T划分为k×k个小区域,其中k为自由参数;并且输出一个k×k的映射特征y,对于第(i,j)个小区域(0≤i,j<k),有
其中,nij是第(i,j)个小区域的像素点,且第(i,j)个小区域贯穿的范围为:
以及在可变形的ROI池化层中,偏移量{Δpij|0≤i,j<k}被添加到空间小区域的位置当中,从而有
y(i,j)=∑p∈T(i,j)x(p0+p+Δpij)/nij。
6.根据权利要求5所述的基于深度学习的可变形卷积网络,其特征在于,所述可变形的ROI池化层模块还包括:
对Δpij的处理:
G(q,p)=g(qx,px)·g(qy,py)
对于可变形的ROI池化层,首先通过池化生成池化的映射特征,生成的映射特征通过全连接层生成标准化的偏移量并随后通过元素级别的计算,利用检测框的宽和高转换为Δpij,具体为:
这里的γ是通过预先设定好的标量,用来调节偏移量的大小;可变形ROI池化层通过卷积层,首先将每个目标类别的所有输入映射特征转换为k2个分数的映射;不需要对每个类别进行区分,这样的分数映射表示为{xi,j},其中(i,j)枚举检测框中每个小区域;在这些分数的映射上进行池化,对于第(i,j)个小区域的输出值是通过对应于该小区域的一个映射特征{xi,j}求和所得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356575.XA CN110197255A (zh) | 2019-04-29 | 2019-04-29 | 一种基于深度学习的可变形卷积网络 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356575.XA CN110197255A (zh) | 2019-04-29 | 2019-04-29 | 一种基于深度学习的可变形卷积网络 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110197255A true CN110197255A (zh) | 2019-09-03 |
Family
ID=67752192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910356575.XA Pending CN110197255A (zh) | 2019-04-29 | 2019-04-29 | 一种基于深度学习的可变形卷积网络 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110197255A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110992642A (zh) * | 2019-12-25 | 2020-04-10 | 辽宁石油化工大学 | 一种基于深度学习的火灾检测方法 |
CN111080477A (zh) * | 2019-12-06 | 2020-04-28 | 北京国电通网络技术有限公司 | 一种家庭电力负荷预测方法及系统 |
CN111709307A (zh) * | 2020-05-22 | 2020-09-25 | 哈尔滨工业大学 | 一种基于分辨率增强的遥感图像小目标检测方法 |
CN112101251A (zh) * | 2020-09-18 | 2020-12-18 | 电子科技大学 | 基于可变卷积神经网络的sar自动目标识别方法 |
CN112257727A (zh) * | 2020-11-03 | 2021-01-22 | 西南石油大学 | 一种基于深度学习自适应可变形卷积的特征图像提取方法 |
-
2019
- 2019-04-29 CN CN201910356575.XA patent/CN110197255A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080477A (zh) * | 2019-12-06 | 2020-04-28 | 北京国电通网络技术有限公司 | 一种家庭电力负荷预测方法及系统 |
CN110992642A (zh) * | 2019-12-25 | 2020-04-10 | 辽宁石油化工大学 | 一种基于深度学习的火灾检测方法 |
CN110992642B (zh) * | 2019-12-25 | 2021-11-05 | 辽宁石油化工大学 | 一种基于深度学习的火灾检测方法 |
CN111709307A (zh) * | 2020-05-22 | 2020-09-25 | 哈尔滨工业大学 | 一种基于分辨率增强的遥感图像小目标检测方法 |
CN111709307B (zh) * | 2020-05-22 | 2022-08-30 | 哈尔滨工业大学 | 一种基于分辨率增强的遥感图像小目标检测方法 |
CN112101251A (zh) * | 2020-09-18 | 2020-12-18 | 电子科技大学 | 基于可变卷积神经网络的sar自动目标识别方法 |
CN112257727A (zh) * | 2020-11-03 | 2021-01-22 | 西南石油大学 | 一种基于深度学习自适应可变形卷积的特征图像提取方法 |
CN112257727B (zh) * | 2020-11-03 | 2023-10-27 | 西南石油大学 | 一种基于深度学习自适应可变形卷积的特征图像提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fey et al. | Splinecnn: Fast geometric deep learning with continuous b-spline kernels | |
CN110197255A (zh) | 一种基于深度学习的可变形卷积网络 | |
CN110348330B (zh) | 基于vae-acgan的人脸姿态虚拟视图生成方法 | |
Sinha et al. | Deep learning 3D shape surfaces using geometry images | |
US11514642B2 (en) | Method and apparatus for generating two-dimensional image data describing a three-dimensional image | |
WO2021184466A1 (zh) | 一种基于偏微分算子的等变卷积网络模型的图像分类方法 | |
WO2019227479A1 (zh) | 人脸旋转图像的生成方法及装置 | |
CN107705322A (zh) | 运动目标识别跟踪方法和系统 | |
CN111625667A (zh) | 一种基于复杂背景图像的三维模型跨域检索方法及系统 | |
CN108280858B (zh) | 多视图重建中的一种线性全局相机运动参数估计方法 | |
CN107301643B (zh) | 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法 | |
Yin et al. | Sparse representation over discriminative dictionary for stereo matching | |
Yan et al. | Monocular depth estimation with guidance of surface normal map | |
CN113449612B (zh) | 一种基于子流型稀疏卷积的三维目标点云识别的方法 | |
Xu et al. | RGB-D-based pose estimation of workpieces with semantic segmentation and point cloud registration | |
CN114724120A (zh) | 基于雷视语义分割自适应融合的车辆目标检测方法及系统 | |
Liu et al. | A novel underwater image enhancement algorithm and an improved underwater biological detection pipeline | |
CN110633640A (zh) | 优化PointNet对于复杂场景的识别方法 | |
Lee et al. | Connectivity-based convolutional neural network for classifying point clouds | |
Luo et al. | Intelligent perception system of robot visual servo for complex industrial environment | |
Fan et al. | Hcpvf: Hierarchical cascaded point-voxel fusion for 3D object detection | |
JP2023145404A (ja) | イメージ間の対応関係を識別するためにピラミッド及び固有性マッチングフライアを使用するシステム及び方法 | |
Krstanović et al. | Feature map regularized CycleGAN for domain transfer | |
CN115439669A (zh) | 基于深度学习的特征点检测网络及跨分辨率图像匹配方法 | |
CN110520869A (zh) | 能够提供时空事件的动态感知不变性以期从其提取统一语义表示的自动化方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |