CN113239771A - 一种姿态估计方法、系统及其应用 - Google Patents
一种姿态估计方法、系统及其应用 Download PDFInfo
- Publication number
- CN113239771A CN113239771A CN202110496028.9A CN202110496028A CN113239771A CN 113239771 A CN113239771 A CN 113239771A CN 202110496028 A CN202110496028 A CN 202110496028A CN 113239771 A CN113239771 A CN 113239771A
- Authority
- CN
- China
- Prior art keywords
- image
- module
- attitude estimation
- segmentation
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本申请属于电子信息技术领域,特别涉及一种姿态估计方法、系统及其应用。现有姿态估计方法存储和计算成本较高,使其难以应用于计算能力有限的硬件平台,且限制了姿态估计的实时性。本申请提供了一种姿态估计方法,包括获取RGB图像和RGB图像对应的深度图像;对RGB图像进行分割得到第一分割图像,将深度图像中与第一分割图像对应的部分分割出来得到第二分割图像,将第二分割图像转换为点云数据;提取第一分割图像的颜色特征,提取点云数据的几何特征,将颜色特征与所述几何特征进行融合得到融合特征;对融合特征回归初始姿态,对初始姿态进行优化调整得到优化后的姿态。在遮挡、杂乱的现实环境中实时且准确地进行物体姿态估计。
Description
技术领域
本申请属于电子信息技术领域,特别是涉及一种姿态估计方法、系统及其应用。
背景技术
6D姿态估计在许多重要的计算机视觉任务中扮演着至关重要的角色,例如自动驾驶,增强现实,机器人操纵等。显然,准确且实时的姿态估计是实现这些任务的关键。随着深度学习技术的蓬勃发展及其在视觉任务中良好的性能表现,使得卷积神经网络在计算机视觉领域各个方向都取得了重大的突破。目前,基于深度学习的姿态估计方法成为了该领域的研究热点。但是,为了克服照明变换,遮挡和传感器噪声等挑战,以前的工作通常会训练了一个或多个复杂的网络来预测物体的6D姿态。虽然复杂的网络具有较好的性能,但由于存储和计算成本较高,使其难以应用于低成本移动终端等计算能力有限的硬件平台,且限制了姿态估计的实时性。因此,如何在满足精度前提下提升姿态估计的效率仍然是一个挑战。
物体的6D姿态又叫6D位姿,它代表物体所在坐标系和相机坐标系之间的旋转变换矩阵R和平移变换向量t。从输入的数据类型来看,姿态估计可以分为基于RGB图像的姿态估计,基于点云/深度图的姿态估计以及基于RGB-D数据的姿态估计三种类别。文献[1]提出了一种直接利用神经网络从RGB图像中回归出物体6D姿态的方法。文献[2]使用了基于三维点云的深度学习框架来进行3D目标检测和姿态估计。文献[3]先用神经网络处理RGB图像得到初始姿态,然后输入深度信息,利用ICP(迭代最近点算法)进行后处理对姿态进行优化。
现有姿态估计方法存储和计算成本较高,使其难以应用于低成本移动终端等计算能力有限的硬件平台,且限制了姿态估计的实时性。
发明内容
1.要解决的技术问题
基于现有姿态估计方法存储和计算成本较高,使其难以应用于低成本移动终端等计算能力有限的硬件平台,且限制了姿态估计的实时性的问题,本申请提供了一种姿态估计方法、系统及其应用。
2.技术方案
为了达到上述的目的,本申请提供了一种姿态估计方法,所述方法包括如下步骤:步骤1:获取RGB图像和所述RGB图像对应的深度图像;步骤2:对所述RGB图像进行分割得到第一分割图像,将所述深度图像中与所述第一分割图像对应的部分分割出来得到第二分割图像,将所述第二分割图像转换为点云数据;步骤3:提取所述第一分割图像的颜色特征,提取所述点云数据的几何特征,将所述颜色特征与所述几何特征进行融合得到融合特征;步骤4:对所述融合特征回归初始姿态,对所述初始姿态进行优化调整得到优化后的姿态。
本申请提供的另一种实施方式为:所述第一分割图像包括物体颜色信息及其边界框,所述第二分割图像包括物体深度信息。
本申请提供的另一种实施方式为:所述融合为像素级别的密集融合。
本申请还提供一种姿态估计系统,所述系统包括依次连接的图像分割模块、特征提取模块、特征融合模块、姿态预测模块和迭代优化模块;
所述图像分割模块包括第一图像分割子模块和第二图像分割子模块,所述特征提取模块包括颜色特征提取子模块和几何特征提取子模块;所述第一图像分割子模块、所述颜色特征提取子模块与所述特征融合模块连接,所述第二图像分割子模块、所述几何特征提取子模块与所述特征融合模块连接。
本申请提供的另一种实施方式为:所述迭代优化模块为基于几何中位数的卷积核剪枝算法剪枝后得到的轻量级迭代优化模块。
本申请提供的另一种实施方式为:所述颜色特征提取子模块包括卷积层、若干混合卷积核的深度卷积层和金字塔池化层。
本申请提供的另一种实施方式为:所述融合特征通过所述姿态预测器回归得到初始姿态。
本申请提供的另一种实施方式为:所述几何特征提取模块对所述点云数据进行卷积的深度特征提取,将3D点信息映射到几何特征中得到几何特征。
本申请提供的另一种实施方式为:当训练所述迭代优化模块到收敛时,将计算几何中位数,并将位于所述几何中位数处或附近的卷积核的值设置为0;然后,对所述迭代优化模块进行微调以重新收敛;当所述迭代优化模块再次收敛时,通过修剪值均为0的滤波器,得到所述轻量级迭代优化模块。
本申请还提供一种姿态估计方法的应用,将所述的姿态估计方法应用于智能制造或者自动驾驶。
3.有益效果
与现有技术相比,本申请提供的一种姿态估计方法、系统及其应用的有益效果在于:
本申请提供的姿态估计方法,在遮挡、杂乱的现实环境中实时且准确地进行物体姿态估计。
本申请提供的姿态估计方法,为一种轻量级的实时物体6D姿态估计方法,可以在达到较好准确率的同时降低计算量并提升运算速度。
本申请提供的姿态估计系统,利用模型压缩和剪枝技术设计了一个轻量级的姿态估计系统,使其在保持准确率的同时大幅降低计算量,提升运算速度,增强模型在低成本终端的应用潜力及实时性。
本申请提供的姿态估计方法,利用MixConv构造参数量更少的颜色特征提取子模块,不仅可以获取更丰富的特征,同时减少了计算量。
本申请提供的姿态估计方法,利用FPGM算法对迭代优化模块进行剪枝,进一步降低了网络模型的参数量。
附图说明
图1是本申请的姿态估计方法流程示意图;
图2是本申请的颜色特征提取子模块结构示意图;
图3是本申请的利用FPGM算法剪枝的迭代优化过程示意图;
图4是本申请的YCB-Video视频数据集上效果示意图;
图5是本申请的姿态估计方法参数比较示意图。
具体实施方式
在下文中,将参考附图对本申请的具体实施例进行详细地描述,依照这些详细的描述,所属领域技术人员能够清楚地理解本申请,并能够实施本申请。在不违背本申请原理的情况下,各个不同的实施例中的特征可以进行组合以获得新的实施方式,或者替代某些实施例中的某些特征,获得其它优选的实施方式。
深度图像=存储深度信息的图像。
参见图1~5,本申请提供一种姿态估计方法,所述方法包括如下步骤:步骤1:获取RGB图像和所述RGB图像对应的深度图像;步骤2:对所述RGB图像进行分割得到第一分割图像,将所述深度图像中与所述第一分割图像对应的部分分割出来得到第二分割图像,将所述第二分割图像转换为点云数据;步骤3:提取所述第一分割图像的颜色特征,提取所述点云数据的几何特征,将所述颜色特征与所述几何特征进行融合得到融合特征;步骤4:对所述融合特征回归初始姿态,对所述初始姿态进行优化调整得到优化后的姿态。
首先,从RGB图像中提取分割出来的物体及其边界框,并将相应的深度图转换为点云数据。然后,将分割结果的边界框和相应的3D点分别通过两个高效的模块提取颜色特征和深度特征,接着将提取到的两种特征进行像素级别的密集融合,再将融合后的特征输入姿态预测器回归出初始姿态。最后,通过一个利用基于几何中位数的卷积核剪枝算法(FPGM)剪枝后得到的轻量级迭代优化模块对初始姿势进行优化调整。
进一步地,所述第一分割图像包括物体颜色信息及其边界框,所述第二分割图像包括物体深度信息。
进一步地,所述融合为像素级别的密集融合。
本申请还提供一种姿态估计系统,所述系统包括依次连接的图像分割模块、特征提取模块、特征融合模块、姿态预测模块和迭代优化模块;
所述图像分割模块包括第一图像分割子模块和第二图像分割子模块,所述特征提取模块包括颜色特征提取子模块和几何特征提取子模块;所述第一图像分割子模块、所述颜色特征提取子模块与所述特征融合模块连接,所述第二图像分割子模块、所述几何特征提取子模块与所述特征融合模块连接。
利用图像分割模块从RGB图像中得到物体的分割结果和边界框,并将分割结果对应的深度图像转换成点云。利用混合卷积核的深度卷积(MixConv)设计了一个紧凑的颜色特征提取子模块将像素映射到颜色特征。同时,还建立了一个直接对点云进行卷积的深度特征提取子模块,将3D点信息映射到几何特征中。然后将相应的颜色和几何特征嵌入融合在一起,得到像素级密集融合特征,在将其输入姿态预测器回归得到初始姿态,最后,将初始姿态输入到优化迭代模块中得到优化后的姿态,其中,利用基于几何中位数的卷积核剪枝算法(FPGM)对迭代优化网络进行剪枝,进一步降低了参数量。
进一步地,所述迭代优化模块为基于几何中位数的卷积核剪枝算法剪枝后得到的轻量级迭代优化模块。
进一步地,所述颜色特征提取子模块包括卷积层、若干混合卷积核的深度卷积层和金字塔池化层。它包含一个常规的卷积层,几个MixConv层和一个金字塔池化层(PPM)其中MC代表MixConv,其后的数字代表不同组卷积核的大小。MC模块上方的数字代表输出通道和步幅的大小。
具体的,为了适应移动和嵌入式视觉应用的需求,深度卷积在现代卷积网络中变得越来越流行。与常规卷积不同,深度卷积分别将不同的卷积核应用于每个通道,从而降低参数量。混合卷积核的深度卷积(MixConv)是深度卷积的一种变体,它在一次卷积操作中对通道进行分组,并在不同组中使用不同尺寸的卷积核,因此它可以轻松地同时捕获高分辨率特征和低分辨率特征,从而获得更高的准确性和效率。
如图2所示,颜色特征提取子模块包含一个常规的卷积层,几个MixConv层和一个金字塔池化层(PPM)。为了使参数大小和计算成本尽可能小,每个输出层的通道数限制在40以下。为了融合来自不同层的特征信息,将第5、9和PPM层的输出进行拼接,上采样到原始图像大小,然后执行卷积操作以减少特征通道。总而言之,不仅使用不同大小的卷积核来聚合不同尺寸的特征,而且还连接了来自不同层的特征图,这使颜色特征提取子模块具有检索更丰富的特征表达的能力。
进一步地,所述融合特征通过所述姿态预测器回归得到初始姿态。
进一步地,所述几何特征提取模块对所述点云数据进行卷积的深度特征提取,将3D点信息映射到几何特征中得到几何特征。
进一步地,当训练所述迭代优化模块到收敛时,将计算几何中位数,并将位于所述几何中位数处或附近的卷积核的值设置为0;然后,对所述迭代优化模块进行微调以重新收敛;当所述迭代优化模块再次收敛时,通过修剪值均为0的滤波器,得到所述轻量级迭代优化模块。
人为设计的结构通常具有冗余性。为了使模型更加紧凑,可以使用剪枝算法移除不必要的连接。在迭代优化模块中,使用基于几何中位数的过卷积核剪枝算法(FPGM)对其进行剪枝,通过训练获得更紧凑的迭代优化模块。FPGM的基本思想是,同一层内的大多数可替换的卷积核是位于几何中位数处或附近的那些卷积核,因此位于几何中位数附近的卷积核是有冗余性的。
本申请还提供一种姿态估计方法的应用,将所述的姿态估计方法应用于智能制造或者自动驾驶。
实施例
准确率分析
在姿态估计两个基准数据集YCB-Video和LineMOD上做了和现有方法的对比实验,实验过程如下:将YCB-Video和LineMOD数据集中的训练集数据分别输入到我们的方法中进行训练,得到两个网络模型,再利用这两个模型对YCB-Video和LineMOD数据集中的测试集数据进行验证。定量结果如表1所示,在两个数据集上分别采用了通用评价指标ADD-S(平均最近点距离)<2cm和ADD(平均距离)的百分比来进行评价验证。可以看到,得益于本申请的提出的新型姿态估计系统,本申请的在两个基准数据集上取得了比现有方法更好的效果。
表1姿态估计数据集上的定量结果(%)
现有方法 | 本方法 | |
YCB-Video(ADD-S<2cm) | 96.5 | 96.6 |
LineMOD(ADD<2cm) | 94.3 | 96.9 |
为了更直接地对比,本申请可视化了YCB-Video数据集上的一些结果。如图4所示,第一行是现有方法的结果,第二行是本申请的方法的结果。可以看到本申请的的方法和现有方法在大部分场景下有相似的效果,但本申请的的方法在某些场景下可以更好地处理图像中的遮挡(例如第一列的漂白清洁剂)和无纹理的物体(例如第二列的香蕉)。
模型复杂度和时间效率
本申请的方法的主要优点是姿态估计的低计算量和高效率。图5显示了现有方法和本申请的方法在BFLOPs(十亿次浮点运算数),参数大小和推断时间方面的比较。与现有方法相比,本申请的的模型实际上将参数大小分别减小了83.6%,将BFLOP(当输入大小为224×224时)减小了96.2%。在LineMOD数据集上,在i7-6850K CPU上评估的推理时间减少了59.0%,在YCB-Video数据集上减少了78.8%。这意味着本申请的的模型在LineMOD上比现有方法快两倍以上,在YCB-Video上快三倍。这证明了本申请的的模型在低成本的硬件设备中的应用潜力。实验结果证明,本申请的的方法在鲁棒性和效率上均优于现有方法。
尽管在上文中参考特定的实施例对本申请进行了描述,但是所属领域技术人员应当理解,在本申请公开的原理和范围内,可以针对本申请公开的配置和细节做出许多修改。本申请的保护范围由所附的权利要求来确定,并且权利要求意在涵盖权利要求中技术特征的等同物文字意义或范围所包含的全部修改。
Claims (10)
1.一种姿态估计方法,其特征在于:所述方法包括如下步骤:
步骤1:获取RGB图像和所述RGB图像对应的深度图像;
步骤2:对所述RGB图像进行分割得到第一分割图像,将所述深度图像中与所述第一分割图像对应的部分分割出来得到第二分割图像,将所述第二分割图像转换为点云数据;
步骤3:提取所述第一分割图像的颜色特征,提取所述点云数据的几何特征,将所述颜色特征与所述几何特征进行融合得到融合特征;
步骤4:对所述融合特征回归初始姿态,对所述初始姿态进行优化调整得到优化后的姿态。
2.如权利要求1所述的姿态估计方法,其特征在于:所述第一分割图像包括物体颜色信息及其边界框,所述第二分割图像包括物体深度信息。
3.如权利要求1所述的姿态估计方法,其特征在于:所述融合为像素级别的密集融合。
4.一种姿态估计系统,其特征在于:所述系统包括依次连接的图像分割模块、特征提取模块、特征融合模块、姿态预测模块和迭代优化模块;
所述图像分割模块包括第一图像分割子模块和第二图像分割子模块,所述特征提取模块包括颜色特征提取子模块和几何特征提取子模块;所述第一图像分割子模块、所述颜色特征提取子模块与所述特征融合模块连接,所述第二图像分割子模块、所述几何特征提取子模块与所述特征融合模块连接。
5.如权利要求4所述的姿态估计系统,其特征在于:所述迭代优化模块为基于几何中位数的卷积核剪枝算法剪枝后得到的轻量级迭代优化模块。
6.如权利要求4所述的姿态估计系统,其特征在于:所述颜色特征提取子模块包括卷积层、若干混合卷积核的深度卷积层和金字塔池化层。
7.如权利要求4所述的姿态估计系统,其特征在于:所述融合特征通过所述姿态预测器回归得到初始姿态。
8.如权利要求4所述的姿态估计系统,其特征在于:所述几何特征提取模块对所述点云数据进行卷积的深度特征提取,将3D点信息映射到几何特征中得到几何特征。
9.如权利要求5所述的姿态估计系统,其特征在于:当训练所述迭代优化模块到收敛时,将计算几何中位数,并将位于所述几何中位数处或附近的卷积核的值设置为0;然后,对所述迭代优化模块进行微调以重新收敛;当所述迭代优化模块再次收敛时,通过修剪值均为0的滤波器,得到所述轻量级迭代优化模块。
10.一种姿态估计方法的应用,其特征在于:将权利要求1~3中任一项所述的姿态估计方法应用于智能制造或者自动驾驶。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110496028.9A CN113239771A (zh) | 2021-05-07 | 2021-05-07 | 一种姿态估计方法、系统及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110496028.9A CN113239771A (zh) | 2021-05-07 | 2021-05-07 | 一种姿态估计方法、系统及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113239771A true CN113239771A (zh) | 2021-08-10 |
Family
ID=77132565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110496028.9A Pending CN113239771A (zh) | 2021-05-07 | 2021-05-07 | 一种姿态估计方法、系统及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239771A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114663514A (zh) * | 2022-05-25 | 2022-06-24 | 浙江大学计算机创新技术研究院 | 一种基于多模态稠密融合网络的物体6d姿态估计方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145253A (zh) * | 2019-12-12 | 2020-05-12 | 深圳先进技术研究院 | 一种高效的物体6d姿态估计算法 |
CN111311679A (zh) * | 2020-01-31 | 2020-06-19 | 武汉大学 | 一种基于深度相机的自由漂浮目标位姿估计方法 |
CN112233181A (zh) * | 2020-10-29 | 2021-01-15 | 深圳市广宁股份有限公司 | 6d位姿识别的方法、装置及计算机存储介质 |
-
2021
- 2021-05-07 CN CN202110496028.9A patent/CN113239771A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145253A (zh) * | 2019-12-12 | 2020-05-12 | 深圳先进技术研究院 | 一种高效的物体6d姿态估计算法 |
CN111311679A (zh) * | 2020-01-31 | 2020-06-19 | 武汉大学 | 一种基于深度相机的自由漂浮目标位姿估计方法 |
CN112233181A (zh) * | 2020-10-29 | 2021-01-15 | 深圳市广宁股份有限公司 | 6d位姿识别的方法、装置及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
陈帆: "基于深度和纹理信息融合的三维物体识别和6D姿态估计研究", 《中国优秀硕士论文学位论文全文数据库 信息科技辑》, no. 07, pages 4 - 2 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114663514A (zh) * | 2022-05-25 | 2022-06-24 | 浙江大学计算机创新技术研究院 | 一种基于多模态稠密融合网络的物体6d姿态估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111696110B (zh) | 场景分割方法及系统 | |
CN110659664B (zh) | 一种基于ssd的高精度识别小物体的方法 | |
CN113822284B (zh) | 一种基于边界注意力的rgbd图像语义分割方法 | |
CN112489164B (zh) | 基于改进深度可分离卷积神经网络的图像着色方法 | |
CN111797841B (zh) | 一种基于深度残差网络的视觉显著性检测方法 | |
CN113378756B (zh) | 一种三维人体语义分割方法、终端设备及存储介质 | |
CN113066089B (zh) | 一种基于注意力引导机制的实时图像语义分割方法 | |
CN117218343A (zh) | 一种基于深度学习的语义部件姿态估计方法 | |
CN111768415A (zh) | 一种无量化池化的图像实例分割方法 | |
CN114764856A (zh) | 图像语义分割方法和图像语义分割装置 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
Gong et al. | FastRoadSeg: Fast monocular road segmentation network | |
CN118397465A (zh) | 一种基于多维特征聚合增强与分发机制的遥感小目标检测方法 | |
CN113239771A (zh) | 一种姿态估计方法、系统及其应用 | |
CN117475228A (zh) | 一种基于双域特征学习的三维点云分类和分割方法 | |
Maisano et al. | Reducing complexity of 3D indoor object detection | |
WO2023207531A1 (zh) | 一种图像处理方法及相关设备 | |
CN117058235A (zh) | 跨多种室内场景的视觉定位方法 | |
CN108921852B (zh) | 基于视差与平面拟合的双分支室外非结构化地形分割网络 | |
CN117173595A (zh) | 基于改进YOLOv7的无人机航拍图像目标检测方法 | |
CN114494284B (zh) | 一种基于显式监督区域关系的场景解析模型及方法 | |
CN113808006B (zh) | 一种基于二维图像重建三维网格模型的方法及装置 | |
WO2022222519A1 (zh) | 故障图像生成方法与装置 | |
CN115830707A (zh) | 一种基于超图学习的多视角人体行为识别方法 | |
CN115424012A (zh) | 一种基于上下文信息的轻量图像语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |