CN114581350B - 一种适用于单目3d目标检测任务的半监督学习方法 - Google Patents
一种适用于单目3d目标检测任务的半监督学习方法 Download PDFInfo
- Publication number
- CN114581350B CN114581350B CN202210166805.8A CN202210166805A CN114581350B CN 114581350 B CN114581350 B CN 114581350B CN 202210166805 A CN202210166805 A CN 202210166805A CN 114581350 B CN114581350 B CN 114581350B
- Authority
- CN
- China
- Prior art keywords
- list
- training
- image
- semi
- monocular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 45
- 230000000694 effects Effects 0.000 claims abstract description 12
- 238000002372 labelling Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 238000002156 mixing Methods 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000010008 shearing Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种适用于单目3D目标检测模型的半监督学习方法,所述方法包括:基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果。本发明利用额外的无标签数据,有效提升单目3D目标检测相关算法的精度指标;提出了一种目标边界框位置不确定度估计方法,用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。
Description
技术领域
本发明属于目标检测领域,具体涉及一种通过半监督学习同时利用标注和未标注数据有效提升有监督学习算法性能指标上限,特别涉及一种适用于单目3D目标检测任务的半监督学习方法。
背景技术
单目3D目标检测是自动驾驶环境感知领域的一项重要任务,基于单帧图像实现对周围目标的类别估计和3D边界框回归,低成本的先天优势使其在自动驾驶和机器人领域具备广阔的应用前景和商业价值。近年来,单目3D目标检测引起了学术界和工业界研究人员的广泛关注,大量的新方法被提出,但这些方法均严重依赖于丰富的标记数据的有监督方法。
人工标注数据不仅成本高,而且漫长的标注周期不利于算法的快速迭代与部署,与之相比,原始图像数据更容易实现大规模快速采集。如何同时充分利用标注和未标注数据是减轻算法对标注图像严重依赖,实现低成本快速迭代的一种很有效的方法。
半监督学习可以通过综合应用少量有标签数据和大规模无标签数据来帮助算法突破有监督学习的指标上限。近年来,大量的半监督学习方法被成功运用于分类、2D目标检测和点云3D目标检测任务,但目前还没有专门针对单目3D目标检测任务设计的半监督学习方法。
发明内容
本发明的目的在于克服现有技术缺陷,提出了一种适用于单目3D目标检测任务的半监督学习方法。
为了实现上述目的,本发明提出了一种适用于单目3D目标检测模型的半监督学习方法,所述方法包括:
基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果。
作为上述方法的一种改进,所述根据得到的教师模型进行面向数据库的伪标签生成具体包括:
使用教师模型通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;
筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库;
基于实例数据库和背景数据库构建合成图像。
作为上述方法的一种改进,所述基于实例数据库和背景数据库构建合成图像;具体包括:
对实例数据库中的图像块进行预处理实现图像增强;
将预处理后的图像块以贴图方式融合到有标签图像,或将预处理后的图像块以贴图方式融合到来自背景数据集的背景图像。
作为上述方法的一种改进,所述预处理具体包括:
按一定比例剪切实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或按一定比例用随机颜色填充实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或将实例图像块与有标签图像之间进行随机权重的加权平均以实现混合;
和/或将实例图像块与背景图片之间进行随机权重的加权平均以实现混合。
作为上述方法的一种改进,所述目标边界框位置不确定度估计方法具体包括:
步骤s1)对于不同参数相同结构的N个教师模型,针对同一帧图像数据,得到M个检测框;
步骤s2)设置列表B包含所有教师模型的M个三维边界框,设置列表S存储与每个三维边界框对应的分类置信度;
步骤s3)设置三个空列表G、H和U,其中,列表G用于保存三维边界框聚类,每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的三维边界框,列表U用于保存列表H中每个三维边界框对应的位置不确定度;
步骤s4)依次遍历列表B中的每一个三维边界框bi,当IoU3D(bi,bm)≥thr,则转至步骤s5),当IoU3D(bi,bm)<thr,若已遍历完毕列表B,转至步骤s6),否则继续执行步骤s4),其中,IoU3D表示三维目标框交并比,bm为列表B中置信度最高的边界框,thr为交并比阈值;
步骤s5)判定bi属于当前聚类C,将bi由列表B转移到聚类C,列表S作相应更新,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s6)将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将bm由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s7)计算列表G中每个聚类C的不确定性u,并将计算结果加入至列表U;
步骤s8)返回位置不确定度列表U和对应边界框列表H。
作为上述方法的一种改进,所述步骤s7)的不确定性u满足下式:
式中,M表示聚类C中的预测框数量,N表示同构异参模型数量,bi表示聚类C中的第i个预测框,bj表示聚类C中的第j个预测框,aij表示每一项的权重,β为超参数,用于控制聚类C中预测框数量对位置不确定度的影响程度;
位置不确定性u取值为0或1,其中,取值为0表示对于同一个实际目标,N个同构异参模型中不存在漏检,且所有N个检测框完全重合;取值为1表示所有模型都无法检测到实际存在的目标。
作为上述方法的一种改进,所述半监督训练的损失函数为:
与现有技术相比,本发明的优势在于:
1、本发明提出了一种适用于单目3D目标检测任务的半监督学习方法Mix-Teaching,该方法通过基于目标实例数据库和背景数据库的合成图像开展半监督训练;
2、本发明利用额外的无标签数据,有效提升单目3D目标检测相关算法的精度指标;
3、本发明提出了一种目标边界框位置不确定度估计方法,用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。
附图说明
图1是本发明的适用于单目3D目标检测任务的半监督学习方法(Mix-Teaching)原理图;
图2是采用本发明的方法实现边界框级数据增强的效果示意图;其中,图2(a)是原始图像,图2(b)是对图2(a)进行边框边缘剪切的效果图,图2(c)是对图2(a)进行边框边缘颜色填充的效果图,图2(d)是对图2(a)进行与背景图片混合的效果图,图2(e)是对图2(a)分别进行边框边缘剪切、边框边缘颜色填充以及与背景图片混合后的融合效果图;
图3是本发明的目标边界框不确定估计方法的伪代码图。
具体实施方式
一种适用于单目3D目标检测任务的半监督学习方法Mix-Teaching。该方法通过基于目标实例数据库和背景数据库的合成图像开展半监督训练。
一种目标边界框位置不确定度估计方法。用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。
下面结合附图和实施例对本发明的技术方案进行详细的说明。
实施例1
本发明所涉及的半监督学习方法采用多阶段训练模式:首先在标注数据上训练初始教师模型,然后根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,训练所得到的学生模型将被作为下一轮次的教师模型,如此不断迭代。
上文中的面向数据库的伪标签生成和基于合成图像的学生模型训练共同组成了本发明所提出的半监督学习方法(Mix-Teaching)。
1、Mix-Teaching半监督学习框架
Mix-Teaching半监督学习框架由两个阶段组成:面向数据库的伪标签生成阶段、基于合成图像的学生模型训练阶段。
(1)面向数据库的伪标签生成
为了在半监督训练环节充分利用稀疏伪标签,需要聚合伪标签和背景。如图1所示,首先使用教师模型对未标注图像数据进行打标签处理。一方面,通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;另一方面,筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库。
(2)基于合成图像的学生模型训练
基于上面创建的实例数据库和背景数据库构建合成图像,本发明提供两种合成图像策略:
1)将实例数据库中的图像块以贴图方式融合到有标签图像;
2)将实例数据库中的图像块以贴图方式融合到来自背景数据集的背景图像。
合成图像过程中,涉及三种实例级数据增强方法,如图2(a)所示为原始图像,
1)边框切割:按0.0-0.3比例剪切实例图像块的水平/垂直边框区域,见图2(b);
2)颜色覆盖:按0.0-0.3比例用随机颜色填充实例图像块的水平/垂直边框区域,见图2(c);
3)混合:将实例图像块与背景图片之间进行加权平均,见图2(d);
图2(e)为依次进行了上述三种方法后的融合效果图。
我们创建了包含带有真实标签或伪标签的密集对象的混合图像,用于半监督训练。
半监督训练总损失函数定义如下:
有监督损失函数作用于人工标注对象,定义如下:
无监督损失函数作用于伪标签对象,定义如下:
2、目标边界框位置不确定度估计方法
本发明通过根据经不同初始化和训练过程得到结构相同但参数不同的多个模型对同一个目标预测框的一致性情况来评估模型对该目标边界框估计的位置不确定度。
对于不同参数相同结构的N个模型,针对同一帧图像数据,会得到M个检测框,检测框位置不确定度具体计算流程如下,具体伪代码见图3:
(1)列表B包含所有模型的M个三维边界框,列表S存储着与每个边界框一一对应的分类置信度;
(2)声明三个空列表G、H和U。G用于保存边界框聚类。每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的边界框,列表U用于保存列表H中每个边界框对应的位置不确定度;
(3)依次遍历列表B中的每一个边界框bi,判断该边界框是否属于当前聚类C,匹配条件为IoU3D(bi,bm)≥thr,thr为交并比阈值;
(4)如果满足匹配条件,则将边界框bi由列表B转移到聚类C,列表S作相应更新;
(5)若不满足匹配条件且已遍历列表B中所有元素,则将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将其由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C;
(6)继续执行步骤(2)直至列表B为空;
(7)计算列表G中每个聚类C的不确定性u,计算结果加入至列表U,公式如下:
式中,M表示聚类C中的预测框数量,N表示同构异参模型数量,bi表示聚类C中的第i个预测框,aij表示每一项的权重,超参数β控制聚类C中预测框数量(召回)对位置不确定度的影响程度。
位置不确定性u取值0-1。取值为0表示对于同一个实际目标,N个同构异参模型中不存在漏检,且所有N个检测框完全重合,当取值为1时,表示所有模型都无法检测到实际存在的目标。
返回位置不确定度列表U和对应边界框列表H。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种适用于单目3D目标检测任务的半监督学习方法,所述方法包括:
基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果;
所述目标边界框位置不确定度估计方法具体包括:
步骤s1)对于不同参数相同结构的N个教师模型,针对同一帧图像数据,得到M个检测框;
步骤s2)设置列表B包含所有教师模型的M个三维边界框,设置列表S存储与每个三维边界框对应的分类置信度;
步骤s3)设置三个空列表G、H和U,其中,列表G用于保存三维边界框聚类,每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的三维边界框,列表U用于保存列表H中每个三维边界框对应的位置不确定度;
步骤s4)依次遍历列表B中的每一个三维边界框bi,当IoU3D(bi,bm)≥thr,则转至步骤s5),当IoU3D(bi,bm)<thr,若已遍历完毕列表B,转至步骤s6),否则继续执行步骤s4),其中,IoU3D表示三维目标框交并比,bm为列表B中置信度最高的边界框,thr为交并比阈值;
步骤s5)判定bi属于当前聚类C,将bi由列表B转移到聚类C,列表S作相应更新,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s6)将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将bm由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s7)计算列表G中每个聚类C的不确定性u,并将计算结果加入至列表U;
步骤s8)返回位置不确定度列表U和对应边界框列表H。
2.根据权利要求1所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述根据得到的教师模型进行面向数据库的伪标签生成具体包括:
使用教师模型通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;
筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库;
基于实例数据库和背景数据库构建合成图像。
3.根据权利要求2所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述基于实例数据库和背景数据库构建合成图像;具体包括:
对实例数据库中的图像块进行预处理实现图像增强;
将预处理后的图像块以贴图方式融合到有标签图像,或将预处理后的图像块以贴图方式融合到来自背景数据集的背景图像。
4.根据权利要求3所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述预处理具体包括:
按一定比例剪切实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或按一定比例用随机颜色填充实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或将实例图像块与有标签图像之间进行随机权重的加权平均以实现混合;
和/或将实例图像块与背景图片之间进行随机权重的加权平均以实现混合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210166805.8A CN114581350B (zh) | 2022-02-23 | 2022-02-23 | 一种适用于单目3d目标检测任务的半监督学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210166805.8A CN114581350B (zh) | 2022-02-23 | 2022-02-23 | 一种适用于单目3d目标检测任务的半监督学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114581350A CN114581350A (zh) | 2022-06-03 |
CN114581350B true CN114581350B (zh) | 2022-11-04 |
Family
ID=81770255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210166805.8A Active CN114581350B (zh) | 2022-02-23 | 2022-02-23 | 一种适用于单目3d目标检测任务的半监督学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114581350B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114882325B (zh) * | 2022-07-12 | 2022-12-02 | 之江实验室 | 基于二阶段物体检测器的半监督物检测及训练方法、装置 |
CN115082757A (zh) * | 2022-07-13 | 2022-09-20 | 北京百度网讯科技有限公司 | 伪标签生成方法、目标检测模型训练方法及装置 |
CN115527083B (zh) * | 2022-09-27 | 2023-04-11 | 中电金信软件有限公司 | 图像标注方法、装置和电子设备 |
CN115620155B (zh) * | 2022-12-19 | 2023-03-10 | 浙江华是科技股份有限公司 | 一种变电站目标检测方法、系统及计算机存储介质 |
CN117710970B (zh) * | 2024-02-05 | 2024-05-03 | 武汉互创联合科技有限公司 | 基于半监督算法的胚胎细胞多核目标检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200057848A (ko) * | 2018-11-15 | 2020-05-27 | 인하대학교 산학협력단 | 다중 분기 트리와 assl을 결합한 오픈 셋 물체 검출 방법 및 장치 |
CN113269267A (zh) * | 2021-06-15 | 2021-08-17 | 苏州挚途科技有限公司 | 目标检测模型的训练方法、目标检测方法和装置 |
CN113377888A (zh) * | 2021-06-25 | 2021-09-10 | 北京百度网讯科技有限公司 | 训练目标检测模型和检测目标的方法 |
CN113420707A (zh) * | 2021-07-05 | 2021-09-21 | 神思电子技术股份有限公司 | 一种基于弱监督学习的视频目标检测方法 |
CN113536920A (zh) * | 2021-06-11 | 2021-10-22 | 复旦大学 | 一种半监督三维点云目标检测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109741383A (zh) * | 2018-12-26 | 2019-05-10 | 西安电子科技大学 | 基于空洞卷积和半监督学习的图像深度估计系统与方法 |
US20200394458A1 (en) * | 2019-06-17 | 2020-12-17 | Nvidia Corporation | Weakly-supervised object detection using one or more neural networks |
CN114067109B (zh) * | 2022-01-13 | 2022-04-22 | 安徽高哲信息技术有限公司 | 谷物检测方法及检测设备、存储介质 |
-
2022
- 2022-02-23 CN CN202210166805.8A patent/CN114581350B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200057848A (ko) * | 2018-11-15 | 2020-05-27 | 인하대학교 산학협력단 | 다중 분기 트리와 assl을 결합한 오픈 셋 물체 검출 방법 및 장치 |
CN113536920A (zh) * | 2021-06-11 | 2021-10-22 | 复旦大学 | 一种半监督三维点云目标检测方法 |
CN113269267A (zh) * | 2021-06-15 | 2021-08-17 | 苏州挚途科技有限公司 | 目标检测模型的训练方法、目标检测方法和装置 |
CN113377888A (zh) * | 2021-06-25 | 2021-09-10 | 北京百度网讯科技有限公司 | 训练目标检测模型和检测目标的方法 |
CN113420707A (zh) * | 2021-07-05 | 2021-09-21 | 神思电子技术股份有限公司 | 一种基于弱监督学习的视频目标检测方法 |
Non-Patent Citations (4)
Title |
---|
3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection;He Wang等;《2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》;20211113;第14610-14619页 * |
Lite-FPN for Keypoint-based Monocular 3D Object Detection;Lei Yang等;《arXiv》;20210612;第1-11页 * |
Monocular 3D Detection With Geometric Constraint Embedding and Semi-Supervised Training;Peixuan Li等;《IEEE Robotics and Automation Letters》;20210223;第06卷(第03期);第5565-5572页 * |
基于深度学习的单目深度估计方法研究;姜欣言;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》;20210715(第07期);第C035-242页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114581350A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114581350B (zh) | 一种适用于单目3d目标检测任务的半监督学习方法 | |
WO2022111219A1 (zh) | 一种域自适应设备运检系统和方法 | |
CN106920243A (zh) | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 | |
CN108257154B (zh) | 基于区域信息和cnn的极化sar图像变化检测方法 | |
CN108038846A (zh) | 基于多层卷积神经网络的输电线路设备图像缺陷检测方法及系统 | |
CN115879535A (zh) | 一种自动驾驶感知模型的训练方法、装置、设备和介质 | |
CN111553403A (zh) | 基于伪3d卷积神经网络的烟雾检测方法及系统 | |
CN115063568A (zh) | 三维模型分割方法、装置、计算设备及计算机可读存储介质 | |
CN111914815A (zh) | 一种垃圾目标的机器视觉智能识别系统及方法 | |
CN111259733A (zh) | 一种基于点云图像的船舶识别方法及装置 | |
CN116486240A (zh) | 图像识别算法在输电线路无人机智能巡检方法上的应用 | |
CN110390724B (zh) | 一种带有实例分割的slam方法 | |
CN111242134A (zh) | 一种基于特征自适应学习的遥感影像地物分割方法 | |
Petschnigg et al. | Point based deep learning to automate automotive assembly simulation model generation with respect to the digital factory | |
CN114511627A (zh) | 一种目标果实定位分割方法及系统 | |
CN103295236B (zh) | 马尔可夫多特征随机场模型构建方法及其脑部mr图像分割技术 | |
CN115294176B (zh) | 一种双光多模型长时间目标跟踪方法、系统及存储介质 | |
Lin et al. | Run and chase: Towards accurate source-free domain adaptive object detection | |
CN116721206A (zh) | 一种实时的室内场景视觉同步定位与建图方法 | |
Zhou et al. | Fine-level semantic labeling of large-scale 3d model by active learning | |
Kim et al. | Approach to auto-recognition of design elements for the intelligent management of interior pictures | |
CN115797904A (zh) | 一种智能驾驶视觉感知中多场景多任务的主动学习方法 | |
CN110084190B (zh) | 一种基于ann的剧烈光照环境下实时非结构化道路检测方法 | |
US20230084761A1 (en) | Automated identification of training data candidates for perception systems | |
CN113920311A (zh) | 一种基于边缘辅助信息的遥感图像分割方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |