CN114581350A - 一种适用于单目3d目标检测任务的半监督学习方法 - Google Patents

一种适用于单目3d目标检测任务的半监督学习方法 Download PDF

Info

Publication number
CN114581350A
CN114581350A CN202210166805.8A CN202210166805A CN114581350A CN 114581350 A CN114581350 A CN 114581350A CN 202210166805 A CN202210166805 A CN 202210166805A CN 114581350 A CN114581350 A CN 114581350A
Authority
CN
China
Prior art keywords
list
training
image
semi
monocular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210166805.8A
Other languages
English (en)
Other versions
CN114581350B (zh
Inventor
李骏
杨磊
张新钰
王力
吴新刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210166805.8A priority Critical patent/CN114581350B/zh
Publication of CN114581350A publication Critical patent/CN114581350A/zh
Application granted granted Critical
Publication of CN114581350B publication Critical patent/CN114581350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种适用于单目3D目标检测模型的半监督学习方法,所述方法包括:基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果。本发明利用额外的无标签数据,有效提升单目3D目标检测相关算法的精度指标;提出了一种目标边界框位置不确定度估计方法,用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。

Description

一种适用于单目3D目标检测任务的半监督学习方法
技术领域
本发明属于目标检测领域,具体涉及一种通过半监督学习同时利用标注和未标注数据有效提升有监督学习算法性能指标上限,特别涉及一种适用于单目3D目标检测任务的半监督学习方法。
背景技术
单目3D目标检测是自动驾驶环境感知领域的一项重要任务,基于单帧图像实现对周围目标的类别估计和3D边界框回归,低成本的先天优势使其在自动驾驶和机器人领域具备广阔的应用前景和商业价值。近年来,单目3D目标检测引起了学术界和工业界研究人员的广泛关注,大量的新方法被提出,但这些方法均严重依赖于丰富的标记数据的有监督方法。
人工标注数据不仅成本高,而且漫长的标注周期不利于算法的快速迭代与部署,与之相比,原始图像数据更容易实现大规模快速采集。如何同时充分利用标注和未标注数据是减轻算法对标注图像严重依赖,实现低成本快速迭代的一种很有效的方法。
半监督学习可以通过综合应用少量有标签数据和大规模无标签数据来帮助算法突破有监督学习的指标上限。近年来,大量的半监督学习方法被成功运用于分类、2D目标检测和点云3D目标检测任务,但目前还没有专门针对单目3D目标检测任务设计的半监督学习方法。
发明内容
本发明的目的在于克服现有技术缺陷,提出了一种适用于单目3D目标检测任务的半监督学习方法。
为了实现上述目的,本发明提出了一种适用于单目3D目标检测模型的半监督学习方法,所述方法包括:
基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果。
作为上述方法的一种改进,所述根据得到的教师模型进行面向数据库的伪标签生成具体包括:
使用教师模型通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;
筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库;
基于实例数据库和背景数据库构建合成图像。
作为上述方法的一种改进,所述基于实例数据库和背景数据库构建合成图像;具体包括:
对实例数据库中的图像块进行预处理实现图像增强;
将预处理后的图像块以贴图方式融合到有标签图像,或将预处理后的图像块以贴图方式融合到来自背景数据集的背景图像。
作为上述方法的一种改进,所述预处理具体包括:
按一定比例剪切实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或按一定比例用随机颜色填充实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或将实例图像块与有标签图像之间进行随机权重的加权平均以实现混合;
和/或将实例图像块与背景图片之间进行随机权重的加权平均以实现混合。
作为上述方法的一种改进,所述目标边界框位置不确定度估计方法具体包括:
步骤s1)对于不同参数相同结构的N个教师模型,针对同一帧图像数据,得到M个检测框;
步骤s2)设置列表B包含所有教师模型的M个三维边界框,设置列表S存储与每个三维边界框对应的分类置信度;
步骤s3)设置三个空列表G、H和U,其中,列表G用于保存三维边界框聚类,每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的三维边界框,列表U用于保存列表H中每个三维边界框对应的位置不确定度;
步骤s4)依次遍历列表B中的每一个三维边界框bi,当IoU3D(bi,bm)≥thr,则转至步骤s5),当IoU3D(bi,bm)<thr,若已遍历完毕列表B,转至步骤s6),否则继续执行步骤s4),其中,IoU3D表示三维目标框交并比,bm为列表B中置信度最高的边界框,thr为交并比阈值;
步骤s5)判定bi属于当前聚类C,将bi由列表B转移到聚类C,列表S作相应更新,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s6)将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将bm由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s7)计算列表G中每个聚类C的不确定性u,并将计算结果加入至列表U;
步骤s8)返回位置不确定度列表U和对应边界框列表H。
作为上述方法的一种改进,所述步骤s7)的不确定性u满足下式:
Figure BDA0003516530770000031
Figure BDA0003516530770000032
式中,M表示聚类C中的预测框数量,N表示同构异参模型数量,bi表示聚类C中的第i个预测框,bj表示聚类C中的第j个预测框,aij表示每一项的权重,β为超参数,用于控制聚类C中预测框数量对位置不确定度的影响程度;
位置不确定性u取值为0或1,其中,取值为0表示对于同一个实际目标,N个同构异参模型中不存在漏检,且所有N个检测框完全重合;取值为1表示所有模型都无法检测到实际存在的目标。
作为上述方法的一种改进,所述半监督训练的损失函数为:
Figure BDA0003516530770000033
其中,
Figure BDA0003516530770000034
为有监督损失,用于人工标注对象,
Figure BDA0003516530770000035
为无监督损失,用于伪标签对象,λ为平衡有监督损失和无监督损失所占比重的超参数;
Figure BDA0003516530770000036
满足下式:
Figure BDA0003516530770000037
其中,L表示一个训练轮次中标注图像索引,Nl表示每张标注图像所包含的人工标注框数量,
Figure BDA0003516530770000038
表示每张标注图像的第m个人工标注框,下标l表示标注对象,
Figure BDA0003516530770000039
表示分类损失函数,
Figure BDA00035165307700000310
表示回归损失函数;
Figure BDA00035165307700000311
满足下式:
Figure BDA0003516530770000041
其中,B表示一个训练轮次中背景图像数量,Nu表示每张标注图像或背景图像所包含的贴图伪标签框的数量,
Figure BDA0003516530770000042
表示在每张图像上的第n个伪标签框,下标u表示未标注对象。
与现有技术相比,本发明的优势在于:
1、本发明提出了一种适用于单目3D目标检测任务的半监督学习方法Mix-Teaching,该方法通过基于目标实例数据库和背景数据库的合成图像开展半监督训练;
2、本发明利用额外的无标签数据,有效提升单目3D目标检测相关算法的精度指标;
3、本发明提出了一种目标边界框位置不确定度估计方法,用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。
附图说明
图1是本发明的适用于单目3D目标检测任务的半监督学习方法(Mix-Teaching)原理图;
图2是采用本发明的方法实现边界框级数据增强的效果示意图;其中,图2(a)是原始图像,图2(b)是对图2(a)进行边框边缘剪切的效果图,图2(c)是对图2(a)进行边框边缘颜色填充的效果图,图2(d)是对图2(a)进行与背景图片混合的效果图,图2(e)是对图2(a)分别进行边框边缘剪切、边框边缘颜色填充以及与背景图片混合后的融合效果图;
图3是本发明的目标边界框不确定估计方法的伪代码图。
具体实施方式
一种适用于单目3D目标检测任务的半监督学习方法Mix-Teaching。该方法通过基于目标实例数据库和背景数据库的合成图像开展半监督训练。
一种目标边界框位置不确定度估计方法。用于有效过滤噪声伪标签,进一步提升半监督学习的训练效果。
下面结合附图和实施例对本发明的技术方案进行详细的说明。
实施例1
本发明所涉及的半监督学习方法采用多阶段训练模式:首先在标注数据上训练初始教师模型,然后根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,训练所得到的学生模型将被作为下一轮次的教师模型,如此不断迭代。
上文中的面向数据库的伪标签生成和基于合成图像的学生模型训练共同组成了本发明所提出的半监督学习方法(Mix-Teaching)。
1、Mix-Teaching半监督学习框架
Mix-Teaching半监督学习框架由两个阶段组成:面向数据库的伪标签生成阶段、基于合成图像的学生模型训练阶段。
(1)面向数据库的伪标签生成
为了在半监督训练环节充分利用稀疏伪标签,需要聚合伪标签和背景。如图1所示,首先使用教师模型对未标注图像数据进行打标签处理。一方面,通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;另一方面,筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库。
(2)基于合成图像的学生模型训练
基于上面创建的实例数据库和背景数据库构建合成图像,本发明提供两种合成图像策略:
1)将实例数据库中的图像块以贴图方式融合到有标签图像;
2)将实例数据库中的图像块以贴图方式融合到来自背景数据集的背景图像。
合成图像过程中,涉及三种实例级数据增强方法,如图2(a)所示为原始图像,
1)边框切割:按0.0-0.3比例剪切实例图像块的水平/垂直边框区域,见图2(b);
2)颜色覆盖:按0.0-0.3比例用随机颜色填充实例图像块的水平/垂直边框区域,见图2(c);
3)混合:将实例图像块与背景图片之间进行加权平均,见图2(d);
图2(e)为依次进行了上述三种方法后的融合效果图。
我们创建了包含带有真实标签或伪标签的密集对象的混合图像,用于半监督训练。
半监督训练总损失函数定义如下:
Figure BDA0003516530770000051
其中,
Figure BDA0003516530770000052
为有监督损失,
Figure BDA0003516530770000053
为无监督损失,λ为平衡有监督损失和无监督损失所占比重的超参数。
有监督损失函数作用于人工标注对象,定义如下:
Figure BDA0003516530770000061
其中,L表示一个训练轮次中标注图像索引,Nl表示每张标注图像所包含的人工标注框数量,
Figure BDA0003516530770000062
表示每张标注图像的第m个人工标注框,下表l表示标注对象,;
Figure BDA0003516530770000063
表示分类损失函数,
Figure BDA0003516530770000064
表示回归损失函数;
无监督损失函数作用于伪标签对象,定义如下:
Figure BDA0003516530770000065
其中,B表示一个训练轮次中背景图像数量,Nu表示每张标注图像或背景图像所包含的贴图伪标签框的数量,
Figure BDA0003516530770000066
表示在所属图像上的第n个伪标签框,下表u表示未标注对象,。
2、目标边界框位置不确定度估计方法
本发明通过根据经不同初始化和训练过程得到结构相同但参数不同的多个模型对同一个目标预测框的一致性情况来评估模型对该目标边界框估计的位置不确定度。
对于不同参数相同结构的N个模型,针对同一帧图像数据,会得到M个检测框,检测框位置不确定度具体计算流程如下,具体伪代码见图3:
(1)列表B包含所有模型的M个三维边界框,列表S存储着与每个边界框一一对应的分类置信度;
(2)声明三个空列表G、H和U。G用于保存边界框聚类。每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的边界框,列表U用于保存列表H中每个边界框对应的位置不确定度;
(3)依次遍历列表B中的每一个边界框bi,判断该边界框是否属于当前聚类C,匹配条件为IoU3D(bi,bm)≥thr,thr为交并比阈值;
(4)如果满足匹配条件,则将边界框bi由列表B转移到聚类C,列表S作相应更新;
(5)若不满足匹配条件且已遍历列表B中所有元素,则将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将其由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C;
(6)继续执行步骤(2)直至列表B为空;
(7)计算列表G中每个聚类C的不确定性u,计算结果加入至列表U,公式如下:
Figure BDA0003516530770000071
Figure BDA0003516530770000072
式中,M表示聚类C中的预测框数量,N表示同构异参模型数量,bi表示聚类C中的第i个预测框,aij表示每一项的权重,超参数β控制聚类C中预测框数量(召回)对位置不确定度的影响程度。
位置不确定性u取值0-1。取值为0表示对于同一个实际目标,N个同构异参模型中不存在漏检,且所有N个检测框完全重合,当取值为1时,表示所有模型都无法检测到实际存在的目标。
返回位置不确定度列表U和对应边界框列表H。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种适用于单目3D目标检测任务的半监督学习方法,所述方法包括:
基于标注数据训练初始教师模型,根据得到的教师模型进行面向数据库的伪标签生成和基于合成图像的学生模型训练,将本轮次训练所得到的学生模型作为下一轮次的教师模型,如此迭代进行多轮次训练直至达到训练要求,得到训练好的学生模型即为单目3D目标检测模型;在训练中采用目标边界框位置不确定度估计方法过滤噪声伪标签,进一步提升半监督训练效果。
2.根据权利要求1所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述根据得到的教师模型进行面向数据库的伪标签生成具体包括:
使用教师模型通过类别执行度和边界框位置不确定度筛选高质量伪标签,创建由实例图像块和对应伪标签组成的实例数据库;
筛选不包含任何检测结果的未标注数据作为背景图像,创建背景数据库;
基于实例数据库和背景数据库构建合成图像。
3.根据权利要求2所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述基于实例数据库和背景数据库构建合成图像;具体包括:
对实例数据库中的图像块进行预处理实现图像增强;
将预处理后的图像块以贴图方式融合到有标签图像,或将预处理后的图像块以贴图方式融合到来自背景数据集的背景图像。
4.根据权利要求3所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述预处理具体包括:
按一定比例剪切实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或按一定比例用随机颜色填充实例图像块的水平边框边缘区域和垂直边框边缘区域;
和/或将实例图像块与有标签图像之间进行随机权重的加权平均以实现混合;
和/或将实例图像块与背景图片之间进行随机权重的加权平均以实现混合。
5.根据权利要求2所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述目标边界框位置不确定度估计方法具体包括:
步骤s1)对于不同参数相同结构的N个教师模型,针对同一帧图像数据,得到M个检测框;
步骤s2)设置列表B包含所有教师模型的M个三维边界框,设置列表S存储与每个三维边界框对应的分类置信度;
步骤s3)设置三个空列表G、H和U,其中,列表G用于保存三维边界框聚类,每个聚类代表N个同构异参模型对图像上同一的目标对象的检测结果,列表H用于保存每个聚类中置信度分数最高的三维边界框,列表U用于保存列表H中每个三维边界框对应的位置不确定度;
步骤s4)依次遍历列表B中的每一个三维边界框bi,当IoU3D(bi,bm)≥thr,则转至步骤s5),当IoU3D(bi,bm)<thr,若已遍历完毕列表B,转至步骤s6),否则继续执行步骤s4),其中,IoU3D表示三维目标框交并比,bm为列表B中置信度最高的边界框,thr为交并比阈值;
步骤s5)判定bi属于当前聚类C,将bi由列表B转移到聚类C,列表S作相应更新,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s6)将当前聚类C加入到列表G,重新选取列表B中置信度最高的边界框bm,将bm由列表B转移至列表H,列表S同步更新,基于框bm初始化新的聚类C,当列表B不为空则转至步骤s4),否则转至步骤s7);
步骤s7)计算列表G中每个聚类C的不确定性u,并将计算结果加入至列表U;
步骤s8)返回位置不确定度列表U和对应边界框列表H。
6.根据权利要求5所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述步骤s7)的不确定性u满足下式:
Figure RE-FDA0003584872930000021
Figure RE-FDA0003584872930000022
式中,M表示聚类C中的预测框数量,N表示同构异参模型数量,bi表示聚类C中的第i个预测框,bj表示聚类C中的第j个预测框,aij表示每一项的权重,β为超参数,用于控制聚类C中预测框数量对位置不确定度的影响程度;
位置不确定性u取值为0或1,其中,取值为0表示对于同一个实际目标,N个同构异参模型中不存在漏检,且所有N个检测框完全重合;取值为1表示所有模型都无法检测到实际存在的目标。
7.根据权利要求1所述的适用于单目3D目标检测任务的半监督学习方法,其特征在于,所述半监督训练的损失函数为:
Figure RE-FDA0003584872930000031
其中,
Figure RE-FDA0003584872930000032
为有监督损失,用于人工标注对象,
Figure RE-FDA0003584872930000033
为无监督损失,用于伪标签对象,λ为平衡有监督损失和无监督损失所占比重的超参数;
Figure RE-FDA0003584872930000034
满足下式:
Figure RE-FDA0003584872930000035
其中,L表示一个训练轮次中标注图像索引,Nl表示每张标注图像所包含的人工标注框数量,
Figure RE-FDA0003584872930000036
表示每张标注图像的第m个人工标注框,下标l表示标注对象,
Figure RE-FDA0003584872930000037
表示分类损失函数,
Figure RE-FDA0003584872930000038
表示回归损失函数;
Figure RE-FDA0003584872930000039
满足下式:
Figure RE-FDA00035848729300000310
其中,B表示一个训练轮次中背景图像数量,Nu表示每张标注图像或背景图像所包含的贴图伪标签框的数量,
Figure RE-FDA00035848729300000311
表示在每张图像上的第n个伪标签框,下标u表示未标注对象。
CN202210166805.8A 2022-02-23 2022-02-23 一种适用于单目3d目标检测任务的半监督学习方法 Active CN114581350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210166805.8A CN114581350B (zh) 2022-02-23 2022-02-23 一种适用于单目3d目标检测任务的半监督学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210166805.8A CN114581350B (zh) 2022-02-23 2022-02-23 一种适用于单目3d目标检测任务的半监督学习方法

Publications (2)

Publication Number Publication Date
CN114581350A true CN114581350A (zh) 2022-06-03
CN114581350B CN114581350B (zh) 2022-11-04

Family

ID=81770255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210166805.8A Active CN114581350B (zh) 2022-02-23 2022-02-23 一种适用于单目3d目标检测任务的半监督学习方法

Country Status (1)

Country Link
CN (1) CN114581350B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882325A (zh) * 2022-07-12 2022-08-09 之江实验室 基于二阶段物体检测器的半监督物检测及训练方法、装置
CN115082757A (zh) * 2022-07-13 2022-09-20 北京百度网讯科技有限公司 伪标签生成方法、目标检测模型训练方法及装置
CN115527083A (zh) * 2022-09-27 2022-12-27 中电金信软件有限公司 图像标注方法、装置和电子设备
CN115620155A (zh) * 2022-12-19 2023-01-17 浙江华是科技股份有限公司 一种变电站目标检测方法、系统及计算机存储介质
CN117710970A (zh) * 2024-02-05 2024-03-15 武汉互创联合科技有限公司 基于半监督算法的胚胎细胞多核目标检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741383A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于空洞卷积和半监督学习的图像深度估计系统与方法
KR20200057848A (ko) * 2018-11-15 2020-05-27 인하대학교 산학협력단 다중 분기 트리와 assl을 결합한 오픈 셋 물체 검출 방법 및 장치
US20200394458A1 (en) * 2019-06-17 2020-12-17 Nvidia Corporation Weakly-supervised object detection using one or more neural networks
CN113269267A (zh) * 2021-06-15 2021-08-17 苏州挚途科技有限公司 目标检测模型的训练方法、目标检测方法和装置
CN113377888A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 训练目标检测模型和检测目标的方法
CN113420707A (zh) * 2021-07-05 2021-09-21 神思电子技术股份有限公司 一种基于弱监督学习的视频目标检测方法
CN113536920A (zh) * 2021-06-11 2021-10-22 复旦大学 一种半监督三维点云目标检测方法
CN114067109A (zh) * 2022-01-13 2022-02-18 安徽高哲信息技术有限公司 谷物检测方法及检测设备、存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200057848A (ko) * 2018-11-15 2020-05-27 인하대학교 산학협력단 다중 분기 트리와 assl을 결합한 오픈 셋 물체 검출 방법 및 장치
CN109741383A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于空洞卷积和半监督学习的图像深度估计系统与方法
US20200394458A1 (en) * 2019-06-17 2020-12-17 Nvidia Corporation Weakly-supervised object detection using one or more neural networks
CN113536920A (zh) * 2021-06-11 2021-10-22 复旦大学 一种半监督三维点云目标检测方法
CN113269267A (zh) * 2021-06-15 2021-08-17 苏州挚途科技有限公司 目标检测模型的训练方法、目标检测方法和装置
CN113377888A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 训练目标检测模型和检测目标的方法
CN113420707A (zh) * 2021-07-05 2021-09-21 神思电子技术股份有限公司 一种基于弱监督学习的视频目标检测方法
CN114067109A (zh) * 2022-01-13 2022-02-18 安徽高哲信息技术有限公司 谷物检测方法及检测设备、存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HE WANG等: "3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection", 《2021 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
LEI YANG等: "Lite-FPN for Keypoint-based Monocular 3D Object Detection", 《ARXIV》 *
PEIXUAN LI等: "Monocular 3D Detection With Geometric Constraint Embedding and Semi-Supervised Training", 《IEEE ROBOTICS AND AUTOMATION LETTERS》 *
姜欣言: "基于深度学习的单目深度估计方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882325A (zh) * 2022-07-12 2022-08-09 之江实验室 基于二阶段物体检测器的半监督物检测及训练方法、装置
CN115082757A (zh) * 2022-07-13 2022-09-20 北京百度网讯科技有限公司 伪标签生成方法、目标检测模型训练方法及装置
CN115527083A (zh) * 2022-09-27 2022-12-27 中电金信软件有限公司 图像标注方法、装置和电子设备
CN115620155A (zh) * 2022-12-19 2023-01-17 浙江华是科技股份有限公司 一种变电站目标检测方法、系统及计算机存储介质
CN115620155B (zh) * 2022-12-19 2023-03-10 浙江华是科技股份有限公司 一种变电站目标检测方法、系统及计算机存储介质
CN117710970A (zh) * 2024-02-05 2024-03-15 武汉互创联合科技有限公司 基于半监督算法的胚胎细胞多核目标检测方法
CN117710970B (zh) * 2024-02-05 2024-05-03 武汉互创联合科技有限公司 基于半监督算法的胚胎细胞多核目标检测方法

Also Published As

Publication number Publication date
CN114581350B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN114581350B (zh) 一种适用于单目3d目标检测任务的半监督学习方法
WO2022111219A1 (zh) 一种域自适应设备运检系统和方法
CN106920243A (zh) 改进的全卷积神经网络的陶瓷材质件序列图像分割方法
CN108038846A (zh) 基于多层卷积神经网络的输电线路设备图像缺陷检测方法及系统
CN108257154B (zh) 基于区域信息和cnn的极化sar图像变化检测方法
CN115879535A (zh) 一种自动驾驶感知模型的训练方法、装置、设备和介质
CN115393687A (zh) 一种基于双伪标签优化学习的rgb图像半监督目标检测方法
CN115063568A (zh) 三维模型分割方法、装置、计算设备及计算机可读存储介质
CN112381060A (zh) 一种基于深度学习的建筑物地震破坏等级分类方法
CN112052818A (zh) 无监督域适应的行人检测方法、系统及存储介质
CN111259733A (zh) 一种基于点云图像的船舶识别方法及装置
CN112347930A (zh) 基于自学习半监督深度神经网络高分影像场景分类方法
CN114511627A (zh) 一种目标果实定位分割方法及系统
Wang et al. Research on traffic sign detection based on convolutional neural network
Petschnigg et al. Point based deep learning to automate automotive assembly simulation model generation with respect to the digital factory
CN115496941B (zh) 基于知识增强计算机视觉的结构健康诊断方法
CN115294176B (zh) 一种双光多模型长时间目标跟踪方法、系统及存储介质
CN103295236A (zh) 马尔可夫多特征随机场模型构建方法及其脑部mr图像分割技术
CN115797904A (zh) 一种智能驾驶视觉感知中多场景多任务的主动学习方法
Kim et al. Approach to auto-recognition of design elements for the intelligent management of interior pictures
CN110084190B (zh) 一种基于ann的剧烈光照环境下实时非结构化道路检测方法
CN114595695A (zh) 一种用于少样本意图识别系统的自训练模型构建方法
CN113920311A (zh) 一种基于边缘辅助信息的遥感图像分割方法及系统
Zhou et al. An overload behavior detection system for engineering transport vehicles based on deep learning
Liu et al. Peaks Fusion assisted Early-stopping Strategy for Overhead Imagery Segmentation with Noisy Labels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant