CN108985334B - 基于自监督过程改进主动学习的通用物体检测系统及方法 - Google Patents
基于自监督过程改进主动学习的通用物体检测系统及方法 Download PDFInfo
- Publication number
- CN108985334B CN108985334B CN201810623784.1A CN201810623784A CN108985334B CN 108985334 B CN108985334 B CN 108985334B CN 201810623784 A CN201810623784 A CN 201810623784A CN 108985334 B CN108985334 B CN 108985334B
- Authority
- CN
- China
- Prior art keywords
- samples
- learning
- self
- pseudo
- object detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
本发明公开了一种基于自监督过程改进主动学习的通用物体检测系统及方法,该系统包括:样本获取单元,获取少量标注样本和海量未标注样本;模型建立及初始化单元,建立深度学习物体检测模型,并利用少量标注样本初始化深度学习物体检测模型;自监督学习单元,引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票选择出高预测一致性的伪标注样本;主动学习单元,引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;模型训练单元,用于将选择的高预测一致性的伪标注样本和人工标注的样本训练模型以提升模型性能。
Description
技术领域
本发明涉及物体检测及深度学习技术领域,特别是涉及一种基于自监督过程改进主动学习的通用物体检测系统及方法。
背景技术
近年来,随着互联网的快速发展和计算能力的提升,受益于大规模训练数据的深度学习技术取得了突破性的进步。物体检测作为计算机视觉领域的一个经典任务,检测精度取得了巨大的提升。以候选区域为基础的物体检测网络对一张输入的图像提取大量的候选物体区域,并对这些区域进行类别标注和位置回归,提升了物体检测的识别精度和识别速度。然而,神经网络的检测效果极其依赖训练网络的标注样本数据,因此,如何利用大规模的未标注或是少量标注的数据有效训练网络,提升其检测精度是亟待解决的问题。
为了使用更少的标注数据训练出高精度的检测模型,一般需要解决以下技术问题:
1)在保证模型效果的同时,尽量减少人工样本标注。通常的神经网络训练,非常依赖大量人工标注的数据集,而比起其他视觉任务(例如,图像分类和动作识别),标注物体需要提供图片中所有物体的类别标签和物体所处区域的边框坐标。因此,对图像进行人工标注非常耗时耗力,发展自动标注无标签数据的方法是减少人工标注负担的关键步骤。
2)挖掘能够显著提高分类器表现的特殊训练样本。现有的物体检测数据集通常包含了绝大多数普通的“简单”样本和少量有益的“困难”样本(即,富含各种光照,变形,遮挡和类内变化的信息量)。因为他们服从长尾分布,“困难”的例子是罕见的,为了利用这些能够最有效训练神经网络的“困难”样本,需要能够从大量样本中将其识别出来。
3)抑制坏样本的负面影响。一些训练样本(例如,离群点或噪声样本)可能会使模型发生偏移,在训练时排除被数据集中的标注者标记为“混乱”的样本后,训练得到的物体检测性能可以得到大幅度的改进和提高。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于自监督过程改进主动学习的通用物体检测系统及方法,以结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能以提高检测精度,本发明可在减少大量的人力物力、节约成本基础上实现通用物体检测目的。
为达上述及其它目的,本发明提出一种基于自监督过程改进主动学习的通用物体检测系统,包括:
样本获取单元,用于获取少量标注样本和海量未标注样本;
模型建立及初始化单元,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
自监督学习单元,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本;
主动学习单元,用于引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
模型训练单元,用于将选择的高预测一致性的伪标注样本和人工标注的样本训练模型以提升模型性能。
优选地,所述深度学习物体检测模型使用Fast-RCNN或Faster-RCNN或R-FCN作为主要的物体检测网络结构,其包括卷积层,降采样层,矫正线性单元层,区域建议层,位置分数感知层和全连层等结构构成,输出物体的类别和位置坐标。
优选地,所述自监督学习单元具体包括:
自步学习伪标注模块,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,标注出物体的类别和位置坐标;
图像交叉验证模块,用于对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本。
优选地,所述图像交叉验证模块的模式函数f(xi;W)定义为:
其中B(xi)表示候选区域xi预测的原坐标,B(xp)表示将候选区域xp贴到其他图像上重新预测的坐标,Iou表示候选区域坐标B(xi)和坐标B(xp)之间的重合度,γ是一个阈值参数,φj(xi;W)表示贴图后候选区域xi属于第j个类别的概率分数,表示排除第j个类别后的标注图片
优选地,所述系统还包括正则化模块,所述正则化模块于自监督学习后利用正则化项根据损失函数惩罚相同的隐变量权重。
优选地,在物体检测中,假设有n个候选区域,m-1个类和一个背景类,所述基于自监督过程改进
其中ΩI表示当前标注图片产生的被标注的建议区域,
其中logφj(xi;W)表示每个候选区域xi属于第j个类别的概率分数。
优选地,对于每个候选区域xi定义了如下两组可实时切换的课程约束:
为达到上述目的,本发明还提供一种基于自监督过程改进主动学习的通用物体检测方法,包括如下步骤:
步骤一,获取少量标注样本和海量未标注样本;
步骤二,建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
步骤三,引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本;
步骤四,引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
步骤五,将选择的高预测一致性的伪标注样本和人工标注的样本训练模型以提升模型性能。
与现有技术相比,本发明一种基于自监督过程改进主动学习的通用物体检测方系统及方法通过结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能,其首先利用少量的标注样本初始化模型,然后在线加入海量的未标注样本,利用自监督学习课程指导自监督学习过程挖掘从简单到困难样本让计算机自动进行伪标注,扩展运用多张图像交叉验证的方式对伪标注的样本进行重新预测投票决策选出高预测一致性的样本,并利用主动学习课程指导主动学习过程挖掘从困难到简单的样本进行简单的人工标注,最后将标注了的样本加入训练微调模型以提高检测精度,本发明可以减少大量的人力物力,节约成本,具有很强的商业价值和应用前景。
附图说明
图1为本发明一种基于自监督过程改进主动学习的通用物体检测系统的系统架构图;
图2为本发明具体实施例中物体检测网络结构的框架结构图;
图3为本发明具体实施例中图像交叉验证模块的结构示意图;
图4为本发明一种基于自监督过程改进主动学习的通用物体检测方法的步骤流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基于自监督过程改进主动学习的通用物体检测系统的系统架构图。如图1所示,本发明一种基于自监督过程改进主动学习的通用物体检测系统,包括:
样本获取单元101,用于获取少量标注样本和海量未标注样本。
于本发明中,样本获取单元101可通过互联网例如一些在线视频网站或者直播网站获得样本,并对少量样本进行人工标注。
模型建立及初始化单元102,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型。在本发明具体实施例中,所述深度学习物体检测模型使用Fast-RCNN,Faster-RCNN,R-FCN作为主要的物体检测网络结构,如图2所示,其可由卷积网络(卷积层,降采样层,矫正线性单元层)、区域建议层,位置分数感知层(感兴趣区域)和池化层等结构构成,其输出物体的类别和位置坐标,这里需说明的是,所述网络结构的网络层的组合方式可以多样,本发明不以此为限。本发明于建立好深度学习物体检测框架后,利用少量的标注样本(例如10%的样本)预训练模型得到一个初始模型,剩余样本为未标注样本。
自监督学习单元103,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本。
具体地,自监督学习单元103进一步包括:
自步学习伪标注模块103a,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注。也就是说,根据当前模型预测出一组高置信度的“简单”样本,这些样本可以通过自监督学习的方式让计算机进行自动地伪标注,标注出物体的类别和位置坐标。
具体地说,对于海量的未标注图像的候选区域通过自监督过程中的高置信度阈值自动进行伪标注。本发明受到自步学习技术的启发,选取最大的类别进行自动伪标注。被用来定义第j个分类器的高置信度候选区域,模型将对其自动进行伪标注。将分类器分数最高一类作为其分类结果,将回归器的输出作为真实物体位置坐标。
图像交叉验证模块103b,用于对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本。也就是说,图像交叉验证模块103b对自步学习伪标注模块103a得到的伪标注样本进行多张图片贴图操作,利用网络模型对贴图进行重新预测,根据预测分数和坐标关系投票决策选择出高预测一致性的伪标注样本。
具体地,图像交叉验证模块示意图如图3所示,该模块用于验证某个候选区域贴在多张图片中是否具有高度一致性,此时将模式函数f(xi;W)定义为:
其中B(xi)表示候选区域xi预测的原坐标,B(xp)表示将候选区域xp贴到其他图像上重新预测的坐标,Iou表示候选区域坐标B(xi)和坐标B(xp)之间的重合度,γ是一个阈值参数,这里设置为0.5,φi(xp;W)表示贴图后候选区域xi属于第j个类别的概率分数。将候选区域贴在k张不含该预测类别的图片中进行再次检测,若Iou大于阈值γ的张数大于k/2,则认为该候选区域认为是高预测一致性样本,这里k设置为5。将分类器分数最高一类作为其分类结果,将回归器的输出作为真实物体位置坐标,该标注是一次性的,每次更新时将重新预测。
本发明在各种通用物体检测结构中使用自监督学习单元,可以使训练中的模型能够在线地对未标注的样本进行伪标注,无需停止训练过程,实现增量式的端到端的持续学习,不断提高检测模型的精度,极大的解决了现实中人工标注样本不足的问题,随着模型性能的提高,伪标注能够获得更加精确的结果,而且每一次伪标注都是一次性伪标注,只在当前训练迭代次数下有效,下次微调训练将重新进行伪标注,这样可以减少因模型精度不高带来的累计误差。
在此需说明的是,本发明提出了两种伪标注的思想,分别用于无交叉验证模块和适配有交叉验证模块的标注器,使用者可根据计算资源情况进行选择。
主动学习单元104,用于引入主动学习课程指导主动学习过程挖掘“困难”样本(低置信度样本)进行人工标注。引入主动学习课程指导主动学习过程挖掘“困难”样本进行人工标注是主动学习课程表示一组具有丰富信息含义的代表性的“困难”样本,这些样本需要通过主动学习的方式进行简单的人工标注。
主动学习单元是本发明人机交互重要模块。根据主动学习方法的技术,若vi (j)=1,进入主动学习过程,对于困难或信息量大的低置信度的样本未标注的候选区域,该样本将进行简单的人工标注,本发明利用主动学习过程标注最具信息量的困难样本加入训练微调模型,纠正自监督学习过程带来的累积误差,指导自监督学习过程,并标注了的样本将ground truth标记为True,该标注是永久性的,一次标注将永久标注。
模型训练单元105,用于将选经图像交叉验证筛选出来的高预测一致性伪标注样本和人工标注的样本训练模型以提升模型性能。也就是说,模型训练单元106将自监督学习单元103中经图像交叉验证筛选出来的高预测一致性伪标注样本和主动学习单元104中人工标注的样本加入训练微调模型以提升模型检测的性能。
因此,在本发明具体实施例中,本发明自监督式的主动样本挖掘的物体检测系统的公式化表达式如下:
其中ΩI表示当前标注图片产生的被标注的建议区域,
这里两点需要注意:(1)在本发明中只有少量的标注样本(10%)初始化模型,大量的样本的标签是不可知的;(2)数据是以一种增量式的方式输入到检测网络中,因此数据规模是逐渐增加的。每个样本xi有一个隐权重变量作为m维的权重向量。样本xi的标签记为这里对应xi第j类的标签,lj(xi,W)是一种特定类的经验损失函数:
其中logφj(xi;W)表示每个候选区域xi属于第j个类别的概率分数。表示的是第t此用户标注阶段每个候选区域xi的课程约束。特别的,本发明给每个候选区域xi定义了如下两组可实时切换的课程约束:(1)时,训练过程进入自监督学习阶段,此时课程为自监督学习课程,模型自动对候选区域xi进行伪标注,是当前的检测器检测出的每个无标注样本的具体分类的权重。(2)时,训练过程进入主动学习阶段,此时课程为主动学习课程,权重向量设置为1。约束惩罚除以下两种情况外的所有情况:(1)为第j个分类器预测正其余分类器预测为负;(2)所有分类器预测为负,此时属于未定义类别。
对于模型训练单元,本发明待训练参数包括V,Y,Ψt和W,初始化隐式权重变量V0,初始课程Ψt0,以及提供初始的标签Y0和初始化模型参数W0。以下分别进行说明:
1、隐变量权重V
固定参数{Ψt,Y,X,W},可直接根据公式(1)
计算f(xi;W),然后根据公式(3)
得到V。
2、更新参数Y
根据获得的V和一致性预测分数s,对候选区域的预测分数 按照降序排列,对每个类别选取前k个最高非零值。这些m个类别重要性样本定义为H=[H1,...,Hj,...,Hm](|Hj|≤k),H即为高预测一致性样本赋予伪标注。固定根据公式(4)、(6)可优化yi:
其中,vi固定为一个常数,xi以一个很高的概率赋予伪标注,运用重排技术,将伪标注赋予排列了的高预测一致性样本集H,公式(8)一个清晰的解。本发明在增量式的伪标注过程中利用以下两个优点来减少累积误差:(1)所有的伪标注都是一次性的,在每次批量迭代过程后伪标注将会被抛弃;(2)图像交叉验证被引入,除了预测的高预测一致性分数,课程约束也会决定是否进行伪标注。同时,课程约束根据用户主动学习的标注进行更新,避免因检测器性能不佳带来的累积误差。
3、更新参数Ψt
主动学习过程选择具有丰富信息的未标注样本通过用户将其标为正样本或负样本。选择策略基于经典的不确定性选择策略,本发明选择经过图像交叉验证后的低一致性样本,将使当前分类器“困惑”的样本(预测为两个正类别)进行人工标注。将这些标注的样本U加入课程约束Ψt中更新Ψt,主动学习过程进行如下两个操作:(1)设置课程约束(2)更新标签{yi}i∈U并将其加入当前已标注的样本集Ωt中。
4、更新参数W
利用给定{D,V,Y,Ψt},可以优化网络参数W,根据公式(4),此时模型可以简化为如下优化目标函数:
该目标函数可以分解为一系列基于批量梯度下降法来求解,利用标准的反向传播算法更新参数W。
图4为本发明一种基于自监督过程改进主动学习的通用物体检测方法的步骤流程图。如图4所示,本发明一种基于自监督过程改进主动学习的通用物体检测方法,包括如下步骤:
步骤401,获取少量标注样本和海量未标注样本。
于步骤401中,这里的样本可通过互联网例如一些在线视频网站或者直播网站获得,并对少量样本进行人工标注。
步骤402,建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型。在本发明具体实施例中,所述深度学习物体检测模型使用Fast-RCNN,Faster-RCNN,R-FCN作为主要的物体检测网络结构,其输出物体的类别和位置坐标。本发明于建立好深度学习物体检测框架后,利用少量的标注样本(例如10%的样本)预训练模型得到一个初始模型,剩余样本为未标注样本。
步骤403,引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本。
具体地,步骤403包括:
引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注。也就是说,于本步骤中,根据当前模型预测出一组高置信度的“简单”样本,这些样本可以通过自监督学习的方式让计算机进行自动地伪标注,标注出物体的类别和位置坐标。
具体地说,对于海量的未标注图像的候选区域通过自监督过程中的高置信度阈值自动进行伪标注。本发明受到自步学习技术的启发,选取最大的类别进行自动伪标注。被用来定义第j个分类器的高置信度候选区域,模型将对其自动进行伪标注。将分类器分数最高一类作为其分类结果,将回归器的输出作为真实物体位置坐标。
对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本。也就是说,对自动伪标注得到的伪标注样本进行多张图片贴图操作,利用网络模型对贴图进行重新预测,根据预测分数和坐标关系投票决策选择出高预测一致性的伪标注样本。
具体地,图像交叉验证过程定义为:
其中B(xi)表示候选区域xi预测的原坐标,B(xp)表示将候选区域xp贴到其他图像上重新预测的坐标,Iou表示候选区域坐标B(xi)和坐标B(xp)之间的重合度,γ是一个阈值参数,这里设置为0.5,φi(xp;W)表示贴图后候选区域xi属于第j个类别的概率分数。将候选区域贴在k张不含该预测类别的图片中进行再次检测,若Iou大于阈值γ的张数大于k/2,则认为该候选区域认为是高预测一致性样本,这里k设置为5。将分类器分数最高一类作为其分类结果,将回归器的输出作为真实物体位置坐标,该标注是一次性的,每次更新时将重新预测。
本发明在各种通用物体检测结构中使用自监督学习,可以使训练中的模型能够在线地对未标注的样本进行伪标注,无需停止训练过程,实现增量式的端到端的持续学习,不断提高检测模型的精度,极大的解决了现实中人工标注样本不足的问题,随着模型性能的提高,伪标注能够获得更加精确的结果,而且每一次伪标注都是一次性伪标注,只在当前训练迭代次数下有效,下次微调训练将重新进行伪标注,这样可以减少因模型精度不高带来的累计误差。
步骤404,引入主动学习课程指导主动学习过程挖掘“困难”样本(低置信度样本)进行人工标注。引入主动学习课程指导主动学习过程挖掘“困难”样本进行人工标注是主动学习课程表示一组具有丰富信息含义的代表性的“困难”样本,这些样本需要通过主动学习的方式进行简单的人工标注。
在本发明具体实施例中,根据主动学习方法的技术,若进入主动学习过程,对于困难或信息量大的低置信度的样本未标注的候选区域,该样本将进行简单的人工标注,本发明利用主动学习过程标注最具信息量的困难样本加入训练微调模型,纠正自监督学习过程带来的累积误差,指导自监督学习过程,并标注了的样本将ground truth标记为True,该标注是永久性的,一次标注将永久标注。
步骤405,将选经图像交叉验证筛选出来的高预测一致性伪标注样本和人工标注的样本训练模型以提升模型性能。也就是说,于本步骤中,将自监督学习经图像交叉验证筛选出来的高预测一致性伪标注样本和主动学习过程中人工标注的样本加入训练微调模型以提升模型检测的性能。
于步骤405中,本发明待训练参数包括V,Y,Ψt和W,初始化隐式权重变量V0,初始课程Ψt0,以及提供初始的标签Y0和初始化模型参数W0。以下分别进行说明:
1、隐变量权重V
固定参数{Ψt,Y,X,W},可直接根据如下公式:
计算f(xi;W),然后根据如下公式:
得到V。
2、更新参数Y
根据获得的V和一致性预测分数s,对候选区域的预测分数 按照降序排列,对每个类别选取前k个最高非零值。这些m个类别重要性样本定义为H=[H1,...,Hj,...,Hm](|Hj|≤k),H即为高预测一致性样本赋予伪标注。固定根据公式(3)可优化yi:
vi固定为一个常数,xi以一个很高的概率赋予伪标注,运用重排技术,将伪标注赋予排列了的高预测一致性样本集H,公式(8)有一个清晰的解。本发明在增量式的伪标注过程中利用以下两个优点来减少累积误差:(1)所有的伪标注都是一次性的,在每次批量迭代过程后伪标注将会被抛弃;(2)图像交叉验证被引入,除了预测的高预测一致性分数,课程约束也会决定是否进行伪标注。同时,课程约束根据用户主动学习的标注进行更新,避免因检测器性能不佳带来的累积误差。
3、更新参数Ψt
主动学习过程选择具有丰富信息的未标注样本通过用户将其标为正样本或负样本。选择策略基于经典的不确定性选择策略,本发明选择经过图像交叉验证后的低一致性样本,将使当前分类器“困惑”的样本(预测为两个正类别)进行人工标注。将这些标注的样本U加入课程约束Ψt中更新Ψt,主动学习过程进行如下两个操作:(1)设置课程约束(2)更新标签{yi}i∈U并将其加入当前已标注的样本集Ωt中。
4、更新参数W
利用给定{D,V,Y,Ψt},可以优化网络参数W,根据公式(4),此时模型可以简化为如下优化目标函数:
该目标函数可以分解为一系列基于批量梯度下降法来求解,利用标准的反向传播算法更新参数W。
在本发明具体实施例中,本发明之基于自监督过程改进主动学习的通用物体检测方法的学习过程算法如下:
输入:
输出:
模型的参数W。
初始化
重复
t:=0
开始批量数据处理=1,…T
1、固定模型参数,根据公式(10)反向传播更新W
2、固定模型参数,通过自监督过程根据公式(8)更新S
3、通过重新排序更新H
4、根据公式(9),自监督过程选择高预测一致性样本更新{yi}i∈H
结束
更新低置信度样本集U
5、判断U非空执行
7、用{yi}i∈U更新标注样本集Ωt
8、t:=+1
直到主动学习模块不能继续选出低置信度样本或达到最大迭代次数
综上所述,本发明一种基于自监督过程改进主动学习的通用物体检测方系统及方法通过结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能,其首先利用少量的标注样本初始化模型,然后在线加入海量的未标注样本,利用自监督学习课程指导自监督学习过程挖掘从简单到困难样本让计算机自动进行伪标注,扩展运用多张图像交叉验证的方式对伪标注的样本进行重新预测投票决策选出高预测一致性的样本,并利用主动学习课程指导主动学习过程挖掘从困难到简单的样本进行简单的人工标注,最后将标注了的样本加入训练微调模型提高检测精度,本发明可以减少大量的人力物力,节约成本,具有很强的商业价值和应用前景。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (5)
1.一种基于自监督过程改进主动学习的通用物体检测系统,包括:
样本获取单元,用于获取少量标注样本和海量未标注样本;
模型建立及初始化单元,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
自监督学习单元,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,并对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本;
主动学习单元,用于引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
模型训练单元,用于将选择的高预测一致性的伪标注样本和人工标注的样本训练模型以提升模型性能;
所述深度学习物体检测模型使用Fast-RCNN或Faster-RCNN或R-FCN作为主要的物体检测网络结构,输出物体的类别和位置坐标;
所述自监督学习单元具体包括:
自步学习伪标注模块,用于引入自监督学习课程指导自监督学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注,标注出物体的类别和位置坐标;
图像交叉验证模块,用于对伪标注过的样本进行图像交叉验证,进行图像贴图重新预测,交叉投票进一步选择出高预测一致性的伪标注样本;
所述图像交叉验证模块的模式函数f(xi;W)定义为:
2.如权利要求1所述的一种基于自监督过程改进主动学习的通用物体检测系统,其特征在于:所述系统还包括正则化模块,所述正则化模块于自监督学习后利用正则化项根据损失函数惩罚相同的隐变量权重。
3.如权利要求2所述的一种基于自监督过程改进主动学习的通用物体检测系统,其特征在于:在物体检测中,假设有n个候选区域,m-1个类和一个背景类,所述基于自监督过程改进主动学习的通用物体检测系统的表达式如下:
其中ΩI表示当前标注图片产生的被标注的建议区域,
其中logφj(xi;W)表示每个候选区域xi属于第j个类别的概率分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623784.1A CN108985334B (zh) | 2018-06-15 | 2018-06-15 | 基于自监督过程改进主动学习的通用物体检测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623784.1A CN108985334B (zh) | 2018-06-15 | 2018-06-15 | 基于自监督过程改进主动学习的通用物体检测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108985334A CN108985334A (zh) | 2018-12-11 |
CN108985334B true CN108985334B (zh) | 2022-04-12 |
Family
ID=64541399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810623784.1A Active CN108985334B (zh) | 2018-06-15 | 2018-06-15 | 基于自监督过程改进主动学习的通用物体检测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108985334B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886338A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研精准汽车科技有限公司 | 一种智能汽车测试图像标注方法、装置、系统及存储介质 |
CN110084131A (zh) * | 2019-04-03 | 2019-08-02 | 华南理工大学 | 一种基于深度卷积网络的半监督行人检测方法 |
CN111783993A (zh) * | 2019-05-23 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 智能标注方法、装置、智能平台及存储介质 |
CN110334633A (zh) * | 2019-06-27 | 2019-10-15 | 北京御航智能科技有限公司 | 识别巡检数据并更新识别模型的方法、装置及存储介质 |
CN110458221B (zh) * | 2019-08-05 | 2021-03-16 | 南开大学 | 基于在线注意力累积的挖掘目标物体区域的方法 |
CN110610169B (zh) * | 2019-09-20 | 2023-12-15 | 腾讯科技(深圳)有限公司 | 图片标注方法和装置、存储介质及电子装置 |
CN110705630A (zh) * | 2019-09-27 | 2020-01-17 | 聚时科技(上海)有限公司 | 半监督学习式目标检测神经网络训练方法、装置及应用 |
CN112861892B (zh) * | 2019-11-27 | 2023-09-01 | 杭州海康威视数字技术股份有限公司 | 图片中目标的属性的确定方法和装置 |
CN110909820B (zh) * | 2019-12-02 | 2023-04-07 | 齐鲁工业大学 | 基于自监督学习的图像分类方法及系统 |
CN111160161B (zh) * | 2019-12-18 | 2022-03-15 | 电子科技大学 | 一种基于噪声剔除的自步学习人脸年龄估计方法 |
CN113052191A (zh) * | 2019-12-26 | 2021-06-29 | 航天信息股份有限公司 | 一种神经语言网络模型的训练方法、装置、设备及介质 |
CN111476284B (zh) * | 2020-04-01 | 2023-12-26 | 杭州网易智企科技有限公司 | 图像识别模型训练及图像识别方法、装置、电子设备 |
CN111401474B (zh) * | 2020-04-13 | 2023-09-08 | Oppo广东移动通信有限公司 | 视频分类模型的训练方法、装置、设备及存储介质 |
CN111652167A (zh) * | 2020-06-09 | 2020-09-11 | 四川大学 | 一种染色体核型图像智能评价方法及系统 |
CN111881956B (zh) * | 2020-07-15 | 2023-05-12 | 北京市商汤科技开发有限公司 | 网络训练方法及装置、目标检测方法及装置和电子设备 |
CN112069921A (zh) * | 2020-08-18 | 2020-12-11 | 浙江大学 | 一种基于自监督知识迁移的小样本视觉目标识别方法 |
CN112163634B (zh) * | 2020-10-14 | 2023-09-05 | 平安科技(深圳)有限公司 | 实例分割模型样本筛选方法、装置、计算机设备及介质 |
CN112435230B (zh) * | 2020-11-20 | 2021-07-16 | 哈尔滨市科佳通用机电股份有限公司 | 一种基于深度学习的数据集生成方法及系统 |
CN113468939A (zh) * | 2020-11-30 | 2021-10-01 | 电子科技大学 | 一种基于监督最小化深度学习模型的sar目标识别方法 |
CN112906902A (zh) * | 2020-12-22 | 2021-06-04 | 上海有个机器人有限公司 | 一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质 |
CN113314205B (zh) * | 2021-05-28 | 2022-05-17 | 北京航空航天大学 | 一种高效的医学影像标注与学习系统 |
CN114841257B (zh) * | 2022-04-21 | 2023-09-22 | 北京交通大学 | 一种基于自监督对比约束下的小样本目标检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218764A (zh) * | 2013-03-28 | 2013-07-24 | 黑龙江大学 | 一种辅助驾校教学的自动识别监测系统 |
CN104318242A (zh) * | 2014-10-08 | 2015-01-28 | 中国人民解放军空军工程大学 | 一种高效的svm主动半监督学习算法 |
CN108038853A (zh) * | 2017-12-18 | 2018-05-15 | 浙江工业大学 | 一种基于卷积神经网络和主动学习的瓷砖表面缺陷识别方法 |
-
2018
- 2018-06-15 CN CN201810623784.1A patent/CN108985334B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218764A (zh) * | 2013-03-28 | 2013-07-24 | 黑龙江大学 | 一种辅助驾校教学的自动识别监测系统 |
CN104318242A (zh) * | 2014-10-08 | 2015-01-28 | 中国人民解放军空军工程大学 | 一种高效的svm主动半监督学习算法 |
CN108038853A (zh) * | 2017-12-18 | 2018-05-15 | 浙江工业大学 | 一种基于卷积神经网络和主动学习的瓷砖表面缺陷识别方法 |
Non-Patent Citations (2)
Title |
---|
Active Self-Paced Learning for Cost-Effective and Progressive Face Identfication;Liang Lin et al;《arXiv:1701.03555v2》;20170703;摘要、第1-6节、附录 * |
Towards Human-Machine Cooperation:Self-supervised Sample Mining for Object Detection;Keze Wang et al;《arXiv:1803.09867v2》;20180524;摘要、第1-5节、图1-5 * |
Also Published As
Publication number | Publication date |
---|---|
CN108985334A (zh) | 2018-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985334B (zh) | 基于自监督过程改进主动学习的通用物体检测系统及方法 | |
CN109034190B (zh) | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 | |
CN110443818B (zh) | 一种基于涂鸦的弱监督语义分割方法与系统 | |
US11055574B2 (en) | Feature fusion and dense connection-based method for infrared plane object detection | |
CN107239731B (zh) | 一种基于Faster R-CNN的手势检测和识别方法 | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
CN111476302A (zh) | 基于深度强化学习的Faster-RCNN目标物体检测方法 | |
CN106845430A (zh) | 基于加速区域卷积神经网络的行人检测与跟踪方法 | |
CN112966684A (zh) | 一种注意力机制下的协同学习文字识别方法 | |
US11640714B2 (en) | Video panoptic segmentation | |
CN108765383B (zh) | 基于深度迁移学习的视频描述方法 | |
CN110533041B (zh) | 基于回归的多尺度场景文本检测方法 | |
CN109284779A (zh) | 基于深度全卷积网络的物体检测方法 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN114863091A (zh) | 一种基于伪标签的目标检测训练方法 | |
CN111368634B (zh) | 基于神经网络的人头检测方法、系统及存储介质 | |
CN116524593A (zh) | 一种动态手势识别方法、系统、设备及介质 | |
CN113808123B (zh) | 一种基于机器视觉的药液袋动态检测方法 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN115019133A (zh) | 基于自训练和标签抗噪的图像中弱目标的检测方法及系统 | |
CN112418207B (zh) | 一种基于自注意力蒸馏的弱监督文字检测方法 | |
CN113408418A (zh) | 一种书法字体与文字内容同步识别方法及系统 | |
CN110457155B (zh) | 一种样本类别标签的修正方法、装置及电子设备 | |
CN116310293B (zh) | 一种基于弱监督学习的生成高质量候选框目标检测方法 | |
CN116958512A (zh) | 目标检测方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220310 Address after: 511455 No. 106, Fengze East Road, Nansha District, Guangzhou City, Guangdong Province (self compiled Building 1) x1301-b013290 Applicant after: Guangzhou wisdom Technology (Guangzhou) Co.,Ltd. Address before: 511400 room 210-5, building 1, Chuangqi, No. 63, Chuangqi Road, Shilou Town, Panyu District, Guangzhou City, Guangdong Province Applicant before: GUANGZHOU SHENYU INFORMATION TECHNOLOGY CO.,LTD. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |