CN109034190B - 一种动态选择策略的主动样本挖掘的物体检测系统及方法 - Google Patents
一种动态选择策略的主动样本挖掘的物体检测系统及方法 Download PDFInfo
- Publication number
- CN109034190B CN109034190B CN201810623849.2A CN201810623849A CN109034190B CN 109034190 B CN109034190 B CN 109034190B CN 201810623849 A CN201810623849 A CN 201810623849A CN 109034190 B CN109034190 B CN 109034190B
- Authority
- CN
- China
- Prior art keywords
- samples
- learning
- model
- sample
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 238000001514 detection method Methods 0.000 title claims abstract description 69
- 238000005065 mining Methods 0.000 title claims abstract description 25
- 230000008569 process Effects 0.000 claims abstract description 92
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000002372 labelling Methods 0.000 claims abstract description 55
- 238000013135 deep learning Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 11
- 230000009977 dual effect Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 2
- 230000008447 perception Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012795 verification Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种动态选择策略的主动样本挖掘的物体检测系统及方法,所述系统包括:样本获取单元,用于获取少量标注样本和海量未标注样本;模型建立及初始化单元,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化深度学习物体检测模型;自学习单元,用于引入自学习课程指导自学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注;主动学习单元,用于引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;双重对偶课程约束单元,通过引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换;模型训练单元,用于将选择的伪标注样本和人工标注的样本训练模型以提升模型性能。
Description
技术领域
本发明涉及物体检测及深度学习技术领域,特别是涉及一种动态选择策略的主动样本挖掘的物体检测系统及方法。
背景技术
近年来,随着互联网的快速发展和计算能力的提升,受益于大规模训练数据的深度学习技术取得了突破性的进步。物体检测作为计算机视觉领域的一个经典任务,检测精度取得了巨大的提升。以候选区域为基础的物体检测网络对一张输入的图像提取大量的候选物体区域,并对这些区域进行类别标注和位置回归,提升了物体检测的识别精度和识别速度。然而,神经网络的检测效果极其依赖训练网络的标注样本数据,因此,如何利用大规模的未标注或是少量标注的数据有效训练网络,提升其检测精度是亟待解决的问题。
为了使用更少的标注数据训练出高精度的检测模型,一般需要解决以下技术问题:
1)在保证模型效果的同时,尽量减少人工样本标注。通常的神经网络训练,非常依赖大量人工标注的数据集,而比起其他视觉任务(例如,图像分类和动作识别),标注物体需要提供图片中所有物体的类别标签和物体所处区域的边框坐标。因此,对图像进行人工标注非常耗时耗力,发展自动标注无标签数据的方法是减少人工标注负担的关键步骤。
2)挖掘能够显著提高分类器表现的特殊训练样本。现有的物体检测数据集通常包含了绝大多数普通的“简单”样本和少量有益的“困难”样本(即,富含各种光照,变形,遮挡和类内变化的信息量)。因为他们服从长尾分布,“困难”的例子是罕见的,为了利用这些能够最有效训练神经网络的“困难”样本,需要能够从大量样本中将其识别出来。
3)抑制噪声样本或离群点的负面影响。一些训练样本(例如,离群点或噪声样本)可能会使模型发生偏移,在训练时排除被数据集中的标注者标记为“混乱”的样本后,训练得到的物体检测性能可以得到大幅度的改进和提高。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种动态选择策略的主动样本挖掘的物体检测系统及方法,以结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能。
为达上述及其它目的,本发明提出一种动态选择策略的主动样本挖掘的物体检测系统,包括:
样本获取单元,用于获取少量标注样本和海量未标注样本;
模型建立及初始化单元,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
自学习单元,用于引入自学习课程指导自学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注;
主动学习单元,用于引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
双重对偶课程约束单元,通过引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换;
模型训练单元,用于将选择的伪标注样本和人工标注的样本训练模型以提升模型性能。
优选地,所述深度学习物体检测模型使用Fast-RCNN或Faster-RCNN或R-FCN作为主要的物体检测网络结构,其包括卷积层,降采样层,矫正线性单元层,区域建议层,位置分数感知层和全连层等结构构成,输出物体的类别和位置坐标。
优选地,所述自学习单元的自动伪标注过程的模式函数fSS〔vi,λ〕为:
优选地,所述自学习单元根据如下公式判断该候选区域是否符合伪标注要求,若符合伪标注要求,则对其自动进行伪标注:
优选地,所述主动学习单元根据主动学习使用最少样本最大化激活模型的思想,将主动学习过程的模式函数fAL〔ui,γ〕定义为:
fAL〔ui,γ〕=-γui,
其中γ为一个正的阈值来选择困难样本给予人工标注。
优选地,在物体检测中,假设有n个候选区域,m-1个类和一个背景类,所述动态选择策略的主动样本挖掘的物体检测系统的表达式如下:
ui∈{0,1}为每个样本xi隐式的指标变量,vi∈[0,1〕m为隐权重变量vi∈[0,1〕m作为m维的权重向量,隐变量集合是与类别无关的,决定此样本是否应该由用户主动标注,隐变量集合是当前的检测器检测出的每个样本具体分类的权重,为引入选择函数。
优选地,所述双重对偶课程约束单元为主动学习过程与自学习过程引入主动学习课程Ψγ和自学习课程Ψλ的对偶课程来约束U和V的优化。
优选地,所述模型训练单元在训练模型以提升模型性能中待训练参数包括U,V,Y和W,初始化隐式权重变量V0和U0以及提供初始的标签Y0和初始化模型参数W0。
为达到上述目的,本发明还提供一种动态选择策略的主动样本挖掘的物体检测方法,包括如下步骤:
步骤一,获取少量标注样本和海量未标注样本;
步骤二,建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
步骤三,引入自学习课程指导自学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注;
步骤四,引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
步骤五,通过引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换;
步骤六,将选择的伪标注样本和人工标注的样本训练模型以提升模型性能。
与现有技术相比,本发明一种动态选择策略的主动样本挖掘的物体检测系统及方法通过结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能,其首先利用少量的标注样本初始化模型,然后在线加入海量的未标注样本,利用主动学习课程指导主动学习过程挖掘从困难到简单的样本进行简单的人工标注,利用自学习课程指导自学习过程挖掘从简单到困难样本以让计算机进行伪标注,最后将标注了的样本加入训练微调模型提高检测精度,本发明具有低成本高效益的性能,可以减少大量的人力物力,节约成本,具有较强的商业价值和应用前景。
附图说明
图1为本发明一种动态选择策略的主动样本挖掘的物体检测系统的系统架构图;
图2为本发明具体实施例中物体检测网络结构的框架结构图;
图3为本发明具体实施例中动态选择策略的主动样本挖掘的物体检测系统的框架示意图;
图4为本发明一种动态选择策略的主动样本挖掘的物体检测方法的步骤流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种动态选择策略的主动样本挖掘的物体检测系统的系统架构图。如图1所示,本发明一种动态选择策略的主动样本挖掘的物体检测系统,包括:
样本获取单元101,用于获取少量标注样本和海量未标注样本。
于本发明中,样本获取单元101可通过互联网例如一些在线视频网站或者直播网站获得样本,并对少量样本进行人工标注。
模型建立及初始化单元102,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型。在本发明具体实施例中,所述深度学习物体检测模型使用Fast-RCNN,Faster-RCNN,R-FCN作为主要的物体检测网络结构,如图2所示,其可由卷积网络(卷积层,降采样层,矫正线性单元层),区域建议层,位置分数感知层(感兴趣区域)和池化层等结构构成,其输出物体的类别和位置坐标,这里需说明的是,所述网络结构的网络层的组合方式可以多样,本发明不以此为限。本发明于建立好深度学习物体检测框架后,利用少量的标注样本(例如10%的样本)预训练模型得到一个初始模型,剩余样本为未标注样本。
自学习单元103,用于引入自学习课程指导自学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注。也就是说,根据当前模型预测出一组高置信度的“简单”样本,这些样本可以通过自学习的方式让计算机进行自动地伪标注,标注出物体的类别和位置坐标。
具体地说,海量的未标注图像的候选区域,通过自学习过程中的高置信度样本自动进行伪标注。本发明受到自步学习技术的启发,将自动伪标注过程的模式函数fss〔vi,λ〕定义为:
阈值参数更新如下:
其中表示第j个分类器在当前训练周期中,在验证集中模型输出的平均精度的-log值,α是控制阈值增长率的参数。阈值参数λ需要在几次更新后被移除,以防止允许太多的未标记的样本进入。因此引入了一个经验性的阈值τ,当且仅当q≤τ,λ会被更新。
本发明使用自学习单元,可以使训练中的模型能够在线地对未标注的样本进行伪标注,无需停止训练过程,实现增量式的端到端的持续学习,不断提高检测模型的精度,极大的解决了现实中人工标注样本不足的问题。随着模型性能的提高,伪标注能够获得更加精确的结果,而且每一次伪标注都是一次性伪标注,只在当前训练迭代次数下有效,下次微调训练将重新进行伪标注,这样可以减少因模型精度不高带来的累计误差。
主动学习单元104,用于引入主动学习课程指导主动学习过程挖掘“困难”样本进行人工标注。引入主动学习课程指导主动学习过程挖掘“困难”样本进行人工标注是主动学习课程表示一组具有丰富信息含义的代表性的“困难”样本,这些样本需要通过主动学习的方式进行简单的人工标注。在本发明具体实施例中,主动学习单元104根据主动学习使用最少样本最大化激活模型的思想,将主动学习过程的模式函数fAL〔ui,γ〕定义为:
fAL〔ui,γ〕=-γui, (3)
这里γ是一个正的阈值来选择困难样本给予人工标注。对于困难或信息量大的低置信度的样本,模型通常难以给出准确预测,而这样的样本通常能使模型学习到更加丰富的特征信息,提高模型预测准确性。本发明提出的主动学习过程可以充分利用困难样本,根据公式(4),当时(u*表示根据公式4优化后最优的值),选择此样本进行人工标注,主动学习过程标注最具信息量的困难样本加入训练微调模型,纠正自学习过程带来的累积误差,指导自学习过程,并将标注了的样本groundtruth(即物体的正确类别以及坐标)标记为True。
双重对偶课程约束单元105,通过引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换。
在本发明具体实施例中,本发明动态选择策略的主动样本挖掘的物体检测系统的公式化表达式如下:
该系统的框架示意图如图3所示,在物体检测中,假设有n个候选区域,m-1个类和一个背景类。训练集代表所有的候选区域。W代表了m个类别的物体检测网络共享的学习参数,样本xi的标签记为这里对应xi第j类的标签。这里,损失函数设置为这里是二分类的交叉熵损失:
公式(4)中的fss〔vi,λ〕和fAL〔ui,γ〕分别对应自学习的高置信度样本自动伪标注过程和低置信度样本人工标注的主动学习过程,用于表示对应过程的模型训练过程。
本发明设计的模型训练过程中,该模型为每个样本xi计算隐式的指标变量ui∈{0,1}作为标注标记和一个隐权重变量vi∈[0,1〕m作为m维的权重向量。是与类别无关的,决定此样本是否应该由用户主动标注,第二个隐变量集合是当前的检测器检测出的每个样本具体分类的权重。本发明引入选择函数来决定用哪一个阶段来获得图像检测分类结果当ui=1时,有所以此时样本xi被fAL〔ui,γ〕选择进行人工标注;当ui=0时,有所以此时样本xi被fss〔vi,λ〕选择进行自动伪标注,类别根据分类器φj的阈值λ〔i〕判断。
由上可知,本发明提出的模型主要利用了两个学习过程——主动学习过程与自学习过程。为了模型的有效优化,本发明为以上两个过程引入对偶课程——主动学习课程Ψr和自学习课程Ψλ来约束U和V的优化。根据人的认知原理,Ψr和Ψλ能够提供专业的信息来指导模型训练过程。具体来说,这两个对偶课程分别被初始化为一个限制到{0,1}x和[0,1〕mx的域。例如在第t次迭代中,假设已经获得了人工标注的样本集合At-1,以及属于未定义的物体类别或易混淆而被分类器丢弃的样本集合Bt-1。
根据公式(6),若xi∈At-1,Ui={1};若xi∈Bt-1,Ui={0};xi∈X/〔At-1∪Bt-1〕,Ui={0,1}。根据公式(7),若xi∈At-1∪Bt-1,Vi={0}m;xi∈X/〔At-1∪Bt-1〕,Ui={0,1〕m。中的样本ui=1将被用于人工标注,剩余样本ui∈{0,1}。根据公式(7)中ui=0的样本可能被fss〔vi,λ〕过程选中做伪标注,自学习课程限制了伪标注样本的权重。总的来说,使模型能从易到难地将伪标注的样本包含到训练中。与之相对的间断性地将人工标注样本从难到易地加入训练范围中。因此和两个作为彼此对偶的课程。主动学习课程指导主动学习过程自动选择可靠的具有丰富信息的样本,纠正自学习课程带来的累积误差和初始模型不可靠带来的预测误差;同时随着模型的持续训练,自学习课程指导的自学习过程获得更可靠的伪标注样本,模型参数具有更强的稳定性和鲁棒性,可以减少主动学习过程的人工标注。双重对偶课程互相补充,互为指导,可以在自学习过程和主动学习过程中无缝切换。
模型训练单元106,用于将将选择的伪标注样本和人工标注的样本训练模型以提升模型性能。也就是说,模型训练单元106将自学习单元103中计算机自动标注的伪标注样本和主动学习单元104中人工标注的样本加入训练微调模型以提升模型检测的性能。
在本发明具体实施例中,待训练参数包括U,V,Y和W,初始化隐式权重变量V0和U0以及提供初始的标签Y0和初始化模型参数W0。以下分别进行说明:
1、隐变量权重U和V
其优化目的是在每一轮迭代中提供越来越多的训练样本。为了这一目标,本发明使用针对隐权重变量U和V的最大-最小优化方法,在这里U代表了样本是否困难,V代表了使用伪标注的样本的可靠性。
2、更新参数Y
根据公式(10)在自学习过程高置信度样本自动伪标注阶段和主动学习过程低置信度样本人工标注阶段更新参数Y。
3、更新参数W
利用给定{X,Y,U,V,Ψγ,Ψλ},可以优化网络参数W,根据公式(4),此时模型可以简化为如下优化目标函数:
该目标函数可以分解为一系列基于批量梯度下降法来求解,利用标准的反向传播算法更新参数W。
图4为本发明一种动态选择策略的主动样本挖掘的物体检测方法的步骤流程图。如图4所示,本发明一种动态选择策略的主动样本挖掘的物体检测方法,包括如下步骤:
步骤401,获取少量标注样本和海量未标注样本。
于步骤401中,这里的样本可通过互联网例如一些在线视频网站或者直播网站获得,并对少量样本进行人工标注。
步骤402,建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型。在本发明具体实施例中,所述深度学习物体检测模型使用Fast-RCNN,Faster-RCNN,R-FCN作为主要的物体检测网络结构,其输出物体的类别和位置坐标。本发明于建立好深度学习物体检测框架后,利用少量的标注样本(例如10%的样本)预训练模型得到一个初始模型,剩余样本为未标注样本。
步骤403,引入自学习课程指导自学习过程挖掘海量未标注样本中的“简单”样本(高置信度样本)自动进行伪标注。也就是说,根据当前模型预测出一组高置信度的“简单”样本,这些样本可以通过自学习的方式让计算机进行自动地伪标注,标注出物体的类别和位置坐标。
具体地说,海量的未标注图像的候选区域,通过自学习过程中的高置信度样本自动进行伪标注。本发明受到自步学习技术的启发,将自动伪标注过程的模式函数fss〔vi,λ〕定义为:
阈值参数更新如下:
其中表示第j个分类器在当前训练周期中,在验证集中模型输出的平均精度的-log值,α是控制阈值增长率的参数。阈值参数λ需要在几次更新后被移除,以防止允许太多的未标记的样本进入。因此引入了一个经验性的阈值τ,当且仅当q≤τ,λ会被更新。
本发明使用自学习步骤,可以使训练中的模型能够在线地对未标注的样本进行伪标注,无需停止训练过程,实现增量式的端到端的持续学习,不断提高检测模型的精度,极大的解决了现实中人工标注样本不足的问题。随着模型性能的提高,伪标注能够获得更加精确的结果,而且每一次伪标注都是一次性伪标注,只在当前训练迭代次数下有效,下次微调训练将重新进行伪标注,这样可以减少因模型精度不高带来的累计误差。
步骤404,引入主动学习课程指导主动学习过程挖掘“困难”样本(低置信度样本)进行人工标注。引入主动学习课程指导主动学习过程挖掘“困难”样本进行人工标注是主动学习课程表示一组具有丰富信息含义的代表性的“困难”样本,这些样本需要通过主动学习的方式进行简单的人工标注。在本发明具体实施例中,步骤104根据主动学习使用最少样本最大化激活模型的思想,将主动学习过程的模式函数fAL〔ui,γ〕定义为:
fAL〔ui,γ〕=-γui,
这里γ是一个正的阈值来选择困难样本给予人工标注。对于困难或信息量大的低置信度的样本,模型通常难以给出准确预测,而这样的样本通常能使模型学习到更加丰富的特征信息,提高模型预测准确性。本发明提出的主动学习过程可以充分利用困难样本,当时,选择此样本进行人工标注,主动学习过程标注最具信息量的困难样本加入训练微调模型,纠正自学习过程带来的累积误差,指导自学习过程,并将标注了的样本groundtruth(即物体的正确类别以及坐标)标记为True。
步骤405,引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换。
本发明提出的模型主要利用了两个学习过程——主动学习过程与自学习过程。为了模型的有效优化,本发明为以上两个过程引入对偶课程——主动学习课程Ψγ和自学习课程Ψλ来约束U和V的优化。根据人的认知原理,Ψγ和Ψλ能够提供专业的信息来指导模型训练过程。具体来说,这两个对偶课程分别被初始化为一个限制到{0,1}x和[0,1〕mx的域。例如在第t次迭代中,假设已经获得了人工标注的样本集合At-1,以及属于未定义的物体类别或易混淆而被分类器丢弃的样本集合Bt-1。
在本发明中,主动学习课程指导主动学习过程自动选择可靠的具有丰富信息的样本,纠正自学习课程带来的累积误差和初始模型不可靠带来的预测误差;同时随着模型的持续训练,自学习课程指导的自学习过程获得更可靠的伪标注样本,模型参数具有更强的稳定性和鲁棒性,可以减少主动学习过程的人工标注。双重对偶课程互相补充,互为指导,可以在自学习过程和主动学习过程中无缝切换。
步骤406将选择的伪标注样本和人工标注的样本训练模型以提升模型性能。也就是说,将自学习过程中计算机自动标注的伪标注样本和主动学习过程中人工标注的样本加入训练微调模型以提升模型检测的性能。
在本发明具体实施例中,待训练参数包括U,V,Y和W,初始化隐式权重变量V0和U0以及提供初始的标签Y0和初始化模型参数W0。以下分别进行说明:
1、隐变量权重U和V
其优化目的是在每一轮迭代中提供越来越多的训练样本。为了这一目标,本发明使用针对隐权重变量U和V的最大-最小优化方法,在这里U代表了样本是否困难,V代表了使用伪标注的样本的可靠性。
2、更新参数Y
根据以上公式在自学习过程高置信度样本自动伪标注阶段和主动学习过程低置信度样本人工标注阶段更新参数Y。
3、更新参数W
利用给定{X,Y,U,V,Ψγ,Ψλ},可以优化网络参数W,根据公式(4),此时模型可以简化为如下优化目标函数:
该目标函数可以分解为一系列基于批量梯度下降法来求解,利用标准的反向传播算法更新参数W。
在本发明具体实施例中,本发明之动态选择策略的主动样本挖掘的物体检测方法的学习过程算法如下:
输入:
输出:
模型的参数W。
初始化:
重复
开始批量数据t=1,…T
1.固定模型参数,根据公式(10)反向传播更新W
2.固定模型参数,根据公式(7)更新U,V
3.根据公式(9),自学习过程选择高一致性样本更新Y
结束
更新低置信度样本集At和Bt
4.判断AtUBt非空执行
5.根据公式(9),主动学习过程更新Y
6.根据公式(3)和(4)更新Ψγ,Ψλ
迭代训练β次,根据公式(6)更新λ
直到主动学习模块不能继续选出低置信度样本或达到最大迭代次数
综上所述,本发明一种动态选择策略的主动样本挖掘的物体检测系统及方法通过结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能,其首先利用少量的标注样本初始化模型,然后在线加入海量的未标注样本,利用主动学习课程指导主动学习过程挖掘从困难到简单的样本进行简单的人工标注,利用自学习课程指导自学习过程挖掘从简单到困难样本以让计算机进行伪标注,最后将标注了的样本加入训练微调模型提高检测精度,本发明具有低成本高效益的性能,可以减少大量的人力物力,节约成本,具有较强的商业价值和应用前景。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (2)
1.一种动态选择策略的主动样本挖掘的物体检测系统,包括:
样本获取单元,用于获取少量标注样本和海量未标注样本;
模型建立及初始化单元,用于建立深度学习物体检测模型,并利用少量的标注过的样本初始化所述深度学习物体检测模型;
自学习单元,用于引入自学习课程指导自学习过程挖掘海量未标注样本中的高置信度样本自动进行伪标注;
主动学习单元,用于引入主动学习课程指导主动学习过程挖掘海量未标注样本中的低置信度样本进行人工标注;
双重对偶课程约束单元,通过引入双重对偶课程指导选择策略在自学习过程和主动学习过程中实现无缝切换;
模型训练单元,用于将选择的伪标注样本和人工标注的样本训练模型以提升模型性能;
所述自学习单元的自动伪标注过程的模式函数fss(vi,λ)为:
所述自学习单元根据如下公式判断候选区域是否符合伪标注要求,若符合伪标注要求,则对其自动进行伪标注:
所述主动学习单元根据主动学习使用最少样本最大化激活模型的思想,将主动学习过程的模式函数fAL(ui,γ)定义为:
fAL(ui,γ)=-γui,
其中γ为一个正的阈值来选择困难样本给予人工标注;
在物体检测中,假设有n个候选区域,m-1个类和一个背景类,所述动态选择策略的主动样本挖掘的物体检测系统的表达式如下:
ui∈{0,1}为每个样本xi隐式的指标变量,vi∈[0,1)m为隐权重变量,vi∈[0,1)m作为m维的权重向量,隐变量集合是与类别无关的,决定此样本是否应该由用户主动标注,隐变量集合是当前的检测器检测出的每个样本具体分类的权重,为引入选择函数;
所述双重对偶课程约束单元为主动学习过程与自学习过程引入主动学习课程Ψγ和自学习课程Ψλ的对偶课程来约束U和V的优化。
2.如权利要求1所述的一种动态选择策略的主动样本挖掘的物体检测系统,其特征在于:所述深度学习物体检测模型使用Fast-RCNN或Faster-RCNN或R-FCN作为主要的物体检测网络结构,其包括卷积层、降采样层、矫正线性单元层、区域建议层、位置分数感知层和全连层,输出物体的类别和位置坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623849.2A CN109034190B (zh) | 2018-06-15 | 2018-06-15 | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623849.2A CN109034190B (zh) | 2018-06-15 | 2018-06-15 | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109034190A CN109034190A (zh) | 2018-12-18 |
CN109034190B true CN109034190B (zh) | 2022-04-12 |
Family
ID=64609930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810623849.2A Active CN109034190B (zh) | 2018-06-15 | 2018-06-15 | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109034190B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859123B (zh) * | 2019-01-10 | 2020-10-09 | 中国人民解放军陆军炮兵防空兵学院 | 基于Primal-dual的图像去噪方法及系统 |
CN109886925A (zh) * | 2019-01-19 | 2019-06-14 | 天津大学 | 一种主动学习与深度学习相结合的铝材表面缺陷检测方法 |
CN110335594A (zh) * | 2019-07-11 | 2019-10-15 | 哈尔滨工业大学 | 基于多示例学习的自动语音识别困难样本挖掘方法 |
CN111782847A (zh) * | 2019-07-31 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 图像处理方法、装置和计算机可读存储介质 |
CN112541372B (zh) * | 2019-09-20 | 2023-03-28 | 魔门塔(苏州)科技有限公司 | 一种困难样本筛选方法及装置 |
CN110688934B (zh) * | 2019-09-23 | 2023-11-21 | 云南电网有限责任公司电力科学研究院 | 一种空间采样主动学习分类方法、电子设备及存储介质 |
CN111476165A (zh) * | 2020-04-07 | 2020-07-31 | 同方赛威讯信息技术有限公司 | 基于深度学习的电子文档中标题印章指纹特征检测方法 |
CN111652167A (zh) * | 2020-06-09 | 2020-09-11 | 四川大学 | 一种染色体核型图像智能评价方法及系统 |
CN111881956B (zh) * | 2020-07-15 | 2023-05-12 | 北京市商汤科技开发有限公司 | 网络训练方法及装置、目标检测方法及装置和电子设备 |
CN112434806A (zh) * | 2020-11-18 | 2021-03-02 | 浙江大华技术股份有限公司 | 深度学习训练方法、装置、计算机设备及存储介质 |
CN112200274B (zh) * | 2020-12-09 | 2021-03-30 | 湖南索莱智能科技有限公司 | 一种目标检测方法、装置、电子设备和存储介质 |
CN112906902B (zh) * | 2020-12-22 | 2024-10-18 | 上海有个机器人有限公司 | 一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质 |
WO2022174436A1 (zh) * | 2021-02-22 | 2022-08-25 | 深圳大学 | 分类模型增量学习实现方法、装置、电子设备及介质 |
CN113205163B (zh) * | 2021-07-07 | 2021-11-19 | 数据堂(北京)科技股份有限公司 | 数据标注方法及装置 |
CN115859990B (zh) * | 2023-02-17 | 2023-05-09 | 智慧眼科技股份有限公司 | 基于元学习的信息抽取方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218764A (zh) * | 2013-03-28 | 2013-07-24 | 黑龙江大学 | 一种辅助驾校教学的自动识别监测系统 |
CN105989368A (zh) * | 2015-02-13 | 2016-10-05 | 展讯通信(天津)有限公司 | 一种目标检测方法及装置以及移动终端 |
CN106778829A (zh) * | 2016-11-28 | 2017-05-31 | 常熟理工学院 | 一种主动学习的肝脏损伤类别的图像检测方法 |
CN107316007A (zh) * | 2017-06-07 | 2017-11-03 | 浙江捷尚视觉科技股份有限公司 | 一种基于深度学习的监控图像多类物体检测与识别方法 |
-
2018
- 2018-06-15 CN CN201810623849.2A patent/CN109034190B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218764A (zh) * | 2013-03-28 | 2013-07-24 | 黑龙江大学 | 一种辅助驾校教学的自动识别监测系统 |
CN105989368A (zh) * | 2015-02-13 | 2016-10-05 | 展讯通信(天津)有限公司 | 一种目标检测方法及装置以及移动终端 |
CN106778829A (zh) * | 2016-11-28 | 2017-05-31 | 常熟理工学院 | 一种主动学习的肝脏损伤类别的图像检测方法 |
CN107316007A (zh) * | 2017-06-07 | 2017-11-03 | 浙江捷尚视觉科技股份有限公司 | 一种基于深度学习的监控图像多类物体检测与识别方法 |
Non-Patent Citations (3)
Title |
---|
Active Self-Paced Learning for Cost-Effective and Progressive Face Identfication;Liang Lin et al;《arXiv:1701.03555v2》;20170703;第1-15页 * |
Self-Paced Curriculum Learning;Lu Jiang et al;《Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence》;20150221;第2694-2700页 * |
Towards Human-Machine Cooperation:Self-supervised Sample Mining for Object Detection;Keze Wang et al;《arXiv:1803.09867v2》;20180524;第1-9页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109034190A (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034190B (zh) | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 | |
CN108985334B (zh) | 基于自监督过程改进主动学习的通用物体检测系统及方法 | |
US10497122B2 (en) | Image crop suggestion and evaluation using deep-learning | |
CN110503074B (zh) | 视频帧的信息标注方法、装置、设备及存储介质 | |
US20180232601A1 (en) | Deep Active Learning Method for Civil Infrastructure Defect Detection | |
CN110770758B (zh) | 确定可移动的设备的位置 | |
US10943352B2 (en) | Object shape regression using wasserstein distance | |
WO2021253686A1 (zh) | 特征点跟踪训练及跟踪方法、装置、电子设备及存储介质 | |
CN111259940A (zh) | 一种基于空间注意力地图的目标检测方法 | |
CN116563738A (zh) | 一种基于不确定性的多阶段引导的小目标半监督学习检测方法 | |
CN109919302B (zh) | 一种用于图像的神经网络的训练方法及装置 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN110245550A (zh) | 一种基于总体余弦分布的人脸噪音数据集cnn训练方法 | |
CN113033555B (zh) | 基于度量学习的视觉slam闭环检测方法 | |
CN116524593A (zh) | 一种动态手势识别方法、系统、设备及介质 | |
CN113920170A (zh) | 结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质 | |
WO2023207389A1 (zh) | 数据处理方法、装置、程序产品、计算机设备和介质 | |
CN116229519A (zh) | 一种基于知识蒸馏的二维人体姿态估计方法 | |
CN116385466A (zh) | 一种基于边界框弱标注的图像中目标分割方法及系统 | |
CN116681961A (zh) | 基于半监督方法和噪声处理的弱监督目标检测方法 | |
CN111144567A (zh) | 神经网络模型的训练方法及装置 | |
JP7221203B2 (ja) | モバイル装置の位置特定方法 | |
CN116543162B (zh) | 基于特征差值与上下文感知一致性的图像分割方法及系统 | |
Cheema et al. | Dilated temporal fully-convolutional network for semantic segmentation of motion capture data | |
CN115187633A (zh) | 一种六自由度视觉反馈实时运动跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220311 Address after: 511455 No. 106, Fengze East Road, Nansha District, Guangzhou City, Guangdong Province (self compiled Building 1) x1301-b013290 Applicant after: Guangzhou wisdom Technology (Guangzhou) Co.,Ltd. Address before: 511400 room 210-5, building 1, Chuangqi, No. 63, Chuangqi Road, Shilou Town, Panyu District, Guangzhou City, Guangdong Province Applicant before: GUANGZHOU SHENYU INFORMATION TECHNOLOGY CO.,LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |