CN104850832B - 一种基于分级迭代的大规模图像样本标注方法及系统 - Google Patents

一种基于分级迭代的大规模图像样本标注方法及系统 Download PDF

Info

Publication number
CN104850832B
CN104850832B CN201510226393.2A CN201510226393A CN104850832B CN 104850832 B CN104850832 B CN 104850832B CN 201510226393 A CN201510226393 A CN 201510226393A CN 104850832 B CN104850832 B CN 104850832B
Authority
CN
China
Prior art keywords
sample collection
positive sample
target
collection
initial data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510226393.2A
Other languages
English (en)
Other versions
CN104850832A (zh
Inventor
葛仕明
杜丰宇
解凯旋
杨睿
孙利民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201510226393.2A priority Critical patent/CN104850832B/zh
Publication of CN104850832A publication Critical patent/CN104850832A/zh
Application granted granted Critical
Publication of CN104850832B publication Critical patent/CN104850832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于分级迭代的大规模图像样本标注方法及系统,所述方法包括:利用半自动软件工具标注原始数据集中的目标;对已标注的原始数据集进行粗采集,得到正样本集和负样本集;利用正样本集和负样本集进行训练,得到目标检测器;利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;判断正样本集中的样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到,利用更新的正样本集和负样本集重新训练目标检测器,迭代精采集过程,否则结束迭代。本发明利用软件工具使得标注工作更快速更高效,整个过程不但提高了标注和采集的速度,节省了人力成本,通过粗采集和精采集的结合提高了样本的精确性。

Description

一种基于分级迭代的大规模图像样本标注方法及系统
技术领域
本发明涉及视频、图像处理技术领域,尤其涉及一种基于分级迭代的大规模图像样本标注方法及系统。
背景技术
随着Internet和数字图像技术的发展,图像数据呈现海量增长,对于很多机器学习领域的学者而言,从海量的视频或图像数据中采集到我们所需的目标的样本集,是一件费时费力的事,而且往往最终得到的样本集不一定够数或者不一定全都有效。采集之前首先要对视频或图片集进行标注,视频标注可以分为手动标注和自动标注两类。传统的人工标注方法每次只能对一幅图像中的物体区域进行标注,仅仅使用人工来进行标注越来越费时耗力。因此越来越多的学者研究通过利用机器学习方法来进行自动图像标注,但是使用统计学习方法也需要大量的已标注样本作为训练集,然而,目前存在的已标注数据集相对较少。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种基于分级迭代的大规模图像样本标注方法及系统。
本发明解决上述技术问题的技术方案如下:一种基于分级迭代的大规模图像样本标注方法,包括如下步骤:
步骤1,利用半自动软件工具标注原始数据集中的目标;
步骤2,对已标注的原始数据集进行粗采集,得到正样本集和负样本集;
步骤3,利用正样本集和负样本集进行训练,得到目标检测器;
步骤4,利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;
步骤5,判断正样本集中的样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到,返回步骤3,否则结束迭代。
本发明的有益效果是:本发明通过半自动方式标注视频或图片集中的目标之后,先“粗采集”部分数据来训练生成检测器,再通过检测器“精采集”来精确获取更多的目标的样本,通过迭代“精采集”的过程,利用新得到的样本训练出新的更精确的检测器进一步检测、切割目标。本发明利用软件工具使得标注工作更快速更高效,整个过程不但提高了标注和采集的速度,节省了人力成本,通过粗采集和精采集的结合提高了样本的精确性。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,步骤1对目标在原始数据集中出现的时间和位置进行标注,将目标信息保存在标注文档中。
采用上述进一步方案的有益效果:为目标的切割提供依据,实现对目标的精准切割,形成正样本集和负样本集。
进一步,步骤2中对已标注的原始数据集进行粗采集,得到正样本集和负样本集的具体操作为:
步骤2.1,从已标注的原始数据集中切割目标,得到的正样本形成一次正样本集;
步骤2.2,从原始数据集中切割不含目标的图片作为负样本集。
进一步,步骤4中利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集的具体操作为:
步骤4.1,利用检测器对原始数据集进行检测;
步骤4.2,将原始数据集中检测到的目标切割下来,更新正样本集;
步骤4.3,从原始数据集中切割不含目标的图片,更新负样本集。
进一步,上述技术方案还包括利用检测器对原始数据集进行检测过程中,为所有得到的目标打分,并按分数高低进行排序;步骤4.2中将原始数据集中检测到的目标切割下来得到检测所得正样本集,检测所述检测所得正样本集中是否存在分数低于阈值的样本,如果存在,将其作为负样本移入负样本集,剩下的分数高于阈值的样本即为正样本,用于更新正样本集,否则直接用检测所得正样本集更新正样本集。
采用上述进一步方案的有益效果:防止误将非目标的样本作为目标样本放入正样本集,进一步提高样本的准确性。
本发明解决上述技术问题的另一技术方案如下:一种基于分级迭代的大规模图像样本标注系统,包括标注模块、粗采集模块、目标检测器生成模块、精采集模块和迭代控制模块;
所述标注模块,用于利用半自动软件工具标注原始数据集中的目标;
所述粗采集模块,用于对已标注的原始数据集进行粗采集,得到正样本集和负样本集;
所述目标检测器生成模块,用于利用正样本集和负样本集进行训练,得到目标检测器;
所述精采集模块,用于利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;
所述迭代控制模块,用于判断正样本集中样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到控制目标检测器生成模块和精采集模块迭代,直至满足预设数量或预设标准。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述标注模块对目标在原始数据集中出现的时间和位置进行标注,将目标信息保存在标注文档中。
进一步,所述粗采集模块包括第一切割单元和第二切割单元:所述第一切割单元,用于从已标注的原始数据集中切割目标,得到的正样本形成一次正样本集;所述第二切割单元,用于从原始数据集中切割不含目标的图片作为负样本集。
进一步,所述精采集模块包括检测单元、第三切割单元和第四切割单元;所述检测单元,利用检测器对原始数据集进行检测;所述第三切割单元,用于将原始数据集中检测到的目标切割下来,更新正样本集;所述第四切割单元,从原始数据集中切割不含目标的图片,更新负样本集。
进一步,所述精采集模块还包括排序单元和监督单元;所述排序单元,用于在检测器对原始数据集进行检测过程中,为所有得到的目标打分,并按分数高低进行排序;所述监督单元,用于将原始数据集中检测到的目标切割下来得到检测所得正样本集,检测所述检测所得正样本集中是否存在分数低于阈值的样本,如果存在,将其作为负样本移入负样本集,剩下的分数高于阈值的样本即为正样本,用于更新正样本集,否则直接用检测所得正样本集更新正样本集。
附图说明
图1为本发明所述一种基于分级迭代的大规模图像样本标注方法流程图;
图2为本发明所述一种基于分级迭代的大规模图像样本标注系统框图。
附图中,各标号所代表的部件列表如下:
1、标注模块,2、粗采集模块,3、目标检测器生成模块,4、精采集模块,5、迭代控制模块,21、第一切割单元,22、第二切割单元,41、检测单元,42、第三切割单元,43、第四切割单元,44、排序单元,45、监督单元。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种基于分级迭代的大规模图像样本标注方法,包括如下步骤:
步骤1,利用半自动软件工具标注原始数据集中的目标;
步骤2,对已标注的原始数据集进行粗采集,得到正样本集和负样本集;
步骤3,利用正样本集和负样本集进行训练,得到目标检测器;
步骤4,利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;
步骤5,判断正样本集中的样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到,返回步骤3,否则结束迭代。
具体地,实现流程如下:
标注过程:
1.收集或网上下载一部分包含目标的视频集或图片集,作为原始数据集,用于采集目标。
2.通过自制软件工具标注部分原始数据集中的目标。如果是视频集,标注出目标所在的视频帧范围、在帧上的空间坐标点;具体的,标注后会将目标的信息保存在标注文档中,保存的信息有:目标类别、目标出现开始帧、目标出现结束帧、目标在图像帧中位置的左上角坐标(x,y)、标注矩形的宽W和高H和视频名称。如果是图片集,标注出目标所在图片的空间坐标点;具体的,标注后会将目标的信息保存在标注文档中,保存的信息有:目标类别、目标在图像帧中位置的左上角坐标(x,y)、标注矩形的宽W和高H和图片名称。
粗采集过程:
3.根据上述标注文档中的目标信息,利用自制的切割工具从原始数据集中切割目标,实现目标样本的粗采集,得到的正样本形成“正样本集”。
4.依然利用上述标注文档,从原始数据集中切割不含目标的部分图片作为负样本,形成“负样本集”。
精采集过程:
5.用上一步得到的正样本集和负样本集进行训练,得到目标检测器和区分正、负样本的阈值。在训练目标检测器的过程中,通过数据统计得到该阈值。
6.利用得到的目标检测器,对原始数据集进行检测。
7.在检测过程中为所有得到的目标打分数,并按分数高低进行排序。
8.将原始数据集中检测到的目标切割下来,形成检测所得正样本集;
9.监督检测所得正样本集,其中分数低于步骤5中所得阈值的样本为负样本,将其移入负样本集中,剩下的分数高于阈值的样本即为正样本,用于更新正样本集;否则直接用检测所得正样本集更新正样本集。
10.从原始视频集中切割不含目标的图片作为负样本集。
11.返回步骤5,进行迭代,直到样本数量达到预设数量或检测器性能达到预设标准为止。
12.最终形成的正样本集和负样本集即可用于机器学习中大规模的数据训练,比如识别器的训练。
如图2所示,一种基于分级迭代的大规模图像样本标注系统,包括标注模块1、粗采集模块2、目标检测器生成模块3、精采集模块4和迭代控制模块5;所述标注模块,用于利用半自动软件工具标注原始数据集中的目标;所述粗采集模块,用于对已标注的原始数据集进行粗采集,得到正样本集和负样本集;所述目标检测器生成模块,用于利用正样本集和负样本集进行训练,得到目标检测器;所述精采集模块,用于利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;所述迭代控制模块,用于判断正样本集中样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到控制目标检测器生成模块和精采集模块迭代,直至满足预设数量或预设标准。
所述标注模块1对目标在原始数据集中出现的时间和位置进行标注,将目标信息保存在标注文档中。
所述粗采集模块2包括第一切割单元21和第二切割单元22:所述第一切割单元21,用于从已标注的原始数据集中切割目标,得到的正样本形成一次正样本集;所述第二切割单元22,用于从原始数据集中切割不含目标的图片作为负样本集。
所述精采集模块4包括检测单元41、第三切割单元42和第四切割单元43;所述检测单元41,利用检测器对原始数据集进行检测;所述第三切割单元42,用于将原始数据集中检测到的目标切割下来,更新正样本集;所述第四切割单元43,从原始数据集中切割不含目标的图片,更新负样本集。
所述精采集模块4还包括排序单元44和监督单元45;所述排序单元44,用于在检测器对原始数据集进行检测过程中,为所有得到的目标打分,并按分数高低进行排序;所述监督单元45,用于将原始数据集中检测到的目标切割下来得到检测所得正样本集,检测所述检测所得正样本集中是否存在分数低于阈值的样本,如果存在,将其作为负样本移入负样本集,剩下的分数高于阈值的样本即为正样本,用于更新正样本集,否则直接用检测所得正样本集更新正样本集。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于分级迭代的大规模图像样本标注方法,其特征在于,包括如下步骤:
步骤1,利用半自动软件工具标注原始数据集中的目标;步骤1对目标在原始数据集中出现的时间和位置进行标注,将目标信息保存在标注文档中;
步骤2,对已标注的原始数据集进行粗采集,得到正样本集和负样本集;
步骤2中对已标注的原始数据集进行粗采集,得到正样本集和负样本集的具体操作为:
步骤2.1,根据目标信息从已标注的原始数据集中切割目标,得到的正样本形成一次正样本集;
步骤2.2,从原始数据集中切割不含目标的图片作为负样本集;
步骤3,利用正样本集和负样本集进行训练,得到目标检测器;
步骤4,利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;
步骤4中利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集的具体操作为:
步骤4.1,利用检测器对原始数据集进行检测;
步骤4.2,将原始数据集中检测到的目标切割下来,更新正样本集;
步骤4.3,从原始数据集中切割不含目标的图片,更新负样本集;
步骤5,判断正样本集中的样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到,返回步骤3,否则结束迭代。
2.根据权利要求1所述一种基于分级迭代的大规模图像样本标注方法,其特征在于,还包括利用检测器对原始数据集进行检测过程中,为所有得到的目标打分,并按分数高低进行排序;步骤4.2中将原始数据集中检测到的目标切割下来得到检测所得正样本集,检测所述检测所得正样本集中是否存在分数低于阈值的样本,如果存在,将其作为负样本移入负样本集,剩下的分数高于阈值的样本即为正样本,用于更新正样本集,否则直接用检测所得正样本集更新正样本集。
3.一种基于分级迭代的大规模图像样本标注系统,其特征在于,包括标注模块、粗采集模块、目标检测器生成模块、精采集模块和迭代控制模块;
所述标注模块,用于利用半自动软件工具标注原始数据集中的目标;所述标注模块对目标在原始数据集中出现的时间和位置进行标注,将目标信息保存在标注文档中;
所述粗采集模块,用于对已标注的原始数据集进行粗采集,得到正样本集和负样本集;所述粗采集模块包括第一切割单元和第二切割单元:
所述第一切割单元,用于根据目标信息从已标注的原始数据集中切割目标,得到的正样本形成一次正样本集;
所述第二切割单元,用于从原始数据集中切割不含目标的图片作为负样本集
所述目标检测器生成模块,用于利用正样本集和负样本集进行训练,得到目标检测器;
所述精采集模块,用于利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;
所述精采集模块包括检测单元、第三切割单元和第四切割单元;
所述检测单元,利用检测器对原始数据集进行检测;
所述第三切割单元,用于将原始数据集中检测到的目标切割下来,更新正样本集;
所述第四切割单元,从原始数据集中切割不含目标的图片,更新负样本集;
所述迭代控制模块,用于判断正样本集中样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到控制目标检测器生成模块和精采集模块迭代,直至满足预设数量或预设标准。
4.根据权利要求3所述一种基于分级迭代的大规模图像样本标注系统,其特征在于,所述精采集模块还包括排序单元和监督单元;
所述排序单元,用于在检测器对原始数据集进行检测过程中,为所有得到的目标打分,并按分数高低进行排序;
所述监督单元,用于将原始数据集中检测到的目标切割下来得到检测所得正样本集,检测所述检测所得正样本集中是否存在分数低于阈值的样本,如果存在,将其作为负样本移入负样本集,剩下的分数高于阈值的样本即为正样本,用于更新正样本集,否则直接用检测所得正样本集更新正样本集。
CN201510226393.2A 2015-05-06 2015-05-06 一种基于分级迭代的大规模图像样本标注方法及系统 Active CN104850832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510226393.2A CN104850832B (zh) 2015-05-06 2015-05-06 一种基于分级迭代的大规模图像样本标注方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510226393.2A CN104850832B (zh) 2015-05-06 2015-05-06 一种基于分级迭代的大规模图像样本标注方法及系统

Publications (2)

Publication Number Publication Date
CN104850832A CN104850832A (zh) 2015-08-19
CN104850832B true CN104850832B (zh) 2018-10-30

Family

ID=53850467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510226393.2A Active CN104850832B (zh) 2015-05-06 2015-05-06 一种基于分级迭代的大规模图像样本标注方法及系统

Country Status (1)

Country Link
CN (1) CN104850832B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022300B (zh) * 2016-06-02 2019-07-05 中国科学院信息工程研究所 基于级联深度学习的交通标志识别方法和系统
CN110019770A (zh) 2017-07-24 2019-07-16 华为技术有限公司 训练分类模型的方法与装置
CN108875769A (zh) * 2018-01-23 2018-11-23 北京迈格威科技有限公司 数据标注方法、装置和系统及存储介质
CN108537129B (zh) * 2018-03-14 2021-01-08 北京影谱科技股份有限公司 训练样本的标注方法、装置和系统
CN108874900A (zh) * 2018-05-24 2018-11-23 四川斐讯信息技术有限公司 一种样本图片数据集合的获取方法和系统
CN108830332A (zh) * 2018-06-22 2018-11-16 安徽江淮汽车集团股份有限公司 一种视觉车辆检测方法及系统
CN110288019A (zh) * 2019-06-21 2019-09-27 北京百度网讯科技有限公司 图像标注方法、装置和存储介质
CN110413821A (zh) * 2019-07-31 2019-11-05 四川长虹电器股份有限公司 数据标注方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010062268A1 (en) * 2008-11-28 2010-06-03 Agency For Science, Technology And Research A method for updating a 2 dimensional linear discriminant analysis (2dlda) classifier engine
CN102722719A (zh) * 2012-05-25 2012-10-10 西安电子科技大学 基于观察学习的入侵检测方法
CN103530604A (zh) * 2013-09-27 2014-01-22 中国人民解放军空军工程大学 一种基于直推的鲁棒视觉跟踪方法
CN103559237A (zh) * 2013-10-25 2014-02-05 南京大学 基于目标跟踪的半自动图像标注样本生成方法
CN103793702A (zh) * 2014-02-28 2014-05-14 武汉大学 基于协同尺度学习的行人重识别方法
CN104318242A (zh) * 2014-10-08 2015-01-28 中国人民解放军空军工程大学 一种高效的svm主动半监督学习算法
CN104504393A (zh) * 2014-12-04 2015-04-08 西安电子科技大学 基于集成学习的极化sar图像半监督分类方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010062268A1 (en) * 2008-11-28 2010-06-03 Agency For Science, Technology And Research A method for updating a 2 dimensional linear discriminant analysis (2dlda) classifier engine
CN102722719A (zh) * 2012-05-25 2012-10-10 西安电子科技大学 基于观察学习的入侵检测方法
CN103530604A (zh) * 2013-09-27 2014-01-22 中国人民解放军空军工程大学 一种基于直推的鲁棒视觉跟踪方法
CN103559237A (zh) * 2013-10-25 2014-02-05 南京大学 基于目标跟踪的半自动图像标注样本生成方法
CN103793702A (zh) * 2014-02-28 2014-05-14 武汉大学 基于协同尺度学习的行人重识别方法
CN104318242A (zh) * 2014-10-08 2015-01-28 中国人民解放军空军工程大学 一种高效的svm主动半监督学习算法
CN104504393A (zh) * 2014-12-04 2015-04-08 西安电子科技大学 基于集成学习的极化sar图像半监督分类方法

Also Published As

Publication number Publication date
CN104850832A (zh) 2015-08-19

Similar Documents

Publication Publication Date Title
CN104850832B (zh) 一种基于分级迭代的大规模图像样本标注方法及系统
CN103824053B (zh) 一种人脸图像的性别标注方法及人脸性别检测方法
US20230281265A1 (en) Method for estimating body size and weight of pig based on deep learning
CN110796011B (zh) 一种基于深度学习的稻穗识别方法、系统、装置及介质
CN111080622A (zh) 神经网络训练方法、工件表面缺陷分类与检测方法及装置
CN102509085A (zh) 基于轮廓不变矩特征的猪行走姿态识别系统和方法
CN108182423A (zh) 一种基于深度卷积神经网络的禽类动物行为识别方法
CN105631458B (zh) 一种电子元件样本标注方法及装置
CN109767443A (zh) 一种布料瑕疵数据收集方法及装置
CN116048082A (zh) 一种基于无人机识别的名优茶自动采摘控制系统及方法
CN107424150A (zh) 一种基于卷积神经网络的道路破损检测方法及装置
CN104658015B (zh) 玉米育种激光自动切片的视觉定位方法
CN113408407A (zh) 电子地图车道线修正方法、设备及计算机可读存储介质
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
CN111462058A (zh) 一种水稻有效穗快速检测方法
CN103279760A (zh) 一种植物检疫幼虫实时分类方法
CN114120094A (zh) 一种基于人工智能的水污染识别方法及系统
CN110197483A (zh) 基于视频信号的深基坑裂缝检测方法
CN106996785A (zh) 一种对导航数据进行更新的方法及装置
CN114708519A (zh) 一种基于无人机遥感的麋鹿识别与形态轮廓参数提取方法
CN113793385A (zh) 鱼头鱼尾定位方法及装置
CN107516329B (zh) 一种减速机油孔定位方法
CN107426488A (zh) 肉鸡跛行自动监测方法及装置
CN102680488A (zh) 一种基于pca的块状农产品在线识别装置及方法
CN113158965A (zh) 一种实现海漂垃圾识别的仿视觉识别方法、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant