CN109697468B - 样本图像的标注方法、装置及存储介质 - Google Patents

样本图像的标注方法、装置及存储介质 Download PDF

Info

Publication number
CN109697468B
CN109697468B CN201811584044.8A CN201811584044A CN109697468B CN 109697468 B CN109697468 B CN 109697468B CN 201811584044 A CN201811584044 A CN 201811584044A CN 109697468 B CN109697468 B CN 109697468B
Authority
CN
China
Prior art keywords
sample images
sample
labeled
image
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811584044.8A
Other languages
English (en)
Other versions
CN109697468A (zh
Inventor
杨秀平
邹文艺
晋兆龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Keda Technology Co Ltd
Original Assignee
Suzhou Keda Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Keda Technology Co Ltd filed Critical Suzhou Keda Technology Co Ltd
Priority to CN201811584044.8A priority Critical patent/CN109697468B/zh
Publication of CN109697468A publication Critical patent/CN109697468A/zh
Application granted granted Critical
Publication of CN109697468B publication Critical patent/CN109697468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本申请涉及一种样本图像的标注方法、装置及存储介质,属于图像处理技术领域,该方法包括:将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;对象检测模型是根据已有标注图像集训练得到的;对待标注的样本图像进行标注得到新增标注图像集,并将新增标注图像集添加至已有标注图像集中;可以解决对所有样本图像均进行标注时,对相似的样本图像重复标注浪费设备资源的问题;可以减少需要进行标注的样本图像的数量,节省设备资源。

Description

样本图像的标注方法、装置及存储介质
技术领域
本申请涉及样本图像的标注方法、装置及存储介质,属于图像处理技术领域。
背景技术
随着人工智能技术的发展,神经网络的应用越来越广泛,比如:神经网络应用在图像识别领域等。神经网络模型在使用前需要进行训练,以用于图像识别的神经网络模型为例,训练的方式包括:将大量的样本图像输入未训练的神经网络模型;然后将该神经网络模型的输出结果与该样本图像的标注信息进行比较;根据比较结果对神经网络模型中的网络参数进行迭代更新,得到用于进行图像识别的神经网络模型。
根据上述过程可知,在对神经网络模型之前需要从海量的视频或图像数据中采集到训练神经网络模型需要的样本图像,并对该样本图像进行标注。
申请号为201510226393.2的发明专利《一种基于分级迭代的大规模图像样本标注方法及系统》公开了一种图像的标注方法,该方法包括:利用半自动软件工具标注原始数据集中的目标;对已标注的原始数据集进行粗采集,得到正样本集和负样本集;利用正样本集和负样本集进行训练,得到目标检测器;利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集;判断正样本集中的样本数量是否达到预设数量或检测器性能是否达到预设标准,如果未达到,再次利用目标检测器对原始数据集进行精采集,更新正样本集和负样本集,否则结束迭。
然而,在样本图像的数量较多时,按照上述方法对每张样本图像进行标记需要消耗大量的资源,而海量的样本图像中通常会包括一些相似的图像,此时,对相似的图像进行标注会浪费设备的资源。
发明内容
本申请提供了一种样本图像的标注方法、装置及存储介质,可以解决对所有样本图像均进行标注时,对相似的样本图像重复标注浪费设备资源的问题。本申请提供如下技术方案:
第一方面,提供了一种样本图像的标注方法,所述方法包括:
将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;所述对象检测模型用于检测所述样本图像中的目标对象,所述n为正整数;
从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,所述筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;所述对象检测模型是根据所述已有标注图像集训练得到的;
对所述待标注的样本图像进行标注得到新增标注图像集,并将所述新增标注图像集添加至已有标注图像集中;所述新增标注图像集包括所述待标注的样本图像以及每张待标注的样本图像的标注信息。
可选地,所述检测结果包括从所述样本图像中检测出所述目标对象和未检测出所述目标对象,所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,包括:
从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像,得到所述待标注的样本图像,所述m为小于或等于所述n的正整数。
可选地,所述检测结果还包括在从所述样本图像中检测出所述目标对象时所述目标对象在所述样本图像中的对象区域和所述目标对象的质量得分;
所述从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像之后,还包括:
从检测结果为检测到所述目标对象的n-m张样本图像中确定所述目标对象的对象区域不符合预设区域标准,且所述目标对象的质量得分小于预设得分阈值的k张样本图像,将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像。
可选地,所述将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像之后,还包括:
确定所述待标注的样本图像的数量是否大于或等于第一数量;
在所述待标注的样本图像的数量大于或等于所述第一数量时,减小所述预设得分阈值,增大所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤。
可选地,所述将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像之后,还包括:
确定所述待标注的样本图像的数量是否小于或等于第二数量;
在所述待标注的样本图像的数量小于或等于所述第二数量时,增大所述预设得分阈值,减小所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤。
可选地,所述对所述待标注的样本图像进行标注得到新增标注图像集之后,包括:
使用所述新增标注图像集对所述对象检测模型进行训练,得到更新后的对象检测模型;
其中,所述更新后的对象检测模型用于对后续输入的样本图像进行检测,以确定出与添加了所述新增标注图像集后的已有标注图像集不同的其它样本图像。
可选地,所述对所述待标注的样本图像进行标注得到新增标注图像集,包括:
使用标注工具对所述待标注的样本图像进行标注;和/或,
获取人工输入的所述待标注的样本图像的标注信息。
第二方面,提供了一种样本图像的标注装置,所述装置包括:
图像检测模块,用于将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;所述对象检测模型用于检测所述样本图像中的目标对象,所述n为正整数;
图像筛选模块,用于从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,所述筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;所述对象检测模型是根据所述已有标注图像集训练得到的;
图像标注模块,用于对所述待标注的样本图像进行标注得到新增标注图像集,并将所述新增标注图像集添加至已有标注图像集中;所述新增标注图像集包括所述待标注的样本图像以及每张待标注的样本图像的标注信息。
第三方面,提供一种样本图像的标注装置,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的样本图像的标注方法。
第四方面,提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的样本图像的标注方法。
本申请的有益效果在于:通过将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;对象检测模型是根据已有标注图像集训练得到的;对待标注的样本图像进行标注得到新增标注图像集,并将新增标注图像集添加至已有标注图像集中;可以解决对所有样本图像均进行标注时,对相似的样本图像重复标注浪费设备资源的问题;由于在对样本图像进行标注之前,会对样本图像进行筛选得到与已有标注图像中的样本图像不同的其它图像,这样可以删除无法提高已有标注图像集的丰富性的冗余样本图像,从而减少需要进行标注的样本图像的数量,节省设备资源。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
图1是本申请一个实施例提供的样本图像的标注方法的流程图;
图2是本申请另一个实施例提供的样本图像的标注方法的流程图;
图3是本申请一个实施例提供的样本图像的标注装置的框图;
图4是本申请一个实施例提供的样本图像的标注装置的框图。
具体实施方式
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
本申请中,以各个实施例中每个步骤的执行主体为电子设备为例进行说明,该电子设备可以是终端,比如:计算机、手机、平板电脑等具有处理能力的终端;或者,也可以是服务器,本实施例不对电子设备的类型作限定。
图1是本申请一个实施例提供的样本图像的标注方法的流程图。该方法至少包括以下几个步骤:
步骤101,将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果。n为正整数。
其中,n的取值通常较大,比如:成千上万等,此时,对每张样本图像均进行标注会消耗大量的资源。
对象检测模型用于检测样本图像中的目标对象,该对象检测模型是根据已有标注图像集训练得到的。其中,已有标注图像集包括多张样本图像和每张样本图像的标注信息。
本申请中,对象检测模型的检测结果是预测的标注信息,该预测的标注信息不一定准确;而样本图像的标注信息是使用标注工具或者人工标记的,是准确的信息。
可选地,标注信息用于指示样本图像中目标对象的属性。根据已有标注图像集所训练的模型的应用场景不同,标注信息也有所不同,比如:已有标注图像集所训练的模型的应用场景为识别人脸,则标注信息包括但不限于:各个人脸在样本图像中的位置、旋转角度,和/或质量得分等;又比如:已有标注图像集所训练的模型的应用场景为识别车辆属性,则标注信息包括但不限于:车辆在样本图像中的位置、车身颜色、车牌、和/或驾驶员状态等。
由于对象检测模型根据已有标注图像集中的样本图像训练得到,因此,对于对象检测模型能够精确检测出目标对象的样本图像,该样本图像与已有标注图像集中的样本图像相同或者相似的概率较大,因此,若对这部分图像再次进行标注既不会提高标注图像集的多样性,还会浪费电子设备标注这部分图像时消耗的资源。基于此,本实施例中电子设备根据每张样本图像的检测结果筛选出对象检测模型无法精确检测出目标对象的样本图像,可以间接筛选出与已有标注图像集中的样本图像不同的其它样本图像。
可选地,对象检测模型可以是神经网络模型;或者,也可以是其它分类模型;目标对象包括但不限于:人脸、车辆、电子产品和家居产品中的至少一种,本实施例不对对象检测模型和目标对象的类型作限定。
步骤102,从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像。
筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像。
可选地,本实施例中筛选条件包括但不限于以下两种:第一种,筛选条件包括筛选出检测结果为未检测出目标对象的样本图像;第二种,筛选条件包括筛选出检测结果为未检测出目标对象的样本图像,还包括在检测结果为检测出目标对象的样本图像中,筛选出目标对象的对象区域不符合预设区域标准,且目标对象的质量得分小于预设得分阈值的样本图像。当然,筛选条件还包括其它条件,本实施例不对该筛选条件作限定。
其中,检测结果包括目标对象的对象区域,基于该对象区域可以确定出该对象区域的尺寸。比如:对象区域为(xmin,ymin,xmax,ymax),则对象区域的尺寸为长为xmax-xmin,宽为ymax-ymin。示意性地,对象区域标准为对象区域的尺寸小于预设尺寸,比如:对象区域为矩形,该对象区域的尺寸通过矩形的长和宽来表示;相应地,预设区域标准为对象区域的长小于长的阈值、或者对象区域的宽小于宽的阈值。当然,对象区域也可以为其它形状,比如:对象区域为圆形且对象区域的尺寸通过圆形的半径来表示;相应地,预设区域标准为对象区域的半径小于半径阈值等,本实施例不对对象区域的形状和对应的预设区域标准作限定。
检测结果包括目标对象的质量得分,该质量得分用于指示对象检测模型检测该目标对象的精确度。对象检测模型能够精确检测目标对象时,该目标对象的质量得分较高;对象检测模型无法精确检测目标对象时,该目标对象的质量得分较低。质量得分可以为0至1之间的数值,其中,1表示最高的质量得分,0表示最低的质量得分;或者,质量得分可以为0至100之间的数值,其中,100表示最高的质量得分,0表示最低的质量得分,本实施例不对质量得分的表示方式作限定。
对于上述两种筛选条件,下面分别对确定满足筛选条件的待标注的样本图像的方式进行介绍。
对于第一种筛选条件,检测结果包括从样本图像中检测出目标对象和未检测出目标对象。此时,从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,包括:从n张样本图像中确定检测结果为未检测出目标对象的m张样本图像,得到待标注的样本图像。此时,m张样本图像为待标注的样本图像。m为小于或等于n的正整数。
可选地,每张样本图像中可能存在多个目标对象,若检测结果指示样本图像中的目标对象的数量为0,则该样本图像为未检测出目标对象的样本图像。
对于第二种筛选条件,检测结果除了包括从样本图像中检测出目标对象和未检测出目标对象外,还包括在从样本图像中检测出目标对象时目标对象在样本图像中的对象区域和目标对象的质量得分。此时,从n张样本图像中确定检测结果为未检测出目标对象的m张样本图像之后,包括:从n张样本图像中确定检测结果为未检测出目标对象的m张样本图像;从检测结果为检测到目标对象的n-m张样本图像中确定目标对象的对象区域不符合预设区域标准,且目标对象的质量得分小于预设得分阈值的k张样本图像,将该m张样本图像和该k张样本图像确定为待标注的样本图像。
以对象区域为矩形,且预设区域标准为对象区域的尺寸小于预设尺寸为例,目标对象的对象区域不符合预设区域标准是指:目标对象的对象区域的长大于或等于长的阈值,且目标对象的对象区域的宽大于或等于宽的阈值。
可选地,对象检测模块的检测结果还可以包括其它信息,比如:样本图像的图像路径、目标对象的类别等,本实施例不对检测结果包括的内容作限定。检测结果中信息的种类与标注信息中信息的种类相同。
步骤103,对待标注的样本图像进行标注得到新增标注图像集,并将新增标注图像集添加至已有标注图像集中。
其中,新增标注图像集包括待标注的样本图像以及每张待标注的样本图像的标注信息。
可选地,对待标注的样本图像进行标注得到新增标注图像集,包括:使用标注工具对待标注的样本图像进行标注;和/或,获取人工输入的待标注的样本图像的标注信息。
可选地,本步骤之后,电子设备还可以使用新增标注图像集对对象检测模型进行训练,得到更新后的对象检测模型;其中,更新后的对象检测模型用于对后续输入的样本图像进行检测,以确定出与添加了新增标注图像集后的已有标注图像集不同的其它样本图像。当然,电子设备在使用新增标注图像集对对象检测模型进行训练时,还可以使用未添加该新增标注图像集时的已有标注图像集对对象检测模型进行训练,即,使用添加了新增标注图像集后的已有标注图像集对该对象检测模型进行训练。
综上所述,本实施例提供的样本图像的标注方法,通过将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;对象检测模型是根据已有标注图像集训练得到的;对待标注的样本图像进行标注得到新增标注图像集,并将新增标注图像集添加至已有标注图像集中;可以解决对所有样本图像均进行标注时,对相似的样本图像重复标注浪费设备资源的问题;由于在对样本图像进行标注之前,会对样本图像进行筛选得到与已有标注图像中的样本图像不同的其它图像,这样可以删除无法提高已有标注图像集的丰富性的冗余样本图像,从而减少需要进行标注的样本图像的数量,节省设备资源。
另外,在对筛选出的待标注的样本图像进行标注时,使用自动标注与人工标注相结合的方式可以节省仅通过人工对样本图像进行标注时消耗的时间,提高图像的标注效率及准确性。
可选地,基于上述实施例,在步骤102中将m张样本图像和k张样本图像确定为待标注的样本图像之后,电子设备还会确定待标注的样本图像的数量是否大于或等于第一数量;在待标注的样本图像的数量大于或等于第一数量时,减小预设得分阈值,增大预设区域标准指示的区域尺寸,再次执行步骤102;在待标注的样本图像的数量小于第一数量时,不调整预设得分阈值和预设区域标准指示的区域尺寸,流程结束。
可选地,基于上述实施例,在步骤102中将m张样本图像和k张样本图像确定为待标注的样本图像之后,电子设备还会确定待标注的样本图像的数量是否小于或等于第二数量;在待标注的样本图像的数量小于或等于第二数量时,增大预设得分阈值,减小预设区域标准指示的区域尺寸,再次执行步骤102;在待标注的样本图像的数量大于第二数量时,不调整预设得分阈值和预设区域标准指示的区域尺寸,流程结束。第一数量大于第二数量。
可选地,结合上述两种调节筛选条件的方式,在待标注的样本图像的数量大于第二数量且小于第一数量时,不调整预设得分阈值和预设区域标准指示的区域尺寸,流程结束。
本申请不对第一数量和第二数量的取值作限定,比如:第一数量为200、第二数量为100等。
综上所述,本实施例中,通过在确定出的待标注的样本图像的数量大于或等于第一数量时设置更严格的筛选条件以减少待标注的样本图像;在确定出的待标注的样本图像的数量小于或等于第二数量时放宽筛选条件以筛选出更多的待标注的样本图像,使得筛选出的待标注的样本图像可以稳定在第一数量和第二数量范围内,电子设备不会为标注待标注的样本图像消耗过多的资源,任务量也不会过低,可以保证电子设备标注待标注的样本图像时的稳定性。
为了更清楚地理解本申请提供的样本图像的标注方法,下面对该方法举一个实例进行说明,在本实例中,以筛选条件包括筛选出检测结果为未检测出目标对象的样本图像,还包括在检测结果为检测出目标对象的样本图像中,筛选出目标对象的对象区域不符合预设区域标准,且目标对象的质量得分小于预设得分阈值的样本图像,对象区域为矩形,对象区域标准为对象区域的长小于长的阈值、或者对象区域的宽小于宽的阈值为例进行说明。图2是本申请一个实施例提供的样本图像的标注方法的流程图。该方法至少包括以下几个步骤:
步骤201,将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果。
本步骤的相关说明详见步骤101,本实施例在此不作赘述。
步骤202,从n张样本图像中确定检测结果为未检测出目标对象的m张样本图像。
步骤203,从检测结果为检测到目标对象的n-m张样本图像中,确定目标对象的对象区域的长大于等于长的阈值、宽大于或等于宽的阈值,且目标对象的质量得分小于预设得分阈值的k张样本图像。
步骤204,确定m+k的数量是否大于或等于第一数量,或者,小于或等于第二数量;在m+k的数量大于或等于第一数量时,执行步骤205;在m+k的数量小于或等于第二数量时,执行步骤206;在m+k的数量大于第二数量且小于第一数量时,执行步骤207。
步骤205,减小预设得分阈值,增大长的阈值和宽的阈值,再次执行步骤203。
步骤206,增大预设得分阈值,减小长的阈值和宽的阈值,再次执行步骤203。
步骤207,对m张样本图像和k张样本图像进行标注得到新增标注图像集,并将该新增标注图像集添加至已有标注图像集中。
综上所述,本实施例提供的样本图像的标注方法,通过将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;从n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;对象检测模型是根据已有标注图像集训练得到的;对待标注的样本图像进行标注得到新增标注图像集,并将新增标注图像集添加至已有标注图像集中;可以解决对所有样本图像均进行标注时,对相似的样本图像重复标注浪费设备资源的问题;由于在对样本图像进行标注之前,会对样本图像进行筛选得到与已有标注图像中的样本图像不同的其它图像,这样可以删除无法提高已有标注图像集的丰富性的冗余样本图像,从而减少需要进行标注的样本图像的数量,节省设备资源。
图3是本申请一个实施例提供的样本图像的标注装置的框图。该装置至少包括以下几个模块:图像检测模块310、图像筛选模块320和图像标注模块330。
图像检测模块310,用于将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;所述对象检测模型用于检测所述样本图像中的目标对象,所述n为正整数;
图像筛选模块320,用于从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,所述筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;所述对象检测模型是根据所述已有标注图像集训练得到的;
图像标注模块330,用于对所述待标注的样本图像进行标注得到新增标注图像集,并将所述新增标注图像集添加至已有标注图像集中;所述新增标注图像集包括所述待标注的样本图像以及每张待标注的样本图像的标注信息。
相关细节参考上述方法实施例。
需要说明的是:上述实施例中提供的样本图像的标注装置在进行样本图像的标注时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将样本图像的标注装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的样本图像的标注装置与样本图像的标注方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4是本申请一个实施例提供的样本图像的标注装置的框图,该装置可以是终端或者服务器等电子设备。该装置至少包括处理器401和存储器402。
处理器401可以包括一个或多个处理核心,比如:4核心处理器、4核心处理器等。处理器401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器401所执行以实现本申请中方法实施例提供的样本图像的标注方法。
在一些实施例中,样本图像的标注装置还可选包括有:外围设备接口和至少一个外围设备。处理器401、存储器402和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地,外围设备包括但不限于:射频电路、触摸显示屏、音频电路、和电源等。
当然,样本图像的标注装置还可以包括更少或更多的组件,本实施例对此不作限定。
可选地,本申请还提供有一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的样本图像的标注方法。
可选地,本申请还提供有一种计算机产品,该计算机产品包括计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的样本图像的标注方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种样本图像的标注方法,其特征在于,所述方法包括:
将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;所述对象检测模型用于检测所述样本图像中的目标对象,所述n为正整数;
从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,所述筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;所述对象检测模型是根据所述已有标注图像集训练得到的;
对所述待标注的样本图像进行标注得到新增标注图像集,并将所述新增标注图像集添加至已有标注图像集中;所述新增标注图像集包括所述待标注的样本图像以及每张待标注的样本图像的标注信息;
所述检测结果包括从所述样本图像中检测出所述目标对象和未检测出所述目标对象,所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,包括:
从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像,得到所述待标注的样本图像,所述m为小于或等于所述n的正整数;
所述检测结果还包括在从所述样本图像中检测出所述目标对象时所述目标对象在所述样本图像中的对象区域和所述目标对象的质量得分;
所述从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像之后,还包括:
从检测结果为检测到所述目标对象的n-m张样本图像中确定所述目标对象的对象区域不符合预设区域标准,且所述目标对象的质量得分小于预设得分阈值的k张样本图像,将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像;所述预设区域标准为所述对象区域的尺寸小于预设尺寸;所述将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像之后,还包括:
确定所述待标注的样本图像的数量是否大于或等于第一数量;
在所述待标注的样本图像的数量大于或等于所述第一数量时,减小所述预设得分阈值,增大所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤;
或者,确定所述待标注的样本图像的数量是否小于或等于第二数量;
在所述待标注的样本图像的数量小于或等于所述第二数量时,增大所述预设得分阈值,减小所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤。
2.根据权利要求1所述的方法,其特征在于,所述对所述待标注的样本图像进行标注得到新增标注图像集之后,包括:
使用所述新增标注图像集对所述对象检测模型进行训练,得到更新后的对象检测模型;
其中,所述更新后的对象检测模型用于对后续输入的样本图像进行检测,以确定出与添加了所述新增标注图像集后的已有标注图像集不同的其它样本图像。
3.根据权利要求1所述的方法,其特征在于,所述对所述待标注的样本图像进行标注得到新增标注图像集,包括:
使用标注工具对所述待标注的样本图像进行标注;和/或,
获取人工输入的所述待标注的样本图像的标注信息。
4.一种样本图像的标注装置,其特征在于,所述装置包括:
图像检测模块,用于将n张样本图像输入预设的对象检测模型,得到每张样本图像的检测结果;所述对象检测模型用于检测所述样本图像中的目标对象,所述n为正整数;
图像筛选模块,用于从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像,所述筛选条件用于筛选出与已有标注图像集中的样本图像不同的其它样本图像;所述对象检测模型是根据所述已有标注图像集训练得到的;
图像标注模块,用于对所述待标注的样本图像进行标注得到新增标注图像集,并将所述新增标注图像集添加至已有标注图像集中;所述新增标注图像集包括所述待标注的样本图像以及每张待标注的样本图像的标注信息;
所述检测结果包括从所述样本图像中检测出所述目标对象和未检测出所述目标对象,所述图像筛选模块,用于从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像,得到所述待标注的样本图像,所述m为小于或等于所述n的正整数;
所述检测结果还包括在从所述样本图像中检测出所述目标对象时所述目标对象在所述样本图像中的对象区域和所述目标对象的质量得分;所述图像筛选模块,还用于:
从所述n张样本图像中确定检测结果为未检测出所述目标对象的m张样本图像之后,从检测结果为检测到所述目标对象的n-m张样本图像中确定所述目标对象的对象区域不符合预设区域标准,且所述目标对象的质量得分小于预设得分阈值的k张样本图像,将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像;所述预设区域标准为所述对象区域的尺寸小于预设尺寸;
所述将所述m张样本图像和所述k张样本图像确定为所述待标注的样本图像之后,确定所述待标注的样本图像的数量是否大于或等于第一数量;
在所述待标注的样本图像的数量大于或等于所述第一数量时,减小所述预设得分阈值,增大所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤;
或者,确定所述待标注的样本图像的数量是否小于或等于第二数量;
在所述待标注的样本图像的数量小于或等于所述第二数量时,增大所述预设得分阈值,减小所述预设区域标准指示的区域尺寸,再次执行所述从所述n张样本图像中确定检测结果满足筛选条件的待标注的样本图像的步骤。
5.一种样本图像的标注装置,其特征在于,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如权利要求1至3任一项所述的样本图像的标注方法。
6.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序被处理器执行时用于实现如权利要求1至3任一项所述的样本图像的标注方法。
CN201811584044.8A 2018-12-24 2018-12-24 样本图像的标注方法、装置及存储介质 Active CN109697468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811584044.8A CN109697468B (zh) 2018-12-24 2018-12-24 样本图像的标注方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811584044.8A CN109697468B (zh) 2018-12-24 2018-12-24 样本图像的标注方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109697468A CN109697468A (zh) 2019-04-30
CN109697468B true CN109697468B (zh) 2021-08-06

Family

ID=66232771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811584044.8A Active CN109697468B (zh) 2018-12-24 2018-12-24 样本图像的标注方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109697468B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522854B (zh) * 2020-03-18 2023-08-01 大箴(杭州)科技有限公司 一种数据标注方法、装置、存储介质及计算机设备
CN111444945A (zh) * 2020-03-20 2020-07-24 北京每日优鲜电子商务有限公司 样本信息过滤方法、装置、计算机设备及存储介质
CN112883876A (zh) * 2021-02-24 2021-06-01 北京市商汤科技开发有限公司 室内行人检测的方法、装置、设备及计算机存储介质
CN113139477A (zh) * 2021-04-27 2021-07-20 北京市商汤科技开发有限公司 训练井盖检测模型的方法、装置、设备及计算机存储介质
CN113706448B (zh) * 2021-05-11 2022-07-12 腾讯医疗健康(深圳)有限公司 确定图像的方法、装置、设备及存储介质
CN114332452B (zh) * 2021-12-13 2023-05-02 南京行者易智能交通科技有限公司 一种针对目标检测或目标分割的图像标注结果的自动检测方法
WO2024087067A1 (zh) * 2022-10-26 2024-05-02 北京小米移动软件有限公司 图像标注方法及装置、神经网络训练方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258216A (zh) * 2013-05-15 2013-08-21 中国科学院自动化研究所 一种基于在线学习的局部可形变目标检测方法及其系统
CN105930832A (zh) * 2016-05-18 2016-09-07 成都芯软科技发展有限公司 一种身份识别系统及方法
US10262234B2 (en) * 2017-04-24 2019-04-16 Baidu Usa Llc Automatically collecting training data for object recognition with 3D lidar and localization
CN108171175B (zh) * 2017-12-29 2020-06-23 苏州科达科技股份有限公司 一种深度学习样本增强系统及其运行方法
CN108805258B (zh) * 2018-05-23 2021-10-12 北京图森智途科技有限公司 一种神经网络训练方法及其装置、计算机服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于判别模型与生成模型的层叠图像自动标注;柯逍 等;《模式识别与人工智能》;20110630;305-313 *

Also Published As

Publication number Publication date
CN109697468A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697468B (zh) 样本图像的标注方法、装置及存储介质
CN105320957B (zh) 分类器训练方法和装置
CN110517262B (zh) 目标检测方法、装置、设备及存储介质
US20210118140A1 (en) Deep model training method and apparatus, electronic device, and storage medium
US10915786B2 (en) Object detection and candidate filtering system
CN110889437B (zh) 一种图像处理方法、装置、电子设备及存储介质
WO2022000861A1 (zh) 图像篡改区域的定位方法、装置及存储介质
CN112949477B (zh) 基于图卷积神经网络的信息识别方法、装置及存储介质
CN114764768A (zh) 缺陷检测分类方法、装置、电子设备及存储介质
CN112668577A (zh) 大尺度图像中目标物体的检测方法、终端及装置
CN112507431A (zh) 基于bim模型的智能审图方法、装置及存储介质
US20220415019A1 (en) Method and apparatus for image classification
CN113705136A (zh) 一种集成电路自动化逻辑综合系统、方法、装置及介质
CN114443483A (zh) 人工智能系统的测试方法、装置、电子设备及介质
WO2018166499A1 (zh) 文本分类方法、设备和存储介质
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN113298822B (zh) 点云数据的选取方法及选取装置、设备、存储介质
CN115272682A (zh) 目标对象检测方法、目标检测模型的训练方法及电子设备
CN112699103A (zh) 基于数据预分析的数据规则探查方法及装置
CN114579136A (zh) 代码处理方法、装置、计算机设备和存储介质
CN111401383A (zh) 基于图像检测的目标框预估方法、系统、设备及介质
CN115147856B (zh) 一种表格信息提取的方法及电子设备
CN112399236B (zh) 一种视频查重方法、装置及电子设备
US20230094252A1 (en) Method and system for automatically annotating sensor data
CN111612095B (zh) 信息聚类方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant