CN113239950A - 标注方法、装置、电子设备及存储介质 - Google Patents
标注方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113239950A CN113239950A CN202110288654.9A CN202110288654A CN113239950A CN 113239950 A CN113239950 A CN 113239950A CN 202110288654 A CN202110288654 A CN 202110288654A CN 113239950 A CN113239950 A CN 113239950A
- Authority
- CN
- China
- Prior art keywords
- image
- labeled
- label
- group
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 47
- 238000013136 deep learning model Methods 0.000 claims abstract description 142
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000004044 response Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 101
- 238000001514 detection method Methods 0.000 claims description 21
- 238000013145 classification model Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 241000282472 Canis lupus familiaris Species 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000252229 Carassius auratus Species 0.000 description 2
- 241000251730 Chondrichthyes Species 0.000 description 2
- 241000252233 Cyprinus carpio Species 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 244000170916 Paeonia officinalis Species 0.000 description 1
- 235000006484 Paeonia officinalis Nutrition 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种标注方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取目标图像对应的深度学习模型;将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。可以利用深度学习模型得到第一标签组,由人工从第一标签组中选择第二标签组,将第二标签组作为目标图像的标签,实现半人工标注和半智能标注的功能,标注效率高。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及标注方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人工智能技术的不断进步,利用深度学习技术对图像进行分类在各种领域的需求愈发突出。而大量的训练数据是进行深度学习的前提,数据的质量决定了模型的上限,而训练数据产生离不开数据标注,数据标注作为机器学习工程中重要的一环,是构建AI金字塔的基础。
目前大量的标注工作需要使用人工完成,工作效率低下,人工成本高。
发明内容
本申请的目的在于提供标注方法、装置、电子设备及计算机可读存储介质,实现半人工标注和半智能标注的功能,标注效率高。
本申请的目的采用以下技术方案实现:
第一方面,本申请提供了一种标注方法,所述方法包括:获取目标图像对应的深度学习模型;将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。该技术方案的有益效果在于,可以将目标图像输入对应的深度学习模型,得到目标图像对应的置信度最高的第一标签组,利用深度学习模型得到第一标签组后,可以由人工从第一标签组中选择第二标签组,将第二标签组作为目标图像的标签,实现半人工标注和半智能标注的功能,标注效率高。
在一些可选的实施例中,所述获取目标图像对应的深度学习模型,包括:S1:获取训练数据集,所述训练数据集包括多个图像以及每个所述图像的标签信息;S2:根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型;S3:取i值为1;S4:针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集;S5:根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型;S6:检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并执行S4,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。该技术方案的有益效果在于,可以根据训练数据集对预设深度模型进行训练,得到第一模型,以第一模型为基础,对待标注图像进行预测,若满足相应的预设条件,可以将待标注图像及其标签信息放入训练数据集,利用更新后的训练数据集对当前模型进行训练,得到新的模型,一方面,通过不断更新训练数据集,可以由第i模型训练得到第i+1模型,实现模型迭代,深度学习模型的预测准确率会逐渐提升;另一方面,可以判断第i+1模型是否满足结束迭代条件,若第i+1模型不满足结束迭代条件,可以继续对i+1模型进行训练,直到满足结束迭代条件,若第i+1模型满足结束迭代条件,可以将其作为目标图像对应的深度学习模型,用于对目标图像进行预测。
在一些可选的实施例中,所述第i预设条件包括以下至少一种:所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。该技术方案的有益效果在于,第i预设条件可以是当前待标注图像的所有标签中,置信度最高的标签的置信度大于第i预设置信度;第i预设条件还可以是按照从大到小的顺序对s1至sn进行排序,当前待标注图像的所有标签中,置信度最高的标签的置信度sk排在前bi%,无论当前待标注图像中置信度最高的标签的置信度sk是否大于第i预设置信度,均可以在集合A中选择出bi%的标签的置信度较高的待标注图像。
在一些可选的实施例中,所述结束迭代条件包括以下至少一种:未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;所述训练数据集中的图像数量不小于第二预设数量;i不小于预设数值;接收到结束迭代的操作。该技术方案的有益效果在于,一方面,当出现未被放入训练数据集的待标注图像的数量不大于第一预设数量、训练数据集中的图像数量不小于第二预设数量中的任意一种或两种情形时,训练数据集中的图像数量较多,当前模型的预测准确率较高,可以将当前模型作为目标图像对应的深度学习模型;一方面,当i不小于预设数值时,当前模型已经进行了多次迭代,其预测准确率较高;另一方面,可以人工选择结束迭代,将当前模型作为目标图像对应的深度学习模型。
在一些可选的实施例中,所述获取训练数据集,包括:检测是否存在给定深度学习模型;当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集;当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。该技术方案的有益效果在于,可以检测是否存在给定深度学习模型,一方面,若不存在,可以将已标注图像组及其标签信息放入训练数据集;另一方面,若存在,可以利用该给定深度学习模型对待标注图像进行预测,从待标注图像中选择部分图像及对应的标签信息放入训练数据集。在对待标注图像进行选择时,可以优先选择置信度较高的部分图像。
在一些可选的实施例中,所述获取已标注图像组及其标签信息,包括:接收标注操作,所述标注操作是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作;响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。该技术方案的有益效果在于,当不存在给定深度学习模型时,可以人工为待标注图像组中的待标注图像进行标注,得到新的已标注图像和对应的标签信息,从而将新的已标注图像和对应的标签信息放入训练数据集。
在一些可选的实施例中,所述获取目标图像对应的深度学习模型,包括:获取所述目标图像对应的类型标识;当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型;当检测不到所述类型标识对应的深度学习模型时,获取所述目标图像对应的深度学习模型的方法包括S1~S6。该技术方案的有益效果在于,可以根据目标图像对应的类型标识判断是否存在该类型标识对应的深度学习模型,若存在,可以直接利用对应的深度学习模型对目标图像进行预测,若不存在,可以根据S1~S6的方法获取目标图像对应的深度学习模型,利用该模型对目标图像进行预测。
在一些可选的实施例中,所述目标图像对应的深度学习模型用于图像检测,所述方法还包括:接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作;响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。该技术方案的有益效果在于,允许用户在当前图像中划选第一边界框,从而在当前图像中获取位于第一边界框内的目标图像。
在一些可选的实施例中,所述获取目标图像对应的深度学习模型,包括:将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个;针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。该技术方案的有益效果在于,可以利用图像检测模型得到当前图像对应的第三标签组以及每个标签对应的边界框,根据当前图像及每个标签对应的边界框,获取每个边界框对应的目标图像,将每个标签对应的图像分类模型作为对应的深度学习模型,对相应的目标图像进行预测。
在一些可选的实施例中,所述将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,包括:将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;所述方法还包括:根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。该技术方案的有益效果在于,利用目标图像对应的深度学习模型可以得到置信度最高的第一标签组以及第一标签组中每个标签的置信度,当从第一标签组中筛选出第二标签组时,可以直接由第一标签组中的每个标签的置信度得到对应的第二标签组中每个标签的置信度,从而得到目标图像的对应标签的置信度。
第二方面,本申请提供了一种标注装置,所述装置包括:模型获取模块,用于获取目标图像对应的深度学习模型;图像输入模块,用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;第一操作模块,用于接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;标签确定模块,用于响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。
在一些可选的实施例中,所述模型获取模块包括:初始子模块,用于获取训练数据集,所述训练数据集包括多个图像以及每个所述图像的标签信息;第一模型子模块,用于根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型;取值子模块,用于取i值为1;待标注子模块,用于针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集;模型迭代子模块,用于根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型;迭代检测子模块,用于检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并调用所述待标注单元,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。
在一些可选的实施例中,所述第i预设条件包括以下至少一种:所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。
在一些可选的实施例中,所述结束迭代条件包括以下至少一种:未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;所述训练数据集中的图像数量不小于第二预设数量;i不小于预设数值;接收到结束迭代的操作。
在一些可选的实施例中,所述初始子模块包括:给定检测单元,用于检测是否存在给定深度学习模型;第一获取单元,用于当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集;第二获取单元,用于当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。
在一些可选的实施例中,所述第一获取单元包括:操作接收子单元,用于接收标注操作,所述标注操作是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作;图像移动子单元,用于响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。
在一些可选的实施例中,所述模型获取模块包括:类型获取子模块,用于获取所述目标图像对应的类型标识;模型确定子模块,用于当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型;模块调用子模块,用于当检测不到所述类型标识对应的深度学习模型时,调用所述模型获取模块以获取所述目标图像对应的深度学习模型。
在一些可选的实施例中,所述目标图像对应的深度学习模型用于图像检测,所述装置还包括:第二操作模块,用于接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作;图像获取模块,用于响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。
在一些可选的实施例中,所述模型获取模块包括:一级模型子模块,用于将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个;二级模型子模块,用于针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。
在一些可选的实施例中,所述图像输入模块用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;所述装置还包括:置信度模块,用于根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。
第三方面,本申请提供了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法的步骤。
附图说明
下面结合附图和实施例对本申请进一步说明。
图1是本申请实施例提供的一种标注方法的流程示意图;
图2是本申请实施例提供的一种获取深度学习模型的流程示意图;
图3是本申请实施例提供的一种获取训练数据集的流程示意图;
图4是本申请实施例提供的一种获取已标注图像组及其标签信息的流程示意图;
图5是本申请实施例提供的一种获取深度学习模型的流程示意图;
图6是本申请实施例提供的一种标注方法的流程示意图;
图7是本申请实施例提供的一种获取深度学习模型的流程示意图;
图8是本申请实施例提供的一种标注方法的流程示意图;
图9是本申请实施例提供的一种标注装置的结构示意图;
图10是本申请实施例提供的一种模型获取模块的结构示意图;
图11是本申请实施例提供的一种初始子模块的结构示意图;
图12是本申请实施例提供的一种第一获取单元的结构示意图;
图13是本申请实施例提供的一种模型获取模块的结构示意图;
图14是本申请实施例提供的一种标注装置的结构示意图;
图15是本申请实施例提供的一种模型获取模块的结构示意图;
图16是本申请实施例提供的一种标注装置的结构示意图;
图17是本申请实施例提供的一种电子设备的结构框图;
图18是本申请实施例提供的一种用于实现标注方法的程序产品的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本申请做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
参见图1,本申请实施例提供了一种标注方法,所述方法可以包括步骤S101~S104。
步骤S101:获取目标图像对应的深度学习模型。
参见图2,在一具体实施方式中,所述步骤S101可以包括步骤S1~S6。
步骤S1:获取训练数据集,所述训练数据集包括多个图像以及每个所述图像的标签信息。
参见图3,在一具体实施方式中,所述步骤S1可以包括步骤S201~S203。
步骤S201:检测是否存在给定深度学习模型。给定深度学习模型可以是目标图像的类型标识对应的深度学习模型,还可以是预先设定的深度学习模型,其中,类型标识可以是人工设置的自定义类别。例如在标注任务下发时,由管理员给定1000张图片及其对应的自定义类别,例如是鱼类,管理员还可以自定义标签供标注员进行标注,自定义标签例如是金鱼、鲤鱼、鲨鱼等。
步骤S202:当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集。
参见图4,在一具体实施方式中,所述步骤S202中所述获取已标注图像组及其标签信息的方法包括步骤S301~S302。
步骤S301:接收标注操作,所述标注操作是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作。
步骤S302:响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。
由此,当不存在给定深度学习模型时,可以人工为待标注图像组中的待标注图像进行标注,得到新的已标注图像和对应的标签信息,从而将新的已标注图像和对应的标签信息放入训练数据集。
步骤S203:当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。
由此,可以检测是否存在给定深度学习模型,一方面,若不存在,可以将已标注图像组及其标签信息放入训练数据集;另一方面,若存在,可以利用该给定深度学习模型对待标注图像进行预测,从待标注图像中选择部分图像及对应的标签信息放入训练数据集。在对待标注图像进行选择时,可以优先选择置信度较高的部分图像。
步骤S2:根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型。
步骤S3:取i值为1。
步骤S4:针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集。
在一具体实施方式中,所述第i预设条件可以包括以下至少一种:
所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;预设置信度可以是预先设定的置信度,第一预设置信度到第i预设置信度可以保持一致,第一预设置信度到第i预设置信度还可以不完全一致,第i预设置信度例如是95%;
将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。举例说明,n为1000,当前待标注图像是第567待标注图像,bi为30,b1到bi可以保持一致,还可以不完全一致,s1至s1000分别为0~100%之间的数值,s567为83%,对s1至s1000进行从大到小的排序后,s567排在前30%,则当前待标注图像满足第i预设条件。
由此,第i预设条件可以是当前待标注图像的所有标签中,置信度最高的标签的置信度大于第i预设置信度;第i预设条件还可以是按照从大到小的顺序对s1至sn进行排序,当前待标注图像的所有标签中,置信度最高的标签的置信度sk排在前bi%,无论当前待标注图像中置信度最高的标签的置信度sk是否大于第i预设置信度,均可以在集合A中选择出bi%的标签的置信度较高的待标注图像。
步骤S5:根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型。
步骤S6:检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并执行S4,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。
由此,可以根据训练数据集对预设深度模型进行训练,得到第一模型,以第一模型为基础,对待标注图像进行预测,若满足相应的预设条件,可以将待标注图像及其标签信息放入训练数据集,利用更新后的训练数据集对当前模型进行训练,得到新的模型,一方面,通过不断更新训练数据集,可以由第i模型训练得到第i+1模型,实现模型迭代,深度学习模型的预测准确率会逐渐提升;另一方面,可以判断第i+1模型是否满足结束迭代条件,若第i+1模型不满足结束迭代条件,可以继续对i+1模型进行训练,直到满足结束迭代条件,若第i+1模型满足结束迭代条件,可以将其作为目标图像对应的深度学习模型,用于目标图像进行预测。
在一具体实施方式中,所述结束迭代条件可以包括以下至少一种:未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;所述训练数据集中的图像数量不小于第二预设数量;i不小于预设数值;接收到结束迭代的操作。第一预设数量和第二预设数量可以是预先设定的数量,第一预设数量例如是10个或者0个,第二预设数量例如是800个或者1000个,预设数值可以是预先设定的数值预设数值例如是3、8、100。
由此,一方面,当出现未被放入训练数据集的待标注图像的数量不大于第一预设数量、训练数据集中的图像数量不小于第二预设数量中的任意一种或两种情形时,训练数据集中的图像数量较多,当前模型的预测准确率较高,可以将当前模型作为目标图像对应的深度学习模型;一方面,当i不小于预设数值时,当前模型已经进行了多次迭代,其预测准确率较高;另一方面,可以人工选择结束迭代,将当前模型作为目标图像对应的深度学习模型。
参见图5,在一具体实施方式中,所述步骤S101可以包括步骤S401~S403。
步骤S401:获取所述目标图像对应的类型标识。类型标识可以是动物、植物、建筑、汽车、人等第一类型,可以是鱼、花、草、树、兔子、老虎、男人、女人等第二类型,还可以是金鱼、鲤鱼、鲨鱼、牡丹花、柳树等第三类型。
步骤S402:当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型。
步骤S403:当检测不到所述类型标识对应的深度学习模型时,获取所述目标图像对应的深度学习模型的方法包括S1~S6。
由此,可以根据目标图像对应的类型标识判断是否存在该类型标识对应的深度学习模型,若存在,可以直接利用对应的深度学习模型对目标图像进行预测,若不存在,可以根据S1~S6的方法获取目标图像对应的深度学习模型,利用该模型对目标图像进行预测。
S102:将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个。
S103:接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个。其中,第二标签组中标签的数量可以是1个。
S104:响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。
由此,可以将目标图像输入对应的深度学习模型,得到目标图像对应的置信度最高的第一标签组,利用深度学习模型得到第一标签组后,可以由人工从第一标签组中选择第二标签组,将第二标签组作为目标图像的标签,实现半人工标注和半智能标注的功能,标注效率高。
参见图6,在一具体实施方式中,所述目标图像对应的深度学习模型可以用于图像检测,所述方法还可以包括步骤S105~S106。
步骤S105:接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作。第二操作可以由人工完成。
步骤S106:响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。
由此,允许用户在当前图像中划选第一边界框,从而在当前图像中获取位于第一边界框内的目标图像。
参见图7,在一具体实施方式中,所述步骤S101可以包括步骤S501~S502。
步骤S501:将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个。当前图像例如是包括房屋、人、车、交通灯的图像,第三标签组中的标签可以包括房屋、人、汽车、交通灯等。
步骤S502:针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。
举例说明,当前图像中有玫瑰花和柯基犬,将当前图像输入图像检测模型,得到花和狗两个标签及其对应的边界框,针对花这一标签及其边界框,确定边界框内的图像作为第一目标图像,获取花对应的花类图像分类模型作为第一目标图像对应的深度学习模型。将第一目标图像输入花类图像分类模型,可以得到置信度最高的玫瑰花这一标签。根据狗这一标签及其边界框确定第二目标图像,基于狗对应的犬类图像分类模型,得到置信度最高的柯基犬这一标签的方法与上述方法类似,此处不做赘述。
由此,可以利用图像检测模型得到当前图像对应的第三标签组以及每个标签对应的边界框,根据当前图像及每个标签对应的边界框,获取每个边界框对应的目标图像,将每个标签对应的图像分类模型作为对应的深度学习模型,对相应的目标图像进行预测。
参见图8,在一具体实施方式中,所述步骤S102可以包括:将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;
所述方法还可以包括步骤S107。
步骤S107:根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。
由此,利用目标图像对应的深度学习模型可以得到置信度最高的第一标签组以及第一标签组中每个标签的置信度,当从第一标签组中筛选出第二标签组时,可以直接由第一标签组中的每个标签的置信度得到对应的第二标签组中每个标签的置信度,从而得到目标图像的对应标签的置信度。
参见图9,本申请实施例还提供了一种标注装置,其具体实现方式与上述标注方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。
所述装置包括:模型获取模块11,用于获取目标图像对应的深度学习模型;图像输入模块12,用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;第一操作模块13,用于接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;标签确定模块14,用于响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。
参见图10,在一具体实施方式中,所述模型获取模块11可以包括:初始子模块111,可以用于获取训练数据集,所述训练数据集可以包括多个图像以及每个所述图像的标签信息;第一模型子模块112,可以用于根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型;取值子模块113,可以用于取i值为1;待标注子模块114,可以用于针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集;模型迭代子模块115,可以用于根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型;迭代检测子模块116,可以用于检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并调用所述待标注单元,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。
参见图11,在一具体实施方式中,所述初始子模块111可以包括:给定检测单元1111,可以用于检测是否存在给定深度学习模型;第一获取单元1112,可以用于当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集;第二获取单元1113,可以用于当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。
参见图12,在一具体实施方式中,所述第一获取单元1112可以包括:操作接收子单元1112a,可以用于接收标注操作,所述标注操作可以是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作;图像移动子单元1112b,可以用于响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。
参见图13,在一具体实施方式中,所述模型获取模块11可以包括:类型获取子模块201,可以用于获取所述目标图像对应的类型标识;模型确定子模块202,可以用于当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型;模块调用子模块203,可以用于当检测不到所述类型标识对应的深度学习模型时,调用所述模型获取模块11以获取所述目标图像对应的深度学习模型。
在一具体实施方式中,所述第i预设条件可以包括以下至少一种:所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。
在一具体实施方式中,所述结束迭代条件可以包括以下至少一种:未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;所述训练数据集中的图像数量不小于第二预设数量;i不小于预设数值;接收到结束迭代的操作。
参见图14,在一具体实施方式中,所述目标图像对应的深度学习模型可以用于图像检测,所述装置还可以包括:第二操作模块15,可以用于接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作;图像获取模块16,可以用于响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。
参见图15,在一具体实施方式中,所述模型获取模块11可以包括:一级模型子模块204,可以用于将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个;二级模型子模块205,可以用于针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。
参见图16,在一具体实施方式中,所述图像输入模块12可以用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;所述装置还可以包括:置信度模块17,可以用于根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。
参见图17,本申请实施例还提供了一种电子设备200,电子设备200包括至少一个存储器210、至少一个处理器220以及连接不同平台系统的总线230。
存储器210可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)211和/或高速缓存存储器212,还可以进一步包括只读存储器(ROM)213。
其中,存储器210还存储有计算机程序,计算机程序可以被处理器220执行,使得处理器220执行本申请实施例中标注方法的步骤,其具体实现方式与上述标注方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。
存储器210还可以包括具有一组(至少一个)程序模块215的程序/实用工具214,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
相应的,处理器220可以执行上述计算机程序,以及可以执行程序/实用工具214。
总线230可以为表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备240例如键盘、指向设备、蓝牙设备等通信,还可与一个或者多个能够与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/得到(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,所述计算机程序被执行时实现本申请实施例中标注方法的步骤,其具体实现方式与上述标注方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。
图18示出了本实施例提供的用于实现上述标注方法的程序产品300,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品300不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。程序产品300可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言诸如Java、C++等,还包括常规的过程式程序设计语言诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本申请从使用目的上,效能上,进步及新颖性等观点进行阐述,其设置有的实用进步性,已符合专利法所强调的功能增进及使用要件,本申请以上的说明及附图,仅为本申请的较佳实施例而已,并非以此局限本申请,因此,凡一切与本申请构造,装置,特征等近似、雷同的,即凡依本申请专利申请范围所作的等同替换或修饰等,皆应属本申请的专利申请保护的范围之内。
Claims (22)
1.一种标注方法,其特征在于,所述方法包括:
获取目标图像对应的深度学习模型;
将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;
接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;
响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。
2.根据权利要求1所述的标注方法,其特征在于,所述获取目标图像对应的深度学习模型,包括:
S1:获取训练数据集,所述训练数据集包括多个图像以及每个所述图像的标签信息;
S2:根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型;
S3:取i值为1;
S4:针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集;
S5:根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型;
S6:检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并执行S4,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。
3.根据权利要求2所述的标注方法,其特征在于,所述第i预设条件包括以下至少一种:
所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;
将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。
4.根据权利要求2所述的标注方法,其特征在于,所述结束迭代条件包括以下至少一种:
未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;
所述训练数据集中的图像数量不小于第二预设数量;
i不小于预设数值;
接收到结束迭代的操作。
5.根据权利要求2所述的标注方法,其特征在于,所述获取训练数据集,包括:
检测是否存在给定深度学习模型;
当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集;
当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。
6.根据权利要求5所述的模型训练方法,其特征在于,所述获取已标注图像组及其标签信息,包括:
接收标注操作,所述标注操作是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作;
响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。
7.根据权利要求2所述的标注方法,其特征在于,所述获取目标图像对应的深度学习模型,包括:
获取所述目标图像对应的类型标识;
当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型;
当检测不到所述类型标识对应的深度学习模型时,获取所述目标图像对应的深度学习模型的方法包括S1~S6。
8.根据权利要求1所述的标注方法,其特征在于,所述目标图像对应的深度学习模型用于图像检测,所述方法还包括:
接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作;
响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。
9.根据权利要求1所述的标注方法,其特征在于,所述获取目标图像对应的深度学习模型,包括:
将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个;
针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。
10.根据权利要求1所述的标注方法,其特征在于,所述将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,包括:
将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;
所述方法还包括:
根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。
11.一种标注装置,其特征在于,所述装置包括:
模型获取模块,用于获取目标图像对应的深度学习模型;
图像输入模块,用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组,所述第一标签组中标签的数量大于1个;
第一操作模块,用于接收第一操作,所述第一操作是从所述第一标签组中选择第二标签组的操作,所述第二标签组中标签的数量不小于1个;
标签确定模块,用于响应于所述第一操作,确定所述第二标签组作为所述目标图像的标签。
12.根据权利要求11所述的标注装置,其特征在于,所述模型获取模块包括:
初始子模块,用于获取训练数据集,所述训练数据集包括多个图像以及每个所述图像的标签信息;
第一模型子模块,用于根据所述训练数据集,对预设深度学习模型进行训练,得到第一模型;
取值子模块,用于取i值为1;
待标注子模块,用于针对待标注图像组中未被放入所述训练数据集的每个待标注图像执行以下处理:将所述待标注图像输入所述第i模型,得到所述待标注图像的标签信息,并检测所述待标注图像是否满足第i预设条件,若满足所述第i预设条件则将所述待标注图像及其标签信息放入所述训练数据集;
模型迭代子模块,用于根据更新后的训练数据集,对所述第i模型进行训练,得到第i+1模型;
迭代检测子模块,用于检测是否满足结束迭代条件,若不满足所述结束迭代条件则使i的值加一并调用所述待标注子模块,若满足所述结束迭代条件则确定所述第i+1模型作为所述目标图像对应的深度学习模型。
13.根据权利要求12所述的标注装置,其特征在于,所述第i预设条件包括以下至少一种:
所述待标注图像的所有标签中置信度最高的标签的置信度大于第i预设置信度;
将s1至sn按照从大到小的顺序进行排序,sk排在前bi%,其中,将所述待标注图像组中未被放入所述训练数据集的所有待标注图像记为集合A,所述集合A包括第一待标注图像至第n待标注图像,所述待标注图像是第k待标注图像,将第j待标注图像的所有标签中置信度最高的标签的置信度记为sj,n是所述集合A中所有待标注图像的数量,j和k均为不大于n的正整数,bi是小于100的正数。
14.根据权利要求12所述的标注装置,其特征在于,所述结束迭代条件包括以下至少一种:
未被放入所述训练数据集的待标注图像的数量不大于第一预设数量;
所述训练数据集中的图像数量不小于第二预设数量;
i不小于预设数值;
接收到结束迭代的操作。
15.根据权利要求12所述的标注装置,其特征在于,所述初始子模块包括:
给定检测单元,用于检测是否存在给定深度学习模型;
第一获取单元,用于当检测到不存在所述给定深度学习模型时,获取已标注图像组及其标签信息,将所述已标注图像组及其标签信息放入所述训练数据集;
第二获取单元,用于当检测到存在所述给定深度学习模型时,将所述待标注图像组中的所有待标注图像输入所述给定深度学习模型,得到所有待标注图像的标签信息,将所有待标注图像中的部分图像及其标签信息放入所述训练数据集。
16.根据权利要求15所述的标注装置,其特征在于,所述第一获取单元包括:
操作接收子单元,用于接收标注操作,所述标注操作是为所述待标注图像组中的其中一个待标注图像设置至少一个标签的操作;
图像移动子单元,用于响应于所述标注操作,从所述待标注图像组中取出所述待标注图像并放入所述已标注图像组作为新的已标注图像,并确定所设置的标签作为所述新的已标注图像的标签,得到所述新的已标注图像的标签信息。
17.根据权利要求12所述的标注装置,其特征在于,所述模型获取模块包括:
类型获取子模块,用于获取所述目标图像对应的类型标识;
模型确定子模块,用于当检测到所述类型标识对应的深度学习模型时,确定所述类型标识对应的深度学习模型作为所述目标图像对应的深度学习模型;
模块调用子模块,用于当检测不到所述类型标识对应的深度学习模型时,调用所述模型获取模块以获取所述目标图像对应的深度学习模型。
18.根据权利要求11所述的标注装置,其特征在于,所述目标图像对应的深度学习模型用于图像检测,所述装置还包括:
第二操作模块,用于接收第二操作,所述第二操作是在当前图像中划选第一边界框的操作;
图像获取模块,用于响应于所述第二操作,根据所述当前图像和所述第一边界框,获取所述目标图像。
19.根据权利要求11所述的标注装置,其特征在于,所述模型获取模块包括:
一级模型子模块,用于将当前图像输入图像检测模型,得到所述当前图像对应的第三标签组以及所述第三标签组中的每个所述标签对应的边界框,所述第三标签组中标签的数量不小于1个;
二级模型子模块,用于针对所述第三标签组中的每个所述标签,根据所述当前图像和所述标签的边界框,获取所述目标图像,并获取所述标签对应的图像分类模型作为所述目标图像对应的深度学习模型。
20.根据权利要求11所述的标注装置,其特征在于,所述图像输入模块用于将所述目标图像输入所述目标图像对应的深度学习模型,得到置信度最高的第一标签组以及所述第一标签组中每个所述标签的置信度;
所述装置还包括:
置信度模块,用于根据所述第一标签组中对应所述标签的置信度,获取所述第二标签组中每个所述标签的置信度作为所述目标图像的对应标签的置信度。
21.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1-10任一项所述方法的步骤。
22.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10任一项所述方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021100403125 | 2021-01-13 | ||
CN202110040312 | 2021-01-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113239950A true CN113239950A (zh) | 2021-08-10 |
Family
ID=77130358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110288654.9A Pending CN113239950A (zh) | 2021-01-13 | 2021-03-18 | 标注方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239950A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705687A (zh) * | 2021-08-30 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于人工智能的图像实例标注方法及相关设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120269436A1 (en) * | 2011-04-20 | 2012-10-25 | Xerox Corporation | Learning structured prediction models for interactive image labeling |
US8873867B1 (en) * | 2012-07-10 | 2014-10-28 | Google Inc. | Assigning labels to images |
US20180373980A1 (en) * | 2017-06-27 | 2018-12-27 | drive.ai Inc. | Method for training and refining an artificial intelligence |
CN109345515A (zh) * | 2018-09-17 | 2019-02-15 | 代黎明 | 样本标签置信度计算方法、装置、设备及模型训练方法 |
US20190073447A1 (en) * | 2017-09-06 | 2019-03-07 | International Business Machines Corporation | Iterative semi-automatic annotation for workload reduction in medical image labeling |
CN110765844A (zh) * | 2019-09-03 | 2020-02-07 | 华南理工大学 | 一种基于对抗学习的非感应式餐盘图像数据自动标注方法 |
CN111191732A (zh) * | 2020-01-03 | 2020-05-22 | 天津大学 | 一种基于全自动学习的目标检测方法 |
CN111680632A (zh) * | 2020-06-10 | 2020-09-18 | 深延科技(北京)有限公司 | 基于深度学习卷积神经网络的烟火检测方法及系统 |
CN111797653A (zh) * | 2019-04-09 | 2020-10-20 | 华为技术有限公司 | 基于高维图像的图像标注方法和装置 |
CN111898696A (zh) * | 2020-08-10 | 2020-11-06 | 腾讯云计算(长沙)有限责任公司 | 伪标签及标签预测模型的生成方法、装置、介质及设备 |
CN111899254A (zh) * | 2020-08-12 | 2020-11-06 | 华中科技大学 | 基于半监督学习自动标注工业产品外观缺陷图像的方法 |
-
2021
- 2021-03-18 CN CN202110288654.9A patent/CN113239950A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120269436A1 (en) * | 2011-04-20 | 2012-10-25 | Xerox Corporation | Learning structured prediction models for interactive image labeling |
US8873867B1 (en) * | 2012-07-10 | 2014-10-28 | Google Inc. | Assigning labels to images |
US20180373980A1 (en) * | 2017-06-27 | 2018-12-27 | drive.ai Inc. | Method for training and refining an artificial intelligence |
US20190073447A1 (en) * | 2017-09-06 | 2019-03-07 | International Business Machines Corporation | Iterative semi-automatic annotation for workload reduction in medical image labeling |
CN109345515A (zh) * | 2018-09-17 | 2019-02-15 | 代黎明 | 样本标签置信度计算方法、装置、设备及模型训练方法 |
CN111797653A (zh) * | 2019-04-09 | 2020-10-20 | 华为技术有限公司 | 基于高维图像的图像标注方法和装置 |
CN110765844A (zh) * | 2019-09-03 | 2020-02-07 | 华南理工大学 | 一种基于对抗学习的非感应式餐盘图像数据自动标注方法 |
CN111191732A (zh) * | 2020-01-03 | 2020-05-22 | 天津大学 | 一种基于全自动学习的目标检测方法 |
CN111680632A (zh) * | 2020-06-10 | 2020-09-18 | 深延科技(北京)有限公司 | 基于深度学习卷积神经网络的烟火检测方法及系统 |
CN111898696A (zh) * | 2020-08-10 | 2020-11-06 | 腾讯云计算(长沙)有限责任公司 | 伪标签及标签预测模型的生成方法、装置、介质及设备 |
CN111899254A (zh) * | 2020-08-12 | 2020-11-06 | 华中科技大学 | 基于半监督学习自动标注工业产品外观缺陷图像的方法 |
Non-Patent Citations (2)
Title |
---|
ZHIXIN LI 等: "Automatic Image Annotation based on Co-Training", 《2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN)》, 30 September 2019 (2019-09-30), pages 1 - 8 * |
林兰: "基于半监督学习的图像自动标注方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2019, 15 January 2019 (2019-01-15), pages 138 - 3982 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705687A (zh) * | 2021-08-30 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于人工智能的图像实例标注方法及相关设备 |
WO2023029348A1 (zh) * | 2021-08-30 | 2023-03-09 | 平安科技(深圳)有限公司 | 基于人工智能的图像实例标注方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113240125B (zh) | 模型训练方法及装置、标注方法及装置、设备及存储介质 | |
CN111695613B (zh) | 数据标注系统、计算机可读存储介质及电子设备 | |
CN113095434B (zh) | 目标检测方法及装置、电子设备、存储介质 | |
CN113379718A (zh) | 一种目标检测方法、装置、电子设备以及可读存储介质 | |
CN111859872A (zh) | 一种文本标注方法和装置 | |
CN110300191A (zh) | 服务系统及数据处理方法 | |
CN112508078B (zh) | 图像多任务多标签识别方法、系统、设备及介质 | |
CN110888582A (zh) | 标记信息处理方法、装置、存储介质和终端 | |
CN113435582B (zh) | 基于句向量预训练模型的文本处理方法及相关设备 | |
CN111291803B (zh) | 一种图像分级粒度迁移方法、系统、设备和介质 | |
CN112069498A (zh) | 一种sql注入检测模型构建方法及检测方法 | |
Vélez et al. | Choosing an Appropriate Platform and Workflow for Processing Camera Trap Data using Artificial Intelligence | |
CN113239950A (zh) | 标注方法、装置、电子设备及存储介质 | |
CN113850666A (zh) | 业务调度的方法、装置、设备及存储介质 | |
CN116311320A (zh) | 文本图像融合层的训练方法、文本图像识别方法及装置 | |
WO2023159778A1 (zh) | 结合rpa及ai的招标文档获取方法及装置 | |
CN112990131B (zh) | 获取电压转换开关工作档位的方法、装置、设备及介质 | |
CN113869353A (zh) | 模型训练方法、老虎关键点检测方法及相关装置 | |
Naticchia et al. | Augmented reality application supporting on-site secondary building assets management | |
CN113283345B (zh) | 板书书写行为检测方法、训练方法、装置、介质及设备 | |
CN113158844B (zh) | 一种船只监管方法、装置和电子设备 | |
CN110390101B (zh) | 实体合同备注的非标设计判断方法、装置及计算机设备 | |
CN117033318B (zh) | 一种待测数据的生成方法、装置、存储介质及电子设备 | |
WO2024088031A1 (zh) | 一种数据采集方法、装置及相关设备 | |
WO2021138783A1 (zh) | 数据处理方法及装置、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |