CN110807486A - 类别标签的生成方法、装置、电子设备及存储介质 - Google Patents

类别标签的生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110807486A
CN110807486A CN201911052428.XA CN201911052428A CN110807486A CN 110807486 A CN110807486 A CN 110807486A CN 201911052428 A CN201911052428 A CN 201911052428A CN 110807486 A CN110807486 A CN 110807486A
Authority
CN
China
Prior art keywords
target
image
images
image group
accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911052428.XA
Other languages
English (en)
Other versions
CN110807486B (zh
Inventor
张志伟
李焱
李岩
吴丽军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Reach Best Technology Co Ltd
Original Assignee
Reach Best Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Reach Best Technology Co Ltd filed Critical Reach Best Technology Co Ltd
Priority to CN201911052428.XA priority Critical patent/CN110807486B/zh
Publication of CN110807486A publication Critical patent/CN110807486A/zh
Application granted granted Critical
Publication of CN110807486B publication Critical patent/CN110807486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本公开是关于一种类别标签的生成方法、装置、电子设备及存储介质,属于计算机技术领域。方法包括:基于目标数量,从备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签,基于预设数量,从备选图像集合中选取参考图像组,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。该方法自动为目标图像生成第一类别标签,不需要进行人工标注,降低了成本,提高了生成效率。并且,通过调整目标数量,从备选图像集合中选取目标图像,提高了准确率。

Description

类别标签的生成方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种类别标签的生成方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的快速发展以及人工智能技术的逐渐成熟,图像分类模型广泛应用于人脸识别、活体检测等多种领域。图像分类模型具有目标类别,该图像分类模型的作用为划分出属于该目标类别的图像以及不属于该目标类别的图像这两类。因此,通常会选取属于目标类别的目标图像,为该目标图像生成第一类别标签,该第一类别标签表示该目标图像属于目标类别,后续会基于选取的目标图像训练图像分类模型。
相关技术中,技术人员获取到多个图像后,从该多个图像中选取属于目标类别的目标图像,为该目标图像标注第一类别标签,再基于目标图像及目标图像的第一类别标签训练图像分类模型。但是,上述方案需要技术人员人工为目标图像标注第一类别标签,耗费的人力成本较高,且生成效率较低。
发明内容
本公开提供了一种类别标签的生成方法、装置、电子设备及存储介质,能够克服相关技术中存在的由于需要人工为目标图像标注第一类别标签而导致的成本高和效率低下的问题。
根据本公开实施例的第一方面,提供一种类别标签的生成方法,所述方法包括:
基于目标数量,从备选图像集合中选取目标图像组,以使所述目标图像组中目标图像的数量等于所述目标数量,且所述目标图像组中目标图像的概率大于所述备选图像集合中除所述目标图像组之外的其他备选图像的概率,所述图像的概率为基于图像分类模型获取的所述图像属于目标类别的概率;
为所述目标图像组中的每个目标图像生成第一类别标签,所述第一类别标签用于表示对应的目标图像属于所述目标类别;
基于预设数量,从所述备选图像集合中选取参考图像组,所述参考图像组中参考图像的数量等于所述预设数量,且所述参考图像组中参考图像的概率大于所述备选图像集合中除所述目标图像组和所述参考图像组之外的其他备选图像的概率;
根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,所述类别标签用于表示对应的图像是否属于所述目标类别,所述第一准确率用于表示所述图像分类模型对所述参考图像组的分类准确率;
根据所述第一准确率,对所述目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为所述目标图像组中的每个目标图像生成所述第一类别标签。
在一种可能实现方式中,所述基于目标数量,从备选图像集合中选取目标图像组,包括:
按照所述备选图像集合中多个备选图像的概率从大到小的顺序,选取所述目标数量的备选图像,作为目标图像添加至所述目标图像组中。
在另一种可能实现方式中,所述基于预设数量,从所述备选图像集合中选取参考图像组,包括:
按照所述备选图像集合中剩余的多个备选图像的概率从大到小的顺序,选取所述预设数量的备选图像,作为参考图像添加至所述参考图像组中。
在另一种可能实现方式中,所述基于目标数量,从备选图像集合中选取目标图像组之前,所述方法还包括:
获取所述备选图像集合,所述备选图像集合中包括多个备选图像;
基于所述图像分类模型,分别获取所述多个备选图像的概率。
在另一种可能实现方式中,所述根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,包括:
获取为所述参考图像组中每个参考图像标注的类别标签,所述类别标签包括第一类别标签或第二类别标签中的至少一种,所述第二类别标签用于表示对应的图像不属于所述目标类别;
将获取到的所述第一类别标签的数量与所述预设数量的比例确定为所述第一准确率。
在另一种可能实现方式中,所述根据所述第一准确率,对所述目标数量进行调整,包括:
当所述第一准确率不小于预设准确率时,增加所述目标数量;或者,
当所述第一准确率小于所述预设准确率时,减小所述目标数量。
在另一种可能实现方式中,所述根据所述第一准确率,对所述目标数量进行调整,包括:
采用以下公式,对所述目标数量进行调整:
Figure BDA0002255644330000031
其中,为调整后的目标数量,
Figure BDA0002255644330000033
为所述目标数量,increasei为所述目标数量的调整幅度,accuracyi为所述第一准确率,σi为所述预设准确率。
在另一种可能实现方式中,所述对所述目标数量进行调整之前,所述根据所述第一准确率,对所述目标数量进行调整还包括:
采用以下公式,获取所述目标数量的调整幅度:
Figure BDA0002255644330000034
其中,
Figure BDA0002255644330000035
为所述目标数量的调整幅度,
Figure BDA0002255644330000036
为预设调整幅度,accuracyi为所述第一准确率,σi为所述预设准确率,k为所述目标数量的累计调整次数,1≤k≤K,K为预设最大调整次数。
根据本公开实施例的第二方面,提供一种类别标签生成装置,所述装置包括:
目标图像选取单元,被配置为基于目标数量,从备选图像集合中选取目标图像组,以使所述目标图像组中目标图像的数量等于所述目标数量,且所述目标图像组中目标图像的概率大于所述备选图像集合中除所述目标图像组之外的其他备选图像的概率,所述图像的概率为基于图像分类模型获取的所述图像属于目标类别的概率;
标签生成单元,被配置为为所述目标图像组中的每个目标图像生成第一类别标签,所述第一类别标签用于表示对应的目标图像属于所述目标类别;
参考图像选取单元,被配置为基于预设数量,从所述备选图像集合中选取参考图像组,所述参考图像组中参考图像的数量等于所述预设数量,且所述参考图像组中参考图像的概率大于所述备选图像集合中除所述目标图像组和所述参考图像组之外的其他备选图像的概率;
准确率获取单元,被配置为根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,所述类别标签用于表示对应的图像是否属于所述目标类别,所述第一准确率用于表示所述图像分类模型对所述参考图像组的分类准确率;
数量调整单元,被配置为根据所述第一准确率,对所述目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为所述目标图像组中的每个目标图像生成所述第一类别标签。
在一种可能实现方式中,所述目标图像选取单元,还被配置为按照所述备选图像集合中多个备选图像的概率从大到小的顺序,选取所述目标数量的备选图像,作为目标图像添加至所述目标图像组中。
在另一种可能实现方式中,所述参考图像选取单元,还被配置为按照所述备选图像集合中剩余的多个备选图像的概率从大到小的顺序,选取所述预设数量的备选图像,作为参考图像添加至所述参考图像组中。
在另一种可能实现方式中,所述目标图像选取单元,包括:
集合获取子单元,被配置为获取所述备选图像集合,所述备选图像集合中包括多个备选图像;
概率获取子单元,被配置为基于所述图像分类模型,分别获取所述多个备选图像的概率。
在另一种可能实现方式中,所述准确率获取单元,包括:
标签获取子单元,被配置为获取为所述参考图像组中每个参考图像标注的类别标签,所述类别标签包括第一类别标签或第二类别标签中的至少一种,所述第二类别标签用于表示对应的图像不属于所述目标类别;
准确率获取子单元,被配置为将获取到的所述第一类别标签的数量与所述预设数量的比例确定为所述第一准确率。
在另一种可能实现方式中,所述数量调整单元,包括:
数量增加子单元,被配置为当所述第一准确率不小于预设准确率时,增加所述目标数量;或者,
数量减少子单元,被配置为当所述第一准确率小于所述预设准确率时,减小所述目标数量。
在另一种可能实现方式中,所述数量调整单元,还被配置为采用以下公式,对所述目标数量进行调整:
其中,
Figure BDA0002255644330000052
为调整后的目标数量,
Figure BDA0002255644330000053
为所述目标数量,increasei为所述目标数量的调整幅度,accuracyi为所述第一准确率,σi为所述预设准确率。
在另一种可能实现方式中,所述数量调整单元,还被配置为采用以下公式,获取所述目标数量的调整幅度:
Figure BDA0002255644330000054
其中,为所述目标数量的调整幅度,
Figure BDA0002255644330000056
为预设调整幅度,accuracyi为所述第一准确率,σi为所述预设准确率,k为所述目标数量的累计调整次数,1≤k≤K,K为预设最大调整次数。
根据本公开实施例的第三方面,提供了一种用于生成类别标签的电子设备,所述电子设备包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行命令的易失性或非易失性存储器;
其中,所述一个或多个处理器被配置为执行第一方面所述的类别标签的生成方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面所述的类别标签的生成方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面所述的类别标签的生成方法。
本公开实施例提供的方法、装置、电子设备及存储介质,获取备选图像集合,基于图像分类模型,分别获取多个备选图像的概率,基于目标数量,从备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签,基于预设数量,从备选图像集合中选取参考图像组,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。本公开实施例提供的方法,基于目标数量,从备选图像集合中选取属于目标类别的目标图像,自动为目标图像生成第一类别标签,而不需要人工标注,降低了人力成本,提高了生成效率。并且,通过调整目标数量,可以从其他备选图像集合中选取更多的目标图像,自动为选取的目标图像生成第一类别标签,提高了准确率,又提高了生成效率。
并且,按照备选图像的概率,从多个备选图像中选取概率较大的备选图像作为目标图像,保证选取的目标图像属于目标类别,提高了生成准确率。
并且,通过增大目标数量,在保证选取的目标图像属于目标类别的基础上,可以选取更多的目标图像,提高生成效率,而之后选取的参考图像的准确率逐渐减小,当准确率小于预设准确率时,减小目标数量,以保证根据目标数量选取的备选图像属于目标类别,减少每次从备选图像集合中选取的目标图像的数量,保证生成目标图像的第一类别标签的准确率。
并且,采用本公开实施例提供的方法,对用户上传的图像进行选取,可以自动选取目标图像,不需要再进行人工审核或者简单地基于图像分类模型进行审核,降低了人工审核的成本。对目标数量进行调整,增大选取的目标数量,进一步降低人工审核的成本,同时本公开实施例提供的方法还可以保证生成目标图像的第一类别标签的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种类别标签的生成方法的流程图。
图2是根据一示例性实施例示出的另一种类别标签的生成方法的流程图。
图3是根据一示例性实施例示出的一种目标数量的调整过程的示意图。
图4是根据一示例性实施例示出的一种类别标签生成装置的框图。
图5是根据一示例性实施例示出的另一种类别标签生成装置的框图。
图6是根据一示例性实施例示出的一种终端的框图。
图7是根据一示例性实施例示出的一种服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的设备和方法的例子。
图1是根据一示例性实施例示出的一种类别标签的生成方法的流程图,参见图1,包括以下步骤:
101、基于目标数量,从备选图像集合中选取目标图像组,以使目标图像组中目标图像的数量等于目标数量,且目标图像组中目标图像的概率大于备选图像集合中除目标图像组之外的其他备选图像的概率,图像的概率为基于图像分类模型获取的图像属于目标类别的概率。
102、为目标图像组中的每个目标图像生成第一类别标签,第一类别标签用于表示对应的目标图像属于目标类别。
103、基于预设数量,从备选图像集合中选取参考图像组,参考图像组中参考图像的数量等于预设数量,且参考图像组中参考图像的概率大于备选图像集合中除目标图像组和参考图像组之外的其他备选图像的概率。
104、根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,类别标签用于表示对应的图像是否属于目标类别,第一准确率用于表示图像分类模型对参考图像组的分类准确率。
105、根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。
本公开实施例提供的方法,基于目标数量,从备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签,基于预设数量,从备选图像集合中选取参考图像组,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。本公开实施例提供的方法,基于目标数量,从备选图像集合中选取属于目标类别的目标图像,自动为目标图像生成第一类别标签,而不需要人工标注,降低了人力成本,提高了生成效率。并且,通过调整目标数量,可以从其他备选图像集合中选取更多的目标图像,为选取的目标图像生成第一类别标签,提高了准确率,又提高了生成效率。
在一种可能实现方式中,基于目标数量,从备选图像集合中选取目标图像组,包括:
按照备选图像集合中多个备选图像的概率从大到小的顺序,选取目标数量的备选图像,作为目标图像添加至目标图像组中。
在另一种可能实现方式中,基于预设数量,从备选图像集合中选取参考图像组,包括:
按照备选图像集合中剩余的多个备选图像的概率从大到小的顺序,选取预设数量的备选图像,作为参考图像添加至参考图像组中。
在另一种可能实现方式中,基于目标数量,从备选图像集合中选取目标图像组之前,方法还包括:
获取备选图像集合,备选图像集合中包括多个备选图像;
基于图像分类模型,分别获取多个备选图像的概率。
在另一种可能实现方式中,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,包括:
获取为参考图像组中每个参考图像标注的类别标签,类别标签包括第一类别标签或第二类别标签中的至少一种,第一类别标签用于表示对应的图像属于目标类别,第二类别标签用于表示对应的图像不属于目标类别;
将获取到的第一类别标签的数量与预设数量的比例确定为第一准确率。
在另一种可能实现方式中,根据第一准确率,对目标数量进行调整,包括:
当第一准确率不小于预设准确率时,增加目标数量;或者,
当第一准确率小于预设准确率时,减小目标数量。
在另一种可能实现方式中,根据第一准确率,对目标数量进行调整,包括:
采用以下公式,对目标数量进行调整:
Figure BDA0002255644330000081
其中,为调整后的目标数量,
Figure BDA0002255644330000083
为目标数量,increasei为目标数量的调整幅度,accuracyi为第一准确率,σi为预设准确率。
在另一种可能实现方式中,对目标数量进行调整之前,根据第一准确率,对目标数量进行调整还包括:
采用以下公式,获取目标数量的调整幅度:
Figure BDA0002255644330000091
其中,为目标数量的调整幅度,
Figure BDA0002255644330000093
为预设调整幅度,accuracyi为第一准确率,σi为预设准确率,k为目标数量的累计调整次数,1≤k≤K,K为预设最大调整次数。
图2是根据一示例性实施例示出的另一种类别标签的生成方法的流程图,参见图2,应用于服务器,包括以下步骤:
201、获取备选图像集合,基于图像分类模型,分别获取多个备选图像的概率。
本公开实施例应用于选取目标图像的场景中,采用本公开实施例的方法从备选图像集合中选取目标图像,选取的目标图像属于目标类别,可以将目标图像作为样本图像用于训练图像分类模型,或者还可以将目标图像用于其他场景。
并且,基于目标数量从备选图像集合中选取目标图像之后,下一次选取目标图像时,会调整目标数量,基于调整后的目标数量继续从其他备选图像集合中选取目标图像。
其中,备选图像集合中包括多个备选图像。该多个备选图像所属的类型可以相同,也可以不同。该多个备选图像可以为视频、图像等多种类型的图像。该多个备选图像可以由服务器收集,例如,将用户上传到服务器的图像进行收集,得到该多个备选图像。
图像分类模型用于对备选图像集合中的多个备选图像进行分类。基于图像分类模型,可以获取备选图像属于目标类别的概率,根据每个备选图像的概率,将该多个备选图像划分为属于目标类别的图像和不属于目标类别的图像。例如,将概率大于预设概率的备选图像划分为属于目标类别的图像,将概率小于预设概率的备选图像划分为不属于目标类别的图像。其中,预设概率为备选图像属于目标类别的最小概率,可以根据对图像分类模型的准确率需求进行设置,如可以为0.5。
其中,图像分类模型可以由服务器训练并存储,或者,由其他设备训练图像分类模型后发送给服务器。
需要说明的是,本公开实施例仅是以从备选图像集合中,基于图像分类模型选取属于一个目标类别的图像为例进行说明,在另一实施例中,图像分类模型可以设置多个目标类别,可以基于图像分类模型从备选图像集合中分别选取属于多个目标类别的目标图像,选取方式与本公开实施例类似,在此不再赘述。
202、基于目标数量,从备选图像集合中选取目标图像组。
203、为目标图像组中的每个目标图像生成第一类别标签。
本公开实施例中,需要从备选图像集合中选取属于目标类别的目标图像,将选取的目标图像构成目标图像组。而图像分类模型获取的概率可以表示对应的备选图像属于目标类别的概率,备选图像的概率越大表示该备选图像属于目标类别的概率越大,因此可以根据图像分类模型获取的每个备选图像的概率,选取概率较大的备选图像,作为目标图像。
此时,选取的目标图像的数量较大,会导致选取到概率较小的目标图像,从而导致目标图像不准确,或者,选取的目标图像的数量较小,又会导致生成效率较低。因此,如何确定目标图像的数量成为亟待解决的问题。
为了解决上述问题,本公开实施例中,基于目标数量从备选图像集合中选取目标图像,目标数量用于指示从备选图像集合中选取的目标图像的数量。
则根据目标数量和备选图像集合中的多个备选图像的概率,从备选图像集合中选取概率较大的、目标数量的备选图像,将这些备选图像作为属于目标类别的目标图像,从而构成目标图像组。因此,选取出的目标图像组中目标图像的概率大于备选图像集合中除该目标图像组之外的其他备选图像的概率,则为目标图像组中的每个目标图像生成第一类别标签。其中,第一类别标签用于表示对应的目标图像属于目标类别,该第一类别标签为自动生成的,不需要人工进行标注,降低了人力成本,提高了第一类别标签的生成效率。
在一种可能实现方式中,该目标数量可以为采用本公开实施例的方法调整后的目标数量,调整方式与后续步骤中目标数量的调整方式类似,在此暂不做说明。或者,当服务器第一次执行本公开实施例提供的方法时,目标数量为预设目标数量,该预设目标数量可以由服务器随机确定,也可以根据图像分类模型的准确率确定。当图像分类模型的准确率较高时,该预设目标数量较大,当图像分类模型的准确率较低时,该预设目标数量较小。
在一种可能实现方式中,选取目标图像时,按照多个备选图像的概率大小,首先选取多个备选图像中概率最大的备选图像,然后选取剩余的多个备选图像中概率最大的备选图像,继续从剩余的多个备选图像中按照上述方式选取备选图像,直至选取出目标数量的备选图像,将选取出的备选图像作为目标图像添加至目标图像组中。
在另一种可能实现方式中,按照备选图像集合中多个备选图像的概率从大到小的顺序,对多个备选图像进行排序,然后按照排序首先选取第一个备选图像,然后选取第二个备选图像,以此类推,直至选出目标数量的备选图像,作为目标图像添加至目标图像组中。
例如,备选图像集合中包括100个备选图像,目标数量为20,将100个备选图像按照概率从大到小进行排序,将前20个备选图像选取为目标图像。
按照备选图像的概率,从多个备选图像中选取概率较大的备选图像作为目标图像,保证选取的目标图像属于目标类别,提高了生成准确率。
另外,选取出目标图像组之后,服务器可以存储该目标图像组,当后续终端或者服务器需要该目标图像时,可以直接从存储的目标图像组中获取目标图像。例如,可以将获取的目标图像用于训练图像分类模型。存储时,可以分别存储得到的目标图像组,也可以将属于同一目标类别的多个目标图像组添加至一个目标图像集合中进行存储。
204、基于预设数量,从备选图像集合中选取参考图像组。
上述步骤202中基于目标数量从备选图像集合中选取目标图像,而在后续过程中,为了增加目标图像的数量,满足图像需求,还会继续从其他备选图像集合中选取目标图像。此时采用的目标数量仍然会对选取的目标图像的准确率以及生成效率造成影响。
但是,如果图像分类模型的准确率不够,会导致基于目标数量选取出的目标图像不够准确。因此,为了提高目标图像的准确率和生成效率,可以以上一次选取过程作为参考,从备选图像集合中选取参考图像,这些参考图像的概率小于目标图像的概率,但大于其他备选图像的概率。由于这些参考图像的概率也比较大,因此可以认为是图像分类模型选取的属于目标类别的图像,则根据图像分类模型对这些参考图像的分类准确率,可以对目标数量进行调整,以便后续采用更为合适的目标数量。
因此,本公开实施例中,基于预设数量,从备选图像集合中选取参考图像,根据选取的参考图像的分类准确率对目标数量进行调整。其中,预设数量用于指示需要选取的参考图像的数量。
则根据预设数量和选取目标图像之后剩余的多个备选图像的概率,从选取目标图像之后剩余的多个备选图像中选取概率较大的、预设数量的备选图像,,将这些备选图像作为参考图像,构成参考图像组,因此参考图像组中参考图像的概率大于备选图像集合中除目标图像组和该参考图像组之外的其他备选图像的概率。
预设数量可以由服务器随机确定,或者,根据技术人员的数量或图像分类模型的准确率确定。该预设数量可以为固定不变的一个值,也可以根据技术人员的数量的变化或者图像分类模型的准确率的变化而改变。
在一种可能实现方式中,选取参考图像时,按照剩余的多个备选图像的概率大小,首先选取概率最大的备选图像,然后选取剩余的多个备选图像中概率最大的备选图像,继续从剩余的多个备选图像中按照上述方式选取备选图像,直至选取出预设数量的备选图像,将选取出的备选图像作为参考图像添加至参考图像组中。
在另一种可能实现方式中,按照备选图像集合中剩余的多个备选图像的概率从大到小的顺序,对剩余的多个备选图像进行排序,然后按照排序首先选取第一个备选图像,然后选取第二个备选图像,以此类推,直至选出预设数量的备选图像,作为参考图像添加至参考图像组中。
例如,剩余的备选图像为80,预设数量为10,将80个备选图像按照概率从大到小进行排序,将第1到第10个备选图像选取为参考图像。
205、根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率。
其中,类别标签用于表示对应的图像是否属于目标类别,第一准确率用于表示图像分类模型对参考图像组的分类准确率。
在一种可能实现方式中,服务器获取为参考图像组中每个参考图像标注的类别标签,该类别标签由技术人员为参考图像确定。该类别标签包括第一类别标签或第二类别标签中的至少一种,该第一类别标签用于表示对应的图像属于目标类别,该第二类别标签用于表示对应的图像不属于目标类别。则对于预设数量的参考图像来说,这些参考图像均是图像分类模型选取的可能属于目标类别的图像,但是通过人工标注确定的类别标签为第一类别标签的图像才是真正属于目标类别的图像,属于目标类别的图像的数量等于第一类别标签的数量,因此将获取到的第一类别标签的数量与预设数量的比例确定为第一准确率,该第一准确率可以表示图像分类模型的分类准确程度。
例如,对选取的10个参考图像进行人工标注,生成类别标签,将人工标注的参考图像的类别与基于图像分类模型得到的目标类别进行比较,假设其中人工标注的参考图像中有9个图像属于目标类别,有1个图像不属于目标类别,则可以得到准确率0.9。
206、根据第一准确率,对目标数量进行调整。
将第一准确率与预设准确率进行比较,根据第一准确率是否小于预设准确率,对目标数量进行调整。其中,预设准确率表示图像分类模型对参考图像组中的参考图像进行分类的最小分类准确率,该预设准确率可以由服务器随机确定,或者,根据技术人员的数量或图像分类模型的准确率确定。
选取目标图像时,目标数量越大,选取的目标图像越多,剩余的多个备选图像的概率越小,从剩余的多个备选图像中选取参考图像时,选取的参考图像的概率越小,则选取的参考图像不属于目标类别的可能性越大。选取的参考图像中,属于目标类别的参考图像越多,即参考图像的准确率越大,则表示根据目标数量选取的目标图像属于目标类别,可以继续增大目标数量,选取更多目标图像;属于目标类别的参考图像越少,即参考图像的准确率越小,则表示如果继续增大目标数量,选取的备选图像可能不属于目标类别,需要减小目标数量,以保证选取出的备选图像属于目标类别。因此,参考图像的分类准确率越大,越应该增加目标图像,而参考图像的分类准确率越小,越应该减小目标数量。
在一种可能实现方式中,当第一准确率不小于预设准确率时,增加该目标数量。对目标数量增加的幅度可以为任意幅度,增加方式可以为该目标数量乘以一个大于1的数值、加上一个大于1的整数或者采用其他方式增加该目标数量。
或者,当第一准确率小于预设准确率时,减小该目标数量。对目标数量减小的幅度可以为任意幅度,减小方式可以为该目标数量乘以一个大于0小于1的数值、减去一个大于1的整数或者采用其他方式减小该目标数量。
在另一种可能实现方式中,采用以下公式,对目标数量进行调整:
Figure BDA0002255644330000131
其中,
Figure BDA0002255644330000132
为调整后的目标数量,为目标数量,
Figure BDA0002255644330000134
为目标数量的调整幅度,accuracyi为第一准确率,σi为预设准确率。
其中,目标数量的调整幅度可以为任一大于1的整数,该调整幅度可以为固定不变的一个数值,也可以为一个变化的数值。
在另一种可能实现方式中,对目标数量进行调整时,该目标数量的调整幅度也会进行调整。可以采用以下公式,获取目标数量的调整幅度:
Figure BDA0002255644330000135
其中,
Figure BDA0002255644330000136
为目标数量的调整幅度,
Figure BDA0002255644330000137
为预设调整幅度,accuracyi为第一准确率,σi为预设准确率,k为目标数量的累计调整次数,1≤k≤K,K为预设最大调整次数。
其中,当第一准确率小于预设准确率时,目标数量的调整幅度为预设调整幅度,该预设调整幅度可以由服务器随机确定,或者,根据技术人员的数量或图像分类模型的准确率确定。当第一准确率不小于预设准确率时,如果k不大于K,则目标数量的调整幅度按照上述公式中的调整方式进行调整,如果k大于K,则目标数量的调整幅度为
Figure BDA0002255644330000141
不再随着k的增大而改变。
获取目标数量的调整幅度之后,结合上述目标数量的调整公式,对目标数量进行调整。该目标数量的调整过程如图3所示,预设最大调整次数为4次,当准确率不小于预设准确率,且调整次数不大于预设最大调整次数时,目标数量呈现指数级别的增长趋势,而当调整次数大于预设最大调整次数时,目标数量呈现线性增长趋势,随着选取的目标数量的增加,选取的预设数量的参考图像的概率偏小,准确率也越来越小,当准确率小于预设准确率时,目标数量会减小为原来的一半。
通过增大目标数量,在保证选取的目标图像属于目标类别的基础上,可以选取更多的目标图像,提高生成效率,而之后选取的参考图像的准确率逐渐减小,当准确率小于预设准确率时,减小目标数量,以保证根据目标数量选取的备选图像属于目标类别,减少每次从备选图像集合中选取的目标图像的数量,保证生成目标图像的第一类别标签的准确率。
本公开实施例中可以看做是利用窗口从备选图像集合中选取目标图像,而窗口的尺寸等于目标数量,每次选取目标图像时,按照窗口的尺寸从备选图像集合中选取目标图像。并且,该窗口的尺寸还可以根据参考图像的分类准确率进行调整,基于调整尺寸后的窗口,可以继续从其他备选图像集合中选取目标图像。
207、基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。
获取任一个其他的备选图像集合,基于图像分类模型,分别获取多个备选图像的概率。基于调整后的目标数量,从该任一其他备选图像集合中选取目标图像组,该目标图像组中的目标图像的类别与上述步骤202中选取的目标图像组中的目标图像的类别可以相同,也可以不同。选取目标图像组之后,为目标图像组中的每个目标图像生成第一类别标签,执行的操作与上述步骤203-206类似,在此不再赘述。
需要说明的是,本公开实施例仅是以执行主体为服务器为例进行说明,在另一实施例中,还可以由终端执行本公开实施例提供的图像选取方法,即终端获取备选图像集合,基于目标数量和预设数量,从备选图像集合中选取目标图像组和参考图像组,为目标图像组中的每个目标图像生成第一类别标签,获取第一准确率,根据第一准确率对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。
本公开实施例提供的方法,获取备选图像集合,基于图像分类模型,分别获取多个备选图像的概率,基于目标数量,从备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签,基于预设数量,从备选图像集合中选取参考图像组,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。本公开实施例提供的方法,基于目标数量,从备选图像集合中选取属于目标类别的目标图像,自动为目标图像生成第一类别标签,而不需要人工标注,降低了人力成本,提高了生成效率。并且,通过调整目标数量,可以从其他备选图像集合中选取更多的目标图像,为选取的目标图像生成第一类别标签,提高了准确率,又提高了生成效率。
并且,按照备选图像的概率,从多个备选图像中选取概率较大的备选图像作为目标图像,保证选取的目标图像属于目标类别,提高了生成目标图像的第一类别标签的准确率。
并且,通过增大目标数量,在保证选取的目标图像属于目标类别的基础上,可以选取更多的目标图像,提高选取的效率,而之后选取的参考图像的准确率逐渐减小,当准确率小于预设准确率时,减小目标数量,以保证根据目标数量选取的备选图像属于目标类别,减少每次从备选图像集合中选取的目标图像的数量,保证生成目标图像的第一类别标签的准确率。
另外,对于一个UGC(User Generated Content,用户生成内容)平台中的垂类频道,每个垂类频道有各自的标签,每个垂类频道中上传的图像的类别需要与该垂类频道的标签相同。本公开实施例中所选取的目标图像可以上传到垂类频道中,推荐给与该垂类频道匹配的用户。
相关技术中,在上传图像时,需要人工对用户上传的图像进行审核,通过审核得到属于目标类别的目标图像,才允许上传这些目标图像,审核成本高,且效率低。或者,也可以基于图像分类模型对图像进行审核,模型的准确率无法达到100%,准确率达到90%的模型已经可以认为是优秀的模型,因此采用图像分类模型进行审核的准确率较低。通常将概率大于预设概率的图像认为是属于目标类别的目标图像,通过增大预设概率,来提高准确率。但是该图像分类模型会随着时间的推移退化,当用户上传的属于该目标类别的图像大量减少之后,如果还根据之前的预设准确率得到目标图像,就会降低准确率。
采用本公开实施例提供的方法,对用户上传的图像进行选取,可以自动选取目标图像,不需要再进行人工审核或者简单地基于图像分类模型进行审核,降低了人工审核的成本。对目标数量进行调整,增大选取的目标数量,进一步降低人工审核的成本,同时本公开实施例提供的方法还可以保证生成目标图像的类别标签的准确率。
图4是根据一示例性实施例示出的一种类别标签生成装置的框图,参见图4,该装置包括:
目标图像选取单元401,被配置为基于目标数量,从备选图像集合中选取目标图像组,以使该目标图像组中目标图像的数量等于目标数量,且该目标图像组中目标图像的概率大于备选图像集合中除该目标图像组之外的其他备选图像的概率,图像的概率为基于图像分类模型获取的该图像属于目标类别的概率;
标签生成单元402,被配置为为目标图像组中的每个目标图像生成第一类别标签,第一类别标签用于表示对应的目标图像属于目标类别;
参考图像选取单元403,被配置为基于预设数量,从备选图像集合中选取参考图像组,该参考图像组中参考图像的数量等于预设数量,且该参考图像组中参考图像的概率大于备选图像集合中除目标图像组和该参考图像组之外的其他备选图像的概率;
准确率获取单元404,被配置为根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,该类别标签用于表示对应的图像是否属于目标类别,该第一准确率用于表示图像分类模型对参考图像组的分类准确率;
数量调整单元405,被配置为根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。
在一种可能实现方式中,目标图像选取单元401,还被配置为按照备选图像集合中多个备选图像的概率从大到小的顺序,选取目标数量的备选图像,作为目标图像添加至目标图像组中。
在另一种可能实现方式中,参考图像选取单元403,还被配置为按照备选图像集合中剩余的多个备选图像的概率从大到小的顺序,选取预设数量的备选图像,作为参考图像添加至参考图像组中。
在另一种可能实现方式中,参见图5,目标图像选取单元401,包括:
集合获取子单元4011,被配置为获取备选图像集合,备选图像集合中包括多个备选图像;
概率获取子单元4012,被配置为基于图像分类模型,分别获取多个备选图像的概率。
在另一种可能实现方式中,参见图5,准确率获取单元404,包括:
标签获取子单元4041,被配置为获取为参考图像组中每个参考图像标注的类别标签,类别标签包括第一类别标签或第二类别标签中的至少一种,第二类别标签用于表示对应的图像不属于目标类别;
准确率获取子单元4042,被配置为将获取到的第一类别标签的数量与预设数量的比例确定为第一准确率。
在另一种可能实现方式中,参见图5,数量调整单元405,包括:
数量增加子单元4051,被配置为当第一准确率不小于预设准确率时,增加目标数量;或者,
数量减少子单元4052,被配置为当第一准确率小于预设准确率时,减小目标数量。
在另一种可能实现方式中,数量调整单元405,还被配置为采用以下公式,对目标数量进行调整:
Figure BDA0002255644330000171
其中,
Figure BDA0002255644330000172
为调整后的目标数量,为目标数量,increasei为目标数量的调整幅度,accuracyi为第一准确率,σi为预设准确率。
在另一种可能实现方式中,数量调整单元404,还被配置为采用以下公式,获取目标数量的调整幅度:
其中,
Figure BDA0002255644330000175
为目标数量的调整幅度,
Figure BDA0002255644330000176
为预设调整幅度,accuracyi为第一准确率,σi为预设准确率,k为目标数量的累计调整次数,1≤k≤K,K为预设最大调整次数。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于生成类别标签的终端600的框图。该终端600用于执行上述类别标签的生成方法中终端所执行的步骤,可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端2100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端600包括有:一个或多个处理器601和一个或多个存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的图像进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的图像进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括易失性存储器或非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所具有以实现本申请中方法实施例提供的类别标签的生成方法。
在一些实施例中,终端600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、触摸显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。
外围设备接口603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及13G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(UserInterface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置终端600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在终端600的不同表面或呈折叠设计;在再一些实施例中,显示屏605可以是柔性显示屏,设置在终端600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
定位组件608用于定位终端600的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件608可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于:加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。
加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号,控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动图像的采集。
陀螺仪传感器612可以检测终端600的机体方向及转动角度,陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的图像,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时,可以检测用户对终端600的握持信号,由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时,由处理器601根据用户对触摸显示屏605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器614用于采集用户的指纹,由处理器601根据指纹传感器614采集到的指纹识别用户的身份,或者,由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器601授权该用户具有相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时,指纹传感器614可以与物理按键或厂商标志集成在一起。
光学传感器615用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器615采集的环境光强度,控制触摸显示屏605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏605的显示亮度;当环境光强度较低时,调低触摸显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器615采集的环境光强度,动态调整摄像头组件606的拍摄参数。
接近传感器616,也称距离传感器,通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中,当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时,由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态;当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时,由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图6中示出的结构并不构成对终端600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图7是根据一示例性实施例示出的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(CentralProcessing Units,CPU)701和一个或一个以上的存储器702,其中,存储器702中存储有至少一条指令,该至少一条指令由处理器701加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器700可以用于执行上述类别标签的生成方法中服务器所执行的步骤。
在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述类别标签的生成方法中服务器或终端所执行的步骤。
在示例性实施例中,还提供了一种计算机程序产品,当计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行上述类别标签的生成方法中服务器或终端所执行的步骤。
本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种类别标签的生成方法,其特征在于,所述方法包括:
基于目标数量,从备选图像集合中选取目标图像组,以使所述目标图像组中目标图像的数量等于所述目标数量,且所述目标图像组中目标图像的概率大于所述备选图像集合中除所述目标图像组之外的其他备选图像的概率,所述图像的概率为基于图像分类模型获取的所述图像属于目标类别的概率;
为所述目标图像组中的每个目标图像生成第一类别标签,所述第一类别标签用于表示对应的目标图像属于所述目标类别;
基于预设数量,从所述备选图像集合中选取参考图像组,所述参考图像组中参考图像的数量等于所述预设数量,且所述参考图像组中参考图像的概率大于所述备选图像集合中除所述目标图像组和所述参考图像组之外的其他备选图像的概率;
根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,所述类别标签用于表示对应的图像是否属于所述目标类别,所述第一准确率用于表示所述图像分类模型对所述参考图像组的分类准确率;
根据所述第一准确率,对所述目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为所述目标图像组中的每个目标图像生成所述第一类别标签。
2.根据权利要求1所述的方法,其特征在于,所述基于目标数量,从备选图像集合中选取目标图像组,包括:
按照所述备选图像集合中多个备选图像的概率从大到小的顺序,选取所述目标数量的备选图像,作为目标图像添加至所述目标图像组中。
3.根据权利要求2所述的方法,其特征在于,所述基于预设数量,从所述备选图像集合中选取参考图像组,包括:
按照所述备选图像集合中剩余的多个备选图像的概率从大到小的顺序,选取所述预设数量的备选图像,作为参考图像添加至所述参考图像组中。
4.根据权利要求1所述的方法,其特征在于,所述基于目标数量,从备选图像集合中选取目标图像组之前,所述方法还包括:
获取所述备选图像集合,所述备选图像集合中包括多个备选图像;
基于所述图像分类模型,分别获取所述多个备选图像的概率。
5.根据权利要求1所述的方法,其特征在于,所述根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,包括:
获取为所述参考图像组中每个参考图像标注的类别标签,所述类别标签包括第一类别标签或第二类别标签中的至少一种,所述第二类别标签用于表示对应的图像不属于所述目标类别;
将获取到的所述第一类别标签的数量与所述预设数量的比例确定为所述第一准确率。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一准确率,对所述目标数量进行调整,包括:
当所述第一准确率不小于预设准确率时,增加所述目标数量;或者,
当所述第一准确率小于所述预设准确率时,减小所述目标数量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一准确率,对所述目标数量进行调整,包括:
采用以下公式,对所述目标数量进行调整:
Figure FDA0002255644320000021
其中,
Figure FDA0002255644320000022
为调整后的目标数量,
Figure FDA0002255644320000023
为所述目标数量,increasei为所述目标数量的调整幅度,accuracyi为所述第一准确率,σi为所述预设准确率。
8.一种类别标签生成装置,其特征在于,所述装置包括:
目标图像选取单元,被配置为基于目标数量,从备选图像集合中选取目标图像组,以使所述目标图像组中目标图像的数量等于所述目标数量,且所述目标图像组中目标图像的概率大于所述备选图像集合中除所述目标图像组之外的其他备选图像的概率,所述图像的概率为基于图像分类模型获取的所述图像属于目标类别的概率;
标签生成单元,被配置为为所述目标图像组中的每个目标图像生成第一类别标签,所述第一类别标签用于表示对应的目标图像属于所述目标类别;
参考图像选取单元,被配置为基于预设数量,从所述备选图像集合中选取参考图像组,所述参考图像组中参考图像的数量等于所述预设数量,且所述参考图像组中参考图像的概率大于所述备选图像集合中除所述目标图像组和所述参考图像组之外的其他备选图像的概率;
准确率获取单元,被配置为根据为所述参考图像组中每个参考图像标注的类别标签,获取第一准确率,所述类别标签用于表示对应的图像是否属于所述目标类别,所述第一准确率用于表示所述图像分类模型对所述参考图像组的分类准确率;
数量调整单元,被配置为根据所述第一准确率,对所述目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为所述目标图像组中的每个目标图像生成所述第一类别标签。
9.一种用于生成类别标签的电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行命令的易失性或非易失性存储器;
其中,所述一个或多个处理器被配置为执行如权利要求1至权利要求7任一项所述的类别标签的生成方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至权利要求7任一项所述的类别标签的生成方法。
CN201911052428.XA 2019-10-31 2019-10-31 类别标签的生成方法、装置、电子设备及存储介质 Active CN110807486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911052428.XA CN110807486B (zh) 2019-10-31 2019-10-31 类别标签的生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911052428.XA CN110807486B (zh) 2019-10-31 2019-10-31 类别标签的生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110807486A true CN110807486A (zh) 2020-02-18
CN110807486B CN110807486B (zh) 2022-09-02

Family

ID=69489802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911052428.XA Active CN110807486B (zh) 2019-10-31 2019-10-31 类别标签的生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110807486B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
CN102662953A (zh) * 2012-03-01 2012-09-12 倪旻 与输入法集成的语义标注系统和方法
US20150142708A1 (en) * 2011-06-17 2015-05-21 Google Inc. Retrieval of similar images to a query image
US20150146974A1 (en) * 2013-11-27 2015-05-28 Fuji Xerox Co., Ltd Image processing apparatus, image processing method, and non-transitory computer readable medium
US20150248768A1 (en) * 2014-02-28 2015-09-03 International Business Machines Corporation Segmentation Using Hybrid Discriminative Generative Label Fusion of Multiple Atlases
CN105354307A (zh) * 2015-11-06 2016-02-24 腾讯科技(深圳)有限公司 一种图像内容识别方法及装置
CN107506362A (zh) * 2016-11-23 2017-12-22 上海大学 基于用户群优化的图像分类仿脑存储方法
CN109389019A (zh) * 2017-08-14 2019-02-26 杭州海康威视数字技术股份有限公司 人脸图像选择方法、装置及计算机设备
CN109409432A (zh) * 2018-10-31 2019-03-01 腾讯科技(深圳)有限公司 一种图像处理方法、装置和存储介质
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN109753976A (zh) * 2017-11-01 2019-05-14 中国电信股份有限公司 语料标注装置和方法
CN109871883A (zh) * 2019-01-24 2019-06-11 北京市商汤科技开发有限公司 神经网络训练方法及装置、电子设备和存储介质
CN109902672A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 图像标注方法及装置、存储介质、计算机设备
CN110175653A (zh) * 2019-05-29 2019-08-27 北京达佳互联信息技术有限公司 图像识别的方法、装置、设备及存储介质
CN110288049A (zh) * 2019-07-02 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像识别模型的方法和装置
CN110378336A (zh) * 2019-06-24 2019-10-25 南方电网科学研究院有限责任公司 训练样本中目标物体的语义级标注方法、装置及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
US20150142708A1 (en) * 2011-06-17 2015-05-21 Google Inc. Retrieval of similar images to a query image
CN102662953A (zh) * 2012-03-01 2012-09-12 倪旻 与输入法集成的语义标注系统和方法
US20150146974A1 (en) * 2013-11-27 2015-05-28 Fuji Xerox Co., Ltd Image processing apparatus, image processing method, and non-transitory computer readable medium
US20150248768A1 (en) * 2014-02-28 2015-09-03 International Business Machines Corporation Segmentation Using Hybrid Discriminative Generative Label Fusion of Multiple Atlases
CN105354307A (zh) * 2015-11-06 2016-02-24 腾讯科技(深圳)有限公司 一种图像内容识别方法及装置
CN107506362A (zh) * 2016-11-23 2017-12-22 上海大学 基于用户群优化的图像分类仿脑存储方法
CN109389019A (zh) * 2017-08-14 2019-02-26 杭州海康威视数字技术股份有限公司 人脸图像选择方法、装置及计算机设备
CN109753976A (zh) * 2017-11-01 2019-05-14 中国电信股份有限公司 语料标注装置和方法
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN109409432A (zh) * 2018-10-31 2019-03-01 腾讯科技(深圳)有限公司 一种图像处理方法、装置和存储介质
CN109902672A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 图像标注方法及装置、存储介质、计算机设备
CN109871883A (zh) * 2019-01-24 2019-06-11 北京市商汤科技开发有限公司 神经网络训练方法及装置、电子设备和存储介质
CN110175653A (zh) * 2019-05-29 2019-08-27 北京达佳互联信息技术有限公司 图像识别的方法、装置、设备及存储介质
CN110378336A (zh) * 2019-06-24 2019-10-25 南方电网科学研究院有限责任公司 训练样本中目标物体的语义级标注方法、装置及存储介质
CN110288049A (zh) * 2019-07-02 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像识别模型的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FISHER YU等: "LSUN: Construction of a Large-Scale Image Dataset using Deep Learning with Humans in the Loop", 《计算机视觉和模式识别》 *

Also Published As

Publication number Publication date
CN110807486B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN109379643B (zh) 视频合成方法、装置、终端及存储介质
CN110650379B (zh) 视频摘要生成方法、装置、电子设备及存储介质
CN110572711A (zh) 视频封面生成方法、装置、计算机设备及存储介质
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN111880888B (zh) 预览封面生成方法、装置、电子设备及存储介质
CN110933468A (zh) 播放方法、装置、电子设备及介质
CN110070143B (zh) 获取训练数据的方法、装置、设备及存储介质
CN109961802B (zh) 音质比较方法、装置、电子设备及存储介质
CN111586279B (zh) 确定拍摄状态的方法、装置、设备及存储介质
CN111753606A (zh) 一种智能模型的升级方法及装置
CN111857793A (zh) 网络模型的训练方法、装置、设备及存储介质
CN111261174B (zh) 音频的分类方法、装置、终端及计算机可读存储介质
CN111327819A (zh) 选择图像的方法、装置、电子设备及介质
CN111611414A (zh) 车辆检索方法、装置及存储介质
CN111988664B (zh) 视频处理方法、装置、计算机设备及计算机可读存储介质
CN113709353B (zh) 图像采集方法和设备
CN110263695B (zh) 人脸部位的位置获取方法、装置、电子设备及存储介质
CN111488895B (zh) 对抗数据生成方法、装置、设备及存储介质
CN110807486B (zh) 类别标签的生成方法、装置、电子设备及存储介质
CN111757146B (zh) 视频拼接的方法、系统及存储介质
CN112132472A (zh) 资源管理方法、装置、电子设备及计算机可读存储介质
CN112990424A (zh) 神经网络模型训练的方法和装置
CN112135256A (zh) 移动轨迹的确定方法、装置、设备及可读存储介质
CN112308104A (zh) 异常识别方法、装置及计算机存储介质
CN111723615A (zh) 对检测物图像进行检测物匹配判定的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant