CN111435451B - 确定图片类别的方法、装置、服务器和存储介质 - Google Patents

确定图片类别的方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN111435451B
CN111435451B CN201910027898.4A CN201910027898A CN111435451B CN 111435451 B CN111435451 B CN 111435451B CN 201910027898 A CN201910027898 A CN 201910027898A CN 111435451 B CN111435451 B CN 111435451B
Authority
CN
China
Prior art keywords
picture
cluster
preset
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910027898.4A
Other languages
English (en)
Other versions
CN111435451A (zh
Inventor
申世伟
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910027898.4A priority Critical patent/CN111435451B/zh
Publication of CN111435451A publication Critical patent/CN111435451A/zh
Application granted granted Critical
Publication of CN111435451B publication Critical patent/CN111435451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开是关于一种确定图片类别的方法、装置、服务器和存储介质,属于大数据技术领域。所述方法包括:在确定待测试图片集中图片的类别时,可以获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,然后服务器可以基于获取到的输出特征,将待测试图片集中的图片分为多个图片簇,并且确定待测试图片集中各图片匹配到每个预设属性的概率,然后对于多个图片簇中的目标图片簇,根据目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别,将目标类别,确定为目标图片簇中各图片的类别。采用本公开,可以提高零样本学习的准确率。

Description

确定图片类别的方法、装置、服务器和存储介质
技术领域
本公开涉及大数据技术领域,尤其涉及确定图片类别的方法、装置、服务器和存储介质。
背景技术
零样本学习是在已知类别上训练物体识别模型,要求模型能够用于识别来自未知类别的物体,例如,有一个训练用的样本集,该样本集包括A、B和C三个类别的样本,可以训练得到A、B和C三个类别的分类器,但是待测试集中有A、B、C和D四个类别,零样本学习就是使用该分类器,确定类别D的物体。
相关技术中,在零样本学习中,一般可以使用直接属性预测方法,确定图片中目标的各个属性的比例,然后基于预先存储的各个类别对应的属性的预设占比,确定出图片中目标对应的类别。
这样,类别对应的属性的预设图片是在全部图片中的占比,然而相关技术中是基于单一图片进行属性预测,单一图片的属性的占比无法反映该图片在全部数据中的占比,所以有可能导致零样本学习结果不准确。
发明内容
本公开提供了一种确定图片类别的方法、装置、服务器和存储介质,能够克服零样本学习结果不准确的问题。
根据本公开实施例的第一方面,提供一种确定图片类别的方法,包括:
获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,根据所述目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
可选的,所述根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,包括:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度;
根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇。
这样,可以使确定的图片的类别更准确。
可选的,所述根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度,包括:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的余弦距离;
将所述任意两个图片的余弦距离,确定为所述任意两个图片的相似度。
可选的,所述根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇,包括:
建立第一图片簇,将所述第一图片簇设置为当前处理图片簇,并将所述待测试图片集中的第一图片添加至所述第一图片簇,并设置为待添加图片;
在所述待测试图片集中,确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将所述目标图片添加至所述第一图片簇,并将所述目标图片设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将所述第二图片簇设置为当前处理图片簇,并将所述待测试图片集中未被添加至图片簇的第二图片添加至所述第二图片簇,并设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对所述待测试图片集中的图片进行划分得到的多个图片簇。
这样,可以使划分的图片簇更准确。
可选的,所述根据所述目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,包括:
如果所述目标图片簇中第一图片匹配到第一预设属性的概率高于所述第一预设属性对应的第二预设阈值,则确定所述第一图片与所述第一预设属性匹配,其中,所述第一图片为所述目标图片簇中的任一图片,所述第一预设属性为任一预设属性;
确定所述目标图片簇中匹配到每个预设属性的图片的数目与所述目标图片簇中图片的总数目的比值;
根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别。
这样,可以使确定的图片的类别更准确。
可选的,所述根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,包括:
对于每个预设类别,根据所述预设类别中各预设属性的预设占比、以及在所述预设类别的各预设属性下所述目标图片簇对应的比值,确定所述目标图片簇与所述预设类别的余弦距离;
将与所述目标图片簇的余弦距离最高的类别,确定为与所述目标图片簇相似度最高的目标类别。
这样,可以使确定的图片的类别更准确。
可选的,所述方法还包括:
根据所述样本图片集,训练得到属性分类器;
所述确定所述待测试图片集中各图片匹配到每个预设属性的概率,包括:
将所述待测试图片集中各图片输入到所述属性分类器中,得到所述待测试图片集中各图片匹配到每个预设属性的概率。
根据本公开实施例的第二方面,提供一种确定图片类别的装置,包括:
获取单元,被配置为获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
确定单元,被配置为:
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,根据所述目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
可选的,所述确定单元,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度;
根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇。
可选的,所述确定单元,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的余弦距离;
将所述任意两个图片的余弦距离,确定为所述任意两个图片的相似度。
可选的,所述确定单元,被配置为:
建立第一图片簇,将所述第一图片簇设置为当前处理图片簇,并将所述待测试图片集中的第一图片添加至所述第一图片簇,并设置为待添加图片;
在所述待测试图片集中,确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将所述目标图片添加至所述第一图片簇,并将所述目标图片设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将所述第二图片簇设置为当前处理图片簇,并将所述待测试图片集中未被添加至图片簇的第二图片添加至所述第二图片簇,并设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对所述待测试图片集中的图片进行划分得到的多个图片簇。
可选的,所述确定单元,被配置为:
如果所述目标图片簇中第一图片匹配到第一预设属性的概率高于所述第一预设属性对应的第二预设阈值,则确定所述第一图片与所述第一预设属性匹配,其中,所述第一图片为所述目标图片簇中的任一图片,所述第一预设属性为任一预设属性;
确定所述目标图片簇中匹配到每个预设属性的图片的数目与所述目标图片簇中图片的总数目的比值;
根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别。
可选的,所述确定单元,被配置为:
对于每个预设类别,根据所述预设类别中各预设属性的预设占比、以及在所述预设类别的各预设属性下所述目标图片簇对应的比值,确定所述目标图片簇与所述预设类别的余弦距离;
将与所述目标图片簇的余弦距离最高的类别,确定为与所述目标图片簇相似度最高的目标类别。
可选的,所述确定单元,还被配置为:
根据所述样本图片集,训练得到属性分类器;
所述确定单元,被配置为:
将所述待测试图片集中各图片输入到所述属性分类器中,得到所述待测试图片集中各图片匹配到每个预设属性的概率。
根据本公开实施例的第三方面,提供了一种服务器,该服务器包括处理器和用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述第一方面所述的确定图片类别的方法步骤。
根据本公开实施例的第四方面,提供了一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述第一方面所述的确定图片类别的方法步骤。
根据本公开实施例的第五方面,提供了一种应用程序,包括一条或多条指令,该一条或多条指令可以由服务器的处理器执行,以完成下述确定图片类别的方法:
获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,根据所述目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开实施例中,在确定待测试图片集中图片的类别时,可以获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,卷积神经网络模型为基于样本图片集训练得到的分类器,样本图片集中的图片的类别少于待测试图片集中图片的类别,然后服务器可以基于获取到的输出特征,将待测试图片集中的图片分为多个图片簇,并且确定待测试图片集中各图片匹配到每个预设属性的概率,然后对于多个图片簇中的目标图片簇,根据目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别,将目标类别,确定为目标图片簇中各图片的类别。这样,将待测试图片集中的图片划分为图片簇,考虑了图片簇整体与类别的相似度,将与图片簇相似度最高的类别,确定为该图片簇中各图片的类别,而不是基于单个图片的属性进行预测,所以可以使零样本学习的准确率更高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种确定图片类别的方法的流程图。
图2是根据一示例性实施例示出的一种卷积神经网络的结构示意图。
图3是根据一示例性实施例示出的一种确定图片类别的装置的结构框图。
图4是根据一示例性实施例示出的一种服务器的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例中提供了一种确定图片类别的方法,该方法可以由终端或服务器实现,终端可以是电脑等,该终端中安装有类别确定应用程序。
其中,终端中可以设置有处理器、存储器和收发器,处理器可以用于确定图片类别过程的处理,存储器可以用于存储确定图片类别过程中需要的数据以及产生的数据,收发器可以用于接收以及发送数据,终端中还可以设置有屏幕等输入输出设备,屏幕可以是触摸屏,可以用于显示图片等。
服务器中可以设置有处理器、存储器和收发器,处理器可以用于确定图片类别过程的处理,存储器可以用于存储确定图片类别过程中需要的数据以及产生的数据,收发器可以用于接收以及发送数据。
本公开实施例以执行主体为服务器为例进行方案的说明,其它情况与之类似,不再赘述。
在进行实施前,首先介绍一下本公开实施例中涉及的应用场景:
在样本图片集中图片的类别少于待测试图片集中图片的类别时,要使用样本图片集,去预测待测试图片集中类别不属于样本图片集中图片的类别的图片的类别。例如。有一个样本图片集中包括A、B、C三个类别的图片,然而待测试图片集中包括A、B、C、D四个类别的图片,那么就要使用A、B、C三个类别的图片,去预测待测试图片集中D类别的图片的类别。
在预测得到图片的类别之后,可以为将图片的类别确定为图片的标签,或者基于视频中图片的类别,为视频添加标签等。
本公开实施例提供了一种确定图片类别的方法,如图1所示,该方法的执行流程可以如下:
在步骤101中,获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征。
其中,待测试图片集包括的图片为要确定类别的图片,样本图片集包括的图片为已经标定类别的图片。样本图片集中的图片的类别少于待测试图片集中图片的类别,例如,样本图片集中的图片的类别为A、B、C,待测试图片集中的图片类别为A、B、C、D、E。图片的类别实际上是图片中目标类别,如图片中包括目标猫,图片的类别为猫等。卷积神经网络模型为基于样本图片集训练得到的分类器。
在实施中,服务器在确定待测试图片集中各图片的类别时,可以获取卷积神经网络模型,然后将待测试图片集中各图片分别输入到卷积神经网络模型中,获得各图片在全连接层的输出特征,各图片在全连接层的输出特征一般是使用一维向量的形式表示。例如,对于某一个图片,该图片在全连接层的输出特征可以表示为一个一维的1024个向量。
需要说明的是,上述卷积神经网络模型是基于样本图片集训练得到的分类器,例如,样本图片集中的图片的类别为A、B、C,分类器可以是只有A、B、C三个类别的分类器。上述卷积神经网络模型可以是CNN(Convolutional Neural Network,卷积神经网络)模型和VGG(Visual Geometry Group,视觉几何组)模型等中的任意一种,但是该分类器必须使用soft-max(柔性最大值传输函数),这是由于该分类器的输出是互斥的,例如,一个图片属于A类别,就不可能属于B类别。
另外,上述卷积神经网络模型一般是包括卷积层、池化层、全连接层等,卷积层、池化层、全连接层的数目可以预设,本公开实施例不做限定,如图2所示,卷积层为两个,池化层为两个,全连接层为一个。
在步骤102中,根据获取的输出特征,将待测试图片集中的图片分为多个图片簇,并确定待测试图片集中各图片匹配到每个预设属性的概率。
其中,预设属性可以预设,并且存储至服务器中,一般可以用于表征图片中目标的一些特性。例如,形状、颜色、材质等,形状可以包括圆、椭圆、三角形、菱形、长方形等,颜色可以包括红色、蓝色、粉红色、黑色、白色等。
在实施中,服务器在获取到待测试图片集中各图片对应的输出特征后,可以基于图片之间的相似性,将待测试图片集中的图片分为多个图片簇。
然后服务器可以使用另一个神经网络模型,该神经网络模型可以输出每个图片匹配到各预设属性的概率,这样就可以确定待测试图片集中各图片匹配到每个预设属性的概率。例如,对于某个图片,红色的概率为50%,形状为圆的概率为70%等。
可选的,可以基于图片之间的相似度,划分得到图片簇,相应的处理可以如下:
根据获取的输出特征,确定待测试图片集中任意两个图片的相似度,根据任意两个图片的相似度,将待测试图片集中的图片分为多个图片簇。
其中,图片簇中包括至少一个图片,在图片簇中的图片均有一定的关联性。
在实施中,服务器在获取到待测试图片集中各图片对应的输出特征后,可以计算每个图片与其它图片的相似度。例如,待测试图片集中包括30张图片,求每个图片与其它图片的相似度,可以得到C30 2个组图片的相似度,每组图片包括两个图片。
然后服务器可以使用确定出的相似度,将待测试图片集中的图片分为多个图片簇。
可选的,可以使用余弦距离,得到相似度,相应的处理可以如下:
根据获取的输出特征,确定待测试图片集中任意两个图片的余弦距离,将任意两个图片的余弦距离,确定为任意两个图片的相似度。
在实施中,服务器在获取到待测试图片集中各图片对应的输出特征后,可以计算每个图片与其它图片的余弦距离,此处以A图片和B图片进行说明,A图片对应的输出特征为{x1,x2,...,xn},B图片对应的输出特征为{y1,y2,...,yn},A图片与B图片的余弦距离可以表示为:
Figure BDA0001943181320000081
这样,就可以得到A图片与B图片的余弦距离,将A图片与B图片的余弦距离,可以确定为A图片与B图片的相似度。这样,就可以得到A图片与B图片的相似度,依此类推,即可得到待测试图片集中任意两个图片的相似度。
可选的,本公开实施例可以基于属性分类器,得到待测试图片集中各图片匹配到每个预设属性的概率,相应的处理可以如下:
根据样本图片集,训练得到属性分类器,将待测试图片集中各图片输入到属性分类器中,得到待测试图片集中各图片匹配到每个预设属性的概率。
其中,预设属性可以预设,并且存储至服务器中,一般可以用于表征图片中目标的一些特性。
在实施中,服务器可以根据样本图片集(样本图片集中,每个图片都标定了属性)和预设的卷积神经网络模型,训练得到属性分类器,在该属性分类器可以是使用sigmoid函数,确定出的分类器,这是由于sigmoid函数是将实数向量映射(0,1)区间,这样,对于每个实数向量,都能得到一个概率值。将某个图片输入至属性分类器中,该属性分类器会输出该图片匹配到每个预设属性的概率。例如,红色的概率为60%、黑色的概率为20%、长方形的概率为50%等。
服务器在训练得到属性分类器之后,可以将待测试图片集中各图片分别输入到属性分类器中,得到各图片匹配到每个预设属性的概率。
需要说明的是,上述训练属性分类器的过程与训练任一分类器的过程相同,此处不再赘述。
在步骤103中,对于多个图片簇中的目标图片簇,根据目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别,将目标类别,确定为目标图片簇中各图片的类别。
其中,多个预设类别可以预设,并且存储至服务器中,预设类别与待测试图片的图片内容有关。例如,如果待测试图片集中的图片中均是包含动物的图片,多个预设类别可以是猫、狗、大象等。对于任一预设类别,该预设类别中各预设属性的预设占比,可以反映该类别的图片的特征。例如,类别为气球,椭圆形属性的预设占比为60%,圆形属性的预设占比为30%,桃心形属性的预设占比为10%,红色属性的预设占比为30%,蓝色属性的占比为20%,绿色属性的预设占比为10%,紫色属性的预设占比为20%,黄色属性的预设占比为20%。
在实施中,服务器确定出多个图片簇之后,对于多个图片簇中的目标图片簇(可以为多个图片簇中的任一图片簇),可以进行如下处理:
服务器可以获取预先存储的多个预设类别中各预设属性的预设占比,然后使用目标图片簇中各图片匹配到每个预设属性的概率和多个预设类别中各预设属性的预设占比,确定多个预设类别中,与目标图片簇相似度最高的目标类别。例如,一共有5个类别,目标图片簇与这5个类别的相似度分别为20%、30%、80%、20%、15%,80%最大,可以将80%对应的类别,确定为目标类别。然后将目标类别,确定为目标图片簇中各图片的类别。
这样,可以确定出目标图片簇的类别,依此类推,服务器可以确定出其它图片簇的类别。
需要说明的是,上述对于同一类型的多种预设属性的预设占比之和等于1。对于颜色类型,各种颜色属性的预设占比之和等于1,例如,红色属性的预设占比为30%,蓝色属性的占比为20%,绿色属性的预设占比为10%,紫色属性的预设占比为20%,黄色属性的预设占比为20%,预设占比之和为30%+20%+10%+20%+20%=100%。
还需要说明的是,上述多个预设类别的各个预设属性可以相同,也可以不相同,本公开实施例中,是以多个预设类别的各个预设属性相同为例进行说明。
可选的,可以使用图片簇中各图片的属性,确定与图片簇相似度最高的目标类别,相应的处理可以如下:
如果目标图片簇中第一图片匹配到第一预设属性的概率高于第一预设属性对应的第二预设阈值,则确定第一图片与第一预设属性匹配,其中,第一图片为目标图片簇中的任一图片,第一预设属性为任一预设属性。确定目标图片簇中匹配到每个预设属性的图片的数目与目标图片簇中图片的总数目的比值。根据各预设属性下目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别。
其中,第一图片为目标图片簇中的任一图片,第一预设属性为多个预设属性中的任一属性。第一预设属性对应的第二预设阈值可以预设,并且存储至服务器中,如70%等。对于不同的预设属性,对应的第二预设阈值可以相同,也可以不相同。例如,第二预设阈值均为70%,或者,其中某个预设属性为70%,另一预设属性为80%。
在实施中,对于目标图片簇中任一图片(可以称为是第一图片),服务器可以确定第一图片匹配到第一预设属性的概率是否超过第一预设属性对应的第二预设阈值,如果超过,则可以确定第一图片与第一预设属性匹配,如果未超过,则可以确定第一图片与第一预设属性不匹配。这样,依此类推,可以确定出第一图片与多个预设属性是否匹配。基于确定第一图片与多个预设属性匹配的处理过程,可以确定出目标图片簇中其它图片与多个预设属性匹配的处理过程。
然后统计目标图片簇中,分别匹配到多个预设属性的图片的数目,然后将目标图片簇中匹配到多个预设属性的图片的数目,分别与该目标图片簇中的图片的总数目相比,得到目标图片簇中匹配到多个预设属性的图片的数目与该总数目的比值,这样,可以得到各预设属性下目标图片簇对应的比值,也可以作为目标图片簇匹配到各属性的占比。
然后服务器可以获取预先存储的各预设类别下每个预设属性的预设占比,对于任一预设类别,根据目标图片簇匹配到该预设类别下的各预设属性的占比和该预设类别下每个预设属性的预设占比,确定出目标图片簇与该预设类别的相似度。依此类推,可以确定出目标图片簇与多个预设类别中其它类别的相似度。
然后在目标图片簇与多个预设类别的相似度中,确定相似度最高的预设类别,将相似度最高的预设类别,确定为目标图片簇的目标类别。
可选的,可以使用余弦距离,确定图片簇与类别的相似度,相应的处理可以如下:
对于每个预设类别,根据预设类别中各预设属性的预设占比、以及在预设类别的各预设属性下目标图片簇对应的比值,确定目标图片簇与预设类别的余弦距离。将与目标图片簇的余弦距离最高的类别,确定为与目标图片簇相似度最高的目标类别。
在实施中,对于多个类别中的某个类别,服务器可以计算该类别中各预设属性的预设占比与在该预设类别的各预设属性下目标图片簇对应的比值的余弦距离。例如,该预设类别中各预设属性的预设占比分别为a1,a2,…,an(n表示该预设类别中有n个预设属性),目标图片簇在该预设类别的各预设属性下目标图片簇对应的比值分别为b1,b2,…,bn,他们之间的余弦距离(可以认为是相似度)可以表示为:
Figure BDA0001943181320000111
依此类推,可以确定目标图片簇与其它预设类别的余弦距离。
然后在目标图片簇与多个预设类别的余弦距离中,确定余弦距离最高的预设类别,将余弦距离最高的预设类别,确定为目标图片簇的目标类别。
另外,在步骤102中,可以基于相似度,将待测试图片集中的图片分为多个图片簇,相应的处理可以如下:
建立第一图片簇,将第一图片簇设置为当前处理图片簇,并将待测试图片集中的第一图片添加至第一图片簇,并设置为待添加图片。在待测试图片集中,确定是否存与待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将目标图片添加至第一图片簇,并将目标图片设置为待添加图片,转至执行确定是否存与待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理。如果不存在目标图片且待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将第二图片簇设置为当前处理图片簇,并将待测试图片集中未被添加至图片簇的第二图片添加至第二图片簇,并设置为待添加图片,转至执行确定是否存与待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理。如果不存在目标图片且待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对待测试图片集中的图片进行划分得到的多个图片簇。
其中,第一预设阈值可以预设,并且存储至服务器中,如80%等。
在实施中,服务器在确定出待测试图片集中任意两个图片的相似度后,可以建一个图片簇,即第一图片簇,当前第一图片簇中没有包括图片,并将第一图片簇设置为当前处理图片簇,然后从待测试图片集中任意选择一个图片(可以称为是第一图片),添加至第一图片簇,并将第一图片设置为待添加图片。然后在待测图片集中,确定是否存在与当前待添加图片的相似度大于或等于第一预设阈值的目标图片。
如果存在目标图片,则可以将目标图片添加至当前处理图片簇中,并将目标图片设置为待添加图片,返回查找待测试图片集中,是否存在与当前待添加图片的相似度大于或等于第一预设阈值的图片的处理。
如果不存在目标图片,可以确定待测试图片集中是否存在图片未添加至图片簇,如果存在,则建立一个新的图片簇,即第二图片簇,并将第二图片簇设置为当前处理图片簇,并且从待测试图片集中选择一个未被添加至图片簇的图片,即第二图片,添加至第二图片簇,并设置为待添加图片,继续确定是否存在与待添加图片相似度大于或等于第一预设阈值的目标图片的处理。
如果不存在目标图片,且待测试图片集中不存在图片未添加至图片簇,则可以将建立的图片簇,确定为对待测试图片集中的图片进行划分得到的多个图片簇。
例如,有7张图片,分别表示为1、2、3、4、5、6和7,其中,1分别与2、7的相似度大于第一预设阈值,2分别与3、4、5、6和7的相似度均小于第一预设阈值,3与4的相似度大于第一预设阈值,3分别与5、6和7的相似度小于第一预设阈值,4分别与5、6的相似度均小于第一预设阈值,5与6的相似度大于第一预设阈值,5与7的相似度小于第一预设阈值,6与7的相似度小于第一预设阈值。这样,第一次确定的待添加图片为1,可以将1添加至第一图片簇,由于1分别与2、7的相似度大于第一预设阈值,所以可以将2、7添加至第一图片簇,由于2与其它图片的相似度均小于第一预设阈值,7与其它图片的相似度均小于第一预设阈值,所以第一图片簇划分完毕,包括1、2、7。然后建立第二图片簇,设置为当前处理图片簇,选取未被添加至图片簇的图片3(即第二图片),添加至第二图片簇,设置为待添加图片,3与4的相似度大于第一预设阈值,可以将4添加至第二图片簇,由于4分别与5、6、7的相似度均小于第一预设阈值,第二图片簇划分完毕,包括3和4。然后建立第三图片簇,设置为当前处理图片簇,选取未被添加至图片簇的图片5(即第三图片),添加至第三图片簇,设置为待添加图片,5与6的相似度大于第一预设阈值,可以将6添加至第三图片簇,由于6分别与7的相似度小于第一预设阈值,第三图片簇划分完毕,包括5和6。然后建立第四图片簇,设置为当前处理图片簇,选取未被添加至图片簇的图片7(即第四图片),添加至第四图片簇,设置为待添加图片,由于待测试图片集中不存在未被添加至图片簇的图片,所以第四图片簇划分完毕,包括7。这样,待测试图片集中的图片划分为多个图片簇。
需要说明的是,由于划分图片簇是基于图片之间的相似度,所以每个图片簇中的图片均有较高的相似性。
本公开实施例中,在确定待测试图片集中图片的类别时,可以获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,卷积神经网络模型为基于样本图片集训练得到的分类器,样本图片集中的图片的类别少于待测试图片集中图片的类别,然后服务器可以基于获取到的输出特征,将待测试图片集中的图片分为多个图片簇,并且确定待测试图片集中各图片匹配到每个预设属性的概率,然后对于多个图片簇中的目标图片簇,根据目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别,将目标类别,确定为目标图片簇中各图片的类别。这样,将待测试图片集中的图片划分为图片簇,考虑了图片簇整体与类别的相似度,将与图片簇相似度最高的类别,确定为该图片簇中各图片的类别,而不是基于单个图片的属性进行预测,所以可以使零样本学习的准确率更高。
图3是根据一示例性实施例示出的一种确定图片类别的装置框图。参照图3,该装置包括获取单元311和确定单元312。
获取单元311,被配置为获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
确定单312,被配置为:
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,根据所述目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
可选的,所述确定单312,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度;
根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇。
可选的,所述确定单312,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的余弦距离;
将所述任意两个图片的余弦距离,确定为所述任意两个图片的相似度。
可选的,所述确定单312,被配置为:
建立第一图片簇,将所述第一图片簇设置为当前处理图片簇,并将所述待测试图片集中的第一图片添加至所述第一图片簇,并设置为待添加图片;
在所述待测试图片集中,确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将所述目标图片添加至所述第一图片簇,并将所述目标图片设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将所述第二图片簇设置为当前处理图片簇,并将所述待测试图片集中未被添加至图片簇的第二图片添加至所述第二图片簇,并设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对所述待测试图片集中的图片进行划分得到的多个图片簇。
可选的,所述确定单312,被配置为:
如果所述目标图片簇中第一图片匹配到第一预设属性的概率高于所述第一预设属性对应的第二预设阈值,则确定所述第一图片与所述第一预设属性匹配,其中,所述第一图片为所述目标图片簇中的任一图片,所述第一预设属性为任一预设属性;
确定所述目标图片簇中匹配到每个预设属性的图片的数目与所述目标图片簇中图片的总数目的比值;
根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别。
可选的,所述确定单312,被配置为:
对于每个预设类别,根据所述预设类别中各预设属性的预设占比、以及在所述预设类别的各预设属性下所述目标图片簇对应的比值,确定所述目标图片簇与所述预设类别的余弦距离;
将与所述目标图片簇的余弦距离最高的类别,确定为与所述目标图片簇相似度最高的目标类别。
可选的,所述确定单312,还被配置为:
根据所述样本图片集,训练得到属性分类器;
所述确定单312,被配置为:
将所述待测试图片集中各图片输入到所述属性分类器中,得到所述待测试图片集中各图片匹配到每个预设属性的概率。
本公开实施例中,在确定待测试图片集中图片的类别时,可以获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,卷积神经网络模型为基于样本图片集训练得到的分类器,样本图片集中的图片的类别少于待测试图片集中图片的类别,然后服务器可以基于获取到的输出特征,将待测试图片集中的图片分为多个图片簇,并且确定待测试图片集中各图片匹配到每个预设属性的概率,然后对于多个图片簇中的目标图片簇,根据目标图片簇中各图片匹配到每个预设属性的概率、以及多个预设类别中各预设属性的预设占比,确定与目标图片簇相似度最高的目标类别,将目标类别,确定为目标图片簇中各图片的类别。这样,将待测试图片集中的图片划分为图片簇,考虑了图片簇整体与类别的相似度,将与图片簇相似度最高的类别,确定为该图片簇中各图片的类别,而不是基于单个图片的属性进行预测,所以可以使零样本学习的准确率更高。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是本公开实施例提供的一种服务器的结构示意图,该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现上述确定图片类别的方法步骤。
本公开实施例中,还提供了一种服务器,包括:处理器和用于存储处理器可执行指令的存储器,其中,所述处理器被配置为执行以完成上述确定图片类别的方法的步骤。
本公开实施例中,还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行以完成上述确定图片类别的方法的步骤。
本公开实施例中,还提供了一种应用程序,包括一条或多条指令,该一条或多条指令可以由服务器的处理器执行,以完成上述确定图片类别的方法的步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种确定图片类别的方法,其特征在于,包括:
获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,如果所述目标图片簇中第一图片匹配到第一预设属性的概率高于所述第一预设属性对应的预设阈值,则确定所述第一图片与所述第一预设属性匹配,其中,所述第一图片为所述目标图片簇中的任一图片,所述第一预设属性为任一预设属性;
确定所述目标图片簇中匹配到每个预设属性的图片的数目与所述目标图片簇中图片的总数目的比值;
根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,包括:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度;
根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇。
3.根据权利要求2所述的方法,其特征在于,所述根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度,包括:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的余弦距离;
将所述任意两个图片的余弦距离,确定为所述任意两个图片的相似度。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇,包括:
建立第一图片簇,将所述第一图片簇设置为当前处理图片簇,并将所述待测试图片集中的第一图片添加至所述第一图片簇,并设置为待添加图片;
在所述待测试图片集中,确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将所述目标图片添加至所述第一图片簇,并将所述目标图片设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将所述第二图片簇设置为当前处理图片簇,并将所述待测试图片集中未被添加至图片簇的第二图片添加至所述第二图片簇,并设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对所述待测试图片集中的图片进行划分得到的多个图片簇。
5.根据权利要求1所述的方法,其特征在于,所述根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,包括:
对于每个预设类别,根据所述预设类别中各预设属性的预设占比、以及在所述预设类别的各预设属性下所述目标图片簇对应的比值,确定所述目标图片簇与所述预设类别的余弦距离;
将与所述目标图片簇的余弦距离最高的类别,确定为与所述目标图片簇相似度最高的目标类别。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述样本图片集,训练得到属性分类器;
所述确定所述待测试图片集中各图片匹配到每个预设属性的概率,包括:
将所述待测试图片集中各图片输入到所述属性分类器中,得到所述待测试图片集中各图片匹配到每个预设属性的概率。
7.一种确定图片类别的装置,其特征在于,包括:
获取单元,被配置为获取待测试图片集中各图片在卷积神经网络模型中全连接层的输出特征,其中,所述卷积神经网络模型为基于样本图片集训练得到的分类器,所述样本图片集中的图片的类别少于所述待测试图片集中图片的类别;
确定单元,被配置为:
根据获取的输出特征,将所述待测试图片集中的图片分为多个图片簇,并确定所述待测试图片集中各图片匹配到每个预设属性的概率;
对于多个图片簇中的目标图片簇,如果所述目标图片簇中第一图片匹配到第一预设属性的概率高于所述第一预设属性对应的预设阈值,则确定所述第一图片与所述第一预设属性匹配,其中,所述第一图片为所述目标图片簇中的任一图片,所述第一预设属性为任一预设属性;
确定所述目标图片簇中匹配到每个预设属性的图片的数目与所述目标图片簇中图片的总数目的比值;
根据各预设属性下所述目标图片簇对应的比值、以及多个预设类别中各预设属性的预设占比,确定与所述目标图片簇相似度最高的目标类别,将所述目标类别,确定为所述目标图片簇中各图片的类别。
8.根据权利要求7所述的装置,其特征在于,所述确定单元,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的相似度;
根据所述任意两个图片的相似度,将所述待测试图片集中的图片分为多个图片簇。
9.根据权利要求8所述的装置,其特征在于,所述确定单元,被配置为:
根据获取的输出特征,确定所述待测试图片集中任意两个图片的余弦距离;
将所述任意两个图片的余弦距离,确定为所述任意两个图片的相似度。
10.根据权利要求8或9所述的装置,其特征在于,所述确定单元,被配置为:
建立第一图片簇,将所述第一图片簇设置为当前处理图片簇,并将所述待测试图片集中的第一图片添加至所述第一图片簇,并设置为待添加图片;
在所述待测试图片集中,确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片,如果存在目标图片,则将所述目标图片添加至所述第一图片簇,并将所述目标图片设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中还存在图片未添加至图片簇,则建立第二图片簇,将所述第二图片簇设置为当前处理图片簇,并将所述待测试图片集中未被添加至图片簇的第二图片添加至所述第二图片簇,并设置为待添加图片,转至执行确定是否存与所述待添加图片相似度大于或等于第一预设阈值且未被添加至图片簇的目标图片的处理;
如果不存在所述目标图片且所述待测试图片集中不存在图片未添加至图片簇,则执行将建立的图片簇,确定为对所述待测试图片集中的图片进行划分得到的多个图片簇。
11.根据权利要求7所述的装置,其特征在于,所述确定单元,被配置为:
对于每个预设类别,根据所述预设类别中各预设属性的预设占比、以及在所述预设类别的各预设属性下所述目标图片簇对应的比值,确定所述目标图片簇与所述预设类别的余弦距离;
将与所述目标图片簇的余弦距离最高的类别,确定为与所述目标图片簇相似度最高的目标类别。
12.根据权利要求7所述的装置,其特征在于,所述确定单元,还被配置为:
根据所述样本图片集,训练得到属性分类器;
所述确定单元,被配置为:
将所述待测试图片集中各图片输入到所述属性分类器中,得到所述待测试图片集中各图片匹配到每个预设属性的概率。
13.一种服务器,其特征在于,包括:处理器和用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1至权利要求6任一所述的方法步骤。
14.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行权利要求1至权利要求6任一所述的方法步骤。
CN201910027898.4A 2019-01-11 2019-01-11 确定图片类别的方法、装置、服务器和存储介质 Active CN111435451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910027898.4A CN111435451B (zh) 2019-01-11 2019-01-11 确定图片类别的方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910027898.4A CN111435451B (zh) 2019-01-11 2019-01-11 确定图片类别的方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN111435451A CN111435451A (zh) 2020-07-21
CN111435451B true CN111435451B (zh) 2023-04-28

Family

ID=71580406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910027898.4A Active CN111435451B (zh) 2019-01-11 2019-01-11 确定图片类别的方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN111435451B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257765B (zh) * 2020-10-16 2022-09-23 济南大学 基于未知类相似类别集的零样本图像分类方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469276A (zh) * 2015-08-19 2017-03-01 阿里巴巴集团控股有限公司 数据样本的类型识别方法及装置
CN107276805A (zh) * 2017-06-19 2017-10-20 北京邮电大学 一种基于入侵检测模型的样本预测方法、装置及电子设备
CN108647595A (zh) * 2018-04-26 2018-10-12 华中科技大学 基于多属性深度特征的车辆重识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469276A (zh) * 2015-08-19 2017-03-01 阿里巴巴集团控股有限公司 数据样本的类型识别方法及装置
CN107276805A (zh) * 2017-06-19 2017-10-20 北京邮电大学 一种基于入侵检测模型的样本预测方法、装置及电子设备
CN108647595A (zh) * 2018-04-26 2018-10-12 华中科技大学 基于多属性深度特征的车辆重识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Seyed Mohsen Shojaee等.Semi-supervised Zero-Shot Learning by a Clustering-based Approach.《arXiv:1605.09016v2[cs.CV]》.2016,全文. *
郁俊.基于属性低秩表示的零样本图像识别研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.(第2019年第02期),全文. *

Also Published As

Publication number Publication date
CN111435451A (zh) 2020-07-21

Similar Documents

Publication Publication Date Title
US11348249B2 (en) Training method for image semantic segmentation model and server
CN108280477B (zh) 用于聚类图像的方法和装置
CN110222791B (zh) 样本标注信息的审核方法及装置
US8923628B2 (en) Computer readable medium, image processing apparatus, and image processing method for learning images based on classification information
WO2019015246A1 (zh) 图像特征获取
US20230085605A1 (en) Face image processing method, apparatus, device, and storage medium
CN110135505B (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
KR102265573B1 (ko) 인공지능 기반 입시 수학 학습 커리큘럼 재구성 방법 및 시스템
CN111914908B (zh) 一种图像识别模型训练方法、图像识别方法及相关设备
CN111723815B (zh) 模型训练方法、图像处理方法、装置、计算机系统和介质
KR102476679B1 (ko) 객체 탐지 장치 및 방법
CN112101114B (zh) 一种视频目标检测方法、装置、设备以及存储介质
CN109190674B (zh) 训练数据的生成方法及装置
CN112329762A (zh) 图像处理方法、模型训练方法、装置、计算机设备和介质
CN105989001A (zh) 图像搜索方法及装置、图像搜索系统
CN111931867A (zh) 基于轻量级模型的新冠肺炎x射线图像分类方法及系统
CN114299567B (zh) 模型训练、活体检测方法、电子设备及存储介质
CN111435451B (zh) 确定图片类别的方法、装置、服务器和存储介质
CN113902944A (zh) 模型的训练及场景识别方法、装置、设备及介质
CN111127432B (zh) 一种医学图像检测方法、装置、设备及存储介质
CN112633341A (zh) 一种界面测试方法、装置、计算机设备和存储介质
CN114663714B (zh) 图像分类、地物分类方法和装置
CN116597246A (zh) 模型训练方法、目标检测方法、电子设备及存储介质
CN116645719A (zh) 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质
CN112329810B (zh) 一种基于显著性检测的图像识别模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant