CN105354307A

CN105354307A - 一种图像内容识别方法及装置

Info

Publication number: CN105354307A
Application number: CN201510753125.6A
Authority: CN
Inventors: 李向林
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2015-11-06
Filing date: 2015-11-06
Publication date: 2016-02-24
Anticipated expiration: 2035-11-06
Also published as: CN105354307B; US10438091B2; WO2017075939A1; US20170372169A1

Abstract

本发明公开了一种图像内容识别方法以装置，包括：提取待识别图像的CNN特征；将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器；确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像；使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。采用本发明实施例，可以提高图像识别的精确性。

Description

一种图像内容识别方法及装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种图像内容识别方法及装置。

背景技术

随着互联网技术以及社交媒体的的发展，用户需要处理的图片越来越多，互联网与社交网络软件上存在大量用户上传的图片，这些图片大多数没有标注内容信息，例如：地理位置图片，知名的景点或者建筑图片等，导致用户无法确定这些图片是什么内容的图片或哪个地方的图片，因此需要一种识别这些图片的方法。

在现有技术方案中，首先抽取待识别图片的特征，然后在图像数据库中检索与待识别图片的特征最相似的若干特征数据，最后利用相似数据的相关网页文本来推断待是被图片的内容标签。但是，这种方法存在以下缺点：第一：依赖与待识别图片相关的网页文本数据，然而从文本数据中提取的内容标签包含有较多的噪声；第二：检索的图像数据库规模庞大，包含了较多的噪声，容易检索到内容相似但语义不同的图片，造成最终给出的标签不够准确；第三：识别出来的图片内容的范围较大，不够精确。

发明内容

本发明实施例提供一种图像内容识别方法及装置。通过两次相似度匹配计算对待识别图像进行标注，提高了图像识别的精确性。

本发明第一方面提供了一种图像内容识别方法，包括：

提取待识别图像的CNN特征；

将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值，所述每个图像分类器包括一个类簇，所述类簇对应类型标签，所述每个类簇包括多个图像，所述多个图像中的每张图像对应实体标签；

根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器；

确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像；

使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。

在第一方面的第一种可能的实现方式中，所述每个图像分类器对应一个系数向量，所述根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值包括：

将所述待识别图像的CNN特征转化为所述待识别图像的特征向量；

根据所述每个图像分类器的系数向量与所述待识别图像的特征向量，计算所述每个图像分类器与所述待识别图像的向量内积；

根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值包括:

将所述每个图像分类器与所述待识别图像的向量内积映射到正实数域得到指数值，并计算指数值之和；

将所述目标图像分类器与所述待识别图像的指数值除以所述指数值之和，计算得到所述目标图像分类器输出的概率值。

结合第一方面的第一种可能的实现方式，在第一方面的第三种可能的实现方式中，所述确定所述目标图像分类器中的每张图像与所述待识别图像的相似度包括：

获取所述目标图像分类器中每张图像的CNN特征；

将所述目标图像分类器中的每张图像的CNN特征转化为所述每张图像的特征向量；

将所述目标图像分类器中的每张图像的特征向量乘以所述待识别图像的特征向量得到所述相似度。

在第一方面的第四种可能的实现方式中，所述提取待识别图像的CNN特征之前，还包括：

提取多张图像中的每张图像的CNN特征，并对所述每张图像对应的文本信息进行识别得到所述每张图像的实体标签；

根据所述每张图像的CNN特征，将所述多张图像进行分类得到多个类簇；

根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签；

结合第一方面的第四种可能的实现方式，在第一方面的第五种可能的实现方式中，所述根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签包括：

统计所述每个类簇中的图像的同一实体标签的个数；

根据所述每个类簇中的图像的同一实体标签的个数，选取目标实体标签作为所述所述每个类簇的类型标签。

相应地，本发明第二方面提供了一种图像内容识别装置，包括：

第一提取模块，用于提取待识别图像的CNN特征；

概率计算模块，用于将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值，所述每个图像分类器包括一个类簇，所述类簇对应类型标签，所述每个类簇包括多个图像，所述多个图像中的每张图像对应实体标签；

分类器选取模块，用于根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器；

图像选取模块，用于确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像；

图像标注模块，用于使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。

在第二方面的第一种可能的实现方式中，所述每个图像分类器对应一个系数向量，所述概率计算模块包括：

特征转化单元，用于将所述待识别图像的CNN特征转化为所述待识别图像的特征向量；

特征计算单元，用于根据所述每个图像分类器的系数向量与所述待识别图像的特征向量，计算所述每个图像分类器与所述待识别图像的向量内积；

概率计算单元，用于根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述概率计算单元具体用于:

结合第二方面的第一种可能的实现方式，在第二方面的第三种可能的实现方式中，所述图像选取模块具体用于：

获取所述目标图像分类器中每张图像的CNN特征；

在第二方面的第四种可能的实现方式中，所述装置还包括：

第二提取模块，用于提取多张图像中的每张图像的CNN特征，并对所述每张图像对应的文本信息进行识别得到所述每张图像的实体标签；

图像分类模块，用于根据所述每张图像的CNN特征，将所述多张图像进行分类得到多个类簇；

标签确定模块，用于根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签。

结合第二方面的第四种可能的实现方式，在第二方面的第五种可能的实现方式中，所述标签确定模块具体用于：

统计所述每个类簇中的图像的同一实体标签的个数；

实施本发明实施例，首先提取待识别图像的CNN特征；其次将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器；再次确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像；最后使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。通过两次相似度匹配计算对待识别图像进行标注，提高了图像识别的精确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提出的一种图像内容识别方法的第一实施例的流程图；

图2是本发明提出的一种图像内容识别方法的第二实施例的流程图；

图3是本发明实施例提出的一种图像内容识别装置的结构示意图；

图4是本发明实施例提出装置中概率计算模块的结构示意图；

图5是本发明实施例提出的另一种图像内容识别装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1是本发明提出的一种图像内容识别方法的第一实施例的流程图。如图所示，本发明实施例中的方法包括:

S101，提取待识别图像的CNN特征。

具体实现中，CNN(convolutionneuralnetwork，卷积神经网络)为一种基于神经元局域连接的神经网络并行处理器，CNN的基本结构包括特征提取层和特征映射层。在特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征，一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；在特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等，特征映射结构使用影响函数核较小的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。

S102，将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值，所述每个图像分类器包括一个类簇，所述类簇对应类型标签，所述每个类簇包括多个图像，所述多个图像中的每张图像对应实体标签。

具体实现中，每个图像分类器对应一个特征向量，一个类簇可以对应一个或多个类型标签，一张图像可以对应一个或多个实体标签。可以将所述待识别图像的CNN特征转化为所述待识别图像的特征向量；根据所述每个图像分类器的系数向量与所述待识别图像的特征向量，计算所述每个图像分类器与所述待识别图像的向量内积；根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值。进一步的，将所述每个图像分类器与所述待识别图像的向量内积映射到正实数域得到指数值，并计算指数值之和；将所述目标图像分类器与所述待识别图像的指数值除以所述指数值之和，计算得到所述目标图像分类器输出的概率值。需要说明的是，如果待识别图像输入到图像分类器集合中，图像分类器的概率值最大，则表示该待识别图像与该图像分类器中的图像相似度最高；图像分类器的概率值最小，则表示该待识别图像与该图像分类器中的图像相似度最低。

例如：假设图像分类器集合中包括N个图像分类器，每个图像分类器模型为向量w_k，输入待识别图像的向量x属于第k个图像分类器模型的概率值，计算公式如下：

P (k) = \frac{\exp (w_{k}^{T} x)}{Σ_{i = 1}^{N} \exp (w_{i}^{T} x)}

S103，根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器。

具体实现中，可以将每个图像分类器输出的概率值进行对比，并依次对概率值从大到小进行排序，选取排在前面的至少一个概率值，并将该至少一个概率值对应的图像分类器作为目标图像分类器。

S104，确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像。

具体实现中，可以首先将所述待识别图像的CNN特征转化为所述待识别图像的特征向量，并获取所述目标图像分类器中的每张图像的CNN特征，将所述目标图像分类器中的每张图像的CNN特征转化为所述每张图像的特征向量，将所述目标图像分类器中的每张图像的特征向量乘以所述待识别图像的特征向量得到向量内积，该向量内积越大，相似度越高；最后对目标图像分类器中的每张图像与待识别图像的相似度进行对比并从大到小依次排序，选取排在前面的多个相似度，并将该多个相似度分别对应的图像作为目标图像。

S105，使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。

例如，图像分类器集合中包括类簇1、类簇2以及类簇3，类簇1、类簇2以及类簇3分别对应类型标签1、类型标签2以及类型标签3，类簇1中包括图像1、图像2以及图像3，类簇2中包括图像4、图像5，类簇3中包括图像6、图像7以及图像8，图像1至图像8分别对应实体标签1至实体标签8。其中，根据图像分类器输出的概率值，选取类簇2以及类簇3，并确定待识别图像与类簇2中的图像5以及类簇3中的图像7相似度最高，则可以融合类型标签2以及类型标签3和图像5的实体标签5以及图像7的实体标签7，对所述待识别图像进行标注。

在本发明实施例中，首先提取待识别图像的CNN特征；其次将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器；再次确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像；最后使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。通过两次相似度匹配计算对待识别图像进行标注，提高了图像识别的精确性。

请参考图2，图2是本发明提出的一种图像内容识别方法的第二实施例的流程图。如图所示，本发明实施例中的方法包括:

S201，提取多张图像中的每张图像的CNN特征，并对所述每张图像对应的文本信息进行识别得到所述每张图像的实体标签。

具体实现中，可以首先选取热度较高的多个查询词构成下载字典，利用下载字典中的每个查询词通过网络爬虫集群在互联网上抓取相关的图像以及与该图像对应的文本信息，并将这些图像以及图像对应的文本信息存储在分布式文件系统中，采用并行CNN计算提取多张图像中的每张图像的CNN特征，并利用NLP(Neuro-LinguisticProgramming，自然语言处理)分词识别每张图片对应的文本信息得到所述每张图像的实体标签。

S202，根据所述每张图像的CNN特征，将所述多张图像进行分类得到多个类簇。

具体实现中，可以对同一查询词抓取到的图像的CNN特征进行K均值聚类，从而将所述多张图像进行分类得到多个类簇。其中，K均值聚类为将数据集中相似的数据成员进行分类组织的过程，该聚类方法先随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心，聚类中心以及分配给它们的对象就代表一个聚类。

S203，根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签。

具体实现中，可以首先统计所述每个类簇中的图像的同一实体标签的个数；然后根据所述每个类簇中的图像的同一实体标签的个数，选取目标实体标签作为所述所述每个类簇的类型标签，最后对每个类簇进行编号并利用并行机器学习平台训练LR(LogisticRegressionClassifier，分类算法)分类模型得到图像分类器集合。另外，可以对每个类簇中的同一实体标签进行排序，将个数排在前n位的实体标签作为该类簇的类型标签。

S204，提取待识别图像的CNN特征。

S205，将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值，所述每个图像分类器包括一个类簇，所述类簇对应类型标签，所述每个类簇包括多个图像，所述多个图像中的每张图像对应实体标签。

具体实现中，每个图像分类器对应一个特征向量，一个类簇可以对应一个或多个类型标签，一张图像可以对应一个或多个实体标签。将所述待识别图像的CNN特征转化为所述待识别图像的特征向量；根据所述每个图像分类器的系数向量与所述待识别图像的特征向量，计算所述每个图像分类器与所述待识别图像的向量内积；根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值。进一步的，可以将所述每个图像分类器与所述待识别图像的向量内积映射到正实数域得到指数值，并计算指数值之和；将所述目标图像分类器与所述待识别图像的指数值除以所述指数值之和，计算得到所述目标图像分类器输出的概率值。需要说明的是，如果待识别图像输入到图像分类器集合中，图像分类器的概率值最大，则表示该待识别图像与该图像分类器中的图像相似度最高；图像分类器的概率值最小，则表示该待识别图像与该图像分类器中的图像相似度最低。

P (k) = \frac{\exp (w_{k}^{T} x)}{Σ_{i = 1}^{N} \exp (w_{i}^{T} x)}

S206，根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器。

S207，确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像。

具体实现中，具体实现中，可以首先将所述待识别图像的CNN特征转化为所述待识别图像的特征向量，并获取所述目标图像分类器中的每张图像的CNN特征，将所述目标图像分类器中的每张图像的CNN特征转化为所述每张图像的特征向量，将所述目标图像分类器中的每张图像的特征向量乘以所述待识别图像的特征向量得到向量内积，该向量内积越大，相似度越高；最后对目标图像分类器中的每张图像与待识别图像的相似度进行对比并从大到小依次排序，选取排在前面的多个相似度，并将该多个相似度分别对应的图像作为目标图像。

S209，使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。

请参考图3，图3是本发明实施例提出的一种图像内容识别装置的结构示意图。如图所示，本发明实施例中的装置包括：

第一提取模块301，用于提取待识别图像的CNN特征。

概率计算模块302，用于将所述待识别图像输入到预建的图像分类器集合中，并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值，所述每个图像分类器包括一个类簇，所述类簇对应类型标签，所述每个类簇包括多个图像，所述多个图像中的每张图像对应实体标签。

具体实现中，如图4所示，概率计算模块302可以进一步包括：

特征转化单元401，用于将所述待识别图像的CNN特征转化为所述待识别图像的特征向量,其中，每个图像分类器对应一个特征向量。

特征计算单元402，用于根据所述每个图像分类器的系数向量与所述待识别图像的特征向量，计算所述每个图像分类器与所述待识别图像的向量内积。

概率计算单元403，用于根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值。

进一步的，可以将所述每个图像分类器与所述待识别图像的向量内积映射到正实数域得到指数值，并计算指数值之和；将所述目标图像分类器与所述待识别图像的指数值除以所述指数值之和，计算得到所述目标图像分类器输出的概率值。需要说明的是，如果待识别图像输入到图像分类器集合中，图像分类器的概率值最大，则表示该待识别图像与该图像分类器中的图像相似度最高；图像分类器的概率值最小，则表示该待识别图像与该图像分类器中的图像相似度最低。并且一个类簇可以对应一个或多个类型标签，一张图像可以对应一个或多个实体标签。

P (k) = \frac{\exp (w_{k}^{T} x)}{Σ_{i = 1}^{N} \exp (w_{i}^{T} x)}

分类器选取模块303，用于根据所述每个图像分类器输出的概率值，从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器。

图像选取模块304，用于确定所述目标图像分类器中的每张图像与所述待识别图像的相似度，并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像。

图像标注模块305，用于使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签，对所述待识别图像进行标注。

可选的，如图3所示，本发明实施例中的装置还可以进一步包括：

第二提取模块306，用于提取多张图像中的每张图像的CNN特征，并对所述每张图像对应的文本信息进行识别得到所述每张图像的实体标签。

图像分类模块307，用于根据所述每张图像的CNN特征，将所述多张图像进行分类得到多个类簇。

标签确定模块308，用于根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签。

在本发明实施例中，首先提取待识别图像的CNN特征；然后将待识别图像输入到预建的图像分类器集合中，并根据待识别图像的CNN特征获取图像分类器集合中每个图像分类器输出的概率值，根据每个图像分类器输出的概率值，选取多个图像集合中概率值最高的图像分类器作为目标图像分类器；其次确定目标图像分类器中的每个类簇中的每张图像与待识别图像的相似度，并选取目标图像分类器中的每个类簇中与待识别图像的相似度最高的图像作为目标图像；最后使用目标图像分类器中的每个类簇对应的类型标签以及目标图像分类器中的每个类簇中的目标图像对应的实体标签，对待识别图像进行标注。通过两次相似度匹配计算对待识别图像进行标注，提高了图像识别的精确性。

请参考图5，图5是本发明实施例提出的另一种图像内容识别装置的结构示意图。如图所示，该装置可以包括：至少一个处理器501，例如CPU，至少一个接收器503，至少一个存储器504，至少一个发送器505，至少一个通信总线502。其中，通信总线502用于实现这些组件之间的连接通信。其中，本发明实施例中装置的接收器503和发送器505可以是有线发送端口，也可以为无线设备，例如包括天线装置，用于与其他节点设备进行信令或数据的通信。存储器504可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器。存储器504可选的还可以是至少一个位于远离前述处理器501的存储装置。存储器504中存储一组程序代码，且处理器用于调用存储器中存储的程序代码，用于执行以下操作：

提取待识别图像的CNN特征；

其中，处理器501还可以执行如下操作步骤：

获取所述目标图像分类器中每张图像的CNN特征；

其中，处理器501还可以执行如下操作步骤：

根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签。

其中，处理器501还可以执行如下操作步骤：

统计所述每个类簇中的图像的同一实体标签的个数；

需要说明的是，对于前述的各个方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某一些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(英文：Read-OnlyMemory，简称：ROM)、随机存取器(英文：RandomAccessMemory，简称：RAM)、磁盘或光盘等。

以上对本发明实施例所提供的内容下载方法及相关设备、系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图像内容识别方法，其特征在于，所述方法包括：

提取待识别图像的CNN特征；

2.如权利要求1所述的方法，其特征在于，所述每个图像分类器对应一个系数向量，所述根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值包括：

3.如权利要求2所述的方法，其特征在于，所述根据所述每个图像分类器与所述待识别图像的向量内积，计算所述每个图像分类器输出的概率值包括:

4.如权利要求2所述的方法，其特征在于，所述确定所述目标图像分类器中的每张图像与所述待识别图像的相似度包括：

获取所述目标图像分类器中每张图像的CNN特征；

5.如权利要求1所述的方法，其特征在于，所述提取待识别图像的CNN特征之前，还包括：

6.如权利要求5所述的方法，其特征在于，所述根据所述多个类簇中每个类簇中的图像的实体标签，确定所述每个类簇的类型标签包括：

统计所述每个类簇中的图像的同一实体标签的个数；

7.一种图像内容识别装置，其特征在于，所述装置包括：

第一提取模块，用于提取待识别图像的CNN特征；

8.如权利要求7所述的装置，其特征在于，所述每个图像分类器对应一个系数向量，所述概率计算模块包括：

9.如权利要求8所述的装置，其特征在于，所述概率计算单元具体用于:

10.如权利要求8所述的装置，其特征在于，所述图像选取模块具体用于：

获取所述目标图像分类器中每张图像的CNN特征；

11.如权利要求7所述的装置，其特征在于，所述装置还包括：

12.如权利要求11所述的装置，其特征在于，所述标签确定模块具体用于：

统计所述每个类簇中的图像的同一实体标签的个数；