CN107545271A

CN107545271A - 图像识别方法、装置和系统

Info

Publication number: CN107545271A
Application number: CN201610499639.8A
Authority: CN
Inventors: 孙佰贵; 刘扬; 华先胜
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2016-06-29
Filing date: 2016-06-29
Publication date: 2018-01-05
Anticipated expiration: 2036-06-29
Also published as: CN107545271B

Abstract

本申请提出一种图像识别方法、装置和系统，该方法包括：获取待识别图像；获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。该方法能够提高对二分类图像的识别效果。

Description

图像识别方法、装置和系统

技术领域

本申请涉及图像处理技术领域，尤其涉及一种图像识别方法、装置和系统。

背景技术

由于图像具有的美观、直观等优点，很多信息都可以采用图像形式进行展示，例如，将商品信息以图像形式展示。但是，不少商品图像会在商品主体外，带有促销类文字、广告类文字、水印、logo等非主体信息，这部分信息可以通俗称为图像上的牛皮癣，相应的包含牛皮癣的图像可以称为牛皮癣图像。由于图像上的牛皮癣会严重影响用户体验，因此需要识别出牛皮癣图像，以便后续进行图像过滤等处理。

相关技术中，通常是采用文本行检测方法识别牛皮癣图像。但是，由于图像中的牛皮癣部分的样式越来越多，甚至是logo等非文本信息，因此，采用文本行检测技术对牛皮癣图像进行识别的效果并不理想。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的一个目的在于提出一种图像识别方法，该方法可以提高对二分类图像的识别效果。

本申请的另一个目的在于提出一种图像识别装置。

本申请的另一个目的在于提出一种图像识别系统。

为达到上述目的，本申请第一方面实施例提出的图像识别方法，包括：获取待识别图像；获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

本申请第一方面实施例提出的图像识别方法，图像识别模型是通过对训练图像进行聚类，以及对训练样本进行机器学习后生成的，相对于文本行检测方式可以提高图像的二分类的识别效果。

为达到上述目的，本申请第二方面实施例提出的图像识别装置，包括：第一获取模块，用于获取待识别图像；第二获取模块，用于获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；识别模块，用于采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

本申请第二方面实施例提出的图像识别装置，图像识别模型是通过对训练图像进行聚类，以及对训练样本进行机器学习后生成的，相对于文本行检测方式可以提高图像的二分类的识别效果。

为达到上述目的，本申请第三面实施例提出的图像识别系统，所述系统包括：至少一个处理器和至少一个存储器，所述存储器用于存储可操作指令；所述处理器用于读取所述可操作指令，以执行：获取待识别图像；获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

本申请第三面实施例提出的图像识别系统，图像识别模型是通过对训练图像进行聚类，以及对训练样本进行机器学习后生成的，相对于文本行检测方式可以提高图像的二分类的识别效果。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本申请一个实施例提出的图像识别方法的流程示意图；

图2是本申请另一个实施例提出的图像识别方法的流程示意图；

图3是图2对应的模块间的交互示意图；

图4是本申请实施例中训练阶段的卷积神经网络的组成示意图；

图5是本申请实施例中预测阶段的卷积神经网络的组成示意图；

图6是本申请实施例中待识别图像及识别出的二分类得分的示意图；

图7是本申请一个实施例提出的图像识别装置的结构示意图；

图8是本申请另一个实施例提出的图像识别装置的结构示意图；

图9是本申请一个实施例提出的图像识别系统的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。相反，本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本申请一个实施例提出的图像识别方法的流程示意图。

参见图1，本实施例的方法包括：

S11：获取待识别图像。

其中，待识别是一个给定的图像，以识别该图像是否是某一指定类型的图像。以商品图像为例，本实施例中指定类型的图像是指商品图像中不仅包括商品主体，还包括促销类文字、广告类文字、水印、logo等非主体信息，以下将该指定类型的图片通俗称为牛皮癣图像。

待识别图像可以具体应用于图像识别流程的预测阶段，作为图像识别装置的输入图像。

其中，图像识别流程可以包括：预测阶段和训练阶段，预测阶段用于识别一张图像是否是指定类型的图像，训练阶段可以用于生成图像识别模型，以将图像识别模型用于预测阶段的识别。

例如，可以将一个商品图像作为待识别图像，识别该商品图像是否是牛皮癣图像。

S12：获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的。

其中，如上所示，图像识别流程可以包括预测阶段和训练阶段。训练阶段是在预测阶段之前预先完成的。

具体的，图像识别模型可以是在训练阶段生成的，从而在预测阶段可以直接获取已经生成的图像识别模型，以用于后续的图像识别。

在训练阶段生成图像识别模型时，可以收集大量的训练图像，并为每个训练图像标注二分类标签，其中，二分类标签用于表明训练图像是否是牛皮癣图像，例如，如果一个训练图像是牛皮癣图像，则该训练图像的二分类标签可以用字符“1”表示，否则，如果一个训练图像不是牛皮癣图像，则该训练图像的二分类标签可以用字符“0”表示。

另外，在收集到训练图像后，可以对训练图像进行聚类，确定每个训练图像的聚类标签。例如，聚类的数量用k(k是可设置的)表示，每个训练图像的聚类标签可以使用k个数字字符中的任一个表示。

在得到每个训练图像的聚类标签和二分类标签后，可以将训练图像及对应的聚类标签和二分类标签作为训练样本，进行机器学习，生成图像识别模型。

具体的，机器学习可以具体是深度机器学习。

进一步的，深度机器学习可以具体是指采用卷积神经网络对训练样本进行训练。

S13：采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

其中，在预测阶段，获取到待识别图像以及图像识别模型后，就可以采用图像识别模型对待识别图像进行识别。

如上所示，本实施例的二分类标签是用于标识图像是否是牛皮癣图像，因此，上述的二分类得分是用于表明待识别图像的牛皮癣程度的得分，例如，该得分越高表明待识别图像为牛皮癣的可能性越高。

另外，可以设置一个阈值，如果待识别图像的上述的二分类得分大于该阈值，则确定待识别图像是牛皮癣图像。

另外，如果确定待识别图像是牛皮癣图像后，可以过滤掉该牛皮癣图像。

本实施例中，图像识别模型是通过对训练图像进行聚类，以及对训练样本进行机器学习后生成的，相对于文本行检测方式可以提高图像的二分类的识别效果。

图2是本申请另一个实施例提出的图像识别方法的流程示意图。

图3是图2对应的模块间的交互示意图。

本实施例的方法可以包括：训练阶段和预测阶段。

其中，在训练阶段，可以通过聚类和机器学习生成图像识别模型；在预测阶段，可以通过已经生成的图像识别模型，对待识别图像进行识别，确定待识别图像的二分类得分。本实施例的二分类以图像是否是牛皮癣图像为例。

本实施例中，聚类算法以kmeans聚类算法为例。可以理解的是，聚类算法不限于此，还可以是层次聚类、SOM、FCM等聚类算法。

本实施例中，机器学习以深度机器学习为例，深度机器学习时采用神经网络进行训练。进一步的，本实施例中以神经网络是卷积神经网络(Convolutional NeuralNetwork，CNN)为例。

参见图2，本实施例的方法包括：

S201：获取大量的训练图像。

其中，在训练阶段，可以收集大量的图像(如几万张)作为训练图像。

离并对这些图像进行二分类标注(如标注字符“1”表明是牛皮癣图像，标注字符“0”表明不是牛皮癣图像)后作为训练样本，以训练生成图像识别模型。

S202：将每个训练图像归一化到预设大小。

由于收集的图像可能大小不一，为了方便处理，可以先对这些图像进行归一化，例如，归一化到256x256的大小。

S203：提取归一化处理后的每个训练图像的抽象特征。

在计算机图形学中，可以分为真实感绘制和非真实感绘制，真实感绘制提供了一种精确模拟真实世界的方法，非真实感绘制的目标不在于所生成的图像的真实性，而主要用于表现图像的艺术特质、模拟艺术式的绘制风格或作为真实感绘制的有效补充，比如线条绘制，线条绘制使用较少的数据量(如线条)，却有效的传递了物体的形状。在可视信息的传递以及物体表示等方面，线条绘制甚至比真实感绘制更具说服力。

抽象化是指以缩减一个场景的信息量来将其广义化的过程，主要是为了只保存与一特定目的相关的信息，例如，将一个篮球抽象为一个球，只保留球的一般属性以及篮球的最显著特征。

因此，一个图像的抽象特征通常是指图像的一般属性特征及最显著特征。

具体的，可以通过特征提取技术，提取到图像的抽取特征。

特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。

常用的特征提取方法包括：统计方法、几何法、模型法、信号处理法等。

例如，在采用模型法时，可以先生成特征提取模型，再根据特征提取模型提取图像的抽象特征。

进一步的，可以采用神经网络对训练样本进行训练，以生成特征提取模型。而具体的神经网络不限定。

S204：对所有训练图像的抽象特征进行kmeans聚类，得到每个训练图像的聚类标签。

其中，kmeans聚类算法是指：将输入的n个数据对象(如所有训练图像的抽象特征)划分为k个聚类，其中，k是可设置的，例如是100。

kmeans聚类算法是一种经典的聚类算法，基本思想是：以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。

因此，通过kmeans聚类算法，可以将每个训练图像的抽象特征归类到k种聚类中的一种，从而将聚类到的聚类标签作为相应的训练图像的聚类标签。

例如，k＝100时，训练图像的聚类标签是0～99中的一个。

S205：获取每个训练图像的二分类标签。

其中，在收集到训练图像后，可以对每个训练图像标注二分类标签，从而可以在标注信息中获取到二分类标签。

本实施例中，二分类标签用于表明训练图像是否是牛皮癣图像，例如，如果一个训练图像是牛皮癣图像，则该训练图像的二分类标签可以用字符“1”表示，否则，如果一个训练图像不是牛皮癣图像，则该训练图像的二分类标签可以用字符“0”表示。

S206：根据每个训练图像以及对应的聚类标签和二分类标签，采用卷积神经网络进行训练，生成图像识别模型。

其中，卷积神经网络是一种神经网络，神经网络具有多个分层，每个分层中有一个或多个神经元。在卷积神经网络中，不同层之间可以进行卷积运算。

在将卷积神经网络应用于图像分类时，卷积神经网络可以包括：卷积层和分类层。其中，卷积层和分类层的数量是可设置的，可以是一个或多个。卷积层用于进行卷积运算，在卷积运算时，可以采用一个或多个滤波器进行，因此，每个卷积层采用的滤波器的个数是可设置的。分类层是一种全连接层，用于得到分类数值。可以理解的是，卷积神经网络还可以包括池化层、其他的全连接层。

本实施例中，参见图4，以3个卷积层和2个分类层为例。

其中，两个分类层中的一个用于kmeans聚类的分类(如用第一分类层表示)，另一个用于牛皮癣图像或非牛皮癣图像的分类(如用第二分类层表示)，因此，第一分类层的维度是k(如100)，第二分类层的维度是2。

分类层采用的分类器可以具体是softmax分类器。

在采用卷积神经网络进行训练时，训练图像可以作为卷积神经网络的输入X，训练图像的聚类标签作为第一分类层的输出Y1，训练图像的二分类标签作为第二分类层的输出Y2，通过X和Y1确定第一分类层对应的第一损失函数(loss1)，通过X和Y2确定第二分类层对应的第二损失函数(loss2)，通过最小化第一损失函数和第二损失函数，可以得到训练模型参数，该训练模型可以称为图像识别模型，从而生成了图像识别模型。

可以理解的是，S21-S26是在训练阶段完成的。

进一步的，在预测阶段，可以根据训练阶段生成的图像识别模型进行图像识别。

参见图2，在预测阶段，可以执行如下流程：

S207：接收待识别图像。

其中，待识别图像是一个给定的图像，以识别该图像是否是牛皮癣图像。

测试图片可以具体应用于图像识别流程的预测阶段，作为图像识别装置的输入图像。

S208：对待识别图像进行归一化。

其中，预测阶段采用的归一化大小与训练阶段的一致，例如，将待识别图像归一化到256x256的大小。

S209：采用训练阶段生成的图像识别模型，对归一化后的待识别图像进行识别，确定待识别图像的二分类得分。

其中，预测阶段采用的图像识别模型与训练阶段生成的图像识别模型一致。

例如，训练阶段在生成图像识别模型时采用的卷积神经网络如图4所示，包括3个卷积层和2个分类层，则预测阶段采用的图像识别模型也具有相同的3个卷积层和2个分类层，如图5所示。

与训练阶段不同的是，在训练阶段需要对应每个分类层确定相应的损失函数，以确定卷积神经网络中每层的参数。而在预测阶段，由于卷积神经网络中每层的参数已确定，因此，在预测阶段，是将待识别图像作为卷积神经网络的输入，经过每层的参数运算后，会得到一个输出值，该输出值是一个概率值，该概论值可以称为二分类得分。

对应不同的待识别图像，经过上述的如图5所示的作为图像识别模型的卷积神经网络，可以得到不同的二分类得分。例如，参见图6，两个不同的待识别图像对应的二分类得分可以在相应的图像下方表示。

在得到每个待识别图像的二分类得分后，可以依据该得分确定该待识别图像属于的类别。例如，本实施例中，该二分类得分越高，表明相应的图像是牛皮癣图像的可能性越高。如果一个待识别图像的二分类得分大于预设的阈值，则可以确定该待识别图像是牛皮癣图像。例如，图6中左侧的图像是非牛皮癣图像，右侧的图像是牛皮癣图像。

本实施例中，通过keams聚类确定图像的聚类标签，可以摒弃根据专家经验设计的规则和特征，更具有一般性和准确性。通过在卷积神经网络训练之前，预先进行过keams聚类，不依赖、受限于二分类的类内和类间间距的平衡性，能更鲁棒、更通用的处理二分类问题。通过卷积神经网络训练，可以在kmeans聚类挖掘的一般语义的基础上再挖掘出深层次的语义，完成牛皮癣图像或非牛皮癣图像的二分类。通过大量的训练样本进行训练，可以使得图像识别结果基本不会受牛皮癣文本、牛皮癣图像的大小、位置、方向、式样等因素的干扰。因此，相较传统方法，本实施例可以在综合性能上更优。

图7是本申请一个实施例提出的图像识别装置的结构示意图。

参见图7，本实施例的装置70包括：第一获取模块71、第二获取模块72和识别模块73。

第一获取模块71，用于获取待识别图像。

第二获取模块72，用于获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的。

其中，图像识别流程可以包括上述的预测阶段，还可以包括训练阶段。训练阶段是在预测阶段之前预先完成的。

在训练阶段生成图像识别模型时，可以收集大量的训练图像，并为每个训练图像标注二分类标签，其中，二分类标签用于表明训练图像是否是牛皮癣图像，例如，如果一个训练图像是牛皮癣图像，则该训练图像的二分类标签可以用1表示，否则，如果一个训练图像不是牛皮癣图像，则该训练图像的二分类标签可以用0表示。

另外，在收集到训练图像后，可以对训练图像进行聚类，确定每个训练图像的聚类标签。例如，聚类的数量用k(k是可设置的)表示，则每个训练图像的聚类标签是0～99中的一个值。

具体的，机器学习可以具体是深度机器学习。

识别模块73，用于采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

如上所示，本实施例的二分类标签是用于识别图像是否是牛皮癣图像，因此，上述的二分类得分是用于表明待识别图像的牛皮癣程度的得分，例如，该得分越高表明牛皮癣程度越高。

一些实施例中，参见图8，本实施例的装置70还包括：

用于生成图像识别模型的生成模块74，生成模块74包括：

收集单元741，用于获取训练图像；

聚类单元742，用于对所述训练图像进行聚类，确定每个训练图像的聚类标签；

获取单元743，用于获取每个训练图像的二分类标签；

训练单元744，用于根据每个训练图像及对应的聚类标签和二分类标签，进行机器学习训练，生成图像识别模型。

一些实施例中，聚类单元742具体用于：

提取每个训练图像的抽象特征；

对所述提取抽象特征进行聚类，得到每个训练图像的聚类标签。

一些实施例中，训练单元744在机器学习训练时采用卷积神经网络进行。

一些实施例中，参见图8，生成模块还包括：

归一化单元745，用于对所述训练图像进行归一化，以便所述聚类单元对归一化后的训练图像进行聚类。

一些实施例中，参见图8，该装置70还包括：

归一化模块75，用于对所述待识别图像进行归一化，以便所述识别模块对归一化后的训练图像进行识别。

可以理解的是，上述实施例中的装置与上述实施例的方法对应，关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9是本申请一个实施例提出的图像识别系统的结构示意图。如图9所示，该系统90包括：至少一个处理器91和至少一个存储器92，所述存储器92用于存储可操作指令；所述处理器91用于读取所述可操作指令，以执行：

获取待识别图像；

获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；

采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

上述的图像识别系统可以位于服务器中，或者位于用户终端，如移动设备中。

需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种图像识别系统，其特征在于，所述系统包括：至少一个处理器和至少一个存储器，所述存储器用于存储可操作指令；所述处理器用于读取所述可操作指令，以执行:

获取待识别图像；

2.一种图像识别方法，其特征在于，包括：

获取待识别图像；

3.根据权利要求1所述的方法，其特征在于，还包括：生成图像识别模型，所述生成图像识别模型，包括：

获取训练图像；

对所述训练图像进行聚类，确定每个训练图像的聚类标签；

获取每个训练图像的二分类标签；

根据每个训练图像及对应的聚类标签和二分类标签，进行机器学习训练，生成图像识别模型。

4.根据权利要求3所述的方法，其特征在于，所述对所述训练图像进行聚类，确定每个训练图像的聚类标签，包括：

提取每个训练图像的抽象特征；

5.根据权利要求3所述的方法，其特征在于，所述机器学习训练时采用卷积神经网络进行。

6.根据权利要求3所述的方法，其特征在于，所述获取训练图像之后，所述方法还包括：

对所述训练图像进行归一化，以便对归一化后的训练图像进行聚类。

7.根据权利要求2所述的方法，其特征在于，所述获取待识别图像之后，所述方法还包括：

对所述待识别图像进行归一化，以便对归一化后的训练图像进行识别。

8.一种图像识别装置，其特征在于，包括：

第一获取模块，用于获取待识别图像；

第二获取模块，用于获取图像识别模型，其中，所述图像识别模型是对训练样本进行机器学习后生成的，所述训练样本包括：训练图像、训练图像的聚类标签和训练图像的二分类标签，所述训练图像的聚类标签是对训练图像进行聚类后得到的；

识别模块，用于采用所述图像识别模型，对所述待识别图像进行识别，确定所述待识别图像的二分类得分。

9.根据权利要求8所述的装置，其特征在于，还包括：用于生成图像识别模型的生成模块，所述生成模块包括：

收集单元，用于获取训练图像；

聚类单元，用于对所述训练图像进行聚类，确定每个训练图像的聚类标签；

获取单元，用于获取每个训练图像的二分类标签；

训练单元，用于根据每个训练图像及对应的聚类标签和二分类标签，进行机器学习训练，生成图像识别模型。

10.根据权利要求9所述的装置，其特征在于，所述聚类单元具体用于：

提取每个训练图像的抽象特征；

11.根据权利要求9所述的装置，其特征在于，所述训练单元在机器学习训练时采用卷积神经网络进行。

12.根据权利要求9所述的装置，其特征在于，所述生成模块还包括：

归一化单元，用于对所述训练图像进行归一化，以便所述聚类单元对归一化后的训练图像进行聚类。

13.根据权利要求8所述的装置，其特征在于，还包括：

归一化模块，用于对所述待识别图像进行归一化，以便所述识别模块对归一化后的训练图像进行识别。