CN106803090A

CN106803090A - 一种图像识别方法和装置

Info

Publication number: CN106803090A
Application number: CN201611104702.XA
Authority: CN
Inventors: 王宇; 华锦芝; 潘岑蕙; 刘想; 张琦; 冯亮
Original assignee: China Unionpay Co Ltd
Current assignee: China Unionpay Co Ltd
Priority date: 2016-12-05
Filing date: 2016-12-05
Publication date: 2017-06-06

Abstract

本发明实施例涉及图像处理领域，尤其涉及一种图像识别方法和装置，用于对图像的种类进行识别。本发明实施例中，获取待识别图像；将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；将待识别图像按预设规则划分为多个子图像；将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；将第一特征向量和第二特征向量进行合并，得到第三特征向量；根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的，以确定待识别图像的种类类型。

Description

一种图像识别方法和装置

技术领域

本发明实施例涉及图像处理领域，尤其涉及一种图像识别方法和装置。

背景技术

ML(Machine Learning,机器学习)是研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。

信用卡图片产品分类是一个典型的分类问题，由于信用卡类别比较多，要求机器学习模型具有极强的特征提取能力，传统机器学习模型很难做到很好的分类效果。比如，现有技术中，利用传统的机器学习方法来对信用卡图片产品进行分类，传统的机器学习模型是基于人工的特征提取方法无法提取信用卡图片的深层次特征，只能实现信用卡发卡行或卡等级的基本分类，并不能实现信用卡种类的细分，对信用卡图片的识别率低、误识别率也高，这对信用卡图片相似度比较高的情况下尤为明显。

综上所述，现有技术对于信用卡产品分类采用传统机器学习模型进行分类，这种方法存在无法提取信用卡图片的深层次特征，识别率低、误识别率也高的缺点，因此，需要提出有效的方法来解决上述问题。

发明内容

本发明实施例提供了一种图像识别方法和装置，用以解决现有技术中采用传统机器学习模型对信用卡产品分类而存在无法提取信用卡图片的深层次特征，识别率低、误识别率也高的问题。

本发明实施例提供一种图像识别方法，包括：

获取待识别图像；

将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

将待识别图像按预设规则划分为多个子图像；

将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；

将第一特征向量和第二特征向量进行合并，得到第三特征向量；

根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。

可选地，样本特征库为将各类样本图像输入特征提取模型得到的，包括：

采用如下方式确定每类样本图像的第四特征向量：

将样本图像输入特征提取模型，得到样本图像的第五特征向量；

将样本图像按预设规则划分为多个子样本图像；

将多个子样本图像分别输入特征提取模型，得到多个子样本图像的第六特征向量；

将第五特征向量和第六特征向量进行合并，得到第四特征向量；

将第四特征向量与样本图像对应的种类类型存于样本特征库中。

可选地，将第一特征向量和第二特征向量进行合并，得到第三特征向量，包括：

将第一特征向量和第二特征向量进行合并，对合并后的第一特征向量和第二特征向量进行主成分分析PCA降维，得到第三特征向量；

将第五特征向量和第六特征向量进行合并，得到第四特征向量，包括：

将第五特征向量和第六特征向量进行合并，对合并后的第五特征向量和第六特征向量进行主成分分析PCA降维，得到第四特征向量。

可选地，特征提取模型是通过样本图像和深度卷积神经网络模型得到的，包括：

获取样本图像集，样本图像集中包括多个不同种类类型的样本图像；

对样本图像集中的样本图像进行变形处理，得到扩充后的样本图像集；

针对每个种类类型，将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，得到特征提取模型。

可选地，对样本图像集中的样本图片进行变形处理，包括以下至少之一：

镜像翻转、旋转、亮度调整。

可选地，将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，包括：

将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型中，前向传播得到损失函数loss值；

根据loss值，采用下降梯度算法反向传播调整深度卷积神经网络的参数，直至loss值符合预设条件。

本发明实施例还提供一种图像识别装置，包括：

获取单元：用于获取待识别图像；

第一输入单元：用于将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

划分单元：用于将待识别图像按预设规则划分为多个子图像；

第二输入单元：用于将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；

合并单元：用于将第一特征向量和第二特征向量进行合并，得到第三特征向量；

确定单元：用于根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。

可选地，确定单元具体用于：

采用如下方式确定每类样本图像的第四特征向量：

将样本图像按预设规则划分为多个子样本图像；

可选地，合并单元具体用于：

可选地，第一输入单元具体用于：

镜像翻转、旋转、亮度调整。

可选地，第一输入单元具体还用于：

本发明实施例中提供了一种图像识别方法和装置，获取待识别图像；将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；将待识别图像按预设规则划分为多个子图像；将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；将第一特征向量和第二特征向量进行合并，得到第三特征向量；根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。本发明实施例中通过将获取的待识别图像输入特征提取模型，提取待识别图像的第一特征向量；将待识别图像划分的多个子图像输入特征提取模型，提取多个子图像的第二特征向量，提取的待识别图像的第一特征向量和多个子图像的第二特征向量为提取的待识别图像的深层次特征，由于提取的是待识别图像的深层次特征，所以能够保证后续确定待识别图像的种类类型的准确率。然后将第一特征向量和第二特征向量进行合并，得到合并后的特征向量即第三特征向量，将第一特征向量和第二特征向量进行合并的好处是：既能够提升待识别图像特征提取的精度，又能够保证后面相似度计算的效率。由于第三特征向量和样本库中各类样本图像的第四特征向量已经是图像的深度特征，根据第三特征向量和样本库中各类样本图像的第四特征向量的相似度的计算，能够有效保证确定出的待识别图像种类类型的正确率很高。此外，本发明提供的待识别图像深度特征提取与确定种类类型的过程是分离的，可以看出，本发明的灵活性高。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍。

图1为本发明实施例提供了一种图像识别方法流程示意图；

图2为本发明实施例提供了对深度卷积神经网络的训练过程流程示意图；

图3为本发明实施例提供的一种图像识别装置结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

应理解，本发明实施例的技术方案可以应用于各种需要定位产品种类的场景，比如可以是信用卡产品的种类识别、银行卡产品的种类识别等，更具体的还可以是中信百度金融联名卡、中信腾讯QQ会员联名卡等，按等级分的话，可以是普卡、金卡、白金卡、钻石卡等。

图1示例性示出了本发明实施例提供的一种图像识别方法流程示意图，如图1所示，包括以下步骤：

步骤S101：获取待识别图像；

步骤S102：将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

步骤S103：将待识别图像按预设规则划分为多个子图像；

步骤S104：将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；

步骤S105：将第一特征向量和第二特征向量进行合并，得到第三特征向量；

步骤S106：根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。

步骤S101中，获取待识别图像，具体来说，通过一定的方式获取需要识别的图像，其中，待识别图像可以根据实际情况，可以获取一张待识别图像，也可以获取多张待识别图像，具体实施中，待识别图像可以是信用卡的图像，信用卡图像的获取方式可以实际中用户手中存在的信用卡图像，也可以通过信用卡营销类网站爬取信用卡图像，还可以通过对信用卡进行实际拍照获取。

步骤S102中，将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的，具体来说，将待识别图像输入特征提取模型中，通过特征提取模型提取待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的，具体实施中，第一特征向量可以是个矩阵，记为A₁，矩阵中的每个数字代表着该待识别图像的特征，比如，可以是信用卡上的图案信息，通过软件解析，以数字的形式表示出来，形成一个矩阵，这个矩阵可以是

步骤S103中，将待识别图像按预设规则划分为多个子图像，具体实施中，可以将待识别图像平均切分为多块，获得多个子图像，比如分成3块，其中，预设的规则除了可以是平均切分，也可以采用其它的规则。将待识别图像平均切分为多个子图像是为了充分提取待识别图像的深层次特征。

步骤S104中，将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量，具体来说，将待识别图像中划分的多个子图像分别输入特征提取模型中，通过该特征提取模型提取多个子图像的第二特征向量，具体实施中，可以分别对各个子图像提取特征向量，各个子图像的特征向量也可以是矩阵，记为A₂,A₃,A₄,…，矩阵中的各个数字代表待识别图像的深层次特征，深层次特征可以指信用卡的图案信息，比如，子图像取3个，分别为A₂,A₃,A₄，假如通过将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量，也就是得到待识别图像更深层次的特征，大大提升后续对待识别图像的种类类型的识别的准确率。

步骤S105中，将第一特征向量和第二特征向量进行合并，得到第三特征向量，具体来说，可以将第一特征向量和第二特征向量按照顺序竖着在矩阵中往下罗列，当然也可以采用其它的方式合并，得到第三特征向量，具体实施中，比如，第一特征向量第二特征向量A₂,A₃,A₄分别为：将第一特征向量和第二特征向量进行合并得到第三特征向量A：需要说明的一点是，由于第一特征向量是2行2列的矩阵，而第二特征向量是3行3列的矩阵，而将第一特征向量和第二特征向量进行合并的时候，由于矩阵的维度不相等，对于第一特征向量的矩阵相比于第二特征向量的矩阵缺少的那一列可以直接补0。将第一特征向量和第二特征向量进行合并，得到第三特征向量，既能够提升待识别图像特征提取的精度，又能够保证后面待识别图像与样本特征库中各类样本图像的相似度的计算效率。

步骤S106中，根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的，具体来说，通过比对第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度来找出与待识别图像最匹配的种类类型，这里的种类类型可以是学生信用卡、消费类的信用卡等，其中，样本特征可中预先存有样本图像的各种类型，而样本特征库是通过将各类样本图像输入特征提取模型得到的。其中，第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度的计算可以通过余弦相似度公式来计算，通过计算找到余弦值最接近1的样本特征库中特征向量对应的种类类型，即为待识别图像的种类类型。除了可以采用余弦相似度公式来计算第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度外，还可以采用其它的方式来计算，只要能够判断出第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度的方式都可以。前面的几个步骤中是提供了保证对待识别图像的识别效果，而这一步骤是在保证对待识别图像的识别效果的前提下，保证识别的速度更快。

采用如下方式确定每类样本图像的第四特征向量：

将样本图像输入特征提取模型，得到样本图像的第五特征向量；将样本图像按预设规则划分为多个子样本图像；将多个子样本图像分别输入特征提取模型，得到多个子样本图像的第六特征向量；将第五特征向量和第六特征向量进行合并，得到第四特征向量；将第四特征向量与样本图像对应的种类类型存于样本特征库中。具体来说，可以取多种类型的样本图像作为输入特征提取模型形成样本特征库，比如，可以取1000种，具体取多少种可以根据具体的实际情况来定。将第一种类类型的样本图像输入到特征提取模型中，提取样本图像的第五特征向量，比如第五特征向量称为B₁，取将样本图像按预设规则划分为多个子样本图像，可以是将样本图像平均分成多块，得到多个子样本图像，将如多个子样本图像分别输入特征提取模型，得到多个子样本图像的第六特征向量，比如分别为B₂,B₃,B₄,…，这里就取三个，分别为B₂,B₃,B₄，取将第五特征向量B₁与第六特征向量B₂,B₃,B₄进行合并，得到第四特征向量B，将第四特征向量B与其所对应的种类类型存储于样本特征库中，可以以表格的形式存储，其中，每一个样本图像的类型是事先标记好的，可以通过人工标记的方式对每张样本图像的种类类型进行标记，然后对每一种类型建立文件夹，将每种种类类型下所属的样本图像存于所在的种类类型文件夹中。对样本图像的第一种类型的第四特征向量和与其所对应的种类类型存于样本库中之后，更换下一种类类型的样本图像重复以上步骤，最终将其特征向量以及种类类型存于样本特征库中，每一种类类型迭代以上步骤，直到将所有种类类型的样本图像的特征向量和对应的种类类型存于样本特征库中。另外，在实际应用中，如果有新的产品种类推出，需要将该产品图像的特征补充到特征库中，并不需要重新建立样本特征库，这种样本特征库的建立方法既方便又高效。

将第一特征向量和第二特征向量进行合并，对合并后的第一特征向量和第二特征向量进行主成分分析PCA降维，得到第三特征向量，具体来说，本方法是对步骤S105更优的一种实现方式，本方法与步骤S105的不同之处在于对合并后的第一特征向量和第二特征向量进行PCA(Principal Component Analysis,主成分分析)降维，对合并后的第一特征向量和第二特征向量进行PCA降维后得到第三特征向量，比如，还要对步骤S105中的进行PCA特征降维，才得到最终的特征向量。这里的PCA降维方法是一种统计分析方法，用于降维。

将第五特征向量和第六特征向量进行合并，对合并后的第五特征向量和第六特征向量进行主成分分析PCA降维，得到第四特征向量，具体来说，就是对合并后的第五特征向量和第六特征向量进行PCA降维，得到最终的特征向量。

以上对待识别图像的合并后的特征向量再进行PCA降维的方式，既能够提升对待识别图像特征提取的精度，又能够保证后面对待识别图像的相似度计算的效率。对样本图像的合并后的特征向量再进行PCA降维的方式，能够保证样本特征库中的样本图像每一种类类型的特征向量与其对应的种类类型的正确性与合理性。

对于特征提取模型主要采用对深度卷积神经模型进行训练，而深度卷积神经网络结构主要包括：卷积层、最大池化层、全连接层、softmax层。表1示例性地示出了具体的深度卷积神经网络结构，如表1所示：

表1：深度卷积神经网络结构

Type	Patch size/stide	Output size
			conv	3×3/1	224×224/64
conv	3×3/1	224×224/64
			maxpool	2×2/2	112×112/64
conv	3×3/1	112×112/128
			conv	3×3/1	112×112/128
maxpool	2×2/2	56×56/128
			conv	3×3/1	56×56/256
conv	3×3/1	56×56/256
			conv	3×3/1	56×56/256
maxpool	2×2/2	28×28/256
			conv	3×3/1	28×28/512
conv	3×3/1	28×28/512
			conv	3×3/1	28×28/512
maxpool	2×2/2	14×14/512
			conv	3×3/1	14×14/512
conv	3×3/1	14×14/512
			conv	3×3/1	14×14/512
maxpool	2×2/2	7×7/512
			fc		1×1/4096
fc		1×1/4096
			fc		1×1/1000
softmax		1×1/1000

表1中，第1列代表该网络的包括的结构类型，conv代表卷积层、maxpool代表最大池化层、fc代表全连接层；第2列Patch size/stide代表卷积核的大小/步长；第3列Outputsize代表输出卷积核的大小，其中，该列中的m×n/l，m×n 代表输出矩阵的长宽，也就是输出的卷积核的长宽，l代表要卷积的图像的通道数，也可以理解为输出矩阵的高。表1中的深度卷积神经网络中各个层的卷积核大小以及步长可以根据实际情况进行调整，调整之后再使用该深度卷积神经网络。

获取样本图像集，样本图像集中包括多个不同种类类型的样本图像；对样本图像集中的样本图像进行变形处理，得到扩充后的样本图像集；针对每个种类类型，将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，得到特征提取模型。具体来说，可以通过网站爬取的方式和拍照的方式来获取样本图像集；对样本图像集中的每张样本图像进行标记种类类型，还要对标记过种类类型的样本图像进行变形处理，得到扩充后的样本图像集，该扩充后的样本图像集包括原始样本图像和变形处理后的样本图像；针对扩充后的样本图像集中的每个种类类型，将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，得到特征提取模型。对标记过种类类型的样本图像进行变形处理得到扩充后的样本图像集，这样做的目的不仅可以更深层次的提取样本图像的特征，而且可以增加对深度卷积神经网络模型进行训练的个数，这样训练出来的特征提取模型更可靠。

可选地，对样本图像集中的样本图像进行变形处理，包括以下至少之一：

镜像翻转、旋转、亮度调整。具体来说，对样本图像集中的样本图像可以通过镜像翻转、旋转、亮度调整的方式进行变形处理，也可以采用其它的方式；比如，对通过拍照的方式获取的样本图像，由于拍出来的样本图像和实际的样本图像不太可能完全一样，可能拍出来的样本图像是歪的，这时可以通过软件对其进行切割处理使其变为方方正正的样本图像。当然，在具体实施中，可以根据样本图像的具体情况来进行处理，可能一张样本图像只需要进行一种处理，也可能需要进行多种处理。

将种类类型的样本图像和种类类型输入初始化的深度卷积神经网络模型中，前向传播得到损失函数loss值；根据loss值，采用下降梯度算法反向传播调整深度卷积神经网络的参数，直至loss值符合预设条件。

对于特征提取模型的整个训练过程将结合表1的深度卷积神经网络来进行一个具体的说明：

(1)可以将样本图像集按比例5:1随机分为训练集和验证集，训练集用于训练深度卷积神经网络，验证集用于训练过程中对网络识别率的验证，将所有样本图像集中的图像大小归一化成224×224大小，并训练集和验证集与标签转换为lmdb格式的，转换成lmdb格式是为了便于读取，采用其它格式的也可以，如果采用其它格式并不方便读取；

(2)用标准差为0.1的xavier算法根据神经元数量随机初始化网络中待训练参数，比如对卷积核大小为3×3的卷积核进行初始化，需要初始化其矩阵或偏移量；

(3)将归一化为224×224大小的训练集中的样本图像作为深度卷积神经网络的输入，输入到深度卷积神经网络中，同时将训练集中的样本图像种类标注送给softmax分类器；进行一次前向传播，依次通过卷积层进行特征提取，再通过maxpool层，去除卷积值冗余，减少后续计算量，然后重复通过其它的卷积层和maxpool层，直至softmax层；其中，前向传播主要是为了计算步骤(4)中的损失函数loss值；

(4)根据softmax输出样本图像种类判别概率与实际产品种类的差值计算得到损失函数loss值；其中，此处的loss值主要用于后向传播，实际产品的种类是可以通过人工标记的方式标记，实际过程中，它是一个向量，向量中，对应标签位的值为1，其它标签位的值为0；具体实施中，比如有500种样本图像，分别记为a1,a2,…a500，首先将a1送给分类器，然后输出a1与a1,a2,…a500之间的相似概率，假如分别为0.8,0.7,0.5,…，总共500个概率，然后将这500个概率与人工标记的这500中的样本图像的数字作差值，最终得到500个数字，再利用loss公式算出一个数字，后面的其它种类的loss值的算法以此类推。

(5)使用反向传播算法，根据梯度下降算法沿着loss下降的方向微调整个网络的参数值；其中，反向传播算法主要用来求偏导，梯度下降算法利用偏导值求最优值；

(6)更换样本图像迭代重复上述步骤，直到loss下降到合适程度后，停止训练。

对于训练好的特征提取模型可以通过验证集来进行验证，如果发现特征提取模型中存在错误，可以根据结果来调整深度卷积神经网络，并继续训练深度卷积神经网络，直到特征提取模型达到较好的效果为止。

具体实施中，将训练集中的样本图像大小归一化后，送入到深度卷积神经网络的输入端，然后经过深度卷积神经网络中的各个层进行样本图像处理，下面以一个流程图的方式将此过程展示出来，图2示例性地示出了对深度卷积神经网络的训练过程，如图2所示：包括以下步骤：

步骤S201：归一化样本图像大小；将归一化之后的样本图像输入到深度卷积神经网络；

步骤S202：conv3-64、conv3-64；经过两个卷积层，卷积核的大小为3×3，步长为1，输出224×224×64大小的图像；

步骤S203：经过最大池化层；卷积核的大小为2×2，步长为2，输出112×112×64大小的图像；

步骤S204：conv3-128、conv3-128；经过两个卷积层，卷积核的大小为3×3，步长为1，输出112×112×128大小的图像；

步骤S205：经过最大池化层；卷积核的大小为2×2，步长为2，输出56×56×128大小的图像；

步骤S206：conv3-256、conv3-256、conv3-256；经过三个卷积层，卷积核的大小为3×3，步长为1，输出56×56×256大小的图像；

步骤S207：经过最大池化层；卷积核的大小为2×2，步长为2，输出28×28×256大小的图像；

步骤S208：conv3-512、conv3-512、conv3-512；经过三个卷积层，卷积核的大小为3×3，步长为1，输出28×28×512大小的图像；

步骤S209：经过最大池化层；卷积核的大小为2×2，步长为2，输出14×14×512大小的图像；

步骤S210：conv3-512、conv3-512、conv3-512；经过三个卷积层，卷积核的大小为3×3，步长为1，输出14×14×512大小的图像；

步骤S211：经过最大池化层；卷积核的大小为2×2，步长为2，输出7×7×512大小的图像；

步骤S212：fc-4096、fc-4096、fc-4096；经过三个全连接层，前两个全连接层输出1×1×4096大小的图像，第三个全连接层输出1×1×1000大小的图像；

步骤S213：softmax层；经过此层，输出1×1×1000大小的图像。

基于相同构思，本发明实施例提供的一种图像识别装置，如图3所示，该装置包括获取单元301、第一输入单元302、划分单元303、第二输入单元304、合并单元305、确定单元306。其中：

获取单元301：用于获取待识别图像；

第一输入单元302：用于将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

划分单元303：用于将待识别图像按预设规则划分为多个子图像；

第二输入单元304：用于将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；

合并单元305：用于将第一特征向量和第二特征向量进行合并，得到第三特征向量；

确定单元306：用于根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。

可选地，确定单元306具体用于：

采用如下方式确定每类样本图像的第四特征向量：

将样本图像按预设规则划分为多个子样本图像；

可选地，合并单元305具体用于：

可选地，第一输入单元302具体用于：

镜像翻转、旋转、亮度调整。

可选地，第一输入单元302具体还用于：

从上述内容可看出：本发明实施例中提供一种图像识别装置，获取待识别图像；将待识别图像输入特征提取模型，得到待识别图像的第一特征向量，特征提取模型是通过样本图像和深度卷积神经网络模型得到的；将待识别图像按预设规则划分为多个子图像；将多个子图像分别输入特征提取模型，得到多个子图像的第二特征向量；将第一特征向量和第二特征向量进行合并，得到第三特征向量；根据第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定待识别图像的种类类型，样本特征库为将各类样本图像输入特征提取模型得到的。本发明实施例中通过将获取的待识别图像输入特征提取模型，提取待识别图像的第一特征向量；将待识别图像划分的多个子图像输入特征提取模型，提取多个子图像的第二特征向量，提取的待识别图像的第一特征向量和多个子图像的第二特征向量为提取的待识别图像的深层次特征，由于提取的是待识别图像的深层次特征，所以能够保证后续确定待识别图像的种类类型的准确率。然后将第一特征向量和第二特征向量进行合并，得到合并后的特征向量即第三特征向量，将第一特征向量和第二特征向量进行合并的好处是：既能够提升待识别图像特征提取的精度，又能够保证后面相似度计算的效率。由于第三特征向量和样本库中各类样本图像的第四特征向量已经是图像的深度特征，根据第三特征向量和样本库中各类样本图像的第四特征向量的相似度的计算，能够有效保证确定出的待识别图像种类类型的正确率很高。此外，本发明提供的待识别图像深度特征提取与确定种类类型的过程是分离的，可以看出，本发明的灵活性高。

本领域内的技术人员应明白，本发明的实施例可提供为方法、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种图像识别方法，其特征在于，包括：

获取待识别图像；

将所述待识别图像输入特征提取模型，得到所述待识别图像的第一特征向量，所述特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

将所述待识别图像按预设规则划分为多个子图像；

将所述多个子图像分别输入所述特征提取模型，得到所述多个子图像的第二特征向量；

将所述第一特征向量和所述第二特征向量进行合并，得到第三特征向量；

根据所述第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定所述待识别图像的种类类型，所述样本特征库为将所述各类样本图像输入所述特征提取模型得到的。

2.如权利要求1所述的方法，其特征在于，所述样本特征库为将所述各类样本图像输入所述特征提取模型得到的，包括：

采用如下方式确定每类样本图像的第四特征向量：

将所述样本图像输入所述特征提取模型，得到所述样本图像的第五特征向量；

将所述样本图像按所述预设规则划分为多个子样本图像；

将所述多个子样本图像分别输入所述特征提取模型，得到所述多个子样本图像的第六特征向量；

将所述第五特征向量和所述第六特征向量进行合并，得到所述第四特征向量；

将所述第四特征向量与所述样本图像对应的种类类型存于所述样本特征库中。

3.如权利要求2所述的方法，其特征在于，

将所述第一特征向量和所述第二特征向量进行合并，得到第三特征向量，包括：

将所述第一特征向量和所述第二特征向量进行合并，对合并后的所述第一特征向量和所述第二特征向量进行主成分分析PCA降维，得到所述第三特征向量；

将所述第五特征向量和所述第六特征向量进行合并，得到所述第四特征向量，包括：

将所述第五特征向量和所述第六特征向量进行合并，对合并后的所述第五特征向量和所述第六特征向量进行主成分分析PCA降维，得到所述第四特征向量。

4.如权利要求1至3任一项所述的方法，其特征在于，所述特征提取模型是通过样本图像和深度卷积神经网络模型得到的，包括：

获取样本图像集，所述样本图像集中包括多个不同种类类型的样本图像；

对所述样本图像集中的样本图像进行变形处理，得到扩充后的样本图像集；

针对每个种类类型，将所述种类类型的样本图像和所述种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，得到所述特征提取模型。

5.如权利要求4所述的方法，其特征在于，对所述样本图像集中的样本图片进行变形处理，包括以下至少之一：

镜像翻转、旋转、亮度调整。

6.如权利要求4所述的方法，其特征在于，将所述种类类型的样本图像和所述种类类型输入初始化的深度卷积神经网络模型进行迭代训练处理，直至损失函数满足预设条件，包括：

将所述种类类型的样本图像和所述种类类型输入初始化的深度卷积神经网络模型中，前向传播得到损失函数loss值；

根据所述loss值，采用下降梯度算法反向传播调整所述深度卷积神经网络的参数，直至所述loss值符合所述预设条件。

7.一种图像识别装置，其特征在于，包括：

获取单元，用于获取待识别图像；

第一输入单元，用于将所述待识别图像输入特征提取模型，得到所述待识别图像的第一特征向量，所述特征提取模型是通过样本图像和深度卷积神经网络模型得到的；

划分单元，用于将所述待识别图像按预设规则划分为多个子图像；

第二输入单元，用于将所述多个子图像分别输入所述特征提取模型，得到所述多个子图像的第二特征向量；

合并单元，用于将所述第一特征向量和所述第二特征向量进行合并，得到第三特征向量；

确定单元，用于根据所述第三特征向量与样本特征库中的各类样本图像的第四特征向量的相似度，确定所述待识别图像的种类类型，所述样本特征库为将所述各类样本图像输入所述特征提取模型得到的。

8.如权利要求7所述的装置，其特征在于，

所述确定单元，具体用于采用如下方式确定每类样本图像的第四特征向量：

将所述样本图像按所述预设规则划分为多个子样本图像；

9.如权利要求8所述的装置，其特征在于，

所述合并单元，具体用于将所述第一特征向量和所述第二特征向量进行合并，对合并后的所述第一特征向量和所述第二特征向量进行主成分分析PCA降维，得到所述第三特征向量；

10.如权利要求7至9任一项所述的装置，其特征在于，

所述第一输入单元，具体用于获取样本图像集，所述样本图像集中包括多个不同种类类型的样本图像；

11.如权利要求10所述的装置，其特征在于，对所述样本图像集中的样本图片进行变形处理，包括以下至少之一：

镜像翻转、旋转、亮度调整。

12.如权利要求10所述的装置，其特征在于，

所述第一输入单元，具体还用于将所述种类类型的样本图像和所述种类类型输入初始化的深度卷积神经网络模型中，前向传播得到损失函数loss值；