CN114445660B

CN114445660B - 一种细粒度图像识别方法

Info

Publication number: CN114445660B
Application number: CN202210069959.5A
Authority: CN
Inventors: 余鹰; 汤洪; 钱进; 蔡震
Original assignee: East China Jiaotong University
Current assignee: East China Jiaotong University
Priority date: 2022-01-21
Filing date: 2022-01-21
Publication date: 2023-04-07
Anticipated expiration: 2042-01-21
Also published as: CN114445660A

Abstract

本发明属于细粒度图像识别技术领域，提出了一种细粒度图像识别方法，包括如下步骤：选择能从不同层面、不同视角刻画图像的异构网络C和异构网络T；并将异构网络C和异构网络T的神经网络训练，将细粒度RGB图像送入已训练的异构网络C和异构网络T，得到高维嵌入特征向量E_C和高维嵌入特征向量E_T；使用PCA算法，分别对图像集E_C和E_T所组成的特征矩阵M_C和M_T进行PCA降维，得到E'_C和E'_T；使用CCA算法，将E'_C和E'_T所组成的降维特征矩阵M'_C和M'_T进行典型相关性分析，得到共同表示变换向量V_C和V_T；将降维特征矩阵M'_C和M'_T各自乘以变换向量V_C和V_T，得到

和

将

和

进行拼接操作，得到关于图像的深层语义异构共同表示特征F_C；将图像的深层语义异构共同表示特征F_C送入分类器，得到图像的精准识别结果。

Description

一种细粒度图像识别方法

技术领域

本发明属于细粒度图像识别技术领域，具体涉及一种细粒度图像识别方法。

背景技术

在智能零售、智慧农业、生态系统保护等领域，使用计算机视觉技术来精准识别零售商品具体的种类，商家可以用这些信息来对客户做更加精准的推荐、农业虫害叶片疾病种类识别可以减少化学品滥用，例如：有两种果树害虫，他们会侵害果树叶片，如果不仔细从叶片上判断是不知道具体是哪一种害虫，如果使用两种杀虫剂势必会造成不必要的浪费，如果使用一种杀虫剂也可能会增加另一种害虫的耐药性；珍稀动物发现设备在工作中需要降低对无关同种类的响应，例如：在一个海洋区域内有两种鲸鱼，一种不太重要的鲸鱼数目较多，重要的鲸鱼数量很少，他们之间非常像，如果使用人工的方式需要专家级别的人员。

细粒度图像识别技术就是在这种背景下得到了极大的发展。细粒度图像识别技术通过分析图像的某种特征或者某些特征组合来共同判断图像中物体的类别。

由于物体的部分遮挡，光照变化，姿态变化，背景干扰等因素导致相同子类之间差异大，又因为不同子类同属一种超类导致类间差异小，如附图1所示。现有方法大多数使用深度学习来实现，通过设计一种神经网络模型，选择或者设计一种或多种损失函数，通过优化损失函数来进行反向传播更新网络参数，直到网络损失函数降到足够低时模型训练完毕，使用这个神经网络提取的高维嵌入特征来进行分类判断。还有的方法针对图像提取手工特征和多种深度学习特征进行结合来分类。这些方法一般存在准确率不高或者网络过于复杂的特点，会使得在实际应用中存在误判高，延迟高等问题。

发明内容

本发明旨在提供一种细粒度图像识别方法，以充分挖掘内部的异构相关性语义，将变换后的特征向量进行拼接融合，得到深层语义异构共同表示特征向量，再使用这个向量去做分类，获得极好的识别效果。

为达到上述目的，本发明采用如下技术方案：一种细粒度图像识别方法，包括如下步骤：

S1：选择能从不同层面、不同视角刻画图像的异构网络C和异构网络T；

S2：将细粒度RGB图像数据集送入异构网络C和异构网络T，进行异构网络C和异构网络T的神经网络训练，直至异构网络C和异构网络T的损失值趋近于0时，停止异构网络C和异构网络T的神经网络训练；

S3：将细粒度RGB图像送入已训练的异构网络C中，通过网络前向传播结果得到：异构网络C对于图像表达的高维嵌入特征向量E_C；

S4：将细粒度RGB图像进行处理，得到适合异构网络T的输入表示，并将处理后的细粒度RGB图像送入已训练的异构网络T中，通过网络前向传播结果得到：异构网络T对于图像表达的高维嵌入特征向量E_T；

S5:使用PCA算法，分别对图像集E_C和E_T所组成的特征矩阵M_C和M_T进行PCA降维，得到每张图像降维后的特征向量表示E'_C和E'_T；

S6：使用CCA算法，将E'_C和E'_T所组成的降维特征矩阵M'_C和M'_T进行典型相关性分析，得到共同表示变换向量V_C和V_T；

S7：将降维特征矩阵M'_C和M'_T各自乘以变换向量V_C和V_T，得到

和

S8：将

和

进行拼接操作，得到关于图像的深层语义异构共同表示特征F_C。

S9：将图像的深层语义异构共同表示特征F_C送入分类器，得到图像的精准识别结果。

在本发明的一种优选实施方式中，S2中，异构网络C的神经网络训练步骤如下，步骤一：将细粒度RGB图像数据集送入异构网络C中，通过网络前向传播得到识别结果，再根据识别结果计算损失；步骤二：根据损失进行反向传播更新优化异构网络C的参数；步骤三：重复步骤一和步骤二，损失值达趋近于0并基本保证恒定，停止训练异构网络C的神经网络训练。

在本发明的一种优选实施方式中，S2中，异构网络T的神经网络训练步骤如下，步骤一：将细粒度RGB图像数据集进行处理，得到适合异构网络T的输入表示；步骤二：将处理完的细粒度RGB图像数据集表示送入异构网络T中，通过网络前向传播得到识别结果，再根据识别结果计算损失；步骤三：根据损失进行反向传播更新优化异构网络T的参数；步骤四：重复步骤一至步骤三，损失值达趋近于0并基本保证恒定，停止训练异构网络T的神经网络训练。

在本发明的一种优选实施方式中，E'_C和E'_T是比E_C和E_T维度更低的特征向量。

本发明的原理以及有益效果：本发明通过只选取两种异构深度神经网络，先分别进行训练，然后各自获得较好的识别性能时，再通过PCA算法对特征进行降维，再将降维特征向量使用CCA进行典型相关分析，充分挖掘内部的异构相关性语义，将变换后的特征向量进行拼接融合，得到深层语义异构共同表示特征向量，再使用这个向量去做分类就能获得极好的识别效果。本发明方法在保证低延时的情况下能够做到高识别率，适用于智能零售、智慧农业、生态系统保护等领域。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是背景技术举例图。

图2是本申请实施例中的细粒度图像识别方法的流程示意图。

图3是本申请实施例中的异构网络C的流程示意图。

图4是本申请实施例中的异构网络T的流程示意图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“竖向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

实施例

基本如附图2、附图3和附图4所示，一种细粒度图像识别方法，使用异构特征提取模块、特征降维处理模块以及异构深层语义特征融合模块，包括如下步骤：

异构特征提取模块：

S2：将细粒度RGB图像数据集送入异构网络C和异构网络T，进行异构网络C和异构网络T的神经网络训练，直至异构网络C和异构网络T的损失值趋近于0并基本保证恒定时，停止异构网络C和异构网络T的神经网络训练；

异构网络C的神经网络训练步骤如下：步骤一：将细粒度RGB图像数据集送入异构网络C中，通过网络前向传播得到识别结果，再根据识别结果计算损失；步骤二：根据损失进行反向传播更新优化异构网络C的参数；步骤三：重复步骤一和步骤二，损失值达趋近于0并基本保证恒定，停止训练异构网络C的神经网络训练；

异构网络T的神经网络训练步骤如下，步骤一：将细粒度RGB图像数据集进行处理，得到适合异构网络T的输入表示；步骤二：将处理完的细粒度RGB图像数据集表示送入异构网络T中，通过网络前向传播得到识别结果，再根据识别结果计算损失；步骤三：根据损失进行反向传播更新优化异构网络T的参数；步骤四：重复步骤一至步骤三，损失值达趋近于0并基本保证恒定时，停止训练异构网络T的神经网络训练。

特征降维处理模块：

S5:使用PCA算法，分别对图像集E_C和E_T所组成的特征矩阵M_C和M_T进行PCA降维，得到每张图像降维后的特征向量表示E'_C和E'_T，其中E'_C和E'_T是比E_C和E_T维度更低的特征向量；

S7：将降维特征矩阵M'_C和M'_T各自乘以变换向量V_C和V_T，得到

和

异构深层语义特征融合模块：

S8：将

和

综上所述，异构特征提取时，将图像进行异构特征提取得到两种不同的，但都能在一定程度上表达图像内容的高维嵌入特征向量E_C和E_T。特征降维处理时，分别将这两种高维嵌入特征向量进行各自合适的降维，得到降维后的特征向量E'_C和E'_T。异构深层语义特征融合时，将这两个特征进行典型相关性分析，找出特征之间的相关性并投影到同一语义空间得到变换特征

和

对两个特征进行拼接融合可以得到深层语义异构共同表示特征F_C，此特征维度为相关性变换特征维度之和。利用这个提取出来的共同表示特征进行分类，可以在不过多增加方法复杂度的情况下，得到更加精确的识别结果。

在本说明书的描述中，参考术语“优选的实施方式”、“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。