CN114359958A

CN114359958A - 一种基于通道注意力机制的猪脸识别方法

Info

Publication number: CN114359958A
Application number: CN202111536355.9A
Authority: CN
Inventors: 许水清; 何启航; 郑浩东; 陶松兵; 都海波
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2021-12-14
Filing date: 2021-12-14
Publication date: 2022-04-15
Anticipated expiration: 2041-12-14
Also published as: CN114359958B

Abstract

本发明公开了一种基于通道注意力机制的猪脸识别方法，属于计算机视觉技术领域，该识别方法通过训练样本集对主干网络的优化得到猪脸识别网络，并利用猪脸识别网络对猪脸进行识别。本发明识别方法采用基于通道注意力机制的残差网络作为主干网络，加入了通道注意力机制，引入了新的数据压缩方法，相比于传统的通道注意力机制，采取全局平均池化的压缩方法，通道注意力机制的数据压缩方法，能更好的提高网络的识别率。本发明的方法在测试样本集中的准确率，均高于其他方法，能更好的适应复杂的农场环境。

Description

一种基于通道注意力机制的猪脸识别方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于通道注意力机制的猪脸识别方法。

背景技术

计算机视觉技术已经深入到畜牧业的众多领域，其中利用图像处理与深度学习的方法实现猪个体识别成为近年来的研究热点。猪作为一种杂食性哺乳动物，不同个体之间面部特征存在差异，理论上可以将人脸识别领域的相关技术迁移至猪的身份识别。但是猪脸识别又有其特殊性，第一，猪的近亲繁殖特性导致其个体相似度很高，第二，长期不清洗的猪脸也会掩盖其面部特征，第三，猪不会配合进行猪脸的识别，想采集到较好质量的猪脸图片较为困难，这些问题，都给猪脸识别带来很大的困难。直接将人脸识别技术应用到猪脸识别领域会存在着一些局限性。

目前传统的猪个体识别技术的方法之一是在猪身体背部喷涂彩色图案，利用图像对比技术和尺度不变特征变换匹配等算法识别猪个体，这种方法对猪的身体造成了侵害，影响后续猪肉的销售，同时，当实际畜牧养殖中，猪个体数量较多时，给每只猪身体背部喷涂彩色图案，将是一个耗时耗力的工作；方法之二是在猪的耳朵上穿孔佩戴无线射频识别RFID标签，这种识别方法会引起动物的不适，咬标、掉标的情况经常发生；方法之三是使用支持向量机、等度量映射融合以及Fisherface等算法通过识别脸部确定猪只身份；但实际畜牧养殖中，环境较差，传统的识别算法应用于复杂的农场环境时，准确率并不理想，无法满足实际需求。

综上所述，现有的猪脸识别技术存在以下问题：

1.猪的近亲繁殖导致个体间相似度很高，人脸识别技术直接应用到猪脸上效果不是很好。

2.长期不清洗的猪脸，会比较脏，掩盖猪脸本来的特征，对特征提取造成一定的影响。

3.对猪脸进行识别时，猪不会配合着进行识别，猪脸会出现多个角度。

4.现有的猪脸识别算法，在复杂的农场环境下，无法保证一个较好的识别率。

发明内容

本发明的目的是解决上述现有技术中存在的问题。具体地，采用基于通道注意力机制的残差网络作为主干网络，利用训练样本集来优化主干网络，利用测试样本集，挑选出优化效果最好的主干网络，作为猪脸识别网络，对猪脸进行识别。与传统方法相比，本发明方法，由于通道注意力机制的加入，能够提高猪脸识别网络的识别率，能够更好的适应复杂的农场环境，保证一定的识别率，同时对于多角度的猪脸识别也是有效的。

为达上述目的，本发明提供了一种基于通道注意力机制的猪脸识别方法，包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络，并利用该猪脸识别网络对猪脸进行识别，具体包括以下步骤：

步骤1，猪脸图像的采集和处理

采集Z类猪脸图像；

在Z类猪脸图像的每类中选M张猪脸图像，得到M×Z张猪脸图像，然后对M×Z张猪脸图像分别用A种图像处理方式进行数据增强并保留每种图像处理方式得到的猪脸图像，即共得到(A+1)×M×Z张猪脸图像，该(A+1)×M×Z猪脸图像构成一个训练样本集；

在Z类猪脸图像的每类中另外选N张猪脸图像，得到N×Z张猪脸图像，该N×Z张猪脸图像构成一个测试样本集，N≠M；

步骤2，通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的网络，并将该具有最佳识别效果的网络记为猪脸识别网络，步骤如下：

步骤2.1，采用基于通道注意力机制的残差网络作为主干网络，所述残差网络的结构包括：卷积核大小为7×7通道数为64的卷积层Γ1，卷积核大小为3×3的最大池化下采样层Φ，3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组Λ1，4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2，6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3，3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4；主干网络的输入为卷积层Γ1，卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组A4依次串联；

所述残差结构1由沿主干网络输入-输出方向依次串联的以下3个卷积层构成：卷积核大小为1×1通道数为64的卷积层，卷积核大小为3×3通道数为64的卷积层，卷积核大小为1×1通道数为256的卷积层，在卷积核大小为1×1通道数为256的卷积层后插入一个通道注意力机制；

所述残差结构2由沿主干网络输入-输出方向依次串联的以下3个卷积层构成：卷积核大小为1×1通道数为128的卷积层，卷积核大小为3×3通道数为128的卷积层，卷积核大小为1×1通道数为512的卷积层，在卷积核大小为1×1通道数为512的卷积层后插入一个通道注意力机制；

所述残差结构3由沿主干网络输入-输出方向依次串联的以下3个卷积层构成：卷积核大小为1×1通道数为256的卷积层，卷积核大小为3×3通道数为256的卷积层，卷积核大小为1×1通道数为1024的卷积层，在卷积核大小为1×1通道数为1024的卷积层后插入一个通道注意力机制；

所述残差结构4由沿主干网络输入-输出方向依次串联的以下3个卷积层构成：卷积核大小为1×1通道数为512的卷积层，卷积核大小为3×3通道数为512的卷积层，卷积核大小为1×1通道数为2048的卷积层，在卷积核大小为1×1通道数为2048的卷积层后插入一个通道注意力机制；

主干网络的输出为第四残差结构组Λ4中的第3个残差结构4后插入的通道注意力机制的输出；

将通道注意力机制插入前的卷积层的通道数记为δ，δ或等于256或等于512或等于1024或等于2048；

步骤2.2，利用训练样本集对步骤2.1所述主干网络进行优化，具体步骤如下：

步骤2.2.1，通过图像预处理操作将训练样本集中的猪脸图像的像素统一调整为C×C；

步骤2.2.2，随机选取训练样本集中的B张猪脸图像，并将其中任意一个猪脸图像的序号记为s，s＝1，2，...，B，计算第s张猪脸图像的实际概率序列Y^s，

其中，q为实际概率序列Y^s中每个实际概率值的序号，q＝1，2，...，Z，

表示第s张猪脸图像在实际概率序列Y^s中的第q个实际概率值；

实际概率序列Y^s的取值如下：令

且

中的其他实际概率值均等于0；

步骤2.2.3，将步骤2.2.2选取得到的B张猪脸图像输入主干网络，输出每张猪脸图像的预测概率序列X^s，

其中p为预测概率序列X^s中每个预测概率值的序号，p＝1，2，...，Z，

表示第s张猪脸图像在预测概率序列X^s中的第p个预测概率值；

步骤2.2.4，根据预测概率序列X^s与实际概率序列Y^s对主干网络进行优化；

步骤2.2.5，重复步骤2.2.2至步骤2.2.4，直至训练样本集中的猪脸图像都被选取过；特别的，如果最后一轮选取中，训练样本集剩下的猪脸图像数小于B，则从已经选取过的猪脸图像中随机选取猪脸图像进行补充；

将通过步骤2.2.2-步骤2.2.5完成优化的主干网络记为第h世代的主干网络T_h，其中h为世代的序号；

步骤2.3，利用测试样本集，计算第h世代的主干网络T_h对测试样本集中猪脸图像分类的准确率v_h，

为利用主干网络T_h对测试样本集中猪脸图像进行正确分类的数值，

步骤2.4，设重复次数为G，G次重复步骤2.2和步骤2.3，得到一个主干网络序列T和一个准确率序列V，T＝{T₁，T₂，...，T_h，...，T_G}，V＝{v₁，v₂，...，v_h，...，v_G}；

步骤2.5，记v_o为最高准确率，v_o＝max{v₁，v₂，...，v_h，...，v_G}，v_o对应的主干网络T_o即为具有最佳识别效果的网络，并记为猪脸识别网络；

步骤3，利用猪脸识别网络对猪脸进行识别，具体步骤如下：

步骤3.1，输入一张待识别原始猪脸图像并进行以下图像处理：首先将该待识别原始猪脸图像的像素调整为D×D，然后再将像素调整为D×D的待识别原始猪脸图像的大小裁剪为E×E，其中E＜D；

将通过前述处理的待识别原始猪脸图像记为待识别猪脸图像；

步骤3.2，将待识别猪脸图像送入猪脸识别网络，得到待识别猪脸图像特征向量J，其中J＝(j₁，j₂，...，j_l，...，j_Z)，l表示待识别猪脸图像特征向量的维数，j_l表示第l维待识别猪脸图像特征向量的值，l＝1，2，...，Z；

步骤3.3，用softmax函数对步骤3.2得到的待识别猪脸图像特征向量J进行运算，得到概率序列R，其中，R＝{r₁，r₂，...，r_g，...，r_Z}，g表示概率序列R的维数，r_g表示第g维概率序列的值，g＝1，2，...，Z；

所述softmax函数的表达式为：

其中，log表示对数函数，e表示指数函数，

步骤3.4，取r_τ＝max{r₁，r₂，...，r_g，...，r_Z}，τ对应的概率序列R的维数即为待识别猪脸图像的类别数，r_τ的值为该类别数的置信度。

优选地，步骤1所述A种图像处理方式为9种处理方式，即A＝9，具体包括：颜色增强，加入高斯噪声，镜像对称，尺寸扩大两倍，向左旋转20度，随机裁剪，对比度增强，亮度增强，随机变色。

优选地，步骤2所述通道注意力机制的实现步骤如下：

根据权利要求1的步骤2.1，通道注意力机制共输入δ个通道的多维通道特征向量，对每一个多维通道特征向量，将其首尾连接展开得到4λ个一维通道特征向量；

记δ个通道中任一个通道的展平向量为F^γ，

γ表示输入的通道的序号，i表示一维通道特征向量值在展平向量F^γ中的序号，

表示展平向量F^γ中第γ个通道的第i个一维通道特征向量值，i＝1，2，...，4λ，γ＝1，2，...，δ；

对展平向量F^γ中的一维通道特征向量值

按照从小到大的顺序重新进行排序，得到排序后的展平向量H^γ，

m表示一维通道特征向量值在排序后的展平向量H^γ中的序号，

表示排序后的展平向量H^γ中第γ个通道的第m个一维通道特征向量值，m＝1，2，...，4λ；

对排序后的展平向量H^γ保留

至

的值，得到去除异常值的展平向量I^γ，

n表示一维通道特征向量值在去除异常值的展平向量I^γ中的序号，

表示去除异常值的展平向量I^γ中第γ个通道第n个一维通道特征向量值，n＝λ，λ+1，...，3λ；

对去除异常值的展平向量I^γ，用求平均值的方式，对每个通道进行数据压缩，得到压缩向量L^γ，

将压缩向量L^γ经过激活模块，完成通道注意力机制，其中，激活模块的具体步骤如下所述：

对压缩向量L^γ，先经过节点数为γ的全连接层，再经过节点数为γ/θ的全连接层，再经过ReLU函数，再经过节点数为γ的全连接层，最后经过Sigmoid函数，其中θ为大于0的整数；

ReLU函数的表达式如下：

其中，

表示ReLU函数的输入，

表示ReLU函数的输出；

Sigmoid函数的表达式如下：

其中，e表示指数函数，ω表示Sigmoid函数的输入，y(ω)表示Sigmoid函数的输出。

优选地，步骤2所述根据预测概率序列X^s与实际概率序列Y^s对主干网络进行优化的具体方式如下：

计算预测概率序列X^s与实际概率序列Y^s之间的损失函数loss，

其中，||·||₂表示2范数，通过梯度下降法最小化损失函数loss，完成主干网络的优化。

与现有技术相比，本发明的有益效果如下：

1.本发明提出的通道注意力机制采用了出新的压缩数据方法，先去除异常值，再求平均值对数据进行压缩。

2.对长期不清洗的猪脸，虽然掩盖了部分特征，但仍能保证着不错的识别效果，本发明的注意力机制会有选择性的提取需要的特征。

3.对于农场这种复杂环境，本发明可以保证一个不错的识别率。

4.本发明提出的基于通道注意力机制的残差网络在对多角度的猪脸识别性能比较强，更适合实际的应用。

附图说明

图1是本发明猪脸识别方法的流程图；

图2是本发明猪脸识别方法的示意框图；

图3是本发明实施例中通道注意力机制实现步骤示意图；

图4是本发明实施例中本发猪脸识别方法和其他方法准确率对比图。

具体实施方式

下面将结合附图和具体的实施方式对本发明的技术方案进行清楚、完整的描述。

图1是本发明猪脸识别方法的流程图，图2是本发明猪脸识别方法的示意框图，由图1和图2可见，本发明提供了一种基于通道注意力机制的猪脸识别方法，包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络，并利用该猪脸识别网络对猪脸进行识别，具体包括以下步骤：

步骤1，猪脸图像的采集和处理

采集Z类猪脸图像；

在Z类猪脸图像的每类中另外选N张猪脸图像，得到N×Z张猪脸图像，该N×Z张猪脸图像构成一个测试样本集，N≠M。

在本实施例中，所述A种图像处理方式为9种处理方式，即A＝9，具体包括：颜色增强，加入高斯噪声，镜像对称，尺寸扩大两倍，向左旋转20度，随机裁剪，对比度增强，亮度增强，随机变色。

在本实施例中，取Z＝30，M＝3，A＝9，N＝10。

步骤2.1，采用基于通道注意力机制的残差网络作为主干网络，所述残差网络的结构包括：卷积核大小为7×7通道数为64的卷积层Γ1，卷积核大小为3×3的最大池化下采样层Φ，3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组Λ1，4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2，6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3，3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4；主干网络的输入为卷积层Γ1，卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组Λ4依次串联；

将通道注意力机制插入前的卷积层的通道数记为δ，δ或等于256或等于512或等于1024或等于2048。

图3是本发明实施例中通道注意力机制实现步骤示意图，由图3可见，在本实施例中，所述通道注意力机制的实现步骤如下：

记δ个通道中任一个通道的展平向量为F^γ，

对展平向量F^γ中的一维通道特征向量值

对排序后的展平向量H^γ保留

至

的值，得到去除异常值的展平向量I^γ，

ReLU函数的表达式如下：

其中，

表示ReLU函数的输入，

表示ReLU函数的输出；

Sigmoid函数的表达式如下：

实际概率序列Y^s的取值如下：令

且

中的其他实际概率值均等于0；

步骤2.2.4，根据预测概率序列X^s与实际概率序列Y^s对主干网络进行优化；具体方式如下：

计算预测概率序列X^s与实际概率序列Y^s之间的损失函数loss，

步骤2.5，记v_o为最高准确率，v_o＝max{v₁，v₂，...，v_h，...，v_G}，v_o对应的主干网络T_o即为具有最佳识别效果的网络，并记为猪脸识别网络。

在本实施例中，B＝16，C＝224，G＝100。

步骤3，利用猪脸识别网络对猪脸进行识别，具体步骤如下：

所述softmax函数的表达式为：

其中，log表示对数函数，e表示指数函数，

步骤3.4，取rτ＝max{r₁，r₂，...，r_g，...，r_Z}，τ对应的概率序列R的维数即为待识别猪脸图像的类别数，r_τ的值为该类别数的置信度。

在本实例中，取D＝256，E＝224。

图4为本发明实施例中一种基于通道注意力机制的猪脸识别方法和其他最新识别算法准确率对比图，其他最新识别算法包括mobileNetV2，mobileNetV3，efficientV1，resnet-50。由图4可见，本发明方法对应的准确率曲线本发明，优于其他最新识别算法，说明本发明提出的识别方法猪脸识别领域的优越性。

总之，本发明方法实现了对通道注意力机制的改进，提高了分类的准确率，使得猪脸识别的准确率得到了很大提高，能够更好的适应复杂的农场环境，更好的服务畜牧业。

Claims

1.一种基于通道注意力机制的猪脸识别方法，其特征在于，包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络，并利用该猪脸识别网络对猪脸进行识别，具体包括以下步骤：

步骤1，猪脸图像的采集和处理

采集Z类猪脸图像，其中Z记为猪脸图像的种类数；

步骤2.1，采用基于通道注意力机制的残差网络作为主干网络，所述残差网络的结构包括：卷积核大小为7×7通道数为64的卷积层Γ1，卷积核大小为3×3的最大池化下采样层Φ，3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组A1，4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2，6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3，3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4；主干网络的输入为卷积层Γ1，卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组A4依次串联；