CN111666838B

CN111666838B - 一种改进的残差网络猪脸识别方法

Info

Publication number: CN111666838B
Application number: CN202010445823.0A
Authority: CN
Inventors: 陈玫玫; 王健; 吴金洋; 吴思嘉; 何文俊; 王辰萱
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2020-05-22
Filing date: 2020-05-22
Publication date: 2023-04-18
Anticipated expiration: 2040-05-22
Also published as: CN111666838A

Abstract

本发明属于计算机视觉与深度学习领域，具体地来讲为一种改进的残差网络猪脸识别方法，该方法包括，采用固定摄像头同时采集多个猪栏视频，并将每个猪栏区域分割为单独图像；然后对猪栏图像进行图像复原处理，去除遮挡猪脸的围栏栏杆；以修复后的图像建立猪脸图像数据集，无需对猪脸部分进行坐标标注和剪裁；采用改进损失函数的残差网络(Residual Network,ResNet)作为主干网络构建猪脸识别模型，并用训练集对模型进行训练，用测试集验证识别效果。经试验，本方法有较强的抗噪声能力，而且改进的损失函数能够有效提高猪脸特征之间的类内紧凑性和类间可分离性，提高了猪脸识别的准确率。

Description

一种改进的残差网络猪脸识别方法

技术领域

本发明涉及计算机视觉及深度学习领域，具体的而言为一种改进的残差网络猪脸识别方法。

背景技术

近年来，随着国家对养殖企业集约化管理与精确监控的要求，能够对牲畜进行有效的识别管理(例如身份确认、体重与体温的监测)，已日渐成为养殖业者的需求。目前牲畜身份识别的主要方式是通过在动物的耳朵上穿孔佩戴无线射频识别RFID标签。这种识别方法会引起动物的不适，咬标、掉标的情况经常发生。而且，预防非洲猪瘟的有效手段之一是减少场外人员和车辆进入猪场，因此对生猪实行非接触式身份识别与监控，是目前迫切需要解决的问题。

人脸识别通常用于非接触式的访问控制与监测，与养殖企业的应用场景非常相似。因此，理论上可以将人脸识别领域的相关技术迁移至牲畜的身份识别。

但是，猪脸识别又有其特殊性，采集图像中的猪通常关在猪栏内，因此会有猪的部分面部特征被栏杆遮挡的情况，同时长期不清洗也会造成部分面部特征被掩盖，给猪脸识别带来极大困难。构建的猪脸识别模型如何提取到更多、更细化的猪脸面部特征，并提高分类器模型的类内特征的紧凑型和类间特征的分离性，是解决上述问题的关键。

发明内容

本发明所要解决的技术问题在于提供一种改进的残差网络猪脸识别方法，利用ResNet提取深层猪脸特征，并提出用L-Softmax损失函数，增强分类器的特征分类学习能力，实现快速、准确的猪脸识别。

本发明是这样实现的，

一种改进的残差网络猪脸识别方法，该方法包括以下步骤：

S1：采用固定在墙壁的摄像头，同时采集多个猪栏的视频数据，将每一帧分解为静态图像，并将每个猪栏区域分割为单独图像，然后筛选其中光线充足、较为清晰的作为有效的猪栏图像；

S2：构建图像复原深度学习模型，对S1图像进行图像修复处理，去除遮挡猪脸的围栏栏杆；

S3：对修复后猪脸图像根据猪的身份将图像划分到相应的身份标签目录，建立猪脸图像数据集，无需对猪脸部分进行坐标标注和剪裁；

S4：采用改进的残差网络作为主干网络，采用大裕度Softmax(Large MarginSoftmax,L-Softmax)损失函数作为输出层的损失函数构建构建猪脸识别的残差网络(Residual Network,ResNet)深度学习网络模型，并用训练集对模型进行训练；

S5：将测试集图像输入至识别模型进行自动识别验证识别效果。

进一步地，所述步骤S2配置GPU图形处理器，在Linux系统环境下应用部分卷积层法进行猪脸图像修复，去除遮挡猪脸的栏杆。

进一步地，S2中，构建图像复原深度学习模型包括：

S21：构建二维部分卷积层；

S22：用二维部分卷积层代替UNet架构的原有卷积层，并将激活函数修正线性单元(Rectified Linear Unit,ReLU)替换为带泄露修正线性单元(Leaky ReLU)，构建部分卷积(Partial Convolution,PConv)网络修复模型S23：按照3:1的比例划分将图像随机为训练集和测试集，用训练集和测试集训练和测试上述模型；

S24：进行复原处理，输入待修复图像，输出即为去除猪脸遮挡物后的图像。

进一步地，步骤4中，采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括：在Linux系统环境下，搭建改进的ResNet-50深度学习网络模型，并进行训练与验证，

所述ResNet-50深度学习网络模型包括卷积层、池化层、以及多个全连接层，其运算步骤依次为：

S41：用8×8的卷积核对输入训练集图像进行卷积、线性激活，经池化层池化后，导入全连接层，通过全连接层输出64×36×36的图像P₁；

S42：使用4×4的卷积核对图像P₁进行卷积、线性激活，经池化层池化后，导入全连接层，通过全连接层输出128×16×16的图像P₂；

S43：使用4×4的卷积核对图像P₂进行卷积、线性激活，经池化层池化后，导入全连接层，通过全连接层输出512×6×6的多维矩阵P₃；

S44：将多维矩阵P₃通过Flatten层变成一维数列，导入全连接层得到数据P₄；

S45：将数据P₄送入输出层，输出层使用L-Softmax损失函数作为目标函数，当损失函数值收敛时，模型训练完成。

进一步地，L-Softmax损失函数表达式如下：

其中，

W为权值向量，x为特征向量，θ为特征向量x与权值向量W间的夹角。m是常数，控制类别之间的差距，D(θ)为是一个单调减函数且

保证

为一个连续函数，m控制类别之间的差距。

进一步地，采用改进的残差网络作为主干网络，采用L-Softmax损失函数作为输出层的损失函数构建猪脸识别模型包括：在CNN网络上加入残差网络，残差网络中增加直连通道，将原始输入信息直接传到后面的层中，并将权值小于0.1的神经元进行Dropout的操作，将其丢弃。

本发明与现有技术相比，有益效果在于：

本发明猪脸识别作为分类问题，构建分类模型时设计合理的Softmax损失函数，使得不同类特征的类间间距够大，同类特征的类内距离足够小，才能够实现准确分类。本发明采用残差网络作为主干网络，并提出L-Softmax损失函数作为输出层的损失函数，并且在网络中加入早停策略和Dropout正则化方法进一步提高收敛速度。实验表明，本发明中的L-Softmax损失函数能够有效提高学习特征之间的类内紧凑性和类间可分离性，实现了较为准确的猪脸识别。

在构建数据集时不需要分割出猪脸和标注猪脸位置坐标，能够大大节省人力物力。

本发明对猪脸图像进行图像复原处理。由于摄像头置于猪栏外，图像中有围栏栏杆遮挡猪脸。因此为提高识别准确率，应用部分卷积层法(Partial Convolutional,PConv)进行猪脸图像修复，去除遮挡猪脸的栏杆。对复原后猪脸图像根据猪的身份将图像划分到相应的身份标签目录，建立猪脸图像数据集。本算法模型不需要分割出猪脸和标注猪脸位置坐标，大大节省构建数据集的人力物力。

附图说明

图1为本发明所述的于改进的残差网络猪脸识别方法的网络结构及流程图；

图2为本发明所述PConv方法复原图像前后对比图(a)为修复前，(b)为修复后；

图3为本发明所述改进模型与VGG16和未改进Resnet模型的准确率对比；

图4为本发明所述改进模型与VGG16和未改进Resnet模型的损失函数收敛曲线对比。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参见图1所示，一种改进的残差网络猪脸识别方法，该方法包括以下步骤：

S4：采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型，并用训练集对模型进行训练；

步骤S1：猪栏区域分割及图像筛选。先将单帧图像中的每个猪栏分割为猪栏区域图像。由于光照不足和目标运动等因素，都会使普通摄像头拍摄的图像较为模糊，因此需要筛选光线较为充足、猪脸较为清晰的图像作为有效图像。

步骤S2配置GPU图形处理器，在Linux系统环境下应用部分卷积层法进行猪脸图像修复，去除遮挡猪脸的栏杆，参见图2(a)为修复前以及图2(b)未修复后的对比图。

S2中，构建图像复原深度学习模型包括：

S21：构建二维部分卷积层；

S22：用二维部分卷积层代替UNet架构的原有卷积层，并将激活函数RELU替换为LeakyRELU，构建PConv网络修复模型；

S23：按照3:1的比例划分将图像随机为训练集和测试集，用训练集和测试集训练和测试上述模型；

为了降低图像中围栏栏杆对猪脸识别结果的影响，在数据集构建过程中，在预处理阶段对猪栏图像进行修复，采用部分卷积神经网络(Partial Convolution，PConv)模型去除遮挡脸部的栏杆。

目前现有的基于的卷积网络的图像修复方法存在一些缺陷，如颜色不匹配和模糊等，所以会使用后处理来消除这些缺陷，但是通常失败。将待修复图像的损坏区域用0像素值标记为掩膜(mask)，为图像的无效区域，未被损坏的区域为图像有效区域。部分卷积是指卷积只在图片的有效区域进行卷积、池化操作，并且图片的掩膜会随着网络层数的加深，经过不断迭代可以对掩膜周围区域进行预测并填充有效值，在进入解码阶段之前，只要网络深度足够，掩膜区域大小可以收缩直至消失。

PConv模型以UNet作为主网络结构，用部分卷积层替换原卷积层，并在解码阶段使用最近邻上采样，然后分别连接两个特征映射和两个掩膜作为下一层部分卷积层的特征和掩膜输入。

将部分卷积运算和掩膜更新函数联合称为部分卷积层，计算过程如下：

如上式所示，W表示卷积层滤波器的权重，b表示卷积层滤波器的偏差值，X表示输入的图片，M表示掩膜，⊙表示元素点乘运算，x'表示输入图片经过卷积后的输出，m'表示输入掩膜经过卷积后的输出。

模型使用堆叠的部分卷积运算和掩模更新步骤来执行图像修复。卷积运算后如果卷积能够在至少一个有效输入值上调节其输出，则将该位置标记为有效。每进行一次卷积，进行一次掩膜更新。只要卷积核所对应的掩膜区域有一个元素是有效的，那么卷积核中心位置对应的掩膜就会进行更新。通过多次迭代，掩膜的区域会越来越小，最终完全消失，此时图像修复完成。

进一步地，步骤4中，采用改进的残差网络作为主干网络，采用L-Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括：在Linux系统环境下，搭建改进的残差网络深度学习网络模型，并进行训练与验证，

所述残差网络深度学习网络模型包括卷积层、池化层、以及多个全连接层，其运算步骤依次为：

S45：将数据P₄送入输出层，输出层使用大裕度Softmax损失函数作为目标函数，当损失函数值收敛时，模型训练完成。

大裕度Softmax损失函数表达式如下：

其中，

保证

为一个连续函数，m控制类别之间的差距。

采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括：在CNN网络上加入残差网络，残差网络中增加直连通道，将原始输入信息直接传到后面的层中，并将权值小于0.1的神经元进行Dropout的操作，将其丢弃。

改进的残差网络猪脸识别

本发明在一般CNN网络基础上引入残差网络模型加以改进。在利用一般CNN网络对图像进行识别的过程中，随着网络深度的增加，模型对于特征的敏感度会提高，有利于提高识别准确。但是网络深度加深即神经网络层数增加，会出现梯度消失的问题：下降的梯度从网络输出端向输入端传播，当网络深度增加后，靠近输入端层的梯度的值会随之变得很小，意味着这些层的学习基本停滞；而且随着网络深度增加，使得参数空间变大，增加了优化难度，网络层数的增加反而导致训练误差增加，识别率降低。ResNet可以有效解决梯度消失问题，不仅让可以训练更深的网络，而且大大提高了网络的准确率。

在神经网络的输出端应采用多输出的Softmax函数。本发明对Softmax函数进行了改进，以大裕度Softmax构建新的损失函数，使得深度学习模型具有较高的猪脸特征类内紧凑性和类间可分离性。

采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别模型包括：在CNN网络上加入残差网络，残差网络中增加直连通道，将原始输入信息直接传到后面的层中，并将权值小于0.1的神经元进行Dropout的操作，将其丢弃。这样可以有效的防止过拟合以及神经元太多而带来的运行速度过慢等问题。

使用大裕度Softmax分类，可以有效对猪脸进行分类，其中在训练过程中提出早停策略，即当准确率下降并且损失函数上升持续一定次数，本算法中为50次，即停止这个梯度，转而重新转换为另外一个梯度，继续运行算法，直至程序结束，然后输出猪的识别结果及识别准确率。

下面结合实际构建的猪脸数据集(45头猪，总数6707张图像)为实例，对本发明进行进一步详细说明。上述猪脸识别模块可以表述为以下步骤：

第一步：利用固定摄像头采集猪栏信息，并进行图像预处理，构建猪脸图像数据集，所述预处理环节依次进行以下3个处理步骤：

(1)区域分割与图像筛选：将视频数据的每一帧分解为静态图像，并对将每一只猪所在猪栏分割为单独猪栏区域图像，并筛选光线充足较为清晰的图像I₁，共6707张。

(2)图像修复：配置GPU图形处理器，在Linux系统环境下，构建部分卷积神经网络模型对图像进行修复处理，去除I1中遮挡猪脸的围栏栏杆，得到图像I2；

①标注待修复区域

将需要复原的部分用绿色(0，255，0)覆盖，将图片保存为.png格式；

②构建图像复原深度学习模型

使用以下组件：Python 3.6TensorFlow 1.10Keras 2.2.4Pillow h5py编译代码，构建图像复原深度学习模型。

step 1：构建二维部分卷积(PConv2D)层；

step 2：用PConv2D层代替UNet架构的原有卷积层，并将激活函数ReLU

替换为LeakyReLU，构建PConv网络修复模型；

step 3：按照3:1的比例划分将6707张图像随机为训练集和测试集，用训练集和测试集训练和测试上述模型；

step 4：进行复原处理，输入待修复图像，输出即为去除猪脸遮挡物后的图像I2。

(3)图像剪裁及归一化：对上一步得到的图像进行适宜的裁剪以得到固定分辨率224×224的图像，然后对其进行图像归一化，得到图像I3。

第二步，将45类6707张图像经过上述I1到图像I3的处理过程，即得到本实验的猪脸数据集。按照3:1的比例随机将数据集分为训练集和测试集。

第三步，在Linux系统环境下，搭建改进的50层的ResNet(即ResNet-50)深度学习网络模型，并进行训练与验证。

所述ResNet-50深度学习网络模型包括卷积层、池化层、以及若干全连接层，其运算步骤依次为：

用8×8的卷积核对输入训练集图像进行卷积、线性激活，经池化层池化后，导入全连接层(Fully Connection,FC)，通过全连接层输出64×36×36的图像P1；

使用4×4的卷积核对P1进行卷积、线性激活，经池化层池化后，导入全连接层，通过全连接层输出128×16×16的图像P2；

使用4×4的卷积核对P2进行卷积、线性激活，经池化层池化后，导入全连接层，通过全连接层输出512×6×6的多维矩阵P3；

由于原ResNet模型的输出节点数与本发明需要的输出种类数(45类)不一致，因此对ResNet模型进行了相应的改进：，将多维矩阵P3通过Flatten层变成一维数列，导入全连接层得到P4；

将P4送入输出层，输出层使用L-Softmax损失函数作为目标函数，当损失函数值收敛时，模型训练完成。

将验证集图像输入训练后的模型，对模型识别准确率进行验证，并得到相应识别结果。

综上实例结合图3本发明所述改进模型与VGG16和未改进Resnet模型的准确率对比；图4为本发明所述改进模型与VGG16和未改进Resnet模型的损失函数收敛曲线对比。可见，本发明对于猪脸识别模型的提出及应用，充分展现了本发明在猪脸识别领域的优越性。通过对Resnet网络的改进，提高了分类的准确率，使得猪脸识别的准确率得到了很大提高。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种改进的残差网络猪脸识别方法，其特征在于，该方法包括以下步骤：

S4：采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型，并用训练集对ResNet深度学习网络模型进行训练；

S5：将测试集图像输入至识别模型，进行自动识别验证识别效果；

S2中，构建图像复原深度学习模型包括：

S21：构建二维部分卷积层；

S22：用部分卷积层代替U-Net架构的原有卷积层，并将激活函数修正线性单元替换为带泄露修正线性单元，构建部分卷积网络修复模型；

S24：进行复原处理，输入待修复图像，输出即为去除猪脸遮挡物后的图像；

图像复原深度学习模型对图像修复方法包括：将待修复图像的损坏区域用0像素值标记为掩膜，为图像的无效区域，未被损坏的区域为图像有效区域，部分卷积层只在图片的有效区域进行卷积、池化操作，图片的掩膜会随着网络层数的加深，经过不断迭代对掩膜周围区域进行预测并填充有效值，计算过程如下：

如上式所示，W表示卷积层滤波器的权重，b表示卷积层滤波器的偏差值，X表示输入的图片，M表示掩膜，⊙表示元素点乘运算，x'表示输入图片经过卷积后的输出，m'表示输入掩膜经过卷积后的输出；

步骤4中，采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括：在Linux系统环境下，搭建改进的残差网络深度学习网络模型，并进行训练与验证，

2.按照权利要求1所述的方法，其特征在于，所述步骤S2配置GPU图形处理器，在Linux系统环境下应用部分卷积层法进行猪脸图像修复，去除遮挡猪脸的栏杆。

3.按照权利要求1所述的方法，其特征在于，大裕度Softmax损失函数表达式如下：

其中，

W为权值向量，x为特征向量，θ为特征向量x与权值向量W间的夹角；m是常数，控制类别之间的差距，D(θ)为是一个单调减函数且保证为一个连续函数。

4.按照权利要求1所述的方法，其特征在于，采用改进的残差网络作为主干网络，采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型还包括：在CNN网络上加入残差网络，残差网络中增加直连通道，将原始输入信息直接传到后面的层中，并将权值小于0.1的神经元进行Dropout的操作，将其丢弃。