CN111666838B - 一种改进的残差网络猪脸识别方法 - Google Patents

一种改进的残差网络猪脸识别方法 Download PDF

Info

Publication number
CN111666838B
CN111666838B CN202010445823.0A CN202010445823A CN111666838B CN 111666838 B CN111666838 B CN 111666838B CN 202010445823 A CN202010445823 A CN 202010445823A CN 111666838 B CN111666838 B CN 111666838B
Authority
CN
China
Prior art keywords
image
network
layer
pig face
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010445823.0A
Other languages
English (en)
Other versions
CN111666838A (zh
Inventor
陈玫玫
王健
吴金洋
吴思嘉
何文俊
王辰萱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202010445823.0A priority Critical patent/CN111666838B/zh
Publication of CN111666838A publication Critical patent/CN111666838A/zh
Application granted granted Critical
Publication of CN111666838B publication Critical patent/CN111666838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明属于计算机视觉与深度学习领域,具体地来讲为一种改进的残差网络猪脸识别方法,该方法包括,采用固定摄像头同时采集多个猪栏视频,并将每个猪栏区域分割为单独图像;然后对猪栏图像进行图像复原处理,去除遮挡猪脸的围栏栏杆;以修复后的图像建立猪脸图像数据集,无需对猪脸部分进行坐标标注和剪裁;采用改进损失函数的残差网络(Residual Network,ResNet)作为主干网络构建猪脸识别模型,并用训练集对模型进行训练,用测试集验证识别效果。经试验,本方法有较强的抗噪声能力,而且改进的损失函数能够有效提高猪脸特征之间的类内紧凑性和类间可分离性,提高了猪脸识别的准确率。

Description

一种改进的残差网络猪脸识别方法
技术领域
本发明涉及计算机视觉及深度学习领域,具体的而言为一种改进的残差网络猪脸识别方法。
背景技术
近年来,随着国家对养殖企业集约化管理与精确监控的要求,能够对牲畜进行有效的识别管理(例如身份确认、体重与体温的监测),已日渐成为养殖业者的需求。目前牲畜身份识别的主要方式是通过在动物的耳朵上穿孔佩戴无线射频识别RFID标签。这种识别方法会引起动物的不适,咬标、掉标的情况经常发生。而且,预防非洲猪瘟的有效手段之一是减少场外人员和车辆进入猪场,因此对生猪实行非接触式身份识别与监控,是目前迫切需要解决的问题。
人脸识别通常用于非接触式的访问控制与监测,与养殖企业的应用场景非常相似。因此,理论上可以将人脸识别领域的相关技术迁移至牲畜的身份识别。
但是,猪脸识别又有其特殊性,采集图像中的猪通常关在猪栏内,因此会有猪的部分面部特征被栏杆遮挡的情况,同时长期不清洗也会造成部分面部特征被掩盖,给猪脸识别带来极大困难。构建的猪脸识别模型如何提取到更多、更细化的猪脸面部特征,并提高分类器模型的类内特征的紧凑型和类间特征的分离性,是解决上述问题的关键。
发明内容
本发明所要解决的技术问题在于提供一种改进的残差网络猪脸识别方法,利用ResNet提取深层猪脸特征,并提出用L-Softmax损失函数,增强分类器的特征分类学习能力,实现快速、准确的猪脸识别。
本发明是这样实现的,
一种改进的残差网络猪脸识别方法,该方法包括以下步骤:
S1:采用固定在墙壁的摄像头,同时采集多个猪栏的视频数据,将每一帧分解为静态图像,并将每个猪栏区域分割为单独图像,然后筛选其中光线充足、较为清晰的作为有效的猪栏图像;
S2:构建图像复原深度学习模型,对S1图像进行图像修复处理,去除遮挡猪脸的围栏栏杆;
S3:对修复后猪脸图像根据猪的身份将图像划分到相应的身份标签目录,建立猪脸图像数据集,无需对猪脸部分进行坐标标注和剪裁;
S4:采用改进的残差网络作为主干网络,采用大裕度Softmax(Large MarginSoftmax,L-Softmax)损失函数作为输出层的损失函数构建构建猪脸识别的残差网络(Residual Network,ResNet)深度学习网络模型,并用训练集对模型进行训练;
S5:将测试集图像输入至识别模型进行自动识别验证识别效果。
进一步地,所述步骤S2配置GPU图形处理器,在Linux系统环境下应用部分卷积层法进行猪脸图像修复,去除遮挡猪脸的栏杆。
进一步地,S2中,构建图像复原深度学习模型包括:
S21:构建二维部分卷积层;
S22:用二维部分卷积层代替UNet架构的原有卷积层,并将激活函数修正线性单元(Rectified Linear Unit,ReLU)替换为带泄露修正线性单元(Leaky ReLU),构建部分卷积(Partial Convolution,PConv)网络修复模型S23:按照3:1的比例划分将图像随机为训练集和测试集,用训练集和测试集训练和测试上述模型;
S24:进行复原处理,输入待修复图像,输出即为去除猪脸遮挡物后的图像。
进一步地,步骤4中,采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括:在Linux系统环境下,搭建改进的ResNet-50深度学习网络模型,并进行训练与验证,
所述ResNet-50深度学习网络模型包括卷积层、池化层、以及多个全连接层,其运算步骤依次为:
S41:用8×8的卷积核对输入训练集图像进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出64×36×36的图像P1
S42:使用4×4的卷积核对图像P1进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出128×16×16的图像P2
S43:使用4×4的卷积核对图像P2进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出512×6×6的多维矩阵P3
S44:将多维矩阵P3通过Flatten层变成一维数列,导入全连接层得到数据P4
S45:将数据P4送入输出层,输出层使用L-Softmax损失函数作为目标函数,当损失函数值收敛时,模型训练完成。
进一步地,L-Softmax损失函数表达式如下:
Figure BDA0002504045860000031
其中,
Figure BDA0002504045860000032
W为权值向量,x为特征向量,θ为特征向量x与权值向量W间的夹角。m是常数,控制类别之间的差距,D(θ)为是一个单调减函数且
Figure BDA0002504045860000033
Figure BDA0002504045860000034
保证
Figure BDA0002504045860000035
为一个连续函数,m控制类别之间的差距。
进一步地,采用改进的残差网络作为主干网络,采用L-Softmax损失函数作为输出层的损失函数构建猪脸识别模型包括:在CNN网络上加入残差网络,残差网络中增加直连通道,将原始输入信息直接传到后面的层中,并将权值小于0.1的神经元进行Dropout的操作,将其丢弃。
本发明与现有技术相比,有益效果在于:
本发明猪脸识别作为分类问题,构建分类模型时设计合理的Softmax损失函数,使得不同类特征的类间间距够大,同类特征的类内距离足够小,才能够实现准确分类。本发明采用残差网络作为主干网络,并提出L-Softmax损失函数作为输出层的损失函数,并且在网络中加入早停策略和Dropout正则化方法进一步提高收敛速度。实验表明,本发明中的L-Softmax损失函数能够有效提高学习特征之间的类内紧凑性和类间可分离性,实现了较为准确的猪脸识别。
在构建数据集时不需要分割出猪脸和标注猪脸位置坐标,能够大大节省人力物力。
本发明对猪脸图像进行图像复原处理。由于摄像头置于猪栏外,图像中有围栏栏杆遮挡猪脸。因此为提高识别准确率,应用部分卷积层法(Partial Convolutional,PConv)进行猪脸图像修复,去除遮挡猪脸的栏杆。对复原后猪脸图像根据猪的身份将图像划分到相应的身份标签目录,建立猪脸图像数据集。本算法模型不需要分割出猪脸和标注猪脸位置坐标,大大节省构建数据集的人力物力。
附图说明
图1为本发明所述的于改进的残差网络猪脸识别方法的网络结构及流程图;
图2为本发明所述PConv方法复原图像前后对比图(a)为修复前,(b)为修复后;
图3为本发明所述改进模型与VGG16和未改进Resnet模型的准确率对比;
图4为本发明所述改进模型与VGG16和未改进Resnet模型的损失函数收敛曲线对比。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参见图1所示,一种改进的残差网络猪脸识别方法,该方法包括以下步骤:
S1:采用固定在墙壁的摄像头,同时采集多个猪栏的视频数据,将每一帧分解为静态图像,并将每个猪栏区域分割为单独图像,然后筛选其中光线充足、较为清晰的作为有效的猪栏图像;
S2:构建图像复原深度学习模型,对S1图像进行图像修复处理,去除遮挡猪脸的围栏栏杆;
S3:对修复后猪脸图像根据猪的身份将图像划分到相应的身份标签目录,建立猪脸图像数据集,无需对猪脸部分进行坐标标注和剪裁;
S4:采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型,并用训练集对模型进行训练;
S5:将测试集图像输入至识别模型进行自动识别验证识别效果。
步骤S1:猪栏区域分割及图像筛选。先将单帧图像中的每个猪栏分割为猪栏区域图像。由于光照不足和目标运动等因素,都会使普通摄像头拍摄的图像较为模糊,因此需要筛选光线较为充足、猪脸较为清晰的图像作为有效图像。
步骤S2配置GPU图形处理器,在Linux系统环境下应用部分卷积层法进行猪脸图像修复,去除遮挡猪脸的栏杆,参见图2(a)为修复前以及图2(b)未修复后的对比图。
S2中,构建图像复原深度学习模型包括:
S21:构建二维部分卷积层;
S22:用二维部分卷积层代替UNet架构的原有卷积层,并将激活函数RELU替换为LeakyRELU,构建PConv网络修复模型;
S23:按照3:1的比例划分将图像随机为训练集和测试集,用训练集和测试集训练和测试上述模型;
S24:进行复原处理,输入待修复图像,输出即为去除猪脸遮挡物后的图像。
为了降低图像中围栏栏杆对猪脸识别结果的影响,在数据集构建过程中,在预处理阶段对猪栏图像进行修复,采用部分卷积神经网络(Partial Convolution,PConv)模型去除遮挡脸部的栏杆。
目前现有的基于的卷积网络的图像修复方法存在一些缺陷,如颜色不匹配和模糊等,所以会使用后处理来消除这些缺陷,但是通常失败。将待修复图像的损坏区域用0像素值标记为掩膜(mask),为图像的无效区域,未被损坏的区域为图像有效区域。部分卷积是指卷积只在图片的有效区域进行卷积、池化操作,并且图片的掩膜会随着网络层数的加深,经过不断迭代可以对掩膜周围区域进行预测并填充有效值,在进入解码阶段之前,只要网络深度足够,掩膜区域大小可以收缩直至消失。
PConv模型以UNet作为主网络结构,用部分卷积层替换原卷积层,并在解码阶段使用最近邻上采样,然后分别连接两个特征映射和两个掩膜作为下一层部分卷积层的特征和掩膜输入。
将部分卷积运算和掩膜更新函数联合称为部分卷积层,计算过程如下:
Figure BDA0002504045860000061
Figure BDA0002504045860000062
如上式所示,W表示卷积层滤波器的权重,b表示卷积层滤波器的偏差值,X表示输入的图片,M表示掩膜,⊙表示元素点乘运算,x'表示输入图片经过卷积后的输出,m'表示输入掩膜经过卷积后的输出。
模型使用堆叠的部分卷积运算和掩模更新步骤来执行图像修复。卷积运算后如果卷积能够在至少一个有效输入值上调节其输出,则将该位置标记为有效。每进行一次卷积,进行一次掩膜更新。只要卷积核所对应的掩膜区域有一个元素是有效的,那么卷积核中心位置对应的掩膜就会进行更新。通过多次迭代,掩膜的区域会越来越小,最终完全消失,此时图像修复完成。
进一步地,步骤4中,采用改进的残差网络作为主干网络,采用L-Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括:在Linux系统环境下,搭建改进的残差网络深度学习网络模型,并进行训练与验证,
所述残差网络深度学习网络模型包括卷积层、池化层、以及多个全连接层,其运算步骤依次为:
S41:用8×8的卷积核对输入训练集图像进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出64×36×36的图像P1
S42:使用4×4的卷积核对图像P1进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出128×16×16的图像P2
S43:使用4×4的卷积核对图像P2进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出512×6×6的多维矩阵P3
S44:将多维矩阵P3通过Flatten层变成一维数列,导入全连接层得到数据P4
S45:将数据P4送入输出层,输出层使用大裕度Softmax损失函数作为目标函数,当损失函数值收敛时,模型训练完成。
大裕度Softmax损失函数表达式如下:
Figure BDA0002504045860000071
其中,
Figure BDA0002504045860000072
W为权值向量,x为特征向量,θ为特征向量x与权值向量W间的夹角。m是常数,控制类别之间的差距,D(θ)为是一个单调减函数且
Figure BDA0002504045860000073
Figure BDA0002504045860000074
保证
Figure BDA0002504045860000075
为一个连续函数,m控制类别之间的差距。
采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括:在CNN网络上加入残差网络,残差网络中增加直连通道,将原始输入信息直接传到后面的层中,并将权值小于0.1的神经元进行Dropout的操作,将其丢弃。
改进的残差网络猪脸识别
本发明在一般CNN网络基础上引入残差网络模型加以改进。在利用一般CNN网络对图像进行识别的过程中,随着网络深度的增加,模型对于特征的敏感度会提高,有利于提高识别准确。但是网络深度加深即神经网络层数增加,会出现梯度消失的问题:下降的梯度从网络输出端向输入端传播,当网络深度增加后,靠近输入端层的梯度的值会随之变得很小,意味着这些层的学习基本停滞;而且随着网络深度增加,使得参数空间变大,增加了优化难度,网络层数的增加反而导致训练误差增加,识别率降低。ResNet可以有效解决梯度消失问题,不仅让可以训练更深的网络,而且大大提高了网络的准确率。
在神经网络的输出端应采用多输出的Softmax函数。本发明对Softmax函数进行了改进,以大裕度Softmax构建新的损失函数,使得深度学习模型具有较高的猪脸特征类内紧凑性和类间可分离性。
采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别模型包括:在CNN网络上加入残差网络,残差网络中增加直连通道,将原始输入信息直接传到后面的层中,并将权值小于0.1的神经元进行Dropout的操作,将其丢弃。这样可以有效的防止过拟合以及神经元太多而带来的运行速度过慢等问题。
使用大裕度Softmax分类,可以有效对猪脸进行分类,其中在训练过程中提出早停策略,即当准确率下降并且损失函数上升持续一定次数,本算法中为50次,即停止这个梯度,转而重新转换为另外一个梯度,继续运行算法,直至程序结束,然后输出猪的识别结果及识别准确率。
下面结合实际构建的猪脸数据集(45头猪,总数6707张图像)为实例,对本发明进行进一步详细说明。上述猪脸识别模块可以表述为以下步骤:
第一步:利用固定摄像头采集猪栏信息,并进行图像预处理,构建猪脸图像数据集,所述预处理环节依次进行以下3个处理步骤:
(1)区域分割与图像筛选:将视频数据的每一帧分解为静态图像,并对将每一只猪所在猪栏分割为单独猪栏区域图像,并筛选光线充足较为清晰的图像I1,共6707张。
(2)图像修复:配置GPU图形处理器,在Linux系统环境下,构建部分卷积神经网络模型对图像进行修复处理,去除I1中遮挡猪脸的围栏栏杆,得到图像I2;
①标注待修复区域
将需要复原的部分用绿色(0,255,0)覆盖,将图片保存为.png格式;
②构建图像复原深度学习模型
使用以下组件:Python 3.6TensorFlow 1.10Keras 2.2.4Pillow h5py编译代码,构建图像复原深度学习模型。
step 1:构建二维部分卷积(PConv2D)层;
step 2:用PConv2D层代替UNet架构的原有卷积层,并将激活函数ReLU
替换为LeakyReLU,构建PConv网络修复模型;
step 3:按照3:1的比例划分将6707张图像随机为训练集和测试集,用训练集和测试集训练和测试上述模型;
step 4:进行复原处理,输入待修复图像,输出即为去除猪脸遮挡物后的图像I2。
(3)图像剪裁及归一化:对上一步得到的图像进行适宜的裁剪以得到固定分辨率224×224的图像,然后对其进行图像归一化,得到图像I3。
第二步,将45类6707张图像经过上述I1到图像I3的处理过程,即得到本实验的猪脸数据集。按照3:1的比例随机将数据集分为训练集和测试集。
第三步,在Linux系统环境下,搭建改进的50层的ResNet(即ResNet-50)深度学习网络模型,并进行训练与验证。
所述ResNet-50深度学习网络模型包括卷积层、池化层、以及若干全连接层,其运算步骤依次为:
用8×8的卷积核对输入训练集图像进行卷积、线性激活,经池化层池化后,导入全连接层(Fully Connection,FC),通过全连接层输出64×36×36的图像P1;
使用4×4的卷积核对P1进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出128×16×16的图像P2;
使用4×4的卷积核对P2进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出512×6×6的多维矩阵P3;
由于原ResNet模型的输出节点数与本发明需要的输出种类数(45类)不一致,因此对ResNet模型进行了相应的改进:,将多维矩阵P3通过Flatten层变成一维数列,导入全连接层得到P4;
将P4送入输出层,输出层使用L-Softmax损失函数作为目标函数,当损失函数值收敛时,模型训练完成。
将验证集图像输入训练后的模型,对模型识别准确率进行验证,并得到相应识别结果。
综上实例结合图3本发明所述改进模型与VGG16和未改进Resnet模型的准确率对比;图4为本发明所述改进模型与VGG16和未改进Resnet模型的损失函数收敛曲线对比。可见,本发明对于猪脸识别模型的提出及应用,充分展现了本发明在猪脸识别领域的优越性。通过对Resnet网络的改进,提高了分类的准确率,使得猪脸识别的准确率得到了很大提高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种改进的残差网络猪脸识别方法,其特征在于,该方法包括以下步骤:
S1:采用固定在墙壁的摄像头,同时采集多个猪栏的视频数据,将每一帧分解为静态图像,并将每个猪栏区域分割为单独图像,然后筛选其中光线充足、较为清晰的作为有效的猪栏图像;
S2:构建图像复原深度学习模型,对S1图像进行图像修复处理,去除遮挡猪脸的围栏栏杆;
S3:对修复后猪脸图像根据猪的身份将图像划分到相应的身份标签目录,建立猪脸图像数据集,无需对猪脸部分进行坐标标注和剪裁;
S4:采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型,并用训练集对ResNet深度学习网络模型进行训练;
S5:将测试集图像输入至识别模型,进行自动识别验证识别效果;
S2中,构建图像复原深度学习模型包括:
S21:构建二维部分卷积层;
S22:用部分卷积层代替U-Net架构的原有卷积层,并将激活函数修正线性单元替换为带泄露修正线性单元,构建部分卷积网络修复模型;
S23:按照3:1的比例划分将图像随机为训练集和测试集,用训练集和测试集训练和测试上述模型;
S24:进行复原处理,输入待修复图像,输出即为去除猪脸遮挡物后的图像;
图像复原深度学习模型对图像修复方法包括:将待修复图像的损坏区域用0像素值标记为掩膜,为图像的无效区域,未被损坏的区域为图像有效区域,部分卷积层只在图片的有效区域进行卷积、池化操作,图片的掩膜会随着网络层数的加深,经过不断迭代对掩膜周围区域进行预测并填充有效值,计算过程如下:
如上式所示,W表示卷积层滤波器的权重,b表示卷积层滤波器的偏差值,X表示输入的图片,M表示掩膜,⊙表示元素点乘运算,x'表示输入图片经过卷积后的输出,m'表示输入掩膜经过卷积后的输出;
步骤4中,采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型包括:在Linux系统环境下,搭建改进的残差网络深度学习网络模型,并进行训练与验证,
所述残差网络深度学习网络模型包括卷积层、池化层、以及多个全连接层,其运算步骤依次为:
S41:用8×8的卷积核对输入训练集图像进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出64×36×36的图像P1
S42:使用4×4的卷积核对图像P1进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出128×16×16的图像P2
S43:使用4×4的卷积核对图像P2进行卷积、线性激活,经池化层池化后,导入全连接层,通过全连接层输出512×6×6的多维矩阵P3
S44:将多维矩阵P3通过Flatten层变成一维数列,导入全连接层得到数据P4
S45:将数据P4送入输出层,输出层使用大裕度Softmax损失函数作为目标函数,当损失函数值收敛时,模型训练完成。
2.按照权利要求1所述的方法,其特征在于,所述步骤S2配置GPU图形处理器,在Linux系统环境下应用部分卷积层法进行猪脸图像修复,去除遮挡猪脸的栏杆。
3.按照权利要求1所述的方法,其特征在于,大裕度Softmax损失函数表达式如下:
其中,
W为权值向量,x为特征向量,θ为特征向量x与权值向量W间的夹角;m是常数,控制类别之间的差距,D(θ)为是一个单调减函数且保证为一个连续函数。
4.按照权利要求1所述的方法,其特征在于,采用改进的残差网络作为主干网络,采用大裕度Softmax损失函数作为输出层的损失函数构建猪脸识别的残差网络深度学习网络模型还包括:在CNN网络上加入残差网络,残差网络中增加直连通道,将原始输入信息直接传到后面的层中,并将权值小于0.1的神经元进行Dropout的操作,将其丢弃。
CN202010445823.0A 2020-05-22 2020-05-22 一种改进的残差网络猪脸识别方法 Active CN111666838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010445823.0A CN111666838B (zh) 2020-05-22 2020-05-22 一种改进的残差网络猪脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010445823.0A CN111666838B (zh) 2020-05-22 2020-05-22 一种改进的残差网络猪脸识别方法

Publications (2)

Publication Number Publication Date
CN111666838A CN111666838A (zh) 2020-09-15
CN111666838B true CN111666838B (zh) 2023-04-18

Family

ID=72384389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010445823.0A Active CN111666838B (zh) 2020-05-22 2020-05-22 一种改进的残差网络猪脸识别方法

Country Status (1)

Country Link
CN (1) CN111666838B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949406A (zh) * 2021-02-02 2021-06-11 西北农林科技大学 一种基于深度学习算法的羊只个体身份识别方法
CN113065460B (zh) * 2021-03-31 2022-04-29 吉林农业大学 基于多任务级联的猪脸面部表情识别框架的建立方法
CN113469356B (zh) * 2021-06-03 2024-06-07 江苏大学 一种基于迁移学习的改进vgg16网络猪的身份识别方法
CN113392783B (zh) * 2021-06-18 2022-11-01 河南科技学院 一种基于改进的ResNet的透窗对象检测方法
CN113326804A (zh) * 2021-06-24 2021-08-31 河北农业大学 一种动物个体识别方法
CN113378980B (zh) * 2021-07-02 2023-05-09 西安电子科技大学 基于自适应上下文注意力机制的口罩遮挡人脸恢复方法
CN113449674B (zh) * 2021-07-12 2022-09-30 江苏商贸职业学院 一种猪脸识别方法及系统
CN113569962A (zh) * 2021-07-30 2021-10-29 昆明理工大学 一种基于TFL-ResNet的残药智能识别方法
CN114359958B (zh) * 2021-12-14 2024-02-20 合肥工业大学 一种基于通道注意力机制的猪脸识别方法
CN114898177B (zh) * 2022-05-09 2023-08-04 梅卡曼德(北京)机器人科技有限公司 缺陷图像生成方法、模型训练方法、设备、介质及产品
CN117313818A (zh) * 2023-09-28 2023-12-29 四川大学 对轻量级卷积神经网络训练的方法及终端设备
CN117558036B (zh) * 2024-01-11 2024-04-05 长春大学 一种基于图像增强和残差网络的多品种牛面部识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679502A (zh) * 2017-10-12 2018-02-09 南京行者易智能交通科技有限公司 一种基于深度学习图像语义分割的人数估计方法
CN108388877A (zh) * 2018-03-14 2018-08-10 广州影子控股股份有限公司 一种猪脸的识别方法
CN110046602A (zh) * 2019-04-24 2019-07-23 李守斌 基于分类的深度学习人脸检测方法
CN111126346A (zh) * 2020-01-06 2020-05-08 腾讯科技(深圳)有限公司 脸部识别方法、分类模型的训练方法、装置和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321785A (zh) * 2019-05-09 2019-10-11 北京尚文金泰教育科技有限公司 一种引入ResNet深度学习网络构建皮纹分类预测模型的方法
CN110728179A (zh) * 2019-09-04 2020-01-24 天津大学 一种采用多路卷积神经网络的猪脸识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679502A (zh) * 2017-10-12 2018-02-09 南京行者易智能交通科技有限公司 一种基于深度学习图像语义分割的人数估计方法
CN108388877A (zh) * 2018-03-14 2018-08-10 广州影子控股股份有限公司 一种猪脸的识别方法
CN110046602A (zh) * 2019-04-24 2019-07-23 李守斌 基于分类的深度学习人脸检测方法
CN111126346A (zh) * 2020-01-06 2020-05-08 腾讯科技(深圳)有限公司 脸部识别方法、分类模型的训练方法、装置和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Mark.F.Hansen等.Towards on-farm pig face recognition using convolutional neural networks.《Computers in Industry》.2018,第98卷145-152. *
王荣等.多变环境下基于多尺度卷积网络的猪个体识别.《江西农业大学学报》.2020,第42卷(第02期),391-400. *
薛月菊等.基于改进Faster R-CNN识别深度视频图像哺乳母猪姿态.《农业工程学报》.2020,(第09期),189-196. *

Also Published As

Publication number Publication date
CN111666838A (zh) 2020-09-15

Similar Documents

Publication Publication Date Title
CN111666838B (zh) 一种改进的残差网络猪脸识别方法
CN108805015B (zh) 加权卷积自编码长短期记忆网络人群异常检测方法
Sun et al. Research on the hand gesture recognition based on deep learning
Bautista et al. Convolutional neural network for vehicle detection in low resolution traffic videos
Gonçalves et al. Real-time automatic license plate recognition through deep multi-task networks
CN111598030A (zh) 一种航拍图像中车辆检测和分割的方法及系统
CN111079674B (zh) 一种基于全局和局部信息融合的目标检测方法
Zhang et al. Application of deep learning and unmanned aerial vehicle technology in traffic flow monitoring
CN107145889A (zh) 基于具有RoI池化的双CNN网络的目标识别方法
Ni et al. A generative adversarial learning strategy for enhanced lightweight crack delineation networks
CN111612024B (zh) 特征提取方法、装置、电子设备及计算机可读存储介质
CN112183313A (zh) 一种基于SlowFast的电力作业现场动作识别方法
CN112686247A (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
Fu et al. HighlightNet: highlighting low-light potential features for real-time UAV tracking
CN114743126A (zh) 一种基于图注意力机制网络的车道线标志分割方法
Wang et al. Water hazard detection using conditional generative adversarial network with mixture reflection attention units
CN111881914B (zh) 一种基于自学习阈值的车牌字符分割方法及系统
CN114743257A (zh) 图像目标行为的检测识别方法
CN111401139B (zh) 基于字符图像智能识别获得矿山井下设备位置的方法
CN112686872A (zh) 基于深度学习的木材计数方法
CN117115789A (zh) 一种时敏目标检测网络及时敏目标消隐方法
CN111079516A (zh) 基于深度神经网络的行人步态分割方法
Zonglei et al. SA‑FRCNN: An Improved Object Detection Method for Airport Apron Scenes.
CN111160316B (zh) 一种基于轻量级神经网络的车牌识别方法
Tao et al. A Real-Time License Plate Detection and Recognition Model in Unconstrained Scenarios

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant