CN114359958A - 一种基于通道注意力机制的猪脸识别方法 - Google Patents

一种基于通道注意力机制的猪脸识别方法 Download PDF

Info

Publication number
CN114359958A
CN114359958A CN202111536355.9A CN202111536355A CN114359958A CN 114359958 A CN114359958 A CN 114359958A CN 202111536355 A CN202111536355 A CN 202111536355A CN 114359958 A CN114359958 A CN 114359958A
Authority
CN
China
Prior art keywords
pig face
multiplied
channel
network
pig
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111536355.9A
Other languages
English (en)
Other versions
CN114359958B (zh
Inventor
许水清
何启航
郑浩东
陶松兵
都海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202111536355.9A priority Critical patent/CN114359958B/zh
Publication of CN114359958A publication Critical patent/CN114359958A/zh
Application granted granted Critical
Publication of CN114359958B publication Critical patent/CN114359958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于通道注意力机制的猪脸识别方法,属于计算机视觉技术领域,该识别方法通过训练样本集对主干网络的优化得到猪脸识别网络,并利用猪脸识别网络对猪脸进行识别。本发明识别方法采用基于通道注意力机制的残差网络作为主干网络,加入了通道注意力机制,引入了新的数据压缩方法,相比于传统的通道注意力机制,采取全局平均池化的压缩方法,通道注意力机制的数据压缩方法,能更好的提高网络的识别率。本发明的方法在测试样本集中的准确率,均高于其他方法,能更好的适应复杂的农场环境。

Description

一种基于通道注意力机制的猪脸识别方法
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于通道注意力机制的猪脸识别方法。
背景技术
计算机视觉技术已经深入到畜牧业的众多领域,其中利用图像处理与深度学习的方法实现猪个体识别成为近年来的研究热点。猪作为一种杂食性哺乳动物,不同个体之间面部特征存在差异,理论上可以将人脸识别领域的相关技术迁移至猪的身份识别。但是猪脸识别又有其特殊性,第一,猪的近亲繁殖特性导致其个体相似度很高,第二,长期不清洗的猪脸也会掩盖其面部特征,第三,猪不会配合进行猪脸的识别,想采集到较好质量的猪脸图片较为困难,这些问题,都给猪脸识别带来很大的困难。直接将人脸识别技术应用到猪脸识别领域会存在着一些局限性。
目前传统的猪个体识别技术的方法之一是在猪身体背部喷涂彩色图案,利用图像对比技术和尺度不变特征变换匹配等算法识别猪个体,这种方法对猪的身体造成了侵害,影响后续猪肉的销售,同时,当实际畜牧养殖中,猪个体数量较多时,给每只猪身体背部喷涂彩色图案,将是一个耗时耗力的工作;方法之二是在猪的耳朵上穿孔佩戴无线射频识别RFID标签,这种识别方法会引起动物的不适,咬标、掉标的情况经常发生;方法之三是使用支持向量机、等度量映射融合以及Fisherface等算法通过识别脸部确定猪只身份;但实际畜牧养殖中,环境较差,传统的识别算法应用于复杂的农场环境时,准确率并不理想,无法满足实际需求。
综上所述,现有的猪脸识别技术存在以下问题:
1.猪的近亲繁殖导致个体间相似度很高,人脸识别技术直接应用到猪脸上效果不是很好。
2.长期不清洗的猪脸,会比较脏,掩盖猪脸本来的特征,对特征提取造成一定的影响。
3.对猪脸进行识别时,猪不会配合着进行识别,猪脸会出现多个角度。
4.现有的猪脸识别算法,在复杂的农场环境下,无法保证一个较好的识别率。
发明内容
本发明的目的是解决上述现有技术中存在的问题。具体地,采用基于通道注意力机制的残差网络作为主干网络,利用训练样本集来优化主干网络,利用测试样本集,挑选出优化效果最好的主干网络,作为猪脸识别网络,对猪脸进行识别。与传统方法相比,本发明方法,由于通道注意力机制的加入,能够提高猪脸识别网络的识别率,能够更好的适应复杂的农场环境,保证一定的识别率,同时对于多角度的猪脸识别也是有效的。
为达上述目的,本发明提供了一种基于通道注意力机制的猪脸识别方法,包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络,并利用该猪脸识别网络对猪脸进行识别,具体包括以下步骤:
步骤1,猪脸图像的采集和处理
采集Z类猪脸图像;
在Z类猪脸图像的每类中选M张猪脸图像,得到M×Z张猪脸图像,然后对M×Z张猪脸图像分别用A种图像处理方式进行数据增强并保留每种图像处理方式得到的猪脸图像,即共得到(A+1)×M×Z张猪脸图像,该(A+1)×M×Z猪脸图像构成一个训练样本集;
在Z类猪脸图像的每类中另外选N张猪脸图像,得到N×Z张猪脸图像,该N×Z张猪脸图像构成一个测试样本集,N≠M;
步骤2,通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的网络,并将该具有最佳识别效果的网络记为猪脸识别网络,步骤如下:
步骤2.1,采用基于通道注意力机制的残差网络作为主干网络,所述残差网络的结构包括:卷积核大小为7×7通道数为64的卷积层Γ1,卷积核大小为3×3的最大池化下采样层Φ,3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组Λ1,4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2,6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3,3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4;主干网络的输入为卷积层Γ1,卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组A4依次串联;
所述残差结构1由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为64的卷积层,卷积核大小为3×3通道数为64的卷积层,卷积核大小为1×1通道数为256的卷积层,在卷积核大小为1×1通道数为256的卷积层后插入一个通道注意力机制;
所述残差结构2由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为128的卷积层,卷积核大小为3×3通道数为128的卷积层,卷积核大小为1×1通道数为512的卷积层,在卷积核大小为1×1通道数为512的卷积层后插入一个通道注意力机制;
所述残差结构3由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为256的卷积层,卷积核大小为3×3通道数为256的卷积层,卷积核大小为1×1通道数为1024的卷积层,在卷积核大小为1×1通道数为1024的卷积层后插入一个通道注意力机制;
所述残差结构4由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为512的卷积层,卷积核大小为3×3通道数为512的卷积层,卷积核大小为1×1通道数为2048的卷积层,在卷积核大小为1×1通道数为2048的卷积层后插入一个通道注意力机制;
主干网络的输出为第四残差结构组Λ4中的第3个残差结构4后插入的通道注意力机制的输出;
将通道注意力机制插入前的卷积层的通道数记为δ,δ或等于256或等于512或等于1024或等于2048;
步骤2.2,利用训练样本集对步骤2.1所述主干网络进行优化,具体步骤如下:
步骤2.2.1,通过图像预处理操作将训练样本集中的猪脸图像的像素统一调整为C×C;
步骤2.2.2,随机选取训练样本集中的B张猪脸图像,并将其中任意一个猪脸图像的序号记为s,s=1,2,...,B,计算第s张猪脸图像的实际概率序列Ys
Figure BDA0003410745460000051
其中,q为实际概率序列Ys中每个实际概率值的序号,q=1,2,...,Z,
Figure BDA0003410745460000052
表示第s张猪脸图像在实际概率序列Ys中的第q个实际概率值;
实际概率序列Ys的取值如下:令
Figure BDA0003410745460000053
Figure BDA0003410745460000054
中的其他实际概率值均等于0;
步骤2.2.3,将步骤2.2.2选取得到的B张猪脸图像输入主干网络,输出每张猪脸图像的预测概率序列Xs
Figure BDA0003410745460000055
其中p为预测概率序列Xs中每个预测概率值的序号,p=1,2,...,Z,
Figure BDA0003410745460000056
表示第s张猪脸图像在预测概率序列Xs中的第p个预测概率值;
步骤2.2.4,根据预测概率序列Xs与实际概率序列Ys对主干网络进行优化;
步骤2.2.5,重复步骤2.2.2至步骤2.2.4,直至训练样本集中的猪脸图像都被选取过;特别的,如果最后一轮选取中,训练样本集剩下的猪脸图像数小于B,则从已经选取过的猪脸图像中随机选取猪脸图像进行补充;
将通过步骤2.2.2-步骤2.2.5完成优化的主干网络记为第h世代的主干网络Th,其中h为世代的序号;
步骤2.3,利用测试样本集,计算第h世代的主干网络Th对测试样本集中猪脸图像分类的准确率vh
Figure BDA0003410745460000061
Figure BDA0003410745460000062
为利用主干网络Th对测试样本集中猪脸图像进行正确分类的数值,
Figure BDA0003410745460000063
步骤2.4,设重复次数为G,G次重复步骤2.2和步骤2.3,得到一个主干网络序列T和一个准确率序列V,T={T1,T2,...,Th,...,TG},V={v1,v2,...,vh,...,vG};
步骤2.5,记vo为最高准确率,vo=max{v1,v2,...,vh,...,vG},vo对应的主干网络To即为具有最佳识别效果的网络,并记为猪脸识别网络;
步骤3,利用猪脸识别网络对猪脸进行识别,具体步骤如下:
步骤3.1,输入一张待识别原始猪脸图像并进行以下图像处理:首先将该待识别原始猪脸图像的像素调整为D×D,然后再将像素调整为D×D的待识别原始猪脸图像的大小裁剪为E×E,其中E<D;
将通过前述处理的待识别原始猪脸图像记为待识别猪脸图像;
步骤3.2,将待识别猪脸图像送入猪脸识别网络,得到待识别猪脸图像特征向量J,其中J=(j1,j2,...,jl,...,jZ),l表示待识别猪脸图像特征向量的维数,jl表示第l维待识别猪脸图像特征向量的值,l=1,2,...,Z;
步骤3.3,用softmax函数对步骤3.2得到的待识别猪脸图像特征向量J进行运算,得到概率序列R,其中,R={r1,r2,...,rg,...,rZ},g表示概率序列R的维数,rg表示第g维概率序列的值,g=1,2,...,Z;
所述softmax函数的表达式为:
Figure BDA0003410745460000071
其中,log表示对数函数,e表示指数函数,
Figure BDA0003410745460000072
Figure BDA0003410745460000073
步骤3.4,取rτ=max{r1,r2,...,rg,...,rZ},τ对应的概率序列R的维数即为待识别猪脸图像的类别数,rτ的值为该类别数的置信度。
优选地,步骤1所述A种图像处理方式为9种处理方式,即A=9,具体包括:颜色增强,加入高斯噪声,镜像对称,尺寸扩大两倍,向左旋转20度,随机裁剪,对比度增强,亮度增强,随机变色。
优选地,步骤2所述通道注意力机制的实现步骤如下:
根据权利要求1的步骤2.1,通道注意力机制共输入δ个通道的多维通道特征向量,对每一个多维通道特征向量,将其首尾连接展开得到4λ个一维通道特征向量;
记δ个通道中任一个通道的展平向量为Fγ
Figure BDA0003410745460000074
Figure BDA0003410745460000075
γ表示输入的通道的序号,i表示一维通道特征向量值在展平向量Fγ中的序号,
Figure BDA0003410745460000076
表示展平向量Fγ中第γ个通道的第i个一维通道特征向量值,i=1,2,...,4λ,γ=1,2,...,δ;
对展平向量Fγ中的一维通道特征向量值
Figure BDA0003410745460000077
按照从小到大的顺序重新进行排序,得到排序后的展平向量Hγ
Figure BDA0003410745460000078
Figure BDA0003410745460000081
m表示一维通道特征向量值在排序后的展平向量Hγ中的序号,
Figure BDA0003410745460000082
表示排序后的展平向量Hγ中第γ个通道的第m个一维通道特征向量值,m=1,2,...,4λ;
对排序后的展平向量Hγ保留
Figure BDA0003410745460000083
Figure BDA0003410745460000084
的值,得到去除异常值的展平向量Iγ
Figure BDA0003410745460000085
n表示一维通道特征向量值在去除异常值的展平向量Iγ中的序号,
Figure BDA0003410745460000086
表示去除异常值的展平向量Iγ中第γ个通道第n个一维通道特征向量值,n=λ,λ+1,...,3λ;
对去除异常值的展平向量Iγ,用求平均值的方式,对每个通道进行数据压缩,得到压缩向量Lγ
Figure BDA0003410745460000087
将压缩向量Lγ经过激活模块,完成通道注意力机制,其中,激活模块的具体步骤如下所述:
对压缩向量Lγ,先经过节点数为γ的全连接层,再经过节点数为γ/θ的全连接层,再经过ReLU函数,再经过节点数为γ的全连接层,最后经过Sigmoid函数,其中θ为大于0的整数;
ReLU函数的表达式如下:
Figure BDA0003410745460000088
其中,
Figure BDA0003410745460000089
表示ReLU函数的输入,
Figure BDA00034107454600000810
表示ReLU函数的输出;
Sigmoid函数的表达式如下:
Figure BDA00034107454600000811
其中,e表示指数函数,ω表示Sigmoid函数的输入,y(ω)表示Sigmoid函数的输出。
优选地,步骤2所述根据预测概率序列Xs与实际概率序列Ys对主干网络进行优化的具体方式如下:
计算预测概率序列Xs与实际概率序列Ys之间的损失函数loss,
Figure BDA0003410745460000091
其中,||·||2表示2范数,通过梯度下降法最小化损失函数loss,完成主干网络的优化。
与现有技术相比,本发明的有益效果如下:
1.本发明提出的通道注意力机制采用了出新的压缩数据方法,先去除异常值,再求平均值对数据进行压缩。
2.对长期不清洗的猪脸,虽然掩盖了部分特征,但仍能保证着不错的识别效果,本发明的注意力机制会有选择性的提取需要的特征。
3.对于农场这种复杂环境,本发明可以保证一个不错的识别率。
4.本发明提出的基于通道注意力机制的残差网络在对多角度的猪脸识别性能比较强,更适合实际的应用。
附图说明
图1是本发明猪脸识别方法的流程图;
图2是本发明猪脸识别方法的示意框图;
图3是本发明实施例中通道注意力机制实现步骤示意图;
图4是本发明实施例中本发猪脸识别方法和其他方法准确率对比图。
具体实施方式
下面将结合附图和具体的实施方式对本发明的技术方案进行清楚、完整的描述。
图1是本发明猪脸识别方法的流程图,图2是本发明猪脸识别方法的示意框图,由图1和图2可见,本发明提供了一种基于通道注意力机制的猪脸识别方法,包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络,并利用该猪脸识别网络对猪脸进行识别,具体包括以下步骤:
步骤1,猪脸图像的采集和处理
采集Z类猪脸图像;
在Z类猪脸图像的每类中选M张猪脸图像,得到M×Z张猪脸图像,然后对M×Z张猪脸图像分别用A种图像处理方式进行数据增强并保留每种图像处理方式得到的猪脸图像,即共得到(A+1)×M×Z张猪脸图像,该(A+1)×M×Z猪脸图像构成一个训练样本集;
在Z类猪脸图像的每类中另外选N张猪脸图像,得到N×Z张猪脸图像,该N×Z张猪脸图像构成一个测试样本集,N≠M。
在本实施例中,所述A种图像处理方式为9种处理方式,即A=9,具体包括:颜色增强,加入高斯噪声,镜像对称,尺寸扩大两倍,向左旋转20度,随机裁剪,对比度增强,亮度增强,随机变色。
在本实施例中,取Z=30,M=3,A=9,N=10。
步骤2,通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的网络,并将该具有最佳识别效果的网络记为猪脸识别网络,步骤如下:
步骤2.1,采用基于通道注意力机制的残差网络作为主干网络,所述残差网络的结构包括:卷积核大小为7×7通道数为64的卷积层Γ1,卷积核大小为3×3的最大池化下采样层Φ,3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组Λ1,4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2,6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3,3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4;主干网络的输入为卷积层Γ1,卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组Λ4依次串联;
所述残差结构1由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为64的卷积层,卷积核大小为3×3通道数为64的卷积层,卷积核大小为1×1通道数为256的卷积层,在卷积核大小为1×1通道数为256的卷积层后插入一个通道注意力机制;
所述残差结构2由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为128的卷积层,卷积核大小为3×3通道数为128的卷积层,卷积核大小为1×1通道数为512的卷积层,在卷积核大小为1×1通道数为512的卷积层后插入一个通道注意力机制;
所述残差结构3由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为256的卷积层,卷积核大小为3×3通道数为256的卷积层,卷积核大小为1×1通道数为1024的卷积层,在卷积核大小为1×1通道数为1024的卷积层后插入一个通道注意力机制;
所述残差结构4由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为512的卷积层,卷积核大小为3×3通道数为512的卷积层,卷积核大小为1×1通道数为2048的卷积层,在卷积核大小为1×1通道数为2048的卷积层后插入一个通道注意力机制;
主干网络的输出为第四残差结构组Λ4中的第3个残差结构4后插入的通道注意力机制的输出;
将通道注意力机制插入前的卷积层的通道数记为δ,δ或等于256或等于512或等于1024或等于2048。
图3是本发明实施例中通道注意力机制实现步骤示意图,由图3可见,在本实施例中,所述通道注意力机制的实现步骤如下:
根据权利要求1的步骤2.1,通道注意力机制共输入δ个通道的多维通道特征向量,对每一个多维通道特征向量,将其首尾连接展开得到4λ个一维通道特征向量;
记δ个通道中任一个通道的展平向量为Fγ
Figure BDA0003410745460000121
Figure BDA0003410745460000122
γ表示输入的通道的序号,i表示一维通道特征向量值在展平向量Fγ中的序号,
Figure BDA0003410745460000123
表示展平向量Fγ中第γ个通道的第i个一维通道特征向量值,i=1,2,...,4λ,γ=1,2,...,δ;
对展平向量Fγ中的一维通道特征向量值
Figure BDA0003410745460000124
按照从小到大的顺序重新进行排序,得到排序后的展平向量Hγ
Figure BDA0003410745460000125
Figure BDA0003410745460000126
m表示一维通道特征向量值在排序后的展平向量Hγ中的序号,
Figure BDA0003410745460000127
表示排序后的展平向量Hγ中第γ个通道的第m个一维通道特征向量值,m=1,2,...,4λ;
对排序后的展平向量Hγ保留
Figure BDA0003410745460000131
Figure BDA0003410745460000132
的值,得到去除异常值的展平向量Iγ
Figure BDA0003410745460000133
n表示一维通道特征向量值在去除异常值的展平向量Iγ中的序号,
Figure BDA0003410745460000134
表示去除异常值的展平向量Iγ中第γ个通道第n个一维通道特征向量值,n=λ,λ+1,...,3λ;
对去除异常值的展平向量Iγ,用求平均值的方式,对每个通道进行数据压缩,得到压缩向量Lγ
Figure BDA0003410745460000135
将压缩向量Lγ经过激活模块,完成通道注意力机制,其中,激活模块的具体步骤如下所述:
对压缩向量Lγ,先经过节点数为γ的全连接层,再经过节点数为γ/θ的全连接层,再经过ReLU函数,再经过节点数为γ的全连接层,最后经过Sigmoid函数,其中θ为大于0的整数;
ReLU函数的表达式如下:
Figure BDA0003410745460000136
其中,
Figure BDA0003410745460000137
表示ReLU函数的输入,
Figure BDA0003410745460000138
表示ReLU函数的输出;
Sigmoid函数的表达式如下:
Figure BDA0003410745460000139
其中,e表示指数函数,ω表示Sigmoid函数的输入,y(ω)表示Sigmoid函数的输出。
步骤2.2,利用训练样本集对步骤2.1所述主干网络进行优化,具体步骤如下:
步骤2.2.1,通过图像预处理操作将训练样本集中的猪脸图像的像素统一调整为C×C;
步骤2.2.2,随机选取训练样本集中的B张猪脸图像,并将其中任意一个猪脸图像的序号记为s,s=1,2,...,B,计算第s张猪脸图像的实际概率序列Ys
Figure BDA0003410745460000141
其中,q为实际概率序列Ys中每个实际概率值的序号,q=1,2,...,Z,
Figure BDA0003410745460000142
表示第s张猪脸图像在实际概率序列Ys中的第q个实际概率值;
实际概率序列Ys的取值如下:令
Figure BDA0003410745460000143
Figure BDA0003410745460000144
中的其他实际概率值均等于0;
步骤2.2.3,将步骤2.2.2选取得到的B张猪脸图像输入主干网络,输出每张猪脸图像的预测概率序列Xs
Figure BDA0003410745460000145
其中p为预测概率序列Xs中每个预测概率值的序号,p=1,2,...,Z,
Figure BDA0003410745460000146
表示第s张猪脸图像在预测概率序列Xs中的第p个预测概率值;
步骤2.2.4,根据预测概率序列Xs与实际概率序列Ys对主干网络进行优化;具体方式如下:
计算预测概率序列Xs与实际概率序列Ys之间的损失函数loss,
Figure BDA0003410745460000147
其中,||·||2表示2范数,通过梯度下降法最小化损失函数loss,完成主干网络的优化。
步骤2.2.5,重复步骤2.2.2至步骤2.2.4,直至训练样本集中的猪脸图像都被选取过;特别的,如果最后一轮选取中,训练样本集剩下的猪脸图像数小于B,则从已经选取过的猪脸图像中随机选取猪脸图像进行补充;
将通过步骤2.2.2-步骤2.2.5完成优化的主干网络记为第h世代的主干网络Th,其中h为世代的序号;
步骤2.3,利用测试样本集,计算第h世代的主干网络Th对测试样本集中猪脸图像分类的准确率vh
Figure BDA0003410745460000151
Figure BDA0003410745460000152
为利用主干网络Th对测试样本集中猪脸图像进行正确分类的数值,
Figure BDA0003410745460000153
步骤2.4,设重复次数为G,G次重复步骤2.2和步骤2.3,得到一个主干网络序列T和一个准确率序列V,T={T1,T2,...,Th,...,TG},V={v1,v2,...,vh,...,vG};
步骤2.5,记vo为最高准确率,vo=max{v1,v2,...,vh,...,vG},vo对应的主干网络To即为具有最佳识别效果的网络,并记为猪脸识别网络。
在本实施例中,B=16,C=224,G=100。
步骤3,利用猪脸识别网络对猪脸进行识别,具体步骤如下:
步骤3.1,输入一张待识别原始猪脸图像并进行以下图像处理:首先将该待识别原始猪脸图像的像素调整为D×D,然后再将像素调整为D×D的待识别原始猪脸图像的大小裁剪为E×E,其中E<D;
将通过前述处理的待识别原始猪脸图像记为待识别猪脸图像;
步骤3.2,将待识别猪脸图像送入猪脸识别网络,得到待识别猪脸图像特征向量J,其中J=(j1,j2,...,jl,...,jZ),l表示待识别猪脸图像特征向量的维数,jl表示第l维待识别猪脸图像特征向量的值,l=1,2,...,Z;
步骤3.3,用softmax函数对步骤3.2得到的待识别猪脸图像特征向量J进行运算,得到概率序列R,其中,R={r1,r2,...,rg,...,rZ},g表示概率序列R的维数,rg表示第g维概率序列的值,g=1,2,...,Z;
所述softmax函数的表达式为:
Figure BDA0003410745460000161
其中,log表示对数函数,e表示指数函数,
Figure BDA0003410745460000162
Figure BDA0003410745460000163
步骤3.4,取rτ=max{r1,r2,...,rg,...,rZ},τ对应的概率序列R的维数即为待识别猪脸图像的类别数,rτ的值为该类别数的置信度。
在本实例中,取D=256,E=224。
图4为本发明实施例中一种基于通道注意力机制的猪脸识别方法和其他最新识别算法准确率对比图,其他最新识别算法包括mobileNetV2,mobileNetV3,efficientV1,resnet-50。由图4可见,本发明方法对应的准确率曲线本发明,优于其他最新识别算法,说明本发明提出的识别方法猪脸识别领域的优越性。
总之,本发明方法实现了对通道注意力机制的改进,提高了分类的准确率,使得猪脸识别的准确率得到了很大提高,能够更好的适应复杂的农场环境,更好的服务畜牧业。

Claims (4)

1.一种基于通道注意力机制的猪脸识别方法,其特征在于,包括通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的猪脸识别网络,并利用该猪脸识别网络对猪脸进行识别,具体包括以下步骤:
步骤1,猪脸图像的采集和处理
采集Z类猪脸图像,其中Z记为猪脸图像的种类数;
在Z类猪脸图像的每类中选M张猪脸图像,得到M×Z张猪脸图像,然后对M×Z张猪脸图像分别用A种图像处理方式进行数据增强并保留每种图像处理方式得到的猪脸图像,即共得到(A+1)×M×Z张猪脸图像,该(A+1)×M×Z猪脸图像构成一个训练样本集;
在Z类猪脸图像的每类中另外选N张猪脸图像,得到N×Z张猪脸图像,该N×Z张猪脸图像构成一个测试样本集,N≠M;
步骤2,通过训练基于通道注意力机制的残差网络得到具有最佳识别效果的网络,并将该具有最佳识别效果的网络记为猪脸识别网络,步骤如下:
步骤2.1,采用基于通道注意力机制的残差网络作为主干网络,所述残差网络的结构包括:卷积核大小为7×7通道数为64的卷积层Γ1,卷积核大小为3×3的最大池化下采样层Φ,3个相同的残差结构1沿主干网络输入-输出方向串联得到的第一残差结构组A1,4个相同的残差结构2沿主干网络输入-输出方向串联得到的第二残差结构组Λ2,6个相同的残差结构3沿主干网络输入-输出方向串联得到的第三残差结构组Λ3,3个相同的残差结构4沿主干网络输入-输出方向串联得到的第四残差结构组Λ4;主干网络的输入为卷积层Γ1,卷积层Γ1、采样层Φ、第一残差结构组Λ1、第二残差结构组Λ2、第三残差结构组Λ3和第四残差结构组A4依次串联;
所述残差结构1由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为64的卷积层,卷积核大小为3×3通道数为64的卷积层,卷积核大小为1×1通道数为256的卷积层,在卷积核大小为1×1通道数为256的卷积层后插入一个通道注意力机制;
所述残差结构2由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为128的卷积层,卷积核大小为3×3通道数为128的卷积层,卷积核大小为1×1通道数为512的卷积层,在卷积核大小为1×1通道数为512的卷积层后插入一个通道注意力机制;
所述残差结构3由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为256的卷积层,卷积核大小为3×3通道数为256的卷积层,卷积核大小为1×1通道数为1024的卷积层,在卷积核大小为1×1通道数为1024的卷积层后插入一个通道注意力机制;
所述残差结构4由沿主干网络输入-输出方向依次串联的以下3个卷积层构成:卷积核大小为1×1通道数为512的卷积层,卷积核大小为3×3通道数为512的卷积层,卷积核大小为1×1通道数为2048的卷积层,在卷积核大小为1×1通道数为2048的卷积层后插入一个通道注意力机制;
主干网络的输出为第四残差结构组Λ4中的第3个残差结构4后插入的通道注意力机制的输出;
将通道注意力机制插入前的卷积层的通道数记为δ,δ或等于256或等于512或等于1024或等于2048;
步骤2.2,利用训练样本集对步骤2.1所述主干网络进行优化,具体步骤如下:
步骤2.2.1,通过图像预处理操作将训练样本集中的猪脸图像的像素统一调整为C×C;
步骤2.2.2,随机选取训练样本集中的B张猪脸图像,并将其中任意一个猪脸图像的序号记为s,s=1,2,...,B,计算第s张猪脸图像的实际概率序列Ys
Figure FDA0003410745450000031
其中,q为实际概率序列Ys中每个实际概率值的序号,q=1,2,...,Z,
Figure FDA0003410745450000032
表示第s张猪脸图像在实际概率序列Ys中的第q个实际概率值;
实际概率序列Ys的取值如下:令
Figure FDA0003410745450000033
Figure FDA0003410745450000034
中的其他实际概率值均等于0;
步骤2.2.3,将步骤2.2.2选取得到的B张猪脸图像输入主干网络,输出每张猪脸图像的预测概率序列Xs
Figure FDA0003410745450000035
其中p为预测概率序列Xs中每个预测概率值的序号,p=1,2,...,Z,
Figure FDA0003410745450000036
表示第s张猪脸图像在预测概率序列Xs中的第p个预测概率值;
步骤2.2.4,根据预测概率序列Xs与实际概率序列Ys对主干网络进行优化;
步骤2.2.5,重复步骤2.2.2至步骤2.2.4,直至训练样本集中的猪脸图像都被选取过;特别的,如果最后一轮选取中,训练样本集剩下的猪脸图像数小于B,则从已经选取过的猪脸图像中随机选取猪脸图像进行补充;
将通过步骤2.2.2-步骤2.2.5完成优化的主干网络记为第h世代的主干网络Th,其中h为世代的序号;
步骤2.3,利用测试样本集,计算第h世代的主干网络Th对测试样本集中猪脸图像分类的准确率vh
Figure FDA0003410745450000041
Figure FDA0003410745450000042
为利用主干网络Th对测试样本集中猪脸图像进行正确分类的数值,
Figure FDA0003410745450000043
步骤2.4,设重复次数为G,G次重复步骤2.2和步骤2.3,得到一个主干网络序列T和一个准确率序列V,T={T1,T2,...,Th,...,TG},V={v1,v2,...,vh,...,vG};
步骤2.5,记vo为最高准确率,vo=max{v1,v2,...,vh,...,vG},vo对应的主干网络To即为具有最佳识别效果的网络,并记为猪脸识别网络;
步骤3,利用猪脸识别网络对猪脸进行识别,具体步骤如下:
步骤3.1,输入一张待识别原始猪脸图像并进行以下图像处理:首先将该待识别原始猪脸图像的像素调整为D×D,然后再将像素调整为D×D的待识别原始猪脸图像的大小裁剪为E×E,其中E<D;
将通过前述处理的待识别原始猪脸图像记为待识别猪脸图像;
步骤3.2,将待识别猪脸图像送入猪脸识别网络,得到待识别猪脸图像特征向量J,其中J=(j1,j2,...,jl,...,jZ),l表示待识别猪脸图像特征向量的维数,jl表示第l维待识别猪脸图像特征向量的值,l=1,2,...,Z;
步骤3.3,用softmax函数对步骤3.2得到的待识别猪脸图像特征向量J进行运算,得到概率序列R,其中,R={r1,r2,...,rg,...,rZ},g表示概率序列R的维数,rg表示第g维概率序列的值,g=1,2,...,Z;
所述softmax函数的表达式为:
Figure FDA0003410745450000051
其中,log表示对数函数,e表示指数函数,
Figure FDA0003410745450000052
Figure FDA0003410745450000053
步骤3.4,取rτ=max{r1,r2,...,rg,...,rZ},τ对应的概率序列R的维数即为待识别猪脸图像的类别数,rτ的值为该类别数的置信度。
2.根据权利要求1所述的一种基于通道注意力机制的猪脸识别方法,其特征在于,步骤1所述A种图像处理方式为9种处理方式,即A=9,具体包括:颜色增强,加入高斯噪声,镜像对称,尺寸扩大两倍,向左旋转20度,随机裁剪,对比度增强,亮度增强,随机变色。
3.根据权利要求1所述的一种基于通道注意力机制的猪脸识别方法,其特征在于,步骤2所述通道注意力机制的实现步骤如下:
根据权利要求1的步骤2.1,通道注意力机制共输入δ个通道的多维通道特征向量,对每一个多维通道特征向量,将其首尾连接展开得到4λ个一维通道特征向量;
记δ个通道中任一个通道的展平向量为Fγ
Figure FDA0003410745450000054
Figure FDA0003410745450000061
γ表示输入的通道的序号,i表示一维通道特征向量值在展平向量Fγ中的序号,
Figure FDA0003410745450000062
表示展平向量Fγ中第γ个通道的第i个一维通道特征向量值,i=1,2,...,4λ,γ=1,2,...,δ;
对展平向量Fγ中的一维通道特征向量值
Figure FDA0003410745450000063
按照从小到大的顺序重新进行排序,得到排序后的展平向量Hγ
Figure FDA0003410745450000064
Figure FDA0003410745450000065
m表示一维通道特征向量值在排序后的展平向量Hγ中的序号,
Figure FDA0003410745450000066
表示排序后的展平向量Hγ中第γ个通道的第m个一维通道特征向量值,m=1,2,...,4λ;
对排序后的展平向量Hγ保留
Figure FDA0003410745450000067
Figure FDA0003410745450000068
的值,得到去除异常值的展平向量Iγ
Figure FDA0003410745450000069
n表示一维通道特征向量值在去除异常值的展平向量Iγ中的序号,
Figure FDA00034107454500000610
表示去除异常值的展平向量Iγ中第γ个通道第n个一维通道特征向量值,n=λ,λ+1,...,3λ;
对去除异常值的展平向量Iγ,用求平均值的方式,对每个通道进行数据压缩,得到压缩向量Lγ
Figure FDA00034107454500000611
将压缩向量Lγ经过激活模块,完成通道注意力机制,其中,激活模块的具体步骤如下所述:
对压缩向量Lγ,先经过节点数为γ的全连接层,再经过节点数为γ/θ的全连接层,再经过ReLU函数,再经过节点数为γ的全连接层,最后经过Sigmoid函数,其中θ为大于0的整数;
ReLU函数的表达式如下:
Figure FDA00034107454500000612
其中,
Figure FDA00034107454500000613
表示ReLU函数的输入,
Figure FDA00034107454500000614
表示ReLU函数的输出;
Sigmoid函数的表达式如下:
Figure FDA0003410745450000071
其中,e表示指数函数,ω表示Sigmoid函数的输入,y(ω)表示Sigmoid函数的输出。
4.根据权利要求1所述的一种基于通道注意力机制的猪脸识别方法,其特征在于,步骤2所述根据预测概率序列Xs与实际概率序列Ys对主干网络进行优化的具体方式如下:
计算预测概率序列Xs与实际概率序列Ys之间的损失函数loss,
Figure FDA0003410745450000072
其中,||·||2表示2范数,通过梯度下降法最小化损失函数loss,完成主干网络的优化。
CN202111536355.9A 2021-12-14 2021-12-14 一种基于通道注意力机制的猪脸识别方法 Active CN114359958B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111536355.9A CN114359958B (zh) 2021-12-14 2021-12-14 一种基于通道注意力机制的猪脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111536355.9A CN114359958B (zh) 2021-12-14 2021-12-14 一种基于通道注意力机制的猪脸识别方法

Publications (2)

Publication Number Publication Date
CN114359958A true CN114359958A (zh) 2022-04-15
CN114359958B CN114359958B (zh) 2024-02-20

Family

ID=81099145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111536355.9A Active CN114359958B (zh) 2021-12-14 2021-12-14 一种基于通道注意力机制的猪脸识别方法

Country Status (1)

Country Link
CN (1) CN114359958B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666838A (zh) * 2020-05-22 2020-09-15 吉林大学 一种改进的残差网络猪脸识别方法
WO2020215676A1 (zh) * 2019-04-26 2020-10-29 平安科技(深圳)有限公司 基于残差网络的图像识别方法、装置、设备及存储介质
WO2021098585A1 (en) * 2019-11-22 2021-05-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image search based on combined local and global information
CN113065460A (zh) * 2021-03-31 2021-07-02 吉林农业大学 基于多任务级联的猪脸面部表情识别框架的建立方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020215676A1 (zh) * 2019-04-26 2020-10-29 平安科技(深圳)有限公司 基于残差网络的图像识别方法、装置、设备及存储介质
WO2021098585A1 (en) * 2019-11-22 2021-05-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image search based on combined local and global information
CN111666838A (zh) * 2020-05-22 2020-09-15 吉林大学 一种改进的残差网络猪脸识别方法
CN113065460A (zh) * 2021-03-31 2021-07-02 吉林农业大学 基于多任务级联的猪脸面部表情识别框架的建立方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
燕红文;刘振宇;崔清亮;胡志伟;: "基于特征金字塔注意力与深度卷积网络的多目标生猪检测", 农业工程学报, no. 11, 8 June 2020 (2020-06-08) *
王荣;史再峰;高荣华;李奇峰;: "多变环境下基于多尺度卷积网络的猪个体识别", 江西农业大学学报, no. 02, 20 April 2020 (2020-04-20) *

Also Published As

Publication number Publication date
CN114359958B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN109685115B (zh) 一种双线性特征融合的细粒度概念模型及学习方法
CN111583284B (zh) 一种基于混合模型的小样本图像语义分割方法
CN107480575B (zh) 模型的训练方法、跨年龄人脸识别方法和对应的装置
CN110135231B (zh) 动物面部识别方法、装置、计算机设备和存储介质
Prakash et al. Face recognition with convolutional neural network and transfer learning
CN111814584A (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
CN111783576A (zh) 基于改进型YOLOv3网络和特征融合的行人重识别方法
CN109063626B (zh) 动态人脸识别方法和装置
CN111126361B (zh) 基于半监督学习和特征约束的sar目标鉴别方法
CN112633382A (zh) 一种基于互近邻的少样本图像分类方法及系统
CN113222011A (zh) 一种基于原型校正的小样本遥感图像分类方法
CN113011253B (zh) 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质
TW202113692A (zh) 圖像處理方法及其裝置、處理器、電子設備及電腦可讀儲存媒體
CN114782997A (zh) 基于多损失注意力自适应网络的行人重识别方法及系统
CN112528058A (zh) 基于图像属性主动学习的细粒度图像分类方法
He et al. What catches the eye? Visualizing and understanding deep saliency models
CN115457332A (zh) 基于图卷积神经网络和类激活映射的图像多标签分类方法
CN116703932A (zh) 一种基于卷积注意力机制的CBAM-HRNet模型小麦穗粒分割与计数方法
CN111368648A (zh) 雷达辐射源个体识别方法、装置、电子设备及其存储介质
CN112991280A (zh) 视觉检测方法、系统及电子设备
CN109784244B (zh) 一种指定目标的低分辨率人脸精确识别方法
CN114359958A (zh) 一种基于通道注意力机制的猪脸识别方法
CN111414952B (zh) 行人重识别的噪声样本识别方法、装置、设备和存储介质
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
CN113837062A (zh) 一种分类方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant