CN107092931B - 一种奶牛个体识别的方法 - Google Patents

一种奶牛个体识别的方法 Download PDF

Info

Publication number
CN107092931B
CN107092931B CN201710269440.0A CN201710269440A CN107092931B CN 107092931 B CN107092931 B CN 107092931B CN 201710269440 A CN201710269440 A CN 201710269440A CN 107092931 B CN107092931 B CN 107092931B
Authority
CN
China
Prior art keywords
cow
individual
dairy
kpca
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710269440.0A
Other languages
English (en)
Other versions
CN107092931A (zh
Inventor
张满囤
单新媛
郭迎春
于洋
阎刚
王小芳
于明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN201710269440.0A priority Critical patent/CN107092931B/zh
Publication of CN107092931A publication Critical patent/CN107092931A/zh
Application granted granted Critical
Publication of CN107092931B publication Critical patent/CN107092931B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Image Analysis (AREA)

Abstract

本发明一种奶牛个体识别的方法,涉及图像数据处理中的图像识别方法,步骤是:奶牛视频数据采集,将奶牛视频数据转化为图片序列并进行归一化,利用小波变换提取奶牛个体的四个不同分量特征,利用改进的KPCA方法进行四个不同分量特征降维,加权融合四个不同分量特征,将图像特征数据划分为训练集和测试集,分别进行SVM训练和SVM测试,最终识别出奶牛个体;该方法克服了现有技术中,奶牛个体的智能识别方法大都仍采用通用的图像处理方法,没有针对奶牛个体特点,尤其没有根据奶牛躯干黑白花纹形状的唯一性来选取出适合的图像处理方法,导致奶牛个体识别准确率低的缺陷。

Description

一种奶牛个体识别的方法
技术领域
本发明的技术方案涉及图像数据处理中的图像识别方法,具体地说是一种奶牛个体识别的方法。
背景技术
信息技术高速发展,农业现代化步伐不断加快,规模化、信息化奶牛养殖场得到了广泛应用,我国已基本形成高密度、集中化的奶牛养殖体系。奶牛个体识别作为奶牛信息化管理的基础,成为当前畜牧业发展的一个研究热点。随着人工智能、模式识别领域研究的不断深入,图像处理正向着高速率、高分辨率、立体化、多媒体化、智能化和标准化方向发展。利用图像处理方法将奶牛个体识别与计算机视觉相联系,已逐渐成为一项推动大规模奶牛信息化管理的重要举措。
早期针对奶牛个体识别问题主要采取人工识别方法,但该方法耗时耗力、误识别率较高。之后发展为采用标签识别的方法,分别为每头奶牛佩戴上唯一的标识号码,但是依然存在人工量大、工作繁琐的缺点,此外,标签容易破损、过多的人为干涉可能降低奶牛产奶量,从而影响牛场的经济效益。目前畜牧业比较流行的识别技术是无线射频技术,但该方法无法实现远距离识别,同时识别率和成本的性价比较低。随着计算机视觉的发展,结合奶牛特有的黑白条纹信息,利用图像处理方法实现奶牛个体识别逐步引起国内外相关学者的关注。W Andrew等人在IEEE图像处理国际会议上发表的《Automatic individual holsteinfriesian cattle identification via selective local coat pattern matching inRGB-D imagery》论文中提出了一种采用选择性局部层模式特征用在彩色描述(RGB-D)图像上进行匹配的方法,该方法通过在奶牛RGB-D框架体系中采用自上而下的深度分割奶牛躯干图像,然后提取仿射尺度不变特征转换(ASIFT)描述算子作为唯一标识,采用支持向量机(SVM)进行学习分类从而达到奶牛个体识别的目的。但是该方法对奶牛个体所处的环境依赖性比较强,如果处在有光照或背景复杂的自然环境下,识别正确率难以保证。Ahmed S等人在IEEE计算机学会上发表的《Muzzle-Based cattle identification using speed uprobust feature approach》论文中提出了运用加速鲁棒特征(SURF)算子提取奶牛嘴部纹理特征点,然后利用SVM分类器对奶牛个体进行分类识别的方法,但是该方法对于采集数据的位置比较敏感,奶牛嘴部数据获取具有一定的难度。CN105260750A公开了一种奶牛个体识别方法,该方法通过将捕捉到的奶牛实时图像与事先建立好的模板图像库进行匹配,将能够成功匹配的模板库中的奶牛个体的标签作为待识别奶牛的类别,但是该方法效率较低,每次匹配过程需要遍历模板的数量可能很大。Cai C等人在信号与信息处理协会高峰会议上发表的《Cattle face recognition using local binary pattern descriptor》论文中提出了一种基于牛脸模型的局部二值模式(LBP) 纹理特征的方法,通过稀疏化和低秩分解用来提高图片处理方法的鲁棒性从而有效克服图片中光照影响、图像错位和闭塞的情况,结果表明LBP在一定程度上可以正确识别出奶牛个体,但是奶牛脸部相对奶牛躯干包含的个体特有信息较少,识别正确率仍不够理想。 CN201710000628.5公开了一种基于深度卷积神经网络的奶牛个体识别方法,该方法模型参数设置需要较高的技巧性,需要反复实验进行训练和测试,并没有统一参照的标准,模型的建立较困难。
现有技术中,奶牛个体的智能识别大都采用传统通用的图像处理方法,没有针对奶牛个体特点,尤其没有根据奶牛躯干黑白花纹形状的唯一性来选取出适合的图像处理方法,导致奶牛个体识别的准确率低。
发明内容
本发明所要解决的技术问题是:提供一种奶牛个体识别的方法,是利用小波变换结合改进的KPCA方法进行奶牛个体的特征提取,最后送入SVM多分类器进行学习分类,完成奶牛个体识别的方法;该方法克服了现有技术中,奶牛个体的智能识别方法大都仍采用通用的图像处理方法,没有针对奶牛个体特点,尤其没有根据奶牛躯干黑白花纹形状的唯一性来选取出适合的图像处理方法,导致奶牛个体识别准确率低的缺陷。
上述KPCA的中文含义是核主成分分析(下同)。
本发明中解决该技术问题所采用的技术方案是:一种奶牛个体识别的方法,利用小波变换结合改进的KPCA方法进行奶牛个体的特征提取,最后送入SVM多分类器进行学习分类,完成奶牛个体识别,具体步骤如下:
第一步,奶牛视频数据采集:
在奶牛数量>300头的规范奶牛养殖场,在自然良好的环境下利用摄像设备录制来回行走的20头奶牛,每头奶牛采集8段视频,不同侧面各4段,每段视频14s~16s,帧速度为29帧/秒,至此完成奶牛视频数据的采集;
第二步,将奶牛视频数据转化为图片序列并进行归一化:
分别将第一步采集的20头奶牛的视频数据转化成图片序列,初始图片大小为1920×1080像素,对初始图片进行截图,人工截取图片中奶牛个体,并去除多余的背景图像;从牛场所有奶牛个体中随机抽取总数1/10的样本,人工测量每头抽样奶牛个体身体部位宽度和高度比例,然后求取所有抽样个体该比例的平均值近似作为每头奶牛个体身体比例,至此确定出奶牛个体部位宽度和高度平均比例为8:5,在保证特征有效提取的前提下成比例缩小图片尺寸,最终利用编写的Matlab程序将经过上述处理的20头奶牛的图片序列中的每张图片归一化为128×80像素,将20头奶牛从1到20编号,表示20个待识别的不同奶牛个体,每头奶牛保留1000张有效图片,至此完成视频转化图片序列并进行归一化的操作;
第三步,利用小波变换提取奶牛个体的四个不同分量特征:
选取Haar型小波对上述第二步归一化后的奶牛个体图像做一层小波分解,得到尺寸大小相等的四个不同分量子图,分别用LL子图、LH子图、HL子图、HH子图表示,四个不同分量子图中不同程度地包含了奶牛个体的有效信息,LL子图低频部分是原始奶牛个体图像的近似,包含了奶牛个体的大部分信息;LH子图和HL子图部分分别包含了奶牛个体躯干中水平和垂直方向的黑白条纹的边缘信息;HH子图部分包含了对角方向信息,至此完成利用小波变换提取奶牛个体的四个不同分量特征;
第四步,利用改进的KPCA方法进行四个不同分量特征降维:
利用改进的KPCA方法对上述第三步利用小波变换提取的奶牛个体的四个不同分量特征,即LL分量特征、LH分量特征、HL分量特征和HH分量特征进行特征降维,步骤如下:
(4.1)设置奶牛个体的融合信息组数,计算各组的融合向量:
设置奶牛个体的融合信息组数,即设奶牛个体的样本总数为N=20000,其中所有奶牛个体类别数为C=20,每类样本个数即每类的各特征子图个数为M=1000,向量化后具有 M个特征向量,将同一类样本类内分成P组,用公式(1)计算各组的融合向量:
Figure GDA0002494375530000031
式(1)中,
Figure GDA0002494375530000032
表示第i类样本的某个分量子图第p组的融合向量,利用组内融合向量
Figure GDA0002494375530000033
代表该组的特征信息,这样就用P组融合向量代表了原来M个特征向量,式(1)中xij表示第i类样本某分组内的第j个特征向量,当每组样本包含数量>10时,融合向量的各维分量数据很大,此时将公式(1)变形成公式(2):
Figure GDA0002494375530000035
规定分组时候要遵从保持组内相似性的原则;
(4.2)确定原空间的初始非线性主成分个数Q:
通过选择RBF核函数来计算上述(4.1)步的融合向量在特征空间中的协方差矩阵A={Ast}n×n,其第s行,第t列元素Ast计算如公式(3)所示:
Ast=(φ(xs)·φ(xt))=a(xs,xt) (3)
式(3)中,“·”表示向量内积运算符号,φ(*)是对应的非线性变换,其中“*”表示函数φ的一个自变量,a(*,*)表示核函数,其中两个“*”表示函数a的两个自变量;
xs,xt表示第s个和第t个融合向量,依照公式(4)计算协方差矩阵A的特征方程:
Aα=nλα (4)
式(4)中,n表示分组之后所有融合向量的个数,n=P×C,其中C=20,表示奶牛类别数,α表示协方差矩阵A的特征向量,λ表示协方差矩阵A的特征值,将求解得到的n 维特征向量αr依据其相应的特征值λr,其中r=1,2,……从大到小顺序进行排列,然后通过公式(5)设置特征值贡献率β的值来选取特征值和对应特征向量的个数Q,即确定原空间的初始非线性主成分个数为Q;
Figure GDA0002494375530000091
(4.3)选出维数相对最小的主成分:
引入表征类别信息的维数度量参数来衡量上述(4.2)步中的初始非线性主成分的有效性,进而选出维数相对最小的主成分,该维数度量参数通过类内聚集程度和类间离散程度求得,维数度量参数如公式(6)所示:
Figure GDA0002494375530000041
式(6)中,Ik表示同类样本第k维分量的聚集程度,Dk表示不同类样本第k维分量的离散程度,维数度量参数δ越小表示类别越分明,越有利于后续的分类识别;利用枚举法从初值Q逐渐减小主成分个数并反复进行相应的实验,直到奶牛个体识别正确率较前一次正确率下降幅度大于3%时结束,在平衡识别率和识别速率两方面性能的前提下,确定出维数相对最小个数d,d<Q的值,选取前d个最小的δ对应的主成分,即为该奶牛个体图像类别信息最全面和维数相对最小的主成分,由此选出维数相对最小的主成分;
(4.4)计算奶牛个体样本在特征空间上的投影:
计算奶牛个体样本在上述(4.3)步中得到的维数相对最小的主成分组成的特征空间上的投影:
第r个非线性主成分vr如公式(7)所示:
Figure GDA0002494375530000042
式(7)中,
Figure GDA0002494375530000046
表示上述(4.2)步中求得的n维特征向量αr的第h维分量,φ(xh)表示第h个融合向量xh经过函数φ非线性变换后的向量;对奶牛个体样本x在第r个非线性主成分vr上的投影
Figure GDA0002494375530000047
如公式(8)所示:
Figure GDA0002494375530000043
式(8)中,“·”表示向量内积运算符号,则奶牛个体样本x,在公式(9)中选取的这d个主成分组成的特征空间中的投影Bx即为:
Figure GDA0002494375530000044
式(9)中,“[]”表示组成向量的符号;
至此完成利用改进的KPCA方法进行四个不同分量特征降维;
第五步,加权融合四个不同分量特征:
对上述第四步利用改进的KPCA方法进行四个不同分量特征降维之后的各子图特征进行加权融合,其中LL子图、LH子图、HL子图和HH子图所占比例别用ω1、ω2、ω3和ω4表示,满足方程组(10):
Figure GDA0002494375530000045
ω1、ω2、ω3和ω4作为四个分量子图的融合权值,将经过改进的KPCA方法降维之后的四个不同分量特征按照公式(11)和(12)进行加权融合得到奶牛图像的最终的特征矩阵Y;
加权融合计算公式如公式(11):
Y=ω1LLkpca2LHkpca3HLkpca4HHkpca (11)
式(11)中Y表示加权融合总特征,即奶牛图像的最终特征矩阵;LLkpca、LHkpca、HLkpca和HHkpca分别表示LL子图、LH子图、HL子图和HH子图经过改进的KPCA方法处理之后得到的特征矩阵;
Figure GDA0002494375530000051
式(12)中part表示某一子图分量,分别取LL、LH、HL和HH,partkpca表示part分量经KPCA方法降维之后的特征向量,“[]”表示组成向量的符号;
至此完成加权融合四个不同分量特征;
第六步,将图像特征数据划分为训练集和测试集:
由于依据上述第二步的每头奶牛保留下1000张图片,在经过上述处理步骤之后具有相应的1000个特征向量,分别将每头奶牛的1000个特征向量以随机方式划分成800个训练数据和200个测试数据,最终组成包含16000个特征向量的训练矩阵和包含4000个特征向量的测试矩阵,至此完成将图像特征数据划分为训练集和测试集;
第七步,SVM训练:
(7.1)构造SVM多分类器:
构造通过一个决策函数将多类问题向两类问题转化的“一对多”的方式进行处理的 SVM多分类器,该SVM多分类器的决策函数G(x)如公式(13)所示,即每次将全部奶牛训练数据分为“属于第l,l=1,2,3……头”和“不属于第l头”两大类,设定好SVM参数进行学习,然后利用测试数据进行测试;
Figure GDA0002494375530000052
其中x为待识别奶牛个体样本,C表示所有奶牛个体类别数,ft(x)表示第t类的分类函数,为传统的SVM二分类器决策函数形式,可以直接调用Matlab语言的SVM工具包;
(7.2)利用SVM多分类器进行训练:
选取线性核函数,将上述第六步处理好的奶牛训练集数据送入SVM进行建模训练,得到训练好的模型,至此完成SVM训练;
第八步,SVM测试:
将上述第六步中处理好的奶牛测试集数据送入第七步训练好的模型中进行测试,得出预测结果,至此完成SVM测试;
第九步,识别出奶牛个体:
根据第八步测试过程得到相应的预测结果,输出测试集中各特征向量对应的奶牛不同个体的标号,识别出奶牛个体;
由此完成对奶牛个体的有效识别。
上述一种奶牛个体识别的方法,所述类内聚集程度计算公式如公式(14):
Figure GDA0002494375530000061
其中Ik表示同类样本第k维分量的聚集程度,C表示所有奶牛个体类别数,P表示每类融合向量的个数,
Figure GDA0002494375530000062
表示第i类样本第k维分量的方差,zijk表示第i类样本的第j个特征向量的第k维分量,
Figure GDA0002494375530000063
表示第i类样本第k维分量的均值。
上述一种奶牛个体识别的方法,所述类间离散程度计算公式如公式(15):
Figure GDA0002494375530000064
其中Dk表示不同类样本第k维分量的离散程度,C表示所有奶牛个体类别数,P表示每类融合向量的个数,mik表示第i类样本第k维分量的累加,mlk表示第l头样本第k维分量的累加,zijk表示第i类样本某分组内第j个特征向量的第k维分量值,zljk表示第l头样本某分组内第j个特征向量的第k维分量值。
上述基于小波变换和改进核主成分分析的奶牛个体识别方法,其中所述“小波变换、 Haar型小波、尺度函数、小波函数、KPCA方法、SVM分类器”都是公知的。
本发明的有益效果如下:
与现有技术相比,本发明具有如下突出的实质性特点:
本发明应用小波变换和改进的KPCA方法进行奶牛个体识别,小波变换具有多分辨率能力,负责提取奶牛的有效特征,得到四个包含不同特征信息的分量子图,但是特征维数依然较大,所以引入改进的KPCA方法进行特征降维处理,在简化特征的同时进一步提取奶牛适于分类的有效信息,之后将经过改进的KPCA方法处理的的各子图特征以 <0.8,0.085,0.085,0.03>权值比例序列进行加权融合得到最终的特征矩阵,保证了信息的完整性,从而提取到有效的奶牛个体特征。
与现有技术相比,本发明具有以下显著的进步:
(1)本发明方法将小波变换和改进的KPCA方法进行结合使用,对奶牛个体黑白花纹特征进行了有效提取和降维,提高了分类的准确性。
(2)本发明方法对传统的KPCA方法进行改进,通过设置适当的融合组数,引入组内融合向量代替整组信息,在信息全面、识别率相当的基础上,提高了方法效率,同时考虑到传统KPCA方法仅考虑了信息最大化,并没有针对后续分类目的即没有根据任何类别信息进行降维,有理由相信降维后的主成分特征中依然可能包含多余信息,所以本发明方法在上述引入融合向量的基础上还设置了类内聚集程度和类间离散程度,从而求取度量参数,根据该度量参数进一步降低特征向量的维数,进一步提高效率,更有利于后面的个体分类。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明方法的流程示意图。
图2(a)是一头奶牛个体的视频数据转化成的原始图片图。
图2(b)是对图2(a)经过一层Haar型小波变换处理得到的效果示例图。
具体实施方式
图1所示实施例表明,本发明奶牛个体识别方法的流程是:S1:奶牛视频数据采集;S2:将奶牛视频数据转化为图片序列并进行归一化;S3:利用小波变换提取奶牛个体的四个不同分量特征;S4:利用改进的KPCA方法进行四个不同分量特征降维;S5:加权融合四个不同分量特征;S6:将图像特征数据划分为训练集和测试集;S7:训练集进行SVM训练;S8:测试集送入S7步训练好的模型中进行SVM测试;S9:识别出奶牛个体。
图2(a)所示是一头奶牛个体的视频数据转化成的原始图片图。
图2(b)所示实施例表明,在通过对奶牛视频数据转化为图片序列并进行归一化后,对图2(a)进行一层Haar小波变换得到图2(b)中所包含LL分量、LH分量、HL分量和HH分量四个子图,可以明显看出LL子图低频部分是原始奶牛个体图像的近似,包含了奶牛个体的大部分信息;LH子图和HL子图部分分别包含了奶牛个体躯干中水平和垂直方向的黑白条纹的边缘信息;HH子图部分包含了对角方向信息,信息量较少。
实施例1
第一步,奶牛视频数据采集:
为保证样本量的充足,本发明的初始数据采用奶牛视频,在奶牛数量>300头的规范奶牛养殖场,在自然良好的环境下利用摄像设备录制来回行走的20头奶牛,每头奶牛采集8 段视频,不同侧面各4段,每段视频14s,帧速度为29帧/秒,至此完成奶牛视频数据的采集;
第二步,将奶牛视频数据转化为图片序列并进行归一化:
分别将第一步采集的20头奶牛的视频数据转化成图片序列,初始图片大小为1920×1080像素,对初始图片进行截图,人工截取图片中奶牛个体,并去除多余的背景图像;从牛场所有奶牛个体中随机抽取总数1/10的样本,人工测量每头抽样奶牛个体身体部位宽度和高度比例,然后求取所有抽样个体该比例的平均值近似作为每头奶牛个体身体比例,至此确定出奶牛个体部位宽度和高度平均比例为8:5,在保证特征有效提取的前提下成比例缩小图片尺寸,最终利用编写的Matlab程序将经过上述处理的20头奶牛的图片序列中的每张图片归一化为128×80像素,将20头奶牛从1到20编号,表示20个待识别的不同奶牛个体,每头奶牛保留1000张有效图片,至此完成视频转化图片序列并进行归一化的操作;
第三步,利用小波变换提取奶牛个体的四个不同分量特征:
选取Haar型小波对上述第二步归一化后的奶牛个体图像做一层小波分解,得到对应的四个不同分量子图即四个不同的64×40的小波系数,图像大小均为原始图像的1/4,分别用LL子图、LH子图、HL子图、HH子图表示,四个分量子图中不同程度地包含了奶牛个体的有效信息,LL子图低频部分是原始奶牛个体图像的近似,包含了奶牛个体的大部分信息;LH子图和HL子图部分分别包含了奶牛个体躯干中水平和垂直方向的黑白条纹的边缘信息;HH子图部分包含了对角方向信息,信息量较少;
至此完成利用小波变换提取奶牛个体的四个不同分量特征;
第四步,利用改进的KPCA方法进行四个不同分量特征降维:
利用改进的KPCA方法对上述第三步利用小波变换提取的奶牛个体的四个不同分量特征,即LL分量特征、LH分量特征、HL分量特征和HH分量特征进行特征降维,步骤如下:
(4.1)设置奶牛个体的融合信息组数,计算各组的融合向量:
设置奶牛个体的融合信息组数,即设奶牛个体的样本总数为N=20000,其中所有奶牛个体类别数为C=20,每类样本个数为M=1000,即对应各分量子图向量化之后的向量个数为M,将同一类样本类内分成P组,用公式(1)计算各组的融合向量:
Figure GDA0002494375530000081
式(1)中,
Figure GDA0002494375530000082
表示第i类样本的某个分量子图第p组的融合向量,利用组内融合向量
Figure GDA0002494375530000083
代表该组的特征信息,这样就用P组融合向量代表了原来M个特征向量,式(1)中xij表示第i类样本某分组内的第j个特征向量,当每组样本包含数量>10时,融合向量的各维分量数据很大,此时将公式(1)变形成公式(2):
Figure GDA0002494375530000084
规定分组时候要遵从保持组内相似性的原则:
本发明中通过分析拍摄的奶牛视频帧速度为29帧/s,即每秒刷新29张图片,结合奶牛行走速度,每秒内奶牛个体的姿势花纹信息图片基本相同,划为一组是合理的,由于实验数据库每头奶牛1000张图片,在保证被组数整除的原则下P设置为40,即将每头奶牛图片划为40组,然后带入公式(1)计算各组内的融合向量,利用融合向量来近似表征组内各特征向量;
(4.2)确定原空间的初始非线性主成分个数Q:
通过选择RBF核函数来计算上述(4.1)步的融合向量在特征空间中的协方差矩阵A={Ast}n×n,其第s行,第t列元素Ast计算如公式(3)所示:
Ast=(φ(xs)·φ(xt))=a(xs,xt) (3)
式(3)中,“·”表示向量内积运算符号,φ(*)是对应的非线性变换,其中“*”表示函数φ的一个自变量,a(*,*)表示核函数,其中两个“*”表示函数a的两个自变量;
xs,xt表示第s个和第t个融合向量,依照公式(4)计算协方差矩阵A的特征方程:
Aα=nλα (4)
式(4)中,n表示分组之后所有融合向量的个数,n=P×C,其中C=20,表示奶牛类别数,α表示协方差矩阵A的特征向量,λ表示协方差矩阵A的特征值,将求解得到的n 维特征向量αr依据其相应的特征值λr,其中r=1,2,……从大到小顺序进行排列,然后通过公式(5)设置特征值贡献率β的值来选取特征值和对应特征向量的个数Q,即确定原空间的初始非线性主成分个数为Q;
Figure GDA0002494375530000091
(4.3)选出维数相对最小的主成分:
引入表征类别信息的维数度量参数来衡量上述(4.2)步中的初始非线性主成分的有效性,进而选出维数相对最小的主成分,该维数度量参数通过类内聚集程度和类间离散程度求得,维数度量参数如公式(6)所示:
Figure GDA0002494375530000092
式(6)中,Ik表示同类样本第k维分量的聚集程度,Dk表示不同类样本第k维分量的离散程度,维数度量参数δ越小表示类别越分明,越有利于后续的分类识别;利用枚举法从初值Q逐渐减小主成分个数并反复进行相应的实验,直到奶牛个体识别正确率较前一次正确率下降幅度大于3%时结束,在平衡识别率和识别速率两方面性能的前提下,确定出维数相对最小个数d,d<Q的值,选取前d个最小的δ对应的主成分,即为该奶牛个体图像类别信息最全面和维数相对最小的主成分,由此选出维数相对最小的主成分;
所述类内聚集程度计算公式如公式(14):
Figure GDA0002494375530000093
其中Ik表示同类样本第k维分量的聚集程度,C表示所有奶牛个体类别数,P表示每类融合向量的个数,
Figure GDA0002494375530000094
表示第i类样本第k维分量的方差,zijk表示第i类样本的第j个特征向量的第k维分量,
Figure GDA0002494375530000095
表示第i类第k维分量的均值;
所述类间离散程度计算公式如公式(15):
Figure GDA0002494375530000096
其中Dk表示不同类样本第k维分量的离散程度,C表示所有奶牛个体类别数,P表示每类融合向量的个数,mik表示第i类样本第k维分量的累加,mlk表示第l头样本第k维分量的累加,zijk表示第i类样本某分组内第j个特征向量的第k维分量值,zljk表示第l头样本某分组内第j个特征向量的第k维分量值。
表1列举出利用20头奶牛的20000张图片进行d值选取的实例验证;其中“改进的KPCA 方法1”表示仅引入融合向量而未加入度量参数的改进的KPCA方法,从实验序号2看出经过未进行度量参数之前的特征向量维数Q为37,所以本文方法中选择37以下的d,可以看出当d取30或25时效果较佳,本发明实例中d值设为25;
表1.不同相对最小特征维数对比实验
Figure GDA0002494375530000101
(4.4)计算奶牛个体样本在特征空间上的投影:
计算奶牛个体样本在上述(4.3)步中得到的维数相对最小的主成分组成的特征空间上的投影:
第r个非线性主成分vr如公式(7)所示:
Figure GDA0002494375530000102
式(7)中,
Figure GDA0002494375530000106
表示上述(4.2)步中求得的n维特征向量αr的第h维分量,φ(xh)表示融合向量xh经过函数φ非线性变换后的向量;对奶牛个体样本x在第r个非线性主成分vr上的投影
Figure GDA0002494375530000107
如公式(8)所示:
Figure GDA0002494375530000103
式(8)中,“·”表示向量内积运算符号,其包含的变量含义同式(7)中所述,则奶牛个体样本x,在公式(9)中选取的这d个主成分组成的特征空间中的投影Bx即为:
Figure GDA0002494375530000104
式(9)中,“[]”表示组成向量的符号;
至此完成利用改进的KPCA方法进行四个不同分量特征降维;
第五步,加权融合四个不同分量特征:
对上述第四步利用改进的KPCA方法进行四个不同分量特征降维之后的各子图特征进行加权融合,其中LL子图、LH子图、HL子图和HH子图所占比例别用ω1、ω2、ω3和ω4表示,满足方程组(10):
Figure GDA0002494375530000105
表2给出利用20头奶牛的20000张图片进行实例验证,得到不同融合权值序列下的奶牛个体的识别正确率:
表2.不同的特征融合权值序列识别正确率/%
Figure GDA0002494375530000111
表中“<>”表示组成LL子图,LH子图,HL子图,HH子图的权值序列符号;本发明实例中选取ω1=0.8,ω2=ω3=0.085,ω4=0.03作为四个分量子图的融合权值,将经过改进的 KPCA方法降维之后的四个不同分量特征按照公式(11)、(12)进行加权融合得到奶牛图像的最终的特征矩阵Y;
加权融合计算公式如公式(11):
Y=ω1LLkpca2LHkpca3HLkpca4HHkpca (11)
其中Y表示加权融合总特征,即奶牛图像的最终特征矩阵;LLkpca、LHkpca、HLkpca和HHkpca分别表示LL子图、LH子图、HL子图和HH子图经过改进的KPCA方法处理之后得到的特征矩阵;
Figure GDA0002494375530000112
公式(12)中part表示某一子图分量,分别取LL、LH、HL和HH,partkpca表示part 分量经KPCA方法降维之后的特征向量,“[]”表示组成向量的符号;
至此完成加权融合四个不同分量特征;
第六步,将图像特征数据划分为训练集和测试集:
由于每头奶牛保留下1000张图片,在经过上述步骤之后具有相应的1000个特征向量,分别将每头奶牛个体的1000个特征向量以随机方式划分成800个训练数据和200个测试数据,最终组成包含16000个特征向量的训练矩阵和包含4000个特征向量的测试矩阵,至此完成数据划分为训练集和测试集;
第七步,SVM训练:
(7.1)构造SVM多分类器:
构造通过一个决策函数将多类问题向两类问题转化的“一对多”的方式进行处理的 SVM多分类器,该SVM多分类器的决策函数G(x)如公式(13)所示,即每次将全部奶牛训练数据分为“属于第l,l=1,2,3……头”和“不属于第l头”两大类,设定好SVM参数进行学习,然后利用测试数据进行测试:
Figure GDA0002494375530000113
其中x为待识别奶牛个体样本,C表示所有奶牛个体类别数,ft(x)表示第t类的分类函数,为传统的SVM二分类器决策函数形式,可以直接调用Matlab语言的SVM工具包;
(7.2)利用SVM多分类器进行训练:
选取线性核函数作为多类SVM的核函数,将20头奶牛个体的16000个特征向量组成的训练矩阵送入SVM进行训练建模,得到训练好的模型,至此完成SVM训练;
第八步,SVM测试:
将20头奶牛个体的4000个特征向量组成的测试矩阵送入第七步中训练好的SVM模型中,得出预测结果,至此完成SVM测试;
第九步,识别出奶牛个体:
根据第八步测试过程得到相应的预测结果,输出测试集中各特征向量对应的奶牛不同个体的标号,识别出奶牛个体;
由此完成对奶牛个体的有效识别。
实施例2
除第一步奶牛视频数据采集中,每段视频为15s之外,其他同实施例1。
实施例3
除第一步奶牛视频数据采集中,每段视频为16s之外,其他同实施例1。
实施例4
利用20头奶牛个体的20000张图片按照实施例1中的步骤计算出识别正确率和识别时间,在同样条件下,用“本发明方法”、“仅本发明的KPCA方法”、“小波+传统KPCA方法”、“LBP方法”和“SURF方法”五种方法计算得到的识别正确率和识别时间进行对比,结果如表3所示:
表3.不同方法对比实验
Figure GDA0002494375530000121
为除去随机结果的干扰,表3数据是相同条件下重复10次实验得到的平均结果;
实验序号1和实验序号2为分别采用本发明方法即小波变换结合改进的KPCA方法与仅采用本发明改进的KPCA方法对奶牛个体进行识别;数据结果显示,在融合组数和特征维数均相同的条件下,本发明方法的识别正确率明显高于仅采用KPCA方法的结果。这是由于奶牛图像较大,小波变换压缩图片同时加权融合了各分量,一定程度上消除了噪声信息,提高了有效信息的比例;
实验序号1和实验序号3表明,本发明方法较小波变换结合传统KPCA方法在识别结果基本相当的情况下,识别速度仅用了4.20s;
实验序号1、实验序号4及实验序号5表明,本发明方法较传统奶牛识别方法虽然识别速度略低,但是平均识别率有了明显提升,比LBP方法提高了5.83%,比SURF方法提高了2.34%。
上述实施例中,所述“小波变换、KPCA方法、SVM分类器、LBP方法、SURF方法”都是公知的。

Claims (1)

1.一种奶牛个体识别的方法,其特征在于:利用小波变换结合改进的KPCA方法进行奶牛个体的特征提取,最后送入SVM多分类器进行学习分类,完成奶牛个体识别,具体步骤如下:
第一步,奶牛视频数据采集:
在奶牛数量>300头的规范奶牛养殖场,在自然良好的环境下利用摄像设备录制来回行走的20头奶牛,每头奶牛采集8段视频,不同侧面各4段,每段视频14s~16s,帧速度为29帧/秒,至此完成奶牛视频数据的采集;
第二步,将奶牛视频数据转化为图片序列并进行归一化:
分别将第一步采集的20头奶牛的视频数据转化成图片序列,初始图片大小为1920×1080像素,对初始图片进行截图,人工截取图片中奶牛个体,并去除多余的背景图像;从牛场所有奶牛个体中随机抽取总数1/10的样本,人工测量每头抽样奶牛个体身体部位宽度和高度比例,然后求取所有抽样个体该比例的平均值近似作为每头奶牛个体身体比例,至此确定出奶牛个体部位宽度和高度平均比例为8:5,在保证特征有效提取的前提下成比例缩小图片尺寸,最终利用编写的Matlab程序将经过上述处理的20头奶牛的图片序列中的每张图片归一化为128×80像素,将20头奶牛从1到20编号,表示20个待识别的不同奶牛个体,每头奶牛保留1000张有效图片,至此完成视频转化图片序列并进行归一化的操作;
第三步,利用小波变换提取奶牛个体的四个不同分量特征:
选取Haar型小波对上述第二步归一化后的奶牛个体图像做一层小波分解,得到尺寸大小相等的四个不同分量子图,分别用LL子图、LH子图、HL子图、HH子图表示,四个不同分量子图中不同程度地包含了奶牛个体的有效信息,LL子图低频部分是原始奶牛个体图像的近似,包含了奶牛个体的大部分信息;LH子图和HL子图部分分别包含了奶牛个体躯干中水平和垂直方向的黑白条纹的边缘信息;HH子图部分包含了对角方向信息,至此完成利用小波变换提取奶牛个体的四个不同分量特征;
第四步,利用改进的KPCA方法进行四个不同分量特征降维:
利用改进的KPCA方法对上述第三步利用小波变换提取的奶牛个体的四个不同分量特征,即LL分量特征、LH分量特征、HL分量特征和HH分量特征进行特征降维,步骤如下:
(4.1)设置奶牛个体的融合信息组数,计算各组的融合向量:
设置奶牛个体的融合信息组数,即设奶牛个体的样本总数为N=20000,其中所有奶牛个体类别数为C=20,每类样本个数即每类的各特征子图个数为M=1000,向量化后具有M个特征向量,将同一类样本类内分成P组,用公式(1)计算各组的融合向量:
Figure FDA0002494375520000011
式(1)中,
Figure FDA0002494375520000021
表示第i类样本的某个分量子图第p组的融合向量,利用组内融合向量
Figure FDA0002494375520000022
代表该组的特征信息,这样就用P组融合向量代表了原来M个特征向量,式(1)中xij表示第i类样本某分组内的第j个特征向量,当每组样本包含数量>10时,融合向量的各维分量数据很大,此时将公式(1)变形成公式(2):
Figure FDA0002494375520000023
规定分组时候要遵从保持组内相似性的原则;
(4.2)确定原空间的初始非线性主成分个数Q:
通过选择RBF核函数来计算上述(4.1)步的融合向量在特征空间中的协方差矩阵A={Ast}n×n,其第s行,第t列元素Ast计算如公式(3)所示:
Ast=(φ(xs)·φ(xt))=a(xs,xt) (3)
式(3)中,“·”表示向量内积运算符号,φ(*)是对应的非线性变换,其中“*”表示函数φ的一个自变量,a(*,*)表示核函数,其中两个“*”表示函数a的两个自变量;
xs,xt表示第s个和第t个融合向量,依照公式(4)计算协方差矩阵A的特征方程:
Aα=nλα (4)
式(4)中,n表示分组之后所有融合向量的个数,n=P×C,其中C=20,表示奶牛类别数,α表示协方差矩阵A的特征向量,λ表示协方差矩阵A的特征值,将求解得到的n维特征向量αr依据其相应的特征值λr,其中r=1,2,……从大到小顺序进行排列,然后通过公式(5)设置特征值贡献率β的值来选取特征值和对应特征向量的个数Q,即确定原空间的初始非线性主成分个数为Q;
Figure FDA0002494375520000024
(4.3)选出维数相对最小的主成分:
引入表征类别信息的维数度量参数来衡量上述(4.2)步中的初始非线性主成分的有效性,进而选出维数相对最小的主成分,该维数度量参数通过类内聚集程度和类间离散程度求得,维数度量参数如公式(6)所示:
Figure FDA0002494375520000025
式(6)中,Ik表示同类样本第k维分量的聚集程度,Dk表示不同类样本第k维分量的离散程度,维数度量参数δ越小表示类别越分明,越有利于后续的分类识别;利用枚举法从初值Q逐渐减小主成分个数并反复进行相应的实验,直到奶牛个体识别正确率较前一次正确率下降幅度大于3%时结束,在平衡识别率和识别速率两方面性能的前提下,确定出维数相对最小个数d,d<Q的值,选取前d个最小的δ对应的主成分,即为该奶牛个体图像类别信息最全面和维数相对最小的主成分,由此选出维数相对最小的主成分;
(4.4)计算奶牛个体样本在特征空间上的投影:
计算奶牛个体样本在上述(4.3)步中得到的维数相对最小的主成分组成的特征空间上的投影:
第r个非线性主成分vr如公式(7)所示:
Figure FDA0002494375520000031
式(7)中,
Figure FDA0002494375520000032
表示上述(4.2)步中求得的n维特征向量αr的第h维分量,φ(xh)表示第h个融合向量xh经过函数φ非线性变换后的向量;对奶牛个体样本x在第r个非线性主成分vr上的投影
Figure FDA0002494375520000033
如公式(8)所示:
Figure FDA0002494375520000034
式(8)中,“·”表示向量内积运算符号,则奶牛个体样本x,在公式(9)中选取的这d个主成分组成的特征空间中的投影Bx即为:
Figure FDA0002494375520000035
式(9)中,“[]”表示组成向量的符号;
至此完成利用改进的KPCA方法进行四个不同分量特征降维;
第五步,加权融合四个不同分量特征:
对上述第四步利用改进的KPCA方法进行四个不同分量特征降维之后的各子图特征进行加权融合,其中LL子图、LH子图、HL子图和HH子图所占比例别用ω1、ω2、ω3和ω4表示,满足方程组(10):
Figure FDA0002494375520000036
ω1、ω2、ω3和ω4作为四个分量子图的融合权值,将经过改进的KPCA方法降维之后的四个不同分量特征按照公式(11)和(12)进行加权融合得到奶牛图像的最终的特征矩阵Y;
加权融合计算公式如公式(11):
Y=ω1LLkpca2LHkpca3HLkpca4HHkpca (11)
式(11)中Y表示加权融合总特征,即奶牛图像的最终特征矩阵;LLkpca、LHkpca、HLkpca和HHkpca分别表示LL子图、LH子图、HL子图和HH子图经过改进的KPCA方法处理之后得到的特征矩阵;
Figure FDA0002494375520000037
式(12)中part表示某一子图分量,分别取LL、LH、HL和HH,partkpca表示part分量经KPCA方法降维之后的特征向量,“[]”表示组成向量的符号;
至此完成加权融合四个不同分量特征;
第六步,将图像特征数据划分为训练集和测试集:
由于依据上述第二步的每头奶牛保留下1000张图片,在经过上述处理步骤之后具有相应的1000个特征向量,分别将每头奶牛的1000个特征向量以随机方式划分成800个训练数据和200个测试数据,最终组成包含16000个特征向量的训练矩阵和包含4000个特征向量的测试矩阵,至此完成将图像特征数据划分为训练集和测试集;
第七步,SVM训练:
(7.1)构造SVM多分类器:
构造通过一个决策函数将多类问题向两类问题转化的“一对多”的方式进行处理的SVM多分类器,该SVM多分类器的决策函数G(x)如公式(13)所示,即每次将全部奶牛训练数据分为“属于第l,l=1,2,3……头”和“不属于第l头”两大类,设定好SVM参数进行学习,然后利用测试数据进行测试;
Figure FDA0002494375520000041
其中x为待识别奶牛个体样本,C表示所有奶牛个体类别数,ft(x)表示第t类的分类函数,为传统的SVM二分类器决策函数形式,可以直接调用Matlab语言的SVM工具包;
(7.2)利用SVM多分类器进行训练:
选取线性核函数,将上述第六步处理好的奶牛训练集数据送入SVM进行建模训练,得到训练好的模型,至此完成SVM训练;
第八步,SVM测试:
将上述第六步中处理好的奶牛测试集数据送入第七步训练好的模型中进行测试,得出预测结果,至此完成SVM测试;
第九步,识别出奶牛个体:
根据第八步测试过程得到相应的预测结果,输出测试集中各特征向量对应的奶牛不同个体的标号,识别出奶牛个体;
由此完成对奶牛个体的有效识别。
CN201710269440.0A 2017-04-24 2017-04-24 一种奶牛个体识别的方法 Expired - Fee Related CN107092931B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710269440.0A CN107092931B (zh) 2017-04-24 2017-04-24 一种奶牛个体识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710269440.0A CN107092931B (zh) 2017-04-24 2017-04-24 一种奶牛个体识别的方法

Publications (2)

Publication Number Publication Date
CN107092931A CN107092931A (zh) 2017-08-25
CN107092931B true CN107092931B (zh) 2020-07-03

Family

ID=59638233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710269440.0A Expired - Fee Related CN107092931B (zh) 2017-04-24 2017-04-24 一种奶牛个体识别的方法

Country Status (1)

Country Link
CN (1) CN107092931B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107680080B (zh) * 2017-09-05 2020-02-21 翔创科技(北京)有限公司 牲畜的样本库建立方法和清点方法、存储介质和电子设备
CN107833145A (zh) * 2017-09-19 2018-03-23 翔创科技(北京)有限公司 牲畜的数据库建立方法和溯源方法、存储介质和电子设备
CN108388877A (zh) * 2018-03-14 2018-08-10 广州影子控股股份有限公司 一种猪脸的识别方法
CN108921049B (zh) * 2018-06-14 2021-08-03 华东交通大学 基于量子门线路神经网络的肿瘤细胞图像识别装置及设备
CN109492562B (zh) * 2018-10-30 2021-05-25 河南科技大学 一种无接触家畜识别系统
CN112651418B (zh) * 2020-05-25 2022-03-08 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968621A (zh) * 2012-11-23 2013-03-13 西安电子科技大学 基于第二代Bandelet统计特征的人体运动识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0719527D0 (en) * 2007-10-08 2007-11-14 Univ York Value determination

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968621A (zh) * 2012-11-23 2013-03-13 西安电子科技大学 基于第二代Bandelet统计特征的人体运动识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于LGBP特征和稀疏表示的人脸表情识别;于明 等;《计算机工程与设计》;20130516;第34卷(第5期);第1787-1791页 *

Also Published As

Publication number Publication date
CN107092931A (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
CN107092931B (zh) 一种奶牛个体识别的方法
Zhao et al. A survey on deep learning-based fine-grained object classification and semantic segmentation
Bazzani et al. Self-taught object localization with deep networks
Cheng et al. Exploiting effective facial patches for robust gender recognition
CN108520226B (zh) 一种基于躯体分解和显著性检测的行人重识别方法
Felzenszwalb et al. Visual object detection with deformable part models
Sun et al. Articulated part-based model for joint object detection and pose estimation
CN105894047B (zh) 一种基于三维数据的人脸分类系统
CN108062574B (zh) 一种基于特定类别空间约束的弱监督目标检测方法
Gall et al. An introduction to random forests for multi-class object detection
CN109919177B (zh) 基于层次化深度网络的特征选择方法
Liu et al. Feature-driven active learning for hyperspectral image classification
CN103942577A (zh) 视频监控中基于自建立样本库及混合特征的身份识别方法
CN109522853A (zh) 面向监控视频的人脸检测与搜索方法
CN104268593A (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN110781766B (zh) 基于特征谱正则化的格拉斯曼流形判别分析图像识别方法
CN112464730B (zh) 一种基于域无关前景特征学习的行人再识别方法
CN106897669A (zh) 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN110135520A (zh) 基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质
CN108154176B (zh) 一种针对单一深度图像的3d人体姿态估计算法
CN115527269B (zh) 一种人体姿态图像智能识别方法及系统
CN106599833A (zh) 一种基于领域适应和流形距离度量的人脸识别方法
CN105718934A (zh) 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
Wang et al. Pig face recognition model based on a cascaded network
CN109145947B (zh) 一种基于部件检测和视觉特征的时尚女装图像细粒度分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200703