CN110476879B - 基于多标签链式生态环境的奶牛行为分类判别方法及装置 - Google Patents

基于多标签链式生态环境的奶牛行为分类判别方法及装置 Download PDF

Info

Publication number
CN110476879B
CN110476879B CN201910787807.7A CN201910787807A CN110476879B CN 110476879 B CN110476879 B CN 110476879B CN 201910787807 A CN201910787807 A CN 201910787807A CN 110476879 B CN110476879 B CN 110476879B
Authority
CN
China
Prior art keywords
data
label
cow
model
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910787807.7A
Other languages
English (en)
Other versions
CN110476879A (zh
Inventor
赵志强
祝政
张琴
向丽娟
赵颖
钱鹰
崔一辉
吴勇
赵春泽
叶顺安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910787807.7A priority Critical patent/CN110476879B/zh
Publication of CN110476879A publication Critical patent/CN110476879A/zh
Application granted granted Critical
Publication of CN110476879B publication Critical patent/CN110476879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K11/00Marking of animals
    • A01K11/006Automatic identification systems for animals, e.g. electronic devices, transponders for animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K29/00Other apparatus for animal husbandry
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K29/00Other apparatus for animal husbandry
    • A01K29/005Monitoring or measuring activity, e.g. detecting heat or mating
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/02Breeding vertebrates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明涉及畜牧业领域,特别是涉及一种基于多标签链式生态环境奶牛行为分类判别方法及装置,所述方法包括获取奶牛行为原始数据,对原始数据打上标签Y1和标签Y2,将原始数据衍生为57维特征向量,根据标签Y2使用递归特征消除法从57维特征中选择9维特征,将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果;本发明本发明将不同类别的奶牛的行为分为九种姿态,通过精准的奶牛行为分类监测,可以判断奶牛的发情和健康状况。

Description

基于多标签链式生态环境的奶牛行为分类判别方法及装置
技术领域
本发明涉及畜牧业领域,特别是涉及基于多标签链式生态环境奶牛行为分类判别方法及装置。
背景技术
目前通过监测牛的行为特征判断其发情和健康状况,这一技术主要应用于奶牛养殖方面,特别是应用于荷斯坦牛的养殖研究。针对奶牛的行为特征研究可分为计步和多姿态判别。利用振动传感器监测奶牛的行走步数,计步的准确率较高,但传感器系于奶牛的脚踝处容易碰撞围栏和浸入泥水,造成使用寿命缩短。利用三轴加速度计系于奶牛的颈部可以克服上述问题,但会降低计步的准确率。对于奶牛多姿态的判断研究,在数据采集方面主要是通过三轴加速度计系于奶牛的颈部,研究方法主要有支持向量机(SVM)、人工神经网络、K-均值聚类和无监督PAM算法结合基于有监督的随机森林算法等,不同的研究方法也将奶牛的行为特征分为不同的类别,但仅是粗分类效果较好,细分类效果较差。例如,奶牛行为特征分为运动和静止较好,奶牛行为特征分为站立和躺卧效果较差。
发明内容
为了对奶牛的站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态特征进行有效、细致的判别,本发明提出基于多标签链式生态环境奶牛行为分类判别方法及装置,所述方法包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、将奶牛行为姿态数据作为标签Y2,根据数据的采集时间将每个57维特征向量X打上标签Y2,即根据Y2标签对57维特征向量X进行分类,对打完标签的57维特征向量X进行数据平衡采样;
S3、设置一个中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作;
S4、将57维特征向量X进行最大最小归一化;
S5、根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型(简称gbdt1)和第二提升树模型(简称gbdt2);
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型(简称Lr1)和第二逻辑回归模型(简称Lr2);
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
进一步的,利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将第一数据集中40%的数据和数据对应的标签Y1,训练得到第一梯度提升树模型;
利用第一梯度提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集和对应标签Y2,训练得到第二梯度提升树模型;
其中,训练第一梯度提升树模型和第二梯度提升树模型的过程包括:
梯度提升树模型为:
Figure GDA0003354319440000031
梯度提升模型的损失函数为:
Figure GDA0003354319440000032
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合分类回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
Figure GDA0003354319440000033
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率;J为回归树上叶子节点的个数。
进一步的,将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型包括:
将第二数据集输入到第一梯度提升树模型,得出第二预测结果,再将数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二梯度提升树模型,得出第四数据集对应的叶子节点,对叶子节点进独热(one-hot)编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的Y1标签作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点和第三预测结果合并作为第六数据集,以第六数据集及其对应的Y2标签,训练出第二逻辑回归模型。
进一步的,将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带Y1标签的预测结果;
将获得的带Y1标签的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带Y1标签的预测结果;
将第二带Y1标签的预测结果以及叶子节点序列输入第二逻辑回归模型,获得Y2标签的预测结果,即获得最终奶牛九种姿态分类结果。
本发明还提出一种基于多标签链式生态环境奶牛行为分类判别装置,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括摄像机、三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及摄像机采集的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;服务器对原始数据进行处理,得出奶牛九种姿态分类结果。
本发明将不同类别的奶牛的行为分为站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态,通过精准的奶牛行为分类监测,可以判断奶牛的发情和健康状况,例如奶牛是否处于发情期和是否患有脚蹄疫,如果奶牛处于慢跑、慢跑、采食和爬跨状态的频率和时间明显增加,那么奶牛很有可能处于发情期,如果奶牛处于静卧的时间明显增加,那么奶牛很有可能患有脚蹄疫;同时此方法适用于不同品种的奶牛,例如中国西门塔尔牛、娟姗牛、奶水牛、牦牛、三河牛、新疆褐牛和蜀宣花牛等。
附图说明
图1是本发明基于多标签链式生态环境奶牛行为分类判别系统整体结构图;
图2是本发明奶牛姿态分类方法图;
图3是本发明基于多标签链式生态环境奶牛行为分类判别方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,具体包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、将奶牛行为姿态数据作为标签Y2,根据数据的采集时间将每个57维特征向量打上标签Y2,即根据Y2标签对57维特征向量进行分类,对打完标签的57维特征向量进行数据平衡采样;
S3、设置一个中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作;
S4、将57维特征向量进行最大最小归一化;
S5、根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型;
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型;
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
在本实施例中,将奶牛原始数据衍生为57维特征向量包括利用滑动时间为2s的窗口提取奶牛原始数据,并将提取的将三轴加速度原始数据衍生19维特征向量x1、将三轴角速度原始数据衍生19维特征向量x2以及将三轴角度原始数据衍生19维特征向量x3,每个特征向量xi(i=1,2,3)表示为:
xi=[xi,avg,yi,avg,zi,avg,xi,max,yi,max,zi,max,xi,min,yi,min,zi,min,
smvi,xi,sd,yi,sd,zi,sd,ci,xy,ci,xz,ci,yz,xi,abs,yi,abs,zi,abs]
其中,xi,avg,yi,avg,zi,avg分别表示第i个特征在x,y,z轴上的平均值;xi,max、yi,max以及zi,max分别表示第i个特征在x、y以及z轴上的最大值;xi,min、yi,min以及zi,min分别表示第i个特征在x、y以及z轴上的最小值;smvi表示第i个特征在x,y,z轴上的平均值之和;xi,sd、yi,sd以及zi,sd分别表示第i个特征在x、y以及z轴上的标准差;ci,xy表示第i个特征x轴与y轴的相关系数;ci,xz表示第i个特征x轴与z轴的相关系数;ci,yz表示第i个特征y轴与z轴的相关系数;xi,abs、yi,abs以及zi,abs分别表示第i个特征在x、y以及z轴上的绝对值最大的数据。
根据数据的采集时间将每个57维特征向量X打上标签Y2包括将摄影机拍摄的奶牛姿态分为9个类别,并将摄影机拍摄一只奶牛的奶牛行为姿态作为该奶牛在同一数据采集时间的57维特征向量X的Y2标签,Y2标签表示为Y2=[站立:1,静卧:2,慢走:3,慢跑:4,采食:5,站立动作:6,静卧动作:7,快跑:8,爬跨:9]。
如图2,根据Y2标签对57维特征向量进行采样平衡后的数据进行分类,生成中间标签Y1,即采样平衡后的数据带有一个Y1标签和一个Y2标签,设置的中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作包括将静卧和慢走标记为静止,将慢跑、采食以及站立动作标记为小幅动作,将静卧动作、快跑以及爬跨标记为小幅动作。
由于每种标签对应的原始数据分布不均,导致有部分标签的原始数量远远大于其他标签的原始标签的数量,为了平衡每种标签的原始数据,在本实施例中,对原始数据多的标签采用下采样,对原始数据数据少的标签采用上采样。
根据对牛姿态的观察和统计,奶牛处于状态Y2=[1,2,3,4,5,8]的原始数据量远远大于奶牛处于状态Y2=[6,7,9]的原始数据量,所以本实施例给出一种对打完标签的57维特征向量进行数据平衡采样的具体过程,包括:
S201、根据Y2标签,将原始样本分为多数类Y2s和少数类Y2l
S202、计算每个样本N个近邻,Δ为N个近邻中与自身类别不一致的个数;
S203、对于任意样本Yi,若Yi∈Y2s且Δ>N/2,则删除样本Yi;若Yi∈Y2l,增加少数类Y2l的数量;
S204、合成新样本增加少数类Y2l的数量,增量的新样本的数量为:
Figure GDA0003354319440000071
S205、根据少数类Y2l中的样本生成m个新样本,确定少数类Y2l中第i个样本合成新样本个数,表示为
Figure GDA0003354319440000072
根据第i个样本合成新样本表示为:
Figure GDA0003354319440000073
其中,maxY2s表示多数类Y2s中样本数量最多类别的数量;minY2l表示少数类Y2l中样本数量最少类别的数量;
Figure GDA0003354319440000075
表示样本点xi近邻中的任意一点;λ为随机因子,为(0,1)中的随机数;ki为中间参数,表示为
Figure GDA0003354319440000074
为了更好地对数据进行处理,需要对57维特征向量进行归一化处理,本实施例采用最大最小归一化,表示为;
Figure GDA0003354319440000081
其中,x*表示进行最大最小归一化之后的数据;x表示进行最大最小归一化之前的数据;xmax表示所用数据中的最大值;xmin表示所用数据中的最小值。
在利用针对标签Y2使用递归特征消除法从57维特征中选择9维特征的过程中,使用SVM支持向量机模型作为评估模型,依次从57维特征中删除一个特征训练出一个模型,然后放回该特征,删除下一个特征......,直到获得57个SVM支持向量机模型,将得到的57个模型评分依次排序选出分值最小的9个模型,该9个模型对应的9个特征即为从57维特征中选择9维特征。
利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将数据集中40%的数据和数据对应的标签Y1,训练得到第一梯度提升树模型;
利用第一梯度提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集和对应标签Y2,训练得到第二梯度提升树模型。
其中,训练第一梯度提升树模型和第二梯度提升树模型的过程包括:
梯度提升树模型为:
Figure GDA0003354319440000082
梯度提升模型的损失函数为:
Figure GDA0003354319440000083
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合CART回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
Figure GDA0003354319440000091
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率,表示为
Figure GDA0003354319440000092
fk(x)表示样本x属于第k类的概率;J为回归树上叶子节点的个数;J为回归树上叶子节点的个数。
将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型的过程包括:
将第二数据集输入到第一梯度提升树模型,得出第二预测结果,再将数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二梯度提升树模型,得出第四数据集对应的叶子节点,对叶子节点进独热编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的Y1标签作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点和第三预测结果合并作为第六数据集,以第六数据集及其对应的Y2标签,训练出第二逻辑回归模型。
将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果,在评估奶牛姿态的过程中,标签Y1与标签Y2存在链式关系,使用逻辑回归作为基础评估模型,具体过程包括包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带Y1标签的预测结果;
将获得的带Y1标签的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带Y1标签的预测结果;
将第二带Y1标签的预测结果以及叶子节点序列输入第二逻辑回归模型,获得Y2标签的预测结果,即获得最终奶牛九种姿态分类结果。
本发明还提供一种基于多标签链式的奶牛行为分类判别装置,如图1,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括摄像机、三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及摄像机采集的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;服务器对原始数据进行处理,得出奶牛九种姿态分类结果;其中,奶牛姿态原始数据采集器佩戴于奶牛的脖子处,用于采集奶牛的三轴加速度、三轴角速度和三轴角度原始数据,采样频率为50hz。
在本实施例中,服务器包括57维特征向量生成器、标签生成器、上采样单元、下采样单元、归一化单元、SVM模型、第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型;其中:
57维特征向量生成器用于将奶牛姿态数据采集器采集的原始数据转化为57维特征向量;
标签生成器将在同一时间采集的9维原始数据和摄像机数据进行对应,并将摄像机中奶牛的行为作为同一时间奶牛的姿态标签;标签生成器中至少包括标签Y1和标签Y2;
上采样单元用于对原始数据进行上采样;优选的,在本实施例中,对标签Y2中Y2=[6,7,9]的原始数据量采用ADASYN算法进行上采样,将数据数量增加一半;
下采样单元用于对原始数据进行下采样;优选的,在本实施例中,对标签Y2中Y2=[1,2,3,4,5,8]的原始数据量采用ENN算法进行下采样,将数据数量减少一半;
归一化单元用于对采样后的数据进行归一化处理;优选的,在本实施例中对数据采用最大最小归一化对数据进行归一化;
SVM模型用于从57维特征中选出9维特征;优选的,在本实施例中,使用SVM支持向量机模型作为评估模型,依次从57维特征中删除一个特征训练出一个模型,然后放回该特征,删除下一个特征......,直到获得57个SVM支持向量机模型,将得到的57个模型评分依次排序选出分值最小的9个模型,该9个模型对应的9个特征即为从57维特征中选择9维特征;
第一提升树模型用于对数据进行预测,并将标签Y1作为预测结果;第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型的训练过程见本发明方法,此处不再赘述;
第二提升树模型用于对第一提升树模型的预测结果进行进一步预测,并将标签Y2作为预测结果;
第一逻辑回归模型用于对第二提升树模型的预测结果进行进一步预测,并将标签Y1作为预测结果;
第二逻辑回归模型用于对第一逻辑回归模型的预测结果进行进一步预测,并将标签Y2作为预测结果,即最终预测结果。
在本实施例中,为了合理化应用资源,Lora网关汇集牧场奶牛姿态数据采集器发送来的数据,每隔半小时将汇集数据通过4G模块发送给服务器,服务器通过算法模型对九轴原始数据处理判断出奶牛站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态,如果奶牛处于慢跑、慢跑、采食和爬跨状态的频率和时间明显增加,那么奶牛很有可能处于发情期,如果奶牛处于静卧的时间明显增加,那么奶牛很有可能患有脚蹄疫,以此判断奶牛的健康状况,农场管理人员可以及时对奶牛的情况作出反应。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.基于多标签链式生态环境奶牛行为分类判别装置,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器以及三轴角度采集器的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;其特征在于,服务器对原始数据进行处理,得出奶牛九种姿态分类结果,服务器包括57维特征向量生成器、数据平衡单元、归一化单元、SVM模型、第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型;其中:
57维特征向量生成器用于将奶牛姿态数据采集器采集的原始数据转化为57维特征向量;
数据平衡单元用于对打完标签的57维特征向量进行数据平衡采样;
归一化单元用于对采样后的数据进行归一化处理;
SVM模型用于从57维特征中选出9维特征;
第一提升树模型用于以实时的筛选出来的9维数据作为输入,获得第一带Y1标签的预测结果;
第二提升树模型用于以带Y1标签的预测结果以及9维数据作为输入,获得叶子节点序列;
第一逻辑回归模型用于对第二提升树模型的预测结果叶子节点序列进行进一步预测,并将标签Y1作为预测结果;
第二逻辑回归模型用于对第一逻辑回归模型的预测结果以及叶子节点序列进行进一步预测,并将标签Y2作为预测结果,即最终预测结果。
2.根据权利要求1所述的基于多标签链式生态环境奶牛行为分类判别装置,其特征在于,所述数据平衡单元包括数据分类子单元、近邻计算子单元、类别分类子单元、删除子单元以及样本合成单元;其中:
数据分类子单元根据数据的实际数量将数据分为多数类和少数类,即当实际的数据量超过设置的数据量阈值时,为多数类,否则为少数类;
近邻计算子单元计算与当前数据之间距离最近的N个数据作为当前数据的近邻集合;
类别分类子单元用于计算当前数据中的近邻集合中与当前集合的类别不一样的数据的数量;
删除子单元用于删除多数类的当前数据的近邻集合中与当前类别不一致的数据,直到当前数据近邻集合中的与当前数据类别不一致的数据的数量小于等于近邻集合容量的一半,优先删除与当前数据之间距离较远的数据;
样本合成子单元包括合成数量确定子单元和合成子单元,其中合成数量确定子单元根据多数类和少数类原始数据的数量确定需要合成的数据数量,再以少数类中某个数据来合成新数据的数量;合成子单元根据少数类中的某个原始数据及其近邻集合中的某个数据以及一个0~1之间随机数合成新的数据。
3.基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,具体包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、将奶牛行为姿态数据作为标签Y2,根据数据的采集时间将每个57维特征向量打上标签Y2,即根据标签Y2对57维特征向量进行分类,对打完标签的57维特征向量进行数据平衡采样;
S3、设置一个中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作;
S4、将57维特征向量进行最大最小归一化;
S5、根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型;
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型;
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
4.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,训练数据的获取包括在牧场设置摄影机,将奶牛的行为拍摄下来,将在同一时间采集的9维特征向量和摄像机数据进行对应,并将摄像机中奶牛的行为作为同一时间奶牛的姿态;其中奶牛的一个姿态为标签Y2中的一个标签,根据标签Y2对57维特征向量进行采样平衡后的数据进行分类,生成中间标签Y1,即采样平衡后的数据带有一个标签Y1和一个标签Y2。
5.根据权利要求4所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,标签Y2表示为Y2=[站立:1,静卧:2,慢走:3,慢跑:4,采食:5,站立动作:6,静卧动作:7,快跑:8,爬跨:9];标签Y1将标签Y2中的奶牛行为姿态分类为静止、小幅动作以及大幅动作,表示为Y1=[静止:1,小幅动作:2,大幅动作:3],其中将站立和静卧标记为静止,将慢走、慢跑和采食动作标记为小幅动作,将站立动作、静卧动作、快跑和爬跨标记为大幅动作。
6.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将第一数据集中40%的数据和数据对应的标签Y1,训练得到第一提升树模型;
利用第一提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集及其对应标签Y2,训练得到第二提升树模型;
训练第一提升树模型和第二提升树模型的过程包括:
梯度提升树模型为:
Figure FDA0003371154710000041
梯度提升模型的损失函数为:
Figure FDA0003371154710000042
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合CART回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
Figure FDA0003371154710000043
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率;J为回归树上叶子节点的个数。
7.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一逻辑回归模型和第二逻辑回归模型的过程包括:
将第二数据集输入到第一提升树模型,得出第二预测结果,再将第二数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二提升树模型,得出第四数据集对应的叶子节点,对叶子节点进行独热编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的标签Y1作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点及其对应的第三预测结果合并作为第六数据集,以第六数据集及其对应的标签Y2,训练出第二逻辑回归模型。
8.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带标签Y1的预测结果;
将获得的带标签Y1的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带标签Y1的预测结果;
将第二带标签Y1的预测结果以及叶子节点序列输入第二逻辑回归模型,获得标签Y2的预测结果,即获得最终奶牛九种姿态分类结果。
9.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,所述将奶牛原始数据衍生为57维特征向量包括利用滑动时间为2s的窗口提取奶牛原始数据,并将提取的将三轴加速度原始数据衍生19维特征向量x1、将三轴角速度原始数据衍生19维特征向量x2以及将三轴角度原始数据衍生19维特征向量x3,每个特征向量xi(i=1,2,3)表示为:
xi=[xi,avg,yi,avg,zi,avg,xi,max,yi,max,zi,max,xi,min,yi,min,zi,min,smvi,xi,sd,yi,sd,zi,sd,ci,xy,ci,xz,ci,yz,xi,abs,yi,abs,zi,abs]
其中,xi,avg,yi,avg,zi,avg分别表示第i个特征在x,y,z轴上的平均值;xi,max、yi,max以及zi,max分别表示第i个特征在x、y以及z轴上的最大值;xi,min、yi,min以及zi,min分别表示第i个特征在x、y以及z轴上的最小值;smvi表示第i个特征在x,y,z轴上的平均值之和;xi,sd、yi,sd以及zi,sd分别表示第i个特征在x、y以及z轴上的标准差;ci,xy表示第i个特征x轴与y轴的相关系数;ci,xz表示第i个特征x轴与z轴的相关系数;ci,yz表示第i个特征y轴与z轴的相关系数;xi,abs、yi,abs以及zi,abs分别表示第i个特征在x、y以及z轴上的绝对值最大的数据。
10.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,对打完标签Y2的57维特征向量进行平衡采样包括:
S1、根据Y2标签,将原始样本分为多数类Y2s和少数类Y2l
S2、计算每个样本N个近邻,Δ为N个近邻中与自身类别不一致的个数;
S3、对于任意样本Yi,若Yi∈Y2s且Δ>N/2,则删除样本Yi;若Yi∈Y2l,增加少数类Y2l的数量;
S4、合成新样本增加少数类Y2l的数量,增量的新样本的数量为:
Figure FDA0003371154710000061
S5、根据少数类Y2l中的样本生成m个新样本,确定少数类Y2l中第i个样本合成新样本个数,表示为
Figure FDA0003371154710000062
根据第i个样本合成新样本表示为:
Figure FDA0003371154710000063
其中,max Y2s表示多数类Y2s中样本数量最多类别的数量;minY2l表示少数类Y2l中样本数量最少类别的数量;
Figure FDA0003371154710000064
表示样本点xi近邻中的任意一点;λ为随机因子,为(0,1)中的随机数;ki为中间参数,表示为
Figure FDA0003371154710000065
CN201910787807.7A 2019-08-26 2019-08-26 基于多标签链式生态环境的奶牛行为分类判别方法及装置 Active CN110476879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910787807.7A CN110476879B (zh) 2019-08-26 2019-08-26 基于多标签链式生态环境的奶牛行为分类判别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910787807.7A CN110476879B (zh) 2019-08-26 2019-08-26 基于多标签链式生态环境的奶牛行为分类判别方法及装置

Publications (2)

Publication Number Publication Date
CN110476879A CN110476879A (zh) 2019-11-22
CN110476879B true CN110476879B (zh) 2022-02-22

Family

ID=68554022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910787807.7A Active CN110476879B (zh) 2019-08-26 2019-08-26 基于多标签链式生态环境的奶牛行为分类判别方法及装置

Country Status (1)

Country Link
CN (1) CN110476879B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139548B (zh) * 2020-12-31 2022-05-06 重庆邮电大学 基于运算符作用域和中心线的数学公式识别方法
CN112883999A (zh) * 2021-01-13 2021-06-01 安徽大学 一种用于奶牛运动异常检测计步器系统及其方法
CN113672736B (zh) * 2021-09-09 2023-08-22 上海德拓信息技术股份有限公司 一种文本多标签分类方法及系统
CN114916913B (zh) * 2022-05-09 2023-01-13 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法
CN115868428A (zh) * 2022-12-15 2023-03-31 四川农业大学 一种基于六轴惯性传感器的智能牛项圈及监测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101472469A (zh) * 2006-04-18 2009-07-01 Iti苏格兰有限公司 用于监视家畜状况的方法及系统
CN101500658A (zh) * 2006-02-08 2009-08-05 S.A.E.阿菲金公司 用于测定动物姿势的装置,特别是用于测定反刍动物姿势的装置
WO2010108496A1 (en) * 2009-03-25 2010-09-30 Smarter Farming A/S System and method for detecting behaviour of animals
CN107027650A (zh) * 2017-03-21 2017-08-11 中国农业大学 一种基于pso‑svm的种猪异常状态检测方法及装置
CN108717523A (zh) * 2018-04-26 2018-10-30 华南农业大学 基于机器视觉的母猪发情行为检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509897A (zh) * 2018-03-29 2018-09-07 同济大学 一种人体姿态识别方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101500658A (zh) * 2006-02-08 2009-08-05 S.A.E.阿菲金公司 用于测定动物姿势的装置,特别是用于测定反刍动物姿势的装置
CN101472469A (zh) * 2006-04-18 2009-07-01 Iti苏格兰有限公司 用于监视家畜状况的方法及系统
WO2010108496A1 (en) * 2009-03-25 2010-09-30 Smarter Farming A/S System and method for detecting behaviour of animals
CN107027650A (zh) * 2017-03-21 2017-08-11 中国农业大学 一种基于pso‑svm的种猪异常状态检测方法及装置
CN108717523A (zh) * 2018-04-26 2018-10-30 华南农业大学 基于机器视觉的母猪发情行为检测方法

Also Published As

Publication number Publication date
CN110476879A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN110476879B (zh) 基于多标签链式生态环境的奶牛行为分类判别方法及装置
González et al. Behavioral classification of data from collars containing motion sensors in grazing cattle
CN107027650B (zh) 一种基于pso-svm的种猪异常状态检测方法及装置
CN107153871B (zh) 基于卷积神经网络和手机传感器数据的跌倒检测方法
Aquino et al. A new methodology for estimating the grapevine-berry number per cluster using image analysis
CN103955699B (zh) 一种基于监控视频的实时摔倒事件检测方法
Achour et al. Unsupervised automated monitoring of dairy cows’ behavior based on Inertial Measurement Unit attached to their back
CN108509897A (zh) 一种人体姿态识别方法和系统
Smith et al. Bag of class posteriors, a new multivariate time series classifier applied to animal behaviour identification
CN109218223A (zh) 一种基于主动学习的鲁棒性网络流量分类方法及系统
Kasfi et al. Convolutional neural network for time series cattle behaviour classification
Hussain et al. Activity detection for the wellbeing of dogs using wearable sensors based on deep learning
CN111259978A (zh) 一种融合多区域深度特征的奶牛个体身份识别方法
CN107669278A (zh) 运动状态识别方法和系统、动物行为识别系统
Colonna et al. A distributed approach for classifying anuran species based on their calls
Vanrell et al. 3d acceleration for heat detection in dairy cows
Gao et al. Adaptive cow movement detection using evolving spiking neural network models
Abhishek et al. Harnessing Deep Learning for Precise Rice Image Classification: Implications for Sustainable Agriculture
CN108990833A (zh) 一种基于位置信息的动物运动行为判别方法及装置
CN111178134B (zh) 一种基于深度学习与网络压缩的摔倒检测方法
Tran et al. A robust classification system for Southern Yellow cow behavior using 3-DoF accelerometers
Zhang et al. Early lameness detection in dairy cattle based on wearable gait analysis using semi-supervised LSTM-Autoencoder
Owalekar et al. An agri vigilance system based on computer vision and deep learning
ZIN et al. Feature detection and analysis of cow motion classification for predicting calving time
Zhao et al. Improved Sensor-Based Animal Behavior Classification Performance through Conditional Generative Adversarial Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant