CN110476879A - 基于多标签链式生态环境的奶牛行为分类判别方法及装置 - Google Patents
基于多标签链式生态环境的奶牛行为分类判别方法及装置 Download PDFInfo
- Publication number
- CN110476879A CN110476879A CN201910787807.7A CN201910787807A CN110476879A CN 110476879 A CN110476879 A CN 110476879A CN 201910787807 A CN201910787807 A CN 201910787807A CN 110476879 A CN110476879 A CN 110476879A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- milk cow
- tree
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000008267 milk Substances 0.000 title claims abstract description 127
- 235000013336 milk Nutrition 0.000 title claims abstract description 127
- 210000004080 milk Anatomy 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000013480 data collection Methods 0.000 claims abstract description 5
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 17
- 230000001133 acceleration Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 230000003068 static effect Effects 0.000 claims description 7
- 241001269238 Data Species 0.000 claims description 6
- 206010065954 Stubbornness Diseases 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 3
- 230000036544 posture Effects 0.000 abstract description 23
- 230000003862 health status Effects 0.000 abstract description 3
- 241001465754 Metazoa Species 0.000 abstract description 2
- 241000283690 Bos taurus Species 0.000 description 85
- 238000012706 support-vector machine Methods 0.000 description 8
- 235000013305 food Nutrition 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000003542 behavioural effect Effects 0.000 description 4
- 210000002683 foot Anatomy 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000012173 estrus Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000283725 Bos Species 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K11/00—Marking of animals
- A01K11/006—Automatic identification systems for animals, e.g. electronic devices, transponders for animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K29/00—Other apparatus for animal husbandry
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K29/00—Other apparatus for animal husbandry
- A01K29/005—Monitoring or measuring activity, e.g. detecting heat or mating
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/02—Breeding vertebrates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Environmental Sciences (AREA)
- Theoretical Computer Science (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Zoology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- Birds (AREA)
- Biophysics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及畜牧业领域,特别是涉及一种基于多标签链式生态环境奶牛行为分类判别方法及装置,所述方法包括获取奶牛行为原始数据,对原始数据打上标签Y1和标签Y2,将原始数据衍生为57维特征向量,根据标签Y2使用递归特征消除法从57维特征中选择9维特征,将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果;本发明本发明将不同类别的奶牛的行为分为九种姿态,通过精准的奶牛行为分类监测,可以判断奶牛的发情和健康状况。
Description
技术领域
本发明涉及畜牧业领域,特别是涉及基于多标签链式生态环境奶牛行为分类判别方法及装置。
背景技术
目前通过监测牛的行为特征判断其发情和健康状况,这一技术主要应用于奶牛养殖方面,特别是应用于荷斯坦牛的养殖研究。针对奶牛的行为特征研究可分为计步和多姿态判别。利用振动传感器监测奶牛的行走步数,计步的准确率较高,但传感器系于奶牛的脚踝处容易碰撞围栏和浸入泥水,造成使用寿命缩短。利用三轴加速度计系于奶牛的颈部可以克服上述问题,但会降低计步的准确率。对于奶牛多姿态的判断研究,在数据采集方面主要是通过三轴加速度计系于奶牛的颈部,研究方法主要有支持向量机(SVM)、人工神经网络、K-均值聚类和无监督PAM算法结合基于有监督的随机森林算法等,不同的研究方法也将奶牛的行为特征分为不同的类别,但仅是粗分类效果较好,细分类效果较差。例如,奶牛行为特征分为运动和静止较好,奶牛行为特征分为站立和躺卧效果较差。
发明内容
为了对奶牛的站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态特征进行有效、细致的判别,本发明提出基于多标签链式生态环境奶牛行为分类判别方法及装置,所述方法包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、将奶牛行为姿态数据作为标签Y2,根据数据的采集时间将每个57维特征向量X打上标签Y2,即根据Y2标签对57维特征向量X进行分类,对打完标签的57维特征向量X进行数据平衡采样;
S3、设置一个中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作;
S4、将57维特征向量X进行最大最小归一化;
S5、根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型(简称gbdt1)和第二提升树模型(简称gbdt2);
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型(简称Lr1)和第二逻辑回归模型(简称Lr2);
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
进一步的,利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将第一数据集中40%的数据和数据对应的标签Y1,训练得到第一梯度提升树模型;
利用第一梯度提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集和对应标签Y2,训练得到第二梯度提升树模型;
其中,训练第一梯度提升树模型和第二梯度提升树模型的过程包括:
梯度提升树模型为:梯度提升模型的损失函数为:
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合分类回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率;J为回归树上叶子节点的个数。
进一步的,将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型包括:
将第二数据集输入到第一梯度提升树模型,得出第二预测结果,再将数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二梯度提升树模型,得出第四数据集对应的叶子节点,对叶子节点进独热(one-hot)编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的Y1标签作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点和第三预测结果合并作为第六数据集,以第六数据集及其对应的Y2标签,训练出第二逻辑回归模型。
进一步的,将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带Y1标签的预测结果;
将获得的带Y1标签的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带Y1标签的预测结果;
将第二带Y1标签的预测结果以及叶子节点序列输入第二逻辑回归模型,获得Y2标签的预测结果,即获得最终奶牛九种姿态分类结果。
本发明还提出一种基于多标签链式生态环境奶牛行为分类判别装置,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括摄像机、三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及摄像机采集的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;服务器对原始数据进行处理,得出奶牛九种姿态分类结果。
本发明将不同类别的奶牛的行为分为站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态,通过精准的奶牛行为分类监测,可以判断奶牛的发情和健康状况,例如奶牛是否处于发情期和是否患有脚蹄疫,如果奶牛处于慢跑、慢跑、采食和爬跨状态的频率和时间明显增加,那么奶牛很有可能处于发情期,如果奶牛处于静卧的时间明显增加,那么奶牛很有可能患有脚蹄疫;同时此方法适用于不同品种的奶牛,例如中国西门塔尔牛、娟姗牛、奶水牛、牦牛、三河牛、新疆褐牛和蜀宣花牛等。
附图说明
图1是本发明基于多标签链式生态环境奶牛行为分类判别系统整体结构图;
图2是本发明奶牛姿态分类方法图;
图3是本发明基于多标签链式生态环境奶牛行为分类判别方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,具体包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、将奶牛行为姿态数据作为标签Y2,根据数据的采集时间将每个57维特征向量打上标签Y2,即根据Y2标签对57维特征向量进行分类,对打完标签的57维特征向量进行数据平衡采样;
S3、设置一个中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作;
S4、将57维特征向量进行最大最小归一化;
S5、根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型;
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型;
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
在本实施例中,将奶牛原始数据衍生为57维特征向量包括利用滑动时间为2s的窗口提取奶牛原始数据,并将提取的将三轴加速度原始数据衍生19维特征向量x1、将三轴角速度原始数据衍生19维特征向量x2以及将三轴角度原始数据衍生19维特征向量x3,每个特征向量xi(i=1,2,3)表示为:
xi=[xi,avg,yi,avg,zi,avg,xi,max,yi,max,zi,max,xi,min,yi,min,zi,min,smvi,xi,sd,yi,sd,zi,sd,ci,xy,ci,xz,ci,yz,xi,abs,yi,abs,zi,abs]
其中,xi,avg,yi,avg,zi,avg分别表示第i个特征在x,y,z轴上的平均值;xi,max、yi,max以及zi,max分别表示第i个特征在x、y以及z轴上的最大值;xi,min、yi,min以及zi,min分别表示第i个特征在x、y以及z轴上的最小值;smvi表示第i个特征在x,y,z轴上的平均值之和;xi,sd、yi,sd以及zi,sd分别表示第i个特征在x、y以及z轴上的标准差;ci,xy表示第i个特征x轴与y轴的相关系数;ci,xz表示第i个特征x轴与z轴的相关系数;ci,yz表示第i个特征y轴与z轴的相关系数;xi,abs、yi,abs以及zi,abs分别表示第i个特征在x、y以及z轴上的绝对值最大的数据。
根据数据的采集时间将每个57维特征向量X打上标签Y2包括将摄影机拍摄的奶牛姿态分为9个类别,并将摄影机拍摄一只奶牛的奶牛行为姿态作为该奶牛在同一数据采集时间的57维特征向量X的Y2标签,Y2标签表示为Y2=[站立:1,静卧:2,慢走:3,慢跑:4,采食:5,站立动作:6,静卧动作:7,快跑:8,爬跨:9]。
如图2,根据Y2标签对57维特征向量进行采样平衡后的数据进行分类,生成中间标签Y1,即采样平衡后的数据带有一个Y1标签和一个Y2标签,设置的中间标签Y1,将标签Y2中的奶牛行为姿态标记为静止、小幅动作以及大幅动作包括将静卧和慢走标记为静止,将慢跑、采食以及站立动作标记为小幅动作,将静卧动作、快跑以及爬跨标记为小幅动作。
由于每种标签对应的原始数据分布不均,导致有部分标签的原始数量远远大于其他标签的原始标签的数量,为了平衡每种标签的原始数据,在本实施例中,对原始数据多的标签采用下采样,对原始数据数据少的标签采用上采样。
根据对牛姿态的观察和统计,奶牛处于状态Y2=[1,2,3,4,5,8]的原始数据量远远大于奶牛处于状态Y2=[6,7,9]的原始数据量,所以本实施例给出一种对打完标签的57维特征向量进行数据平衡采样的具体过程,包括:
S201、根据Y2标签,将原始样本分为多数类Y2s和少数类Y2l;
S202、计算每个样本N个近邻,Δ为N个近邻中与自身类别不一致的个数;
S203、对于任意样本Yi,若Yi∈Y2s且Δ>N/2,则删除样本Yi;若Yi∈Y2l,增加少数类Y2l的数量;
S204、合成新样本增加少数类Y2l的数量,增量的新样本的数量为:
S205、根据少数类Y2l中的样本生成m个新样本,确定少数类Y2l中第i个样本合成新样本个数,表示为根据第i个样本合成新样本表示为:
其中,maxY2s表示多数类Y2s中样本数量最多类别的数量;minY2l表示少数类Y2l中样本数量最少类别的数量;表示样本点xi近邻中的任意一点;λ为随机因子,为(0,1)中的随机数;ki为中间参数,表示为
为了更好地对数据进行处理,需要对57维特征向量进行归一化处理,本实施例采用最大最小归一化,表示为;
其中,x*表示进行最大最小归一化之后的数据;x表示进行最大最小归一化之前的数据;xmax表示所用数据中的最大值;xmin表示所用数据中的最小值。
在利用针对标签Y2使用递归特征消除法从57维特征中选择9维特征的过程中,使用SVM支持向量机模型作为评估模型,依次从57维特征中删除一个特征训练出一个模型,然后放回该特征,删除下一个特征......,直到获得57个SVM支持向量机模型,将得到的57个模型评分依次排序选出分值最小的9个模型,该9个模型对应的9个特征即为从57维特征中选择9维特征。
利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将数据集中40%的数据和数据对应的标签Y1,训练得到第一梯度提升树模型;
利用第一梯度提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集和对应标签Y2,训练得到第二梯度提升树模型。
其中,训练第一梯度提升树模型和第二梯度提升树模型的过程包括:
梯度提升树模型为:梯度提升模型的损失函数为:
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合CART回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率,表示为fk(x)表示样本x属于第k类的概率;J为回归树上叶子节点的个数;J为回归树上叶子节点的个数。
将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型的过程包括:
将第二数据集输入到第一梯度提升树模型,得出第二预测结果,再将数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二梯度提升树模型,得出第四数据集对应的叶子节点,对叶子节点进独热编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的Y1标签作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点和第三预测结果合并作为第六数据集,以第六数据集及其对应的Y2标签,训练出第二逻辑回归模型。
将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果,在评估奶牛姿态的过程中,标签Y1与标签Y2存在链式关系,使用逻辑回归作为基础评估模型,具体过程包括包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带Y1标签的预测结果;
将获得的带Y1标签的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带Y1标签的预测结果;
将第二带Y1标签的预测结果以及叶子节点序列输入第二逻辑回归模型,获得Y2标签的预测结果,即获得最终奶牛九种姿态分类结果。
本发明还提供一种基于多标签链式的奶牛行为分类判别装置,如图1,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括摄像机、三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及摄像机采集的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;服务器对原始数据进行处理,得出奶牛九种姿态分类结果;其中,奶牛姿态原始数据采集器佩戴于奶牛的脖子处,用于采集奶牛的三轴加速度、三轴角速度和三轴角度原始数据,采样频率为50hz。
在本实施例中,服务器包括57维特征向量生成器、标签生成器、上采样单元、下采样单元、归一化单元、SVM模型、第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型;其中:
57维特征向量生成器用于将奶牛姿态数据采集器采集的原始数据转化为57维特征向量;
标签生成器将在同一时间采集的9维原始数据和摄像机数据进行对应,并将摄像机中奶牛的行为作为同一时间奶牛的姿态标签;标签生成器中至少包括标签Y1和标签Y2;
上采样单元用于对原始数据进行上采样;优选的,在本实施例中,对标签Y2中Y2=[6,7,9]的原始数据量采用ADASYN算法进行上采样,将数据数量增加一半;
下采样单元用于对原始数据进行下采样;优选的,在本实施例中,对标签Y2中Y2=[1,2,3,4,5,8]的原始数据量采用ENN算法进行下采样,将数据数量减少一半;
归一化单元用于对采样后的数据进行归一化处理;优选的,在本实施例中对数据采用最大最小归一化对数据进行归一化;
SVM模型用于从57维特征中选出9维特征;优选的,在本实施例中,使用SVM支持向量机模型作为评估模型,依次从57维特征中删除一个特征训练出一个模型,然后放回该特征,删除下一个特征......,直到获得57个SVM支持向量机模型,将得到的57个模型评分依次排序选出分值最小的9个模型,该9个模型对应的9个特征即为从57维特征中选择9维特征;
第一提升树模型用于对数据进行预测,并将标签Y1作为预测结果;第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型的训练过程见本发明方法,此处不再赘述;
第二提升树模型用于对第一提升树模型的预测结果进行进一步预测,并将标签Y2作为预测结果;
第一逻辑回归模型用于对第二提升树模型的预测结果进行进一步预测,并将标签Y1作为预测结果;
第二逻辑回归模型用于对第一逻辑回归模型的预测结果进行进一步预测,并将标签Y2作为预测结果,即最终预测结果。
在本实施例中,为了合理化应用资源,Lora网关汇集牧场奶牛姿态数据采集器发送来的数据,每隔半小时将汇集数据通过4G模块发送给服务器,服务器通过算法模型对九轴原始数据处理判断出奶牛站立、站立动作、静卧、静卧动作、慢走、慢跑、快跑、采食和爬跨九种姿态,如果奶牛处于慢跑、慢跑、采食和爬跨状态的频率和时间明显增加,那么奶牛很有可能处于发情期,如果奶牛处于静卧的时间明显增加,那么奶牛很有可能患有脚蹄疫,以此判断奶牛的健康状况,农场管理人员可以及时对奶牛的情况作出反应。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.基于多标签链式生态环境奶牛行为分类判别装置,包括奶牛姿态原始数据采集器、Lora网关和服务器,奶牛姿态数据采集器安装在奶牛的脖子上,该奶牛姿态数据采集器包括三轴加速度采集器、三轴角速度采集器、三轴角度采集器以及Lora模块;奶牛姿态数据采集器通过Lora模块将三轴加速度采集器、三轴角速度采集器以及三轴角度采集器的数据发送给Lora网关;Lora网关包括4G模块,Lora网关每隔一段时间通过4G模块将采集的数据发送到服务器;其特征在于,服务器对原始数据进行处理,得出奶牛九种姿态分类结果,服务器包括57维特征向量生成器、数据平衡单元、归一化单元、SVM模型、第一提升树模型、第二提升树模型、第一逻辑回归模型以及第二逻辑回归模型;其中:
57维特征向量生成器用于将奶牛姿态数据采集器采集的原始数据转化为57维特征向量;
数据平衡单元用于平衡原始数据的数据量;
归一化单元用于对采样后的数据进行归一化处理;
SVM模型用于从57维特征中选出9维特征;
第一提升树模型用于对实时数据进行预测,并将标签Y1作为预测结果;
第二提升树模型用于对第一提升树模型的预测结果以及原始数据进行进一步预测,得出叶子节点序列;
第一逻辑回归模型用于对第二提升树模型的预测结果叶子节点序列进行进一步预测,并将标签Y1作为预测结果;
第二逻辑回归模型用于对第一逻辑回归模型的预测结果以及叶子节点序列进行进一步预测,并将标签Y2作为预测结果,即最终预测结果。
2.基于多标签链式生态环境奶牛行为分类判别装置,其特征在于,所述数据平衡单元包括数据分类子单元、近邻计算子单元、类别分类子单元、删除子单元以及样本合成单元;其中:
数据分类子单元根据数据的实际数量将数据分为多数类和少数类,即当实际的数据量超过设置的数据量阈值时,为多数类,否则为少数类;
近邻计算子单元计算与当前数据之间距离最近的N个数据作为当前数据的近邻集合;
类别分类子单元用于计算当前数据中的近邻集合中与当前集合的类别不一样的数据的数量;
删除子单元用于删除多数类的当前数据的近邻集合中与当前类别不一致的数据,直到当前数据近邻集合中的与当前数据类别不一致的数据的数量小于等于近邻集合容量的一半,优先删除与当前数据之间距离较远的数据;
样本合成子单元包括合成数量确定子单元和合成子单元,其中合成数量确定子单元根据多数类和少数类原始数据的数量确定需要合成的数据数量,再以少数类中某个数据来合成新数据的数量;合成子单元根据少数类中的某个原始数据及其近邻集合中的某个数据以及一个0~1之间随机数合成新的数据。
3.基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,具体包括以下步骤:
S1、从佩戴奶牛脖子上的数据采集器获取奶牛行为原始数据,奶牛行为原始数据包括奶牛的三轴加速度、三轴角速度、三轴角度、奶牛行为姿态数据以及每个数据的采集时间;将奶牛的三轴加速度、三轴角速度、三轴角度9维原始数据衍生为57维特征向量;
S2、对获取的57维特征向量进行平衡采样;若该57维特征向量为训练数据,则将每个训练数据打上标签Y2和标签Y1;;
S3、将57维特征向量X进行最大最小归一化;
S5、在训练数据中,根据标签Y2使用递归特征消除法从57维特征中选择9维特征;
S6、将从训练数据中选出的9维数据集随机选择一半记作第一数据集,用于GBDT模型的训练;另一半数据记作第二数据集,用于逻辑回归模型的构建;
S7、利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型;
S8、将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一回归模型和第二逻辑回归模型;
S9、根据实时数据、第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果。
4.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,训练数据的获取包括在牧场设置摄影机,将奶牛的行为拍摄下来,将在同一时间采集的9维特征向量和摄像机数据进行对应,并将摄像机中奶牛的行为作为同一时间奶牛的姿态;其中奶牛的一个姿态为Y2标签中的一个标签,根据Y2标签对57维特征向量进行采样平衡后的数据进行分类,生成中间标签Y1,即采样平衡后的数据带有一个Y1标签和一个Y2标签。
5.根据权利要求4所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,Y2标签表示为Y2=[站立:1,静卧:2,慢走:3,慢跑:4,采食:5,站立动作:6,静卧动作:7,快跑:8,爬跨:9];标签Y1将标签Y2中的奶牛行为姿态分类为静止、小幅动作以及大幅动作,表示为Y1=[静止:1,小幅动作:2,大幅动作:3],其中将站立和静卧标记为静止,将慢走、慢跑和采食动作标记为小幅动作,将站立动作、静卧动作、快跑和爬跨标记为大幅动作。
6.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,利用第一数据集训练GBDT模型获得第一提升树模型和第二提升树模型包括:
将第一数据集中40%的数据和数据对应的标签Y1,训练得到第一梯度提升树模型;
利用第一梯度提升树模型预测数据集中剩余60%的数据集,得出第一预测结果,再将60%的数据集及其预测得到的对应的标签合并作为第三数据集;
根据第三数据集及其对应标签Y2,训练得到第二梯度提升树模型;
训练第一梯度提升树模型和第二梯度提升树模型的过程包括:
梯度提升树模型为:梯度提升模型的损失函数为:
在第t次训练过程中,计算第i个样本对应类别l的负梯度误差,表示为:rtil=yil-pl,t-1(xi);
利用(xi,rti)(i=1,2...m)拟合CART回归树,得到第t颗回归树,其对应的叶节点区域Rtj,j=1,2...,J,针对每一个叶子节点里的样本,求使损失函数最小,即拟合叶子节点最好的输出值Ctj,表示为:
其中,yil为第i个样本对应的类别l;pl,t-1(xi)为第t-1次迭代第l类别的概率;f0(x)为常数;xi为第i个样本;rti为第t次迭代样本i的负梯度误差;m为第m棵回归树;T为模型迭代次数;I为样本xi所属于的叶子的离散参数,属于当前叶子时值为1,不属于时值为0;Rtjl为第t棵回归树叶节点区域中属于l类别的叶子;K为样本对应的总类别数,pk(x)为样本x属于第k个类别的概率;J为回归树上叶子节点的个数。
7.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,将第二数据集输入第一提升树模型和第二提升树模型获得第四数据集,根据第四数据集训练进行逻辑回归训练,获得第一逻辑回归模型和第二逻辑回归模型的过程包括:
将第二数据集输入到第一梯度提升树模型,得出第二预测结果,再将第二数据集及第二预测结果合并作为第四数据集;
将第四数据集输入到第二梯度提升树模型,得出第四数据集对应的叶子节点,对叶子节点进行独热编码,得出叶子节点序列,将40%叶子节点和该叶子节点对应的Y1标签作为第五数据集,训练出第一逻辑回归模型;
利用第一逻辑回归模型预测40%的叶子节点,得出第三预测结果,将40%的叶子节点及其对应的第三预测结果合并作为第六数据集,以第六数据集及其对应的Y2标签,训练出第二逻辑回归模型。
8.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,将实时数据输入第一提升树模型、第二提升树模型、第一回归模型和第二逻辑回归模型,得出奶牛九种姿态分类结果包括:
将实时的筛选出来的9维数据输入第一提升树模型,获得第一带Y1标签的预测结果;
将获得的带Y1标签的预测结果以及9维数据输入第二提升树模型,获得叶子节点序列;
将叶子节点序列输入第一逻辑回归模型,获得第二带Y1标签的预测结果;
将第二带Y1标签的预测结果以及叶子节点序列输入第二逻辑回归模型,获得Y2标签的预测结果,即获得最终奶牛九种姿态分类结果。
9.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,所述将奶牛原始数据衍生为57维特征向量包括利用滑动时间为2s的窗口提取奶牛原始数据,并将提取的将三轴加速度原始数据衍生19维特征向量x1、将三轴角速度原始数据衍生19维特征向量x2以及将三轴角度原始数据衍生19维特征向量x3,每个特征向量xi(i=1,2,3)表示为:
xi=[xi,avg,yi,avg,zi,avg,xi,max,yi,max,zi,max,xi,min,yi,min,zi,min,smvi,xi,sd,yi,sd,zi,sd,ci,xy,ci,xz,ci,yz,xi,abs,yi,abs,zi,abs]
其中,xi,avg,yi,avg,zi,avg分别表示第i个特征在x,y,z轴上的平均值;xi,max、yi,max以及zi,max分别表示第i个特征在x、y以及z轴上的最大值;xi,min、yi,min以及zi,min分别表示第i个特征在x、y以及z轴上的最小值;smvi表示第i个特征在x,y,z轴上的平均值之和;xi,sd、yi,sd以及zi,sd分别表示第i个特征在x、y以及z轴上的标准差;ci,xy表示第i个特征x轴与y轴的相关系数;ci,xz表示第i个特征x轴与z轴的相关系数;ci,yz表示第i个特征y轴与z轴的相关系数;xi,abs、yi,abs以及zi,abs分别表示第i个特征在x、y以及z轴上的绝对值最大的数据。
10.根据权利要求3所述的基于多标签链式生态环境奶牛行为分类判别方法,其特征在于,对原始数据进行平衡采样包括:
S1、根据Y2标签,将原始样本分为多数类Y2s和少数类Y2l;
S2、计算每个样本N个近邻,Δ为N个近邻中与自身类别不一致的个数;
S3、对于任意样本Yi,若Yi∈Y2s且Δ>N/2,则删除样本Yi;若Yi∈Y2l,增加少数类Y2l的数量;
S4、合成新样本增加少数类Y2l的数量,增量的新样本的数量为:
S5、根据少数类Y2l中的样本生成m个新样本,确定少数类Y2l中第i个样本合成新样本个数,表示为根据第i个样本合成新样本表示为:
其中,maxY2s表示多数类Y2s中样本数量最多类别的数量;minY2l表示少数类Y2l中样本数量最少类别的数量;表示样本点xi近邻中的任意一点;λ为随机因子,为(0,1)中的随机数;ki为中间参数,表示为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910787807.7A CN110476879B (zh) | 2019-08-26 | 2019-08-26 | 基于多标签链式生态环境的奶牛行为分类判别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910787807.7A CN110476879B (zh) | 2019-08-26 | 2019-08-26 | 基于多标签链式生态环境的奶牛行为分类判别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110476879A true CN110476879A (zh) | 2019-11-22 |
CN110476879B CN110476879B (zh) | 2022-02-22 |
Family
ID=68554022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910787807.7A Active CN110476879B (zh) | 2019-08-26 | 2019-08-26 | 基于多标签链式生态环境的奶牛行为分类判别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110476879B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883999A (zh) * | 2021-01-13 | 2021-06-01 | 安徽大学 | 一种用于奶牛运动异常检测计步器系统及其方法 |
CN113139548A (zh) * | 2020-12-31 | 2021-07-20 | 重庆邮电大学 | 基于运算符作用域和中心线的数学公式识别方法 |
CN113672736A (zh) * | 2021-09-09 | 2021-11-19 | 上海德拓信息技术股份有限公司 | 一种文本多标签分类方法及系统 |
CN114916913A (zh) * | 2022-05-09 | 2022-08-19 | 东北大学 | 一种便携式睡眠呼吸状态实时监测系统及方法 |
CN115868428A (zh) * | 2022-12-15 | 2023-03-31 | 四川农业大学 | 一种基于六轴惯性传感器的智能牛项圈及监测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101472469A (zh) * | 2006-04-18 | 2009-07-01 | Iti苏格兰有限公司 | 用于监视家畜状况的方法及系统 |
CN101500658A (zh) * | 2006-02-08 | 2009-08-05 | S.A.E.阿菲金公司 | 用于测定动物姿势的装置,特别是用于测定反刍动物姿势的装置 |
WO2010108496A1 (en) * | 2009-03-25 | 2010-09-30 | Smarter Farming A/S | System and method for detecting behaviour of animals |
CN107027650A (zh) * | 2017-03-21 | 2017-08-11 | 中国农业大学 | 一种基于pso‑svm的种猪异常状态检测方法及装置 |
CN108509897A (zh) * | 2018-03-29 | 2018-09-07 | 同济大学 | 一种人体姿态识别方法和系统 |
CN108717523A (zh) * | 2018-04-26 | 2018-10-30 | 华南农业大学 | 基于机器视觉的母猪发情行为检测方法 |
-
2019
- 2019-08-26 CN CN201910787807.7A patent/CN110476879B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101500658A (zh) * | 2006-02-08 | 2009-08-05 | S.A.E.阿菲金公司 | 用于测定动物姿势的装置,特别是用于测定反刍动物姿势的装置 |
CN101472469A (zh) * | 2006-04-18 | 2009-07-01 | Iti苏格兰有限公司 | 用于监视家畜状况的方法及系统 |
WO2010108496A1 (en) * | 2009-03-25 | 2010-09-30 | Smarter Farming A/S | System and method for detecting behaviour of animals |
CN107027650A (zh) * | 2017-03-21 | 2017-08-11 | 中国农业大学 | 一种基于pso‑svm的种猪异常状态检测方法及装置 |
CN108509897A (zh) * | 2018-03-29 | 2018-09-07 | 同济大学 | 一种人体姿态识别方法和系统 |
CN108717523A (zh) * | 2018-04-26 | 2018-10-30 | 华南农业大学 | 基于机器视觉的母猪发情行为检测方法 |
Non-Patent Citations (2)
Title |
---|
侯云涛等: "奶牛行为特征识别方法的研究与实现――基于支持向量机", 《农机化研究》 * |
王俊等: "基于最优二叉决策树分类模型的奶牛运动行为识别", 《农业工程学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139548A (zh) * | 2020-12-31 | 2021-07-20 | 重庆邮电大学 | 基于运算符作用域和中心线的数学公式识别方法 |
CN113139548B (zh) * | 2020-12-31 | 2022-05-06 | 重庆邮电大学 | 基于运算符作用域和中心线的数学公式识别方法 |
CN112883999A (zh) * | 2021-01-13 | 2021-06-01 | 安徽大学 | 一种用于奶牛运动异常检测计步器系统及其方法 |
CN113672736A (zh) * | 2021-09-09 | 2021-11-19 | 上海德拓信息技术股份有限公司 | 一种文本多标签分类方法及系统 |
CN113672736B (zh) * | 2021-09-09 | 2023-08-22 | 上海德拓信息技术股份有限公司 | 一种文本多标签分类方法及系统 |
CN114916913A (zh) * | 2022-05-09 | 2022-08-19 | 东北大学 | 一种便携式睡眠呼吸状态实时监测系统及方法 |
CN115868428A (zh) * | 2022-12-15 | 2023-03-31 | 四川农业大学 | 一种基于六轴惯性传感器的智能牛项圈及监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110476879B (zh) | 2022-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110476879A (zh) | 基于多标签链式生态环境的奶牛行为分类判别方法及装置 | |
Smith et al. | Behavior classification of cows fitted with motion collars: Decomposing multi-class classification into a set of binary problems | |
CN107027650B (zh) | 一种基于pso-svm的种猪异常状态检测方法及装置 | |
CN111027487B (zh) | 基于多卷积核残差网络的行为识别系统、方法、介质及设备 | |
CN109446923A (zh) | 基于训练特征融合的深度监督卷积神经网络行为识别方法 | |
CN108171278B (zh) | 一种基于运动训练数据的运动模式识别方法和系统 | |
Anderson et al. | Characterising the spatial and temporal activities of free-ranging cows from GPS data | |
CN109344872A (zh) | 一种少数民族服装图像的识别方法 | |
CN110119421A (zh) | 一种基于Spark流式分类的电力窃电用户识别方法 | |
CN109101997A (zh) | 一种采样受限主动学习的溯源方法 | |
CN110163131A (zh) | 混合卷积神经网络与小生境灰狼优化的人体动作分类方法 | |
Lu et al. | An automatic splitting method for the adhesive piglets’ gray scale image based on the ellipse shape feature | |
CN114493680B (zh) | 一种基于流刺网调查的渔业资源统计方法及系统 | |
CN108038586B (zh) | 一种河蟹养殖的水环境评价方法及系统 | |
CN117475517A (zh) | 一种母猪活动水平、姿态及行为的监测方法 | |
CN113221776A (zh) | 一种基于人工智能对反刍动物一般行为识别的方法 | |
Gill et al. | Application of Machine Learning Techniques in Modern Agriculture: A Review | |
De Waele et al. | Time-series-based feature selection and clustering for equine activity recognition using accelerometers | |
Aulsebrook et al. | Quantifying mating behaviour using accelerometry and machine learning: challenges and opportunities | |
Wang et al. | Vision-based measuring method for individual cow feed intake using depth images and a Siamese network | |
Wang et al. | Development of a wireless measurement system for classifying cow behavior using accelerometer data and location data | |
CN114913456A (zh) | 一种基于自注意力网络的猪群出栏、投食估测系统 | |
CN106503745A (zh) | 基于社交图片sift特征的上下文信息预测方法 | |
AURASOPON | Dynamic Time Warping for classifying cattle behaviors and reducing acceleration data size | |
Gutierrez-Galan et al. | Semi-wildlife gait patterns classification using statistical methods and artificial neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |