CN112184734B - 一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 - Google Patents
一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 Download PDFInfo
- Publication number
- CN112184734B CN112184734B CN202011068610.7A CN202011068610A CN112184734B CN 112184734 B CN112184734 B CN 112184734B CN 202011068610 A CN202011068610 A CN 202011068610A CN 112184734 B CN112184734 B CN 112184734B
- Authority
- CN
- China
- Prior art keywords
- animal
- gesture recognition
- image
- local
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001465754 Metazoa Species 0.000 title claims abstract description 82
- 239000013307 optical fiber Substances 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 38
- 230000007246 mechanism Effects 0.000 claims abstract description 14
- 230000009467 reduction Effects 0.000 claims abstract description 4
- 239000002245 particle Substances 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 23
- 230000003542 behavioural effect Effects 0.000 claims description 20
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 239000000835 fiber Substances 0.000 claims 1
- 230000006399 behavior Effects 0.000 abstract description 14
- 238000005286 illumination Methods 0.000 abstract description 4
- 238000012795 verification Methods 0.000 abstract description 2
- 238000002610 neuroimaging Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/66—Analysis of geometric attributes of image moments or centre of gravity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,该系统包含注意力机制模块M1、局部姿态识别模型训练模块M2,局部姿态识别预测模块M3、全局姿态还原模块M4,实现了对佩戴有光纤设备的动物行为学红外低分辨率视频的关键节点高精度识别,大幅度减少了人工校验的时长解决了动物蜷缩、旋转以及拍摄光照波动等问题的影响,可广泛应用于脑成像领域。
Description
本发明涉及图像处理领域,特别涉及一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统。
背景技术
神经元的行为与动物活动息息相关。为了探索特定行为下由神经元构成的复杂网络是如何连接和交互的,常常需要对动物行为进行定量分析。
在当前的大数据高频率采集条件下,手工处理的效率既耗时又容易出错,但由于自然动物行为的动态性、复杂性以及周围因素干扰,使得自动识别存在极大的挑战。佩戴有微型显微镜的动物,在激光信号传输过程中头部带有光纤,由于光纤的遮挡和晃动会对行为分析造成较大的挑战。同时,在长时间实验记录过程中,图像光照等环境条件常常会发生不可忽略的波动,对特征的稳定性造成干扰。除此之外,为了不干扰穿戴式荧光显微镜激发成像,在记录的行为时常常使用红外摄像机记录,而红外图像往往对比度低、分辨率差、纹理信息模糊,显著增加了实验动物行为的自动识别难度。
前人尝试使用物理标记的方法会干扰动物的自然行为;也有人尝试利用深度相机在自然空间中对动物行为进行定位,但这些技术的成像条件和对场景变化敏感;传统的姿态识别方法依赖于特征的提取和匹配,对特征稳定性要求较高,因此不适用于复杂的运动动物行为识别。
因此亟待一种识别准确、适用低分辨率、变化光照、动物自然多变姿态的系统,定量精确地分析动物的姿态和轨迹,为神经精神性疾病药物发现、脑科学研究等提供良好的技术支持。
发明内容
为了解决上述技术问题,本发明提供了一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,实现了对佩戴有光纤设备的动物行为学红外低分辨率视频的关键节点高精度识别。
为达到上述发明目的,本发明通过以下技术方案来实现:系统包括注意力机制模块M1、局部姿态识别模型训练模块M2、局部姿态识别预测模块M3和全局姿态还原模块M4。
为了减少光纤的晃动和遮挡、周围相似物体的干扰,注意力机制模块M1负责在动物行为学图像序列中进行质心识别和目标动物区域裁剪。通过粒子滤波方法逐帧检测动物的质心位置,得到动物质心位置坐标序列{(xj,yj),j=1....t},以动物质心位置坐标(xj,yj)为矩形中心,根据图像坐标范围为/>获取长为s、宽为z的矩形裁剪图像/>将每帧对应的裁剪图像/>按照采集时间排列,得到包含目标动物的裁剪图像序列/>其中t为总采样帧数;
注意力机制模块M1中的目标检测采用粒子滤波算法,其步骤为:
第一步,在初始时刻假设目标动物的颜色分布为{qu}u=1,2,...,B,统计空间信息,计算落入每个区间的像素位置的均值向量和协方差矩阵;
第二步:根据假设目标动物的颜色分布建立初始状态样本集其中N表示设置跟踪粒子数;
第三步:计算粒子状态转移,在时刻k(k>0),根据重要性采样原理和前一时刻的粒子位置/>预测此刻的粒子/>的状态;
第四步:粒子权值计算,根据通过当前时刻的观测值Zt来计算每个粒子的权重,之后进行归一化处理:/>计算k时刻目标状态的最小均方误差估计:/>
第五步:重采样,根据样本的权值从样本集/>重新抽取N个样本,对粒子集进行自适应聚类,根据目标函数/>找到距所有粒子最近的中心点/>聚类中心/>即认为是动物的质心位置{(xj,yj),j=1,2,...,t};
为了增加训练样本的多样性、提高训练模型的鲁棒性、提高局部姿态识别的精度,局部姿态识别模型训练模块M2负责由目标动物裁剪图像序列分别生成训练图像序列/>和预测图像序列/>并根据图像序列 训练得到局部姿态识别模型T;
局部姿态识别模型训练模块M2中所述的群等变ResNet50卷积神经网络的训练机制为:训练前预设局部姿态识别模型的关键点类别数为ω,将训练图像序列及对应人工标注的关键点坐标序列/>作为训练样本,经过群等变ResNet-50卷积网络训练得到局部姿态识别模型T。
群等变ResNet-50卷积的网络结构设置为群等变卷积模块,卷积层,池化层,激活层,反向优化模块和损失函数。其中,群等变卷积模块使用对称性群将图像进行数据扩增,增加网络的旋转不变性;卷积层选取卷积核,提取图像的深层特征;池化层选取最大池化层,压缩数据和参数的存储空间,防止过拟合;激活层选取的激活函数为ReLu;反向优化模块选取Adam梯度下降法。损失函数为min(E)=min(EMSE+Ehuber),其中
群等变ResNet-50卷积的网络优化目标为最小化损失函数,通过不断减小损失函数得到针对局部姿态识别的模型T,其中表示输入网络中人工标注的关键点坐标,/>表示卷积神经网络预测的关键点坐标,δ为脉冲函数。
为了自动识别得到未标注的动物姿态关键节点坐标,局部姿态识别模块M3负责利用局部姿态模型T对预测图像序列进行动物关键节点局部置信度预测,得到关键节点局部置信度图像序列/>及局部预测关键点坐标序列/>
群等变ResNet-50卷积神经网络的具体预测步骤包括:
第一步、将NP张预测图像依次输入局部姿态识别模型T;
第二步、获取对应每张预测图像及每个关键节点的局部置信度图像序列 其中,/>在像素坐标(m,n)处的像素值概率值,其代表:在第j张预测图像中,像素坐标为(m,n)的像素点属于ω类关键节点的概率值。
第三步、关键节点的局部置信度图像序列中,逐帧获取最大像素值对应的像素坐标,得到局部预测关键点坐标序列/>
本发明具有如下有益效果:
1、本发明通过粗细定位结合的姿态检测策略,实现了对佩戴有光纤设备的动物行为学红外低分辨率视频的关键节点高精度识别,大幅度减少了人工校验的时长。
2、本发明通过对深度特征的提取,解决了动物蜷缩、旋转以及拍摄光照波动等问题的影响,使得分析自由运动下的行为成为可能,行为学分析的适用范围更加广泛。
附图说明
图1、是本发明基于红外图像的高精度佩戴光纤的长时间姿态识别;
图2、是具体实施例中系统采集动物行为学原始图像示意图;
图3、是具体实施例中注意力机制模块M1的处理方法和处理结果图;
图4、是具体实施例中局部姿态识别预测模块M3和全部姿态还原模块M4的处理方法和处理结果图;
图5、是局部姿态识别模型训练模块M2的网络结构示意图。
具体实施方式
下面,将根据参考附图详细地描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
本发明包括注意力机制模块M1、局部姿态识别模型训练模块M2、局部姿态识别预测模块M3和全局姿态还原模块M4。
图1所示为本发明一示例性实施例提供的一种基于红外图像和穿戴式光纤的动物长时间姿态识别系流程示意图。如图1所示,本发明实施例提供的基于红外图像和佩戴光纤的长时间姿态识别系统包括如下步骤:
步骤1,动物行为学原始视频的采集及预处理
步骤1-1,在自由运动的动物场景下,采集动物行为学原始视频。示例性地,在佩戴有光纤的动物自由运动下,采用1080p的红外摄像头进行视频采集,图像采集时间12h,采集频率为30Hz,红外采集波长为850nm,图像大小为1280*720pixel。其中采集的视频图像如图2中所示。
步骤1-2,对采集到的动物行为学原始视频进行预处理
示例性地,将动物行为学原始视频中的第一帧图像作为原始模板图像,手动选定感兴趣区域轮廓,并将原始模板图像中感兴趣区域内的像素值置为1,其余部分像素值置为0,进而得到模板图像;将模板图像与动物行为学原始视频中的每帧图像进行点乘,从而使得每帧图像中感兴趣区域内的像素值保持不变,其余区域的像素值置为0,进而得到t张动物行为学图像,其中一张动物行为学图像如图2所示。
需要说明的是,本发明实施例对步骤1中提及的模板图像提取的具体实现方式不进行限定,只要能够提取目标感兴趣区域即可。
步骤2,将t张动物行为学视频输入注意力机制模块M1,进行质心识别和目标动物区域裁剪
步骤2-1,对t张动物行为学图像进行逐帧质心识别,得到t个动物质心位置坐标
示例性地,本发明基于颜色直方图的粒子滤波目标跟踪算法。第一步,粒子初始化,在初始时刻(k=0)计算目标动物的颜色分布{qu}u=1,2,...,B,统计空间信息,计算落入每个区间的像素位置的均值向量和协方差矩阵,其中B是颜色量化等级;第二步、并根据先验分布p(X0)建立初始状态样本集其中N表示设置跟踪粒子数,这里N=5000;第三步、计算粒子状态转移,在时刻k(k>0),根据重要性采样原理/>和粒子/>预测粒子/>的状态;第四步、计算粒子权值,根据/>通过当前时刻的观测值Zt来计算每个粒子的权重,之后进行归一化处理:/>计算k时刻目标状态的最小均方误差估计:/>第五步、重采样,根据样本的权值/>从样本集/>重新抽取N个样本,对粒子集进行自适应聚类,目标函数为/>找到距所有粒子最近的中心点/>聚类中心/>即认为是动物的质心位置{(xj,yj),j=1,2,...,t}。
步骤2-2,根据t个动物质心位置坐标序列进行目标动物区域裁剪,得到t张目标动物裁剪图像。
示例性地,根据质心位置(xj,yj),将第j张动物行为学图像中128×128大小的矩形区域裁剪出来,形成第j张动物行为学图像对应的目标动物裁剪图像,裁剪方法如下:将第j张动物行为学图像中像素坐标范围[xj-64:xj+64,yj-64:yj+64]内的像素提取出来,根据t个动物质心位置坐标,得到每一帧动物行为学图像对应的目标动物裁剪图像,即t张目标动物裁剪图像,如图3中(a)所示。
步骤3,将t张目标动物裁剪图像输入局部姿态识别模型训练模块M2,生成NT张训练图像、NP张预测图像及局部姿态识别模型T。
步骤3-1,由t张目标动物裁剪图像分别生成NT张训练图像和NP张预测图像,并对NT张训练图像进行关键点坐标标注,以得到NT×ω个关键点坐标。
示例性地,预设每帧目标动物裁剪图像中有2类关键点,分别对应小鼠头部和小鼠尾部。
请生物学领域的行为学专家对从图像序列SR中随机抽取的5000张目标动物裁剪图像逐帧人工标注小鼠头尾关键点坐标,即,每张训练图像对应一个头部关键点坐标和一个尾部关键点坐标。
步骤3-2,将NT张训练图像及对应的NT×ω个关键点坐标作为局部姿态识别模型T的训练样本,训练得到局部姿态识别模型T。
示例性地,局部姿态识别模型T选取群卷积Resnet50神经网络,神经网络设置为4个残差块,其中一个残差块包括两个分支,其中一支直接将输入连接到输出端,另一支包括3×3卷积层,群等变卷积,激活层,1×1卷积层,把两支输出结果相加作下采样,之后接一个激活层,其他三个残差块类似,网络的结果如图3所示。
由于ResNet50卷积神经网络对旋转不具有等变性,而传统的数据扩增的方法需要很大的训练图像,实现困难且浪费资源。局部姿态识别模块T引入群卷积Resnet50网络,其中群卷积G-CNN部分是为了对数据进行扩增,减少计算和存储空间。群卷积作为可扩展部分,加入到3×3卷积层中。群卷积部分将图像和卷积网络的对称性引入到群论的框架中,通过Z2-P4、P4-P4、P4-Z2三个卷积网络部分,使得输出的特征图具有等变性,其中Z2表示特征空间,P表示空间群,P4群是由绕方形网格的中心以90度角进行旋转和平移变换组成的群。Z2-P4卷积是将卷积核旋转4次,分别与输入图像做卷积;P4-P4卷积对Z2-P4卷积输出的特征图进行操作,分别将四个卷积核绕着顺时针方向旋转90°。同时卷积核也旋转90°,之后进行卷积操作;P4-Z2卷积将P4-P4输出的4个特征图相加得到最后的特征图。这样会使得同一个卷积核的四种状态对于不同的特征图应该能够得到一个P4的约束,这样网络学到一个旋转等变的性质,而不需要增加训练图像。
应当理解,群卷积ResNet50神经网络能够自动学习高层的纹理轮廓等抽象信息,避免了特征功能的固定性,且自动抽象的特征具有尺度不变性,因此,群卷积Resnet50神经网络提取的关键节点特征有更高的鲁棒性。
优选地,网络损失函数为均方MSE误差和huber损失函数求和:E=EMSE+Ehuber。
其中
表示输入网络中人工标注的关键点坐标,/>表示卷积神经网络预测的关键点坐标,δ为脉冲函数,即/>均方误差主要使得训练预测坐标和标注坐标尽可能相近,而huber函数可以处理异常数据。使用反向传播算法不断迭代使得两种损失函数取最小值得到训练好的局部姿态识别模型T,学习率为0.05,每个批次的大小为8,迭代步长为40000次;
需要说明的是,本发明实施例对步骤3-2中提及的局部姿态识别模型结构、训练方式、损失函数设计不进行限定,只要能够进行关键点坐标预测即可。
步骤4,将局部姿态识别模型T和NP张预测图像输入局部姿态识别模块M3,利用局部姿态识别模型T对NP张预测图像进行动物关键点局部置信度预测,得到NP×ω个局部预测关键点坐标
具体而言,将单帧预测图像依次输入局部姿态识别模型T,识别小鼠的头部、尾部关键节点,输出得到对应单帧图像的2张关键点局部置信度图像,第一张图像中每个像素坐标处的像素值表示此像素坐标属于头部关键点的概率,应当理解的是,此图像中像素值最大的像素点对应的像素坐标为头部的局部预测关键点坐标;第二张图像中每个像素坐标处的像素值表示此像素坐标属于尾部关键点的概率,应当理解的是,此图像中像素值最大的像素点对应的像素坐标为尾部的局部预测关键点坐标,对应单帧头尾局部预测关键点位置如图4(a)所示。
应当理解,将NP张预测图像依次输入局部姿态识别模型T后,得到NP个头部局部预测关键点坐标和NP个尾部局部预测关键点坐标即NP×2个头尾局部预测关键点坐标。
步骤5,将NP×ω个局部关键点预测坐标和NP个动物质心位置坐标输入全局姿态还原模块M4,根据NP×ω个局部关键点预测坐标和NP个动物质心位置坐标的像素坐标匹配关系,得到NP×ω个全局关键点坐标。
示例性地,根据质心坐标{(xj,yj),j=1....t}、局部预测关键点坐标 和行为学图像中的矩形区域裁剪大小为128×128,可以计算得出全局关键点坐标序列/>计算得出全局关键点坐标序列对应单帧头尾全局关键点位置如图4(b)所示。
本实施例获取了基于红外图像的连续12h记录佩戴有光纤实验动物的自由运动活动视频记录。根据本发明所述的系统进行了预处理感兴趣区域的提取、质心识别、图像裁剪、局部姿态识别以及全局姿态还原模块,具体流程图如图1所示,处理结果如图2至图4所示。图2是动物行为学原始图像示意图,图3是系统质心识别和图像裁剪的输出结果,图4是局部姿态识别和全局姿态还原的输出结果,图5是群卷积Resnet50的网络结构。
Claims (4)
1.一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,其特征在于:该系统包含注意力机制模块M1、局部姿态识别模型训练模块M2,局部姿态识别预测模块M3、全局姿态还原模块M4,其中:
注意力机制模块M1功能为将采集到的动物行为学图像序列 中,通过目标检测方法逐帧检测动物的质心位置,得到动物质心位置坐标序列{(xj,yj),j=1....t},以动物质心位置坐标(xj,yj)为矩形中心,根据图像坐标范围为/>获取长为s、宽为z的矩形裁剪图像/>将每帧对应的裁剪图像/>按照采集时间排列,得到包含目标动物的裁剪图像序列/>其中t为总采样帧数;
局部姿态识别模型训练模块M2功能为由目标动物裁剪图像序列 分别生成训练图像序列/>和预测图像序列/>根据图像序列/>输入群等变RseNet-50卷积神经网络训练得到局部姿态识别模型T;
局部姿态识别预测模块M3利用局部姿态识别模型T和群等变RseNet-50卷积神经网络预测机制,对图像序列进行动物关键节点局部置信度预测,得到关键节点局部置信度图像序列/> 及局部预测关键点坐标序列
全局姿态还原模块M4功能为利用局部预测关键点坐标序列 与动物质心位置坐标序列{(xj,yj),j=1....NP}的像素坐标匹配关系,得到全局关键点坐标序列/>
2.如权利要求1所述的一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,其特征在于所述的注意力机制模块M1中的目标检测采用粒子滤波算法,其步骤为:
第一步,在初始时刻假设目标动物的颜色分布为{qu}u=1,2,...,B,统计空间信息,计算落入每个区间的像素位置的均值向量和协方差矩阵;
第二步:根据假设目标动物的颜色分布建立初始状态样本集其中N表示设置跟踪粒子数;
第三步:计算粒子状态转移,在时刻k(k>0),根据重要性采样原理和前一时刻的粒子位置/>预测此刻的粒子/>的状态;
第四步:粒子权值计算,根据通过当前时刻的观测值Zt来计算每个粒子的权重,之后进行归一化处理:/>计算k时刻目标状态的最小均方误差估计:/>
第五步:重采样,根据样本的权值从样本集/>重新抽取N个样本,对粒子集进行自适应聚类,根据目标函数/>找到距所有粒子最近的中心点/>聚类中心/>即认为是动物的质心位置{(xj,yj),j=1,2,...,t}。
3.如权利要求1所述的一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,其特征在于局部姿态识别模型训练模块M2中所述的群等变ResNet50卷积神经网络的训练机制为:训练前预设局部姿态识别模型的关键点类别数为ω,将训练图像序列及对应人工标注的关键点坐标序列/>作为训练样本,经过群等变ResNet-50卷积网络训练得到局部姿态识别模型T;
群等变ResNet-50卷积的网络结构设置为:群等变卷积模块、卷积层、池化层、激活层、反向优化模块和损失函数,其中,群等变卷积模块使用对称性群将图像进行数据扩增,增加网络的旋转不变性;卷积层选取卷积核,提取图像的深层特征;池化层选取最大池化层,压缩数据和参数的存储空间,防止过拟合;激活层选取的激活函数为ReLu;反向优化模块选取Adam梯度下降法;损失函数为min(E)=min(EMSE+Ehuber),其中:
群等变ResNet-50卷积的网络优化目标为最小化损失函数,通过不断减小损失函数得到针对局部姿态识别的模型T,其中表示输入网络中人工标注的关键点坐标,/>表示卷积神经网络预测的关键点坐标,δ为脉冲函数。
4.如权利要求1所述的一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统,其特征在于局部姿态识别模型训练模块M3中所述的群等变ResNet-50卷积神经网络的具体预测步骤包括:
第一步,将NP张预测图像依次输入群等变ResNet-50卷积神经网络的预测机制中,网络参数使用局部姿态识别模型T;
第二步,获取对应每张预测图像及每个关键节点的局部置信度图像序列其中,/>在像素坐标(m,n)处的像素值概率值,其代表:在第j张预测图像中,像素坐标为(m,n)的像素点属于ω类关键节点的概率值;
第三步,在所述的关键节点的局部置信度图像序列 中,逐帧获取最大像素值对应的像素坐标,得到局部预测关键点坐标序列/>
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011068610.7A CN112184734B (zh) | 2020-09-30 | 2020-09-30 | 一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011068610.7A CN112184734B (zh) | 2020-09-30 | 2020-09-30 | 一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112184734A CN112184734A (zh) | 2021-01-05 |
CN112184734B true CN112184734B (zh) | 2024-06-07 |
Family
ID=73947777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011068610.7A Active CN112184734B (zh) | 2020-09-30 | 2020-09-30 | 一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112184734B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949400B (zh) * | 2021-01-26 | 2022-07-08 | 四川大学 | 一种基于深度学习的动物智能实验系统与方法 |
CN113095446B (zh) * | 2021-06-09 | 2021-09-03 | 中南大学 | 异常行为样本生成方法及系统 |
CN114528976B (zh) * | 2022-01-24 | 2023-01-03 | 北京智源人工智能研究院 | 一种等变网络训练方法、装置、电子设备及存储介质 |
CN116718791B (zh) * | 2023-04-13 | 2024-04-26 | 东莞市杜氏诚发精密弹簧有限公司 | 扭矩弹簧的转速检测方法、设备、系统及存储介质 |
CN117292330B (zh) * | 2023-11-27 | 2024-02-02 | 山东海博科技信息系统股份有限公司 | 一种适用于时序数据运维的智能监测系统 |
CN118096836B (zh) * | 2024-04-26 | 2024-06-21 | 南昌工程学院 | 基于旋转等变网络与三重注意力机制目标跟踪方法与系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844797A (zh) * | 2017-09-27 | 2018-03-27 | 华南农业大学 | 一种基于深度图像的哺乳母猪姿态自动识别的方法 |
CN110363140A (zh) * | 2019-07-15 | 2019-10-22 | 成都理工大学 | 一种基于红外图像的人体动作实时识别方法 |
CN110782487A (zh) * | 2019-09-05 | 2020-02-11 | 杭州视鑫科技有限公司 | 一种基于改进的粒子滤波算法的目标跟踪方法 |
CN111160085A (zh) * | 2019-11-19 | 2020-05-15 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
CN111428586A (zh) * | 2020-03-09 | 2020-07-17 | 同济大学 | 基于特征融合与样本增强的三维人体姿态估计方法 |
-
2020
- 2020-09-30 CN CN202011068610.7A patent/CN112184734B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844797A (zh) * | 2017-09-27 | 2018-03-27 | 华南农业大学 | 一种基于深度图像的哺乳母猪姿态自动识别的方法 |
CN110363140A (zh) * | 2019-07-15 | 2019-10-22 | 成都理工大学 | 一种基于红外图像的人体动作实时识别方法 |
CN110782487A (zh) * | 2019-09-05 | 2020-02-11 | 杭州视鑫科技有限公司 | 一种基于改进的粒子滤波算法的目标跟踪方法 |
CN111160085A (zh) * | 2019-11-19 | 2020-05-15 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
CN111428586A (zh) * | 2020-03-09 | 2020-07-17 | 同济大学 | 基于特征融合与样本增强的三维人体姿态估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112184734A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112184734B (zh) | 一种基于红外图像和穿戴式光纤的动物长时间姿态识别系统 | |
Liu et al. | Plant diseases and pests detection based on deep learning: a review | |
Yang et al. | Visual perception enabled industry intelligence: state of the art, challenges and prospects | |
Shen et al. | Individual identification of dairy cows based on convolutional neural networks | |
CN105740894B (zh) | 一种高光谱遥感图像的语义标注方法 | |
CN111814661B (zh) | 基于残差-循环神经网络的人体行为识别方法 | |
CN110728694B (zh) | 一种基于持续学习的长时视觉目标跟踪方法 | |
CN107767416B (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
CN110490915B (zh) | 一种基于卷积受限玻尔兹曼机的点云配准方法 | |
CN112001278A (zh) | 一种基于结构化知识蒸馏的人群计数模型及其方法 | |
CN110533100A (zh) | 一种基于机器学习进行cme检测和跟踪的方法 | |
CN116051996A (zh) | 一种基于多模态信息的二阶段农作物生长预测方法 | |
Ouchra et al. | Object detection approaches in images: a survey | |
Udawant et al. | Cotton leaf disease detection using instance segmentation | |
CN115908924A (zh) | 一种基于多分类器的小样本高光谱图像语义分割方法及系统 | |
CN115439884A (zh) | 一种基于双分支自注意力网络的行人属性识别方法 | |
Joseph | Accurate segmentation for low resolution satellite images by discriminative generative adversarial network for identifying agriculture fields | |
Yu et al. | An image-based automatic recognition method for the flowering stage of maize | |
Wu et al. | Nighttime cattle detection based on YOLOv4 | |
CN114663916A (zh) | 一种基于深度抽象特征的热红外人体目标识别方法 | |
CN114743257A (zh) | 图像目标行为的检测识别方法 | |
CN113269159A (zh) | 一种融合肌电信号与视觉图像的手势识别方法 | |
Maslii et al. | ANALYSIS OF METHODS OF PERSON RE-IDENTIFICATION IN MULTI CAMERA ENVIRONMENT | |
Stanski et al. | Flower detection using object analysis: new ways to quantify plant phenology in a warming tundra biome | |
Vijayalakshmi et al. | Early prediction of plant disease using AI enabled IOT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |