CN103065129A - 对大熊猫识别的方法 - Google Patents

对大熊猫识别的方法 Download PDF

Info

Publication number
CN103065129A
CN103065129A CN2012105928718A CN201210592871A CN103065129A CN 103065129 A CN103065129 A CN 103065129A CN 2012105928718 A CN2012105928718 A CN 2012105928718A CN 201210592871 A CN201210592871 A CN 201210592871A CN 103065129 A CN103065129 A CN 103065129A
Authority
CN
China
Prior art keywords
vector
giant panda
panda
image
reference vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105928718A
Other languages
English (en)
Other versions
CN103065129B (zh
Inventor
刘忠轩
董博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Original Assignee
XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd filed Critical XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Priority to CN201210592871.8A priority Critical patent/CN103065129B/zh
Publication of CN103065129A publication Critical patent/CN103065129A/zh
Application granted granted Critical
Publication of CN103065129B publication Critical patent/CN103065129B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种对大熊猫识别的方法,包括:检测出视频图像中的大熊猫图像;将所述大熊猫图像分割为多个区域;确定每个所述区域的特征向量,将多个特征向量与预先采集的数据库中的多个基准向量进行匹配;将所述数据库中匹配成功的大熊猫作为识别结果。通过上述的步骤,可在数据库中确定出大熊猫,将确定出的大熊猫作为检测到的大熊猫。从而可在视频中掌握每只大熊猫的生活习性以及活动范围。

Description

对大熊猫识别的方法
技术领域
本发明涉及视频监控领域,具体而言,涉及一种对大熊猫识别的方法。
背景技术
对于稀有动物大熊猫,为研究其在生存环境下的生活习性,需要对大熊猫在生存环境下的各种行为进行视频监控。
由于目前的视频识别技术,只能识别出视频中的大熊猫,不能对大熊猫的个体进行确认,从而导致不能区分出每个大熊猫的移动轨迹,不能确定当前视频中的大熊猫的身份。
发明内容
本发明旨在提供一种对大熊猫识别的方法,以解决不能对大熊猫的个体进行确认的问题。
在本发明的实施例中,提供了一种对大熊猫识别的方法,其特征在于,包括:检测出视频图像中的大熊猫图像;将所述大熊猫图像分割为多个区域;确定每个所述区域的特征向量,将多个特征向量与预先采集的数据库中的多个基准向量进行匹配;将所述数据库中匹配成功的大熊猫作为识别结果。
通过上述的步骤,可在数据库中确定出大熊猫,将确定出的大熊猫作为检测到的大熊猫。从而可在视频中掌握每只大熊猫的生活习性以及活动范围。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了实施例的流程图;
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。参见图1,实施例的步骤包括:
S11:检测出视频图像中的大熊猫图像;
S12:将所述大熊猫图像分割为多个区域;
S13:确定每个所述区域的特征向量,将多个特征向量与预先采集的数据库中的多个基准向量进行匹配;
S14:将所述数据库中匹配成功的大熊猫作为识别结果。
通过上述的步骤,可在数据库中确定出大熊猫,将确定出的大熊猫作为检测到的大熊猫。从而可在视频中掌握每只大熊猫的生活习性以及活动范围。
优选地,实施例中,检测大熊猫的步骤包括:使用高斯背景建模法在视频中检测运动区域。在检测到的运动区域内,使用基于方向梯度直方图(HOG)和带有隐含参数的支持向量机(latent SVM)的物体检测方法,在不同尺度上对视频中的大熊猫进行检测。
优选地,实施例中,对图像进行分割时,可采用分水岭算法对图像进行分割。在图像中,选取灰度值为局部极小值的点作为分水岭算法的种子,对图像的灰度信息使用分水岭算法,将图片分割为不同的区域。
计算像素点的灰度的公式如下:Y=0.2999R+0.5870G+0.1140B
分水岭算法分割图像:分水岭算法是根据图像的灰度信息,对图像进行区域分割的一种方法。首先将图像中的所有像素点按照灰度值从小到大排序,将灰度值为局部极小值的点作为种子点。在每个种子点所在位置构建区域。之后按照灰度值从小到大的顺序逐个处理每一个像素点,将被处理的像素点加入与它相邻的区域之中。当所有像素点都被加入区域之后,就得到图像的分割信息。
采用分水岭算法具体实现方式如下:
M1M2,….MR表示图像g(x,y)的局部极小值点的坐标的集合。R为正整数。
C(Mi)表示与局部极小值Mi相联系的汇水盆内点的集合。
T[n]={(s,t)|g(s,t)<n}表示位于平面g(x,y)=n下方的点的集合。S,t为坐标点。
Cn(Mi)=C(Mi)∩T[n]表示第n阶段汇水盆地被水淹没部分的集合。Mi=M1~MR
Q表示T[n]中连续分量的集合。对每个连续分量q∈有三种可能
(a)q∩C[n-1]为空
(b)q∩C[n-1]包含C[n-1]中的一个连通分量。
(c)q∩C[n-1]包含C[n-1]多于一个连通分量。
遇到新的最小值时,符合条件(a),将q并入c[n-1],构成c[n];
Q位于某些局部最小值构成的汇水盆地时,符合条件(b),将q并入c[n-1]构成c[n],当遇到分离全部或部分汇水盆地时,符合条件(c),在q建立水坝。水坝为两个不同颜色的图像的边缘分界线。
终止条件为n=max+1。max像素点的颜色取值区间,例如:在灰度中,255为最高。
优选地,对分割后的图像消除过度分割:得到图像分割信息之后,计算每个区域的平均灰度,将相邻的区域的平均灰度进行比较,当差值不超过阈值5时,将两个区域合并为一个。
优选地,实施例中,确定特征向量的过程包括:
将检测到的图像转换为HSV格式,并提取颜色分布直方图。
从RGB颜色空间到HSV颜色空间的转换,计算公式如下:
h = 0 max = min 60 &times; g - b max - min max = r , g &GreaterEqual; b 60 &times; g - b max - min + 360 max = r , g < b 60 &times; b - r max - min + 120 max = g 60 &times; r - g max - min + 240 max = b
s = 0 max = 0 max - min max otherwise
v=max
其中max=max(r,g,b),min=min(r,g,b)。比如,对于RGB颜色值为(0.1,0.2,0.5)的像素点,在HSV颜色空间中的值为(225,0.8,0.5)。
计算颜色直方图:对于图像中的每一个像素,对其颜色进行统计。例如,v分量小于阈值1为黑色,v分量大于阈值2并且s分量小于阈值3为白色,v分量在阈值1和阈值2之间且v分量小于阈值3为灰色,其他颜色为彩色。
对于彩色,按照h分量从0到360均匀划分为6种颜色,即[0,60),[60,120),[120,180),[180,240),[240,300),[300,360)。
对每个像素的颜色进行统计,并计算出每种颜色在大熊猫图像中所占比例,依次存储到数组x中,作为图像的特征向量使用。
例如,一个图像区域中有10个像素点。其中黑色点和白色点各有3个,另外4个点属于颜色[60,120),那么这个区域对应的特征向量为(0.3,0.3,0,0,0.4,0,0,0,0)。
优选地,实施例中,所述数据库中的基准向量由以下步骤确定:
预先采集每个大熊猫的多幅视频图像;
通过所述多幅视频图像,确定出该大熊猫的多个区域、以及与每个区域对应的一组特征向量,作为该区域对应的基准向量。
该过程可通过聚类的方法实现,例如:使用K-means(K均值)等算法。
使用K-means训练时,将检测过程中得到的每一个大熊猫区域的颜色直方图作为特征向量进行聚类,得到特征向量的聚类中心,以及每个聚类中心包含的区域样本。
K均值算法需要输入一个参数k,以及若干个特征向量。通过K均值算法计算可以将这些特征向量分为k类,以及每一类中所包含的样本。这样,就可以将输入的样本分为k类,每一类代表一只大熊猫。
将聚类中心得到每一类的各个区域对应的特征向量存储到数据库中。
上述的匹配过程包括:
运算各个所述区域对应的各个特征向量分别与所述数据库中每个大熊猫的各个区域的基准向量的距离;
对每个特征向量得到的多个距离排序,确定出两个最小的距离d1和d2;其中,d1<d2;
如果所述1.5d1<d2,则确定该特征向量与用于运算所述d1的基准向量相匹配。
确定与每个所述特征向量距离最近的基准向量的所在区域对应的大熊猫,并统计对应每只大熊猫的各个区域的基准向量被匹配的次数的总和;
找出被确定的次数总和唯一、且最高的值的大熊猫,作为所述匹配成功的大熊猫。
其中,用于运算出最小的欧式距离的基准向量作为距离最高的基准向量。欧式距离的公式如下:
d = &Sigma; i = 1 N ( x i - X i ) 2
其中d为特征向量到聚类中心的基准向量之间的距离,x为图像的特征向量,X为训练得到的聚类中心对应的特征向量,即基准向量,xi和Xi分别表示图像的基准向量和聚类中心的基准向量的第i位,N为特征向量或基准向量的维数。
假设大熊猫被划分为若干区域,其中第i个区域被识别为区块pi,来自于数据库中第si只大熊猫。对si进行直方图统计,并将整只大熊猫归类为直方图中最大的分量所对应的模型。
例如:如果一共有3个大熊猫样本,每个样本为一只大熊猫所包含的多个区域所分别对应的多个基准向量。
检测到的大熊猫被分为5个区域,共5个特征向量;数据库中包括5只大熊猫样本,每个样本包括6个区域,则共有30个区域,每个区域对应一个基准向量。计算检测到的每个特征向量与30个基准向量的距离,得到5组数据。
每组数据中包括30个距离,找到最小的两个距离,d1和d2,且满足1.5d1<d2,则认为匹配到基准向量。
统计每只大熊猫的各个基准向量被匹配的次数。例如:检测某个区域的特征向量为(1,0,0,0,0,0,0,0,0),与之距离最近的两个基准向量分别为(0.8,0,0,0,0,0,0,0,0.2)和(0.5,0.5,0,0,0,0,0,0,0)。则可以计算得到d1≈0.283,d2≈0.707,且1.5d1<d2。确定该特征向量与用于运算所述d1的基准向量相匹配。用于运算所述d1的基准向量为样本1的大熊猫,则样本1的大熊猫为识别成功的大熊猫。
其余的各个区域被分别识别为以下各个样本中的区域;如:样本1,样本1,样本1,样本2,样本3,则统计直方图为(3,1,1),样本1为最高且唯一的样本,被检测到的大熊猫最终被再识别为样本1所对应的熊猫。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种对大熊猫识别的方法,其特征在于,包括:
检测出视频图像中的大熊猫图像;
将所述大熊猫图像分割为多个区域;
确定每个所述区域的特征向量,将多个特征向量与预先采集的数据库中的多个基准向量进行匹配;
将所述数据库中匹配成功的大熊猫作为识别结果。
2.根据权利要求1所述的方法,其特征在于,所述分割过程包括:
选择图像中局部最小值作为种子,采用分水岭算法分割为多个区域。
3.根据权利要求2所述的方法,其特征在于,还包括:
比较相邻区域的颜色灰度,当差值小于阈值时,将所述相邻区域合并。
4.根据权利要求2所述的方法,其特征在于,所述确定特征向量的过程包括:
将所述区域的图像转换为HSV格式;
统计所述HSV格式的区域内的各种颜色的像素数量;
根据所述各种颜色的像素数量确定与该区域对应的一组特征向量。
5.根据权利要求4所述的方法,其特征在于,所述数据库中的基准向量由以下步骤确定:
预先采集每个大熊猫的多幅视频图像;
通过所述多幅视频图像,确定出该大熊猫的多个区域、以及与每个区域对应的一组特征向量,作为该区域对应的基准向量;
所述匹配过程包括:
运算各个所述区域对应的各个特征向量分别与所述数据库中每个大熊猫的各个区域的基准向量的距离;
对每个特征向量得到的多个距离排序,确定出两个最小的距离d1和d2;其中,d1<d2;
如果所述1.5d1<d2,则确定该特征向量与用于运算所述d1的基准向量相匹配。
6.根据权利要求5所述的方法,其特征在于,
确定与每个所述特征向量距离最近的基准向量的所在区域对应的大熊猫,并统计对应每只大熊猫的各个区域的基准向量被匹配的次数的总和;
找出被确定的次数总和唯一、且最高的值的大熊猫,作为所述匹配成功的大熊猫。
7.根据权利要求5所述的方法,其特征在于,还包括:采用以下欧式距离公式运算所述距离;
d = &Sigma; i = 1 N ( x i - X i ) 2 ;
其中d为特征向量与基准向量的距离,x为图像的特征向量,X为训练得到的基准向量,i表示特征向量或基准向量的位数,N为特征向量或基准向量的维数。
8.根据权利要求6所述的方法,其特征在于,还包括:
如果没有匹配成功,则将所述检测出的大熊猫的各个区域的特征向量作为新的基准向量加入到所述数据库。
9.根据权利要求1所述的方法,其特征在于,还包括:
在当前帧图像和之前的视频图像中,采用最小的带颜色框体框住所述检测到的该大熊猫。
CN201210592871.8A 2012-12-30 2012-12-30 对大熊猫识别的方法 Expired - Fee Related CN103065129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210592871.8A CN103065129B (zh) 2012-12-30 2012-12-30 对大熊猫识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210592871.8A CN103065129B (zh) 2012-12-30 2012-12-30 对大熊猫识别的方法

Publications (2)

Publication Number Publication Date
CN103065129A true CN103065129A (zh) 2013-04-24
CN103065129B CN103065129B (zh) 2016-06-29

Family

ID=48107752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210592871.8A Expired - Fee Related CN103065129B (zh) 2012-12-30 2012-12-30 对大熊猫识别的方法

Country Status (1)

Country Link
CN (1) CN103065129B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766865A (zh) * 2019-01-19 2019-05-17 郑州天迈科技股份有限公司 一种分水岭、多区域局域融合和特征跟踪的客流统计方法
CN114500934A (zh) * 2021-12-24 2022-05-13 兰州理工大学 一种用于实现野外监控图像自动传输的监控系统
CN114666635A (zh) * 2020-12-23 2022-06-24 宏正自动科技股份有限公司 多视频图像设定方法及多视频图像处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100435562C (zh) * 2006-12-28 2008-11-19 上海交通大学 基于多区域分割及模糊逻辑的自动曝光方法
CN102436662A (zh) * 2011-11-29 2012-05-02 南京信息工程大学 一种非重叠视域多摄像机网络中的人体目标跟踪方法
CN102722735A (zh) * 2012-05-24 2012-10-10 西南交通大学 一种融合全局和局部特征的内镜图像病变检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100435562C (zh) * 2006-12-28 2008-11-19 上海交通大学 基于多区域分割及模糊逻辑的自动曝光方法
CN102436662A (zh) * 2011-11-29 2012-05-02 南京信息工程大学 一种非重叠视域多摄像机网络中的人体目标跟踪方法
CN102722735A (zh) * 2012-05-24 2012-10-10 西南交通大学 一种融合全局和局部特征的内镜图像病变检测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766865A (zh) * 2019-01-19 2019-05-17 郑州天迈科技股份有限公司 一种分水岭、多区域局域融合和特征跟踪的客流统计方法
CN109766865B (zh) * 2019-01-19 2021-02-26 郑州天迈科技股份有限公司 一种分水岭、多区域局域融合和特征跟踪的客流统计方法
CN114666635A (zh) * 2020-12-23 2022-06-24 宏正自动科技股份有限公司 多视频图像设定方法及多视频图像处理方法
CN114666635B (zh) * 2020-12-23 2024-01-30 宏正自动科技股份有限公司 多视频图像设定方法及多视频图像处理方法
CN114500934A (zh) * 2021-12-24 2022-05-13 兰州理工大学 一种用于实现野外监控图像自动传输的监控系统
CN114500934B (zh) * 2021-12-24 2023-08-11 兰州理工大学 一种用于实现野外监控图像自动传输的监控系统

Also Published As

Publication number Publication date
CN103065129B (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
US20230289979A1 (en) A method for video moving object detection based on relative statistical characteristics of image pixels
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN103065126A (zh) 不同场景对人体图像再识别的方法
CN105184818B (zh) 一种视频监控异常行为检测方法及其检测系统
CN103049749B (zh) 在栅格遮挡下的人体再识别方法
US20140270489A1 (en) Learned mid-level representation for contour and object detection
CN110490194A (zh) 一种自适应权值的多特征分块融合交通标志的识别方法
CN104281853A (zh) 一种基于3d卷积神经网络的行为识别方法
Kontschieder et al. Context-sensitive decision forests for object detection
CN101477633A (zh) 自动估计图像和视频的视觉显著度的方法
CN102542244A (zh) 人脸检测方法与系统及计算机程序产品
CN103093274A (zh) 基于视频的行人计数的方法
CN102184404B (zh) 掌纹图像中手掌区域的获取方法及装置
CN103092963A (zh) 一种视频摘要生成方法和装置
CN103544504A (zh) 一种基于多尺度图匹配核的场景字符识别方法
CN103310227A (zh) 基于神经网络的自动窗宽窗位提取方法
CN105825168A (zh) 一种基于s-tld的川金丝猴面部检测和追踪算法
CN110751191A (zh) 一种图像的分类方法及系统
CN108664969A (zh) 基于条件随机场的路标识别方法
CN102609715B (zh) 一种结合多个兴趣点检测子的物体类识别方法
Saidane et al. Robust binarization for video text recognition
CN107657276B (zh) 一种基于寻找语义类簇的弱监督语义分割方法
CN103065129A (zh) 对大熊猫识别的方法
CN105354570A (zh) 一种车牌左右边界精确定位的方法及系统
Watson et al. Person re-identification combining deep features and attribute detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160629

Termination date: 20191230