CN103065129A

CN103065129A - 对大熊猫识别的方法

Info

Publication number: CN103065129A
Application number: CN2012105928718A
Authority: CN
Inventors: 刘忠轩; 董博
Original assignee: XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Current assignee: XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Priority date: 2012-12-30
Filing date: 2012-12-30
Publication date: 2013-04-24
Anticipated expiration: 2032-12-30
Also published as: CN103065129B

Abstract

本发明提供了一种对大熊猫识别的方法，包括：检测出视频图像中的大熊猫图像；将所述大熊猫图像分割为多个区域；确定每个所述区域的特征向量，将多个特征向量与预先采集的数据库中的多个基准向量进行匹配；将所述数据库中匹配成功的大熊猫作为识别结果。通过上述的步骤，可在数据库中确定出大熊猫，将确定出的大熊猫作为检测到的大熊猫。从而可在视频中掌握每只大熊猫的生活习性以及活动范围。

Description

对大熊猫识别的方法

技术领域

本发明涉及视频监控领域，具体而言，涉及一种对大熊猫识别的方法。

背景技术

对于稀有动物大熊猫，为研究其在生存环境下的生活习性，需要对大熊猫在生存环境下的各种行为进行视频监控。

由于目前的视频识别技术，只能识别出视频中的大熊猫，不能对大熊猫的个体进行确认，从而导致不能区分出每个大熊猫的移动轨迹，不能确定当前视频中的大熊猫的身份。

发明内容

本发明旨在提供一种对大熊猫识别的方法，以解决不能对大熊猫的个体进行确认的问题。

在本发明的实施例中，提供了一种对大熊猫识别的方法，其特征在于，包括：检测出视频图像中的大熊猫图像；将所述大熊猫图像分割为多个区域；确定每个所述区域的特征向量，将多个特征向量与预先采集的数据库中的多个基准向量进行匹配；将所述数据库中匹配成功的大熊猫作为识别结果。

通过上述的步骤，可在数据库中确定出大熊猫，将确定出的大熊猫作为检测到的大熊猫。从而可在视频中掌握每只大熊猫的生活习性以及活动范围。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了实施例的流程图；

具体实施方式

下面将参考附图并结合实施例，来详细说明本发明。参见图1，实施例的步骤包括：

S11：检测出视频图像中的大熊猫图像；

S12：将所述大熊猫图像分割为多个区域；

S13：确定每个所述区域的特征向量，将多个特征向量与预先采集的数据库中的多个基准向量进行匹配；

S14：将所述数据库中匹配成功的大熊猫作为识别结果。

优选地，实施例中，检测大熊猫的步骤包括：使用高斯背景建模法在视频中检测运动区域。在检测到的运动区域内，使用基于方向梯度直方图(HOG)和带有隐含参数的支持向量机(latent SVM)的物体检测方法，在不同尺度上对视频中的大熊猫进行检测。

优选地，实施例中，对图像进行分割时，可采用分水岭算法对图像进行分割。在图像中，选取灰度值为局部极小值的点作为分水岭算法的种子，对图像的灰度信息使用分水岭算法，将图片分割为不同的区域。

计算像素点的灰度的公式如下：Y=0.2999R+0.5870G+0.1140B

分水岭算法分割图像：分水岭算法是根据图像的灰度信息，对图像进行区域分割的一种方法。首先将图像中的所有像素点按照灰度值从小到大排序，将灰度值为局部极小值的点作为种子点。在每个种子点所在位置构建区域。之后按照灰度值从小到大的顺序逐个处理每一个像素点，将被处理的像素点加入与它相邻的区域之中。当所有像素点都被加入区域之后，就得到图像的分割信息。

采用分水岭算法具体实现方式如下：

M1M2,….MR表示图像g（x，y）的局部极小值点的坐标的集合。R为正整数。

C(Mi)表示与局部极小值Mi相联系的汇水盆内点的集合。

T[n]＝{(s,t)|g(s,t)<n}表示位于平面g（x，y）=n下方的点的集合。S，t为坐标点。

Cn(Mi)=C(Mi)∩T[n]表示第n阶段汇水盆地被水淹没部分的集合。Mi=M1~MR

Q表示T[n]中连续分量的集合。对每个连续分量q∈有三种可能

（a）q∩C[n-1]为空

（b）q∩C[n-1]包含C[n-1]中的一个连通分量。

（c）q∩C[n-1]包含C[n-1]多于一个连通分量。

遇到新的最小值时，符合条件（a），将q并入c[n-1],构成c[n];

Q位于某些局部最小值构成的汇水盆地时，符合条件（b），将q并入c[n-1]构成c[n],当遇到分离全部或部分汇水盆地时，符合条件(c)，在q建立水坝。水坝为两个不同颜色的图像的边缘分界线。

终止条件为n=max+1。max像素点的颜色取值区间，例如：在灰度中，255为最高。

优选地，对分割后的图像消除过度分割：得到图像分割信息之后，计算每个区域的平均灰度，将相邻的区域的平均灰度进行比较，当差值不超过阈值5时，将两个区域合并为一个。

优选地，实施例中，确定特征向量的过程包括：

将检测到的图像转换为HSV格式，并提取颜色分布直方图。

从RGB颜色空间到HSV颜色空间的转换，计算公式如下：

h = \{\begin{matrix} 0 & \max = \min \\ 60 \times \frac{g - b}{\max - \min} & \max = r, g &GreaterEqual; b \\ 60 \times \frac{g - b}{\max - \min} + 360 & \max = r, g < b \\ 60 \times \frac{b - r}{\max - \min} + 120 & \max = g \\ 60 \times \frac{r - g}{\max - \min} + 240 & \max = b \end{matrix}

s = \{\begin{matrix} 0 & \max = 0 \\ \frac{\max - \min}{\max} & otherwise \end{matrix}

v＝max

其中max=max(r,g,b)，min=min(r,g,b)。比如，对于RGB颜色值为(0.1,0.2,0.5)的像素点，在HSV颜色空间中的值为(225,0.8,0.5)。

计算颜色直方图：对于图像中的每一个像素，对其颜色进行统计。例如，v分量小于阈值1为黑色，v分量大于阈值2并且s分量小于阈值3为白色，v分量在阈值1和阈值2之间且v分量小于阈值3为灰色，其他颜色为彩色。

对于彩色，按照h分量从0到360均匀划分为6种颜色，即[0，60),[60，120)，[120，180)，[180，240)，[240，300)，[300，360)。

对每个像素的颜色进行统计，并计算出每种颜色在大熊猫图像中所占比例，依次存储到数组x中，作为图像的特征向量使用。

例如，一个图像区域中有10个像素点。其中黑色点和白色点各有3个，另外4个点属于颜色[60，120)，那么这个区域对应的特征向量为(0.3,0.3,0,0,0.4,0,0,0,0)。

优选地，实施例中，所述数据库中的基准向量由以下步骤确定：

预先采集每个大熊猫的多幅视频图像；

通过所述多幅视频图像，确定出该大熊猫的多个区域、以及与每个区域对应的一组特征向量，作为该区域对应的基准向量。

该过程可通过聚类的方法实现，例如：使用K-means(K均值)等算法。

使用K-means训练时，将检测过程中得到的每一个大熊猫区域的颜色直方图作为特征向量进行聚类，得到特征向量的聚类中心，以及每个聚类中心包含的区域样本。

K均值算法需要输入一个参数k，以及若干个特征向量。通过K均值算法计算可以将这些特征向量分为k类，以及每一类中所包含的样本。这样，就可以将输入的样本分为k类，每一类代表一只大熊猫。

将聚类中心得到每一类的各个区域对应的特征向量存储到数据库中。

上述的匹配过程包括：

运算各个所述区域对应的各个特征向量分别与所述数据库中每个大熊猫的各个区域的基准向量的距离；

对每个特征向量得到的多个距离排序，确定出两个最小的距离d1和d2；其中，d1<d2；

如果所述1.5d1＜d2，则确定该特征向量与用于运算所述d1的基准向量相匹配。

确定与每个所述特征向量距离最近的基准向量的所在区域对应的大熊猫，并统计对应每只大熊猫的各个区域的基准向量被匹配的次数的总和；

找出被确定的次数总和唯一、且最高的值的大熊猫，作为所述匹配成功的大熊猫。

其中，用于运算出最小的欧式距离的基准向量作为距离最高的基准向量。欧式距离的公式如下：

d = \sqrt{Σ_{i = 1}^{N} {(x_{i} - X_{i})}^{2}}

其中d为特征向量到聚类中心的基准向量之间的距离，x为图像的特征向量，X为训练得到的聚类中心对应的特征向量，即基准向量，x_i和X_i分别表示图像的基准向量和聚类中心的基准向量的第i位，N为特征向量或基准向量的维数。

假设大熊猫被划分为若干区域，其中第i个区域被识别为区块p_i，来自于数据库中第s_i只大熊猫。对s_i进行直方图统计，并将整只大熊猫归类为直方图中最大的分量所对应的模型。

例如：如果一共有3个大熊猫样本，每个样本为一只大熊猫所包含的多个区域所分别对应的多个基准向量。

检测到的大熊猫被分为5个区域，共5个特征向量；数据库中包括5只大熊猫样本，每个样本包括6个区域，则共有30个区域，每个区域对应一个基准向量。计算检测到的每个特征向量与30个基准向量的距离，得到5组数据。

每组数据中包括30个距离，找到最小的两个距离，d1和d2，且满足1.5d1＜d2，则认为匹配到基准向量。

统计每只大熊猫的各个基准向量被匹配的次数。例如：检测某个区域的特征向量为(1,0,0,0,0,0,0,0,0)，与之距离最近的两个基准向量分别为(0.8,0,0,0,0,0,0,0,0.2)和(0.5,0.5,0,0,0,0,0,0,0)。则可以计算得到d₁≈0.283，d₂≈0.707，且1.5d₁<d₂。确定该特征向量与用于运算所述d1的基准向量相匹配。用于运算所述d1的基准向量为样本1的大熊猫，则样本1的大熊猫为识别成功的大熊猫。

其余的各个区域被分别识别为以下各个样本中的区域；如：样本1，样本1，样本1，样本2，样本3，则统计直方图为(3,1,1)，样本1为最高且唯一的样本，被检测到的大熊猫最终被再识别为样本1所对应的熊猫。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种对大熊猫识别的方法，其特征在于，包括：

检测出视频图像中的大熊猫图像；

将所述大熊猫图像分割为多个区域；

确定每个所述区域的特征向量，将多个特征向量与预先采集的数据库中的多个基准向量进行匹配；

将所述数据库中匹配成功的大熊猫作为识别结果。

2.根据权利要求1所述的方法，其特征在于，所述分割过程包括：

选择图像中局部最小值作为种子，采用分水岭算法分割为多个区域。

3.根据权利要求2所述的方法，其特征在于，还包括：

比较相邻区域的颜色灰度，当差值小于阈值时，将所述相邻区域合并。

4.根据权利要求2所述的方法，其特征在于，所述确定特征向量的过程包括：

将所述区域的图像转换为HSV格式；

统计所述HSV格式的区域内的各种颜色的像素数量；

根据所述各种颜色的像素数量确定与该区域对应的一组特征向量。

5.根据权利要求4所述的方法，其特征在于，所述数据库中的基准向量由以下步骤确定：

预先采集每个大熊猫的多幅视频图像；

通过所述多幅视频图像，确定出该大熊猫的多个区域、以及与每个区域对应的一组特征向量，作为该区域对应的基准向量；

所述匹配过程包括：

6.根据权利要求5所述的方法，其特征在于，

7.根据权利要求5所述的方法，其特征在于，还包括：采用以下欧式距离公式运算所述距离；

d = \sqrt{Σ_{i = 1}^{N} {(x_{i} - X_{i})}^{2}};

其中d为特征向量与基准向量的距离，x为图像的特征向量，X为训练得到的基准向量，i表示特征向量或基准向量的位数，N为特征向量或基准向量的维数。

8.根据权利要求6所述的方法，其特征在于，还包括：

如果没有匹配成功，则将所述检测出的大熊猫的各个区域的特征向量作为新的基准向量加入到所述数据库。

9.根据权利要求1所述的方法，其特征在于，还包括：

在当前帧图像和之前的视频图像中，采用最小的带颜色框体框住所述检测到的该大熊猫。