CN103258187A

CN103258187A - 一种基于hog特征的电视台标识别方法

Info

Publication number: CN103258187A
Application number: CN2013101314232A
Authority: CN
Inventors: 于俊清; 吴玲生; 唐九飞; 何云峰; 管涛
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2013-04-16
Filing date: 2013-04-16
Publication date: 2013-08-21

Abstract

本发明公开了一种基于HOG特征的电视台标识别方法，包括以下步骤：获取所有电视台的台标区域SIZE，获取所有电视台的图片，截取该图片中的台标区域SIZE，并将截取的台标区域存储在各个电视台的模板文件夹中，对每一个截取的台标区域提取HOG特征描述符，使用PCA方法对生成的HOG特征描述符进行降维处理，降维后的维度不大于所有电视台的图片总和，根据降维后的HOG特征描述符训练SVM分类器，其中SVM分类器的类别数被设置为模板文件夹的总数，使用训练生成的SVM分类器识别电视台台标，本发明的电视台标识别方法能够解决现有方法中存在的当台标背景复杂多变、噪声很大时容易识别错误的问题。

Description

一种基于HOG特征的电视台标识别方法

技术领域

本发明属于计算机视觉、模式识别领域，更具体地，涉及一种基于HOG特征的电视台标识别方法。

背景技术

电视台标是区分不同电视台的唯一标识，面对每天庞大的电视节目，通过人工识别方式，不仅效率低下，也容易受到外界干扰。通过对台标的自动匹配识别，不仅能在海量的电视视频序列中正确找出目标台，还能够为电视节目的自动搜索、收录、分析和检索提供有效支持。

目前存在的台标识别算法主要分为两类：基于颜色直方图的台标识别和普通Hu不变矩的台标识别。其中，基于颜色直方图的台标识别是利用不同台标的不同色调进行识别，将待识别的台标提取颜色直方图，与库中预存的直方图采用欧式距离匹配，距离越接近的即为检测台标，该算法最大缺点在于，对相似颜色和透明台标不易识别；普通Hu不变矩算法利用了台标的形状特征进行匹配识别，由于台标背景的干扰和噪声的存在，影响了轮廓的提取，降低了识别率。鉴于此，陈科宇等提出了一种基于颜色和形状的电视台标识别方法，潘达等提出一种基于分块形状特征匹配的台标识别系统，目的是综合利用台标的颜色和形状信息，减少背景的影响，以提高识别率，然而他们没有考虑到背景与台标的相关性，因此当画面较为干净、所含噪声较少、提取的台标图较为清晰时，识别结果较好；而当台标背景复杂多变、噪声很大时容易识别错误。

发明内容

针对现有技术的缺陷，本发明的目的在于提供一种基于HOG特征的电视台标识别方法，旨在解决现有方法中存在的当台标背景复杂多变、噪声很大时容易识别错误的问题。

为实现上述目的，本发明提供了一种基于HOG特征的电视台标识别方法，包括以下步骤：

（1）从输入的电视截图中截取台标区域SIZE；

（2）对截取出的台标区域SIZE提取HOG描述符；

（3）使用PCA方法对提取的HOG描述符使用降维，降维后的维度与以下步骤d中的维度相同；

（4）使用SVM分类器对降维后的HOG描述符进行识别，以得到识别结果；

其中SVM分类器是通过以下步骤训练获得：

a.获取所有电视台的台标区域SIZE；

b.获取所有电视台的图片，截取该图片中的台标区域SIZE，并将截取的台标区域存储在各个电视台的模板文件夹中；

c.对每一个截取的台标区域提取HOG特征描述符；

d.使用PCA方法对生成的HOG特征描述符进行降维处理，降维后的维度不大于所有电视台的图片总和；

e.根据降维后的HOG特征描述符训练SVM分类器，其中SVM分类器的类别数被设置为模板文件夹的总数。

步骤a具体为，对所有电视台的台标区域进行统计，以确定能包含至少90%的电视台的台标范围的最小矩形，然后对该最小矩形的大小向上取整为偶数，微调的结果为台标区域SIZE。

步骤c包括以下子步骤：

（3-1）将每一个截取的台标区域划分为多个子区域，并将每个子区域划分为多个细胞单元；

（3-2）使用一维的离散微分模板计算每个细胞单元的梯度值；

（3-3）使用计算得到的梯度值构建各个细胞单元的梯度直方图；

（3-4）对各个子区域中的所有细胞单元的梯度直方图进行归一化处理，以形成各个子区域的HOG特征描述符。

子区域的大小是根据截取的台标区域的大小来确定，且能被台标区域的大小整除，细胞单元的大小与子区域的划分方式相同。

SVM训练过程和识别过程均采用线性核函数。

通过本发明所构思的以上技术方案，与现有技术相比，本发明具有以下的有益效果：

1、台标识别率高：由于采用了步骤a和步骤c，步骤a仅仅考虑台标区域，最大程度的减少了背景的影响；步骤c使用HOG描述符，HOG特征对图像几何的和光学的形变都能保持很好的不变性，因此本发明方法有较高的识别率；

2、计算效率高：由于采用了步骤d对HOG描述符进行降维，可以将4000维以上的HOG描述符降维到500维以内，大大减少了计算量，提高了计算速度。

附图说明

图1是本发明基于HOG特征的电视台标识别方法的流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明基于HOG特征的电视台标识别方法包括以下步骤：

（1）获取所有电视台的台标区域SIZE；具体而言，对所有电视台的台标区域进行统计，以确定能包含至少90%的电视台的台标范围的最小矩形，然后对该最小矩形进行微调，即将大小向上取整为偶数，微调的结果为台标区域SIZE。

本步骤的优点是，获取台标区域后只考虑台标区域，最大限度的减少了背景的影响。

（2）获取所有电视台的图片，截取该图片中的台标区域SIZE，并将截取的台标区域存储在各个电视台的模板文件夹中；

（3）对每一个截取的台标区域提取HOG特征描述符；

具体包括以下子步骤：

（3-1）将每一个截取的台标区域划分为多个子区域（Block），并将每个子区域划分为多个细胞单元（Cell）；具体而言，子区域的大小是根据截取的台标区域的大小来确定，且能被台标区域的大小整除（例如，若台标区域的大小为200*100像素，则子区域的大小可为20*20像素），细胞单元的大小与上述划分方式相同。

（3-2）使用一维的离散微分模板（1-D centered point discretederivative mask）计算每个细胞单元的梯度值；

（4）使用主成分分析（Principal Component Analysis，简称PCA）方法对生成的HOG特征描述符进行降维处理，降维后的维度不大于所有电视台的图片总和；

下面介绍本发明使用的PCA方法：

如果高维向量的结构比较稀疏，并且有着比较明显的结构性，一般使用降维技术将向量从高维空间转换到能量更加集中的低维空间，然后在低维空间进行后续的处理。

PCA方法是一种无监督的降维方法，首先通过训练数据学习一个全局线性投影矩阵，然后使用该线性投影矩阵将高维向量空间中的点投影到低维超平面中，使得数据点在低维空间的分布尽可能的广，投影误差尽可能的小。学习全局线性投影矩阵的方法如下：

（4-1）假设给定n维空间中的训练集X，采用以下公式从训练集中移除均值：

\overset{&OverBar;}{x} = \frac{1}{| X |} \underset{x &Element; X}{Σ} x

x = x - \overset{&OverBar;}{x}, &ForAll; x &Element; X

其中x为原始向量，x为X中任意向量，

为训练集X的均值；

（4-2）计算训练集X经过均值调整后的协方差矩阵C：

C＝XX^T

（4-3）对协方差矩阵做特征值分解：

其中λ₀，...，λ_n-1为为从大到小排序的特征值，u₀，...，u_n-1为特征值λ₀，...，λ_n-1对应的特征向量，U为单位正交矩阵。由矩阵U中前p（p<n，p为降维后的维度）个特征向量组成的n×p矩阵M即为PCA投影矩阵。原始向量x在p维超平面上的投影M^Tx即该向量对应的低维向量。矩阵M的伪逆矩阵（即M的转置矩阵）定义了从低维超平面至高维平面的反投影，反投影的结果MM^Tx是低维向量在高维空间的坐标，反投影向量与原始向量的差为投影误差ε_p(x)＝x-MM^Tx，投影误差位于7M的零空间。因此PCA降维可以解释为原始空间中的一种向量近似。

本步骤的优点在于，台标区域提取的HOG描述符的维度一般在4000维以上，经过PCA降维后，台标区域的HOG描述符的维度被控制在500维以内，从而大大减少了存储空间，并提高了计算效率。

（5）根据降维后的HOG特征描述符训练SVM分类器，其中SVM分类器的类别数被设置为模板文件夹的总数；

SVM是Vapnik等人根据统计学习理论提出的一种新的机器学习方法，它建立在VC维和结构风险最小化原则基础上，通过适当选择函数子集，根据有限样本在模型的负责性和学习能力之间寻求最佳折中，使学习机的实际风险达到最小。SVM保证了通过有限训练样本得到的分类器对测试集较小的测试误差；利用软间隔以解决线性不可分问题；通过引入核函数使线性可分扩展到非线性可分。

由广义线性判别函数的性质可知，如果一个问题在其定义的空间中不是线性可分的，那么可以通过构造新的特征向量，把问题转换到另外一个较高维的空间，在这个空间里可以用线性判别函数实现原空间中的非线性判别函数。对于任意高次判别函数，都可以通过适当的变换转化为另一空间中的线性判别函数来处理。所以，当要解决一个非线性问题时，可以将其通过非线性变换转化为另一个空间中的线性问题，在这个变换空间上求最优或广义最优分类面。在这个空间中，只需要进行内积运算即可。假定有l个样本的样本集(x₁，y₁），(x₂，y₂)，...，(x_l，y_l)，x∈Rⁿ；y∈{+1，-1}是类别标号，后面公式中x_i，x_j，y_i，y_i，i，j∈(1，l)均为样本集内的点。由Hilbert-Sclllnidt原理可知，只要某种运算满足Mercer定理，它就可作为内积使用。

Mercer定理:任意的对称函数

当它是某个特征空间中的内积运算的充分必要条件时，对于任意函数有

满足Mercer定理的内积函数称为核函数，采用适当的核函数实现非线性到线性空间的映射，不会增加计算复杂度。当选定了适当的核，优化问题可以写成：

W (α_{i}) = Σ_{i = 1}^{l} α_{i} - \frac{1}{2} Σ_{i = 1}^{l} Σ_{j = 1}^{l} α_{i} α_{j} y_{i} y_{j} K (x_{i}, x_{j})

分类函数变成：

f (x) = sgn [Σ_{i = 1}^{l} α_{i}^{*} y_{i} K (x_{i}, x) + b *]

其中为拉格朗日乘子

，

表示

取得最优解时的值，

为阈值，sgn()表示符号函数。

这就是支持向量机的一般表述。支持向量机关键思想可以概括为：首先通过非线性变换将线性不可分情况下的训练样本映射到高维空间，然后在这个新空间中求取最优线性分类面，而这种非线性变换是通过定义适当的内积函数实现的。

在支持向量机理论中，不同的内积函数形成了不同的算法，典型的核函数有以下4类：

线性(Linear)核函数：

K (x_{i}, x_{j}) = x_{i} \cdot x_{j}

多项式(Polynomial)核函数：

K (x_{i}, x_{j}) = {(x_{i} \cdot x_{j} + 1)}^{d}

径向基(RBF)核函数：

K (x_{i}, x_{j}) = \exp (- \frac{{| | x_{i} \cdot x_{j} | |}^{2}}{{2 σ}^{2}})

双曲正切(Sigmoid)核函数K(x_i，x_j)＝tanh[k(x_i·x_j)+δ]

核函数是支持向量机的关键部分。对于低维空间中的线性不可分问题，解决办法是将其映射到高维空间中，转变成为高维空间中的线性可分问题，但随之带来计算复杂度的增加，而核函数则能够解决这一难题。SVM无需知道非线性映射的显式表达式，只需要利用核函数进行计算。计算复杂度不再在取决于空间维数，而取决于样本数，尤其是样本中的支持向量数，所以SVM可以由训练样本集和核函数完全描述。

本发明的使用的SVM训练过程和识别过程均采用线性核函数。

本步骤的优点在于，采用SVM分类器具有分类速度快，分类结果全局最优的特点，并且SVM有较好的泛化能力。

（6）使用训练生成的SVM分类器识别电视台台标，具体包括以下子步骤：

（6-1）从输入的电视截图中截取台标区域SIZE；

（6-2）对截取出的台标区域SIZE提取HOG描述符；

（6-3）使用PCA方法对提取的HOG描述符使用降维，降维后的维度与步骤（4）中的维度相同；

（6-4）使用步骤（5）生成的SVM分类器对降维后的HOG描述符进行识别，以得到识别结果。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于HOG特征的电视台标识别方法，其特征在于，包括以下步骤：

（1）从输入的电视截图中截取台标区域SIZE；

（2）对截取出的台标区域SIZE提取HOG描述符；

其中SVM分类器是通过以下步骤训练获得：

a.获取所有电视台的台标区域SIZE；

c.对每一个截取的台标区域提取HOG特征描述符；

2.根据权利要求1所述的电视台标识别方法，其特征在于，步骤a具体为，对所有电视台的台标区域进行统计，以确定能包含至少90%的电视台的台标范围的最小矩形，然后对该最小矩形的大小向上取整为偶数，微调的结果为台标区域SIZE。

3.根据权利要求1所述的电视台标识别方法，其特征在于，步骤c包括以下子步骤：

4.根据权利要求3所述的电视台标识别方法，其特征在于，子区域的大小是根据截取的台标区域的大小来确定，且能被台标区域的大小整除，细胞单元的大小与子区域的划分方式相同。

5.根据权利要求1所述的电视台标识别方法，其特征在于，SVM训练过程和识别过程均采用线性核函数。