CN103186777B

CN103186777B - 基于非负矩阵分解的人体检测方法

Info

Publication number: CN103186777B
Application number: CN201310116508.3A
Authority: CN
Inventors: 韩红; 焦李成; 顾建银; 李阳阳; 马文萍; 马晶晶; 尚荣华
Original assignee: Xidian University
Current assignee: Hangzhou Huazhen Environmental Protection Technology Co ltd; Qingdao Huashi Intelligent Technology Co ltd
Priority date: 2013-04-03
Filing date: 2013-04-03
Publication date: 2016-01-13
Anticipated expiration: 2033-04-03
Also published as: CN103186777A

Abstract

本发明提出了一种基于非负矩阵分解的人体检测方法，主要解决现有方法特征维数大，运算量大的问题。其实现过程是：提取CVC-02数据库中训练样本图像的尺度旋转不变SIFT特征点；对尺度旋转不变SIFT特征点进行非负矩阵分解，得到一个基矩阵和一个系数矩阵；将基矩阵正交化后转置，然后与训练样本图像的尺度旋转不变SIFT特征点相乘得到训练样本图像的特征；对得到的特征利用SVM分类器进行分类训练，得到检测分类器；将待检测图像的特征输入到分类器中，根据分类结果，对所有分为人体的扫描窗口进行组合，形成最终的人体检测结果。本发明具有特征维数低，检测正确率高的优点，可用于对图像中的人体及其它目标的分类与检测。

Description

基于非负矩阵分解的人体检测方法

技术领域

本发明属于计算机视觉与模式识别技术领域，涉及人体检测方法，可用于对图像中的人体及其它目标的检测。

背景技术

人体检测在计算机视觉中有许多重要的应用，如视频监控、智能汽车及智能交通、机器人和高级人机交互等。然而，由于人体自身姿态的变化、衣服的多样性和光照等因素的影响，人体的外观变化非常大，导致人体检测成为一个非常困难的问题。

目前，图像中人体检测的方法主要有基于人体模型的方法、基于模板匹配的方法和基于统计分类的方法。

基于人体模型的方法，要有明确的人体模型，然后根据模型构造的各个部位与人体之间的关系进行人体识别。这种方法可以处理遮挡问题，并且可以推断出人体的姿态。但是这种方法的不足是模型的构建困难，求解复杂。

基于模板匹配的方法，先是给人体目标构造一个模板，然后根据模板匹配算法进行人体的识别。这种方法与基于模型的方法相比计算比较简单，缺点是由于人体姿态的复杂性，很难构造出足够的模板以处理不同的姿态。

基于统计分类的方法，通过机器学习从一系列训练数据中学习得到一个分类器，用该分类器来表示人体，然后利用该分类器对输入进行分类及识别。基于统计分类的方法的优点是检测结果稳定，效果较优，缺点是通常提取的特征维数较大，计算量较大，并且很难解决光线不足和背景混杂的问题。

发明内容

本发明目的是针对上述已有技术的不足，提出一种新的基于非负矩阵分解的图像特征表示用于人体检测，以降低提取的图像特征的维数，提高特征的表征能力，有效的提高人体检测的正确率。

本发明的技术方案通过如下步骤实现：

(1)提取CVC-02数据库中所有训练样本图像的尺度旋转不变SIFT特征点D；

(2)对所有训练样本图像的尺度旋转不变SIFT特征点D进行非负矩阵分解，得到一个系数矩阵H和一个基矩阵W；

(3)将基矩阵W正交化，得到正交化后的正交矩阵Q；

(4)将正交矩阵Q转置后与训练样本的尺度旋转不变SIFT特征点D相乘，得到训练样本的特征F；

(5)使用支持向量机SVM分类器对所得到的特征F进行分类训练，得到最终的检测分类器；

(6)从CVC-02数据库或INRIA数据库中提取出待检测的图像，输入到步骤(5)得到的检测分类器中，检测出人体。

本发明与现有的技术相比具有以下优点：

1．本发明由于将提取的像尺度旋转不变SIFT特征点转换到由非负矩阵分解得到的基表示的空间中，使得最后的图像特征的维数较低，有效的缩减了数据计算量，并且得到的特征能够表征局部视觉特征信息，在检测混杂背景，人体姿势存在变化及光线较暗的图像时，能够将人体很好的检测出来。

2．本发明由于对非负矩阵分解得到的基矩阵进行正交化，使得图像特征的表征能力更强，提高了分类器的性能。

附图说明

图1是本发明的流程示意图；

图2是本发明中使用的部分正样本图像；

图3是本发明中使用的部分负样本图像；

图4是用本发明在INRIA数据库上的检测结果图；

图5是用本发明在CVC-02数据库上的检测结果图。

具体实施方式

参照图1，本发明的具体实施步骤如下：

步骤一，提取CVC-02数据库中所有训练样本图像的尺度旋转不变SIFT特征点D。

(1a)将第j幅训练样本分割为16×16像素大小的块，提取每个块的SIFT特征点作为第j幅图像的SIFT特征点D_j，其中，D_j＝[d₁…,d_t…,d_m]^T，t∈[1,m]，m为从第j幅图像中提取的SIFT特征点维数，符号T表示向量的转置；

(1b)按照步骤(1a)提取所有训练图像的尺度旋转不变SIFT特征点D，其中D_j＝{D₁…,D_j…,D_n}，j∈[1,n]，n为训练样本数。

步骤二，对所有训练样本图像的尺度旋转不变SIFT特征点D进行非负矩阵分解，得到一个系数矩阵H和一个基矩阵W。

(2a)随机生成一个大小为m×r的非负矩阵，作为基矩阵W的初始值W₀，其中r为设定的值，r的取值要满足(m+n)r＜mn；

(2b)随机生成一个大小为r×n的非负矩阵，作为系数矩阵H的初始值H₀；

(2c)根据已知的基矩阵W，系数矩阵H和步骤一中得到的所有训练样本图像的尺度旋转不变SIFT特征点D，更新系数矩阵H和基矩阵W：

(2c1)由公式：得到第k次更新后的系数矩阵H的值为H_k，其中，符号T表示矩阵的转置，H_k-1表示第k-1次更新后的系数矩阵H的值，k为迭代次数，k＝1,2,…,N，N为最大迭代次数；

(2c2)由公式：得到第k次更新后的基矩阵W的值为W_k，其中，符号T表示矩阵的转置，W_k-1表示第k-1次更新后的系数矩阵W的值；

(2c3)根据步骤(2c1)得到的第k次更新后得到的系数矩阵H的值H_k和步骤(2c2)得到的第k次更新后的基矩阵W的值W_k，计算目标函数F₁＝||D-W_kH_k||²，其中，符号||·||表示对矩阵取二范数。

(2d)重复步骤(2c)，直至目标函数F₁的值小于设定的阈值TR＝10^-8或k达到最大的迭代次数N＝1000。

步骤三，将基矩阵W按照施密特正交化法进行正交化，得到正交化后的正交矩阵Q。

(3a)令：b₁＝w₁，得到第1个中间变量b₁，w₁为基矩阵W的第1列向量；

(3b)由公式：得到第2个中间变量b₂，w₂为基矩阵W的第2列向量；

(3c)按照公式：

b_{f} = w_{f} - \frac{< w_{f}, b_{1} >}{< b_{1}, b_{1} >} b_{1} - \frac{< w_{f}, b_{1} >}{< b_{2}, b_{2} >} b_{2} - \cdot \cdot \cdot - \frac{< w_{f}, b_{f - 1} >}{< b_{f - 1}, b_{f - 1} >} b_{f - 1}

计算，得到第f个中间变量b_f，f∈[3,r]，r为基矩阵W的列数，w_f为基矩阵W的第f列向量，b_f-1为第f-1个中间变量；

(3d)将得到的r个中间变量按照公式：进行单位化，得到正交矩阵Q的第e列向量q_e，b_e为第e个中间变量，e∈[1,r]，符号||·||表示对向量取二范数；

(3e)将得到的列向量q_e组合得到正交矩阵Q＝{q₁…,q_e…,q_r}，e∈[1,r]。

步骤四，将正交矩阵Q转置后与训练样本的尺度旋转不变SIFT特征点D相乘，得到训练样本的特征F。

根据步骤三得到的正交矩阵Q和步骤一中得到的所有训练样本图像的尺度旋转不变SIFT特征点D，按照公式：F＝Q^TD计算得到训练样本的特征F，其中，符号T表示矩阵的转置。

步骤五，使用支持向量机SVM分类器对所得到的训练样本的特征F进行分类训练，得到最终的检测分类器。

步骤六，从CVC-02数据库或INRIA数据库中提取出待检测的图像，输入到步骤五得到的检测分类器中，检测出人体。

(6a)将输入的CVC-02数据库或INRIA数据库中的待检测图像按比例α进行缩放,α∈[0.5,2]；

(6b)将缩放后的被检测图像左上角的一个大小为128×64像素的区域作为第一个扫描窗口，每向右平移8个像素或向下平移8个像素作为一个新的扫描窗口，由此得到一组扫描窗口，提取每个窗口的尺度旋转不变SIFT特征点Dt；

(6c)将步骤(3)中得到的正交矩阵Q转置后与步骤(6b)中提取的扫描窗口的尺度旋转不变SIFT特征点Dt相乘，得到扫描窗口的特征Ft；

(6d)将得到的扫描窗口的特征Ft输入到步骤(5)得到的检测分类器中，得到各个扫描窗口的分类器分数；

(6e)根据扫描窗口的分类器分数判断被测图像中是否包含人体，若分类器输出的扫描窗口含有人体，则从所有的含有人体的扫描窗口中，找出分类器分数最高的扫描窗口作为主窗口；

(6f)将与主窗口重叠大于的人体窗口和主窗口的边界进行加权组合，得到加权组合后的组合窗口；

在参与组合的人体窗口中，分类器分数最高的人体窗口的边界b_max的权值为0.7，分类器分数最低的人体窗口的边界b_min的权值为0.3，根据公式：b_z＝0.7b_max+0.3b_min计算得到加权组合后的组合窗口的边界b_z；

(6g)保留步骤(6f)得到的加权组合后的组合窗口，将步骤(6f)中参与组合的人体窗口从步骤(6d)中的扫描窗口中删除；

(6h)若将步骤(6f)中参与组合的人体窗口从步骤(6d)中的扫描窗口中删除后，还有人体窗口剩余，则再从剩余的人体窗口中找出分类器分数最高的人体窗口作为主窗口，并重复步骤(6f)-(6g)；

(6i)在被检测人体图像上标出所有加权组合后的组合窗口，作为被测图像最终的人体检测结果，采用矩形框表示检测结果，被检测出的人体处于矩形框内。

本发明的效果可以通过以下仿真实验得到验证：

1）仿真实验条件设置：本发明的仿真实验在Matlab2009a上编译完成，执行环境为Windows框架下的HP工作站。实验所需的训练样本和测试样本均取自于CVC-02数据库。训练样本包括2032个正样本与15300个负样本，测试样本包括1140个正样本与15000个负样本，正样本与负样本图像的大小均为128×64像素，图2给出了其中部分正样本图像，图3给出了其中部分负样本图像。

2）仿真内容及结果分析

仿真一：分别使用本发明和现有的有向梯度直方图HOG特征提取方法对分类器的性能进行对比，在r＝1000，假阳率FPPW＝10^-4时，分类器的正确率如表1所示。

表1.分类器性能

	正确率
		HOG	81%
本发明	85.5%

从表1可以看出，本发明的分类器性能高于现有的有向梯度直方图HOG特征提取方法的分类器性能。并且，本发明提取的特征维数为1000，而有向梯度直方图HOG的特征维数为3780，本发明所提出的特征提取方法特征维数较小，降低了数据运算量。

仿真二：使用本发明方法对INRIA数据库中的图像进行检测，检测结果如图4所示。从图4可以看出本发明的方法能够在光照不均匀，背景复杂，人体姿势存在变化及存在部分遮挡的情况下将人体检测出来。

仿真三：使用本发明方法对CVC-02数据库中的图像进行检测，检测结果如图5所示。从图5可以看出本发明的方法能够在光线较暗及存在部分遮挡的情况下将人体检测出来。

综上，本发明在降低提取的图像特征维数的同时，提高了特征的表达能力，同时本方法能够在光照不均匀，光线较暗，背景复杂，人体姿势存在变化及存在部分遮挡的情况下将人体检测出来。从而使本方法非常适合于图像中的人体检测。

Claims

1.一种基于非负矩阵分解的人体检测方法，包括如下步骤：

(3)将基矩阵W正交化，得到正交化后的正交矩阵Q；

(6)从CVC-02数据库或INRIA数据库中提取出待检测的图像，输入到步骤(5)得到的检测分类器中，检测出人体：

(6f)对主窗口与其他人体窗口进行组合判定，当其他人体窗口处于主窗口周围且重叠大于时，将此窗口与主窗口组合，获得组合后的人体窗口；

(6g)保留组合后的人体窗口，删除主窗口及所有参与组合的人体窗口；

(6h)若还有剩余的人体窗口，则再找出其中分类器分数最高的人体窗口作为主窗口，并重复步骤(6e)-(6g)；

(6i)在被检测人体图像上标出所有检测结果，作为被测图像最终的人体检测结果，采用矩形框表示检测结果，被检测出的人体处于矩形框内。

2.根据权利要求1所述方法，其中步骤(1)中所述的提取所有训练样本的尺度旋转不变SIFT特征点D，按如下步骤进行：

(1a)将第j幅训练样本分割为16×16像素大小的块，在每个块上提取尺度旋转不变SIFT特征点，将第j幅图像所有块的SIFT特征点作为第j幅图像的尺度旋转不变SIFT特征点D_j；