CN103186777B - 基于非负矩阵分解的人体检测方法 - Google Patents

基于非负矩阵分解的人体检测方法 Download PDF

Info

Publication number
CN103186777B
CN103186777B CN201310116508.3A CN201310116508A CN103186777B CN 103186777 B CN103186777 B CN 103186777B CN 201310116508 A CN201310116508 A CN 201310116508A CN 103186777 B CN103186777 B CN 103186777B
Authority
CN
China
Prior art keywords
human body
window
image
feature point
sorter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310116508.3A
Other languages
English (en)
Other versions
CN103186777A (zh
Inventor
韩红
焦李成
顾建银
李阳阳
马文萍
马晶晶
尚荣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huazhen Environmental Protection Technology Co ltd
Qingdao Huashi Intelligent Technology Co ltd
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201310116508.3A priority Critical patent/CN103186777B/zh
Publication of CN103186777A publication Critical patent/CN103186777A/zh
Application granted granted Critical
Publication of CN103186777B publication Critical patent/CN103186777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提出了一种基于非负矩阵分解的人体检测方法,主要解决现有方法特征维数大,运算量大的问题。其实现过程是:提取CVC-02数据库中训练样本图像的尺度旋转不变SIFT特征点;对尺度旋转不变SIFT特征点进行非负矩阵分解,得到一个基矩阵和一个系数矩阵;将基矩阵正交化后转置,然后与训练样本图像的尺度旋转不变SIFT特征点相乘得到训练样本图像的特征;对得到的特征利用SVM分类器进行分类训练,得到检测分类器;将待检测图像的特征输入到分类器中,根据分类结果,对所有分为人体的扫描窗口进行组合,形成最终的人体检测结果。本发明具有特征维数低,检测正确率高的优点,可用于对图像中的人体及其它目标的分类与检测。

Description

基于非负矩阵分解的人体检测方法
技术领域
本发明属于计算机视觉与模式识别技术领域,涉及人体检测方法,可用于对图像中的人体及其它目标的检测。
背景技术
人体检测在计算机视觉中有许多重要的应用,如视频监控、智能汽车及智能交通、机器人和高级人机交互等。然而,由于人体自身姿态的变化、衣服的多样性和光照等因素的影响,人体的外观变化非常大,导致人体检测成为一个非常困难的问题。
目前,图像中人体检测的方法主要有基于人体模型的方法、基于模板匹配的方法和基于统计分类的方法。
基于人体模型的方法,要有明确的人体模型,然后根据模型构造的各个部位与人体之间的关系进行人体识别。这种方法可以处理遮挡问题,并且可以推断出人体的姿态。但是这种方法的不足是模型的构建困难,求解复杂。
基于模板匹配的方法,先是给人体目标构造一个模板,然后根据模板匹配算法进行人体的识别。这种方法与基于模型的方法相比计算比较简单,缺点是由于人体姿态的复杂性,很难构造出足够的模板以处理不同的姿态。
基于统计分类的方法,通过机器学习从一系列训练数据中学习得到一个分类器,用该分类器来表示人体,然后利用该分类器对输入进行分类及识别。基于统计分类的方法的优点是检测结果稳定,效果较优,缺点是通常提取的特征维数较大,计算量较大,并且很难解决光线不足和背景混杂的问题。
发明内容
本发明目的是针对上述已有技术的不足,提出一种新的基于非负矩阵分解的图像特征表示用于人体检测,以降低提取的图像特征的维数,提高特征的表征能力,有效的提高人体检测的正确率。
本发明的技术方案通过如下步骤实现:
(1)提取CVC-02数据库中所有训练样本图像的尺度旋转不变SIFT特征点D;
(2)对所有训练样本图像的尺度旋转不变SIFT特征点D进行非负矩阵分解,得到一个系数矩阵H和一个基矩阵W;
(3)将基矩阵W正交化,得到正交化后的正交矩阵Q;
(4)将正交矩阵Q转置后与训练样本的尺度旋转不变SIFT特征点D相乘,得到训练样本的特征F;
(5)使用支持向量机SVM分类器对所得到的特征F进行分类训练,得到最终的检测分类器;
(6)从CVC-02数据库或INRIA数据库中提取出待检测的图像,输入到步骤(5)得到的检测分类器中,检测出人体。
本发明与现有的技术相比具有以下优点:
1.本发明由于将提取的像尺度旋转不变SIFT特征点转换到由非负矩阵分解得到的基表示的空间中,使得最后的图像特征的维数较低,有效的缩减了数据计算量,并且得到的特征能够表征局部视觉特征信息,在检测混杂背景,人体姿势存在变化及光线较暗的图像时,能够将人体很好的检测出来。
2.本发明由于对非负矩阵分解得到的基矩阵进行正交化,使得图像特征的表征能力更强,提高了分类器的性能。
附图说明
图1是本发明的流程示意图;
图2是本发明中使用的部分正样本图像;
图3是本发明中使用的部分负样本图像;
图4是用本发明在INRIA数据库上的检测结果图;
图5是用本发明在CVC-02数据库上的检测结果图。
具体实施方式
参照图1,本发明的具体实施步骤如下:
步骤一,提取CVC-02数据库中所有训练样本图像的尺度旋转不变SIFT特征点D。
(1a)将第j幅训练样本分割为16×16像素大小的块,提取每个块的SIFT特征点作为第j幅图像的SIFT特征点Dj,其中,Dj=[d1…,dt…,dm]T,t∈[1,m],m为从第j幅图像中提取的SIFT特征点维数,符号T表示向量的转置;
(1b)按照步骤(1a)提取所有训练图像的尺度旋转不变SIFT特征点D,其中Dj={D1…,Dj…,Dn},j∈[1,n],n为训练样本数。
步骤二,对所有训练样本图像的尺度旋转不变SIFT特征点D进行非负矩阵分解,得到一个系数矩阵H和一个基矩阵W。
(2a)随机生成一个大小为m×r的非负矩阵,作为基矩阵W的初始值W0,其中r为设定的值,r的取值要满足(m+n)r<mn;
(2b)随机生成一个大小为r×n的非负矩阵,作为系数矩阵H的初始值H0
(2c)根据已知的基矩阵W,系数矩阵H和步骤一中得到的所有训练样本图像的尺度旋转不变SIFT特征点D,更新系数矩阵H和基矩阵W:
(2c1)由公式:得到第k次更新后的系数矩阵H的值为Hk,其中,符号T表示矩阵的转置,Hk-1表示第k-1次更新后的系数矩阵H的值,k为迭代次数,k=1,2,…,N,N为最大迭代次数;
(2c2)由公式:得到第k次更新后的基矩阵W的值为Wk,其中,符号T表示矩阵的转置,Wk-1表示第k-1次更新后的系数矩阵W的值;
(2c3)根据步骤(2c1)得到的第k次更新后得到的系数矩阵H的值Hk和步骤(2c2)得到的第k次更新后的基矩阵W的值Wk,计算目标函数F1=||D-WkHk||2,其中,符号||·||表示对矩阵取二范数。
(2d)重复步骤(2c),直至目标函数F1的值小于设定的阈值TR=10-8或k达到最大的迭代次数N=1000。
步骤三,将基矩阵W按照施密特正交化法进行正交化,得到正交化后的正交矩阵Q。
(3a)令:b1=w1,得到第1个中间变量b1,w1为基矩阵W的第1列向量;
(3b)由公式:得到第2个中间变量b2,w2为基矩阵W的第2列向量;
(3c)按照公式: b f = w f - < w f , b 1 > < b 1 , b 1 > b 1 - < w f , b 1 > < b 2 , b 2 > b 2 - &CenterDot; &CenterDot; &CenterDot; - < w f , b f - 1 > < b f - 1 , b f - 1 > b f - 1 计算,得到第f个中间变量bf,f∈[3,r],r为基矩阵W的列数,wf为基矩阵W的第f列向量,bf-1为第f-1个中间变量;
(3d)将得到的r个中间变量按照公式:进行单位化,得到正交矩阵Q的第e列向量qe,be为第e个中间变量,e∈[1,r],符号||·||表示对向量取二范数;
(3e)将得到的列向量qe组合得到正交矩阵Q={q1…,qe…,qr},e∈[1,r]。
步骤四,将正交矩阵Q转置后与训练样本的尺度旋转不变SIFT特征点D相乘,得到训练样本的特征F。
根据步骤三得到的正交矩阵Q和步骤一中得到的所有训练样本图像的尺度旋转不变SIFT特征点D,按照公式:F=QTD计算得到训练样本的特征F,其中,符号T表示矩阵的转置。
步骤五,使用支持向量机SVM分类器对所得到的训练样本的特征F进行分类训练,得到最终的检测分类器。
步骤六,从CVC-02数据库或INRIA数据库中提取出待检测的图像,输入到步骤五得到的检测分类器中,检测出人体。
(6a)将输入的CVC-02数据库或INRIA数据库中的待检测图像按比例α进行缩放,α∈[0.5,2];
(6b)将缩放后的被检测图像左上角的一个大小为128×64像素的区域作为第一个扫描窗口,每向右平移8个像素或向下平移8个像素作为一个新的扫描窗口,由此得到一组扫描窗口,提取每个窗口的尺度旋转不变SIFT特征点Dt;
(6c)将步骤(3)中得到的正交矩阵Q转置后与步骤(6b)中提取的扫描窗口的尺度旋转不变SIFT特征点Dt相乘,得到扫描窗口的特征Ft;
(6d)将得到的扫描窗口的特征Ft输入到步骤(5)得到的检测分类器中,得到各个扫描窗口的分类器分数;
(6e)根据扫描窗口的分类器分数判断被测图像中是否包含人体,若分类器输出的扫描窗口含有人体,则从所有的含有人体的扫描窗口中,找出分类器分数最高的扫描窗口作为主窗口;
(6f)将与主窗口重叠大于的人体窗口和主窗口的边界进行加权组合,得到加权组合后的组合窗口;
在参与组合的人体窗口中,分类器分数最高的人体窗口的边界bmax的权值为0.7,分类器分数最低的人体窗口的边界bmin的权值为0.3,根据公式:bz=0.7bmax+0.3bmin计算得到加权组合后的组合窗口的边界bz
(6g)保留步骤(6f)得到的加权组合后的组合窗口,将步骤(6f)中参与组合的人体窗口从步骤(6d)中的扫描窗口中删除;
(6h)若将步骤(6f)中参与组合的人体窗口从步骤(6d)中的扫描窗口中删除后,还有人体窗口剩余,则再从剩余的人体窗口中找出分类器分数最高的人体窗口作为主窗口,并重复步骤(6f)-(6g);
(6i)在被检测人体图像上标出所有加权组合后的组合窗口,作为被测图像最终的人体检测结果,采用矩形框表示检测结果,被检测出的人体处于矩形框内。
本发明的效果可以通过以下仿真实验得到验证:
1)仿真实验条件设置:本发明的仿真实验在Matlab2009a上编译完成,执行环境为Windows框架下的HP工作站。实验所需的训练样本和测试样本均取自于CVC-02数据库。训练样本包括2032个正样本与15300个负样本,测试样本包括1140个正样本与15000个负样本,正样本与负样本图像的大小均为128×64像素,图2给出了其中部分正样本图像,图3给出了其中部分负样本图像。
2)仿真内容及结果分析
仿真一:分别使用本发明和现有的有向梯度直方图HOG特征提取方法对分类器的性能进行对比,在r=1000,假阳率FPPW=10-4时,分类器的正确率如表1所示。
表1.分类器性能
正确率
HOG 81%
本发明 85.5%
从表1可以看出,本发明的分类器性能高于现有的有向梯度直方图HOG特征提取方法的分类器性能。并且,本发明提取的特征维数为1000,而有向梯度直方图HOG的特征维数为3780,本发明所提出的特征提取方法特征维数较小,降低了数据运算量。
仿真二:使用本发明方法对INRIA数据库中的图像进行检测,检测结果如图4所示。从图4可以看出本发明的方法能够在光照不均匀,背景复杂,人体姿势存在变化及存在部分遮挡的情况下将人体检测出来。
仿真三:使用本发明方法对CVC-02数据库中的图像进行检测,检测结果如图5所示。从图5可以看出本发明的方法能够在光线较暗及存在部分遮挡的情况下将人体检测出来。
综上,本发明在降低提取的图像特征维数的同时,提高了特征的表达能力,同时本方法能够在光照不均匀,光线较暗,背景复杂,人体姿势存在变化及存在部分遮挡的情况下将人体检测出来。从而使本方法非常适合于图像中的人体检测。

Claims (2)

1.一种基于非负矩阵分解的人体检测方法,包括如下步骤:
(1)提取CVC-02数据库中所有训练样本图像的尺度旋转不变SIFT特征点D;
(2)对所有训练样本图像的尺度旋转不变SIFT特征点D进行非负矩阵分解,得到一个系数矩阵H和一个基矩阵W;
(3)将基矩阵W正交化,得到正交化后的正交矩阵Q;
(4)将正交矩阵Q转置后与训练样本的尺度旋转不变SIFT特征点D相乘,得到训练样本的特征F;
(5)使用支持向量机SVM分类器对所得到的特征F进行分类训练,得到最终的检测分类器;
(6)从CVC-02数据库或INRIA数据库中提取出待检测的图像,输入到步骤(5)得到的检测分类器中,检测出人体:
(6a)将输入的CVC-02数据库或INRIA数据库中的待检测图像按比例α进行缩放,α∈[0.5,2];
(6b)将缩放后的被检测图像左上角的一个大小为128×64像素的区域作为第一个扫描窗口,每向右平移8个像素或向下平移8个像素作为一个新的扫描窗口,由此得到一组扫描窗口,提取每个窗口的尺度旋转不变SIFT特征点Dt;
(6c)将步骤(3)中得到的正交矩阵Q转置后与步骤(6b)中提取的扫描窗口的尺度旋转不变SIFT特征点Dt相乘,得到扫描窗口的特征Ft;
(6d)将得到的扫描窗口的特征Ft输入到步骤(5)得到的检测分类器中,得到各个扫描窗口的分类器分数;
(6e)根据扫描窗口的分类器分数判断被测图像中是否包含人体,若分类器输出的扫描窗口含有人体,则从所有的含有人体的扫描窗口中,找出分类器分数最高的扫描窗口作为主窗口;
(6f)对主窗口与其他人体窗口进行组合判定,当其他人体窗口处于主窗口周围且重叠大于时,将此窗口与主窗口组合,获得组合后的人体窗口;
(6g)保留组合后的人体窗口,删除主窗口及所有参与组合的人体窗口;
(6h)若还有剩余的人体窗口,则再找出其中分类器分数最高的人体窗口作为主窗口,并重复步骤(6e)-(6g);
(6i)在被检测人体图像上标出所有检测结果,作为被测图像最终的人体检测结果,采用矩形框表示检测结果,被检测出的人体处于矩形框内。
2.根据权利要求1所述方法,其中步骤(1)中所述的提取所有训练样本的尺度旋转不变SIFT特征点D,按如下步骤进行:
(1a)将第j幅训练样本分割为16×16像素大小的块,在每个块上提取尺度旋转不变SIFT特征点,将第j幅图像所有块的SIFT特征点作为第j幅图像的尺度旋转不变SIFT特征点Dj
(1b)按照步骤(1a)提取所有训练图像的尺度旋转不变SIFT特征点D,其中Dj={D1…,Dj…,Dn},j∈[1,n],n为训练样本数。
CN201310116508.3A 2013-04-03 2013-04-03 基于非负矩阵分解的人体检测方法 Active CN103186777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310116508.3A CN103186777B (zh) 2013-04-03 2013-04-03 基于非负矩阵分解的人体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310116508.3A CN103186777B (zh) 2013-04-03 2013-04-03 基于非负矩阵分解的人体检测方法

Publications (2)

Publication Number Publication Date
CN103186777A CN103186777A (zh) 2013-07-03
CN103186777B true CN103186777B (zh) 2016-01-13

Family

ID=48677938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310116508.3A Active CN103186777B (zh) 2013-04-03 2013-04-03 基于非负矩阵分解的人体检测方法

Country Status (1)

Country Link
CN (1) CN103186777B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679715B (zh) * 2013-12-05 2016-08-17 宁波大学 一种基于非负矩阵分解的手机图像特征提取方法
CN106446854A (zh) * 2016-10-06 2017-02-22 西北工业大学 基于旋转不变hog特征的高分辨率光学遥感图像目标检测方法
CN109858312B (zh) * 2017-11-30 2023-08-22 佳能株式会社 人体部件检测装置和方法以及图像处理系统
CN110334761B (zh) * 2019-07-03 2021-05-04 北京林业大学 基于正交性约束增量非负矩阵分解的有监督图像识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908150A (zh) * 2010-06-25 2010-12-08 北京交通大学 一种人体检测方法
CN102426653A (zh) * 2011-10-28 2012-04-25 西安电子科技大学 基于第二代Bandelet变换和星型模型的静态人体检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627171B2 (en) * 2003-07-03 2009-12-01 Videoiq, Inc. Methods and systems for detecting objects of interest in spatio-temporal signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908150A (zh) * 2010-06-25 2010-12-08 北京交通大学 一种人体检测方法
CN102426653A (zh) * 2011-10-28 2012-04-25 西安电子科技大学 基于第二代Bandelet变换和星型模型的静态人体检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Gabor变换和Adaboost算法的人体目标检测分类器;梁英宏;《计算机工程与设计》;20091231;5790-5792 *

Also Published As

Publication number Publication date
CN103186777A (zh) 2013-07-03

Similar Documents

Publication Publication Date Title
CN101930549B (zh) 基于第二代曲线波变换的静态人体检测方法
CN104463101A (zh) 用于文字性试题的答案识别方法及系统
CN105138972A (zh) 人脸认证方法和装置
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
CN105160317A (zh) 一种基于区域分块行人性别识别方法
CN105205449A (zh) 基于深度学习的手语识别方法
CN103186776B (zh) 基于多特征和深度信息的人体检测方法
CN105469047A (zh) 基于无监督学习深度学习网络的中文检测方法及系统
CN106446890B (zh) 一种基于窗口打分和超像素分割的候选区域提取方法
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN105139041A (zh) 基于图像的语种识别方法及装置
CN103745233B (zh) 基于空间信息迁移的高光谱图像分类方法
CN103186777B (zh) 基于非负矩阵分解的人体检测方法
CN104794455B (zh) 一种东巴象形文字识别方法
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
CN104794479A (zh) 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN101520839B (zh) 基于第二代条带波变换的人体检测方法
CN105469063A (zh) 鲁棒的人脸图像主成分特征提取方法及识别装置
CN105893952A (zh) 基于pca方法的手写签名识别方法
CN104657709A (zh) 人脸图像识别方法、装置及服务器
CN103839066A (zh) 一种源于生物视觉的特征提取方法
CN101251896A (zh) 一种基于多分类器的物体检测系统及方法
CN106155540A (zh) 电子毛笔笔形处理方法和装置
CN103824062B (zh) 基于非负矩阵分解的分部位人体运动识别方法
CN104281850B (zh) 一种文字区域识别方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200717

Address after: 266101 area a, software park, 169 Songling Road, Laoshan District, Qingdao City, Shandong Province

Patentee after: Qingdao Huashi Intelligent Technology Co.,Ltd.

Address before: Room 309-1, 3 / F, building 1, Business Incubation Park, Zhejiang a & F University, No. 352, Nonglin Road, Jincheng Street, Lin'an District, Hangzhou City, Zhejiang Province

Patentee before: Hangzhou Huazhen Environmental Protection Technology Co.,Ltd.

Effective date of registration: 20200717

Address after: Room 309-1, 3 / F, building 1, Business Incubation Park, Zhejiang a & F University, No. 352, Nonglin Road, Jincheng Street, Lin'an District, Hangzhou City, Zhejiang Province

Patentee after: Hangzhou Huazhen Environmental Protection Technology Co.,Ltd.

Address before: Xi'an City, Shaanxi province Taibai Road 710071 No. 2

Patentee before: XIDIAN University