CN108985216A

CN108985216A - 一种基于多元logistic回归特征融合的行人头部检测方法

Info

Publication number: CN108985216A
Application number: CN201810751494.5A
Authority: CN
Inventors: 刘锁兰; 孔立智; 王洪元
Original assignee: Changzhou University
Current assignee: Changzhou University
Priority date: 2018-07-10
Filing date: 2018-07-10
Publication date: 2018-12-11
Anticipated expiration: 2038-07-10
Also published as: CN108985216B

Abstract

本发明公开了一种基于多元logistic回归特征融合的行人头部检测方法，它包括以下步骤：S1：载入视频数据，采用基于single shot multibox detector(SSD)的方法进行运动目标(行人)检测；S2：对检测到的运动区域使用梯度法进行头部预选；S3：将每个候选的头部图像进一步划分为若干子图像；S4：对每个候选图像首先提取全局特征，同时对子图像分别提取局部特征；S5：使用自适应权值的异源特征融合方法，将候选图像表示为一个特征向量；S6：将特征向量作为多元logistic回归输入，计算回归系数，得到匹配概率。

Description

一种基于多元logistic回归特征融合的行人头部检测方法

技术领域

本发明属于计算机数字图像处理领域，尤其涉及一种基于多元logistic回归特征融合的行人头部检测方法。

背景技术

人体头部由于其相对简单的形状变化和运动，相对于人脸来说更便于进行检测和跟踪。目前，人体头部检测技术在智能监控、视觉导航、智能家居、商场等领域中已得到了广泛的应用，并已扩展到行人计数和流量分析应用中，为智能安保工作提供参考和指导。虽然对头部的检测看起来似乎比对脸部的检测更容易，但仍然存在许多困难，主要包括以下几个方面：(1)误检。将非头部目标误判为头部，然后从伪头部区域提取特征等用于后续跟踪等处理，将会导致一系列糟糕的后果。(2)漏检。在检测过程中由于受光照条件，视角，头部倾斜，甚至被检测者头戴帽子，胡须等外观变化都会导致目标漏检。(3)实时处理性能弱。虽然许多检测算法比较快速，但在视频分析系统应用(如行人跟踪)中，头部检测的计算量通常占比较大甚至大于30％，主要因为大多数算法采用窗口扫描方法。窗口数量越大，计算量则越大。此外，许多系统本身性能较低对计算负担特别敏感。所以如何准确快速地检测和定位人体头部区域是一项具有挑战的研究工作。

行人头部检测算法主要分为基于颜色模型的方法、基于模板匹配的方法和基于轮廓检测的方法三类。基于颜色模型的方法一般通过建立肤色和头发颜色模型来判断像素是否属于头部区域(参见Y Guan,Y Huang.Multi-pose human head detection andtracking boosted by efficient human head validation using ellipse detection,Engineering applications of artificial intelligence,2015,37:181-193)。该类方法简单实时性能好，但需要脸部面向相机。因此当脸部背对相机且背景较复杂时，头部区域往往被误判为背景目标。因此基于颜色模型的方法虽然简单但自适应性较差。基于模板匹配的方法首先手动或自动离线建立头部模板模型，然后基于这些模板，通过相似性度量或动态变形技术等搜索头部区域。(参见M Prantl,S Vera.Curvature-based featuredetection for head modeling,Procedia computer science,2017,2323-2327)。这种方法对复杂背景和任意头部姿态具有良好的鲁棒性，但搜索过程往往耗时较长。基于轮廓检测的方法将头部轮廓近似为椭圆、高斯曲线等几何曲线。根据头部边缘的梯度信息通过曲线拟合技术来获得描述参数。这类方法可以实现对头部轮廓的求解，在头部检测中得到广泛应用。(参见W Zhou,Y Li,K Yuan.Real-time elliptical head contour detectionunder arbitrary pose and wide distance range,Journal ofvisual communicationand image representation,2009(20):217–228)。在所有适用的近似曲线中，椭圆由于其与头部轮廓形状最为相似，且为闭合形态，因而得到广泛地应用。但该方法受图像尺度影响较大，尤其对于小目标，存在漏检率和误检率的问题。

发明内容

针对现有技术中的缺陷，本发明提供一种基于多元logistic回归特征融合的行人头部检测方法。能够避免现有方法在对头部进行检测时容易误检和漏检，准确度低的问题，可以大幅度提高复杂背景下行人头部检测的速度和准确性。为了实现上述目标，本发明所采用的技术方案如下：

S1：载入视频数据，采用基于single shot multibox detector(SSD)的方法进行运动目标(行人)检测；

S2：对检测到的运动区域使用prewitt算子提取边缘。在此基础上分别计算边缘梯度幅值和方向。通过定义幅值和方向阈值范围进行头部区域预筛选；

S3：调整候选的头部图像尺寸大小为m*n,并使用局部区域法进一步划分为S个子图像，每个子图像大小为m*n/S；

S4：对每个候选的头部图像提取基于颜色直方图的全局特征，对S个子图像经向量重组后提取随机特征子集构成局部特征；

S5：使用自适应权值的异源特征融合方法，将候选图像转换为一个特征向量；

S6：将特征向量作为多元logistic回归输入，计算回归系数，得到匹配概率；通过设置匹配阈值便可得到检测结果，即true head。

进一步的，在S1中的行人检测具体方法为：采用基于深度学习的SSD检测器进行行人检测，并使用Google开源的神经卷积网络MobileNet V2提取卷积层特征用于训练SSD参数。

进一步的，在S2中的头部候选区域检测具体方法为：首先对步骤1检测到的运动区域使用prewitt边缘检测算子提取边缘；其次，在边缘提取基础上分别计算每个边缘像素点的梯度幅值和方向；最后，通过定义幅值和方向的阈值范围进行头部区域预筛选，得到若干候选头部区域。

进一步的，在S3中的子图像划分具体方法为：调整所有候选头部图像尺寸，统一大小为60*60,并使用局部区域法进一步均分为S个子图像，每个子图像大小为60*60/S，S一般取值为9，16，25等；

进一步的，在S4中的候选头部图像特征提取具体方法为：首先，对每个候选的头部图像提取颜色直方图作为全局特征。其次，对S个子图像提取局部特征，具体做法为：

S41.设训练集中共有Z帧图像。对于所有图像按上述步骤进行运动目标检测和划分子图像等处理。

S42.将每个子图像表示为一个60*60/S维的列向量。将训练集中所有位置相同的列向量组合为一个子图像集,共得到S个子图像集。

S43.对第q个子图像集Q_q,从Z个子图像中每随机生成一个索引向量就表示为一个特征。则假设要分为K类，共可以获得K个有效特征，每个特征子集可表示为(k＝1,2,…,K；q＝1,2,…,S)。

进一步的，在S5中的特征融合具体方法为：设每个候选图像样本x_i可提取U个特征矢量则该图像可以表示为因此定义异源特征融合模型，表示为：

其中，为自适应权值矩阵，用于将异源特征映射为线性特征。

进一步的，在S6中的分类判别具体方法为：对多元logistic回归模型进行对数变换建立因变量与自变量间的线性关系模型，表示为：

其中ε₀、ε_j为待估计系数，p_i为匹配概率。匹配概率p_i越趋近于1，则表示判断为真实头部区域的可能性越大。因此，多元logistic回归即为求使上式取得极大值时的系数。求回归系数的某个分量可通过求偏导数的方法求得。最后通过设定匹配概率阈值，得到头部图像。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明一种基于多元logistic回归特征融合的行人头部检测方法的流程图；

图2是本发明的行人检测效果图；2(a)原始视频图像；2(b)行人检测结果；

图3是本发明采用基于梯度的阈值判定方法提取的头部候选区域。从左到有分别为行人梯度图，梯度图上头部粗选结果，粗选区域映射至原始视频图像对于的区域图

图4是本发明的子图像划分及局部特征提取方法示意图；

图5是本发明的最终头部区域提取结果5(a)及头部区域放大示意图5(b)。

具体实施方式

下面结合附图和实施例对本发明的技术方案进行详细地描述，以下实施了例不构成对本发明的限定：

参照图1所示，本发明提供一种基于多元logistic回归特征融合的行人头部检测方法。通过载入视频帧图像，使用SSD方法进行行人检测，对检测目标提取边缘并计算边缘梯度幅值和方向信息。通过设置幅值和方向阈值得到若干候选头部图像区域。对候选区域分别提取全局和局部特征并进行融合得到表示该区域的特征向量。以此特征向量作为多元logistic回归模型的输入，通过估计系数得到匹配概率，设置匹配阈值得到分类结果。

其具体步骤如下：

步骤1：读入待检测的视频帧图像，使用基于SSD方法进行运动目标检测，寻找到运动区域的轮廓外接矩形，输出行人检测结果，并在本机中保存为.jpg格式的8位灰度图像。参见图2(b)。

步骤2：使用prewitt算子提取运动目标边缘，并计算边缘梯度幅值M(i,j)和方向值O(i,j)，计算方法如下：

O(i,j)＝1/tan(g_y(i,j)/g_x(i,j))

其中，g_x(i,j)＝f(i,j-1)-f(i,j+1),g_y(i,j)＝f(i-1,j)-f(i+1,j)分别表示像素点在水平方向和垂直方向的梯度大小。设置梯度幅值阈值为M_th,方向阈值范围为[O_min,O_max]对图像进行二值化处理，并以外接矩形标定头部候选区域。同时将矩形位置信息映射至原始视频帧图像，并以Region1、Region2等标注，输出头部粗选结果。参见图3。

步骤3：对Regioni调整尺寸大小为60*60。计算颜色直方图作为全局特征。同时等分为16个子图像，每个子图像大小为15*15。将Z个训练样本中所有位置相同的子图像串行组合为行向量，共构成16个子图像集。对第q个子图像集Q_q,从Z个子图像中每随机生成一个索引向量就表示为一个特征。则假设要分为K类，共可以获得K个有效特征，每个特征子集可表示为(k＝1,2,…,K；q＝1,2,…,S)。参见图4。

步骤4：特征融合与分类决策。将从Regioni提取的全局特征和局部特征采用如下公式进行特征融合：

其中为自适应权值矩阵。该融合模型通过调整每个特征的权值,衡量不同特征对模型的贡献,灵活有效地融合了多种特征，最后生成一个特征向量X_i用于表示区域Regioni。

将特征向量X_i作为logistic回归模型的输入。估计系数ε₀、ε_j，使匹配概率p_i趋近于1，即为求使上式取得极大值时的系数，通过对各分量求偏导数得到。

步骤5：通过设置匹配阈值，得到最终的头部检测结果。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制。任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，均仍属于本方明技术方案的保护范围。

Claims

1.一种基于多元logistic回归特征融合的行人头部检测方法，该方法包括如下步骤：

S2：对检测到的运动区域使用prewitt算子提取边缘，在此基础上分别计算边缘梯度幅值和方向，通过定义幅值和方向阈值范围进行头部区域预筛选；

S6：将特征向量作为多元logistic回归输入，计算回归系数，得到匹配概率；通过设置匹配阈值得到检测结果，即true head。

2.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤1中运动目标(行人)检测的具体步骤为：训练基于深度学习的SSD检测器，其中SSD的特征提取层使用了Google开源的轻量化神经卷积网络MobileNet V2，从而极大地压缩神经网络的参数量，加快检测速度。

3.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤2的具体步骤为：首先对步骤1检测到的运动区域使用prewitt边缘检测算子提取边缘；其次，在边缘提取基础上分别计算每个边缘像素点的梯度幅值和方向；最后，通过定义幅值和方向的阈值范围进行头部区域预筛选，得到若干候选头部区域。

4.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤3的具体步骤为：调整所有候选头部图像尺寸，统一大小为60*60,并使用局部区域法进一步均分为S个子图像，每个子图像大小为60*60/S，S一般取值为9，16，25等。

5.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤4的具体步骤为：

首先，对每个候选的头部图像提取颜色直方图作为全局特征；其次，对S个子图像提取局部特征，具体做法为：

a.设训练集中共有Z帧图像，对于所有图像按上述步骤进行运动目标检测和划分子图像等处理；

b.将每个子图像表示为一个60*60/S维的列向量，将训练集中所有位置相同的列向量组合为一个子图像集,共得到S个子图像集；

c.对第q个子图像集Q_q,从Z个子图像中每随机生成一个索引向量就表示为一个特征，则假设要分为K类，共可以获得K个有效特征，每个特征子集可表示为

6.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤5的具体步骤为：设每个候选图像样本x_i可提取U个特征矢量则该图像可以表示为因此定义异源特征融合模型，表示为：

7.根据权利要求1所述的一种基于多元logistic回归特征融合的行人头部检测方法，其特征在于所述步骤6的具体步骤为：对多元logistic回归模型做对数变换建立因变量与自变量间的线性关系模型，表示为：

其中ε₀、ε_j为待估计系数，p_i为匹配概率，可知，匹配概率p_i越趋近于1，判断为真实头部区域的可能性越大；因此，多元logistic回归即为求使上式取得极大值时的系数，求回归系数的某个分量可通过求偏导数的方法求得；最后通过设定匹配概率阈值，得到头部图像。