CN109271877A

CN109271877A - 一种人形识别方法及装置

Info

Publication number: CN109271877A
Application number: CN201810972475.5A
Authority: CN
Inventors: 王军; 赵雪鹏; 李苏祺; 余旭; 李党; 朱明�; 李娇; 耿磊
Original assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Current assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Priority date: 2018-08-24
Filing date: 2018-08-24
Publication date: 2019-01-25

Abstract

本发明提供了一种人形识别方法，该方法包括：输入视频图像，对视频图像进行运动目标检测，获取运动目标区域；对运动目标区域进行团块处理、面积过滤和宽高比过滤，获取人形候选区域；对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；采用人形分类器模型对人形候选区域进行分类，输出分类结果。与现有技术相比，本发明能快速准确地进行人形识别。

Description

一种人形识别方法及装置

技术领域

本发明涉及图像处理、视频监控以及安防，特别涉及人形识别方法及装置。

背景技术

人形识别技术是指利用人体成像的一定特征，通过对图形图像的处理,最终在成像空间中发现识别和定位人形目标的技术。人形识别技术是智能安防系统的一项重要技术，可以被广泛的应用到智能监控、智能交通、目标循迹、目标跟踪等领域。

现有的人形识别方法主要包括：基于背景建模的人形识别方法和基于统计学习的人形识别方法。基于背景建模的人形识别方法是首先利用背景建模的方法，提取视频画面中前景运动区域，然后在目标区域中进行特征提取及分类器学习，从而判断视频画面中是否有行人，但是该方法很难避免由于光照等外界环境变化导致的视频内容变化对人形识别的影响。基于统计学习的人形识别方法依据大量的样本构建行人识别分类器，通过对样本的特征提取和分类器训练来实现人形识别。

然而，目前的人形识别方法识别准确率不高，会出现很多误报和漏报，严重降低用户体验和产品警示功能的可信度。

综上所述，目前迫切需要提出一种识别率较高且鲁棒性较好的人形识别方法。

发明内容

有鉴于此，本发明的主要目的在于实现人形识别，且识别率和鲁棒性较好。

为达到上述目的，按照本发明的第一个方面，提供了一种人形识别方法，该方法包括：

第一步骤，输入视频图像，对视频图像进行运动目标检测，获取运动目标区域；

第二步骤，对运动目标区域进行团块处理、面积过滤和宽高比过滤，获取人形候选区域；

第三步骤，对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；

第四步骤，采用人形分类器模型对人形候选区域进行分类，输出分类结果。

进一步地，所述第二步骤包括：

团块处理步骤，对运动目标区域进行小团块合并、孤立小团块滤除、过大团块分割处理；

面积过滤步骤，计算运动目标区域的面积，如果运动目标区域的面积小于第一阈值，则滤除对应的运动目标区域；

宽高比过滤步骤，计算运动目标区域的宽度与高度的比值，如果运动目标区域的宽度与高度的比值小于第二阈值，则滤除对应的运动目标区域；

人形候选区域输出步骤，将剩余的运动目标区域作为人形候选区域输出。

进一步地，所述团块处理步骤包括：

小团块合并步骤，在当前帧图像内，根据任意两个运动目标区域的宽度、高度和间距，判断这两个运动目标区域是否进行合并处理；

孤立小团块滤除步骤，在当前帧图像内，根据运动目标区域的面积、以及与其他运动目标区域的间距，将属于孤立小团块的运动目标区域滤除；

过大团块分割步骤，在当前帧图像内，根据运动目标区域的面积与视频图像面积的比值，将属于过大团块的运动目标区域进行分割处理。

进一步地，所述第三步骤包括：

随机采样步骤，输入已标记目标的图像，将每个标记目标作为正样本，统计正样本的数量NUM1，从标记目标以外的背景区域中随机抽取NUM2个负样本；

难例负样本选取步骤，根据正样本和负样本，对卷积神经网络进行初次训练，获取初次训练的分类器模型，并对所有负样本按照概率值从高到底进行排序，选取前NUM3个作为难例负样本；

二次训练步骤，根据正样本和难例负样本，对初次训练的分类器模型进行二次训练，获取人形分类器模型。

进一步地，选用center-loss损失函数与softmax-loss损失函数的联合作为损失函数，根据损失函数对所述卷积神经网络进行分类训练。

按照本发明的另一个方面，提供了一种人形识别装置，该装置包括：

运动目标区域获取模块，用于输入视频图像，对视频图像进行运动目标检测，获取运动目标区域；

团块处理和过滤模块，用于对运动目标区域进行团块处理、面积过滤和宽高比过滤，获取人形候选区域；

样本挖掘和人形分类器模型获取模块，用于对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；

人形分类和结果输出模块，用于采用人形分类器模型对人形候选区域进行分类，输出分类结果。

进一步地，所述团块处理和过滤模块包括：

团块处理模块，用于对运动目标区域进行小团块合并、孤立小团块滤除、过大团块分割处理；

面积过滤模块，用于计算运动目标区域的面积，如果运动目标区域的面积小于第一阈值，则滤除对应的运动目标区域；

宽高比过滤模块，用于计算运动目标区域的宽度与高度的比值，如果运动目标区域的宽度与高度的比值小于第二阈值，则滤除对应的运动目标区域；

人形候选区域输出模块，用于将剩余的运动目标区域作为人形候选区域输出。

进一步地，所述团块处理模块包括：

小团块合并模块，用于在当前帧图像内，根据任意两个运动目标区域的宽度、高度和间距，判断这两个运动目标区域是否进行合并处理；

孤立小团块滤除模块，用于在当前帧图像内，根据运动目标区域的面积、以及与其他运动目标区域的间距，将属于孤立小团块的运动目标区域滤除；

过大团块分割模块，用于在当前帧图像内，根据运动目标区域的面积与视频图像面积的比值，将属于过大团块的运动目标区域进行分割处理。

进一步地，所述样本挖掘和人形分类器模型获取模块包括：

随机采样模块，用于输入已标记目标的图像，将每个标记目标作为正样本，统计正样本的数量NUM1，从标记目标以外的背景区域中随机抽取NUM2个负样本；

难例负样本选取模块，用于根据正样本和负样本，对卷积神经网络进行初次训练，获取初次训练的分类器模型，并对所有负样本按照概率值从高到底进行排序，选取前NUM3个作为难例负样本；

二次训练模块，用于根据正样本和难例负样本，对初次训练的分类器模型进行二次训练，获取人形分类器模型。

与现有的人形识别技术相比，本发明的一种人形识别方法及装置一方面采用运动目标检测和团块处理和区域筛选，以获取人形候选区域，提高了检测速度；另一方面采用卷积神经网络对样本进行二次训练，根据训练好的人形分类模型对人形候选区域进行分类，提高了人形识别的准确率。

附图说明

图1示出了按照本发明的人形识别方法的流程图。

图2示出了按照本发明的人形识别装置的框架图。

具体实施方式

为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的，现结合所附较佳实施例详细说明如下，所说明的较佳实施例仅用于说明本发明的技术方案，并非限定本发明。

图1给出了按照本发明的人形识别方法的流程图。如图1所示，按照本发明的人形识别方法包括：

第一步骤S1，输入视频图像，对视频图像进行运动目标检测，获取运动目标区域；

第二步骤S2，对运动目标区域进行团块处理、面积过滤和宽高比过滤，获取人形候选区域；

第三步骤S3，对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；

第四步骤S4，采用人形分类器模型对人形候选区域进行分类，输出分类结果。

所述第一步骤S1中运动目标检测可以采用现有的运动目标检测或者移动目标检测方法实现，包括但不限于以下一种或者多种方法的组合：基于背景建模的运动目标检测、基于帧差法的运动目标检测、基于光流法的运动目标检测等。示例性地，输入视频图像，采用基于混合高斯背景建模的运动目标检测方法，从视频图像中获取运动目标区域。

进一步地，所述第二步骤S2包括：

团块处理步骤S21，对运动目标区域进行小团块合并、孤立小团块滤除、过大团块分割处理；

面积过滤步骤S22，计算运动目标区域的面积，如果运动目标区域的面积小于第一阈值，则滤除对应的运动目标区域；

宽高比过滤步骤S23，计算运动目标区域的宽度与高度的比值，如果运动目标区域的宽度与高度的比值小于第二阈值，则滤除对应的运动目标区域；

人形候选区域输出步骤S24，将剩余的运动目标区域作为人形候选区域输出。

进一步地，所述团块处理步骤S21包括：

小团块合并步骤S211，在当前帧图像内，根据任意两个运动目标区域的宽度、高度和间距，判断这两个运动目标区域是否进行合并处理；

孤立小团块滤除步骤S212，在当前帧图像内，根据运动目标区域的面积、以及与其他运动目标区域的间距，将属于孤立小团块的运动目标区域滤除；

过大团块分割步骤S213，在当前帧图像内，根据运动目标区域的面积与视频图像面积的比值，将属于过大团块的运动目标区域进行分割处理。

进一步地，所述小团块合并步骤S211包括：对于当前帧图像内的任意两个运动目标区域B_i和B_j，计算运动目标区域B_i的宽度WB_i和高度HB_i，计算运动目标区域B_j的宽度WB_j和高度HB_j，分别计算运动目标区域B_i和B_j在x和y方向上的间距Xd_ij、Yd_ij，如果同时满足和则将运动目标区域B_i和B_j合并成一个运动目标区域，其中i，j∈{1，2，…，BNum1}，i≠j，BNum1为当前帧图像内的运动目标区域的个数，W和H为当前帧图像的宽度和高度。

进一步地，所述孤立小团块滤除步骤S212包括：对于当前帧图像，分别计算每个运动目标区域的面积，获取运动目标区域的面积最大值SB_max，对于任意一个运动目标区域B_p，如果满足则认为运动目标区域B_p为孤立小团块，将运动目标区域B_p滤除，其中p∈{1，2，…，BNum2}，BNum2为当前帧图像内的运动目标区域的个数，SB_p为运动目标区域B_p的面积。

进一步地，所述过大团块分割步骤S213包括：对于当前帧图像内的任意一个运动目标区域B_q，计算运动目标区域B_q的面积SB_q与当前帧图像的面积S的比值如果则认为运动目标区域B_q为过大团块，并采用前景密度分布分割法，将运动目标区域B_q分割成一个或者多个运动目标区域，其中q∈{1，2，…，BNum3}，BNum3为当前帧图像内的运动目标区域的个数。

进一步地，所述过大团块分割步骤S213中前景密度分布分割法包括：对于认为是过大团块的运动目标区域B_q，构建一个宽度为高度为的滑动窗口，采用滑动窗口在运动目标区域B_q内依次滑动一遍，统计每个滑动窗口区域内的前景点的数量值，获取滑动窗口区域内前景点数量值的最大值WFNum_max，将前景点数量值为WFNum_max的滑动窗口区域作为分割的运动目标区域B_q1；将运动目标区域B_q内除运动目标区域B_q1以外的部分作为分割子区域，分别计算每个分割子区域的面积，如果某个分割子区域的面积与运动目标区域B_q1面积的比值小于则滤除此分割子区域，如果某个分割子区域的面积与运动目标区域B_q1面积的比值位于之间，则将此分割子区域与运动目标区域B_q1合并，如果某个分割子区域的面积与运动目标区域B_q1面积的比值大于则将此分割子区域作为分割的运动目标区域。

进一步地，所述T₁的取值范围为2～8，所述T₂的取值范围为3～8，所述T₃的取值范围为2～8，所述T₄的取值范围为2～8，所述T₅的取值范围为8～12，所述T₆的取值范围为2～6。进一步地，所述T₁的取值范围为2～4，所述T₂的取值范围为4～6，所述T₃的取值范围为2～4，所述T₄的取值范围为2～4，T₅的取值范围为9～11，所述T₆的取值范围为3～5。

进一步地，所述第一阈值的取值范围为500～1000。示例性地，计算运动目标区域的面积，如果运动目标区域的面积小于900，则滤除对应的运动目标区域。

进一步地，所述第二阈值的取值范围为0.2～0.3。示例性地，计算运动目标区域的宽度与高度的比值，如果运动目标区域的宽度与高度的比值小于0.25，则滤除对应的运动目标区域。

进一步地，所述第三步骤S3包括：

随机采样步骤S31，输入已标记目标的图像，将每个标记目标作为正样本，统计正样本的数量NUM1，从标记目标以外的背景区域中随机抽取NUM2个负样本；

难例负样本选取步骤S32，根据正样本和负样本，对卷积神经网络进行初次训练，获取初次训练的分类器模型，并对所有负样本按照概率值从高到底进行排序，选取前NUM3个作为难例负样本；

二次训练步骤S33，根据正样本和难例负样本，对初次训练的分类器模型进行二次训练，获取人形分类器模型。

所述NUM2和NUM3可以根据实际需要进行人工设置。进一步地，所述NUM2的取值范围为100～100万，所述NUM3的取值范围为50～10万。

所述NUM2和NUM3也可以根据实际需要进行自动设置。进一步地，所述NUM2自动设置为NUM1的T₇倍，所述NUM3自动设置为NUM1的T₈倍。进一步地，所述T₇的取值范围为3～20，所述T₈的取值范围为1～10。

进一步地，所述卷积神经网络采用center-loss与softmax-loss的联合损失函数，对样本进行分类训练。

所述center-loss与softmax-loss的联合损失函数为：L＝L_s+λL_c，其中为softmax-loss损失函数，为center-loss损失函数。示例性地，所述softmax-loss损失函数和center-loss损失函数可以参照“ADiscriminative Feature Learning Approach for Deep Face Recognition.Y Wen，KZhang，Z Li，Y Qiao.Springer International Publishing,2016,47(9):499-515”论文。

进一步地，所述center-loss损失函数改为：当i为1时，样本属于正样本，δ(i＝1)为1；当i为0时，样本属于负样本，δ(i＝1)为0。

所述卷积神经网络可以采用现有的卷积神经网络实现。

示例性地，所述卷积神经网络包括：6个卷积层、5个ReLU激活函数层、1个全连接层。输入为64×64的图像，输出为人形识别结果。卷积过程中采用步长为2、核为3*3的卷积核进行特征提取和池化。

进一步地，所述第四步骤S4中分类结果包括：人形识别的结果和人形框的位置。

进一步地，所述第四步骤S4中分类结果还包括：人形识别的概率值。

图2给出了按照本发明的人形识别装置的框架图。如图2所示，按照本发明的人形识别装置包括：

运动目标区域获取模块1，用于输入视频图像，对视频图像进行运动目标检测，获取运动目标区域；

团块处理和过滤模块2，用于对运动目标区域进行团块处理、面积过滤和宽高比过滤，获取人形候选区域；

样本挖掘和人形分类器模型获取模块3，用于对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；

人形分类和结果输出模块4，用于采用人形分类器模型对人形候选区域进行分类，输出分类结果。

进一步地，所述团块处理和过滤模块2包括：

团块处理模块21，用于对运动目标区域进行小团块合并、孤立小团块滤除、过大团块分割处理；

面积过滤模块22，用于计算运动目标区域的面积，如果运动目标区域的面积小于第一阈值，则滤除对应的运动目标区域；

宽高比过滤模块23，用于计算运动目标区域的宽度与高度的比值，如果运动目标区域的宽度与高度的比值小于第二阈值，则滤除对应的运动目标区域；

人形候选区域输出模块24，用于将剩余的运动目标区域作为人形候选区域输出。

进一步地，所述团块处理模块21包括：

小团块合并模块211，用于在当前帧图像内，根据任意两个运动目标区域的宽度、高度和间距，判断这两个运动目标区域是否进行合并处理；

孤立小团块滤除模块212，用于在当前帧图像内，根据运动目标区域的面积、以及与其他运动目标区域的间距，将属于孤立小团块的运动目标区域滤除；

过大团块分割模块213，用于在当前帧图像内，根据运动目标区域的面积与视频图像面积的比值，将属于过大团块的运动目标区域进行分割处理。

进一步地，所述小团块合并模块211包括：用于对于当前帧图像内的任意两个运动目标区域B_i和B_j，计算运动目标区域B_i的宽度WB_i和高度HB_i，计算运动目标区域B_j的宽度WB_j和高度HB_j，分别计算运动目标区域B_i和B_j在x和y方向上的间距Xd_ij、Xd_ij，如果同时满足和则将运动目标区域B_i和B_j合并成一个运动目标区域，其中i，j∈{1，2，…，BNum1}，i≠j，BNum1为当前帧图像内的运动目标区域的个数，W和H为当前帧图像的宽度和高度。

进一步地，所述孤立小团块滤除模块212包括：用于对于当前帧图像，分别计算每个运动目标区域的面积，获取运动目标区域的面积最大值SB_max，对于任意一个运动目标区域B_p，如果满足则认为运动目标区域B_p为孤立小团块，将运动目标区域B_p滤除，其中p∈{1，2，…，BNum2}，BNum2为当前帧图像内的运动目标区域的个数，SB_p为运动目标区域B_p的面积。

进一步地，所述过大团块分割模块213包括：用于对于当前帧图像内的任意一个运动目标区域B_q，计算运动目标区域B_q的面积SB_q与当前帧图像的面积S的比值如果则认为运动目标区域B_q为过大团块，并采用前景密度分布分割法，将运动目标区域B_q分割成一个或者多个运动目标区域，其中q∈{1，2，…，BNum3}，BNum3为当前帧图像内的运动目标区域的个数。

进一步地，所述样本挖掘和人形分类器模型获取模块3包括：

随机采样模块31，用于输入已标记目标的图像，将每个标记目标作为正样本，统计正样本的数量NUM1，从标记目标以外的背景区域中随机抽取NUM2个负样本；

难例负样本选取模块32，用于根据正样本和负样本，对卷积神经网络进行初次训练，获取初次训练的分类器模型，并对所有负样本按照概率值从高到底进行排序，选取前NUM3个作为难例负样本；

二次训练模块33，用于根据正样本和难例负样本，对初次训练的分类器模型进行二次训练，获取人形分类器模型。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善，因此本发明只受到本发明权利要求的内容和范围的限制，其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims

1.一种人形识别方法，其特征在于，该方法包括：

2.如权利要求1所述的方法，其特征在于，所述第二步骤包括：

3.如权利要求2所述的方法，其特征在于，所述团块处理步骤包括：

4.如权利要求3所述的方法，其特征在于，所述小团块合并步骤包括：对于当前帧图像内的任意两个运动目标区域B_i和B_j，计算运动目标区域B_i的宽度WB_i和高度HB_i，计算运动目标区域B_j的宽度WB_j和高度HB_j，分别计算运动目标区域B_i和B_j在x和y方向上的间距Xd_ij、Yd_ij，如果同时满足和则将运动目标区域B_i和B_j合并成一个运动目标区域，其中i，j∈{1，2，…，BNum1}，i≠j，BNum1为当前帧图像内的运动目标区域的个数，W和H为当前帧图像的宽度和高度。

5.如权利要求3所述的方法，其特征在于，所述孤立小团块滤除步骤包括：对于当前帧图像，分别计算每个运动目标区域的面积，获取运动目标区域的面积最大值SB_max，对于任意一个运动目标区域B_p，如果满足则认为运动目标区域B_p为孤立小团块，将运动目标区域B_p滤除，其中p∈{1，2，…，BNum2}，BNum2为当前帧图像内的运动目标区域的个数，SB_p为运动目标区域B_p的面积。

6.如权利要求3所述的方法，其特征在于，所述过大团块分割步骤包括：对于当前帧图像内的任意一个运动目标区域B_q，计算运动目标区域B_q的面积SB_q与当前帧图像的面积S的比值如果则认为运动目标区域B_q为过大团块，并采用前景密度分布分割法，将运动目标区域B_q分割成一个或者多个运动目标区域，其中q∈{1，2，…，BNum3}，BNum3为当前帧图像内的运动目标区域的个数；

其中，所述前景密度分布分割法包括：对于认为是过大团块的运动目标区域B_q，构建一个宽度为高度为的滑动窗口，采用滑动窗口在运动目标区域B_q内依次滑动一遍，统计每个滑动窗口区域内的前景点的数量值，获取滑动窗口区域内前景点数量值的最大值WFNum_max，将前景点数量值为WFNum_max的滑动窗口区域作为分割的运动目标区域B_q1；将运动目标区域B_q内除运动目标区域B_q1以外的部分作为分割子区域，分别计算每个分割子区域的面积，如果某个分割子区域的面积与运动目标区域B_q1面积的比值小于则滤除此分割子区域，如果某个分割子区域的面积与运动目标区域B_q1面积的比值位于之间，则将此分割子区域与运动目标区域B_q1合并，如果某个分割子区域的面积与运动目标区域B_q1面积的比值大于则将此分割子区域作为分割的运动目标区域。

7.如权利要求1所述的方法，其特征在于，所述第三步骤包括：

二次训练步骤，根据正样本和难例负样本，对初次训练的分类器模型进行二次训练，获取人形分类器模型；

其中，所述NUM2和NUM3人工设置数值或者自动设置数值。

8.如权利要求7所述的方法，其特征在于，所述卷积神经网络采用center-loss与softmax-loss的联合损失函数，对样本进行分类训练；

其中，所述center-loss与softmax-loss的联合损失函数为：L＝L_s+λL_c，其中为softmax-loss损失函数，为center-loss损失函数。

9.如权利要求8所述的方法，其特征在于，所述center-loss损失函数改为：当i为1时，样本属于正样本，δ(i＝1)为1；当i为0时，样本属于负样本，δ(i＝1)为0。

10.如权利要求7所述的方法，进一步地，所述NUM2自动设置为NUM1的T₇倍，所述NUM3自动设置为NUM1的T₈倍。

11.如权利要求1～10所述的方法，进一步，所述T₁的取值范围为2～8，所述T₂的取值范围为3～8，所述T₃的取值范围为2～8，所述T₄的取值范围为2～8，所述T₅的取值范围为8～12，所述T₆的取值范围为2～6；

所述第一阈值的取值范围为500～1000，所述第二阈值的取值范围为0.2～0.3；

所述T₇的取值范围为3～20，所述T₈的取值范围为1～10。

12.一种人形识别装置，其特征在于，该装置包括：

样本挖掘和人形分类器模型获取模块，用于对样本图像进行随机采样，对卷积神经网络进行初次训练，根据初次训练的分类器模型，获取难例负样本，根据正样本和难例负样本对初次训练的分类器模型进行二次训练，获取人形分类器模型；人形分类和结果输出模块，用于采用人形分类器模型对人形候选区域进行分类，输出分类结果。

13.如权利要求12所述的装置，其特征在于，所述团块处理和过滤模块包括：团块处理模块，用于对运动目标区域进行小团块合并、孤立小团块滤除、过大团块分割处理；

14.如权利要求13所述的装置，其特征在于，所述团块处理模块包括：

15.如权利要求12所述的装置，其特征在于，所述样本挖掘和人形分类器模型获取模块包括：

随机采样模块，用于输入已标记目标的图像，将每个标记目标作为正样本，统计正样本的数量NUM1，从标记目标以外的背景区域中随机抽取NUM2个负样本；难例负样本选取模块，用于根据正样本和负样本，对卷积神经网络进行初次训练，获取初次训练的分类器模型，并对所有负样本按照概率值从高到底进行排序，选取前NUM3个作为难例负样本；