CN107909032A

CN107909032A - 一种基于单样本的行为检测与识别方法

Info

Publication number: CN107909032A
Application number: CN201711128829.XA
Authority: CN
Inventors: 黄�俊; 张磊
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2017-11-15
Filing date: 2017-11-15
Publication date: 2018-04-13

Abstract

本文提出了一种基于单样本的行为检测与识别方法能够对视频中是否出现该类行为做出快速的判断。方法通过匹配运动目标身上的特征点并将其对应的位移信息进行投票产生位移直方图对行为进行表征，紧接着采用矩阵余弦相似度的方法来判别行为。实验表明，在摄像头固定的静态场景下，所提的方法能够快速有效的对视频中的行为进行检测与识别。

Description

一种基于单样本的行为检测与识别方法

技术领域

本发明涉及视频识别技术，具体涉及一种基于单样本的视频中行为的检测与识别方法。

背景技术

随着社会的发展和人们安全意识的增强，视频监控系统已经在各行各业中得到了广泛的应用。与此同时，人工智能的迅速崛起使得人们对智能监控的研发需求空前膨胀。视频中行为的检测与识别是智能视频监控中的研究重点和难点，当行为样本的收集比较困难的时候，研究利用极少甚至单个的样本对视频中的行为进行检测与识别显得很有意义。本文提出了一种基于单样本的行为检测与识别方法能够对视频中是否出现该类行为做出快速的判断。方法通过匹配运动目标身上的特征点并将其对应的位移信息进行投票产生位移直方图对行为进行表征，紧接着采用矩阵余弦相似度的方法来判别行为。实验表明，在摄像头固定的静态场景下，所提的方法能够快速有效的对视频中的行为进行检测与识别。

从视频中检测与识别其中的人体行为，是智能监控研究的关键问题。目前，已经有了很多针对视频中行为检测与识别的研究成果。总体上可根据是否需要大量的训练样本可以将其分成两大类。第一类方法需要使用大量的视频样本来对行为识别分类器进行训练，而另一类方法进行行为识别过程中只需要少量样本甚至单样本即可完成。基于第一类的检测方法的取得了较多的理论成果，这些方法在获得较好识别效果的同时却以牺牲时间复杂度为代价，检测需要消耗大量的时间，往往达不到实际系统实时性的要求，而且当训练样本数量不足时，方法的检测性能会大幅度下降，甚至失效。而第二类算法的研究成果相对较少一些，且已有方法都比较耗时。

与基于多样本训练分类器的行为识别方法不同的是所有的基于单样本的行为检测方法从根源上无法克服由背景、人体着装、拍摄角度等造成的同类行为之间的类内差异性的影响。但有时训练行为分类器所需的样本视频很难获取的，所以研究利用单样本进行行为检测与识别的方法是很有意义的，其有特定的应用场景。在实际应用中往往对行为的检测与识别速度有着较高的要求，所以其采用方法的计算复杂度越低越好。但现有的针对基于单样本的行为识别算法研究较少，且它们大都使用了复杂度较高的特征提取与匹配算法，因此不适合对实时性要求高的应用场景。针对这一现状本文提出了一种高实时性的基于单样本的行为检测与识别方法。

发明内容

本发明的目的在于，解决在能够获取到用来检测行为的视频样本数量非常少的情况下，要迅速的对视频中的行为进行识别的问题。具体技术方案实现：一种基于单样本的行为检测与识别方法，步骤如下：

(1)为了保证对视频中行为正确的识别，我们选用的兴趣点检测方法一定要确保从运动的人体身上提取到足够数量的有效兴趣点。因执行者相较与背景有着明显的轮廓信息，因此提取运动目标的轮廓上的特征点是一个很好的选择。为了避免相邻帧差法中运动目标的运动速度对检测效果的影响，本发明根据运动速度的大小动态的调整跨帧的间隔；

(2)成功提取到视频中运动目标的轮廓后，将轮廓上等间隔的点作为兴趣点，再将两幅图像中检测到的兴趣点利用HOG(方向梯度直方图)方法分别进行匹配；

(3)经过以上步骤可以得到一个特征点对集，接下来将特征点对集中逐个特征点对的位移变化在位移空间中进行投票，统计得到位移空间中每个位移单元对应的特征点对数目，即得到表征行为的位移直方图；

(4)使用上述步骤可以得到整个样本视频的位移直方图序列，同样从目标视频中提取到位移直方图序列，紧接着可通过矩阵余弦相似度的方法来衡量样本视频与目标视频的相似度，从而达到了对视频中行为识别的目的。

附图说明

图1是本发明中基于单样本的行为检测与识别系统框图

图2是本发明中速度自适应的轮廓提取框架图

具体实施方式

本发明用于提供一种基于单样本的行为检测与识别方法，为使本发明的目的、技术方案及效果更加清楚、明确，以下对本发明进一步详细说明。

(1)视频中能够表征行为的重要信息都集中在行为的实施者即视频中的运动人体身上。为了保证对视频中行为正确的识别，我们选用的兴趣点检测方法一定要确保从运动的人体身上提取到足够数量的有效兴趣点。因执行者相较与背景有着明显的轮廓信息，因此提取运动目标的轮廓上的特征点是一个很好的选择。常用的检测方法有SIFT特征点、Harris角点，但是SIFT特征点检测的复杂度太高，对硬件的要求很高，检测需要消耗大量的时间，因此不适合实时性的行为检测系统；而Harris角点检测到的属于运动人体的特征点的数目有限，也不利于行为检测的精度的提升。

要提取运动目标的轮廓首先要检测出视频中运动的目标，检测运动目标的常用的方法有帧间差分法与背景减除法。背景减除法需要良好的背景建模才能将运动目标分离出来，而常见的背景建模方法无论是高斯背景建模还是混合高斯建模因其复杂度都很难应用到实际的场景中，而帧间差分法容易受到运动目标的移动速度快慢的影响，当目标移动速度过慢时目标在差分图像中可能会消失，当目标移动速度过快时，在差分图像中会显现两个相同的目标。因此本算法采用改进的速度自适应的轮廓提取方法来提取运动目标的轮廓，该方法融合了帧间差分法和Sobel算子。

为了避免相邻帧差法中运动目标的运动速度对检测效果的影响，方法根据运动速度的大小动态的调整跨帧的间隔，当移动速度过慢时，连续两帧中的目标位置变化小，跨帧间隔自动调大，而当移动速度过快时，连续两帧中的目标位置变化大，跨帧间隔自动调小；

(2)成功提取到视频中运动目标的轮廓后，假定从第i幅图像中等间隔采样得到的特征点集记为P_i，则：

P_i＝{p_i,j∈R²}i＝1,2,…,T j＞0

其中P_i,j为特征点集P_i中第j个特征点，P_i,j＝(x_ij,y_ij)是兴趣点在图像中的坐标位置。

为了有效的对视频中的行为进行表征，需要将两幅图像中属于同一人体上的特征点进行匹配。实验表明，HOG(方向梯度直方图)特征能够较好的匹配在一定程度上存在形变的特征点。首先，提取以各特征点为中心且大小为w×w的图像区域(在此我们将w设定为9)的HOG特征。紧接着在范围σ内，根据约束条件选择其它帧中的特征点与其完成匹配。约束条件如下所示：

其中|x_ij-x_ik|＜σ，|y_ij-y_ik|＜σ限定了搜索的范围，因为在连续视频帧中人体各部分都是在一定的范围内变化的，因此只需要在一定的临域内匹配特征点，这也大大节约了匹配所需的时间成本，但本算法是基于单样本的，不能通过训练来学习参数σ，本文方法通过实验设置σ参数。S(p_1j,p_ik)是度量HOG特征相似性的函数，在本方法中采用曼哈顿距离来定义度量函数，(p_1j,p_i1)是匹配成功的特征点对；

(3)经过以上过程，便可以得到一帧图像中所有的特征点与另一帧图像特征点匹配得到的特征点对集M＝{(p_1j,p_ik),i＝2,…T}。接下来将特征对集中逐个特征点对的位移变化(x_1j-x_il,y_1j-y_il)在位移空间(Δx,Δy)中进行投票，统计得到位移空间中每个位移单元对应的匹配特征点对数目，即可得到表征行为的位移直方图。又因轮廓提取时不可避免的从背景环境中提取到了与行为识别无关的特征点，而其也将会和环境中相应的特征点进行匹配，其位移为零，为了消除背景对后续行为识别的影响，我们可将位移为(0,0)的分量从直方图中去除。

又因每次从图像中提取到的特征点数目不能确定，因此在行为匹配之前为了将视频中目标的行为有效的表征必须利用L₁范数将位移直方图归一化，归一化的公式如下所示：

其中，d′为归一化之前的位移直方图，d为归一化处理后得到的位移直方图，是位移直方图d′的L₁范数；

(4)将帧长为t₀的样本视频通过自适应轮廓提取算法动态的调整帧间隔，继而通过大小为T的滑动窗口将视频分为大小相同的有序视频段，将每个视频段表征为位移直方图，这样便可以得到整个样本视频的位移直方图序列记为d_Src，同样地从目标视频中提取到的位移直方图为序列记为d_Des，我们可以通过矩阵余弦相似度来衡量样本视频与目标视频的相似度。矩阵余弦相似度的度量方法实则计算两个规范化矩阵的Frobenius内积，其定义公式如下：

式中，将其以列向量的形式表示出来为又因其中两个向量与的相似度为：则可以把样本视频与目标视频位移直方图的矩阵余弦相似度改写为加权的向量相似度之和，形如下式：

则可得到计算目标视频中的第k段视频剪辑与样本视频的相似性的公式为：

式中，是目标视频第k段剪辑的位移直方图序列的第i个位移直方图，D_Src(i)是样本视频位移直方图序列的D_Src第i个位移直方图。

可利用通过上面计算得到的相似度，定义用来判定样本视频中包含的行为是否在目标视频剪辑中出现的判别函数f(Des_k,Src)。该判别函数的公式描述如下：

如果经过判别函数f(Des_k,Src)计算得到的结果为1，表明两个位移直方图序列的相似度S(Des_k,Src)大于设定的阈值τ，也就是说可以判定样本视频Src中定义的行为在目标视频剪辑Des_k中出现。同样的由于本文是基于单样本的行为识别方法，所以，阈值τ只能通过实验进行调整设置。

Claims

1.一种基于单样本的行为检测与识别方法，其特征在于，步骤如下：

2.根据权利要求1所述的基于单样本的行为检测与识别方法，其特征在于，采用自适应轮廓提取可解决目标运动速度对轮廓提取的影响。

3.根据权利要求1所述的基于单样本的行为检测与识别方法，其特征在于，使用位移直方图对行为进行表征，接着采用矩阵余弦相似度的方法对行为进行匹配，大大减少了运行时间，使实时性得到满足。

4.根据权利要求1所述的基于单样本的行为检测与识别方法，其特征在于，动态轮廓提取与位移直方表征行为的结合。