CN106778595B

CN106778595B - 基于高斯混合模型的人群中异常行为的检测方法

Info

Publication number: CN106778595B
Application number: CN201611136453.2A
Authority: CN
Inventors: 于明; 郭团团; 刘依; 于洋; 师硕; 阎刚; 郭迎春
Original assignee: Hebei University of Technology
Current assignee: Hebei University of Technology
Priority date: 2016-12-12
Filing date: 2016-12-12
Publication date: 2020-04-07
Anticipated expiration: 2036-12-12
Also published as: CN106778595A

Abstract

本发明基于高斯混合模型的人群中异常行为的检测方法，涉及应用电子设备进行识别图形的方法，首先在预处理阶段使用高斯混合模型对输入视频进行背景建模来提取ROI，并利用形态学方法消除背景的影响，然后将人群看作整体来提取ROI光流运动特征和SIFT运动特征，再对输入视频序列中的图像进行分块，按图像子块分配运动特征，对不同子块建立高斯混合模型，利用最大期望EM算法训练高斯混合模型，检测人群中异常行为的图像，克服了现有技术中在高密度场景下人群存在遮挡和光照变化给行人运动分析带来的干扰，同时监控视频下不同区域运动状态的不同也给人群异常行为检测模型的建立带来了干扰，容易造成误检的缺陷。

Description

基于高斯混合模型的人群中异常行为的检测方法

技术领域

本发明的技术方案涉及应用电子设备进行识别图形的方法，具体地说是基于高斯混合模型的人群中异常行为的检测方法。

背景技术

近年来，公众场所的安全保障问题日益得到广泛关注。在火车站、公园以及人流量比较大的场所，持刀伤人、人群冲突及恐怖袭击等问题时刻威胁着人民群众的生命安全。虽然多数的公众场合都安装有监控系统，能为调查取证提供重要线索，但还无法智能报警。由于监控视频数据量庞大，通过人工查看监控视频的方式效率低下，随着智能监控技术的发展，监控视频下的人群异常行为的检测技术将有助于解决上述问题。

现有的人群异常行为的检测方法，一是通过跟踪算法跟踪视频中的目标，获得目标在视频中的运动轨迹，分析运动轨迹从而来判断场景中是否存在异常事件。但是该方法只适用于人群密度低的场景，对于高密度人群场景，运动目标较多，且容易发生遮挡，很难获得精准的运动轨迹；二是通过光流法来提取视频中的运动速度大小，设置固定阈值，大于阈值的运动速度被判断为异常事件。由于现实场景容易受到背景和光照变化干扰，并且由于监控摄像头的视频角度问题，同一场景中距离摄像头远近不同但运动速度相同的人群在检测中获得的运动速度却不同，固定阈值无法准确地将人群异常事件监测出来。2008年，Antoni B.Chan等人提出了混合动态纹理特征MDT(Mixture of Dynamic Textures)，该特征结合了运动信息和纹理信息，进行视频分割，将不同的运动形态分割开；在2010年，VijayMahadevan和Weixin Li等人受GMM背景建模思想启发，将MDT特征运用到视频监控的人群异常行为检测上，从时间异常和空间异常两方面对监控视频进行分析从而检测人群异常事件，但该方法也只能适用于低密度人群的场景；在2014年，Weixin Li等人进一步改进完善了混合动态纹理特征，克服了异常种类在不同人群规模下定义模糊的问题，提出H-MDT((Hierarchical Mixture of Dynamic Texture)模型，以多尺度空间规模定义异常图，但该方法的缺点是计算耗时，实时性差；CN104636751提出的基于时间递归神经网络的人群异常检测和定位系统及方法，通过划分时空块构造多规模光流直方图和Gabor小波纹理特征，来训练时间递归神经网络模型判断人群异常，但该方法只能检测预先标注好的人群异常，检测的人群异常种类受限；CN102799863A公开了视频监控中的团体人群异常行为检测方法，利用MGHMM模型对人群轨迹建立模型，通过模型判断人群轨迹是否异常，由于该方法依赖于跟踪算法得到运动轨迹，高密度人群中存在遮挡，难以获得较为准确的轨迹，因此难适用于高密度场景。CN104156979A提出了一种基于高斯混合模型的视频中异常行为在线检测方法，先合成原图像的低分辨率图像，分别计算原图像和低分辨率图像的光流，再对图像分块计算高斯混合模型，最后计算待检测图像的高斯混合模型与标准高斯混合模型的差异得分，通过差异得分与固定阈值的比较来判断待检测图像中是否有异常，但该方法采用单一的光流特征，光流特征容易受光照变化和场景中背景因素的影响，因此难以适用于环境复杂的场景。

总之，现有技术的人群异常行为的检测方法能检测稀疏场景的人群异常行为，但仍然没有克服高密度场景下人群存在遮挡和光照变化带来的影响，同时监控视频下不同区域运动状态的不同也给人群异常行为检测模型的建立带来了干扰，容易造成误检。

发明内容

本发明所要解决的技术问题是：提供基于高斯混合模型的人群中异常行为的检测方法，首先在预处理阶段使用高斯混合模型对输入视频进行背景建模来提取ROI，并利用形态学方法消除背景的影响，然后将人群看作整体来提取ROI光流运动特征和SIFT运动特征，再对输入视频序列中的图像进行分块，按图像子块分配运动特征，对不同子块建立高斯混合模型，利用最大期望EM算法训练高斯混合模型，检测人群中异常行为的图像，克服了现有技术中在高密度场景下人群存在遮挡和光照变化给行人运动分析带来的干扰，同时监控视频下不同区域运动状态的不同也给人群异常行为检测模型的建立带来了干扰，容易造成误检的缺陷。

上述ROI是Region of Interest的缩写，即感兴趣区域；SIFT是Scale-invariantfeature transform的缩写，即尺度不变特征变换。

本发明解决该技术问题所采用的技术方案是：基于高斯混合模型的人群中异常行为的检测方法，具体步骤如下：

第一步，输入视频序列并进行预处理：

(1.1)利用高斯混合模型对输入视频进行背景建模：

将摄像头采集的含有人群的视频序列输入到计算机中，输入的视频帧为N帧，每帧图像共有L×H个像素点，将输入的所有视频帧转化为灰度图像I_i，其中i＝1,…,N；

对第i帧灰度图像I_i中每个像素点建立K个高斯混合模型，每个高斯混合模型共有四个参数：优先级s、权重w、均值m和方差v，首先将第i帧灰度图像I_i中的每个像素点的灰度值与对应的K个高斯混合模型逐个进行匹配，然后根据该像素点的匹配情况更新与其对应的高斯混合模型，匹配和更新的公式如下：

其中，I_i(x,y)表示第i帧灰度图像I_i位于坐标(x,y)处的灰度值，m_k表示该坐标对应的第k个高斯混合模型的均值，1≤k≤K，v_k表示第k个高斯混合模型的方差，α为学习效率，w_k为第k个高斯混合模型的权重，s_k为优先级，更新的过程是，当第i帧灰度图像I_i中某像素点(x,y)处的灰度值I_i(x,y)与其第k个高斯混合模型匹配，即满足公式(1a)，则判断该像素点为背景点，并将其灰度值设置为0，然后根据公式(1b)-(1e)更新第k个高斯混合模型的四个参数，反之当像素点(x,y)处的灰度值I_i(x,y)与其k个高斯混合模型均不匹配时，即不满足公式(1a)，则该像素点为前景点，并将其灰度值置为255，同时将该像素点的原始灰度值I_i(x,y)作为其对应的K个高斯混合模型中优先级最低的模型的均值m_k；经过上述高斯混合模型的匹配与更新后，得到二值图像

二值图像

中的前景区域，即为初始的ROI，由此完成利用高斯混合模型对输入视频进行背景建模；

(1.2)形态学处理：

对上述(1.1)步得到的ROI进行中值滤波，再进行两次膨胀处理，填充ROI空洞，再将二值图像

和第i帧灰度图像I_i进行“与”操作，保留第i帧灰度图像I_i与二值图像

中前景区域位置相同的像素值，并将背景区域像素值设置为255，得到只含有运动物体的图像I_i′，由此完成形态学处理；

第二步，提取ROI光流运动特征和SIFT运动特征：

(2.1)提取ROI各像素点的光流运动特征：

利用金字塔LK光流法检测出上述(1.2)步得到的只含有运动物体的图像I′_i和只含有运动物体的图像I′_i+4中所有对应ROI内像素的位置坐标(x,y)和(x′,y′)，利用欧式距离公式计算两点之间的距离，得到各像素点的光流运动特征F_i，所用欧式距离公式(2)如下：

F_i(x,y)＝((x′-x)²+(y′-y)²)^1/2 (2)，

其中F_i(x,y)为第i时刻只含有运动物体的图像I′_i在4帧时间段内像素点的移动距离，即坐标点(x,y)处的像素点的光流运动特征F_i，由此得到ROI各像素点的光流运动特征；

(2.2)提取ROI中图像I′_i的SIFT运动特征：

对上述(1.2)步得到的只含有运动物体的图像I′_i和只含有运动物体的图像I′_i+4提取SIFT运动特征，得到只含有运动物体的图像I′_i和只含有运动物体的图像I′_i+4的所有SIFT特征点描述，匹配上述I′_i与I′_i+4两幅图像的SIFT特征点，同时用RACSAN算法对匹配结果进行筛选，得到上述图像I′_i与图像I′_i+4匹配的特征点

与

由欧式距离公式(2)计算特征点

与

在4帧时间段内的移动距离，得到ROI中第i时刻只含有运动物体的图像I′_i的SIFT运动特征S_i；

第三步，按图像子块分配运动特征：

首先将上述(1.2)步得到的只含有运动物体的图像I′_i分成M×M的不重叠的图像子块，然后将上述第二步得到的光流运动特征F_i和SIFT运动特征S_i分别分配于对应的分块后的图像子块中，并将每一子块q中的光流运动特征F_i,q和SIFT运动特征S_i,q串联成[F_i,qS_i,q]，该q＝1,2,…,M×M，得到只含有运动物体的图像I′_i中的每个图像子块的运动特征序列t_i,q＝[t_i,q,1,t_i,q,2,…,t_i,q,l]，其中i为所在帧序号，q为所在子块序号，l为第i帧第q个子块中包含光流运动特征点个数和SIFT运动特征点个数的总和，由此完成按图像子块分配运动特征；

第四步，利用最大期望EM算法训练高斯混合模型：

在上述三个步骤处理完所有输入视频图像后，将训练视频中每帧图像相应位置的子块的运动特征，包括光流运动特征F_i,q和SIFT运动特征S_i,q，按照视频序列顺序串联后得到整个视频在每个子块的运动特征序列T_q＝[t_1,q,t_2,q,…,t_N,q]，对每个子块建立R个高斯混合模型，使得每个子块对应R个高斯混合模型，用最大期望EM算法对高斯混合模型进行训练，至完成利用最大期望EM算法训练高斯混合模型；

第五步，检测人群中异常行为的图像：

将摄像头采集的待检测的含有人群的视频序列输入到计算机中，将输入的所有待检测的视频帧转化为灰度图像

其中i＝1,…,N，对待检测的第i帧灰度图像

由上述第一、二、三步的方法得到该图像

中第q个图像子块的运动特征序列t_i,q，判断其中第j个特征t_i,q,j是否符合上述第四步中对应利用最大期望EM算法训练的子块高斯混合模型，判断公式(4)如下：

公式(4)中，m_q,r为第q个图像子块中第r个高斯模型的均值，v_q,r为第q个图像子块中第r个高斯模型的方差，对于满足上述判断公式(4)的高斯模型的t_i,q,j，则判断该特征属于正常运动特征，反之则判断为异常运动特征，统计每个图像子块中异常运动特征的个数，将图像子块中异常特征个数超过三个的图像子块判断为异常块，对该异常块进行标注，并判断该图像

为人群中异常行为的图像，由此检测出人群中异常行为的图像；

至此完成人群中异常行为的检测。

上述基于高斯混合模型的人群中异常行为的检测方法，所述输入的视频帧为N帧，其中，在UMN数据库中N为7739帧，在UCSD数据库的Ped1场景中N为14000帧，在UCSD数据库的Ped2场景中N为5040帧。

上述基于高斯混合模型的人群中异常行为的检测方法，所述每帧图像共有L×H个像素点，其中，在UMN数据库L×H为320×240像素，在UCSD数据库的Ped1场景中L×H为238×158像素，在UCSD数据库的Ped2场景中L×H为360×240像素。

上述基于高斯混合模型的人群中异常行为的检测方法，所述最大期望EM算法操作如下：输入第q个子块的运动特征序列T_q，先根据如下公式(3d)计算后验概率β，再按如下公式(3a)、(3b)和(3c)对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r计算期望，

公式(3)中，如公式(3d)所示，B为第q个子块的运动特征序列T_q的长度，T_q,b为第q个子块的运动特征序列T_q中第b个特征，β_b,r为后验概率；如公式(3e)所示，N_r(T_q,b,m_q,r,v_q,r)为第r个高斯模型的概率分布密度函数；如公式(3f)所示，循环输入第q个子块的运动特征序列T_q，更新模型参数，直到第q个子块的运动特征序列T_q的概率P(T_q|(m_q,v_q))不再变化时，将每个子块的每个高斯模型的均值和方差保存下来，作为异常判断的参数，

重复输入第q个子块的运动特征序列T_q，先根据公式(3d)计算后验概率β，再按公式(3a)、(3b)和(3c)对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r计算期望，这先后两步操作，更新第r个高斯模型，利用公式(3f)对迭代进行终止判决，至T_q的概率P(T_q|(m_q,_vq))不再变化，迭代终止，完成对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r的计算期望。

上述基于高斯混合模型的人群中异常行为的检测方法，所述高斯混合模型背景建模、光流法、SIFT算法、EM(Expectation Maximization)算法都是公知的。

本发明的有益效果是：与现有技术相比，本发明的突出的实质性特点和显著进步如下：

(1)本发明方法在预处理阶段将含有人群的视频序列的前景区域即ROI检测出来，然后利用形态学方法填充ROI中的孔洞，使得ROI既消除背景的影响又完整的包含了运动目标，然后采用光流法计算ROI的人群光流和采用SIFT算法提取视频的SIFT运动特征，将人群看作一个整体来提取特征，再对输入视频序列中的图像进行分块，对不同子块建立高斯混合模型，根据ROI人群光流及ROI的SIFT特征对子块进行异常种类检测，省去了行人检测及多目标跟踪等复杂的过程，对于光照变化和人群遮挡的场景依然有很好的效果，克服了现有技术中在高密度场景下人群存在遮挡和光照变化给行人运动分析带来的干扰，同时监控视频下不同区域运动状态的不同也给人群异常行为检测模型的建立带来了干扰，容易造成误检的缺陷。

(2)本发明方法采用了对ROI分块的方法进行人群异常行为检测，由于监控视频下不同区域行人运动特征不同，通过正常场景的数据训练出不同分块的高斯混合模型，替代了人工的经验判断，对每个子块用其对应的高斯混合模型来检测异常，提高了人群异常行为检测准确率，同时这种方法也能很好的定位出异常行为人群在图像中的具体位置。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明方法的流程示意框图。

图2是本发明方法中利用高斯混合模型背景建模以及形态学处理后的ROI效果图，其中：

图2(a)为原始输入图像；

图2(b)为对输入视频序列并进行预处理得到的ROI效果图。

图3是本发明方法中对图像分块检测异常行为示意图。

具体实施方式

图1所示实施例表明，本发明方法的流程是：输入视频序列并进行预处理→提取ROI光流运动特征和SIFT运动特征→按图像子块分配运动特征→利用最大期望EM算法训练高斯混合模型→检测人群中异常行为的图像。

图2所示实例显示了利用高斯混合模型背景建模检测出场景中的运动物体，其中，

图2(a)为输入的三个不同场景中含有人群的三帧视频序列图像，其中左边是一幅人群四散的图，中间图的人群中有自行车出现，右边图的人群中有汽车和自行车出现。

图2(b)显示对图2(a)的输入的三个不同场景中含有人群的三帧视频序列图像进行预处理得到的ROI效果图，具体地说是经过利用高斯混合模型对图2(a)的输入的三个不同场景中含有人群的三帧视频序列图像进行背景建模，得到二值图像

二值图像

中的前景区域即为初始的ROI，对得到的ROI进行中值滤波，再进行两次膨胀处理，填充ROI空洞，再将二值图像

中前景区域位置相同的像素值，并将背景区域像素值设置为255，得到只含有运动物体的图像I′_i。

图3所示实施例显示了人群异常检测效果图，先利用光流法和SIFT算法提取特征后，再对图像进行分块，分别将检测到的速度大小归类到各自的分块图像中，利用对应的高斯混合模型来判断各个分块中的速度是否属于正常，将分块中异常点个数大于3的块用“×”号标注，直观地表示出检测到的异常行为位置，得到最终的人群异常行为检测效果图。

实施例1

本实施例的基于高斯混合模型的人群中异常行为的检测方法，具体步骤如下：

第一步，输入视频序列并进行预处理：

(1.1)利用高斯混合模型对输入视频进行背景建模：

将摄像头采集的含有人群的视频序列输入到计算机中，输入的视频帧为N帧，每帧图像共有L×H个像素点，将输入的所有视频帧转化为灰度图像I_i，其中i＝1,…,N；本实施例中，在UMN数据库中N为7739帧，在UCSD数据库的Ped1场景中N为14000帧，在UCSD数据库的Ped2场景中N为5040帧；本实施例中，在UMN数据库L×H为320×240像素，在UCSD数据库的Ped1场景中L×H为238×158像素，在UCSD数据库的Ped2场景中L×H为360×240像素。

其中，I_i(x,y)表示第i帧灰度图像I_i位于坐标(x,y)处的灰度值，m_k表示该坐标对应的第k个高斯混合模型的均值，1≤k≤K，v_k表示第k个高斯混合模型的方差，α为学习效率，这里α取0.1，w_k为第k个高斯混合模型的权重，s_k为优先级，更新的过程是，当第i帧灰度图像I_i中某像素点(x,y)处的灰度值I_i(x,y)与其第k个高斯混合模型匹配，即满足公式(1a)，则判断该像素点为背景点，并将其灰度值设置为0，然后根据公式(1b)-(1e)更新第k个高斯混合模型的四个参数，反之当像素点(x,y)处的灰度值I_i(x,y)与其k个高斯混合模型均不匹配时，即不满足公式(1a)，则该像素点为前景点，并将其灰度值置为255，同时将该像素点的原始灰度值I_i(x,y)作为其对应的K个高斯混合模型中优先级最低的模型的均值m_k；经过上述高斯混合模型的匹配与更新后，得到二值图像

二值图像

(1.2)形态学处理：

第二步，提取ROI光流运动特征和SIFT运动特征：

(2.1)提取ROI各像素点的光流运动特征：

利用金字塔LK光流法检测出上述(1.2)步得到的只含有运动物体的图像I_i′和只含有运动物体的图像I′_i+4中所有对应ROI内像素的位置坐标(x,y)和(x′,y′)，利用欧式距离公式计算两点之间的距离，得到各像素点的光流运动特征F_i，所用欧式距离公式(2)如下：

F_i(x,y)＝((x′-x)²+(y′-y)²)^1/2 (2)，

(2.2)提取ROI中图像I′_i的SIFT运动特征：

由于光流运动特征易受光照变化影响，辅助SIFT提取运动特征能克服光照变化影响，对上述(1.2)步得到的只含有运动物体的图像I′_i和只含有运动物体的图像I′_i+4提取SIFT运动特征，得到只含有运动物体的图像I′_i和只含有运动物体的图像I′_i+4的所有SIFT特征点描述，匹配上述I′_i与I′_i+4两幅图像的SIFT特征点，同时用RACSAN算法对匹配结果进行筛选，得到上述图像I′_i与图像I′_i+4匹配的特征点

与

由欧式距离公式(2)计算特征点

与

对上述(1.2)步得到的只含有运动物体的图像I′_i，采用光流法和SIFT算法对只含有运动物体的图像I′_i提取运动特征，由于该图像I′_i中只含有运动物体，提取的运动特征没有背景的干扰，同时提高了效率；

第三步，按图像子块分配运动特征：

由于监控视频下不同区域行人运动特征不同，首先将上述(1.2)步得到的只含有运动物体的图像I′_i分成M×M的不重叠的图像子块，然后将上述第二步得到的光流运动特征F_i和SIFT运动特征S_i分别分配于对应的分块后的图像子块中，并将每一子块q中的光流运动特征F_i,q和SIFT运动特征S_i,q串联成[F_i,q S_i,q]，该q＝1,2,…,M×M，得到只含有运动物体的图像I′_i中的每个图像子块的运动特征序列t_i,q＝[t_i,q,1,t_i,q,2,…,t_i,q,l]，其中i为所在帧序号，q为所在子块序号，l为第i帧第q个子块中包含光流运动特征点个数和SIFT运动特征点个数的总和，由此完成按图像子块分配运动特征；

第四步，利用最大期望EM算法训练高斯混合模型：

在上述三个步骤处理完所有输入视频图像后，将训练视频中每帧图像相应位置的子块的运动特征，包括光流运动特征F_i,q和SIFT运动特征S_i,q，按照视频序列顺序串联后得到整个视频在每个子块的运动特征序列T_q＝[t_1,q,t_2,q,…,t_N,q]，对每个子块建立R个高斯混合模型，使得每个子块对应R个高斯混合模型，本实施例中R＝3，用最大期望EM算法对高斯混合模型进行训练，至完成利用最大期望EM算法训练高斯混合模型；

所述最大期望EM算法操作如下：输入第q个子块的运动特征序列T_q，先根据如下公式(3d)计算后验概率β，再按如下公式(3a)、(3b)和(3c)对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r计算期望，

重复输入第q个子块的运动特征序列T_q，先根据公式(3d)计算后验概率β，再按公式(3a)、(3b)和(3c)对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r计算期望，这先后两步操作，更新第r个高斯模型，利用公式(3f)对迭代进行终止判决，至T_q的概率P(T_q|(m_q,v_q))不再变化，迭代终止，完成对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r的计算期望。

第五步，检测人群中异常行为的图像：

其中i＝1,…,N，由上述第一、二、三步的方法得到该图像

至此完成人群中异常行为的检测。

实施例2

本实施例是对本发明提出的基于高斯混合模型的人群中异常行为的检测方法在UMN和UCSD数据库上进行实验验证，对比方法有：稀疏重构结合大规模字典选择的人群异常检测Sparse+LSDS、局部敏感哈希滤波的人群异常检测Locality Sensitive HashingFilters、半参数扫描统计的人群异常检测Semiparametric Scan Statistic和稀疏重构的人群异常检测Sparse reconstruction。

A.在UMN数据库中进行实验，UMN数据库中异常种类为人群恐慌四散，分三个场景为scene1、scene2和scene3，实验结果以AUC值作为检测的评价指标，AUC值是指ROC曲线的右下方面积，ROC曲线的横坐标是FPR，纵坐标是TPR计算公式如下(5a)、(5b)所示：

其中FP表示异常帧被判断为正常帧的个数，TN表示异常帧被判断为异常帧的个数，TP表示正常帧被判断为正常帧的个数，FN表示正常帧被判断为异常帧的个数，AUC值越大说明分类效果越好，实验结果如表1所示，表中用“/”分割的三个AUC值从左到右分别对应于三个场景scene1、scene2和scene3：

表1 UMN数据库检测结果AUC值对比

由实验结果可知，本发明提出的基于高斯混合模型的人群中异常行为的检测方法在UMN数据库三个场景中的AUC值分别为0.9962、0.9831、0.995，均优于其他方法在这三个场景中的效果。

B.在UCSD数据库中两个场景中进行验证，UCSD数据库是由University ofCalifornia大学的两处校园场景Ped1场景和Ped2场景组成，该数据库的异常种类是人行道上出现的滑板、自行车和汽车等，实验结果以AUC值作为评价指标，实验结果如下表2所示：

表2 UCSD数据库检测结果AUC值对比

由实验结果可知，本发明提出的基于高斯混合模型的人群中异常行为的检测方法在UCSD数据库的Ped1、Ped2场景中AUC值分别为0.87、0.94，均优于其他方法。

上述实施例中，所述高斯混合模型背景建模、光流法、SIFT算法、EM(ExpectationMaximization)算法都是公知的。

Claims

1.基于高斯混合模型的人群中异常行为的检测方法，其特征在于具体步骤如下：

第一步，输入视频序列并进行预处理：

(1.1)利用高斯混合模型对输入视频进行背景建模：

二值图像

(1.2)形态学处理：

第二步，提取ROI光流运动特征和SIFT运动特征：

(2.1)提取ROI各像素点的光流运动特征：

F_i(x,y)＝((x′-x)²+(y′-y)²)^1/2 (2)，

(2.2)提取ROI中图像I′_i的SIFT运动特征：

与

由欧式距离公式(2)计算特征点

与

第三步，按图像子块分配运动特征：

首先将上述(1.2)步得到的只含有运动物体的图像I′_i分成M×M的不重叠的图像子块，然后将上述第二步得到的光流运动特征F_i和SIFT运动特征S_i分别分配于对应的分块后的图像子块中，并将每一子块q中的光流运动特征F_i,q和SIFT运动特征S_i,q串联成[F_i,q S_i,q]，该q＝1,2,…,M×M，得到只含有运动物体的图像I′_i中的每个图像子块的运动特征序列t_i,q＝[t_i,q,1,t_i,q,2,…,t_i,q,l]，其中i为所在帧序号，q为所在子块序号，l为第i帧第q个子块中包含光流运动特征点个数和SIFT运动特征点个数的总和，由此完成按图像子块分配运动特征；

第四步，利用最大期望EM算法训练高斯混合模型：

第五步，检测人群中异常行为的图像：

其中i＝1,…,N，对待检测的第i帧灰度图像

由上述第一、二、三步的方法得到该图像

至此完成人群中异常行为的检测。

2.根据权利要求1所述基于高斯混合模型的人群中异常行为的检测方法，其特征在于：所述输入的视频帧为N帧，其中，在UMN数据库中N为7739帧，在UCSD数据库的Ped1场景中N为14000帧，在UCSD数据库的Ped2场景中N为5040帧。

3.根据权利要求1所述基于高斯混合模型的人群中异常行为的检测方法，其特征在于：所述每帧图像共有L×H个像素点，其中，在UMN数据库L×H为320×240像素，在UCSD数据库的Ped1场景中L×H为238×158像素，在UCSD数据库的Ped2场景中L×H为360×240像素。

4.根据权利要求1所述基于高斯混合模型的人群中异常行为的检测方法，其特征在于：所述最大期望EM算法操作如下：输入第q个子块的运动特征序列T_q，先根据如下公式(3d)计算后验概率β，再按如下公式(3a)、(3b)和(3c)对第q个子块中第r个高斯模型的三个参数：权重w_q,r、均值m_q,r和方差v_q,r计算期望，