CN103577804B - 基于sift流和隐条件随机场的人群异常行为识别方法 - Google Patents

基于sift流和隐条件随机场的人群异常行为识别方法 Download PDF

Info

Publication number
CN103577804B
CN103577804B CN201310494769.9A CN201310494769A CN103577804B CN 103577804 B CN103577804 B CN 103577804B CN 201310494769 A CN201310494769 A CN 201310494769A CN 103577804 B CN103577804 B CN 103577804B
Authority
CN
China
Prior art keywords
sift
pixel
conditional random
random fields
crowd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310494769.9A
Other languages
English (en)
Other versions
CN103577804A (zh
Inventor
章东平
徐凯航
陶玉婷
芦亚飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201310494769.9A priority Critical patent/CN103577804B/zh
Publication of CN103577804A publication Critical patent/CN103577804A/zh
Application granted granted Critical
Publication of CN103577804B publication Critical patent/CN103577804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于SIFT流和隐条件随机场的人群异常行为识别方法,包括了建立相邻帧的SIFT流场,获取行为视频序列的每一帧像素点的运动矢量信息,训练隐条件随机场模型(HCRF)参数,建立隐条件随机场模型,进而识别视频序列中的人群群体异常行为。本发明的目的在于解决传统的基于条件随机场的异常行为识别方法中对人群运动信息特征提取不够准确以及模型识别能力不够丰富的缺点,大大提高了异常行为识别的准确度,可用于公共场所人群群体异常行为的识别。

Description

基于SIFT流和隐条件随机场的人群异常行为识别方法
技术领域
本发明属于图像处理领域,具体是一种基于SIFT流和隐条件随机场的异常行为识别方法,是目前计算机视觉领域中结合SIFT流场和隐条件随机场参数训练并对异常行为进行识别的方法。
背景技术
近些年来,人群行为识别作为计算机视觉的重要课题之一,已经在智能视频监控中应用和普及于公共安全、金融安全、运输、和其他领域中。现有的人群行为识别方法可以分为基于统计的方法和基于描述方法。SIFT流是最近兴起的计算机视觉领域的特征提取方法,对于几何变换、光照变换具有不变性,对于噪声、遮挡、以及背景干扰均具有良好的鲁棒性,并且特征间具有很高的区分度。但是现有技术中缺少基于SIFT流的人群异常行为识别方法。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出一种基于SIFT流和隐条件随机场的人群异常行为识别方法,包括如下步骤:
步骤(1)输入包含正常行为的训练视频和包含打架、斗殴、恐慌的人群行为的测试视频,提取视频序列中每一帧图像每一个像素点的SIFT 描述子,优化SIFT流场;
步骤(2)匹配相邻帧图像像素点,通过SIFT流获取运动矢量信息,统计归类每帧图像的像素点的运动矢量信息,生成加权方向直方图;
步骤(3)将训练视频每一帧的加权方向直方图集合作为输入隐条件随机场模型的一个观察值序列,用于训练隐条件随机场模型的参数
步骤(4)输入测试视频的加权方向直方图集合,用训练得到的隐条件随机场模型识别,输出该段序列属于正常行为的概率,作为最终的识别结果。
进一步的,步骤(1)通过如下方式实现:计算此帧图像中每一个像素点的SIFT 局部特征描述子,建立SIFT金字塔{S(k)},对图像进行自顶而下进行匹配。
进一步的,步骤(2)通过如下方式实现:根据相邻帧的像素点SIFT描述子的匹配,生成像素点运动流场,将每帧所有像素点运动矢量信息归类为12个方向,得到每帧图像的加权方向直方图
进一步的,SIFT描述子采用如下方式计算:
计算每个像素点梯度值及梯度方向:
进一步的,对于任意点像素,取其周围n×n 像素为局部区域。对局部区域内每一点,计算其梯度值m(x, y)和梯度方向θ (x, y)后,将n×n的局部区域均分成m×m 个区块,每个区块内部分别计算加权梯度直方图,其中方向角量化为k个区间,权值由Gauss 函数给出。
进一步的,生成运动流场W=(u,v)时有如下限制:
相邻两帧的像素点p 按照SIFT 描述子s1(p),s2(p)的相似程度进行匹配;
考虑实际情况,流速u2(p)+v2(p)应加以限制,不能过大;
考虑运动的连续性,必须优先匹配像素点的邻近区域N:
此方程通过双平面上的序列置信度传递方法(BP-S)求解。
进一步的,对SIFT流场采用如下方式优化:
建立SIFT 金字塔{S (k) },其中:S (1) =S,对S (k)进行平滑和下采样得到S (k+1);在层k,令Pk 表示要匹配的像素的坐标,Ck 为搜索窗口的中心, W (Pk)为最佳匹配;在图像金字塔最顶层S (3),搜索窗口中心在P3,其大小为m×mm 为图像S (3)的宽);对下一层的搜索时,只需要对这一层的最优流向量W (Pk)所对应的部分进行搜索即可:即:对图像进行自顶而下进行匹配,即对于同一尺度的按照计算像素点的流场,则在尺度搜索时,只需计算S (k)尺度匹配点p 的领域W (P\)即可。
进一步的,分析整段视频序列时,设置滑动窗口的大小为10,即选取10帧的加权方向直方图作为一个观察值,滑动窗口一帧一帧移动,形成观察值序列输入到隐条件随机场中用于训练模型参数
其中,假设每个观察值X对应一个潜在的变量S,一组观察序列对应的变量集合为,隐条件随机场模型通过输入一段行为的观察值序列给出该行为属于正常行为的概率,公式如下:
势函数由θ参数化获得。
本发明的基于SIFT流和隐条件随机场的人群异常行为识别方法,分别输入正常行为和包含恐慌、打架、斗殴的异常行为的视频序列,通过SIFT流场获取像素点运动矢量信息,统计归类加权方向直方图作为观察值序列输入到隐条件随机场中训练模型参数,然后输入测试视频观察值序列到训练得到的模型中来识别人群异常行为。
附图说明
图1是本发明的模型参数训练和识别的流程图;
图2是像素点SIFT描述子的结果图;
图3是SIFT流场优化过程图;
图4是隐条件随机场模型示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,本发明提供的基于SIFT流和隐条件随机场的人群异常行为识别方法包括以下具体步骤:
步骤1、输入包含正常行为的训练视频和包含打架、斗殴、恐慌的人群行为的测试视频,提取视频序列中每一帧图像每一个像素点的SIFT 描述子,优化SIFT流场,实现方式是计算此帧图像中每一个像素点的SIFT 局部特征描述子,建立SIFT金字塔{S(k)},对图像进行自顶而下进行匹配。
步骤2、匹配相邻帧图像像素点,通过SIFT流获取运动矢量信息,统计归类每帧图像的像素点的运动矢量信息,生成加权方向直方图,实现方式是根据相邻帧的像素点SIFT描述子的匹配,生成像素点运动流场,将每帧所有像素点运动矢量信息归类为12个方向,得到每帧图像的加权方向直方图
步骤3、将训练视频每一帧的加权方向直方图集合作为输入隐条件随机场模型的一个观察值序列,用于训练隐条件随机场模型的参数
步骤4、输入测试视频的加权方向直方图集合,用训练得到的隐条件随机场模型识别,输出该段序列属于正常行为的概率,作为最终的识别结果。
其中,无论是用于训练的视频序列还是用于测试的视频序列,都先需要建立该段视频序列的SIFT流场,获取像素点的运动矢量信息W=(u,v),然后将视频序列中每帧图像的的运动矢量信息归类为12个方向,生成加权方向直方图,作为输入隐条件随机场的观察值序列。其步骤如下:
(1)提取视频序列每帧图像上像素点的SIFT描述子
计算每个像素点梯度值及梯度方向:
(2)建立像素区域直方图:
对于任意点像素,取其周围n×n 像素为局部区域。对局部区域内每一点,计算其梯度值m(x, y)和梯度方向θ (x, y)后,将n×n的局部区域均分成m×m 个区块,每个区块内部分别计算加权梯度直方图,其中方向角量化为k 个区间,权值由Gauss 函数给出(σ =1.5)。SIFT 局部特征描述子的生成原理如图2所示。
(3)建立SIFT流场获取运动矢量信息
提取每一像素点SIFT 描述子后,我们需要通过匹配相邻两帧的同一像素点,从而生成运动流场W=(u,v)。考虑三个因素:
相邻两帧的像素点p 按照SIFT 描述子s1(p),s2(p)的相似程度进行匹配。
考虑实际情况,流速u2(p)+v2(p)应加以限制,不能过大。
考虑运动的连续性,必须优先匹配像素点的邻近区域N。
此方程通过双平面上的序列置信度传递方法(BP-S)求解。
(4)SIFT流场的优化:
建立SIFT 金字塔{S (k) },其中:S (1) =S,对S (k)进行平滑和下采样得到S (k+1)。在层k,令Pk 表示要匹配的像素的坐标,Ck 为搜索窗口的中心, W (Pk)为最佳匹配。在图像金字塔最顶层S (3),搜索窗口中心在P3,其大小为m×mm 为图像S (3)的宽)。对下一层的搜索时,只需要对这一层的最优流向量W (Pk)所对应的部分进行搜索即可。即:对图像进行自顶而下进行匹配,即对于同一尺度的按照计算像素点的流场,则在尺度搜索时,只需计算S (k)尺度匹配点p 的领域W (P\)即可,这样可以大大加速计算。金字塔的生成原理如图3所示。
其中,获取了像素点的运动矢量信息之后,我们将一帧图像中像素点的运动矢量信息统计生成加权方向直方图
将每一帧的所有像素点的运动矢量通过以下公式统计为12个方向:
我们通过一个直观的加权方向直方图来表示一帧图像的运动矢量向量场,将一段视频序列的加权方向直方图集合作为输入隐条件随机场的观察值序列。
其中,为了能够分析整段视频序列,我们设置滑动窗口的大小为10,即选取10帧的加权方向直方图作为一个观察值,滑动窗口一帧一帧移动,形成观察值序列输入到隐条件随机场中用于训练模型参数
其中,我们假设每个观察值X对应一个潜在的变量S,一组观察序列对应的变量集合为,隐条件随机场模型通过输入一段行为的观察值序列给出该行为属于正常行为的概率,如图4所示,公式如下:
势函数由θ参数化获得。
我们输入一段视频序列的观察值,得出一个关于正常序列的概率,即可判断是否为异常行为。

Claims (9)

1.一种基于SIFT流和隐条件随机场的人群异常行为识别方法,包括如下步骤:
步骤(1)输入包含正常行为的训练视频和包含打架、斗殴、恐慌的人群行为的测试视频,提取视频序列中每一帧图像每一个像素点的SIFT 描述子,优化SIFT流场;
步骤(2)匹配相邻帧图像像素点,通过SIFT流获取运动矢量信息,统计归类每帧图像的像素点的运动矢量信息,生成加权方向直方图;
步骤(3)将训练视频每一帧的加权方向直方图集合作为输入隐条件随机场模型的一个观察值序列,用于训练隐条件随机场模型的参数
步骤(4)输入测试视频的加权方向直方图集合,用训练得到的隐条件随机场模型识别,输出该视频序列属于正常行为的概率,作为最终的识别结果。
2.如权利要求1所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:步骤(1)通过如下方式实现:计算此帧图像中每一个像素点的SIFT 局部特征描述子,建立SIFT金字塔{S(k)},对图像进行自顶而下进行匹配。
3.如权利要求2所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:步骤(2)通过如下方式实现:根据相邻帧的像素点SIFT描述子的匹配,生成像素点运动流场,将每帧所有像素点运动矢量信息归类为12个方向,得到每帧图像的加权方向直方图
4.如权利要求3所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:SIFT局部特征描述子采用如下方式计算:
计算每个像素点梯度值及梯度方向:
5.如权利要求4所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:对于任意点像素,取其周围n×n 像素为局部区域。
6.如权利要求4所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:对局部区域内每一点,计算其梯度值m(x, y)和梯度方向θ (x, y)后,将n×n的局部区域均分成m×m 个区块,每个区块内部分别计算加权梯度直方图,其中方向角量化为k个区间,权值由Gauss 函数给出。
7.如权利要求3所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:生成像素点运动流场W=(u,v)时有如下限制:
相邻两帧的像素点p 按照SIFT 局部特征描述子s1(p),s2(p)的相似程度进行匹配;
考虑实际情况,流速u2(p)+v2(p)应加以限制;
考虑运动的连续性,必须优先匹配像素点的邻近区域N:
此方程通过双平面上的序列置信度传递方法(BP-S)求解。
8.如权利要求1所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:对SIFT流场采用如下方式优化:
建立SIFT 金字塔{S (k) },其中:S (1) =S,对S (k)进行平滑和下采样得到S (k+1);在层k,令Pk 表示要匹配的像素的坐标,Ck 为搜索窗口的中心, W (Pk)为最佳匹配;在图像金字塔最顶层S (3),搜索窗口中心在P3,其大小为m×mm 为图像S (3)的宽);对下一层的搜索时,只需要对这一层的最优流向量W (Pk)所对应的部分进行搜索即可:即:对图像进行自顶而下进行匹配,即对于同一尺度的按照计算像素点的流场,则在尺度搜索时,只需计算S (k)尺度匹配点p 的领域W (P\)即可。
9.如权利要求3所述的基于SIFT流和隐条件随机场的人群异常行为识别方法,其特征在于:分析整段视频序列时,设置滑动窗口的大小为10,即选取10帧的加权方向直方图作为一个观察值,滑动窗口一帧一帧移动,形成观察值序列输入到隐条件随机场中用于训练模型参数
其中,假设每个观察值X对应一个潜在的变量S,一组观察序列对应的变量集合为,隐条件随机场模型通过输入一段行为的观察值序列给出该行为属于正常行为的概率,公式如下:
势函数由θ参数化获得。
CN201310494769.9A 2013-10-21 2013-10-21 基于sift流和隐条件随机场的人群异常行为识别方法 Active CN103577804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310494769.9A CN103577804B (zh) 2013-10-21 2013-10-21 基于sift流和隐条件随机场的人群异常行为识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310494769.9A CN103577804B (zh) 2013-10-21 2013-10-21 基于sift流和隐条件随机场的人群异常行为识别方法

Publications (2)

Publication Number Publication Date
CN103577804A CN103577804A (zh) 2014-02-12
CN103577804B true CN103577804B (zh) 2017-01-04

Family

ID=50049555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310494769.9A Active CN103577804B (zh) 2013-10-21 2013-10-21 基于sift流和隐条件随机场的人群异常行为识别方法

Country Status (1)

Country Link
CN (1) CN103577804B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268546A (zh) * 2014-05-28 2015-01-07 苏州大学 一种基于主题模型的动态场景分类方法
CN105631462A (zh) * 2014-10-28 2016-06-01 北京交通大学 结合置信度和贡献度的基于时空上下文的行为识别方法
CN107341471B (zh) * 2017-07-04 2019-10-01 南京邮电大学 一种基于双层条件随机场的人体行为识别方法
CN109886117A (zh) * 2019-01-21 2019-06-14 青岛海信网络科技股份有限公司 一种目标行为检测的方法和设备
CN110197122B (zh) * 2019-04-24 2023-06-30 上海理工大学 获取图像的局部特征描述子的方法及异常行为图像检索法
CN111062246A (zh) * 2019-11-06 2020-04-24 盐城吉大智能终端产业研究院有限公司 基于视频图像的密集人群异常行为的检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719216A (zh) * 2009-12-21 2010-06-02 西安电子科技大学 基于模板匹配的运动人体异常行为识别方法
CN101980250A (zh) * 2010-10-15 2011-02-23 北京航空航天大学 基于降维局部特征描述子和隐条件随机场的目标识别方法
CN102682303A (zh) * 2012-03-13 2012-09-19 上海交通大学 基于lbp加权社会力模型的人群异常事件检测方法
CN102799863A (zh) * 2012-07-02 2012-11-28 中国计量学院 视频监控中的团体人群异常行为检测方法
CN102930248A (zh) * 2012-10-22 2013-02-13 中国计量学院 基于机器学习的人群异常行为检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101300247B1 (ko) * 2011-11-11 2013-08-26 경희대학교 산학협력단 마르코프 연쇄 은닉 조건부 랜덤 필드 모델 기반의 패턴 인식 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719216A (zh) * 2009-12-21 2010-06-02 西安电子科技大学 基于模板匹配的运动人体异常行为识别方法
CN101980250A (zh) * 2010-10-15 2011-02-23 北京航空航天大学 基于降维局部特征描述子和隐条件随机场的目标识别方法
CN102682303A (zh) * 2012-03-13 2012-09-19 上海交通大学 基于lbp加权社会力模型的人群异常事件检测方法
CN102799863A (zh) * 2012-07-02 2012-11-28 中国计量学院 视频监控中的团体人群异常行为检测方法
CN102930248A (zh) * 2012-10-22 2013-02-13 中国计量学院 基于机器学习的人群异常行为检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种人群异常行为检测系统的设计与实现;杨琳等;《铁路计算机应用》;20101231;第19卷(第7期);第37-41页 *
人群异常状态检测的图分析方法;朱海龙等;《自动化学报》;20120531;第38卷(第5期);第742-750页 *

Also Published As

Publication number Publication date
CN103577804A (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN103577804B (zh) 基于sift流和隐条件随机场的人群异常行为识别方法
CN102521565B (zh) 低分辨率视频的服装识别方法及系统
CN102831618B (zh) 基于霍夫森林的视频目标跟踪方法
CN103824070B (zh) 一种基于计算机视觉的快速行人检测方法
CN105160310A (zh) 基于3d卷积神经网络的人体行为识别方法
Mou et al. Group-level arousal and valence recognition in static images: Face, body and context
CN105528794A (zh) 基于混合高斯模型与超像素分割的运动目标检测方法
Aurangzeb et al. Human behavior analysis based on multi-types features fusion and Von Nauman entropy based features reduction
CN106355138A (zh) 基于深度学习和关键点特征提取的人脸识别方法
CN105574510A (zh) 一种步态识别方法及装置
CN106384345B (zh) 一种基于rcnn的图像检测以及流量统计方法
CN103605986A (zh) 一种基于局部特征的人体动作识别方法
CN105718866A (zh) 一种视觉目标检测与识别方法
CN103714181A (zh) 一种层级化的特定人物检索方法
CN105469050B (zh) 基于局部时空特征描述与金字塔词汇树的视频行为识别方法
CN103699874A (zh) 基于surf流和lle稀疏表示的人群异常行为识别方法
CN106127812A (zh) 一种基于视频监控的客运站非出入口区域的客流统计方法
Lu et al. Multi-object detection method based on YOLO and ResNet hybrid networks
CN106570490A (zh) 一种基于快速聚类的行人实时跟踪方法
CN104063721A (zh) 一种基于语义特征自动学习与筛选的人类行为识别方法
WO2013075295A1 (zh) 低分辨率视频的服装识别方法及系统
CN105138995A (zh) 基于骨架信息的时不变及视不变的人体行为识别方法
Paul et al. Extraction of facial feature points using cumulative histogram
CN104376334A (zh) 一种多尺度特征融合的行人比对方法
CN103955671A (zh) 基于快速判别公共向量算法的人体行为识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant