CN103984915B - 一种监控视频中行人重识别方法 - Google Patents
一种监控视频中行人重识别方法 Download PDFInfo
- Publication number
- CN103984915B CN103984915B CN201410070931.9A CN201410070931A CN103984915B CN 103984915 B CN103984915 B CN 103984915B CN 201410070931 A CN201410070931 A CN 201410070931A CN 103984915 B CN103984915 B CN 103984915B
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- sample
- label
- matrix
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于人体对称性与结构化特征稀疏表示的监控视频中行人重识别方法。该方法利用待识别行人的多帧图像作为训练,先进行行人检测和行人轮廓的提取,后根据人体对称性把行人的轮廓分为头部、左躯干、右躯干、左腿和右腿五个感兴趣区域。通过选取适当的特征对这五个感兴趣区域进行特征提取,并输入线性模型中,可得到待重识别的结果。本发明贴切实际情况,可有效地解决视频监控网络中行人重识别准确率低的问题。
Description
技术领域
本发明属于智能监控领域,具体涉及一种监控视频中行人重识别方法。
背景技术
安全是一个社会和企业赖以生存和发展的基础,尤其是在现代化技术高度发展的今天,犯罪更趋智能化,手段更隐蔽,加强现代化的安防技术就显得更为重要。例如,如何在机场、车站、码头、宾馆、商场等口岸或公共场所的人群中发现特定的目标。安全部门、公安部门以往的做法只能是靠人工布控、蹲守。这种方式除了耗费大量的警力以外,还往往因为有关人员的疏忽而造成特定目标漏网;犯罪嫌疑人在被控制以后,不愿意透露自己的真实身份,而且身上没有任何可以证明身份的线索。公安人员往往因为无从确认其身份而不得不将其释放。在受害人身份确认方面同样也存在类似的难题;在出入境管理方面,常常有受控人员使用假的身份证件而成功逃脱有关部门的监控。
智能监控技术对于维护国家安全和社会稳定、打击各类犯罪活动具有十分重大的意义。在新兴的信息安全应用领域,行人重识别技术提供了一种更为安全可靠易用的身份鉴别手段,从而提升了整个网络信息系统的安全性能,有效地遏止各类网络违法犯罪活动。同时,行人重识别技术在传统的安防领域可以便捷的与原有技术实现紧密的结合,大大提升原有系统的智能化程度、安全性及易用性,拓展了原有系统的应用领域,从而促进了传统产业的技术升级。
发明内容
为了解决整个国家、社会的安全防范水平,达到威慑犯罪、惩治罪犯、维护社会稳定、保障国家安全的目的,本发明提供一种监控视频中行人重识别方法,可以较好地满足公安部门对安全的需求,包括步骤:
步骤(1)行人轮廓提取:分别提取地点A监控视频中出现的行人轮廓,及其他地点监控视频中的行人轮廓;
步骤(2)行人特征提取:基于人体对称性,把行人的轮廓分为头部、左躯干、右躯干、左腿和右腿五个感兴趣区域,并分别提取每个感兴趣区域的特征,选用特征为:颜色、纹理、形状。
步骤(3)行人重识别:行人重识别是指:从地点B的监控视频中找出地点A监控视频中出现的某些行人。假设地点A待识别行人有c个,每个行人pζ有多帧图像,ξ为c个 行人中的一个,ξ≤c,每个人的每一帧作为一个样本,xi是该样本的特征向量,i为其中一个样本,且该行人对应的标签为yζ。同时,也得到地点B重识别候选行人的样本特征x′i。构建基于结构化特征稀疏表示的线性回归模型学习的代价函数,建立行人重识别线性回归模型。将x,y,x′一起输入到模型中,即可得到相应的预测值,再通过自适应阈值最终得到人重识别的结果。
进一步的,所述步骤(2)中对行人特征提取具体为:
1)把提取出来的行人轮廓通过人体对称性分成五个局部,分别为头部、左躯干、右躯干、左腿和右腿。头部分割公式:其中 上下体分割公式:其中左右躯干分割:左右腿分割:d(.,.)是欧氏距离,α是纵坐标,β是横坐标,B(.,.)是区域,δ=I/4。
2)采用颜色相关图特征cκ提取行人的颜色信息、灰度共生矩阵特征tκ提取感兴趣区域的纹理和边界特征sκ来获取图像的形状参数,其中κ为对应感兴趣区域,这三种特征分别对行人的五个感兴趣区域进行特征提取。每提取一个行人轮廓设定为一个独立样本,xi是该样本的特征向量,i为其中一个样本,即xj=[c1 c2 c3 c4 c5t1 t2 t3 t4 t5 s1 s2 s3 s4s5]T,所以总体样本的特征矩阵为X=[x1,x2,...,xn]∈Rd×n,d为特征向量的维数,n为样本总数。
进一步的,所述步骤(3)中构建基于结构化特征稀疏表示的线性回归模型学习的代价函数具体为:
1)构建线性回归函数为Y=XTW+1nbT,X∈Rd×n是训练样本,
Y∈Rn×c是行人身份信息,W∈Rd×c是投影矩阵;1n∈Rn定义为有n个全为1的列向量。
b∈Rc×1是偏置量,W是为了特征选择从X到Y的映射矩阵。模型的代价函数可定义为: loss(W)是一个逻辑损失函数,γ是正则化参数;
2)采用拉普拉斯特征映射的流形学习方法,损失函数最小化定义为:定义了一个拉普拉斯矩阵为:L=D-K,其中D是一个对角矩阵,定义式为:K是权值函数,与xi和xj的关系是:
3)为了提高重识别符合度,即在测试过程中,定义一个预测矩阵为:F=[f1,f2,...,fn]T∈Rn×c,此F是待重识别行人的预测矩阵,满足F=XTW+1nbT,使预测的结果F更匹配原始信息Y:优化项为:Tr((F-Y)TU(F-Y)),定义了一个对角矩阵U,其中若xi有标签,则Uii=∞,若没有标签,则Uii=1;
4)由式Y=XTW+1nbT,即最小二乘表达式可写为:
其中Xi和Yi表示有标签的行人特征和对应原始真实标签;
5)由于训练数据量较大,所以,为有效的表示行人信息就要用较少的数据来捕获感兴趣目标,所采用稀疏表示来优化代价函数,||W||2,1的定义如下:
6)综上所述,优化后的基于结构化特征稀疏表示的线性回归模型学习的代价函数表达式为:
附图说明
图1是本发明的监控视频中行人重识别方法流程图;
图2是该监控视频中行人重识别方法前景提取示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,本发明的监控视频中行人重识别方法,包括如下步骤:
步骤(1)行人轮廓提取:分别提取地点A监控视频中出现的行人轮廓,及其他地点监控视 频中的行人轮廓;
步骤(2)行人特征提取:基于人体对称性,把行人的轮廓分为头部、左躯干、右躯干、左腿和右腿五个感兴趣区域,并分别提取每个感兴趣区域的特征,选用特征为:颜色、纹理、形状。
步骤(3)行人重识别:行人重识别是指:从地点B的监控视频中找出地点A监控视频中出现的某些行人。假设地点A待识别行人有c个,每个行人pζ有多帧图像,ξ为c个行人中的一个,ξ≤c,每个人的每一帧作为一个样本,xi是该样本的特征向量,i为其中一个样本,且该行人对应的标签为yζ。同时,也得到地点B重识别候选行人的样本特征x′i。构建基于结构化特征稀疏表示的线性回归模型学习的代价函数,建立行人重识别线性回归模型。将x,y,x′一起输入到模型中,即可得到相应的预测值,再通过自适应阈值最终得到人重识别的结果。
进一步的,所述步骤(1)中行人轮廓提取具体为:
1)把地点A和地点B的视频采用基于HOG+SVM的行人检测方法对每张图片中的行人进行检测,检测出来的行人用大小I×J的方框框起来;
2)对检测出来的行人区域利用高斯混合模型的方法提取每一帧图片的行人轮廓;
进一步的,所述步骤(2)中对行人特征提取具体为:
3)把提取出来的行人轮廓通过人体对称性分成五个局部,分别为头部、左躯干、右躯干、左腿和右腿。头部分割公式:其中上下体分割公式:其中左右躯干分割:左右腿分割:d(.,.)是欧氏距离,α是纵坐标,β是横坐标,B(.,.)是区域,δ=I/4。
4)采用颜色相关图特征cκ提取行人的颜色信息、灰度共生矩阵特征tκ提取感兴趣区域的纹理和边界特征sκ来获取图像的形状参数,其中κ为对应感兴趣区域,这三种特征分别对行人的五个感兴趣区域进行特征提取。每提取一个行人轮廓设定为一个独立样本,xi是该 样本的特征向量,i为其中一个样本,即xj=[c1 c2 c3 c4 c5 t1 t2 t3 t4 t5 s1 s2 s3s4 s5]T,所以总体样本的特征矩阵为X=[x1,x2,...,xn]∈Rd×n,d为特征向量的维数,n为样本总数。
进一步的,所述步骤(3)中行人重识别具体为:
7)把所选取的行人做好相应的标签标记,即每一个样本对应一个标签,每个人有多个样本。标签矩阵定义为Y=[y1,y2,...,yn]T∈{0,1}n×c,Y中包含了所有样本的身份信息,c是行人的人数,每个人会被收集到多个样本,若xi是该j人,则Yij=1,否则为零;
8)构建线性回归函数为Y=XTW+1nbT,X∈Rd×n是训练样本,
Y∈Rn×c是行人身份信息,W∈Rd×c是投影矩阵;1n∈Rn定义为有n个全为1的列向量。
b∈Rc×1是偏置量,W是为了特征选择从X到Y的映射矩阵。模型的代价函数可定义为: loss(W)是一个逻辑损失函数,γ是正则化参数;
9)定义一个预测矩阵为:F=[f1,f2,...,fn]T∈Rn×c,此F是待重识别行人的预测矩阵,满足F=XTW+1nbT;
10)采用拉普拉斯特征映射的流形学习方法,损失函数最小化定义为:定义了一个拉普拉斯矩阵为:L=D-K,其中D是一个对角矩阵,定义式为:K是权值函数,与xi和xj的关系是:
11)为了提高重识别符合度,即在测试过程中,使预测的结果F更匹配原始信息Y:优化项为:Tr((F-Y)TU(F-Y)),定义了一个对角矩阵U,其中若xi有标签,则Uii=∞,若没有标签,则Uii=1;
12)由于训练数据量较大,所以,为有效的表示行人信息就要用较少的数据来捕获感兴趣目标,所采用稀疏表示来优化代价函数,||W||2,1的定义如下:
13)综上所述,优化后的基于结构化特征稀疏表示的线性回归模型学习的代价函数表达 式为:第j个人预测值的均值为εj是第j行人的帧数,ω是行人总数,最后一项是约束被测行人的ε帧图像有相同的标签;
14)代价函数表达式中所用参数有k、η、γ,其中参数γ和μ可从{10-3,10-2,10-1,1,10,102,103}中通过实验测试选取,k可通过实验测得最优解得到。
15)通过迭代法求解上述的最优化问题,得到矩阵W、F、b。
16)选择自适应阈值T,定义T=μ±3σ,对F进行阈值处理,即得检测图像的标签Z。通过阈值后所得的标签Z为:
其中,n*为检测的样本数。
Claims (1)
1.一种基于人体对称性与结构化特征稀疏表示的监控视频中行人重识别方法,包括步骤:
步骤(1)行人轮廓提取:分别提取地点A监控视频中出现的行人轮廓,及其他地点监控视频中的行人轮廓;
步骤(2)行人特征提取:基于人体对称性,把行人的轮廓分为头部、左躯干、右躯干、左腿和右腿五个感兴趣区域,并分别提取每个感兴趣区域的特征,选用特征为:颜色、纹理、形状;
步骤(3)行人重识别:行人重识别是指:从地点B的监控视频中找出地点A监控视频中出现的某些行人;
假设地点A待识别行人有个,每个行人有多帧图像,为个行人中的一个,,每个人的每一帧作为一个样本,是该样本的特征向量,为其中一个样本,且该行人对应的标签为;
同时,也得到地点B重识别候选行人的样本特征;构建基于结构化特征稀疏表示的线性回归模型学习的代价函数,建立行人重识别线性回归模型;将一起输入到模型中,即可得到相应的预测值,再通过自适应阈值最终得到人重识别的结果;所述步骤(1)中行人轮廓提取具体为:
把地点A和地点B的视频采用基于HOG+SVM的行人检测方法对每张图片中的行人进行检测,检测出来的行人用大小的方框框起来;
对检测出来的行人区域利用高斯混合模型的方法提取每一帧图片的行人轮廓;
所述步骤(2)中对行人特征提取具体为:
把提取出来的行人轮廓通过人体对称性分成五个局部,分别为头部、左躯干、右躯干、左腿和右腿;
头部分割公式:,其中是使达到最小值时的值,,是在图像前景区域,以纵坐标为轴的对称区域的归一化面积差,上下体分割公式:,其中,是在图像前景区域,以纵坐标为轴的对称区域的颜色特征距离,左右躯干分割:;左右腿分割:,、是使图像前景区域颜色和面积差值最小的值;是欧氏距离,是纵坐标,是横坐标,是区域,;
采用颜色相关图特征提取行人的颜色信息、灰度共生矩阵特征提取感兴趣区域的纹理和边界特征来获取图像的形状参数, 其中为对应感兴趣区域,这三种特征分别对行人的五个感兴趣区域进行特征提取;
每提取一个行人轮廓设定为一个独立样本,是该样本的特征向量,为其中一个样本,即,所以总体样本的特征矩阵为,为特征向量的维数,为样本总数;
所述步骤(3)中行人重识别具体为:
把所选取的行人做好相应的标签标记,即每一个样本对应一个标签,每个人有多个样本;
标签矩阵定义为,中包含了所有样本的身份信息,是行人的人数,每个人会被收集到多个样本,若是第人,则,否则为零;
构建线性回归函数为,是训练样本,
是行人身份信息, 是投影矩阵; 定义为有n个全为1的列向量;
是偏置量,是为了特征选择从到的映射矩阵;
模型的代价函数可定义为:,是一个逻辑损失函数,是正则化参数;
定义一个预测矩阵为:,此是待重识别行人的预测矩阵,满足;
采用拉普拉斯特征映射的流形学习方法,损失函数最小化定义为:,定义了一个拉普拉斯矩阵为: ,其中是一个对角矩阵,定义式为:,是权值函数,与和的关系是:
,其中中的元素是由和之间的相似度决定的;
为了提高重识别符合度,即在测试过程中,使预测的结果更匹配原始信息:优化项为:,定义了一个对角矩阵,其中若有标签,则,若没有标签,则;
由于训练数据量较大,所以,为有效的表示行人信息就要用较少的数据来捕获感兴趣目标,所采用稀疏表示来优化代价函数,的定义如下: ;
综上所述,优化后的基于结构化特征稀疏表示的线性回归模型学习的代价函数表达式为:,Fij第j人的第i个样本的预测输出,第个人预测值的均值为,是第j行人的帧数,是行人总数,最后一项是约束被测行人的帧图像有相同的标签;
代价函数表达式中所用参数有、、,其中参数和可从中通过实验测试选取,可通过实验测得最优解得到;
通过迭代法求解上述的最优化问题,得到矩阵、、b;
选择自适应阈值,定义,对进行阈值处理,即得检测图像的标签;
通过阈值后所得的标签为:
其中,,为检测的样本数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410070931.9A CN103984915B (zh) | 2014-02-28 | 2014-02-28 | 一种监控视频中行人重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410070931.9A CN103984915B (zh) | 2014-02-28 | 2014-02-28 | 一种监控视频中行人重识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103984915A CN103984915A (zh) | 2014-08-13 |
CN103984915B true CN103984915B (zh) | 2017-11-24 |
Family
ID=51276877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410070931.9A Active CN103984915B (zh) | 2014-02-28 | 2014-02-28 | 一种监控视频中行人重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103984915B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463246A (zh) * | 2014-12-08 | 2015-03-25 | 天津大学 | 一种基于流形的线性回归学习方法 |
CN105005760B (zh) * | 2015-06-11 | 2018-04-24 | 华中科技大学 | 一种基于有限混合模型的行人再识别方法 |
CN105095870B (zh) * | 2015-07-27 | 2018-07-20 | 中国计量学院 | 基于迁移学习的行人重识别方法 |
CN105354548B (zh) * | 2015-10-30 | 2018-10-26 | 武汉大学 | 一种基于ImageNet检索的监控视频行人重识别方法 |
CN105426871B (zh) * | 2015-12-16 | 2018-12-11 | 华南理工大学 | 一种适用于运动行人再识别的相似性度量计算方法 |
CN105956550B (zh) * | 2016-04-29 | 2019-06-04 | 浪潮电子信息产业股份有限公司 | 一种视频鉴别的方法和装置 |
CN106682620A (zh) * | 2016-12-28 | 2017-05-17 | 北京旷视科技有限公司 | 人脸图像采集方法及装置 |
CN106874884B (zh) * | 2017-03-03 | 2019-11-12 | 中国民航大学 | 基于部位分割的人体再识别方法 |
CN108694347B (zh) * | 2017-04-06 | 2022-07-12 | 北京旷视科技有限公司 | 图像处理方法和装置 |
US10762635B2 (en) | 2017-06-14 | 2020-09-01 | Tusimple, Inc. | System and method for actively selecting and labeling images for semantic segmentation |
CN107273873B (zh) * | 2017-07-13 | 2019-09-17 | 武汉大学 | 基于不规则视频序列的行人重识别方法及系统 |
US10671083B2 (en) | 2017-09-13 | 2020-06-02 | Tusimple, Inc. | Neural network architecture system for deep odometry assisted by static scene optical flow |
US10552979B2 (en) | 2017-09-13 | 2020-02-04 | TuSimple | Output of a neural network method for deep odometry assisted by static scene optical flow |
CN107844753A (zh) * | 2017-10-20 | 2018-03-27 | 珠海习悦信息技术有限公司 | 视频图像中的行人重识别方法、装置、存储介质及处理器 |
CN107844752A (zh) * | 2017-10-20 | 2018-03-27 | 常州大学 | 一种基于块稀疏表示的行人重识别方法 |
CN108062562B (zh) * | 2017-12-12 | 2020-03-10 | 北京图森未来科技有限公司 | 一种物体重识别方法及装置 |
CN108596034B (zh) * | 2018-03-23 | 2021-05-11 | 广州大学 | 一种基于目标中心编码外观模型的行人重识别方法 |
CN108985149A (zh) * | 2018-06-01 | 2018-12-11 | 平安科技(深圳)有限公司 | 人物图像识别方法、服务器及计算机可读存储介质 |
CN109145769A (zh) * | 2018-08-01 | 2019-01-04 | 辽宁工业大学 | 融合图像分割特征的目标检测网络设计方法 |
CN109492610B (zh) * | 2018-11-27 | 2022-05-10 | 广东工业大学 | 一种行人重识别方法、装置及可读存储介质 |
CN110321862B (zh) * | 2019-07-09 | 2023-01-10 | 天津师范大学 | 一种基于紧致三元损失的行人再识别方法 |
CN112288865A (zh) * | 2019-07-23 | 2021-01-29 | 比亚迪股份有限公司 | 地图的构建方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708294B (zh) * | 2012-05-11 | 2015-04-01 | 上海交通大学 | 基于半监督局部线性回归的自适应参数软测量方法 |
CN103218604A (zh) * | 2013-04-03 | 2013-07-24 | 上海交通大学 | 交通场景中基于路面提取的行人检测方法 |
CN103325122B (zh) * | 2013-07-03 | 2016-01-20 | 武汉大学 | 基于双向排序的行人检索方法 |
-
2014
- 2014-02-28 CN CN201410070931.9A patent/CN103984915B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103984915A (zh) | 2014-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103984915B (zh) | 一种监控视频中行人重识别方法 | |
Tao et al. | Smoke detection based on deep convolutional neural networks | |
CN109583342B (zh) | 基于迁移学习的人脸活体检测方法 | |
Frizzi et al. | Convolutional neural network for video fire and smoke detection | |
CN104866829B (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
CN104166841B (zh) | 一种视频监控网络中指定行人或车辆的快速检测识别方法 | |
CN104504394B (zh) | 一种基于多特征融合的密集人数估计方法和系统 | |
CN106803301A (zh) | 一种基于深度学习的人脸识别门禁方法及系统 | |
CN104091176A (zh) | 人像比对在视频中的应用技术 | |
CN102844766A (zh) | 基于人眼图像的多特征融合身份识别方法 | |
CN109190475A (zh) | 一种人脸识别网络与行人再识别网络协同训练方法 | |
CN107169106A (zh) | 视频检索方法、装置、存储介质及处理器 | |
CN107766797A (zh) | 一种陌生人识别方法和系统 | |
CN109977887A (zh) | 一种抗年龄干扰的人脸识别方法 | |
CN105095867A (zh) | 基于深度学习的快速动态人脸提取、识别方法 | |
CN109492528A (zh) | 一种基于高斯和深度特征的行人再识别方法 | |
CN112069891A (zh) | 一种基于光照特征的深度伪造人脸鉴别方法 | |
CN108345900A (zh) | 基于颜色纹理分布特征的行人重识别方法及其系统 | |
CN113221655A (zh) | 基于特征空间约束的人脸欺骗检测方法 | |
Venkataraman et al. | Support vector machine based classification of medicinal plants using leaf features | |
Bekkanti et al. | Computer based detection of alcohol consumed candidates using face expressions with SIFT and bag of words | |
CN105550642B (zh) | 基于多尺度线性差分特征低秩表示的性别识别方法及系统 | |
CN106886771A (zh) | 基于模块化pca的图像主信息提取方法及人脸识别方法 | |
Huo et al. | 3DVSD: An end-to-end 3D convolutional object detection network for video smoke detection | |
Gao et al. | A feature fusion strategy for person re-identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |