CN107844775A - 一种基于块稀疏表示的行人重识别方法 - Google Patents

一种基于块稀疏表示的行人重识别方法 Download PDF

Info

Publication number
CN107844775A
CN107844775A CN201711112535.8A CN201711112535A CN107844775A CN 107844775 A CN107844775 A CN 107844775A CN 201711112535 A CN201711112535 A CN 201711112535A CN 107844775 A CN107844775 A CN 107844775A
Authority
CN
China
Prior art keywords
pedestrian
feature
rarefaction representation
block
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711112535.8A
Other languages
English (en)
Inventor
王洪元
孙金玉
张继
张文文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou University
Original Assignee
Changzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou University filed Critical Changzhou University
Priority to CN201711112535.8A priority Critical patent/CN107844775A/zh
Publication of CN107844775A publication Critical patent/CN107844775A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉中的行人重识别技术领域,尤其是一种基于块稀疏表示的行人重识别方法,包括以下步骤:步骤1、行人训练集和测试集的划分;步骤2、提取行人特征,所述行人特征包括行人颜色特征与行人纹理特征;步骤3、进行行人特征变换;步骤4、构建块稀疏表示的行人重识别模型;步骤5、交替方向框架求解模型;步骤6、计算残差进行行人身份的判别,有效解决了传统的单摄像机视角限制,克服多摄像机视角下行人重识别困难;本发明专利对行人遮挡情况可以很好建模从而更好地对行人进行匹配。本发明对行人的姿态变化、光照影响、外貌以及遮挡均具有很强的鲁棒性。

Description

一种基于块稀疏表示的行人重识别方法
技术领域
本发明涉及计算机视觉中的行人重识别技术领域,尤其是一种基于块稀疏表示的行人重识别方法。
背景技术
行人重识别是计算机视觉领域重要的问题之一,其中行人重识别目标是在不同地点通过不同的非重叠摄相机视角识别某一个行人的所有图像,从而找出行人轨迹。由于其在智能监控、多目标跟踪等领域具有重要的意义,近年来得到了国内外研究者的广泛关注。
事实上,在行人重识别领域主要的复杂之处在于同一个行人通常在不同时间被相互之间非重叠的摄像机所拍摄,这就导致拍摄到的图像会因为不同的光照条件、不同的相机视角、不同的行人姿态甚至不同的行人衣着或外观等原因,而产生很大的变化。因此,行人重识别问题通常具有以下几个特点:1)因为在实际的监控环境中,不能有效的利用脸部的有效信息,所以只能利用行人的外貌特征进行识别;2)在不同的摄像头下,因尺度、光照和拍摄角度的变化,同一个行人的不同图片中,外观特征也会有一定程度的变化;3)因为行人姿态和摄像头角度的改变,在不同摄像头中,不同行人的外貌特征可能比同一个行人的外貌特征更相似。基于以上特点,当前的行人重识别研究工作可以大致分为:基于外貌的特征表示方法和基于距离度量学习方法两类。前者利用纹理和颜色直方图等特征描述行人外貌,如文献“Gheissari N,Sebasetian T B,Hartley R。Person Reidentification UsingSpartiotemporal Appearance[C]。IEEE Computer Society Conference on ComputerVision Pattern Recognition,2006:1528-1535。”提取行人外貌特征中不变的区域,在每个稳定不变的区域上提取多种颜色特征,采用三角形模型表示行人身体结构,通过模型匹配计算两个行人图像的距离。文献“Farenzena M,Bazzani L,Perina A。Person re-identification by symmetry-driven accumulation of local features[C]。ComputerVision and Pattern Recognition(CVPR),2010:2360-2367。”将人体按照结构划分成不同区域,分别提取加权HSV直方图和纹理特征,再分别对不同的特征采用不同的距离函数计算距离,最终距离按照不同的权重将不同特征的距离加权求和得到;文献“Cai Y,Pietikainen M。Person Re-identification Based on Global Color Context[C]。Procof Lecture Notes in Computer Science,2011:205-215”将位置信息融入到HSV颜色直方图中,提出全局颜色背景(global color context,GCC)方法。基于距离度量学习的行人重识别方法则是通过训练,找出有最大区分度的特征分量,再进行建模实现目标重识别。如文献“Weinberger KQ,Saul LK。Distance Metric Learning for Large Margin NearestNeighbor Classification[J]。Journal of Machine Learning Research,2006,10(1):207-244。”提出大间隔最近邻分类(Large Margin Nearest Neighbor,LMNN)距离测度学习算法;文献“Zheng W S,Gong S,Xiang T。Person re-identification by probabilisticrelative distance comparison[C]。IEEE Conference on Computer Vision andPattern Recognition,2011:649-656。”首次引入尺度学习算法的思想,仅采用LMNN中三元组形式的样本对,提出基于概率相对距离比较(Probabilistic Relative DistanceComparison,PRDC)的距离测度学习算法;文献“Zheng W S,Gong S,Xiang T。Re-identification by Relative Distance Comparison[J]。IEEE Transactions onPattern Analysis and Machine Intelligence,2013,35(3):653-68。”提出将行人重识别视作一个相对距离比较(relative distance comparison,RDC)的学习问题,在他的方法中,各类特征并非一视同仁对待,目的也是将正样本的距离最大化及负样本的距离最小化,该方法表现出对于外观变化更大的宽容性。文献“许允喜,蒋云良,陈方。基于支持向量机增量学习和LBPoost的人体目标再识别算法[J]。光子学报,2011,40(5):758-763。”采用视觉单词树直方图和全局颜色直方图构建所跟踪目标的人体外观模型,并使用SVM增量学习进行在线训练;文献“Xiong F,Gou M,Camps O,et al。Person Re-Identification UsingKernel-Based Metric Learning Methods[M]//Computer Vision–ECCV 2014,2014:1-16。”提出了一种新的基于内核的距离学习方法,将归一化成对约束成分分析(regularizedPairwise Constrained Component Analysis,rPCCA)方法用于行人再识别问题;文献“Chen D,Yuan Z,Hua G。Similarity learning on an explicit polynomial kernelfeature map for person re-identification[C]。Conference on Computer Vision andPattern Recognition,2015:1565-1573。”提出了一种相似性学习(Similarity Learning)算法,实质是基于显示内核特征图(explicit kernel feature map)计算特征相似性距离,提高算法鲁棒性;文献“You J,Wu A,Li X,et al。Top-push Video-based Person Re-identification[J]。IEEE Conference on Computer Vision and Pattern Recognition,2016。”提出top-push距离学习(TDL)方法,该方法基于视频上的研究,主要思路即进一步增大行人类间差异,缩小类内差异。显然这些行人重识别方法取得了很好的效果,但是都是基于全部行人特征基础上的研究,加之行人重识别一直以来受遮挡、姿态变化、光照、视角等因素影响,研究效果并不显著,进一步提升仍是困难重重。
近年来,稀疏表示理论在计算机视觉领域发挥了重要作用,如目标跟踪、图像识别以及图像复原等问题。特别是人脸识别问题中,稀疏表示理论得到广泛应用。例如文献“Wright J,Yang A Y,Ganesh A,et al。Robust Face Recognition via SparseRepresentation[J]。IEEE Transactions on Pattern Analysis and MachineIntelligence,2008:31(2):210-227。”的稀疏表示分类算法(SRC)是一个比较有效的人脸识别算法。基于SRC算法主旨思想,本发明假设任一张行人图像都可以用同一行人训练样本的线性组合来表示,通过寻找测试样本相对于整个训练集的稀疏表示系数来发现测试图像所属的用户身份。借助于先进的高维凸优化技术(如L1范数最小化),稀疏表示系数可以被精确稳定地恢复出来,解的精度和鲁棒性都有理论上的保证。与现有多数方法相比,SRC方法直接利用了高维数据分布的基本特性(即“稀疏性”)进行统计推断,可以有效地应对维数灾难问题。文献“Yang M,Zhang D,Feng X.Fisher discrimination dictionary learningfor sparse representation[C]。Computer Vision(ICCV),2011IEEE InternationalConference on。IEEE。201 1:543-550。”Yang等人在2011年的ICCV上提出了FisherDiscriminative Dictionary Learning(FDDL)算法来学习一个结构化字典,因此可以采用基于重构的方法来对测试样本进行分类。该算法不仅对字典施加了判别性,而且还考虑到了稀疏编码的判别性。Fisher判别准则被应用到了稀疏编码之上,使得训练样本的稀疏编码具有小的类内散度和大的类间散度,这可以进一步提高学习到的字典的判别性。
然而基于稀疏表示的分类方法并没有将这种结构考虑进去。因此,文献“Elhamifar E,Vidal R。Robust classifcation using structured sparserepresentation[C]。Computer Vision and Pattern Recognitio 2011IEEE Conferenceon。IEEE。20 1 1:1 873-1 879。”考虑使用稀疏表示技巧在多个子空间环境下进行分类任务。直观上来说所有训练样本组成的字典应该具有块结构,并且来自同一个类别的训练样本组成了字典的某些块。可以将分类归结为结构化稀疏复原问题,目的在于从字典中找到最少数量的字典块来表示一个测试样例。传统的基于稀疏表示分类方法旨在找到一个测试样本最稀疏的表示,但是这可能并不是最好的分类规则。
然而,基于分类方法的稀疏表示在行人重识别问题上未曾受到广泛关注。虽然有些方法采取稀疏表,也并未利用到行人特征向量字典固有的块结构。
行人重识别领域主要的问题在于同一个行人通常在不同时间被相互之间非重叠的摄像机所拍摄,导致拍摄到的图像会因为不同的光照条件、不同的相机视角、不同的行人姿态甚至不同的行人衣着或外观等原因,产生很大的变化。因此,行人重识别问题通常具有以下几个特点:1)在实际的监控环境中,不能有效的利用脸部的有效信息,只能利用行人的外貌特征进行识别;2)在不同的摄像头下,因尺度、光照和拍摄角度的变化,同一个行人的不同图片中,外观特征也会有一定程度的变化;3)行人姿态和摄像头角度的改变,在不同摄像头中,不同行人的外貌特征可能比同一个行人的外貌特征更相似。
因此本发明提出一种新的方法用于行人重识别问题,将分类归结为块结构化稀疏复原问题,与传统的基于稀疏表示分类方法旨在找到一个测试样本最稀疏的表示不同的是,本发明方法目的在于从字典中找到最少数量的字典块来表示一个测试样例。之后利用交替方向框架求解相关块稀疏极小化问题。并且在2个公开的视频序列数据集PRID 2011和iLIDS-VID上进行实验,证实了该方法与同类方法比较时(特别是那些涉及复杂背景以及有遮挡的场景)的优越性与鲁棒性,此方法对行人目标姿态变化、环境光照变化、目标遮挡等具有很强的鲁棒性。
发明内容
本发明要解决的技术问题是:为了解决现有技术中行人重识别问题通常具有的以上问题,本发明提供了一种基于块稀疏表示的行人重识别方法,包括以下步骤:步骤1、行人训练集和测试集的划分;步骤2、提取行人特征,所述行人特征包括行人颜色特征与行人纹理特征;步骤3、进行行人特征变换;步骤4、构建块稀疏表示的行人重识别模型;步骤5、交替方向框架求解模型;步骤6、计算残差进行行人身份的判别,有效解决了传统的单摄像机视角限制,克服多摄像机视角下行人重识别困难;本发明专利对行人遮挡情况可以很好建模从而更好地对行人进行匹配。本发明对行人的姿态变化、光照影响、外貌以及遮挡均具有很强的鲁棒性。
本发明解决其技术问题所采用的技术方案是:
一种基于块稀疏表示的行人重识别方法,包括以下步骤:
步骤1、行人训练集和测试集的划分;
步骤2、提取行人特征,所述行人特征包括行人颜色特征与行人纹理特征;
步骤3、进行行人特征变换;
步骤4、构建块稀疏表示的行人重识别模型;
步骤5、交替方向框架求解模型;
步骤6、计算残差进行行人身份的判别。
作为优选,所述步骤2中在进行行人特征提取前,先将待提取图像统一进行归一化处理成大小,并且分块为像素大小,且每一小块在水平和竖直方向上均有50%的重叠部分;对于分块后用于提取特征的图像,主要提取HS(色调:Hue、饱和度:Saturation)颜色直方图、Lab特征和Gabor特征;对于每一张行人图像,其在水平方向有7个分块,根据特征提取的内容,每个块中有20个特征通道,每个通道又被表示为16维直方图向量,即每幅图像在特征空间中被表示为维度的全局图像特征向量。
作为优选,所述步骤3中对行人特征的变换,主要是采用典型相关分析(CCA)对高维特征进行转换,将训练集用于学习投影矩阵并将测试集行人特征投影到该投影空间。
作为优选,所述步骤4构建基于块稀疏表示的行人重识别模型,需要先对行人特征构建数据集特征字典D,该字典是由块向量串联而成,且对应块向量与测试集中待识别一致行人近似呈线性关系。
作为优选,所述步骤6中对行人身份进行判断,需要将待识别行人特征与在投影空间变换后表示的该行人特征之间进行残差项量计算,对所求的所有残差向量求其最小,就能识别出该行人的对应标识。
本发明的有益效果是:本发明提供了一种基于块稀疏表示的行人重识别方法,包括以下步骤:步骤1、行人训练集和测试集的划分;步骤2、提取行人特征,所述行人特征包括行人颜色特征与行人纹理特征;步骤3、进行行人特征变换;步骤4、构建块稀疏表示的行人重识别模型;步骤5、交替方向框架求解模型;步骤6、计算残差进行行人身份的判别,有效解决了传统的单摄像机视角限制,克服多摄像机视角下行人重识别困难;本发明专利对行人遮挡情况可以很好建模从而更好地对行人进行匹配。本发明对行人的姿态变化、光照影响、外貌以及遮挡均具有很强的鲁棒性。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1为本发明的行人重识别方法的系统流程图;
图2为本发明采用的行人特征提取示意图;
图3为本发明的行人特征转换的示意图;
图4(a)为在PRID2011数据集上实验的结果;
图4(b)为在iLIDS-VID数据集上实验的结果。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
下面将结合附图1-4并结合实施例,来详细说明本发明。
图1给出了基于块稀疏表示的行人重识别方法的系统流程图:将公开数据集里的行人图像随机选择将之划分为大小相等的训练集和测试集。然后对行人进行特征描述,首先要将行人图像进行归一化处理,并将之分块为水平与竖直方向上均有50%重叠的块,分别提取行人的颜色特征(HS颜色直方图、Lab特征)与纹理特征(Gabor特征)。对所提取的高维特征进行特征变换,投影空间学习,有效避免高维特征运算中造成的维数灾难问题,为提高行人识别率打好基础。然后对行人所对应的多张行人图像进行数据集字典构造,每个行人的图像形成字典的一个块,最终字典由所有行人的字典块串联而成,再依据行人数据集图像与所对应的图像间的线性表示关系建立块稀疏表示模型;对于遮挡以及遭遇的数据损坏等情况,则对模型进行一步优化。最后对行人身份识别,即对将待识别行人特征与在投影空间变换后表示的该行人特征之间进行残差项量计算,对所求的所有残差向量求其最小,就能识别出该行人的对应标识。
一种基于块稀疏表示的行人重识别方法,包括以下步骤:
步骤1、划分数据集
随机选择行人图像将之划分为大小相等的训练集和测试集;由于本发明所选择的数据集中每个行人有多张图像,所以每一个行人在数据集视角和查询集视角下都随机选择各5张图像提取行人特征。
步骤2、提取行人的颜色特征与纹理特征:
如图2,在进行行人特征提取前,先将待提取图像统一进行归一化处理成128×48大小,并且分块为32×48像素大小,且每一小块在水平和竖直方向上均有50%的重叠部分。对于分块后用于提取特征的图像,主要提取HS(色调:Hue、饱和度:Saturation)颜色直方图、Lab特征和Gabor特征。对于每一张行人图像,其在水平方向有7个分块,根据特征提取的内容,每个块中有20个特征通道,每个通道又被表示为16维直方图向量。所以每幅图像在特征空间中被表示为7×20×16=2240维度的全局图像特征向量。
步骤3、进行特征变换:
对于行人图像所提取的特征所在的空间看作是基础空间,由于行人在基础空间中高维的特征(识别过程中易造成维数灾难)以及行人重识别所面临的遮挡、光照、视角、姿态等综合因素,使得行人在重识别过程中效率低下。
针对行人的高维特征在识别过程中易造成维数灾难问题,可以采用典型相关分析(CCA)对行人的高维特征进行转换。它能对给定的两组变量寻找一组线性映射,将多维数据投影到一个子空间中,使投影后的两组数据间的相关性达到最大,在一定程度上有效避免原本高维特征在运算中所引起的维数灾难。CCA是一种简单的用于求投影矩阵的方法,同时也是一种统计两组随机变量之间关系的数学方法。因此采用典型相关分析(CCA)对特征进行投影,使经过投影空间后的行人特征更具有匹配重识别的能力,大大提高重识别率。
图3给出了行人特征转换的示意图。对给定的查询集特征向量,将它映射到投影空间并解出一个块稀疏恢复问题用于决定它的分类。
步骤4、构建块稀疏表示的行人重识别模型:
Z表示在数据集里行人的数量,第i个行人有n幅图像,该行人的第j张图像特征向量表示为gik∈Rd,k=1,2,...,n表示经投影空间转换后关于在数据集中的第k张图像的d维特征向量。
带有标记i行人的n幅图像提取的特征数据形成字典Gi=[gi1 gi2 … gin]∈Rd×n。现给定一张待识别行人图像p,假设其属于第i个行人,则依据文献“Wright J,Yang A Y,Ganesh A,et al。Robust Face Recognition via Sparse Representation[J]。IEEETransactions on Pattern Analysis and Machine Intelligence,2008:31(2):210-227。”只需用第i个行人的数据集图像特征向量就能线性表示p,即:
p≈xi1gi1+xi2gi2+…+xingin (1)
xij∈R,j=1,2,...,n表示带有标记i的第j个样本的权重系数。该等式可以简洁地记为:
p≈Gixi (2)
然后构建所有数据集特征字典D∈Rd×N
D=[G1 G2 … GZ] (3)
N=Z×n为所有在数据集中出现的图像总数。该数据字典是由Z个独立块向量串联而成,由文献“Elhamifar E,Vidal R。Robust classifcation using structured sparserepresentation[C]。Computer Vision and Pattern Recognitio 2011IEEE Conferenceon。IEEE。2011:1 873-1 879。”,该字典具有块结构。如图2中间部分所示,这是多目标配准行人重识别问题的一大特点。利用该特点本发明设计一个基于块稀疏的行人重识别方法。
因此,可以建立模型
pij≈G1x1+G2x2+…+GKxZ (4)
xi=[xi1 xi2 … xin]T∈Rn表示与带有标记i的行人相对应的系数块。由于本发明的假设是让p与行人i的字典Gi近似呈线性关系,且注意到向量块xi要比向量块xz,z=1,2,…,Z,z≠i对最优解向量x的贡献大,也即模型的系数向量主要由系数块xi所决定。
同时模型为
p≈Dx (5)
其中x∈RN是稀疏的。也就是说,当数据集字典D中的行人数目较多时,x中只会有少量的非零项,大部分的系数为0。本发明所要寻找的也即非零项集中在特定行人特征字典块上的解向量,因此采用稀疏的目的就是求解稀疏系数矩阵x。
如文献“Wright J,Yang A Y,Ganesh A,et al。Robust Face Recognition viaSparse Representation[J]。IEEE Transactions on Pattern Analysis and MachineIntelligence,2008:31(2):210-227。”中所述,本发明所提的问题如下述l1/l2优化问题:
s.t.p=Dx (6)
提出该问题目的在于试图去最小化L2范数块中的系数向量的能量。
从监控摄像机捕获的行人图像通常被其他人或者物体所遮挡,正如图3所示的样例图像。与其他相关多目行人重识别技术不同的是,本发明的制定方法能够明确地建模遮挡物。即引入一个误差项e∈Rd到式(5)里,则线性近似模型为:
p=Dx+e (7)
等式(7)的最小化问题可以表述如下:
s.t.p=Dx+e (8)
给定恢复块稀疏系数向量xs以及误差向量es,计算残差i=1,2,...,Z,行人标签根据上文方法进行判定。
步骤5、交替方向框架求解模型
给定数据p和D,使用交替方向框架来计算公式(7)的解。首先,引入松弛变量s∈RN,式(8)的问题可重新建模为:
s.t.s=x
p=Dx+e (9)
现引入Lagrange乘数α∈RN、β∈Rd将式(9)的约束最小化问题转换为下述无约束的最小化问题:
添加两个二次惩罚项在损失函数里以最小化目标。本发明观察到最小化该损失函数涉及到三个变量s,x和e。为此本发明采用交替方向迭代框架,最小化单变量损失函数,即每次迭代仅与一个变量相关,其他两个变量保持固定。
第一步,固定s和e并最小化变量为x的损失函数。此时损失函数为:
该x的子问题是一个简单的二次优化目标问题,其闭合解为:
x*=(η1I+η2DTD)-12DT(p-e)+η1s+βTD-α) (12)
第二步,固定s和x并最小化变量为e的损失函数:
x*是上述x子问题的最优解。同样e的子问题也有一个闭式解,即:
表明元素运算方式为乘法。
第三步,通过固定x和e并最小化关于s的损失函数,得到:
该s子问题也有一个闭式解,并且该解对每个分块的系数i=1,2,…,Z是由块收缩[13]运算得到:
第四步,更新拉格朗日乘数为
α=α-η1(s*-x*) (17)
β=β-η1(Dx*+e*-p) (18)
步骤6、计算残差进行行人身份的判别
设pij∈Rd作为在投影空间中关于待查询集里行人pi的第j张图片的特征向量。为了重识别该行人,需求解公式(8)的问题用于构建每一个pij,j=1,2,…,n,其中n是pi在数据集相机视图中对应可用的图像数目。针对每一个待查询集里的行人,计算残差向量i=1,2,…,Z。并求所有残差向量ri∈RZ之和形成净残差项净残差项R最小值的指标最终作为待识别的行人的标记。
实验中,因为本发明所选择的数据集中每个行人有多张图像,所以每一个行人在数据集视角和查询集视角下都随机选择各5张图像提取行人特征;为了得到稳定可靠的实验结果并减少随机因素所带来的不可控影响,对上述过程重复10次,取其平均值作为最终结果。由于本发明对行人特征进行转换时主要是进行空间投影,因此对所提方法在投影空间与基础空间的比较必不可少。此时在两个空间中,对行人特征的提取均需保持一致,唯一不同之处在于特征投影空间是否转换。
如图4中所示,在应用本发明所提方法的投影空间,图4(a)为在PRID 2011数据集上实验的结果,Rank1的性能提升到了24.74%;图4(b)为在iLIDS-VID数据集上实验的结果,Rank1的性能提升到了21.97%。在这两个公开数据集上投影空间中的结果始终比基础空间的好。该实验也清楚地证明本发明所提的关于在投影空间里制定一个线性近似模型而不是基础特征空间的原假设。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (5)

1.一种基于块稀疏表示的行人重识别方法,其特征在于:包括以下步骤:
步骤1、行人训练集和测试集的划分;
步骤2、提取行人特征,所述行人特征包括行人颜色特征与行人纹理特征;
步骤3、进行行人特征变换;
步骤4、构建块稀疏表示的行人重识别模型;
步骤5、交替方向框架求解模型;
步骤6、计算残差进行行人身份的判别。
2.如权利要求1所述的一种基于块稀疏表示的行人重识别方法,其特征在于:所述步骤2中在进行行人特征提取前,先将待提取图像统一进行归一化处理成大小,并且分块为像素大小,且每一小块在水平和竖直方向上均有50%的重叠部分;对于分块后用于提取特征的图像,主要提取HS(色调:Hue、饱和度:Saturation)颜色直方图、Lab特征和Gabor特征;对于每一张行人图像,其在水平方向有7个分块,根据特征提取的内容,每个块中有20个特征通道,每个通道又被表示为16维直方图向量,即每幅图像在特征空间中被表示为维度的全局图像特征向量。
3.如权利要求1所述的一种基于块稀疏表示的行人重识别方法,其特征在于:所述步骤3中对行人特征的变换,主要是采用典型相关分析(CCA)对高维特征进行转换,将训练集用于学习投影矩阵并将测试集行人特征投影到该投影空间。
4.如权利要求1所述的一种基于块稀疏表示的行人重识别方法,其特征在于:所述步骤4构建基于块稀疏表示的行人重识别模型,需要先对行人特征构建数据集特征字典D,该字典是由块向量串联而成,且对应块向量与测试集中待识别一致行人近似呈线性关系。
5.如权利要求1所述的一种基于块稀疏表示的行人重识别方法,其特征在于:所述步骤6中对行人身份进行判断,需要将待识别行人特征与在投影空间变换后表示的该行人特征之间进行残差项量计算,对所求的所有残差向量求其最小,就能识别出该行人的对应标识。
CN201711112535.8A 2017-11-13 2017-11-13 一种基于块稀疏表示的行人重识别方法 Pending CN107844775A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711112535.8A CN107844775A (zh) 2017-11-13 2017-11-13 一种基于块稀疏表示的行人重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711112535.8A CN107844775A (zh) 2017-11-13 2017-11-13 一种基于块稀疏表示的行人重识别方法

Publications (1)

Publication Number Publication Date
CN107844775A true CN107844775A (zh) 2018-03-27

Family

ID=61681644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711112535.8A Pending CN107844775A (zh) 2017-11-13 2017-11-13 一种基于块稀疏表示的行人重识别方法

Country Status (1)

Country Link
CN (1) CN107844775A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145744A (zh) * 2018-07-19 2019-01-04 西安理工大学 一种基于自适应预测模式的lstm网络行人重识别方法
CN109214442A (zh) * 2018-08-24 2019-01-15 昆明理工大学 一种基于列表和身份一致性约束的行人重识别算法
CN109214430A (zh) * 2018-08-15 2019-01-15 天津大学 一种基于特征空间拓扑分布的行人重识别方法
CN109284668A (zh) * 2018-07-27 2019-01-29 昆明理工大学 一种基于距离正则化投影和字典学习的行人重识别算法
CN109298785A (zh) * 2018-09-06 2019-02-01 天津联图科技有限公司 一种监测设备的人机联控系统及方法
CN109917347A (zh) * 2019-04-10 2019-06-21 电子科技大学 一种基于时频域稀疏重构的雷达行人检测方法
CN109993128A (zh) * 2019-04-04 2019-07-09 北京航空航天大学 一种行人图像属性特征量化的方法
US11263445B2 (en) * 2018-07-04 2022-03-01 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus and system for human body tracking processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298992A (zh) * 2014-10-14 2015-01-21 武汉大学 一种基于数据驱动的自适应尺度行人重识别方法
CN107133575A (zh) * 2017-04-13 2017-09-05 中原智慧城市设计研究院有限公司 一种基于时空特征的监控视频行人重识别方法
CN107844752A (zh) * 2017-10-20 2018-03-27 常州大学 一种基于块稀疏表示的行人重识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298992A (zh) * 2014-10-14 2015-01-21 武汉大学 一种基于数据驱动的自适应尺度行人重识别方法
CN107133575A (zh) * 2017-04-13 2017-09-05 中原智慧城市设计研究院有限公司 一种基于时空特征的监控视频行人重识别方法
CN107844752A (zh) * 2017-10-20 2018-03-27 常州大学 一种基于块稀疏表示的行人重识别方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11263445B2 (en) * 2018-07-04 2022-03-01 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus and system for human body tracking processing
CN109145744A (zh) * 2018-07-19 2019-01-04 西安理工大学 一种基于自适应预测模式的lstm网络行人重识别方法
CN109145744B (zh) * 2018-07-19 2020-08-18 西安理工大学 一种基于自适应预测模式的lstm网络行人重识别方法
CN109284668A (zh) * 2018-07-27 2019-01-29 昆明理工大学 一种基于距离正则化投影和字典学习的行人重识别算法
CN109284668B (zh) * 2018-07-27 2021-06-18 昆明理工大学 一种基于距离正则化投影和字典学习的行人重识别方法
CN109214430A (zh) * 2018-08-15 2019-01-15 天津大学 一种基于特征空间拓扑分布的行人重识别方法
CN109214430B (zh) * 2018-08-15 2021-10-22 天津大学 一种基于特征空间拓扑分布的行人重识别方法
CN109214442A (zh) * 2018-08-24 2019-01-15 昆明理工大学 一种基于列表和身份一致性约束的行人重识别算法
CN109298785A (zh) * 2018-09-06 2019-02-01 天津联图科技有限公司 一种监测设备的人机联控系统及方法
CN109993128A (zh) * 2019-04-04 2019-07-09 北京航空航天大学 一种行人图像属性特征量化的方法
CN109917347A (zh) * 2019-04-10 2019-06-21 电子科技大学 一种基于时频域稀疏重构的雷达行人检测方法
CN109917347B (zh) * 2019-04-10 2021-09-24 电子科技大学 一种基于时频域稀疏重构的雷达行人检测方法

Similar Documents

Publication Publication Date Title
CN107844775A (zh) 一种基于块稀疏表示的行人重识别方法
CN107844752A (zh) 一种基于块稀疏表示的行人重识别方法
Li et al. Weighted sparse representation regularized graph learning for RGB-T object tracking
CN109389055B (zh) 基于混合卷积和注意力机制的视频分类方法
Tao et al. Smoke detection based on deep convolutional neural networks
Parkhi et al. Deep face recognition
Khemchandani et al. Robust least squares twin support vector machine for human activity recognition
Pavani et al. Haar-like features with optimally weighted rectangles for rapid object detection
Wan et al. End-to-end integration of a convolution network, deformable parts model and non-maximum suppression
Ran et al. Applications of a simple characterization of human gait in surveillance
Liu et al. Human action recognition using boosted EigenActions
Ming et al. Simple triplet loss based on intra/inter-class metric learning for face verification
CN104850857A (zh) 基于视觉空间显著性约束的跨摄像机行人目标匹配方法
Li et al. Global-local attention network for semantic segmentation in aerial images
Chan et al. A 3-D-point-cloud system for human-pose estimation
Munoz Inference Machines Parsing Scenes via Iterated Predictions
Jiang et al. A unified tree-based framework for joint action localization, recognition and segmentation
Abdelwahab et al. Reliable and rapid traffic congestion detection approach based on deep residual learning and motion trajectories
Huang et al. Temporally-aggregating multiple-discontinuous-image saliency prediction with transformer-based attention
Hou et al. Forest: A lightweight semantic image descriptor for robust visual place recognition
Liu et al. GDMN: Group decision-making network for person re-identification
Chakraborty et al. Person reidentification using multiple egocentric views
Ren et al. Exploring Prototype-Anchor Contrast for Semantic Segmentation
Said et al. Wavelet networks for facial emotion recognition
Souded People detection, tracking and re-identification through a video camera network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180327