CN113177487A - 行人重识别方法、装置、计算机设备和存储介质 - Google Patents
行人重识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113177487A CN113177487A CN202110490325.2A CN202110490325A CN113177487A CN 113177487 A CN113177487 A CN 113177487A CN 202110490325 A CN202110490325 A CN 202110490325A CN 113177487 A CN113177487 A CN 113177487A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- camera
- category
- dictionary
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种行人重识别方法、装置、计算机设备和存储介质。该方法包括:获取待比对摄像机拍摄的待识别行人图像;将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型;根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;在进行多个摄像机之间的迁移字典学习时,充分利用有标记训练样本监督地学习结构化的字典,充分利用无标记训练样本优化字典的稀疏表示性能,增强行人重识别能力,进而提高了行人重识别的准确度。
Description
技术领域
本申请涉及图像识别技术领域,特别是涉及一种行人重识别方法、装置、计算机设备和存储介质。
背景技术
近年来,越来越多的监控摄像机被部署到各类公共场所中,视频监控在维护社会安全等方面正发挥着越来越重要的作用。在视频监控的应用中,针对特定行人目标的检测与重识别是一个重要的需求。
行人重识别技术用于判断在不同监控摄像机下出现的行人是否是同一个人,它是一种自动目标识别技术,可以在视频监控网络中快速定位到感兴趣的行人目标。目前,一些行人重识别方法研究如何从行人图像或视频帧中提取有效的特征来建立行人特征表示模型,通常直接使用该模型进行识别,识别效果取决于提取特征的有效性;另一些行人重识别方法研究如何得到使同一行人的图像相似性较大,不同行人的图像相似性较小的相似性度量计算方法,通常是直接使用原始行人图像或利用某些已有的行人特征表示模型提取特征后进行相似性判别学习;还有一些行人重识别方法既设计行人特征表示模型又进行相似性判别学习,充分利用两者的优势,可以有效提高识别效果。
在上述第三类行人重识别方法中,由于字典学习在图像识别方面具有良好的识别性能和鲁棒性,基于字典学习的行人重识别方法通常具有较好的识别效果。但目前已有的这一类型的方法数量较少,且它们都是直接使用原始数据进行字典学习,或直接利用某些已有的行人特征表示模型提取特征后再进行字典学习,没有考虑行人特征提取技术以及行人特征表示模型与字典学习之间的关系和相互影响,并且这些方法都只是针对有限的有标记行人图像或视频数据,使得目前的行人重识别方法准确度低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高行人重识别方法准确度的行人重识别方法。
一种行人重识别方法,所述方法包括:
获取待比对摄像机拍摄的待识别行人图像;
将所述待识别行人图像输入至所述待比对摄像机对应的识别模型进行识别,确定所述待识别行人图像中的行人类别,所述识别模型是预先基于半监督迁移字典学习的识别模型;
根据所述待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;
其中,所述预先基于半监督迁移字典学习的识别模型的训练方式包括:
获取监控不同监控区域的第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集;
将所述第一摄像机和所述第二摄像机对应的识别模型的所述行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;
根据所述共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练所述第一摄像机和所述第二摄像机对应的识别模型,获得所述第一摄像机对应的识别模型的特征提取投影矩阵和字典,和所述第二摄像机对应的识别模型的特征提取投影矩阵和字典。
在其中一个实施例中,所述半监督迁移字典学习的目标函数为:
其中,v=A,B表示摄像机编号,A为第一摄像机编号,B为第二摄像机编号,表示Xv中行人类别p的行人图像训练样本子集,p=1,2,…,Cv,Xv表示来自摄像机v的行人图像训练样本集,Cv表示摄像机v的行人类别总数,Wv表示对应Xv的特征提取投影矩阵,Dv表示对应Xv的字典,Av表示使用字典Dv重构Xv的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示Xv中的无标记行人图像训练样本子集,λ1表示正的第一权重系数,λ2表示正的第二权重系数,表示字典Dv中对应行人类别t的子字典,t=1,2,…,CS,CS表示共有的行人类别个数,T表示矩阵转置,F表示F范数,s.t.表示受限制于,表示字典Dv中对应行人类别p的子字典,表示字典Dv中对应行人类别q的子字典,q=1,2,…,Cv,q≠p,表示使用子字典重构的稀疏编码系数,表示使用子字典重构的稀疏编码系数。
在其中一个实施例中,所述识别模型进行识别的方式包括:
采用所述识别模型对应的特征提取投影矩阵对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量;
采用所述识别模型对应的字典稀疏重构所述特征向量,获得所述待识别行人图像的稀疏编码系数;
根据所述稀疏编码系数计算所述待识别行人图像与每个行人类别的相似度,获得每个行人类别对应的相似度数据;
根据每个行人类别对应的所述相似度数据,确定所述待识别行人图像中的行人类别。
在其中一个实施例中,所述采用所述识别模型对应的特征提取投影矩阵对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量的步骤,包括:
采用所述识别模型对应的特征提取投影矩阵根据特征向量分析公式,对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量;
所述特征向量分析公式为:
y′=(Wv)Ty
其中,y′表示待识别行人图像的特征向量,Wv表示识别模型对应的特征提取投影矩阵,y表示待识别行人图像。
在其中一个实施例中,所述采用所述识别模型对应的字典稀疏重构所述特征向量,获得所述待识别行人图像的稀疏编码系数的步骤,包括:
采用所述识别模型对应的字典根据稀疏编码系数分析公式,稀疏重构所述特征向量,获得所述待识别行人图像的稀疏编码系数;
所述稀疏编码系数分析公式为:
其中,β表示待识别行人图像的稀疏编码系数,y′表示待识别行人图像的特征向量,Dv表示识别模型对应的字典,λ2表示正的第二权重系数。
一种行人重识别装置,所述装置包括:
图像获取模块,用于获取待比对摄像机拍摄的待识别行人图像;
行人类别识别模块,用于将所述待识别行人图像输入至所述待比对摄像机对应的识别模型进行识别,确定所述待识别行人图像中的行人类别,所述识别模型是预先基于半监督迁移字典学习的识别模型;
目标行人类别分析模块,用于根据所述待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;
其中,所述预先基于半监督迁移字典学习的识别模型的训练方式包括:
获取监控不同监控区域的第一摄像机和第二摄像机,对应的识别模型的行人图像训练样本集;
将所述第一摄像机和所述第二摄像机对应的识别模型的所述行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;
根据所述共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练所述第一摄像机和所述第二摄像机对应的识别模型,获得所述第一摄像机对应的识别模型的特征提取投影矩阵和字典,和所述第二摄像机对应的识别模型的特征提取投影矩阵和字典。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
上述行人重识别方法、装置、计算机设备和存储介质,通过获取待比对摄像机拍摄的待识别行人图像;将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型;根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;预先基于半监督迁移字典学习的识别模型,在进行半监督迁移字典学习的同时通过特征提取投影矩阵实现行人特征提取和降维,使提取到的特征更加适合字典学习,在进行多个摄像机之间的迁移字典学习时,充分利用有标记训练样本监督地学习结构化的字典,充分利用无标记训练样本优化字典的稀疏表示性能,增强行人重识别能力,进而提高了行人重识别的准确度。
附图说明
图1为一个实施例中行人重识别方法的流程示意图;
图2为一个实施例中行人重识别装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种行人重识别方法,包括以下步骤:
步骤S220,获取待比对摄像机拍摄的待识别行人图像。
其中,待比对摄像机是拍摄待比对监控区域的摄像机,待识别行人图像是将待比对摄像机拍摄待比对监控区域获得的视频进行预处理后的图像,可以是照片或者视频。对视频进行处理的方式是将视频中的每一个行人以每个图片中主要包含一个行人的方式进行提取,得到预处理后的图像。
在一个场景中,第一摄像机A的监控区域拍摄到了一个人E,现需要识别出E有没有在第二摄像机B的监控区域拍摄到,就用第二摄像机B拍摄的视频进行预处理后的行人图像作为待识别行人图像,第二摄像机B即为待比对摄像机。
在一个场景中,第一摄像机A的某个人F的一些图片和第二摄像机B的某个人C的一些图片,需要判断一下某个人F的一些图片和某个人C的一些图片是否属于同一个行人,分别将第一摄像机A为待比对摄像机,第一摄像机A的某个人F的一些图片为待识别行人图像;第二摄像机B为待比对摄像机,第二摄像机B的某个人C的一些图片为待识别行人图像。
步骤S240,将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型。
其中,预先基于半监督迁移字典学习的识别模型的训练方式包括:获取监控不同监控区域的第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集;将第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;根据共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练第一摄像机和第二摄像机对应的识别模型,获得第一摄像机对应的识别模型的特征提取投影矩阵和字典,和第二摄像机对应的识别模型的特征提取投影矩阵和字典。
其中,监控不同监控区域的第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集是从第一摄像机和第二摄像机拍摄的视频中提取出来的用于识别模型训练的行人图像。字典学习需要特征维数相同的样本,需要将行人图像预处理为分辨率相同的图像,因此,所有行人图像训练样本集中的行人图像的分辨率相同,且每个行人图像中只包含一个行人。每个行人图像训练样本表示为一个列向量。
在一个场景中,假设有监控不同监控区域的第一摄像机A和第二摄像机B为例进行举例说明:
从第一摄像机A拍摄的视频,获取一段视频进行预处理后,获得第一摄像机A的行人图像训练样本集,从第二摄像机B拍摄的视频,获取一段视频进行预处理后,获得第二摄像机B的行人图像训练样本集。将第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,具体地:令CS表示第一摄像机A和第二摄像机B共有的行人类别个数;对来自第一摄像机A的行人图像训练样本集XA,令CAO表示第一摄像机A独有的行人类别个数,CA=CS+CAO表示第一摄像机A的行人类别总数,表示XA中第一摄像机A和第二摄像机B共有的行人类别i的行人图像训练样本子集,表示XA中第一摄像机A独有的行人类别j的行人图像训练样本子集,表示XA中第一摄像机A的无标记行人图像训练样本子集;对来自第二摄像机B的行人图像训练样本集XB,令CBO表示第二摄像机B独有的行人类别个数,CB=CS+CBO表示第二摄像机B的行人类别总数,表示XB中第一摄像机A和第二摄像机B共有的行人类别i的行人图像训练样本子集,表示XB中第二摄像机B独有的行人类别k的行人图像训练样本子集,表示XB中第二摄像机B的无标记行人图像训练样本子集。
以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数如下:
其中,v=A,B表示摄像机编号,A为第一摄像机编号,B为第二摄像机编号,表示Xv中行人类别p的行人图像训练样本子集,p=1,2,…,Cv,Xv表示来自摄像机v的行人图像训练样本集,XA表示来自第一摄像机A的行人图像训练样本集,XB表示来自第二摄像机B的行人图像训练样本集,Cv表示摄像机v的行人类别总数,Wv表示对应Xv的特征提取投影矩阵,WA表示对应XA的特征提取投影矩阵,WB表示对应XB的特征提取投影矩阵,Dv表示对应Xv的字典,DA表示对应XA的字典,DB表示对应XB的字典,Av表示使用字典Dv重构Xv的稀疏编码系数,AA表示使用字典DA重构XA的稀疏编码系数,AB表示使用字典DB重构XB的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示Xv中的无标记行人图像训练样本子集,λ1表示正的第一权重系数,λ2表示正的第二权重系数,表示字典DA中对应行人类别t的子字典,表示字典DB中对应行人类别t的子字典,t=1,2,…,CS,CS表示共有的行人类别个数,T表示矩阵转置,F表示F范数,s.t.表示受限制于,表示字典Dv中对应行人类别p的子字典,表示字典Dv中对应行人类别q的子字典,q=1,2,…,Cv,q≠p,表示使用子字典重构的稀疏编码系数,表示使用子字典重构的稀疏编码系数。
半监督迁移字典学习的目标函数的求解涉及到特征提取投影矩阵WA和WB、字典DA和DB与稀疏编码系数AA和AB三组变量求解,采用三组变量依次更新的方式进行迭代求解,获得特征提取投影矩阵WA和WB与字典DA和DB;目标函数在进行半监督迁移字典学习的同时通过特征提取投影矩阵实现行人特征提取和降维,使提取到的特征更加适合字典学习;目标函数在进行两个摄像机之间的迁移字典学习时,充分利用有标记训练样本监督地学习结构化的字典,充分利用无标记训练样本优化字典的稀疏表示性能,增强行人重识别能力;
以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数的迭代求解过程如下所示:
步骤1,分别对XA和XB进行主成分分析,获得初始特征提取投影矩阵WA和WB。
步骤2,随机初始化字典DA和DB。
步骤3,固定WA、WB、DA和DB,根据以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数求解稀疏编码系数AA和AB,令
步骤4,固定WA、WB、AA和AB,根据以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数更新DA和DB。
步骤5,固定WA、WB、DA和DB,根据以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数更新AA和AB,令
步骤6,如果|J1-J2|>ε,ε表示迭代算法的阈值,ε>0是一个比较小的阈值,令J1=J2,转向步骤4;否则,转向步骤7。
步骤7,如果|J0-J2|>ε,转向步骤8;否则,停止迭代。
步骤8,固定DA、DB、AA和AB,根据以第一摄像机A和第二摄像机B为例的半监督迁移字典学习的目标函数更新WA和WB,转向步骤3。
其中,识别模型进行识别的方式包括:采用识别模型对应的特征提取投影矩阵对待识别行人图像进行特征提取和降维,获得待识别行人图像的特征向量;采用识别模型对应的字典稀疏重构特征向量,获得待识别行人图像的稀疏编码系数;根据稀疏编码系数计算待识别行人图像与每个行人类别的相似度,获得每个行人类别对应的相似度数据;根据每个行人类别对应的相似度数据,确定待识别行人图像中的行人类别。
在一个实施例中,采用识别模型对应的特征提取投影矩阵对待识别行人图像进行特征提取和降维,获得待识别行人图像的特征向量的步骤,包括:
采用识别模型对应的特征提取投影矩阵根据特征向量分析公式,对待识别行人图像进行特征提取和降维,获得待识别行人图像的特征向量;特征向量分析公式为:
y′=(Wv)Ty
其中,y′表示待识别行人图像的特征向量,Wv表示识别模型对应的特征提取投影矩阵,y表示待识别行人图像。
在一个实施例中,采用识别模型对应的字典稀疏重构特征向量,获得待识别行人图像的稀疏编码系数的步骤,包括:
采用识别模型对应的字典根据稀疏编码系数分析公式,稀疏重构特征向量,获得待识别行人图像的稀疏编码系数;稀疏编码系数分析公式为:
其中,β表示待识别行人图像的稀疏编码系数,y′表示待识别行人图像的特征向量,Dv表示识别模型对应的字典,λ2表示正的第二权重系数。
令
根据待识别行人图像y与每个行人类别的相似度,对待识别行人图像样本y进行归类具体是:如果相似度阈值为0.5,则则将行人类别p作为待识别行人图像样本y所属的行人类别,记为p*;否则,待识别行人图像样本y属于已知行人类别的可能性较低,一般认为属于某个未知的新的行人类别;该待识别行人图像样本归类方式,是根据实际应用情况分析进行判定的,其中采用的相似度阈值也可以根据实际情况进行调整,如0.8、0.7等等。
步骤S260,根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别。
其中,目标行人类别是用于比对的行人类别。
在一个场景中,第一摄像机A的监控区域拍摄到了一个人E,现需要识别出E有没有在第二摄像机B的监控区域拍摄到,就用第二摄像机B拍摄的视频进行预处理后的行人图像作为待识别行人图像,第二摄像机B即为待比对摄像机,将第二摄像机B的待识别行人图像输入至第二摄像机B对应的识别模型进行识别,确定出待识别行人图像中的行人类别,将该行人类别与第一摄像机A的监控区域拍摄到目标行人E进行比对,确定第二摄像机B中是否出现目标行人E。
在一个场景中,第一摄像机A的某个人F的一些图片和第二摄像机B的某个人C的一些图片,需要判断一下某个人F的一些图片和某个人C的一些图片是否属于同一个行人,分别将第一摄像机A为待比对摄像机,第一摄像机A的某个人F的一些图片为待识别行人图像;第二摄像机B为待比对摄像机,第二摄像机B的某个人C的一些图片为待识别行人图像,将第一摄像机A的待识别行人图像输入至第一摄像机A对应的识别模型进行识别,确定出待识别行人图像中的行人类别S,将第二摄像机B的待识别行人图像输入至第二摄像机B对应的识别模型进行识别,确定出待识别行人图像中的行人类别T,将行人类别S与行人类别T比对,确定行人类别S与行人类别T是否为同一人。
上述行人重识别方法,通过获取待比对摄像机拍摄的待识别行人图像;将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型;根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;预先基于半监督迁移字典学习的识别模型,在进行半监督迁移字典学习的同时通过特征提取投影矩阵实现行人特征提取和降维,使提取到的特征更加适合字典学习,在进行多个摄像机之间的迁移字典学习时,充分利用有标记训练样本监督地学习结构化的字典,充分利用无标记训练样本优化字典的稀疏表示性能,增强行人重识别能力,进而提高了行人重识别的准确度。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图2所示,提供了一种行人重识别装置,包括:
图像获取模块310,用于获取待比对摄像机拍摄的待识别行人图像;
行人类别识别模块320,用于将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型;
目标行人类别分析模块330,用于根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;
其中,预先基于半监督迁移字典学习的识别模型的训练方式包括:
获取监控不同监控区域的第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集;
将所述第一摄像机和所述第二摄像机对应的识别模型的所述行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;
根据所述共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练所述第一摄像机和所述第二摄像机对应的识别模型,获得所述第一摄像机对应的识别模型的特征提取投影矩阵和字典,和所述第二摄像机对应的识别模型的特征提取投影矩阵和字典。
其中,半监督迁移字典学习的目标函数为:
其中,v=A,B表示摄像机编号,A为第一摄像机编号,B为第二摄像机编号,表示Xv中行人类别p的行人图像训练样本子集,p=1,2,…,Cv,Xv表示来自摄像机v的行人图像训练样本集,Cv表示摄像机v的行人类别总数,Wv表示对应Xv的特征提取投影矩阵,Dv表示对应Xv的字典,Av表示使用字典Dv重构Xv的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示Xv中的无标记行人图像训练样本子集,λ1表示正的第一权重系数,λ2表示正的第二权重系数,表示字典Dv中对应行人类别t的子字典,t=1,2,…,CS,CS表示共有的行人类别个数,T表示矩阵转置,F表示F范数,s.t.表示受限制于,表示字典Dv中对应行人类别p的子字典,表示字典Dv中对应行人类别q的子字典,q=1,2,…,Cv,q≠p,表示使用子字典重构的稀疏编码系数,表示使用子字典重构的稀疏编码系数。
在一个实施例中,行人类别识别模块320还用于:采用识别模型对应的特征提取投影矩阵对待识别行人图像进行特征提取和降维,获得待识别行人图像的特征向量;采用识别模型对应的字典稀疏重构特征向量,获得待识别行人图像的稀疏编码系数;根据稀疏编码系数计算待识别行人图像与每个行人类别的相似度,获得每个行人类别对应的相似度数据;根据每个行人类别对应的相似度数据,确定待识别行人图像中的行人类别。
在一个实施例中,行人类别识别模块320还用于:采用识别模型对应的特征提取投影矩阵根据特征向量分析公式,对待识别行人图像进行特征提取和降维,获得待识别行人图像的特征向量;
特征向量分析公式为:
y′=(Wv)Ty
其中,y′表示待识别行人图像的特征向量,Wv表示识别模型对应的特征提取投影矩阵,y表示待识别行人图像。
在一个实施例中,行人类别识别模块320还用于:采用识别模型对应的字典根据稀疏编码系数分析公式,稀疏重构特征向量,获得待识别行人图像的稀疏编码系数;
稀疏编码系数分析公式为:
其中,β表示待识别行人图像的稀疏编码系数,y′表示待识别行人图像的特征向量,Dv表示识别模型对应的字典,λ2表示正的第二权重系数。
关于行人重识别装置的具体限定可以参见上文中对于行人重识别方法的限定,在此不再赘述。上述行人重识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的行人重识别方法的步骤。
在一个实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的行人重识别方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种行人重识别方法,其特征在于,所述方法包括:
获取待比对摄像机拍摄的待识别行人图像;
将所述待识别行人图像输入至所述待比对摄像机对应的识别模型进行识别,确定所述待识别行人图像中的行人类别,所述识别模型是预先基于半监督迁移字典学习的识别模型;
根据所述待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;
其中,所述预先基于半监督迁移字典学习的识别模型的训练方式包括:
获取监控不同监控区域的第一摄像机和第二摄像机对应的识别模型的行人图像训练样本集;
将所述第一摄像机和所述第二摄像机对应的识别模型的所述行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;
根据所述共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练所述第一摄像机和所述第二摄像机对应的识别模型,获得所述第一摄像机对应的识别模型的特征提取投影矩阵和字典,和所述第二摄像机对应的识别模型的特征提取投影矩阵和字典。
2.根据权利要求1所述的方法,其特征在于,所述半监督迁移字典学习的目标函数为:
其中,v=A,B表示摄像机编号,A为第一摄像机编号,B为第二摄像机编号,表示Xv中行人类别p的行人图像训练样本子集,p=1,2,…,Cv,Xv表示来自摄像机v的行人图像训练样本集,Cv表示摄像机v的行人类别总数,Wv表示对应Xv的特征提取投影矩阵,Dv表示对应Xv的字典,Av表示使用字典Dv重构Xv的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示使用字典Dv重构的稀疏编码系数,表示Xv中的无标记行人图像训练样本子集,λ1表示正的第一权重系数,λ2表示正的第二权重系数,表示字典Dv中对应行人类别t的子字典,t=1,2,…,CS,CS表示共有的行人类别个数,T表示矩阵转置,F表示F范数,s.t.表示受限制于,表示字典Dv中对应行人类别p的子字典,表示字典Dv中对应行人类别q的子字典,q=1,2,…,Cv,q≠p,表示使用子字典重构的稀疏编码系数,表示使用子字典重构的稀疏编码系数。
3.根据权利要求1所述的方法,其特征在于,所述识别模型进行识别的方式包括:
采用所述识别模型对应的特征提取投影矩阵对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量;
采用所述识别模型对应的字典稀疏重构所述特征向量,获得所述待识别行人图像的稀疏编码系数;
根据所述稀疏编码系数计算所述待识别行人图像与每个行人类别的相似度,获得每个行人类别对应的相似度数据;
根据每个行人类别对应的所述相似度数据,确定所述待识别行人图像中的行人类别。
4.根据权利要求3所述的方法,其特征在于,所述采用所述识别模型对应的特征提取投影矩阵对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量的步骤,包括:
采用所述识别模型对应的特征提取投影矩阵根据特征向量分析公式,对所述待识别行人图像进行特征提取和降维,获得所述待识别行人图像的特征向量;
所述特征向量分析公式为:
y′=(Wv)Ty
其中,y′表示待识别行人图像的特征向量,Wv表示识别模型对应的特征提取投影矩阵,y表示待识别行人图像。
6.一种行人重识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待比对摄像机拍摄的待识别行人图像;
行人类别识别模块,用于将所述待识别行人图像输入至所述待比对摄像机对应的识别模型进行识别,确定所述待识别行人图像中的行人类别,所述识别模型是预先基于半监督迁移字典学习的识别模型;
目标行人类别分析模块,用于根据所述待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;
其中,所述预先基于半监督迁移字典学习的识别模型的训练方式包括:
获取监控不同监控区域的第一摄像机和第二摄像机,对应的识别模型的行人图像训练样本集;
将所述第一摄像机和所述第二摄像机对应的识别模型的所述行人图像训练样本集,划分为共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集;
根据所述共有的行人类别的行人图像训练样本子集、独有的行人类别的行人图像训练样本子集和无标记行人图像训练样本子集,基于半监督迁移字典学习的目标函数训练所述第一摄像机和所述第二摄像机对应的识别模型,获得所述第一摄像机对应的识别模型的特征提取投影矩阵和字典,和所述第二摄像机对应的识别模型的特征提取投影矩阵和字典。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110490325.2A CN113177487B (zh) | 2021-05-06 | 2021-05-06 | 行人重识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110490325.2A CN113177487B (zh) | 2021-05-06 | 2021-05-06 | 行人重识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177487A true CN113177487A (zh) | 2021-07-27 |
CN113177487B CN113177487B (zh) | 2023-07-18 |
Family
ID=76928844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110490325.2A Active CN113177487B (zh) | 2021-05-06 | 2021-05-06 | 行人重识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177487B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574515A (zh) * | 2016-01-15 | 2016-05-11 | 南京邮电大学 | 一种无重叠视域下的行人再识别方法 |
CN106897669A (zh) * | 2017-01-19 | 2017-06-27 | 同济大学 | 一种基于一致迭代多视角迁移学习的行人再辨识方法 |
CN107392190A (zh) * | 2017-09-07 | 2017-11-24 | 南京信息工程大学 | 基于半监督多视图字典学习的彩色人脸识别方法 |
CN108509854A (zh) * | 2018-03-05 | 2018-09-07 | 昆明理工大学 | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 |
CN108875445A (zh) * | 2017-05-08 | 2018-11-23 | 上海荆虹电子科技有限公司 | 一种行人再识别方法及装置 |
CN109492610A (zh) * | 2018-11-27 | 2019-03-19 | 广东工业大学 | 一种行人重识别方法、装置及可读存储介质 |
CN109766748A (zh) * | 2018-11-27 | 2019-05-17 | 昆明理工大学 | 一种基于投影变换与字典学习的行人再识别的方法 |
CN110032984A (zh) * | 2019-04-22 | 2019-07-19 | 广东石油化工学院 | 基于非对称映射半监督字典对的低分辨率行人重学习方法 |
CN110046583A (zh) * | 2019-04-18 | 2019-07-23 | 南京信息工程大学 | 基于半监督多视图增量字典学习的彩色人脸识别方法 |
-
2021
- 2021-05-06 CN CN202110490325.2A patent/CN113177487B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574515A (zh) * | 2016-01-15 | 2016-05-11 | 南京邮电大学 | 一种无重叠视域下的行人再识别方法 |
CN106897669A (zh) * | 2017-01-19 | 2017-06-27 | 同济大学 | 一种基于一致迭代多视角迁移学习的行人再辨识方法 |
CN108875445A (zh) * | 2017-05-08 | 2018-11-23 | 上海荆虹电子科技有限公司 | 一种行人再识别方法及装置 |
CN107392190A (zh) * | 2017-09-07 | 2017-11-24 | 南京信息工程大学 | 基于半监督多视图字典学习的彩色人脸识别方法 |
CN108509854A (zh) * | 2018-03-05 | 2018-09-07 | 昆明理工大学 | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 |
CN109492610A (zh) * | 2018-11-27 | 2019-03-19 | 广东工业大学 | 一种行人重识别方法、装置及可读存储介质 |
CN109766748A (zh) * | 2018-11-27 | 2019-05-17 | 昆明理工大学 | 一种基于投影变换与字典学习的行人再识别的方法 |
CN110046583A (zh) * | 2019-04-18 | 2019-07-23 | 南京信息工程大学 | 基于半监督多视图增量字典学习的彩色人脸识别方法 |
CN110032984A (zh) * | 2019-04-22 | 2019-07-19 | 广东石油化工学院 | 基于非对称映射半监督字典对的低分辨率行人重学习方法 |
Non-Patent Citations (4)
Title |
---|
XIAO LIU 等: "Semi-Supervised Coupled Dictionary Learning for Person Re-identification", 《CVPR 2014》 * |
XIAOKE ZHU 等: "Semi-supervised Cross-view Projection-based Dictionary Learning for Video-based Person Re-identification", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
张见威 等: "基于字典学习和 Fisher 判别稀疏表示的行人重识别方法", 《华南理工大学学报(自然科学版)》 * |
汤红忠 等: "面向跨视图行人重识别的多级判别性字典学习算法", 《计算机辅助设计与图形学学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113177487B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108846355B (zh) | 图像处理方法、人脸识别方法、装置和计算机设备 | |
CN111783576B (zh) | 基于改进型YOLOv3网络和特征融合的行人重识别方法 | |
CN111860670A (zh) | 域自适应模型训练、图像检测方法、装置、设备及介质 | |
US7869657B2 (en) | System and method for comparing images using an edit distance | |
WO2009032570A1 (en) | Visual language modeling for image classification | |
CN110807491A (zh) | 车牌图像清晰度模型训练方法、清晰度检测方法及装置 | |
US10331968B2 (en) | One shot color calibrated metric learning for object re-identification | |
CN110457985B (zh) | 基于视频序列的行人再识别方法、装置及计算机设备 | |
CN114419672A (zh) | 基于一致性学习的跨场景持续学习的行人再识别方法及装置 | |
CN112668462B (zh) | 车损检测模型训练、车损检测方法、装置、设备及介质 | |
CN110046577B (zh) | 行人属性预测方法、装置、计算机设备和存储介质 | |
CN112232971A (zh) | 反欺诈检测方法、装置、计算机设备和存储介质 | |
CN114419406A (zh) | 图像变化检测方法、训练方法、装置和计算机设备 | |
CN111177447B (zh) | 一种基于深度网络模型的行人图像识别方法 | |
CN113205002A (zh) | 非受限视频监控的低清人脸识别方法、装置、设备及介质 | |
An | Pedestrian re-recognition algorithm based on optimization deep learning-sequence memory model | |
CN113177487B (zh) | 行人重识别方法、装置、计算机设备和存储介质 | |
CN115862119A (zh) | 基于注意力机制的人脸年龄估计方法及装置 | |
CN115761837A (zh) | 人脸识别质量检测方法、系统及设备和介质 | |
CN115393901A (zh) | 一种跨模态行人重识别方法及计算机可读存储介质 | |
Singh et al. | Performance Analysis of ELA-CNN model for Image Forgery Detection | |
CN114445916A (zh) | 一种活体检测方法、终端设备及存储介质 | |
CN110489592B (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
Muniappan et al. | An Evaluation of Convolutional Neural Network (CNN) Model for Copy-Move and Splicing Forgery Detection | |
Brkić et al. | Towards neural art-based face de-identification in video data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |