CN113610028A - 行人重识别方法、装置、计算机设备及存储介质 - Google Patents
行人重识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113610028A CN113610028A CN202110930702.XA CN202110930702A CN113610028A CN 113610028 A CN113610028 A CN 113610028A CN 202110930702 A CN202110930702 A CN 202110930702A CN 113610028 A CN113610028 A CN 113610028A
- Authority
- CN
- China
- Prior art keywords
- candidate
- pedestrian
- image
- posture
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000000605 extraction Methods 0.000 claims abstract description 50
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 230000001815 facial effect Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种行人重识别方法、装置、计算机设备及存储介质,所述方法包括:获取候选行人的多个候选体态图像及对应的候选面部图像;根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
Description
技术领域
本发明涉及图像识别技术领域,特别涉及一种行人重识别方法、装置、计算机设备及存储介质。
背景技术
行人重识别指的是在预先获得行人图像及其确定身份的基础上,当再次拍摄到该行人的图像时,可以利用识别模型提取行人特征以确认其对应的身份信息。然而目前的行人重识别技术主要存在两方面的弊端。一方面,当前行人重识别方法大多需要通过手动标注的方式,将不同的行人图像与其姓名等身份信息进行关联,自动化程度差且不利于图像库的及时更新。另一方面,现有的识别模型都是基于有标签数据进行训练的,由于有标签数据本身数量较少且场景单一,使得现有的识别模型大多存在识别精度低、鲁棒性差等缺陷。
发明内容
本发明的目的是提供一种能够自动标注身份信息,并且可基于大量无标签数据对识别模型进行训练的技术方案,以解决现有技术中存在的上述问题。
为实现上述目的,本发明提供一种行人重识别方法,包括以下步骤:
获取候选行人的多个候选体态图像及对应的候选面部图像;
根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;
现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;
将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;
确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
根据本发明提供的行人重识别方法,所述获取候选行人的多个候选体态图像及对应的面部图像的步骤包括:
利用枪球联动一体机中的枪型摄像机拍摄第一图片,其中所述枪型摄像机具有固定的第一世界坐标;
从所述第一图片中获取与所述候选行人对应的一个第一候选体态图像;
利用枪球联动一体机中的球型摄像机拍摄第二图片,其中所述枪型摄像机具有固定的第二世界坐标以及实时转动角度;其中所述实时转动角度与所述第一世界坐标和所述第二世界坐标相关联,以使所述第二图片是所述第一图片的局部放大图;
从所述第二图片中获取与所述候选行人对应的一个第二候选体态图像和第一面部图像;
为所述第一候选体态图像、所述第二候选体态图像和第一面部图像添加第一识别码。
根据本发明提供的行人重识别方法,所述从所述第二图片中获取与所述候选行人对应的一个第二候选体态图像和第一面部图像的步骤包括:
利用所述特征提取模型提取所述第一候选体态图像的第一候选特征;
获取所述第二图片中的一个或多个候选体态图像;
利用所述特征提取模型提取所述第二图片中的每个候选体态图像对应的第二候选特征;
选择与所述第一候选特征一致的第二候选特征对应的候选体态图像作为所述第二候选体态图像;
从所述第二候选体态图像中获取对应的第一面部图像。
根据本发明提供的行人重识别方法,所述获取候选行人的多个候选体态图像及对应的面部图像的步骤还包括:
利用枪球联动一体机中的球型摄像机拍摄第三图片,其中所述第三图片和所述第二图片对应的实时转动角度不同;
从所述第三图片中获取与所述候选行人对应的一个第三候选体态图像;
为所述第三候选体态图像添加所述第一识别码。
根据本发明提供的行人重识别方法,所述根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息的步骤包括:
通过面部识别算法从面部识别库中确定与所述候选面部图像相似度最高的目标面部图像;
获取预设的与所述目标面部图像相对应的第一识别信息;
用所述第一识别信息替换所述第一识别码。
根据本发明提供的行人重识别方法,所述特征提取模型通过以下步骤训练:
获取多个无标签的行人体态样本图像,通过聚类算法为所述行人体态样本图像分类;
将所述行人体态样本图像作为输入,将提取到的体态特征作为输出以训练深度神经网络,使得属于同一类别的行人体态样本图像通过所述深度神经网络输出相同或相近的体态特征;
利用MMT算法对所述深度神经网络进行迭代优化,以获得所述特征提取模型。
根据本发明提供的行人重识别方法,所述获取多个无标签的行人体态样本图像,通过聚类算法为所述行人体态样本图像分类的步骤之后,还包括:
对所述行人体态样本图像进行数据增强处理,所述数据增强处理包括图像翻转、增加噪声以及GAN数据生成中的一种或多种。
为实现上述目的,本发明还提供一种行人重识别装置,包括以下步骤:
图像获取模块,适用于获取候选行人的多个候选体态图像及对应的候选面部图像;
识别信息模块,适用于根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;
现场采集模块,适用于现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;
特征对比模块,适用于将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;
目标识别模块,适用于确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的行人重识别方法、装置、计算机设备及存储介质,可以自动、快速地建立行人图像库,并提供基于大量数据训练的高精度特征提取模型。该图像库中包含候选行人的多张体态照片及对应的识别信息,通过建立图像库,可以为后续的行人重识别提供丰富的数据对比基础。本发明通过上述图像库和特征提取模型,大幅提高了行人重识别在跨场景下的识别精度和算法泛化性能。
附图说明
图1为本发明的行人重识别方法实施例一的流程图;
图2为本发明实施例一获取体态图像及面部图像的示意性流程图;
图3为本发明实施例一确定第二候选体态图像的示意性流程图;
图4为本发明实施例一确定候选行人的识别信息的示意性流程图;
图5为本发明实施例一的特征提取模型的训练过程示意图;
图6为本发明的行人重识别装置实施例一的程序模块示意图;
图7为本发明的行人重识别装置实施例一的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参阅图1,本实施例提出一种行人重识别方法,包括以下步骤:
S100:获取候选行人的多个候选体态图像及对应的候选面部图像。
候选行人可以是在某场景中可能出现的人员,例如某施工现场的建筑工人、某写字楼的内部员工,某小区内的住户等。候选体态图像可以是远距离拍摄的候选行人的全身图像,同一个候选行人可以在不同位置处得到多张不同的候选体态图像。候选面部图像可以是候选体态图像的局部放大图。候选面部图像与候选体态图像可以来自同一个影像设备,这种情况下该影像设备需要具有较高的分辨率;候选面部图像与候选体态图像也可以来自不同的影像设备,这种情况下两个影像设备之间具有一定的对应关系,例如第一影像设备和第二影像设备具有相同的拍摄角度以及不同的焦距。
S200:根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息。
识别信息可以是与候选行人的身份有关的信息,例如姓名、身份证号、工作编号等等。可以预先建立面部识别库,在该面部识别库中存储每一个候选面部图像与其对应的识别信息之间的映射关系。例如对于某单位的工作人员,可以集中采集每个工作人员的面部图像,并且针对每个面部图像输入已知的识别信息保存入库。进一步,根据步骤S100中获取到的与候选面部图像对应的多个候选体态图像,根据候选面部图像与多个候选体态图像之间的关联关系,可以确定多个候选体态图像对应的识别信息。
上述步骤S100和S200描述了行人体态库的建立过程。该行人体态库中包含多个候选行人的体态图像以及对应的识别信息。在具体实施时,可以将属于同一个行人的多张体态图像划分为一组,并为该组添加对应的ID编码,其中每一组体态图像对应唯一的识别信息。在后续行人重识别过程中,通过将现场采集到的目标行人体态图像与行人体态库中的候选体态图像进行对比,从而选出最接近的候选体态图像并获取对应的识别信息。
S300:现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征。
本步骤起用于执行行人重识别过程。本实施例的行人重识别过程利用特征提取模型来提取体态特征,该特征提取模型是通过深度学习算法对卷积神经网络模型进行训练得到的,该卷积神经网络模型可以包括Resnet模型或Densenet模型等。本实施例中的特征提取模型输入为行人的体态图像,输出为提取到的体态特征向量。这样,通过体态特征向量的对比可以实现体态图像之间的对比。在具体实施时,可以通过固定设置的影像设备按照固定频率拍摄图片,并通过从图片中提取目标行人体态轮廓的方式获得目标行人的第一体态图像。
S400:将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的。
如前所述,行人体态库中包含候选行人的多张候选体态图像。将这些候选体态图像输入特征提取模型,可以分别得到每张候选体态图像对应的特征向量。
S500:确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
比较结果相一致的候选特征可以是相似度最高且超过预设阈值的特征。假设第一特征的特征向量为A,多个候选特征的候选特征向量分别为B1、B2……Bn,分别比较B1、B2……Bn与A的相似度,选择相似度最大的候选特征向量例如Bm,如果Bm与A的相似度大于预设阈值,则可以确定Bm是比较结果相一致的候选特征。相应的,作为Bm输入的候选体态图像Fm对应的识别信息Im即为目标行人的识别信息。
通过上述步骤,本实施例可以实现在快速、准确地进行行人重识别,提高了行人重识别在跨场景下的识别精度和算法泛化性能。
图2示出了本发明实施例一的获取体态图像及面部图像的示意性流程图。
如图2所示,步骤S100包括:
S110:利用枪球联动一体机中的枪型摄像机拍摄第一图片,其中所述枪型摄像机具有固定的第一世界坐标。
枪球联动一体机主要包括枪型摄像机和球型摄像机,其中枪型摄像机(以下简称枪机)用于拍摄整体画面,球型摄像机(以下简称球机)用于拍摄局部画面。其工作原理为,枪球联动一体机会在枪机的画面中建立一个坐标系,比如1080P的视频就会对应1920*1080个像素点,每个像素点都有一个坐标,通过调整球机将球机画面的中心调整到对应的像素点上,可以得出球机的PTZ(全方位移动及镜头变倍、变焦控制)数值。因此理想情况下,若已知枪机的固定坐标位置,可以通过调整球机的转动角度及焦距等参数获得枪机拍摄画面中任一像素点的局部图像。
在本实施例中,首先通过具有第一世界坐标的枪机在特定场景下拍摄第一图片。可以理解,第一图片中可以包括一个或多个候选行人。
S120:从所述第一图片中获取与所述候选行人对应的一个第一候选体态图像。
本步骤用于从包含多种背景信息的第一图片中提取单一候选行人的体态图像。可以通过现有的任意图像提取方法获取其中一个候选行人的第一候选体态图像,例如基于颜色差异从第一图片中提取候选行人的体态轮廓以及轮廓内部图像作为第一候选体态图像。当第一图片中包含多个候选行人时,则可以对候选行人逐个锁定进行提取。
S130:利用枪球联动一体机中的球型摄像机拍摄第二图片,其中所述枪型摄像机具有固定的第二世界坐标以及实时转动角度;其中所述实时转动角度与所述第一世界坐标和所述第二世界坐标相关联,以使所述第二图片是所述第一图片的局部放大图。
如前所述,可以通过调整球机的转动角度及焦距以实现对第一图片中部分内容的放大,从而得到第二图片。通常枪机拍摄的第一图片的视野范围较大,获取到的第一候选体态图像相对较小。
S140:从所述第二图片中获取与所述候选行人对应的一个第二候选体态图像和第一面部图像。
理想情况下,球机拍摄的第二图片中可以获得与候选行人相对应的更加清晰放大的第二体态图像,并进一步从第二体态图像中获取到候选行人的第一面部图像。上述第二体态图像及第一面部图像也可以通过现有的任意抠图方法获取到。
当第二图片中包含多个体态图像时,可以通过特征提取的方式确定与第一候选体态图像对应的第二候选体态图像。如图3所示,确定第二候选体态图像的步骤具体包括:
S141:利用特征提取模型提取所述第一候选体态图像的第一候选特征。
S142:分别获取第二图片的每个候选体态图像。可以通过现有的任意图像提取方法获取每个候选体态图像,例如基于颜色差异从第二图片中提取候选行人的体态轮廓以及轮廓内部图像作为候选体态图像。
S143:利用特征提取模型提取第二图片中的每个候选体态图像对应的第二候选特征。
S144:选择与第一候选特征一致的第二候选特征对应的候选体态图像作为所述第二候选体态图像。本步骤中,当两个候选特征的相似度大于预设阈值时即可视为两个候选特征一致。
S145:从所述第二候选体态图像中获取对应的第一面部图像。可以通过现有的任意图像提取方法获取第一面部图像,例如基于颜色差异从第二候选体态图像中提取第一面部图像。
上述特征提取模型与步骤S300中的特征提取模型可以是同一个模型,其输入数据为体态图像,输出数据为对应的体态特征向量。
S150:为所述第一候选体态图像、所述第二候选体态图像和第一面部图像添加第一识别码。
本步骤添加第一识别码的目的是将特定行人的第一候选体态图像、第二候选体态图像和第一面部图像划分为同一组。这样,添加了相同伪标签的所有图像与同一个候选行人相对应。
S160:利用枪球联动一体机中的球型摄像机拍摄第三图片,其中所述第三图片和所述第二图片对应的实时转动角度不同。为了进一步丰富候选行人的候选体态图像,可以通过重新调整球型摄像机的转动角度的方式以拍摄到不同视角下的第三图片。可以理解,对于同一个候选行人,其在第二图片中的体态图像和在第三图片中的体态图像必然不同。
S170:从所述第三图片中获取与所述候选行人对应的一个第三候选体态图像。该步骤与步骤S140类似,此处不再赘述。
S180:为所述第三候选体态图像添加所述第一识别码。通过上述步骤,本实施例为同一个候选行人相关的第一候选体态图像、第一面部图像、第二候选体态图像和第三候选体态图像都具有同一个第一识别码,有利于获得同一个候选行人的多种不同的候选体态图像,从而丰富体态图像库,提高行人重识别准确率。
图4示出了本发明实施例一确定候选行人的识别信息的示意性流程图。如图4所示,步骤S200包括:
S210:通过面部识别算法从面部识别库中确定与所述候选面部图像相似度最高的目标面部图像。
面部识别库包括预先采集的大量候选行人的面部图像,每一张面部图像对应确定的身份识别信息,例如姓名、身份证号、工作地址等。通过将候选面部图像与面部识别库进行对比,可以得到相似度最高的目标面部图像。可以利用现有的任意图像对比算法确定目标面部图像,本实施例对此不做限制。
S220:获取预设的与所述目标面部图像相对应的第一识别信息。这里的第一识别信息就是面部识别库中预存的与目标面部图像对应的身份识别信息。
S230:用所述第一识别信息替换所述第一识别码。这样,可以获得每个候选行人真实的身份识别信息,从而为后续的行人重识别提供身份基础。
图5示出了本发明实施例一的特征提取模型的训练过程示意图,包括以下步骤:
S510:获取多个无标签的行人体态样本图像,通过聚类算法为所述行人体态样本图像分类。
为了提高行人体态样本图像的数量,本实施例可利用未标注的开源数据集Market1501作为上述样本图像。本实施例所称标注,指的是将同一个行人的多张体态样本图像添加同一个标记。现有的机器标注方法准确率较低,人工标注方法又极为费时费力,因此都不适合大量样本数据的训练。考虑到标注的困难性和时间成本,本发明首先利用无监督聚类方法对行人体态样本图像进行分类,属于同一类的样本图像标识对应同一个行人。通过采用聚类算法,本实施例可以利用大量的未标注行人体态图像,有效增加了样本数量。进一步,本实施例还可以对所述行人体态样本图像进行数据增强处理,所述数据增强处理包括图像翻转、增加噪声以及GAN数据生成中的一种或多种,从而增加样本数据的多样性。
S520:将所述行人体态样本图像作为输入,将提取到的体态特征作为输出以训练深度神经网络,使得属于同一类别的行人体态样本图像通过所述深度神经网络输出相同或相近的体态特征。这里所称同一类别的行人体态样本图像即为步骤S510中通过聚类算法确定的同一个行人的体态样本图像。为了提升模型的运行效率和泛化性能,本实施例可以选择占用资源相对较少的MobileNet结构作为主干网络。
S530:利用MMT算法对所述深度神经网络进行迭代优化,以获得所述特征提取模型。
具体训练时,可以先对无监督训练中的网络参数进行初始化,然后利用MMT(Mutual Mean-Teaching)算法结合前面生成的伪标签进行循环迭代优化,直至目标函数收敛为止。
综上所述,本实施例通过基于目标跟踪和人脸识别的自动建库方法,从而实现了行人ID和行人身份信息的自动关联,避免了大量的手工标注工作;结合枪球联动设备实现人脸和行人的关联,并利用球机的灵活性和自动变焦功能更好的实现高质量人脸图像的抓拍。本实施例利用无标签数据结合无监督训练和领域自适应方法,减少数据类别标注带来的时间成本的同时,大大提升模型在不同领域下的识别精度和鲁棒性。
请继续参阅图6,示出了一种行人重识别装置,在本实施例中,行人重识别装置60可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述行人重识别方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述行人重识别装置60在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
图像获取模块61,适用于获取候选行人的多个候选体态图像及对应的候选面部图像;
识别信息模块62,适用于根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;
现场采集模块63,适用于现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;
特征对比模块64,适用于将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;
目标识别模块65,适用于确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备70至少包括但不限于:可通过系统总线相互通信连接的存储器71、处理器72,如图7所示。需要指出的是,图7仅示出了具有组件71-72的计算机设备70,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器71(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器71可以是计算机设备70的内部存储单元,例如该计算机设备70的硬盘或内存。在另一些实施例中,存储器71也可以是计算机设备70的外部存储设备,例如该计算机设备70上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器71还可以既包括计算机设备70的内部存储单元也包括其外部存储设备。本实施例中,存储器71通常用于存储安装于计算机设备70的操作系统和各类应用软件,例如实施例一的行人重识别装置60的程序代码等。此外,存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器72在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制计算机设备70的总体操作。本实施例中,处理器72用于运行存储器71中存储的程序代码或者处理数据,例如运行行人重识别装置60,以实现实施例一的行人重识别方法。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储行人重识别装置60,被处理器执行时实现实施例一的行人重识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
流程图中或在此以其它方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所述技术领域的技术人员所理解。
本技术领域的普通技术人员可以理解,实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种行人重识别方法,其特征在于,包括以下步骤:
获取候选行人的多个候选体态图像及对应的候选面部图像;
根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;
现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;
将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;
确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
2.根据权利要求1所述的行人重识别方法,其特征在于,所述获取候选行人的多个候选体态图像及对应的面部图像的步骤包括:
利用枪球联动一体机中的枪型摄像机拍摄第一图片,其中所述枪型摄像机具有固定的第一世界坐标;
从所述第一图片中获取与所述候选行人对应的一个第一候选体态图像;
利用枪球联动一体机中的球型摄像机拍摄第二图片,其中所述枪型摄像机具有固定的第二世界坐标以及实时转动角度;其中所述实时转动角度与所述第一世界坐标和所述第二世界坐标相关联,以使所述第二图片是所述第一图片的局部放大图;
从所述第二图片中获取与所述候选行人对应的一个第二候选体态图像和第一面部图像;
为所述第一候选体态图像、所述第二候选体态图像和第一面部图像添加第一识别码。
3.根据权利要求2所述的行人重识别方法,其特征在于,所述从所述第二图片中获取与所述候选行人对应的一个第二候选体态图像和第一面部图像的步骤包括:
利用所述特征提取模型提取所述第一候选体态图像的第一候选特征;
获取所述第二图片中的一个或多个候选体态图像;
利用所述特征提取模型提取所述第二图片中的每个候选体态图像对应的第二候选特征;
选择与所述第一候选特征一致的第二候选特征对应的候选体态图像作为所述第二候选体态图像;
从所述第二候选体态图像中获取对应的第一面部图像。
4.根据权利要求2或3所述的行人重识别方法,其特征在于,所述获取候选行人的多个候选体态图像及对应的面部图像的步骤还包括:
利用枪球联动一体机中的球型摄像机拍摄第三图片,其中所述第三图片和所述第二图片对应的实时转动角度不同;
从所述第三图片中获取与所述候选行人对应的一个第三候选体态图像;
为所述第三候选体态图像添加所述第一识别码。
5.根据权利要求4所述的行人重识别方法,其特征在于,所述根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息的步骤包括:
通过面部识别算法从面部识别库中确定与所述候选面部图像相似度最高的目标面部图像;
获取预设的与所述目标面部图像相对应的第一识别信息;
用所述第一识别信息替换所述第一识别码。
6.根据权利要求1所述的行人重识别方法,其特征在于,所述特征提取模型通过以下步骤训练:
获取多个无标签的行人体态样本图像,通过聚类算法为所述行人体态样本图像分类;
将所述行人体态样本图像作为输入,将提取到的体态特征作为输出以训练深度神经网络,使得属于同一类别的行人体态样本图像通过所述深度神经网络输出相同或相近的体态特征;
利用MMT算法对所述深度神经网络进行迭代优化,以获得所述特征提取模型。
7.根据权利要求6所述的行人重识别方法,其特征在于,所述获取多个无标签的行人体态样本图像,通过聚类算法为所述行人体态样本图像分类的步骤之后,还包括:
对所述行人体态样本图像进行数据增强处理,所述数据增强处理包括图像翻转、增加噪声以及GAN数据生成中的一种或多种。
8.一种行人重识别装置,其特征在于,包括以下步骤:
图像获取模块,适用于获取候选行人的多个候选体态图像及对应的候选面部图像;
识别信息模块,适用于根据所述候选面部图像与识别信息之间的预设映射关系,确定所述候选行人的识别信息;
现场采集模块,适用于现场采集目标行人的第一体态图像,利用特征提取模型提取所述第一体态图像对应的目标特征;
特征对比模块,适用于将所述目标特征与所述多个候选体态图像对应的多个候选特征进行比较,其中所述候选特征是通过所述特征提取模型对所述候选体态图像进行特征提取而得到的;
目标识别模块,适用于确定与所述第一特征的比较结果相一致的候选特征,将所述比较结果相一致的候选特征对应的识别信息作为所述目标行人的识别信息。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110930702.XA CN113610028A (zh) | 2021-08-13 | 2021-08-13 | 行人重识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110930702.XA CN113610028A (zh) | 2021-08-13 | 2021-08-13 | 行人重识别方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113610028A true CN113610028A (zh) | 2021-11-05 |
Family
ID=78308533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110930702.XA Pending CN113610028A (zh) | 2021-08-13 | 2021-08-13 | 行人重识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610028A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130109777A (ko) * | 2012-03-28 | 2013-10-08 | 삼성전자주식회사 | 얼굴 인식 기반의 근태 관리를 위한 장치 및 방법 |
CN103810476A (zh) * | 2014-02-20 | 2014-05-21 | 中国计量学院 | 基于小群体信息关联的视频监控网络中行人重识别方法 |
CN111222424A (zh) * | 2019-12-26 | 2020-06-02 | 的卢技术有限公司 | 一种多角度的车主身份识别方法及系统 |
CN111339979A (zh) * | 2020-03-04 | 2020-06-26 | 平安科技(深圳)有限公司 | 基于特征提取的图像识别方法及图像识别装置 |
WO2020253127A1 (zh) * | 2019-06-21 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 |
CN112347957A (zh) * | 2020-11-12 | 2021-02-09 | 广联达科技股份有限公司 | 行人重识别方法、装置、计算机设备及存储介质 |
WO2021082118A1 (zh) * | 2019-11-01 | 2021-05-06 | 深圳大学 | 行人重识别的方法、装置、终端及存储介质 |
-
2021
- 2021-08-13 CN CN202110930702.XA patent/CN113610028A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130109777A (ko) * | 2012-03-28 | 2013-10-08 | 삼성전자주식회사 | 얼굴 인식 기반의 근태 관리를 위한 장치 및 방법 |
CN103810476A (zh) * | 2014-02-20 | 2014-05-21 | 中国计量学院 | 基于小群体信息关联的视频监控网络中行人重识别方法 |
WO2020253127A1 (zh) * | 2019-06-21 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 |
WO2021082118A1 (zh) * | 2019-11-01 | 2021-05-06 | 深圳大学 | 行人重识别的方法、装置、终端及存储介质 |
CN111222424A (zh) * | 2019-12-26 | 2020-06-02 | 的卢技术有限公司 | 一种多角度的车主身份识别方法及系统 |
CN111339979A (zh) * | 2020-03-04 | 2020-06-26 | 平安科技(深圳)有限公司 | 基于特征提取的图像识别方法及图像识别装置 |
CN112347957A (zh) * | 2020-11-12 | 2021-02-09 | 广联达科技股份有限公司 | 行人重识别方法、装置、计算机设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
官洪运;缪新苗;王亚青;井倩倩;张抒艺;: "基于步态的行人重识别算法研究", 现代计算机, no. 23, 15 August 2020 (2020-08-15) * |
张文文;王洪元;万建武;孙金玉;丁宗元;: "基于稀疏学习的行人重识别算法", 数据采集与处理, no. 05, 15 September 2018 (2018-09-15) * |
彭志勇;常发亮;刘洪彬;别秀德;: "基于HSV模型和特征点匹配的行人重识别算法", 光电子・激光, no. 08, 15 August 2015 (2015-08-15) * |
谢月飞;蔡晓东;张学敏;: "基于透视投影变换与动态候选策略的目标交接算法", 计算机应用, no. 1, 30 June 2013 (2013-06-30) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936911B2 (en) | Logo detection | |
CN111126125A (zh) | 证件中的目标文本提取方法、装置、设备及可读存储介质 | |
US8630493B2 (en) | Techniques for enabling or establishing the use of face recognition algorithms | |
Li et al. | Building extraction from remotely sensed images by integrating saliency cue | |
US9690979B2 (en) | Techniques for enabling or establishing the use of face recognition algorithms | |
CN110569878A (zh) | 一种基于卷积神经网络的照片背景相似度聚类方法及计算机 | |
JP2013508844A (ja) | 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置 | |
Yang et al. | Aligning 2.5 D scene fragments with distinctive local geometric features and voting-based correspondences | |
US20120154638A1 (en) | Systems and Methods for Implementing Augmented Reality | |
CN111914775B (zh) | 活体检测方法、装置、电子设备及存储介质 | |
Tian et al. | Scene Text Detection in Video by Learning Locally and Globally. | |
CN112613553B (zh) | 图片样本集生成方法、装置、计算机设备和存储介质 | |
CN111079571A (zh) | 证卡信息识别及其边缘检测模型训练方法、装置 | |
CN113490947A (zh) | 检测模型训练方法、装置、检测模型使用方法及存储介质 | |
CN112149762A (zh) | 目标跟踪方法、目标跟踪装置及计算机可读存储介质 | |
CN114676777A (zh) | 一种基于孪生网络的自监督学习细粒度图像分类方法 | |
Bhuyan et al. | Trajectory guided recognition of hand gestures having only global motions | |
CN112036362A (zh) | 图像处理方法、装置、计算机设备和可读存储介质 | |
CN112215964A (zh) | 基于ar的场景导览方法和设备 | |
Turk et al. | Computer vision for mobile augmented reality | |
Barath et al. | A large-scale homography benchmark | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN112766065A (zh) | 一种移动端考生身份认证方法、装置、终端及存储介质 | |
CN112347957A (zh) | 行人重识别方法、装置、计算机设备及存储介质 | |
Uchiyama et al. | Augmenting text document by on-line learning of local arrangement of keypoints |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |