CN111783568B - 一种基于置信学习的行人重识别方法、装置及存储介质 - Google Patents

一种基于置信学习的行人重识别方法、装置及存储介质 Download PDF

Info

Publication number
CN111783568B
CN111783568B CN202010549958.1A CN202010549958A CN111783568B CN 111783568 B CN111783568 B CN 111783568B CN 202010549958 A CN202010549958 A CN 202010549958A CN 111783568 B CN111783568 B CN 111783568B
Authority
CN
China
Prior art keywords
pedestrian
training set
images
training
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010549958.1A
Other languages
English (en)
Other versions
CN111783568A (zh
Inventor
林修明
辛铮
赵文霞
林淑强
陈涛涛
鄢小征
魏超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202010549958.1A priority Critical patent/CN111783568B/zh
Publication of CN111783568A publication Critical patent/CN111783568A/zh
Application granted granted Critical
Publication of CN111783568B publication Critical patent/CN111783568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于置信学习的行人重识别方法、装置及存储介质,该方法包括:从视频图像资源库的获取N张行人图像,从中随机选取M张行人图像作为查询图像,其余作为查询底库;使用行人重识别模型从中筛选一定数目的行人图像保存在一候选训练集,并该数目的行人图像标记一个新的人员id;将候选训练集与原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差后进行校验,然后对行人重识别模型进行重新训练得到重训练后的行人重识别模型后进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,有效地提高了行人重识别系统的泛化性能及准确率。

Description

一种基于置信学习的行人重识别方法、装置及存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于置信学习的行人重识别方法、装置及存储介质。
背景技术
随着社会和科技的进步,人脸识别越来越成为一项可依赖的安防技术。但是对于现今大部分摄像头而言,其分辨率往往不能达到人脸识别系统的要求,故可以应用于现有监控系统的行人重识别技术是极有必要的。行人重识别(Person re-identification)是利用图像处理技术来判定某一摄像头下的行人是否出现在其他摄像头中,从而可以描绘行人的活动路径,实现跨镜头追踪的目的。现阶段行人重识别常用方法主要有表征学习、度量学习、基于局部特征或视频序列等方法。
行人和人脸一样具有结构,但是不同于人脸,行人的结构往往更加复杂。在实际应用场景中可能存在无正脸、配饰不一、姿态变化及遮挡、摄像头的拍摄角度、室内外环境的变化、白天与黑夜的光线差异、季节穿搭(冬天进入室内可能会脱掉外套)等等不利条件和干扰因素。与此同时,不同于人脸可以到互联网直接爬取名人的图片,行人重识别由于其任务的特殊性,其训练数据集采集标记难度更高,现有的数据集往往只能达到几万的级别,这也阻碍了行人重识别技术进一步走向实用化,即现有的训练集数量不足,另一方面,现有的监控系统下存在海量的无标签数据难以利用,无法作为行人重识别的训练集使用。
发明内容
本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
一种基于置信学习的行人重识别方法,该方法包括:
预处理步骤,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;
筛选步骤,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;
置信训练步骤,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;
重训练步骤,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;
识别步骤,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。
更进一步地,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
更进一步地,所述相似度为余弦相似度,所述第一阈值为0.9,所述第二阈值为10,所述第三阈值为0.2。
更进一步地,所述使用置信训练寻找合并训练集的标签误差的过程为:
将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure 719327DEST_PATH_IMAGE001
,其表示标记类别
Figure 257756DEST_PATH_IMAGE002
样本X的实际类别
Figure 455519DEST_PATH_IMAGE003
的概率为
Figure 3175DEST_PATH_IMAGE004
Figure 468529DEST_PATH_IMAGE005
其中:
Figure 443438DEST_PATH_IMAGE006
其中,
Figure 862918DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 479845DEST_PATH_IMAGE008
得到置信分布
Figure 35591DEST_PATH_IMAGE009
后,定义联合分布:
Figure 446981DEST_PATH_IMAGE010
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
更进一步地,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
本发明还提出了一种基于置信学习的行人重识别装置,该装置包括:
预处理单元,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;
筛选单元,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;
置信训练单元,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;
重训练单元,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;
识别单元,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。
更进一步地,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
更进一步地,所述相似度为余弦相似度,所述第一阈值为0.9,所述第二阈值为10,所述第三阈值为0.2。
更进一步地,所述使用置信训练寻找合并训练集的标签误差的过程为:
将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure DEST_PATH_IMAGE011
,其表示标记类别
Figure 822598DEST_PATH_IMAGE012
样本X的实际类别
Figure 747610DEST_PATH_IMAGE013
的概率为
Figure 423442DEST_PATH_IMAGE014
Figure 5733DEST_PATH_IMAGE015
其中:
Figure 399805DEST_PATH_IMAGE016
其中,
Figure 827375DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 623293DEST_PATH_IMAGE017
得到置信分布
Figure 110906DEST_PATH_IMAGE018
后,定义联合分布:
Figure 992275DEST_PATH_IMAGE019
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
更进一步地,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。
本发明的技术效果在于:本发明的一种基于置信学习的行人重识别方法,该方法包括:预处理步骤,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;筛选步骤,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;置信训练步骤,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;重训练步骤,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;识别步骤,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,使用更多的训练数据对行人重识别系统进行再训练,有效地提高了行人重识别系统的泛化性能及准确率,提高了行人重识别的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1是根据本发明的实施例的一种基于置信学习的行人重识别方法的流程图。
图2是根据本发明的实施例的一种基于置信学习的行人重识别装置的结构图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了本发明的一种基于置信学习的行人重识别方法,该方法包括:
预处理步骤S101,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;本发明的视频资源库为监控系统拍下的一段段视频资源,一般来说M、N都为整数,且N大于M,N的数目一般来说比较大,比如成千上万张图像,可以根据一定的比例确定M的大小,比如从N张行人图像选取其中的10%作为M张行人图像作为查询图像,其余的图像作为查询底库。
筛选步骤S102,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;一般来说,可以使用余弦距离表示相似度,即余弦相似度,所述第一阈值可以设为0.85-0.95,优选0.9,所述第二阈值可以设置为8-12,优选为10。
置信训练步骤S103,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;置信学习基于噪声数据剪枝的原理,以计数的方式对噪声进行评估,并对样本进行排序以进行置信训练,与大多数机器学习方法不同,置信学习具有不需要超参数等优点,其训练速度快,可以对视频中提取的照片进行清洗,一般来说,所述第三阈值设置为0.15-0.25,优选为0.2。
重训练步骤S104,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;训练完毕后可以对训练后的行人重识别模型与训练前的模型进行性能比较,如果训练后的行人重识别模型识别准确率大于训练前的模型的识别准确率,将训练后的行人重识别模型进行保存,否则,进行丢弃后,重新进行训练,直到获取性能优于现有的行人重识别模型。
识别步骤S105,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。更新是指使用重训练后的且性能优于现有的行人重识别模型的行人重识别模型替换现有的行人重识别模型进行发布,比如可以更新客户端中的现有的行人重识别模型。
在一个实施例中,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
在一个实施例中,所述使用置信训练寻找合并训练集的标签误差的过程为:将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure 987650DEST_PATH_IMAGE020
,其表示标记类别
Figure 638074DEST_PATH_IMAGE021
样本X的实际类别
Figure 562168DEST_PATH_IMAGE022
的概率为
Figure 665253DEST_PATH_IMAGE023
Figure 700205DEST_PATH_IMAGE024
其中:
Figure 470715DEST_PATH_IMAGE025
其中,
Figure 565710DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 156092DEST_PATH_IMAGE026
得到置信分布
Figure 493270DEST_PATH_IMAGE027
后,定义联合分布:
Figure 118286DEST_PATH_IMAGE028
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
在一个实施例中,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
本发明的方法利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,使用更多的训练数据对行人重识别系统进行再训练,有效地提高了行人重识别系统的泛化性能及准确率,提高了行人重识别的准确率,这是本发明的重要发明点。
图2示出了本发明的一种基于置信学习的行人重识别装置,该装置包括:
预处理单元201,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;本发明的视频资源库为监控系统拍下的一段段视频资源,一般来说M、N都为整数,且N大于M,N的数目一般来说比较大,比如成千上万张图像,可以根据一定的比例确定M的大小,比如从N张行人图像选取其中的10%作为M张行人图像作为查询图像,其余的图像作为查询底库。
筛选单元202,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;一般来说,可以使用余弦距离表示相似度,即余弦相似度,所述第一阈值可以设为0.85-0.95,优选0.9,所述第二阈值可以设置为8-12,优选为10。
置信训练单元203,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;置信学习基于噪声数据剪枝的原理,以计数的方式对噪声进行评估,并对样本进行排序以进行置信训练,与大多数机器学习方法不同,置信学习具有不需要超参数等优点,其训练速度快,可以对视频中提取的照片进行清洗,一般来说,所述第三阈值设置为0.15-0.25,优选为0.2。
重训练单元204,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;训练完毕后可以对训练后的行人重识别模型与训练前的模型进行性能比较,如果训练后的行人重识别模型识别准确率大于训练前的模型的识别准确率,将训练后的行人重识别模型进行保存,否则,进行丢弃后,重新进行训练,直到获取性能优于现有的行人重识别模型。
识别单元205,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。更新是指使用重训练后的且性能优于现有的行人重识别模型的行人重识别模型替换现有的行人重识别模型进行发布,比如可以更新客户端中的现有的行人重识别模型。
在一个实施例中,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
在一个实施例中,所述使用置信训练寻找合并训练集的标签误差的过程为:将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure 180920DEST_PATH_IMAGE029
,其表示标记类别
Figure 258597DEST_PATH_IMAGE030
样本X的实际类别
Figure 635352DEST_PATH_IMAGE031
的概率为
Figure 114875DEST_PATH_IMAGE032
Figure 551673DEST_PATH_IMAGE033
其中:
Figure 116646DEST_PATH_IMAGE034
其中,
Figure 297092DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 129656DEST_PATH_IMAGE035
得到置信分布
Figure 737355DEST_PATH_IMAGE036
后,定义联合分布:
Figure 789625DEST_PATH_IMAGE037
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
在一个实施例中,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
本发明的装置利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,使用更多的训练数据对行人重识别系统进行再训练,有效地提高了行人重识别系统的泛化性能及准确率,提高了行人重识别的准确率,这是本发明的重要发明点。
本发明的为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质 中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的装置。
最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (11)

1.一种基于置信学习的行人重识别方法,其特征在于,该方法包括:
预处理步骤,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;
筛选步骤,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;
置信训练步骤,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;
重训练步骤,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;
识别步骤,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。
2.根据权利要求1所述的方法,其特征在于,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
3.根据权利要求2所述的方法,其特征在于,所述相似度为余弦相似度,所述第一阈值为0.9,所述第二阈值为10,所述第三阈值为0.2。
4.根据权利要求3所述的方法,其特征在于,所述使用置信训练寻找合并训练集的标签误差的过程为:
将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure DEST_PATH_IMAGE001
,其表示标记类别
Figure 241589DEST_PATH_IMAGE002
样本X的实际类别
Figure 670296DEST_PATH_IMAGE003
的概率为
Figure 790699DEST_PATH_IMAGE004
Figure 39277DEST_PATH_IMAGE005
其中:
Figure 700066DEST_PATH_IMAGE006
; 其中,
Figure DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 655384DEST_PATH_IMAGE008
得到置信分布
Figure DEST_PATH_IMAGE009
后,定义联合分布:
Figure 179644DEST_PATH_IMAGE010
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
5.根据权利要求4所述的方法,其特征在于,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
6.一种基于置信学习的行人重识别装置,其特征在于,该装置包括:
预处理单元,从视频图像资源库的获取N张行人图像,从所述N张行人图像随机选取M张行人图像作为查询图像,N-M张行人图像作为查询底库;
筛选单元,使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配,如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时,则将该数目的行人图像保存在一候选训练集,并将该数目的行人图像标记一个新的人员id;
置信训练单元,当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时,将所述候选训练集与所述原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差;
重训练单元,基于所述标签误差对所述合并训练集进行校验,使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型;
识别单元,将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。
7.根据权利要求6所述的装置,其特征在于,所述从视频图像资源库的获取N张行人图像的操作为:通过行人检测模型对视频图像资源库中的每条视频进行检测,如果所述视频中一帧或多帧中存在行人,则将该一帧或多帧中的行人图像进行抠取,所述视频处理完毕后获得N张行人图像。
8.根据权利要求7所述的装置,其特征在于,所述相似度为余弦相似度,所述第一阈值为0.9,所述第二阈值为10,所述第三阈值为0.2。
9.根据权利要求8所述的装置,其特征在于,所述使用置信训练寻找合并训练集的标签误差的过程为:
将原始训练集等分成5份,每份分别与候选训练集组成5个子合并训练集,针对这5个子合并训练集并行进行置信训练,对子合并训练集分别剔除错误标签后再对其进行合并,对每个子合并训练集进行置信训练的操作为:
定义置信分布:每个子合并训练集的置信分布
Figure 649939DEST_PATH_IMAGE011
,其表示标记类别
Figure 317681DEST_PATH_IMAGE012
样本X的实际类别
Figure 455401DEST_PATH_IMAGE013
的概率为
Figure 917606DEST_PATH_IMAGE014
Figure 937515DEST_PATH_IMAGE015
其中:
Figure 612210DEST_PATH_IMAGE016
其中,
Figure 604437DEST_PATH_IMAGE007
为设定阈值,表示类别j中的所有样本距类中心的平均余弦距离:
Figure 34281DEST_PATH_IMAGE017
得到置信分布
Figure 464124DEST_PATH_IMAGE018
后,定义联合分布:
Figure 270406DEST_PATH_IMAGE019
得到联合分布后,用于查找并删除带有标签问题的噪声类别。
10.根据权利要求9所述的装置,其特征在于,所述基于所述标签误差对所述合并训练集进行校验的操作为:通过人工判定所述标签误差是否正确,如果判定存在误标记,则删除该人员id。
11.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行权利要求1-5之任一的方法。
CN202010549958.1A 2020-06-16 2020-06-16 一种基于置信学习的行人重识别方法、装置及存储介质 Active CN111783568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010549958.1A CN111783568B (zh) 2020-06-16 2020-06-16 一种基于置信学习的行人重识别方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010549958.1A CN111783568B (zh) 2020-06-16 2020-06-16 一种基于置信学习的行人重识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111783568A CN111783568A (zh) 2020-10-16
CN111783568B true CN111783568B (zh) 2022-07-15

Family

ID=72755979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010549958.1A Active CN111783568B (zh) 2020-06-16 2020-06-16 一种基于置信学习的行人重识别方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111783568B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112950674B (zh) * 2021-03-09 2024-03-05 厦门市公安局 一种基于多种识别技术协同的跨摄像头轨迹跟踪方法、装置及存储介质
CN112926487B (zh) * 2021-03-17 2022-02-11 西安电子科技大学广州研究院 一种行人重识别的方法和装置
CN113625603B (zh) * 2021-07-27 2023-06-23 金鹏电子信息机器有限公司 基于大数据的安防监控管理系统及管理方法
CN113984946B (zh) * 2021-10-21 2022-12-27 江南大学 一种基于气相电子鼻和机器学习的小龙虾新鲜度检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717520A (zh) * 2018-04-10 2018-10-30 新智数字科技有限公司 一种行人重识别方法及装置
CN109740413A (zh) * 2018-11-14 2019-05-10 平安科技(深圳)有限公司 行人重识别方法、装置、计算机设备及计算机存储介质
CN109977798A (zh) * 2019-03-06 2019-07-05 中山大学 用于行人重识别的掩膜池化模型训练和行人重识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10108850B1 (en) * 2017-04-24 2018-10-23 Intel Corporation Recognition, reidentification and security enhancements using autonomous machines

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717520A (zh) * 2018-04-10 2018-10-30 新智数字科技有限公司 一种行人重识别方法及装置
CN109740413A (zh) * 2018-11-14 2019-05-10 平安科技(深圳)有限公司 行人重识别方法、装置、计算机设备及计算机存储介质
CN109977798A (zh) * 2019-03-06 2019-07-05 中山大学 用于行人重识别的掩膜池化模型训练和行人重识别方法

Also Published As

Publication number Publication date
CN111783568A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN111783568B (zh) 一种基于置信学习的行人重识别方法、装置及存储介质
CN111126360B (zh) 基于无监督联合多损失模型的跨域行人重识别方法
CN110414368B (zh) 一种基于知识蒸馏的无监督行人重识别方法
Huang et al. Person search in videos with one portrait through visual and temporal links
CN110717411A (zh) 一种基于深层特征融合的行人重识别方法
Lee et al. Place recognition using straight lines for vision-based SLAM
CN111666434B (zh) 基于深度全局特征的街景图片检索方法
CN112232241A (zh) 一种行人重识别方法、装置、电子设备和可读存储介质
CN108171127A (zh) 一种基于深度学习的发票自动识别方法
CN104794219A (zh) 一种基于地理位置信息的场景检索方法
CN109241808A (zh) 一种时尚图像中二维码自动筛选方法
CN111209799B (zh) 基于部分共享网络和余弦间隔损失函数的行人搜索方法
CN110309810B (zh) 一种基于批次中心相似度的行人重识别方法
CN111932582A (zh) 一种视频图像中的目标跟踪方法及装置
Zhang et al. Topological spatial verification for instance search
US20240087352A1 (en) System for identifying companion animal and method therefor
CN112836611A (zh) 确定身体部位语义图、模型训练和行人重识别方法及设备
CN112685580A (zh) 基于深度学习的社交网络头像比对的分布式检测系统、方法、装置、处理器及其存储介质
Gominski et al. Challenging deep image descriptors for retrieval in heterogeneous iconographic collections
CN108133192A (zh) 一种基于高斯-拉普拉斯分布统计的行人重识别
CN116580333A (zh) 基于YOLOv5和改进StrongSORT的粮库车辆追踪方法
Hanif et al. Re-ranking person re-identification using distance aggregation of k-nearest neighbors hierarchical tree
CN110717544B (zh) 一种垂直鱼眼镜头下行人属性分析方法及系统
CN110826432B (zh) 一种基于航空图片的输电线识别方法
CN110503663B (zh) 一种基于抽帧检测的随机多目标自动检测跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant