CN111783568B

CN111783568B - 一种基于置信学习的行人重识别方法、装置及存储介质

Info

Publication number: CN111783568B
Application number: CN202010549958.1A
Authority: CN
Inventors: 林修明; 辛铮; 赵文霞; 林淑强; 陈涛涛; 鄢小征; 魏超
Original assignee: Xiamen Meiya Pico Information Co Ltd
Current assignee: Xiamen Meiya Pico Information Co Ltd
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2022-07-15
Anticipated expiration: 2040-06-16
Also published as: CN111783568A

Abstract

本发明提出了一种基于置信学习的行人重识别方法、装置及存储介质，该方法包括：从视频图像资源库的获取N张行人图像，从中随机选取M张行人图像作为查询图像，其余作为查询底库；使用行人重识别模型从中筛选一定数目的行人图像保存在一候选训练集，并该数目的行人图像标记一个新的人员id；将候选训练集与原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差后进行校验，然后对行人重识别模型进行重新训练得到重训练后的行人重识别模型后进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据，从而提供更多的可用训练数据，有效地提高了行人重识别系统的泛化性能及准确率。

Description

一种基于置信学习的行人重识别方法、装置及存储介质

技术领域

本发明涉及人工智能技术领域，具体涉及一种基于置信学习的行人重识别方法、装置及存储介质。

背景技术

随着社会和科技的进步，人脸识别越来越成为一项可依赖的安防技术。但是对于现今大部分摄像头而言，其分辨率往往不能达到人脸识别系统的要求，故可以应用于现有监控系统的行人重识别技术是极有必要的。行人重识别（Person re-identification）是利用图像处理技术来判定某一摄像头下的行人是否出现在其他摄像头中，从而可以描绘行人的活动路径，实现跨镜头追踪的目的。现阶段行人重识别常用方法主要有表征学习、度量学习、基于局部特征或视频序列等方法。

行人和人脸一样具有结构，但是不同于人脸，行人的结构往往更加复杂。在实际应用场景中可能存在无正脸、配饰不一、姿态变化及遮挡、摄像头的拍摄角度、室内外环境的变化、白天与黑夜的光线差异、季节穿搭（冬天进入室内可能会脱掉外套）等等不利条件和干扰因素。与此同时，不同于人脸可以到互联网直接爬取名人的图片，行人重识别由于其任务的特殊性，其训练数据集采集标记难度更高，现有的数据集往往只能达到几万的级别，这也阻碍了行人重识别技术进一步走向实用化，即现有的训练集数量不足，另一方面，现有的监控系统下存在海量的无标签数据难以利用，无法作为行人重识别的训练集使用。

发明内容

本发明针对上述现有技术中一个或多个技术缺陷，提出了如下技术方案。

一种基于置信学习的行人重识别方法，该方法包括：

预处理步骤，从视频图像资源库的获取N张行人图像，从所述N张行人图像随机选取M张行人图像作为查询图像，N-M张行人图像作为查询底库；

筛选步骤，使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配，如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时，则将该数目的行人图像保存在一候选训练集，并将该数目的行人图像标记一个新的人员id；

置信训练步骤，当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时，将所述候选训练集与所述原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差；

重训练步骤，基于所述标签误差对所述合并训练集进行校验，使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型；

识别步骤，将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。

更进一步地，所述从视频图像资源库的获取N张行人图像的操作为：通过行人检测模型对视频图像资源库中的每条视频进行检测，如果所述视频中一帧或多帧中存在行人，则将该一帧或多帧中的行人图像进行抠取，所述视频处理完毕后获得N张行人图像。

更进一步地，所述相似度为余弦相似度，所述第一阈值为0.9，所述第二阈值为10，所述第三阈值为0.2。

更进一步地，所述使用置信训练寻找合并训练集的标签误差的过程为：

将原始训练集等分成5份，每份分别与候选训练集组成5个子合并训练集，针对这5个子合并训练集并行进行置信训练，对子合并训练集分别剔除错误标签后再对其进行合并，对每个子合并训练集进行置信训练的操作为：

定义置信分布：每个子合并训练集的置信分布

，其表示标记类别

样本X的实际类别

的概率为

；

其中：

；

其中，

为设定阈值，表示类别j中的所有样本距类中心的平均余弦距离:

得到置信分布

后，定义联合分布：

得到联合分布后，用于查找并删除带有标签问题的噪声类别。

更进一步地，所述基于所述标签误差对所述合并训练集进行校验的操作为：通过人工判定所述标签误差是否正确，如果判定存在误标记，则删除该人员id。

本发明还提出了一种基于置信学习的行人重识别装置，该装置包括：

预处理单元，从视频图像资源库的获取N张行人图像，从所述N张行人图像随机选取M张行人图像作为查询图像，N-M张行人图像作为查询底库；

筛选单元，使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配，如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时，则将该数目的行人图像保存在一候选训练集，并将该数目的行人图像标记一个新的人员id；

置信训练单元，当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时，将所述候选训练集与所述原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差；

重训练单元，基于所述标签误差对所述合并训练集进行校验，使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型；

识别单元，将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。

定义置信分布：每个子合并训练集的置信分布

，其表示标记类别

样本X的实际类别

的概率为

；

其中：

；

其中，

得到置信分布

后，定义联合分布：

本发明还提出了一种计算机可读存储介质，所述存储介质上存储有计算机程序代码，当所述计算机程序代码被计算机执行时执行上述之任一的方法。

本发明的技术效果在于：本发明的一种基于置信学习的行人重识别方法，该方法包括：预处理步骤，从视频图像资源库的获取N张行人图像，从所述N张行人图像随机选取M张行人图像作为查询图像，N-M张行人图像作为查询底库；筛选步骤，使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配，如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时，则将该数目的行人图像保存在一候选训练集，并将该数目的行人图像标记一个新的人员id；置信训练步骤，当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时，将所述候选训练集与所述原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差；重训练步骤，基于所述标签误差对所述合并训练集进行校验，使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型；识别步骤，将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据，从而提供更多的可用训练数据，使用更多的训练数据对行人重识别系统进行再训练，有效地提高了行人重识别系统的泛化性能及准确率，提高了行人重识别的准确率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显。

图1是根据本发明的实施例的一种基于置信学习的行人重识别方法的流程图。

图2是根据本发明的实施例的一种基于置信学习的行人重识别装置的结构图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了本发明的一种基于置信学习的行人重识别方法，该方法包括：

预处理步骤S101，从视频图像资源库的获取N张行人图像，从所述N张行人图像随机选取M张行人图像作为查询图像，N-M张行人图像作为查询底库；本发明的视频资源库为监控系统拍下的一段段视频资源，一般来说M、N都为整数，且N大于M，N的数目一般来说比较大，比如成千上万张图像，可以根据一定的比例确定M的大小，比如从N张行人图像选取其中的10%作为M张行人图像作为查询图像，其余的图像作为查询底库。

筛选步骤S102，使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配，如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时，则将该数目的行人图像保存在一候选训练集，并将该数目的行人图像标记一个新的人员id；一般来说，可以使用余弦距离表示相似度，即余弦相似度，所述第一阈值可以设为0.85-0.95，优选0.9，所述第二阈值可以设置为8-12，优选为10。

置信训练步骤S103，当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时，将所述候选训练集与所述原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差；置信学习基于噪声数据剪枝的原理，以计数的方式对噪声进行评估，并对样本进行排序以进行置信训练，与大多数机器学习方法不同，置信学习具有不需要超参数等优点，其训练速度快，可以对视频中提取的照片进行清洗，一般来说，所述第三阈值设置为0.15-0.25，优选为0.2。

重训练步骤S104，基于所述标签误差对所述合并训练集进行校验，使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型；训练完毕后可以对训练后的行人重识别模型与训练前的模型进行性能比较，如果训练后的行人重识别模型识别准确率大于训练前的模型的识别准确率，将训练后的行人重识别模型进行保存，否则，进行丢弃后，重新进行训练，直到获取性能优于现有的行人重识别模型。

识别步骤S105，将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。更新是指使用重训练后的且性能优于现有的行人重识别模型的行人重识别模型替换现有的行人重识别模型进行发布，比如可以更新客户端中的现有的行人重识别模型。

在一个实施例中，所述从视频图像资源库的获取N张行人图像的操作为：通过行人检测模型对视频图像资源库中的每条视频进行检测，如果所述视频中一帧或多帧中存在行人，则将该一帧或多帧中的行人图像进行抠取，所述视频处理完毕后获得N张行人图像。

在一个实施例中，所述使用置信训练寻找合并训练集的标签误差的过程为：将原始训练集等分成5份，每份分别与候选训练集组成5个子合并训练集，针对这5个子合并训练集并行进行置信训练，对子合并训练集分别剔除错误标签后再对其进行合并，对每个子合并训练集进行置信训练的操作为：

定义置信分布：每个子合并训练集的置信分布

，其表示标记类别

样本X的实际类别

的概率为

；

其中：

；

其中，

得到置信分布

后，定义联合分布：

在一个实施例中，所述基于所述标签误差对所述合并训练集进行校验的操作为：通过人工判定所述标签误差是否正确，如果判定存在误标记，则删除该人员id。

本发明的方法利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据，从而提供更多的可用训练数据，使用更多的训练数据对行人重识别系统进行再训练，有效地提高了行人重识别系统的泛化性能及准确率，提高了行人重识别的准确率，这是本发明的重要发明点。

图2示出了本发明的一种基于置信学习的行人重识别装置，该装置包括：

预处理单元201，从视频图像资源库的获取N张行人图像，从所述N张行人图像随机选取M张行人图像作为查询图像，N-M张行人图像作为查询底库；本发明的视频资源库为监控系统拍下的一段段视频资源，一般来说M、N都为整数，且N大于M，N的数目一般来说比较大，比如成千上万张图像，可以根据一定的比例确定M的大小，比如从N张行人图像选取其中的10%作为M张行人图像作为查询图像，其余的图像作为查询底库。

筛选单元202，使用行人重识别模型对所述M张行人图像中的每张行人图像在查询底库进行查询匹配，如果查询底库中存在与该张行人图像相似度大于第一阈值的图像的数目大于第二阈值时，则将该数目的行人图像保存在一候选训练集，并将该数目的行人图像标记一个新的人员id；一般来说，可以使用余弦距离表示相似度，即余弦相似度，所述第一阈值可以设为0.85-0.95，优选0.9，所述第二阈值可以设置为8-12，优选为10。

置信训练单元203，当所述候选训练集的id的数目与所述行人重识别模型的原始训练集数目的比例达到第三阈值时，将所述候选训练集与所述原始训练集合并得到合并训练集，并使用置信训练寻找合并训练集的标签误差；置信学习基于噪声数据剪枝的原理，以计数的方式对噪声进行评估，并对样本进行排序以进行置信训练，与大多数机器学习方法不同，置信学习具有不需要超参数等优点，其训练速度快，可以对视频中提取的照片进行清洗，一般来说，所述第三阈值设置为0.15-0.25，优选为0.2。

重训练单元204，基于所述标签误差对所述合并训练集进行校验，使用校验后的合并训练集对所述行人重识别模型进行重新训练得到重训练后的行人重识别模型；训练完毕后可以对训练后的行人重识别模型与训练前的模型进行性能比较，如果训练后的行人重识别模型识别准确率大于训练前的模型的识别准确率，将训练后的行人重识别模型进行保存，否则，进行丢弃后，重新进行训练，直到获取性能优于现有的行人重识别模型。

识别单元205，将所述重训练后的行人重识别模型进行线上更新以进行行人重识别。更新是指使用重训练后的且性能优于现有的行人重识别模型的行人重识别模型替换现有的行人重识别模型进行发布，比如可以更新客户端中的现有的行人重识别模型。

定义置信分布：每个子合并训练集的置信分布

，其表示标记类别

样本X的实际类别

的概率为

；

其中：

；

其中，

得到置信分布

后，定义联合分布：

本发明的装置利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据，从而提供更多的可用训练数据，使用更多的训练数据对行人重识别系统进行再训练，有效地提高了行人重识别系统的泛化性能及准确率，提高了行人重识别的准确率，这是本发明的重要发明点。

本发明的为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例或者实施例的某些部分所述的装置。

最后所应说明的是：以上实施例仅以说明而非限制本发明的技术方案，尽管参照上述实施例对本发明进行了详细说明，本领域的普通技术人员应当理解：依然可以对本发明进行修改或者等同替换，而不脱离本发明的精神和范围的任何修改或局部替换，其均应涵盖在本发明的权利要求范围当中。