CN111414952B - 行人重识别的噪声样本识别方法、装置、设备和存储介质 - Google Patents

行人重识别的噪声样本识别方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111414952B
CN111414952B CN202010186361.5A CN202010186361A CN111414952B CN 111414952 B CN111414952 B CN 111414952B CN 202010186361 A CN202010186361 A CN 202010186361A CN 111414952 B CN111414952 B CN 111414952B
Authority
CN
China
Prior art keywords
sample
initial
group
noise
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010186361.5A
Other languages
English (en)
Other versions
CN111414952A (zh
Inventor
程昊
蒋忻洋
李珂
孙星
余宗桥
彭湃
郭晓威
黄小明
黄飞跃
吴永坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010186361.5A priority Critical patent/CN111414952B/zh
Publication of CN111414952A publication Critical patent/CN111414952A/zh
Application granted granted Critical
Publication of CN111414952B publication Critical patent/CN111414952B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Abstract

一种行人重识别的噪声样本识别方法、装置、设备和存储介质,所述方法包括:对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征;根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离,目标样本组包括至少两个初始样本,样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离;根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本;将确定为噪声样本的初始样本移除,获得更新后的样本数据;根据更新后的样本数据对预设神经网络进行网络训练,获得训练确定的行人重识别模型。通过上述方法获得的行人重识别模型的准确度更高。

Description

行人重识别的噪声样本识别方法、装置、设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种行人重识别的噪声样本识别方法、装置、计算机设备和存储介质。
背景技术
在机器学习的领域中,需要携带标注信息的样本来训练模型,而样本的标注信息通常是由所属领域的经验丰富的人员对样本进行标注得到的,其中也有可能存在标注失误的情况,这一标注失误的样本称为噪声样本;为了使用于训练模型的样本更好,可以采用一些方法识别出样本中的噪声样本。
通常认为噪声标签对应样本的loss(损失)倾向于比非噪声样本的loss要大,在例如图像分类问题中主要根据网络输出层(FC层)的损失(loss)来鉴别噪声样本数据;然而,在一些具体应用场景中,例如行人重识别(ReID),ID的数量很多,而每个ID内的样本数据量较少,通过上述方法网络输出层容易过拟合,利用样本的loss无法区分出噪声样本和非噪声样本,进而用包含噪声样本的样本数据进行行人重识别模型的训练,获得的模型识别准确度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够获得识别准确度更高的行人重识别模型的行人重识别的噪声样本识别方法、装置、设备和存储介质。
一种行人重识别的噪声样本识别方法,所述方法包括:
对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;
根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;
根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;
将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;
根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
一种行人重识别的噪声样本识别装置,所述装置包括:
特征提取模块,用于对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;
样本距离确定模块,用于根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;
噪声样本识别模块,用于根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;
样本更新模块,用于将确定为噪声样本的初始样本移除,获得更新后的样本数据;
模型训练模块,用于根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;
根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;
根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;
将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;
根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;
根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;
根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;
将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;
根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
上述行人重识别的噪声样本识别方法、装置、设备和存储介质,通过对行人重识别的各初始样本进行特征提取,提取获得的各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组中各初始样本的样本特征所在目标样本组的组内样本特征中心之间的样本距离;其中,目标样本组中包括至少两个初始样本;进一步地,根据各样本对应的目标样本距离确定各样本的是否为噪声样本;识别出噪声样本后,将初始样本中的噪声样本剔除,用更新后的样本对预设时间网络模型进行训练,获得行人重识别模型。上述行人重识别的噪声样本识别方法,通过对各初始样本进行特征提取,并基于提取的特征计算各初始样本的样本特征与所在组的组内样本特征中心的样本距离,并根据各初始样本的样本距离确定初始样本是否为噪声样本,确定为噪声样本后将其从初始样本中剔除获得更新后的样本数据,进而利用更新后的样本数据进行网络模型训练获得行人重识别模型,获得的行人重识别模型的识别准确度更高。
附图说明
图1为一个实施例中行人重识别的噪声样本识别方法的流程示意图;
图2为一个实施例中对各行人重识别的初始样本进行特征提取,获得各初始样本的样本特征的流程示意图;
图3为一个实施例中根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离的流程示意图;
图4为一个具体实施例中混合高斯模型的输出结果;
图5为一个实施例中根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本的流程示意图;
图6为一个具体实施例中ReID中ID内的各初始样本的示意图;
图7为一个具体实施例中行人重识别的噪声样本识别方法的流程示意图;
图8为一个具体实施例中提取各初始样本的特征的流程示意图;
图9为一个实施例中行人重识别的噪声样本识别装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,本申请提供了一种行人重识别的噪声样本识别方法,包括步骤S110至步骤S150。
步骤S110,对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征。
行人重识别(Person ReID,Person re-identification),也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。给定一张切好块的行人图像(query image),从一大堆切好块的图像(gallery images)中找到同一身份的人的图像的过程;这些图像通常是由不同摄像头拍摄的不连续帧。
计算机视觉(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本实施例中,初始样本是指的原本给定用于训练预设神经网络的样本,其中可能包含有噪声样本,这类样本如果与干净样本一起训练模型,可能导致模型的准确率降低;因此在本申请中提出一种行人重识别的噪声样本识别方法,通过对各行人重识别的初始样本进行识别,找出其中的噪声样本进行剔除之后,用得到的干净样本训练预设神经网络,可以提高训练确定的模型的准确率;其中,训练确定的模型用于行人重识别。
针对用于训练预设神经网络的初始样本,可能包括多组样本,每一组初始样本对应同一标注信息;在行人重识别的场景中,初始样本包括多个ID,每一ID中可能包括多个摄像头下拍摄的图片,对应被标注为同一目标(例如一个ID内的图像对应的标注信息均为行人X);在行人重识别的场景中每一ID内包含的样本量较少。
其中,特征提取是计算机视觉和图像处理中的一个概念;它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征;特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。在一个实施例中,对各初始样本进行特征提取可以采用多种方式,如利用神经网络提取特征、通过图像特征提取算法进行特征提取SIFT(Scale-invariant feature transform,尺度不变特征变换)、HOG(histogram of Oriented Gradient,方向梯度直方图)、DOG(Difference ofGaussian,高斯函数差分)等等。在一个具体实施例中,通过预设神经网络的卷积层对初始样本数据中各样本进行图像特征提取;卷积神经网络中每层卷积层(Convolutionallayer)由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。在一个实施例中,预设神经网络是卷积神经网络,在一个具体实施例中,预设神经网络为ResNet50(残差网络),或者更深层结构的网络,如DenseNet。
步骤S120,根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离;其中,目标样本组包括至少两个初始样本,样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离。
组内样本特征中心是指的每一组初始样本对应计算得到一个组内样本特征中心;在一个具体实施例中,将目标样本组中的各初始样本的样本特征计算平均值,确定为该目标样本组的组内样本特征中心;进一步地,计算各初始样本的样本特征与所在目标样本组的组内样本特征中心之间的距离,确定为该初始样本的样本距离,可以理解地,每一初始样本对应一个样本距离。
在一个实施例中,初始样本中携带组别标识,通过组别标识确定各初始样本所在的样本组;进一步地,在一个实施例中,目标样本组为包括所有初始样本的样本组(可能包括两个或两个以上样本组),在另一个实施例中,目标样本组包括同一组别标识的样本组(包括一个样本组);其中,任一样本组中包括至少两个初始样本。
步骤S130,根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本。
在确定各初始样本跟与其对应的组内样本特征中心的目标样本距离之后,基于目标样本距离确定各初始样本是否为噪声样本;通常噪声样本和非噪声样本对应的目标样本距离相差较大,因此可以根据目标样本距离可以确定各初始样本是否为噪声样本。
进一步地,在一个实施例中,可以对各初始样本的目标样本距离采用聚类的方式来鉴别该初始样本是否为噪声样本,其中聚类的方式例如可以是如混合高斯模型聚类、层次聚类等方式。
步骤S140,将确定为噪声样本的初始样本移除,获得更新后的样本数据。
在根据各初始样本的样本距离确定初始样本是否为噪声样本之后,本实施例中将噪声样本从各初始样本中移除,获得更新后的样本数据,即为干净的非噪声样本数据,利用非噪声样本数据对神经网络模型进行训练,可以获得准确度更高的模型。
步骤S150,根据更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
在一个实施例中,根据更新后的样本数据对第一预设神经网络进行网络训练可以通过任意一种模型训练的方式实现;如在一个具体实施例中,根据更新后的样本数据对第一预设神经网络进行训练中,使用cross entropy loss(交叉熵损失)计算损失,基于损失进行反向梯度更新。本实施例中,最终收敛后的神经网络即为最终确定的网络模型,记为行人重识别模型,由于该行人重识别模型仅用非噪声样本(可靠的干净样本)进行训练得到,达到了去除噪声标签的目的,行人重识别模型使用时识别准确度更高。在一个具体实施例中,第一预设神经网络可以是ResNet50或者DenseNet,可用于训练行人重识别模型。
相比于利用不对样本数据中的噪声样本进行识别并剔除网络模型训练而言,本实施例中利用识别并剔除了噪声样本的样本,即上述更新后的样本,训练获得的模型准确度更高。
上述行人重识别的噪声样本识别方法,通过对行人重识别的各初始样本进行特征提取,提取获得的各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组中各初始样本的样本特征所在目标样本组的组内样本特征中心之间的样本距离;其中,目标样本组中包括至少两个初始样本;进一步地,根据各样本对应的目标样本距离确定各样本的是否为噪声样本;识别出噪声样本后,将初始样本中的噪声样本剔除,用更新后的样本对预设时间网络模型进行训练,获得行人重识别模型。上述行人重识别的噪声样本识别方法,通过对各初始样本进行特征提取,并基于提取的特征计算各初始样本的样本特征与所在组的组内样本特征中心的样本距离,并根据各初始样本的样本距离确定初始样本是否为噪声样本,确定为噪声样本后将其从初始样本中剔除获得更新后的样本数据,进而利用更新后的样本数据进行网络模型训练获得行人重识别模型,获得的行人重识别模型的识别准确度更高。
在一个实施例中,如图2所示,对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征,包括:
步骤S210,根据初始样本训练第二预设神经网络,并在达到训练终止条件时停止训练,获得中间神经网络。
在一个实施例中,根据初始样本第二训练预设神经网络包括:根据各初始样本,采用梯度下降的方法对预设神经网络进行训练;其中,梯度下降法作为机器学习中较常使用的优化算法,其有着三种不同的形式:批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent)以及小批量梯度下降(Mini-Batch GradientDescent);本实施例中,采用随机梯度下降方法训练预设神经网络;随机梯度下降是每次迭代使用一个样本来对参数进行更新,使得训练速度加快。在一个实施例中,第一预设神经网络和第二预设神经网络的网络结构相同。
终止条件是指神经网络模型停止训练的条件,在一个实施例中,预设时间网络的训练次数达到预设次数阈值判定满足终止条件;在另一个实施例中,第二预设神经网络的损失小于预设阈值时判定满足终止条件;在另一个实施例中,第二预设神经网络的损失不再增加时判定满足终止条件;其中第二预设神经网络的损失可以通过任意一种可实现的方式确定。在本实施例中,将对第二预设神经网络的训练达到终止条件时停止训练获得的神经网络记为中间神经网络。
步骤S220,将初始样本输入中间神经网络,获取中间神经网络的卷积层对各初始样本进行特征提取得到的样本特征。
在一个实施例中,利用各初始样本训练得到的中间神经网络对各初始样本进行特征提取获得样本特征,进一步地,在一个实施例中,获取中间神经网络中的最后一个卷积层(紧靠全连接层的卷积层)提取的图像特征作为各初始样本的样本特征。本实施例中,首先利用各初始样本对第二预设神经网络进行训练,在达到终止条件时停止训练获得中间神经网络,该中间神经网络较为稳定,因此本实施例中根据各初始样本输入中间神经网络,获取中间神经网络中的卷积层对各初始样本进行图像特征获得的样本特征。
在一个实施例中,目标样本组包括各样本组;如图3所示,在本实施例中,根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离,包括步骤S310至步骤S350。
步骤S310,读取各初始样本的组别标识。
在本实施例中,初始样本中携带组别标识,用于标识该初始样本所属的组别;在一个实施例中,组别标识对应行人重识别样本的ID(identification,身份)标识。
步骤S320,选取未被选取的任一组别标识对应的样本组为待处理样本组,获取待处理样本组中的各初始样本的样本特征。
本实施例中目标样本组包括所有初始样本所在的样本组,所以对于各目标样本组采取依次选取一个样本组进行计算样本特征中心以及各初始样本的样本距离,本实施例中记为待处理样本组。
步骤S330,根据待处理样本组中各初始样本的样本特征,确定待处理样本组对应的组内样本特征中心。
在一个实施例中,根据待处理样本组中各初始样本的样本特征,确定待处理样本组对应的组内样本特征中心包括:计算待处理样本组中各初始样本的样本特征的平均值,确定为该待处理样本组的组内样本特征中心。
步骤S340,分别计算待处理样本组中各初始样本的样本特征与待处理样本组对应的组内样本特征中心之间的样本距离。
在确定待处理样本组的组内样本特征中心之后,分别计算该待处理样本组中各初始样本与该组内样本特征中心之间的距离,本实施例中记为样本距离;进一步地,计算初始样本与组内样本特征中心之间的距离包括:计算各初始样本的样本特征与组内样本特征中心之间的欧式距离;其中,欧式距离是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。更进一步地,在一个具体实施例中,计算各初始样本的样本特征与组内样本特征中心之间的欧式距离采用的是个初始样本的样本特征与组内样本特征中心的L2范数。在一个实施例中,各初始样本的样本特征与组内样本特征中心之间的欧式距离为1维数据。
在一个实施例中,在对待处理样本组计算组内样本特征中心以及各初始样本的样本距离之后,将该待处理样本组标识为已选取。
步骤S350,在存在未被选取的组别标识时,返回选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。
采用本实施例中的方式依次选取目标样本组中的一个样本组进行数据处理,直至所有目标样本组中的样本组均经过数据处理。
在另一个实施例中,目标样本组包括一个样本组,本实施例中目标样本组为各样本组中未被选取的样本组;在本实施例中,根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本之后,还包括:在存在未被选取的样本组时,选取未被选取的任一样本组为目标样本组,返回根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离的步骤。
本实施例中,目标样本组包括一个样本组,对于目标样本组计算组内样本特征中心以及各初始样本的样本距离之后,根据该组内样本特征中心以及各初始样本的样本距离确定该目标样本组中各初始样本是否为噪声样本,然后再返回选取下一目标样本组进行上述处理。
在确定目标样本组的组内样本特征中心以及各初始样本的样本距离之后,本申请的实施例中,根据各初始样本的样本距离确定初始样本是否为噪声样本可以采用聚类的方式实现,在一个实施例中,可以采用混合高斯模型聚类或者层次聚类的方式确定各初始样本是否为噪声样本。
其中,混合高斯模型是一种基于高斯模型的无标签数据聚类方法,混合高斯模型使用K(通常为3到5个)个高斯模型来表征图像中各个像素点的特征,在新一帧图像获得后更新混合高斯模型,用当前图像中的每个像素点与混合高斯模型匹配,如果成功则判定该点为背景点,否则为前景点。层次聚类方法的基本思想是:通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点。
在一个实施例中,根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本,包括:基于目标样本组内的各初始样本对应的样本距离,确定目标样本组内的各初始样本对应的噪声样本概率和非噪声样本概率;将对应的噪声样本概率大于非噪声样本概率的初始样本,判定为噪声样本。
其中,对于目标样本组内各初始样本组均可以计算两个概率,一个概率对应该初始样本属于噪声样本的概率,本实施例中记为噪声样本概率;另一个概率对应该初始样本属于非噪声样本的概率,本实施例中记为非噪声样本;可以理解地,对于任一初始样本的噪声样本概率和非噪声样本概率的和为1,同时初始样本的噪声样本概率和非噪声样本概率中概率值较大的对应该初始样本更有可能所属的类别(噪声样本或者非噪声样本),即当某一初始样本的噪声样本概率大于非噪声样本概率时,判定该初始样本概率为噪声样本。
进一步地,在其中一个实施例中,基于目标样本组内的各初始样本对应的样本距离,确定目标样本组内的各初始样本对应的噪声样本概率和非噪声样本概率,可以通过混合高斯模型计算各初始样本对应的噪声样本概率和非噪声概率,具体包括:将目标样本组内的各初始样本对应的样本距离输入预设混合高斯模型;获取预设混合高斯模型输出的各初始样本的噪声样本概率和非噪声样本概率。
将目标样本组内的各初始样本的样本距离输入预设混合高斯模型,预设混合高斯模型中设置了初始值,在该预设混合高斯模型初始化时将初始样本的样本距离初始化为两个分布,这两个分布为噪声样本的分布和非噪声样本的分布,根据各初始样本的样本距离对混合高斯模型进行训练,训练过程中对这两个分布进行调整达到最优。其中,如图4所示为一个具体实施例中混合高斯模型的输出结果。
上述实施例中行人重识别的噪声样本识别方法通过混合高斯模型聚类的方法对目标样本组中的各初始样本的样本距离进行聚类,对于目标样本组中各初始样本分别输出一个噪声样本概率和一个非噪声样本概率,可以动态地寻找噪音样本,效果提升更明显。
在一个实施例中,如图5所示,根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本,包括步骤S510至步骤S530。
步骤S510,根据目标样本组中各初始样本对应的样本距离,对目标样本组中的各初始样本进行层次聚类,获得两个样本聚类。
层次聚类最终将根据初始样本对应的样本距离将各初始样本聚类得到两个大类,本实施例中记为样本聚类;在一个实施例中两个样本聚类中一个表示噪声样本聚集得到的样本聚类,另一个为非噪声样本聚集得到的样本聚类。由于噪声样本的样本距离比较大,非噪声样本的样本距离比较小,所以在层次聚类开始的时候,噪声样本容易聚类到一起,非噪声样本容易聚类到一起。
在一个实施例中,根据目标样本组内的各初始样本的样本距离,对目标样本组中的各初始样本进行层次聚类具体包括:将距离最近的点合并到同一个类,然后计算得到的各类与类之间的距离,将距离最近的类合并为一个大类。依次循环合并,直到合并得到两个聚类。
步骤S520,分别确定各样本聚类的平均样本距离。
在一个实施例中,确定样本聚类的平均样本距离包括:计算样本聚类中各初始样本的样本距离的平均值,即为该样本聚类的平均样本距离。
步骤S530,将两个样本聚类中平均样本距离较大的样本聚类确定为噪声样本聚类,根据噪声样本聚类确定目标样本组中的噪声样本。
通常对于任一样本组中的所有初始样本中噪声样本比非噪声样本要少,因此在计算样本组的各初始样本的样本距离时,噪声样本对应的样本距离较大,在本实施例中,将样本聚类的平均样本距离更大的聚类确定为噪声样本聚类。
上述行人重识别的噪声样本识别方法通过层次聚类的方法对目标样本组中的各初始样本的样本距离进行聚类,将各初始样本划分为两个聚类,其中平均样本距离更大的样本聚类即为噪声样本聚类,噪声样本聚类中的初始样本判定为噪声样本。
如图6所示为一个具体实施例中ReID的问题中某两个ID内的各初始样本的示意图,其中,序号为“00030739_***”表示一组ID的各初始样本,其中,序号为“00030739_0144_00000000”为该组ID内的噪声样本;序号为“00024190_***”表示另一组ID的各初始样本,其中,序号为“00024190_0001_00000009”为该组ID内的噪声样本;如果按照传统的噪声样本鉴别的方法,网络的输出层(FC层)容易对每个ID的数据产生过拟合(神经网络模型固定,数据量越少越容易过拟合),经实验在行人重识别的问题中,通过计算loss大小区分噪声样本和非噪声样本的方法,获得的噪声样本和全部样本的loss均值、loss方差非常接近,即根据各样本的loss无法将噪音数据和非噪音数据分开。在一个具体实施例中,如图7所示,本实施例中的行人重识别的噪声样本识别方法包括以下步骤:
首先,用一个预设神经网络(上述第二预设神经网络)训练带有噪音标签的全部初始样本,并利用训练得到的中间神经网络提取各初始样本的特征,如图8所示,具体包括以下步骤:在获取到各初始样本之后,以随机梯度下降(SGD)的方式训练第二预设神经网络(ResNet50或者DenseNet),在loss(损失)不再增加时停止训练,获得中间神经网络;对每一个训练集合中ID内的全部样本,提取卷积层之后的样本特征并保存。其中,各初始样本中可能包括携带噪声标注信息的样本数据(噪声样本)。
然后,利用混合高斯模型或者层次聚类的方法鉴别每个ID内的噪声数据,包括以下步骤:对于每一个ID,计算每一个ID内样本的样本特征到此ID的样本特征中心的欧式距离。对于欧式距离可以采用高斯混合模型对其进行聚类鉴别噪声样本:将得到的所有样本的欧式距离作为样本的压缩性特征(欧式距离仅为1维)送到混合高斯模型中分别学习非噪音样本和噪音样本的高斯分布;于是对于每一个样本,计算此样本在混合高斯模型中属于噪音样本和非噪音样本的概率。当属于噪音样本的概率高于非噪音样本时,认为此样本为噪音样本并剔除。对每一个ID重复上述操作,识别出初始样本数据中的所有噪声样本并剔除,得到可靠的数据样本(称干净样本)。其中,ID的样本特征中心定义为此ID内所有样本的样本特征的平均值。
在另一个实施例中,在计算获得各ID内个样本与各ID的样本特征中心的欧式距离之后,对于欧式距离可以采用层次聚类的方式鉴别噪声样本:每次将欧式距离最近的点合并到同一个类,然后,再计算得到的类与类之间的距离,将距离最近的类合并为一个大类,依次合并,直至合并为两个大类;可以理解地,两个大类中一个为噪声样本的聚类,另一个为非噪声样本的聚类;分别计算该两个聚类的平均欧式距离,平均欧式距离较大的一个聚类确定为噪声样本的聚类。
最后,用干净样本重新训练神经网络,用这些干净样本重新训练一个预设神经网络(上述第一预设神经网络,可以与第二预设神经网络架构相同),使用cross entropyloss(交叉熵损失)计算损失,基于损失进行反向梯度更新。最终收敛后的网络,因为此网络仅用非噪声样本(干净样本)训练,达到了去除携带噪声标注信息的样本(噪声样本)的目的。
在一个具体实施例中,采用混合高斯模型对各初始样本进行聚类;很多聚类算法受到初始的阈值影响较大,然而使用高斯混合模型的优势是对初识阈值不敏感,可以在模型训练的时候自动更新阈值。下表展示不同初始阈值对模型的最终效果影响:
初始值 mAP cmc1 cmc5 cmc10
Baseline 42.03 65.17 75.68 79.44
混合高斯 (0.2,0.1),(0.8,0.1) 46.42 68.27 77.92 81.71
混合高斯 (0.3,0.1),(0.7,0.1) 47.30 68.84 78.68 82.13
混合高斯 (0.6,0.1),(0.65,0.1) 49.10 70.16 79.04 82.77
其中,mAP(mean Average Precision)和cmc(Cumulative MatchingCharacteristics)是ReID任务中常见的测量指标。其中,Cmc用来衡量模型对数据的匹配特性;mAP用来衡量模型的平均查准率(precision)和查全率(recall)。两个指标都是值越高越好。上表中Baseline是指基于未经去除噪声标签的样本数据训练预设神经网络得到的mAP等评价结果。由表中数据可以看到使用的混合高斯模型对于初始值不是很敏感,即对于ReID问题,不同的初始值都可以得到模型mAP和cmc指标的提升。
应该理解的是,虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种行人重识别的噪声样本识别装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:特征提取模块910、样本距离确定模块920、噪声样本识别模块930、样本更新模块940以及模型训练模块950,其中:
特征提取模块910,用于对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征。
样本距离确定模块920,用于根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离,目标样本组包括至少两个初始样本,样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离。
噪声样本识别模块930,用于根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本。
样本更新模块940,用于将确定为噪声样本的初始样本移除,获得更新后的样本数据。
模型训练模块950,用于根据更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
上述行人重识别的噪声样本识别装置,通过对行人重识别的各初始样本进行特征提取,提取获得的各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组中各初始样本的样本特征所在目标样本组的组内样本特征中心之间的样本距离;其中,目标样本组中包括至少两个初始样本;进一步地,根据各样本对应的目标样本距离确定各样本的是否为噪声样本;识别出噪声样本后,将初始样本中的噪声样本剔除,用更新后的样本对预设时间网络模型进行训练,获得行人重识别模型。上述行人重识别的噪声样本识别装置,通过对各初始样本进行特征提取,并基于提取的特征计算各初始样本的样本特征与所在组的组内样本特征中心的样本距离,并根据各初始样本的样本距离确定初始样本是否为噪声样本,确定为噪声样本后将其从初始样本中剔除获得更新后的样本数据,进而利用更新后的样本数据进行网络模型训练获得行人重识别模型,获得的行人重识别模型的识别准确度更高。
在一个实施例中,上述行人重识别的噪声样本识别装置中的特征提取模块910包括:训练模块,用于根据初始样本训练第二预设神经网络,并在达到训练终止条件时停止训练,获得中间神经网络;在本实施例中,特征提取模块910还用于将初始样本输入中间神经网络,获取中间神经网络的卷积层对各初始样本进行特征提取得到的样本特征。
在一个实施例中,目标样本组包括各样本组;上述行人重识别的噪声样本识别装置中的样本距离确定模块920包括组别标识读取模块、样本组选取模块、组内样本特征中心确定模块、样本距离确定模块以及循环模块。其中:
组别标识读取模块,用于读取各初始样本的组别标识;样本组选取模块,用于选取未被选取的任一组别标识对应的样本组为待处理样本组,获取待处理样本组中的各初始样本的样本特征;组内样本特征中心确定模块,用于根据待处理样本组中各初始样本的样本特征,确定待处理样本组对应的组内样本特征中心;样本距离确定模块,用于分别计算待处理样本组中各初始样本的样本特征与待处理样本组对应的组内样本特征中心之间的样本距离;循环模块,用于在存在未被选取的组别标识时,返回选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。
在另一个实施例中,目标样本组为各样本组中未被选取的样本组;上述行人重识别的噪声样本识别装置中还包括:目标样本组选取模块,用于在存在未被选取的样本组时,选取未被选取的任一样本组为目标样本组,返回根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离的步骤。
在一个实施例中,上述行人重识别的噪声样本识别装置中的噪声样本识别模块930包括:概率确定模块,用于基于目标样本组内的各初始样本对应的样本距离,确定目标样本组内的各初始样本对应的噪声样本概率和非噪声样本概率;在本实施例中,噪声样本识别模块930还用于将对应的噪声样本概率大于非噪声样本概率的初始样本,判定为噪声样本。
进一步地,在一个实施例中,上述行人重识别的噪声样本识别装置中的概率确定模块包括输入模块,用于将目标样本组内的各初始样本对应的样本距离输入预设混合高斯模型;以及输出结果获取模块,用于获取预设混合高斯模型输出的各初始样本的噪声样本概率和非噪声样本概率。
在另一个实施例中,上述行人重识别的噪声样本识别装置中的噪声样本识别模块930包括:层次聚类模块,用于根据目标样本组中各初始样本对应的样本距离,对目标样本组中的各初始样本进行层次聚类,获得两个样本聚类;平均样本距离确定模块,用于分别确定各样本聚类的平均样本距离;在本实施例中,噪声样本识别模块930还用于将两个样本聚类中平均样本距离较小的样本聚类确定为噪声样本聚类,根据噪声样本聚类确定目标样本组中的噪声样本。
关于行人重识别的噪声样本识别装置的具体限定可以参见上文中对于行人重识别的噪声样本识别方法的限定,在此不再赘述。上述行人重识别的噪声样本识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,本申请提供的行人重识别的噪声样本识别装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该行人重识别的噪声样本识别装置的各个程序模块,比如,图9所示的特征提取模块910、样本距离确定模块920、噪声样本识别模块930、样本更新模块940以及模型训练模块950。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的行人重识别的噪声样本识别方法中的步骤。
例如,图10所示的计算机设备可以通过如图9所示的行人重识别的噪声样本识别装置中的特征提取模块910对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征。计算机设备可通过样本距离确定模块920,根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离,目标样本组包括至少两个初始样本,样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离。计算机设备可通过噪声样本识别模块930根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本。计算机设备可通过样本更新模块940将确定为噪声样本的初始样本移除,获得更新后的样本数据。计算机设备可通过模型训练模块950根据更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述行人重识别的噪声样本识别方法的步骤。此处行人重识别的噪声样本识别方法的步骤可以是上述各个实施例的行人重识别的噪声样本识别方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述行人重识别的噪声样本识别方法的步骤。此处行人重识别的噪声样本识别方法的步骤可以是上述各个实施例的行人重识别的噪声样本识别方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (14)

1.一种行人重识别的噪声样本识别方法,其特征在于,所述方法包括:
对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;各所述初始样本构成多个样本组;每一所述样本组中的各初始样本标注为同一行人;
针对每一所述样本组,根据所述样本组内各初始样本各自的样本特征,确定所述样本组的组内样本特征中心,以及所述样本组内的各初始样本各自的样本距离;每一所述样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在样本组的组内样本特征中心之间的距离;所述样本组的组内样本特征中心,为所述样本组内各初始样本各自的样本特征的平均值;
根据所述样本组的各所述初始样本各自的样本距离,对所述样本组中的各所述初始样本进行聚类处理,确定所述样本组中的各所述初始样本是否为噪声样本;
将各所述初始样本中确定为噪声样本的初始样本移除,获得更新后的样本数据;
根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
2.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征,包括:
根据行人重识别的各初始样本训练第二预设神经网络,并在达到训练终止条件时停止训练,获得中间神经网络;
将各所述初始样本分别输入所述中间神经网络,获取所述中间神经网络的卷积层对各所述初始样本进行特征提取得到的样本特征。
3.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述针对每一所述样本组,根据所述样本组内各初始样本各自的样本特征,确定所述样本组的组内样本特征中心,以及所述样本组内的各初始样本各自的样本距离,包括:
读取各所述初始样本的组别标识;
选取未被选取的任一组别标识对应的样本组为待处理样本组,获取所述待处理样本组中的各初始样本的样本特征;
根据所述待处理样本组中各初始样本的样本特征,确定所述待处理样本组对应的组内样本特征中心;
分别计算所述待处理样本组中各初始样本的样本特征与所述待处理样本组对应的组内样本特征中心之间的样本距离,将所述待处理样本组标识为已选取;
在存在未被选取的组别标识时,返回所述选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。
4.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述根据所述样本组的各所述初始样本各自的样本距离,对所述样本组中的各所述初始样本进行聚类处理,确定所述样本组中的各所述初始样本是否为噪声样本,包括:
对于每一所述样本组,基于所述样本组内的各所述初始样本各自对应的样本距离,确定所述样本组内的各所述初始样本各自对应的噪声样本概率和非噪声样本概率;
将对应的噪声样本概率大于非噪声样本概率的初始样本,判定为噪声样本。
5.根据权利要求4所述的行人重识别的噪声样本识别方法,其特征在于,所述基于所述样本组内的各所述初始样本各自对应的样本距离,确定所述样本组内的各所述初始样本各自对应的噪声样本概率和非噪声样本概率,包括:
将所述样本组内的各所述初始样本各自对应的样本距离输入预设混合高斯模型;
获取所述预设混合高斯模型输出的各所述初始样本各自的噪声样本概率和非噪声样本概率。
6.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述根据所述样本组的各所述初始样本各自的样本距离,对所述样本组中的各所述初始样本进行聚类处理,确定所述样本组中的各所述初始样本是否为噪声样本,包括:
对于每一所述样本组,根据所述样本组中各所述初始样本各自对应的样本距离,对所述样本组中的各所述初始样本进行层次聚类,获得两个样本聚类;
分别确定各所述样本聚类的平均样本距离;
将所述两个样本聚类中平均样本距离较大的样本聚类确定为噪声样本聚类,根据所述噪声样本聚类确定所述样本组中的噪声样本。
7.一种行人重识别的噪声样本识别装置,其特征在于,所述装置包括:
特征提取模块,用于对各行人重识别的初始样本进行特征提取,获得各所述初始样本的样本特征;各所述初始样本构成多个样本组;每一所述样本组中的各初始样本标注为同一行人;
样本距离确定模块,用于针对每一所述样本组,根据所述样本组内各初始样本各自的样本特征,确定所述样本组的组内样本特征中心,以及所述样本组内的各初始样本各自的样本距离;每一所述样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在样本组的组内样本特征中心之间的距离;所述样本组的组内样本特征中心,为所述样本组内各初始样本各自的样本特征的平均值;
噪声样本识别模块,用于根据所述样本组的各所述初始样本各自的样本距离,对所述样本组中的各所述初始样本进行聚类处理,确定所述样本组中的各所述初始样本是否为噪声样本;
样本更新模块,用于将各所述初始样本中确定为所述噪声样本的初始样本移除,获得更新后的样本数据;
模型训练模块,用于根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。
8.根据权利要求7所述的行人重识别的噪声样本识别装置,其特征在于,所述特征提取模块具体用于:
根据行人重识别的各初始样本训练第二预设神经网络,并在达到训练终止条件时停止训练,获得中间神经网络;
将各所述初始样本分别输入所述中间神经网络,获取所述中间神经网络的卷积层对各所述初始样本进行特征提取得到的样本特征。
9.根据权利要求7所述的行人重识别的噪声样本识别装置,其特征在于,所述样本距离确定模块包括:
组别标识读取模块,用于读取各所述初始样本的组别标识;
样本组选取模块,用于选取未被选取的任一组别标识对应的样本组为待处理样本组,获取所述待处理样本组中的各初始样本的样本特征;
组内样本特征中心确定模块,用于根据所述待处理样本组中各初始样本的样本特征,确定所述待处理样本组对应的组内样本特征中心;
样本距离确定模块,用于分别计算所述待处理样本组中各初始样本的样本特征与所述待处理样本组对应的组内样本特征中心之间的样本距离,将所述待处理样本组标识为已选取;
循环模块,用于在存在未被选取的组别标识时,返回所述选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。
10.根据权利要求7所述的行人重识别的噪声样本识别装置,其特征在于,所述噪声样本识别模块包括:
概率确定模块,用于对于每一所述样本组,基于所述样本组内的各所述初始样本各自对应的样本距离,确定所述样本组内的各所述初始样本各自对应的噪声样本概率和非噪声样本概率;
所述噪声样本识别模块具体用于将对应的噪声样本概率大于非噪声样本概率的初始样本,判定为噪声样本。
11.根据权利要求10所述的行人重识别的噪声样本识别装置,其特征在于,所述概率确定模块包括:
输入模块,用于将所述样本组内的各所述初始样本各自对应的样本距离输入预设混合高斯模型;
输出结果获取模块,用于获取所述预设混合高斯模型输出的各所述初始样本各自的噪声样本概率和非噪声样本概率。
12.根据权利要求7所述的行人重识别的噪声样本识别装置,其特征在于,所述噪声样本识别模块包括:
层次聚类模块,用于对于每一所述样本组,根据所述样本组中各所述初始样本各自对应的样本距离,对所述样本组中的各所述初始样本进行层次聚类,获得两个样本聚类;
平均样本距离确定模块,用于分别确定各所述样本聚类的平均样本距离;
所述噪声样本识别模块具体用于将所述两个样本聚类中平均样本距离较大的样本聚类确定为噪声样本聚类,根据所述噪声样本聚类确定所述样本组中的噪声样本。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010186361.5A 2020-03-17 2020-03-17 行人重识别的噪声样本识别方法、装置、设备和存储介质 Active CN111414952B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010186361.5A CN111414952B (zh) 2020-03-17 2020-03-17 行人重识别的噪声样本识别方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010186361.5A CN111414952B (zh) 2020-03-17 2020-03-17 行人重识别的噪声样本识别方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111414952A CN111414952A (zh) 2020-07-14
CN111414952B true CN111414952B (zh) 2023-10-17

Family

ID=71493058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010186361.5A Active CN111414952B (zh) 2020-03-17 2020-03-17 行人重识别的噪声样本识别方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111414952B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232241B (zh) * 2020-10-22 2022-03-25 华中科技大学 一种行人重识别方法、装置、电子设备和可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506867A (zh) * 2017-08-31 2017-12-22 国网冀北电力有限公司廊坊供电公司 一种基于动态建模的光伏出力预测方法
CN108537136A (zh) * 2018-03-19 2018-09-14 复旦大学 基于姿态归一化图像生成的行人重识别方法
CN108595585A (zh) * 2018-04-18 2018-09-28 平安科技(深圳)有限公司 样本数据分类方法、模型训练方法、电子设备及存储介质
CN109241903A (zh) * 2018-08-30 2019-01-18 平安科技(深圳)有限公司 样本数据清洗方法、装置、计算机设备及存储介质
CN110175653A (zh) * 2019-05-29 2019-08-27 北京达佳互联信息技术有限公司 图像识别的方法、装置、设备及存储介质
WO2019237558A1 (zh) * 2018-06-14 2019-12-19 平安科技(深圳)有限公司 电子装置、图片样本集生成方法和计算机可读存储介质
CN110866435A (zh) * 2019-08-13 2020-03-06 广州三木智能科技有限公司 一种自相似性梯度朝向直方图的远红外行人训练方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506867A (zh) * 2017-08-31 2017-12-22 国网冀北电力有限公司廊坊供电公司 一种基于动态建模的光伏出力预测方法
CN108537136A (zh) * 2018-03-19 2018-09-14 复旦大学 基于姿态归一化图像生成的行人重识别方法
CN108595585A (zh) * 2018-04-18 2018-09-28 平安科技(深圳)有限公司 样本数据分类方法、模型训练方法、电子设备及存储介质
WO2019237558A1 (zh) * 2018-06-14 2019-12-19 平安科技(深圳)有限公司 电子装置、图片样本集生成方法和计算机可读存储介质
CN109241903A (zh) * 2018-08-30 2019-01-18 平安科技(深圳)有限公司 样本数据清洗方法、装置、计算机设备及存储介质
CN110175653A (zh) * 2019-05-29 2019-08-27 北京达佳互联信息技术有限公司 图像识别的方法、装置、设备及存储介质
CN110866435A (zh) * 2019-08-13 2020-03-06 广州三木智能科技有限公司 一种自相似性梯度朝向直方图的远红外行人训练方法

Also Published As

Publication number Publication date
CN111414952A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
EP3620956B1 (en) Learning method, learning device for detecting lane through classification of lane candidate pixels and testing method, testing device using the same
CN110263659B (zh) 一种基于三元组损失和轻量级网络的指静脉识别方法及系统
EP3620980B1 (en) Learning method, learning device for detecting lane by using cnn and testing method, testing device using the same
CN109472191B (zh) 一种基于时空上下文的行人重识别与追踪方法
US10275667B1 (en) Learning method, learning device for detecting lane through lane model and testing method, testing device using the same
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN111310800B (zh) 图像分类模型生成方法、装置、计算机设备和存储介质
CA2922296A1 (en) System and method for clustering data
CN106408037A (zh) 图像识别方法及装置
JP2008217706A (ja) ラベリング装置、ラベリング方法及びプログラム
CN110852152B (zh) 一种基于数据增强的深度哈希行人重识别方法
CN111914762A (zh) 基于步态信息的身份识别方法及装置
CN111177447B (zh) 一种基于深度网络模型的行人图像识别方法
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
CN116486419A (zh) 一种基于孪生卷积神经网络的书法字识别方法
CN112270204A (zh) 目标识别方法及装置、存储介质及电子设备
CN111353385A (zh) 一种基于掩膜对齐与注意力机制的行人再识别方法和装置
CN111414952B (zh) 行人重识别的噪声样本识别方法、装置、设备和存储介质
CN114519863A (zh) 人体重识别方法、人体重识别装置、计算机设备及介质
Molina-Giraldo et al. Image segmentation based on multi-kernel learning and feature relevance analysis
CN115984671A (zh) 模型在线更新方法、装置、电子设备及可读存储介质
US20240087352A1 (en) System for identifying companion animal and method therefor
CN116206334A (zh) 一种野生动物识别方法和装置
CN111160077A (zh) 一种大规模人脸动态聚类方法
Farfan-Escobedo et al. Towards accurate building recognition using convolutional neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant