CN117079309A - 一种ReID模型训练方法、ReID行人识别方法、设备及介质 - Google Patents
一种ReID模型训练方法、ReID行人识别方法、设备及介质 Download PDFInfo
- Publication number
- CN117079309A CN117079309A CN202310929840.5A CN202310929840A CN117079309A CN 117079309 A CN117079309 A CN 117079309A CN 202310929840 A CN202310929840 A CN 202310929840A CN 117079309 A CN117079309 A CN 117079309A
- Authority
- CN
- China
- Prior art keywords
- class
- data set
- training
- reid
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 119
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000005070 sampling Methods 0.000 claims abstract description 104
- 230000015654 memory Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 13
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 6
- 238000012804 iterative process Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及行人重识别技术领域,具体提供一种ReID模型训练方法、ReID行人识别方法、设备及介质。本发明的ReID模型训练方法包括:S101、基于数据集的类采样权重,从数据集中选取训练子数据集;S102、基于训练子数据集对ReID模型进行一次迭代训练,通过损失函数更新ReID模型的权重;S103、判断数据集中的所有图片样本是否均完成一次迭代训练;若是,执行S104;若否,循环执行S101‑S102,直到数据集中的所有图片样本均已完成一次迭代训练;S104、判断数据集是否完成预设轮数的训练;若是,结束训练,并输出训练好的ReID模型;若否,基于训练后的数据集,更新类采样权重,循环执行S101‑S104,直至数据集已完成预设轮数的训练。因此,训练后的ReID模型具有较好的识别难例样本的能力。
Description
技术领域
本发明涉及行人重识别技术领域,具体提供一种ReID模型训练方法、ReID行人识别方法、设备及介质。
背景技术
人重识别(Person Re-identification,ReID),是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,在学术界和工业界已经得到广泛的关注与应用,并且,在越来越多的应用场景中发挥着重要作用,如行人跟踪、区域寻人等等。
现有技术中,通常采用PK采样方法对ReID模型进行训练,即,从数据集的所有类别中等概率选取出P个类别,再从P个类别中各自等概率选取出K张图片,组成P*K个样本,进行后续的ReID模型训练。
然而,对于行人重识别任务而言,数据集中的好例样本数量远远大于难例样本数量,PK采样方法是等概率的选取数据,会使选取到难例样本的数量小于好例样本的数量,因此,训练出的ReID模型在识别难例样本时,准确率较低。
相应地,本领域需要一种新的ReID模型训练方案来解决上述问题。
发明内容
为了克服上述缺陷,提出了本发明,提供一种,以解决或至少部分地解决现有技术中因等概率的从数据集中选取数据而导致训练出的ReID模型在识别难例样本时准确率低的技术问题。
在第一方面,本发明提供一种ReID模型训练方法,所述方法包括如下步骤:
S101、基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集;
S102、基于所述训练子数据集,对ReID模型进行一次迭代训练,在当前迭代过程中,通过损失函数更新ReID模型的权重;
S103、判断所述数据集中的所有图片样本是否均完成一次迭代训练;若是,则认为完成对所述数据集的一轮训练,执行步骤S104;若否,循环执行步骤S101-S102,直到所述数据集中的所有图片样本均已完成一次迭代训练;
S104、判断所述数据集是否完成预设轮数的训练;若是,执行步骤S105;若否,执行步骤S106;
S105、结束训练,并输出训练好的ReID模型;
S106、基于训练后的数据集,更新所述类采样权重,循环执行步骤S101-S104,直至所述数据集已完成预设轮数的训练。
在上述ReID模型训练方法的一个技术方案中,所述数据集包含若干个类别,每个类别对应不同待识别目标,且每个类别包含若干张图片;所述类采样权重包括类间采样权重和类内采样权重;
所述基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集,具体包括:
S1011、从数据集中等概率选取出一个类别;
S1012、按照一个类别对应的所述类间采样权重,再从所述数据集中选取P-1个类别;
S1013、在选取出的P-1类中,等概率选取一张图片;
S1014、按照每个类别分别对应的所述类内采样权重,在每个类内采样K-1张图;
S1015、以P*K张图组成一个批次,作为训练子数据集。
在上述ReID模型训练方法的一个技术方案中,所述类采样权重包括:类间采样权重;
所述方法包括基于以下公式获取类间采样权重:
Wi=pi*∑W,(0≤i<C,i!=X)
其中,Wi表示第i类图片样本的类间采样权重,pi表示第i类图片样本的概率,∑W表示所有图片样本的总权重,∑W的取值为1。
在上述ReID模型训练方法的一个技术方案中,所述类采样权重包括:类内采样权重;
所述方法包括基于以下公式获取类内采样权重:
Vi=pi*∑V,(0≤i<Dx,i!=A)
其中,Vi表示第i类图片样本的类内采样权重,pi表示第i类图片样本的概率,∑V表示所有图片样本的总权重,∑V的取值为1。
在上述ReID模型训练方法的一个技术方案中,所述方法还包括根据训练子数据集中的任一图片样本特征、与其相似度最高的不同类别图片样本特征以及与其相似度最低的同一类别图片样本特征以及以下公式确定损失函数:
其中,Loss为损失函数,cos为余弦距离,zi为训练集中第i个图片样本,为训练集中与zi相似度最高的不同类别图片样本特征,/>为训练集中与zi相似度最低的同一类别图片样本特征,τ为训练参数。
在上述ReID模型训练方法的一个技术方案中,所述基于训练后的数据集,更新所述类采样权重,包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定不同类别下的类平均特征;
根据类平均特征以及以下公式,更新类间采样权重:
其中,WY为更新后的类间采样权重,W′Y为更新前的类间采样权重,cos为余弦距离,α为平滑系数,FX为X类别下的平均特征,FY为Y类别下的平均特征。
在上述ReID模型训练方法的一个技术方案中,所述基于训练后的数据集,更新所述类采样权重,还包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定同类别下的类平均特征;
根据类平均特征以及以下公式,更新类内采样权重:
其中,为更新后的类内采样权重,/>为更新前的类内采样权重,cos为余弦距离,α为平滑系数,Ai为类别里的第i个图片样本特征,Aj为类别里的第j个图片样本特征。
在第二方面,本发明提供一种ReID行人识别方法,包括:
获取待识别图像;
基于训练好的ReID模型对所述待识别图像进行识别;
其中,所述ReID模型基于ReID模型训练方法的技术方案中任意一项所述的ReID模型训练方法进行训练。
在第三方面,本发明提供一种电子设备,包括:
处理器;
存储器,所述存储器适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述ReID模型训练方法的技术方案中任一项所述的ReID模型训练方法,或,ReID行人识别方法的技术方案中任一项所述的ReID行人识别方法。
在第四方面,本发明提供一种计算机可读存储介质,其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述ReID模型训练方法的技术方案中任一项所述的ReID模型训练方法,或,ReID行人识别方法的技术方案中任一项所述的ReID行人识别方法。
本发明上述一个或多个技术方案,至少具有如下一种或多种
有益效果:
在实施本发明的技术方案中,S101、基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集;S102、基于所述训练子数据集,对ReID模型进行一次迭代训练,在当前迭代过程中,通过损失函数更新ReID模型的权重;S103、判断所述数据集中的所有图片样本是否均完成一次迭代训练;若是,则认为完成对所述数据集的一轮训练,执行步骤S104;若否,循环执行步骤S101-S102,直到所述数据集中的所有图片样本均已完成一次迭代训练;S104、判断所述数据集是否完成预设轮数的训练;若是,执行步骤S105;若否,执行步骤S106;S105、结束训练,并输出训练好的ReID模型;S106、基于训练后的数据集,更新所述类采样权重,循环执行步骤S101-S104,直至所述数据集已完成预设轮数的训练。在本发明中,训练子数据集每完成一轮训练后,就更新一次类采样权重,基于更新后的类采样权重继续对ReID模型进行训练,也就是说,选取图片样本的概率是随着ReID模型训练的进度逐渐更新的,因此,使得训练后的ReID模型具有较好的识别难例样本的能力,提高难例样本识别的准确率。
附图说明
参照附图,本发明的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围组成限制。此外,图中类似的数字用以表示类似的部件,其中:
图1是本发明的ReID模型训练方法的主要步骤流程图;
图2是本发明图1中步骤S101的详细步骤流程图;
图3是本发明的一个实施例的ReID模型训练方法的步骤流程图;
图4是本发明的ReID行人识别方法的主要步骤流程图;
图5是用于执行本发明的ReID模型训练方法或ReID行人识别方法的电子设备的主要结构框图。
具体实施方式
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。
请参阅附图1,图1是根据本发明的ReID模型训练方法的主要步骤流程图。
如图1所示,本发明提供一种ReID模型训练方法,所述方法包括如下步骤:
S101、基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集;
S102、基于所述训练子数据集,对ReID模型进行一次迭代训练,在当前迭代过程中,通过损失函数更新ReID模型的权重;
S103、判断所述数据集中的所有图片样本是否均完成一次迭代训练;若是,则认为完成对所述数据集的一轮训练,执行步骤S104;若否,循环执行步骤S101-S102,直到所述数据集中的所有图片样本均已完成一次迭代训练;
S104、判断所述数据集是否完成预设轮数的训练;若是,执行步骤S105;若否,执行步骤S106;
S105、结束训练,并输出训练好的ReID模型;
S106、基于训练后的数据集,更新所述类采样权重,循环执行步骤S101-S104,直至所述数据集已完成预设轮数的训练。
在本发明中,训练子数据集每完成一轮训练后,就更新一次类采样权重,基于更新后的类采样权重继续对ReID模型进行训练,也就是说,选取图片样本的概率是随着ReID模型训练的进度逐渐更新的,因此,使得训练后的ReID模型具有较好的识别难例样本的能力,提高难例样本识别的准确率。
在一个实施方式中,请参阅附图2,图2是本发明图1中步骤S101的详细步骤流程图。
如图2所示,所述数据集包含若干个类别,每个类别对应不同待识别目标,且每个类别包含若干张图片;所述类采样权重包括类间采样权重和类内采样权重;
所述基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集,具体包括:
S201、从数据集中等概率选取出一个类别;
S202、按照一个类别对应的所述类间采样权重,再从所述数据集中选取P-1个类别;
S203、在选取出的P-1类中,等概率选取一张图片;
S204、按照每个类别分别对应的所述类内采样权重,在每个类内采样K-1张图;
S205、以P*K张图组成一个批次,作为训练子数据集。
在一个实施方式中,所述类采样权重包括:类间采样权重;
所述方法包括基于以下公式获取类间采样权重:
Wi=pi*∑W,(0≤i<C,i!=X)
其中,Wi表示第i类图片样本的类间采样权重,pi表示第i类图片样本的概率,∑W表示所有图片样本的总权重,∑W的取值为1。
在一个实施方式中,所述类采样权重包括:类内采样权重;
所述方法包括基于以下公式获取类内采样权重:
Vi=pi*∑V,(0≤i<Dx,i!=A)
其中,Vi表示第i类图片样本的类内采样权重,pi表示第i类图片样本的概率,∑V表示所有图片样本的总权重,∑V的取值为1。
说明一点,无论类间采样权重还是类内采样权重,在ReID模型进行第一轮训练时,Wi和Vi均初始化为1,也就是说,等概率的从数据集中选取图片样本。
结合上述提及的类间采样权重和类内采样权重,如下将具体说明如何基于类采样权重从数据集中选取部分图片作为训练子数据集。
具体地,从数据集的多个类别中随机选取一个类别,按照类间采样权重,从多个类别中选出P-1类,也就是说,当前共选取了P个类别,再在P个类别中分别选取一张图片样本,再按照类内采样权重,从P个类别中选取K-1张图片样本,那么,P*K张图组成一个批次,作为训练子数据集。
值得注意的是,在从多个类别中随机选取一个类别时,该类别优先从当前轮中尚未训练的类别中等概率选取,若各类别均已训练,则所有类别等概率选取;同理,在从上述P个类别中分别选取一张图片样本时,优先从当前轮中尚未训练的图片样本中等概率选取,若均已训练,则该类别下所有样本等概率选取。
在一个实施方式中,在步骤S102中,所述方法还包括根据训练子数据集中的任一图片样本特征、与其相似度最高的不同类别图片样本特征以及与其相似度最低的同一类别图片样本特征以及以下公式确定损失函数:
其中,Loss为损失函数,cos为余弦距离,zi为训练集中第i个图片样本,为训练集中与zi相似度最高的不同类别图片样本特征,/>为训练集中与zi相似度最低的同一类别图片样本特征,τ为训练参数。
示例性的,τ的可以为0.3。
但在实际应用中,τ取值可以根据实际情况对数值进行调节,在此并不做具体限定,以满足不同场景的需求。
在一个实施方式中,在上述步骤S106中,所述基于训练后的数据集,更新所述类采样权重,包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定不同类别下的类平均特征;
根据类平均特征以及以下公式,更新类间采样权重:
其中,WY为更新后的类间采样权重,W′Y为更新前的类间采样权重,cos为余弦距离,α为平滑系数,FX为X类别下的平均特征,FY为Y类别下的平均特征。
示例性的,α的可以为0.3。
但在实际应用中,α取值一般在0-1之间,可以根据实际情况对数值进行调节,在此并不做具体限定,以满足不同场景的需求。
此外,在确定出训练后的数据集中每个图片样本的特征后,将每个类别下的图片样本的特征取平均值,即可得到类平均特征。
在一个实施方式中,所述基于训练后的数据集,更新所述类采样权重,还包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定同类别下的类平均特征;
根据类平均特征以及以下公式,更新类内采样权重:
其中,为更新后的类内采样权重,/>为更新前的类内采样权重,cos为余弦距离,α为平滑系数,Ai为类别里的第i个图片样本特征,Aj为类别里的第j个图片样本特征。
示例性的,α的可以为0.2。
但在实际应用中,α取值一般在0-1之间,可以根据实际情况对数值进行调节,在此并不做具体限定,以满足不同场景的需求。
此外,在确定出训练后的数据集中每个图片样本的特征后,将相同类别下的图片样本的特征取平均值,即可得到类平均特征。
为了具体说明上述ReID模型训练方法,本发明提供了一个实施例,请参阅附图3。
图3是本发明一个实施例的ReID模型训练方法的步骤流程图。如图3所示,根据本实施例的ReID模型训练方法包括下列步骤:
例如,以ReID模型进行第一轮训练时的类间采样权重和类内采样权重分别定义为初始类间采样权重和初始类内采样权重为例进行说明。
S301、从数据集中等概率选取出一个类别,按照初始类间采样权重,再从数据集中选取P-1个类别,在选取出的P-1类中,等概率选取一张图片,按照初始类内采样权重,在每个类内采样K-1张图,以P*K张图组成一个批次,作为训练子数据集;
S302、根据训练子数据集对ReID模型进行一次迭代训练,在当前迭代过程中,通过损失函数更新ReID模型的权重;
其中,损失函数的表达式可参见上文内容,此处不在赘述。
S303、判断数据集中的所有图片样本是否均完成一次迭代训练;若是,执行步骤S304;若否,循环执行步骤S301-S302;
S304、继续判断数据集是否完成预设轮数的训练;若是,执行步骤S305;若否,执行步骤S306;
S305、结束训练,并输出训练好的ReID模型;
S306、更新类间采样权重和类内采样权重,从数据集中等概率选取出一个类别,按照更新后的类间采样权重,再从数据集中选取P-1个类别,在选取出的P-1类中,等概率选取一张图片,按照更新后的类内采样权重,在每个类内采样K-1张图,以P*K张图组成一个批次,作为训练子数据集;循环执行步骤S302至S304,直至数据集已完成预设轮数的训练。
需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
请参阅附图4,图4是根据本发明的一种ReID行人识别方法的步骤流程图;
如图4所示,本发明还提供了一种ReID行人识别方法,包括如下步骤:
S401、获取待识别图像;
S402、基于训练好的ReID模型对所述待识别图像进行识别;
其中,所述ReID模型基于上述ReID模型训练方法的技术方案中任意一项所述的ReID模型训练方法进行训练。
进一步地,本发明还提供了一种电子设备。请参阅附图5,图5是用于执行本发明的ReID模型训练方法以及ReID行人识别方法的电子设备的主要结构框图。
如图5所示,在根据本发明的一个电子设备实施例中,电子设备500包括处理器501和存储器502,存储器502可以被配置成存储执行上述方法实施例的驾驶设备定位方法的程序代码503,处理器501可以被配置成用于执行存储器502中的程序代码503,该程序代码503包括但不限于执行上述方法实施例的驾驶设备定位方法的程序代码503。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。
示例性地,处理器501可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器502可以是电子设备的内部存储单元,例如,是电子设备的硬盘或内存;存储器也可以是电子设备的外部存储设备,例如,在电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器用于存储计算机程序以及电子设备所需的其它程序和数据,存储器还可以用于暂时地存储已经输出或者将要输出的数据。
在一些可能的实施方式中,电子设备可以包括多个处理器和存储器。而执行上述方法实施例的驾驶设备定位方法的程序代码503可以被分割成多段子程序,每段子程序分别可以由处理器加载并运行以执行上述方法实施例的驾驶设备定位方法的不同步骤。具体地,每段子程序可以分别存储在不同的存储器中,每个处理器可以被配置成用于执行一个或多个存储器中的程序,以共同实现上述方法实施例的驾驶设备定位方法,即每个处理器分别执行上述方法实施例的驾驶设备定位方法的不同步骤,来共同实现上述方法实施例的驾驶设备定位方法。
上述多个处理器可以是部署于同一个设备上的处理器,例如上述电子设备可以是由多个处理器组成的高性能设备,上述多个处理器可以是该高性能设备上配置的处理器。此外,上述多个处理器也可以是部署于不同设备上的处理器,例如上述电子设备可以是服务器集群,上述多个处理器可以是服务器集群中不同服务器上的处理器。
电子设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备,例如上述的驾驶设备、移动终端以及驾驶设备定位系统。电子设备可以包括但不仅限于处理器和存储器。本领域技术人员可以理解,图5仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如,电子设备还可以包括输入输出设备、网络接入设备、总线等。
进一步地,本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中,计算机可读存储介质可以被配置成存储执行上述方法实施例的驾驶设备定位方法的程序,该程序可以由处理器加载并运行以实现上述驾驶设备定位方法。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备,可选的,本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域技术人员可以意识到,结合本发明中实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本申请各实施例中可能涉及的相关用户个人信息,均为严格按照法律法规的要求,遵循合法、正当、必要的原则,基于业务场景的合理目的,处理用户在使用产品/服务过程中主动提供或因使用产品/服务而产生的,以及经用户授权获取的个人信息。
申请人处理的用户个人信息会因具体产品/服务场景而有所不同,需以用户使用产品/服务的具体场景为准,可能会涉及用户的账号信息、设备信息、驾驶信息、车辆信息或其他相关信息。申请人会以高度的勤勉义务对待用户的个人信息及其处理。
申请人非常重视用户个人信息的安全,已采取符合业界标准、合理可行的安全防护措施保护用户的信息,防止个人信息遭到未经授权访问、公开披露、使用、修改、损坏或丢失。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种ReID模型训练方法,其特征在于,所述方法包括如下步骤:
S101、基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集;
S102、基于所述训练子数据集,对ReID模型进行一次迭代训练,在当前迭代过程中,通过损失函数更新ReID模型的权重;
S103、判断所述数据集中的所有图片样本是否均完成一次迭代训练;若是,则认为完成对所述数据集的一轮训练,执行步骤S104;若否,循环执行步骤S101-S102,直到所述数据集中的所有图片样本均已完成一次迭代训练;
S104、判断所述数据集是否完成预设轮数的训练;若是,执行步骤S105;若否,执行步骤S106;
S105、结束训练,并输出训练好的ReID模型;
S106、基于训练后的数据集,更新所述类采样权重,循环执行步骤S101-S104,直至所述数据集已完成预设轮数的训练。
2.根据权利要求1所述的ReID模型训练方法,其特征在于,所述数据集包含若干个类别,每个类别对应不同待识别目标,且每个类别包含若干张图片;所述类采样权重包括类间采样权重和类内采样权重;
所述基于数据集的类采样权重,从数据集中选取部分图片作为训练子数据集,具体包括:
S1011、从数据集中等概率选取出一个类别;
S1012、按照一个类别对应的所述类间采样权重,再从所述数据集中选取P-1个类别;
S1013、在选取出的P-1类中,等概率选取一张图片;
S1014、按照每个类别分别对应的所述类内采样权重,在每个类内采样K-1张图;
S1015、以P*K张图组成一个批次,作为训练子数据集。
3.根据权利要求1或2所述的ReID模型训练方法,其特征在于,所述类采样权重包括:类间采样权重;
所述方法包括基于以下公式获取类间采样权重:
Wi=pi*∑W,(0≤i<C,i!=X)
其中,Wi表示第i类图片样本的类间采样权重,pi表示第i类图片样本的概率,∑W表示所有图片样本的总权重,∑W的取值为1。
4.根据权利要求1或2所述的ReID模型训练方法,其特征在于,所述类采样权重包括:类内采样权重;
所述方法包括基于以下公式获取类内采样权重:
Vi=pi*∑V,(0≤i<Dx,i!=A)
其中,Vi表示第i类图片样本的类内采样权重,pi表示第i类图片样本的概率,∑V表示所有图片样本的总权重,∑V的取值为1。
5.根据权利要求1所述的ReID模型训练方法,其特征在于,所述方法还包括根据训练子数据集中的任一图片样本特征、与其相似度最高的不同类别图片样本特征以及与其相似度最低的同一类别图片样本特征以及以下公式确定损失函数:
其中,Loss为损失函数,cos为余弦距离,zi为训练集中第i个图片样本,为训练集中与zi相似度最高的不同类别图片样本特征,/>为训练集中与zi相似度最低的同一类别图片样本特征,τ为训练参数。
6.根据权利要求1所述的ReID模型训练方法,其特征在于,所述基于训练后的数据集,更新所述类采样权重,包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定不同类别下的类平均特征;
根据类平均特征以及以下公式,更新类间采样权重:
其中,WY为更新后的类间采样权重,W′Y为更新前的类间采样权重,cos为余弦距离,α为平滑系数,FX为X类别下的平均特征,FY为Y类别下的平均特征。
7.根据权利要求6所述的ReID模型训练方法,其特征在于,所述基于训练后的数据集,更新所述类采样权重,还包括:
确定训练后的数据集中每个图片样本的特征;
根据每个图片样本的特征,确定同类别下的类平均特征;
根据类平均特征以及以下公式,更新类内采样权重:
其中,为更新后的类内采样权重,/>为更新前的类内采样权重,cos为余弦距离,α为平滑系数,Ai为类别里的第i个图片样本特征,Aj为类别里的第j个图片样本特征。
8.一种ReID行人识别方法,其特征在于,包括:
获取待识别图像;
基于训练好的ReID模型对所述待识别图像进行识别;
其中,所述ReID模型基于权利要求1-7任意一项所述的ReID模型训练方法进行训练。
9.一种电子设备,其特征在于,包括:
存储器;
处理器;所述存储器适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1-7中任一项所述的ReID模型训练方法,或权利要求8所述的ReID行人识别方法。
10.一种计算机可读存储介质,其中存储有多条程序代码,其特征在于,所述程序代码适于由处理器加载并运行以执行权利要求1-7中任一项所述的ReID模型训练方法,或权利要求8所述的ReID行人识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310929840.5A CN117079309A (zh) | 2023-07-26 | 2023-07-26 | 一种ReID模型训练方法、ReID行人识别方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310929840.5A CN117079309A (zh) | 2023-07-26 | 2023-07-26 | 一种ReID模型训练方法、ReID行人识别方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117079309A true CN117079309A (zh) | 2023-11-17 |
Family
ID=88705306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310929840.5A Pending CN117079309A (zh) | 2023-07-26 | 2023-07-26 | 一种ReID模型训练方法、ReID行人识别方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117079309A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710903A (zh) * | 2024-02-05 | 2024-03-15 | 南京信息工程大学 | 一种基于ReID和Yolov5双模型下的可视化特定行人追踪方法及系统 |
-
2023
- 2023-07-26 CN CN202310929840.5A patent/CN117079309A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710903A (zh) * | 2024-02-05 | 2024-03-15 | 南京信息工程大学 | 一种基于ReID和Yolov5双模型下的可视化特定行人追踪方法及系统 |
CN117710903B (zh) * | 2024-02-05 | 2024-05-03 | 南京信息工程大学 | 一种基于ReID和Yolov5双模型下的可视化特定行人追踪方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748401B2 (en) | Generating congruous metadata for multimedia | |
CN111950723B (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN107729935B (zh) | 相似图片的识别方法和装置、服务器、存储介质 | |
CN117079309A (zh) | 一种ReID模型训练方法、ReID行人识别方法、设备及介质 | |
CN112052251B (zh) | 目标数据更新方法和相关装置、设备及存储介质 | |
CN111178357B (zh) | 车牌识别方法、系统、设备和存储介质 | |
CN114880513A (zh) | 一种目标检索方法及相关装置 | |
US20120189193A1 (en) | Detection of objects represented in images | |
CN112884866B (zh) | 一种黑白视频的上色方法、装置、设备及存储介质 | |
CN113705666B (zh) | 分割网络训练方法、使用方法、装置、设备及存储介质 | |
CN114724128B (zh) | 一种车牌识别方法、装置、设备和介质 | |
CN114140427B (zh) | 一种物体检测方法及装置 | |
CN113807401B (zh) | 通用id识别方法、装置及设备 | |
CN113239738B (zh) | 一种图像的模糊检测方法及模糊检测装置 | |
CN113919421A (zh) | 调整目标检测模型的方法、装置和设备 | |
CN112288748B (zh) | 一种语义分割网络训练、图像语义分割方法及装置 | |
CN109840535B (zh) | 实现地形分类的方法和装置 | |
CN113239226A (zh) | 一种图像检索方法、装置、设备及存储介质 | |
CN110825701A (zh) | 一种文件类型确定方法、装置、电子设备及可读存储介质 | |
CN110765862A (zh) | 车标识别的方法及终端设备 | |
CN117173692B (zh) | 3d目标检测方法、电子设备、介质以及驾驶设备 | |
CN115147871B (zh) | 遮挡环境下行人再识别方法 | |
CN112199522B (zh) | 互动实现方法、终端、服务端、计算机设备及存储介质 | |
CN116843014A (zh) | 一种自监督训练模型及其训练方法以及ReID模型训练方法 | |
CN117076713B (zh) | 一种视频指纹提取和检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |