CN117456314B - 目标再识别模型的训练方法及装置 - Google Patents
目标再识别模型的训练方法及装置 Download PDFInfo
- Publication number
- CN117456314B CN117456314B CN202311788123.1A CN202311788123A CN117456314B CN 117456314 B CN117456314 B CN 117456314B CN 202311788123 A CN202311788123 A CN 202311788123A CN 117456314 B CN117456314 B CN 117456314B
- Authority
- CN
- China
- Prior art keywords
- target
- network
- training
- classification
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 76
- 238000005457 optimization Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 230000008485 antagonism Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Abstract
本公开涉及目标再识别技术领域,提供了一种目标再识别模型的训练方法及装置。该方法包括:将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;通过目标分类网络对整体特征进行处理,得到目标识别结果;通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。采用上述技术手段,解决现有技术中,目标对象的穿戴物改变容易导致目标再识别不准确的问题。
Description
技术领域
本公开涉及目标再识别技术领域,尤其涉及一种目标再识别模型的训练方法及装置。
背景技术
目前目标再识别是利用目标对象的外观信息进行的。在实践中发现如果当目标对象的穿戴物改变,则从目标对象的图像中提取到的特征会发生很大的变化,从而导致识别错误。目前该缺陷没有得到很好的解决。
发明内容
有鉴于此,本公开实施例提供了一种目标再识别模型的训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,目标对象的穿戴物改变容易导致目标再识别不准确的问题。
本公开实施例的第一方面,提供了一种目标再识别模型的训练方法,包括:利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;获取训练数据,其中,训练数据包括关于目标对象的训练图像;将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;通过目标分类网络对整体特征进行处理,得到目标识别结果;通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
本公开实施例的第二方面,提供了一种目标再识别模型的训练装置,包括:构建模块,被配置为利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;获取模块,被配置为获取训练数据,其中,训练数据包括关于目标对象的训练图像;提取模块,被配置为将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;第一处理模块,被配置为通过目标分类网络对整体特征进行处理,得到目标识别结果;第二处理模块,被配置为通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;计算模块,被配置为分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;优化模块,被配置为依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;获取训练数据,其中,训练数据包括关于目标对象的训练图像;将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;通过目标分类网络对整体特征进行处理,得到目标识别结果;通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。采用上述技术手段,可以解决现有技术中,目标对象的穿戴物改变容易导致目标再识别不准确的问题,进而提高目标对象的穿戴物改变场景下目标再识别的准确率。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本公开实施例提供的一种目标再识别模型的训练方法的流程示意图;
图2是本公开实施例提供的一种目标再识别方法的流程示意图;
图3是本公开实施例提供的一种目标再识别模型的训练装置的结构示意图;
图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
下面将结合附图详细说明根据本公开实施例的一种目标再识别模型的训练方法和装置。
图1是本公开实施例提供的一种目标再识别模型的训练方法的流程示意图。图1的目标再识别模型的训练方法可以由计算机或服务器,或者计算机或服务器上的软件执行。如图1所示,该目标再识别模型的训练方法包括:
S101,利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;
S102,获取训练数据,其中,训练数据包括关于目标对象的训练图像;
S103,将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;
S104,通过目标分类网络对整体特征进行处理,得到目标识别结果;
S105,通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;
S106,分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;
S107,依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
需要说明的是,整体特征提取网络是一个特征提取网络,用于提取目标对象的整体特征,可以选用残差网络,也可以采用其它常用的特征提取网络。整体特征提取网络后接并行的目标分类网络和穿戴物分类网络作为目标再识别模型。分类层可以是连接全连接层和激活层得到的。目标分类网络和穿戴物分类网络的网络结构相同。目标分类网络用于学习目标对象自身的特征(目标对象身上除了穿戴物之外部分的特征)并识别目标对象,穿戴物分类网络用于学习目标对象的穿戴物的特征并识别穿戴物,所以目标分类网络和穿戴物分类网络不同在于,训练之初两个网络初始参数的设定和训练之后两个网络最终训练得到的参数。训练数据中包括多个目标对象,每个目标对象有多种身姿和穿戴物下的训练图像。
目标对象可以是人,当目标对象是人,则目标再识别中的行人重识别(行人再识别),整体特征可以理解为人全身的特征,包括人穿戴物的特征和人自身的特征。
将训练图像输入目标再识别模型:具体地,将训练图像输入整体特征提取网络,得到整体特征;将整体特征输入目标分类网络,输出目标识别结果,其中,目标识别结果是识别训练图像中目标对象的标识的结果;将整体特征输入穿戴物分类网络,输出穿戴物识别结果,其中,穿戴物识别结果是识别训练图像中目标对象的穿戴物的标识的结果,穿戴物可以有五种标识:上半身穿戴物(如外套)、下半身穿戴物(如裤子)、头部穿戴物(如头饰)、脚部穿戴物(如鞋子)和全身穿戴物(包括全身所有的穿戴物);基于目标识别结果计算目标分类损失,基于穿戴物识别结果计算穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数。
根据本公开实施例提供的技术方案,利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;获取训练数据,其中,训练数据包括关于目标对象的训练图像;将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;通过目标分类网络对整体特征进行处理,得到目标识别结果;通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。采用上述技术手段,可以解决现有技术中,目标对象的穿戴物改变容易导致目标再识别不准确的问题,进而提高目标对象的穿戴物改变场景下目标再识别的准确率。
进一步地,通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果之后,方法还包括:计算目标识别结果和第一标签之间的目标分类损失,其中,第一标签用于标识训练图像中的目标对象;计算穿戴物识别结果和第二标签之间的穿戴物分类损失,其中,第二标签用于标识训练图像中目标对象的穿戴物。
计算损失的函数可以是交叉熵损失函数。
更进一步地,依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练,包括:依据目标分类损失优化目标再识别模型中整体特征提取网络和目标分类网络的网络参数;依据穿戴物分类损失优化目标再识别模型中整体特征提取网络和穿戴物分类网络的网络参数;其中,目标分类损失和穿戴物分类损失优化网络参数是同时进行的。
目标再识别模型中,实际上是利用穿戴物分类网络提升目标分类网络的准确率,或者说,利用穿戴物分类损失辅助目标分类损失优化整体特征提取网络的网络参数。穿戴物分类网络正确识别训练图像中目标对象的穿戴物,是有益于目标分类网络识别训练图像中目标对象的标识(因为在训练中,穿戴物分类网络的识别结果是和整体特征提取网络的参数的优化有关的,整体特征提取网络的参数又和目标分类网络的输入相关)。
进一步地,依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练,包括:依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数。
具体地,冻结穿戴物分类网络的网络参数,对目标再识别模型进行第一阶段训练,当目标分类网络的准确率大于第一阈值,结束第一阶段训练;解冻穿戴物分类网络的网络参数,冻结目标分类网络的网络参数,对目标再识别模型进行第二阶段训练,当穿戴物分类网络的准确率大于第二阈值,结束第二阶段训练;解冻目标分类网络的网络参数,对目标再识别模型进行第三阶段训练,当目标分类网络的准确率大于第三阈值,结束第三阶段训练。
进一步地,分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失之后,方法还包括:计算穿戴物识别结果和第三标签之间的对抗损失,其中,第三标签用于标识训练图像中目标对象身体上除了穿戴物之外的其它部分;依据目标分类损失、穿戴物分类损失和对抗损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
第三标签可以是该部分是穿戴物和该部分不是穿戴物,穿戴物分类损失是约束穿戴物分类网络学习穿戴物的特征,对抗损失约束穿戴物分类网络学习与穿戴物无关的特征。类似的,利用穿戴物分类损失和对抗损失辅助目标分类损失优化整体特征提取网络的网络参数。穿戴物分类网络正确识别训练图像中每个部分是否是穿戴物,是有益于目标分类网络识别训练图像中目标对象的标识(因为在训练中,穿戴物分类网络的识别结果是和整体特征提取网络的参数的优化有关的,整体特征提取网络的参数又和目标分类网络的输入相关)。
更进一步地,依据目标分类损失、穿戴物分类损失和对抗损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练,包括:依据目标分类损失优化目标再识别模型中整体特征提取网络和目标分类网络的网络参数;依据穿戴物分类损失和对抗损失优化目标再识别模型中整体特征提取网络和穿戴物分类网络的网络参数。
上述两次优化网络参数可以是同时进行的。
更进一步地,依据目标分类损失、穿戴物分类损失和对抗损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练,包括:依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第四阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失和对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数。
图2是本公开实施例提供的一种目标再识别方法的示意图。如图2所示,该方法包括:
S201,获取待识别的图像和对象数据库,其中,对象数据库中保存有获取待识别的图像之前检测到的各个对象的图像;
S202,将待识别的图像和各个对象的图像输入整体特征提取网络,得到待识别的图像的特征和各个对象的图像的特征;
S203,通过计算待识别的图像的特征和各个对象的图像的特征之间的相似度,确定出待识别的图像对应的对象,以完成对待识别的图像的再识别。
通过对比待识别的图像和各个对象的图像,确定待识别的图像对应的对象。具体对比方法是通过计算特征相似度的方法,可以是余弦相似度。比如5分钟前检测到目标A的一张图像,将该图像保存到对象数据库。此时也检测到目标A的一张图像(待识别的图像),通过计算发现对象数据库保存的待识别的图像的图像和待识别的图像的特征相似度大于预设相似度,可以判定待识别的图像属于目标A,进而完成目标A的再识别。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图3是本公开实施例提供的一种目标再识别模型的训练装置的示意图。如图3所示,该目标再识别模型的训练装置包括:
构建模块301,被配置为构建模块,被配置为利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;
获取模块302,被配置为获取训练数据,其中,训练数据包括关于目标对象的训练图像;
提取模块303,被配置为将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;
第一处理模块304,被配置为通过目标分类网络对整体特征进行处理,得到目标识别结果;
第二处理模块305,被配置为通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;
计算模块306,被配置为分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;
优化模块307,被配置为依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
根据本公开实施例提供的技术方案,利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,整体特征提取网络采用残差网络,目标分类网络和穿戴物分类网络均是依次连接全连接层和分类层得到的;获取训练数据,其中,训练数据包括关于目标对象的训练图像;将训练图像输入目标再识别模型:通过整体特征提取网络对训练图像进行处理,得到训练图像中关于目标对象的整体特征;通过目标分类网络对整体特征进行处理,得到目标识别结果;通过穿戴物分类网络对整体特征进行处理,得到穿戴物识别结果;分别基于目标识别结果和穿戴物识别结果,计算目标分类损失和穿戴物分类损失;依据目标分类损失和穿戴物分类损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。采用上述技术手段,可以解决现有技术中,目标对象的穿戴物改变容易导致目标再识别不准确的问题,进而提高目标对象的穿戴物改变场景下目标再识别的准确率。
在一些实施例中,计算模块306还被配置为计算目标识别结果和第一标签之间的目标分类损失,其中,第一标签用于标识训练图像中的目标对象;计算穿戴物识别结果和第二标签之间的穿戴物分类损失,其中,第二标签用于标识训练图像中目标对象的穿戴物。
在一些实施例中,优化模块307还被配置为依据目标分类损失优化目标再识别模型中整体特征提取网络和目标分类网络的网络参数;依据穿戴物分类损失优化目标再识别模型中整体特征提取网络和穿戴物分类网络的网络参数;其中,目标分类损失和穿戴物分类损失优化网络参数是同时进行的。
在一些实施例中,优化模块307还被配置为依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数。
在一些实施例中,优化模块307还被配置为计算穿戴物识别结果和第三标签之间的对抗损失,其中,第三标签用于标识训练图像中目标对象身体上除了穿戴物之外的其它部分;依据目标分类损失、穿戴物分类损失和对抗损失优化目标再识别模型的网络参数,以完成对目标再识别模型的训练。
在一些实施例中,优化模块307还被配置为依据目标分类损失优化目标再识别模型中整体特征提取网络和目标分类网络的网络参数;依据穿戴物分类损失和对抗损失优化目标再识别模型中整体特征提取网络和穿戴物分类网络的网络参数。
在一些实施例中,优化模块307还被配置为依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第四阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失和对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数。
在一些实施例中,优化模块307还被配置为获取待识别的图像和对象数据库,其中,对象数据库中保存有获取待识别的图像之前检测到的各个对象的图像;将待识别的图像和各个对象的图像输入整体特征提取网络,得到待识别的图像的特征和各个对象的图像的特征;通过计算待识别的图像的特征和各个对象的图像的特征之间的相似度,确定出待识别的图像对应的对象,以完成对待识别的图像的再识别。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
图4是本公开实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。
Claims (5)
1.一种目标再识别模型的训练方法,其特征在于,包括:
利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,所述整体特征提取网络采用残差网络,所述目标分类网络和所述穿戴物分类网络均是依次连接全连接层和分类层得到的;
获取训练数据,其中,所述训练数据包括关于目标对象的训练图像;
将所述训练图像输入所述目标再识别模型:
通过所述整体特征提取网络对所述训练图像进行处理,得到所述训练图像中关于所述目标对象的整体特征;
通过所述目标分类网络对所述整体特征进行处理,得到目标识别结果;
通过所述穿戴物分类网络对所述整体特征进行处理,得到穿戴物识别结果;
分别基于所述目标识别结果和所述穿戴物识别结果,计算目标分类损失和穿戴物分类损失;
计算所述穿戴物识别结果和第三标签之间的对抗损失,其中,所述第三标签用于标识所述训练图像中目标对象身体上除了穿戴物之外的其它部分;
依据所述目标分类损失、所述穿戴物分类损失和所述对抗损失优化所述目标再识别模型的网络参数,以完成对所述目标再识别模型的训练,包括:依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第四阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失和对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;
其中,依据所述目标分类损失、所述穿戴物分类损失和所述对抗损失优化所述目标再识别模型的网络参数,以完成对所述目标再识别模型的训练之后,所述方法还包括:获取待识别的图像和对象数据库,其中,所述对象数据库中保存有获取待识别的图像之前识别到的各个对象的图像;将待识别的图像和各个对象的图像输入所述整体特征提取网络,得到待识别的图像的特征和各个对象的图像的特征;通过计算待识别的图像的特征和各个对象的图像的特征之间的相似度,确定出待识别的图像对应的对象,以完成对待识别的图像的再识别。
2.根据权利要求1所述的方法,其特征在于,通过所述穿戴物分类网络对所述整体特征进行处理,得到穿戴物识别结果之后,所述方法还包括:
计算所述目标识别结果和第一标签之间的目标分类损失,其中,所述第一标签用于标识所述训练图像中的目标对象;
计算所述穿戴物识别结果和第二标签之间的穿戴物分类损失,其中,所述第二标签用于标识所述训练图像中目标对象的穿戴物。
3.一种目标再识别模型的训练装置,其特征在于,包括:
构建模块,被配置为利用整体特征提取网络、目标分类网络和穿戴物分类网络构建目标再识别模型,其中,所述整体特征提取网络采用残差网络,所述目标分类网络和所述穿戴物分类网络均是依次连接全连接层和分类层得到的;
获取模块,被配置为获取训练数据,其中,所述训练数据包括关于目标对象的训练图像;
提取模块,被配置为将所述训练图像输入所述目标再识别模型:通过所述整体特征提取网络对所述训练图像进行处理,得到所述训练图像中关于所述目标对象的整体特征;
第一处理模块,被配置为通过所述目标分类网络对所述整体特征进行处理,得到目标识别结果;
第二处理模块,被配置为通过所述穿戴物分类网络对所述整体特征进行处理,得到穿戴物识别结果;
计算模块,被配置为分别基于所述目标识别结果和所述穿戴物识别结果,计算目标分类损失和穿戴物分类损失;
所述计算模块还被配置为计算所述穿戴物识别结果和第三标签之间的对抗损失,其中,所述第三标签用于标识所述训练图像中目标对象身体上除了穿戴物之外的其它部分;
优化模块,被配置为依据所述目标分类损失、所述穿戴物分类损失和所述对抗损失优化所述目标再识别模型的网络参数,以完成对所述目标再识别模型的训练,包括:依次对目标再识别模型进行多阶段训练:对目标再识别模型进行第一阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数;对目标再识别模型进行第二阶段训练:依据穿戴物分类损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第三阶段训练:依据对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;对目标再识别模型进行第四阶段训练:依据目标分类损失优化整体特征提取网络和目标分类网络的网络参数,同时依据穿戴物分类损失和对抗损失优化整体特征提取网络和穿戴物分类网络的网络参数;
所述优化模块还被配置为获取待识别的图像和对象数据库,其中,所述对象数据库中保存有获取待识别的图像之前识别到的各个对象的图像;将待识别的图像和各个对象的图像输入所述整体特征提取网络,得到待识别的图像的特征和各个对象的图像的特征;通过计算待识别的图像的特征和各个对象的图像的特征之间的相似度,确定出待识别的图像对应的对象,以完成对待识别的图像的再识别。
4.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至2中任一项所述方法的步骤。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311788123.1A CN117456314B (zh) | 2023-12-25 | 2023-12-25 | 目标再识别模型的训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311788123.1A CN117456314B (zh) | 2023-12-25 | 2023-12-25 | 目标再识别模型的训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117456314A CN117456314A (zh) | 2024-01-26 |
CN117456314B true CN117456314B (zh) | 2024-04-16 |
Family
ID=89589606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311788123.1A Active CN117456314B (zh) | 2023-12-25 | 2023-12-25 | 目标再识别模型的训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117456314B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102187302B1 (ko) * | 2020-01-13 | 2020-12-04 | 서강대학교 산학협력단 | 보행자 패션 정보를 이용한 보행자 검색 시스템 및 보행자 검색 방법 |
CN112784754A (zh) * | 2021-01-22 | 2021-05-11 | 上海明略人工智能(集团)有限公司 | 一种车辆再识别方法、装置、设备及存储介质 |
CN115147870A (zh) * | 2022-07-18 | 2022-10-04 | 深圳集智数字科技有限公司 | 行人再识别方法及装置 |
CN116612497A (zh) * | 2023-05-17 | 2023-08-18 | 安徽理工大学 | 一种基于服装风格特征融合的换衣行人重识别方法 |
CN116978090A (zh) * | 2023-06-19 | 2023-10-31 | 北京理工大学 | 一种基于特征分离和融合的行人重识别表征学习技术 |
-
2023
- 2023-12-25 CN CN202311788123.1A patent/CN117456314B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102187302B1 (ko) * | 2020-01-13 | 2020-12-04 | 서강대학교 산학협력단 | 보행자 패션 정보를 이용한 보행자 검색 시스템 및 보행자 검색 방법 |
CN112784754A (zh) * | 2021-01-22 | 2021-05-11 | 上海明略人工智能(集团)有限公司 | 一种车辆再识别方法、装置、设备及存储介质 |
CN115147870A (zh) * | 2022-07-18 | 2022-10-04 | 深圳集智数字科技有限公司 | 行人再识别方法及装置 |
CN116612497A (zh) * | 2023-05-17 | 2023-08-18 | 安徽理工大学 | 一种基于服装风格特征融合的换衣行人重识别方法 |
CN116978090A (zh) * | 2023-06-19 | 2023-10-31 | 北京理工大学 | 一种基于特征分离和融合的行人重识别表征学习技术 |
Non-Patent Citations (3)
Title |
---|
"Clothes-Changing Person Re-identification with RGB Modality Only;Xinqian Gu等;arXiv:2204.06890;20220414;第1-11页 * |
Xinqian Gu等."Clothes-Changing Person Re-identification with RGB Modality Only.arXiv:2204.06890.2022,第1-11页. * |
基于迭代训练和集成学习的图像分类方法;罗会兰 等;计算机工程与设计;20200531;第41卷(第5期);第1301-1307页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117456314A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944020B (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
CN108288051B (zh) | 行人再识别模型训练方法及装置、电子设备和存储介质 | |
AU2014350727A1 (en) | Face positioning method and device | |
CN110287936B (zh) | 图像检测方法、装置、设备及存储介质 | |
US20210097692A1 (en) | Data filtering of image stacks and video streams | |
CN112597850B (zh) | 一种身份识别方法及装置 | |
CN113313053B (zh) | 图像处理方法、装置、设备、介质及程序产品 | |
CN113298152B (zh) | 模型训练方法、装置、终端设备及计算机可读存储介质 | |
CN110705584A (zh) | 情绪识别方法、装置、计算机装置及存储介质 | |
CN111401339A (zh) | 识别人脸图像中的人的年龄的方法、装置及电子设备 | |
CN111368657A (zh) | 牛脸识别方法和装置 | |
CN114358205A (zh) | 模型训练方法、模型训练装置、终端设备及存储介质 | |
CN117456314B (zh) | 目标再识别模型的训练方法及装置 | |
Abdolhoseini et al. | Automated tracing of microglia using multilevel thresholding and minimum spanning trees | |
CN112861934A (zh) | 一种嵌入式终端的图像分类方法、装置及嵌入式终端 | |
CN113723431B (zh) | 图像识别方法、装置以及计算机可读存储介质 | |
CN116958724A (zh) | 一种产品分类模型的训练方法和相关装置 | |
CN114140822A (zh) | 行人重识别方法及装置 | |
CN117474037B (zh) | 基于空间距离对齐的知识蒸馏方法及装置 | |
CN113392867A (zh) | 一种图像识别方法、装置、计算机设备及存储介质 | |
CN117953346A (zh) | 基于特征一致性的目标重识别模型的训练方法及装置 | |
CN117372818B (zh) | 目标重识别方法及装置 | |
CN113837930B (zh) | 人脸图像合成方法、装置以及计算机可读存储介质 | |
CN116912920B (zh) | 表情识别方法及装置 | |
CN117475215A (zh) | 目标识别模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |