CN113095174A - 重识别模型训练方法、装置、设备及可读存储介质 - Google Patents
重识别模型训练方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN113095174A CN113095174A CN202110337321.0A CN202110337321A CN113095174A CN 113095174 A CN113095174 A CN 113095174A CN 202110337321 A CN202110337321 A CN 202110337321A CN 113095174 A CN113095174 A CN 113095174A
- Authority
- CN
- China
- Prior art keywords
- sample data
- target
- model
- data set
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 34
- 238000009499 grossing Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 102100040160 Rabankyrin-5 Human genes 0.000 description 3
- 101710086049 Rabankyrin-5 Proteins 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
- G06V40/25—Recognition of walking or running movements, e.g. gait recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种重识别模型训练方法,该方法包括:获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。本发明还公开了一种重识别模型训练装置、设备及可读存储介质。本发明通过利用经过标签替换处理得到的目标样本数据对重识别模型进行训练,提高了重识别模型的识别性能。
Description
技术领域
本发明涉及重识别技术领域,尤其涉及一种重识别模型训练方法、装置、设备及可读存储介质。
背景技术
随着重识别技术的发展,在行人重识别、车辆重识别等识别任务中,常常采用一些数据增强、训练Tricks等方法提升模型性能。目前常用的利用one-hot编码标签提升重识别模型性能的方法,在重识别模型训练过程中,鼓励模型预测为目标类别的概率趋近1,非目标类别的概率趋近0,即最终预测的所有类别的概率分布的向量值中目标类别的值会趋于无穷大,使得模型向预测正确与错误标签的向量差值无限增大的方向学习,而过大的向量差值会使模型缺乏适应性,对自身的预测结果过于自信,从而出现模型过拟合,泛化能力差。为解决模型过拟合问题,提高模型的泛化能力,也有基于标签平滑的模型训练方法,使用交叉熵的损失函数作为目标损失函数,标签平滑相当于在真实标签数据中加入了噪声,避免模型对正确标签的预测结果过于自信,使得对目标类别和非目标类别的预测向量值的差别不那么大,从而避免模型过拟合,提高模型的泛化能力。目前基于标签平滑的方法训练出的重识别模型虽然解决了模型的过拟合问题,但模型的识别性能并不理想。
发明内容
本发明的主要目的在于提供一种重识别模型训练方法、装置、设备及可读存储介质,旨在解决现有重识别模型性能较低的技术问题。
此外,为实现上述目的,本发明还提供一种重识别模型训练方法,所述重识别模型训练方法包括以下步骤:
获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;
利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
可选地,所述利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型的步骤,包括:
获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据;
利用所述第一目标样本数据对所述预设待训练模型进行训练,得到第一识别模型。
可选地,所述获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据的步骤,包括:
获取所述样本数据集的标签数据,根据所述标签数据计算所述样本数据集的损失函数;
利用第一预设算法对所述损失函数中的参数进行替换,以对所述样本数据集的标签数据进行标签平滑处理,得到第一目标样本数据。
可选地,所述样本数据包括图像数据,所述利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值的步骤,包括:
利用所述第一识别模型,对所述样本数据集中的图像数据进行特征提取,得到目标特征向量;
从所述样本数据集的图像数据中确定第一图像数据,并从所述目标特征向量中确定所述第一图像数据对应的第一特征向量;
对所述第一特征向量进行特征计算,得到目标特征值。
可选地,所述根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据的步骤,包括:
从所述样本数据集中确定第二图像数据;
根据所述目标特征值,对所述第一图像数据与所述第二图像数据的相似性进行计算,得到相似性特征值;
根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据。
可选地,所述根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据的步骤,包括:
获取预设超参数对应的超参数值;
利用第二预设算法,对所述超参数值和所述相似性特征值进行计算,得到所述样本数据集对应的目标标签数据;
利用所述目标标签数据对所述样本数据集的标签数据进行替换,得到目标样本数据。
可选地,其特征在于,所述利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型之后的步骤,包括:
获取所述目标重识别模型的模型参数;
根据所述模型参数对所述目标重识别模型的性能进行评估,以判断所述目标重识别模型的性能是否满足预设条件;
若所述目标重识别模型的性能不满足预设条件,则返回并执行获取预设超参数对应的超参数值的步骤,直到所述目标重识别模型的性能满足预设条件。
此外,为实现上述目的,本发明还提供一种重识别模型训练装置,所述重识别模型训练装置包括:
模型预训练模块,用于获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
特征处理模块,用于利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
标签处理模块,用于根据所述目标特征值对所述样本数据集进行标示,得到目标样本数据;
模型训练模块,用于利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
此外,为实现上述目的,本发明还提供一种重识别模型训练设备,所述重识别模型训练设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的重识别模型训练程序,所述重识别模型训练程序被所述处理器执行时实现如上述的重识别模型训练方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有重识别模型训练程序,所述重识别模型训练程序被处理器执行时实现如上述的重识别模型训练方法的步骤。
本发明实施例提出的一种方法、装置、设备及可读存储介质。与现有技术中,基于标签平滑的重识别模型性能较低相比,本发明实施例中,通过获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。即利用样本数据集的特征值对样本数据集进行标签替换处理,得到目标样本数据,利用经过标签替换处理的目标样本数据对预设待训练模型进行训练,得到的目标重识别模型,不仅可以提高重识别模型的泛化能力,还能提高重识别模型的识别性能。
附图说明
图1为本发明实施例提供的重识别模型训练设备一种实施方式的硬件结构示意图;
图2为本发明重识别模型训练方法第一实施例的流程示意图;
图3为本发明重识别模型训练装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
本发明实施例重识别模型训练设备(又叫终端、设备或者终端设备)可以是PC,也可以是智能手机、平板电脑和便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及重识别模型训练程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的重识别模型训练程序,所述重识别模型训练程序被处理器执行时实现下述实施例提供的重识别模型训练方法中的操作。
基于上述设备硬件结构,提出了本发明重识别模型训练方法的实施例。
参照图2,在本发明重识别模型训练方法的第一实施例中,所述重识别模型训练方法包括步骤S10-S40:
步骤S10,获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
在本发明中,重识别模型训练所用的样本数据集包括图像数据,该图像数据可以是多个行人或者车辆等不同对象的图像,其中,样本数据集中的图像数据来自不同的图像采集终端,图像采集终端可以是相机也可以是监控摄像头,在此不作限定。本实施例中,样本数据集中的图像数据以来自不同的图像采集终端的行人的图像数据为例进行说明。首先获取样本数据集,可知地,获取的样本数据集包括训练样本集和测试样本集,利用获取的样本数据集对预设待训练模型进行预训练,得到第一识别模型,对预设待训练模型的预训练可以是基于现有的模型训练方法进行的模型训练,如one-hot编码标签法,或者是基于one-hot编码标签的标签平滑法,以下模型预训练以基于one-hot编码标签的标签平滑法为例进行说明。
在本实施例中,预设待训练模型为基础重识别模型,如OSnet(Omni-ScaleNetwork,全称网络)模型、RESnet(Residual Network,残差网络)模型等,以OSnet模型为例,利用获取的样本数据集对OSnet模型进行预训练,得到基于OSnet的重识别模型,对预设待训练的基础OSnet模型进行预训练的过程,包括步骤A1-A2:
步骤A1,获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据;
步骤A2,利用所述第一目标样本数据对所述预设待训练模型进行训练,得到第一识别模型。
获取样本数据集的标签数据,在本实施例中,该标签数据是one-hot编码标签,在样本数据集中,同一个行人的图像数据可能包括多张图像,因此,在one-hot编码标签里,同一个行人在样本数据集中的图像可能有多个不同的编码标签,以100个行人为例,对100个行人分别编码为001-100,将001-100作为该行人的ID编码,则在样本数据集中,同一个ID编码可能对应有多张来自不同终端设备的图像,因此,同一ID在样本数据集中的图像可能有不同的编码或标签。获取样本数据集的标签数据,并采用标签平滑法对样本数据集的标签数据进行平滑处理,得到第一目标样本数据,利用经过平滑处理后的第一目标样本数据对预设待训练OSnet模型进行训练,得到第一识别模型。
进一步地,对样本数据集的标签数据进行标签平滑处理包括步骤A11-A12:
步骤A11,获取所述样本数据集的标签数据,根据所述标签数据计算所述样本数据集的损失函数;
步骤A12,利用第一预设算法对所述损失函数中的参数进行替换,以对所述样本数据集的标签数据进行标签平滑处理,得到第一目标样本数据。
在对样本数据集的标签数据进行标签平滑处理时,首先获取样本数据集的标签数据,并根据标签数据计算样本数据集的损失函数,该损失函数的计算过程如公式1-3所示:
其中,H(y,p)表示损失函数,K表示样本数据集中图像数据的图像数量,i表示当前图像在样本数据集的图像数据中的序号,假如样本数据集的图像数据中总计有1000张图像,则i的取值为1~1000,target表示待识别的目标分类(行人),即待查询的行人的ID编号对应的图像的序号,yi表示当前分类图像的one-hot编码,zi、zj表示模型输出的对当前图像分类(行人)的识别向量值,j为模型的识别网络的参数,pi表示当前图像分类与待识别的目标分类匹配的概率值。
上述公式2所示的yi为样本数据集中图像数据的one-hot编码,该编码就可以作为样本数据集中,图像数据的标签,从而构成样本数据集的标签数据。利用预设算法对公式1所示的损失函数中的参数进行替换,例如,对作为样本数据集标签数据的one-hot编码的yi进行替换,具体替换方式可以是下列公式4所示:
根据公式4,在损失函数中,用y'i代替yi,其他参数与公式2中的含义相同,与公式2不同是在公式4中引入了一个超参数α',使得当前图像分类与目标分类匹配时的概不为1,不匹配的概率也不为0,在数据集的标签数据中加入噪声,避免模型对正确的标签数据的预测结果过于自信,从而避免模型过拟合,实现对样本数据集的标签数据的平滑处理,得到第一目标样本数据,利用平滑处理后的样本数据集对预设待训练模型进行训练,得到第一识别模型。
步骤S20,利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
利用经过预训练的模型对样本数据集进行特征提取,主要是对样本数据集中的图像数据的特征进行提取,该特征是同一分类(行人)图像与其他分类(行人)图像匹配的概率值组成的向量,若样本数据集的标签数据为one-hot编码,则该特征为[1,0,0,0,0,0,...,0]、[0,1,0,0,0,0,...,0]、......,其中1表示该标签对应的分类图像与待识别的目标分类为同一分类(即为同一个行人的图像),0表示该标签对应的分类图像与待识别的分类图像不是同一分类,若样本数据集的标签数据是经过平滑处理后的one-hot编码标签数据,则该特征为形如[1-α',α'/K,α'/K,α'/K,....,α'/K]、[α'/K,1-α',α'/K,α'/K,....,α'/K]、.......,的向量,其中1-α'表示该标签对应的分类图像与待识别的目标分类为同一分类,α'/K表示该标签对应的分类图像与待识别的目标分类不是同一分类,对提取的特征进行计算,得到目标特征值。
其中,目标特征值的计算过程如步骤B1-B3所示:
步骤B1,利用所述第一识别模型,对所述样本数据集中的图像数据进行特征提取,得到目标特征向量;
步骤B2,从所述样本数据集的图像数据中确定第一图像数据,并从所述目标特征向量中确定所述第一图像数据对应的第一特征向量;
步骤B3,对所述第一特征向量进行特征计算,得到目标特征值。
具体地,利用经过预训练的识别模型进行特征提取时,以上述ID编号001-100的行人为例,若样本数据集的标签数据为one-hot编码标签或经过平滑处理后的one-hot编码标签,则对样本数据集中的图像数据进行特征提取后,得到目标特征向量,该目标特征向量如上述[1,0,0,0,0,0,...,0]以及[α'/K,1-α',α'/K,α'/K,....,α'/K]所示,在目标特征向量中,每个图像对应的特征向量都可以表示该图像与其他图像的ID匹配的概率值。对提取的特征进行计算时,首先从样本数据集的图像数据中确定第一图像数据,对目标特征向量中第一图像数据对应的第一特征向量进行计算,得到目标特征值。
本实施例中,第一图像数据可以是同一个ID对应的图像数据,对第一图像数据对应的第一特征向量进行计算,也即是对同一ID的图像的特征向量进行计算,该计算可以是进行平均计算,即将同一个ID对应的多张图像的特征向量的平均值作为该ID的图像的特征向量,分别对001-100的ID进行相同的计算即得到目标特征值。也可以对同一ID对应的图像的特征向量进行其他方式的计算,如加权平均或取众数运算,在此不作具体限定。
步骤S30,根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;
进一步地,在得到目标特征值后,根据目标特征值对样本数据集进行标签替换处理,得到目标样本数据。在对样本数据集进行标签替换处理时,基于上述标签平滑处理的步骤,采用不同的方式计算新的编码标签,进而利用新的标签对样本数据集的标签数据进行替换,得到目标样本数据。
更进一步地,根据目标特征值对样本数据集进行标签替换处理,得到目标样本数据的过程,包括步骤C1-C3:
步骤C1,从所述样本数据集中确定第二图像数据;
步骤C2,根据所述目标特征值,对所述第一图像数据与所述第二图像数据的相似性进行计算,得到相似性特征值;
步骤C3,根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据。
同样以上述ID编号001-100的行人为例,若样本数据集中的第一图像数据为同一ID的图像数据,则对于同一个ID的图像数据而言,其他所有ID的图像数据即为第二图像数据。在对样本数据集进行标签替换处理时,首先从样本数据集的图像数据中,根据同一ID的第一图像数据确定其他ID的第二图数据,然后根据目标特征值,即每个ID的平均特征值,计算第一图像数据与第二图像数据的相似度特征值。也即对同一ID的图像与其他ID的图像的相似度进行计算,得到相似度特征值,该相似度包括但不限于余弦相似度,以下余弦相似度为例进行说明。计算出每一个ID的图像与其他ID图像的余弦相似度作为相似度特征值,利用该相似度特征值对样本数据集中的图像数据进行标示,具体标示过程如步骤C31-C33所示:
步骤C31,获取预设超参数对应的超参数值;
步骤C32,利用第二预设算法,对所述超参数值和所述相似性特征值进行计算,得到所述样本数据集对应的目标标签数据;
步骤C33,利用所述目标标签数据对所述样本数据集的标签数据进行替换,得到目标样本数据。
与标签平滑相似,在对样本数据集进行标签替换时,引入了一个超参数,获取预设的超参数的参数值,该参数值可以是自定义设置的,也可以是在模型训练过程中自动调整的,利用预设算法,对该超参数值和相似性特征值进行计算,得到样本数据集的目标标签数据,利用该目标标签数据对原有标签数据进行替换,得到目标样本数据。其中,对超参数值和相似性特征值的计算如公式5或6所示:
在公式5和公式6中,表示样本数据集中的图像数据的编码标签,α是引入的超参数,作用与在标签平滑处理中的作用类似,是作为噪声引入的错误标签,1-α表示该标签对应的分类图像与待识别的分类图像为同一分类,对于不同ID的图像与待识别的分类图像之间的匹配概率值,将其与待识别的分类图像的ID的余弦相似度作为权重,对错误标签α进行加权分配,一般地,超参数α的值较小,θi表示当前分类图像与待识别的目标分类的余弦相似度,其他参数与在公式2中的含义相同。
与标签平滑处理的不同之处在于,对于引入的超参数,在标签平滑中,是由除待识别的目标ID之外的其他ID的图像对超参数的值进行平均分配,而在本申请的标签替换处理中,是根据其他ID的图像与目标ID图像的余弦相似度,对引入的超参数的值进行加权分配的,利用该编码作为样本数据集的标签数据,对样本数据集原本的标签数据进行替换,得到目标样本数据。公式5和公式6仅为本发明实施例中的一种优选计算方式,本发明所述的对超参数值和相似性特征值的计算方式并不限于此。
步骤S40,利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
利用上述得到的目标样本数据对预设待训练模型进行训练,能够使训练后的模型对于错误标签的免疫性更高。其中,利用目标样本数据对预设待训练模型进行训练的步骤,可以是与上述预训练步骤基本相同的步骤,不同的是在上述预训练的标签平滑处理时,将经过平滑处理的标签,替换为了利用相似性特征值和超参数进行计算得到的标签,从而得到目标重识别模型。经过训练得到的目标重识别模型不仅提高了模型的泛化能力,还提高了模型的识别准确率,相比于经过标签平滑和one-hot编码标签训练得到的重识别模型,该目标重识别模型的整体性能都有所提升。
在本实施例中,通过获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。即利用样本数据集的特征值对样本数据集进行标签替换处理,得到目标样本数据,利用经过标签替换处理的目标样本数据对预设待训练模型进行训练,得到的目标重识别模型,不仅可以提高重识别模型的泛化能力,还能提高重识别模型的识别性能。
进一步地,在本发明上述实施例的基础上,提出了本发明方法的第二实施例。
本实施例是第一实施例中步骤S40之后的步骤,包括步骤D1-D3:
步骤D1,获取所述目标重识别模型的模型参数;
步骤D2,根据所述模型参数对所述目标重识别模型的性能进行评估,以判断所述目标重识别模型的性能是否满足预设条件;
步骤D3,若所述目标重识别模型的性能不满足预设条件,则返回并执行获取预设超参数对应的超参数值的步骤,直到所述目标重识别模型的性能满足预设条件。
在本申请所述的重识别模型训练方法中,利用目标样本数据对预设待训练模型进行训练,得到目标重识别模型后,需要对模型的性能进行评估,进而对模型的参数进行调整,以使模型的性能更加优化。以上述实施例中的目标重识别模型为例,对该目标重识别模型进行评估时,首先获取模型参数,模型参数包括mAP(mean Average Precision平均精度均值)、rank-k(按照相似度排序后的前k张图像中存在与查询图像属于同一分类的准确率)和CMC(Cumulative Match Characteristic累计匹配特征)等。本实施例中,仅以mAP和rank-1为例进行说明。
具体地说,以行人重识别为例,在对模型进行参数评估时,将样本数据集分为测试样本和验证样本,测试样本包括待查询数据库和查询数据库,待查询数据库中是待查询的行人图像,查询数据库中包含待查询数据库中全部或部分待查询行人图像。训练样本包括与待查询行人匹配的正样本和与待查询行人不匹配的负样本,在模型的重识别结果中,包括识别正确的正样本TP(True Positive)、识别错误的正样本FP(False Positive)、识别正确的负样本TN(Ture negative)以及识别错误的负样本FN(False Negative),通过验证样本对模型识别结果进行验证得到TP、FP、TN、FN对应的识别结果集。
参数mAP的计算方式如公式7-9所示:
其中,公式8中的分子为验证结果中,待查询行人的所有精确率的和,分母为待查询行人对应的图像的数量,在公式9中,C表示待查询的行人的总数量,K表示当前查询的行人的序号,APK表示对当前查询的行人重识别的平均精度。
具体来说,在行人重识别中,若待查询行人的图像标签为m1,查询数据库中有100个人的图像,其中,包含3张待查询行人的图像,查询出来的图像按照得分从高到低的顺序为m1、m2、m1、m3、m4、m1…,此时:
第一次查询到m1,提取出的正确信息条数为1,提取出的信息条数为1,精确率=1/1=100%;
第二次查询到m1,提取出的正确信息条数为2,提取出的信息条数为3,精确率=2/3≈66.66%;
第三次查询到m1,提取出的正确信息条数为3,提取出的信息条数为6,正确率=3/6=50%;
对该行人重识别的平均精确率AP≈(100%+66.66%+50%)/3=72.22%
而当需要查询的不止一个人时,此时mAP则如公式9所示,是取所有人的平均精确率的均值。
参数rank-1则是在识别任务中,将待查询行人的图像与查询数据库中所有行人的图像一一进行相似度计算,然后将根据相似度进行匹配的得分从高到低排列,rank1是排名第一位的图像与待查询行人的图像匹配的准确率。
例如,在行人重识别中,查询数据库中有100个行人,待查询行人的图像的标签为m1,与查询数据库中的图像对比后,计算每个图像与待查询行人的图像的匹配度得分,将查询数据库中的图像按照得分从高到低进行排序:
如果识别结果是m1、m2、m3、m4、m5……,则此时rank-1的正确率为100%;rank-2的正确率也为100%;rank-5的正确率也为100%;
如果识别结果是m2、m1、m3、m4、m5……,则此时rank-1的正确率为0%;rank-2的正确率为100%;rank-5的正确率也为100%;
如果识别结果是m2、m3、m4、m5、m1……,则此时rank-1的正确率为0%;rank-2的正确率为0%;rank-5的正确率为100%。
根据模型参数对重识别模型的性能进行评估,判断训练后的目标重识别模型是否满足预设条件,预设条件例如,相同的超参数下,与one-hot编码标签和标签平滑相比,目标重识别模型的识别准确率是否提高,识别准确率的提高程度是否达到要求等。若目标重识别模型的性能不满足预设条件,则重新获取预设超参数对应的超参数值,并对样本数据集重新进行标签替换处理,直到训练后的目标重识别模型的性能满足预设条件。其中,重新获取的超参数值,是根据对模型参数的评估结果进行自动调整后的值。
超参数值一般是一个较小的值,例如0.1,超参数值自动调整的依据,还可以是对模型参数多次评估的结果,例如,第一次模型训练将超参数值设置为0.1,第二模型训练将超参数值设置为0.2,对两次训练得到的模型进行参数评估后发现,两个超参数值都能使模型的性能有所提高,但当超参数值为0.2时,模型识别准确率相较于超参数值为0.1时有所下降,则将模型参数自动调整为0.15,再次对模型进行训练,对训练后的目标和重识别模型机型参数评估,若模型的识别准确率比超参数值为0.1时有所提高,则将超参数值设置为0.18再次进行模型训练,利用逼近法不断调整超参数值,直到确定一个最优超参数值,能够使得训练后的重识别模型性能最佳。可知地,上述超参数值调整方式仅用于对本实施例进行说明,并不对本发明构成限定。
在本实施例中,通过对训练后的目标重识别模型进行参数评估,从而确定训练后的目标重识别模型是否满足预设条件,若不满足,则重新获取超参数值,不断对超参数的值进行调整,直到使训练后的模型性能达到预设条件,提高了模型的识别性能。
此外,参照图3,本发明实施例还提出一种重识别模型训练装置,所述重识别模型训练装置包括:
模型预训练模块10,用于获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
特征处理模块20,用于利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
标签处理模块30,用于根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;
模型训练模块40,用于利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
可选地,所述模型预训练模块10,包括:
标签平滑单元,用于获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据;
预训练单元,用于利用所述第一目标样本数据对所述预设待训练模型进行训练,得到第一识别模型。
可选地,所述标签平滑单元,包括:
标签计算子单元,用于获取所述样本数据集的标签数据,根据所述标签数据计算所述样本数据集的损失函数;
标签替换子单元,用于利用第一预设算法对所述损失函数中的参数进行替换,以对所述样本数据集的标签数据进行标签平滑处理,得到第一目标样本数据。
可选地,所述特征处理模块20,包括:
特征提取单元,用于利用所述第一识别模型,对所述样本数据集中的图像数据进行特征提取,得到目标特征向量;
第一确定单元,用于从所述样本数据集的图像数据中确定第一图像数据,并从所述目标特征向量中确定所述第一图像数据对应的第一特征向量;
特征计算单元,用于对所述第一特征向量进行特征计算,得到目标特征值。
可选地,所述标签处理模块30,包括:
第二确定单元,用于从所述样本数据集中确定第二图像数据;
相似性计算单元,用于根据所述目标特征值,对所述第一图像数据与所述第二图像数据的相似性进行计算,得到相似性特征值;
样本标示单元,用于根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据。
可选地,所述样本标示单元,包括:
参数获取子单元,用于获取预设超参数对应的超参数值;
标签计算子单元,用于利用第二预设算法,对所述超参数值和所述相似性特征值进行计算,得到所述样本数据集对应的目标标签数据;
标签替换子单元,用于利用所述目标标签数据对所述样本数据集的标签数据进行替换,得到目标样本数据。
可选地,所述重识别模型训练装置,还包括:
模型参数获取单元,用于获取所述目标重识别模型的模型参数;
模型评估单元,用于根据所述模型参数对所述目标重识别模型的性能进行评估,以判断所述目标重识别模型的性能是否满足预设条件;
循环单元,用于若所述目标重识别模型的性能不满足预设条件,则返回并执行获取预设超参数对应的超参数值的步骤,直到所述目标重识别模型的性能满足预设条件。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有重识别模型训练程序,所述重识别模型训练程序被处理器执行时实现上述实施例提供的重识别模型训练方法中的操作。
上述各程序模块所执行的方法可参照本发明方法各个实施例,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的重识别模型训练方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种重识别模型训练方法,其特征在于,所述重识别模型训练方法包括以下步骤:
获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;
利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
2.如权利要求1所述的重识别模型训练方法,其特征在于,所述利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型的步骤,包括:
获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据;
利用所述第一目标样本数据对所述预设待训练模型进行训练,得到第一识别模型。
3.如权利要求2所述的重识别模型训练方法,其特征在于,所述获取所述样本数据集的标签数据,并对所述标签数据进行标签平滑处理,得到第一目标样本数据的步骤,包括:
获取所述样本数据集的标签数据,根据所述标签数据计算所述样本数据集的损失函数;
利用第一预设算法对所述损失函数中的参数进行替换,以对所述样本数据集的标签数据进行标签平滑处理,得到第一目标样本数据。
4.如权利要求1所述的重识别模型训练方法,其特征在于,所述样本数据包括图像数据,所述利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值的步骤,包括:
利用所述第一识别模型,对所述样本数据集中的图像数据进行特征提取,得到目标特征向量;
从所述样本数据集的图像数据中确定第一图像数据,并从所述目标特征向量中确定所述第一图像数据对应的第一特征向量;
对所述第一特征向量进行特征计算,得到目标特征值。
5.如权利要求4所述的重识别模型训练方法,其特征在于,所述根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据的步骤,包括:
从所述样本数据集中确定第二图像数据;
根据所述目标特征值,对所述第一图像数据与所述第二图像数据的相似性进行计算,得到相似性特征值;
根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据。
6.如权利要求5所述的重识别模型训练方法,其特征在于,所述根据所述相似性特征值对所述样本数据集进行标示,以对所述样本数据的标签数据进行替换,得到目标样本数据的步骤,包括:
获取预设超参数对应的超参数值;
利用第二预设算法,对所述超参数值和所述相似性特征值进行计算,得到所述样本数据集对应的目标标签数据;
利用所述目标标签数据对所述样本数据集的标签数据进行替换,得到目标样本数据。
7.如权利要求1至6任一项所述的重识别模型训练方法,其特征在于,所述利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型之后的步骤,包括:
获取所述目标重识别模型的模型参数;
根据所述模型参数对所述目标重识别模型的性能进行评估,以判断所述目标重识别模型的性能是否满足预设条件;
若所述目标重识别模型的性能不满足预设条件,则返回并执行获取预设超参数对应的超参数值的步骤,直到所述目标重识别模型的性能满足预设条件。
8.一种重识别模型训练装置,其特征在于,所述重识别模型训练装置包括:
模型预训练模块,用于获取样本数据集,并利用所述样本数据集对预设待训练模型进行预训练,得到第一识别模型;
特征处理模块,用于利用所述第一识别模型对所述样本数据集进行特征提取处理,并对提取的特征进行计算,得到目标特征值;
标签处理模块,用于根据所述目标特征值对所述样本数据集进行标签替换处理,得到目标样本数据;
模型训练模块,用于利用所述目标样本数据对所述预设待训练模型进行训练,得到目标重识别模型。
9.一种重识别模型训练设备,其特征在于,所述重识别模型训练设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的重识别模型训练程序,所述重识别模型训练程序被所述处理器执行时实现如权利要求1至7中任一项所述的重识别模型训练方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有重识别模型训练程序,所述重识别模型训练程序被处理器执行时实现如权利要求1至7中任一项所述的重识别模型训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337321.0A CN113095174A (zh) | 2021-03-29 | 2021-03-29 | 重识别模型训练方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337321.0A CN113095174A (zh) | 2021-03-29 | 2021-03-29 | 重识别模型训练方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113095174A true CN113095174A (zh) | 2021-07-09 |
Family
ID=76671061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110337321.0A Pending CN113095174A (zh) | 2021-03-29 | 2021-03-29 | 重识别模型训练方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095174A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023115911A1 (zh) * | 2021-12-24 | 2023-06-29 | 上海商汤智能科技有限公司 | 对象重识别方法及装置、电子设备、存储介质和计算机程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160297A (zh) * | 2019-12-31 | 2020-05-15 | 武汉大学 | 基于残差注意机制时空联合模型的行人重识别方法及装置 |
CN111723645A (zh) * | 2020-04-24 | 2020-09-29 | 浙江大学 | 用于同相机内有监督场景的多相机高精度行人重识别方法 |
CN111783576A (zh) * | 2020-06-18 | 2020-10-16 | 西安电子科技大学 | 基于改进型YOLOv3网络和特征融合的行人重识别方法 |
CN111881757A (zh) * | 2020-06-29 | 2020-11-03 | 浪潮电子信息产业股份有限公司 | 一种行人重识别方法、装置、设备及介质 |
CN111967294A (zh) * | 2020-06-23 | 2020-11-20 | 南昌大学 | 一种无监督域自适应的行人重识别方法 |
CN112418134A (zh) * | 2020-12-01 | 2021-02-26 | 厦门大学 | 基于行人解析的多流多标签行人再识别方法 |
WO2021043168A1 (zh) * | 2019-09-05 | 2021-03-11 | 华为技术有限公司 | 行人再识别网络的训练方法、行人再识别方法和装置 |
-
2021
- 2021-03-29 CN CN202110337321.0A patent/CN113095174A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021043168A1 (zh) * | 2019-09-05 | 2021-03-11 | 华为技术有限公司 | 行人再识别网络的训练方法、行人再识别方法和装置 |
CN111160297A (zh) * | 2019-12-31 | 2020-05-15 | 武汉大学 | 基于残差注意机制时空联合模型的行人重识别方法及装置 |
CN111723645A (zh) * | 2020-04-24 | 2020-09-29 | 浙江大学 | 用于同相机内有监督场景的多相机高精度行人重识别方法 |
CN111783576A (zh) * | 2020-06-18 | 2020-10-16 | 西安电子科技大学 | 基于改进型YOLOv3网络和特征融合的行人重识别方法 |
CN111967294A (zh) * | 2020-06-23 | 2020-11-20 | 南昌大学 | 一种无监督域自适应的行人重识别方法 |
CN111881757A (zh) * | 2020-06-29 | 2020-11-03 | 浪潮电子信息产业股份有限公司 | 一种行人重识别方法、装置、设备及介质 |
CN112418134A (zh) * | 2020-12-01 | 2021-02-26 | 厦门大学 | 基于行人解析的多流多标签行人再识别方法 |
Non-Patent Citations (1)
Title |
---|
MAX KRÜGER: ""A similarity measure in Bayesian classification based on characteristic attributes of objects"", 《2016 19TH INTERNATIONAL CONFERENCE ON INFORMATION FUSION》, 4 August 2016 (2016-08-04) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023115911A1 (zh) * | 2021-12-24 | 2023-06-29 | 上海商汤智能科技有限公司 | 对象重识别方法及装置、电子设备、存储介质和计算机程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633204B (zh) | 人脸遮挡检测方法、装置及存储介质 | |
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
CN109471945B (zh) | 基于深度学习的医疗文本分类方法、装置及存储介质 | |
US8792722B2 (en) | Hand gesture detection | |
US8750573B2 (en) | Hand gesture detection | |
CN108268838B (zh) | 人脸表情识别方法及人脸表情识别系统 | |
CN109145766B (zh) | 模型训练方法、装置、识别方法、电子设备及存储介质 | |
JP5214760B2 (ja) | 学習装置、方法及びプログラム | |
CN109882019B (zh) | 一种基于目标检测和动作识别的汽车电动尾门开启方法 | |
CN111126224A (zh) | 车辆检测方法及分类识别模型训练方法 | |
CN110717554B (zh) | 图像识别方法、电子设备及存储介质 | |
US20080240579A1 (en) | Video discrimination method and video discrimination apparatus | |
CN108038208B (zh) | 上下文信息识别模型的训练方法、装置和存储介质 | |
CN111126396A (zh) | 图像识别方法、装置、计算机设备以及存储介质 | |
CN110909784B (zh) | 一种图像识别模型的训练方法、装置及电子设备 | |
CN112767366A (zh) | 基于深度学习的图像识别方法、装置、设备及存储介质 | |
CN107066980B (zh) | 一种图像变形检测方法及装置 | |
CN110264093B (zh) | 信用模型的建立方法、装置、设备及可读存储介质 | |
CN113033271A (zh) | 利用人工智能模块学习脸部辨识的处理方法 | |
CN113095174A (zh) | 重识别模型训练方法、装置、设备及可读存储介质 | |
CN114299546A (zh) | 识别宠物身份的方法、装置、存储介质及电子设备 | |
CN113378852A (zh) | 关键点检测方法、装置、电子设备及存储介质 | |
CN111476144A (zh) | 行人属性识别模型确定方法、装置及计算机可读存储介质 | |
CN116958512A (zh) | 目标检测方法、装置、计算机可读介质及电子设备 | |
CN111722717A (zh) | 手势识别方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |