CN113807401A - 通用id识别方法、装置及设备 - Google Patents

通用id识别方法、装置及设备 Download PDF

Info

Publication number
CN113807401A
CN113807401A CN202110950191.8A CN202110950191A CN113807401A CN 113807401 A CN113807401 A CN 113807401A CN 202110950191 A CN202110950191 A CN 202110950191A CN 113807401 A CN113807401 A CN 113807401A
Authority
CN
China
Prior art keywords
loss
picture
sample
network model
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110950191.8A
Other languages
English (en)
Other versions
CN113807401B (zh
Inventor
张�浩
徐�明
刘强
李杉杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZNV Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen ZNV Technology Co Ltd
Priority to CN202110950191.8A priority Critical patent/CN113807401B/zh
Priority claimed from CN202110950191.8A external-priority patent/CN113807401B/zh
Publication of CN113807401A publication Critical patent/CN113807401A/zh
Application granted granted Critical
Publication of CN113807401B publication Critical patent/CN113807401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

一种通用ID识别方法、装置及设备,通过将训练样本集输入初始识别网络模型,得到各样本图片的ID特征向量和ID预测标签信息;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息得到三元组损失;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息得到中心损失;根据三元组损失、中心损失和分类损失得到组合损失,根据组合损失对初始识别网络模型的参数进行调整得到更新的识别网络模型;迭代训练得到目标识别网络模型。通过上述目标识别网络模型得到的各个类别的物体的特征向量满足同类别聚集,不同类别离散的分布,因此通过上述目标识别网络模型可以实现通用ID的识别,从而提高了ID识别模型的利用率和识别效率。

Description

通用ID识别方法、装置及设备
技术领域
本发明涉及机器视觉技术领域,具体涉及一种通用ID识别方法、装置及设备。
背景技术
在人脸识别、行人重识别、车辆重识别、猪脸识别、奶牛识别等身份标识号(Identity document,ID)识别任务中,每个ID识别任务都需要根据专门的训练数据训练识别模型,并且不同的识别任务需要分别训练不同的识别模型;新增类别的ID识别需要收集并标注大量数据,而进行ID标注的成本非常高且花费的时间较长,从而导致ID识别模型的利用率和识别效率较低。
发明内容
本发明实施例提供一种通用ID识别方法、装置及设备,用以提高ID识别模型的利用率和识别效率。
根据第一方面,一种实施例中提供一种通用ID识别方法,所述方法包括:
获取训练样本集,其中,所述训练样本集包括多种类别的样本图片和各所述样本图片的ID标注信息,所述ID标注信息用于标注各所述样本图片对应的ID,所述训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;
将所述训练样本集输入初始识别网络模型中,得到各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息;
根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到三元组损失,其中,所述三元组损失包括三元组类别损失和三元组ID损失;
根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到中心损失,其中,所述中心损失包括中心类别损失和中心ID损失;
通过预设分类损失函数,根据各所述样本图片的ID标注信息和各所述样本图片的ID预测标签信息,得到分类损失;
根据所述三元组损失、所述中心损失和所述分类损失,得到组合损失,并根据所述组合损失,对所述初始识别网络模型的参数进行调整,以得到更新的识别网络模型;
针对所述更新的识别网络模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
可选的,所述方法还包括:
获取待识别的第一图片和第二图片;
将所述第一图片和所述第二图片分别输入所述目标识别网络模型中,得到所述第一图片的ID特征向量和所述第二图片的ID特征向量;
通过预设相似度算法,根据所述第一图片的ID特征向量和所述第二图片的ID特征向量,得到所述第一图片和所述第二图片的第一ID相似度;
若所述第一ID相似度大于第二预设阈值,则确定所述第一图片的ID和所述第二图片的ID相同。
可选的,所述方法还包括:
获取待识别图片和图片库中包括的具有多种类别的示例图片,各所述示例图片的ID不同;
将所述待识别图片输入所述目标识别网络模型中,得到所述待识别图片的ID特征向量;
计算图片库中每一类别示例图片的ID综合特征向量,并通过预设相似度算法,根据所述待识别图片的ID特征向量与所述每一类别示例图片的ID综合特征向量,计算所述待识别图片和所述每一类别示例图片之间的第二ID相似度,将最大的所述第二ID相似度所对应的示例图片类别确定为目标类别;
通过预设相似度算法,根据所述待识别图片的ID特征向量与属于所述目标类别的各示例图片的ID特征向量,计算所述待识别图片和属于所述目标类别的各示例图片之间的第三ID相似度;将所述待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID。
可选的,所述目标识别网络模型包括:残差网络ResNet、MobileNet网络和GoogLeNet网络。
可选的,所述组合损失通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为所述组合损失,LossCls为所述分类损失,LTri(ID)为所述三元组ID损失,Lc(ID)为所述中心ID损失,LTri(Class)为所述三元组类别损失,LC(Class)为所述中心类别损失,λ1、λ2、λ3和λ4为损失系数。
可选的,所述预设分类损失函数为交叉熵损失函数。
根据第二方面,一种实施例中提供一种通用ID识别装置,所述装置包括:
第一获取模块,用于获取训练样本集,其中,所述训练样本集包括多种类别的样本图片和各所述样本图片的ID标注信息,所述ID标注信息用于标注各所述样本图片对应的ID,所述训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;
第二获取模块,用于将所述训练样本集输入初始识别网络模型中,得到各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息;
第三获取模块,用于根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到三元组损失,其中,所述三元组损失包括三元组类别损失和三元组ID损失;
第四获取模块,用于根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到中心损失,其中,所述中心损失包括中心类别损失和中心ID损失;
第五获取模块,用于通过预设分类损失函数,根据各所述样本图片的ID标注信息和各所述样本图片的ID预测标签信息,得到分类损失;
更新模块,用于根据所述三元组损失、所述中心损失和所述分类损失,得到组合损失,并根据所述组合损失,对所述初始识别网络模型的参数进行调整,以得到更新的识别网络模型;
第一确定模块,用于针对所述更新的识别网络模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
可选的,所述装置还包括:第二确定模块,用于获取待识别的第一图片和第二图片;将所述第一图片和所述第二图片分别输入所述目标识别网络模型中,得到所述第一图片的ID特征向量和所述第二图片的ID特征向量;通过预设相似度算法,根据所述第一图片的ID特征向量和所述第二图片的ID特征向量,得到所述第一图片和所述第二图片的第一ID相似度;若所述第一ID相似度大于第二预设阈值,则确定所述第一图片的ID和所述第二图片的ID相同。
可选的,所述装置还包括:第三确定模块,用于获取待识别图片和图片库中包括的具有多种类别的示例图片,各所述示例图片的ID不同;将所述待识别图片输入所述目标识别网络模型中,得到所述待识别图片的ID特征向量;计算图片库中每一类别示例图片的ID综合特征向量,并通过预设相似度算法,根据所述待识别图片的ID特征向量与所述每一类别示例图片的ID综合特征向量,计算所述待识别图片和所述每一类别示例图片之间的第二ID相似度,将最大的所述第二ID相似度所对应的示例图片类别确定为目标类别;通过预设相似度算法,根据所述待识别图片的ID特征向量与属于所述目标类别的各示例图片的ID特征向量,计算所述待识别图片和属于所述目标类别的各示例图片之间的第三ID相似度;将所述待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID。
可选的,所述目标识别网络模型包括:残差网络ResNet、MobileNet网络和GoogLeNet网络。
可选的,所述组合损失通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为所述组合损失,LossCls为所述分类损失,LTri(ID)为所述三元组ID损失,Lc(ID)为所述中心ID损失,LTri(Class)为所述三元组类别损失,LC(Class)为所述中心类别损失,λ1、λ2、λ3和λ4为损失系数。
可选的,所述预设分类损失函数为交叉熵损失函数。
根据第三方面,一种实施例中提供一种电子设备,包括:存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现上述第一方面中任一项所述的通用ID识别方法。
根据第四方面,一种实施例中提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现上述第一方面中任一项所述的通用ID识别方法。
本发明实施例提供一种通用ID识别方法、装置及设备,通过获取训练样本集,其中,训练样本集包括多种类别的样本图片和各样本图片的ID标注信息,ID标注信息用于标注各样本图片对应的ID,训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和各样本图片的ID预测标签信息;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到三元组损失,其中,三元组损失包括三元组类别损失和三元组ID损失;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到中心损失,其中,中心损失包括中心类别损失和中心ID损失;通过预设分类损失函数,根据各样本图片的ID标注信息和各样本图片的ID预测标签信息,得到分类损失;根据三元组损失、中心损失和分类损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型;针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。通过上述目标识别网络模型得到的各个类别的物体的特征向量满足同类别聚集,不同类别离散的分布,无需为每个ID识别任务通过专门的训练数据训练识别模型,也无需为新增类别的ID识别任务收集并标注大量数据,因此通过上述目标识别网络模型可以实现通用ID的识别,从而提高了ID识别模型的利用率和识别效率。
附图说明
图1为本发明实施例提供的一种通用ID识别方法的实施例一的流程示意图;
图2为本发明实施例提供的一种通用ID识别方法的实施例二的流程示意图;
图3为本发明实施例提供的一种通用ID识别方法的实施例三的流程示意图;
图4为本发明实施例提供的一种通用ID识别方法的实施例四的流程示意图;
图5为本发明实施例提供的一种特征向量分布的对比图;
图6为本发明实施例提供的一种通用ID识别装置的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
由于现有技术中,在人脸识别、行人重识别、车辆重识别、猪脸识别、奶牛识别等身份标识号识别任务中,每个ID识别任务都需要根据专门的训练数据训练识别模型,并且不同的识别任务需要分别训练不同的识别模型;新增类别的ID识别需要收集并标注大量数据,而进行ID标注的成本非常高且花费的时间较长,从而导致ID识别模型的利用率和识别效率较低。为了提高ID识别模型的利用率和识别效率,本发明实施例提供了一种通用ID识别方法、装置及设备,以下分别进行详细说明。
图1为本发明实施例提供的一种通用ID识别方法的实施例一的流程示意图,本发明实施例的执行主体为任意具有处理能力的设备。如图1所示,本实施例提供的通用ID识别方法可以包括:
S101,获取训练样本集。
其中,该训练样本集包括多种类别的样本图片和各样本图片的ID标注信息,ID标注信息用于标注各样本图片对应的ID,训练样本集中包括的每个类别的样本图片至少对应两个ID,并且每个ID至少对应两张样本图片。
举例说明,训练样本集中可以包括5种类别的样本图片,这5种类别分别为:人脸、行人、车辆、猪脸和奶牛。其中,人脸类别的样本图片有200张,这200张样本图片对应的ID数量为20,可以将1-20设置为这200张样本图片对应的ID,并且每个ID都对应10张样本图片;行人类别的样本图片有150张,这150张样本图片对应的ID数量为15,可以将21-35设置为这150张样本图片对应的ID,并且每个ID都对应10张样本图片;车辆类别的样本图片有100张,这100张样本图片对应的ID数量为10,可以将36-45设置为这100张样本图片对应的ID,并且36-45的ID所对应的样本图片的数量可以为2、9、10、8、11、4、16、10、13和17;猪脸类别的样本图片有80张,这80张样本图片对应的ID数量为7,可以将46-52设置为这80张样本图片对应的ID,并且46-52的ID所对应的样本图片的数量可以为13、7、10、12、9、15和14;奶牛类别的样本图片有50张,这50张样本图片对应的ID数量为10,可以将53-62设置为这50张样本图片对应的ID,并且53-62的ID所对应的样本图片的数量可以为5、3、5、8、5、2、5、5、5和7。
S102,将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和各样本图片的ID预测标签信息。
S103,根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到三元组损失。
其中,三元组损失包括三元组类别损失和三元组ID损失。这里的三元组(例如a、b和c)指的是a为从训练样本集中随机选取的一个样本,b为与a属于同一类别(或者对应同一ID)的样本,而c为与a属于不同类别(或者对应不同ID)的样本,可以将a和b叫作正样本对,将a和c叫作负样本对。
具体的,三元组损失可以通过下述公式得到:
LTri=[dp-dp+dp]+
其中,LTri为三元组损失,dp为正样本对的距离,dp是负样本对的距离,dp为正样本对的距离和负样本对的距离之间的最小的间隔(三元组损失的边界),在本实施例中,可以将α设置为0.3。上述公式中右下角的“+”表示:当“[]”内的值大于零的时候,取“[]”内的值为损失值;当“[]”内的值小于零的时候,损失值为0,即,[Z]+等于max(Z,0)。
在计算三元组类别损失时,正、负样本对可以根据类别进行区分,即,对应同类别为正样本,对应不同类别为负样本。例如,从训练样本集中随机选取一个样本A,然后从训练样本集中选取与A属于同一类别的样本B,再从训练样本集中选取与A属于不同类别的样本C,然后根据样本A、B和C的ID特征向量计算针对样本A的三元组类别损失。
在计算三元组ID损失时,正、负样本对可以根据得到的预测ID进行区分,即,对应同一预测ID为正样本,对应不同预测ID为负样本。例如,从训练样本集中随机选取一个样本a,然后从训练样本集中选取与a对应同一预测ID的样本b,再从训练样本集中选取与a对应不同预测ID的样本c,然后根据样本a、b和c的ID特征向量计算针对样本a的三元组ID损失。
具体实现时,可以将训练样本集分成等量的子集,例如可以将100万个样本分成1000份,每份1000个样本,这些子集就称为mini-batch,每次迭代可以计算1个子集内各样本的三元组类别损失和三元组ID损失,然后对该子集中针对每一个样本计算得到的三元组类别损失和三元组ID损失分别进行求和,得到一次迭代中的三元组类别损失和三元组ID损失。
S104,根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到中心损失。
其中,中心损失包括中心类别损失和中心ID损失。
具体的,三元组损失可以通过下述公式得到:
Figure BDA0003218369330000071
其中,LC为三元组损失,yj为mini-batch中第j个样本图片的类别(ID),
Figure BDA0003218369330000072
为mini-batch中第j个样本图片的ID特征向量,
Figure BDA0003218369330000081
为yj类别(ID)的深度特征中心,B为mini-batch的大小。
在计算中心类别损失时,可以从mini-batch中随机选取一个样本D,然后通过现有的方式,计算样本D所属类别的深度特征中心,再计算得到针对样本D的中心类别损失,以此类推得到mini-batch中各样本的中心类别损失,然后求和得到一次迭代中的中心类别损失。
在计算中心ID损失时,可以从mini-batch中随机选取一个样本d,然后通过现有的方式,计算样本d对应ID的深度特征中心,再计算得到针对样本d的中心ID损失,以此类推得到mini-batch中各样本的中心ID损失,然后求和得到一次迭代中的中心ID损失。
S105,通过预设分类损失函数,根据各样本图片的ID标注信息和各样本图片的ID预测标签信息,得到分类损失。
具体实现时,预设分类损失函数可以为交叉熵损失函数。
S106,根据三元组损失、中心损失和分类损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型。
具体的,组合损失可以通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为组合损失,LossCls为分类损失,LTri(ID)为三元组ID损失,Lc(ID)为中心ID损失,LTri(Class)为三元组类别损失,LC(Class)为中心类别损失,λ1、λ2、λ3和λ4为损失系数。具体的,初始λ1、λ2、λ3和λ4可以都设置为1,后续可以根据网络训练效果调整某单项损失在总体中所占比重。
S107,针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
具体实现时,目标识别网络模型可以为残差网络ResNet、MobileNet网络或者GoogLeNet网络。其中,残差网络ResNet是一种卷积神经网络,它的特点是容易优化,并且能够通过增加相当的深度来提高准确率,其内部的残差块使用了跳跃连接,缓解了在深度神经网络中增加深度所带来的梯度消失问题。MobileNet网络是一种基于流线型的架构并使用深度可分离的卷积来构建的轻量级的深层神经网络,用于移动和嵌入式视觉应用。GoogLeNet网络是一种深度神经网络,它可以在增加网络深度和宽度的同时减少参数,GoogLeNet网络可以更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。
本发明实施例提供的通用ID识别方法,通过获取训练样本集,其中,训练样本集包括多种类别的样本图片和各样本图片的ID标注信息,ID标注信息用于标注各样本图片对应的ID,训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和各样本图片的ID预测标签信息;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到三元组损失,其中,三元组损失包括三元组类别损失和三元组ID损失;根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到中心损失,其中,中心损失包括中心类别损失和中心ID损失;通过预设分类损失函数,根据各样本图片的ID标注信息和各样本图片的ID预测标签信息,得到分类损失;根据三元组损失、中心损失和分类损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型;针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。通过上述目标识别网络模型得到的各个类别的物体的特征向量满足同类别聚集,不同类别离散的分布,无需为每个ID识别任务通过专门的训练数据训练识别模型,也无需为新增类别的ID识别任务收集并标注大量数据,因此通过上述目标识别网络模型可以实现通用ID的识别,从而提高了ID识别模型的利用率和识别效率。
图2为本发明实施例提供的一种通用ID识别方法的实施例二的流程示意图,如图2所示,在通过执行上述实施例一中的S107得到目标识别网络模型之后,本实施例提供的通用ID识别方法还可以包括:
S201,获取待识别的第一图片和第二图片。
S202,将第一图片和第二图片分别输入目标识别网络模型中,得到第一图片的ID特征向量和第二图片的ID特征向量。
S203,通过预设相似度算法,根据第一图片的ID特征向量和第二图片的ID特征向量,得到第一图片和第二图片的第一ID相似度。
具体实现时,可以通过余弦距离公式,根据第一图片的ID特征向量和第二图片的ID特征向量,得到第一图片和第二图片的第一ID相似度。
S204,若第一ID相似度大于第二预设阈值,则确定第一图片的ID和第二图片的ID相同。
本发明实施例提供的通用ID识别方法,通过获取待识别的第一图片和第二图片;将第一图片和第二图片分别输入目标识别网络模型中,得到第一图片的ID特征向量和第二图片的ID特征向量;通过预设相似度算法,根据第一图片的ID特征向量和第二图片的ID特征向量,得到第一图片和第二图片的第一ID相似度;若第一ID相似度大于第二预设阈值,则确定第一图片的ID和第二图片的ID相同,从而可以区分两个待识别的图片是否对应于同一个ID。
图3为本发明实施例提供的一种通用ID识别方法的实施例三的流程示意图,如图3所示,在通过执行上述实施例一中的S107得到目标识别网络模型之后,本实施例提供的通用ID识别方法还可以包括:
S301,获取待识别图片和图片库中包括的具有多种类别的示例图片。
其中,图片库中各示例图片的ID不同。
S302,将待识别图片输入目标识别网络模型中,得到待识别图片的ID特征向量。
S303,计算图片库中每一类别示例图片的ID综合特征向量。
具体实现时,可以通过现有的方法计算可以代表每一类别图片的ID特征向量。例如,根据每一类别各示例图片的ID特征向量,计算该类别所有示例图片的平均ID特征向量,作为该类别的ID综合特征向量。
S304,通过预设相似度算法,根据待识别图片的ID特征向量与每一类别示例图片的ID综合特征向量,计算待识别图片和每一类别示例图片之间的第二ID相似度。
具体实现时,可以通过余弦距离公式,根据待识别图片的ID特征向量与每一类别示例图片的ID综合特征向量,计算待识别图片和每一类别示例图片之间的第二ID相似度。
S305,将最大的第二ID相似度所对应的示例图片类别确定为目标类别。
S306,通过预设相似度算法,根据待识别图片的ID特征向量与属于目标类别的各示例图片的ID特征向量,计算待识别图片和属于目标类别的各示例图片之间的第三ID相似度。
假设目标类别为车辆类别,那么可以通过余弦距离公式,计算待识别图片和属于车辆类别的各示例图片之间的第三ID相似度。
S307,将待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID。
本发明实施例提供的通用ID识别方法,通过获取待识别图片和图片库中包括的具有多种类别的示例图片,各示例图片的ID不同;将待识别图片输入目标识别网络模型中,得到待识别图片的ID特征向量;计算图片库中每一类别示例图片的ID综合特征向量,并通过预设相似度算法,根据待识别图片的ID特征向量与每一类别示例图片的ID综合特征向量,计算待识别图片和每一类别示例图片之间的第二ID相似度,将最大的第二ID相似度所对应的示例图片类别确定为目标类别;通过预设相似度算法,根据待识别图片的ID特征向量与属于目标类别的各示例图片的ID特征向量,计算待识别图片和属于目标类别的各示例图片之间的第三ID相似度;将待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID,可以快速且准确地确定待识别的图片的ID。
下面以一个具体的实现方式为例对本发明实施例提供的通用ID识别方法进行说明。图4为本发明实施例提供的一种通用ID识别方法的实施例四的流程示意图,如图4所示,本实施例提供的通用ID识别方法还可以包括:
S401,确定初始识别网络模型。
具体实现时,初始识别网络模型可以选择ResNet50,可以在ImageNet上预训练好ResNet50参数,并将最后的输出设置为ID预测标签信息。
S402,获取训练样本集。
具体实现时,可以将训练样本集分成等量的子集,每个子集包括L*P*K(Batch-size)张样本图片。其中,L为训练样本集中选取的类别数,可设置为2-16;P为每个类别取的ID数,可以设置为2-16;K为每个ID取的图片数,可以设置为2-16。具体计算时,可以根据执行主体的计算资源选择合适的Batch-size。
S403,将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和ID预测标签。
S404,根据ID特征向量和ID预测标签,计算三元组损失和中心损失;并根据ID预测标签,计算交叉熵损失。
S405,根据三元组损失、中心损失和交叉熵损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型。
通过上述组合损失,可以使得模型训练时的特征向量逐渐接近如图5右侧所示的分布方式。在图5的左侧,在特征向量的初始分布中,多种类别的特征杂乱无章地聚集在一起,通过本发明实施例的通用ID识别网络训练后,各个特征向量满足同类别聚集,不同类别离散的分布。
S406,针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
可选的,对任意的两个物体,可以通过上述目标识别网络模型得到其特征向量,计算两个特征向量的相似度,若相似度超过特定阈值,则两个物体为同一ID;若相似度低于特定阈值,则两个物体为不同ID,从而实现通用ID识别。
图6为本发明实施例提供的一种通用ID识别装置的结构示意图,如图6所示,该通用ID识别装置60可以包括:
第一获取模块610,可以用于获取训练样本集,其中,训练样本集包括多种类别的样本图片和各样本图片的ID标注信息,ID标注信息用于标注各样本图片对应的ID,训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数。
第二获取模块620,可以用于将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和各样本图片的ID预测标签信息。
第三获取模块630,可以用于根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到三元组损失,其中,三元组损失包括三元组类别损失和三元组ID损失。
第四获取模块640,可以用于根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到中心损失,其中,中心损失包括中心类别损失和中心ID损失。
第五获取模块650,可以用于通过预设分类损失函数,根据各样本图片的ID标注信息和各样本图片的ID预测标签信息,得到分类损失;
更新模块660,可以用于根据三元组损失、中心损失和分类损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型。
第一确定模块670,可以用于针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
本发明实施例提供的通用ID识别装置,通过第一获取模块,获取训练样本集,其中,训练样本集包括多种类别的样本图片和各样本图片的ID标注信息,ID标注信息用于标注各样本图片对应的ID,训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;通过第二获取模块,将训练样本集输入初始识别网络模型中,得到各样本图片的ID特征向量和各样本图片的ID预测标签信息;通过第三获取模块,根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到三元组损失,其中,三元组损失包括三元组类别损失和三元组ID损失;通过第四获取模块,根据各样本图片的ID特征向量和各样本图片的ID预测标签信息,得到中心损失,其中,中心损失包括中心类别损失和中心ID损失;通过第五获取模块,通过预设分类损失函数,根据各样本图片的ID标注信息和各样本图片的ID预测标签信息,得到分类损失;通过更新模块,根据三元组损失、中心损失和分类损失,得到组合损失,并根据组合损失,对初始识别网络模型的参数进行调整,以得到更新的识别网络模型;通过第一确定模块,针对更新的识别网络模型,迭代上述训练过程,直至组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。通过上述目标识别网络模型得到的各个类别的物体的特征向量满足同类别聚集,不同类别离散的分布,无需为每个ID识别任务通过专门的训练数据训练识别模型,也无需为新增类别的ID识别任务收集并标注大量数据,因此通过上述目标识别网络模型可以实现通用ID的识别,从而提高了ID识别模型的利用率和识别效率。
可选的,上述装置还可以包括:第二确定模块(图中未示出),用于获取待识别的第一图片和第二图片;将第一图片和第二图片分别输入目标识别网络模型中,得到第一图片的ID特征向量和第二图片的ID特征向量;通过预设相似度算法,根据第一图片的ID特征向量和第二图片的ID特征向量,得到第一图片和第二图片的第一ID相似度;若第一ID相似度大于第二预设阈值,则确定第一图片的ID和第二图片的ID相同。
可选的,上述装置还可以包括:第三确定模块(图中未示出),用于获取待识别图片和图片库中包括的具有多种类别的示例图片,各示例图片的ID不同;将待识别图片输入目标识别网络模型中,得到待识别图片的ID特征向量;计算图片库中每一类别示例图片的ID综合特征向量,并通过预设相似度算法,根据待识别图片的ID特征向量与每一类别示例图片的ID综合特征向量,计算待识别图片和每一类别示例图片之间的第二ID相似度,将最大的第二ID相似度所对应的示例图片类别确定为目标类别;通过预设相似度算法,根据待识别图片的ID特征向量与属于目标类别的各示例图片的ID特征向量,计算待识别图片和属于目标类别的各示例图片之间的第三ID相似度;将待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID。
可选的,上述目标识别网络模型可以包括:残差网络ResNet、MobileNet网络和GoogLeNet网络。
可选的,上述组合损失可以通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为组合损失,LossCls为分类损失,LTri(ID)为三元组ID损失,Lc(ID)为中心ID损失,LTri(Class)为三元组类别损失,LC(Class)为中心类别损失,λ1、λ2、λ3和λ4为损失系数。
可选的,上述预设分类损失函数可以为交叉熵损失函数。
另外,相应于上述实施例所提供的通用ID识别方法,本发明实施例还提供了一种电子设备,该电子设备可以包括:存储器,用于存储程序;处理器,用于通过执行存储器存储的程序以实现本发明实施例提供的通用ID识别方法的所有步骤。
另外,相应于上述实施例所提供的通用ID识别方法,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时实现本发明实施例的通用ID识别方法的所有步骤。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种通用ID识别方法,其特征在于,所述方法包括:
获取训练样本集,其中,所述训练样本集包括多种类别的样本图片和各所述样本图片的ID标注信息,所述ID标注信息用于标注各所述样本图片对应的ID,所述训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;
将所述训练样本集输入初始识别网络模型中,得到各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息;
根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到三元组损失,其中,所述三元组损失包括三元组类别损失和三元组ID损失;
根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到中心损失,其中,所述中心损失包括中心类别损失和中心ID损失;
通过预设分类损失函数,根据各所述样本图片的ID标注信息和各所述样本图片的ID预测标签信息,得到分类损失;
根据所述三元组损失、所述中心损失和所述分类损失,得到组合损失,并根据所述组合损失,对所述初始识别网络模型的参数进行调整,以得到更新的识别网络模型;
针对所述更新的识别网络模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取待识别的第一图片和第二图片;
将所述第一图片和所述第二图片分别输入所述目标识别网络模型中,得到所述第一图片的ID特征向量和所述第二图片的ID特征向量;
通过预设相似度算法,根据所述第一图片的ID特征向量和所述第二图片的ID特征向量,得到所述第一图片和所述第二图片的第一ID相似度;
若所述第一ID相似度大于第二预设阈值,则确定所述第一图片的ID和所述第二图片的ID相同。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取待识别图片和图片库中包括的具有多种类别的示例图片,各所述示例图片的ID不同;
将所述待识别图片输入所述目标识别网络模型中,得到所述待识别图片的ID特征向量;
计算图片库中每一类别示例图片的ID综合特征向量,并通过预设相似度算法,根据所述待识别图片的ID特征向量与所述每一类别示例图片的ID综合特征向量,计算所述待识别图片和所述每一类别示例图片之间的第二ID相似度,将最大的所述第二ID相似度所对应的示例图片类别确定为目标类别;
通过预设相似度算法,根据所述待识别图片的ID特征向量与属于所述目标类别的各示例图片的ID特征向量,计算所述待识别图片和属于所述目标类别的各示例图片之间的第三ID相似度;将所述待识别图片的ID确定为最大的第三ID相似度所对应的示例图片的ID。
4.如权利要求1所述的方法,其特征在于,所述目标识别网络模型包括:残差网络ResNet、MobileNet网络和GoogLeNet网络。
5.如权利要求1所述的方法,其特征在于,所述组合损失通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为所述组合损失,LossCls为所述分类损失,LTri(ID)为所述三元组ID损失,Lc(ID)为所述中心ID损失,LTri(Class)为所述三元组类别损失,LC(Class)为所述中心类别损失,λ1、λ2、λ3和λ4为损失系数。
6.如权利要求1所述的方法,其特征在于,所述预设分类损失函数为交叉熵损失函数。
7.一种通用ID识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取训练样本集,其中,所述训练样本集包括多种类别的样本图片和各所述样本图片的ID标注信息,所述ID标注信息用于标注各所述样本图片对应的ID,所述训练样本集中包括的每个类别的样本图片对应的ID数量以及每个ID对应的样本图片数量均为大于1的正整数;
第二获取模块,用于将所述训练样本集输入初始识别网络模型中,得到各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息;
第三获取模块,用于根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到三元组损失,其中,所述三元组损失包括三元组类别损失和三元组ID损失;
第四获取模块,用于根据各所述样本图片的ID特征向量和各所述样本图片的ID预测标签信息,得到中心损失,其中,所述中心损失包括中心类别损失和中心ID损失;
第五获取模块,用于通过预设分类损失函数,根据各所述样本图片的ID标注信息和各所述样本图片的ID预测标签信息,得到分类损失;
更新模块,用于根据所述三元组损失、所述中心损失和所述分类损失,得到组合损失,并根据所述组合损失,对所述初始识别网络模型的参数进行调整,以得到更新的识别网络模型;
第一确定模块,用于针对所述更新的识别网络模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别网络模型作为目标识别网络模型。
8.如权利要求7所述的装置,其特征在于,所述组合损失通过下述公式得到:
Loss=LossCls1*LTri(ID)+λ2*Lc(ID)+λ3*LTri(Class)+λ4*LC(Class)
其中,Loss为所述组合损失,LossCls为所述分类损失,LTri(ID)为所述三元组ID损失,Lc(ID)为所述中心ID损失,LTri(Class)为所述三元组类别损失,LC(Class)为所述中心类别损失,λ1、λ2、λ3和λ4为损失系数。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述介质上存储有程序,所述程序能够被处理器执行以实现如权利要求1-6中任一项所述的方法。
CN202110950191.8A 2021-08-18 通用id识别方法、装置及设备 Active CN113807401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110950191.8A CN113807401B (zh) 2021-08-18 通用id识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110950191.8A CN113807401B (zh) 2021-08-18 通用id识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN113807401A true CN113807401A (zh) 2021-12-17
CN113807401B CN113807401B (zh) 2024-05-24

Family

ID=

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784166A (zh) * 2018-12-13 2019-05-21 北京飞搜科技有限公司 行人重识别的方法及装置
KR20190140824A (ko) * 2018-05-31 2019-12-20 한국과학기술원 트리플릿 기반의 손실함수를 활용한 순서가 있는 분류문제를 위한 딥러닝 모델 학습 방법 및 장치
CN111461061A (zh) * 2020-04-23 2020-07-28 湖北工业大学 一种基于相机风格适应的行人重识别方法
CN111507217A (zh) * 2020-04-08 2020-08-07 南京邮电大学 一种基于局部分辨特征融合的行人重识别方法
CN111667050A (zh) * 2020-04-21 2020-09-15 佳都新太科技股份有限公司 度量学习方法、装置、设备及存储介质
CN111814584A (zh) * 2020-06-18 2020-10-23 北京交通大学 基于多中心度量损失的多视角环境下车辆重识别方法
CN112183468A (zh) * 2020-10-27 2021-01-05 南京信息工程大学 一种基于多注意力联合多级特征的行人再识别方法
CN112800876A (zh) * 2021-01-14 2021-05-14 北京交通大学 一种用于重识别的超球面特征嵌入方法及系统
CN113065516A (zh) * 2021-04-22 2021-07-02 中国矿业大学 一种基于样本分离的无监督行人重识别系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190140824A (ko) * 2018-05-31 2019-12-20 한국과학기술원 트리플릿 기반의 손실함수를 활용한 순서가 있는 분류문제를 위한 딥러닝 모델 학습 방법 및 장치
CN109784166A (zh) * 2018-12-13 2019-05-21 北京飞搜科技有限公司 行人重识别的方法及装置
CN111507217A (zh) * 2020-04-08 2020-08-07 南京邮电大学 一种基于局部分辨特征融合的行人重识别方法
CN111667050A (zh) * 2020-04-21 2020-09-15 佳都新太科技股份有限公司 度量学习方法、装置、设备及存储介质
CN111461061A (zh) * 2020-04-23 2020-07-28 湖北工业大学 一种基于相机风格适应的行人重识别方法
CN111814584A (zh) * 2020-06-18 2020-10-23 北京交通大学 基于多中心度量损失的多视角环境下车辆重识别方法
CN112183468A (zh) * 2020-10-27 2021-01-05 南京信息工程大学 一种基于多注意力联合多级特征的行人再识别方法
CN112800876A (zh) * 2021-01-14 2021-05-14 北京交通大学 一种用于重识别的超球面特征嵌入方法及系统
CN113065516A (zh) * 2021-04-22 2021-07-02 中国矿业大学 一种基于样本分离的无监督行人重识别系统及方法

Similar Documents

Publication Publication Date Title
CN111079780B (zh) 空间图卷积网络的训练方法、电子设备及存储介质
CN112184508B (zh) 一种用于图像处理的学生模型的训练方法及装置
CN110633745A (zh) 一种基于人工智能的图像分类训练方法、装置及存储介质
CN106228188A (zh) 聚类方法、装置及电子设备
EP3136292A1 (en) Method and device for classifying an object of an image and corresponding computer program product and computer-readable medium
CN111243601B (zh) 声纹聚类方法、装置、电子设备和计算机可读存储介质
CN110929836B (zh) 神经网络训练及图像处理方法和装置、电子设备、介质
CN113344016A (zh) 深度迁移学习方法、装置、电子设备及存储介质
CN105354228B (zh) 相似图搜索方法及装置
CN112257689A (zh) 人脸识别模型的训练和识别方法、存储介质及相关设备
CN113807401A (zh) 通用id识别方法、装置及设备
CN111428567A (zh) 一种基于仿射多任务回归的行人跟踪系统及方法
CN113807401B (zh) 通用id识别方法、装置及设备
CN115795355A (zh) 一种分类模型训练方法、装置及设备
CN105760442A (zh) 基于数据库邻域关系的图像特征增强方法
CN112115996B (zh) 图像数据的处理方法、装置、设备及存储介质
CN115439878A (zh) 目标重识别模型抗遗忘训练方法、目标重识别方法及装置
CN112906824B (zh) 车辆聚类方法、系统、设备及存储介质
CN114494809A (zh) 特征提取模型优化方法、装置及电子设备
CN110928987B (zh) 基于神经网络混合模型的法律条文检索方法及相关设备
CN114462526A (zh) 一种分类模型训练方法、装置、计算机设备及存储介质
CN111178292A (zh) 一种车型识别方法、装置及设备
CN112733067B (zh) 一种面向机器人目标检测算法的数据集选择方法
CN112738724A (zh) 一种区域目标人群的精准识别方法、装置、设备和介质
CN110852206A (zh) 一种联合全局特征和局部特征的场景识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant