CN112329833A - 一种基于球面嵌入的图像度量学习方法 - Google Patents

一种基于球面嵌入的图像度量学习方法 Download PDF

Info

Publication number
CN112329833A
CN112329833A CN202011171940.9A CN202011171940A CN112329833A CN 112329833 A CN112329833 A CN 112329833A CN 202011171940 A CN202011171940 A CN 202011171940A CN 112329833 A CN112329833 A CN 112329833A
Authority
CN
China
Prior art keywords
image
embedding
learning
images
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011171940.9A
Other languages
English (en)
Other versions
CN112329833B (zh
Inventor
张鼎懿
李英明
张仲非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011171940.9A priority Critical patent/CN112329833B/zh
Publication of CN112329833A publication Critical patent/CN112329833A/zh
Application granted granted Critical
Publication of CN112329833B publication Critical patent/CN112329833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于球面嵌入的图像度量学习方法,用于输出细粒度图像间的相似度,如输入两张商品图像,该算法会输出它们的相似程度,用位于[0,1]的浮点数表示。具体包括如下步骤:获取用于训练深度度量学习模型的图像数据集;利用图像数据集训练预先定义好的深度神经网络,优化目标是度量学习损失和球面嵌入约束;利用训练好的模型输出给定图像对的相似度。本发明适用于真实图像场景的深度度量学习,面对各种不同种类的细粒度图像(如商品、汽车、时装、人脸),以及图像中可能存在的光照、姿态、尺度变化都能得到较为鲁棒的结果。

Description

一种基于球面嵌入的图像度量学习方法
技术领域
本发明属于计算机视觉领域,特别地涉及一种基于球面嵌入的图像度量学习方法。
背景技术
度量学习的目标是学习一个特征(嵌入)空间,使得不同图像映射到这个空间后,语义相近的图像在其中的距离较近,而语义不同的图像在其中的距离较远。近年来,随着深度学习的发展,深度度量学习应运而生,这种方法采用一个深度神经网络作为图像到特征(嵌入)的映射函数,极大的提高了度量学习的效果。当我们得到一个合适的映射函数后,便可以很方便的衡量两张给定图像的相似度,从而处理很多视觉理解任务,例如细粒度图像检索和人脸识别。在深度度量学习任务中,一个热点方向是设计一个效果更优的损失函数,使得训练得到的深度度量学习模型对不同图像具有更好的鉴别力。一系列基于图像样本对的损失函数被提出,如对比损失、三元组损失、N对损失、多相似度损失,它们的构成元素都是一个批量中不同图像样本对之间的相似度。
理论上,我们可以采用欧式距离或角度距离(归一化欧式距离或余弦距离都可以称为角度距离)来衡量两个特征(嵌入)在特征(嵌入)空间中的相似度。然而,在现有的深度度量学习损失函数中,我们通常采用角度距离,这样做一方面是为了解耦特征(嵌入)的L2范数和方向信息,以便于在损失函数中只优化方向信息,另一方面是为了保持训练和测试度量的一致性。但是,这一种做法也有它固有的缺点,即忽视了特征(嵌入)的L2范数在梯度计算中的重要性。例如,我们考虑两个特征(嵌入)fi和fj之间的余弦距离cosθij对其中一个特征(嵌入)fi的梯度
Figure BDA0002747568310000021
我们可以看到fi的L2范数||fi||2对梯度大小起着重要的缩放作用。当我们使用损失函数优化角度距离时,我们希望不同特征(嵌入)的L2范数大小相似,以使得不同特征(嵌入)的方向都能得到较为均衡的更新。但是,现有的损失函数无法在训练过程中保证这一点,不同特征(嵌入)的L2范数分布仍然具有较大的方差。于是,在深度神经网络的训练中,梯度更新的过程将变得不稳定,模型的快速收敛也会受其影响,例如,如果一个特征(嵌入)的L2范数较大,那么它的方向更新速度将会减慢。
发明内容
为解决上述问题,本发明的目的在于提供一种基于球面嵌入的图像度量学习方法,来为各种图像学习一个更有鉴别力的特征(嵌入)空间。本方法自适应地调节不同特征(嵌入)的L2范数,使得不同特征(嵌入)大致位于同一个超球面的表面,来得到更为均衡的方向更新。对于调节方式,本方法灵活地逐步减小不同特征(嵌入)的L2范数分布的方差,而不是简单地将它们的L2范数都约束到一个固定值,减少了一个需要调节的超参数,提高了方法的易用性。此外,本方法能很好地与批量训练方式结合使用,增加的额外计算量可以忽略不计,能与各种现有的度量学习损失函数联合使用,可以有效地提升现有损失函数的效果,并带来更快的模型收敛速度。
为实现上述目的,本发明的技术方案为:
一种基于球面嵌入的图像度量学习方法,包括以下步骤:
S1、获取用于训练深度度量学习模型的图像数据集;
S2、利用图像数据集训练预先定义好的深度神经网络,优化目标是度量学习损失和球面嵌入约束;
S3、利用训练好的深度神经网络模型输出给定图像对的相似度。
进一步的,步骤S1中,所述的图像数据集为{(x1,y1),(x2,y2),…,(xN,yN)},其中N为数据集中的图像总数,xi和yi分别表示第i张图像及其对应的类标签,yi∈{1,...,C},C表示类别总数,每一类都包含多张图像。
进一步的,步骤S2具体包括:
S21、在训练深度神经网络时采用批量处理的方式,首先从图像数据集中随机采样一个批量的图像样本
Figure BDA0002747568310000031
其中批量大小Nbs预先给定;
S22、将B中的图像输入深度神经网络M得到对应的特征(嵌入)f,然后组成正负样本对集合{(fi,fj,lij),...},其中fi和fj分别表示B中两张不同图像xi和xj对应的特征(嵌入),lij用于指示两张图像xi和yi是否属于同一个类,当yi=yj时lij=1,当yi≠yj时lij=0;
S23、使用所述正负样本对集合构成度量学习损失函数Lmetric,同时使用一个批量中的所有特征(嵌入)构成球面嵌入约束
Figure BDA0002747568310000032
其中μ为超球面半径超参数;
S24、基于所述度量学习损失函数和球面嵌入约束得到总的损失函数为
L=Lmetric+η*Lsec
其中η是预先设置的权重参数,用来平衡两种损失函数的贡献;
S25、根据得到的总的损失函数,使用Adam优化器或带动量的随机梯度下降优化器,以及反向传播算法训练深度神经网络;
S26、重复步骤S21至S25直至模型收敛。
可选的,步骤S23中,所述度量学习损失函数Lmetric
Figure BDA0002747568310000033
其中λ为给定的间隔超参数;或者为
Figure BDA0002747568310000034
其中λ为给定的间隔超参数;或者为
Figure BDA0002747568310000041
其中s是给定的缩放超参数;或者为
Figure BDA0002747568310000042
其中α和β是给定的缩放超参数,λ是给定的间隔超参数。
可选的,步骤S23中,所述超球面半径超参数μ的计算方式为当前批量中所有特征(嵌入)的L2范数平均值
Figure BDA0002747568310000043
可选的,步骤S23中,所述超球面半径超参数μ的计算方式为维持一个全局记录,并使用指数滑动平均方法来综合历史批量中特征(嵌入)的L2范数平均值
Figure BDA0002747568310000044
其中ρ∈[0,1]是预先设置的更新动量。
进一步的,步骤S3中,计算给定的两张图像xa和xb相似度的方法为:将xa和xb分别输入训练好的深度神经网络M,得到与它们相对应的特征(嵌入)fa和fb,然后计算两个特征(嵌入)间的余弦相似度
Figure BDA0002747568310000045
即为两张图片间的相似度。
本发明的基于球面嵌入的图像度量学习方法,相比于现有的图像度量学习方法,具有以下有益效果:
首先,本方法自适应地调节不同特征(嵌入)的L2范数,使得不同特征(嵌入)大致位于同一个超球面的表面,能够缓解现有度量学习方法中不同特征(嵌入)方向更新速度不均衡的问题。
其次,本方法灵活地逐步减小不同特征(嵌入)的L2范数分布的方差,而不是将它们的L2范数都约束到一个固定值,减少了一个需要调节的超参数,能方便的与现有的损失函数相结合,为特征(嵌入)空间的学习提供正则约束,有效提升现有损失函数的效果,并带来更快的模型收敛速度。
本发明的基于球面嵌入的图像度量学习方法在大规模商品图像检索和人脸识别等系统中具有良好的应用价值,能够有效提高图像检索的性能。例如,在搭建大规模商品图像检索系统时,本发明的图像度量学习方法能够加快模型训练的收敛速度,同时提高检索出语义相似商品图像的准确率,从而优化商品检索系统的使用体验;在人脸识别系统中,本发明的图像度量学习方法能够更准确的衡量两张人脸图像的相似度,从而提高基于人脸识别的安防系统的安全性。
附图说明
图1为本发明的基于球面嵌入的图像度量学习方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参考图1,在本发明的较佳实施例中,基于球面嵌入的图像度量学习方法,包括以下步骤:
首先,获取用于训练深度度量学习模型的图像数据集。所述的图像数据集为{(x1,y1),(x2,y2),...,(xN,yN)},其中N为数据集中的图像总数,xi和yi分别表示第i张图像及其对应的类标签,yi∈{1,...,C},C表示类别总数,每一类都包含多张图像。
其次,利用图像数据集训练预先定义好的深度神经网络,优化目标是度量学习损失和球面嵌入约束。具体包括如下步骤:
第一步,在训练深度神经网络时采用批量处理的方式,首先从图像数据集中随机采样一个批量的图像样本
Figure BDA0002747568310000061
其中批量大小Nbs预先给定。以PK采样为例,它的具体步骤为首先随机采样P个不同的类标签,再从每一类中随机采样K张不同的图像,来组成一个批量的图像样本B:
第二步,将B中的图像输入深度神经网络M得到对应的特征(嵌入)f,然后组成正负样本对集合{(fi,fj,lij),...},其中fi和fj分别表示B中两张不同图像xi和xj对应的特征(嵌入),lij用于指示两张图像xi和yi是否属于同一个类,当yi=yj时lij=1,当yi≠yj时lij=0;
第三步,使用正负样本对集合构成度量学习损失函数Lmetric,以对比损失为例,它的具体形式为
Figure BDA0002747568310000062
其中λ为预先设置的间隔超参数;
或者,在另外的实施方式中,学习损失函数Lmetric也可以是
Figure BDA0002747568310000063
其中λ为给定的间隔超参数;或者也可以是
Figure BDA0002747568310000064
其中s是给定的缩放超参数;或者也可以是
Figure BDA0002747568310000071
其中α和β是给定的缩放超参数,λ是给定的间隔超参数。
同时使用一个批量中的所有特征(嵌入)构成球面嵌入约束
Figure BDA0002747568310000072
其中μ有两种计算方式。第一种计算方式为当前批量中所有特征(嵌入)的L2范数平均值
Figure BDA0002747568310000073
μ的第二种计算方式为维持一个全局记录,并使用指数滑动平均方法来综合历史批量中特征(嵌入)的L2范数平均值
Figure BDA0002747568310000074
其中ρ∈[0,1]是预先设置的更新动量;于是总的损失函数为
L=Lmetric+η*Lsec
其中η是预先设置的权重参数,用来平衡两种损失函数的贡献;
第四步,根据得到的损失函数,使用Adam优化器或带动量的随机梯度下降优化器,以及反向传播算法训练深度神经网络;
第五步,重复步骤S21至S24直至模型收敛。
最后,利用训练好的深度神经网络模型输出给定图像对的相似度。具体的,计算给定的两张图像xa和xb相似度的方法为:将xa和xb分别输入训练好的深度神经网络M,得到与它们相对应的特征(嵌入)fa和fb,然后计算两个特征(嵌入)间的余弦相似度
Figure BDA0002747568310000081
即为两张图片间的相似度。
通过以上技术方案,本发明实施例基于深度学习技术发展了一种图像度量学习方法。本发明引入了球面嵌入约束,自适应地调节不同特征(嵌入)的L2范数分布,使不同特征(嵌入)具有逐步接近的L2范数,从而优化了特征(嵌入)空间的整体结构,使得不同图像间的相似度可以得到更为准确地衡量,也优化了图像检索的效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于球面嵌入的图像度量学习方法,其特征在于,包括以下步骤:
S1、获取用于训练深度度量学习模型的图像数据集;
S2、利用图像数据集训练预先定义好的深度神经网络,优化目标是度量学习损失和球面嵌入约束;
S3、利用训练好的深度神经网络模型输出给定图像对的相似度。
2.如权利要求1所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S1中,所述的图像数据集为{(x1,y1),(x2,y2),…,(xN,yN)},其中N为数据集中的图像总数,xi和yi分别表示第i张图像及其对应的类标签,yi∈{1,…,C},C表示类别总数,每一类都包含多张图像。
3.如权利要求2所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S2具体包括:
S21、在训练深度神经网络时采用批量处理的方式,首先从图像数据集中随机采样一个批量的图像样本
Figure FDA0002747568300000011
其中批量大小Nbs预先给定;
S22、将B中的图像输入深度神经网络M得到对应的特征(嵌入)f,然后组成正负样本对集合{(fi,fj,lij),…},其中fi和fj分别表示B中两张不同图像xi和xj对应的特征(嵌入),lij用于指示两张图像xi和yi是否属于同一个类,当yi=yj时lij=1,当yi≠yj时lij=0;
S23、使用所述正负样本对集合构成度量学习损失函数Lmetric,同时使用一个批量中的所有特征(嵌入)构成球面嵌入约束
Figure FDA0002747568300000012
其中μ为超球面半径超参数;
S24、基于所述度量学习损失函数和球面嵌入约束得到总的损失函数为
L=Lmetric+η*Lsec
其中η是预先设置的权重参数,用来平衡两种损失函数的贡献;
S25、根据得到的总的损失函数,使用Adam优化器或带动量的随机梯度下降优化器,以及反向传播算法训练深度神经网络;
S26、重复步骤S21至S25直至模型收敛。
4.如权利要求3所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S23中,所述度量学习损失函数Lmetric
Figure FDA0002747568300000021
其中λ为给定的间隔超参数;或者为
Figure FDA0002747568300000022
其中λ为给定的间隔超参数;或者为
Figure FDA0002747568300000023
其中s是给定的缩放超参数;或者为
Figure FDA0002747568300000024
其中α和β是给定的缩放超参数,λ是给定的间隔超参数。
5.如权利要求3所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S23中,所述超球面半径超参数μ的计算方式为当前批量中所有特征(嵌入)的L2范数平均值
Figure FDA0002747568300000031
6.如权利要求3所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S23中,所述超球面半径超参数μ的计算方式为维持一个全局记录,并使用指数滑动平均方法来综合历史批量中特征(嵌入)的L2范数平均值
Figure FDA0002747568300000032
其中ρ∈[0,1]是预先设置的更新动量。
7.如权利要求1-6任一项所述的基于球面嵌入的图像度量学习方法,其特征在于,步骤S3中,计算给定的两张图像xa和xb相似度的方法为:将xa和xb分别输入训练好的深度神经网络M,得到与它们相对应的特征(嵌入)fa和fb,然后计算两个特征(嵌入)间的余弦相似度
Figure FDA0002747568300000033
即为两张图片间的相似度。
CN202011171940.9A 2020-10-28 2020-10-28 一种基于球面嵌入的图像度量学习方法 Active CN112329833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011171940.9A CN112329833B (zh) 2020-10-28 2020-10-28 一种基于球面嵌入的图像度量学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011171940.9A CN112329833B (zh) 2020-10-28 2020-10-28 一种基于球面嵌入的图像度量学习方法

Publications (2)

Publication Number Publication Date
CN112329833A true CN112329833A (zh) 2021-02-05
CN112329833B CN112329833B (zh) 2022-08-12

Family

ID=74296133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011171940.9A Active CN112329833B (zh) 2020-10-28 2020-10-28 一种基于球面嵌入的图像度量学习方法

Country Status (1)

Country Link
CN (1) CN112329833B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115470365A (zh) * 2022-11-09 2022-12-13 南京码极客科技有限公司 一种基于深度度量学习的细粒度跨媒体检索方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170228641A1 (en) * 2016-02-04 2017-08-10 Nec Laboratories America, Inc. Distance metric learning with n-pair loss
CN107103281A (zh) * 2017-03-10 2017-08-29 中山大学 基于聚集损失深度度量学习的人脸识别方法
CN107247940A (zh) * 2017-06-18 2017-10-13 天津大学 一种面部识别和聚类的联合嵌入方法
CN107341463A (zh) * 2017-06-28 2017-11-10 北京飞搜科技有限公司 一种结合图像质量分析与度量学习的人脸特征识别方法
CN109063719A (zh) * 2018-04-23 2018-12-21 湖北工业大学 一种联合结构相似性和类信息的图像分类方法
CN109359684A (zh) * 2018-10-17 2019-02-19 苏州大学 基于弱监督定位和子类别相似性度量的细粒度车型识别方法
CN109829377A (zh) * 2018-12-28 2019-05-31 河海大学 一种基于深度余弦度量学习的行人重识别方法
US20190303754A1 (en) * 2018-03-28 2019-10-03 University Of Maryland, College Park L2 constrained softmax loss for discriminative face verification
CN110516533A (zh) * 2019-07-11 2019-11-29 同济大学 一种基于深度度量的行人再辨识方法
CN110717402A (zh) * 2019-09-16 2020-01-21 华中科技大学 一种基于层级优化度量学习的行人再识别方法
CN110728263A (zh) * 2019-10-24 2020-01-24 中国石油大学(华东) 一种基于距离选择的强判别特征学习的行人重识别方法
KR20200093975A (ko) * 2019-01-29 2020-08-06 중앙대학교 산학협력단 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법
CN111651558A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 基于预训练语义模型的超球面协同度量推荐装置和方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170228641A1 (en) * 2016-02-04 2017-08-10 Nec Laboratories America, Inc. Distance metric learning with n-pair loss
CN107103281A (zh) * 2017-03-10 2017-08-29 中山大学 基于聚集损失深度度量学习的人脸识别方法
CN107247940A (zh) * 2017-06-18 2017-10-13 天津大学 一种面部识别和聚类的联合嵌入方法
CN107341463A (zh) * 2017-06-28 2017-11-10 北京飞搜科技有限公司 一种结合图像质量分析与度量学习的人脸特征识别方法
US20190303754A1 (en) * 2018-03-28 2019-10-03 University Of Maryland, College Park L2 constrained softmax loss for discriminative face verification
CN109063719A (zh) * 2018-04-23 2018-12-21 湖北工业大学 一种联合结构相似性和类信息的图像分类方法
CN109359684A (zh) * 2018-10-17 2019-02-19 苏州大学 基于弱监督定位和子类别相似性度量的细粒度车型识别方法
CN109829377A (zh) * 2018-12-28 2019-05-31 河海大学 一种基于深度余弦度量学习的行人重识别方法
KR20200093975A (ko) * 2019-01-29 2020-08-06 중앙대학교 산학협력단 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법
CN110516533A (zh) * 2019-07-11 2019-11-29 同济大学 一种基于深度度量的行人再辨识方法
CN110717402A (zh) * 2019-09-16 2020-01-21 华中科技大学 一种基于层级优化度量学习的行人再识别方法
CN110728263A (zh) * 2019-10-24 2020-01-24 中国石油大学(华东) 一种基于距离选择的强判别特征学习的行人重识别方法
CN111651558A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 基于预训练语义模型的超球面协同度量推荐装置和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KIHYUK SOHN: "Improved deep metric learning with multi-class N-pair loss objective", 《NIPS"16: PROCEEDINGS OF THE 30TH INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING》 *
XU ZHANG 等: "HEATED-UP SOFTMAX EMBEDDING", 《ARXIV:1809.04157V1 [CS.LG]》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115470365A (zh) * 2022-11-09 2022-12-13 南京码极客科技有限公司 一种基于深度度量学习的细粒度跨媒体检索方法

Also Published As

Publication number Publication date
CN112329833B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN111523621B (zh) 图像识别方法、装置、计算机设备和存储介质
CN110458187B (zh) 一种恶意代码家族聚类方法和系统
CN110941734B (zh) 基于稀疏图结构的深度无监督图像检索方法
WO2018157699A1 (zh) 一种全局最优粒子滤波方法及全局最优粒子滤波器
CN112699998B (zh) 一种时间序列预测方法、装置、电子设备及可读存储介质
CN108009571A (zh) 一种新的直推式半监督数据分类方法及系统
CN112085041A (zh) 神经网络的训练方法、训练装置和电子设备
CN114218292A (zh) 一种多元时间序列相似性检索方法
CN111191786A (zh) 一种基于主动学习的迁移学习算法
CN114926742B (zh) 一种基于二阶注意力机制的回环检测及优化方法
JP2022548187A (ja) 対象再識別方法および装置、端末並びに記憶媒体
CN111834004A (zh) 一种基于中心化空间学习的未知疾病类别识别方法及装置
CN116993548A (zh) 基于增量学习的LightGBM-SVM的教育培训机构信用评估方法及系统
CN112329833B (zh) 一种基于球面嵌入的图像度量学习方法
CN110503148B (zh) 一种具有尺度不变性的点云对象识别方法
CN114255381B (zh) 图像识别模型的训练方法、图像识别方法、装置及介质
CN117152427A (zh) 基于扩散模型和知识蒸馏的遥感图像语义分割方法与系统
CN111144466A (zh) 一种图像样本自适应的深度度量学习方法
CN117496157A (zh) 基于ms模块的相对较小部分点云语义分割方法
CN115794805B (zh) 一种中低压配网量测数据补齐方法
CN110728292A (zh) 一种多任务联合优化下的自适应特征选择算法
CN112905166B (zh) 人工智能编程系统、计算机设备、计算机可读存储介质
CN116956171A (zh) 基于ai模型的分类方法、装置、设备及存储介质
CN112686318B (zh) 一种基于球面嵌入、球面对齐和球面校准的零样本学习机制
CN112507137B (zh) 开放环境下基于粒度感知的少样本关系抽取方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant