CN112257738A

CN112257738A - 机器学习模型的训练方法、装置和图像的分类方法、装置

Info

Publication number: CN112257738A
Application number: CN202010757205.XA
Authority: CN
Inventors: 潘滢炜; 王羽; 姚霆; 梅涛
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2021-01-22

Abstract

本公开涉及一种机器学习模型的训练方法、装置和图像的分类方法、装置，涉及人工智能技术领域。该训练方法包括：对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据，第一正样本数据和多个第二正样本数据共同构成待分类图像的正样本数据；利用机器学习模型，提取待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量，各样本数据包括正样本数据和负样本数据；根据目标特征向量与各样本特征向量的相似程度，计算损失函数的函数值；利用函数值，训练机器学习模型，用于对待分类图像进行分类。

Description

机器学习模型的训练方法、装置和图像的分类方法、装置

技术领域

本公开涉及人工智能技术领域，特别涉及一种机器学习模型的训练方法、机器学习模型的训练装置、图像的分类方法、图像的分类装置、电子设备和非易失性计算机可读存储介质。

背景技术

近年来，有监督学习和无监督学习等机器学习方法被广泛应用于很多人工智能场景。例如，通过机器学习方法可以实现图像的目标检测、图像分类等。

在相关技术中，独立地计算目标与每个分类的正样本的相似程度，以确定损失函数；利用该损失函数训练机器学习模型。

发明内容

本公开的发明人发现上述相关技术中存在如下问题：每次训练只能分析目标与单个正样本的关系，无法充分挖掘每个分类的内在特征，造成机器学习模型的训练效果差，从而导致图像分类准确率低。

鉴于此，本公开提出了一种机器学习模型的训练技术方案，能够提高机器学习模型的训练效果，从而提高图像分类的准确率。

根据本公开的一些实施例，提供了一种机器学习模型的训练方法，包括：对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据，所述第一正样本数据和所述多个第二正样本数据共同构成所述待分类图像的正样本数据；利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量，所述各样本数据包括所述正样本数据和负样本数据；根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值；利用所述函数值，训练所述机器学习模型，用于对所述待分类图像进行分类。

在一些实施例中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：根据各正样本数据的特征向量的统计特征，计算所述目标特征向量与所述各样本特征向量的相似程度。

在一些实施例中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：在所述正样本数据的数量趋于正无穷的情况下，利用各正样本数据的特征向量的统计特征，确定所述损失函数的极限，用于计算所述函数值。

在一些实施例中，所述利用各正样本数据的特征向量的统计特征，确定所述损失函数的极限包括：根据所述目标特征向量与所述各正样本数据的特征向量的均值的相似程度，确定第一相似度；根据所述目标特征向量与所述各正样本数据的特征向量的方差的相似程度，确定第二相似度；根据所述目标特征向量与所述各负样本数据的特征向量的相似程度之和，确定第三相似度；根据所述第一相似度、第二相似度、第三相似度，确定所述损失函数的极限，所述损失函数的极限与所述第一相似度负相关，与所述第二相似度和所述第三相似度之和正相关。

在一些实施例中，所述利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量包括：利用第一机器学习模型提取所述目标特征向量，利用第二机器学习模型提取所述各样本特征向量；所述利用所述函数值，训练所述机器学习模型包括：利用所述函数值，调整所述第一机器学习模型的各参数；根据所述第一机器学习模型的各参数，调整所述第二机器学习模型的各参数。

在一些实施例中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：根据所述目标特征向量与任一正样本数据的特征向量的相似程度，确定该正样本数据对应的子损失函数，所述子损失函数跟所述目标特征向量与该正样本数据的特征向量的相似程度负相关，跟所述目标特征向量与所有负样本数据的特征向量的相似度之和正相关；根据各子损失函数的加权和，确定所述损失函数。

在一些实施例中，所述变换处理包括旋转处理、加噪声处理、翻转处理、缩放处理、裁剪处理、平移处理中的至少一项。

在一些实施例中，所述利用所述函数值，训练所述机器学习模型包括：根据一批次的训练数据中各待分类图像的所述函数值的加权平均值，训练所述机器学习模型。

根据本公开的另一些实施例，提供一种图像的分类方法，包括：获取待分类图像；利用机器学习模型，对所述待分类图像进行分类，所述机器学习模型根据上述任一个实施例中的训练方法训练得到。

根据本公开的又一些实施例，提供一种机器学习模型的训练装置，包括：生成单元，用于对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据，所述第一正样本数据和所述多个第二正样本数据共同构成所述待分类图像的正样本数据；提取单元，用于利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量，所述各样本数据包括所述正样本数据和负样本数据；计算单元，用于根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值；训练单元，用于利用所述函数值，训练所述机器学习模型，用于对所述待分类图像进行分类。

在一些实施例中，所述计算单元根据各正样本数据的特征向量的统计特征，计算所述目标特征向量与所述各样本特征向量的相似程度。

在一些实施例中，所述计算单元在所述正样本数据的数量趋于正无穷的情况下，利用各正样本数据的特征向量的统计特征，确定所述损失函数的极限，用于计算所述函数值。

在一些实施例中，所述计算单元根据所述目标特征向量与所述各正样本数据的特征向量的均值的相似程度，确定第一相似度；根据所述目标特征向量与所述各正样本数据的特征向量的方差的相似程度，确定第二相似度；根据所述目标特征向量与所述各负样本数据的特征向量的相似程度之和，确定第三相似度；根据所述第一相似度、第二相似度、第三相似度，确定所述损失函数的极限，所述损失函数的极限与所述第一相似度负相关，与所述第二相似度和所述第三相似度之和正相关。

在一些实施例中，所述提取单元利用第一机器学习模型提取所述目标特征向量，利用第二机器学习模型提取所述各样本特征向量；所述训练单元利用所述函数值，调整所述第一机器学习模型的各参数；根据所述第一机器学习模型的各参数，调整所述第二机器学习模型的各参数。

在一些实施例中，所述计算单元根据所述目标特征向量与任一正样本数据的特征向量的相似程度，确定该正样本数据对应的子损失函数，所述子损失函数跟所述目标特征向量与该正样本数据的特征向量的相似程度负相关，跟所述目标特征向量与所有负样本数据的特征向量的相似度之和正相关；根据各子损失函数的加权和，确定所述损失函数。

在一些实施例中，所述训练单元根据一批次的训练数据中各待分类图像的所述函数值的加权平均值，训练所述机器学习模型。

根据本公开的又一些实施例，提供一种图像的分类装置，包括：获取单元，用于获取待分类图像；分类单元，用于利用机器学习模型，对所述待分类图像进行分类，所述机器学习模型根据上述任一个实施例中的训练方法训练得到。

根据本公开的又一些实施例，提供一种电子设备，包括：存储器；和耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器装置中的指令，执行上述任一个实施例中的机器学习模型的训练方法或者图像的分类方法。

根据本公开的再一些实施例，提供一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一个实施例中的机器学习模型的训练方法或者图像的分类方法。

在上述实施例中，基于一个正样本数据生成了多个正样本数据，并根据多个正样本数据与待分类图像的相似程度进行训练。这样，可以利用正样本数据之间共享相似性的特点，充分挖掘每个分类的内在特征，以提高机器学习模型的训练效果，从而提高图像分类的准确率。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1示出本公开的机器学习模型的训练方法的一些实施例的流程图；

图2示出本公开的机器学习模型的训练方法的一些实施例的示意图；

图3示出本公开的机器学习模型的训练方法的另一些实施例的示意图；

图4示出本公开的机器学习模型的训练最终的一些实施例的框图；

图5示出本公开的电子设备的一些实施例的框图；

图6示出本公开的电子设备的另一些实施例的框图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

针对上述技术问题，在每次训练过程中，对于本公开同时分析待分类图像与其所属的图像分类的多个正样本数据的相似性。这样，可以利用同一图像分类的多个正样本数据之间的相关性，对训练过程实施更加严格的约束，以提高训练的效果。从而，可以提高机器学习模型对图像分类的准确性。

例如，可以通过如下的实施例实现本公开的技术方案。

图1示出本公开的机器学习模型的训练方法的一些实施例的流程图。

如图1所示，该方法包括：步骤110，生成多个第二正样本数据；步骤120，提取特征向量；步骤130，计算损失函数的函数值；和步骤140，训练机器学习模型。

在步骤110中，对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据。第一正样本数据和多个第二正样本数据共同构成待分类图像的正样本数据。

在一些实施例中，变换处理可以是各种数据增强处理(Data Augmentation)。例如，变换出力可以包括旋转处理(Rotation)、加噪声处理(Gaussian Noise)、翻转处理(Flip)、缩放处理(Scale)、裁剪处理(Crop)、平移处理(Translation)中的至少一项。

例如，训练数据集合X_i中包含待分类图像

及其所属图像类型的1个正样本数据和多个负样本数据。可以在输入空间(ambient space)中，将该正样本数据扩展为多个正样本数据

m为大于或等于1，小于等于整数M的整数。输入空间可以是待分类图像中像素值的取值范围。

例如，可以对X_i中的

进行M+1次的数据增强处理，将其中的M个处理结果作为正样本数据，将剩余的1个处理结果作为待分类图像。

在步骤120中，利用机器学习模型，提取待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量。各样本数据包括正样本数据和负样本数据。

在一些实施例中，利用第一机器学习模型提取目标特征向量，利用第二机器学习模型提取各样本特征向量。

例如，第一机器学习模型为查询编码器f(·)，第二机器学习模型为键值编码器g(·)。f(·)用于提取X_i中的

的目标特征向量q_i；g(·)用于提取X_i中的各

的正样本特征向量

和各负样本数据的负样本特征向量

j为大于或等于1，小于等于整数K的整数。

在一些实施例中，第一机器学习模型和第二机器学习模型可以为不同的深度学习神经网络。可以通过对比学习的方式对第一机器学习模型和第二机器学习模型进行训练。

例如，可以利用函数值，调整第一机器学习模型的各参数；根据第一机器学习模型的各参数，调整第二机器学习模型的各参数。

在步骤130中，根据目标特征向量与各样本特征向量的相似程度，计算损失函数的函数值。

在一些实施例中，根据目标特征向量与任一正样本数据的特征向量的相似程度，确定该正样本数据对应的子损失函数。子损失函数跟目标特征向量与该正样本数据的特征向量的相似程度负相关，跟目标特征向量与所有负样本数据的特征向量的相似度之和正相关；根据各子损失函数的加权和，确定损失函数。例如，可以通过图2中的实施例确定各子损失函数。

图2示出本公开的机器学习模型的训练方法的一些实施例的示意图。

如图2所示，利用f(·)和g(·)分别提取X_i中的

的q_i和各

的

利用

计算

与各

的相似程度，利用

计算

与各负样本数据的相似程度；然后利用各

计算正样本数据

对应的子损失函数L_i,m。例如，可以通过如下的公式计算各L_i,m：

τ为根据实际情况和需求设置的温度超参数。从上面的公式可以看出，L_i,m根q_i与

的相似程度负相关，跟q_i与

以及与所有负样本数据的

的相似度之和正相关。

在一些实施例中，根据各子损失函数的加权和，确定损失函数。例如，各子损失函数的权值与正样本数据的数量负相关。如可以取M个子损失函数的平均值作为损失函数。对于待分类图像

的所属图像分类的M个正样本数据，损失函数

可以通过如下公式计算：

在一些实施例中，根据各正样本数据的特征向量的统计特征，计算目标特征向量与各样本特征向量的相似程度；根据相似程度计算损失函数的函数值。

例如，可以利用各

的分布的均值、方差中的至少一项，表征正样本数据的综合特征向量；利用综合特征向量，计算

与所有

的相似程度。

这样，可以不必计算每个正样本数据与待分类图像的相似程度，仅需计算综合特征向量与待分类图像的相似程度即可确定损失函数的函数值。从而，既降低了计算量，又引入了多个正样本数据之间的关联信息，提升了训练效率，提高了图像分类的准确性。

由于对于一批训练数据中的N个待分类图像，需要计算(M+1)×N对

与

的相似程度，因此，这会导致计算量较大。为了解决该技术问题，可以采用下面实施例中的方式计算损失函数的函数值。

在一些实施例中，在正样本数据的数量趋于正无穷的情况下，利用各正样本数据的特征向量的统计特征，确定损失函数的极限，用于计算函数值。

例如，可以采用如下的极限计算公式，确定损失函数：

为取括号中关于所有正样本数据

的均值。进而，可以确定上面公式的上限为：

在上述实施例中，在正样本数据的数量趋于正无穷的情况下，确定了

的严格上限，以获取在具有无限多个正样本数据的情况下的损失函数。这样，可以使得损失函数更加贴近实际情况，提高训练效果，从而提高图像分类的准确性。

在一些实施例中，所有正样本数据

服从高斯分布，即

和

分别为

的分布的均值和方差。可以根据

和

计算上面公式中

与

的相似程度。例如，可以通过图3中的实施例实现上述技术方案。

图3示出本公开的机器学习模型的训练方法的另一些实施例的示意图。

如图3所示，可以对第一正样本数据进行M′次的数据增强处理，获取M′个第二正样本数据，M′为小于M的正整数。利用f(·)和g(·)分别提取X_i中的

的q_i和各

的

并获取所有

服从的分布

中的统计特征

和

在一些实施例中，根据目标特征向量与各正样本数据的特征向量的均值的相似程度，确定第一相似度。例如，第一相似度可以为

根据目标特征向量与各正样本数据的特征向量的方差的相似程度，确定第二相似度。例如，第二相似度可以为

根据目标特征向量与各负样本数据的特征向量的相似程度之和，确定第三相似度。例如，第三相似度可以为

根据第一相似度、第二相似度、第三相似度，确定损失函数的极限。损失函数的极限与第一相似度负相关，与第二相似度和第三相似度之和正相关。例如，可以确定损失函数为：

λ为根据实际情况和需求设置的调节超参数。

在上述实施例中，利用

的统计特征

和

计算出无穷多个正样本数据的子损失函数的和作为损失函数，提高了训练效果和图像分类的准确性。

在步骤140中，利用函数值，训练机器学习模型，用于对待分类图像进行分类。

在一些实施例中，根据一批次的训练数据中各待分类图像的函数值的加权平均值，训练机器学习模型。例如，可以取所有待分类图像的损失函数的平均值，计算出用于训练的最终函数值：

在一些实施例中，利用上述任一项的训练方法训练机器学习模型后，可以利用该机器学习模型，对获取的待分类图像进行分类。

图4示出本公开的机器学习模型的训练最终的一些实施例的框图。

如图4所示，训练装置4包括生成单元41、提取单元42、计算单元43和训练单元44。

生成单元41对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据。第一正样本数据和多个第二正样本数据共同构成待分类图像的正样本数据。

在一些实施例中，变换处理包括旋转处理、加噪声处理、翻转处理、缩放处理、裁剪处理、平移处理中的至少一项。

提取单元42利用机器学习模型，提取待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量。各样本数据包括正样本数据和负样本数据。

计算单元43根据目标特征向量与各样本特征向量的相似程度，计算损失函数的函数值。

在一些实施例中，计算单元43根据各正样本数据的特征向量的统计特征，计算目标特征向量与各样本特征向量的相似程度。

在一些实施例中，计算单元43在正样本数据的数量趋于正无穷的情况下，利用各正样本数据的特征向量的统计特征，确定损失函数的极限，用于计算函数值。

在一些实施例中，计算单元43根据目标特征向量与各正样本数据的特征向量的均值的相似程度，确定第一相似度；根据目标特征向量与各正样本数据的特征向量的方差的相似程度，确定第二相似度；根据目标特征向量与各负样本数据的特征向量的相似程度之和，确定第三相似度；根据第一相似度、第二相似度、第三相似度，确定损失函数的极限。损失函数的极限与第一相似度负相关，与第二相似度和所述第三相似度之和正相关。

在一些实施例中，计算单元43根据目标特征向量与任一正样本数据的特征向量的相似程度，确定该正样本数据对应的子损失函数。子损失函数跟目标特征向量与该正样本数据的特征向量的相似程度负相关，跟目标特征向量与所有负样本数据的特征向量的相似度之和正相关；根据各子损失函数的加权和，确定损失函数。

训练单元44利用函数值，训练机器学习模型，用于对待分类图像进行分类。

在一些实施例中，提取单元42利用第一机器学习模型提取目标特征向量，利用第二机器学习模型提取各样本特征向量；训练单元44利用函数值，调整第一机器学习模型的各参数；根据第一机器学习模型的各参数，调整第二机器学习模型的各参数。

在一些实施例中，训练单元44根据一批次的训练数据中各待分类图像的函数值的加权平均值，训练机器学习模型。

在一些实施例中，图像的分类装置包括：获取单元，用于获取待分类图像；分类单元，用于利用机器学习模型，对待分类图像进行分类。机器学习模型根据上述任一个实施例中的训练方法训练得到。

图5示出本公开的电子设备的一些实施例的框图。

如图5所示，该实施例的电子设备5包括：存储器51以及耦接至该存储器51的处理器52，处理器52被配置为基于存储在存储器51中的指令，执行本公开中任意一个实施例中的机器学习模型的训练方法或者图像的分类方法。

其中，存储器51例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。

图6示出本公开的电子设备的另一些实施例的框图。

如图6所示，该实施例的电子设备6包括：存储器610以及耦接至该存储器610的处理器620，处理器620被配置为基于存储在存储器610中的指令，执行前述任意一个实施例中的机器学习模型的训练方法或者图像的分类方法。

存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。

电子设备6还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630、640、650以及存储器610和处理器620之间例如可以通过总线660连接。其中，输入输出接口630为显示器、鼠标、键盘、触摸屏、麦克、音箱等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

至此，已经详细描述了根据本公开的机器学习模型的训练方法、机器学习模型的训练装置、图像的分类方法、图像的分类装置、电子设备和非易失性计算机可读存储介质。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本公开的方法和系统。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims

1.一种机器学习模型的训练方法，包括：

对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据，所述第一正样本数据和所述多个第二正样本数据共同构成所述待分类图像的正样本数据；

利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量，所述各样本数据包括所述正样本数据和负样本数据；

根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值；

利用所述函数值，训练所述机器学习模型，用于对所述待分类图像进行分类。

2.根据权利要求1所述的训练方法，其中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：

根据各正样本数据的特征向量的统计特征，计算所述目标特征向量与所述各样本特征向量的相似程度。

3.根据权利要求1所述的训练方法，其中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：

在所述正样本数据的数量趋于正无穷的情况下，利用各正样本数据的特征向量的统计特征，确定所述损失函数的极限，用于计算所述函数值。

4.根据权利要求3所述的训练方法，其中，所述利用各正样本数据的特征向量的统计特征，确定所述损失函数的极限包括：

根据所述目标特征向量与所述各正样本数据的特征向量的均值的相似程度，确定第一相似度；

根据所述目标特征向量与所述各正样本数据的特征向量的方差的相似程度，确定第二相似度；

根据所述目标特征向量与所述各负样本数据的特征向量的相似程度之和，确定第三相似度；

根据所述第一相似度、所述第二相似度、所述第三相似度，确定所述损失函数的极限，所述损失函数的极限与所述第一相似度负相关，与所述第二相似度和所述第三相似度之和正相关。

5.根据权利要求1所述的训练方法，其中，

所述利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量包括：

利用第一机器学习模型提取所述目标特征向量，利用第二机器学习模型提取所述各样本特征向量；

所述利用所述函数值，训练所述机器学习模型包括：

利用所述函数值，调整所述第一机器学习模型的各参数；

根据所述第一机器学习模型的各参数，调整所述第二机器学习模型的各参数。

6.根据权利要求1-5任一项所述的训练方法，其中，所述根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值包括：

根据所述目标特征向量与任一正样本数据的特征向量的相似程度，确定该正样本数据对应的子损失函数，所述子损失函数跟所述目标特征向量与该正样本数据的特征向量的相似程度负相关，跟所述目标特征向量与所有负样本数据的特征向量的相似度之和正相关；

根据各子损失函数的加权和，确定所述损失函数。

7.根据权利要求1-5任一项所述的训练方法，其中，

所述变换处理包括旋转处理、加噪声处理、翻转处理、缩放处理、裁剪处理、平移处理中的至少一项。

8.根据权利要求1-5任一项所述的训练方法，其中，所述利用所述函数值，训练所述机器学习模型包括：

根据一批次的训练数据中各待分类图像的所述函数值的加权平均值，训练所述机器学习模型。

9.一种图像的分类方法，包括：

获取待分类图像；

利用机器学习模型，对所述待分类图像进行分类，所述机器学习模型根据权利要求1-8任一项所述的训练方法训练得到。

10.一种机器学习模型的训练装置，包括：

生成单元，用于对待分类图像的第一正样本数据进行变换处理，生成多个第二正样本数据，所述第一正样本数据和所述多个第二正样本数据共同构成所述待分类图像的正样本数据；

提取单元，用于利用机器学习模型，提取所述待分类图像的特征向量作为目标特征向量，并提取各样本数据的特征向量作为各样本特征向量，所述各样本数据包括所述正样本数据和负样本数据；

计算单元，用于根据所述目标特征向量与所述各样本特征向量的相似程度，计算损失函数的函数值；

训练单元，用于利用所述函数值，训练所述机器学习模型，用于对所述待分类图像进行分类。

11.一种图像的分类装置，包括：

获取单元，用于获取待分类图像；

分类单元，用于利用机器学习模型，对所述待分类图像进行分类，所述机器学习模型根据权利要求1-8任一项所述的训练方法训练得到。

12.一种电子设备，包括：

存储器；和

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行权利要求1-8任一项所述的机器学习模型的训练方法，或者权利要求9所述的图像的分类方法。

13.一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-8任一项所述的机器学习模型的训练方法，或者权利要求9所述的图像的分类方法。