WO2021244521A1

WO2021244521A1 - 模型训练、对象分类方法和装置、电子设备及存储介质

Info

Publication number: WO2021244521A1
Application number: PCT/CN2021/097643
Authority: WO
Inventors: 黄颖; 邱尚锋; 张文伟
Original assignee: 广州虎牙科技有限公司
Priority date: 2020-06-04
Filing date: 2021-06-01
Publication date: 2021-12-09
Also published as: CN111652315A; CN111652315B

Abstract

本申请提供的模型训练、对象分类方法和装置、电子设备及存储介质，涉及深度学习技术领域。在本申请中，首先，获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量。其次，基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系。然后，基于相似概率参数计算得到分类损失，并基于分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，样本对象为样本图像，对象分类模型用于对目标图像的类型进行分类确定。通过上述方法，可以改善现有技术中训练得到的对象分类模型容易出现分类准确度不高的问题。

Description

模型训练、对象分类方法和装置、电子设备及存储介质

相关申请的交叉引用

本申请要求于2020年6月4日提交中国专利局的申请号为2020105000003、名称为“模型训练、对象分类方法和装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及深度学习技术领域，具体而言，涉及一种模型训练、对象分类方法和装置、电子设备及存储介质。

背景技术

随着深度学习技术的不断发展，其应用范围也越来越广，例如，深度学习技术在图像识别领域中就得到了很好的应用，如利用深度学习技术对图像进行识别分类。

经发明人研究发现，基于相关技术训练得到的对象分类模型，在对图像进行识别分类时，容易出现分类准确度不高的问题。

发明内容

有鉴于此，本申请的目的在于提供一种模型训练、对象分类方法和装置、电子设备及存储介质，以改善相关技术中训练得到的对象分类模型容易出现分类准确度不高的问题。

为实现上述目的，本申请实施例采用如下技术方案：

一种对象分类模型训练方法，包括：

获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量，其中，该样本对象为多个，且与多个样本标签具有一一对应关系；

基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在该分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系；

基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，所述样本对象为样本图像，所述对象分类模型用于对目标图像的类型进行分类确定。

可选地，在上述对象分类模型训练方法中，所述分类算法包括指数函数，所述基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数的步骤，包括：

针对每一个对象向量，基于第一指数函数计算该对象向量与目标标签向量之间的第一相似参数，其中，该目标标签向量对应的样本标签与该对象向量对应的样本对象之间具有对应关系，且在该第一指数函数中，指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系；

针对每一个对象向量，基于第二指数函数计算该对象向量与每一个其它标签向量之间的第二相似参数，其中，该其它标签向量为全部标签向量中所述目标标签向量以外的标签向量；

针对每一个对象向量，基于归一化函数对该对象向量的第一相似参数和第二相似参数进行处理，得到相似概率参数。

可选地，在上述对象分类模型训练方法中，所述第一指数函数中包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子中的一种或多种；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度相关，所述第二乘性惩罚因子与分类的类数量相关，所述加性惩罚因子与分类的准确度相关。

可选地，所述方法还包括：

获得响应用户的第一参数配置操作生成的第一参数配置指令；

基于所述第一参数配置指令对所述第一乘性惩罚因子、所述第二乘性惩罚因子和所述加性惩罚因子，分别进行赋值处理；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度之间具有正相关关系，所述第二乘性惩罚因子与分类的类数量之间具有正相关关系，所述加性惩罚因子与分类的准确度之间具有正相关关系。

可选地，在上述对象分类模型训练方法中，所述第一指数函数包括：

其中，χ为所述第一相似参数，a为所述第一乘性惩罚因子，s为所述第二乘性惩罚因子，b为所述加性惩罚因子，θ _yt为所述对象向量和所述目标标签向量之间的向量夹角。

可选地，在上述对象分类模型训练方法中，该方法还包括：

获得响应用户的第二参数配置操作生成的第二参数配置指令；

基于所述第二参数配置指令对指数函数进行配置处理，得到第二指数函数，其中，在该第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有非线性关系。

可选地，在上述对象分类模型训练方法中，在所述第二指数函数中，指数的值与对象向量和标签向量之间的向量夹角具有余弦的非线性关系，所述第二指数函数包括：

其中，

为所述第二相似参数，s为第二乘性惩罚因子，且该第二乘性惩罚因子与分类的类数量之间具有正相关关系，θ _j为所述对象向量和所述其它标签向量之间的向量夹角。

可选地，所述分类算法包括对数函数，在所述对数函数中，真数的值与对象向量和标签向量之间的向量夹角具有线性关系。

在上述基础上，本申请实施例还提供了一种对象分类方法，包括：

将获得的目标对象输入至预设的对象分类模型，其中，该对象分类模型基于上述的对象分类模型训练方法进行训练得到；

通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型，其中，该目标对象为目标图像。

本申请实施例还提供了一种对象分类模型训练装置，包括：

向量获得模块，用于获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量，其中，该样本对象为多个，且与多个样本标签具有一一对应关系；

参数计算模块，用于基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在该分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系；

模型训练模块，用于基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，所述样本对象为样本图像，所述对象分类模型用于对目标图像的类型进行分类确定。

可选地，所述分类算法包括指数函数，所述参数计算模块进一步配置成：

可选地，所述第一指数函数中包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子中的一种或多种；

可选地，所述装置还包括因子赋值模块，配置成：

可选地，所述第一指数函数包括：

可选地，所述装置还包括第二指数函数生成模块，配置成：

可选地，在所述第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有余弦的非线性关系，所述第二指数函数包括：

其中，

在上述基础上，本申请实施例还提供了一种对象分类装置，包括：

对象输入模块，配置成将获得的目标对象输入至预设的对象分类模型，其中，该对象分类模型基于上述的对象分类模型训练装置进行训练得到；

对象分类模块，配置成通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型，其中，该目标对象为目标图像。

在上述基础上，本申请实施例还提供了一种电子设备，包括：

存储器，配置成存储计算机程序；

与所述存储器连接的处理器，配置成执行该存储器存储的计算机程序，以实现上述的对象分类模型训练方法，或实现上述的对象分类方法。

在上述基础上，本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被执行时，实现上述的对象分类模型训练方法，或实现上述的对象分类方法。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请的技术方案，下面将对其中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实现方式，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它相关的附图。

图1为本申请实施例提供的电子设备的结构框图。

图2为本申请实施例提供的对象分类模型训练方法的流程示意图。

图3为图2中步骤S120包括的各子步骤的流程示意图。

图4为本申请实施例提供的对象分类模型训练方法包括的其它步骤的流程示意图。

图5为本申请实施例提供的向量夹角与指数的值之间具有线性关系和非线性关系的两种函数关系示意图。

图6为本申请实施例提供的对象分类模型训练方法包括的其它步骤的另一流程示意图。

图7为本申请实施例提供的对象分类方法的流程示意图。

图8为本申请实施例提供的对象分类模型训练装置包括的功能模块的方框示意图。

图9为本申请实施例提供的对象分类装置包括的功能模块的方框示意图。

图标：10-电子设备；12-存储器；14-处理器；100-对象分类模型训练装置；110-向量获得模块；120-参数计算模块；130-模型训练模块；200-对象分类装置；210-对象输入模块；220-对象分类模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本申请的一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，本申请实施例提供了一种电子设备10。其中，该电子设备10可以包括存储器12和处理器14。

详细地，所述存储器12和处理器14之间直接或间接地电性连接，以实现数据的传输或交互。例如，相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器12中可以存储有至少一个可以以软件或固件(firmware)的形式，存在的软件功能模块。所述处理器14可以用于执行所述存储器12中存储的可执行的计算机程序，如前述的软件功能模块，从而实现本申请实施例(如后文所述)提供的对象分类模型训练方法，以得到对象分类模型，或实现本申请实施例(如后文所述)提供的对象分类方法，以得到目标对象的对象类型。

可选地，所述存储器12可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

并且，所述处理器14可以是一种通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)、片上系统(System on Chip，SoC)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可以理解，所述电子设备10可以是一种具有数据处理能力的服务器。

并且，图1所示的结构仅为示意，所述电子设备10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置，例如，还可以包括用于与其它设备进行信息交互的通信单元，如与其它数据库进行信息交互，以获得样本对象，或与终端设备进行信息交互，以获得目标对象，本申请实施例对电子设备10的结构不进行限制。

结合图2，本申请实施例还提供一种可应用于上述电子设备10的对象分类模型训练方法。其中，所述对象分类模型训练方法有关的流程所定义的方法步骤，可以由所述电子设备10实现，也即，可由电子设备执行本申请实施例提供的对象分类模型训练方法。下面将对图2所示的主要步骤S110～步骤S130，进行详细阐述。

步骤S110，获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量。

在本实施例中，所述电子设备10在需要对预设的神经网络模型进行训练时，可以先获得每一个样本对象对应的对象向量，并获得每一个样本对象对应的样本标签对应的标签向量。

其中，所述样本对象可以为多个，且与多个样本标签可以具有一一对应关系。也就是说，可以获得多个对象向量和多个标签向量。

步骤S120，基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数。

在本实施例中，在基于步骤S110获得所述多个对象向量和所述多个标签向量之后，所述电子设备10可以基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数。

其中，在所述分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系；也即，上述用于计算对象向量与标签向量之间的相似概率参数的分类算法至少包含有具有线性关系的函数。本申请实施例对该具有线性关系的函数的具体表达式不进行限定，具体可根据实际情况进行设置。

步骤S130，基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型。

在本实施例中，在基于步骤S120得到所述相似概率参数之后，所述电子设备10可以先基于该相似概率参数计算得到分类损失，然后，再基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型。

其中，所述样本对象可以为样本图像，如此，使得所述对象分类模型可以用于对目标图像的类型进行分类确定。

由于大多相关的模型训练技术所采用的分类算法中基本采用非线性关系的函数，诸如，采用的指数函数的指数的值与对象向量和标签向量之间的向量夹角具有余弦非线性关系，因而该指数的值具有较大的波动，使得分类损失的计算结果存在波动较大、难以有效的收敛。相比之下，基于本公开实施例提供的上述方法，由于分类算法中包括具有线性关系的函数，使得基于该分类算法得到的相似概率参数用于计算分类损失时，可以保证计算得到的损失可以平稳的进行收敛，从而使得基于该分类损失训练得到的对象分类模型的识别分类性能也较为稳定，保证训练得到的对象分类模型都具有较高的分类准确度，进而改善相关技术中训练得到的对象分类模型容易出现分类准确度不高的问题。特别是在应用于人脸识别分类时，由于人脸图像的类型较多(如100万个人，就有10万个类型)，使得本公开实施例提供的上述模型训练方法对于这种多分类的领域具有较好的应用效果，实用价值较高。

第一方面，对于步骤S110需要说明的是，获得所述对象向量的具体方式不受限制，可以根据实际应用需求进行选择。

例如，基于所述样本对象的具体形式不同，可以有不同的选择。诸如，在一种可以替代的示例中，在所述样本对象为样本图像时，可以先获得多个样本图像，再基于神经网络模型中的特征提取层(如编码器)，对每一个样本图像均进行特征提取处理，得到多个图像特征，然后，再通过神经网络模型中的图像分类层(如全连接层，fully connected layers，FC)对每一个图像特征进行特征分类处理，最终得到多个图像向量(即所述对象向量)。

并且，在步骤S110中，获得所述标签向量的具体方式也不受限制，也可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，可以直接获取已经对多个样本对象对应的样本标签进行向量化处理得到的标签向量。又例如，在另一种可以替代的示例中，也可以直接获取多个样本对象对应的样本标签，然后，再对每一个样本标签进行向量化处理，得到多个标签向量，如下所示：

[W1、W2、W3、...、Wi、...、Wn]；

其中，Wi表示第i个样本标签的标签向量，n表示标签向量的数量，即有n个标签向量。

第二方面，对于步骤S120需要说明的是，计算所述相似概率参数的具体方式也不受限制，也可以根据实际应用需求进行选择，例如，基于所述分类算法中具有上述线性关系的函数的具体内容不同，可以有不同的选择。

其中，一方面，在所述分类算法中，具有上述线性关系的函数，可以为指数函数，如此，在该指数函数中，指数的值与对象向量和标签向量之间的向量夹角具有线性关系。另一方面，在所述分类算法中，具有上述线性关系的函数也可以为非指数函数，如对数函数(也可以是其它函数)，如此，在该对数函数中，真数的值与对象向量和标签向量之间的向量夹角具有线性关系。

也就是说，所述分类算法既可以包括指数函数，也可以不包括指数函数。其中，基于所述分类算法中具有线性关系的函数为指数函数的示例，所述分类算法的具体内容也不受限制，使得计算所述相似概率参数的具体方式也可以有不同的选择。

例如，在一种可以替代的示例中，可以基于相同的指数函数分别计算对象向量与目标标签向量之间的第一相似参数、对象向量与每一个除目标标签向量之外的其它标签向量之间的第二相似参数，该目标标签向量对应的样本标签与该对象向量对应的样本对象之间具有对应关系。

也就是说，在上述示例中，所述分类算法包括的指数函数都具有如下关系：指数的值与对象向量和标签向量之间的向量夹角具有线性关系。

又例如，在另一种可以替代的示例中，为了使得训练得到的对象分类模型具有较好的识别分类能力，也即，为了使得计算得到的对象向量与目标标签向量之间的第一相似参数能够充分的表征该对象向量与该目标标签向量之间的真实关系(如参数的值为1)，结合图3，步骤S120可以包括步骤S121、步骤S122和步骤S123，具体内容如下所述。

步骤S121，针对每一个对象向量，基于第一指数函数计算该对象向量与目标标签向量之间的第一相似参数。

在本实施例中，在基于步骤S110得到多个所述对象向量和多个所述标签向量之后，可以针对每一个对象向量，基于预设的第一指数函数，计算该对象向量与该对象向量对应的目标标签向量之间的相似参数，得到对应的第一相似参数。如此，基于多个对象向量，可以得到多个第一相似参数。

其中，所述目标标签向量对应的样本标签与该对象向量对应的样本对象之间可以具有对应关系，且在所述第一指数函数中，指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系。

步骤S122，针对每一个对象向量，基于第二指数函数计算该对象向量与每一个其它标签向量之间的第二相似参数。其它标签向量也即是除了上述目标标签向量之外的标签向量。

在本实施例中，在基于步骤S110得到多个所述对象向量和多个所述标签向量之后，针对每一个对象向量，还可以基于预设的第二指数函数，计算该对象向量与每一个除了上述目标标签向量之外的其它标签向量之间的相似参数，得到对应的至少一个第二相似参数。如此，基于多个对象向量，可以得到多个第二相似参数。

其中，所述其它标签向量可以为全部标签向量中，所述目标标签向量以外的标签向量。也就是说，一个标签向量在作为一个对象向量的目标标签向量时，也可以作为另一个对象向量的其它标签向量。

步骤S123，针对每一个对象向量，基于归一化函数对该对象向量的第一相似参数和第二相似参数进行处理，得到相似概率参数。也即，对每个对象向量的第一相似参数和第二相似参数进行归一化处理，得到相似概率参数。

在本实施例中，在基于步骤S121和步骤S122得到每一个对象向量的一个第一相似参数和至少一个第二相似参数之后，可以针对每一个对象向量，基于预设的归一化函数，对该对象向量对应的一个第一相似参数和至少一个第二相似参数进行处理，得到对应的相似概率参数。

如此，基于多个对象向量，可以得到多个相似概率参数。

其中，在上述示例中，分别基于第一指数函数和第二指数函数计算所述第一相似参数和所述第二相似参数，由于在指数函数中，随着自变量的增大，会得到较大的函数值，使得基于不同的向量夹角计算得到的第一相似参数和第二相似参数可以有较大的数值范围，如此，在多分类的应用中，可以使得分类更为准确、更为精细化。

可选地，执行步骤S121以计算所述第一相似参数的具体方式不受限制，可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，若对分类的类间聚合度有特定的需求，经过本申请的发明人的长期研究发现，可以在计算所述第一相似参数时，设置一种类型的乘性惩罚因子。也即，可以在第一指数函数中设置第一乘性惩罚因子，第一乘性惩罚因子的数值与分类的类间聚合度相关。

又例如，在另一种可以替代的示例中，若对分类的类数量具有特定的需求，经过本申请的发明人的长期研究发现，可以在计算所述第一相似参数时，设置另一种类型的乘性惩罚因子。也即，可以在第一指数函数中设置第二乘性惩罚因子，第二乘性惩罚因子的数值与分类的类数量相关。

再例如，在另一种可以替代的示例中，若对分类的准确度具有特定的需求，经过本申请的发明人的长期研究发现，可以在计算所述第一相似参数时，设置一种加性惩罚因子。也即，可以在第一指数函数中设置加性惩罚因子，加性惩罚因子的数值与分类的准确度相关。

基于此，在一种具体的应用示例中，为了使得训练得到的对象分类模型能够对分类的类间聚合度、类数量和准确度都具有较好的适应能力，所述第一指数函数中，在指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系的基础上，可以包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子。

因此，为了使得第一指数函数满足上述的需求，结合图4，所述对象分类模型训练方法还可以包括步骤S140和步骤S150，具体内容如下所述。

步骤S140，获得响应用户第一参数配置操作生成的第一参数配置指令。

在本实施例中，在进行神经网络模型的训练之前，所述电子设备10还可以先获得预先生成的第一参数配置指令。其中，该第一参数配置指令，可以是(电子设备10，或其它设备)响应用户的第一参数配置操作生成。换言之，用户可以通过第一参数配置操作生成第一参数配置指令，诸如，用户可以通过指定端口(诸如电子设备10呈现的指定界面的参数配置输入框中)输入所需配置的第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子的具体数值，完成第一参数配置操作，此时生成了携带有第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子的具体数值的第一参数配置指令。

步骤S150，基于所述第一参数配置指令对所述第一乘性惩罚因子、所述第二乘性惩罚因子和所述加性惩罚因子，分别进行赋值处理。

在本实施例中，在基于步骤S140获得所述第一参数配置指令之后，所述电子设备10还可以基于该第一参数配置指令对所述第一乘性惩罚因子、所述第二乘性惩罚因子和所述加性惩罚因子，分别进行赋值处理。

其中，经过本申请的发明人的研究发现，所述第一乘性惩罚因子的数值与分类的类间聚合度之间具有正相关关系，所述第二乘性惩罚因子与分类的类数量之间具有正相关关系，所述加性惩罚因子与分类的准确度之间具有正相关关系。

也就是说，在对分类的类间聚合度具有较高的需求时，可以设置一个较大的第一乘性惩罚因子。在对分类的类数量具有较高的需求时，可以设置一个较大的第二乘性惩罚因子，例如，在对象分类模型用于对人脸进行识别时，因为可能涉及到需要对上千万的不同人脸图像进行分类识别，需要对分类的类数量有较高要求，因而，在模型训练过程中可以为第一指数函数设置较大的第二乘性惩罚因子。在对分类的准确度具有较高的需求时，可以设置一个较大的加性惩罚因子，例如，在对象分类模型用于网络支付验证中，为了保证财产的高安全性，需要对分类准确度要求较高，因而，在模型训练过程中可以为第一指数函数设置较大的加性惩罚因子，以保证支付验证的可靠性。

可以理解的是，所述第一指数函数的具体内容不受限制，只要满足上述的“指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系，包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子”的条件即可。

基于此，在一种具体的应用示例中，所述第一指数函数可以包括：

其中，χ可以为所述第一相似参数，a可以为所述第一乘性惩罚因子，s可以为所述第二乘性惩罚因子，b可以为所述加性惩罚因子，θ _yt可以为所述对象向量和所述目标标签向量之间的向量夹角。

也就是说，在基于步骤S110获得多个所述对象向量和多个所述标签向量之后，可以针对每一个对象向量，确定该对象向量与对应的目标标签向量之间的向量夹角，然后，再结合上述的第一指数函数可以计算出，该对象向量与该目标标签向量之间的相似概率参数。

如图5所示，示意出了基于本申请实施例提供的指数的值与向量夹角之间具有线性关系的指数函数，以及指数的值与向量夹角之间具有非线性关系的指数函数，其中，图5中以非线性关系是余弦非线性关系为例进行示意，且图5中所示的两种指数函数都包括乘性惩罚因子和加性惩罚因子。从图5中可明显获知，在具有余弦非线性的指数函数中，指数的值随着向量夹角的变化存在较大的波动，如此，会导致仅采用该指数函数对神经网络模型进行训练时，计算得到的分类损失不稳定，出现梯度下降不稳定的问题，进而使得训练难以进行有效地收敛，导致训练结束之后，得到的对象分类模型容易存在识别分类的准确度较低的问题。如果在模型训练过中加入了指数的值与对象向量和标签向量之间的向量夹角具有线性关系的指数函数，则能够使得计算得到的分类损失可以比较平稳的进行收敛。如此，由于分类损失可以平稳的进行收敛，使得基于该分类损失训练得到的对象分类模型的识别分类性能也较为稳定，保证训练得到的对象分类模型都具有较高的分类准确度，从而避免仅采用包含有非线性关系的指数函数使得分类损失的计算结果存在波动较大、难以有效的收敛的问题。

可选地，执行步骤S122以计算所述第二相似参数的具体方式也不受限制，可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，基于所述第二指数函数中指数的值与对象向量和其它标签向量之间的向量夹角是否具有线性关系，计算所述第二相似参数的具体方式可以有不同的选择。

也就是说，在一种具体的应用示例中，在所述第二指数函数中，指数的值与对象向量和标签向量之间的向量夹角可以具有线性关系。在另一种具体的应用示例中，考虑到对象向量与不同的其它标签向量之间的向量夹角不具有规律性，在所述第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角可以不具有线性关系，即具有非线性关系。

又例如，在一种可以替代的示例中，基于是否考虑分类的类间聚合度、类数量和准确度，计算所述第二相似参数的具体方式也可以有不同的选择。

例如，在一种具体的应用示例中，若不需要考虑分类的类间聚合度、类数量和准确度，可以在所述第二指数函数中，不设置任何的惩罚因子。

又例如，在另一种具体的应用示例中，考虑到在较多的应用领域中，如基于图像识别领域中的人脸识别，一般都会涉及到较多的分类(如前所述的上千万的人脸识别分类)，使得对分类的类数量具有一定的需求。

基于此，在所述第二指数函数中，可以包括第二乘性惩罚因子，如前所述，该第二乘性惩罚因子与分类的类数量之间具有正相关关系，即在对分类的类数量具有较大的需求时，可以设置一个较大的第二乘性惩罚因子。

因此，为了使得第二指数函数满足上述的需求，结合图6，所述对象分类模型训练方法还可以包括步骤S160和步骤S170，具体内容如下所述。

步骤S160，获得响应用户第二参数配置操作生成的第二参数配置指令。

在本实施例中，在进行神经网络模型的训练之前，所述电子设备10还可以先获得预先生成的第二参数配置指令。其中，该第二参数配置指令，可以是(电子设备10，或其它设备)响应用户的第二参数配置操作生成。换言之，用户可以通过第二参数配置操作生成第二参数配置指令，诸如，用户可以通过指定端口(诸如电子设备10呈现的指定界面的参数配置输入框中)输入所需配置的指数函数的函数表达式以及参数值，此时生成了携带有指数函数的函数表达式以及参数值的第二参数配置指令。

步骤S170，基于所述第二参数配置指令对指数函数进行配置处理，得到第二指数函数。

在本实施例中，在基于步骤S160获得所述第二参数配置指令之后，所述电子设备10还可以基于该第二参数配置指令对预设的指数函数进行配置处理，以得到第二指数函数。

其中，在需要所述第二指数函数中指数的值与对象向量和其它标签向量之间的向量夹角具有线性关系时，可以生成第一种类型的第二参数配置指令，以配置具有线性关系的第二指数函数。在需要所述第二指数函数中指数的值与对象向量和其它标签向量之间的向量夹角非具有线性关系时，可以生成第二种类型的第二参数配置指令，以配置具有非线性关系的第二指数函数。在实际应用中可以根据需求而灵活设置，诸如可以由用户在执行第二参数配置操作时根据需求而直接设置指数的值与对象向量和其它标签向量之间的向量夹角是否具有线性关系。

并且，上述的非线性关系的具体内容也不受限制，也可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，上述的非线性关系，可以是一种反三角函数关系，如基于反余弦关系的非线性关系。

又例如，在另一种可以替代的示例中，上述的非线性关系，也可以是一种三角函数关系，如基于余弦关系的非线性关系。

基于此，在具有余弦的非线性关系和具有乘性惩罚的需求的基础上，所述第二指数函数可以包括：

其中，

可以为所述第二相似参数，s可以为第二乘性惩罚因子，且该第二乘性惩罚因子与分类的类数量之间具有正相关关系，θ _j可以为所述对象向量和所述其它标签向量之间的向量夹角。

可以理解的是，在上述的示例中，“线性关系”可以是指，指数的值与向量夹角之间的变化趋势固定，即形成的函数关系中，斜率为固定值。

可选地，执行步骤S123以计算所述相似概率参数的具体方式也不受限制，可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，针对每一个对象向量，可以先计算该对象向量对应的一个第一相似参数与对应的全部第二相似参数的和值，然后，再计算该第一相似参数与该和值的商值(即前者除后者)，如此，可以得到该对象向量的相似概率参数。

又例如，在另一种可以替代的示例中，针对每一个对象向量，可以先计算该对象向量对应的全部第二相似参数的加权和值(即可以预设配置权重系数)，再计算该加权和值与该对象向量对应的一个第一相似参数的和值，然后，再计算该第一相似参数与该和值的商值，如此，也可以得到该对象对象的相似概率参数。

第三方面，对于步骤S130需要说明的是，对所述神经网络模型进行训练的具体方式也不受限制，可以根据实际应用需求进行选择。

例如，在一种可以替代的示例中，可以直接基于计算得到的分类损失，按照反向传播算法(Backpropagation algorithm，BP算法，是一种监督学习算法)对所述神经网络模型进行训练，即该神经网络模型包括用于将所述样本对象转换为对应的对象向量的特征提取层和图像分类层等。

又例如，在另一种可以替代的示例中，在所述分类损失的基础上，还可以结合其它类型的损失，先计算得到总损失。然后，在基于该总损失，按照反向传播算法对所述神经网络模型进行训练。

结合图7，本申请实施例还提供一种可应用于上述电子设备10的对象分类方法。其中，所述对象分类方法有关的流程所定义的方法步骤，可以由所述电子设备10实现。下面将对图7所示的具体流程，进行详细阐述。

步骤S210，将获得的目标对象输入至预设的对象分类模型。

在本实施例中，所述电子设备10在获得所述目标对象之后，可以先将该目标对象输入至预设的对象分类模型中。

其中，所述目标对象可以为目标图像。所述对象分类模型可以是，基于前述的对象分类模型训练方法对初始的神经网络模型进行训练得到。

步骤S220，通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型。

在本实施例中，在基于步骤S210将所述目标对象输入至所述对象分类模型之后，所述电子设备10可以通过该对象分类模型对该目标对象进行类型识别处理，从而得到该目标对象的对象类型。

其中，在所述目标对象为目标图像时，所述对象分类模型可以是一种图像识别模型，用于对该目标图像进行识别，如进行人脸特征识别，以确定该目标图像中的人脸是否属于某一个人。

由于上述对象分类模型是基于前述对象分类模型训练方法训练得到的，因此识别分类性能也较为稳定，具有较高的分类准确度。

结合图8，本申请实施例还提供一种对象分类模型训练装置100，可应配置成上述的电子设备10。其中，所述对象分类模型训练装置100可以包括向量获得模块110、参数计算模块120和模型训练模块130。

所述向量获得模块110，可以配置成获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量，其中，该样本对象为多个，且与多个样本标签具有一一对应关系。在本实施例中，所述向量获得模块110可配置成执行图2所示的步骤S110，关于所述向量获得模块110的相关内容可以参照前文对步骤S110的描述。

所述参数计算模块120，可以配置成基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在该分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系。在本实施例中，所述参数计算模块120可配置成执行图2所示的步骤S120，关于所述参数计算模块120的相关内容可以参照前文对步骤S120的描述。

所述模型训练模块130，可以配置成基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，所述样本对象为样本图像，所述对象分类模型配置成对目标图像的类型进行分类确定。在本实施例中，所述模型训练模块130可配置成执行图2所示的步骤S130，关于所述模型训练模块130的相关内容可以参照前文对步骤S130的描述。

由于大多相关的模型训练技术所采用的分类算法中基本采用非线性关系的函数，诸如，采用的指数函数的指数的值与对象向量和标签向量之间的向量夹角具有余弦非线性关系，因而该指数的值具有较大的波动，使得分类损失的计算结果存在波动较大、难以有效的收敛。相比之下，基于本公开实施例提供的上述对象分类模型训练装置，由于分类算法中包括具有线性关系的函数，使得基于该分类算法得到的相似概率参数用于计算分类损失时，可以保证计算得到的损失可以平稳的进行收敛，从而使得基于该分类损失训练得到的对象分类模型的识别分类性能也较为稳定，保证训练得到的对象分类模型都具有较高的分类准确度，进而改善相关技术中训练得到的对象分类模型容易出现分类准确度不高的问题。特别是在应用于人脸识别分类时，由于人脸图像的类型较多(如100万个人，就有10万个类型)，使得本公开实施例提供的上述模型训练方法对于这种多分类的领域具有较好的应用效果，实用价值较高。

可选地，所述装置还包括因子赋值模块，配置成：

可选地，所述第一指数函数包括：

可选地，所述装置还包括第二指数函数生成模块，配置成：

其中，

结合图9，本申请实施例还提供一种对象分类装置200，可应配置成上述的电子设备10。其中，所述对象分类装置200可以包括对象输入模块210和对象分类模块220。

所述对象输入模块210，可以配置成将获得的目标对象输入至预设的对象分类模型，其中，该对象分类模型可以基于上述的对象分类模型训练装置进行训练得到。在本实施例中，所述对象输入模块210可配置成执行图7所示的步骤S210，关于所述对象输入模块210的相关内容可以参照前文对步骤S210的描述。

所述对象分类模块220，可以配置成通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型，其中，该目标对象为目标图像。在本实施例中，所述对象分类模块220可配置成执行图7所示的步骤S220，关于所述对象分类模块220的相关内容可以参照前文对步骤S220的描述。

由于上述对象分类装置中所采用的对象分类模型是基于前述对象分类模型训练装置训练得到的，因此识别分类性能也较为稳定，具有较高的分类准确度。

在本申请实施例中，对应于上述的对象分类模型训练方法，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，该计算机程序运行时执行上述对象分类模型训练方法的各个步骤。

其中，前述计算机程序运行时执行的各步骤，在此不再一一赘述，可参考前文对所述对象分类模型训练方法的解释说明。

并且，在本申请实施例中，对应于上述的对象分类方法，也提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，该计算机程序运行时执行上述对象分类方法的各个步骤。

其中，前述计算机程序运行时执行的各步骤，在此不再一一赘述，可参考前文对所述对象分类方法的解释说明。

综上所述，本申请提供的模型训练、对象分类方法和装置、电子设备及存储介质，在计算分类损失时，通过采用包括具有线性关系的函数的分类算法，使得计算得到的分类损失可以比较平稳的进行收敛。如此，由于分类损失可以平稳的进行收敛，使得基于该分类损失训练得到的对象分类模型的识别分类性能也较为稳定，保证训练得到的对象分类模型都具有较高的分类准确度，从而避免采用现有的模型训练技术使得分类损失的计算结果存在波动较大、难以有效的收敛的问题，进而改善相关技术中训练得到的对象分类模型容易出现分类准确度不高的问题，特别是在应用于人脸识别分类时，由于人脸图像的类型较多(如100万个人，就有10万个类型)，使得对于这种多分类的领域具有较好的应用效果，实用价值较高。

在本申请实施例所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

工业实用性

本申请提出的技术方案中，在计算分类损失时，通过采用包括具有线性关系的函数的分类算法，使得计算得到的分类损失可以比较平稳的进行收敛。如此，由于分类损失可以平稳的进行收敛，使得基于该分类损失训练得到的对象分类模型的识别分类性能也较为稳定，保证训练得到的对象分类模型都具有较高的分类准确度，从而避免采用相关的模型训练技术使得分类损失的计算结果存在波动较大、难以有效的收敛的问题，进而改善相关技术中训练得到的对象分类模型容易出现分类准确度不高的问题，具有较高的实用价值。

Claims

一种对象分类模型训练方法，其特征在于，包括：

获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量，其中，该样本对象为多个，且与多个样本标签具有一一对应关系；

基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在该分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系；

基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，所述样本对象为样本图像，所述对象分类模型用于对目标图像的类型进行分类确定。
根据权利要求1所述的对象分类模型训练方法，其特征在于，所述分类算法包括指数函数，所述基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数的步骤，包括：

针对每一个对象向量，基于第一指数函数计算该对象向量与目标标签向量之间的第一相似参数，其中，该目标标签向量对应的样本标签与该对象向量对应的样本对象之间具有对应关系，且在该第一指数函数中，指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系；

针对每一个对象向量，基于第二指数函数计算该对象向量与每一个其它标签向量之间的第二相似参数，其中，该其它标签向量为全部标签向量中所述目标标签向量以外的标签向量；

针对每一个对象向量，基于归一化函数对该对象向量的第一相似参数和第二相似参数进行处理，得到相似概率参数。
根据权利要求1或2所述的对象分类模型训练方法，其特征在于，所述第一指数函数中包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子中的一种或多种；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度相关，所述第二乘性惩罚因子与分类的类数量相关，所述加性惩罚因子与分类的准确度相关。
根据权利要求3所述的对象分类模型训练方法，其特征在于，所述方法还包括：

获得响应用户的第一参数配置操作生成的第一参数配置指令；

基于所述第一参数配置指令对所述第一乘性惩罚因子、所述第二乘性惩罚因子和所述加性惩罚因子，分别进行赋值处理；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度之间具有正相关关系，所述第二乘性惩罚因子与分类的类数量之间具有正相关关系，所述加性惩罚因子与分类的准确度之间具有正相关关系。
根据权利要求4所述的对象分类模型训练方法，其特征在于，所述第一指数函数包括：

其中，χ为所述第一相似参数，a为所述第一乘性惩罚因子，s为所述第二乘性惩罚因子，b为所述加性惩罚因子，θ _yt为所述对象向量和所述目标标签向量之间的向量夹角。
根据权利要求2-5任意一项所述的对象分类模型训练方法，其特征在于，该方法还包括：

获得响应用户的第二参数配置操作生成的第二参数配置指令；

基于所述第二参数配置指令对指数函数进行配置处理，得到第二指数函数，其中，在该第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有非线性关系。
根据权利要求6所述的对象分类模型训练方法，其特征在于，在所述第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有余弦的非线性关系，所述第二指数函数包括：

其中，
为所述第二相似参数，s为第二乘性惩罚因子，且该第二乘性惩罚因子与分类的类数量之间具有正相关关系，θ _j为所述对象向量和所述其它标签向量之间的向量夹角。
根据权利要求1所述的对象分类模型训练方法，其特征在于，所述分类算法包括对数函数，在所述对数函数中，真数的值与对象向量和标签向量之间的向量夹角具有线性关系。
一种对象分类方法，其特征在于，包括：

将获得的目标对象输入至预设的对象分类模型，其中，该对象分类模型基于权利要求1-8任意一项所述的对象分类模型训练方法进行训练得到；

通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型，其中，该目标对象为目标图像。
一种对象分类模型训练装置，其特征在于，包括：

向量获得模块，配置成获得每一个样本对象对应的对象向量、每一个样本标签对应的标签向量，其中，该样本对象为多个，且与多个样本标签具有一一对应关系；

参数计算模块，配置成基于预设的分类算法计算每一个对象向量与每一个标签向量之间的相似概率参数，其中，在该分类算法包括的至少部分函数中，函数的值与对象向量和标签向量之间的向量夹角具有线性关系；

模型训练模块，配置成基于所述相似概率参数计算得到分类损失，并基于该分类损失对预设的神经网络模型进行训练，得到对象分类模型，其中，所述样本对象为样本图像，所述对象分类模型配置成对目标图像的类型进行分类确定。
根据权利要求10所述的对象分类模型训练装置，其特征在于，所述分类算法包括指数函数，所述参数计算模块进一步配置成：

针对每一个对象向量，基于第一指数函数计算该对象向量与目标标签向量之间的第一相似参数，其中，该目标标签向量对应的样本标签与该对象向量对应的样本对象之间具有对应关系，且在该第一指数函数中，指数的值与对象向量和目标标签向量之间的向量夹角具有线性关系；

针对每一个对象向量，基于第二指数函数计算该对象向量与每一个其它标签向量之间的第二相似参数，其中，该其它标签向量为全部标签向量中所述目标标签向量以外的标签向量；

针对每一个对象向量，基于归一化函数对该对象向量的第一相似参数和第二相似参数进行处理，得到相似概率参数。
根据权利要求10或11所述的对象分类模型训练装置，其特征在于，所述第一指数函数中包括第一乘性惩罚因子、第二乘性惩罚因子和加性惩罚因子中的一种或多种；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度相关，所述第二乘性惩罚因子与分类的类数量相关，所述加性惩罚因子与分类的准确度相关。
根据权利要求12所述的对象分类模型训练装置，其特征在于，所述装置还包括因子赋值模块，配置成：

获得响应用户的第一参数配置操作生成的第一参数配置指令；

基于所述第一参数配置指令对所述第一乘性惩罚因子、所述第二乘性惩罚因子和所述加性惩罚因子，分别进行赋值处理；

其中，所述第一乘性惩罚因子的数值与分类的类间聚合度之间具有正相关关系，所述第二乘性惩罚因子与分类的类数量之间具有正相关关系，所述加性惩罚因子与分类的准确度之间具有正相关关系。
根据权利要求13所述的对象分类模型训练装置，其特征在于，所述第一指数函数包括：

其中，χ为所述第一相似参数，a为所述第一乘性惩罚因子，s为所述第二乘性惩罚因子，b为所述加性惩罚因子，θ _yt为所述对象向量和所述目标标签向量之间的向量夹角。
根据权利要求11-14任意一项所述的对象分类模型训练装置，其特征在于，所述装置还包括第二指数函数生成模块，配置成：

获得响应用户的第二参数配置操作生成的第二参数配置指令；

基于所述第二参数配置指令对指数函数进行配置处理，得到第二指数函数，其中，在该第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有非线性关系。
根据权利要求15所述的对象分类模型训练装置，其特征在于，在所述第二指数函数中，指数的值与对象向量和其它标签向量之间的向量夹角具有余弦的非线性关系，所述第二指数函数包括：

其中，
为所述第二相似参数，s为第二乘性惩罚因子，且该第二乘性惩罚因子与分类的类数量之间具有正相关关系，θ _j为所述对象向量和所述其它标签向量之间的向量夹角。
一种对象分类装置，其特征在于，包括：

对象输入模块，配置成将获得的目标对象输入至预设的对象分类模型，其中，该对象分类模型基于权利要求10至16任一项所述的对象分类模型训练装置进行训练得到；

对象分类模块，配置成通过所述对象分类模型对所述目标对象进行类型识别处理，得到该目标对象的对象类型，其中，该目标对象为目标图像。
一种电子设备，其特征在于，包括：

存储器，配置成存储计算机程序；

与所述存储器连接的处理器，配置成执行该存储器存储的计算机程序，以实现权利要求1-8任意一项所述的对象分类模型训练方法，或实现权利要求9所述的对象分类方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被执行时，实现权利要求1-8任意一项所述的对象分类模型训练方法，或实现权利要求9所述的对象分类方法。