CN114067415A

CN114067415A - 回归模型的训练方法、对象评估方法、装置、设备和介质

Info

Publication number: CN114067415A
Application number: CN202111427652.XA
Authority: CN
Inventors: 彭涵宇; 骈纬国; 孙明明; 李平
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-11-26
Filing date: 2021-11-26
Publication date: 2022-02-18

Abstract

本公开提供了一种回归模型的训练方法、对象评估方法、装置、设备、介质和产品，涉及人工智能领域，尤其涉及深度学习技术领域。回归模型的训练方法包括：将原始训练样本输入回归模型，得到针对原始训练样本的初始评估值；根据预定输出阈值和初始评估值，得到加噪评估值，其中，加噪评估值与初始评估值之间的差小于等于预定输出阈值；根据加噪评估值，得到附加噪声值；将附加噪声值添加到原始训练样本，得到更新后训练样本；利用更新后训练样本对回归模型进行训练。

Description

回归模型的训练方法、对象评估方法、装置、设备和介质

技术领域

本公开涉及人工智能领域，尤其涉及深度学习技术领域，更具体地，涉及一种回归模型的训练方法、对象评估方法、装置、电子设备、介质和程序产品。

背景技术

在模型训练中，可以利用对原始训练样本添加随机噪声来生成新的样本。在以上样本生成方法应用于回归模型这种输出值为连续值的模型训练中的情况下，在损失函数一定的情况下，模型输出值与样本实际值差异较大，导致训练的效率和准确度均较差。

发明内容

本公开提供了一种回归模型的训练方法、对象评估方法、装置、电子设备、存储介质以及程序产品。

根据本公开的一方面，提供了一种回归模型的训练方法，包括：将原始训练样本输入回归模型，得到针对所述原始训练样本的初始评估值；根据预定输出阈值和所述初始评估值，得到加噪评估值，其中，所述加噪评估值与所述初始评估值之间的差小于等于所述预定输出阈值；根据所述加噪评估值，得到附加噪声值；将所述附加噪声值添加到所述原始训练样本，得到更新后训练样本；利用所述更新后训练样本对所述回归模型进行训练。

根据本公开的另一方面，提供了一种对象评估方法，包括：获取目标对象的对象数据；将所述对象数据输入回归模型，得到针对所述目标对象的评估数据；其中，所述回归模型是利用上述回归模型的训练方法训练的。

根据本公开的另一方面，提供了一种回归模型的训练装置，包括：第一输入模块、第一获得模块、第二获得模块、添加模块以及训练模块。第一输入模块，用于将原始训练样本输入回归模型，得到针对所述原始训练样本的初始评估值；第一获得模块，用于根据预定输出阈值和所述初始评估值，得到加噪评估值，其中，所述加噪评估值与所述初始评估值之间的差小于等于所述预定输出阈值；第二获得模块，用于根据所述加噪评估值，得到附加噪声值；添加模块，用于将所述附加噪声值添加到所述原始训练样本，得到更新后训练样本；训练模块，用于利用所述更新后训练样本对所述回归模型进行训练。

根据本公开的另一方面，提供了一种对象评估装置，包括：获取模块和第二输入模块。获取模块，用于获取目标对象的对象数据；第二输入模块，用于将所述对象数据输入回归模型，得到针对所述目标对象的评估数据；其中，所述回归模型是上述回归模型的训练装置训练的。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器和与所述至少一个处理器通信连接的存储器。其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的回归模型的训练方法和/或对象评估方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述的回归模型的训练方法和/或对象评估方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述的回归模型的训练方法和/或对象评估方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示意性示出了一种对象评估的应用场景；

图2示意性示出了根据本公开一实施例的回归模型的训练方法的流程图；

图3示意性示出了根据本公开一实施例的回归模型的训练方法的原理图；

图4示意性示出了根据本公开一实施例的对象评估方法的流程图；

图5示意性示出了根据本公开一实施例的回归模型的训练装置的框图；

图6示意性示出了根据本公开一实施例的对象评估装置的框图；以及

图7是用来实现本公开实施例的用于执行回归模型的训练和/或对象评估的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

图1示意性示出了一种对象评估的应用场景。

如图1所示，根据本公开实施例的应用场景100，虚线左边为利用分类模型对对象数据进行评估的示例，虚线右边为利用回归模型对对象数据进行评估的示例。对象数据例如包括图像数据。

如图1左侧所示，将第一原始图像111输入分类模型中得到分类结果，分类结果例如包括第一原始图像111中对象所属的类别概率，类别例如包括猫、狗、鸟等。例如，针对第一原始图像111的分类正确率为0.80(对象属于猫的概率)。

为了提高样本图像的数量，可以将随机噪声添加至第一原始图像111中，得到第一加噪图像112。将第一加噪图像112输入分类模型中得到分类结果，分类结果例如包括第一加噪图像112中对象所属的类别概率。例如，针对第一加噪图像112的分类正确率为0.71(对象属于猫的概率)。

在分类模型中，尽管对于第一加噪图像112的分类正确率(0.71)低于第一原始图像111的分类正确率(0.80)，但是仍然是分类正确的，分类模型不太可能将其误分类为其它不同的类别，例如自行车。这是因为在分类问题中，类别的分布是离散的，并且类别之间具有很大的分歧。

然而，回归问题与分类问题不同。回归问题是机器学习和统计分析中的一项基础研究问题，这项问题涉及对一个或多个自变量和因变量之间的关系进行建模。与输出离散值的分类问题不同的是，回归问题的输出是连续值。近年来，不平衡问题与分类问题的结合所产生的不平衡分类问题引起了研究者的广泛关注。通过类比，人们开始质疑，是否也存在长尾回归问题(或者也可以称之为非均衡回归)。例如，已经有人提出了一项新任务，即长尾回归(类别的数据量分布不均衡，有的类样本非常多，有的类样本非常少)。该项任务在实际应用中具有重要的意义，例如，根据面部图像的年龄，估计医疗保健中不同人群的健康指标。这些应用的样本分布具有长尾的特性。更进一步说，长尾回归的研究现状难以满足实际应用中对模型的性能要求。

针对回归问题，如图1右侧所示，将第二原始图像121输入回归模型中得到评估结果，评估结果例如包括第二原始图像121中对象的年龄55.3岁。

为了提高样本图像的数量，可以将随机噪声添加至第二原始图像121中，得到第二加噪图像122。将第二加噪图像122输入回归模型中得到的评估结果例如为52.6岁。

与第二原始图像121的年龄评估结果(55.3岁)相比较，回归模型对第二加噪图像122的年龄估计结果为52.6岁，52.6岁与55.3岁之间的误差过大，表示直接将随机噪声添加至第二原始图像121得到的第二加噪图像122是难以接受的。

有鉴于此，本公开的实施例提出了一种合理有效地控制并利用噪声来生成加噪图像的方法，并且提出了如何使用自监督学习来提高长尾回归的性能和泛化性的问题。下面参考图2～图4来描述根据本公开示例性实施方式的回归模型的训练方法和对象评估方法。

本领域技术人员可以理解，根据本公开实施例，回归模型(regression model)可以包括各种线性回归模型和非线性回归模型，本公开实施例不对此进行限制，只要是对统计关系进行定量描述的模型即可。

图2示意性示出了根据本公开一实施例的回归模型的训练方法的流程图。

如图2所示，本公开实施例的回归模型的训练方法200例如可以包括操作S210～操作S250。

在操作S210，将原始训练样本输入回归模型，得到针对原始训练样本的初始评估值。

在操作S220，根据预定输出阈值和初始评估值，得到加噪评估值。

在操作S230，根据加噪评估值，得到附加噪声值。

在操作S240，将附加噪声值添加到原始训练样本，得到更新后训练样本。

在操作S250，利用更新后训练样本对回归模型进行训练。

示例性地，原始训练样本例如包括脸部图像样本，回归模型例如用于评估对象的年龄。将原始训练样本输入回归模型得到的初始评估值例如为50(表示50岁)。

预定输入阈值例如可以根据需求进行设置，例如可以设置为1(表示1岁)、0.5(表示0.5岁)等。例如，将预定输入阈值设置为0.5，这可以指示在该示例中，对于实际标签为50的原始样本，可接受的最大输出偏差是0.5岁。基于初始评估值50和预定输入阈值0.5得到加噪评估值，加噪评估值与初始评估值50之间的差例如小于等于预定输出阈值0.5，可以将加噪评估值随机设置为小于预定输出阈值0.5的任意数值，例如加噪评估值可以是50.3或49.7。

接下来，可以基于加噪评估值50.3确定附加噪声值，附加噪声值例如可以是随机噪声值，将附加噪声值添加至原始训练样本得到更新后训练样本，更新后训练样本例如是加噪脸部图像。更新后训练样本可以用于训练回归模型。

根据本公开的实施例，基于预定输出阈值对原始训练样本输入回归模型得到的输出值(初始评估值)施加约束，得到加噪评估值，并根据加噪评估值得到附加噪声值，将附加噪声值添加到原始训练样本得到更新后训练样本。可以理解，通过对回归模型针对原始训练样本的输出值(初始评估值)施加约束的方式得到更新后训练样本，使得更新后训练样本与原始训练样本更加相似，利用更新后训练样本训练回归模型可以提高模型的精度。

图3示意性示出了根据本公开一实施例的回归模型的训练方法的原理图。

如图3所示，将原始训练样本x_i输入回归模型310中，得到针对原始训练样本x_i的初始评估值

原始训练样本x_i例如包括脸部图像样本，回归模型310例如用于评估对象(脸部)的年龄。将原始训练样本x_i输入回归模型310得到的初始评估值

例如为50。

然后，根据预定输出阈值z_i和初始评估值

得到加噪评估值

预定输出阈值z_i例如可以从区间[0，Δy]中随机采样得到，Δy可以设置为1(表示1岁)。例如，随机采样得到的预定输出阈值zi可以是0.5。

加噪评估值

与初始评估值

之间的差例如小于等于预定输出阈值z_i，例如，根据预定输出阈值z_i和初始评估值

得到的加噪评估值

为50.3。

接下来，根据加噪评估值

得到附加噪声值r_i，当原始训练样本x_i为脸部图像时，附加噪声值r_i可以包括针对脸部图像中每个像素的调整值。将附加噪声值r_i添加到原始训练样本x_i，得到更新后训练样本

例如，

其中，将附加噪声值r_i添加到原始训练样本x_i例如包括调整原始训练样本x_i的像素值。

在得到更新后训练样本

之后，可以将更新后训练样本

输入回归模型310中，以对回归模型310进行训练。

本公开实施例例如可以包括多个原始训练样本，下标i例如表示第i个原始训练样本，i为大于等于1的整数。本领域技术人员可以理解，可以对多个原始训练样本中的每一个执行相同操作。

本公开实施例通过控制噪声的范围来将针对原始训练样本x_i输出的初始评估值

和加噪评估值

之间的差值限制在Δy之内，以提高更新后训练样本

和原始训练样本x_i之间的相似性。换言之，本公开实施例没有直接在原始训练样本x_i中添加噪声，而是基于期望的加噪评估值

根据针对原始训练样本x_i输出的初始评估值

来得到要添加到原始训练样本的附加噪声值r_i。该过程可以用以下公式表示：

s.t.||r_i||＜ε (2)

其中，

f(x)表示回归模型；θ表示回归模型的模型参数；

表示距离损失函数，距离损失函数

可以为任意距离函数，例如为L1范数、L2范数、绝对差等；i表示第i个原始训练样本。s.t.表示使得||r_i||＜ε，其中，ε为预定值(也称噪声约束值)，ε例如可以为0.0001。

需要注意的是，|z_i|可以从[0，Δy]中随机采样得到，由此保证加噪评估值

和初始评估值

之间的相似性，同时提高了输出的局部平滑度。

在本公开的一示例中，可以通过自监督不平衡回归(Self-SupervisedImbalanced Regression，SSIR)方法得到附加噪声值r_i。一个示例过程如下描述。

由于神经网络是高维、非线性的，因此在通常情况下，难以获得关于附加噪声值r_i的闭式解(closedform solution)。为了有效求解附加噪声值r_i，在一个示例中，可以通过以下一阶泰勒展开式近似表示距离损失函数

其中，s.t.||r_i||≤ε，

a表示关于x的常数项，x表示至少一个原始训练样本，x_i表示第i个原始训练样本。基于此，附加噪声值r_i的闭式解可以被表示为：

基于此，附加噪声值r_i的闭式解可以被表示为：

由于

因此上述公式(5)可进一步表示为：

在本公开的一示例中，根据加噪评估值

得到附加噪声值r_i例如包括通过一步优化的方式得到。具体过程如下描述。

例如，基于加噪评估值

和初始评估值

执行梯度优化。例如可以利用以下公式(7)，得到第一优化梯度值g_i。然后，根据第一优化梯度值g_i和预定噪声约束值ε，得到第一附加噪声值，将第一附加噪声值作为附加噪声值r_i，例如利用以下公式(8)。

例如，针对初始化随机噪声(预定输出阈值Z_i)，其中|z_i|＜Δy；

f(·；θ)中的“·”表示参数待输入，例如可以是x_i。利用

关于x_i的梯度，计算r_i：

其中，g_i1为第一优化梯度值。

根据第一优化梯度值g_i1和预定噪声约束值ε，得到附加噪声值r_i：

r_i←ε×g_i1/||g_i1||₂ (8)

根据本公开的实施例，一步优化的方式得到附加噪声值r_i，提高了数据处理的速度，进而提高了回归训练模型的训练效率。

在本公开的另一示例中，根据加噪评估值

得到附加噪声值r_i例如包括通过二步优化或二步以上优化的方式得到。以二步优化方式为例进行说明。

在通过上述公式(8)得到附加噪声值r_i(第一附加噪声值)之后，基于附加噪声值r_i(第一附加噪声值)更新加噪评估值

例如，将第一附加噪声值添加到原始训练样本x_i，得到第一更新后训练样序

如公式(9)所示。

其中，原始训练样本x_i中，值的范围例如为(v_min，v_max)，

表示用于截断超出范围值的函数。根据本公开实施例，可以根据训练样本的类型来确定(v_min，v_max)。例如，在训练样本为图像数据的情况下，(v_min，v_max)可以设置为(0，255)。

将第一更新后训练样本

输入回归模型，得到二次评估值

根据预定输出阈值z_i和二次评估值

得到二次加噪评估值

如公式(10)所示。

基于二次加噪评估值

和二次评估值

执行梯度优化，得到第二优化梯度值g_i2，如公式(11)所示。

根据第二优化梯度值g_i2和所述预定噪声约束值ε，得到第二附加噪声值，作为二步优化后的附加噪声值r_i2，如公式(12)所示。基于此，通过两步优化即可得到附加噪声值r_i2。

r_i2←ε×g_i2/||g_i2||₂ (12)

另外，还可以执行多步优化更新，例如继续基于公式(13)和公式(14)执行计算。公式(13)和公式(14)的计算过程分别和公式(9)和公式(10)的计算过程类似，在此不再赘述。

根据本公开的实施例，通过二步优化或二步以上优化的方式得到附加噪声值r_i2，并将该数值作为附加噪声值r_i，提高了附加噪声值r_i的精度，从而提高了基于附加噪声值r_i得到的更新后训练样本的精度，基于精度较高的更新后训练样本训练回归模型，可以得到高精度的回归模型。

在本公开的实施例中，原始训练样本包括多个原始训练样本，例如，原始训练样本可以包括多个批次，其中一个批次例如包括M个原始训练样本，M为大于1的整数。更新后训练样本包括与原始训练样本对应的多个更新后训练样本。

示例性地，利用更新后训练样本对回归模型进行训练包括：将多个更新后训练样本逐一输入回归模型，得到多个输出评估值，并根据多个输出评估值的均值，调整回归模型的模型参数θ，使得回归模型的损失函数收敛，从而得到调整后的模型参数

调整回归模型的模型参数θ如公式(15)所示。

根据本公开的实施例，初始评估值例如包括与原始训练样本对应的多个初始评估值。根据多个输出评估值的均值，调整回归模型的模型参数θ，使得回归模型的损失函数收敛例如包括：

根据多个输出评估值的均值(与以下示出的公式(16)中的

相关联)和多个初始评估值的均值(与以下示出的公式(16)中的

相关联)，调整回归模型的模型参数θ，使得回归模型的损失函数收敛。具体如下描述。

本公开实施例针对回归模型的训练策略是将标准的回归训练和自监督回归进行结合。关于回归训练，可以直接使用有监督学习来最小化模型的输出

(初始评估值)和针对原始训练样本x_i的标签y(例如为年龄)之间的损失函数值。此外，本公开的实施例还引入了一个额外的因子λ来调节回归损失

和自监督回归损失(f(x_i；θ)，f(x_i+r_i；θ))之间的平衡。总的损失函数如公式(16)所示：

其中，因子λ为经验值，引入因子λ使得预测值(例如为针对原始训练样本x_i的标签y)与加噪后样本的输出值(例如为针对更新后训练样本的输出评估值)更接近，经训练的回归模型更稳定。N为样本总个数，即，原始训练样本包括多个批次，N为所有批次的原始训练样本的总个数。

在本公开的另一示例中，将附加噪声值添加到原始训练样本，得到更新后训练样本例如包括如下操作。

例如，根据原始训练样本的类型，确定针对原始训练样本的样本范围。当原始训练样本的类型为图像类型时，样本范围例如为针对像素值的范围[0，255]。

在得到更新后训练样本之后，确定更新后训练样本中每个像素的像素值是否处于样本范围以内。如果更新后训练样本的像素值没有处于样本范围以内，可以对更新后训练样本进行处理，使得经处理的更新后训练样本的像素值处于样本范围以内。

例如，基于上述过程计算得到的附加噪声值r_i，得到更新后训练样本

但是，此时的更新后训练样本

中可能有一些像素的像素值会超出样本范围[0，255]。因此，在计算得到更新后训练样本

之后，对更新后训练样本

中超出样本范围[0，255]的像素值进行截断操作，例如将大于255的像素值设置为255，将小于0的像素值设置为0。

图4示意性示出了根据本公开一实施例的对象评估方法的流程图。

如图4所示，本公开实施例的对象评估方法400例如可以包括操作S410～操作S420。

在操作S410，获取目标对象的对象数据。

在操作S420，将对象数据输入回归模型，得到针对目标对象的评估数据。

示例性地，回归模型例如是利用上述回归模型的训练方法训练得到的。

示例性地，对象数据例如包括图像数据或音频数据。当对象数据为图像数据时，利用回归模型基于图像数据进行图像识别处理得到针对目标对象(脸部)的年龄作为评估数据。当对象数据为音频数据时，利用回归模型基于音频数据进行语音识别处理得到针对目标对象(发声者)的年龄或音质评估值作为评估数据。

根据本公开的实施例，利用上述的回归模型的训练方法得到的回归模型的精度更高，基于高精度的回归模型进行对象评估，提高了评估的精度。

图5示意性示出了根据本公开一实施例的回归模型的训练装置的框图。

如图5所示，本公开实施例的回归模型的训练装置500例如包括第一输入模块510、第一获得模块520、第二获得模块530、添加模块540以及训练模块550。

第一输入模块510可以用于将原始训练样本输入回归模型，得到针对原始训练样本的初始评估值。根据本公开实施例，第一输入模块510例如可以执行上文参考图2描述的操作S210，在此不再赘述。

第一获得模块520可以用于根据预定输出阈值和初始评估值，得到加噪评估值，其中，加噪评估值与初始评估值之间的差小于等于预定输出阈值。根据本公开实施例，第一获得模块520例如可以执行上文参考图2描述的操作S220，在此不再赘述。

第二获得模块530可以用于根据加噪评估值，得到附加噪声值。根据本公开实施例，第二获得模块530例如可以执行上文参考图2描述的操作S230，在此不再赘述。

添加模块540可以用于将附加噪声值添加到原始训练样本，得到更新后训练样本。根据本公开实施例，添加模块540例如可以执行上文参考图2描述的操作S240，在此不再赘述。

训练模块550可以用于利用更新后训练样本对回归模型进行训练。根据本公开实施例，训练模块550例如可以执行上文参考图2描述的操作S250，在此不再赘述。

根据本公开的实施例，第二获得模块530包括：第一优化子模块和第一获得子模块。第一优化子模块，用于基于加噪评估值和初始评估值，执行梯度优化，得到第一优化梯度值；第一获得子模块，用于根据第一优化梯度值和预定噪声约束值，得到第一附加噪声值，作为附加噪声值。

根据本公开的实施例，第二获得模块530还包括：添加子模块、第一输入子模块、第二获得子模块、第二优化模块和第三获得子模块。添加子模块，用于将第一附加噪声值添加到原始训练样本，得到第一更新后训练样本；第一输入子模块，用于将第一更新后训练样本输入回归模型，得到二次评估值；第二获得子模块，用于根据预定输出阈值和二次评估值，得到二次加噪评估值；第二优化模块，用于基于二次加噪评估值和二次评估值，执行梯度优化，得到第二优化梯度值；第三获得子模块，用于根据第二优化梯度值和预定噪声约束值，得到第二附加噪声值，作为附加噪声值。

根据本公开的实施例，原始训练样本包括多个原始训练样本，更新后训练样本包括与原始训练样本对应的多个更新后训练样本；其中，训练模块550包括：第二输入子模块和调整子模块。第二输入子模块，用于将多个更新后训练样本逐一输入回归模型，得到多个输出评估值；调整子模块，用于根据多个输出评估值的均值，调整回归模型的模型参数，使得回归模型的损失函数收敛。

根据本公开的实施例，初始评估值包括与原始训练样本对应的多个初始评估值；其中，调整子模块还用于：根据多个输出评估值的均值和多个初始评估值的均值，调整回归模型的模型参数，使得回归模型的损失函数收敛。

根据本公开的实施例，添加模块540包括：第一确定子模块、第二确定子模块和处理子模块。第一确定子模块，用于根据原始训练样本的类型，确定针对原始训练样本的样本范围；第二确定子模块，用于确定更新后训练样本是否处于样本范围以内；处理子模块，用于在更新后训练样本没有处于样本范围以内的情况下，对更新后训练样本进行处理，使得经处理的更新后训练样本处于样本范围以内。

图6示意性示出了根据本公开一实施例的对象评估装置的框图。

如图6所示，本公开实施例的对象评估装置600例如包括获取模块610以及第二输入模块620。

获取模块610可以用于获取目标对象的对象数据。根据本公开实施例，获取模块610例如可以执行上文参考图4描述的操作S410，在此不再赘述。

第二输入模块620可以用于将对象数据输入回归模型，得到针对目标对象的评估数据。根据本公开实施例，第二输入模块620例如可以执行上文参考图4描述的操作S420，在此不再赘述。

根据本公开的实施例，回归模型是利用回归模型训练装置训练的。

根据本公开的实施例，对象数据包括图像数据或音频数据。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开实施例的示例电子设备700的示意性框图。电子设备700旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如回归模型的训练方法和/或对象评估方法。例如，在一些实施例中，回归模型的训练方法和/或对象评估方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的回归模型的训练方法和/或对象评估方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行回归模型的训练方法和/或对象评估方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程回归模型的训练装置和/或对象评估装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的回归模型的训练装置和/或对象评估装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种回归模型的训练方法，包括：

将原始训练样本输入回归模型，得到针对所述原始训练样本的初始评估值；

根据预定输出阈值和所述初始评估值，得到加噪评估值，其中，所述加噪评估值与所述初始评估值之间的差小于等于所述预定输出阈值；

根据所述加噪评估值，得到附加噪声值；

将所述附加噪声值添加到所述原始训练样本，得到更新后训练样本；以及

利用所述更新后训练样本对所述回归模型进行训练。

2.根据权利要求1所述的方法，其中，所述根据所述加噪评估值，得到附加噪声值包括：

基于所述加噪评估值和所述初始评估值，执行梯度优化，得到第一优化梯度值；以及

根据所述第一优化梯度值和预定噪声约束值，得到第一附加噪声值，作为所述附加噪声值。

3.根据权利要求2所述的方法，其中，所述根据所述加噪评估值，得到附加噪声值还包括：

将所述第一附加噪声值添加到所述原始训练样本，得到第一更新后训练样本；

将所述第一更新后训练样本输入所述回归模型，得到二次评估值；

根据所述预定输出阈值和所述二次评估值，得到二次加噪评估值；

基于所述二次加噪评估值和所述二次评估值，执行所述梯度优化，得到第二优化梯度值；以及

根据所述第二优化梯度值和所述预定噪声约束值，得到第二附加噪声值，作为所述附加噪声值。

4.根据权利要求1所述的方法，其中，所述原始训练样本包括多个原始训练样本，所述更新后训练样本包括与所述原始训练样本对应的多个更新后训练样本；

其中，所述利用所述更新后训练样本对所述回归模型进行训练包括：

将所述多个更新后训练样本逐一输入所述回归模型，得到多个输出评估值；以及

根据所述多个输出评估值的均值，调整所述回归模型的模型参数，使得所述回归模型的损失函数收敛。

5.根据权利要求4所述的方法，其中，所述初始评估值包括与所述原始训练样本对应的多个初始评估值；

其中，所述根据所述多个输出评估值的均值，调整所述回归模型的模型参数，使得所述回归模型的损失函数收敛包括：

根据所述多个输出评估值的均值和所述多个初始评估值的均值，调整所述回归模型的模型参数，使得所述回归模型的损失函数收敛。

6.根据权利要求1所述的方法，其中，所述将所述附加噪声值添加到所述原始训练样本，得到更新后训练样本包括：

根据所述原始训练样本的类型，确定针对所述原始训练样本的样本范围；

确定更新后训练样本是否处于所述样本范围以内；以及

在所述更新后训练样本没有处于所述样本范围以内的情况下，对所述更新后训练样本进行处理，使得经处理的更新后训练样本处于所述样本范围以内。

7.一种对象评估方法，包括：

获取目标对象的对象数据；以及

将所述对象数据输入回归模型，得到针对所述目标对象的评估数据；

其中，所述回归模型是利用根据权利要求1-6之一所述的方法训练的。

8.根据权利要求7所述的方法，其中，所述对象数据包括图像数据或音频数据。

9.一种回归模型的训练装置，包括：

第一输入模块，用于将原始训练样本输入回归模型，得到针对所述原始训练样本的初始评估值；

第一获得模块，用于根据预定输出阈值和所述初始评估值，得到加噪评估值，其中，所述加噪评估值与所述初始评估值之间的差小于等于所述预定输出阈值；

第二获得模块，用于根据所述加噪评估值，得到附加噪声值；

添加模块，用于将所述附加噪声值添加到所述原始训练样本，得到更新后训练样本；以及

训练模块，用于利用所述更新后训练样本对所述回归模型进行训练。

10.根据权利要求9所述的装置，其中，所述第二获得模块包括：

第一优化子模块，用于基于所述加噪评估值和所述初始评估值，执行梯度优化，得到第一优化梯度值；以及

第一获得子模块，用于根据所述第一优化梯度值和预定噪声约束值，得到第一附加噪声值，作为所述附加噪声值。

11.根据权利要求10所述的装置，其中，所述第二获得模块还包括：

添加子模块，用于将所述第一附加噪声值添加到所述原始训练样本，得到第一更新后训练样本；

第一输入子模块，用于将所述第一更新后训练样本输入所述回归模型，得到二次评估值；

第二获得子模块，用于根据所述预定输出阈值和所述二次评估值，得到二次加噪评估值；

第二优化模块，用于基于所述二次加噪评估值和所述二次评估值，执行所述梯度优化，得到第二优化梯度值；以及

第三获得子模块，用于根据所述第二优化梯度值和所述预定噪声约束值，得到第二附加噪声值，作为所述附加噪声值。

12.根据权利要求9所述的装置，其中，所述原始训练样本包括多个原始训练样本，所述更新后训练样本包括与所述原始训练样本对应的多个更新后训练样本；

其中，所述训练模块包括：

第二输入子模块，用于将所述多个更新后训练样本逐一输入所述回归模型，得到多个输出评估值；以及

调整子模块，用于根据所述多个输出评估值的均值，调整所述回归模型的模型参数，使得所述回归模型的损失函数收敛。

13.根据权利要求12所述的装置，其中，所述初始评估值包括与所述原始训练样本对应的多个初始评估值；

其中，所述调整子模块还用于：

14.根据权利要求9所述的装置，其中，所述添加模块包括：

第一确定子模块，用于根据所述原始训练样本的类型，确定针对所述原始训练样本的样本范围；

第二确定子模块，用于确定更新后训练样本是否处于所述样本范围以内；以及

处理子模块，用于在所述更新后训练样本没有处于所述样本范围以内的情况下，对所述更新后训练样本进行处理，使得经处理的更新后训练样本处于所述样本范围以内。

15.一种对象评估装置，包括：

获取模块，用于获取目标对象的对象数据；以及

第二输入模块，用于将所述对象数据输入回归模型，得到针对所述目标对象的评估数据；

其中，所述回归模型是利用根据权利要求9-14之一所述的装置训练的。

16.根据权利要求15所述的装置，其中，所述对象数据包括图像数据或音频数据。

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。