CN109815332A

CN109815332A - 损失函数优化方法、装置、计算机设备及存储介质

Info

Publication number: CN109815332A
Application number: CN201910012557.XA
Authority: CN
Inventors: 郑立颖; 金戈; 徐亮
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-01-07
Filing date: 2019-01-07
Publication date: 2019-05-28
Anticipated expiration: 2039-01-07
Also published as: WO2020143304A1; CN109815332B

Abstract

本发明公开了损失函数优化方法、装置、计算机设备及存储介质。该方法包括：若初始样本为初始不平衡样本，获取其中正样本比例和负样本比例；获取根据初始不平衡样本对应训练得到的预测模型，根据预测模型得到与每一样本对应的预测值；获取初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与初始不平衡样本中每一样本对应的损失函数调节值；将初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与预测模型对应的损失函数。该方法通过对损失函数进行调整使得训练过程更关注少量样本的错误情况，进而提高其准确率。

Description

损失函数优化方法、装置、计算机设备及存储介质

技术领域

本发明涉及机器学习技术领域，尤其涉及一种损失函数优化方法、装置、计算机设备及存储介质。

背景技术

目前，在文本分类问题中经常会碰到类别不平衡问题，例如情感多分类中，表达快乐的样本很多，但是表达愤怒的样本很少，在使用深度学习进行分类时会出现少类样本训练不充分导致准确率不高。

发明内容

本发明实施例提供了一种损失函数优化方法、装置、计算机设备及存储介质，旨在解决现有技术中文本分类中样本易出现类别不平衡，在使用深度学习进行分类时会出现少数类别的样本训练不充分，导致准确率不高的问题。

第一方面，本发明实施例提供了一种损失函数优化方法，其包括：

若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例；

获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值；

获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值；以及

将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

第二方面，本发明实施例提供了一种损失函数优化装置，其包括：

正负比例获取单元，用于若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例；

预测值获取单元，用于获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值；

调节值获取单元，用于获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值；以及

损失函数获取单元，用于将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

第三方面，本发明实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的损失函数优化方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的损失函数优化方法。

本发明实施例提供了一种损失函数优化方法、装置、计算机设备及存储介质。该方法包括若初始样本为初始不平衡样本，获取初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例；获取根据初始不平衡样本对应训练得到的预测模型，根据预测模型得到与初始不平衡样本中每一样本对应的预测值；获取初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与初始不平衡样本中每一样本对应的损失函数调节值；将初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与预测模型对应的损失函数。该方法通过对损失函数进行调整使得训练过程更关注少量样本的错误情况，进而提高其准确率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的损失函数优化方法的应用场景示意图；

图2为本发明实施例提供的损失函数优化方法的流程示意图；

图3为本发明实施例提供的损失函数优化方法的子流程示意图；

图4为本发明实施例提供的损失函数优化方法的另一子流程示意图；

图5为本发明实施例提供的损失函数优化方法的另一子流程示意图；

图6为本发明实施例提供的损失函数优化装置的示意性框图；

图7为本发明实施例提供的损失函数优化装置的子单元示意性框图；

图8为本发明实施例提供的损失函数优化装置的另一子单元示意性框图；

图9为本发明实施例提供的损失函数优化装置的另一子单元示意性框图；

图10为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1是本发明实施例提供的损失函数优化方法的应用场景示意图，图2是本发明实施例提供的损失函数优化方法的流程示意图，该损失函数优化方法应用于服务器中，该方法通过安装于服务器中的应用软件进行执行。

如图2所示，该方法包括步骤S110～S140。

S110、若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例。

在本实施例中，当用户端上传了初始样本至服务器进行机器学习时，常常会遇到样本比例不平衡的问题，如对于一个二分类问题，正负样本的比例是2：8，样本比例不平衡的现象往往是由于本身数据来源决定的。但是实际获取的数据又往往是不平衡的，样本比例不平衡往往会带来不少问题，如：

1)样本不平衡往往会导致模型对样本数较多的分类造成过拟合，即总是将样本分到了样本数较多的分类中；

2)另一个典型的问题就是模型的对样本预测的准确率很高，但是模型的泛化能力差，其原因是模型将大多数的样本都归类为样本数较多的那一类。

此时为了后续对样本不平衡的调整，需初始获取不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例。

在一实施例中，步骤S110之前还包括：

判断初始样本中正样本对应的第一数量与负样本对应的第二数量之比是否超出预设的第一比例阈值或者低于预设的第二比例阈值，若所述第一数量与所述第二数量之比超出所述第一比例阈值或者低于所述第二比例阈值，判定所述初始样本为初始不平衡样本；其中，所述第一比例阈值为4，所述第二比例阈值为0.25。

在本实施例中，在判断初始样本是否为初始不平衡样本时，主要是判断正负样本数量之比是否过高或过低，即判断正样本对应的第一数量与负样本对应的第二数量之比是否超出预设的第一比例阈值或者低于预设的第二比例阈值。若初始样本的正样本与负样本的数量之比过高或过低，则表示该初始样本为初始不平衡样本，需要对损失函数进行调整，使得训练过程更关注少量样本。

S120、获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值。

在本实施例中，在未对所述初始不平衡样本对应的损失函数进行调整时，先根据所述初始不平衡样本对待训练模型(如CNN模型、DNN模型，RNN模型、BP神经网络模型等，其中CNN模型表示卷积神经网络模型，DNN模型表示深度神经网络模型，RNN模型表示循环神经网络模型，BP神经网络模型表示反向传播神经网络模型)进行训练得到预测模型。然后将所述初始不平衡样本中各样本的输入值输入至所述预测模型，得到与所述初始不平衡样本中每一样本对应的预测值。

由于所述初始不平衡样本中每一样本对应的预测值不一定与该样本对应的真实值相等，此时为了提高预测模型的泛化能力，需对预测模型对应的损失函数设置调节参数，以通过对损失函数进行调整，使得训练过程更关注少量样本的错误情况，进而提高其准确率。

在一实施例中，如图3所示，步骤S120包括：

S121、根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；

S122、将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

在本实施例中，在预先设置了训练集获取比例后(如70％)，可在所述初始不平衡样本所包括的正样本和负样本中均随机获70％的样本数据以作为训练集输入至待训练模型进行训练，以得到与待训练模型对应的预测模型。得到了预测模型后，即可将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与各样本对应的预测值。

在一实施例中，如图4所示，步骤S121之后还包括：

S1211、将所述初始不平衡样本中与所述训练集对应的补集作为测试集，将所述测试集中每一样本输入至所述预测模型，以得到与所述测试集中每一样本对应的预测值；

S1212、判断述测试集中每一样本对应的预测值和真实值之差是否均在预设的损失阈值之内，若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行步骤S122；若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行步骤S1213；

S1213、发送所述测试模型未通过验证的提示信息。

在完成对预测模型的训练后，还可以将所述初始不平衡样本中未被选择为训练集的样本数据作为测试集，以验证所述预测模型的正确性。若所述预测模型通过测试集的验证(例如测试集中某一正样本的样本数据的输入值作为预测模型的输入，得到与该样本数据对应的预测值，此时预测值与样本数据对应的真实值之间的差距在可接受的范围内，即表示所示预测模型无需进行校正直接进行下一步应用。

在验证了所述预测模型后，可以将所述初始不平衡样本中所包括的每一样本的输入值作为预测模型的输入，得到与每一样本对应的预测值。在现有技术中，对预测模型的鲁棒性进行判断时，是计算该预测函数的交叉熵损失函数，具体如下：

其中，y_true表示每一样本对应的真实值，y_pred表示每一样本对应的预测值。损失函数(loss function)是用来估量模型的预测值与真实值的不一致程度，它是一个非负实值函数，损失函数越小，模型的鲁棒性就越好。但是，若直接采用上述交叉熵损失函数，则未充分考虑到初始不平衡样本中正样本比例与负样本比例，易导致预测模型的泛化能力差。此时需设置一个调节参数，以对损失函数进行动态调整。

S130、获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值。

在一实施例中，如图5所示，步骤S130包括：

S131、若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；

S132、若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

在本实施例中，例如，当正负样本的比例是2:8时，需调整至当y_pred>0.8时，才判定预测值对应的是正样本的预测结果，此时可以将调节参数λ(y_pred，y_true)设置如下：

即第一判断条件为y_pred>0.8且y_true＝1，第二判断条件为y_pred<0.2且y_true＝-1，第三判断条件为第一判断条件和第二判断条件求并集后的补集。通过上述调整，充分考虑到初始不平衡样本中正样本比例与负样本比例，将各个类别赋予不同的权重(即调节参数)，通过给予少量样本更高权重来调整损失函数，提高了预测模型的泛化能力。

S140、将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

在本实施例中，将损失函数通过下式计算，即可通过优化损失函数进而提高预测模型的准确率：

Loss＝-∑_yλ(y_pred，y_true)y_truelgy_pred；

通过将损失函数优化为上述方式，针对少类样本给予更高权重，进而使得模型准确率提高。

该方法通过对损失函数进行调整，使得训练过程更关注少量样本的错误情况，进而提高其准确率。

本发明实施例还提供一种损失函数优化装置，该损失函数优化装置用于执行前述损失函数优化方法的任一实施例。具体地，请参阅图6，图6是本发明实施例提供的损失函数优化装置的示意性框图。该损失函数优化装置100可以配置于服务器中。

如图6所示，损失函数优化装置100包括正负比例获取单元110、预测值获取单元120、调节值获取单元130、损失函数获取单元140。

正负比例获取单元110，用于若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例。

在本实施例中，当用户端上传了初始样本至服务器进行机器学习时，常常会遇到样本比例不平衡的问题，如对于一个二分类问题，正负样本的比例是2：8，样本比例不平衡的现象往往是由于本身数据来源决定的。但是实际获取的数据又往往是不平衡的，样本比例不平衡往往会带来不少问题，此时为了后续对样本不平衡的调整，需初始获取不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例。

在一实施例中，损失函数优化装置还包括：

样本类型判断单元，用于判断初始样本中正样本对应的第一数量与负样本对应的第二数量之比是否超出预设的第一比例阈值或者低于预设的第二比例阈值，若所述第一数量与所述第二数量之比超出所述第一比例阈值或者低于所述第二比例阈值，判定所述初始样本为初始不平衡样本；其中，所述第一比例阈值为4，所述第二比例阈值为0.25。

预测值获取单元120，用于获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值。

在一实施例中，如图7所示，预测值获取单元120包括：

模型训练单元121，用于根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；

输入运算单元122，用于将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

在一实施例中，如图8所示，预测值获取单元120还包括：

测试集获取单元1211，用于将所述初始不平衡样本中与所述训练集对应的补集作为测试集，将所述测试集中每一样本输入至所述预测模型，以得到与所述测试集中每一样本对应的预测值；

差值判断单元1212，用于判断述测试集中每一样本对应的预测值和真实值之差是否均在预设的损失阈值之内，若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值的步骤；若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行发送所述测试模型未通过验证的提示信息的步骤；

提示单元1213，用于发送所述测试模型未通过验证的提示信息。

调节值获取单元130，用于获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值。

在一实施例中，如图9所示，调节值获取单元130包括：

第一调节值获取单元131，用于若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；

第二调节值获取单元132，用于若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

损失函数获取单元140，用于将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

Loss＝-∑_yλ(y_pred，y_true)y_truelgy_pred；

该装置通过对损失函数进行调整，使得训练过程更关注少量样本的错误情况，进而提高其准确率。

上述损失函数优化装置可以实现为计算机程序的形式，该计算机程序可以在如图10所示的计算机设备上运行。

请参阅图10，图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器。其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图10，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行损失函数优化方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行损失函数优化方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图10中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下功能：若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例；获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值；获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值；以及将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

在一实施例中，处理器502在执行所述获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值的步骤时，执行如下操作：若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

在一实施例中，处理器502在执行所述获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值的步骤时，执行如下操作：根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

在一实施例中，处理器502在执行所述根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型的步骤之后，还执行如下操作：将所述初始不平衡样本中与所述训练集对应的补集作为测试集，将所述测试集中每一样本输入至所述预测模型，以得到与所述测试集中每一样本对应的预测值；判断述测试集中每一样本对应的预测值和真实值之差是否均在预设的损失阈值之内，若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值的步骤；若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行发送所述测试模型未通过验证的提示信息的步骤；发送所述测试模型未通过验证的提示信息。

在一实施例中，处理器502在执行所述若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例的步骤之前，还执行如下操作：判断初始样本中正样本对应的第一数量与负样本对应的第二数量之比是否超出预设的第一比例阈值或者低于预设的第二比例阈值，若所述第一数量与所述第二数量之比超出所述第一比例阈值或者低于所述第二比例阈值，判定所述初始样本为初始不平衡样本；其中，所述第一比例阈值为4，所述第二比例阈值为0.25。

本领域技术人员可以理解，图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图10所示实施例一致，在此不再赘述。

应当理解，在本发明实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现以下步骤：若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例；获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值；获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值；以及将所述初始不平衡样本中每一样本对应的损失函数调节值乘以对应样本的交叉熵并求和，以得到与所述预测模型对应的损失函数。

在一实施例中，所述获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值，包括：若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

在一实施例中，所述获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值，包括：根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

在一实施例中，所述根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型之后，还包括：将所述初始不平衡样本中与所述训练集对应的补集作为测试集，将所述测试集中每一样本输入至所述预测模型，以得到与所述测试集中每一样本对应的预测值；判断述测试集中每一样本对应的预测值和真实值之差是否均在预设的损失阈值之内，若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值的步骤；若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行发送所述测试模型未通过验证的提示信息的步骤；发送所述测试模型未通过验证的提示信息。

在一实施例中，所述若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例之前，还包括：判断初始样本中正样本对应的第一数量与负样本对应的第二数量之比是否超出预设的第一比例阈值或者低于预设的第二比例阈值，若所述第一数量与所述第二数量之比超出所述第一比例阈值或者低于所述第二比例阈值，判定所述初始样本为初始不平衡样本；其中，所述第一比例阈值为4，所述第二比例阈值为0.25。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种损失函数优化方法，其特征在于，包括：

2.根据权利要求1所述的损失函数优化方法，其特征在于，所述获取所述初始不平衡样本中每一样本的预测值和真实值所满足的取值区间，根据每一样本的预测值和真实值所满足的取值区间以及预设的调节值设置策略，得到与所述初始不平衡样本中每一样本对应的损失函数调节值，包括：

若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；

若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

3.根据权利要求1所述的损失函数优化方法，其特征在于，所述获取根据所述初始不平衡样本对应训练得到的预测模型，根据所述预测模型得到与所述初始不平衡样本中每一样本对应的预测值，包括：

根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；

将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

4.根据权利要求3所述的损失函数优化方法，其特征在于，所述根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型之后，还包括：

将所述初始不平衡样本中与所述训练集对应的补集作为测试集，将所述测试集中每一样本输入至所述预测模型，以得到与所述测试集中每一样本对应的预测值；

判断述测试集中每一样本对应的预测值和真实值之差是否均在预设的损失阈值之内，若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值的步骤；若所述测试集中每一样本对应的预测值和真实值之差均在预设的损失阈值之内，执行发送所述测试模型未通过验证的提示信息的步骤；

发送所述测试模型未通过验证的提示信息。

5.根据权利要求2所述的损失函数优化方法，其特征在于，所述若初始样本为初始不平衡样本，获取所述初始不平衡样本中正样本所占的正样本比例和负样本所占的负样本比例之前，还包括：

6.一种损失函数优化装置，其特征在于，包括：

7.根据权利要求6所述的损失函数优化装置，其特征在于，所述调节值获取单元，包括：

第一调节值获取单元，用于若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第一判断条件或满足预设的第二判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第一调节值；其中，所述第一判断条件为预测值大于0.8且真实值等于1，所述第二判断条件为预测值小于0.2且真实值等于-1；

第二调节值获取单元，用于若所述初始不平衡样本中每一样本的预测值和真实值满足预设的第三判断条件，将与所述初始不平衡样本中对应样本的调节参数设置为第二调节值；其中，所述第三判断条件为第三判断条件为第一判断条件和第二判断条件的并集所对应的补集。

8.根据权利要求6所述的损失函数优化装置，其特征在于，所述预测值获取单元，包括：

模型训练单元，用于根据预设的训练集获取比例在所述初始不平衡样本所包括的正样本和负样本中对应获取训练集以对待训练模型进行训练，得到与所述待训练模型对应的预测模型；

输入运算单元，用于将所述初始不平衡样本中所包括的每一样本的输入值作为所述预测模型的输入进行运算，得到与所述初始不平衡样本中所包括的每一样本对应的预测值。

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的损失函数优化方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的损失函数优化方法。