WO2021169473A1

WO2021169473A1 - 模型性能优化方法、装置、设备及存储介质

Info

Publication number: WO2021169473A1
Application number: PCT/CN2020/134671
Authority: WO
Inventors: 蔡林; 周古月; 吴泽衡; 徐倩; 杨强
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-02-28
Filing date: 2020-12-30
Publication date: 2021-09-02
Also published as: CN111368903A; CN111368903B

Abstract

一种模型性能优化方法、装置、设备及存储介质，所述方法包括：将预设的负例训练数据输入待训练模型得到预测结果(S10)；当预测结果表征负例训练数据被预测为负例的概率大于预设阈值时，对负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值(S20)；根据修正后的损失函数值调整待训练模型的模型参数，以对待训练模型进行训练得到目标模型(S30)。

Description

模型性能优化方法、装置、设备及存储介质

相关申请的交叉引用

本申请要求：2020年2月28日申请的、申请号为202010131522.0、名称为“模型性能优化方法、装置、设备及存储介质”的中国专利申请的优先权，在此将其引入作为参考。

技术领域

本申请涉及机器学习技术领域，尤其涉及一种模型性能优化方法、装置、设备及存储介质。

背景技术

随着机器学习技术的快速发展，机器学习应用的范围也越来越广，对机器学习模型的训练优化，也成为了整个行业的不断探索方向。现有的机器学习模型训练过程中，会采用正例和负例来对模型进行训练，例如，对图像目标检测模型进行训练时，会采用包含目标的图像(正例)和不包含目标的图像(负例)进行训练。然而，在很多场景中，会存在实际上是正例，但是因为各种原因导致错误地标注为负例，进而被当作负例进行训练的情况，例如，训练能够识别遥感卫星图像中养殖场的图像目标检测模型时，会存在养殖主未及时上报或者瞒报的现象，导致许多负例中也存在养殖场。这种错误标注负例的情况，会使得最终训练得到的模型预测或分类效果不准确，也即导致模型性能不佳，例如，导致养殖场检测模型无法全面识别出各种养殖场。

上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

发明内容

本申请的主要目的在于提供一种模型性能优化方法、装置、设备及存储介质，旨在解决现有因采用错误标注的负例对模型进行训练，导致训练得到的模型预测或分类效果不准确的问题。

为实现上述目的，本申请提供一种模型性能优化方法，所述模型性能优化方法包括以下步骤：

将预设的负例训练数据输入待训练模型得到预测结果；

当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；以及

根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。

在一实施例中，所述预测结果是所述负例训练数据被预测为负例的概率，所述当所述预测结果表征所述负例训练数据预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正的步骤包括：

当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；以及

将所述损失修正系数乘以所述负例训练数据对应的损失函数值，以对所述损失函数值进行修正。

在一实施例中，所述当所述预测结果大于所述预设阈值时，获取预设的损失修正系数的步骤包括：

当所述预测结果大于所述预设阈值时，将所述预测结果代入预设的平滑下降公式得到所述损失修正系数，其中，所述损失修正系数随着所述预测结果变大而变小。

在一实施例中，所述

平滑下降公式为：

其中，α(p)为损失修正系数，α为预设阈值，p为预测结果。

在一实施例中，所述将预设的负例训练数据输入待训练模型得到预测结果的步骤之前，还包括：

基于预设的正例训练数据对初始模型进行初步训练，得到所述待训练模型；

所述根据修正后的损失函数值调整所述待训练模型的模型参数的步骤包括：

根据所述正例训练数据对应的损失函数值和修正后的所述负例训练数据对应的损失函数值，调整所述待训练模型的模型参数。

在一实施例中，所述根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型的步骤包括：

根据修正后的损失函数值调整所述待训练模型的模型参数；

检测调整模型参数后的待训练模型是否满足预设模型条件；

若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；以及

若检测到调整模型参数后的待训练模型满足预设模型条件，则将调整模型参数后的待训练模型作为目标模型。

在一实施例中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型的步骤之后，还包括：

将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；以及

根据所述分类结果得到所述待检测卫星图像的养殖场检测结果。

对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。

在一实施例中，损失函数为：

其中，DL 2为损失函数值，p为待训练模型输出的像素点的分类类别，n为像素点的编号，N为总像素点个数，r为像素点的标注类别，ε为预设的一个极小值。

在一实施例中，所述对负例训练数据对应的损失函数值进行修正，使得修正后的损失函数值小于修正前的损失函数值的步骤包括：

将负例训练数据对应的损失函数值减少一个预设值，以及将负例训练数据对应的损失函数值乘以一个预设的小于1的正数。

在一实施例中，所述根据修正后的损失函数值调整所述待训练模型的模型参数包括：

根据修正后的损失函数值计算模型参数对应的梯度，并根据各个模型参数的梯度来对应更新模型参数。

为实现上述目的，本申请还提供一种模型性能优化装置，所述模型性能优化装置包括：

输入模块，用于将预设的负例训练数据输入待训练模型得到预测结果；

修正模块，用于当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；

调整模块，用于根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。

在一实施例中，所述预测结果包括所述负例训练数据被预测为负例的概率，所述修正模块包括：

获取单元，用于当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；以及

修正单元，用于将所述损失修正系数乘以所述负例训练数据对应的损失函数值，以对所述损失函数值进行修正。

在一实施例中，所述获取单元包括：

计算单元，用于当所述预测结果大于所述预设阈值时，将所述预测结果代入预设的平滑下降公式得到所述损失修正系数，其中，所述损失修正系数随着所述预测结果变大而变小。

在一实施例中，所述模型性能优化装置还包括：

初步训练模块，用于基于预设的正例训练数据对初始模型进行初步训练，得到所述待训练模型；

所述调整模块包括：

第一调整单元，用于根据所述正例训练数据对应的损失函数值和修正后的所述负例训练数据对应的损失函数值，调整所述待训练模型的模型参数。

在一实施例中，所述调整模块包括：

第二调整单元，用于根据修正后的损失函数值调整所述待训练模型的模型参数；

检测单元，用于检测调整模型参数后的待训练模型是否满足预设模型条件；

第三调整单元，用于若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；以及

确定单元，用于若检测到调整模型参数后的待训练模型满足预设模型条件，则将调整模型参数后的待训练模型作为目标模型。

在一实施例中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述模型性能优化装置还包括：

图像输入模块，用于将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；以及

检测模块，用于根据所述分类结果得到所述待检测卫星图像的养殖场检测结果。

在一实施例中，所述模型性能优化装置还包括：

增广模块，用于对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。为实现上述目的，本申请还提供一种模型性能优化设备，所述模型性能优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的模型性能优化程序，所述模型性能优化程序被所述处理器执行时实现如上所述的模型性能优化方法的步骤。

此外，为实现上述目的，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有模型性能优化程序，所述模型性能优化程序被处理器执行时实现如上所述的模型性能优化方法的步骤。

本申请中，通过在对待训练模型的训练过程中，将负例训练数据输入待训练模型得到预测结果，当预测结果表征该负例训练数据预测为负例的概率大于一个预设阈值时，对该负例训练数据的损失函数值进行修正，使得修正后的损失函数值小于修正后的损失函数值，根据修正后的损失函数值调整待训练模型的模型参数得到目标模型，使得实际上是负例的可能性较大的负例训练数据对损失函数收敛的作用增大，从而对比来看，使得实际上是正例的可能性比较大的负例训练数据对损失函数收敛的作用减小，进而能够减小错误标记的负例训练数据对模型训练的影响，从而避免最终得到的目标模型的预测或分类准确率降低，也即提高了目标模型的预测或分类准确率，提高了模型性能。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的结构示意图；

图2为本申请模型性能优化方法第一实施例的流程示意图；

图3为本申请实施例涉及的一种损失修正系数的取值案例图；

图4本申请模型性能优化装置较佳实施例的功能示意图模块图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

需要说明的是，本申请实施例模型性能优化设备可以是智能手机、个人计算机和服务器等设备，在此不做具体限制。

如图1所示，该模型性能优化设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的设备结构并不构成对模型性能优化设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及模型性能优化程序。其中，操作系统是管理和控制设备硬件和软件资源的程序，支持模型性能优化程序以及其它软件或程序的运行。

在图1所示的设备中，用户接口1003主要用于与客户端进行数据通信；网络接口1004主要用于与服务器建立通信连接；而处理器1001可以用于调用存储器1005中存储的模型性能优化程序，并执行以下操作：

将预设的负例训练数据输入待训练模型得到预测结果；

当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；

当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；

在一实施例中，所述将预设的负例训练数据输入待训练模型得到预测结果的步骤之前，处理器1001还可以用于调用存储器1005中存储的模型性能优化程序，执行以下操作：

根据修正后的损失函数值调整所述待训练模型的模型参数；

检测调整模型参数后的待训练模型是否满足预设模型条件；

若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；

在一实施例中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型的步骤之后，处理器1001还可以用于调用存储器1005中存储的模型性能优化程序，执行以下操作：

将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；

基于上述的结构，提出模型性能优化方法的各个实施例。

参照图2，图2为本申请模型性能优化方法第一实施例的流程示意图。

本申请实施例提供了模型性能优化方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。本申请模型性能优化方法各个实施例的执行主体可以是智能手机、个人计算机和服务器等设备，为便于描述，以下各实施例中省略执行主体进行阐述。在本实施例中，模型性能优化方法包括：

步骤S10，将预设的负例训练数据输入待训练模型得到预测结果；

在本实施例中，对于一个目标任务，如预测任务或分类任务，可以预先设置一个模型，模型结构可以是采用针对该目标任务所常用的模型结构。例如，图像目标检测任务即可以采用常用的图像目标检测模型，如可采用语义图像分割模型DeepLab-v3+。模型的参数需要经过对模型进行训练才能确定，以下将该预设设置的模型称为待训练模型。

预先可以采集训练数据，用于对待训练模型进行训练，训练数据可包括正例训练数据和负例训练数据。根据目标任务不同，所采集的训练数据不同，例如，目标任务是对图像进行目标检测的任务时，所采集的正例训练数据可以是多张包含目标的图像，负例训练数据可以是多张不包含目标的图像，更具体地，目标任务是检测图像中的养殖场时，正例训练数据可以是多种包含养殖场的遥感卫星图片，负例训练数据可以是多张不包含养殖场的遥感卫星图片。对训练数据可以进行标注，获得每个训练数据对应的标注数据，根据训练数据和目标任务不同，标注数据也不同。例如，目标任务是检测图像中的养殖场时，标注数据可以是与遥感卫星图片对应的掩膜图，掩膜图中有每个遥感卫星图片的每个像素点对应的分类类别，如0表示该像素点不属于养殖场，1表示该像素点属于养殖场，掩膜图可以采用不同的颜色表示不同的类别，那么负例训练数据对应的掩膜图就是各个像素点都标记为0；此外，正例训练数据和负例训练数据本身可以带一个标签，例如，正例训练数据是标记为1，负例训练数据标记为-1。

在训练过程中，训练数据的使用顺序可以多种，例如，可以是先采用正例训练数据来对待训练模型进行训练，再采用负例训练数据来对待训练模型进行调整，也可以是采用正例训练数据和负例训练数据一起来对待训练模型进行训练。

具体地，对训练过程中采用负例训练数据进行训练的部分进行说明：将负例训练数据分别输入待训练模型，待训练模型输出每个负例训练数据对应的预测结果。其中，预测结果可以是该负例训练数据被预测为负例的概率，也可以是该负例训练数据被预测为正例的概率，还可以是其他能够表征负例训练数据被预测为负例的概率的结果。当目标任务是图像目标检测任务时，待训练模型的输出结果可以是图像中每个像素点的分类结果，在各个分类结果的基础上，可以接上一个二分类器，二分类器可采用常用的二分类器，如softmax分类器；经过二分类模型对各个分类结果的处理，可得到一个表示该负例训练数据预测为负例的概率，该概率即可作为负例训练数据对应的预测结果。

同样地，若采用正例训练数据进行训练，也将正例训练数据输入待训练模型，得到预测结果。

步骤S20，当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；

在将负例训练数据输入待训练模型得到预测结果后，或将负例训练数据和正例训练数据输入待训练模型得到预测结果后，可依据预测结果和训练数据对应的标注数据计算损失函数，待训练模型的损失函数可以是采用针对目标任务常用的损失函数。损失函数值有负例训练数据对应的损失函数值和正例训练数据对应的损失函数值。

由于负例训练数据虽然被标注为负例，但是可能是错误标记的负例，也即，部分负例训练数据可能实际上是正例，那么负例训练数据的标注数据也可能是错误的，从而导致计算出来的负例训练数据对应的损失函数值是有误的，而根据错误的损失函数值来计算模型参数的梯度，进而根据梯度来调整模型参数，会导致最终损失函数收敛时得到的模型参数是偏离的，模型以偏离的模型参数来进行使用时，会出现预测或分类不准确的现象。

在本实施例中，当检测到一个负例训练数据对应的预测结果表征该负例训练数据被预测为负例的概率大于预设阈值时，可对该负例训练数据对应的损失函数值进行修正，并且，修正后的损失函数值小于修正前的损失函数值。其中，预设阈值是预先设置的一个阈值，该阈值的范围可以是大于零小于1。也即，当一个负例训练数据被待训练模型预测为负例的概率比较大时，说明该负例训练数据确实是负例的可能性是比较大的，此时，可以将该负例训练数据对于的损失函数值变小，使得该负例训练数据对损失函数的收敛做较大的贡献，即使得损失函数能够快速收敛；对应地，对被预测为负例的概率不大于预设阈值的负例训练数据，则对该负例训练数据的损失函数不做处理，可以使得当负例训练数据确实为负例的可能性比较小，也即很可能实际上是正例时，就让它对损失函数收敛的作用不变；从而使得实际上很可能为正例的负例训练数据，和实际上很可能为负例的负例训练数据，对比起来看，前者对损失函数的收敛作用减小，后者对损失函数的收敛作用变大，从而使得错误标记的负例(实际上很可能为正例的负例训练数据)对模型的影响降低，反过来就提高了最终获取到的模型的预测准确率或分类准确率，也即提高模型的性能。也即，在本实施例中，通过负例训练数据被预测为负例的概率是否大于预设阈值，来表示负例训练数据被错误标记的可能性，当负例训练数据被预测为负例的概率大于预设阈值时，说明错误标记的可能性小，反之则说明错误标记的可能性大；从而实现根据负例训练数据被错误标记的可能性来对损失函数进行修正；当被错误标记的可能性小时，减少损失函数，当被错误标记的可能性大时，不改变损失函数，使得被错误标记可能性大的负例训练数据对模型训练的影响相对减少。

需要说明的是，对于被预测为负例的概率不大于预设阈值的负例训练数据，也可以是对该负例训练数据对应的损失函数值进行增大，从而更加减小实际上很可能是正例的负例训练数据对损失函数收敛的作用；由于一个负例训练数据虽然被预测为负例的概率不大于预设阈值，但也仍不能够确定该负例训练数据就是错误标记的负例，即不能够确定该负例训练数据就是正例，所以，将该负例训练数据对应的损失函数值不做处理的操作，可以避免错误地将本是负例的负例训练数据对损失函数收敛的作用减小。

对负例训练数据对应的损失函数值进行修正，使得修正后的损失函数值小于修正前的损失函数值，具体可以采用的方式有多种，例如，可以将负例训练数据对应的损失函数值减少一个预设值，也可以是将负例训练数据对应的损失函数值乘以一个预设的小于1的正数等等。

步骤S30，根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。

根据修正后的损失函数值调整待训练模型的模型参数。具体地，根据修正后的损失函数值计算各个模型参数对应的梯度，根据各个模型参数的梯度来对应更新各个模型参数，也即调整各个模型参数，此处根据损失函数更新模型参数的过程与现有的模型参数更新过程类似，在此不做详细赘述。若采用正例训练数据和负例训练数据一起训练时，就根据正例训练数据对应的损失函数值和修正后的负例训练数据对应的损失函数值一起计算各个模型参数对应的梯度。

在调整待训练模型的模型参数后，可以检测损失函数是否收敛；若损失函数收敛，则可以停止训练，将最终最后一次调整过的模型参数作为最终的模型参数，即得到目标模型；若损失函数未收敛，则可以在调整后的模型参数基础上，将训练数据再输入待训练模型得到预测结果，以及修正损失函数值，计算梯度，调整模型参数；循环调整模型参数，直到检测到损失函数收敛为止。

在本实施例中，通过在对待训练模型的训练过程中，将负例训练数据输入待训练模型得到预测结果，当预测结果表征该负例训练数据预测为负例的概率大于一个预设阈值时，对该负例训练数据的损失函数值进行修正，使得修正后的损失函数值小于修正后的损失函数值，根据修正后的损失函数值调整待训练模型的模型参数得到目标模型，使得实际上是负例的可能性较大的负例训练数据对损失函数收敛的作用增大，从而对比来看，使得实际上是正例的可能性比较大的负例训练数据对损失函数收敛的作用减小，进而能够减小错误标记的负例训练数据对模型训练的影响，从而避免最终得到的目标模型的预测或分类准确率降低，也即提高了目标模型的预测或分类准确率，提高了模型性能。

在一实施例中，基于上述第一实施例，提出本申请模型性能优化方法第二实施例，在本实施例中，所述预测结果是所述负例训练数据被预测为负例的概率，所述步骤S20包括：

步骤S201，当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；

在一实施例中，在本实施例中，预测结果可以是一个概率，该概率是负例训练数据被待训练模型预测为负例的概率。在将负例训练数据输入待训练模型得到预测结果后，将负例训练数据的预测结果与预设阈值进行比较。若预测结果大于该预设阈值，则获取预设的损失修正系数，该损失修正系数可以是小于1的正数。

步骤S202，将所述损失修正系数乘以所述负例训练数据对应的损失函数值，以对所述损失函数值进行修正。

将该损失修正系数乘以该负例训练数据对应的损失函数值，通过这种方式，对负例训练数据对应的损失函数值进行修正。由于损失修正系数是小于1的正数，所以修正后的损失函数值是小于修正前的损失函数值的，从而可以增加实际上是负例的可能性较大的负例训练数据对损失函数收敛的作用。

在一实施例中，所述S201中当所述预测结果大于所述预设阈值时，获取预设的损失修正系数的步骤包括：

步骤a，当所述预测结果大于所述预设阈值时，将所述预测结果代入预设的平滑下降公式得到所述损失修正系数，其中，所述损失修正系数随着所述预测结果变大而变小。

在一实施例中，为使得实际上是负例的可能性越大的负例训练数据对损失函数收敛的作用越大，对于被预测为负例的概率越大的负例训练数据，可将该负例训练数据的损失函数值减小得越小。此时，可以预先设置一个平滑下降公式，该平滑下降公式可以使得损失修正系数随着预测结果变大而逐渐平滑变小，那么当预测结果大于预设阈值时，将预测结果带入该平滑下降公式获得损失修正系数，可以使得当预测结果越大时，得到的损失修正系数越小，当预测结果越小时得到的损失修正系数越大。并且，平滑下降公式使得损失修正系数随着预测结果变大而逐渐平滑变小，从而使得训练过程中，不会因为损失函数的突变，导致错过了收敛点而难以收敛，从而提高模型训练过程的稳定性，也提高了模型训练的效率。

其中，平滑下降公式可以采用常用的曲线下降公式。如，可以采用如下公式来计算损失修正系数。

其中，α(p)是损失修正系数，α是预设阈值，p是预测结果，根据该公式，α(p)、α和p的关系如图3所示，当p大于α时，α(p)取1，当p小于等于α时，α(p)是小于1的。

需要说明的是，也可以采用其他公式，使得预测结果越大时，损失修正系数越小，若可采用直线下降公式。

在一实施例中，基于上述第一和第二实施例，提出本申请模型性能优化方法第三实施例，在本实施例中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述步骤S30之后，还包括：

步骤S40，将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；

在一实施例中，目标任务可以是检测遥感卫星图像中的养殖场，那么待训练模型可以是用于检测遥感卫星图像中养殖场的模型，待训练模型的结构可采用常用的图像目标检测模型。对待训练模型采用上述步骤S10～S30的训练过程进行训练得到目标模型后，可使用该目标模型来完成检测遥感卫星图像中养殖场的任务。具体地，可以将待检测卫星图像输入该目标模型，由目标模型输出待检测卫星图像中各个像素点的分类结果。分类结果用于表示对于的像素点是否属于养殖场。

步骤S50，根据所述分类结果得到所述待检测卫星图像的养殖场检测结果。

在得到待检测卫星图像中各个像素点的分类结果后，即可以根据分类结果得到待检测卫星图像的养殖场检测结果。具体地，根据分类结果可以得到一个掩膜图，该掩膜图中，对分类结果不同的像素点，可采用不同的颜色，例如，属于养殖场的区域是白色，不属于养殖场区域的是黑色，那么就可以根据掩膜图直观地确定养殖场所在区域。此外，也可以根据分类结果，确定属于养殖场的像素点，并根据像素点与实际经纬度的对应关系，确定养殖场所在的经纬度，从而实现从遥感卫星图像中直接确定养殖场的地理位置，从而实现对养殖场的监测和管理。

在我国养殖业发展迅速，健康养殖、福利养殖，特别是精准化养殖等概念备受社会关注。当前养殖业存在很多问题，如养殖场没有得到规范化管理，造成严重环境污染以及爆发疫情等。在本实施例中，通过采用步骤S10～S30的方式训练得到一个检测图像中养殖场的目标模型，使得训练得到的模型能够准确地检测到遥感卫星图像中的养殖场区域，从而能够实现精细化的养殖场管理，实现正确及时地了解养殖场的情况，避免由于各地存在养殖主未及时上报或者瞒报的现象，导致训练得到的模型无法全面识别出各种养殖场的问题。

在一实施例中，所述步骤S10之前，还包括：

步骤S60，对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。

在一实施例中，当目标任务是检测遥感卫星图像中的养殖场时，训练数据的采集可以是：对遥感卫星地图进行裁剪，得到多张遥感卫星图像，然后对多张遥感卫星图像进行标注，标注出其中的养殖场区域，标注可以采用常用的标注软件，基于标注还可以生成背景全黑的掩膜图，也即掩膜图中养殖场区域外的区域是黑色。对于不含养殖场的遥感卫星图片(负例训练数据)，对应的掩膜图是全黑。黑色区域对应的类别是0，表示是背景，白色区域对应的类别是1，表示是养殖场。

对采集到的遥感卫星图像，还可以进行数据增广操作，数据增广操作可以是对遥感卫星图像进行扭曲操作、翻转操作和加噪操作等操作，这些操作与现有的数据增广操作类似，在此不做详细赘述。通过数据增广操作一方面可以使得在遥感卫星图像数量较少时，增加遥感卫星图像的数量，从而使得训练数据变多，使得模型得到充分的训练，另一方面，可以使得训练得到的模型能够识别各种不同的养殖场，也即提高了模型的通用性。需要说明的是，对于标注为负例的遥感卫星图像，对该遥感卫星图像进行数据增广，就得到多张遥感卫星图像，将多张遥感卫星图像作为负例训练数据。

在一实施例中，损失函数的计算可以是把一个类别的所有像素作为一个整体去计算损失的，其本质是计算两个轮廓区域的相似程度。具体的计算公式可如下：

其中，DL 2是损失函数值，p是待训练模型输出的像素点的分类类别，n是像素点的编号，N是总像素点个数，r是像素点的标注类别，ε是预设的一个极小值，用于避免分子分母为零。上述公式中，1减去了两个部分，第一个部分实际上是目标区域(养殖场区域，也即前景)对应的损失，第二部分实际上是背景区域对应的损失，这说明损失函数是基于图像仅区分前景和背景的标注去监督待训练模型的输出，如果标注不够好，会严重影响损失函数的计算。因此可以考虑引入一些原图的信息作为辅助，丰富损失函数函数，这种方式称为弱监督。也即，本实施例中通过加入图像整体的标注作为辅助，用于区分正例训练数据和负例训练数据，对于负例训练数据，则修正其对应的损失函数值，从而基于弱监督学习，通过优化损失函数的计算方法，有效地解决了遥感卫星地图中错误标注负例的问题。

在一实施例中，基于上述第一、第二和第三实施例，提出本申请模型性能优化方法第四实施例，在本实施例中，所述步骤S10之前，还包括：

步骤S70，基于预设的正例训练数据对初始模型进行初步训练，得到所述待训练模型；

在一实施例中，在本实施例中，可以先采用正例训练数据对模型进行训练，再采用正例训练数据和负例训练数据对模型进行微调，具体地：

可获取预先采集的正例训练数据，采用正例训练数据对初始模型进行初步训练，其中，初始模型也即预先设置的待训练的模型，此处为了区分后面的待训练模型，采用初始模型的描述。采用正例训练数据对初始模型进行初步训练的过程与现有的模型训练过程类似，也即，不进行损失函数值的修正。初步训练后，初始模型的模型参数得到调整，将调整了模型参数的初始模型称为待训练模型。

所述步骤S30中的根据修正后的损失函数值调整所述待训练模型的模型参数的步骤包括：

步骤S301，根据所述正例训练数据对应的损失函数值和修正后的所述负例训练数据对应的损失函数值，调整所述待训练模型的模型参数。

然后采用负例训练数据和该正例训练数据一起训练待训练模型，此时训练的过程如上述第一实施例中步骤S10～步骤S30的训练过程。其中，在根据损失函数值进行调整待训练模型的模型参数时，是根据正例训练数据对应的损失函数值和修正后的负例训练数据对应的损失函数值一起调整待训练模型的模型参数的，也即，根据正例训练数据对应的损失函数值和修正后的负例训练数据对应的损失函数值一起计算各个模型参数的梯度，然后基于梯度来更新各个模型参数。而正例训练数据对应的损失函数值类似于负例训练数据的损失函数值的计算过程，也即是正例训练数据输入待训练模型得到预测结果，然后根据预测结果和正例训练数据的标注数据来计算正例训练数据对应的损失函数值的。

在本实施例中，通过先采用正例训练数据来对模型进行初步训练，然后采用正例训练数据和负例训练数据一起来对初步训练后的模型进行微调，也即通过负例进行纠偏，减少模型的误检。并且，通过将正例训练数据和负例训练数据一起来对模型进行微调，避免全部采用负例训练数据造成正例训练数据的训练效果被覆盖。

在一实施例中，所述步骤S30还可包括：

步骤S302，根据修正后的损失函数值调整所述待训练模型的模型参数；

步骤S303，检测调整模型参数后的待训练模型是否满足预设模型条件；

步骤S304，若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；

步骤S305，若检测到调整模型参数后的待训练模型满足预设模型条件，则将调整模型参数后的待训练模型作为目标模型。

在一实施例中，在一种实施方式中，在根据修正后的损失函数值调整待训练模型的模型参数后，可检测调整模型参数后的待训练模型是否满足预设模型条件。其中，预设模型条件可以是预先根据对模型的性能需求设置的条件，如可以将模型的损失函数收敛作为一个条件，还可以是将常用的检测模型性能的客观指标作为条件，如准确率、召回率和IOU(Intersection over Union,交并比)等客观指标。若检测到待训练模型满足预设模型条件，则可将调整模型参数后的待训练模型作为最终的目标模型，也即停止训练。若检测到待训练模型不满足预设模型条件，则按照预设规则调整预设阈值，在调整了预设阈值后，再将负例训练数据输入调整模型参数后的待训练模型得到预测结果，当预测结果表征负例训练数据大于调整后的预设阈值时，对负例训练数据对应的损失函数值进行修正，再根据修正后的损失函数值调整待训练模型的模型参数，再次进行待训练模型是否满足预设模型条件的判断。也即，循环进行多次的训练，直到检测到待训练模型满足预设模型条件为止。

其中，调整预设阈值的预设规则可以是预先设置的，例如，先采用一个较大的概率值作为预设阈值，在训练过程中，逐渐减小预设阈值。

在本实施例中，由于负例训练数据中实际上是正例的训练数据所占比例是未知的，所以初次采用的预设阈值的取值可能是不合适的，通过不断训练，不断对预设阈值不断地调整，使得模型的损失函数能够收敛，并且能够找到一个最合适的预设阈值，也即找到一个与实际上是正例的负例训练数据占所有负例训练数据的比例正合适的预设阈值，从而使得对错误标记的负例对模型训练的影响减小的操作更加准确。

此外，此外本申请实施例还提出一种模型性能优化装置，参照图4，所述模型性能优化装置包括：

输入模块10，用于将预设的负例训练数据输入待训练模型得到预测结果；

修正模块20，用于当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；

调整模块30，用于根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。

在一实施例中，所述预测结果是所述负例训练数据被预测为负例的概率，所述修正模块20包括：

获取单元，用于当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；

在一实施例中，所述获取单元包括：

在一实施例中，所述模型性能优化装置还包括：

所述调整模块30包括：

在一实施例中，所述调整模块30包括：

第三调整单元，用于若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；

图像输入模块，用于将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；

在一实施例中，所述模型性能优化装置还包括：

增广模块，用于对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。

本申请模型性能优化装置的具体实施方式的拓展内容与上述模型性能优化方法各实施例基本相同，在此不做赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述存储介质上存储有模型性能优化程序，所述模型性能优化程序被处理器执行时实现如下所述的模型性能优化方法的步骤。

本申请模型性能优化设备和计算机可读存储介质的各实施例，均可参照本申请模型性能优化方法各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种模型性能优化方法，其中，所述模型性能优化方法包括以下步骤：

将预设的负例训练数据输入待训练模型得到预测结果；

当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；以及

根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。
如权利要求1所述的模型性能优化方法，其中，所述预测结果是所述负例训练数据被预测为负例的概率，所述当所述预测结果表征所述负例训练数据预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正的步骤包括：

当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；以及

将所述损失修正系数乘以所述负例训练数据对应的损失函数值，以对所述损失函数值进行修正。
如权利要求2所述的模型性能优化方法，其中，所述当所述预测结果大于所述预设阈值时，获取预设的损失修正系数的步骤包括：

当所述预测结果大于所述预设阈值时，将所述预测结果代入预设的平滑下降公式得到所述损失修正系数，其中，所述损失修正系数随着所述预测结果变大而变小。
如权利要求3所述的模型性能优化方法，其中，所述
平滑下降公式为：

其中，α(p)为损失修正系数，α为预设阈值，p为预测结果。
如权利要求1所述的模型性能优化方法，其中，所述将预设的负例训练数据输入待训练模型得到预测结果的步骤之前，还包括：

基于预设的正例训练数据对初始模型进行初步训练，得到所述待训练模型；

所述根据修正后的损失函数值调整所述待训练模型的模型参数的步骤包括：

根据所述正例训练数据对应的损失函数值和修正后的所述负例训练数据对应的损失函数值，调整所述待训练模型的模型参数。
如权利要求1所述的模型性能优化方法，其中，所述根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型的步骤包括：

根据修正后的损失函数值调整所述待训练模型的模型参数；

检测调整模型参数后的待训练模型是否满足预设模型条件；

若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；以及

若检测到调整模型参数后的待训练模型满足预设模型条件，则将调整模型参数后的待训练模型作为目标模型。
如权利要求1至6任一项所述的模型性能优化方法，其中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型的步骤之后，还包括：

将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；以及

根据所述分类结果得到所述待检测卫星图像的养殖场检测结果。
如权利要求7所述的模型性能优化方法，其中，所述将预设的负例训练数据输入待训练模型得到预测结果的步骤之前，还包括：

对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。
如权利要求8所述的模型性能优化方法，其中，损失函数为：

其中，DL 2为损失函数值，p为待训练模型输出的像素点的分类类别，n为像素点的编号，N为总像素点个数，r为像素点的标注类别，ε为预设的一个极小值。
如权利要求1所述的模型性能优化方法，其中，所述对负例训练数据对应的损失函数值进行修正，使得修正后的损失函数值小于修正前的损失函数值的步骤包括：

将负例训练数据对应的损失函数值减少一个预设值，以及将负例训练数据对应的损失函数值乘以一个预设的小于1的正数。
如权利要求1所述的模型性能优化方法，其中，所述根据修正后的损失函数值调整所述待训练模型的模型参数包括：

根据修正后的损失函数值计算模型参数对应的梯度，并根据各个模型参数的梯度来对应更新模型参数。
一种模型性能优化装置，其中，所述模型性能优化装置包括：

输入模块，用于将预设的负例训练数据输入待训练模型得到预测结果；

修正模块，用于当所述预测结果表征所述负例训练数据被预测为负例的概率大于预设阈值时，对所述负例训练数据对应的损失函数值进行修正，其中，修正后的损失函数值小于修正前的损失函数值；以及

调整模块，用于根据修正后的损失函数值调整所述待训练模型的模型参数，以对所述待训练模型进行训练得到目标模型。
如权利要求12所述的模型性能优化装置，其中，所述预测结果包括所述负例训练数据被预测为负例的概率，所述修正模块包括：

获取单元，用于当所述预测结果大于所述预设阈值时，获取预设的损失修正系数，其中，所述损失修正系数是小于1的正数；以及

修正单元，用于将所述损失修正系数乘以所述负例训练数据对应的损失函数值，以对所述损失函数值进行修正。
如权利要求13所述的模型性能优化装置，其中，所述获取单元包括：

计算单元，用于当所述预测结果大于所述预设阈值时，将所述预测结果代入预设的平滑下降公式得到所述损失修正系数，其中，所述损失修正系数随着所述预测结果变大而变小。
如权利要求12所述的模型性能优化装置，其中，所述模型性能优化装置还包括：

初步训练模块，用于基于预设的正例训练数据对初始模型进行初步训练，得到所述待训练模型；

所述调整模块包括：

第一调整单元，用于根据所述正例训练数据对应的损失函数值和修正后的所述负例训练数据对应的损失函数值，调整所述待训练模型的模型参数。
如权利要求15所述的模型性能优化装置，其中，所述调整模块包括：

第二调整单元，用于根据修正后的损失函数值调整所述待训练模型的模型参数；

检测单元，用于检测调整模型参数后的待训练模型是否满足预设模型条件；

第三调整单元，用于若检测到调整模型参数后的待训练模型不满足所述预设模型条件，则在按照预设规则调整所述预设阈值后，基于调整模型参数后的待训练模型，再执行所述步骤：将预设的负例训练数据输入待训练模型得到预测结果；以及

确定单元，用于若检测到调整模型参数后的待训练模型满足预设模型条件，则将调整模型参数后的待训练模型作为目标模型。
如权利要求12所述的模型性能优化装置，其中，所述待训练模型是用于检测遥感卫星图像中养殖场的模型，所述模型性能优化装置还包括：

图像输入模块，用于将待检测卫星图像输入所述目标模型得到所述待检测卫星图像中各个像素点的分类结果，其中，所述分类结果用于表示对应的像素点是否属于养殖场；以及

检测模块，用于根据所述分类结果得到所述待检测卫星图像的养殖场检测结果。
如权利要求12所述的模型性能优化装置，其中所述模型性能优化装置还包括：

增广模块，用于对采集到的遥感卫星图像进行数据增广操作得到所述负例训练数据，其中，所述遥感卫星图像对应的标注是负例标注，所述数据增广操作至少包括扭曲操作、翻转操作和加噪操作。
一种模型性能优化设备，其中，所述模型性能优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的模型性能优化程序，所述模型性能优化程序被所述处理器执行时实现如权利要求1至11中任一项所述的模型性能优化方法的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有模型性能优化程序，所述模型性能优化程序被处理器执行时实现如权利要求1至11中任一项所述的模型性能优化方法的步骤。