CN109815988A

CN109815988A - 模型生成方法、分类方法、装置及计算机可读存储介质

Info

Publication number: CN109815988A
Application number: CN201811614135.1A
Authority: CN
Inventors: 诸加丹
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2018-12-27
Filing date: 2018-12-27
Publication date: 2019-05-28
Anticipated expiration: 2038-12-27
Also published as: CN109815988B

Abstract

本发明提供了一种模型生成方法、分类方法、装置及计算机可读存储介质，属于网络技术领域。该方法可以利用初始分类模型获取样本属于每个类别的概率值，根据样本属于每个类别的概率值确定预估类别，根据预估类别与样本所属的真实类别之间的偏差程度，计算初始分类模型的损失值，其中，偏差程度越大损失值越大，若损失值不在预设范围，基于损失值表示的误差程度对初始分类模型进行调整，并继续进行训练，直至损失值在预设范围，将初始分类模型作为分类模型。这样，计算得到损失值表示的误差程度能够代表初始分类模型出现的分类错误的严重程度，进而实现模型的错误程度越大调整程度越大，对模型的调整更加精准，提高模型的收敛速度及精度。

Description

模型生成方法、分类方法、装置及计算机可读存储介质

技术领域

本发明属于网络技术领域，特别是涉及一种模型生成方法、分类方法、装置及计算机可读存储介质。

背景技术

随着网络系统中对象越来越多，为了方便用户便捷的获取到自己所需的对象，经常需要训练分类模型，来对网络系统中的对象进行分类。在训练分类模型的过程中，往往需要计算初始分类模型的损失值，以此作为训练过程中对初始分类模型的调整依据。

现有技术中，通常是，用初始分类模型确定出样本属于每个类别的概率值，然后利用损失函数根据每个类别的概率值计算损失值，具体的，会为除该样本所属的真实类别之外，为其他类别均设置相同的系数，然后根据每个类别的系数与样本对应每个类别的概率值计算损失值，接着，会根据损失值表示的误差程度，对初始分类模型进行调整。

这样，在初始分类模型对应的多个类别之间为相同属性，但是表示的程度不同的情况下，例如，多个类别均表示图像质量，不同类别表示不同程度的图像质量的情况下，为其他类别设置相同的系数，会导致只有在初始分类模型分类正确以及分类错误的情况下，基于每个类别的系数计算出来的损失值是不同的，而在出现分类错误时，无论确定的预估类别与真实类别相差较大，即，初始分类模型的错误程度较大，还是预估类别与真实类别相差较小，即，初始分类模型的错误程度较小，计算出的损失值都是相同的，进而导致对模型参数的调整程度是相同的，无法对初始分类模型进行精准的调整，导致模型训练的精度较差。

发明内容

本发明提供一种模型生成方法、分类方法、装置及计算机可读存储介质，以便解决对初始分类模型的调整不够精准，导致模型训练的精度较差的问题。

依据本发明的第一方面，提供了一种模型生成方法，该方法包括：

利用初始分类模型获取样本属于每个类别的概率值；

根据所述样本属于每个类别的概率值，确定所述样本所属的预设类别，得到预估类别；

根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值；其中，所述偏差程度越大，所述损失值越大；

若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

可选的，所述根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值，包括：

根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量；

根据所述第一损失分量，确定损失值。

可选的，所述根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量，包括：

根据所述预估类别的类别强度值以及所述真实类别的类别强度值，计算所述预估类别与所述真实类别的距离，以作为所述第一损失分量。

基于所述预估类别的类别强度值以及所述真实类别的类别强度值，计算所述预估类别与所述真实类别的距离；

根据所述样本属于所述预估类别的概率值，计算所述初始分类模型对应所述预估类别的错误程度；

基于所述距离及所述错误程度，确定所述第一损失分量。

可选的，所述根据所述样本属于所述预估类别的概率值，计算所述初始分类模型对应所述预估类别的错误程度，包括：

计算预设系数与所述样本属于所述预估类别的概率值的差值；

以自然常数为底，计算所述差值的对数，得到所述错误程度；所述样本属于所述预估类别的概率值越大，所述错误程度越大。

可选的，所述根据所述第一损失分量，确定损失值，包括：

将所述第一损失分量作为所述损失值；或者，

利用所述样本属于每个类别的概率值，计算第二损失分量；将所述第一损失分量与所述第二损失分量之积作为所述损失值。

依据本发明的第二方面，提供了一种分类方法，所述方法包括：

将待分类对象输入分类模型；

通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别；其中，所述分类模型是利用第一方面中任一项所述的方法生成的。

依据本发明的第三方面，提供了一种模型生成装置，该装置包括：

获取模块，用于利用初始分类模型获取样本属于每个类别的概率值；

确定模块，用于根据所述样本属于每个类别的概率值，确定所述样本所属的预设类别，得到预估类别；

计算模块，用于根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值；其中，所述偏差程度越大，所述损失值越大；

调整模块，用于若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

可选的，所述计算模块，包括：

计算子模块，用于根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量；

确定子模块，用于根据所述第一损失分量，确定损失值。

可选的，所述计算子模块，用于：

可选的，所述计算子模块，包括：

第一计算单元，用于基于所述预估类别的类别强度值以及所述真实类别的类别强度值，计算所述预估类别与所述真实类别的距离；

第二计算单元，用于根据所述样本属于所述预估类别的概率值，计算所述初始分类模型对应所述预估类别的错误程度；

确定单元，用于基于所述距离及所述错误程度，确定所述第一损失分量。

可选的，所述第二计算单元，用于：

可选的，所述确定子模块，用于：

将所述第一损失分量作为所述损失值；或者，

依据本发明的第四方面，提供了一种分类装置，所述装置包括：

输入模块，用于将待分类对象输入分类模型；

分类模块，用于通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别；其中，所述分类模型是利用第三方面中任一项所述的装置生成的。

依据本发明的第五方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的模型生成方法，以及第二方面所述的分类方法的步骤。

针对在先技术，本发明具备如下优点：

本发明实施例提供的模型生成方法，可以利用初始分类模型获取样本属于每个类别的概率值，然后根据样本属于每个类别的概率值，确定样本所属的预设类别，得到预估类别，接着，根据预估类别与样本所属的真实类别之间的偏差程度，并利用损失函数计算初始分类模型的损失值，其中，偏差程度越大，损失值越大，最后，若损失值不在预设范围，基于损失值表示的误差程度，对初始分类模型进行调整，并对调整后的初始分类模型继续进行训练，直至损失值在预设范围，将初始分类模型作为分类模型。这样，以预估类别与样本所属的真实类别之间的偏差程度来计算损失值，使得计算得到损失值表示的误差程度能够代表初始分类模型出现的分类错误的严重程度，这样，基于损失值对模型进行调整，可以实现在模型的错误程度越大时，进行更大程度的调整，进而提高模型的收敛速度，提高训练效率，同时，也使得对模型的调整操作更加精准，进而提高模型训练的精度。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例提供的一种模型生成方法的步骤流程图；

图2是本发明实施例提供的另一种模型生成方法的步骤流程图；

图3是本发明实施例提供的一种分类方法的步骤流程图；

图4是本发明实施例提供的另一种分类方法的步骤流程图；

图5是本发明实施例提供的一种模型生成装置的框图；

图6是本发明实施例提供的一种分类装置的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

图1是本发明实施例提供的一种模型生成方法的步骤流程图，如图1所示，该方法可以包括：

步骤101、利用初始分类模型获取样本属于每个类别的概率值。

本发明实施例中，该初始分类模型可以是开发人员，根据实际需求，基于神经网络模型预先构建的，例如，该初始分类模型可以为图像分类模型，或者，又例如，该初始分类模型可以为视频分类模型，等等，相应地，该样本可以是根据该初始分类模型适用的对象选取的，例如，在初始分类模型为图像分类模型时，该样本可以为图像，在初始分类模型为视频分类模型时，该样本可以为视频，进一步地，该初始分类模型可以包括多层结构，每层结构可以实现不同的处理，在构建初始分类模型时，可以根据分类需求，在初始分类模型中预先定义不同的类别。具体的，本步骤中，可以先将样本输入初始分类模型中，以使该初始分类模型通过其包括的各层对样本进行处理，最后，得到该样本的属于每个类别的概率值。

步骤102、根据所述样本属于每个类别的概率值，获取所述样本所属的预设类别，得到预估类别。

本发明实施例中，样本属于某个类别的概率值越大，则可以认为样本属于该类别的可能性越大，相应地，可以确定样本属于每个类别的概率值中的最大概率值对应的类别，将该最大概率值对应的类别作为预估类别。

步骤103、根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值；其中，所述偏差程度越大，所述损失值越大。

本发明实施例中，可以利用损失函数实现根据预估类别与真实类别之间的偏差程度，计算损失值，其中，该损失函数可以是预先构建的，以预估类别与真实类别之间的偏差程度为自变量的递增函数。这样，在预估类别与真实类别之间的偏差程度越大时，即，初始分类模型的分类错误程度越大时，可以保证损失函数的损失值越大，反之，在预估类别与真实类别之间的偏差程度越小时，即，初始分类模型的分类错误程度越小时，可以保证损失函数的损失值越小，这样，计算出来的损失值就能更加精准表示初始分类模型的分类准确度，后续通过该损失值对初始分类模型进行调整时，就能对初始分类模型进行相应程度的调整，即，根据初始分类模型的错误程度，给予初始分类模型相应的“惩罚”。

步骤104、若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

本发明实施例中，如果损失值不在预设范围内，则可以认为初始分类模型还不能将样本分入正确的类别中，该初始分类模型对处理能力还不够以满足需求，因此，可以对初始分类模型中的参数进行调整，然后继续训练，以此来进一步优化该初始分类模型。具体的，可以基于损失值表示的误差程度，对初始分类模型进行调整，由于初始分类模型在出现分类错误时，针对不同的错误程度，会计算出表示不同误差程度的损失值，因此，相较于现有技术中，无论初始分类模型的错误程度多大，都进行相同程度的调整，本步骤中，基于损失值表示的误差程度对初始分类模型进行调整，可以在模型的错误程度越大时，进行更大程度的调整，进而提高模型的收敛速度，提高训练效率，同时，也使得调整操作更加精准。进一步地，在对初始分类模型调整之后，对初始分类模型继续进行训练的过程中，如果某一轮训练中初始分类模型的损失值在该预设范围，则可以认为当前的初始分类模型能够进行准确的分类，因此，可以将初始分类模型作为分类模型。

综上所述，本发明实施例提供的模型生成方法，可以利用初始分类模型获取样本属于每个类别的概率值，然后根据样本属于每个类别的概率值，确定样本所属的预设类别，得到预估类别，接着，根据预估类别与样本所属的真实类别之间的偏差程度，并利用损失函数计算初始分类模型的损失值，其中，偏差程度越大，损失值越大，最后，若损失值不在预设范围，基于损失值表示的误差程度，对初始分类模型进行调整，并对调整后的初始分类模型继续进行训练，直至损失值在预设范围，将初始分类模型作为分类模型。这样，以预估类别与样本所属的真实类别之间的偏差程度来计算损失值，使得计算得到损失值表示的误差程度能够代表初始分类模型出现的分类错误的严重程度，这样，基于损失值对模型进行调整，可以实现在模型的错误程度越大时，进行更大程度的调整，进而提高模型的收敛速度，提高训练效率，同时，也使得对模型的调整操作更加精准，进而提高模型训练的精度。

图2是本发明实施例提供的另一种模型生成方法的步骤流程图，如图2所示，该方法可以包括：

步骤201、利用初始分类模型获取样本属于每个类别的概率值。

具体的，本步骤的实现方式可以参考上述步骤101，本发明实施例在此不做赘述。

步骤202、根据所述样本属于每个类别的概率值，确定所述样本所属的预设类别，得到预估类别。

具体的，本步骤的实现方式可以参考上述步骤102，本发明实施例在此不做赘述。

步骤203、根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值。

本步骤中，该损失函数可以是预先构建的，示例的，该构建时，可以基于预估类别的类别强度以及真实类别的类别强度，构建损失函数，其中，该损失函数可以为以预估类别与真实类别之间的偏差程度为自变量，以损失值为因变量的连续可导函数，通过构建连续可导函数，可以保证后续过程中能够基于该损失函数便捷的计算出损失值所表示的误差程度。

进一步地，基于预估类别的类别强度以及真实类别的类别强度，构建损失函数可以包括如下步骤a～步骤b：

步骤a、以预估类别的类别强度以及真实类别的类别强度作为自变量，预估类别与真实类别的距离作为因变量，构建第一损失分量函数。

具体的，可以通过下述两种实现方式来实现构建第一损失分量函数：

实现方式一、包括以下子步骤(1)～子步骤(3)：

子步骤(1)：以所述预估类别的类别强度以及所述真实类别的类别强度作为自变量，所述预估类别与所述真实类别的距离作为因变量，构建距离函数；所述距离函数中的因变量随着所述自变量的增大而增大。

具体的，该距离函数只要可以用于根据预估类别的类别强度以及所述真实类别的类别强度，计算预估类别与所述真实类别的距离，且能够保证因变量随着自变量的增大而增大，即，距离函数为递增函数。示例的，该距离函数可以为范数函数，假设真实类别的类别强度表示为y，预估类别的类别强度表示为那么，该距离函数可以表示为：

在上述公式(1)中，||*||表示对*求范数。

当然，该距离函数也可以为预估类别的类别强度与真实类别的类别强度的差值的绝对值函数，等等，本发明实施例对此不作限定。

子步骤(2)：以所述样本属于所述预估类别的概率作为自变量，所述初始分类模型对应所述预估类别的错误程度作为因变量，构建错误程度函数；所述错误程度函数中的因变量随着所述自变量的减小而增大，所述最大概率为所述样本属于所述预估类别的概率。

实际应用中，会将样本属于每个类别的概率值中最大概率值对应的类别作为预估类别，因此，该样本属于预估类别的概率，可以为样本属于每个类别的概率值中的最大概率，该最大概率可以代表初始分类模型确定的样本属于该预估类别的可能程度，最大概率越大，则可以认为初始分类模型认为该样本属于该预估类别的可能越大，因此，在出现分类错误时，即，预估类别与实际类别不同时，最大概率越大，则可以认为初始分类模型对应该预估类别的错误程度越大，因此，可以根据样本对应的最大概率，构建错误程度函数，这样，在利用预估类别与真实类别的偏差程度衡量初始分类模型的精度的同时，可以利用该错误程度函数从对应预估类别的错误程度来进一步地衡量初始分类模型的精度，进而提高后续过程中利用损失函数确定的损失值的代表性。

具体的，可以以预设系数与最大概率的差值为自变量，构建以该差值为自变量的递增函数，例如，构建该差值的以自然常数为底的负的对数函数，其中，该预设系数可以为1，即，实际中能够达到的最大概率值，这样，该最大概率与预设系数的差值越小，则表示初始分类模型对应该预估类别的错误程度越大，相应的，该对数函数的取值越大，进而可以利用该对数函数确定的值，能够准确的衡量初始分类模型对应该预估类别的错误程度。示例的，假设样本属于预估类别的概率表示为那么该对数函数P可以表示为：

在上述公式(2)中，由于是小于1的数，因此，的取值范围为不小于0且不大于1，ln(*)表示以自然常数e为底，求*的对数，1n(*)在*不大于1时，ln(*)的值为小于0的负数，因此，随着越大，越小，的绝对值就越大，因此，该对数函数取值就越大。

子步骤(3)：根据所述距离函数以及所述错误程度函数，构建第一损失分量函数。

本步骤中，可以将结合距离函数以及错误程度函数，构建第一损失分量函数，以使得第一损失分量函数，能够在利用预估类别与真实类别的偏差程度衡量初始分类模型的精度的同时，利用该错误程度函数基于初始分类模型对应预估类别的错误程度来进一步地衡量初始分类模型的精度，进而提高后续过程中利用损失函数确定的损失值的代表性。具体的，可以将距离函数及错误程度函数的乘积作为第一损失分量函数，示例的，该第一损失分量函数可以表示为：

实现方式二、包括以下子步骤(1)～子步骤(2)：

具体的，本步骤的实现方式可以参考上述实现方式一中子步骤(1)的实现方式，本发明实施例在此不做赘述。

子步骤(2)：将所述距离函数作为第一损失分量函数。

本步骤中，可以将直接将距离函数作为第一损失分量函数，以使得第一损失分量函数，能够利用预估类别与真实类别的偏差程度衡量初始分类模型的精度。进而使得后续过程中基于该第一损失分量函数构建的损失函数能够预估类别与真实类别的偏差程度确定损失值。

步骤b、将第一损失分量函数作为损失函数；或者，以样本属于每个类别的概率值作为因变量，初始分类模型相对于所有类别的偏差程度作为自变量，构建第二损失分量函数，并根据第一损失分量函数及第二损失分量函数，构建损失函数。

本步骤中，可以直接将第一损失分量函数作为损失函数，以使得损失函数能够预估类别与真实类别的偏差程度确定损失值，当然，也可以先以样本属于每个类别的概率值作为因变量，初始分类模型相对于每个类别的偏差程度作为自变量，构建第二损失分量函数，根据第一损失分量函数及第二损失分量函数，构建损失函数，使得利用损失函数计算的损失值，还能够表示初始分类模型相对于所有类别的偏差程度，进而进一步提高利用该损失函数计算的损失值的代表性。

示例的，该第二损失分量函数可以为：

在公式(4)中，i表示第i个类别，y_i表示第i个类别的指定系数，k表示类别的总个数，a_i表示样本相对于第i个类别的概率。由于a_i为不大于1的数，因此，的值会小于0，且随着自变量的增大，值会变小，因此，第二损失分量函数：的值，会随着自变量的增大而增大，进而使得该第二损失分量函数的值准确的体现初始分类模型相对于每个类别的偏差程度。

进一步地，以C表示损失函数，那么，根据第一损失分量函数及第二损失分量函数构建的损失函数，可以表示为：

相应地，本步骤中，可以根据下述步骤2031～步骤2032来实现计算所述初始分类模型的损失值：

步骤2031、根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量。

具体的，可以通过下述两种实现方式实现计算第一损失分量的操作：

实现方式一、包括以下子步骤(1)～子步骤(2)：

子步骤(1)：根据所述预估类别的类别强度值以及所述真实类别的类别强度值，计算所述预估类别与所述真实类别的距离。

本步骤中，可以将预估类别的类别强度值以及真实类别的类别强度值输入损失函数，以使损失函数能够先基于该预估类别的类别强度值以及真实类别的类别强度值计算预估类别与所述真实类别的距离。示例的，可以是通过上述公式(1)，计算预估类别的类别强度值以及真实类别的类别强度值的范数，得到预估类别与所述真实类别的距离，当然，也可以是通过计算预估类别的类别强度与真实类别的类别强度的差值的绝对值，得到预估类别与所述真实类别的距离。

子步骤(2)：将所述距离作为所述第一损失分量。

本步骤中，由于预估类别与所述真实类别的距离能够体现初始分类模型出现的分类错误，在类别维度上的严重程度，因此，可以直接将该距离作为第一损失分量。

实现方式二、包括以下子步骤(1)～子步骤(3)：

子步骤(1)：基于所述预估类别的类别强度值以及所述真实类别的类别强度值，计算所述预估类别与所述真实类别的距离。

具体的，本步骤的实现方式可以参考上述计算第一损失分量的实现方式一中子步骤(1)的实现方式，本发明实施例在此不做赘述。

子步骤(2)：根据所述样本属于所述预估类别的概率值，计算所述初始分类模型对应所述预估类别的错误程度。

本步骤中，可以将样本属于所述预估类别的概率值输入损失函数，以使损失函数能够基于该样本属于所述预估类别的概率值，计算初始分类模型对应预估类别的错误程度。具体的，可以是通过上述公式(2)先计算预设系数与该样本属于预估类别的概率值的差值，其中，该预设系数可以为1，接着，可以以自然常数为底，计算该差值的对数，得到错误程度。

子步骤(3)：基于所述距离及所述错误程度，确定所述第一损失分量。

本步骤中，可以计算距离与错误程度的乘积，将该乘积作为第一损失分量，这样，使得该第一损失分量能够在体现预估类别与真实类别的偏差程度的同时，还可以体现该初始分类模型对应预估类别的错误程度，进而提高后续过程中基于该第一损失分量确定的损失值的代表性。

步骤2032、根据所述第一损失分量，确定损失值。

本步骤中，可以直接将第一损失分量作为损失值，保证确定的损失值能够体现预估类别与真实类别的偏差程度，进而保证损失值能够更准确的表示初始分类模型出现的分类错误的严重程度。

或者，也可以先利用样本属于每个类别的概率值，计算第二损失分量，具体的，可以通过上述公式(4)，对于每个类别，计算样本属于该类别的概率的对数与该类别的指定系数的乘积，然后计算每个类别的乘积之和，得到第二损失分量。然后，可以将第一损失分量与第二损失分量之积作为损失值。本发明实施例中，根据第一损失分量及第二损失分量，确定损失函数，可以使得利用计算得到的损失值，还能够表示初始分类模型相对于所有类别的偏差程度，进而进一步提高利用该损失函数计算的损失值的代表性。

步骤204、若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

本步骤中，损失值表示的误差程度可以为损失函数的梯度值，一般，函数在梯度方向的变化最快，即，函数沿着梯度方向的取值最大，因此，在基于损失值表示的误差程度，对初始分类模型进行调整时，可以是先对损失函数做梯度运算，计算损失函数的梯度值。然后根据梯度值，调整初始分类模型中的参数，并对调整后的初始分类模型继续进行训练。

具体的，实际应用中的初始分类模型，其最后一层往往会设定与该分类模型对应的多个类别一一对应的神经元，即每个类别对应分类模型最后一层中的一个神经元，该神经元的输出即为样本属于该类别的概率值，进一步地，以损失函数为公式(4)所示的函数为例，每个神经元采用softmax函数计算样本属于该类别的概率值为例，其中，样本属于第i个类别的概率为：

其中，Zⁱ表示初始分类模型中最后一层的第i个神经元的输入，a_i表示最后一层中第i个神经元的输出，e表示自然常数，表示最后一层所有神经元的输入之和。进一步地，可以先对a_i求导，具体的，假设样本对应的真实类别对应的第m个神经元，那么对于真实类别对应的第m个神经元，即，m＝i时，a_i相对于Zⁱ的导数为：

相应地，对于除真实类别之外的类别对应的神经元，即，m≠i时，a_i相对于Zⁱ的导数为：

同理，对于真实类别对应的第m个神经元，即，m＝i时，相对于Zⁱ的导数为：

对于除真实类别之外的类别对应的神经元，即，m≠i时，相对于Zⁱ的导数，可以表示为：

进一步地，z是关于神经元的权重w和偏置b的函数，由于损失函数是关于a_i以及的函数，损失函数相对于偏置b的梯度，可以表示为：

其中，w_ij表示第i个神经元的第j个权重，进一步地，在i为预估类别对应的神经元时，损失函数相对于偏置b的梯度可以表示为：

在i不为预估类别对应的神经元时，可以表示为：

同理，在i为预估类别对应的神经元时，损失函数相对于权重_w的梯度可以表示为：

其中，L表示当前层，L-1表示前一层神经元，进一步地，在i不为预估类别对应的神经元时，可以表示为：

相应地，可以将相应参数输入上述表达式，计算梯度值，然后计算梯度值与预设步长的乘积，最后，将初始分类模型中的参数减去梯该乘积之后的值，作为新的参数。进一步地，由于损失函数会根据预估类别与样本所属的真实类别之间的偏差程度计算损失值，即，损失函数是关于预估类别及真实类别的函数，那么，相应地，该损失函数的梯度是关于预估类别及真实类别的函数，具体的，从上述示例的梯度计算公式中可以看出，损失函数的梯度是关于预估类别的类别强度及真实类别的类别强度的函数，因此，本发明实施例中，在预估类别与真实类别之间的偏差程度越大时，损失值越大，损失函数的梯度值就会越大，相应地，对模型中参数的调整程度也就越大，进而可以实现对初始分类模型进行更加精准的调整，提高模型的训练速度。进一步地，在对初始分类模型继续进行训练的过程中，如果某一轮训练中初始分类模型的损失值在该预设范围，则可以认为当前的初始分类模型能够进行准确的分类，因此，可以将初始分类模型作为分类模型。

步骤205、若所述损失值在预设范围，将所述初始分类模型作为分类模型。

本步骤中，如果损失值在预设范围，则可以认为该初始分类模型能够进行准确的分类，因此，可以将直接将该初始分类模型作为分类模型。

图3是本发明实施例提供的一种分类方法的步骤流程图，如图3所示，该方法可以包括：

步骤301、将待分类对象输入分类模型。

本发明实施例中，该待处理对象可以是需要进行分类的对象，该待处理对象可以为图片、音频、文本，等等，进一步地，该分类模型可以是上述模型生成方法实施例中生成的。

步骤302、通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别。

本发明实施例中，由于该分类模型在训练过程中，是根据初始分类模型的错误程度来确定损失值的，因此，该分类模型的分类精度较高，进而可以使得基于该分类模型确定的待分类对象的类别越准确。

综上所述，本发明实施例提供的分类方法，可以将待分类对象输入分类模型，通过分类模型对待分类对象进行分类，得到待分类对象的类别，其中，该分类模型在训练过程中，是根据初始分类模型的错误程度来确定损失值的，因此，该分类模型的分类精度较高，进而可以使得基于该分类模型确定的待分类对象的类别越准确。

图4是本发明实施例提供的另一种分类方法的步骤流程图，如图4所示，该方法可以包括：

步骤401、利用初始分类模型获取样本属于每个类别的概率值。

具体的，本步骤的实现方式可以参照上述步骤101，本发明实施例在此不做赘述。

步骤402、根据所述样本属于每个类别的概率值，确定所述样本所属的预设类别，得到预估类别。

具体的，本步骤的实现方式可以参照上述步骤102，本发明实施例在此不做赘述。

步骤403、根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值；其中，所述偏差程度越大，所述损失值越大。

具体的，本步骤的实现方式可以参照上述步骤103，本发明实施例在此不做赘述。

步骤404、若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

具体的，本步骤的实现方式可以参照上述步骤104，本发明实施例在此不做赘述。

步骤405、将待分类对象输入分类模型。

具体的，本步骤的实现方式可以参照上述步骤301，本发明实施例在此不做赘述。

步骤406、通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别。

具体的，本步骤的实现方式可以参照上述步骤302，本发明实施例在此不做赘述。

综上所述，本发明实施例提供的分类方法，可以利用初始分类模型获取样本属于每个类别的概率值，然后根据样本属于每个类别的概率值，确定样本所属的预设类别，得到预估类别，接着，根据预估类别与样本所属的真实类别之间的偏差程度，并利用损失函数计算初始分类模型的损失值，其中，偏差程度越大，损失值越大，接着，若损失值不在预设范围，基于损失值表示的误差程度，对初始分类模型进行调整，并对调整后的初始分类模型继续进行训练，直至损失值在预设范围，将初始分类模型作为分类模型，接着，可以将待分类对象输入分类模型，通过该分类模型对待分类对象进行分类，得到待分类对象的类别。这样，以预估类别与样本所属的真实类别之间的偏差程度来计算损失值，使得计算得到损失值表示的误差程度能够代表初始分类模型出现的分类错误的严重程度，这样，基于损失值对模型进行调整，可以实现在模型的错误程度越大时，进行更大程度的调整，进而提高模型的收敛速度，提高训练效率，同时，也使得对模型的调整操作更加精准，进而提高模型训练的精度，使得基于该分类模型确定的待分类对象的类别越准确。

图5是本发明实施例提供的一种模型生成装置的框图，如图5所示，该装置50可以包括：

获取模块501，用于利用初始分类模型获取样本属于每个类别的概率值。

确定模块502，用于根据所述样本属于每个类别的概率值，确定所述样本所属的预设类别，得到预估类别。

计算模块503，用于根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值；其中，所述偏差程度越大，所述损失值越大。

调整模块504，用于若所述损失值不在预设范围，基于所述损失值表示的误差程度，对所述初始分类模型进行调整，并对调整后的所述初始分类模型继续进行训练，直至所述损失值在所述预设范围，将所述初始分类模型作为分类模型。

可选的，所述计算模块503，包括：

确定子模块，用于根据所述第一损失分量，确定损失值。

可选的，所述计算子模块，用于：

可选的，所述计算子模块，包括：

可选的，所述第二计算单元，用于：

可选的，所述确定子模块，用于：

将所述第一损失分量作为所述损失值；或者，

综上所述，本发明实施例提供的模型生成装置，获取模块可以利用初始分类模型获取样本属于每个类别的概率值，然后确定模块可以根据样本属于每个类别的概率值，确定样本所属的预设类别，得到预估类别，接着，计算模块可以根据预估类别与样本所属的真实类别之间的偏差程度，并利用损失函数计算初始分类模型的损失值，其中，偏差程度越大，损失值越大，最后，若损失值不在预设范围，调整模块可以基于损失值表示的误差程度，对初始分类模型进行调整，并对调整后的初始分类模型继续进行训练，直至损失值在预设范围，将初始分类模型作为分类模型。这样，以预估类别与样本所属的真实类别之间的偏差程度来计算损失值，使得计算得到损失值表示的误差程度能够代表初始分类模型出现的分类错误的严重程度，这样，基于损失值对模型进行调整，可以实现在模型的错误程度越大时，进行更大程度的调整，进而提高模型的收敛速度，提高训练效率，同时，也使得对模型的调整操作更加精准，进而提高模型训练的精度。

图6是本发明实施例提供的一种分类装置的框图，如图6所示，该装置60可以包括：

输入模块601，用于将待分类对象输入分类模型；

分类模块602，用于通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别；其中，所述分类模型是利用上述模型生成装置生成的。

综上所述，本发明实施例提供的分类装置，输入模块可以将待分类对象输入分类模型，分类模块可以通过分类模型对待分类对象进行分类，得到待分类对象的类别，其中，该分类模型在训练过程中，是根据初始分类模型的错误程度来确定损失值的，因此，该分类模型的分类精度较高，进而可以使得基于该分类模型确定的待分类对象的类别越准确。

对于上述装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

另外，本发明实施例还提供一种终端，包括处理器，存储器，存储在存储器上并可在处理上运行的计算机程序，该计算机程序被处理器执行时实现上述模型生成方法实施例，以及分类方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述模型生成方法实施例以及分类方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，可以为只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(RandomAccess Memory，简称RAM)、磁碟或者光盘等。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是：上述各个实施例的任意组合应用都是可行的，故上述各个实施例之间的任意组合都是本发明的实施方案，但是由于篇幅限制，本说明书在此就不一一详述了。

在此提供的模型生成方法以及分类方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造具有本发明方案的系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的模型生成方法以及分类方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种模型生成方法，其特征在于，所述方法包括：

利用初始分类模型获取样本属于每个类别的概率值；

2.根据权利要求1所述的方法，其特征在于，所述根据所述预估类别与所述样本所属的真实类别之间的偏差程度，并利用损失函数计算所述初始分类模型的损失值，包括：

根据所述第一损失分量，确定损失值。

3.根据权利要求2所述的方法，其特征在于，所述根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述预估类别的类别强度以及所述真实类别的类别强度，并利用所述损失函数计算第一损失分量，包括：

基于所述距离及所述错误程度，确定所述第一损失分量。

5.根据权利要求4所述的方法，其特征在于，所述根据所述样本属于所述预估类别的概率值，计算所述初始分类模型对应所述预估类别的错误程度，包括：

6.根据权利要求2至5中任一所述的方法，其特征在于，所述根据所述第一损失分量，确定损失值，包括：

将所述第一损失分量作为所述损失值；或者，

7.一种分类方法，其特征在于，所述方法包括：

将待分类对象输入分类模型；

通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别；其中，所述分类模型是利用权利要求1至6中任一项所述的方法生成的。

8.一种模型生成装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述计算模块，包括：

确定子模块，用于根据所述第一损失分量，确定损失值。

10.根据权利要求9所述的装置，其特征在于，所述计算子模块，用于：

11.根据权利要求9所述的装置，其特征在于，所述计算子模块，包括：

12.根据权利要求11所述的装置，其特征在于，所述第二计算单元，用于：

13.根据权利要求9至12中任一所述的装置，其特征在于，所述确定子模块，用于：

将所述第一损失分量作为所述损失值；或者，

14.一种分类装置，其特征在于，所述装置包括：

输入模块，用于将待分类对象输入分类模型；

分类模块，用于通过所述分类模型对所述待分类对象进行分类，得到所述待分类对象的类别；其中，所述分类模型是利用权利要求8至13中任一项所述的装置生成的。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的模型生成方法，以及权利要求7所述的分类方法。