CN114462598A

CN114462598A - 深度学习模型的训练方法、确定数据类别的方法和装置

Info

Publication number: CN114462598A
Application number: CN202210135142.3A
Authority: CN
Inventors: 尚方信; 杨叶辉; 王晓荣; 黄海峰; 王磊
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-02-14
Filing date: 2022-02-14
Publication date: 2022-05-10

Abstract

本公开提供了一种深度学习模型的训练方法，涉及人工智能技术领域，尤其涉及深度学习技术。具体实现方案为：根据参数集合，训练分类模型，得到目标参数集合；根据参数集合和目标参数集合，得到第一损失值；以及根据第一损失值，训练用于确定参数集合的深度学习模型。本公开还提供了一种目标分类模型的训练方法、确定数据类别的方法、装置、电子设备和存储介质。

Description

深度学习模型的训练方法、确定数据类别的方法和装置

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习技术。更具体地，本公开提供了一种深度学习模型的训练方法、目标分类模型的训练方法、确定数据类别的方法、装置、电子设备和存储介质。

背景技术

在利用深度学习模型完成一个训练任务之后，基于迁移学习技术，可以将经训练的深度学习模型用于执行另一个训练任务。

发明内容

本公开提供了一种深度学习模型的训练方法、目标分类模型的训练方法、确定数据类别的方法、装置、设备以及存储介质。

根据第一方面，提供了一种深度学习模型的训练方法，该方法包括：根据参数集合，训练分类模型，得到目标参数集合；根据所述参数集合和所述目标参数集合，得到第一损失值；以及根据所述第一损失值，训练用于确定所述参数集合的深度学习模型。

根据第二方面，提供了一种目标分类模型的训练方法，该方法包括：将具有人工标签的第二样本数据输入所述目标分类模型，得到第二输出结果；根据所述人工标签和所述第二输出结果，得到第二损失值；以及根据所述第三损失值，训练所述目标分类模型；其中，所述目标分类模型的初始化参数是通过深度学习模型确定的，所述深度学习模型是根据本公开提供的方法训练的。

根据第三方面，提供了一种确定数据类别的方法，该方法包括：将目标数据输入目标分类模型，得到所述目标数据的类别；其中，所述目标分类模型是根据本公开提供的方法训练的。

根据第四方面，提供了一种深度学习模型的训练装置，该装置包括：第一训练模块，用于根据参数集合，训练分类模型，得到目标参数集合；第一获得模块，用于根据所述参数集合和所述目标参数集合，得到第一损失值；以及第二训练模块，用于根据所述第一损失值，训练用于确定所述参数集合的深度学习模型。

据第五方面，提供了一种目标分类模型的训练装置，该装置包括：第二获得模块，用于将具有人工标签的第二样本数据输入所述目标分类模型，得到第二输出结果；第三获得模块，用于根据所述人工标签和所述第二输出结果，得到第三损失值；以及第三训练模块，用于根据所述第三损失值，训练所述目标分类模型；其中，所述目标分类模型的初始化参数是通过深度学习模型确定的，所述深度学习模型是根据本公开提供的装置训练的。

据第六方面，提供了一种确定数据类别的装置，该装置包括：第四获得模块，用于将目标数据输入目标分类模型，得到所述目标数据的类别；其中，所述目标分类模型是根据本公开提供的装置训练的。

根据第七方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。

根据第八方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。

根据第九方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据本公开提供的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开的一个实施例的深度学习模型的训练方法的流程图；

图2是根据本公开的另一个实施例的深度学习模型的训练方法的流程图；

图3A是根据本公开的一个实施例的原始图像样本数据的示意图；

图3B是根据本公开的一个实施例的第一样本数据的示意图；

图3C是根据本公开的一个实施例的深度学习模型的训练方法的原理图；

图4是根据本公开的一个实施例的目标分类模型的训练方法的流程图；

图5A是根据本公开的一个实施例的一个第二样本数据的示意图；

图5B是根据本公开的一个实施例的另一个第二样本数据的示意图；

图5C是根据本公开的一个实施例的目标分类模型的训练方法的原理图；

图6是根据本公开的一个实施例的目标分类模型的训练方法的效果图；

图7是根据本公开的一个实施例的确定数据类别的装置的流程图；

图8是根据本公开的一个实施例的深度学习模型的训练装置的框图；

图9是根据本公开的一个实施例的目标分类模型的训练装置的框图；

图10是根据本公开的一个实施例的确定数据类别的装置的框图；以及

图11是根据本公开的一个实施例的可以应用深度学习模型的训练方法、目标分类模型的训练方法和/或确定数据类别的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

基于迁移学习技术，执行不同的训练任务时，分类模型的主干结构可以保持一致。例如，一个训练任务Task_A为：基于自然图像数据集，训练分类模型Model_1。Model_1的主干结构可以为ResNet(Residual Network，残差网络)。另一个训练任务Task_B为：基于医疗图像数据集，训练分类模型Model_1。在完成训练任务Task_A之后，基于迁移学习技术，可以将经训练的分类模型Model_1用于另一个训练任务Task_B。相较于未训练的分类模型Model_1，利用经训练的分类模型Model_1可以在较少的训练周期内完成训练任务Task_B。

然而，若训练任务Task_B’为：基于医疗图像数据集，训练分类模型Model_0。分类模型Model_0的主干结构为LSTM(Long and Short Term Memory，长短时记忆)网络。在完成训练任务Task_A之后，基于迁移学习技术，经训练的分类模型Model_1的参数无法作为分类模型Model_0的初始化参数。

图1是根据本公开的一个实施例的深度学习模型的训练方法的流程图。

如图1所示，该方法100可以包括操作S110至操作S130。

在操作S110，根据参数集合，训练分类模型，得到目标参数集合。

例如，分类模型是来自分类模型集合中的一个模型。分类模型集合中包含多个分类模型。在一个示例中，分类模型集合中可以包括分类模型Model_1、分类模型Model_2等多个分类模型。分类模型Model_1的主干结构如上文所述。分类模型Model_2的主干结构为DenseNet(Dense convolution network，密集卷积网络)。

例如，参数集合中包含多个参数。每个参数对应分类模型的主干结构上的一个节点。

例如，可以对分类模型进行至少一个子周期的训练，得到目标参数集合。在一个示例中，经训练的分类模型的主干结构中每个节点对应一个参数，获取这些参数，可以得到目标参数集合。

在操作S120，根据参数集合和目标参数集合，得到第一损失值。

例如，根据参数集合和目标参数集合，可以利用任一种损失函数，得到第一损失值。在一个示例中，损失函数例如可以是交叉熵损失函数。

在操作S130，根据第一损失值，训练用于确定参数集合的深度学习模型。

例如，根据第一损失值，调整深度学习模型的参数，使得调整后的深度学习模型可以根据分类模型的计算图确定不同的参数集合。

通过本公开实施例，经训练的深度学习模型可以根据不同的分类模型的主干结构，确定不同的参数集合。因此，可以节约对分类模型进行预训练的时间成本。

通过本公开实施例，与相关迁移学习技术不同，分类模型的主干结构可以不一致，由此可以适应各种不同的应用场景。

可以理解，模型的主干结构确定后，即可以确定模型的计算图。

在一些实施例中，根据参数集合，训练分类模型，得到目标参数集合包括：对分类模型进行至少一个子周期的训练，到目标参数集合。例如，可以对初始化后的分类模型Model_1进行多个子周期的训练，直到得到的损失值小于预设损失阈值。可以获取经多个子周期的训练后的分类模型Model_1的主干结构中每个节点的参数，得到目标参数集合。

在一些实施例中，深度学习模型是根据分类模型的计算图确定参数集合的。

例如，计算图可以表征分类模型的主干结构。

例如，深度学习模型可以根据计算图，生成参数集合。在一个示例中，该深度学习模型可以是GHNs(Graph HyperNetworks，图超网络)模型。在一个示例中，深度学习模型可以根据分类模型Model_1的计算图，生成参数集合Para_1。

图2是根据本公开另一个实施例的深度学习模型的训练方法的流程图。

如图2所示，方法210可以根据参数集合，训练分类模型，得到目标参数集合，下面将结合操作S211至操作S214进行详细说明。

在操作S211，根据参数集合，调整分类模型的参数，得到调参后的分类模型。

例如，针对分类模型Model_1，可以将其主干结构上的每个节点的参数对应地替换为参数集合Para_1中的参数，以对该分类模型Model_1进行参数调整，得到调参后的分类模型。

在操作S212，将第一样本数据输入调参后的分类模型，得到第一输出结果。

例如，第一样本数据具有样本标签。

在本公开实施例中，第一样本数据是根据无标签的原始样本数据得到的。

例如，原始样本数据包括原始图像样本数据。在一个示例中，原始图像样本数据可以包括原始医疗图像样本数据，比如原始的眼底图像。

例如，对原始图像样本数据进行图像增强，得到第一样本数据和第一样本数据的样本标签。又例如，样本标签用于表征图像增强的方式。

在一个示例中，图像增强可以包括图像旋转、图像翻转等等各种图像增强方式。以图像旋转为示例，可以将原始的眼底图像顺时针旋转90°，得到一个第一样本数据。该第一样本数据的样本标签Lable_1可以为“旋转90°”。

在操作S213，根据第一输出结果和样本标签，得到第二损失值。

又例如，如上文所述，将第一样本图像输入调参后的分类模型Model_1，得到该眼底图像的类别，该类别为第一输出结果Output_1。根据第一输出结果Output_1和样本标签Lable_1，利用任一种损失函数，可以得到一个第二损失值。在一个示例中，损失函数例如可以是上文所述的交叉熵损失函数。

在操作S214，根据第二损失值，调整调参后的分类模型的参数，得到目标参数集合。

例如，基于上文所述的第二损失值，可以调整调参后的分类模型Model_1的参数，以完成一个子周期的训练。之后，可以获取这次调整后的分类模型Model_1主干结构中每个节点的参数，得到目标参数集合。

通过本公开实施例，可以基于自监督的训练方式对分类模型进行训练。针对基于医疗图像数据集的训练任务，可以根据医疗图像数据自行生成标签，可以降低样本数据的标注成本。

可以理解，第一样本数据可以是文本数据、图像数据、音频数据等各种模态的数据，本公开对此不作限制。

可以理解，原始样本数据还可以包括原始文本样本数据、原始音频样本数据等各种模态的数据，本公开对此不作限制。

在一些实施例中，根据第一损失值，训练深度学习模型包括：针对当前训练周期，根据第一损失值，调整深度学习模型的参数，得到调整后的深度学习模型。例如，调整后的深度学习模型可以根据分类模型Model_1的计算图，可以生成不同于上文的参数集合Para_1的参数集合Para_1’。

在一些实施例中，根据第一损失值，训练用于确定参数集合的深度学习模型还包括：针对下一训练周期，将对应下一训练周期的分类模型的计算图输入调整后的深度学习模型，得到对应下一训练周期的分类模型的参数集合，以训练调整后的深度学习模型。例如，对应下一训练周期的分类模型仍可以是分类模型Model_1，也可以是另一分类模型Model_2。本实施例中，以分类模型Model_2为示例。上文所述的调整的深度学习模型可以根据分类模型Model_2的计算图，生成参数集合Para_2。

图3A是根据本公开的一个实施例的原始图像样本数据的示意图。

如图3A所示，该原始图像样本数据301可以为一个眼底图像。

图3B是根据本公开的一个实施例的第一样本数据的示意图。

如图3B所示，该第一样本数据302可以是对原始图像样本数据301进行顺时针旋转得到的。旋转角度例如可以是90°。该第一样本数据302的标签可以是“旋转90°”。

图3C是根据本公开一个实施例的深度学习模型的训练方法的原理图。

如图3C所示，深度学习模型310根据分类模型的计算图，输出参数集合。分类模型根据参数集合，调整参数，转换为调参后的分类模型320。

接下来，调参后的分类模型320将第一样本图像302作为输入，输出第一输出结果304。第一样本图像302可以具有样本标签303。样本标签303可以为上文所述的“旋转90°”。根据第一输出结果304和样本标签303，可以得到第二损失值305。根据第二损失值305，可以调整调参后的分类模型320的参数，得到目标参数集合。根据参数集合和目标参数集合，可以得到第一损失值。接下来，可以根据第一损失值，调整深度学习模型310的参数，以对深度学习模型310的进行训练。

图4是根据本公开的一个实施例的目标分类模型的训练方法的流程图。

如图4所示，该方法400包括操作S410至操作S430。

在操作S410，将具有人工标签的第二样本数据输入目标分类模型，得到第二输出结果。

例如，目标分类模型可以是上文所述的分类模型集合中的一个，也可以是其他分类模型，本公开对此不做限制。

例如，可以对部分的医疗图像样本数据进行人工标注，以得到第二样本数据。在一个示例中，第二样本图像可以为一个眼底图像，该第二样本图像的人工标签可以是“Negative”。该人工标签“Negative”可以表征眼部无病变。

又例如，第二样本数据可以为多个。

在操作S420，根据人工标签和第二输出结果，得到第三损失值。

例如，根据人工标签和第二输出结果，利用任一种损失函数，可以得到第三损失值。在一个示例中，损失函数例如可以是上文所述的交叉熵损失函数。

在操作S430，根据第三损失值，训练目标分类模型。

例如，目标分类模型的初始化参数是通过深度学习模型确定的。在一个示例中，目标分类模型的初始化参数是将目标分类模型的计算图输入深度学习模型得到的。

例如，深度学习模型是根据本公开提供的方法训练的。在一个示例中，深度学习模型是根据本公开提供的方法100训练的。

通过本公开实施例，根据训练完成的深度学习模型，可以快速地确定目标分类模型的初始化参数，可以高效地对目标分类模型进行训练。

可以理解，第二样本数据可以是文本数据、图像数据、音频数据等各种模态的数据，本公开对此不作限制。

图5A是根据本公开的一个实施例的第二样本数据的示意图。

如图5A所示，第二样本数据501可以上文所述的原始图像样本数据301。对原始图像样本数据301进行人工标注，可以得到第二样本数据501。第二样本数据501的人工标签可以是“Negative”，可以表征眼部无病变。

图5B是根据本公开的一个实施例的另一个第二样本数据的示意图。

如图5B所示，第二样本数据502的人工标签可以是“Positive”，可以表征眼部有病变。

图5C是根据本公开的一个实施例的目标分类模型的训练方法的原理图。

如图5C所示，深度学习模型510可以根据目标分类模型530的计算图，输出参数集合，以确定目标分类模型530的初始化参数。上文所述的深度学习模型310经训练完成后，可以作为本实施例中的深度学习模型510。

接下来，目标分类模型530将第二样本图像501作为输入，输出第二输出结果504。第二样本图像502可以具有人工标签503。人工标签503可以为上文所述的“Negative”，可以表征眼部无病变。根据第二输出结果504和人工标签503，可以得到第三损失值505。根据第三损失值505调整目标分类模型530的参数，以对目标分类模型530进行训练。

图6是根据本公开的一个实施例的目标分类模型的训练方法的效果图。

例如，本实施例中，训练任务M_1为：基于眼底影像数据集EyePACS，训练目标分类模型。眼底影像数据集EyePACS中包含多个眼底图像，每个眼底图像的标签可以表征糖尿病视网膜病变等级。糖尿病视网膜病变等级共有5级，相当于多个眼底图像共对应5个类别。目标分类模型可以根据一个眼底图像，进行分类。在训练任务M_1中，目标分类模型Model_3的初始化参数是将该目标分类模型Model_3的计算图输入深度学习模型得到的，该深度学习模型是经例如方法100训练完成后得到的。

又例如，为了说明本公开的效果，设置了训练任务M_2和训练任务M_3，作为训练任务M_1的对比。

训练任务M_2与训练任务M_1不同之处在于，目标分类模型Model_4的初始化参数是根据ImageNet数据集对目标分类模型Model_4进行预训练后得到的。

训练任务M_3与训练任务M_1不同之处在于，目标分类模型Model_5的初始化参数是随机生成的。

分别执行上文所述的3个训练任务，利用分布一致性指标Kappa进行评估，得到图6所示的效果图。例如，执行上文所述的训练任务M_1，可以得到例如图6所示的曲线C601。执行上文所述的训练任务M_2，可以得到例如图6所示的曲线C602。执行上文所述的训练任务M_3，可以得到例如图6所示的曲线C603。

如图6所示，随着训练进程推进，曲线C601与曲线C602的差异逐渐减小，最终取得接近的Kappa指标数值。可以理解，利用深度学习模型生成的参数集合进行初始化后得到的训练结果，与利用ImageNet数据集进行预训练得到的训练结果接近。但对于不同的主干结构的目标分类模型，经训练的深度学习模型可以快速地根据不同的计算图得到不同的初始化参数，效率更高。

如图6所示，随着训练进程推进，曲线C601一直处于曲线C603的上方。可以理解，利用深度学习模型生成的参数集合进行初始化后得到的训练结果，显著优于随机初始化得到的训练结果。

图7是根据本公开的一个实施例的确定数据类别的方法。

如图7所示，方法700可以包括操作S710。

在操作S710，将目标数据输入目标分类模型，得到目标数据的类别。

例如，目标分类模型是根据本公开提供的方法训练的。

例如，目标分类模型是根据本公开提供的方法400训练的。

可以理解，目标数据可以是文本数据、图像数据、音频数据等各种模态的数据，本公开对此不作限制。

图8是根据本公开的一个实施例的深度学习模型的训练装置的框图。

如图8所示，该装置800可以包括第一训练模块810、第一获得模块820和第二训练模块830。

第一训练模块810，用于根据参数集合，训练分类模型，得到目标参数集合。

第一获得模块820，用于根据所述参数集合和所述目标参数集合，得到第一损失值。

第二训练模块830，用于根据所述第一损失值，训练用于确定所述参数集合的深度学习模型。

在一些实施例中，所述第一训练模块包括：调整单元，用于根据所述参数集合，调整所述分类模型的参数，得到调参后的分类模型；第一获得单元，用于将第一样本数据输入所述调参后的分类模型，得到第一输出结果，其中，所述第一样本数据具有样本标签；第二获得单元，用于根据所述第一输出结果和所述样本标签，得到第二损失值；以及第二调整单元，用于根据所述第二损失值，调整所述调参后的分类模型的参数，得到目标参数集合。

在一些实施例中，所述第一样本数据是根据无标签的原始样本数据得到的。

在一些实施例中，所述原始样本数据包括原始图像样本数据，所述第一样本数据是通过以下单元根据所述原始图像样本数据执行相关操作得到的：增强单元，用于对所述原始图像样本数据进行图像增强，得到所述第一样本数据和所述第一样本数据的样本标签，其中，所述样本标签用于表征所述图像增强的方式。

在一些实施例中，所述原始图像样本数据包括医疗图像样本数据。

在一些实施例中，所述第二训练模块包括：第三调整单元，用于针对当前训练周期，根据所述第一损失值，调整所述深度学习模型的参数，得到调整后的深度学习模型；第四调整单元，用于针对下一训练周期，将对应所述下一训练周期的分类模型的计算图输入所述调整后的深度学习模型，得到对应所述下一训练周期的分类模型的参数集合，以训练所述调整后的深度学习模型。

在一些实施例中，所述深度学习模型是根据所述分类模型的计算图确定所述参数集合的。

图9是根据本公开的一个实施例的目标分类模型的训练装置的框图。

如图9所示，该装置900可以包括第二获得模块910、第三获得模块920和第三训练模块930。

第二获得模块910，用于将具有人工标签的第二样本数据输入所述目标分类模型，得到第二输出结果。

第三获得模块920，用于根据所述人工标签和所述第二输出结果，得到第三损失值。

第三训练模块930，用于根据所述第三损失值，训练所述目标分类模型。

例如，所述目标分类模型的初始化参数是通过深度学习模型确定的，所述深度学习模型是根据本公开提供的装置训练的。

图10是根据本公开的一个实施例的确定数据类别的装置的框图。

如图10所示，该装置1000可以包括第四获得模块1010。

第四获得模块1010，用于将目标数据输入目标分类模型，得到所述目标数据的类别。

例如，所述目标分类模型是根据权利要求15所述的装置训练的。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如深度学习模型的训练方法、目标分类模型的训练方法和/或确定数据类别的方法。例如，在一些实施例中，深度学习模型的训练方法、目标分类模型的训练方法和/或确定数据类别的方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时，可以执行上文描述的深度学习模型的训练方法、目标分类模型的训练方法和/或确定数据类别的方法的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行深度学习模型的训练方法、目标分类模型的训练方法和/或确定数据类别的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种深度学习模型的训练方法，包括：

根据参数集合，训练分类模型，得到目标参数集合；

根据所述参数集合和所述目标参数集合，得到第一损失值；以及

根据所述第一损失值，训练用于确定所述参数集合的深度学习模型。

2.根据权利要求1所述的方法，其中，所述根据所述参数集合，训练所述分类模型，得到目标参数集合包括：

根据所述参数集合，调整所述分类模型的参数，得到调参后的分类模型；

将第一样本数据输入所述调参后的分类模型，得到第一输出结果，其中，所述第一样本数据具有样本标签；

根据所述第一输出结果和所述样本标签，得到第二损失值；以及

根据所述第二损失值，调整所述调参后的分类模型的参数，得到目标参数集合。

3.根据权利要求2所述的方法，其中，所述第一样本数据是根据无标签的原始样本数据得到的。

4.根据权利要求2或3所述的方法，其中，所述原始样本数据包括原始图像样本数据，

所述第一样本数据是根据所述原始图像样本数据执行以下操作得到的：

对所述原始图像样本数据进行图像增强，得到所述第一样本数据和所述第一样本数据的样本标签，

其中，所述样本标签用于表征所述图像增强的方式。

5.根据权利要求4所述的方法，其中，所述原始图像样本数据包括医疗图像样本数据。

6.根据权利要求1所述的方法，其中，所述根据所述第一损失值，训练用于确定所述参数集合的深度学习模型包括：

针对当前训练周期，

根据所述第一损失值，调整所述深度学习模型的参数，得到调整后的深度学习模型；

针对下一训练周期，

将对应所述下一训练周期的分类模型的计算图输入所述调整后的深度学习模型，得到对应所述下一训练周期的分类模型的参数集合，以训练所述调整后的深度学习模型。

7.根据权利要求1所述的方法，其中，所述深度学习模型是根据所述分类模型的计算图确定所述参数集合的。

8.一种目标分类模型的训练方法，包括：

将具有人工标签的第二样本数据输入所述目标分类模型，得到第二输出结果；

根据所述人工标签和所述第二输出结果，得到第三损失值；以及

根据所述第三损失值，训练所述目标分类模型；

其中，所述目标分类模型的初始化参数是通过深度学习模型确定的，所述深度学习模型是根据权利要求1至6任一项所述的方法训练的。

9.一种确定数据类别的方法，包括：

将目标数据输入目标分类模型，得到所述目标数据的类别；

其中，所述目标分类模型是根据权利要求7所述的方法训练的。

10.一种深度学习模型的训练装置，包括：

第一训练模块，用于根据参数集合，训练分类模型，得到目标参数集合；

第一获得模块，用于根据所述参数集合和所述目标参数集合，得到第一损失值；以及

第二训练模块，用于根据所述第一损失值，训练用于确定所述参数集合的深度学习模型。

11.根据权利要求10所述的装置，其中，所述第一训练模块包括：

调整单元，用于根据所述参数集合，调整所述分类模型的参数，得到调参后的分类模型；

第一获得单元，用于将第一样本数据输入所述调参后的分类模型，得到第一输出结果，其中，所述第一样本数据具有样本标签；

第二获得单元，用于根据所述第一输出结果和所述样本标签，得到第二损失值；以及

第二调整单元，用于根据所述第二损失值，调整所述调参后的分类模型的参数，得到目标参数集合。

12.根据权利要求11所述的装置，其中，所述第一样本数据是根据无标签的原始样本数据得到的。

13.根据权利要求11或12所述的装置，其中，所述原始样本数据包括原始图像样本数据，

所述第一样本数据是通过以下单元根据所述原始图像样本数据执行相关操作得到的：

增强单元，用于对所述原始图像样本数据进行图像增强，得到所述第一样本数据和所述第一样本数据的样本标签，

其中，所述样本标签用于表征所述图像增强的方式。

14.根据权利要求13所述的装置，其中，所述原始图像样本数据包括医疗图像样本数据。

15.根据权利要求10所述的装置，其中，所述第二训练模块包括：

第三调整单元，用于针对当前训练周期，根据所述第一损失值，调整所述深度学习模型的参数，得到调整后的深度学习模型；

第四调整单元，用于针对下一训练周期，将对应所述下一训练周期的分类模型的计算图输入所述调整后的深度学习模型，得到对应所述下一训练周期的分类模型的参数集合，以训练所述调整后的深度学习模型。

16.根据权利要求10所述的方法，其中，所述深度学习模型是根据所述分类模型的计算图确定所述参数集合的。

17.一种目标分类模型的训练装置，包括：

第二获得模块，用于将具有人工标签的第二样本数据输入所述目标分类模型，得到第二输出结果；

第三获得模块，用于根据所述人工标签和所述第二输出结果，得到第三损失值；以及

第三训练模块，用于根据所述第三损失值，训练所述目标分类模型；

其中，所述目标分类模型的初始化参数是通过深度学习模型确定的，所述深度学习模型是根据权利要求10至16任一项所述的装置训练的。

18.一种确定数据类别的装置，包括：

第四获得模块，用于将目标数据输入目标分类模型，得到所述目标数据的类别；

其中，所述目标分类模型是根据权利要求16所述的装置训练的。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1至9中任一项所述的方法。