CN115049003A

CN115049003A - 一种预训练模型微调方法、装置、设备和存储介质

Info

Publication number: CN115049003A
Application number: CN202210684822.0A
Authority: CN
Inventors: 陶大程; 丁亮; 钟起煌
Original assignee: Jingdong Technology Information Technology Co Ltd
Current assignee: Jingdong Technology Information Technology Co Ltd
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2022-09-13

Abstract

本发明实施例公开了一种预训练模型微调方法、装置、设备和存储介质。该方法包括：获取与目标下游任务相关联的第一样本数据；基于预设统计语言模型，对第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据；基于目标下游任务对应的实际样本数据，对预训练模型进行微调确定第一微调模型；基于第一微调模型对第二样本数据进行去噪处理，获得去噪后的第三样本数据；基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型。通过本发明实施例的技术方案，可以提高扩充的样本数据的质量，进而提高微调效果。

Description

一种预训练模型微调方法、装置、设备和存储介质

技术领域

本发明实施例涉及超级深度学习技术领域，尤其涉及一种预训练模型微调方法、装置、设备和存储介质。

背景技术

随着计算机技术的快速发展，预训练模型凭借其参数规模大、通用能力强、综合性能好等特点，逐渐成为业界的研究热点。对预训练模型进行下游任务的微调，是利用大规模预训练模型解决下游任务的主要方式。

由于下游任务的训练样本数据较少，从而直接利用下游任务的训练样本数据对预训练模型进行微调，往往难以取得理想效果。目前，为了解决下游任务训练样本数据不足这一问题，通常是获取与下游任务相关联的大规模样本数据，并通过将其与实际样本数据进行混合的方式扩充数据集进行微调。

然而，在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

由于与下游任务相关联的样本数据的质量不高，存在很多噪声，从而将其直接与实际样本数据进行混合得到的微调效果较差，并且模型易出现过拟合现象，无法保证微调获得的下游任务模型的模型性能。

发明内容

本发明实施例提供了一种预训练模型微调方法、装置、设备和存储介质，以提高扩充的样本数据的质量，进而提高微调效果，保证微调获得的下游任务模型的模型性能。

第一方面，本发明实施例提供了一种预训练模型微调方法，包括：

获取与目标下游任务相关联的第一样本数据；

基于预设统计语言模型，对所述第一样本数据进行数据领域分析，并基于领域分析结果，从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据；

基于所述目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型；

基于所述第一微调模型，对所述第二样本数据进行去噪处理，获得去噪后的第三样本数据；

基于所述第三样本数据和所述实际样本数据，对所述第一微调模型进行再次微调，确定第二微调模型，并基于所述第二微调模型确定目标下游任务模型。

第二方面，本发明实施例还提供了一种预训练模型微调装置，包括：

第一样本数据获取模块，用于获取与目标下游任务相关联的第一样本数据；

第二样本数据确定模块，用于基于预设统计语言模型，对所述第一样本数据进行数据领域分析，并基于领域分析结果，从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据；

第一微调模型确定模块，用于基于所述目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型；

第三样本数据确定模块，用于基于所述第一微调模型，对所述第二样本数据进行去噪处理，获得去噪后的第三样本数据；

目标下游任务模型确定模块，用于基于所述第三样本数据和所述实际样本数据，对所述第一微调模型进行再次微调，确定第二微调模型，并基于所述第二微调模型确定目标下游任务模型。

第三方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任意实施例所提供的预训练模型微调方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的预训练模型微调方法。

上述发明中的实施例具有如下优点或有益效果：

通过基于预设统计语言模型，对与目标下游任务相关联的第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据，即获得与目标下游领域强相关的第二样本数据，并利用基于实际样本数据对预训练模型进行微调后的第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据，从而基于预设统计语言模型和自校准方式，可以获得与目标下游领域强相关且不存在噪声的第三样本数据，大大提高了扩充的样本数据的质量。基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型，从而可以提高模型微调效果，进而保证微调获得的下游任务模型的模型性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种预训练模型微调方法的流程图；

图2是本发明实施例提供的另一种预训练模型微调方法的流程图；

图3是本发明实施例提供的一种预训练模型微调装置的结构示意图；

图4是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

图1为本发明实施例提供的一种预训练模型微调方法的流程图，本实施例可适用于基于下游任务对预训练模型进行的情况，尤其是适用于基于下游翻译任务对预训练模型进行微调场景中。该方法可以由预训练模型微调装置来执行，该装置可以由软件和/或硬件的方式来实现，集成于电子设备中。如图1所示，该方法具体包括以下步骤：

S110、获取与目标下游任务相关联的第一样本数据。

其中，目标下游任务可以是指待微调的特定一个下游任务。例如，目标下游任务可以是但不限于翻译任务，以便基于该翻译任务对预训练模型进行微调获得翻译模型。第一样本数据可以是指与目标下游任务存在关联性且容易获得的大量样本数据。

具体地，针对目标下游任务，可以获取与目标下游任务对应的实际样本数据类似的各个第一样本数据，即第一样本数据集。本实施例可以获取与目标下游任务属于相同或相似任务，但粒度更粗更容易获得的各个第一样本数据。例如，若目标下游任务为针对细粒度的方面级情感分析任务，则可以获取属于情感分析任务，但粒度更粗的句子级情感分析的第一样本数据(数据量大)，以便利用第一样本数据对实际样本数据进行样本扩充。

S120、基于预设统计语言模型，对第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据。

其中，目标下游领域可以是指目标下游任务所应用到的特定领域。预设统计语言模型可以是预先设置的，用于分析样本数据所属于的数据领域的模型。例如，预设统计语言模型可以是用于预测输入数据是否为目标下游领域的模型。本实施例中的预设统计语言模型可以是预先利用目标下游任务对应的实际样本数据进行训练获得的，从而基于预设统计语言模型可以确定出每个第一样本数据与目标下游领域的相关程度。

具体地，由于获得的各个第一样本数据对应的数据领域较为广泛，从而需要基于预设统计语言模型，对各个第一样本数据进行领域筛选，以便获得与目标下游领域相同或者相似的第二样本数据，进而提高扩充的样本数据的质量。

需要说明的是，通过筛选与目标下游领域相似的第二样本数据，可以在后续微调时避免因领域差异大而导致的知识灾难性遗忘的问题，从而可以大大提高模型微调效果。

示例性地，S120可以包括：将每个第一样本数据输入至预设统计语言模型中进行数据领域分析，确定每个第一样本数据对应的数据领域为目标下游领域的概率值；基于各个概率值和预设概率值阈值范围，从各个第一样本数据中确定与目标下游领域相匹配的第二样本数据。

其中，概率值可以是指用于表征第一样本数据对应的数据领域与目标下游领域相关程度。本实施例可以利用0-1的数值表征概率值，比如，概率值越大越表明与目标下游领域越相关；也可以利用对数概率的方式表征概率值，比如输出的概率值为负数，并越接近0表明与目标下游领域越相关。预设概率值阈值范围可以是预先设置的，与目标下游领域相匹配的样本数据所对应的概率值范围。例如，在利用对数概率的方式表征概率值时，预设概率值阈值范围可以设置为：[-50,-10]。

具体地，针对每个第一样本数据而言，可以将第一样本数据输入至预先训练获得的预设统计语言模型中进行数据领域分析，并基于预设统计语言模型的输出，可以获得该第一样本数据对应的数据领域为目标下游领域的概率值，并检测该概率值是否位于预设概率值阈值范围，若是，则表明该第一样本数据与目标下游领域强相关，此时可以将该第一样本数据作为第二样本数据。同理，可以从各个第一样本数据中筛选出与目标下游领域相同或者相似的各个第二样本数据，即第二样本数据集。

S130、基于目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型。

具体地，可以基于目标下游任务对应的实际样本数据和相应的实际标签对大规模的预训练模型进行首次微调，即首次训练，获得第一微调模型。例如，将每个实际样本数据输入至预训练模型中，并基于预训练模型的输出，获得相应的预测结果，并基于损失函数，根据预测结果和实际标签确定出训练误差，并将训练误差反向传播至预训练模型中，调整预训练模型中的模型参数，直到达到预设收敛条件，比如迭代次数等于预设次数，或者训练误差变化趋于平稳时，确定预训练模型微调结束，获得第一微调模型。

其中，损失函数可以是但不限于交叉熵损失函数L，该函数可以表示如下：

其中，y和p分别表示实际样本数据对应的实际标签和预测结果；i和j分别表示实际样本数据集中的样本索引和标签类别索引。

S140、基于第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据。

具体地，由于与目标下游任务相关联且与目标下游任务强相关的第二样本数据中存在很多噪声，从而利用第一微调模型，对各个第二样本数据进行去噪处理，获得各个第二样本数据中不存在噪声的各个第三样本数据，即第三样本数据集，进而可以提高扩充的第三样本数据的质量。

示例性地，S140可以包括：将每个第二样本数据输入至第一微调模型中，确定每个第二样本数据对应的输出结果；基于各个第二样本数据对应的输出结果和实际标签，对各个第二样本数据进行去噪处理，获得去噪后的第三样本数据。

具体地，可以利用第一微调模型，对每个领域强相关的第二样本数据进行重新标注，并基于重新标注的输出结果和原始标注的实际标签，可以去除各个第二样本数据中存在噪声的样本数据，获得去噪后的第三样本数据。

示例性地，基于各个第二样本数据对应的输出结果和实际标签，对各个第二样本数据进行去噪处理，获得去噪后的第三样本数据，可以包括：检测每个第二样本数据对应的输出结果和相应的实际标签是否一致；将检测到的输出结果与实际标签一致的各个第二样本数据确定为去燥后的第三样本数据。

具体地，选取输出结果与实际标签相一致的第二样本数据，去除输出结果与实际标签相不一致的第二样本数据，从而通过自校准的方式实现第二样本数据的去噪操作，无需人工参与，自动快速地获得质量更高的大量第三样本数据，从而在扩大下游任务样本数据的同时，提高了扩充样本数据的质量。

S150、基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型。

具体地，可以将与目标下游领域强相关且不存在噪声的第三样本数据和实际样本数据进行混合，以扩充实际样本数据量，从而基于扩充的大量样本数据对第一微调模型进行再次训练，即再次微调，再次微调过程与首次微调过程类似，从而可以获得微调后的第二微调模型，进而提高了微调效果。本实施例可以直接将第二微调模型作为最终获得的目标下游任务模型，以便利用目标下游任务模型处理相应的下游任务，进而保证目标下游任务模型的模型性能。

本实施例的技术方案，通过基于预设统计语言模型，对与目标下游任务相关联的第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据，即获得与目标下游领域强相关的第二样本数据，并利用基于实际样本数据对预训练模型进行微调后的第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据，从而基于预设统计语言模型和自校准方式，可以获得与目标下游领域强相关且不存在噪声的第三样本数据，大大提高了扩充的样本数据的质量。基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型，从而可以提高模型微调效果，进而保证微调获得的下游任务模型的模型性能。

在上述技术方案的基础上，S150中的“基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型”，可以包括：基于第三样本数据，对第一微调模型进行再次微调，确定第三微调模型；基于实际样本数据，对第三微调模型进行再次微调，确定第二微调模型。

具体地，首先基于第三样本数据对第一微调模型进行再次微调，并在获得的第三微调模型的基础上，基于实际样本数据对第三微调模型进行再次微调，从而通过利用二阶段微调方式，可以获得微调效果更好的第二微调模型，进一步避免第三样本数据中的伪噪声对微调效果的影响，进而可以进一步保证下游任务模型的模型性能。

图2为本发明实施例提供的另一种预训练模型微调方法的流程图，本实施例在上述各实施例的基础上，对步骤“基于第二微调模型确定目标下游任务模型”进行了进一步优化。其中与上述各实施例相同或相应的术语的解释在此不再赘述。

参见图2，本实施例提供的另一种预训练模型微调方法具体包括以下步骤：

S210、获取与目标下游任务相关联的第一样本数据。

S220、基于预设统计语言模型，对第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据。

S230、基于目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型。

S240、基于第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据。

S250、基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型。

S260、获取实际测试数据，并将第二微调模型作为当前微调模型。

其中，实际测试数据可以是用于测试下游模型的真实数据。实际测试数据更加接近于模型应用阶段所处理的应用数据。本实施例中用于训练模型的样本数据的标签信息可以直接存储在训练方，而训练方未存储有测试数据的标签信息。

具体地，可以获取目标下游任务对应的不存在标签信息的实际测试数据，并将第二微调模型作为当前微调模型的初始模型，以便基于实际测试数据和第二微调模型进行后续的首次迭代学习，进而可以有效降低用于模型训练的样本数据与测试数据之间的领域差异，进一步提高模型性能。

S270、基于当前微调模型，对实际测试数据进行标注，获得标注后的当前测试数据。

具体地，可以基于当前微调模型，对每个实际测试数据进行测试，并基于测试结果对相应的实际测试数据进行标注，从而可以获得带有标签的当前测试数据。

示例性地，S270可以包括：将实际测试数据输入至当前微调模型中，确定实际测试数据对应的测试结果；将实际测试数据对应的测试结果作为伪标签进行标注，获得标注后的当前测试数据。

具体地，可以将每个实际测试数据输入至当前微调模型所输出的测试结果作为为相应实际测试数据的伪标签，从而可以构建出带有伪标签的当前测试数据集。

S280、基于标注后的当前测试数据和实际样本数据，对当前微调模型进行再次微调，更新当前微调模型。

具体地，将带有伪标签的当前测试数据集与实际样本数据混合，对当前微调模型进行再次训练，并将再次训练后获得的微调模型更新为当前微调模型，以便进行下次迭代学习。通过传导式学习方式，可以将在实际样本数据上学习到的知识推广到目标下游任务的实际测试数据上，从而有效降低实际样本数据与实际测试数据之间的领域差异，进一步提高模型在实际测试数据上的性能。

S290、检测当前是否满足预设测试停止条件，若是，则执行步骤S291，若否，则返回执行步骤S270。

其中，预设测试停止条件可以包括：迭代次数等于预设次数或者当前微调模型性能达到预设性能。

具体地，若检测到当前不满足预设测试停止条件，则可以通过返回执行步骤S270-S280的方式，基于当前微调模型对当前测试数据进行重新标注，并对当前微调模型进行再次微调，直到当前满足预设测试停止条件时，执行步骤S291。

S291、将当前微调模型作为目标下游任务模型。

具体地，在当前满足预设测试停止条件时，表明当前微调模型的模型性能最优，此时可以将该当前微调模型作为目标下游任务模型。

本实施例的技术方案，通过将第二微调模型作为当前微调模型，并基于当前微调模型，对实际测试数据进行标注，获得标注后的当前测试数据，基于标注后的当前测试数据和实际样本数据，对当前微调模型进行再次微调，更新当前微调模型，并返回执行基于当前微调模型，对实际测试数据进行标注的步骤，直到满足预设测试停止条件时，将当前微调模型作为目标下游任务模型，从而可以有效降低实际样本数据与实际测试数据之间的领域差异，进一步提高模型在实际测试数据上的性能，进而提高最终获得的目标下游任务模型的模型性能。

以下是本发明实施例提供的预训练模型微调装置的实施例，该装置与上述各实施例的预训练模型微调方法属于同一个发明构思，在预训练模型微调装置的实施例中未详尽描述的细节内容，可以参考上述预训练模型微调方法的实施例。

图3为本发明实施例提供的一种预训练模型微调装置的结构示意图，本实施例可适用于基于下游任务对预训练模型进行的情况，尤其是适用于基于下游翻译任务对预训练模型进行微调场景中。如图3所示，该装置具体包括：第一样本数据获取模块310、第二样本数据确定模块320、第一微调模型确定模块330、第三样本数据确定模块340和目标下游任务模型确定模块350。

其中，第一样本数据获取模块310，用于获取与目标下游任务相关联的第一样本数据；第二样本数据确定模块320，用于基于预设统计语言模型，对第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据；第一微调模型确定模块330，用于基于目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型；第三样本数据确定模块340，用于基于第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据；目标下游任务模型确定模块350，用于基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型。

可选地，第二样本数据确定模块320，具体用于：

将每个第一样本数据输入至预设统计语言模型中进行数据领域分析，确定每个第一样本数据对应的数据领域为目标下游领域的概率值；基于各个概率值和预设概率值阈值范围，从各个第一样本数据中确定与目标下游领域相匹配的第二样本数据。

可选地，第三样本数据确定模块340，包括：

第二样本数据输入单元，用于将每个第二样本数据输入至第一微调模型中，确定每个第二样本数据对应的输出结果；

第三样本数据确定单元，用于基于各个第二样本数据对应的输出结果和实际标签，对各个第二样本数据进行去噪处理，获得去噪后的第三样本数据。

可选地，第三样本数据确定单元，具体用于：检测每个第二样本数据对应的输出结果和相应的实际标签是否一致；将检测到的输出结果与实际标签一致的各个第二样本数据确定为去燥后的第三样本数据。

可选地，目标下游任务模型确定模块350包括：

第二微调模型确定单元，用于：基于第三样本数据，对第一微调模型进行再次微调，确定第三微调模型；基于实际样本数据，对第三微调模型进行再次微调，确定第二微调模型。

可选地，目标下游任务模型确定模块350还包括：

目标下游任务模型确定单元，用于：获取实际测试数据，并将第二微调模型作为当前微调模型；基于当前微调模型，对实际测试数据进行标注，获得标注后的当前测试数据；基于标注后的当前测试数据和实际样本数据，对当前微调模型进行再次微调，更新当前微调模型，并返回执行基于当前微调模型，对实际测试数据进行标注的步骤；当满足预设测试停止条件时，将当前微调模型作为目标下游任务模型。

可选地，目标下游任务模型确定单元，具体用于：将实际测试数据输入至当前微调模型中，确定实际测试数据对应的测试结果；将实际测试数据对应的测试结果作为伪标签进行标注，获得标注后的当前测试数据。

本发明实施例所提供的预训练模型微调装置可执行本发明任意实施例所提供的预训练模型微调方法，具备执行预训练模型微调方法相应的功能模块和有益效果。

值得注意的是，上述预训练模型微调装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

图4为本发明实施例提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如系统存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发实施例所提供的一种预训练模型微调方法步骤，该方法包括：

获取与目标下游任务相关联的第一样本数据；

基于预设统计语言模型，对第一样本数据进行数据领域分析，并基于领域分析结果，从第一样本数据中确定与目标下游领域相匹配的第二样本数据；

基于目标下游任务对应的实际样本数据，对预训练模型进行微调，确定第一微调模型；

基于第一微调模型，对第二样本数据进行去噪处理，获得去噪后的第三样本数据；

基于第三样本数据和实际样本数据，对第一微调模型进行再次微调，确定第二微调模型，并基于第二微调模型确定目标下游任务模型。

当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供的预训练模型微调方法的技术方案。

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的预训练模型微调方法步骤，该方法包括：

获取与目标下游任务相关联的第一样本数据；

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本领域普通技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个计算装置上，或者分布在多个计算装置所组成的网络上，可选地，他们可以用计算机装置可执行的程序代码来实现，从而可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件的结合。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种预训练模型微调方法，其特征在于，包括：

获取与目标下游任务相关联的第一样本数据；

2.根据权利要求1所述的方法，其特征在于，所述基于预设统计语言模型，对所述第一样本数据进行数据领域分析，并基于领域分析结果，从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据，包括：

将每个所述第一样本数据输入至预设统计语言模型中进行数据领域分析，确定每个所述第一样本数据对应的数据领域为目标下游领域的概率值；

基于各个所述概率值和预设概率值阈值范围，从各个所述第一样本数据中确定与目标下游领域相匹配的第二样本数据。

3.根据权利要求1所述的方法，其特征在于，所述基于所述第一微调模型，对所述第二样本数据进行去噪处理，获得去噪后的第三样本数据，包括：

将每个所述第二样本数据输入至所述第一微调模型中，确定每个所述第二样本数据对应的输出结果；

基于各个第二样本数据对应的输出结果和实际标签，对各个第二样本数据进行去噪处理，获得去噪后的第三样本数据。

4.根据权利要求3所述的方法，其特征在于，所述基于各个第二样本数据对应的输出结果和实际标签，对各个第二样本数据进行去噪处理，获得去噪后的第三样本数据，包括：

检测每个第二样本数据对应的输出结果和相应的实际标签是否一致；

将检测到的输出结果与实际标签一致的各个第二样本数据确定为去燥后的第三样本数据。

5.根据权利要求1所述的方法，其特征在于，所述基于所述第三样本数据和所述实际样本数据，对所述第一微调模型进行再次微调，确定第二微调模型，包括：

基于所述第三样本数据，对所述第一微调模型进行再次微调，确定第三微调模型；

基于所述实际样本数据，对所述第三微调模型进行再次微调，确定第二微调模型。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述基于所述第二微调模型确定目标下游任务模型，包括：

获取实际测试数据，并将所述第二微调模型作为当前微调模型；

基于当前微调模型，对所述实际测试数据进行标注，获得标注后的当前测试数据；

基于标注后的当前测试数据和所述实际样本数据，对当前微调模型进行再次微调，更新当前微调模型，并返回执行所述基于当前微调模型，对所述实际测试数据进行标注的步骤；

当满足预设测试停止条件时，将当前微调模型作为目标下游任务模型。

7.根据权利要求6所述的方法，其特征在于，所述基于当前微调模型，对所述实际测试数据进行标注，获得标注后的当前测试数据，包括：

将所述实际测试数据输入至当前微调模型中，确定所述实际测试数据对应的测试结果；

将所述实际测试数据对应的测试结果作为伪标签进行标注，获得标注后的当前测试数据。

8.一种预训练模型微调装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的预训练模型微调方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的预训练模型微调方法。