CN117952182A

CN117952182A - 一种基于数据质量的混合精度模型训练方法及装置

Info

Publication number: CN117952182A
Application number: CN202410345301.1A
Authority: CN
Inventors: 崔钰; 刘懿; 程稳; 戴雨洋; 吕波; 黄章敏; 曾令仿; 陈�光
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2024-03-25
Filing date: 2024-03-25
Publication date: 2024-04-30
Anticipated expiration: 2044-03-25
Also published as: CN117952182B

Abstract

本说明书公开了一种基于数据质量的混合精度模型训练方法及装置。所述任务执行方法包括：服务器首先接收训练指令，并执行训练指令，以获取目标模型，将预设的样本数据输入到预设的精度调整模型中，得到针对目标模型中包含的每个网络层对应关联数据的调整后精度。并根据调整后精度，对目标模型进行精度调整，得到调整后目标模型，并将样本数据输入调整后目标模型中，得到针对样本数据的预测结果，以最小化预测结果与样本数据对应的实际结果之间的偏差，以及最小化调整后目标模型处理样本数据所消耗的时间为优化目标，对目标模型以及精度调整模型进行训练。

Description

一种基于数据质量的混合精度模型训练方法及装置

技术领域

本说明书涉及深度学习技术领域，尤其涉及一种基于数据质量的混合精度模型训练方法及装置。

背景技术

随着深度学习的快速发展，其在各大领域都取得了巨大的成功，同时也对多个交叉学科的发展起到了重要的推动作用。

目前，神经网络模型的规模越来越大，但是过大的网络规模导致其训练效率和执行效率降低，同时耗费大量的时间来进行计算。因此，产生了混合精度训练的方式来对模型中的网络参数进行调整。然而，现有的训练方式不能使模型得到准确的结果。

基于此，如何通过调整精度来提高神经网络模型训练的效率，同时保证模型输出结果的准确性，则是一个亟待解决的问题。

发明内容

本说明书提供一种基于数据质量的混合精度模型训练方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种基于数据质量的混合精度模型训练方法，包括：

服务器接收训练指令；

执行所述训练指令，以获取目标模型；

将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种，所述样本数据包括：样本文本数据、样本图像数据、样本音频数据；

根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述样本数据输入所述调整后目标模型中，得到针对所述样本数据的预测结果；

以最小化所述预测结果与所述样本数据对应的实际结果之间的偏差，以及最小化所述调整后目标模型处理所述样本数据所消耗的时间为优化目标，对所述目标模型以及所述精度调整模型进行训练。

可选地，将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，具体包括：

将预设的样本数据以及每个网络层所包含的网络参数的张量输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度。

可选地，在将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度之前，所述方法还包括：

对所述样本数据的数据质量进行评估，得到评估结果；

将所述评估结果进行度量，所述度量是指将所述评估结果进行编码，以将所述评估结果转化成可度量的数据；

将度量后的所述评估结果进行向量化，得到向量化后的所述评估结果；

将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，具体包括：

将向量化后的所述评估结果输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度。

可选地，对所述样本数据的数据质量进行评估，得到评估结果，具体包括：

确定所述样本数据的生成时间；

根据所述生成时间以及当前时间，对所述样本数据的数据质量进行评估，得到评估结果。

可选地，在根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型之前，所述方法还包括：

确定部署所述目标模型的设备的设备参数；

根据所述设备参数，对所述调整后精度进行调整，得到目标精度；

根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，具体包括：

根据所述目标精度，对所述目标模型进行精度调整，得到调整后目标模型。

可选地，所述方法还包括：

针对所述目标模型中包含的每个网络层，若确定该网络层中包含的网络参数的调整后精度低于该网络层中包含的网络参数的调整前精度，则增大该网络层对应的张量缩放系数，所述张量缩放系数用于对该网络层的输出数据缩放至预设的数值范围内。

本说明书提供了一种任务执行的方法，包括：

获取任务数据；

将所述任务数据输入到预先训练的精度调整模型中，得到针对用于执行所述任务数据对应任务的目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种；

根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述任务数据输入所述调整后目标模型中，得到针对所述任务数据的输出结果，以根据所述输出结果，执行所述任务数据对应的任务，所述精度调整模型以及所述目标模型是通过上述模型训练方法训练得到的。

本说明书提供了一种基于数据质量的混合精度模型训练装置，包括：

接收模块，用于接收训练指令；

获取模块，用于执行所述训练指令，以获取目标模型；

输入模块，用于将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种，所述样本数据包括：样本文本数据、样本图像数据、样本音频数据；

调整模块，用于根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述样本数据输入所述调整后目标模型中，得到针对所述样本数据的预测结果；

训练模块，用于以最小化所述预测结果与所述样本数据对应的实际结果之间的偏差，以及最小化所述调整后目标模型处理所述样本数据所消耗的时间为优化目标，对所述目标模型以及所述精度调整模型进行训练。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于数据质量的混合精度模型训练方法或任务执行的方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述基于数据质量的混合精度模型训练方法或任务执行的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的基于数据质量的混合精度模型训练方法中，服务器首先接收训练指令，并执行训练指令，以获取目标模型，将预设的样本数据输入到预设的精度调整模型中，得到针对目标模型中包含的每个网络层对应关联数据的调整后精度。并根据调整后精度，对目标模型进行精度调整，得到调整后目标模型，并将样本数据输入调整后目标模型中，得到针对样本数据的预测结果，以最小化预测结果与样本数据对应的实际结果之间的偏差，以及最小化调整后目标模型处理样本数据所消耗的时间为优化目标，对目标模型以及精度调整模型进行训练。

从上述方法可以看出，在本说明书提供的基于数据质量的混合精度模型训练方法中，根据样本数据的数据质量，可以得到针对目标模型中包含的每个网络层对应关联数据的调整后精度，进而对目标模型进行调整，以得到调整后的目标模型，从而使得目标模型在有限的设备条件下，充分利用硬件资源，在不影响目标模型准确率的情况下，得到训练效率更高的目标模型。并且对精度调整模型同时进行训练，以得到针对目标模型更加准确的精度调整结果，进而提高目标模型的训练和执行的效率。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中提供的一种基于数据质量的混合精度模型训练方法的流程示意图；

图2为本说明书提供的一种基于数据质量的混合精度模型训练方法的模块示意图；

图3为本说明书中提供的一种任务执行的方法的流程示意图；

图4为本说明书提供的一种基于数据质量的混合精度模型训练装置的示意图；

图5为本说明书提供的一种任务执行的装置的示意图；

图6为本说明书提供的一种对应于图1或图3的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中提供的一种基于数据质量的混合精度模型训练方法的流程示意图，包括以下步骤：

S101：服务器接收训练指令。

在深度学习领域，最根本的理念就是更深、更庞大的网络意味着更佳的性能，在这样的理念影响下，神经网络模型不断迈向更深的网络架构。但是更深的网络架构意味着更大的计算和存储开销，受限于传统通用加速硬件的性能限制，神经网络模型的训练开销的增长幅度远超硬件性能的增长幅度，从而使算力需求与算力供给的不均衡，这种不均衡催生出了各种基于现有硬件提升训练效率的方法，如：稀疏计算、混合精度训练等都是常见的神经网络模型训练加速方法。

然而，现有的训练方式不能使模型输出准确的结果，也不能很好的利用有限的硬件资源提高模型的训练效率。

基于此，本说明书提供了一种基于数据质量的混合精度模型训练方法，首先获取目标模型，将预设的样本数据输入到预设的精度调整模型中，得到针对目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种。并根据调整后精度，对目标模型进行精度调整，得到调整后目标模型，并将样本数据输入调整后目标模型中，得到针对样本数据的预测结果，以最小化预测结果与样本数据对应的实际结果之间的偏差，以及最小化调整后目标模型处理样本数据所消耗的时间为优化目标，对目标模型以及精度调整模型进行训练。

上述方式可以使精度调整模型根据样本数据得到针对目标模型中包含的每个网络层对应关联数据的调整后精度，以对目标模型进行调整，使目标模型能够在有限的资源下，保持准确率，并且提高训练效率。

在本说明书中，用于实现一种基于数据质量的混合精度模型训练方法的执行主体可以是诸如笔记本电脑、平板电脑等终端设备，当然，也可以是服务器，为了便于描述，本说明书仅以服务器作为执行主体为例，对本说明书中提供的一种基于数据质量的混合精度模型训练方法进行说明。

服务器接收训练指令，以根据训练指令，执行模型训练任务。

S102：执行所述训练指令，以获取目标模型。

首先，服务器可以执行接收到的训练指令，根据训练指令，获取目标模型，并根据获取到的目标模型，得到目标模型对应的模型计算图，其中，目标模型中所有的计算都可以被转化为计算图中的节点，而节点之间的边描述了计算之间的依赖关系，所以，在本说明书中模型计算图用于记录目标模型中所有计算的算子和网络参数，模型计算图中的每个节点分别对应一个算子。其中，本说明书中所提到的精度调整模型可以包括算子精度自适应调节网络和参数精度自适应调节网络，以使精度调整模型对目标模型的算子精度和参数精度进行调整。

在本说明书中，服务器建立算子精度名单，其中，算子精度名单包括目标模型中的各算子对应的精度，当然，算子精度名单中包含了两种特殊的算子，一种是精度较为敏感的算子，当服务器降低算子精度时可能会出现溢出问题，而另一种是对精度不太敏感的算子，当服务器降低算子精度时不容易出现溢出的问题。

在实际对目标模型中的算子进行调整时，根据算子精度名单，取消对这两种算子的调整，防止在调整过程中做出不必要的精度调节尝试。具体地，对于精度敏感的算子进行精度降低时，可能会导致模型训练失败，对于精度不太敏感的算子进行精度调整则会浪费高精度算力。在算子精度名单中这两种算子在所有算子中只占非常小的比例，取消对这两种算子的精度调整可以提升目标模型的训练，避免不必要的调整。

根据算子精度名单，建立目标模型的精度查找表，其中，精度查找表中包括目标模型训练过程中使用的不同算子所对应的初始化精度。一些数值范围较大的算子对应高精度，而其他数值范围较小的算子则采用低精度。目标模型中的算子初始化所采用的精度包括但不限于FP8, FP16, FP32。

根据目标模型的精度查找表，对目标模型对应的模型计算图进行初始化，得到初始化后的模型计算图，在后续对目标模型精度的调整中，模型计算图也需要做出相应调整。

S103：将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种，所述样本数据包括：样本文本数据、样本图像数据、样本音频数据。

服务器通过数据质量评估模块对样本数据的数据质量进行评估，得到评估结果。具体地，服务器确定出样本数据的生成时间，并根据生成时间以及当前时间，对样本数据的数据质量进行评估，以得到评估结果。其中，当样本数据的生成时间距离当前时间越远时，说明样本数据的数据质量的时效性越差，其评估结果越差。

除了通过样本数据的生成时间以及当前时间，对样本数据的数据质量进行评估外，本说明书还可以根据样本数据的其他属性对样本数据的数据质量进行评估。

服务器根据样本数据的来源信息对样本数据进行分级。例如，来自高水平期刊、会议、教材的文章形成的样本数据为级别5，来自其他学术刊物的内容形成的样本数据为级别4，来自维基百科的内容形成的样本数据为级别3，来自专业人员和机构的互联网内容形成的样本数据为级别2，来自一般互联网的内容形成的样本数据为级别1。其中，当样本数据级别越高时，说明样本数据的数据来源越好，其评估结果越好。

服务器还可以通过对样本数据的哈希值校验，以对样本数据的数据质量进行评估。具体地，校验哈希值时，可以使用哈希值校验工具或在线哈希值查询服务。这些工具或服务可以计算样本数据的哈希值，并与官方提供的哈希值进行比较，当样本数据的哈希值与官方提供的哈希值一致时，可以认为样本数据未被篡改或损坏，其评价结果好，当样本数据的哈希值与官方提供的哈希值不一致时，可以认为样本数据已被篡改或损坏，其评价结果差。

针对样本数据的一致性时，服务器将样本数据输入到语言模型中，以通过语言模型对样本数据的一致性进行判别。例如，两篇报道都记录了同一件事且标题相同，都记录的是同一场球赛，但是实际内容却不相同，其中一篇记录了A夺冠，另一篇记录了B夺冠，这样的情况就说明数据不一致。也就是说，如果样本数据存在相同的内容但对于关键信息记录的不一致，则样本数据的一致性低，其评估结果差。

服务器还可以根据样本数据中是否存在乱码，或者不属于指定语言体系的字符对样本数据的可读性进行评估。具体地，服务器确定出上述乱码字符以及不属于指定语言体系的字符的数量，并根据这种字符的数量对样本数据的数据质量进行评估，其中，当这种字符的数量越多时，说明样本数据的数据质量越差，其评估结果越差。

另外，服务器还可以根据样本数据中对细节描述的数据数量，以对样本数据的粒度进行评估，例如，评级为细粒度的数据可以有具体到人物、精确数字、具体日期等数据，当样本数据中缺少某些评级为细粒度的数据，那么就将样本数据划分为更粗的粒度，也就是说，样本数据中缺少的评级为细粒度的数据越多，样本数据对应的粒度越粗。其中，当样本数据的粒度越粗时，说明样本数据的数据质量越差，其评估结果越差。

需要说明的是，上述提到的样本数据可以包括样本文本数据、样本图像数据、样本音频数据，服务器通过数据质量评估模块，按照上述评估方式对样本数据的数据质量进行评估，以得到评估结果。

服务器可以将上述从不同角度对样本数据进行评估的评估结果进行汇总，得到汇总后的评估结果，作为评估结果。当然，也可以是服务器从某一个角度对样本数据的数据质量进行评估，得到评估结果。

服务器通过数据质量度量模块将评估结果进行度量，其中，度量是指将评估结果进行编码，以将评估结果转化成可度量的数据。服务器将度量后的评估结果通过数据质量向量化模块进行向量化，得到向量化后的评估结果。

进一步地，将向量化后的评估结果以及每个网络层所包含的网络参数的张量输入到预设的精度调整模型中，得到针对目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种。

例如，在本说明书中，精度调整模型可以由算子精度自适应调节网络和参数精度自适应调节网络组成。关联数据可以指某个网络层的输入数据和输出数据以及网络参数，其中算子可以表示某个网络层的输入数据通过算子计算得到某个网络层的输入数据对应的输出数据，所以关联数据也可以指算子和网络参数。服务器将向量化后的评估结果以及每个网络层所包含的网络参数的张量输入到预设的精度调整模型的算子精度自适应调节网络和参数精度自适应调节网络中，得到针对目标模型中包含的每个网络层对应算子和网络参数的调整后精度，即模型计算图中各节点和目标模型中网络参数的调整后精度。

在本说明书中，每个网络层所包含的网络参数的张量可以经过张量统计模块的处理再输入到预设的精度调整模型中。具体地，张量统计模块可以计算每个网络层所包含的算子对应的张量的均值、标准差、偏度以及度量，并将算子对应的张量的均值、标准差、偏度以及度量进行向量化，从而产生精度调整模型更易理解的内嵌向量。

S104：根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述样本数据输入所述调整后目标模型中，得到针对所述样本数据的预测结果。

由于神经网络模型中每个网络层的输入输出有一定的局限性。例如，神经网络模型无法感知硬件精度限制等，对于硬件所不支持的精度，这样的情况会导致两个主要的问题：一是神经网络模型使用比硬件所支持的精度更低的精度进行计算时，可能会节省一部分存储空间，但是不会带来训练性能的提升；二是神经网络模型使用比硬件所支持精度更高的精度进行计算时，则会导致使用更多的设备内存进行计算，可能会增加程序的复杂性，同时训练效率大幅度下降。

因此，本说明书提供有精度调节规范化模块，服务器根据部署目标模型的设备的特性对调整后精度进行调整。精度调节规范化模块在初始化时使用的数据为部署目标模型的设备的各项参数，例如，设备支持的计算精度、设备支持的变量存储精度。服务器将精度调节模型输出的调整后精度输入到精度调节规范化模块中，由精度调节规范化模块根据设备参数对调整后精度进行修正和标准化，尽量避免设备所不支持的精度在目标模型的训练中出现。

具体地，服务器确定部署目标模型的设备的设备参数，并根据设备参数，对调整后精度进行调整，得到目标精度，进而根据目标精度，对目标模型进行精度调整，得到调整后目标模型。

进一步地，服务器将样本数据输入到调整后的目标模型中，得到针对样本数据的预测结果。

S105：以最小化所述预测结果与所述样本数据对应的实际结果之间的偏差，以及最小化所述调整后目标模型处理所述样本数据所消耗的时间为优化目标，对所述目标模型以及所述精度调整模型进行训练。

目前将样本数据输入到目标模型中，得到的预测结果可能不够准确，所以需要对目标模型和精度调整模型进行进一步训练。具体地，服务器以最小化预测结果与样本数据对应的实际结果之间的偏差，以及最小化调整后目标模型处理样本数据所消耗的时间为优化目标，对目标模型以及精度调整模型进行训练。

其中，在训练目标模型的过程中，由于目标模型中同时使用了低精度和高精度的精度模式，需要更加精细地控制训练过程中的数值稳定性。在这种情况下，使用损失缩放系数可以更好地平衡不同精度数据之间的差异，从而提高训练速度和目标模型的准确性。具体地，在目标模型进行训练时计算损失值，损失值对应有损失缩放系数，将损失值乘以损失缩放系数后，目标模型逐层进行反向传播。如果目标模型在进行反向传播时梯度没有出现NaN或者Inf，则继续进行反向传播，否则，调节损失缩放系数，当损失缩放系数已达极限，则放弃本轮目标模型的训练。

另外，在目标模型训练时，梯度的计算和传递是至关重要的。然而，当目标模型的网络参数非常大或非常小时，梯度可能会变得非常大或非常小，从而导致训练过程变得不稳定或收敛速度过慢。为了解决这个问题，可以使用张量缩放系数对梯度进行缩放，以控制其大小。

当目标模型中的网络参数精度发生改变时，服务器针对目标模型中包含的每个网络层，若确定该网络层中包含的网络参数的调整后精度低于该网络层中包含的网络参数的调整前精度，则增大该网络层对应的张量缩放系数，其中，张量缩放系数用于对该网络层的输出数据缩放至预设的数值范围内。当然，服务器针对目标模型中包含的每个网络层，张量缩放系数也可以用于对该网络层的其他数据进行缩放，例如：算子、网络参数、输入数据等。

在本说明书中对精度调整模型进行训练时，采用强化学习的方式对精度调整模型中的参数进行更新，具体地，设定一个奖励值，当训练目标模型时，可能会因为精度发生变化而导致目标模型训练失败，此时将奖励值记为0，当目标模型训练成功时，此时将奖励值记为1，以此鼓励精度调节模型往奖励值为1的方向更新参数。

为了更加清楚的描述本说明书提供的方法，这里通过一个例子来说明。例如，样本数据经过处理后与每个网络层所包含的网络参数的张量输入到精度调整模型中，得到调整后精度，并根据部署目标模型的设备的设备参数，对调整后精度进行调整，得到目标精度，再根据目标精度，调整目标模型，以使目标模型输出针对样本数据的更加准确的预测结果，如图2所示。

图2为本说明书提供的一种基于数据质量的混合精度模型训练方法的模块示意图。

从图2中可以看出，服务器先将样本数据输入到数据质量评估模块，得到评估结果，再将评估结果输入到数据质量度量模块，对评估结果进行度量，然后将度量后的评估结果输入到数据质量向量化模块，以得到向量化的评估结果。将向量化的评估结果以及每个网络层所包含的网络参数的张量输入到精度调节模型中，这里的精度调节模型包括算子精度自适应调节网络和参数精度自适应调节网络，服务器将精度调节模型的输出结果输入到精度调节规范化模块，根据精度调节规范化模块输出的结果，对目标模型进行调整，以使目标模型输出针对样本数据的预测结果。

在本说明书中，服务器将预设的样本数据输入到精度调整模型中，以使精度调整模型根据预设的样本数据，得到针对目标模型的调整后精度，这里的预设的样本数据首先要经过数据质量评估，以得到评估结果，在对评估结果依次进行度量和向量化，以得到精度调整模型更容易识别的向量化的评估结果，从而使精度调整模型输出的调整后精度更加适合样本数据和样本数据所对应的目标模型，进一步地，调整后的目标模型可以在保证准确率的情况下提高训练效率。

同时，服务器还可以将每个网络层所包含的网络参数的张量输入到精度调整模型中，这样可以使精度调整模型在对目标模型进行调整时，可以参考目标模型的每个网络层所包含的网络参数的张量，以得到更加符合目标模型的调整后精度。

进一步地，精度调整模型输出的调整后结果还可以根据部署目标模型的设备的设备参数进行调整，以避免精度调整模型输出的调整后精度在部署目标模型的设备上无法实现或实现效果不好。

本说明书中还设置有损失缩放系数和张量缩放系数，用于调整训练过程中的损失值和梯度大小。其中，损失缩放系数是在计算损失函数时使用的，用于缩放损失值，以避免梯度爆炸和梯度消失的问题。张量缩放系数是在训练过程中对张量进行缩放的比例因子，可以用于调整模型训练过程中的梯度大小和损失值，以提高训练的稳定性和效率。

需要注意的是，损失缩放系数和张量缩放系数在使用时需要根据模型的实际情况进行调整。不同的目标模型和样本数据可能需要不同的缩放系数来达到最佳的训练效果。因此，在使用损失缩放系数和张量缩放系数时，需要根据实际情况进行尝试和调整。

根据上述一种基于数据质量的混合精度模型训练方法，得到经过训练后的精度调整模型和目标模型，进而可以得到一种任务执行的方法，具体过程如下图所示。

图3为本说明书中提供的一种任务执行的方法的流程示意图。

S301：获取任务数据。

在本说明书中，服务器可以先获取任务数据，以输入到针对用于执行任务数据任务的目标模型并使目标模型输出结果。这里的任务具体可以是指图像处理任务、智能应答任务、文本分类任务、语音识别任务等。

具体地，在图像处理任务中，任务数据可以指输入到目标模型中待识别的图像数据；在智能应答任务中，任务数据可以指输入到目标模型中用户提出的待应答问题所对应的文本数据；在文本分类任务中，任务数据可以指输入到目标模型中待分类的多种类型的文本数据；在语音识别任务中，任务数据可以指输入到目标模型中待识别的音频数据。

S302：将所述任务数据输入到预先训练的精度调整模型中，得到针对用于执行所述任务数据对应任务的目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种。

服务器将任务数据输入到预先训练的精度调整模型中，得到针对用于执行任务数据对应任务的目标模型中包含的每个网络层对应关联数据的调整后精度，其中，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种。其中精度调整模型的使用方法和训练方式已在上述步骤中说明，在此不再赘述。

S303：根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述任务数据输入所述调整后目标模型中，得到针对所述任务数据的输出结果，以根据所述输出结果，执行所述任务数据对应的任务，所述精度调整模型以及所述目标模型是通过上述模型训练方法训练得到的。

服务器得到精度调整模型输出的调整后精度，根据部署目标模型的设备的设备参数对调整后精度进行调整，得到目标精度，再根据目标精度，对目标模型进行调整，得到调整后目标模型。进一步地，服务器将获取到的任务数据输入到调整后目标模型中，得到针对任务数据的输出结果，以根据目标模型的输出结果，执行任务数据对应的任务。

以上为本说明书的一个或多个实施基于数据质量的混合精度模型训练方法以及一种任务执行的方法，基于同样的思路，本说明书还提供了相应的基于数据质量的混合精度模型训练装置以及一种任务执行的装置，如图4、图5所示。

图4为本说明书提供的一种基于数据质量的混合精度模型训练装置的示意图，包括：

接收模块401，用于接收训练指令；

获取模块402，用于执行所述训练指令，以获取目标模型；

输入模块403，用于将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种；

调整模块404，用于根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述样本数据输入所述调整后目标模型中，得到针对所述样本数据的预测结果；

训练模块405，用于以最小化所述预测结果与所述样本数据对应的实际结果之间的偏差，以及最小化所述调整后目标模型处理所述样本数据所消耗的时间为优化目标，对所述目标模型以及所述精度调整模型进行训练。

可选地，所述输入模块403具体用于，将预设的样本数据以及每个网络层所包含的网络参数的张量输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度。

可选地，在将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度之前，所述输入模块403还用于，对所述样本数据的数据质量进行评估，得到评估结果；将所述评估结果进行度量，所述度量是指将所述评估结果进行编码，以将所述评估结果转化成可度量的数据；将度量后的所述评估结果进行向量化，得到向量化后的所述评估结果；

所述输入模块403具体用于，将向量化后的所述评估结果输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度。

可选地，所述输入模块403具体用于，确定所述样本数据的生成时间；根据所述生成时间以及当前时间，对所述样本数据的数据质量进行评估，得到评估结果。

可选地，在根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型之前，所述调整模块404还用于，确定部署所述目标模型的设备的设备参数；根据所述设备参数，对所述调整后精度进行调整，得到目标精度；

所述调整模块404具体用于，根据所述目标精度，对所述目标模型进行精度调整，得到调整后目标模型。

可选地，所述调整模块404还用于，针对所述目标模型中包含的每个网络层，若确定该网络层中包含的网络参数的调整后精度低于该网络层中包含的网络参数的调整前精度，则增大该网络层对应的张量缩放系数，所述张量缩放系数用于对该网络层的输出数据缩放至预设的数值范围内。

图5为本说明书提供的一种任务执行装置的示意图，包括：

获取模块501，用于获取任务数据；

输入模块502，用于将所述任务数据输入到预先训练的精度调整模型中，得到针对用于执行所述任务数据对应任务的目标模型中包含的每个网络层对应关联数据的调整后精度，针对每个网络层，该网络层对应的关联数据包括：该网络层的输入数据、该网络层的网络参数以及该网络层的输出数据中的至少一种；

调整模块503，用于根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述任务数据输入所述调整后目标模型中，得到针对所述任务数据的输出结果，以根据所述输出结果，执行所述任务数据对应的任务，所述精度调整模型以及所述目标模型是通过上述模型训练方法训练得到的。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的一种基于数据质量的混合精度模型训练方法或图3提供的一种任务执行的方法。

本说明书还提供了图6所示的一种对应于图1或图3的电子设备的示意结构图。如图6所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的基于数据质量的混合精度模型训练方法或图3所述的任务执行的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

对于一个技术的改进可以很明显地区分是硬件上的改进（例如，对二极管、晶体管、开关等电路结构的改进）还是软件上的改进（对于方法流程的改进）。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件（ProgrammableLogic Device, PLD）（例如现场可编程门阵列（Field Programmable Gate Array，FPGA））就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器（logic compiler）”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言（HardwareDescription Language，HDL），而HDL也并非仅有一种，而是有许多种，如ABEL（AdvancedBoolean Expression Language）、AHDL（Altera Hardware Description Language）、Confluence、CUPL（Cornell University Programming Language）、HDCal、JHDL（JavaHardware Description Language）、Lava、Lola、MyHDL、PALASM、RHDL（Ruby HardwareDescription Language）等，目前最普遍使用的是VHDL（Very-High-Speed IntegratedCircuit Hardware Description Language）与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该（微）处理器执行的计算机可读程序代码（例如软件或固件）的计算机可读介质、逻辑门、开关、专用集成电路（Application Specific Integrated Circuit，ASIC）、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种基于数据质量的混合精度模型训练方法，其特征在于，包括：

服务器接收训练指令；

执行所述训练指令，以获取目标模型；

2.如权利要求1所述的方法，其特征在于，将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度，具体包括：

3.如权利要求1所述的方法，其特征在于，在将预设的样本数据输入到预设的精度调整模型中，得到针对所述目标模型中包含的每个网络层对应关联数据的调整后精度之前，所述方法还包括：

对所述样本数据的数据质量进行评估，得到评估结果；

4.如权利要求3所述的方法，其特征在于，对所述样本数据的数据质量进行评估，得到评估结果，具体包括：

确定所述样本数据的生成时间；

5.如权利要求1所述的方法，其特征在于，在根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型之前，所述方法还包括：

确定部署所述目标模型的设备的设备参数；

6.如权利要求1所述的方法，其特征在于，所述方法还包括：

7.一种任务执行的方法，其特征在于，包括：

获取任务数据；

根据所述调整后精度，对所述目标模型进行精度调整，得到调整后目标模型，并将所述任务数据输入所述调整后目标模型中，得到针对所述任务数据的输出结果，以根据所述输出结果，执行所述任务数据对应的任务，所述精度调整模型以及所述目标模型是通过如权利要求1~6任一项所述的方法训练得到的。

8.一种基于数据质量的混合精度模型训练装置，其特征在于，包括：

接收模块，用于接收训练指令；

获取模块，用于执行所述训练指令，以获取目标模型；

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。