WO2021253941A1

WO2021253941A1 - 神经网络模型训练、图像分类、文本翻译方法及装置、设备

Info

Publication number: WO2021253941A1
Application number: PCT/CN2021/086589
Authority: WO
Inventors: 胡丁晟; 徐斌; 姚棋中
Original assignee: 华为技术有限公司
Priority date: 2020-06-18
Filing date: 2021-04-12
Publication date: 2021-12-23
Also published as: CN113822410A; US20230120631A1; WO2021253941A9; EP4152211A1; EP4152211A4

Abstract

本申请涉及人工智能技术领域，公开了一种神经网络模型训练、图像分类、文本翻译方法及装置、设备，神经网络模型的训练方法包括：首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练，在预设停止条件未被满足时，对码字进行更新，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。由于码字占据的内存空间远小于权重矩阵，从而能够降低从内存中读入的数据量。

Description

神经网络模型训练、图像分类、文本翻译方法及装置、设备

本申请要求于2020年06月18日提交中国专利局、申请号为202010558711.6、发明名称为“神经网络模型训练、图像分类、文本翻译方法及装置、设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种神经网络模型训练方法、一种图像分类方法、一种文本翻译方法及装置、设备。

背景技术

随着人工智能(artificial intelligence，AI)的快速发展，神经网络(neural network，NN)作为引领当前AI发展方向的关键技术，已取得了突破性进展，其在图像处理、文本分类、机器翻译、自然语言处理等诸多领域均取得了很高的准确率。

目前，在利用神经网络模型执行预设任务(例如，图像分类或文本翻译等)时，通常需要预先对神经网络模型进行训练，以提高模型输出任务结果的准确率。神经网络一般可以包括多个权重系数矩阵，在利用神经网络进行预设任务运算时，以分类任务为例，可以向神经网络中输入待分类对象的数据向量，以便神经网络基于该数据向量和自身的多个权重系数矩阵的向量进行计算，得到该数据向量对应的输出向量，而后神经网络可以基于该输出向量对待分类对象进行分类。通常情况下，初始状态下的神经网络中的权重系数矩阵是未知的，为了获取更为准确的权重系数矩阵，以使神经网络能够获得更为准确的运算结果，需要对初始状态下的神经网络进行训练，并在训练过程中，根据神经网络的输出结果和理想的输出结果的差异，对神经网络中每一层包含的权重系数矩阵进行不断更新和修正，直至神经网络能够基于修正后的权重系数矩阵对任一数据向量进行处理后，都能得到一个接近理想的输出向量为止。

但在对神经网络模型进行训练时，为了保证神经网络模型输出结果的准确性，需要利用训练数据反复对每一层包含的权重系数进行不断更新和修正。而目前的神经网络通常会包含较多层(大于15层)网络，而且每一层包含的权重系数矩阵的数据量也较为庞大，导致在训练过程中反复读入权重系数矩阵数据会带来内存瓶颈。甚至在资源受限的场景下难以进行神经网络的训练。

发明内容

本申请实施例提供了一种神经网络模型训练方法、一种图像分类方法、一种文本翻译方法及装置、设备，能够减小神经网络模型训练中权重矩阵的数据量和权重矩阵更新过程中的中间参数计算量，从而使得在利用该神经网络模型执行预设任务(例如，图像分类或文本翻译等)时，能够解决内存瓶颈的问题，并达到预期效果。

第一方面，本申请提供了一种神经网络模型训练方法，该方法包括：首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练，在预设停止条件未被满足时，更新码字，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。

与传统技术相比，由于本申请实施例在对神经网络模型进行训练时，不再直接从内存中读入权重矩阵，而是读入权重矩阵对应的码字，用以构成权重矩阵进行训练，由于码字占据的内存空间要远远小于权重矩阵占据的内存空间，所以能够大幅降低从内存中读入的数据量，克服了内存瓶颈问题。并且，由于本申请在模型训练过程中，不再计算权重矩阵的更新量，而是计算码字的更新量，用以重新确定新的权重矩阵进行后续训练，从而能够减少更新过程中的中间参数计算量，进而使得在资源受限的场景下能够顺利进行神经网络模型的训练。

一种可能的实现方式中，第一权重矩阵为初始权重矩阵时，该方法还包括：

将初始权重矩阵进行划分，以确定初始权重矩阵对应的码字。以便于后续将码字存储到内存中，减小内存占用量。

一种可能的实现方式中，将初始权重矩阵进行划分，以确定初始权重矩阵对应的码字，包括：

将初始权重矩阵划分为k个相同维度的子矩阵；其中，k为大于1的正整数；

将k个相同维度的子矩阵进行聚类处理，得到k个相同维度的子矩阵对应的n个码字，其中，n为大于0的正整数，n≤k；

将n个码字确定为初始权重矩阵对应的码字。

这样，在对神经网络模型进行训练时，可以从内存中获取对应于神经网络模型的初始权重矩阵的码字，进行模型训练，而不需要直接读入初始权重矩阵进行训练，由于码字所占据的数据存储空间要远远小于权重矩阵所占据的数据存储空间，所以能够大幅降低从内存中读入的数据量，有效克服内存瓶颈问题。

一种可能的实现方式中，将k个相同维度的子矩阵进行聚类处理，得到k个相同维度的子矩阵对应的n个码字，包括：

将k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量；

将k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

将k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。

这样，通过聚类和求平均的方式，得到能够表征n个码字，且每一码字能够同时表征多个子矩阵，进而后续可利用这n个码字快速解码出神经网络的权重矩阵。

一种可能的实现方式中，该方法还包括：

当预设停止条件未被满足时，在内存中释放所述神经网络模型的权重矩阵。这样，可以进一步节省内存空间，有利于克服内存瓶颈问题。

一种可能的实现方式中，在预设停止条件未被满足时，更新码字，得到更新后的码字，包括：

在预设停止条件未被满足时，确定神经网络模型的第一权重矩阵的权重梯度；

根据第一权重梯度，确定码字梯度，并根据码字梯度，确定更新后的码字。

这样，可以根据权重梯度确定出码字梯度，以得到更为准确的更新后的码字，用以进行后续的模型训练。

一种可能的实现方式中，根据权重梯度，确定码字梯度，并根据码字梯度，确定更新后的码字，包括：

将权重梯度中属于第j个码字对应的子矩阵的权重梯度进行加权求和，得到第j个码字对应的码字梯度；其中，j分别取1到n的整数；

对第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量；

利用第j个码字的更新量对第j个码字进行更新，得到更新后的第j个码字。

这样，可以准确的确定出各个码字，用以解码出新的权重矩阵进行后续模型训练。

一种可能的实现方式中，该方法还包括：

获取索引，其中，索引为码字和神经网络模型的权重矩阵之间的对应关系。以便于可以利用码字和索引，更加准确地解码出神经网络模型的权重矩阵。

一种可能的实现方式中，预设停止条件包括以下一项或多项条件：

训练数据对应的结果标签值与神经网络模型对训练数据的输出结果之差低于预设差值；

训练数据对应的结果标签值与神经网络模型对训练数据的输出结果之差的变化率低于预设变化阈值；

神经网络模型中的模型参数的更新次数达到预设更新次数；

神经网络模型所采用的损失函数的输出值达到预设阈值；其中，损失函数用于衡量神经网络模型对所述训练数据的输出结果与训练数据对应的结果标签值之间的差距。

第二方面，本申请还提供了一种图像分类方法，该方法包括：获取待分类图像；将待分类图像输入训练好的神经网络模型，得到神经网络模型输出的图像分类结果；其中，神经网络模型的训练过程包括：首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练，其中，训练数据包括正样本图像和负样本图像。当神经网络模型输出训练数据为正样本图像的概率值后，在预设停止条件未被满足时，更新码字，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。

与传统技术相比，本申请实施例是利用预先训练好的神经网络模型对待分类图像进行分类，由于该神经网络模型能够达到全局最优，使得该神经网络模型输出的分类结果更准确，进而能够提高分类结果准确性。

第三方面，本申请还提供了一种文本翻译方法，该方法包括：获取待翻译文本；将待翻译文本输入训练好的神经网络模型，得到神经网络模型输出的文本翻译结果；其中，神经网络模型的训练过程包括：首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练，其中，练数据为样本文本。当神经网络模型输出样本文本的翻译结果后，在预设停止条件未被满足时，更新码字，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。

与传统技术相比，本申请实施例是利用预先训练好的神经网络模型对待翻译文本进行翻译，由于该神经网络模型能够达到全局最优，使得该神经网络模型输出的翻译结果更准确，进而能够提高翻译结果准确性。

第四方面，本申请还提供了一种神经网络模型训练装置，该装置包括：第一获取单元，用于从内存中获取码字，其中，码字对应于神经网络模型的第一权重矩阵；第一训练单元，用于根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练；更新单元，用于在预设停止条件未被满足时，更新码字，得到更新后的码字；存储单元，用于将更新后的码字存储在内存中；第二训练单元，用于利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练；停止单元，用于在预设停止条件被满足时，停止神经网络模型的训练。

一种可能的实现方式中，第一权重矩阵为初始权重矩阵时，该装置还包括：

划分单元，用于将初始权重矩阵进行划分，以确定初始权重矩阵对应的码字。

一种可能的实现方式中，划分单元包括：

第一划分子单元，用于将所述初始权重矩阵划分为k个相同维度的子矩阵；所述k为大于1的正整数；

聚类子单元，用于将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，所述n为大于0的正整数，n≤k；

第一确定子单元，用于将所述n个码字确定为所述初始权重矩阵对应的码字。

一种可能的实现方式中，聚类子单元包括：

降维子单元，用于将k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量；

第二划分子单元，用于将k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

计算子单元，用于将k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。

一种可能的实现方式中，该装置还包括：释放单元，用于当预设停止条件未被满足时，在内存中释放神经网络模型的权重矩阵。

一种可能的实现方式中，更新单元包括：

第二确定子单元，用于在预设停止条件未被满足时，确定神经网络模型的第一权重矩阵的权重梯度；

第三确定子单元，用于根据第一权重梯度和索引，确定码字梯度，并根据码字梯度，确定更新后的码字。

一种可能的实现方式中，第三确定子单元包括：

第一获得子单元，用于将权重梯度中属于第j个码字的索引编号对应的子矩阵的权重梯度进行加权求和，得到第j个码字对应的码字梯度；其中，j分别取1到n的整数；

第二获得子单元，用于对第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量；

第三获得子单元，用于利用第j个码字的更新量对第j个码字进行更新，得到更新后的第j个码字。

一种可能的实现方式中，该装置还包括：

第二获取单元，用于获取索引，其中，索引为码字和神经网络模型的权重矩阵之间的对应关系。

神经网络模型中的模型参数的更新次数达到预设更新次数；

神经网络模型所采用的损失函数的输出值达到预设阈值；其中，损失函数用于衡量神经网络模型对训练数据的输出结果与训练数据对应的结果标签值之间的差距。

第五方面，本申请还提供了一种图像分类装置，该装置包括：图像获取单元，用于获取待分类图像；图像分类单元，用于将待分类图像输入训练好的神经网络模型，得到神经网络模型输出的图像分类结果；神经网络模型训练单元，用于训练所述神经网络模型；

其中，神经网络模型训练单元包括：

第一获取单元，用于从内存中获取码字，其中，码字对应于神经网络模型的第一权重矩阵；

第一训练单元，用于根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练；其中，训练数据包括正样本图像和负样本图像；

更新单元，用于当神经网络模型输出训练数据为正样本图像的概率值后，在预设停止条件未被满足时，更新码字，得到更新后的码字；

存储单元，用于将更新后的码字存储在内存中；

第二训练单元，用于利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练；

停止单元，用于在预设停止条件被满足时，停止神经网络模型的训练。

第六方面，本申请还提供了一种文本翻译装置，该装置包括：文本获取单元，用于获取待翻译文本；文本翻译单元，用于将待翻译文本输入训练好的神经网络模型，得到神经网络模型输出的文本翻译结果；神经网络模型训练单元，用于训练神经网络模型；

其中，神经网络模型训练单元包括：

第一训练单元，用于根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练；其中，训练数据为样本文本；

更新单元，用于当神经网络模型输出所述样本文本的翻译结果后，在预设停止条件未被满足时，更新码字，得到更新后的码字；

存储单元，用于将更新后的码字存储在内存中；

第七方面，本申请还提供了一种神经网络模型训练设备，该神经网络模型训练设备包括：存储器、处理器；

存储器，用于存储指令；处理器，用于执行存储器中的指令，执行上述第一方面及其任意一种可能的实现方式中的神经网络模型训练方法。

第八方面，本申请还提供了一种图像分类设备，该图像分类设备包括：存储器、处理器；

存储器，用于存储指令；处理器，用于执行存储器中的指令，执行上述第二方面中的图像分类方法。

第九方面，本申请还提供了一种文本翻译设备，该文本翻译设备包括：存储器、处理器；

存储器，用于存储指令；处理器，用于执行存储器中的指令，执行上述第三方面中的文本翻译方法。

第十方面，本申请还提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述第一方面及其任意一种可能的实现方式中的神经网络模型训练方法，或者执行上述第二方面中的图像分类方法，或者执行上述第三方面中的文本翻译方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例在对神经网络模型进行训练时，首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对该第一权重矩阵进行训练，在预设停止条件未被满足时，对码字进行更新，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。可见，本申请实施例在对神经网络模型进行训练时，不再直接从内存中读入权重矩阵，而是读入权重矩阵对应的码字，用以构成权重矩阵进行训练，由于码字占据的内存空间要远远小于权重矩阵占据的内存空间，所以能够大幅降低从内存中读入的数据量，克服了内存瓶颈问题。并且，由于本申请在模型训练过程中，不再计算权重矩阵的更新量，而是计算码字的更新量，用以重新确定新的权重矩阵进行后续训练，从而能够减少更新过程中的中间参数计算量，进而使得在资源受限的场景下能够顺利进行神经网络模型的训练。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的人工智能主体框架的一种结构示意图；

图2为本申请实施例应用的一种系统架构的示例图；

图3为本申请实施例提供的一种神经网络模型训练方法的流程图；

图4为本申请实施例的提供的根据码字确定神经网络模型的第一权重矩阵的示意图；

图5为本申请实施例的提供的码字更新的示意图；

图6为本申请实施例提供的一种图像分类方法的流程图；

图7为本申请实施例提供的一种文本翻译方法的流程图；

图8为本申请实施例提供的一种神经网络模型训练装置的结构框图；

图9为本申请实施例提供的一种图像分类装置的结构框图；

图10为本申请实施例提供的一种文本翻译装置的结构框图；

图11为本申请实施例提供的一种神经网络模型训练设备的结构示意图；

图12为本申请实施例提供的一种图像分类设备的结构示意图；

图13为本申请实施例提供的一种文本翻译设备的结构示意图。

具体实施方式

本申请实施例提供了一种神经网络模型训练方法、一种图像分类方法、一种文本翻译方法及装置、设备，能够减小神经网络模型训练中权重矩阵的数据量和权重矩阵更新过程中的中间参数计算量，以解决内存瓶颈的问题，并达到预期训练效果。

下面结合附图，对本申请的实施例进行描述。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

首先对人工智能系统总体工作流程进行描述，请参见图1，图1示出的为人工智能主体框架的一种结构示意图，下面从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度对上述人工智能主题框架进行阐述。其中，“智能信息链”反映从数据的获取到处理的一列过程。举例来说，可以是智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中，数据经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程，反映人工智能为信息技术产业带来的价值。

(1)基础设施

基础设施为人工智能系统提供计算能力支持，实现与外部世界的沟通，并通过基础平台实现支撑。通过传感器与外部沟通；计算能力由智能芯片(CPU、NPU、GPU、ASIC、FPGA等硬件加速芯片)提供；基础平台包括分布式计算框架及网络等相关的平台保障和支持，可以包括云存储和计算、互联互通网络等。举例来说，传感器和外部沟通获取数据，这些数据提供给基础平台提供的分布式计算系统中的智能芯片进行计算。

(2)数据

基础设施的上一层的数据用于表示人工智能领域的数据来源。数据涉及到图形、图像、语音、文本，还涉及到传统设备的物联网数据，包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。

(3)数据处理

数据处理通常包括数据训练，机器学习，深度学习，搜索，推理，决策等方式。

其中，机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、抽取、预处理、训练等。

推理是指在计算机或智能系统中，模拟人类的智能推理方式，依据推理控制策略，利用形式化的信息进行机器思维和求解问题的过程，典型的功能是搜索与匹配。

决策是指智能信息经过推理后进行决策的过程，通常提供分类、排序、预测等功能。

(4)通用能力

对数据经过上面提到的数据处理后，进一步基于数据处理的结果可以形成一些通用的能力，比如可以是算法或者一个通用系统，例如，翻译，文本的分析，计算机视觉的处理，语音识别，图像的识别等等。

(5)智能产品及行业应用

智能产品及行业应用指人工智能系统在各领域的产品和应用，是对人工智能整体解决方案的封装，将智能信息决策产品化、实现落地应用，其应用领域主要包括：智能终端、智能交通、智能医疗、自动驾驶、平安城市等。

由于本申请实施例涉及神经网络模型的训练过程，为了便于理解，下面先对本申请实施例可能涉及的神经网络模型的相关术语和概念进行介绍。

(1)神经网络

神经网络可以是由神经单元组成的，神经单元可以是指以xs和截距1为输入的运算单元，该运算单元的输出可以为：

其中，s＝1、2、……、n，n为大于1的自然数，Ws为Xs的权重，b为神经单元的偏置。f为神经单元的激活函数(activation functions)，用于将非线性特性引入神经网络中，来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入，激活函数可以是sigmoid函数。神经网络是将多个上述单一的神经单元联结在一起形成的网络，即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连，来提取局部接受域的特征，局部接受域可以是由若干个神经单元组成的区域。

(2)损失函数

在训练神经网络的过程中，因为希望神经网络的输出尽可能的接近真正想要预测的值，所以可以通过比较当前网络的预测值和真正想要的目标值，再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然，在第一次更新之前通常会有初始化的过程，即为深度神经网络中的各层预先配置参数)，比如，如果网络的预测值高了，就调整权重向量让它预测低一些，不断地调整，直到深度神经网络能够预测出真正想要的目标值或与真正想要的目标值非常接近的值。因此，就需要预先定义“如何比较预测值和目标值之间的差异”，这便是损失函数(loss function)或目标函数(objective function)，它们是用于衡量预测值和目标值的差异的重要方程。其中，以损失函数举例，损失函数的输出值(loss)越高表示差异越大，那么深度神经网络的训练就变成了尽可能缩小这个loss的过程。

(3)反向传播算法

神经网络可以采用误差反向传播(back propagation，BP)算法在训练过程中修正初始的神经网络模型中参数的大小，使得神经网络模型的重建误差损失越来越小。具体地，前向传递输入信号直至输出会产生误差损失，通过反向传播误差损失信息来更新初始的神经网络模型中参数，从而使误差损失收敛。反向传播算法是以误差损失为主导的反向传播运动，旨在得到最优的神经网络模型的参数，例如权重矩阵。

本申请可以应用于人工智能领域中，下面将对本申请实施例中神经网络模型训练应用的一种系统结构进行介绍。

参见图2，其示出了本申请实施例应用的一种系统架构的示例图，如图2所示，该场景中，包括了内存201、处理器202和AI硬件加速器203。内存201与处理器202连接，处理器202与AI硬件加速器203连接。上述“连接”可以是直接连接，也可以是间接连接。

其中，内存201是计算机中重要的部件之一，它是外部存储器与处理器202进行沟通的桥梁。并且，计算机中所有程序的运行都是在内存中进行的。

处理器202可以是中央处理器(central processing unit，CPU)，用于为挂载其上的AI硬件加速器203分配加速任务等。

AI硬件加速器203可以是一个独立的芯片，也可以作为一个功能模块集成到一个片上系统中(system on chip，SoC)。其主要包括矩阵计算单元(cube unit)、向量计算单元(vector unit)和缓存(buffer)。

矩阵计算单元，用于完成矩阵乘矩阵计算，比如完成神经网络中的梯度计算以及卷积层和全连接层对应的矩阵乘矩阵计算。具体来讲，在进行卷积层或全连接层运算时，矩阵计算单元从数据缓存单元和参数缓存单元中读取数据矩阵对应的数据，其中，从参数缓存单元中读取的参数数据是通过存储器读写控制器搬运到参数缓存单元中，在搬运过程中，需要先通过解压引擎进行参数数据解压缩操作，然后才能在矩阵计算单元上进行矩阵乘计算，得到矩阵的部分结果或最终结果，保存在累加器中。

向量处理单元可以在实际情况需要的情况下，对矩阵计算单元的输出结果做进一步优化处理，如向量乘、向量加、指数运算、对数运算、大小比较等操作。主要用于神经网络中非卷积层和全连接层外其他层的网络计算，如激活函数(rectified linear unit，Relu)层、池化(Pooling)层等。

缓存用于保存从内存加载到AI硬件加速器内部的数据和计算过程中产生的中间数据等。

本申请应用于AI硬件加速器203的神经网络模型训练过程如下：

在本申请实施例中，AI硬件加速器203首先通过处理器202从内存201中获取神经网络模型的初始权重矩阵对应的码字和索引，然后根据获取的码字和索引，确定神经网络模型的权重矩阵，并利用训练数据对该权重矩阵进行训练，当不满足预设停止条件时，对码字进行更新，并利用更新后的码字和之前获取到的索引，重新确定权重矩阵，用以重新进行模型训练，以此类推，只要不满足预设停止条件，就重复对码字进行更新，并利用更新后的码字重新确定权重矩阵，用以重新进行模型训练。直至满足预设停止条件为止，这样，通过减小神经网络模型训练中权重矩阵的数据量和权重矩阵更新过程中的中间参数计算量，不仅解决了内存瓶颈的问题，还能够达到预期的模型训练效果。

需要注意的是，上述应用场景仅是为了便于理解本申请而示出，本申请的实施方式在此方面不受任何限制。相反，本申请的实施方式可以应用于适用的任何场景。

基于以上应用场景，本申请实施例提供了一种神经网络模型训练方法，该方法可应用于AI硬件加速器203，如图3所示，该方法包括：

S301：从内存中获取码字，其中，码字对应于神经网络模型的第一权重矩阵。

在本实施例中，为了克服神经网络模型训练中的内存瓶颈问题，不再反复载入权重矩阵，而是从内存中获取码字，以进行模型训练，其中，码字对应于神经网络模型的第一权重矩阵。并且，当第一权重矩阵为初始权重矩阵时，需要将初始权重矩阵进行划分，以确定初始权重矩阵对应的码字。即，需要预先对神经网络模型的初始权重矩阵进行预处理，将其拆分成对应的码字和对应的索引，其中，码字指的是字典中每个出现状态的表征，而本申请中的每一个码字指的是权重矩阵中的一个子矩阵，且码字占据的内存空间要远远小于权重矩阵占据的内存空间，码字的详细内容请参见后续步骤A2中的相关介绍。索引表征了码字和神经网络模型的权重矩阵之间的对应关系，且神经网络模型每一层包含的权重均值分别各自对应了不同的码字和索引。这样，在对神经网络模型进行训练时，可以从内存中获取对应于神经网络模型的初始权重矩阵的码字，用以执行后续步骤S302-S306来完成模型训练，而不需要直接读入初始权重矩阵进行训练，由于码字所占据的数据存储空间要远远小于权重矩阵所占据的数据存储空间，所以能够大幅降低从内存中读入的数据量，有效克服内存瓶颈问题。

在本实施例的一种可能的实现方式中，预先对神经网络模型的初始权重矩阵进行预处理，将其拆分成对应的码字和索引的具体实现过程可以包括下述步骤A1-A3：

步骤A1：将初始权重矩阵划分为k个相同维度的子矩阵，并确定k个相同维度的子矩阵对应的索引编号；其中，k为大于1的正整数。

在本实现方式中，对神经网络模型的初始权重矩阵进行预处理指的是预先将神经网络模型中每一层包含的初始权重矩阵分别进行预处理，使得每一层包含的初始权重分别各自对应了不同的码字和索引。需要说明的是，在后续内容中，本实施例将以神经网络模型中某一层包含的初始权重矩阵为准来介绍如何对初始权重矩阵进行预处理，以得到其对应的码字和索引并对其进行后续处理，而其它层包含的初始权重矩阵的处理方式与之类似，不再一一赘述。

具体来讲，本申请首先将初始权重划分为k个相同维度的子矩阵，并确定每个子矩阵对应的索引编号，二者是一一对应的关系(即一个子矩阵对应一个索引编号)，比如，可以将k个相同维度的子矩阵对应的索引编号分别定义为i ₀、i ₁、...i _k-1，用以执行步骤A3。其中，k为大于1的正整数。

步骤A2：将k个相同维度的子矩阵进行聚类处理，得到k个相同维度的子矩阵对应的n个码字，并确定n个码字对应的索引值，其中，n为大于0的正整数，n≤k。

在本实现方式中，通过步骤A1将初始权重矩阵划分为k个相同维度的子矩阵后，进一步可以将这k个相同维度的子矩阵进行聚类处理，得到n个类别中心(即n个码字)，其中，n为大于0的正整数，且n≤k，这样，可以利用每一类别中心对应的子矩阵(即码字)，来表征其所属类别中的各个子矩阵。并且，进一步可以确定这n个码字各自对应的索引值，二者是一一对应的关系(即一个码字对应一个索引值)，比如，可以将这n个码字对应的索引值分别定义为1、2、…n，用以执行步骤A3。

具体来讲，一种可选的实现方式是，本步骤A2中“将k个相同维度的子矩阵进行聚类处理，得到k个相同维度的子矩阵对应的n个码字”的具体实现过程可以包括下述步骤A21-A23：

步骤A21：将k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量。

在本实现方式中，为了确定k个相同维度的子矩阵对应的n个码字，首先需要将k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量。

举例说明：假设k个相同维度的子矩阵中包含有一个2*3阶的矩阵：

则可以将其降维成一个包含6个元素的一维向量[a ₁,a ₂,a ₃,a ₄,a ₅,a ₆]。

步骤A22：将k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量。

在本实现方式中，通过步骤A21将k个相同维度的子矩阵分别降维成对应的k个一维向量后，进一步可以将这k个一维向量进行分组，比如，可以将其中元素值较为接近的向量划分为一个向量组，使得每个向量组中包含有至少一个一维向量。

步骤A23：将k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。

在本实现方式中，通过步骤A22将k个一维向量划分为n个向量组后，进一步可以确定出每个向量组的中心向量，用以确定该向量组对应的码字。具体的，以第i个向量组为例(i可以取为1到n中的任意一个整数)，假设第i个向量组中包含有3个一维向量，分别为：[a ₁,a ₂,a ₃,a ₄,a ₅,a ₆]、[b ₁,b ₂,b ₃,b ₄,b ₅,b ₆]、[c ₁,c ₂,c ₃,c ₄,c ₅,c ₆]，则可以将这三个一个向量中对应位置的元素值进行求平均计算，得到一个一维平均向量为：

该一维向量即为第i个向量组对应的码字，且该码字的长度为6，也就是该一维向量包含的元素个数。

需要说明的是，在确定第i个向量组中所有一维向量对应的码字时，还可以利用其他数据处理方式，对第i个向量组中所有一维向量中对应位置的元素值进行处理，比如可以进行加权求平均等，具体处理方式可根据实际情况进行选取，本申请实施例对此不进行限制。

步骤A3：将n个码字确定为初始权重矩阵对应的码字，将n个码字对应的索引值以及索引值对应的索引编号构成初始权重矩阵对应的索引。

在本实现方式中，通过步骤A2将初始权重矩阵划分为k个相同维度的子矩阵，并确定出这k个相同维度的子矩阵对应的索引编号，以及通过步骤A2确定出k个相同维度的子矩阵对应的n个码字以及这n个码字对应的索引值后，可以将这n个码字确定为初始权重对应的码字进行存储，或者，将这n个码字构成一个字典进行存储。同时，可以将这n个码字对应的索引值(例如1、2、…n)以及索引值对应的索引编号(如i ₀、i ₁、...i _k-1)构成初始权重对应的索引。

需要说明的是，由于子矩阵与索引编号是一一对应的关系(即一个子矩阵对应一个索引编号)，且码字与索引值是一一对应的关系(即一个码字对应一个索引值)，而码字又是一个向量组的中心向量(如平均向量)，其中，向量组中每个向量又对应了一个子矩阵，所以，一个码字能够对应表征多个子矩阵，进而可得一个索引值可能对应多个索引编号。

进一步的，在确定出初始权重矩阵对应的码字和索引后，可以将码字存储在内存中，相比于直接将初始权重矩阵保存在内存中，码字所占据的存储空间要小得多，或者，也可以将码字和索引均存储在内存中，相比于直接将初始权重矩阵保存在内存中，二者所占据的存储空间也要小得多，从而可以大幅降低内存中参数量占据的存储空间，通常压缩率可达到40倍左右。例如，对于528MB的权重矩阵，在对其进行上述过程的预处理后，可以得到其对应的码字和索引共14.45MB，其中，码字为1.16MB，索引为13.29MB，压缩率接近了40倍。

需要说明的是，在确定出初始权重矩阵对应的码字和索引后，也可以将其存储在外部存储器(如硬盘)中，再由外部存储器输入内存中，具体存储位置，本申请实施例不进行限制。

S302：根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练。

在本实施例中，通过步骤S301从内存中获取到对应于神经网络模型的初始权重矩阵的码字后，进一步可以根据获取到的码字确定神经网络模型的新的权重矩阵(此处将其定义为第一权重矩阵)。一种可选的实现方式是，还需要获取表征码字和神经网络模型的权重矩阵之间的对应关系的索引，进而可以利用获取到的码字、索引以及权重矩阵之间的对应关系，确定出神经网络模型的第一权重矩阵。

具体的，可以利用码字与索引值之间一一对应的关系、索引值与索引编号之间一对多的关系、以及索引编号与子矩阵之间一一对应的关系，解码出神经网络模型的第一权重矩阵，并利用训练数据对神经网络模型的第一权重矩阵进行训练，具体计算公式如下：

W＝D _mat·I _oh (2)

其中，D _mat表示码字组成的第一权重矩阵，该矩阵的维度为c×n，其中，c表示码字的长度，n表示码字的个数；I _oh表示索引构成的one-hot矩阵，该矩阵的维度为n×k，其中，基于one-hot矩阵的特点，每一行仅在对应于索引编号位置的值为1，其他位置的值为0。

举例说明：如图4所示，左侧图为由n个码字构成一个字典，分别为：第1个码字、第2个码字、…、第n个码字，中间图为由n个码字对应的索引值(即1、2、…、n)以及索引值对应的索引编号(即i ₀、i ₁、...i _k-1)构成索引。如图中黑色的粗箭头指示，字典中第1个码字对应的索引值为“1”，且该索引值对应了两个索引编号，分别是索引图中第一行第一列的索引编号和第二行第二列的索引编号，这两个索引编号又分别对应了神经网络模型的权重矩阵中的两个子矩阵，分别是右侧的权重矩阵图中第一行第一列中利用浅灰色方块表示的子矩阵和第二行第二列中利用浅灰色表示的子矩阵，进而可利用这样的对应关系，根据字典中的第1个码字解码出权重矩阵中的第一行第一列的子矩阵和第二行第二列的子矩阵。

同理，如图4中黑色的细箭头指示，第2个码字对应的索引值为“2”，且该索引值对应了一个索引编号，即索引图中第三行第一列的索引编号，该索引编号对应了神经网络模型的权重矩阵中的一个子矩阵，即右侧的权重矩阵图中第三行第一列中利用深灰色方块表示的子矩阵，进而可利用这样的对应关系，根据字典中的第2个码字解码出权重矩阵中的第三行第一列的子矩阵，依次类推，即可利用字典中的各个码字以及码字、索引、权重矩阵的子矩阵三者之间的对应关系，解码出神经网络模型的整个权重矩阵。进而可以利用训练数据对该权重矩阵进行训练。

但需要说明的是，由于码字是通过上述步骤A21-A23，将初始矩阵对应的子矩阵进行聚类、平均后生成的，所以利用该码字和索引确定出的神经网络模型的第一权重矩阵相比于初始权重矩阵来说，二者所占据的数据空间虽然是一致的，但二者包含的权重元素并不是完全相同的，进而导致二者的权重值也是不完全一致的，但二者是非常接近的，即，可以利用确定出的神经网络模型的权重矩阵代替初始权重矩阵进行模型训练。

S303：当预设停止条件未被满足时，更新码字，得到更新后的码字。

在本实施例中，通过步骤S302利用训练数据对神经网络模型的第一权重矩阵进行训练后，进一步需要判断是否满足预设的停止条件，其中，预设的停止条件指的是预先设定的停止训练时需要满足的条件。可以为训练数据的结果标签值与模型对训练数据的输出结果之差低于预设差值；也可以为训练数据的结果标签值与模型对训练数据的输出结果之差的变化率低于预设变化阈值；还可以为模型参数的更新次数达到预设更新次数(如100次)等；再或者，还可以是表征模型输出结果与目标结果值之间差异的损失函数的输出值(loss)达到预设阈值(如0.1)等，在预设停止条件未被满足时，则需要根据当前训练的结果，对码字进行更新，得到更新后的码字，用以通过后续步骤S304，对模型进行重新训练。

在本实施例的一种可能的实现方式中，本步骤S303的具体实现过程可以包括下述步骤B1-B2：

步骤B1：在预设停止条件未被满足时，确定神经网络模型的第一权重矩阵的权重梯度。

在本实现方式中，当通过步骤S302利用训练数据对神经网络模型的第一权重矩阵进行训练后，判断出不满足预设的停止条件，如loss值并未达到预设阈值时，可以利用loss值经过反向计算，确定出神经网络模型的第一权重矩阵的权重梯度(此处将其定义为)，用以执行后续步骤B2。

步骤B2：根据第一权重梯度和索引，确定码字梯度，并根据码字梯度，确定更新后的码字。

在本实现方式中，当通过步骤B1确定出神经网络模型的第一权重矩阵的权重梯度后，进一步可以根据码字、索引以及权重矩阵之间的对应关系，确定出码字梯度。具体的，可以利用码字与索引值之间一一对应的关系、索引值与索引编号之间一对多的关系、以及索引编号与子矩阵之间一一对应的关系，将属于同一码字的索引编号对应的子矩阵中的权重梯度进行处理，以得到该码字对应的码字梯度，具体计算公式如下：

其中，g _D表示码字梯度；

表示索引构成的one-hot矩阵I _oh的转置；g _w表示神经网络模型的第一权重矩阵的权重梯度。

具体来讲，一种可选的实现方式是，本步骤B2的具体实现过程可以包括下述步骤B21-B23：

步骤B21：将权重梯度中属于第j个码字的索引编号对应的子矩阵的权重梯度进行加权求和，得到第j个码字对应的码字梯度；其中，j分别取1到n的整数。

在本实现方式中，为了得到更新后的码字，需要对属于同一码字的索引编号对应的子矩阵中的权重梯度进行处理，并根据处理结果确定该码字对应的更新后的值。具体的，以第j个码字为例(j可以取为1到n中的任意一个整数)，该码字对应的索引编号可能有多个，而其中每个索引编号又分别对应了一个子矩阵，进而可以将每个索引编号对应的子矩阵的权重梯度进行加权求和计算，并将计算结果作为第j个码字对应的码字梯度。

需要说明的是，在确定第j个码字对应的码字梯度时，还可以利用其他数据处理方式，对属于第j个码字的每个索引编号对应的子矩阵的权重梯度进行处理，比如可以直接进行累加求和等，具体处理方式可根据实际情况进行选取，本申请实施例对此不进行限制。

步骤B22：对第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量。

在本实现方式中，通过步骤B21得到第j个码字对应的码字梯度后，进一步可以对该麦子梯度进行优化处理，以得到第j个码字的更新量。比如，可以利用应用较为广泛的Adam优化器，对第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量，同时在优化过程中会生成四个中间参数，分别为：一阶动量m _t、二阶动量v _t、一阶动量修正值

二阶动量修正值

需要说明的是，优化过程中生成这四个中间参数(即m _t、v _t、

)的每一参数的数据量与第j个码字的码字梯度的数量是一致的。

步骤B23：利用第j个码字的更新量对第j个码字进行更新，得到更新后的第j个码字。

在本实现方式中，通过步骤B22得到第j个码字的更新量后，进一步可以利用该更新量对第j个码字进行更新，比如可以利用第j个码字减掉该更新量后的结果，或者，利用第 j个码字与该更新量相加后的结果，作为更新后的第j个码字，用以执行后续步骤S305。

举例说明：如图5所示，右侧图为权重矩阵的权重梯度，中间图为由n个码字对应的索引值(即1、2、…、n)以及索引值对应的索引编号(即i ₀、i ₁、...i _k-1)构成索引。如图中黑色的粗箭头指示，字典中第1个码字对应的索引值为“1”，且该索引值对应了两个索引编号，分别是索引图中第一行第一列的索引编号和第二行第二列的索引编号，这两个索引编号又分别对应了权重矩阵的权重梯度中的两个子矩阵的权重梯度，分别是右侧的权重梯度图中第一行第一列中的权重梯度和第二行第二列中的权重梯度，进而可以将这两个权重梯度进行加权求和，得到第1个码字对应的码字梯度。

同理，如图5中黑色的细箭头指示，第2个码字对应的索引值为“2”，且该索引值页对应了两个索引编号，分别是索引图中第三行第一列的索引编号和第四行第三列的索引编号，这两个索引编号又分别对应了权重矩阵的权重梯度中的两个子矩阵的权重梯度，分别是右侧的权重梯度图中第三行第一列中的权重梯度和第四行第三列中的权重梯度，进而可以将这两个权重梯度进行加权求和，得到第2个码字对应的码字梯度，依次类推，即可确定出每个码字各自对应的码字梯度。进而可以利用Adam优化器对各个码字梯度进行优化处理，得到各个码字的更新量，再利用各个码字的更新量分别对各个码字进行更新，得到更新后的各个码字。

S304：将更新后的码字存储在内存中。

在本实施例中，通过步骤S303得到更新后的各个码字后，进一步可以将更新后的码字存储在内存中，用以执行后续步骤S305。

S305：利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练。

在本实施例中，通过步骤S304将更新后的码字存储在内存中后，进一步可以利用在内存中获取的更新后的码字，通过执行上述步骤S302，重新确定出确定神经网络模型的新的权重矩阵(此处将其定义为第二权重矩阵，以替代步骤S302中介绍的第一权重矩阵)，并利用训练数据对神经网络模型的第二权重矩阵进行下一轮模型训练。具体实现过程可参见上述步骤S302的介绍，在此不再赘述。

需要说明的是，当通过步骤S302利用训练数据对神经网络模型的第二权重矩阵进行训练后，判断出预设的停止条件仍未被满足时，为了节省内存空间，可以在内存中释放当前神经网络模型的权重矩阵，再通过上述步骤S303-S305重新确定新的神经网络模型的权重矩阵，用以进行下一轮模型训练。

S306：在预设停止条件被满足时，停止神经网络模型的训练。

在本实施例中，通过步骤S305利用训练数据对神经网络模型的第二权重取值(或者是后续新的权重矩阵)进行下一轮模型训练后，进一步还需要判断是否满足预设的停止条件，比如，需要判断是loss值是否达到预设阈值等，当预设停止条件仍未被满足时，则需要根据一轮模型训练的结果，对码字进行再次更新，得到再次更新后的码字，用以通过上述步骤S305，对模型进行再次的重新训练。依次类推，重复执行当不满足预设停止条件时，更新码字以及后续步骤(即步骤S303和S305)，直至在预设停止条件被满足时，停止神经网络模型的训练。

综上，本实施例提供的一种神经网络模型训练方法，在对神经网络模型进行训练时，首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对该第一权重矩阵进行训练，在预设停止条件未被满足时，对码字进行更新，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在满足预设停止条件被满足时，停止神经网络模型的训练。可见，本申请实施例在对神经网络模型进行训练时，不再直接从内存中读入权重矩阵，而是读入权重矩阵对应的码字和索引，用以构成权重矩阵进行训练，由于码字占据的内存空间要远远小于权重矩阵占据的内存空间，所以能够大幅降低从内存中读入的数据量，克服了内存瓶颈问题。并且，由于本申请在模型训练过程中，不再计算权重矩阵的更新量，而是计算码字的更新量，用以重新确定新的权重矩阵进行后续训练，从而能够减少更新过程中的中间参数计算量，进而使得在资源受限的场景下能够顺利进行神经网络模型的训练。

举例说明：在采用现有方法对分类网络VGG16进行训练时，读入的权重矩阵的数据量为528MB，产生的权重梯度为528MB，在对其进行优化时产生的四个中间参数(即m _t、v _t、

)中每一参数的数据量也均为528MB，因此，总计需要内存空间为3.17GB。而采用本申请提供的模型训练方法对VGG16进行训练时，读入的是权重矩阵对应的码字和索引，二者共14.45MB，其中，码字为1.16MB，索引为13.29MB，产生的码字梯度为1.16MB，在对其进行优化时产生的四个中间参数(即m _t、v _t、

)中每一参数的数据量也均为1.16MB，因此，总计需要内存空间为20.25MB，相比于3.17GB，计算的数据量大幅下降。

在采用现有方法对翻译网络模型transformer进行训练时，读入的权重矩阵的数据量为471MB，产生的权重梯度为471MB，在对其进行优化时产生的四个中间参数(即m _t、v _t、

)中每一参数的数据量也均为471MB，因此，总计需要内存空间为2.76GB。而采用本申请提供的模型训练方法对transformer进行训练时，读入的是权重矩阵对应的码字和索引，二者共11.46MB，其中，码字为0.12MB，索引为11.34MB，产生的码字梯度为0.12MB，在对其进行优化时产生的四个中间参数(即m _t、v _t、

)中每一参数的数据量也均为0.12MB，因此，总计需要内存空间为12.06MB，相比于2.76GB，计算的数据量也大幅下降。

另外，本申请实施例还提供一种图像分类方法，基于上述实施例提供的神经网络模型训练方法，可以将根据神经网络模型训练方法获得的神经网络模型应用到图像分类中，参见图6，该图为本申请实施例提供的一种图像分类方法的流程图，该方法可以包括：

S601：获取待分类图像。

S602：将待分类图像输入训练好的神经网络模型，得到神经网络模型输出的图像分类结果。

在本实施例中，首先获取待分类的图像，并将该待分类的图像输入预先训练好的神经网络模型中，以获得该待分类的图像对应的图像分类结果。在具体实现时，神经网络模型不仅可以输出待分类图像对应的分类结果，还可以输出每种分类结果对应的概率值，从而便于用户直接了解待分类图像的分类情况。

举例说明：以待分类图像为医学影像图像为例，所使用的神经网络模型为可以对医学影像图像进行分类的模型，通过将医学影像图像(或其对应的特征图)输入神经网络模型可以获得该医学影像图像的具体分类结果。例如，可以识别出所输入的医学影像图像是携带有某种特征或具有某种分类结果的医学影像图像，还是未携带有某种特征或不具有某种分类结果的医学影像图像。

其中，神经网络模型的训练过程包括：

从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；

在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

将所述更新后的码字存储在所述内存中；

利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述第二权重矩阵进行训练；

在所述预设停止条件被满足时，停止所述神经网络模型的训练。

需要说明的是，本实施例中的训练数据可以包括正样本图像和负样本图像。其中，正样本图像是指携带有某种特征或具有某种分类结果的待训练图像，而且正样本图像的结果标签值可以为1。负样本图像是指未携带有某种特征或不具有某种分类结果的待训练图像；而且负样本图像的结果标签值可以为0。当前待训练神经网络模型对训练数据的输出结果可以为将训练数据输入当前待训练神经网络模型，当前待训练神经网络模型输出的训练数据为正样本图像的概率值。

在本实施例的一种实现方式中，第一权重矩阵为初始权重矩阵时，所述方法还包括：

将所述初始权重矩阵进行划分，以确定所述初始权重矩阵对应的码字。

在本实施例的一种实现方式中，所述将所述初始权重矩阵进行划分，以确定所述初始权重矩阵对应的码字，包括：

将所述初始权重矩阵划分为k个相同维度的子矩阵；所述k为大于1的正整数；

将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，所述n为大于0的正整数，n≤k；

将所述n个码字确定为所述初始权重矩阵对应的码字。

在本实施例的一种实现方式中，所述将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，包括：

将所述k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量；

将所述k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

将所述k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到所述第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。

在本实施例的一种实现方式中，所述方法还包括：

当所述预设停止条件未被满足时，在所述内存中释放所述神经网络模型的权重矩阵。

在本实施例的一种实现方式中，所述在预设停止条件未被满足时，更新所述码字，得到更新后的码字，包括：

在预设停止条件未被满足时，确定所述神经网络模型的第一权重矩阵的权重梯度；

根据所述第一权重梯度，确定码字梯度，并根据所述码字梯度，确定更新后的码字。

在本实施例的一种实现方式中，所述根据所述权重梯度，确定码字梯度，并根据所述码字梯度，确定更新后的码字，包括：

将所述权重梯度中属于第j个码字对应的子矩阵的权重梯度进行加权求和，得到所述第j个码字对应的码字梯度；其中，j分别取1到n的整数；

对所述第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量；

利用所述第j个码字的更新量对所述第j个码字进行更新，得到更新后的第j个码字。

在本实施例的一种实现方式中，所述方法还包括：

获取索引，所述索引为所述码字和所述神经网络模型的权重矩阵之间的对应关系。

在本实施例的一种实现方式中，所述预设停止条件包括以下一项或多项条件：

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差低于预设差值；

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差的变化率低于预设变化阈值；

所述神经网络模型中的模型参数的更新次数达到预设更新次数；

所述神经网络模型所采用的损失函数的输出值达到预设阈值；所述损失函数用于衡量所述神经网络模型对所述训练数据的输出结果与所述训练数据对应的结果标签值之间的差距。

还需要说明的是，本实施例中关于神经网络模型的具体训练过程的说明可以参见图3所述方法的流程，本实施例在此不再赘述。

本申请实施例利用预先训练好的神经网络模型对待分类图像进行分类，由于该神经网络模型能够达到全局最优，使得该神经网络模型输出的分类结果更准确，进而提高分类结果准确性。

另外，本申请实施例还提供一种文本翻译方法，基于上述实施例提供的神经网络模型训练方法，可以将根据神经网络模型训练方法获得的神经网络模型应用到文本翻译中，参见图7，该图为本申请实施例提供的一种文本翻译方法的流程图，该方法可以包括：

S701：获取待翻译文本。

S702：将待翻译文本输入训练好的神经网络模型，得到神经网络模型输出的文本翻译结果。

在本实施例中，首先获取待翻译的文本，并将该待翻译的文本输入预先训练好的神经网络模型中，以获得该待翻译文本对应的文本翻译结果。比如将英文文本翻译为中文文本，并通过预先训练好的神经网络模型输出中文翻译结果，或者，将中文文本翻译为德文文本，并通过预先训练好的神经网络模型输出德文文本翻译结果等，本申请不限定翻译的语种。

举例说明：以待翻译文本为英文文本为例，所使用的神经网络模型为可以对待翻译文本进行翻译的模型，通过将待翻译文本(或其对应的特征向量)输入神经网络模型可以获得该英文文本的具体翻译结果。例如，可以翻译出所输入的英文文本的中文文本翻译结果或德文文本翻译结果等。

其中，神经网络模型的训练过程包括：

将所述更新后的码字存储在所述内存中；

将所述n个码字确定为所述初始权重矩阵对应的码字。

在本实施例的一种实现方式中，所述方法还包括：

本申请实施例利用预先训练好的神经网络模型对待翻译文本进行翻译，由于该神经网络模型能够达到全局最优，使得该神经网络模型输出的翻译结果更准确，进而提高翻译结果准确性。

为便于更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关装置。请参见图8所示，本申请实施例提供了一种神经网络模型训练装置800。该装置800可以包括：第一获取单元801、第一训练单元802、更新单元803、存储单元804、第二训练单元805和停止单元806。其中，第一获取单元801用于支持装置800执行图3所示实施例中的S301。第一训练单元802用于支持装置800执行图3所示实施例中的S302。更新单元803用于支持装置800执行图3所示实施例中的S303。存储单元804用于支持装置800执行图3所示实施例中的S304。第二训练单元805用于支持装置800执行图3所示实施例中的S305。停止单元806用于支持装置800执行图3所示实施例中的S306。具体的，

第一获取单元801，用于从内存中获取码字，其中，码字对应于神经网络模型的第一权重矩阵；

第一训练单元802，用于根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对第一权重矩阵进行训练；

更新单元803，用于在预设停止条件未被满足时，更新码字，得到更新后的码字；

存储单元804，用于将更新后的码字存储在内存中；

第二训练单元805，用于利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练；

停止单元806，用于在预设停止条件被满足时，停止神经网络模型的训练。

在本实施例的一种实现方式中，第一权重矩阵为初始权重矩阵时，该装置还包括：

在本实施例的一种实现方式中，划分单元包括：

第一划分子单元，用于将初始权重矩阵划分为k个相同维度的子矩阵；其中，k为大于1的正整数；

聚类子单元，用于将k个相同维度的子矩阵进行聚类处理，得到k个相同维度的子矩阵对应的n个码字，其中，n为大于0的正整数，n≤k；

第一确定子单元，用于将n个码字确定为初始权重矩阵对应的码字。

在本实施例的一种实现方式中，聚类子单元包括：

第二划分子单元，用于将所述k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

计算子单元，用于将所述k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到所述第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。

在本实施例的一种实现方式中，该装置还包括：

释放单元，用于当预设停止条件未被满足时，在内存中释放神经网络模型的权重矩阵。

在本实施例的一种实现方式中，更新单元803包括：

第三确定子单元，用于根据第一权重梯度，确定码字梯度，并根据码字梯度，确定更新后的码字。

在本实施例的一种实现方式中，第三确定子单元包括：

在本实施例的一种实现方式中，该装置还包括：

在本实施例的一种实现方式中，预设停止条件包括以下一项或多项条件：

神经网络模型中的模型参数的更新次数达到预设更新次数；

神经网络模型所采用的损失函数的输出值达到预设阈值；其中，损失函数用于衡量神经网络模型对所述训练数据的输出结果与所述训练数据对应的结果标签值之间的差距。

综上，本实施例提供的一种神经网络模型训练装置，对神经网络模型进行训练时，首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对该第一权重矩阵进行训练，在预设停止条件未被满足时，对码字进行更新，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。可见，本申请实施例在对神经网络模型进行训练时，不再直接从内存中读入权重矩阵，而是读入权重矩阵对应的码字，用以构成权重矩阵进行训练，由于码字占据的内存空间要远远小于权重矩阵占据的内存空间，所以能够大幅降低从内存中读入的数据量，克服了内存瓶颈问题。并且，由于本申请在模型训练过程中，不再计算权重矩阵的更新量，而是计算码字的更新量，用以重新确定新的权重矩阵进行后续训练，从而能够减少更新过程中的中间参数计算量，进而使得在资源受限的场景下能够顺利进行神经网络模型的训练。

请参见图9所示，本申请实施例还提供了一种图像分类装置900。该装置900可以包括：图像获取单元901、图像分类单元902和神经网络模型训练单元903。其中，图像获取单元901用于支持装置900执行图6所示实施例中的S601。图像分类单元902 用于支持装置900执行图6所示实施例中的S602。神经网络模型训练单元903用于支持装置900执行图3所示实施例中的S301-S306。具体的，

图像获取单元901，用于获取待分类图像；

图像分类单元902，用于将待分类图像输入训练好的神经网络模型，得到神经网络模型输出的图像分类结果；

神经网络模型训练单元903，用于训练神经网络模型；

其中，神经网络模型训练单元903包括：

第一获取单元，用于从内存中获取码字，其在，码字对应于神经网络模型的第一权重矩阵；

存储单元，用于将更新后的码字存储在内存中；

在本实施例的一种实现方式中，划分单元包括：

在本实施例的一种实现方式中，聚类子单元包括：

在本实施例的一种实现方式中，该装置还包括：

在本实施例的一种实现方式中，更新单元包括：

在本实施例的一种实现方式中，第三确定子单元包括：

在本实施例的一种实现方式中，该装置还包括：

神经网络模型中的模型参数的更新次数达到预设更新次数；

请参见图10所示，本申请实施例还提供了一种文本翻译装置1000。该装置1000可以包括：文本获取单元1001、文本翻译单元1002和神经网络模型训练单元1003。其中，文本获取单元1001用于支持装置1000执行图7所示实施例中的S701。文本翻译单元1002用于支持装置1000执行图7所示实施例中的S702。神经网络模型训练单元1003用于支持装置1000执行图3所示实施例中的S301-S306。具体的，

文本获取单元1001，用于获取待翻译文本；

文本翻译单元1002，用于将待翻译文本输入训练好的神经网络模型，得到神经网络模型输出的文本翻译结果；

神经网络模型训练单元1003，用于训练神经网络模型；

其中，神经网络模型训练单元1003包括：

更新单元，用于当神经网络模型输出样本文本的翻译结果后，在预设停止条件未被满足时，更新码字，得到更新后的码字；

存储单元，用于将更新后的码字存储在内存中；

第二训练单元，用于利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对神经网络模型的第二权重矩阵进行训练；

在本实施例的一种实现方式中，划分单元包括：

在本实施例的一种实现方式中，聚类子单元包括：

在本实施例的一种实现方式中，该装置还包括：

在本实施例的一种实现方式中，更新单元包括：

在本实施例的一种实现方式中，第三确定子单元包括：

在本实施例的一种实现方式中，该装置还包括：

神经网络模型中的模型参数的更新次数达到预设更新次数；

参见图11，本申请实施例提供了一种神经网络模型训练设备1100，该设备包括存储器1101、处理器1102和通信接口1103，

存储器1101，用于存储指令；

处理器1102，用于执行存储器1101中的指令，执行上述应用于图3所示实施例中的神经网络模型训练方法；

通信接口1103，用于进行通信。

存储器1101、处理器1102和通信接口1103通过总线1104相互连接；总线1104可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extended industry standard architecture，简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在具体实施例中，处理器1102用于在对神经网络模型进行训练时，首先从内存中获取对应于神经网络模型的第一权重矩阵的码字，然后根据码字确定神经网络模型的权重矩阵为第一权重矩阵，并利用训练数据对该第一权重矩阵进行训练，在预设停止条件未被满足时，对码字进行更新，得到更新后的码字，并将更新后的码字存储在内存中，接着，利用在内存中获取的更新后的码字确定神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对第二权重矩阵进行训练，进而在预设停止条件被满足时，停止神经网络模型的训练。该处理器1102的详细处理过程请参考上述图3所示实施例中S301、S302、S303、S304、S305和S306的详细描述，这里不再赘述。

上述存储器1101可以是随机存取存储器(random-access memory，RAM)、闪存(flash)、只读存储器(read only memory，ROM)、可擦写可编程只读存储器(erasable programmable read only memory，EPROM)、电可擦除可编程只读存储器(electrically erasable programmable read only memory，EEPROM)、寄存器(register)、硬盘、移动硬盘、CD-ROM或者本领域技术人员知晓的任何其他形式的存储介质。

上述处理器1102例如可以是中央处理器(central processing unit，CPU)、通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application-specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

上述通信接口1103例如可以是接口卡等，可以为以太(ethernet)接口或异步传输模式(asynchronous transfer mode，ATM)接口。

参见图12，本申请实施例提供了一种图像分类设备1200，该设备包括存储器1201、处理器1202和通信接口1203，

存储器1201，用于存储指令；

处理器1202，用于执行存储器1201中的指令，执行上述应用于图6所示实施例中的图像分类方法；

通信接口1203，用于进行通信。

存储器1201、处理器1202和通信接口1203通过总线1204相互连接；总线1204可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extended industry standard architecture，简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图12中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在具体实施例中，处理器1202用于在对图像进行分类时，首先获取待分类的图像，并将该待分类的图像输入预先训练好的神经网络模型中，以获得该待分类的图像对应的图像分类结果。该处理器1202的详细处理过程请参考上述图6所示实施例中S601、S602和S603的详细描述，这里不再赘述。

上述存储器1201可以是随机存取存储器(random-access memory，RAM)、闪存(flash)、只读存储器(read only memory，ROM)、可擦写可编程只读存储器(erasable programmable read only memory，EPROM)、电可擦除可编程只读存储器(electrically erasable programmable read only memory，EEPROM)、寄存器(register)、硬盘、移动硬盘、CD-ROM或者本领域技术人员知晓的任何其他形式的存储介质。

上述处理器1202例如可以是中央处理器(central processing unit，CPU)、通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application-specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

上述通信接口1203例如可以是接口卡等，可以为以太(ethernet)接口或异步传输模式(asynchronous transfer mode，ATM)接口。

参见图13，本申请实施例提供了一种文本翻译设备1300，该设备包括存储器1301、处理器1302和通信接口1303，

存储器1301，用于存储指令；

处理器1302，用于执行存储器1301中的指令，执行上述应用于图7所示实施例中的图像分类方法；

通信接口1303，用于进行通信。

存储器1301、处理器1302和通信接口1303通过总线1304相互连接；总线1304可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extended industry standard architecture，简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图13中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在具体实施例中，处理器1302用于在对文本进行翻译时，首先获取待翻译的文本，并将该待翻译的文本输入预先训练好的神经网络模型中，以获得该待翻译文本对应的文本翻译结果。该处理器1302的详细处理过程请参考上述图7所示实施例中S701、S702和S703的详细描述，这里不再赘述。

上述存储器1301可以是随机存取存储器(random-access memory，RAM)、闪存(flash)、只读存储器(read only memory，ROM)、可擦写可编程只读存储器(erasable programmable read only memory，EPROM)、电可擦除可编程只读存储器(electrically erasable programmable read only memory，EEPROM)、寄存器(register)、硬盘、移动硬盘、CD-ROM或者本领域技术人员知晓的任何其他形式的存储介质。

上述处理器1302例如可以是中央处理器(central processing unit，CPU)、通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application-specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

上述通信接口1303例如可以是接口卡等，可以为以太(ethernet)接口或异步传输模式(asynchronous transfer mode，ATM)接口。

本申请实施例还提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述实施例所述的神经网络模型训练方法的任一实施方式，或者执行如上述实施例所述的图像分类方法，或者执行上述实施例所述的文本翻译方法。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种神经网络模型训练方法，其特征在于，所述方法包括：

从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；

在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

将所述更新后的码字存储在所述内存中；

利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述第二权重矩阵进行训练；

在所述预设停止条件被满足时，停止所述神经网络模型的训练。
根据权利要求1所述的方法，其特征在于，所述第一权重矩阵为初始权重矩阵时，所述方法还包括：

将所述初始权重矩阵进行划分，以确定所述初始权重矩阵对应的码字。
根据权利要求2所述的方法，其特征在于，所述将所述初始权重矩阵进行划分，以确定所述初始权重矩阵对应的码字，包括：

将所述初始权重矩阵划分为k个相同维度的子矩阵；所述k为大于1的正整数；

将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，所述n为大于0的正整数，n≤k；

将所述n个码字确定为所述初始权重矩阵对应的码字。
根据权利要求3所述的方法，其特征在于，所述将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，包括：

将所述k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量；

将所述k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

将所述k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到所述第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述预设停止条件未被满足时，在所述内存中释放所述神经网络模型的权重矩阵。
根据权利要求1所述的方法，其特征在于，所述在预设停止条件未被满足时，更新所述码字，得到更新后的码字，包括：

在预设停止条件未被满足时，确定所述神经网络模型的第一权重矩阵的权重梯度；

根据所述第一权重梯度，确定码字梯度，并根据所述码字梯度，确定更新后的码字。
根据权利要求6所述的方法，其特征在于，所述根据所述权重梯度，确定码字梯度，并根据所述码字梯度，确定更新后的码字，包括：

将所述权重梯度中属于第j个码字对应的子矩阵的权重梯度进行加权求和，得到所述第j个码字对应的码字梯度；其中，j分别取1到n的整数；

对所述第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量；

利用所述第j个码字的更新量对所述第j个码字进行更新，得到更新后的第j个码字。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取索引，所述索引为所述码字和所述神经网络模型的权重矩阵之间的对应关系。
根据权利要求1至8任一所述的方法，其特征在于，所述预设停止条件包括以下一项或多项条件：

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差低于预设差值；

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差的变化率低于预设变化阈值；

所述神经网络模型中的模型参数的更新次数达到预设更新次数；

所述神经网络模型所采用的损失函数的输出值达到预设阈值；所述损失函数用于衡量所述神经网络模型对所述训练数据的输出结果与所述训练数据对应的结果标签值之间的差距。
一种图像分类方法，其特征在于，所述方法包括：

获取待分类图像；

将所述待分类图像输入训练好的神经网络模型，得到所述神经网络模型输出的图像分类结果；

所述神经网络模型的训练过程包括：

从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；所述训练数据包括正样本图像和负样本图像；

当所述神经网络模型输出所述训练数据为正样本图像的概率值后，在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

将所述更新后的码字存储在所述内存中；

利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述第二权重矩阵进行训练；

在所述预设停止条件被满足时，停止所述神经网络模型的训练。
一种文本翻译方法，其特征在于，所述方法包括：

获取待翻译文本；

将所述待翻译文本输入训练好的神经网络模型，得到所述神经网络模型输出的文本翻译结果；

所述神经网络模型的训练过程包括：

从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；所述训练数据为样本文本；

当所述神经网络模型输出所述样本文本的翻译结果后，在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

将所述更新后的码字存储在所述内存中；

利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述神经网络模型的第二权重矩阵进行训练；

在所述预设停止条件被满足时，停止所述神经网络模型的训练。
一种神经网络模型训练装置，其特征在于，所述装置包括：

第一获取单元，用于从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

第一训练单元，用于根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；

更新单元，用于在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

存储单元，用于将所述更新后的码字存储在所述内存中；

第二训练单元，用于利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述第二权重矩阵进行训练；

停止单元，用于在所述预设停止条件被满足时，停止所述神经网络模型的训练。
根据权利要求11所述的装置，其特征在于，所述第一权重矩阵为初始权重矩阵时，所述装置还包括：

划分单元，用于将所述初始权重矩阵进行划分，以确定所述初始权重矩阵对应的码字。
根据权利要求13所述的装置，其特征在于，所述划分单元包括：

第一划分子单元，用于将所述初始权重矩阵划分为k个相同维度的子矩阵；所述k为大于1的正整数；

聚类子单元，用于将所述k个相同维度的子矩阵进行聚类处理，得到所述k个相同维度的子矩阵对应的n个码字，所述n为大于0的正整数，n≤k；

第一确定子单元，用于将所述n个码字确定为所述初始权重矩阵对应的码字。
根据权利要求14所述的装置，其特征在于，所述聚类子单元包括：

降维子单元，用于将所述k个相同维度的子矩阵分别降维成一维向量，得到k个一维向量；

第二划分子单元，用于将所述k个一维向量划分为n个向量组，其中，每个向量组中包含至少一个一维向量；

计算子单元，用于将所述k个一维向量中属于第i个向量组的所有一维向量中对应位置的元素值进行求平均计算，得到所述第i个向量组中所有一维向量对应的一个码字；其中，i分别取1到n的整数。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

释放单元，用于当所述预设停止条件未被满足时，在所述内存中释放所述神经网络模型的权重矩阵。
根据权利要求12所述的装置，其特征在于，所述更新单元包括：

第二确定子单元，用于在预设停止条件未被满足时，确定所述神经网络模型的第一权重矩阵的权重梯度；

第三确定子单元，用于根据所述第一权重梯度，确定码字梯度，并根据所述码字梯度，确定更新后的码字。
根据权利要求17所述的装置，其特征在于，所述第三确定子单元包括：

第一获得子单元，用于将所述权重梯度中属于第j个码字对应的子矩阵的权重梯度进行加权求和，得到所述第j个码字对应的码字梯度；其中，j分别取1到n的整数；

第二获得子单元，用于对所述第j个码字对应的码字梯度进行优化处理，得到第j个码字的更新量；

第三获得子单元，用于利用所述第j个码字的更新量对所述第j个码字进行更新，得到更新后的第j个码字。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

第二获取单元，用于获取索引，所述索引为所述码字和所述神经网络模型的权重矩阵之间的对应关系。
根据权利要求12至19任一所述的装置，其特征在于，所述预设停止条件包括以下一项或多项条件：

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差低于预设差值；

所述训练数据对应的结果标签值与所述神经网络模型对所述训练数据的输出结果之差的变化率低于预设变化阈值；

所述神经网络模型中的模型参数的更新次数达到预设更新次数；

所述神经网络模型所采用的损失函数的输出值达到预设阈值；所述损失函数用于衡量所述神经网络模型对所述训练数据的输出结果与所述训练数据对应的结果标签值之间的差距。
一种图像分类装置，其特征在于，所述装置包括：

图像获取单元，用于获取待分类图像；

图像分类单元，用于将所述待分类图像输入训练好的神经网络模型，得到所述神经网络模型输出的图像分类结果；

神经网络模型训练单元，用于训练所述神经网络模型；

所述神经网络模型训练单元包括：

第一获取单元，用于从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

第一训练单元，用于根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；所述训练数据包括正样本图像和负样本图像；

更新单元，用于当所述神经网络模型输出所述训练数据为正样本图像的概率值后，在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

存储单元，用于将所述更新后的码字存储在所述内存中；

第二训练单元，用于利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述第二权重矩阵进行训练；

停止单元，用于在所述预设停止条件被满足时，停止所述神经网络模型的训练。
一种文本翻译装置，其特征在于，所述装置包括：

文本获取单元，用于获取待翻译文本；

文本翻译单元，用于将所述待翻译文本输入训练好的神经网络模型，得到所述神经网络模型输出的文本翻译结果；

神经网络模型训练单元，用于训练所述神经网络模型；

所述神经网络模型训练单元包括：

第一获取单元，用于从内存中获取码字，所述码字对应于神经网络模型的第一权重矩阵；

第一训练单元，用于根据所述码字确定所述神经网络模型的权重矩阵为所述第一权重矩阵，并利用训练数据对所述第一权重矩阵进行训练；所述训练数据为样本文本；

更新单元，用于当所述神经网络模型输出所述样本文本的翻译结果后，在预设停止条件未被满足时，更新所述码字，得到更新后的码字；

存储单元，用于将所述更新后的码字存储在所述内存中；

第二训练单元，用于利用在所述内存中获取的所述更新后的码字确定所述神经网络模型的权重矩阵为第二权重矩阵，并利用训练数据对所述神经网络模型的第二权重矩阵进行训练；

停止单元，用于在所述预设停止条件被满足时，停止所述神经网络模型的训练。
一种神经网络模型训练设备，其特征在于，所述设备包括存储器、处理器；

所述存储器，用于存储指令；

所述处理器，用于执行所述存储器中的所述指令，执行权利要求1-9任意一项所述的神经网络模型训练方法。
一种图像分类设备，其特征在于，所述设备包括存储器、处理器；

所述存储器，用于存储指令；

所述处理器，用于执行所述存储器中的所述指令，执行权利要求10所述的图像分类方法。
一种文本翻译设备，其特征在于，所述设备包括存储器、处理器；

所述存储器，用于存储指令；

所述处理器，用于执行所述存储器中的所述指令，执行权利要求11所述的文本翻译方法。
一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得所述计算机执行以上权利要求1-9任意一项所述的神经网络模型训练方法，或者实现如权利要求10所述的图像分类方法，或者实现如权利要求11所述的文本翻译方法。