WO2022052656A1

WO2022052656A1 - 一种物体识别模型的训练方法、系统及装置

Info

Publication number: WO2022052656A1
Application number: PCT/CN2021/109199
Authority: WO
Inventors: 赵旭东
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2020-09-11
Filing date: 2021-07-29
Publication date: 2022-03-17
Also published as: CN112115997A; CN112115997B; US20230267710A1

Abstract

一种物体识别模型的训练方法、系统及装置，预先将参数矩阵保存在内存中；在模型训练过程中，将样本图片输入至深度学习模型中，得到样本特征向量；从参数矩阵中抽取出样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；将样本特征向量与新参数矩阵相乘，再计算损失函数，然后进行梯度的反向传播，更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵。可见，本申请计算使用的参数矩阵的数据量较小，减少了计算量，加快了模型训练过程，且原参数矩阵保存在存储空间较大的内存中，有效解决了参数矩阵数据量过大无法存放的问题。

Description

一种物体识别模型的训练方法、系统及装置

本申请要求于2020年09月11日提交至中国专利局、申请号为202010956031.X、发明名称为“一种物体识别模型的训练方法、系统及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及模型训练领域，特别是涉及一种物体识别模型的训练方法、系统及装置。

背景技术

随着深度学习模型在计算机视觉领域的高速发展，人脸识别技术得到了显著的进展，模型精度基本可以达到人类识别的水平，已经被广泛应用于门禁考勤等应用场景。

在现有的人脸识别模型训练过程中，普遍采用的训练方法为：将人脸图片输入到一个深度学习模型中，深度学习模型会输出一个用于表示输入图片的特征信息的特征向量，然后将这个特征向量与一个与身份总数成线性关系的参数矩阵(用于表示多个身份各自的特征信息)相乘，再进行损失函数的计算，最后进行梯度的反向传播，更新参数矩阵和深度学习模型中的所有参数。

但是，参数矩阵的大小随着身份总数的增加而线性的增大，若每个身份采用128维的向量表示，当身份总数达到十亿时，参数矩阵需要占用接近0.5TB的内存空间(10 ⁹*128*4B＝0.5TB)，用于模型训练计算的GPU(Graphics Processing Unit，图形处理器)已经无法存放下所有的参数矩阵数据。

目前，在亿级人脸识别模型训练时，通常采用模型并行的方法，也就是将整个参数矩阵拆分到多个GPU上，在每个GPU上完成计算后，将计算结果进行规约。但是，即使采用模型并行的方法，也无法有效解决参数矩阵数据量过大导致GPU无法存放的问题；而且，GPU上的计算量很大，导致模型训练过程较慢。

因此，如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。

发明内容

本发明的目的是提供一种物体识别模型的训练方法、系统及装置，在模型训练过程中计算使用的参数矩阵是一个从原参数矩阵中抽取的部分参数矩阵，抽取的部分参数矩阵的数据量较小，从而减少了计算量，加快了模型训练过程；而且，原参数矩阵保存在存储空间较大的内存中，从而有效解决了参数矩阵数据量过大无法存放的问题。

为解决上述技术问题，本发明提供了一种物体识别模型的训练方法，包括：

预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中；

在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；

从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

将所述样本特征向量与所述新参数矩阵相乘，得到所述样本特征向量与所述新参数矩阵中的各特征向量的相似度；

根据所述相似度计算损失函数，并基于所述损失函数进行梯度的反向传播，更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。

优选地，预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中的过程，包括：

随机初始化一个大小为emb_size×cls_size、用于表示多张样本图片的特征信息的参数矩阵，并将所述参数矩阵保存在内存中；其中，emb_size 为用于表示一张样本图片的特征信息的特征向量的大小，cls_size为样本图片的总数量。

优选地，所述物体识别模型的训练方法还包括：

预先将多张样本图片保存在数据集中，并为多张样本图片一一配置样本ID；

相应的，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵的过程，包括：

从所有样本ID中随机获取一批次目标样本ID，并基于所述目标样本ID从所述数据集中获取对应的目标样本图片；

将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述目标样本图片的特征信息的样本特征向量；

从剩余样本ID中随机获取一定数量的随机样本ID，并从所述参数矩阵中抽取出所述目标样本ID和所述随机样本ID对应的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。

优选地，所述深度学习模型的本轮训练过程具体包括：

预先为不同GPU分配不同样本图片；

将目标GPU对应的样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的目标样本特征向量；其中，所述目标GPU为任一所述GPU；

从所述参数矩阵中抽取出为所有GPU分配的所有样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

利用所述目标GPU将所述目标样本特征向量与所述新参数矩阵相乘，得到所述目标样本特征向量与所述新参数矩阵中的各特征向量的目标相似度，并根据所述目标相似度计算目标损失函数，且基于所述目标损失函数进行梯度的反向传播，得到所述新参数矩阵和所述深度学习模型的待更新参数值的梯度；

求取各GPU对应的待更新参数值梯度的平均值，并根据所述待更新参数值梯度的平均值更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。

优选地，所述物体识别模型的训练方法还包括：

在完成所述深度学习模型的上一轮训练之后，判断所述深度学习模型是否满足物体识别的模型精度要求；

若是，则确定所述深度学习模型训练结束；

若否，则重新将新的样本图片输入至用于物体识别的深度学习模型中进入新一轮的训练。

优选地，所述深度学习模型具体为卷积神经网络模型。

为解决上述技术问题，本发明还提供了一种物体识别模型的训练系统，包括：

矩阵保存模块，用于预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中；

向量获取模块，用于在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；

矩阵重构模块，用于从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

相似度获取模块，用于将所述样本特征向量与所述新参数矩阵相乘，得到所述样本特征向量与所述新参数矩阵中的各特征向量的相似度；

参数更新模块，用于根据所述相似度计算损失函数，并基于所述损失函数进行梯度的反向传播，更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。

优选地，所述矩阵保存模块具体用于：

随机初始化一个大小为emb_size×cls_size、用于表示多张样本图片的特征信息的参数矩阵，并将所述参数矩阵保存在内存中；其中，emb_size为用于表示一张样本图片的特征信息的特征向量的大小，cls_size为样本图片的总数量。

优选地，所述物体识别模型的训练系统还包括：

ID配置模块，用于预先将多张样本图片保存在数据集中，并为多张样本图片一一配置样本ID；

相应的，所述向量获取模块具体用于：

从所有样本ID中随机获取一批次目标样本ID，并基于所述目标样本ID从所述数据集中获取对应的目标样本图片；将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述目标样本图片的特征信息的样本特征向量；

所述矩阵重构模块具体用于：

为解决上述技术问题，本发明还提供了一种物体识别模型的训练装置，包括：

存储器，用于存储计算机程序；

处理器，用于在执行所述计算机程序时实现上述任一种物体识别模型的训练方法的步骤。

本发明提供了一种物体识别模型的训练方法，预先将参数矩阵保存在内存中；在模型训练过程中，将样本图片输入至深度学习模型中，得到样本特征向量；从参数矩阵中抽取出样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；将样本特征向量与新参数矩阵相乘，得到样本特征向量与新参数矩阵中的各特征向量的相似度；根据相似度计算损失函数，并基于损失函数进行梯度的反向传播，更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵，以完成深度学习模型的本轮训练。可见，本申请在模型训练过程中计算使用的参数矩阵是一个从原参数矩阵中抽取的部分参数矩阵，抽取的部分参数矩阵的数据量较小，从而减少了计算量，加快了模型训练过程；而且，原参数矩阵保存在存储空间较大的内存中，从而有效解决了参数矩阵数据量过大无法存放的问题。

本发明还提供了一种物体识别模型的训练系统及装置，与上述训练方法具有相同的有益效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种物体识别模型的训练方法的流程图；

图2为本发明实施例提供的一种人脸识别模型的训练方法的流程图；

图3为本发明实施例提供的一种物体识别模型的训练系统的结构示意图。

具体实施方式

本发明的核心是提供一种物体识别模型的训练方法、系统及装置，在模型训练过程中计算使用的参数矩阵是一个从原参数矩阵中抽取的部分参数矩阵，抽取的部分参数矩阵的数据量较小，从而减少了计算量，加快了模型训练过程；而且，原参数矩阵保存在存储空间较大的内存中，从而有效解决了参数矩阵数据量过大无法存放的问题。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参照图1，图1为本发明实施例提供的一种物体识别模型的训练方法的流程图。

该物体识别模型的训练方法包括：

步骤S1：预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中。

具体地，考虑到内存的存储空间远大于GPU设备的存储空间，所以本申请提前将由多个用于表示物体特征信息的特征向量构成的一整个参数矩阵保存在内存中，从而有效解决了一整个参数矩阵数据量过大无法存放的问题。

可以理解的是，内存中保存的参数矩阵中的一个特征向量对应表示一张图片的特征信息，一整个参数矩阵对应着很多张图片，基本能达到亿级图片，后续训练用于物体识别的深度学习模型所需使用的样本图片需从这些图片中选择。

步骤S2：在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的样本特征向量。

具体地，在深度学习模型训练过程中，首先从内存中保存的参数矩阵对应的多张图片中获取本轮训练所需的样本图片，然后将样本图片输入至深度学习模型中，深度学习模型会输出表示样本图片的特征信息的样本特征向量，供后续计算使用。

步骤S3：从参数矩阵中抽取出样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。

具体地，考虑到现有技术参与计算的参数矩阵是内存中保存的一整个参数矩阵，计算量太大，所以本申请重构一个数据量相对较小的新参数矩阵，从而减少计算量，加快模型训练过程。

更具体地，重构新参数矩阵的过程：一方面，从内存中保存的一整个参数矩阵中抽取出样本图片对应的特征向量(称为第一特征向量)；另一方面，从剩余参数矩阵(内存中保存的一整个参数矩阵中，除去样本图片对应的特征向量剩下的特征向量组成的参数矩阵)中随机抽取出一定数量的特征向量(称为第二特征向量)，然后将抽取出的所有特征向量(第一特征向量+第二特征向量)重新构成新参数矩阵，供后续计算使用。

步骤S4：将样本特征向量与新参数矩阵相乘，得到样本特征向量与新参数矩阵中的各特征向量的相似度。

具体地，本申请在得到深度学习模型输出的样本特征向量及重构的新参数矩阵之后，将样本特征向量与新参数矩阵相乘，计算得到样本特征向量与新参数矩阵中的各特征向量的相似度。

步骤S5：根据相似度计算损失函数，并基于损失函数进行梯度的反向传播，更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵，以完成深度学习模型的本轮训练。

具体地，本申请根据样本特征向量与新参数矩阵中的各特征向量的相似度可计算损失函数，并基于损失函数进行梯度的反向传播，更新新参数矩阵，且基于更新后的新参数矩阵更新内存中的总参数矩阵，然后继续进行梯度的反向传播，更新深度学习模型的参数，深度学习模型的本轮训练结束。

需要说明的是，如图2所示，本申请的深度学习模型可具体应用于人脸识别。

在上述实施例的基础上：

作为一种可选的实施例，预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中的过程，包括：

随机初始化一个大小为emb_size×cls_size、用于表示多张样本图片的特征信息的参数矩阵，并将参数矩阵保存在内存中；其中，emb_size为用于表示一张样本图片的特征信息的特征向量的大小，cls_size为样本图片的总数量。

具体地，内存中初始保存的一整个参数矩阵的大小为：emb_size×cls_size，其中，emb_size为一个特征向量的大小，cls_size为一整个参数矩阵包含的特征向量的总个数。参数矩阵的初始值是随机生成的，一个特征向量用于表示一张样本图片的特征信息，则一整个参数矩阵对应着cls_size张图片。

基于此，本申请重构的新参数矩阵的数据量大小为m×emb_size×4B，其中，m为新参数矩阵包含的特征向量的总个数，m远小于cls_size。

作为一种可选的实施例，物体识别模型的训练方法还包括：

相应的，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的样本特征向量；从参数矩阵中抽取出样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵的过程，包括：

从所有样本ID中随机获取一批次目标样本ID，并基于目标样本ID从数据集中获取对应的目标样本图片；

将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示目标样本图片的特征信息的样本特征向量；

从剩余样本ID中随机获取一定数量的随机样本ID，并从参数矩阵中抽取出目标样本ID和随机样本ID对应的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。

进一步地，本申请可提前将内存中保存的一整个参数矩阵对应的多张样本图片保存在数据集中，并为多张样本图片一一配置样本ID(Identity Document，身份标识号)，相当于为每张样本图片配置一个标签，从而便于后续获取所需的样本图片。

基于此，获取供后续计算使用的样本特征向量的过程：本申请可从所有样本ID中随机获取一批次样本ID(称为目标样本ID)，并基于目标样本ID从数据集中获取对应的样本图片(称为目标样本图片)，即深度学习模型本轮训练所需的样本图片；然后将目标样本图片输入至深度学习模型中，得到用于表示目标样本图片的特征信息的样本特征向量。

获取供后续计算使用的新参数矩阵的过程：一方面，从所有样本ID中随机获取一批次样本ID(称为目标样本ID)；另一方面，从剩余样本ID(所有样本ID中除去目标样本ID剩下的样本ID)中随机获取一定数量的样本ID(称为随机样本ID)，然后从内存中保存的一整个参数矩阵中抽取出目标样本ID和随机样本ID对应的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。

作为一种可选的实施例，深度学习模型的本轮训练过程具体包括：

预先为不同GPU分配不同样本图片；

将目标GPU对应的样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的目标样本特征向量；其中，目标GPU为任一GPU；

从参数矩阵中抽取出为所有GPU分配的所有样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

利用目标GPU将目标样本特征向量与新参数矩阵相乘，得到目标样本特征向量与新参数矩阵中的各特征向量的目标相似度，并根据目标相似度计算目标损失函数，且基于目标损失函数进行梯度的反向传播，得到新参数矩阵和深度学习模型的待更新参数值的梯度；

求取各GPU对应的待更新参数值梯度的平均值，并根据待更新参数值梯度的平均值更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵，以完成深度学习模型的本轮训练。

具体地，本申请采用多个GPU一起参与训练深度学习模型，深度学习模型的训练过程为：预先为不同GPU分配不同样本图片(如共有两个GPU参与模型训练，为GPU 1分配样本图片1和样本图片2，为GPU 2分配样本图片3和样本图片4)；将任一GPU(称为目标GPU)对应的样本图片输入至深度学习模型中，得到用于表示样本图片的特征信息的目标样本特征向量；从内存中保存的一整个参数矩阵中抽取出为所有GPU分配的所有样本图片对应的特征向量(如所有样本图片为样本图片1、2、3、4，样本图片1、2、3、4对应特征向量1、2、3、4)，及从剩余参数矩阵中随机抽取出一定数量的特征向量(如特征向量5、6、7、8)，并将抽取出的所有特征向量(如特征向量1、2、3、4、5、6、7、8)重新构成新参数矩阵，且将新参数矩阵传送给目标GPU；利用目标GPU将目标样本特征向量与新参数矩阵相乘，得到目标样本特征向量与新参数矩阵中的各特征向量的目标相似度；根据目标相似度计算目标损失函数，并基于目标损失函数进行梯度的反向传播，得到新参数矩阵和深度学习模型的待更新参数值的梯度；求取各GPU对应的待更新参数值梯度的平均值，并根据待更新参数值梯度的平均值更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵，深度学习模型的本轮训练结束。

作为一种可选的实施例，物体识别模型的训练方法还包括：

在完成深度学习模型的上一轮训练之后，判断深度学习模型是否满足物体识别的模型精度要求；

若是，则确定深度学习模型训练结束；

进一步地，本申请还可在完成深度学习模型的上一轮训练之后，判断深度学习模型是否满足物体识别的模型精度要求；若深度学习模型已满足物体识别的模型精度要求，说明深度学习模型无需继续训练，可直接投入使用，则确定深度学习模型训练结束；若深度学习模型还未满足物体识别的模型精度要求，说明深度学习模型需继续训练，不可直接投入使用，则重新将新的样本图片输入至深度学习模型中进入新一轮的训练，直至深度学习模型满足物体识别的模型精度要求，才结束深度学习模型的训练。

作为一种可选的实施例，深度学习模型具体为卷积神经网络模型。

具体地，本申请的深度学习模型可选用但不仅限于卷积神经网络模型(如ResNet、SqueezeNet等模型)，本申请在此不做特别的限定。

请参照图3，图3为本发明实施例提供的一种物体识别模型的训练系统的结构示意图。

该物体识别模型的训练系统包括：

矩阵保存模块1，用于预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中；

向量获取模块2，用于在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的样本特征向量；

矩阵重构模块3，用于从参数矩阵中抽取出样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

相似度获取模块4，用于将样本特征向量与新参数矩阵相乘，得到样本特征向量与新参数矩阵中的各特征向量的相似度；

参数更新模块5，用于根据相似度计算损失函数，并基于损失函数进行梯度的反向传播，更新新参数矩阵和深度学习模型的参数，且基于更新后的新参数矩阵更新内存中的总参数矩阵，以完成深度学习模型的本轮训练。

作为一种可选的实施例，矩阵保存模块1具体用于：

作为一种可选的实施例，物体识别模型的训练系统还包括：

相应的，向量获取模块2具体用于：

从所有样本ID中随机获取一批次目标样本ID，并基于目标样本ID从数据集中获取对应的目标样本图片；将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示目标样本图片的特征信息的样本特征向量；

矩阵重构模块3具体用于：

本申请提供的训练系统的介绍请参考上述训练方法的实施例，本申请在此不再赘述。

本申请还提供了一种物体识别模型的训练装置，包括：

存储器，用于存储计算机程序；

处理器，用于在执行计算机程序时实现上述任一种物体识别模型的训练方法的步骤。

本申请提供的训练装置的介绍请参考上述训练方法的实施例，本申请在此不再赘述。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种物体识别模型的训练方法，其特征在于，包括：

预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中；

在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；

从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

将所述样本特征向量与所述新参数矩阵相乘，得到所述样本特征向量与所述新参数矩阵中的各特征向量的相似度；

根据所述相似度计算损失函数，并基于所述损失函数进行梯度的反向传播，更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。
如权利要求1所述的物体识别模型的训练方法，其特征在于，预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中的过程，包括：

随机初始化一个大小为emb_size×cls_size、用于表示多张样本图片的特征信息的参数矩阵，并将所述参数矩阵保存在内存中；其中，emb_size为用于表示一张样本图片的特征信息的特征向量的大小，cls_size为样本图片的总数量。
如权利要求2所述的物体识别模型的训练方法，其特征在于，所述物体识别模型的训练方法还包括：

预先将多张样本图片保存在数据集中，并为多张样本图片一一配置样本ID；

相应的，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵的过程，包括：

从所有样本ID中随机获取一批次目标样本ID，并基于所述目标样本ID从所述数据集中获取对应的目标样本图片；

将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述目标样本图片的特征信息的样本特征向量；

从剩余样本ID中随机获取一定数量的随机样本ID，并从所述参数矩阵中抽取出所述目标样本ID和所述随机样本ID对应的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。
如权利要求1所述的物体识别模型的训练方法，其特征在于，所述深度学习模型的本轮训练过程具体包括：

预先为不同GPU分配不同样本图片；

将目标GPU对应的样本图片输入至用于物体识别的深度学习模型中，得到用于表示样本图片的特征信息的目标样本特征向量；其中，所述目标GPU为任一所述GPU；

从所述参数矩阵中抽取出为所有GPU分配的所有样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

利用所述目标GPU将所述目标样本特征向量与所述新参数矩阵相乘，得到所述目标样本特征向量与所述新参数矩阵中的各特征向量的目标相似度，并根据所述目标相似度计算目标损失函数，且基于所述目标损失函数进行梯度的反向传播，得到所述新参数矩阵和所述深度学习模型的待更新参数值的梯度；

求取各GPU对应的待更新参数值梯度的平均值，并根据所述待更新参数值梯度的平均值更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。
如权利要求1所述的物体识别模型的训练方法，其特征在于，所述物体识别模型的训练方法还包括：

在完成所述深度学习模型的上一轮训练之后，判断所述深度学习模型是否满足物体识别的模型精度要求；

若是，则确定所述深度学习模型训练结束；

若否，则重新将新的样本图片输入至用于物体识别的深度学习模型中进入新一轮的训练。
如权利要求1所述的物体识别模型的训练方法，其特征在于，所述深度学习模型具体为卷积神经网络模型。
一种物体识别模型的训练系统，其特征在于，包括：

矩阵保存模块，用于预先将由多个用于表示物体特征信息的特征向量构成的参数矩阵保存在内存中；

向量获取模块，用于在模型训练过程中，将样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述样本图片的特征信息的样本特征向量；

矩阵重构模块，用于从所述参数矩阵中抽取出所述样本图片对应的特征向量及从剩余参数矩阵中随机抽取出一定数量的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵；

相似度获取模块，用于将所述样本特征向量与所述新参数矩阵相乘，得到所述样本特征向量与所述新参数矩阵中的各特征向量的相似度；

参数更新模块，用于根据所述相似度计算损失函数，并基于所述损失函数进行梯度的反向传播，更新所述新参数矩阵和所述深度学习模型的参数，且基于更新后的新参数矩阵更新所述内存中的总参数矩阵，以完成所述深度学习模型的本轮训练。
如权利要求7所述的物体识别模型的训练系统，其特征在于，所述矩阵保存模块具体用于：

随机初始化一个大小为emb_size×cls_size、用于表示多张样本图片的特征信息的参数矩阵，并将所述参数矩阵保存在内存中；其中，emb_size为用于表示一张样本图片的特征信息的特征向量的大小，cls_size为样本图片的总数量。
如权利要求8所述的物体识别模型的训练系统，其特征在于，所述物体识别模型的训练系统还包括：

ID配置模块，用于预先将多张样本图片保存在数据集中，并为多张样本图片一一配置样本ID；

相应的，所述向量获取模块具体用于：

从所有样本ID中随机获取一批次目标样本ID，并基于所述目标样本ID从所述数据集中获取对应的目标样本图片；将目标样本图片输入至用于物体识别的深度学习模型中，得到用于表示所述目标样本图片的特征信息的样本特征向量；

所述矩阵重构模块具体用于：

从剩余样本ID中随机获取一定数量的随机样本ID，并从所述参数矩阵中抽取出所述目标样本ID和所述随机样本ID对应的特征向量，并将抽取出的所有特征向量重新构成新参数矩阵。
一种物体识别模型的训练装置，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于在执行所述计算机程序时实现如权利要求1-6任一项所述的物体识别模型的训练方法的步骤。