CN113657596B

CN113657596B - 训练模型和图像识别的方法和装置

Info

Publication number: CN113657596B
Application number: CN202110994071.8A
Authority: CN
Inventors: 沈力
Original assignee: Jingdong Technology Information Technology Co Ltd
Current assignee: Jingdong Technology Information Technology Co Ltd
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2023-11-03
Anticipated expiration: 2041-08-27
Also published as: CN113657596A

Abstract

本公开的实施例公开了训练模型和图像识别的方法和装置。该方法的具体实施方式包括：基于历史训练数据序列对初始模型进行训练得到第一模型；将当前训练数据序列输入第一模型，计算元损失函数在当前训练数据序列上的第一梯度；根据第一梯度与学习率更新第一模型的网络参数，得到第二模型；将历史训练数据序列输入第二模型，计算元损失函数在历史训练数据序列上的第二梯度；根据第一梯度和第二梯度更新学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；基于未来训练数据序列和更新后的学习率进行模型训练。该实施方式能够提高模型在时序数据领域迁移情景下识别的准确率。

Description

训练模型和图像识别的方法和装置

技术领域

本公开的实施例涉及计算机技术领域，具体涉及训练模型和图像识别的方法和装置。

背景技术

时间序列分类问题在现实生活中有大量的应用场景。在真实场景中，给定任务的数据集都是逐渐获取的，不同时间段的获取数据集往往具有不同的领域知识(domainknowledge)，比如一个用户用手机拍照，随着时间的变换，早上，中午和晚上的照片的光线各有不同，随着地点的变换，每个时刻的照片的背景也会时刻变换。比如针对无人驾驶场景，汽车需要识别出外界不同时刻不同地域的场景，市区，郊区，沙漠无人区，高速公路，高架桥等场景，这些场景数据的领域知识会随着时间和地点的变换有很大的差异。我们将这类为题称之为序列领域转变问题(sequential domain shift，SDF)。

现有的考虑了SDF问题的深度学习模型，虽然可以在当前时刻的数据域取得较高的分类精度，但无法在历史时刻的数据域上取得较高的分类精度。

发明内容

本公开的实施例提出了训练模型和图像识别的方法和装置。

第一方面，本公开的实施例提供了一种训练模型的方法，包括：基于所述历史训练数据序列对初始模型进行训练得到第一模型；将当前训练数据序列输入所述第一模型，计算元损失函数在当前训练数据序列上的第一梯度；根据所述第一梯度与学习率更新所述第一模型的网络参数，得到第二模型；将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度；根据所述第一梯度和所述第二梯度更新所述学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；基于所述未来训练数据序列和更新后的学习率进行模型训练。

在一些实施例中，所述将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度，包括：将记忆数据集输入所述第二模型，得到每个记忆数据的预测值；将每个记忆数据的预测值和真实值输入元损失函数，计算每个记忆数据的损失值；计算每个记忆数据的损失值的平均值在所述第二模型的网络参数的梯度作为第二梯度。

在一些实施例中，所述根据所述第一梯度和所述第二梯度更新所述学习率，包括：将所述第一梯度和所述第二梯度之积乘以预设参数后加上所述学习率作为新的学习率。

在一些实施例中，所述方法还包括：基于对初始模型的训练过程确定出不同数据领域的共享模型参数和独享模型参数；在对第一模型和第二模型的训练过程中，针对目标数据领域的训练数据，固定其它数据领域的独享模型参数，调整目标数据领域的独享模型参数和共享模型参数。

在一些实施例中，所述获取历史训练数据序列、当前训练数据序列、未来训练数据序列，包括：获取两个数据领域的训练数据序列集合；确定所述训练数据序列集合中数据领域迁移的临界时间点；从所述临界时间点之前的训练数据序列中选取历史训练数据序列，从所述临界时间点对应的训练数据序列中选取当前训练数据序列，从所述临界时间点之后的训练数据序列中选取未来训练数据序列。

在一些实施例中，所述确定所述训练数据序列集合中数据领域迁移的临界时间点，包括：依次计算相邻训练数据之间的相似度；若检测出相似度小于预定阈值的两个相邻的训练数据，则确定出数据领域迁移的临界时间点。

第二方面，本公开的实施例提供了一种图像识别方法，包括：获取包括不同数据领域的时序图像集合；将所述时序图像集合输入根据第一方面所述的方法训练得到的模型，输出每张时序图像的识别结果。

第三方面，本公开的实施例提供了一种训练模型的装置，包括：第一训练单元，被配置成基于所述历史训练数据序列对初始模型进行训练得到第一模型；第一计算单元，被配置成将当前训练数据序列输入所述第一模型，计算元损失函数在当前训练数据序列上的第一梯度；第一更新单元，被配置成根据所述第一梯度与学习率更新所述第一模型的网络参数，得到第二模型；第二计算单元，被配置成将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度；第二更新单元，被配置成根据所述第一梯度和所述第二梯度更新所述学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；第二训练单元，被配置成基于所述未来训练数据序列和更新后的学习率进行模型训练。

第四方面，本公开的实施例提供了一种图像识别装置，包括：获取单元，被配置成获取包括不同数据领域的时序图像集合；识别单元，被配置成将所述时序图像集合输入根据第一方面所述的方法训练得到的模型，输出每张时序图像的识别结果。

第五方面，本公开的实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个计算机程序，当所述一个或多个计算机程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面或第二方面所述的方法。

第六方面，本公开的实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如第一方面或第二方面所述的方法。

本公开实施例提供的训练模型和图像识别的方法和装置，针对于时序数据的领域迁移问题，提出了一类元优化器算法来解决基于深度学习模型的时序数据的领域迁移算法中的灾难遗忘问题。将在历史时刻的数据域上训练得到的神经网络模型的参数分成两部分：对历史时刻数据敏感的模型参数和对历史数据不敏感的模型参数。针对对历史时刻数据敏感的模型参数，尽量延缓这类参数在当前时刻数据域上的更新，而对于历史数据不敏感的模型参数，则加速这类参数在当前时刻数据域上的更新频率。为了达到这个目标，根据历史数据，定义了一个小型的记忆数据集。计算神经网络在该小型数据集上的梯度，根据这个梯度大小来估计神经网络参数对于历史数据的敏感程度，通过这个敏感程度来决定当前的神经网络模型参数在当前时刻数据域上更新时的学习率大小，学习率越大，则对应的神经网络模型参数更新的越快，学习率越小，则对应的神经网络模型参数更新的越慢。通过这种动态调整学习率的方法，本技术方案即可解决长时间序列中的灾难遗忘问题。最后，将本方案中提出的元优化器算法应用到领域已知的时序数据的领域迁移问题和领域未知的时序数据的领域迁移问题。最后，通过大量的实验结果证明了训练模型的方法的有效性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开的一个实施例可以应用于其中的示例性系统架构图；

图2是根据本公开的训练模型的方法的一个实施例的流程图；

图3a、3b是根据本公开的训练模型的方法的一个应用场景的示意图；

图4是根据本公开的图像识别方法的一个实施例的流程图；

图5是根据本公开的图像识别方法的实验结果；

图6是根据本公开的训练模型的装置的一个实施例的结构示意图；

图7是根据本公开的图像识别装置的一个实施例的结构示意图；

图8是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出了可以应用本公开实施例的训练模型的方法、训练模型的装置、图像识别方法或图像识别装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端101、102，网络103、数据库服务器104和服务器105。网络103用以在终端101、102，数据库服务器104与服务器105之间提供通信链路的介质。网络103可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户110可以使用终端101、102通过网络103与服务器105进行交互，以接收或发送消息等。终端101、102上可以安装有各种客户端应用，例如模型训练类应用、图像识别类应用、购物类应用、支付类应用、网页浏览器和即时通讯工具等。

这里的终端101、102可以是硬件，也可以是软件。当终端101、102为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、膝上型便携计算机和台式计算机等等。当终端101、102为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

当终端101、102为硬件时，其上还可以安装有图像采集设备。图像采集设备可以是各种能实现采集图像功能的设备，如摄像头、传感器等等。用户110可以利用终端101、102上的图像采集设备，来采集不同数据领域的图像。

数据库服务器104可以是提供各种服务的数据库服务器。例如数据库服务器中可以存储有样本集。样本集中包含有大量的样本。其中，样本可以包括样本图像和用于标注图像中物体类别的标注信息。这样，用户110也可以通过终端101、102，从数据库服务器104所存储的样本集中选取样本。

服务器105也可以是提供各种服务的服务器，例如对终端101、102上显示的各种应用提供支持的后台服务器。后台服务器可以利用终端101、102发送的样本集中的样本，对初始模型进行训练，并可以将训练结果(如生成的模型)发送给终端101、102。这样，用户可以应用生成的模型进行图像识别。

这里的数据库服务器104和服务器105同样可以是硬件，也可以是软件。当它们为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当它们为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。数据库服务器104和服务器105也可以为分布式系统的服务器，或者是结合了区块链的服务器。数据库服务器104和服务器105也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。

需要说明的是，本公开实施例所提供的训练模型的方法或图像识别方法一般由服务器105执行。相应地，训练模型的装置或图像识别装置一般也设置于服务器105中。

需要指出的是，在服务器105可以实现数据库服务器104的相关功能的情况下，系统架构100中可以不设置数据库服务器104。

应该理解，图1中的终端、网络、数据库服务器和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端、网络、数据库服务器和服务器。

继续参见图2，其示出了根据本公开的训练模型的方法的一个实施例的流程200。该训练模型的方法可以包括以下步骤：

步骤201，基于历史训练数据序列对初始模型进行训练得到第一模型。

在本实施例中，训练模型的方法的执行主体(例如图1所示的服务器105)可以通过多种方式来获取样本集，样本集可包括历史训练数据序列、当前训练数据序列和未来训练数据序列。这三种训练数据序列是按时间顺序排序的。历史训练数据序列、当前训练数据序列和未来训练数据序列可以是单一数据领域的数据，也可以是多个数据领域的数据。可选地，历史训练数据序列和未来训练数据序列可以属于不同的数据领域，他们之间存在领域迁移。而当前训练数据序列是领域迁移的临界时间点对应的数据。

每种训练数据序列中的每个数据代表一个样本。样本可以包括样本图像以及与样本图像对应的标注信息。这里的标注信息可以是用于表征图像中物体类别、位置的信息。例如无人车采集的图像中标注出红绿灯、人行道、绿化带、车辆、行人等类别和位置。

这里的模型是用于图像识别的神经网络，可以是现有技术中任意的图像识别模型。

给定一组时序数据域D₁,D₂,…,D_J作为历史训练数据序列。记N_i,i＝1,2,…,J-1表示在这个时序数据中，领域迁移出现的临界点。针对时间段1～N₁，可从这一组数据领域的每个时间段中随机采样出数据集这类数据的领域分布满足P(D₁)，针对时间段N_i+1～N_i+1,可从这一组数据领域的每个时间段中随机采样出数据集/>这类数据的领域分布满足P(D_i)。针对时间段N_J-1+1～N_J,可从这一组数据领域的每个时间段中随机采样出数据集/>这类数据的领域分布满足P(D_J)。每个数据T_i∈D_i,可将其分解为支撑集S(也)和查询集Q。在元学习中，训练过程分为元学习训练(Meta-Training)和元学习测试(Meta-Testing)两个阶段，在元学习训练，可从训练数据抽取一部分的数据样本，这部分数据样本称之为支撑集S。在测试阶段，可从训练数据中抽取一部分数据样本，这部分数据样本称之为查询集Q。S主要是为了做训练，Q主要是为了判断训练的好坏。

时序数据的领域迁移问题指的就是通过这一组历史训练数据序列训练得到一个深度学习模型(命名为第一模型，与后面的第二模型的结构相同，但网络参数不同)，这个深度学习模型在新时刻获取得到的数据域上进行训练之后得到第二模型，第二模型不会对历史时刻数据域上的分类精度造成影响。在实验的最后，可通过在P(D₁)，P(D_i)，P(D_J)上抽取一组未参与训练的属于来评价在整个深度学习模型的效果好坏。

在本实施例的一些可选地实现方式中，该方法还包括：获取两个数据领域的训练数据序列集合；确定所述训练数据序列集合中数据领域迁移的临界时间点；从所述临界时间点之前的训练数据序列中选取出历史训练数据序列；从所述临界时间点对应的训练数据序列中选取出当前训练数据序列；从所述临界时间点之后的训练数据序列中选取出未来训练数据序列。

数据领域迁移有两种情况，第一种就是已知数据领域出现了迁移。比如从高速公路场景到过道的场景，这个就明显有区别。第二种是未知场景，则可通过数据领域迁移检测来判断是否出现了迁移。可依次计算相邻训练数据之间的相似度；若检测出相似度小于预定阈值的两个相邻的训练数据，则确定出数据领域迁移的临界时间点。

每个临界时间点都会对应若干个训练数据，可从中抽取部分或全部训练数据作为当前训练数据序列。

步骤202，将当前训练数据序列输入第一模型，计算元损失函数在当前训练数据序列上的第一梯度。

在本实施例中，定义元损失函数L_θ(T_i)＝P(Q|θ,S)，该函数表示在任务T_i(采用的是当前训练数据序列)上的元损失函数。将其梯度定义为表示函数L_θ(T_i)在第一模型的网络参数θ处的梯度，命名为第一梯度。

步骤203，根据第一梯度与学习率更新第一模型的网络参数，得到第二模型。

在本实施例中，这里的学习率是初始的学习率λ。

θ′表示第二模型的网络参数。

步骤204，将记忆数据集输入第二模型，计算元损失函数在记忆数据集上的第二梯度。

在本实施例中，定义两个梯度乘积为：针对两个任务T_i和T_j,如果/>则表示任务T_i和T_j的相似程度很低，那么从任务T_i到任务T_j上迁移的时候，会出现灾难遗忘问题。如果/>则表示任务T_i和T_j的相似程度比较高，那么从任务T_i到任务T_j上迁移的时候，灾难遗忘出现的概率较低。在本方案中，通过构建一个小的记忆数据集M(可从历史训练数据序列中抽取出初始的记忆数据集，再将使用过的当前训练数据中的一部分添加到记忆数据集M中)，来解决长时序数据的领域迁移过程中的灾难遗忘的问题，这个问题的损失函数定义如下：

其中/>

在上述公式中，θ^′表示的为在当前时刻的时序数据域(即当前训练数据序列)上训练的神经网络模型，λ表示的为训练算法的学习率。F(θ)表示的元损失函数在记忆数据集上的泛化精度。上述整个公式表示，在当前时刻的时序数据域上更新得到的神经网络模型参数同时可以确保在记忆数据集(历史时刻构造)上取得更好的泛化结果，从而一定程度上解决了长时间序列问题中的灾难遗忘的问题。根据上述优化问题F(θ)的是关于学习率λ的函数。根据F(θ)的定义，我们可以得到F(θ)关于学习率λ的梯度为：

根据F(θ)关于学习率λ的梯度，利用梯度下降算法，我们即可得到学习率的自适应的更新公式：

注意到表示的为元损失函数在记忆数据集上的梯度(即第二梯度)，/>表示的是元损失函数在当前时刻数据域上的梯度(即第一梯度)。如果则表示当前时刻数据域和历史时刻数据域差距较大，领域迁移会导致灾难遗忘的问题,则可通过减小学习率λ，放缓深度学习模型在当前时刻数据域上的更新速度。相反的，如果/>则表示当前时刻数据域和历史时刻数据域差距较小，领域迁移不会产生严重的灾难遗忘的问题，则可以直接增大学习率，加速深度学习模型在当前时刻数据域上的更新的性能和速度，从而得到更快的迁移效率。

可计算记忆数据集中所有记忆数据的梯度的平均值作为第二梯度。

在本实施例的一些可选地实现方式中，将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度，包括：将记忆数据集输入所述第二模型，得到每个记忆数据的预测值；将每个记忆数据的预测值和真实值输入元损失函数，计算每个记忆数据的损失值；计算每个记忆数据的损失值的平均值在所述第二模型的网络参数的梯度作为第二梯度。记忆数据也是样本集中的一部分，也具备图像和标注信息，标注信息即为真实值，用于和预测值进行有监督的训练。损失值的计算方法为现有技术常规方法，在此不再赘述。

步骤205，根据第一梯度和第二梯度更新学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中。

在本实施例中，可根据第一梯度和第二梯度之积调整学习率，使得第一梯度和第二梯度之积为负数时，学习率减小，而第一梯度和第二梯度之积为正数时，学习率增加。例如，当检测到第一梯度和第二梯度之积为负数时，学习率减小一个固定步长。当检测到第一梯度和第二梯度之积为正数时，学习率增加一个固定步长。

在本实施例的一些可选地实现方式中，可让学习率直接加上第一梯度和第二梯度之积乘以一个参数作为新的学习率。

λ_t+1表示基于未来训练数据序列训练时的学习率，λ_t为基于当前训练数据序列训练时的学习率。

η可以是固定值，也可以是根据模型收敛速度动态调整的值，如果模型收敛速度太慢，则可增加η。

步骤206，基于未来训练数据序列和更新后的学习率进行模型训练。

在本实施例中，按照更新后的学习率更新在未来训练数据序列上的网络参数。

其中，θ_t表示当前的学习率，θ_t+1表示更新后的学习率。

可以在每次发生数据领域迁移时更新学习率，在同一数据领域中训练时学习率可保持不变，或者可通过调整参数η来调整学习率。

具体的动态调整学习率的算法如下：

1.给定训练序列其中N_i,i＝1,2,…,J-1表示领域迁移出现的临界点。初始化学习参数λ₀,模型参数θ₀,以及参数η₀

2.Fort＝1,2,…,N_Jdo

3.//更新在未来时刻数据域上的神经网络参数

4.//更新在未来时刻数据域上的训练算法的学习率

5.将当前t时刻的数据域的部分数据集T_t添加到记忆数据集中：M＝M∪T_t

End For

将本方案中提出的动态调整学习率的算法应用到领域已知的时序数据的领域迁移问题和领域未知的时序数据的领域迁移问题。针对这两种具体的场景，本文给出相应的具体的解决方案，其结构说明图3a和图3b所示。在图3a和图3b中的CNN区域表示的不同的领域共享的特征抽取模块，subnet-i(第i个领域的子网络)表示每个领域独享的差异模块。在训练领域D_i时，CNN区域和相应的subnet-i模块会进行更新，其他的subnet模块会保持固定，采取这种训练架构的目的可以有效的防止灾难遗忘的问题。另外，针对领域未知的时序数据的领域迁移问题(如图3b)，可在其中插入例如领域迁移检测模块，来自适应的检测出是否发生了领域迁移。一旦检测出来训练过程中发生了领域迁移，图3b即退化为图3a中的领域一直的时序数据的领域迁移问题。

在本实施例的一些可选地实现方式中，该方法还包括：基于对初始模型的训练过程确定出不同数据领域的共享模型参数和独享模型参数；在对第一模型和第二模型的训练过程中，针对目标数据领域的训练数据，固定其它数据领域的独享模型参数，调整目标数据领域的独享模型参数和共享模型参数。

如图3a、3b所示的CNN模块代表的就是共享模型参数。subnet-i代表的是独享模型参数。

通过历史训练数据序列训练出第一模型，然后从历史训练数据序列中抽取一部分数据放入记忆数据集。对于领域1，根据D₁对应的任务T1的训练数据进行训练，通过反向传播调整共享模型参数和subnet1的模型参数，并得到第一梯度。还计算记忆数据集在更新后的模型上的第二梯度。然后根据第一梯度和第二梯度动态调整学习率，得到学习率λ₁。对于领域2，使用学习率λ₁进行训练，此时subnet1的模型参数保持不变，通过反向传播调整共享模型参数和subnet2的模型参数，重复上述步骤，更新学习率为λ₂。依此类推，在每个领域迁移的临界点更新学习率，以防止领域迁移的灾难性遗忘问题。

通过这种动态调整学习率的方法，本技术方案即可解决长时间序列中的灾难遗忘问题。

请参见图4，其示出了本公开提供的图像识别方法的一个实施例的流程400。图像识别方法可以包括以下步骤：

步骤401，获取包括不同数据领域的时序图像集合。

在本实施例中，图像识别方法的执行主体(例如图1所示的服务器105)可以通过多种方式来获取包括不同数据领域的时序图像集合。例如，从无人车获取其采集的周边环境图像，无人车可从高速公路切换到市区道路，则数据领域发生了变化。

步骤402，将时序图像集合输入模型，输出每张时序图像的识别结果。

在本实施例中，执行主体可以将步骤401中获取的时序图像集合输入模型中，从而生成图像识别结果。图像识别结果可以是用于描述图像中目标对象的信息。例如图像识别结果可以包括是否检测到车辆，以及车辆的位置等。

在本实施例中，模型可以是采用如上述图2实施例所描述的方法而生成的。具体生成过程可以参见图2实施例的相关描述，在此不再赘述。

需要说明的是，本实施例图像识别方法可以用于测试上述各实施例所生成的模型。进而根据测试结果可以不断地优化模型。该方法也可以是上述各实施例所生成的模型的实际应用方法。采用上述各实施例所生成的模型，来进行图像识别，有助于提高图像识别的性能。如找到的目标对象较多，找到的目标对象信息比较准确等。

在实验中，本技术方案中提出的算法(ours)与现有的技术方案进行对比EWC(Elastic Weight Consolidation，弹性权重固结),HAT(Hard Attention Mask，强注意力掩码),UCB(Uncertainty-guided continual learning with bayesian neuralnetworks，使用贝叶斯神经网络不确定导的连续学习),A-GEM,RS(Reservoir Sampling，蓄水池采样),MER(Meta Experience Replay，元经验重现)。实验测试数据集以及相应的时序关系为Necessities，Fungi,Omniglot，Plantae，AIRCRAFT，Miniimagenet，CIFARFS，CUB，Quickdraw，Electronic。

图5展示了性能随着领域数量而变化(performance varies with the number ofdomains)，其中，横坐标表示领域的数量(number of domains)，纵坐标表示准确率(accuracy)。不同曲线示出了在不同的数量的时序领域迁移问题上，不同算法的实验结果。根据上述实验可以看到，本公开的算法可以获得更高的测试精度，从而体现了本公开的算法的优越性。

继续参见图6，作为对上述图2所示方法的实现，本公开提供了一种训练模型的装置的一个实施例。该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例的训练模型的装置600可以包括：第一训练单元601、第一计算单元602、第一更新单元603、第二计算单元604、第二更新单元605和第二训练单元606。其中，第一训练单元601，被配置成基于所述历史训练数据序列对初始模型进行训练得到第一模型；第一计算单元602，被配置成将当前训练数据序列输入所述第一模型，计算元损失函数在当前训练数据序列上的第一梯度；第一更新单元603，被配置成根据所述第一梯度与学习率更新所述第一模型的网络参数，得到第二模型；第二计算单元604，被配置成将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度；第二更新单元605，被配置成根据所述第一梯度和所述第二梯度更新所述学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；第二训练单元606，被配置成基于所述未来训练数据序列和更新后的学习率进行模型训练。

在本实施例的一些可选的实现方式中，第二计算单元604进一步被配置成：将记忆数据集输入所述第二模型，得到每个记忆数据的预测值；将每个记忆数据的预测值和真实值输入元损失函数，计算每个记忆数据的损失值；计算每个记忆数据的损失值的平均值在所述第二模型的网络参数的梯度作为第二梯度。

在本实施例的一些可选的实现方式中，第二更新单元605进一步被配置成：将所述第一梯度和所述第二梯度之积乘以预设参数后加上所述学习率作为新的学习率。

在本实施例的一些可选的实现方式中，装置600还包括调参单元(附图中未示出)，被配置成：基于对初始模型的训练过程确定出不同数据领域的共享模型参数和独享模型参数；在对第一模型和第二模型的训练过程中，针对目标数据领域的训练数据，固定其它数据领域的独享模型参数，调整目标数据领域的独享模型参数和共享模型参数。

在本实施例的一些可选的实现方式中，装置600还包括样本获取单元(附图中未示出)，被配置成：获取两个数据领域的训练数据序列集合；确定所述训练数据序列集合中数据领域迁移的临界时间点；从所述临界时间点之前的训练数据序列中选取出历史训练数据序列；从所述临界时间点对应的训练数据序列中选取出当前训练数据序列；从所述临界时间点之后的训练数据序列中选取出未来训练数据序列。

在本实施例的一些可选的实现方式中，样本获取单元进一步被配置成：依次计算相邻训练数据之间的相似度；若检测出相似度小于预定阈值的两个相邻的训练数据，则确定出数据领域迁移的临界时间点。

继续参见图7，作为对上述图4所示方法的实现，本公开提供了一种图像识别装置的一个实施例。该装置实施例与图4所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图7所示，本实施例的图像识别装置700可以包括：获取单元701，被配置成获取包括不同数据领域的时序图像集合；识别单元702，被配置成将所述时序图像集合输入根据流程200中任一项所述的方法训练得到的模型，输出每张时序图像的识别结果。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质。

一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个计算机程序，当所述一个或多个计算机程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如流程200或400所述的方法。

一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如流程200或400所述的方法。

图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如训练模型的方法。例如，在一些实施例中，训练模型的方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的训练模型的方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行训练模型的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种训练用于图像识别的模型的方法，包括：

基于历史训练数据序列对初始模型进行训练得到第一模型，其中，所述初始模型是用于图像识别的神经网络；

将当前训练数据序列输入所述第一模型，计算元损失函数在当前训练数据序列上的第一梯度；

根据所述第一梯度与学习率更新所述第一模型的网络参数，得到第二模型；

将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度；

根据所述第一梯度和所述第二梯度更新所述学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；

基于未来训练数据序列和更新后的学习率进行模型训练，输出用于图像识别的模型。

2.根据权利要求1所述的方法，其中，所述将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度，包括：

将记忆数据集输入所述第二模型，得到每个记忆数据的预测值；

将每个记忆数据的预测值和真实值输入元损失函数，计算每个记忆数据的损失值；

计算每个记忆数据的损失值的平均值在所述第二模型的网络参数的梯度作为第二梯度。

3.根据权利要求1所述的方法，其中，所述根据所述第一梯度和所述第二梯度更新所述学习率，包括：

将所述第一梯度和所述第二梯度之积乘以预设参数后加上所述学习率作为新的学习率。

4.根据权利要求1所述的方法，其中，所述方法还包括：

基于对初始模型的训练过程确定出不同数据领域的共享模型参数和独享模型参数；

在对第一模型和第二模型的训练过程中，针对目标数据领域的训练数据，固定其它数据领域的独享模型参数，调整目标数据领域的独享模型参数和共享模型参数。

5.根据权利要求1所述的方法，其中，所述方法还包括：

获取两个数据领域的训练数据序列集合；

确定所述训练数据序列集合中数据领域迁移的临界时间点；

从所述临界时间点之前的训练数据序列中选取出历史训练数据序列；

从所述临界时间点对应的训练数据序列中选取出当前训练数据序列；

从所述临界时间点之后的训练数据序列中选取出未来训练数据序列。

6.根据权利要求5所述的方法，其中，所述确定所述训练数据序列集合中数据领域迁移的临界时间点，包括：

依次计算相邻训练数据之间的相似度；

若检测出相似度小于预定阈值的两个相邻的训练数据，则确定出数据领域迁移的临界时间点。

7.一种图像识别方法，包括：

获取包括不同数据领域的时序图像集合；

将所述时序图像集合输入根据权利要求1-6中任一项所述的方法训练得到的模型，输出每张时序图像的识别结果。

8.一种训练用于图像识别的模型的装置，包括：

第一训练单元，被配置成基于历史训练数据序列对初始模型进行训练得到第一模型，其中，所述初始模型是用于图像识别的神经网络；

第一计算单元，被配置成将当前训练数据序列输入所述第一模型，计算元损失函数在当前训练数据序列上的第一梯度；

第一更新单元，被配置成根据所述第一梯度与学习率更新所述第一模型的网络参数，得到第二模型；

第二计算单元，被配置成将记忆数据集输入所述第二模型，计算元损失函数在记忆数据集上的第二梯度；

第二更新单元，被配置成根据所述第一梯度和所述第二梯度更新所述学习率，并从当前训练数据序列抽取训练数据添加到记忆数据集中；

第二训练单元，被配置成基于未来训练数据序列和更新后的学习率进行模型训练，输出用于图像识别的模型。

9.一种图像识别装置，包括：

获取单元，被配置成获取包括不同数据领域的时序图像集合；

识别单元，被配置成将所述时序图像集合输入根据权利要求1-6中任一项所述的方法训练得到的模型，输出每张时序图像的识别结果。

10.一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个计算机程序，

当所述一个或多个计算机程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。

11.一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。