CN111860828A

CN111860828A - 一种神经网络的训练方法、存储介质和设备

Info

Publication number: CN111860828A
Application number: CN202010540736.3A
Authority: CN
Inventors: 贾政轩; 庄长辉; 肖莹莹; 林廷宇; 曾贲; 李鹤宇; 田子阳
Original assignee: Beijing Simulation Center
Current assignee: Beijing Simulation Center
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2020-10-30
Anticipated expiration: 2040-06-15
Also published as: CN111860828B

Abstract

本发明实施例公开一种神经网络的训练方法，构建包括参数节点及若干个训练节点的训练框架，将若干训练节点与参数节点的神经网络参数进行更新；各训练节点进行训练，每隔预设的训练步数分别向参数节点发送神经网络参数和/或神经网络累积梯度；参数节点对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，并据其更新参数节点的神经网络参数和/或神经网络累积梯度；各训练节点根据参数节点发送的融合后的神经网络参数和/或神经网络累积梯度再次训练，通过预设的模型训练终止条件，参数节点输出其神经网络模型。本发明实施例提供的神经网络的训练方法，可进一步提升神经网络训练方法的训练效率及收敛模型的性能和训练精度。

Description

一种神经网络的训练方法、存储介质和设备

技术领域

本发明涉及深度学习技术领域，特别是涉及一种神经网络的训练方法、存储介质和设备。

背景技术

随着深度学习、深度强化学习等智能化算法所面临问题复杂性的日益增强，深度神经网络的训练所需的数据规模和训练计算量剧烈增长，单机训练时长也逐渐趋于爆炸。尽管近年来GPU硬件的发展取得了长足进展，并在一定程度上为深度神经网络的训练提供了支撑，但单机训练深度神经网络的时长仍然过长。在此条件下，深度神经网络的分布式训练被提出，并逐渐引起研究人员关注。

现有技术中的深度神经网络的分布式训练主要存在三种模式：模型并行、数据并行、以及模型和数据并行。模型并行主要是采用不同的计算机/计算节点对同一个深度神经网络的不同部分进行训练，以提升整个模型的训练效率，模型并行模式主要针对体量庞大的深度神经网络模型，得益于GPU硬件的快速发展，目前规模的深度神经网络在单机或单卡上基本能够得到良好支撑。

数据并行则是将同一个深度神经网络模型复制为多份，分别采用不同的计算机对深度神经网络模型副本进行训练，训练过程中通过对不同深度神经网络模型副本的神经网络参数或其累积梯度进行处理，获得神经网络参数更新，最终获得良好收敛的模型。

目前现有的数据并行模式的深度神经网络分布式训练方法，在不同模型参数处理方面主要包括三种方法：参数平均、梯度平均、以及去中心化传递更新。其中，参数平均、梯度平均的训练方法中，计算集群分为参数管理节点和训练节点，各训练节点在训练周期开始前均与参数管理节点同步神经网络参数，且在训练后，将训练节点的神经网络参数或累积训练梯度发送给参数管理节点，参数管理节点对各个训练节点传递过来的神经网络参数或累积训练梯度取平均后更新参数管理节点的神经网络参数，从而完成模型更新。而去中心化传递更新方法与之前的两种方法不同，在该方法中，计算集群中的所有节点均为训练节点。每个训练周期中，各训练节点将各自的累积梯度发送给其他的训练节点，并以其他训练节点发送来的累积梯度的平均值更新自身的神经网络副本参数。相比前两种方法，该方法的主要效果在于缩减网络通信，但其与前两种方法的实际性能对比尚为空白。

随着深度神经网络模型所要处理的任务的复杂性与日俱增，训练深度神经网络所需考虑、采用的训练数据的体量的日益增长，现有技术中的深度神经网络分布式训练方法的收敛效率及收敛得到的模型的性能、训练精度较差，数据利用效率较低。

因此，为了克服现有技术存在的技术缺陷，需要提供一种新的神经网络的训练方法、存储介质和设备。

发明内容

本发明的目的在于提供一种神经网络的训练方法、存储介质和设备，以解决现有技术存在的问题中的至少一个。

为了达到上述目的之一，本发明一方面提供一种神经网络的训练方法，包括以下步骤：

S1、构建分布式训练框架，所述分布式训练框架包括参数节点及若干个训练节点，所述参数节点与所述若干个训练节点分别具有神经网络模型；

S2、将所述若干训练节点的神经网络参数与所述参数节点的神经网络参数进行更新；

S3、各训练节点基于各自的训练数据，对各自的神经网络模型进行训练，以分别更新各训练节点的神经网络参数和/或神经网络累积梯度；

S4、各训练节点每隔预设的训练步数分别向所述参数节点发送各训练节点的神经网络参数和/或神经网络累积梯度；

S5、参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，以得到融合后的神经网络参数和/或神经网络累积梯度，并据其更新参数节点的神经网络参数和/或神经网络累积梯度；

S6、判断是否满足预设的模型训练终止条件，若满足则转入步骤S8，否则转入步骤S7；

S7、参数节点将融合后的神经网络参数和/或神经网络累积梯度发送给各训练节点，各训练节点根据所述融合后的神经网络参数和/或神经网络累积梯度再次训练，以分别再次更新各训练节点的神经网络参数和/或神经网络累积梯度，并转入步骤S4；

S8、参数节点输出其神经网络模型。

在一种实施例中，步骤S2中所述若干训练节点的神经网络参数与所述参数节点的神经网络参数设置为同步更新。

在一种实施例中，所述模型训练终止条件为：参数节点的神经网络模型的训练精度达到预设的精度的期望值。

在一种实施例中，所述参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，以得到融合后的神经网络参数和/或神经网络累积梯度进一步包括：

将各训练节点的神经网络参数或神经网络累积梯度设置为X₁,X₂,......,X_n,各训练节点的神经网络参数和/或神经网络累积梯度通过以下形式进行融合：

X_int＝g(X₁,X₂,......,X_n；p_i)

＝g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)，

其中，

p_i＝[θ_1,i,θ_2,i,...,θ_m,i]^T i∈{1,2,...,popSize}，θ_i为一个参数向量，θ_m,i为θ_i的第m维的数值，θ_m,i∈[0,1]，m为θ_i向量的维数，popSize为p_i向量的总数，g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为参数化函数，X_int为融合后的神经网络参数和/或神经网络累积梯度；

设计适应度函数，并根据所述适应度函数对融合得到的神经网络参数或神经网络累积梯度的性能进行评价；

采用群体智能算法设计θ_i的位置演化规律及演化过程。

在一种实施例中，所述g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为多项式函数或三角函数。

在一种实施例中，所述设计适应度函数，并根据所述适应度函数对融合得到的神经网络参数或神经网络累积梯度的性能进行评价基于分布式并行化设计实现。

在一种实施例中，所述采用群体智能算法设计θ_i的位置演化规律及演化过程基于分布式并行化设计实现。

在一种实施例中，所述群体智能算法为粒子群算法、人工蜂群算法或微分进化算法。

本发明第二方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的训练方法。

本发明第三方面提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述的训练方法。

本发明的有益效果如下：

本发明针对目前现有技术中存在的问题，提供一种神经网络的训练方法、存储介质和设备，该训练方法通过每隔预设的训练步数就对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，充分利用各个训练节点的经验，更有效地更新参数节点的神经网络参数，从而进一步提升深度神经网络分布式训练的训练效率及收敛模型的性能和训练精度。而且，该训练方法可应用于目前主流的监督学习、无监督学习或者强化学习等多种学习模式中。另外，本发明的训练方法通过采用群体智能优化方法，引入对各训练节点的神经网络参数或累积梯度的最佳融合函数的搜索，通过在有限但庞大的搜索空间内对各训练节点的神经网络参数或累积梯度的最佳融合方式进行高效搜索，并可在较短时间内获得较优解甚至最优解，在进一步缩短训练时长的同时，提高收敛模型的性能和训练精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本发明的一个实施方式的神经网络的训练方法的流程示意图。

图2示出本发明的一个实施方式的神经网络的训练方法的整体框架图。

图3示出本发明的一个实施方式的群体智能优化算法的流程示意图。

具体实施方式

为了更清楚地说明本发明，下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解的是，下面所具体描述的内容是说明性的而非限制性的，不应以此限制本发明的保护范围。

随着深度神经网络模型所要处理的任务的复杂性与日俱增，训练深度神经网络所需考虑、采用的训练数据的体量的日益增长，现有技术中的深度神经网络分布式训练方法的收敛效率及收敛得到的模型的性能、训练精度较差，数据利用效率较低。其中，针对数据并行模式的分布式训练，现有技术通常采用简单平均神经网络参数或累积梯度的方法，并未经过优化处理，特别是在各个神经网络参数或累积梯度如何融合上，缺乏更进一步的细致考虑；而且，现有技术的分布式训练往往需要各个训练节点训练充分长的时间才能进行一次参数管理节点的参数更新，导致神经网络达到收敛的效率较差，存在一定程度的缓慢，且收敛后所得到的神经网络模型的精度也较差。

针对现有技术中存在的技术问题，本发明提供一种神经网络的训练方法，如图1-3所示，包括以下步骤：

S1、构建分布式训练框架，所述分布式训练框架包括参数节点及若干个训练节点，所述参数节点与所述若干个训练节点分别具有神经网络模型，随后转入步骤S2；

在一种具体的实施方式中，该步骤还包括：

训练硬件环境的构建(如GPU卡等)、深度神经网络的构建以及训练基础框架的选择或实现。在又一种具体的实施方式中，训练基础框架可选择如Tensorflow、Pytorch、Caffe等；在一种具体的应用于监督学习、无监督学习的实施方式中，还包括对训练数据进行预处理；在一种具体的应用于深度强化学习的实施方式中，还包括准备交互式训练环境以及对接口封装等。

基于以上所构建的基础环境及选择的训练基础框架，设计并构建参数节点与若干个训练节点的深度神经网络模型，其中包括基于不同的处理问题，选择及设计不同的深度神经网络类型、深度神经网络结构的设计及神经元参数的初始化等。在一种具体的实施方式中，深度神经网络类型可为卷积神经网络、循环神经网络、残差网络、区域卷积网络、时域卷积网络等。深度神经网络结构的设计包括对深度神经网络的层数、单层神经元的个数等的设计。

同时，基于所设计的参数节点与若干个训练节点的深度神经网络模型以及具体的处理问题，设计实现若干个训练节点的深度神经网络模型的训练代码，实现训练逻辑流程的设计，为分布式训练框架的构建及实现奠定基础。

分布式训练框架的构建及实现主要基于若干个训练节点的深度神经网络模型的训练代码完成分布式训练算法的实现，在一种具体的实施方式中，在各个训练节点的训练代码的基础上，在各个训练节点补充如下部分的设计代码：

(1)与参数节点的数据通信代码，主要包括参数节点中神经网络参数的获取，以及当前的训练节点的神经网络参数和/或累积梯度向参数节点的发送；

(2)当前的训练节点的训练节奏的控制，即与参数节点的神经网络参数同步的节奏的配合；

同时，参数节点的训练代码也补充如下部分的设计代码；

(1)深度神经网络向不同计算设备部署部分代码(计算设备包括计算机、CPU、GPU、以及TPU)，即若干个训练节点的构建；

(2)与若干个训练节点的数据通信代码，主要包括若干个训练节点的神经网络参数和/或累积梯度的获取，以及参数节点的神经网络参数和/或累积梯度向若干个训练节点的发送；

(3)参数节点的神经网络参数更新的节奏控制；

(4)若干个训练节点神经网络参数和/或累积梯度融合更新函数的接口保留，以便与后续采用群体优化算法对最佳融合函数寻优的代码集成。

S2、将所述若干训练节点的神经网络参数与所述参数节点的神经网络参数进行更新，随后转入步骤S3；

在一种具体的实施方式中，若干训练节点的神经网络参数与所述参数节点的神经网络参数设置为同步更新，也就是说，所有的训练节点的神经网络参数同时与参数节点的神经网络参数进行更新，随后转入步骤S3；在另一种实施方式中，若干训练节点的神经网络参数与所述参数节点的神经网络参数设置为异步更新，即若干训练节点的神经网络参数分别与参数节点的神经网络参数进行更新，更新完成的训练节点直接转入步骤S3中开始训练。通过异步更新，减少同一时间段与参数节点进行神经网络参数更新的训练节点的数量，一定程度上减轻参数节点的负担。

S3、各训练节点基于各自的训练数据，对各自的神经网络模型进行训练，以分别更新各训练节点的神经网络参数和/或神经网络累积梯度，随后转入步骤S4；

S4、各训练节点每隔预设的训练步数分别向所述参数节点发送各训练节点的神经网络参数和/或神经网络累积梯度，随后转入步骤S5；

S5、参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，以得到融合后的神经网络参数和/或神经网络累积梯度，并据其更新参数节点的神经网络参数和/或神经网络累积梯度，随后转入步骤S6；

具体地，参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，即参数节点将各训练节点的神经网络参数进行融合，从而得到融合后的神经网络参数；或者参数节点将各训练节点的神经网络累积梯度进行融合，从而得到融合后的神经网络累积梯度。

本实施例针对现有技术数据并行模式下深度神经网络分布式训练中对各训练节点的神经网络参数和/或神经网络累积梯度的处理过于简单，创造性地在各训练节点的神经网络参数和/或神经网络累积梯度的融合方式进行寻优。其中，申请人发现各训练节点的神经网络参数和/或神经网络累积梯度的最佳融合问题的实质是以各训练节点的神经网络参数和/或神经网络累积梯度作为自变量的函数空间上进行搜索，将各训练节点的神经网络参数或神经网络累积梯度设置为X₁,X₂,......,X_n,则各训练节点的神经网络参数和/或神经网络累积梯度的最佳融合问题可表示为以下形式：

由此可知，该融合问题为无穷维上的优化问题，难以求解。

在一种具体的实施方式中，如图1-3所示，所述参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，以得到融合后的神经网络参数和/或神经网络累积梯度进一步包括：

X_int＝g(X₁,X₂,......,X_n；p_i)

＝g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)，

其中，

由此可见，本申请采用有限参数化的函数描述方式，对各训练节点的神经网络参数和/或神经网络累积梯度的最佳融合问题采用有限参数化函数方式描述，从而实现可采用群体智能优化方法求解。

在一种具体的实施方式中，g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为多项式函数或三角函数。在另一种具体的实施方式中，g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为各训练节点的神经网络参数和/或神经网络累积梯度的加权求和，则该实施例的融合后的神经网络参数和/或神经网络累积梯度如下式所示：

在另一种具体的实施方式中，g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为各训练节点的神经网络参数和/或神经网络累积梯度的加权求平方和，则该实施例的融合后的神经网络参数和/或神经网络累积梯度如下式所示：

具体地，基于深度神经网络待完成的学习任务类型以及具体的问题描述，以融合后的神经网络模型和/或神经网络累积梯度作为自变量，设计适应度函数，实现对当前个体确定的融合方式所得的融合参数或累积梯度性能的评价。采用有限参数化描述后的适应度函数为：

在如上所述当g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为各训练节点的神经网络参数和/或神经网络累积梯度的加权求和的实施方式中，适应度函数如下式所示：

在应用于监督学习的实施方式中，该适应度函数可描述为采用融合后的神经网络参数和/或神经网络累积梯度更新后的深度神经网络模型在训练集和测试集上的综合表现，其中，针对监督学习模式下的评价，适应度函数仍以深度神经网络模型在训练集上的表现为核心评价指标，而测试集仅作为搜索终止等处理的判定条件；在应用于无监督学习的实施例中，该适应度函数可描述为采用融合后的神经网络参数和/或神经网络累积梯度更新后的深度神经网络模型在数据集上的进行特征提取的性能评价值；在针对深度强化学习的实施方式中，该适应度函数则为采用融合后的神经网络参数和/或神经网络累积梯度更新后的深度神经网络模型在交互环境中决策的得分。

另外，在又一种实施方式中，所述设计适应度函数，并根据所述适应度函数对融合得到的神经网络参数和/或神经网络累积梯度的性能进行评价基于分布式并行化设计实现，即将适应度评价过程根据具体算法进行分布式并行化设计，分配至多个CPU、多个进程进行分布式并行计算，充分利用CPU的计算资源，与分布式训练所采用的GPU资源共同支撑高效训练，以进一步提升搜索效率，进一步提升深度神经网络训练效率。

采用群体智能算法设计θ_i的位置演化规律及演化过程。

基于以上两点，针对神经网络参数和/或神经网络累积梯度的最优融合方式的搜索过程中群体中个体位置的演化规律及演化过程通过群体智能算法进行设计。具体地，如图3所示，在一种实施例中，所述群体智能算法为粒子群算法、人工蜂群算法或微分进化算法，也可采用自行设计或改进算法实现。在一种采用粒子群算法进行设计的实施方式中，即θ_i设计为一个例子在三维空间内的位置，通过大量迭代更新求出最优解。

在一种实施例中，所述采用群体智能算法设计θ_i的位置演化规律及演化过程基于分布式并行化设计实现。即将适应度评价过程根据具体算法进行分布式并行化设计，分配至多个CPU、多个进程进行分布式并行计算，充分利用CPU的计算资源，与分布式训练所采用的GPU资源共同支撑高效训练，以进一步提升搜索效率，进一步提升深度神经网络训练效率。

该实施方式通过在各训练节点的神经网络参数和/或神经网络累积梯度的融合方式中引入基于群体智能优化方法寻优过程，实现对各训练节点的神经网络参数和/或神经网络累积梯度的最佳融合方式的高效搜索，可在较短时间内获得较优解甚至最优解，在进一步缩短训练时长的同时，提高收敛模型的性能和训练精度。

具体地，在一种实施例中，所述模型训练终止条件为：参数节点的神经网络模型的训练精度达到预设的精度的期望值。

S8、参数节点输出其神经网络模型。

相比于现有技术中数据并行模式下采用简单平均方法的深度神经网络分布式训练方法，而且往往需要各个训练节点训练充分长的时间才能进行一次参数管理节点的参数更新，导致训练效率和模型性能不佳，本申请的实施例的训练方法首先通过每隔预设的训练步数就对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，充分利用各个训练节点的经验，更有效地更新参数节点的神经网络参数，从而进一步提升深度神经网络分布式训练的训练效率及收敛模型的性能和训练精度。同时通过在各训练节点的神经网络参数和/或神经网络累积梯度的融合方式中引入基于群体智能优化方法寻优过程，通过在有限但庞大的搜索空间内对各训练节点的神经网络参数和/或累积梯度的最佳融合方式进行高效搜索，可在较短时间内获得较优解甚至最优解，完成对多源的神经网络参数和/或累积梯度的最佳融合方式的寻优，在进一步缩短训练时长的同时，提高收敛模型的性能和训练精度。而且，该训练方法可应用于目前主流的监督学习、无监督学习或者强化学习等多种学习模式中。

同时，深度神经网络的分布式训练方法由于涉及大量的张量计算，通常用到多块GPU联合使用甚至多个配置有GPU卡的计算机联合使用，以对训练过程实现充分的计算加速。与之相配合地，适应度评价过程和个体位置演化过程都可基于分布式并行化设计实现。即根据具体算法进行分布式并行化设计，分配至多个CPU、多个进程进行分布式并行计算，充分利用CPU的计算资源，与分布式训练所采用的GPU资源共同支撑高效训练，融合众多CPU核心的算力，实现在很短时间内完成各训练节点的神经网络参数和/或神经网络累积梯度的融合方法的寻优，以削弱对于深度神经网络的分布式训练方法的训练时间的影响，进一步提升搜索效率，进一步提升深度神经网络训练效率。

本发明的一个实施例中提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的训练方法。

本发明的又一个实施例中提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述的训练方法。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.一种神经网络的训练方法，其特征在于，包括以下步骤：

S8、参数节点输出其神经网络模型。

2.根据权利要求1所述的训练方法，其特征在于，步骤S2中所述若干训练节点的神经网络参数与所述参数节点的神经网络参数设置为同步更新。

3.根据权利要求1所述的训练方法，其特征在于，所述模型训练终止条件为：参数节点的神经网络模型的训练精度达到预设的精度的期望值。

4.根据权利要求1所述的训练方法，其特征在于，所述参数节点分别对各训练节点的神经网络参数和/或神经网络累积梯度进行融合，以得到融合后的神经网络参数和/或神经网络累积梯度进一步包括：

将各训练节点的神经网络参数或神经网络累积梯度设置为X₁,X₂,....,X_n,各训练节点的神经网络参数和/或神经网络累积梯度通过以下形式进行融合：

X_int＝g(X₁,X₂,......,X_n；p_i)

＝g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)，

其中，

p_i＝[θ_1,i,θ_2,i,...,θ_m,i]^Ti∈{1,2,...,popSize}，θ_i为一个参数向量，θ_m,i为θ_i的第m维的数值，θ_m,i∈[0,1]，m为θ_i向量的维数，popSize为p_i向量的总数，g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为参数化函数，X_int为融合后的神经网络参数和/或神经网络累积梯度；

采用群体智能算法设计θ_i的位置演化规律及演化过程。

5.根据权利要求4所述的训练方法，其特征在于，所述g(X₁,X₂,......,X_n；[θ_1,i,θ_2,i,...,θ_m,i]^T)为多项式函数或三角函数。

6.根据权利要求4所述的训练方法，其特征在于，所述设计适应度函数，并根据所述适应度函数对融合得到的神经网络参数或神经网络累积梯度的性能进行评价基于分布式并行化设计实现。

7.根据权利要求4所述的训练方法，其特征在于，所述采用群体智能算法设计θ_i的位置演化规律及演化过程基于分布式并行化设计实现。

8.根据权利要求4所述的训练方法，其特征在于，所述群体智能算法为粒子群算法、人工蜂群算法或微分进化算法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8所述的训练方法。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-8所述的训练方法。