CN111580962A

CN111580962A - 一种具有权值衰减的分布式自适应在线学习方法

Info

Publication number: CN111580962A
Application number: CN202010353941.9A
Authority: CN
Inventors: 申修宇; 李德权; 方润月
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2020-04-29
Filing date: 2020-04-29
Publication date: 2020-08-25

Abstract

本发明解决了分散网络中的一个自适应在线学习问题，其中一组学习者的目标函数是局部时变函数的和，而节点间的通信模型是一个连通的无向图。针对这一问题，首次提出了一种利用分布式优化方法和自适应策略的权值衰减分布式自适应在线梯度学习方法。该方法在图像数据集上对一个多项逻辑回归任务进行了数值实验，证实了该方法的计算优势，并与其他在线优化方法进行了比较，该方法优于其他方法。

Description

一种具有权值衰减的分布式自适应在线学习方法

技术领域

本发明涉及一种具有权值衰减的分布式自适应在线学习方法，属于数据处理领域。

背景技术

近年来，分布式优化因其在许多领域的广泛应用而受到广泛关注。与集中式优化相比，分布式优化有一个本质区别，即不需要知道整个问题结构的全部知识。这意味着每个学习者或节点只能与它们的邻居通信，没有一个节点被指定为“中心”。在这种情况下，节点共同最小化优化问题，节点之间的底层通信通常建模为无向图或有向图。

在分布式优化中，值得注意的是现有工作中的大多数成本函数是时不变的。然而，由于动态变化和不确定的环境，在许多实际场景中，目标函数是随时间而变化的。为了解决这些问题，在线优化作为一种强有力的工具，它可以有效地处理这些问题中出现的不确定性。由于对分散设置中的许多实际应用程序的兴趣，分布式版本的在线优化最近得到了广泛的关注。在分布式在线优化中，与多个体网络相关联的全局代价函数被表示为局部代价函数的和，而局部代价函数不能预先得到。本发明的目标是设计一个分布式的在线方法，在一定的时间范围内共同最小化全局成本函数。又由于权值衰减能够提高泛化性能，然而，目前针对此设计都是基于集中式场景，在分布式场景设计的很少。因此本发明在分布式场景中，设计一个具有权值衰减的在线学习方法，提高训练性能。

总结目前存在的问题：①现有的分布式自适应在线学习方法大多是针对中心网络拓扑结构设计的。这种拓扑结构的主要瓶颈在于中心节点上的通信过载，因为所有节点都需要与它并发通信。②现有的分布式在线学习方法中，未考虑权值衰减这一提高泛化性能的重要操作。

发明内容

本发明所要解决的技术问题是：提供一种具有权值衰减的分布式自适应在线学习方法，旨在解决分散式网络中在线学习问题。

为解决以上技术问题，本发明采用如下的技术方案：

首先，将分布式网络架构下的流数据处理与分析问题转化为分布式在线优化问题，考虑研究分散式网络拓扑结构，其中所有节点只能与其邻居通信，没有一个节点被指定为“中心”。其次，受权值衰减的启发，在分布式自适应在线学习中运用了权值衰减操作，提高了分布式在线学习方法的泛化性能。在此基础上，设计泛化能力强的权值衰减分布式在线学习算法，揭示算法性能和网络拓扑结构参数间的关系，实现有代表性的分布式在线学习的应用研究。该方法既能并行化数据，又能分散计算，适用于大规模机器学习问题。

附图说明

图1是本发明的方法在多项逻辑回归任务上与其它方法的对比图。

图2是本发明的方法在不同节点的网络上的测试图。

图3是本发明的方法在不同网络拓扑结构上的测试图。

具体实施方式

本发明解决在连通无向网络上的分布式在线学习问题，避免集中式场景中单个信息处理单元中的缺陷，造成中心节点通信成本过高，以及利用权值衰减操作提高该方法的数据处理效率。

具体步骤为：

Step1：揭示损失函数f_i,t(x_i,t)；

Step2：计算个体产生信息的梯度，

Step3：

在分布式网络中，通过加权平均进行个体的信息传递(Step3中的第四行)，以确保充分利用重要个体的信息。此外，该方法引入了权值衰减操作，提升了数据处理的效率。α_t是学习率，β₁,β₂,β₃∈[0,1)为衰减参数，m_i,t是学习者i在t时刻的梯度的一阶动量估计，v_i,t是学习者i在t时刻的梯度的二阶动量估计，λ∈(0,1)是权值衰减参数，W为双随机矩阵。

以下结合附图对本发明作进一步的说明。

图1是本发明的方法在多项逻辑回归任务上与其它方法的对比图。考虑在线分布式学习环境：解决机器学习中流行的多项逻辑回归问题，对于MNIST图像数据集，测试结果如图1所示。可以看出，本发明提出的方法优于其他已存在的方法。图1还显示了该方法的收敛速度在开始时明显快于其他方法。

图2是本发明的方法在不同节点的网络上的测试图。在实际数据集上进行了实验，结果令人满意。从图2可以看出，在较大的网络上，其成本的下降速度比在较小的网络上要慢。

图3是本发明的方法在不同网络拓扑结构上的测试图。测试采用了Complete完全图以及ER随机图两种网络拓扑结构，并采用了著名的MNIST数据集，结果令人满意。

Claims

1.一种具有权值衰减的分布式自适应在线学习方法，其特征在于:网络拓扑的自适应性，分布式网络中所有节点只能与其邻居通信，没有一个节点被指定为“中心”。并且受权重衰减的启发，在分布式自适应在线学习中使用了权重衰减操作，提升训练性能。

2.根据权利要求1所述的分布式网络中所有节点只能与其邻居通信，没有一个节点被指定为“中心”。其特征在于：在分布式在线学习中，每个节点代表一个学习者，在每轮迭代中，学习者产生决策信息，相互独立提交决策信息并获得相应的成本函数。

3.根据权利要求1阐述的受权重衰减的启发，在分布式自适应在线学习中使用了权重衰减，加速训练过程。其特征在于：在训练过程中实施权重衰减操作，提升了算法的性能，加速训练过程。