CN113159331B

CN113159331B - 一种网络化机器学习系统的自适应稀疏度量化方法

Info

Publication number: CN113159331B
Application number: CN202110564356.8A
Authority: CN
Inventors: 衣鹏; 洪奕光; 雷金龙; 李莉; 陈杰; 梁舒; 李修贤; 马晓宇
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2021-05-24
Filing date: 2021-05-24
Publication date: 2023-06-30
Anticipated expiration: 2041-05-24
Also published as: CN113159331A

Abstract

本发明公开了一种网络化机器学习系统的自适应稀疏度量化方法，应用于网络化机器学习系统的智能体，其包括：在当前时间步，某个智能体与目标智能体交换通信信息过程中，采用随机稀疏器对通信信息稀疏化；该智能体计算上一时间步其通信信息与目标智能体的通信信息之间的差异，并采用与该差异负相关的稀疏度作为当前时间步所述随机稀疏器所采用的稀疏度。对随机稀疏器所采用的稀疏度进行自适应调节，可以在确保通信质量的同时，尽量降低通信成本。

Description

一种网络化机器学习系统的自适应稀疏度量化方法

技术领域

本发明涉及计算机技术领域，具体涉及一种网络化机器学习系统的自适应稀疏度量化方法。

背景技术

近年来，随着机器学习中数据的爆炸式增长，单个计算机的存储容量已很难满足要求，且提高单机计算性能的方法成本太高，网络化系统机器学习被越来越多地应用。网络化系统包含多个具有感知、计算和通信功能的智能体，网络结构如附图1所示，图中圆点代表智能体，直线代表通信链路，该网络没有中心节点。每个智能体只存储部分数据，它们通过局部计算并将计算结果与各自的邻居通信，训练机器学习的模型。网络化系统机器学习仅依赖于智能体的局部数据、局部计算和局部通信，该方法因其自主性、鲁棒性和可扩展性比传统的集中式方法更为合理高效。

但是，网络化系统机器学习的性能常常会受到通信的影响。在实际应用中，智能体通信模块的带宽和耗电量常常是有限制的，因此智能体通信时发送的数据量也受到限制，这就需要设计高效的通信机制，在使用尽量少的通信成本的情况下，使网络化系统机器学习拥有不错的性能表现。

目前，网络化系统机器学习中的通信高效机制主要有固定量化和随机稀疏两种方法，固定量化就是引入量化器，将通信信息中的元素量化成固定点，降低通信信息的精度，达到降低通信成本的目的；随机稀疏方法是将通信信息中较小的元素稀疏为0，只传输主要信息，忽略次要信息，从而减少通信成本。

但以上方法都是开环的，要根据具体问题调节参数，费时费力，不具有普适性。我们希望开发一种具有自主调节能力的高效通信机制。

发明内容

本发明的目的是根据上述现有技术的不足之处，提供一种网络化机器学习系统的自适应稀疏度量化方法，其通过采用自适应稀疏度量化方法，实现了降低网络化系统机器学习中的通信成本的目的。

本发明目的实现由以下技术方案完成：

一种网络化机器学习系统的自适应稀疏度量化方法，应用于网络化机器学习系统的智能体，在当前时间步，某个智能体与目标智能体交换通信信息过程中，采用随机稀疏器对通信信息进行稀疏化；该智能体计算上一时间步其通信信息与目标智能体的通信信息之间的差异，并采用与该差异负相关的稀疏度作为当前时间步所述随机稀疏器所采用的稀疏度。

本发明的进一步改进在于：所述智能体确定当前时间步的稀疏度s_ij(t+1)的表达式为：

其中：a,b为常数，x_i(t)为上一时间步所述智能体的通信信息；x_j(t)为上一时间步目标智能体的通信信息；||x_i(t)-x_j(t)||₂表示所述智能体与目标智能体的通信信息的差值的2范数，用于衡量两者的差异。

本发明的进一步改进在于：当前时间步的稀疏度s_ij(t+1)的计算结果大于1时，令稀疏度s_ij(t+1)等于为1-Δ，其中Δ的取值范围为0.01≤Δ≤0.1。

本发明的进一步改进在于：参数a的大小与网络化机器学习系统的收敛速度负相关。

本发明的进一步改进在于：参数a以及b的取值范围均为(0,1]。

本发明的进一步改进在于：网络化机器学习系统运行的算法为QDGD算法。

本发明的进一步改进在于：所述通信信息包括梯度向量。

本发明的优点是：对随机稀疏器所采用的稀疏度进行自适应调节，可以在确保通信质量的同时，尽量降低通信成本，还可以使用更少的通信成本达到更快的收敛速度。

附图说明

图1为网络化机器学习系统中智能体之间的网络结构示意图；

图2为自适应动态量化仿真过程中优化精度随迭代次数的变化曲线；

图3为自适应动态量化仿真过程中优化精度随通信成本的变化曲线。

具体实施方式

以下结合附图通过实施例对本发明的特征及其它相关特征作进一步详细说明，以便于同行业技术人员的理解：

实施例：本发明的实施例包括一种网络化机器学习系统的自适应稀疏度量化方法，应用于网络化机器学习系统的智能体。如图1所示，网络化机器学习系统包括多个智能体，图1中每个点表示一个智能体，每条边表示一个通信链路，每条边连接的两个智能体可以相互之间进行通信。智能体为计算机、传感器、无人机等具有计算和通信能力的实体。在网络化机器学习系统中按照预定间隔(时间步)，相邻的(通过通信链路连接的)智能体之间交换通信信息。在一些具体实施例中，通信信息包括机器学习训练过程中的梯度向量、梯度矩阵等信息。

在交换通信信息的过程中，接收通信信息的智能体被称为目标智能体。在当前时间步，某个智能体与目标智能体交换通信信息过程中，采用随机稀疏器对通信信息进行稀疏化。

随机稀疏器Q(·)为一种将通信信息x＝[x₁,…,x_d]^T无偏稀疏化的计算方法。每一个数据x_i有p_i的概率稀疏为0，有1-p_i的概率被保留为x_i/(1-p_i)，即P(x_i＝0)＝p_i,P(x_i＝x_i/(1-p_i))＝1-p_i。稀疏化后数据信息的期望

且有有界的方差，即

概率p_i的计算方法为：

输入：

|x₁|＞|x₂|＞…＞|x_d|；稀疏度0<s<1。

初始化：

本实施例中，对随机稀疏器所采用的稀疏度(概率p_i)进行自适应调节，以便在确保通信质量的同时，尽量降低通信成本，并提高系统的性能。稀疏度的调节方式为：发起交换的智能体计算上一时间步其通信信息与目标智能体的通信信息之间的差异，并采用与该差异负相关的稀疏度作为当前时间步随机稀疏器所采用的稀疏度。

上述调节过程的原理为：若上一时间步发起交换的智能体i和目标智能体j的通信信息接近，表示本时间步二者可采用更大稀疏度，使得智能体i发出的通信信息较上一时间步更加稀疏，以降低通信成本。反之，若差异较大，则减小智能体i的稀疏度，保留更多的信息。采用这种方式，使得智能体与各相邻的智能体在交换通信信息的过程中采用各自的稀疏度，从而实现稀疏度的自适应量化。

在一个具体实施例中，发起交换的智能体确定当前时间步的稀疏度s_ij(t+1)的表达式为：

其中：a,b为常数，x_i(t)为上一时间步发起交换的智能体的通信信息；x_j(t)为上一时间步目标智能体的通信信息；||x_i(t)-x_j(t)||₂表示发起交换的智能体与目标智能体的通信信息的差值的2范数，用于衡量两者的差异。

此外，当前时间步的稀疏度s_ij(t+1)的计算结果大于1时，令稀疏度s_ij(t+1)等于为1-Δ，其中Δ的取值范围为0.01≤Δ≤0.1。

上述计算过程中，参数a的大小与网络化机器学习系统的收敛速度负相关。参数b不变时，a越小，收敛越快，a越大，收敛越慢。参数b是通信信息差异的缩放比例。参数a以及b的取值范围均为(0,1]。

如图1至3所示，在一个具体实施例中网络化机器学习系统的运行的算法为QDGD算法。我们以该算法为例，将本实施例的自适应稀疏度量化方法与固定稀疏度的方法作对比。该算法中，用x_i(t)表示发起交换的智能体i在t时刻的通信信息，z_i(t)＝Q(x_i(t))表示x_i(t)通过随机稀疏器处理后的值，成为量化值，

表示智能体i的相邻的集合。QDGD算法的迭代过程为：

其中ε,α表示步长，混合权重

我们使用的网络拓扑为完全图，即每个智能体的连通度为n-1，智能体个数n＝4，数据集为理想数据集，数据维数是30，自适应动态量化中稀疏度计算公式为

将其与固定稀疏度s＝0,0.4,0.6,0.8作对比，步长α＝ε＝0.02/t^0.25。实验总共跑10轮，每轮迭代10000次，收敛结果是10轮的平均值，结果如图2所示。

图2、3中纵坐标为优化精度

图2为优化精度随时间的收敛曲线，图3是优化精度随通信成本的变化曲线，这里通信成本的计算方式是所有智能体通信的非零元素的个数的平均值，可用如下公式表示：

其中Φ(z_ij(t))表示智能体i向智能体j通信时发送的梯度向量中非零元素的个数。

从图2和图3,可以看到，在本实验采用的步长条件下，自适应动态量化方法可以使用更少的通信成本达到更快的收敛速度。

以上的本发明实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种网络化机器学习系统的自适应稀疏度量化方法，应用于网络化机器学习系统的智能体，其特征在于：在当前时间步，某个智能体与目标智能体交换通信信息过程中，采用随机稀疏器对通信信息稀疏化；该智能体计算上一时间步其通信信息与目标智能体的通信信息之间的差异，并采用与该差异负相关的稀疏度作为当前时间步所述随机稀疏器所采用的稀疏度；通信信息包括机器学习训练过程中的梯度向量、梯度矩阵；

所述智能体确定当前时间步的稀疏度s_ij(t+1)的表达式为：

2.根据权利要求1所述的一种网络化机器学习系统的自适应稀疏度量化方法，其特征在于：当前时间步的稀疏度s_ij(t+1)的计算结果大于1时，令稀疏度s_ij(t+1)等于为1-Δ，其中Δ的取值范围为0.01≤Δ≤0.1。

3.根据权利要求1所述的一种网络化机器学习系统的自适应稀疏度量化方法，其特征在于：参数a的大小与网络化机器学习系统的收敛速度负相关。

4.根据权利要求1所述的一种网络化机器学习系统的自适应稀疏度量化方法，其特征在于：参数a以及b的取值范围均为(0,1]。

5.根据权利要求1所述的一种网络化机器学习系统的自适应稀疏度量化方法，其特征在于：网络化机器学习系统运行的算法为QDGD算法。