CN114648092A

CN114648092A - 一种个性化联邦学习加速方法、装置

Info

Publication number: CN114648092A
Application number: CN202011512260.9A
Authority: CN
Inventors: 伍泰霖; 高希彤; 林彦颖; 叶可江; 须成忠
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2020-12-19
Filing date: 2020-12-19
Publication date: 2022-06-21
Also published as: WO2022126706A1

Abstract

本发明适用人工智能的机器学习技术领域，提供了一种个性化联邦学习加速方法、装置；该方法在联邦学习中使用服务节点服务器模型的信息，训练出元自动剪枝网络，接着将元自动剪枝网络下发到子节点，用子节点的数据进行再训练，生成个性化网络权值，同时对由网络模型每层信道数量构成的编码向量进行迭代优化以加速提高个性化网络权值的准确性；最终在子节点进行压缩加速后的网络满足各种个性化场景下的约束条件；采用该方法的装置也具有同样的技术效果。

Description

一种个性化联邦学习加速方法、装置

技术领域

本发明属于人工智能中的机器学习技术领域，尤其涉及一种个性化联邦学习加速方法、装置。

背景技术

2017年，谷歌利用联邦学习解决移动设备在本地更新模型的问题。之后，联邦学习被推广至医疗、金融等领域。由于这些场景下的数据更加敏感和隐私，联邦学习提出在保障数据交换时安全和隐私的前提下，利用多个计算节点进行模型更新。其具体做法是在一个公共节点上建立一个虚拟的初始模型，其他节点在不违反隐私法规的情况下向该节点更新参数，最终的结果是该虚拟模型将全部的数据聚合在一起形成最优模型。

然而，现有的联邦学习的优化方法只是局限于服务节点和子节点的通信效率上进行探索，以至于联邦学习模型的训练和执行的计算效率偏低。

发明内容

本发明的目的在于提供个性化联邦学习加速方法、装置，旨在通过对模型的剪裁解决联邦学习模型的训练和执行的计算效率偏低的问题。

一方面，本发明提供了一种个性化联邦学习加速方法，所述方法包括下述步骤：

S1.使用服务节点将各子节点更新的初始模型统一为聚合模型，通过所述聚合模型的编码向量，训练出由两个全连接层组成的元自动剪枝网络；

S2.将所述元自动剪枝网络下发到各所述子节点，输入所述聚合模型的编码向量和所述子节点的个性化小样本数据进行矩阵剪裁；

S3.以生成的权值矩阵构造加速网络模型；

S4.在硬约束条件下，对随机选取的编码向量所对应的所述加速网络模型的准确率进行评价和排序；

S5.选择准确率高于阈值的所述加速网络模型所对应的编码向量进行突变和/或交叉繁衍，生成新编码向量；

S6.消除准确率不合格的所述新编码向量后判断剩余的所述新编码向量所达到的准确率是否符合要求，若不符合，重复步骤S4至S6；

S7.若所述新编码向量符合要求，则以所述新编码向量构造新的加速网络模型。

另一方面，本发明还提供了一种个性化联邦学习加速装置，所述装置包括：

元自动剪枝网络单元，用于使用服务节点聚合模型的编码向量，训练出由两个全连接层组成的元自动剪枝网络；将所述元自动剪枝网络下发到子节点，输入所述聚合模型的编码向量和子节点的个性化小样本数据进行矩阵剪裁，生成的权值矩阵构造加速网络模型；

加速网络单元，用于在硬约束条件下，对随机选取的编码向量所对应的所述加速网络模型的准确率进行评价和排序；选择准确率高于阈值的所述加速网络模型所对应的编码向量进行突变和/或交叉繁衍，生成新编码向量；进而消除准确率不合格的所述新编码向量后判断剩余的所述新编码向量所达到的准确率是否符合要求，若不符合，重复上述步骤；若所述新编码向量符合要求，则以所述新编码向量构造新的加速网络模型。

本发明的方法和装置可以通过对模型的自动剪枝和在元自动剪枝网络训练完成后对编码向量的迭代优化来加速准确率高的模型构建，以此实现对神经网络模型进行加速，已达到对整体的个性化联邦学习加速的效率提高和提高子节点在个性化场景任务算法模型的执行效率。

附图说明

图1是本发明实施例一提供的个性化联邦学习加速方法的实现流程图；

图2是本发明实施例二提供的个性化联邦学习加速装置的功能结构框图；

图3是本发明实施例一提供的个性化联邦学习加速方法的流程示意图；

图4是本发明实施例一提供的个性化联邦学习加速方法的总体流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图1-3及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1、3、4示出了本发明实施例一提供的个性化联邦学习加速方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

一种个性化联邦学习加速方法，所述方法包括下述步骤：

S1.使用服务节点将各子节点根据自身本地数据库更新的初始模型统一为聚合模型；通过所述聚合模型的编码向量，训练出由两个全连接层组成的元自动剪枝网络；

S2.将所述元自动剪枝网络下发到各所述子节点，输入所述聚合模型的编码向量和所述子节点的个性化小样本数据(即附图4中的个性化数据)进行矩阵剪裁；

S3.以生成的权值矩阵构造加速网络模型(即附图4中的加速模型)；

在前向传递过程中，元自动剪枝网络使用服务节点聚合模型的编码向量(即网络模型每层信道的数量)为输入，还加入了子节点的个性化数据(附图3中未示出，请参见附图4)，输出为生成的子节点的加速后个性化网络模型(加速网络模型)的权值矩阵。子节点的加速网络模型结构由每层的输出通道宽度所构成。该输出通道的宽度等于服务节点聚合网络模型的编码向量中的元素值。

将元自动剪枝网络生成的权值矩阵进行裁剪后，以匹配子节点加速网络模型中输入和输出通道的数量。接着给定的一小批输入图像，我们可以用生成的权值来计算加速后个性化模型的损失函数。

在逆向过程中，本发明采用计算元自动剪枝网络中的梯度和权值，而非现有技术中直接更新元自动剪枝网络中的权值方式。因为在元自动剪枝网络的全连接的输出层和加速网络的前卷积层的输出之间的重塑和卷积操作都是可微的，所以元自动剪枝网络的权重的梯度可以很容易地用链式法则计算。

简单而言，在元自动剪枝网络训练完成后，将聚合网络的编码向量和个性化数据输入元自动剪枝网络中，生成相应的加速网络的权值矩阵，并对验证数据进行评估，即可获得每个潜在加速网络的剪枝精度。

由于网络编码向量的数量很大，我们无法用枚举法进行比较搜寻。因此，我们采用了一种进化算法，这种方法可以很容易地在满足个性化场景数据的软约束和硬约束条件下，找到最终加速网络需要的权值。

S5.选择准确率高于阈值的加速网络模型所对应的编码向量进行突变和/或交叉繁衍，生成新编码向量；

S6.消除准确率不合格的新编码向量后判断剩余的新编码向量所达到的准确率是否符合要求，若不符合，重复步骤S4至S6；

S7.若新编码向量符合要求，则以新编码向量构造新的加速网络模型。

其中，编码向量所对应的所述加速网络模型的准确率需要根据实际情况进行具体设定，其符合要求的新编码向量使得其对应的加速网络模型所达到的准确率必须高于准确率的合格线(合格值)，以实现在加速网络运行的基础上对运行准确率的提升。

优选的，在步骤S3中，通过随机结构抽样在每次迭代中随机选择一层的信道数量，生成编码向量；根据不同的编码向量去构造出不同的加速网络，并利用元自动剪枝网络的输出给出其相应的权值矩阵。

优选的，在步骤S1中，所述元自动剪枝网络定义为：

表达式的参数中，X是加速前的网络模型；c是网络模型的信道宽度；c1,c2,……,cj是神经网络模型中信道宽度构成的编码向量；j是一个表示数量的字母代号，表示从1到J个；L是Loss function的简写，表达的意思是损失函数，是元自动剪枝网络中一种用来训练网络的目标函数；训练后的模型算得的损失函数越小，则越接近环境中需要的模型；w是权重，即元自动剪枝网络中各个神经元函数的加权；

表示保证在子节点个性化再训练后精度损失最小时的所有信道宽度；D是加权，s.t.D<constraint是表示使神经网络中各个神经元函数的加权D满足一定计算量和延迟约束。

优选的，步骤S5中，突变为：随机改变编码向量中各个向量元素的数字比例。

优选的，步骤S5中，交叉为随机重组两个或两个以上的编码向量，以产生一个子代编码向量。

优选的，在所述子节点的加速网络模型结构由元自动剪枝网络中每层所述全连接层输出的编码向量所构成，所述编码向量等于所述服务节点的所述聚合模型的编码向量中的元素值。

如前所述，为了训练元自动剪枝网络，本发明还提出了随机结构抽样。在模型训练阶段(步骤S2)，在每次迭代中随机选择每一层的信道数量，生成权值矩阵。根据不同的权值矩阵去生成构造出不同的加速网络，并利用元自动剪枝网络的输出给出其相应的权值。通过随机训练不同的编码向量，元自动剪枝网络学会了为不同环境下的加速网络去预测合理的权值矩阵。

实施例二：

图2示出了本发明实施例一提供的个性化联邦学习加速装置的功能示意图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

一种个性化联邦学习加速装置，所述装置包括：

加速网络单元，用于在硬约束条件下，对随机选取的编码向量所对应的所述加速网络模型的准确率进行评价和排序；选择准确率高于阈值的加速网络模型所对应的编码向量进行突变和/或交叉繁衍，生成新编码向量；进而消除准确率不合格的新编码向量后判断剩余的新编码向量所达到的准确率是否符合要求，若不符合，重复上述步骤；若新编码向量符合要求，则以新编码向量构造新的加速网络模型。

优选的，元自动剪枝网络单元包括：

迭代模块，用于通过随机结构抽样在每次迭代中随机选择一层的信道数量，生成编码向量；根据不同的编码向量去构造出不同的加速网络，并利用元自动剪枝网络的输出给出其相应的权值矩阵。

优选的，加速网络单元包括：

突变模块，用于随机改变编码向量中各个向量元素的数字比例。

优选的，加速网络单元还包括：

交叉模块，用于随机重组两个或两个以上的编码向量，以产生一个子代编码向量。

加速网络单元在元自动剪枝网络训练完成后对准确性较高的模型权重的搜索进行压缩加速，达到模型执行加速且保持个性化场景下的运行准确程度。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种个性化联邦学习加速方法，其特征在于，所述方法包括下述步骤：

S3.以生成的权值矩阵构造加速网络模型；

2.如权利要求1所述的方法，其特征在于，在步骤S3中，通过随机结构抽样在每次迭代中随机选择一层的信道数量，生成编码向量；根据不同的编码向量去构造出不同的加速网络，并利用元自动剪枝网络的输出给出其相应的权值矩阵。

3.如权利要求1所述的方法，其特征在于，在步骤S1中，所述元自动剪枝网络定义为：

其中，X是加速前的网络模型；c是网络模型的信道宽度；c1,c2,……,cj是神经网络模型中信道宽度构成的编码向量；j是一个表示数量的字母代号，表示从1到J个；L是Lossfunction的简写，表达的意思是损失函数，是元自动剪枝网络中一种用来训练网络的目标函数；训练后的模型算得的损失函数越小，则越接近环境中需要的模型；w是权重，即元自动剪枝网络中各个神经元函数的加权；

4.如权利要求1所述的方法，其特征在于，所述步骤S5中，所述突变为：随机改变编码向量中各个向量元素的数字比例。

5.如权利要求1所述的方法，其特征在于，所述步骤S5中，所述交叉为随机重组两个编码向量，以产生一个子代编码向量。

6.如权利要求1所述的方法，其特征在于，所述子节点的加速网络模型结构由元自动剪枝网络中每层所述全连接层输出的编码向量所构成，所述编码向量等于所述服务节点的所述聚合模型的编码向量中的元素值。

7.一种个性化联邦学习加速装置，其特征在于，所述装置包括：

8.如权利要求7所述的装置，其特征在于，所述元自动剪枝网络单元包括：

9.如权利要求7所述的装置，其特征在于，所述加速网络单元包括：

10.如权利要求7所述的装置，其特征在于，所述加速网络单元还包括：

交叉模块，用于随机重组两个编码向量，以产生一个子代编码向量。