CN117094381A

CN117094381A - 一种兼顾高效通信和个性化的多模态联邦协同方法

Info

Publication number: CN117094381A
Application number: CN202311054007.7A
Authority: CN
Inventors: 胡睿晗; 王忠杰; 贺祥; 徐汉川; 于爽
Original assignee: Harbin Institute of Technology Shenzhen
Current assignee: Harbin Institute of Technology Shenzhen
Priority date: 2023-08-21
Filing date: 2023-08-21
Publication date: 2023-11-21
Anticipated expiration: 2043-08-21
Also published as: CN117094381B

Abstract

一种兼顾高效通信和个性化的多模态联邦协同方法，所述方法首先在云端构建全局模型，全局模型采用了多模态模型，可以对多模态数据进行建模，并分别初始化全局模型的权重；将全局模型参数拷贝给边缘端，构建局部模型。局部模型为一个三玩家模型，分别是全局网络，切分网络和局部网络。在模型局部更新阶段，将切分网络划分为基础层和学习层，其中基础层的参数可以通过上传上行链路的形式传送给云端全局模型；基于误差压缩的梯度输出方法，计算边缘端模型参数梯度的积累量，并对参数梯度的积累量采用信号压缩，减少需要更新的量，达到提高通信效率的目的。

Description

一种兼顾高效通信和个性化的多模态联邦协同方法

技术领域

本发明涉及一种兼顾高效通信和个性化的多模态联邦协同方法，能够应用在人工智能物联网、工业互联网、服务推荐等诸多领域，例如数字孪生和实体设备的交互、网联设备优化、微服务组件调度等，应用涉及面广。

背景技术

随着人工智能、云边协同等技术的迅速发展，无人集群系统(如AGV、无人机、无人船等)成为工业互联网数据湖的主要来源，为智能仓储、智能生产、数字孪生反馈控制等上层服务系统提供了重要支持。例如，在工业互联网领域无人集群系统控制应用中，从实体设备采集感知数据对于分析数字孪生设备、孪生-云设备的通信，以及云设备反馈控制集群系统至关重要。从宏观角度来看，无人集群系统的感知可以跨越云、边缘和端设备的层次结构。从微观逻辑角度来看，工业互联网的感知涉及到多个物理-虚拟设备的分布式计算问题。在工业领域的感知方法中，联邦学习技术因其具备在分布式计算中保护隐私的潜力而成为感知计算的重要研究方向。然而，随着采集数据的多元性和云边计算资源环境的有限性，实现多个设备的协同感知变得困难。现有研究工作在无人集群感知方案上缺乏全面考虑，例如如何平衡设备之间的通信成本、如何考虑多个硬件-虚拟设备的物理异构性问题，不利于感知方案的快速迭代优化。

现有的无人集群系统存在以下问题：1.无人集群系统往往采集多模态的信息，例如图像、声音、点云等模态信息。2.环境资源的有限性，由于计算设备算力、网络带宽等限制条件，高效的联邦学习显得尤为重要。3.设备的异构性，由于集群设备中采集数据、电气信号、通信协议和采集质量的差异，若应用相同的感知模型在集群中，将严重影响联邦学习的建模效果。

发明内容

本发明从工业互联网实际需求和应用的角度出发，提供了一种面向多模态数据的兼顾高效通信和异步训练的边云协同治理方法，可以实现工业互联网设备采集的异构数据云边协同训练和半监督学习。在工业互联网领域，面临的一个关键技术问题是在各边缘节点设备的异构性导致云端模型建模效果不佳的问题。因此，如何提高云端模型的建模效果，是本发明着重考虑的问题。其中核心的问题是数据异质性：边缘端的本地数据分布可能不同，这可能导致边云协同治理优化的困难。第二个问题是数据的多源性：各边缘端可能由多个感知传感器进行采集。第三个障碍是参数更新的高通信成本，由于参与边缘节点数量造成的模型参数通信负担问题。这些问题表明了数据治理在工业互联网应用中面临的困境。解决这些挑战需要综合考虑数据多源性、节点异质性和通信成本等因素，本发明提出相应的技术和方法来克服这些障碍。本发明着重从多模态的数据出发，采用通信的方式的压缩，设备的异步训练的方式，支撑多模态的异构数据学习。此外，本发明为了适应于实际工业互联网环境，还考虑了半监督学习的训练方式，考虑各边缘端存在无标签样本的情况。

为实现上述目的，本发明采取的技术方案如下：

一种兼顾高效通信和个性化的多模态联邦协同方法，所述方法为：

步骤一：采集多模态的视觉和声学模态数据，并采用两层全连接网络的方式，将视觉特征和声学特征进行合并构建训练多模态分类器模型；

步骤二：云边协同模型包括云端和边缘端训练的模型，即边缘端训练和云端训练更新；假设每次全局融合共需要选择K个边缘端模型，在边缘端的训练模型中，每个模型M_k，其参数为分别包括标签和无标签数据；全局模型M的参数ω_M经过各边缘端模型参数平均计算得到：

步骤三：针对各边缘端模型，为一个三玩家的模型，分别是全局网络，切分网络和局部网络；切分网络的结构由m+n层的网络实现无标签样本的预测，其中特征提取层(n层)由全局网络提供，个性化层(m层)由局部网络提供；

步骤四：为了实现半监督学习，最后聚合全局网络、切分网络和局部网络的结果的输出，为未标记的数据分配伪标签标签；利用标记和伪标记的数据，运行边缘端模型来更新参数，这些参数将被上传到云端模型以更新全局参数；三玩家模型的训练分为两个阶段，预训练阶段和伪标签学习阶段；

步骤五：针对半监督学习生成的伪标签的预测是否被信任，暨设置一个全局阈值θ，如果最大概率大于θ，既可以认为该无标签样本及其生成的伪标签可以被加入到训练集中；此外，全局阈值的设置是动态性的，随着全局迭代次数T动态变化：

其中，α是控制全局阈值的学习率；表示待上载的K个局部模型阈值的平均值，既

步骤六：提出了梯度量化的方法，通过量化反馈误差实现云端和边缘端模型的通信成本；

计算伪梯度变量Δ，计算云端模型下载到边缘端模型和各边缘端模型上载到云端模型的二范数差异，表征：

其中，参数t代表第t次全局迭代；的含义是第t次迭代的伪梯度变量；

将针对第t次伪梯度变量采取量化压缩的手段，得到/>C(.)表示量化压缩算子；

步骤七：各边缘端模型只给云端模型贡献实现提高通信效率的目的；因此云端积累的各边缘端模型的误差为：/>

各边缘端模型压缩的误差满足迭代的表示为：

其中，表示第k个模型在第t次迭代时候的压缩误差；/>表示第k个模型在第t+1次迭代时候的压缩误差；

步骤八：将所述误差积累作为梯度参数传递给云端，云端模型基于所述各边缘端上传的梯度参数进行聚合后得到的聚合模型，并将所述的聚合模型作为云端模型重新下载到边缘端模型，直至达到了迭代截止后联邦学习结束。

本发明相对于现有技术的有益效果为：在Non-IID和Streaming Non-IID的非独立同分布的异构数据下，随着通讯次数的增加，学习效果逐渐增强，证明了个性化学习的能力。

附图说明

图1为一种兼顾高效通信和个性化的多模态联邦协同方法流程图。

图2为在Non-IID数据下，通信轮数随着准确率变化的情况图；

图3为在StreamingNon-IID数据下，通信轮数随着准确率变化的情况图。

具体实施方式

下面结合附图和实施例对本发明的技术方案进行进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

如图1所示，本发明首先在云端构建全局模型，全局模型采用了多模态模型，可以对多模态数据进行建模，并分别初始化全局模型的权重；将全局模型参数拷贝给边缘端，构建局部模型。局部模型为一个三玩家模型，分别是全局网络，切分网络和局部网络。在模型局部更新阶段，将切分网络划分为基础层和学习层，其中基础层的参数可以通过上传上行链路的形式传送给云端全局模型；基于误差压缩的梯度输出方法，计算边缘端模型参数梯度的积累量，并对参数梯度的积累量采用信号压缩，减少需要更新的量，达到提高通信效率的目的。图1包括全局模型和局部模型组成。全局模型为多模态分类器模型，通过建立多层卷积模型实现图像和声学模态的联合建模；此外，全局模型将ω_M下发到各局部模型；为了实现个性化训练，在局部模型，为一个由三玩家模型，既全局网络、局部网络、切分网络组成。

具体实施方式一：本实施方式记载的是一种兼顾高效通信和个性化的多模态联邦协同方法，所述方法为：

步骤一：采集多模态的视觉和声学模态数据，并采用两层全连接网络的方式，将视觉特征和声学特征进行合并构建训练多模态分类器模型，如图1所示；

步骤三：针对各边缘端模型，为一个三玩家的模型，分别是全局网络，切分网络和局部网络；切分网络的结构由m+n层的网络实现无标签样本的预测，其中特征提取层(n层)由全局网络提供，个性化层(m层)由局部网络提供；均为个性化层(m层)和特征提取层(n层)，通过m+n层的网络实现无标签样本的预测；

其中，α是控制全局阈值的学习率；表示待上载的K个局部模型阈值的平均值，既从公式(4)可以看出，阈值θ会随着全局迭代次数的增加而逐渐降低，因为生成的伪标签质量也会随着迭代次数的增加而得到增强；

步骤六：此外，本发明还提出了梯度量化的方法，通过量化反馈误差实现云端和边缘端模型的通信成本；

本项目模型将针对第t次伪梯度变量采取量化压缩的手段，得到C(.)表示量化压缩算子；

各边缘端模型压缩的误差满足迭代的表示为：

具体实施方式二：具体实施方式一所述的一种兼顾高效通信和个性化的多模态联邦协同方法，步骤一中，视觉图像经过三层卷积网络组成的视觉特征提取算子，声学模态经过三层卷积网络组成的声学特征提取算子。

具体实施方式三：具体实施方式一所述的一种兼顾高效通信和个性化的多模态联邦协同方法，步骤四中，所述预训练阶段具体为：产生伪标签后更新边缘端模型；设计损失函数：实现伪标签质量生成的自适应学习；在每一轮通信中，边缘端从云端模型下载全局的参数，用于预训练的边缘端模型训练；之后，部分边缘端模型将参与全局聚合，将其本地模型参数上传到服务器；损失函数中，CE代表交叉熵损失函数，f代表网络模型，/>代表第k个模型下的第i个样本，/>代表第k个网络模型第i个参数，/>代表第k个模型下的第i个标签，/>是k个模型的样本个数；

所述伪标签学习阶段具体为：三玩家模型中的全局网络前n层深度神经网络专注于低维特征学习，这些特征可以在不同异构数据建模任务之间共享；此外，局部网络的后m层深度神经网络用来提取各边缘端数据的个性化特征，因此这些特征是独特的(根据步骤三，个性化层(m层)和特征提取层(n层)，这里讲的前n层深度神经网络专注于低维特征学习，就是用于特征提取，m层深度神经网络用来提取各边缘端数据的个性化特征就是个性化层)；三玩家的模型，包括全局网络的浅层参数(具有更好的泛化能力)和局部网络的深层来组成切分网络，实现个性化的训练；最后，通过统计全局网络p_g，切分网络p_s和局部网络p_l的输出概率，得到预测结果：

最后采用函数argmax(.)计算最大化概率实现伪标签类别的计算：

具体实施方式四：具体实施方式一所述的一种兼顾高效通信和个性化的多模态联邦协同方法，步骤八中，所述压缩算子为Scaled-sign压缩算子或TopK压缩算子；所述Scaled-sign压缩算子表示为符号和伸缩操作的集合：

C(ω)＝||ω||₁·sign(ω)/d (6)

其中，d表示压缩参数，||ω||₁表示参数的1范数，sign(ω)表示符号函数；

所述TopK压缩算子表示为若干基向量与参数幅度的乘积：

其中，α_i表示第i个基向量；ω_i表示第i个参数幅度。

实施例1：

整个算法模型的实施过程可以表示为：

输入：初始模型参数，压缩函数C(.)，全局迭代次数T

采集多模态的视觉和声学模态数据，训练多模态分类器模型。初始化云端模型M，参数为ω_M和边缘段模型M_k。共分为预训练和半监督学习两个阶段。第k个边缘模型的有标签样本标签/>第k个边缘模型的有标签样本/>

----------------------------预训练阶段---------------------

Fort＝1……T₁：

随机任选K个边缘端模型

云端模型下发参数ω_M给边缘端模型

For i＝1……K：

通过损失函数引导，计算三玩家模型的分数：/>得到边缘端训练后的梯度/>

计算伪梯度：

压缩伪梯度：

End for

云端模型融合各边缘端的计算误差积累

----------------------------半监督学习阶段---------------------

For t＝1……T₂：

随机任选K个边缘端模型

云端模型下发参数ω_M给边缘端模型

For i＝1……K：

计算三玩家模型的分数：得到伪标签/>得到边缘端训练后的梯度/>通过损失函数引导，/>若/>则信任伪标签/>的值。

计算伪梯度：

压缩伪梯度：

End for

云端模型融合各边缘端的计算误差积累

为了探索在半监督学习的学习效果，在不同非独立同分布(Non-IID，StreamingNon-IID)数据下，通信轮数随着准确率变化的情况，如图2和3所示。各边缘端标签数量为300、500和800。随着标签数量的递增，模型得到越快的收敛。由图2可以看出，标签量在800时，80次迭代后模型逐步收敛；标签量在500时，100次迭代后模型逐步收敛；标签量在300时，模型无法在120步迭代次数内实现收敛.实验表明边缘端标签越多，约有利于收敛；由图3可以看出，标签量在800时，80次迭代后模型逐步收敛；标签量在500时，80次迭代后模型逐步收敛；标签量在300时，80次迭代后模型逐步收敛。

Claims

1.一种兼顾高效通信和个性化的多模态联邦协同方法，其特征在于：所述方法为：

各边缘端模型压缩的误差满足迭代的表示为：

2.根据权利要求1所述的一种兼顾高效通信和个性化的多模态联邦协同方法，其特征在于：步骤一中，视觉图像经过三层卷积网络组成的视觉特征提取算子，声学模态经过三层卷积网络组成的声学特征提取算子。

3.根据权利要求1所述的一种兼顾高效通信和个性化的多模态联邦协同方法，其特征在于：步骤四中，所述预训练阶段具体为：产生伪标签后更新边缘端模型；设计损失函数：实现伪标签质量生成的自适应学习；在每一轮通信中，边缘端从云端模型下载全局的参数，用于预训练的边缘端模型训练；之后，部分边缘端模型将参与全局聚合，将其本地模型参数上传到服务器；损失函数中，CE代表交叉熵损失函数，f代表网络模型，/>代表第k个模型下的第i个样本，/>代表第k个网络模型第i个参数，代表第k个模型下的第i个标签，/>是k个模型的样本个数；

所述伪标签学习阶段具体为：三玩家模型中的全局网络前n层深度神经网络专注于低维特征学习，这些特征可以在不同异构数据建模任务之间共享；此外，局部网络的后m层深度神经网络用来提取各边缘端数据的个性化特征，因此这些特征是独特的；三玩家的模型，包括全局网络的浅层参数(具有更好的泛化能力)和局部网络的深层来组成切分网络，实现个性化的训练；最后，通过统计全局网络p_g，切分网络p_s和局部网络p_l的输出概率，得到预测结果：

4.根据权利要求1所述的一种兼顾高效通信和个性化的多模态联邦协同方法，其特征在于：步骤八中，所述压缩算子为Scaled-sign压缩算子或TopK压缩算子；所述Scaled-sign压缩算子表示为符号和伸缩操作的集合：

C(ω)＝||ω||₁·sign(ω)/d (6)

所述TopK压缩算子表示为若干基向量与参数幅度的乘积：

其中，α_i表示第i个基向量；ω_i表示第i个参数幅度。