WO2021179196A1

WO2021179196A1 - 一种基于联邦学习的模型训练方法、电子设备及存储介质

Info

Publication number: WO2021179196A1
Application number: PCT/CN2020/078721
Authority: WO
Inventors: 田文强; 沈嘉
Original assignee: Oppo广东移动通信有限公司
Priority date: 2020-03-11
Filing date: 2020-03-11
Publication date: 2021-09-16
Also published as: CN115280338A

Abstract

一种基于联邦学习的模型训练方法，包括：子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息（S201）；所述模型参数和所述权重信息用于主节点设备训练全局模型。还公开了另一种基于联邦学习的模型训练方法、电子设备及存储介质。

Description

一种基于联邦学习的模型训练方法、电子设备及存储介质

技术领域

本申请涉及无线通信技术领域，尤其涉及一种基于联邦学习的模型训练方法、电子设备及存储介质。

背景技术

基于联邦学习进行模型训练时，主节点设备如何基于子节点上报的局部模型训练全局模型时，如何获取高性能的全局模型尚未被明确。

发明内容

本申请实施例提供一种基于联邦学习的模型训练方法、电子设备及存储介质，能够训练得到高性能的全局模型。

第一方面，本申请实施例提供一种基于联邦学习的模型训练方法，包括：子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息；所述模型参数和所述权重信息用于主节点设备训练全局模型。

第二方面，本申请实施例提供一种基于联邦学习的模型训练方法，包括：主节点设备接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息；所述主节点设备基于所述模型参数和所述权重信息，训练全局模型。

第三方面，本申请实施例提供一种子节点设备，所述子节点设备包括：

第一发送单元，配置为发送局部模型的模型参数和所述局部模型对应的权重信息；所述模型参数和所述权重信息用于主节点设备训练全局模型。

第四方面，本申请实施例提供一种主节点设备，所述主节点设备包括：

第一接收单元，配置为接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息；处理单元，配置为基于所述模型参数和所述权重信息，训练全局模型。

第五方面，本申请实施例提供一种子节点设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述子节点设备执行的基于联邦学习的模型训练方法的步骤。

第六方面，本申请实施例提供一种主节点设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述主节点设备执行的基于联邦学习的模型训练方法的步骤。

第七方面，本申请实施例提供一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行上述子节点设备执行的基于联邦学习的模型训练方法。

第八方面，本申请实施例提供一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行上述主节点设备执行的基于联邦学习的模型训练方法。

第九方面，本申请实施例提供一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现上述子节点设备执行的基于联邦学习的模型训练方法。

第十方面，本申请实施例提供一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现上述主节点设备执行的基于联邦学习的模型训练方法。

第十一方面，本申请实施例提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述子节点设备执行的基于联邦学习的模型训练方法。

第十二方面，本申请实施例提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述主节点设备执行的基于联邦学习的模型训练方法。

第十三方面，本申请实施例提供一种计算机程序，所述计算机程序使得计算机执行上述子节点设备执行的基于联邦学习的模型训练方法。

第十四方面，本申请实施例提供一种计算机程序，所述计算机程序使得计算机执行上述主节点设备执行的基于联邦学习的模型训练方法。

本申请实施例提供的基于联邦学习的模型训练方法、电子设备及存储介质，包括：子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息；所述模型参数和所述权重信息用于主节点设备训练全局模型。如此，通过子节点设备向主节点设备上报局部模型对应的权重信息，使得主节点设备能够基于不同的局部模型的权重信息训练全局模型；使得全局模型能够反映局部模型所代表的训练数据的特征，能够保证主节点设备利用各子节点设备上报的局部模型训练全局模型时，全局模型的性能不受低可靠度的局部模型影响。

附图说明

图1为本申请简单的神经网络模型的基本结构示意图；

图2为本申请深度神经网络模型的基本结构示意图；

图3a为本申请神经网络模型的训练过程示意图；

图3b为本申请神经网络模型的推理过程示意图；

图4为本申请基于联邦学习的神经网络模型的训练过程示意图；

图5为本申请实施例通信系统的组成结构示意图；

图6为本申请实施例基于联邦学习的模型训练方法的一种可选处理流程示意图；

图7为本申请实施例基于联邦学习的模型训练方法的另一种可选处理流程示意图；

图8为本申请实施例基于联邦学习的模型训练方法的一种详细处理流程示意图；

图9为本申请实施例基于联邦学习的模型训练方法的另一种详细处理流程示意图；

图10为本申请实施例子节点设备的一种可选组成结构示意图；

图11为本申请实施例主节点设备的一种可选组成结构示意图；

图12为本申请实施例电子设备的硬件组成结构示意图。

具体实施方式

为了能够更加详尽地了解本申请实施例的特点和技术内容，下面结合附图对本申请实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本申请实施例。

在对本申请实施例进行详细描述之前，对人工智能进行简要说明。

人工智能已经成为人们解决问题、处理问题的新路径。其中，基于神经网络的人工智能具有广泛的应用。一个简单的神经网络模型的基本结构如图1所示，包括：输入层，隐藏层和输出层；其中，输入层用于接收数据，隐藏层用于对数据进行处理，输出层用于产生神经网络模型的计算结果。

随着对神经网络模型研究的不断发展，又提出了神经网络深度学习算法，深度神经网络模型的基本结构如图2所示，深度神经网络模型包括多个隐藏层，包括多个隐藏层的深度神经网络模型能够极大地提高对数据的处理能力，在模式识别、信号处理、优化组合以及异常探测等方面被广泛应用。

神经网络模型的应用包括训练阶段和推理阶段两个过程。在训练阶段，首先需要获得大量的数据作为训练集合(也称为样本集合)，将训练集合作为待训练的神经网络模型的输入数据，并基于特定的训练算法，通过大量的训练和参数迭代，确定待训练的神经网络模型的待确定参数，如此便完成了神经网络模型的训练过程，得到一个训练好的神经网络模型。例如可通过大量的图片训练一个识别小狗的神经网络模型，如图3a所示。对于一个神经网络来说，当神经网络模型训练完毕之后，便可以应用训练好的神经网络模型进行识别、分类、信息恢复等推理或验证操作，这一过程称之为神经网络模型的推理过程。例如可通过训练好的神经网络模型识别出图像中的小狗，如图3b所示。

神经网络模型训练的一种方式是“联邦学习”，其特征是在神经网络模型的训练过程中，训练集合分布在各个子节点设备上。基于联邦学习的神经网络模型的训练过程如图4所示，包括三个步骤，首先，各个子节点生成本地局部神经网络模型后，将本地神经网络模型上传至主节点设备；其次，主节点设备科根据获得的全部本地局部神经网络模型合成当前全局神经网络模型，并将全局神经网络模型传输至各个子节点设备。最后，子节点设备继续使用新的全局神经网络模型进行下一次训练迭代；在主节点设备和多个子节点设备的协作下完成神经网络模型的训练。

但是，在基于联邦学习的全局神经网络模型训练的过程中，可能会存在如下问题：

1、根据实际环境不同，不同的子节点设备在能够获得的训练集合可能不同；如训练结合的数量不同和/或训练集合的类别不同。

例如，当A用户有1000个数据作为训练集，B用户有10个数据作为训练集时，A用户和B用户确定的局部模型不应该当作同等可信程度的局部模型同等处理。

再例如：当A用户有1000个数据，且1000个数据都属于一类数据；B用户有1000个数据，但1000个数据属于不同类别的数据。在该场景下，A用户和B用户的训练集合中的数据数量虽然相同，但是训练集合所反映的样本信息是不同的；B用户的训练集合能反映出更多类别的样本信息，B用户对应的局部模型的泛化能力也会较A用户对应的局部模型的泛化能力强。

2、根据实际环境不同，不同的子节点设备利用训练集合获得局部模型的方式可能不同。

例如：A用户训练局部模型时用200个数据作为一批训练数据处理，并用这一批训练数据更新局部模型参数，完成一次局部模型的训练。B用户训练局部模型时用1000个训练数据作为一批训练数据处理，并用这一批训练数据更新局部模型参数，完成一次局部模型的训练。该场景下，B用户单次局部模型训练所使用的训练数据相比于A用户单次局部模型训练所使用的训练数据多；相应地，B用户所对应的单次局部模型相比于A用户所对应的单次局部模型代表了更多训练集合信息。

3、不同节点对应的信道情况和传输能力在实际环境下是不同的。

例如：A用户和B用户训练局部模型时都使用200个训练数据作为一批处理，并A用户和B用户分别更新自身的局部模型参数，完成一次局部模型的训练。在上述条件的基础上，A用户所处的信道环境较差，传输速率较低，A用户无法实现每次本地局部模型训练完成后，都将更新的局部模型参数上报至主节点设备；如A用户在本地做10次局部模型参数更新后传输一次局部模型参数至主节点。B用户所处的信道环境条件较A用户好，能支持相对较高的传输速率，B用户在本地做2次局部模型参数更新后传输一次局部模型参数至主节点设备。该场景下，A用户传输至主节点设备的局部模型参数与B用户传输至主节点设备的局部模型参数代表了不同的局部模型训练次数的信息，也可以理解为对应了不同大小的训练集合信息。

综上，由于训练集合的特征、确定局部模型的方式以及无线传输条件等因素的影响，在联邦学习的过程中可能存在不同的子节点设备生成的局部模型所对应的权重不同的情况；在该场景下，如果一个局部模型A的训练数据少于局部模型B的训练数据，如利用同等对待的策略将局部模型A和局部模型B合并为一个全局模型，则会造成全局模型训练结果受小规模训练数据的影响过大的问题，从而全局模型的性能。

针对上述问题，本申请实施例提供一种基于联邦学习的模型训练方法，本申请实施例的技术方案可以应用于各种通信系统，例如：全球移动通讯(global system of mobile communication，GSM)系统、码分多址(code division multiple access，CDMA)系统、宽带码分多址(wideband code division multiple access，WCDMA)系统、通用分组无线业务(general packet radio service，GPRS)、长期演进(long term evolution，LTE)系统、LTE频分双工(frequency division duplex，FDD)系统、LTE 时分双工(time division duplex，TDD)系统、先进的长期演进(advanced long term evolution，LTE-A)系统、新无线(new radio，NR)系统、NR系统的演进系统、非授权频段上的LTE(LTE-based access to unlicensed spectrum，LTE-U)系统、非授权频段上的NR(NR-based access to unlicensed spectrum，NR-U)系统、通用移动通信系统(universal mobile telecommunication system，UMTS)、全球互联微波接入(worldwide interoperability for microwave access，WiMAX)通信系统、无线局域网(wireless local area networks，WLAN)、无线保真(wireless fidelity，WiFi)、下一代通信系统或其他通信系统等。

本申请实施例描述的系统架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着网络架构的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请实施例中涉及的网络设备，可以是普通的基站(如NodeB或eNB或者gNB)、新无线控制器(new radio controller，NR controller)、集中式网元(centralized unit)、新无线基站、射频拉远模块、微基站、中继(relay)、分布式网元(distributed unit)、接收点(transmission reception point，TRP)、传输点(transmission point，TP)或者任何其它设备。本申请的实施例对网络设备所采用的具体技术和具体设备形态不做限定。为方便描述，本申请所有实施例中，上述为终端设备提供无线通信功能的装置统称为网络设备。

在本申请实施例中，终端设备可以是任意的终端，比如，终端设备可以是机器类通信的用户设备。也就是说，该终端设备也可称之为用户设备UE、移动台(mobile station，MS)、移动终端(mobile terminal)、终端(terminal)等，该终端设备可以经无线接入网(radio access network，RAN)与一个或多个核心网进行通信，例如，终端设备可以是移动电话(或称为“蜂窝”电话)、具有移动终端的计算机等，例如，终端设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语言和/或数据。本申请实施例中不做具体限定。

可选的，网络设备和终端设备可以部署在陆地上，包括室内或室外、手持或车载；也可以部署在水面上；还可以部署在空中的飞机、气球和人造卫星上。本申请的实施例对网络设备和终端设备的应用场景不做限定。

可选的，网络设备和终端设备之间以及终端设备和终端设备之间可以通过授权频谱(licensed spectrum)进行通信，也可以通过非授权频谱(unlicensed spectrum)进行通信，也可以同时通过授权频谱和非授权频谱进行通信。网络设备和终端设备之间以及终端设备和终端设备之间可以通过7吉兆赫(gigahertz，GHz)以下的频谱进行通信，也可以通过7GHz以上的频谱进行通信，还可以同时使用7GHz以下的频谱和7GHz以上的频谱进行通信。本申请的实施例对网络设备和终端设备之间所使用的频谱资源不做限定。

通常来说，传统的通信系统支持的连接数有限，也易于实现，然而，随着通信技术的发展，移动通信系统将不仅支持传统的通信，还将支持例如，设备到设备(device to device，D2D)通信，机器到机器(machine to machine，M2M)通信，机器类型通信(machine type communication，MTC)，以及车辆间(vehicle to vehicle，V2V)通信等，本申请实施例也可以应用于这些通信系统。

示例性的，本申请实施例应用的通信系统100，如图5所示。该通信系统100可以包括网络设备110，网络设备110可以是与终端设备120(或称为通信终端、终端)通信的设备。网络设备110可以为特定的地理区域提供通信覆盖，并且可以与位于该覆盖区域内的终端设备进行通信。可选地，该网络设备110可以是GSM系统或CDMA系统中的基站(Base Transceiver Station，BTS)，也可以是WCDMA系统中的基站(NodeB，NB)，还可以是LTE系统中的演进型基站(Evolutional Node B，eNB或eNodeB)，或者是云无线接入网络(Cloud Radio Access Network，CRAN)中的无线控制器，或者该网络设备可以为移动交换中心、中继站、接入点、车载设备、可穿戴设备、集线器、交换机、网桥、路由器、5G网络中的网络侧设备或者未来演进的公共陆地移动网络(Public Land Mobile Network，PLMN)中的网络设备等。

该通信系统100还包括位于网络设备110覆盖范围内的至少一个终端设备120。作为在此使用的“终端设备”包括但不限于经由有线线路连接，如经由公共交换电话网络(Public Switched Telephone Networks，PSTN)、数字用户线路(Digital Subscriber Line，DSL)、数字电缆、直接电缆连接；和/或另一数据连接/网络；和/或经由无线接口，如，针对蜂窝网络、无线局域网(Wireless Local Area Network，WLAN)、诸如DVB-H网络的数字电视网络、卫星网络、AM-FM广播发送器；和/或另一终端设备的被设置成接收/发送通信信号的装置；和/或物联网(Internet of Things，IoT)设备。被设置成通过无线接口通信的终端设备可以被称为“无线通信终端”、“无线终端”或“移动终端”。移动终端的示例包括但不限于卫星或蜂窝电话；可以组合蜂窝无线电电话与数据处理、传真以及数据通信能力的个人通信系统(Personal Communications System，PCS)终端；可以包括无线电电话、寻呼机、因特网/内联网接入、Web浏览器、记事簿、日历以及/或全球定位系统(Global Positioning System，GPS)接收器的PDA；以及常规膝上型和/或掌上型接收器或包括无线电电话收发器的其它电子装置。终端设备可以指接入终端、用户设备(User Equipment，UE)、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。接入终端可以是蜂窝电话、无绳电话、会话启动协议(Session Initiation Protocol，SIP)电话、无线本地环路(Wireless Local Loop，WLL)站、个人数字处理(Personal Digital Assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、可穿戴设备、5G网络中的终端设备或者未来演进的PLMN中的终端设备等。

可选地，终端设备120之间可以进行终端直连(Device to Device，D2D)通信。

可选地，5G系统或5G网络还可以称为新无线(New Radio，NR)系统或NR网络。

图5示例性地示出了一个网络设备和两个终端设备，可选地，该通信系统100可以包括多个网络设备并且每个网络设备的覆盖范围内可以包括其它数量的终端设备，本申请实施例对此不做限定。

可选地，该通信系统100还可以包括网络控制器、移动管理实体等其他网络实体，本申请实施例对此不作限定。

应理解，本申请实施例中网络/系统中具有通信功能的设备可称为通信设备。以图5示出的通信系统100为例，通信设备可包括具有通信功能的网络设备110和终端设备120，网络设备110和终端设备120可以为上文所述的具体设备，此处不再赘述；通信设备还可包括通信系统100中的其他设备，例如网络控制器、移动管理实体等其他网络实体，本申请实施例中对此不做限定。

本申请实施例提供的基于联邦学习的模型训练方法的一种可选处理流程，如图6所示，包括以下步骤：

步骤S201，子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息。

在一些实施例中，子节点设备向主节点设备发送局部模型的模型参数和所述局部模型对应的权重信息。其中，所述模型参数和所述权重信息用于主节点设备训练全局模型。

在具体实施时，所述子节点设备可以通过业务层数据、或上行控制信令(Uplink Control Information，UCI)、或无线资源控制(Radio Resource Contro，RRC)信令发送所述模型参数；所述模型参数也可以承载于物理上行控制信道(Physical Uplink Control Channel，PUCCH)或物理上行共享信道(Physical Uplink Shared Channel，PUSCH)上。所述子节点设备可以通过业务层数据、或UCI、或RRC信令发送所述局部模型对应的权重信息；所述局部模型对应的权重信息也可以承载于PUCCH或PUSCH上。

在一些实施例中，所述局部模型对应的权重信息可以为：用于训练所述局部模型的样本的数据特征；则子节点设备发送局部模型的模型参数和用于训练所述局部模型的样本的数据特征。所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。

在另一些实施例中，所述局部模型对应的权重信息可以为：与用于训练所述局部模型的样本的数据特征对应的权重因子值。则子节点设备发送局部模型的模型参数和与用于训练所述局部模型的样本的数据特征对应的权重因子值。所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。

其中，用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，由所述主节点设备配置；或者，用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。

举例来说，用于训练所述局部模型的样本的数据特征包括用于训练所述局部模型的全部样本数据的大小，用于训练所述局部模型的样本的数据特征与权重因子值的对应关系，如下表1所示，用于训练所述局部模型的全部样本数据的大小为Ni，与Ni对应的权重因子值为Mi。其中，Nimin是用于训练所述局部模型的全部样本数据的最小值，Nimax是用于训练所述局部模型的全部样本数据的最大值；如表1中用于训练所述局部模型的全部样本数据大小在N1min至N1max之间时，对应的权重因子为M1；用于训练所述局部模型的全部样本数据大小在N2min至N2max之间时，对应的权重因子为M2；用于训练所述局部模型的全部样本数据大小在N3min至N3max之间时，对应的权重因子为M3。

用于训练所述局部模型的全部样本数据的大小	权重因子
N1min至N1max	M1
N2min至N2max	M2
N3min至N3max	M3

表1

再举例来说，用于训练所述局部模型的样本的数据特征包括每次训练所述局部模型的样本数据的大小，用于训练所述局部模型的样本的数据特征与权重因子值的对应关系，如下表2所示，每次训练所述局部模型的样本数据的大小为Bi，与Bi对应的权重因子值为Mi。其中，Bimin是每次训练所述局部模型的样本数据的最小值，Bimax是每次训练所述局部模型的样本数据的最大值；如表2中每次训练所述局部模型的样本数据的大小在B1min至B1max之间时，对应的权重因子为M1；每次训练所述局部模型的样本数据的大小在B2min至B2max之间时，对应的权重因子为M2；每次训练所述局部模型的样本数据的大小在B3min至B3max之间时，对应的权重因子为M3。

每次训练所述局部模型的样本数据的大小	权重因子
B1min至B1max	M1
B2min至B2max	M2
B3min至B3max	M3

表2

又举例来说，用于训练所述局部模型的样本的数据特征包括训练所述局部模型的次数，用于训练所述局部模型的样本的数据特征与权重因子值的对应关系，如下表3所示，训练所述局部模型的次数为Ki，与Ki对应的权重因子值为Mi。其中，Kimin是训练所述局部模型的次数的最小值，Kimax是训练所述局部模型的次数的最大值；如表3中训练所述局部模型的次数在K1min至K1max之间时，对应的权重因子为M1；训练所述局部模型的次数在K2min至K2max之间时，对应的权重因子为M2；训练所述局部模型的次数在K3min至K3max之间时，对应的权重因子为M3。

训练局部模型的次数	局部模型权重因子
K1min至K1max	M1
K2min至K2max	M2
K3min至K3max	M3

表3

在用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系由所述主节点设备配置的情况下，所述主节点设备可以通过业务层数据、或RRC信令、或广播消息、或下行控制信令 (Downlink Control Information，DCI)、或媒体接入控制单元(Media Access Control-Control Element，MAC CE)、或者物理下行控制信道(Physical Downlink Control CHannel，PDCCH)信令将用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系发送至子节点设备。子节点设备再根据所述对应关系，查找与自身训练局部模型所使用的样本的数据特征对应的权重因子值，将查找得到的权重因子值上报至主节点设备。

本申请实施例中，所述子节点设备可以是第一终端设备，所述主节点设备可以是第二终端设备或网络设备。在所述主节点设备为第二终端设备的情况下，所述子节点设备可以将局部模型的模型参数和所述局部模型对应的权重信息发送至第二终端设备，第二终端设备可以作为主节点处理接收到的局部模型的模型参数和所述局部模型对应的权重信息。或第二终端设备可以将接收到的局部模型的模型参数和所述局部模型对应的权重信息发送至主节点设备。

本申请实施例提供的基于联邦学习的模型训练方法的另一种可选处理流程，如图7所示，包括以下步骤：

步骤S301，主节点设备接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息。

在一些实施例中，针对所述模型参数和所述权重信息的说明，与上述步骤S201中的相同，这里不再赘述。

在一些实施例中，针对所述主节点设备接收所述模型参数和所述权重信息的说明，与上述步骤S201中子节点设备发送所述模型参数和所述权重信息的说明相同，这里不再赘述。

需要说明的是，在所述权重信息为用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，且所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系由所述主节点设备配置的情况下，所述方法还可以包括：

步骤S300，主节点设备发送第一配置信息，所述第一配置信息用于确定所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。

在一些实施例中，所述第一配置信息可携带与下述中的任意一项：业务层数据、RRC信令、广播消息、DCI、MAC CE和PDCCH信令。

步骤S302，主节点设备基于所述模型参数和所述权重信息，训练全局模型。

在一些实施例中，在所述权重信息包括训练所述局部模型的次数的情况下，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数的相乘之后，再与训练全部局部模型的次数相除得到的数值相加之和。

举例来说，子节点设备1和子节点设备2向主节点设备上报模型参数和权重信息。若子节点设备1上报的模型参数为R1，子节点设备1训练所述局部模型的次数为N1，即子节点设备1训练N1次局部模型便上报一次模型参数；子节点设备2上报的模型参数为R2，子节点设备2训练所述局部模型的次数为N2，即子节点设备2训练N2次局部模型便上报一次模型参数。则全局模型的模型参数R可以表示为：

R＝(R1*N1+R2*N2)/(N1+N2) (1)

在另一些实施例中，在所述权重信息包括训练所述局部模型的全部样本数据的大小或每次训练所述局部模型的样本数据的大小的情况下，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值相加之和；其中，所述局部模型的参数因子等于所述局部模型的样本的数据特征与全部局部模型的样本的数据特征之和的比值。

举例来说，若子节点设备1上报的模型参数为R1，子节点设备1训练所述局部模型的全部样本数据的大小为N1；子节点设备2上报的模型参数为R2，子节点设备2训练所述局部模型的全部样本数据的大小为N2，子节点设备k上报的模型参数为Rk，子节点设备k训练所述局部模型的全部样本数据的大小为Nk。则全局模型的模型参数R可以表示为：

其中，

还有一些实施例中，在所述权重信息包括与训练所述局部模型的次数对应的权重因子值的情况下，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数对应的权重因子值相乘之后，再与训练全部局部模型的次数对应的权重因子值之和相除得到的数值相加之和。

举例来说，子节点设备1和子节点设备2向主节点设备上报模型参数和权重信息。若子节点设备1上报的模型参数为R1，训练所述局部模型的次数对应的权重因子值为M1；若子节点设备2上报的模型参数为R2，训练所述局部模型的次数对应的权重因子值为M2。则主节点设备确定全局模型的模型参数为：

R＝(R1*M1+R2*M2)/(M1+M2) (4)

又一些实施例中，在所述权重信息包括与训练所述局部模型的全部样本数据的大小对应的权重因子值、或与每次训练所述局部模型的样本数据的大小对应的权重因子值的情况下，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值数据相加之和；其中，所述局部模型的参数因子等于所述局部模型的权重因子值与全部局部模型的权重因子值之和的比值。

举例来说，举例来说，若子节点设备1上报的模型参数为R1，子节点设备1训练所述局部模型的全部样本数据的大小对应的权重因子值为M1；子节点设备2上报的模型参数为R2，子节点设备2训练所述局部模型的全部样本数据的大小对应的权重因子值为M2，子节点设备k上报的模型参数为Rk，子节点设备k训练所述局部模型的全部样本数据的大小对应的权重因子值为Mk。则全局模型的模型参数R可以表示为：

其中，

本申请实施例中，所述子节点设备可以是第一终端设备，所述主节点设备可以是第二终端设备或网络设备。

下面以所述局部模型对应的权重信息包括：用于训练所述局部模型的样本的数据特征为例，本申请实施例提供的基于联邦学习的模型训练方法的一种详细处理流程示意图，如图8所示，包括：

步骤S401，子节点设备向主节点设备发送局部模型的模型参数和用于训练所述局部模型的样本的数据特征。

其中，子节点设备通过业务层数据、或UCI、或RRC信令向主节点设备发送局部模型的模型参数和用于训练所述局部模型的样本的数据特征。所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。

步骤S402，主节点设备基于子节点设备发送的局部模型的模型参数和用于训练所述局部模型的样本的数据特征，合成全局模型。

在具体实施时，若用于训练所述局部模型的样本的数据特征包括训练所述局部模型的次数的情况下，如上述公式(1)所示，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数的相乘之后，再与训练全部局部模型的次数相除得到的数值相加之和。

在具体实施时，若用于训练所述局部模型的样本的数据特征包括训练所述局部模型的全部样本数据的大小或每次训练所述局部模型的样本数据的大小的情况下，如上述公式(2)和公式(3)所示，所述主节点设备确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值相加之和；其中，所述局部模型的参数因子等于所述局部模型的样本的数据特征与全部局部模型的样本的数据特征之和的比值。

步骤S403，主节点设备向子节点设备发送全局模型。

步骤S404，子节点设备向主节点设备发送局部模型的模型参数和用于训练所述局部模型的样本的数据特征。

这里，所述子节点设备重复上述步骤S401的操作，步骤S401与步骤S404中发送的模型参数可能不同，也可能相同；步骤S401与步骤S404中发送的用于训练所述局部模型的样本的数据特征可能不同，也可能相同。相应的，所述主节点设备重复上述步骤S402至步骤S403的操作；直至全局模型训练完成。

下面以所述局部模型对应的权重信息包括：与用于训练所述局部模型的样本的数据特征对应的权重因子值为例，本申请实施例提供的基于联邦学习的模型训练方法的一种详细处理流程示意图，如图9所示，包括：

步骤S501，子节点设备获取用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。

在一些实施例中，所述子节点设备可以根据预先约定来确定用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系；所述子节点设备也可以通过接收网络设备发送的第一配置信息来确定用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。

步骤S502，子节点设备根据自身训练局部模型的样品的数据特征，确定权重因子值。

在具体实施时，子节点设备在用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系中，查找与自身训练局部模型的样品的数据特征对应的权重因子值。

步骤S503，子节点设备向主节点设备发送局部模型的模型参数和权重因子值。

在一些实施例中，子节点设备通过业务层数据、或UCI、或RRC信令向主节点设备发送局部模型的模型参数和权重因子值。

步骤S504，主节点设备基于子节点设备发送的局部模型的模型参数和权重因子值，合成全局模型。

在具体实施时，若所述权重因子值为与训练所述局部模型的次数对应的权重因子值的情况下，所述主节点设备基于上述公式(4)确定全局模型的模型参数等于，每个局部模型的模型参数的值与训练所述局部模型的次数对应的权重因子值相乘之后，再与训练全部局部模型的次数对应的权重因子值之和相除得到的数值相加之和。

在具体实施时，若所述权重因子值为与训练所述局部模型的全部样本数据的大小对应的权重因子值、或与每次训练所述局部模型的样本数据的大小对应的权重因子值的情况下，所述主节点设备基于上述公式(5)和公式(6)确定全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值数据相加之和；其中，所述局部模型的参数因子等于所述局部模型的权重因子值与全部局部模型的权重因子值之和的比值。

步骤S505，主节点设备向子节点设备发送全局模型。

步骤S506，子节点设备向主节点设备发送局部模型的模型参数和权重因子值。

这里，所述子节点设备重复上述步骤S503的操作，步骤S503与步骤S506中子节点设备向主节点设备发送的模型参数可能相同，也可能不同；步骤S503与步骤S506中子节点设备向主节点设备发送的权重因子值可能相同，也可能不同。相应的，所述主节点设备重复上述步骤S504至步骤S505的操作；直至全局模型训练完成。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在具体实施时，本申请实施例提供的基于联邦学习的模型训练方法至少可以应用于下述场景：如信道模型生成，服务用户预测，智能交通决策。

以本申请实施例提供的基于联邦学习的模型训练方法应用于信道模型生成场景为例，所述终端设备获取信道质量数据，以该信道质量数据作为样本训练局部模型；终端设备将训练得到的局部模型的模型参数发送至网络设备，网络设备根据各终端设备分别发送的局部模型的模型参数确定全局模型的模型参数；所述全局模型用于确定信道质量。

为实现上述基于联邦学习的模型训练方法，本申请实施例提供一种子节点设备，所述子节点设备600的一种可选组成结构示意图，如图10所示，包括：

第一发送单元601，配置为发送局部模型的模型参数和所述局部模型对应的权重信息；

所述模型参数和所述权重信息用于主节点设备训练全局模型。

在一些实施例中，所述权重信息包括：用于训练所述局部模型的样本的数据特征。

在一些实施例中，所述局部模型对应的权重信息包括：与用于训练所述局部模型的样本的数据特征对应的权重因子值。

在一些实施例中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，由所述主节点设备配置；或者，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。

在一些实施例中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，通过下述中的任意一项配置：

业务层数据、RRC信令、广播消息、DCI、MAC CE和PDCCH信令。

在一些实施例中，所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。

在一些实施例中，所述权重信息通过业务层数据、或UCI、或RRC信令传输；和/或，所述权重信息承载于PUCCH或PUSCH上。

在一些实施例中，所述模型参数通过业务层数据、或UCI、或RRC信令传输；和/或，所述模型参数承载于PUCCH或PUSCH上。

在一些实施例中，所述子节点设备600包括：第一终端设备。

在一些实施例中，所述主节点设备包括：第二终端设备或网络设备。

为实现上述基于联邦学习的模型训练方法，本申请实施例提供一种主节点设备，所述主节点设备800的可选组成结构示意图，如图11所示，包括：

第一接收单元801，配置为接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息；

处理单元802，配置为基于所述模型参数和所述权重信息，训练全局模型。

在一些实施例中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。

在一些实施例中，所述主节点设备800还包括：

第二发送单元803，配置为发送第一配置信息，所述第一配置信息用于确定所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。

在一些实施例中，所述第一配置信息携带与下述中的任意一项：

业务层数据、RRC信令、广播消息、DCI、MAC CE和PDCCH信令。

在一些实施例中，所述处理单元802，配置为在所述权重信息包括训练所述局部模型的次数的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数的相乘之后，再与训练全部局部模型的次数相除得到的数值相加之和。

在一些实施例中，所述处理单元802，配置为在所述权重信息包括训练所述局部模型的全部样本数据的大小或每次训练所述局部模型的样本数据的大小的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值相加之和；

其中，所述局部模型的参数因子等于所述局部模型的样本的数据特征与全部局部模型的样本的数据特征之和的比值。

在一些实施例中，所述处理单元802，配置为在所述权重信息包括与训练所述局部模型的次数对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数对应的权重因子值相乘之后，再与训练全部局部模型的次数对应的权重因子值之和相除得到的数值相加之和。

在一些实施例中，所述处理单元802，配置为在所述权重信息包括与训练所述局部模型的全部样本数据的大小对应的权重因子值、或与每次训练所述局部模型的样本数据的大小对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值数据相加之和；

其中，所述局部模型的参数因子等于所述局部模型的权重因子值与全部局部模型的权重因子值之和的比值。

在一些实施例中，所述模型参数通过业务层数据、或UCI、或RRC信令传输；

和/或，所述模型参数承载于PUCCH或PUSCH上。

在一些实施例中，所述子节点设备包括：第一终端设备。

本申请实施例还提供一种子节点设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述子节点执行的基于联邦学习的模型训练方法的步骤。

本申请实施例还提供一种主节点设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述主节点设备执行的基于联邦学习的模型训练方法的步骤。

本申请实施例还提供一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行上述子节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行上述主节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现上述子节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现上述主节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述子节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述主节点设备执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种计算机程序，所述计算机程序使得计算机执行上述子节点执行的基于联邦学习的模型训练方法。

本申请实施例还提供一种计算机程序，所述计算机程序使得计算机执行上述主节点设备执行的基于联邦学习的模型训练方法。

图12是本申请实施例的电子设备(主节点设备或子节点设备)的硬件组成结构示意图，电子设备700包括：至少一个处理器701、存储器702和至少一个网络接口704。电子设备700中的各个组件通过总线系统705耦合在一起。可理解，总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图12中将各种总线都标为总线系统705。

可以理解，存储器702可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是ROM、可编程只读存储器(PROM，Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM，Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM，ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM，Compact Disc Read-Only Memory)；磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM，Random Access Memory)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(SRAM，Static Random Access Memory)、同步静态随机存取存储器(SSRAM，Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM，Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM，Synchronous Dynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM，Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM，Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM，SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM，Direct Rambus Random Access Memory)。本申请实施例描述的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。

本申请实施例中的存储器702用于存储各种类型的数据以支持电子设备700的操作。这些数据的示例包括：用于在电子设备700上操作的任何计算机程序，如应用程序7022。实现本申请实施例方法的程序可以包含在应用程序7022中。

上述本申请实施例揭示的方法可以应用于处理器701中，或者由处理器701实现。处理器701可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器701可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器702，处理器701读取存储器702中的信息，结合其硬件完成前述方法的步骤。

在示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、FPGA、通用处理器、控制器、MCU、MPU、或其他电子元件实现，用于执行前述方法。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

应理解，本申请中术语“系统”和“网络”在本文中常被可互换使用。本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本申请中字符“/”，一般表示前后关联对象是一种“或”的关系。

以上所述，仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围，凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本申请的保护范围之内。

Claims

一种基于联邦学习的模型训练方法，所述方法包括：

子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息；

所述模型参数和所述权重信息用于主节点设备训练全局模型。
根据权利要求1所述的方法，其中，所述局部模型对应的权重信息包括：

用于训练所述局部模型的样本的数据特征。
根据权利要求1所述的方法，其中，所述局部模型对应的权重信息包括：

与用于训练所述局部模型的样本的数据特征对应的权重因子值。
根据权利要求3所述的方法，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，由所述主节点设备配置；

或者，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。
根据权利要求4所述的方法，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，通过下述中的任意一项配置：

业务层数据、无线资源控制RRC信令、广播消息、下行控制信令DCI、媒体接入控制单元MAC CE和物理下行控制信道PDCCH信令。
根据权利要求2至5任一项所述的方法，其中，所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：

用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。
根据权利要求1至6任一项所述的方法，其中，所述权重信息通过业务层数据、或上行控制信令UCI、或RRC信令传输；

和/或，所述权重信息承载于PUCCH或物理上行共享信道PUSCH上。
根据权利要求1至7任一项所述的方法，其中，所述模型参数通过业务层数据、或UCI、或RRC信令传输；

和/或，所述模型参数承载于PUCCH或PUSCH上。
根据权利要求1至8任一项所述的方法，其中，所述子节点设备包括：第一终端设备。
根据权利要求1至9任一项所述的方法，其中，所述主节点设备包括：第二终端设备或网络设备。
一种基于联邦学习的模型训练方法，所述方法包括：

主节点设备接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息；

所述主节点设备基于所述模型参数和所述权重信息，训练全局模型。
根据权利要求11所述的方法，其中，所述权重信息包括：

用于训练所述局部模型的样本的数据特征。
根据权利要求11所述的方法，其中，所述局部模型对应的权重信息包括：

与用于训练所述局部模型的样本的数据特征对应的权重因子值。
根据权利要求13所述的方法，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系由所述主节点设备配置；

或者，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系预先约定。
根据权利要求13所述的方法，其中，所述方法还包括：

所述主节点设备发送第一配置信息，所述第一配置信息用于确定所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。
根据权利要求15所述的方法，其中，所述第一配置信息携带与下述中的任意一项：

业务层数据、无线资源控制RRC信令、广播消息、下行控制信令DCI、媒体接入控制单元MAC CE和物理下行控制信道PDCCH信令。
根据权利要求12至16任一项所述的方法，其中，所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：

用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。
根据权利要求12所述的方法，其中，所述主节点设备基于所述模型参数和所述权重信息，训练全局模型，包括：

在所述权重信息包括训练所述局部模型的次数的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数的相乘之后，再与训练全部局部模型的次数相除得到的数值相加之和。
根据权利要求12所述的方法，其中，所述主节点设备基于所述模型参数和所述权重信息，训练全局模型，包括：

在所述权重信息包括训练所述局部模型的全部样本数据的大小或每次训练所述局部模型的样本数据的大小的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值相加之和；

其中，所述局部模型的参数因子等于所述局部模型的样本的数据特征与全部局部模型的样本的数据特征之和的比值。
根据权利要求13至16任一项所述的方法，其中，所述主节点设备基于所述模型参数和所述权重信息，训练全局模型，包括：

在所述权重信息包括与训练所述局部模型的次数对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数对应的权重因子值相乘之后，再与训练全部局部模型的次数对应的权重因子值之和相除得到的数值相加之和。
根据权利要求13至16任一项所述的方法，其中，所述主节点设备基于所述模型参数和所述权重信息，训练全局模型，包括：

在所述权重信息包括与训练所述局部模型的全部样本数据的大小对应的权重因子值、或与每次训练所述局部模型的样本数据的大小对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值数据相加之和；

其中，所述局部模型的参数因子等于所述局部模型的权重因子值与全部局部模型的权重因子值之和的比值。
根据权利要求11至21任一项所述的方法，其中，所述权重信息通过业务层数据、或上行控制信令UCI、或RRC信令传输；

和/或，所述权重信息承载于PUCCH或物理上行共享信道PUSCH上。
根据权利要求11至22任一项所述的方法，其中，所述模型参数通过业务层数据、或上行控制信令UCI、或RRC信令传输；

和/或，所述模型参数承载于PUCCH或PUSCH上。
根据权利要求11至23任一项所述的方法，其中，所述子节点设备包括：第一终端设备。
根据权利要求11至24任一项所述的方法，其中，所述主节点设备包括：第二终端设备或网络设备。
一种子节点设备，所述子节点设备包括：

第一发送单元，配置为发送局部模型的模型参数和所述局部模型对应的权重信息；

所述模型参数和所述权重信息用于主节点设备训练全局模型。
根据权利要求26所述的子节点设备，其中，所述局部模型对应的权重信息包括：

用于训练所述局部模型的样本的数据特征。
根据权利要求26所述的子节点设备，其中，所述局部模型对应的权重信息包括：

与用于训练所述局部模型的样本的数据特征对应的权重因子值。
根据权利要求28所述的子节点设备，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，由所述主节点设备配置；

或者，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。
根据权利要求29所述的子节点设备，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系，通过下述中的任意一项配置：

业务层数据、无线资源控制RRC信令、广播消息、下行控制信令DCI、媒体接入控制单元MAC CE和物理下行控制信道PDCCH信令。
根据权利要求27至30任一项所述的子节点设备，其中，所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：

用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。
根据权利要求26至31任一项所述的子节点设备，其中，所述权重信息通过业务层数据、或上行控制信令UCI、或RRC信令传输；

和/或，所述权重信息承载于PUCCH或物理上行共享信道PUSCH上。
根据权利要求26至32任一项所述的子节点设备，其中，所述模型参数通过业务层数据、或UCI、或RRC信令传输；

和/或，所述模型参数承载于PUCCH或PUSCH上。
根据权利要求26至33任一项所述的子节点设备，其中，所述子节点设备包括：第一终端设备。
根据权利要求26至33任一项所述的子节点设备，其中，所述主节点设备包括：第二终端设备或网络设备。
一种主节点设备，所述主节点设备包括：

第一接收单元，配置为接收至少两个子节点设备发送的局部模型的模型参数和所述局部模型对应的权重信息；

处理单元，配置为基于所述模型参数和所述权重信息，训练全局模型。
根据权利要求36所述的主节点设备，其中，所述权重信息包括：

用于训练所述局部模型的样本的数据特征。
根据权利要求36所述的主节点设备，其中，所述局部模型对应的权重信息包括：

与用于训练所述局部模型的样本的数据特征对应的权重因子值。
根据权利要求38所述的主节点设备，其中，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系由所述主节点设备配置；

或者，所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系为预先约定。
根据权利要求38所述的主节点设备，其中，所述主节点设备还包括：

第二发送单元，配置为发送第一配置信息，所述第一配置信息用于确定所述用于训练所述局部模型的样本的数据特征与所述权重因子值的对应关系。
根据权利要求40所述的主节点设备，其中，所述第一配置信息携带与下述中的任意一项：

业务层数据、无线资源控制RRC信令、广播消息、下行控制信令DCI、媒体接入控制单元MAC CE和物理下行控制信道PDCCH信令。
根据权利要求37至41任一项所述的主节点设备，其中，所述用于训练所述局部模型的样本的数据特征包括下述中的至少一项：

用于训练所述局部模型的全部样本数据的大小、每次训练所述局部模型的样本数据的大小和训练所述局部模型的次数。
根据权利要求37所述的主节点设备，其中，所述处理单元，配置为在所述权重信息包括训练所述局部模型的次数的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数的相乘之后，再与训练全部局部模型的次数相除得到的数值相加之和。
根据权利要求37所述的主节点设备，其中，所述处理单元，配置为在所述权重信息包括训练所述局部模型的全部样本数据的大小或每次训练所述局部模型的样本数据的大小的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值相加之和；

其中，所述局部模型的参数因子等于所述局部模型的样本的数据特征与全部局部模型的样本的数据特征之和的比值。
根据权利要求38至41任一项所述的主节点设备，其中，所述处理单元，配置为在所述权重信息包括与训练所述局部模型的次数对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与训练所述局部模型的次数对应的权重因子值相乘之后，再与训练全部局部模型的次数对应的权重因子值之和相除得到的数值相加之和。
根据权利要求38至41任一项所述的主节点设备，其中，所述处理单元，配置为在所述权重信息包括与训练所述局部模型的全部样本数据的大小对应的权重因子值、或与每次训练所述局部模型的样本数据的大小对应的权重因子值的情况下，确定所述全局模型的模型参数的值等于，每个局部模型的模型参数的值与所述局部模型的参数因子相乘得到的数值数据相加之和；

其中，所述局部模型的参数因子等于所述局部模型的权重因子值与全部局部模型的权重因子值之和的比值。
根据权利要求36至46任一项所述的主节点设备，其中，所述权重信息通过业务层数据、或上行控制信令UCI、或RRC信令传输；

和/或，所述权重信息承载于PUCCH或物理上行共享信道PUSCH上。
根据权利要求36至47任一项所述的主节点设备，其中，所述模型参数通过业务层数据、或UCI、或RRC信令传输；

和/或，所述模型参数承载于PUCCH或PUSCH上。
根据权利要求36至47任一项所述的主节点设备，其中，所述子节点设备包括：第一终端设备。
根据权利要求36至48任一项所述的主节点设备，其中，所述主节点设备包括：第二终端设备或网络设备。
一种终端设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，

所述处理器用于运行所述计算机程序时，执行权利要求1至10任一项所述的基于联邦学习的模型训练方法的步骤。
一种网络设备，包括处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，

所述处理器用于运行所述计算机程序时，执行权利要求11至25任一项所述的基于联邦学习的模型训练方法的步骤。
一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现权利要求1至10任一项所述的基于联邦学习的模型训练方法。
一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时，实现权利要求11至25任一项所述的基于联邦学习的模型训练方法。
一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行如权利要求1至10任一项所述的基于联邦学习的模型训练方法。
一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行如权利要求11至25任一项所述的基于联邦学习的模型训练方法。
一种计算机程序，所述计算机程序使得计算机执行如权利要求1至10任一项所述的基于联邦学习的模型训练方法。
一种计算机程序，所述计算机程序使得计算机执行如权利要求11至25任一项所述的基于联邦学习的模型训练方法。
一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如权利要求1至10任一项所述的基于联邦学习的模型训练方法。
一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如权利要求11至25任一项所述的基于联邦学习的模型训练方法。