WO2024065709A1

WO2024065709A1 - 一种通信方法及相关设备

Info

Publication number: WO2024065709A1
Application number: PCT/CN2022/123355
Authority: WO
Inventors: 张公正; 李榕; 王坚; 童文; 马江镭
Original assignee: 华为技术有限公司
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2024-04-04

Abstract

本申请提供了一种通信方法及相关设备，可以应用于多级联合学习场景。第一设备根据下游第二设备侧模型的第一结果更新本地模型，并向上游第三设备发送更新后的本地模型。从而接收上游第三设备根据第二设备更新的模型处理得到的第三模型。进而根据该第三模型更新对公共数据集新的第二结果，该第二结果用于更新下游第二设备侧模型。可以看出，第一设备在多级联合学习场景下，充分利用计算能力参与联合训练。相较于中间级只做转发的方案，可以融合下游设备异构的模型，并减少上游设备的处理流程，从而增加多级联合学习的学习效率。

Description

一种通信方法及相关设备

技术领域

本申请涉及通信领域，尤其涉及一种通信方法及相关设备。

背景技术

以联邦学习为代表的联合学习是一种分布式学习技术，各设备利用本地数据集进行模型训练，将训练得到的模型或更新上报给参数服务器；服务器通过以联邦平均为代表的融合算法，加权平均多个设备的本地模型，得到全局模型并下发给各设备，实现模型的更新。联邦学习框架不需要上传用户数据，从而在保障用户隐私的前提下，实现多个设备的联合学习。

目前，在基于联邦学习的三层联合学习场景中，以网络设备为代表的中间层只进行转发操作，没有充分利用中间层的计算能力；而各终端的计算和存储能力不同，不一定具有训练和部署统一模型的能力。

因此，如何在三层联合学习场景中有效利用中间层的计算能力是亟待解决的技术问题。

发明内容

本申请提供了一种通信方法及相关设备，第一设备在多级联合学习场景下，充分利用计算能力参与联合训练。相较于中间级只做转发的方案，可以融合下游设备异构的模型，并减少上游设备的处理流程，从而增加多级联合学习的学习效率。

本申请实施例第一方面提供了一种通信方法，可以应用于多级联合学习场景。该方法可以由第一设备执行，也可以由第一设备的部件(例如处理器、芯片、或芯片系统等)执行。该第一设备具体可以为基站、传输点(transmitting and receiving point，TRP)等网络设备，也可以为终端或核心网设备，该方法包括：获取第一结果，第一结果为第二设备侧模型推理公共数据集得到的结果；基于公共数据集与第一结果更新第一模型以得到第二模型，第一模型为第一设备的本地模型；向第三设备发送第二模型；接收第三设备发送的第三模型，第三模型由第二模型处理得到；基于第三模型与公共数据集获取第二结果，第二结果用于更新第二设备侧模型。

本申请实施例中，第一设备根据下游第二设备侧模型的第一结果更新本地模型，并向上游第三设备发送更新后的本地模型。从而接收上游第三设备根据第二设备更新的模型处理得到的第三模型。进而根据该第三模型更新对公共数据集的第二结果，该第二结果用于更新下游第二设备侧模型。可以看出，第一设备在多级联合学习场景下，充分利用计算能力参与联合训练。相较于中间级只做转发的方案，可以融合下游设备异构的模型，并减少上游设备的处理流程，从而增加多级联合学习的学习效率。

可选地，在第一方面的一种可能的实现方式中，上述步骤：获取第一结果，包括：接收来自第二设备的第一结果，第一结果为第二设备使用第二设备侧模型推理公共数据集得到的结果。

该种可能的实现方式中，第一设备可以通过直接获取第一结果的方式，减少第一设备使用第二设备侧模型推理过程占用的算力资源与存储资源。

可选地，在第一方面的一种可能的实现方式中，上述步骤：获取第一结果，包括：接收来自第二设备的第二设备侧模型；使用第二设备侧模型推理公共数据集得到第一结果。

该种可能的实现方式中，第一设备可以通过获取第二设备侧模型的方式，自身执行推理过程，可以减少第二设备推理所占用的算力资源与存储资源。

可选地，在第一方面的一种可能的实现方式中，上述步骤还包括：向第二设备发送第二结果，第二结果用于第二设备更新第二设备侧模型。

该种可能的实现方式中，第二设备可以使用第二结果进行更新第二设备侧模型。减少第一设备更新第二设备侧模型所占用的算力资源与存储资源。

可选地，在第一方面的一种可能的实现方式中，上述步骤还包括：基于第二结果更新第二设备侧模型；向第二设备发送更新后的第二设备侧模型。

该种可能的实现方式中，第一设备可以使用第二结果进行更新第二设备侧模型。并下发至第二设备。减少第二设备更新第二设备侧模型所占用的算力资源与存储资源。

可选地，在第一方面的一种可能的实现方式中，上述步骤还包括：向第二设备发送指示信息，指示信息用于第一设备与第二设备同步公共数据集，同步对应的操作包括以下至少一项：增加、删除、修改；接收第二设备发送的确认信息，确认信息用于同步公共数据集。

该种可能的实现方式中，参与联合学习的第一设备与第二设备可以对公共数据集进行同步。从而确保交互的预测结果(例如第一结果、第二结果)是与相同公共数据集对应的。

本申请实施例第二方面提供了一种通信方法，可以应用于模型训练场景。该方法可以由第二设备执行，也可以由第二设备的部件(例如处理器、芯片、或芯片系统等)执行。该第二设备具体可以为终端设备，该方法包括：获取第一模型，第一模型基于第二设备的第一信息与第二模型得到，第一模型为第二模型的一部分；第一信息包括能力信息和/或业务需求信息。

本申请实施例中，第二设备可以通过第二设备的能力信息和/或业务需求信息从第二模型中确定第一模型。且第二设备的数据都采用第一模型(即第二模型的一个子结构)进行推理。

可选地，在第二方面的一种可能的实现方式中，上述第二模型包括N层第一网络，N层第一网络中至少一层第一网络包括两个以上并行的子网络，第一模型包括N层第二网络，第一数量小于第二数量，第一数量为N层第二网络中至少一层第二网络包括子网络的数量，第二数量为N层第一网络中对应至少一层第二网络的第一网络所包括子网络的数量，N为正整数。

该种可能的实现方式中，第一模型为第二模型一部分的一种示例，第一模型与第二模型的网络层数相同，第一模型的至少一层第二网络中子网络的数量少于该至少一层第二网络对应第二模型中第一网络的子网络数量。该种情况下，也可以理解为第一模型为第二模型中的一条或多条路径。

可选地，在第二方面的一种可能的实现方式中，上述步骤还包括：接收来自第一设备的第一参数，第一参数用于指示对子网络的调整；基于第一参数更新第一模型。

该种可能的实现方式中，第一设备与第二设备可以通过第一参数实现对第一模型中子网络的调整，进而提升第一模型的性能。

可选地，在第二方面的一种可能的实现方式中，上述步骤还包括：接收来自第一设备的第二模型；获取第一模型，包括：基于第一信息从第二模型中确定第一模型。

该种可能的实现方式中，第二设备获取第一模型的一种示例，可以通过接收第一设备发送的第二模型，并从第二模型中确定出第一模型。以减少第二设备确定第一模型所占用的算力资源与存储资源。

可选地，在第二方面的一种可能的实现方式中，上述步骤基于第一信息从第二模型中确定第一模型，包括：基于第一信息确定N层第一网络中各层第一网络的子网络；基于子网络构建第一模型。

该种可能的实现方式中，通过第一信息确定各网络层中的子网络，进而得到第一模型。

可选地，在第二方面的一种可能的实现方式中，上述能力信息用于确定N层第二网络中各第二网络的子网络的数量，业务需求信息用于确定各第二网络中子网络。

该种可能的实现方式中，通过能力信息确定子网络的数量，并通过业务需求信息确定子网络。从而可以精准从第二模型中选择作为第一模型的子网络。

可选地，在第二方面的一种可能的实现方式中，上述步骤：获取第一模型，包括：向第一设备发送第一信息，第一信息用于第一设备从第二模型中确定第一模型；接收第一设备发送的第二模型。

该种可能的实现方式中，第二设备获取第一模型的另一种示例，可以通过向第一设备上报第一信息，接收第一设备发送的第一模型，该第一模型由第一设备基于第一信息所确定。通过将从第二模型中确定第一模型的过程放在第一设备侧，以减少第二设备的算力资源与存储资源。

可选地，在第二方面的一种可能的实现方式中，上述步骤还包括：基于本地数据训练第一模型得到第三模型；向第一设备发送第三模型，第三模型用于第一设备更新第二模型。

该种可能的实现方式中，第一设备与第二设备可以使用第一模型进行联合训练。

可选地，在第二方面的一种可能的实现方式中，上述步骤还包括：获取第四模型，第四模型由第三模型更新第二模型得到；基于第四模型更新第三模型。

可选地，在第二方面的一种可能的实现方式中，上述第一模型包括N层第一网络，第二模型包括M层第一网络，N与M为正整数，且M小于或等于N。

该种可能的实现方式中，第一模型为第二模型一部分的一种示例，可以用在分割网络场景。例如，第一模型只是整个第二模型中的编码器或解码器等。

本申请实施例第三方面提供了一种通信方法，可以应用于模型训练场景。该方法可以由第一设备执行，也可以由第一设备的部件(例如处理器、芯片、或芯片系统等)执行。该第一设备具体可以为网络设备(例如基站、TRP等)，该方法包括：接收第二设备发送的第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；确定第一设备与第二设备的学习模式，学习模式为联邦学习模式或蒸馏学习模式；向第二设备发送指示信息，指示信息用于指示学习模式；接收第二设备发送的第二信息，第二信息用于更新第一设备侧的模型。

本申请实施例中，第一设备通过第二设备的能力信息/业务需求信息来确定与第二设备匹配的学习模式，从而可以灵活适用模型训练的场景，提升模型训练效率。

本申请实施例第四方面提供了一种通信方法，可以应用于模型训练场景。该方法可以由第二设备执行，也可以由第二设备的部件(例如处理器、芯片、或芯片系统等)执行。该第二设备具体可以为终端设备，该方法包括：向第一设备发送第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；接收第一设备发送的指示信息，指示信息用于指示学习模式；基于学习模式向第一设备发送第二信息，第二信息用于更新第一设备侧的模型。

可选地，在第三方面或第四方面的一种可能的实现方式中，在联邦学习模式下，第二信息为模型的权重或梯度。

该种可能的实现方式中，该方法可以应用于第二设备算力(例如算力能力、存储能力)较强的场景。

可选地，在第三方面或第四方面的一种可能的实现方式中，上述在蒸馏学习模式下，第二信息为模型推理公共数据集得到的结果。

该种可能的实现方式中，该方法可以应用于第二设备能力(例如算力能力、存储能力)较差的场景。

本申请实施例第五方面提供了一种第一设备，可以应用于多级联合学习场景。该第一设备包括：获取单元，用于获取第一结果，第一结果为第二设备侧模型推理公共数据集得到的结果；更新单元，用于基于公共数据集与第一结果更新第一模型以得到第二模型，第一模型为第一设备的本地模型；发送单元，用于向第三设备发送第二模型；接收单元，用于接收第三设备发送的第三模型，第三模型由第二模型处理得到；获取单元，还用于基于第三模型与公共数据集获取第二结果，第二结果用于更新第二设备侧模型。

可选地，在第五方面的一种可能的实现方式中，上述的获取单元，具体用于接收来自第二设备的第一结果，第一结果为第二设备使用第二设备侧模型推理公共数据集得到的结果。

可选地，在第五方面的一种可能的实现方式中，上述的获取单元，具体用于接收来自第二设备的第二设备侧模型；获取单元，具体用于使用第二设备侧模型推理公共数据集得到第一结果。

可选地，在第五方面的一种可能的实现方式中，上述的发送单元，还用于向第二设备发送第二结果，第二结果用于第二设备更新第二设备侧模型。

可选地，在第五方面的一种可能的实现方式中，上述的更新单元，还用于基于第二结果更新第二设备侧模型；发送单元，还用于向第二设备发送更新后的第二设备侧模型。

可选地，在第五方面的一种可能的实现方式中，上述的发送单元，还用于向第二设备发送指示信息，指示信息用于第一设备与第二设备同步公共数据集，同步对应的操作包括以下至少一项：增加、删除、修改；接收单元，还用于接收第二设备发送的确认信息，确认信息用于同步公共数据集。

本申请实施例第六方面提供了一种第二设备，可以应用于模型训练场景。该第二设备包括：获取单元，用于获取第一模型，第一模型基于第二设备的第一信息与第二模型得到，第一模型为第二模型的一部分；第一信息包括能力信息和/或业务需求信息。

可选地，在第六方面的一种可能的实现方式中，上述的第二模型包括N层第一网络，N层第一网络中至少一层第一网络包括两个以上并行的子网络，第一模型包括N层第二网络，第一数量小于第二数量，第一数量为N层第二网络中至少一层第二网络包括子网络的数量，第二数量为N层第一网络中对应至少一层第二网络的第一网络所包括子网络的数量，N为正整数。

可选地，在第六方面的一种可能的实现方式中，上述的第二设备还包括：接收单元，用于接收来自第一设备的第一参数，第一参数用于指示对子网络的调整；更新单元，用于基于第一参数更新第一模型。

可选地，在第六方面的一种可能的实现方式中，上述的接收单元，用于接收来自第一设备的第二模型；获取单元，具体用于基于第一信息从第二模型中确定第一模型。

可选地，在第六方面的一种可能的实现方式中，上述的获取单元，具体用于基于第一信息确定N层第一网络中各层第一网络的子网络；获取单元，具体用于基于子网络构建第一模型。

可选地，在第六方面的一种可能的实现方式中，上述的能力信息用于确定N层第二网络中各第二网络的子网络的数量，业务需求信息用于确定各第二网络中子网络。

可选地，在第六方面的一种可能的实现方式中，上述的获取单元，具体用于向第一设备发送第一信息，第一信息用于第一设备从第二模型中确定第一模型；获取单元，具体用于接收第一设备发送的第二模型。

可选地，在第六方面的一种可能的实现方式中，上述的更新单元，还用于基于本地数据训练第一模型得到第三模型；发送单元，还用于向第一设备发送第三模型，第三模型用于第一设备更新第二模型。

可选地，在第六方面的一种可能的实现方式中，上述的获取单元，还用于获取第四模型，第四模型由第三模型更新第二模型得到；更新单元，用于基于第四模型更新第三模型。

可选地，在第六方面的一种可能的实现方式中，上述的第一模型包括N层第一网络，第二模型包括M层第一网络，N与M为正整数，且M小于或等于N。

本申请实施例第七方面提供了一种第一设备，可以应用于模型训练场景。该第一设备包括：接收单元，用于接收第二设备发送的第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；确定单元，用于确定第一设备与第二设备的学习模式，学习模式为联邦学习模式或蒸馏学习模式；发送单元，用于向第二设备发送指示信息，指示信息用于指示学习模式；接收单元，还用于接收第二设备发送的第二信息，第二信息用于更新第一设备侧的模型。

本申请实施例第八方面提供了一种第二设备，可以应用于模型训练场景。该第二设备包括：发送单元，用于向第一设备发送第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；接收单元，用于接收第一设备发送的指示信息，指示信息用于指示学习模式；发送单元，用于基于学习模式向第一设备发送第二信息，第二信息用于更新第一设备侧的模型。

可选地，在第七方面或第八方面的一种可能的实现方式中，在联邦学习模式下，第二信息为模型的权重或梯度。

可选地，在第七方面或第八方面的一种可能的实现方式中，在蒸馏学习模式下，第二信息为模型推理公共数据集得到的结果。

本申请实施例第九方面提供了一种第一设备，包括：处理器，处理器与存储器耦合，存储器用于存储程序或指令，当程序或指令被处理器执行时，使得该第一设备实现上述第一方面或第一方面的任意可能的实现方式中的方法，或者使得该第二设备实现上述第三方面或第三方面的任意可能的实现方式中的方法。

本申请实施例第十方面提供了一种第二设备，包括：处理器，处理器与存储器耦合，存储器用于存储程序或指令，当程序或指令被处理器执行时，使得该第二设备实现上述第二方面或第二方面的任意可能的实现方式中的方法，使得该第二设备实现上述第四方面或第四方面的任意可能的实现方式中的方法。

本申请实施例第十一方面提供了一种通信系统，包括：上述第九方面的第一设备，和/或上述第十方面的第二设备。

本申请实施例第十一方面提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持第一设备实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能；或者用于支持第一设备实现上述第三方面或第三方面任意一种可能的实现方式中所涉及的功能。

在一种可能的设计中，该芯片系统还可以包括存储器，存储器，用于保存该通信设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。可选的，所述芯片系统还包括接口电路，所述接口电路为所述至少一个处理器提供程序指令和/或数据。

本申请实施例第十二方面提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持第二设备实现上述第二方面或第二方面任意一种可能的实现方式中所涉及的功能；或者用于支持第二设备实现上述第四方面或第四方面任意一种可能的实现方式中所涉及的功能。

本申请实施例第十三方面提供了一种计算机可读介质，其上存储有计算机程序或指令，当计算机程序或指令在计算机上运行时，使得计算机执行前述第一方面或第一方面的任意可能的实现方式中的方法，或者使得计算机执行前述第二方面或第二方面的任意可能的实现方式中的方法，或者使得计算机执行前述第三方面或第三方面的任意可能的实现方式中的方法，或者使得计算机执行前述第四方面或第四方面的任意可能的实现方式中的方法。

本申请实施例第十四方面提供了一种计算机程序产品，该计算机程序产品在计算机上执行时，使得计算机执行前述第一方面或第一方面的任意可能的实现方式中的方法，使得计算机执行前述第二方面或第二方面的任意可能的实现方式中的方法，或者使得计算机执行前述第三方面或第三方面的任意可能的实现方式中的方法，或者使得计算机执行前述第四方面或第四方面的任意可能的实现方式中的方法。

从以上技术方案可以看出，本申请具有以下优点：第一设备根据下游第二设备侧模型的第一结果更新本地模型，并向上游第三设备发送更新后的本地模型。从而接收上游第三设备根据第二设备更新的模型处理得到的第三模型。进而根据该第三模型更新对公共数据集新的第二结果，该第二结果用于更新下游第二设备侧模型。可以看出，第一设备在多级联合学习场景下，充分利用计算能力参与联合训练。相较于中间级只做转发的方案，可以减少上游设备的处理流程，从而增加多级联合学习的学习效率。

附图说明

图1A为本申请实施例提供的通信系统的一个示意图；

图1B为本申请实施例提供的多级学习架构的一个示意图；

图2为本申请实施例提供的通信方法的一个流程示意图；

图3为本申请实施例提供的通信方法的另一个流程示意图；

图4为本申请实施例提供的通信方法的另一个流程示意图；

图5为本申请实施例提供的通信方法的另一个流程示意图；

图6为本申请实施例提供的第二模型的一个示例图；

图7A为本申请实施例提供的第一模型的一个示例图；

图7B为本申请实施例提供的第一模型的另一个示例图；

图8A为本申请实施例提供的第二模型的另一个示例图；

图8B为本申请实施例提供的第一模型的另一个示例图；

图9为本申请实施例提供的通信方法的另一个流程示意图；

图10为本申请实施例提供的通信方法的另一个流程示意图；

图11为本申请实施例提供的通信方法的另一个流程示意图；

图12为本申请实施例提供的通信系统的另一个示意图；

图13为本申请实施例提供的第一设备的一个结构示意图；

图14为本申请实施例提供的第二设备的一个结构示意图；

图15为本申请实施例提供的第一设备的另一个结构示意图；

图16为本申请实施例提供的第二设备的另一个结构示意图；

图17为本申请实施例提供的第一设备的另一个结构示意图；

图18为本申请实施例提供的第二设备的另一个结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

首先，对本申请实施例中的部分用语进行解释说明，以便于本领域技术人员理解。

1、联邦学习

联邦学习是一种分布式学习技术，各设备利用本地数据集进行模型训练，将训练得到的模型或更新上报给参数服务器，服务器通过以联邦平均为代表的融合算法，加权平均多个设备的本地模型，得到全局模型并下发给各设备，实现模型的更新。联邦学习框架不需要上传用户数据，从而在保障用户隐私的前提下，实现多个设备的联合学习。

2、混合专家(Mixed of Expert,MoE)

混合专家是一种神经网络，训练多个子模型，各个子模型称为专家，针对各样本，通过控制模块选择使用哪个专家推理，从而实现提升模型容量而不大幅增加计算需求。知识蒸馏是一种实现不同结构模型知识迁移的一种方法，通过将一个神经网络的输出作为另一个神经网络训练的标签，实现知识的转移。

3、本申请实施例中的术语“系统”和“网络”可被互换使用。“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A、同时存在A和B、单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如“A，B和C中的至少一个”包括A，B，C，AB，AC，BC或ABC。以及，除非有特别说明，本申请实施例提及“第一”、“第二”等序数词是用于对多个对象进行区分，不用于限定多个对象的顺序、时序、优先级或者重要程度。

请参阅图1A，为本申请实施例提供的通信系统的一个示意图。

图1A示出了本申请实施例的一种通信系统的示意图。该通信系统中包括服务器/核心网设备101、网络设备1021与1022、终端设备1031与1032。

本申请实施例中，图1A仅以1个服务器/核心网设备101、两个网络设备1021与1022以及两个终端设备1031与1032为例进行说明，在实际应用中，可以有更多的服务器/核心网设备、网络设备以及终端设备。

各终端设备接入服务器/核心网设备101的方式也可以有所不同，可以两个终端设备1031与1032通过同一个网络设备1021接入服务器/核心网设备101，也可以是一个终端设备通过一个网络设备接入服务器/核心网设备101(图1A中未示出)。

两个终端设备1031以及1032与网络设备1021之间一般通过无线网络连接，也可以通过有线网络连接，如果是通过无线网络连接，具体的连接形式可以为蜂窝状无线网络，或者是WiFi网络，或者是其他类型的无线网络。

网络设备1021以及1022与服务器/核心网设备101之间可以通过无线网络连接，也可以通过有线网络连接，如果是通过有线网络连接，一般的连接形式为光纤网络。

可选地，终端设备1031与终端设备1032可以通过无线网络或有线网络直接连接。也可以通过网络设备1021进行间接连接等，具体此处不做限定。

可以理解的是，网络设备1021与1022可以是独立于服务器/核心网设备101以外的设备，还可以是服务器/核心网设备101的人工智能(artificial intelligence，AI)节点等等。

图1A所示的通信系统可以应用于第三代合作伙伴计划(3rd generation partnership project，3GPP)相关的蜂窝系统，例如，长期演进(long term evolution，LTE)系统，第四代(4th generation，4G)通信系统，新无线(new radio，NR)系统等第五代(5th generation，5G)通信系统，还可以应用于无线保真(wireless fidelity，WiFi)系统，支持多种无线技术融合的通信系统，或者是第六代(6th generation，6G)通信系统等5G之后演进的通信系统。

本申请实施例涉及的终端设备、网络设备、服务器/核心网设备具有通信功能，还可以具有AI计算能力，这些设备可以通过本地的数据样本进行机器学习的训练，也可以接收其他设备训练的模型进行融合，发送给其他设备，从而实现多个设备的联合学习。

本申请实施例中提及的终端设备，可以是一种具有无线收发功能的设备，具体可以指用户设备(user equipment，UE)、接入终端、用户单元(subscriber unit)、用户站、移动台(mobile station)、远方站、远程终端、移动设备、用户终端、无线通信设备、用户代理或用户装置。终端设备还可以是卫星电话、蜂窝电话、智能手机、无线数据卡、无线调制解调器、机器类型通信设备、可以是无绳电话、会话启动协议(session initiation protocol，SIP)电话、无线本地环路(wireless local loop，WLL)站、个人数字处理(personal digital assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、高空飞机上搭载的通信设备、可穿戴设备、无人机、机器人、设备到设备通信(device-to-device，D2D)中的终端、车到一切(vehicle to everything，V2X)中的终端、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端或者未来通信网络中的终端设备等，本申请不作限制。

本申请实施例中提及的网络设备，可以是具有无线收发功能的设备，用于与终端设备进行通信，也可以是一种将终端设备接入到无线网络的设备。网络设备可以为无线接入网中的节点，又可以称为基站，还可以称为无线接入网(radio access network，RAN)节点(或设备)。网络设备可以是LTE中的演进型基站(evolved Node B，eNB或eNodeB)；或者5G网络中的下一代节点B(next generation node B，gNB)或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的基站，宽带网络业务网关(broadband network gateway，BNG)，汇聚交换机或者非第三代合作伙伴项目(3rd generation partnership project，3GPP)接入设备等。可选的，本申请实施例中的网络设备可以包括各种形式的基站，例如：宏基站、微基站(也称为小站)、中继站、接入点、5G之后演进的通信系统中实现基站功能的设备、WiFi系统中的接入点(access point，AP)、传输点(transmitting and receiving point，TRP)、发射点(transmitting point，TP)、移动交换中心以及设备到设备(Device-to-Device，D2D)、车辆外联(vehicle-to-everything，V2X)、机器到机器(machine-to-machine，M2M)通信中承担基站功能的设备等，还可以包括云接入网(cloud radio access network，C-RAN)系统中的集中式单元(centralized unit，CU)和分布式单元(distributed unit，DU、非陆地通信网络(non-terrestrial network，NTN)通信系统中的网络设备，即可以部署于高空平台或者卫星。本申请实施例对此不作具体限定。

本申请实施例中提及的服务器也可以理解为是AI服务器(AI Function，AIF)。核心网设备可以例如包括访问和移动管理功能(access and mobility management function，AMF)、用户面功能(user plane function，UPF)或会话管理功能(session management function， SMF)等。可以理解的是，核心网设备也可以称为核心网网元。其中，核心网网元可以用于完成注册、连接、会话管理等功能。该核心网网元主要包含网络开放功能(network exposure function，NEF)网元、策略控制功能(policy control function，PCF)网元、应用功能(application function，AF)网元、接入与移动性管理功能(access and mobility management function，AMF)网元、会话管理功能模块(session management function，SMF)网元以及用户平面功能(user plane function，UPF)网元等。

可选地，服务器(server)一般不视为核心网网元。该server包括用于实现模型处理等。

图1A所示的通信系统中，各设备可以实现多级联合学习。下面通过图1B对图1A的多级联合学习进行描述。

图1B为多级学习架构的结构图，该多级学习架构包括终端设备、第一级节点、第二级节点。这里以第一级节点为图1A所示的网络设备，第二级节点为图1A所示的服务器/核心网设备为例进行说明。图1B可以视作为一轮联合学习的过程，重复图1B的过程直到满足停止条件。该停止条件可以是模型收敛、训练时长达到预设时长或训练次数达到预设次数等。另外，第一级节点与第二级节点之间可以理解为是联邦学习层。第一级节点与终端设备之间可以理解为知识蒸馏学习层。一般情况下，终端设备与网络设备预先存储有公共数据集。当然，也可以是终端设备与网络设备交互等方式获取公共数据集，具体此处不做限定。

可以理解的是，图1B仅以第一级节点是网络设备，第二级节点是服务器/核心网设备为例进行示例性描述。在实际应用中，第一级节点与第二级节点也可以是其他终端设备等，该种情况下可以看做是终端设备的多级联合学习。对于第二级节点与第三级节点具体此处不做限定。

图1B所示的一轮联合学习包括步骤1至步骤7，下面分别进行描述。

步骤1：服务器/核心网设备触发联合学习过程，选择参与联邦学习的网络设备。并通知各网络设备参与联合学习过程。参与联邦学习的网络设备进一步选择参与联邦蒸馏的终端设备。并通知各终端设备参与联合学习过程。具体的，可以通过终端设备的能力信息和/或业务需求信息选取终端设备。能力信息可以包括以下至少一项：计算能力、存储能力等。业务需求信息包括以下至少一项：各终端设备的数据分布、各终端设备的推理任务等。

步骤2：参与联合学习过程的终端设备根据本地数据集对本地模型进行训练之后，更新后的本地模型推理公共数据集得到第一结果。并将第一结果上报给网络设备。

步骤3：网络设备根据接收到的第一结果，将公共数据集作为训练集，训练集的标签作为计算损失函数的标签，第一结果作为计算损失函数的软标签，训练网络设备侧模型。

步骤4：网络设备将训练好的网络侧设备模型上报给服务器/核心网设备。

步骤5：服务器/核心网设备将收到的网络侧设备模型进行加权平均，以得到本轮学习得到的全局模型。并将全局模型下发给各网络设备。

步骤6：网络设备用全局模型替换上述训练好的网络侧设备模型。并利用全局模型对公共数据集进行处理以得到第二结果。再将第二结果下发给终端设备。

步骤7：终端设备接收到第二结果之后，将公共数据集作为训练集，训练集的标签作为计算损失函数的标签，第二结果作为计算损失函数的软标签，训练终端侧模型。至此，完成一轮联合学习。

可以理解的是，上述步骤2、步骤3、步骤7中，也可以通过网络设备进行知识蒸馏进行终端侧模型融合，即终端设备基于本地私有数据训练本地模型，将训练得到的本地模型上报给网络设备；网络设备基于公共数据集和各终端侧模型，对网络设备侧模型通过知识蒸馏进行训练，并进一步蒸馏更新各终端侧模型，将更新后的终端侧模型并下发给终端设备进行更新。

为了更详细的了解上述联合学习的流程，下面结合图1A与图1B的通信架构，对本申请实施例中的通信方法进行描述：

请参阅图2，本申请实施例提供的通信方法的一个流程示意图，该方法可以包括步骤201至步骤207。下面对步骤201至步骤207进行详细说明。本实施例中的第一设备为前述图1A与图1B中的第一级节点/网络设备。第二设备为终端设备，第三设备为前述图1A与图1B中的服务器/核心网设备。另外，对于第一设备、第二设备以及第三设备的数量可以是一个或多个，具体此处不做限定。

步骤201，第一设备获取第一结果。

本申请实施例中第一设备获取第一结果有多种情况，下面分别进行描述。

第一种情况，该情况下的步骤201包括步骤2011与步骤2012。

步骤2011，第二设备基于第二设备侧模型推理公共数据集得到第一结果。

可选地，第二设备使用本地的第二设备侧模型推理公共数据集得到第一结果。具体的，第二设备将公共数据集中的数据输入第二设备侧模型中得到推理结果(即第一结果)。

可选地，上述的第二设备侧模型是第二设备使用本地数据进行训练得到。

步骤2012，第二设备向第一设备发送第一结果。

第二设备获取第一结果之后，向第一设备发送该第一结果。相应的，第一设备接收第二设备发送的第一结果。

第二种情况，该情况下的步骤201包括步骤2013与步骤2014。

步骤2013，第二设备向第一设备发送第二设备侧模型。

可选地，第二设备使用本地数据训练模型得到第二设备侧模型。第二设备生成第二设备侧模型之后，向第一设备发送第二设备侧模型。相应的，第一设备接收第二设备发送的第二设备侧模型。

步骤2014，第一设备基于第二设备侧模型推理公共数据集得到第一结果。

可选地，第一设备获取第二设备侧模型之后，基于第二设备侧模型推理公共数据集得到第一结果。具体的，通过第二设备侧模型推理公共数据集得到第一结果。

可以理解的是，上述两种情况只是举例，在实际应用中，第一设备获取第一结果的方式还有很多，例如从数据库中选取等方式，具体此处不做限定。

可以看出，上述两种情况下，可以根据实际需要选择。第一种情况是第二设备向第一设备上报的是第一结果。第二种情况是第二设备向第一设备上报的是第二设备侧模型，第一设备再使用第二设备侧模型推理公共数据集得到第一结果。

步骤202，第一设备基于第一结果更新第一模型以得到第二模型。

第一设备获取第一结果之后，可以基于该第一结果更新第一模型以得到第二模型。

可选地，将公共数据集作为训练集，训练集的标签作为损失函数的硬标签，第一结果作为损失函数的软标签。第一设备以该训练集作为输入，以降低损失函数的值为目标对第一模型训练以得到第二模型。其中，损失函数用于表示第一差异与第二差异。第一差异为第一模型的输出与硬标签之间的差异，第二差异为第一模型的输出与软标签之间的差异。

可选地，损失函数包括第一差异与第二差异的加权，其中，第一差异与第二差异的权重系数可以根据实际需要设置，例如，损失函数＝0.4*第一差异+0.6*第二差异。具体此处不做限定。

本步骤也可以理解为第一设备基于公共数据集与第一结果进行知识蒸馏。

另外，需要说明的是，本申请实施例中各设备交互的模型(例如第一模型、第二模型、第三模型等)可以是指整个模型，也可以是模型的权重(例如全部权重，或有增量更新的权重等，具体此处不做限定。

可以理解的是，这里的第一模型权重可以是第一模型的所有参数权重，也可以是相对于上次学习有调整的参数权重，具体此处不做限定。

步骤203，第一设备向第三设备发送第二模型。

第一设备训练/更新第一模型得到第二模型之后，向第三设备发送第二模型。相应的，第三设备接收第一设备发送的第二模型。

步骤204，第三设备基于第二模型更新第三设备侧模型以得到第三模型。

第三设备接收第一设备发送的第二模型之后。基于第二模型更新第三设备侧模型以得到第三模型。

本步骤中，第三设备获取第二模型的数量取决于参与联合学习的第一设备数量，即该第三设备可以获取多个第一设备上报的第二模型。第三设备获取多个第一设备上报的第二模型之后，基于多个第二模型更新第三设备侧模型以得到第三模型。例如，将多个第二模型与第三设备侧模型的参数进行加权平均以得到第三模型。

本步骤可以理解为，第三设备收集多个第一设备处最新的模型，并使用多个第一设备最新的模型得到全局模型(即第三模型)。例如，将多个第一设备最新的模型与第三设备侧模型的参数进行加权平均得到全局模型。

步骤205，第三设备向第一设备发送第三模型。

第三设备获取第三模型之后，向第一设备发送第三模型。相应的，第一设备接收第三设备发送的第三模型。

本步骤可以理解为，第三设备通过收集多个第一设备上报的第二模型之后，使用第二模型更新上一次的第三设备侧模型得到全局模型，并将该全局模型下发至各第一设备。

步骤206，第一设备基于公共数据集与第三模型获取第二结果。

第一设备接收第三设备发送的第三模型之后，基于公共数据集与第三模型获取第二结果。

可选地，第三模型推理公共数据集得到第二结果。

可以理解的是，在有些场景中，若第三设备存储有公共数据集，上述步骤205与步骤206则可以替换为：第三设备在获取第三模型之后，基于公共数据集与第三模型得到第二结果，并将第二结果发给第一设备。

步骤207，基于第二结果更新第二设备侧模型。

本实施例中，基于第二结果更新第二设备侧模型由多种情况，下面分别进行描述。

在一种可能实现的方式中，第一设备获取第二结果之后，向第二设备发送第二结果。第二设备基于该第二结果与公共数据集更新第二设备侧模型。例如，与前述类似，通过将公共数据集作为训练集，训练集的标签作为损失函数的硬标签，第二结果作为损失函数的软标签。第二设备以该训练集作为输入，以降低损失函数的值为目标对第二设备侧模型进行训练更新。

在另一种可能实现的方式中，第一设备处存储有第二设备侧模型(例如，通过前述步骤201的第二种情况获取第二设备侧模型)，第一设备可以基于第二结果更新第二设备侧模型。并将更新后的第二设备侧模型下发至第二设备。例如，与前述类似，通过将公共数据集作为训练集，训练集的标签作为损失函数的硬标签，第二结果作为损失函数的软标签。第一设备以该训练集作为输入，以降低损失函数的值为目标对第二设备侧模型进行训练更新。

图3为本申请实施例提供的另一种通信方法。图3可以理解为是以第一设备为基站，第二设备为终端设备，第三设备为AI服务器为例进行描述。该方法包括步骤301至步骤308。下面分别进行描述。

步骤301，AI服务器向基站发送第一触发信息。

AI服务器向基站发送第一触发信息，相应的，基站接收AI服务器发送的第一触发信息。该第一触发信息用于通知基站进行联合学习。

可选地，AI服务器可以广播该第一触发信息。该第一触发信息中可以包括以下至少一项：联合学习标识、学习区域(例如用小区标识或专用的学习区域标识表示)等。联合学习标识用于指示具体的AI任务。学习区域用于指示参与联合学习的区域，该区域内的基站可以参与联合学习。

步骤302，基站向终端设备发送第二触发信息。

基站收到第一触发信息之后，向终端设备发送第二触发信息。相应的，终端设备接收基站发送的第二触发信息。该第二触发信息用于指示终端设备进行联合学习。

可选地，基站收到第一触发信息之后，广播第二触发信息，该第二触发信息包括以下至少一项：联合学习标识、终端ID、反馈时频资源位置等。终端ID用于指示参与联合学习的终端设备，反馈时频资源位置用于指示终端反馈训练完成信息使用的物理资源。

步骤303，终端设备向基站发送训练完成信息。

终端数设备接收第二触发信息之后，分别使用本地数据训练模型，训练完成后向基站发送训练完成信息。相应的，基站接收终端设备发送的训练完成信息。该训练完成信息用于指示终端设备已对模型完成训练。

步骤304，基站向终端设备发送配置信息。

基站向终端设备发送配置信息。相应的，终端设备接收基站发送的配置信息。该配置信息用于指示终端设备上报第一结果使用的物理资源和/或传输参数等。物理资源可以是前述的反馈时频资源位置等。传输参数可以包括编码码率和/或调制阶数等。

可以理解的是，若前述第二触发信息中没有反馈时频资源位置，则配置信息可以包括反馈时频资源位置。当然，若终端设备有预设值的反馈时频资源位置，则前述第二触发信息与配置信息中可以不包括反馈时频资源位置。

步骤305，终端设备向基站发送第一结果。

终端设备使用本地训练好的模型对公共数据集进行推理得到第一结果。具体的，本地训练好的模型推理公共数据集得到第一结果。并向基站发送第一结果。相应的，基站接收终端设备发送的第一结果。

其中，关于第一结果的描述可以参考前述图1B与图2所示实施例中第一结果的描述，此处不再赘述。

步骤306，基站向AI服务器发送第一模型。

基站获取第一结果之后，可以基于第一结果与公共数据集对本地模型进行训练以得到第一模型。并向AI服务器发送第一模型。相应的，AI服务器接收基站发送的第一模型。

步骤307，AI服务器向基站发送第二模型。

AI服务器接收基站发送的第一模型之后，使用第一模型更新AI服务器的本地模型以得到第二模型。并向基站发送第二模型。相应的，基站接收AI服务器发送的第二模型。

可选地，AI服务器将多个基站上报的第一模型进行融合更新后得到第二模型，将第二模型广播给各基站。

步骤308，基站向终端设备发送第二结果。

基站收到AI服务器发送的第二模型之后，使用第二模型推理公共数据集得到第二结果。并向终端设备发送第二结果。相应的，终端设备接收基站发送的第二结果。该第二结果用于更新终端设备侧模型。

可以理解的是，图3只是以第一设备为基站，第二设备为终端设备，第三设备为AI服务器为例对各设备之间的交互进行描述。其中，关于具体过程可以参考前述图1B与图2所示实施例中的描述，此处不再赘述。

此外，上述图1B至图3所示实施例中联合学习的过程中，参与联合学习的第一设备与第二设备可以对公共数据集进行同步。从而确保交互的预测结果(例如第一结果、第二结果)是与相同公共数据集对应的。在一种可能实现的方式中，上述公共数据集的同步过程可以如图4所示，该交互流程包括步骤401与步骤402。

步骤401，第一设备向第二设备发送指示信息。

第一设备向第二设备发送指示信息。相应的，第二设备接收第一设备发送的指示信息。该指示信息用于第一设备与第二设备同步公共数据集。该同步对应的操作包括以下至少一项：增加、删除、修改等。

可选地，可以为公共数据集中的各样本配置一个索引，通过该索引指示样本。上述同步对应的操作包括：样本增加、样本删除、样本修改等。

可选地，指示信息可以通过承载于以下至少一项：无线资源控制(Radio Resource Control，RRC)信令、下行控制信息(downlink control information，DCI)、媒体接入控制信息中的控制单元(Medium Access Control Control Element，MAC CE)等。

步骤402，第二设备向第一设备发送确认信息。

第二设备接收指示信息之后，进行公共数据集的增加、删除、修改等操作。并向第一设备发送确认信息，该确认信息用于同步公共数据集。

可选地，确认信息可以包括最新的公共数据集，也可以包括增量更新的公共数据集，还可以包括待修改样本的索引以及修改后的内容，还可以包括待删除样本的索引等，具体此处不做限定。

本实施例，参与联合学习的第一设备与第二设备可以对公共数据集进行同步。从而确保交互的预测结果(例如第一结果、第二结果)是与相同公共数据集对应的。

请参阅图5，本申请实施例提供的通信方法的另一个流程示意图，该方法可以包括步骤501至步骤508。下面对步骤501至步骤508进行详细说明。本实施例中的第一设备与第二设备可以是前述图1A至图4所示实施例中的终端设备与网络设备，也可以是网络设备与服务器/核心网络设备，具体此处不做限定。即图5所示实施例可以与图1A至图4所示实施例结合。

步骤501，第二设备获取第一模型。

第二设备获取第一模型，该第一模型基于第二设备的第一信息与第二模型得到。第一模型为第二模型的一部分。第一信息包括能力信息和/或业务需求信息。

其中，第一模型为第二模型的一部分有多种情况。

在一种可能实现的方式中，第一模型与第二模型的网络层数相同，第一模型中各网络层数的子网络为第二模型中对应各网络层数的子网络的一部分。该种情况下，第二模型包括N层第一网络，N层第一网络中至少一层第一网络包括两个以上并行的子网络，第一模型包括N层第二网络，第一数量小于第二数量，第一数量为N层第二网络中至少一层第二网络包括子网络的数量，第二数量为N层第一网络中对应至少一层第二网络的第一网络所包括子网络的数量，N为正整数。

示例性的，第二模型如图6所示。该第二模型包括n层第一网络，n为大于2的整数。n层第一网络包括：第一层第一网络NN1，第二层第一网络NN2，...，第n层第一网络NNn。其中，第一层第一网络NN1包括K个子网络：子网络NN1-1，子网络NN1-2，...，子网络NN1-K。第二层第一网络NN2包括L个子网络：子网络NN2-1，子网络NN2-2，...，子网络NN2-L。第n层第一网络NNn包括M个子网络：子网络NNn-1，子网络NNn-2，...，子网络NNn-M。其中，K、L、M为正整数。第一模型如图7A所示，第一模型包括n层第二网络。n层第二网络包括：第一层第二网络NN1，第二层第二网络NN2，...，第n层第二网络NNn。其中，第一层第二网络NN1包括K-P个子网络：子网络NN1-1，...，子网络NN1-(K-P)。第二层第二网络NN2包括L个子网络：子网络NN2-1，子网络NN2-2，...，子网络NN2-L。第n层第二网络NNn包括M个子网络：子网络NNn-1，子网络NNn-2，...，子网络NNn-M。其中， P为大于0小于K的正整数。可以理解的是，图6与图7A只是第二模型与第一模型的举例，用于描述第一模型为第二模型的一部分的一种情况。

在另一种可能实现的方式中，第一模型与第二模型的网络层数不同，第二模型中所有网络层中的部分网络层为第一模型。该种情况下，第一模型包括N层第一网络，第二模型包括M层第一网络，N与M为正整数，且M小于或等于N。

示例性的，延续第二模型如图6的举例。第一模型如图7B所示，第一模型包括n-m层第二网络。n-m层第二网络包括：第一层第二网络NN1，...，第n-m层第二网络NN(n-m)。其中，第一层第二网络NN1包括K个子网络：子网络NN1-1，子网络NN1-2，...，子网络NN1-K。第n-m层第二网络NN(n-m)包括Q个子网络：子网络NN(n-m)-1，子网络NN(n-m)-2，...，子网络NNNN(n-m)-Q。其中，Q与m为正整数。可以理解的是，图6与图7B只是第二模型与第一模型的举例，用于描述第一模型为第二模型的一部分的另一种情况。

另外，第二设备的能力信息用于确定第一模型中子网络的数量。业务需求信息用于确定各子网络。能力信息可以包括以下至少一项：计算能力、存储能力等。业务需求信息包括以下至少一项：各第二设备的数据分布、各第二设备的推理任务等。

本申请实施例中第二设备获取第一模型有多种情况，下面分别进行描述。

第一种情况，该情况下的步骤501包括步骤5011与步骤5012。

步骤5011，第一设备向第二设备发送第二模型。

第一设备向第二设备发送第一设备处的第二模型。相应的，第二设备接收第一设备发送的第二模型。该第二模型也可以理解为是具有多个专家(即第一网络/第二网络)的大模型。

步骤5012，第二设备基于第一信息从第二模型中确定第一模型。

第二设备获取第二模型之后，可以基于第一信息从第二模型中确定第一模型。

具体的，可以通过能力信息确定第一模型中子网络的数量。通过业务需求信息用于确定各子网络。从而确定从第二模型中选择哪些子网络作为第一模型。

从第二模型中确定第一模型可以理解为是在第二模型中确定一条或多条路径作为第一模型。该路径用于表示从第二模型中选择的子网络。

可选地，第二模型中可以包括路径选择模块以及与第一网络匹配的专家选择模块。该专家选择模块用于确定第一网络中的子网络。其中，路径选择模块用于确定后续在第二模型中每层第一网络中选择子网络的数量。该路径选择模块的输入信息包括以下至少一项：终端ID、终端的能力信息、终端的业务需求信息、输入样本、路径数量等。路径选择模块的输出为与输入样本同样维度的向量或所有样本的平均值。专家选择模块接收路径选择模块发送的信息(例如，输入样本、路径数量等)，输出各子网络的权重。专家选择模块的数量可以是一个或多个。在专家选择模块的数量为1个时，该专家选择模块用于对第二模型中所有层第一网络的子网络进行选择。在专家选择模块的数量与第二模型中第一网络的数量相同时，每层第一网络可以对应一个专家选择模块，用于确定各自第一网络层中的子网络。另外，专家选择模块从每层第一网络中选择子网络的数量可以是一个或多个，具体此处不做限定。若专家选择模块从每层第一网络中确定一个子网络，则各层第一网络被选择的子网络连接起来可以视为一条路径。

另外，上述的路径控制模块可以不参与第二模型的推理。即第二模型是部署包含所有路径的模型，在具体推理的时候，专家选择模块会根据输入样本，确定选择其中的一个路径对样本进行处理，从而确定路径上子网络的权重。

示例性的，以第二模型如图8A(即图6中的N、M、L、K为3)，第一模型如图8B所示。描述上述从第二模型中确定第一模型的过程。如图8A所示，第二模型包括3层第一网络。分别为：第一层第一网络NN1，第二层第一网络NN2，第三层第一网络NN3。第一层第一网络NN1包括：子网络NN1-1，子网络NN1-2，子网络NN1-3。第二层第一网络NN2包括：子网络NN2-1，子网络NN2-2，子网络NN2-3。第三层第一网络NN3包括：子网络NN3-1，子网络NN2-3，子网络NN3-3。另外，多个第一网络可以匹配一个专家选择模块，当然，为了提升模型的总体性能，也可以每一层第一网络可以匹配一个专家选择模块。例如，专家选择模块1用于确定第一层第一网络中选取的子网络。专家选择模块2用于确定第二层第一网络中选取的子网络。专家选择模块3用于确定第三层第一网络中选取的子网络。以从每一层第一网络中选取一个子网络为例(即选择一个路径)，专家选择模块输出各子网络的权重之后，可以在每一层第一网络中选择权重较大的子网络作为第一模型的子网络。如图8A所示，第一层第一网络NN1中子网络NN1-1的权重为0.1，子网络NN1-2的权重为0.7，子网络NN1-3的权重为0.1。第二层第一网络NN2中子网络NN2-1的权重为0.05，子网络NN2-2的权重为0.6，子网络NN2-3的权重为0.1。第三层第一网络NN3中子网络NN3-1的权重为0.8，子网络NN3-2的权重为0.02，子网络NN3-3的权重为0.08。可以看出，子网络NN1-2的权重为0.7是第一层第一网络NN1中最大的权重。子网络NN2-2的权重为0.6是第二层第一网络NN2中最大的权重。子网络NN3-1的权重为0.8是第三层第一网络NN3中最大的权重。从而确定出一个路径：子网络NN1-2、子网络NN2-2、子网络NN3-1。进而基于上述过程确定的第一模型如图8B所示。

可以理解的是，上述图8A与图8B只是举例，在实际应用中，第二模型与第一模型还可以有其他情况，以及第一模型包括的路径也可以是多个，具体此处不做限定。

可选地，上述图8B是前述第一模型为第二模型的一部分的第一种情况。对于前述第一模型为第二模型的一部分的第二种情况，例如，对于应用于联合推理的自编码器等结构，网络还可能将模型切分成两个部分，相应地，选择的路径也分成两个部分。对于分割的模型，其中一部分部署在第二设备(例如终端)，另一部分部署在第一设备(例如基站)，如用于信道信息反馈的编码器和解码器。例如，在第二模型包括编码器与解码器的情况，第一模型可以是第二模型中的编码器或解码器中的一部分。对于每个终端，基站需要维护路径信息，以便在联合推理的时候，选择与对应的路径，即与编码器配对的解码器。对于分割的神经网络，可以通过分割学习，即终端和基站通过交互中间特征和梯度实现模型的训练。

第二种情况，该情况下的步骤501包括步骤5013至步骤5015。

步骤5013，第二设备向第一设备发送第一信息。

第二设备向第一设备发送第一信息。相应的，第一设备接收第二设备发送的第一信息。该第一信息的描述可以参考前述，此处不再赘述。

步骤5014，第一设备基于第一信息从第二模型中确定第一模型。

本步骤与前述5012的步骤类似，此处不再赘述赘述。

步骤5015，第一设备向第二设备发送第一模型。

第一设备从第二模型中确定第一模型之后，向第二设备发送第一模型。相应的，第二设备接收第一设备发送的第一模型。

可以看出，上述两种情况下，可以根据实际需要选择。第一种情况是第一设备向第二设备发送第二模型。进而第二设备根据第一信息从第二模型中确定第一模型。第二种情况是第二设备向第一设备上报的是第一信息。进而第一设备根据第一信息从第二模型中确定第一模型，并将第一模型发给第二设备。

步骤502，第一设备向第二设备发送第一参数。本步骤是可选地。

可选地，第一设备获取第一模型之后，还可以向第二设备发送第一参数。相应的，第二设备接收第一设备发送的第一参数。该第一参数用于指示对子网络的调整。

其中，第一参数可以包括以下至少一项：第一模型子网络的增加、删除等。

步骤503，第二设备基于第一参数更新第一模型。本步骤是可选地。

可选地，第二设备接收第一参数之后，基于第一参数更新第一模型。

具体的，第二设备通过接收到的第一参数对第一模型中的子网络进行增加、删除、修改等操作。

可以理解的是，步骤502与步骤503的过程是第一设备触发的。在实际应用中，子网络的调整过程也可以是第二设备触发的，例如，联合学习中增加有新的终端等，具体此处不做限定。

步骤504，第二设备基于本地数据训练第一模型得到第三模型。本步骤是可选地。

可选地，第二设备获取第一模型之后，基于本地数据训练第一模型以得到第三模型。该过程也可以理解为第二设备对第一模型的微调，使得微调后的第三模型更能满足第二设备处数据的推理。

步骤505，第二设备向第一设备发送第三模型。本步骤是可选地。

可选地，第二设备微调第一模型得到第三模型之后，向第一设备发送第三模型。相应的，第一设备接收第二设备发送的第三模型。

步骤506，第一设备基于第三模型更新第二模型得到第四模型。本步骤是可选地。

可选地，第一设备接收第三模型之后，使用第三模型更新本地的第二模型以得到第四模型。

本步骤也可以理解为，基站通过接收下游终端上报的最新模型，调整基站侧的第二模型以得到第四模型。例如，将各终端处模型(即各第一模型)的相同子网络进行融合处理得到第四模型。

步骤507，第一设备向第二设备发送第四模型。本步骤是可选地。

可选地，第一设备获取第四模型之后，可以向第二设备发送第四模型。相应的，第二设备接收第一设备发送的第四模型。

本步骤可以理解为，基站将各终端处模型的相同子网络进行融合处理后得到第四模型。并将第四模型下发至第二设备，使得第二设备根据该第三模型更新本地模型。

步骤508，第二设备基于第四模型更新第三模型。本步骤是可选地。

可选地，第二设备获取第四模型之后，使用该第四模型更新本地的第三模型。

另外，本实施例的步骤501、步骤504至步骤508可以理解为是联合学习。具体的，网络设备侧基于已有数据训练多专家大模型(即第二模型)。终端设备或网络设备基于能力信息/业务需求信息，确定由一个或多个专家路径确定的子模型(即第一模型)。各终端设备基于本地数据训练得到训练好的子模型(即第三模型)并上报。网络设备根据各终端设备上报的子模型的相同部分进行融合，并将融合后的模型(即第四模型)下发给终端设备，使得终端设备对本地模型进行更新。其中，网络设备或终端设备需要维护终端ID和子模型的路径信息，用于网络设备侧模型融合时参与各模块模型的平均。训练完成后，各终端设备基于子模型推理，网络设备基于大模型推理。终端设备可进一步基于子模型进行知识蒸馏得到更小或更适合本地硬件的模型。

在一种可能实现的方式中，本实施例提供的通信方法包括步骤501。该种情况下，该通信方法可以根据终端的能力信息和/或业务需求信息从第二模型中确定第一模型。且终端的数据都采用这一路径(即第一模型中的子网络)进行推理。

在另一种可能实现的方式中，本实施例提供的通信方法包括步骤501至503。该种情况下，该通信方法可以根据终端的能力信息和/或业务需求信息从第二模型中确定第一模型。且终端的数据都采用这一路径(即第一模型中的子网络)进行推理。此外，还可以实现第一模型中子网络的及时调整。

在另一种可能实现的方式中，本实施例提供的通信方法包括步骤501、步骤504至步骤508。该通信方法可以根据终端的能力信息和/或业务需求信息从第二模型中确定第一模型。且终端的数据都采用这一路径(即第一模型中的子网络)进行推理。此外，可以适用于联合学习场景。该种情况下，

在另一种可能实现的方式中，本实施例提供的通信方法包括步骤501至508。

请参阅图9，本申请实施例提供的通信方法的另一个流程示意图，该方法可以包括步骤901至步骤903。下面对步骤901至步骤903进行详细说明。本实施例中的第一设备与第二设备可以是前述图1A至图4所示实施例中的终端设备与网络设备，也可以是网络设备与服务器/核心网络设备，具体此处不做限定。即图9所示实施例可以与图1A至图8B所示实施例结合。

步骤901，第二设备向第一设备发送第一信息。

第二设备向第一设备发送第一信息。相应的，第一设备接收第二设备发送的第一信息。该第一信息包括第二设备的能力信息和/或业务需求信息。

可选地，能力信息可以包括以下至少一项：计算能力、存储能力等。业务需求信息包括以下至少一项：第二设备的数据分布、第二设备的推理任务等。

步骤902，第一设备向第二设备发送指示信息。

第一设备获取第二设备的第一信息之后，基于该第一信息确定模型的学习模式为联邦学习模式，还是蒸馏学习模式。确定学习模式之后，向第二设备发送指示信息。相应的第二设备接收第一设备发送的指示信息。该指示信息用于指示学习模式为联邦学习模式或蒸馏学习模式。

例如，对于计算能力较差的第二设备，适用小模型。从而确定该第二设备的学习模式为蒸馏学习模式(也可以称为知识蒸馏模式)。又例如，对于计算能力较强的第二设备，适用大模型。从而确定该第二设备的学习模式为联邦学习模式。

步骤903，第二设备基于指示信息发送第二信息。

第二设备接收到指示信息，根据该指示信息确定出学习模式。并基于该指示信息确定向第一设备发送的第二信息。该第二信息用于更新第一设备侧模型。

在一种可能实现的方式中，在蒸馏学习模式下，第二信息为第二设备侧模型推理公共数据集得到的第一结果。

在另一种可能实现的方式中，在联邦学习模式下，第二信息为第二设备侧模型的权重或梯度。

本实施例中，第一设备通过第二设备的能力信息/业务需求信息来确定与第二设备匹配的学习模式，从而可以灵活适用模型训练的场景，提升模型训练效率。

可以看出，基于学习模式的不同，通信流程有所不同。下面以两个UE、一个基站为例结合图10与图11分别进行描述。

第一种，蒸馏学习模式(或称为知识蒸馏模式)。

如图10所示，该通信流程包括步骤1001至步骤1006。

步骤1001，UE1与UE2向基站发送第一信息。

UE1与UE2向基站发送第一信息。UE1的第一信息包括UE1的能力信息和/或业务需求信息。UE2的第一信息包括UE2的能力信息和/或业务需求信息。

其中，能力信息可以包括以下至少一项：计算能力、存储能力等。业务需求信息包括以下至少一项：第二设备的数据分布、第二设备的推理任务等。

步骤1002，基站向UE1与UE2发送指示信息(知识蒸馏)。

基站基于UE1与UE2的第一信息确定学习模式为知识蒸馏模式。并向UE1与UE2发送指示信息，该指示信息用于指示学习模式为知识蒸馏模式。

步骤1003，UE1与UE2本地训练。

UE1与UE2确定学习模式为知识蒸馏模式之后，通过各自的本地数据训练模型。并基于训练好的模型与公共数据集得到推理结果(即第一结果)。

步骤1004，UE1与UE2向基站发送第一结果。

UE1与UE2获取第一结果之后，向基站上报第一结果。

步骤1005，基站模型训练。

基站接收UE1与UE2发送的第一结果之后，使用第一结果对基站侧模型进行更新。并基于更新后的模型与公共数据集得到推理结果(即第二结果)。

步骤1006，基站向UE1与UE2发送第二结果。

基站获取第二结果之后，向UE1与UE2发送第二结果，该第二结果用于UE1与UE2更新各自的本地模型。

图10所示实施例的流程与前述图1B中第一级节点与终端设备之间的流程类似，此处对于类似的描述不再赘述。

第二种，联邦学习模式。

如图11所示，该通信流程包括步骤1101至步骤1106。

步骤1101，UE1与UE2向基站发送第一信息。

步骤1102，基站向UE1与UE2发送指示信息(联邦学习)。

基站基于UE1与UE2的第一信息确定学习模式为联邦学习模式。并向UE1与UE2发送指示信息，该指示信息用于指示学习模式为联邦学习模式。

步骤1103，UE1与UE2本地训练。

UE1与UE2确定学习模式为联邦学习模式之后，通过各自的本地数据训练模型。并得到训练好的模型的权重/梯度。

步骤1104，UE1与UE2向基站发送权重/梯度。

UE1与UE2获取权重/梯度之后，向基站上报权重/梯度。

步骤1105，基站模型训练。

基站接收UE1与UE2发送的权重/梯度之后，使用权重/梯度对基站侧模型进行更新。并将更新后模型权重/梯度(可以称为更新后的权重/梯度)。

步骤1106，基站向UE1与UE2发送更新后的权重/梯度。

基站获取第二结果之后，向UE1与UE2发送更新后的权重/梯度，该更新后的权重/梯度用于UE1与UE2更新各自的本地模型。

本实施例中，基站通过UE的能力信息/业务需求信息来确定与UE匹配的学习模式，从而可以灵活适用模型训练的场景，提升模型训练效率。

另外，本申请实施例还提供了一种终端与终端之间的通信流程。该场景如图12所示，该场景以1个基站与4个UE为例。

该场景下，基站未存储有公共数据集，只做数据转发。可以将能力(例如计算能力、存储能力等)强的UE负责大模型融合和维护。各UE根据本地数据训练本地模型。直连UE通过D2D传输模型，融合节点根据本地数据融合模型，包括蒸馏到小模型后发送给其他节点。非直连UE通过基站转发模型，融合节点根据本地数据融合模型后发送给基站。基站可作为融合模型存储节点和融合终端调度节点。模型融合终端的ID作为模型传输的目的地标识。

本实施例中，可以将较强能力的UE负责大模型融合和维护。从而实现通过D2D或者基站中转实现模型传输，实现模型训练过程。

上面对本申请实施例中的通信方法进行了描述，下面对本申请实施例中的相关设备进行描述。

请参阅图13，本申请实施例中第一设备的一个实施例包括：

获取单元1301，用于获取第一结果，第一结果为第二设备侧模型推理公共数据集得到的结果；

更新单元1302，用于基于公共数据集与第一结果更新第一模型以得到第二模型，第一模型为第一设备的本地模型；

发送单元1303，用于向第三设备发送第二模型；

接收单元1304，用于接收第三设备发送的第三模型，第三模型由第二模型处理得到；

获取单元1301，还用于基于第三模型与公共数据集获取第二结果，第二结果用于更新第二设备侧模型。

可选地，获取单元1301，具体用于接收来自第二设备的第一结果，第一结果为第二设备使用第二设备侧模型推理公共数据集得到的结果。

可选地，获取单元1301，具体用于接收来自第二设备的第二设备侧模型；获取单元1301，具体用于使用第二设备侧模型推理公共数据集得到第一结果。

可选地，发送单元1303，还用于向第二设备发送第二结果，第二结果用于第二设备更新第二设备侧模型。

可选地，更新单元1302，还用于基于第二结果更新第二设备侧模型；发送单元1303，还用于向第二设备发送更新后的第二设备侧模型。

可选地，发送单元1303，还用于向第二设备发送指示信息，指示信息用于第一设备与第二设备同步公共数据集，同步对应的操作包括以下至少一项：增加、删除、修改；接收单元1304，还用于接收第二设备发送的确认信息，确认信息用于同步公共数据集。

本实施例中，第一设备中各单元所执行的操作与前述图1A至图12所示实施例中描述的类似，此处不再赘述。

本实施例中，更新单元1302根据下游第二设备侧模型的第一结果更新本地模型，发送单元1303向上游第三设备发送更新后的本地模型。从而接收单元1304接收上游第三设备根据第二设备更新的模型处理得到的第三模型。进而根据该第三模型更新对公共数据集新的第二结果，该第二结果用于更新下游第二设备侧模型。可以看出，第一设备在多级联合学习场景下，充分利用计算能力参与联合训练。相较于中间级只做转发的方案，可以减少上游设备的处理流程，从而增加多级联合学习的学习效率。

请参阅图14，本申请实施例中第二设备的一个实施例包括：

获取单元1401，用于获取第一模型，第一模型基于第二设备的第一信息与第二模型得到，第一模型为第二模型的一部分；第一信息包括能力信息和/或业务需求信息。

可选地，第二模型包括N层第一网络，N层第一网络中至少一层第一网络包括两个以上并行的子网络，第一模型包括N层第二网络，第一数量小于第二数量，第一数量为N层第二网络中至少一层第二网络包括子网络的数量，第二数量为N层第一网络中对应至少一层第二网络的第一网络所包括子网络的数量，N为正整数。

可选地，第二设备还包括：接收单元1402，用于接收来自第一设备的第一参数，第一参数用于指示对子网络的调整；

可选地，第二设备还包括：更新单元1403，用于基于第一参数更新第一模型。

可选地，接收单元1402，用于接收来自第一设备的第二模型；获取单元1401，具体用于基于第一信息从第二模型中确定第一模型。

可选地，获取单元1401，具体用于基于第一信息确定N层第一网络中各层第一网络的子网络；获取单元1401，具体用于基于子网络构建第一模型。

可选地，能力信息用于确定N层第二网络中各第二网络的子网络的数量，业务需求信息用于确定各第二网络中子网络。

可选地，获取单元1401，具体用于向第一设备发送第一信息，第一信息用于第一设备从第二模型中确定第一模型；获取单元1401，具体用于接收第一设备发送的第一模型。

可选地，更新单元1403，用于基于本地数据训练第一模型得到第三模型；发送单元1404，用于向第一设备发送第三模型，第三模型用于第一设备更新第二模型。

可选地，获取单元1401，还用于获取第四模型，第四模型由第三模型更新第二模型得到；更新单元1403，用于基于第四模型更新第三模型。

可选地，第一模型包括N层第一网络，第二模型包括M层第一网络，N与M为正整数，且M小于或等于N。

本实施例中，第二设备中各单元所执行的操作与前述图1A至图12所示实施例中描述的类似，此处不再赘述。

本实施例中，第二设备可以通过第二设备的能力信息和/或业务需求信息从第二模型中确定第一模型。且第二设备的数据都采用这一路径(即第二模型的一个子结构)进行推理。

请参阅图15，本申请实施例中第一设备的另一个实施例包括：

接收单元1501，用于接收第二设备发送的第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

确定单元1502，用于确定第一设备与第二设备的学习模式，学习模式为联邦学习模式或蒸馏学习模式；

发送单元1503，用于向第二设备发送指示信息，指示信息用于指示学习模式；

接收单元1501，还用于接收第二设备发送的第二信息，第二信息用于更新第一设备侧的模型。

可选地，在联邦学习模式下，第二信息为模型的权重或梯度。

可选地，在蒸馏学习模式下，第二信息为模型推理公共数据集得到的结果。

请参阅图16，本申请实施例中第二设备的另一个实施例包括：

发送单元1601，用于向第一设备发送第一信息，第一信息包括第二设备的能力信息和/或业务需求信息，第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

接收单元1602，用于接收第一设备发送的指示信息，指示信息用于指示学习模式；

发送单元1601，用于基于学习模式向第一设备发送第二信息，第二信息用于更新第一设备侧的模型。

请参阅图17，为本申请的实施例提供的上述实施例中所涉及的第二设备的结构示意图，其中，该第二设备具体可以为前述实施例中的第二设备/网络设备，该第二设备的结构可以参考图17所示的结构。

第二设备包括至少一个处理器1711、至少一个存储器1712、至少一个收发器1713、至少一个网络接口1714和一个或多个天线1715。处理器1711、存储器1712、收发器1713和网络接口1714相连，例如通过总线相连，在本申请实施例中，所述连接可包括各类接口、传输线或总线等，本实施例对此不做限定。天线1715与收发器1713相连。网络接口1714用于使得第二设备通过通信链路，与其它通信设备相连，例如网络接口1714可以包括第二设备与核心网设备之间的网络接口，例如S1接口，网络接口可以包括第二设备和其他网络设备(例如其他接入网设备或者核心网设备)之间的网络接口，例如X2或者Xn接口。

处理器1711主要用于对通信协议以及通信数据进行处理，以及对整个第二设备进行控制，执行软件程序，处理软件程序的数据，例如用于支持第二设备执行实施例中所描述的动作。第二设备可以可以包括基带处理器和中央处理器，基带处理器主要用于对通信协议以及通信数据进行处理，中央处理器主要用于对整个终端设备进行控制，执行软件程序，处理软件程序的数据。图17中的处理器1711可以集成基带处理器和中央处理器的功能，本领域技术人员可以理解，基带处理器和中央处理器也可以是各自独立的处理器，通过总线等技术互联。本领域技术人员可以理解，终端设备可以包括多个基带处理器以适应不同的网络制式，终端设备可以包括多个中央处理器以增强其处理能力，终端设备的各个部件可以通过各种总线连接。所述基带处理器也可以表述为基带处理电路或者基带处理芯片。所述中央处理器也可以表述为中央处理电路或者中央处理芯片。对通信协议以及通信数据进行处理的功能可以内置在处理器中，也可以以软件程序的形式存储在存储器中，由处理器执行软件程序以实现基带处理功能。

存储器主要用于存储软件程序和数据。存储器1712可以是独立存在，与处理器1711相连。可选的，存储器1712可以和处理器1711集成在一起，例如集成在一个芯片之内。其中，存储器1712能够存储执行本申请实施例的技术方案的程序代码，并由处理器1711来控制执行，被执行的各类计算机程序代码也可被视为是处理器1711的驱动程序。

图17仅示出了一个存储器和一个处理器。在实际的终端设备中，可以存在多个处理器和多个存储器。存储器也可以称为存储介质或者存储设备等。存储器可以为与处理器处于同一芯片上的存储元件，即片内存储元件，或者为独立的存储元件，本申请实施例对此不做限定。

收发器1713可以用于支持第二设备与终端之间射频信号的接收或者发送，收发器1713可以与天线1715相连。收发器1713包括发射机Tx和接收机Rx。具体地，一个或多个天线1715可以接收射频信号，该收发器1713的接收机Rx用于从天线接收所述射频信号，并将射频信号转换为数字基带信号或数字中频信号，并将该数字基带信号或数字中频信号提供给所述处理器1711，以便处理器1711对该数字基带信号或数字中频信号做进一步的处理，例如解调处理和译码处理。此外，收发器1713中的发射机Tx还用于从处理器1711接收经过调制的数字基带信号或数字中频信号，并将该经过调制的数字基带信号或数字中频信号转换为射频信号，并通过一个或多个天线1715发送所述射频信号。具体地，接收机Rx可以选择性地对射频信号进行一级或多级下混频处理和模数转换处理以得到数字基带信号或数字中频信号，所述下混频处理和模数转换处理的先后顺序是可调整的。发射机Tx可以选择性地对经过调制的数字基带信号或数字中频信号时进行一级或多级上混频处理和数模转换处理以得到射频信号，所述上混频处理和数模转换处理的先后顺序是可调整的。数字基带信号和数字中频信号可以统称为数字信号。

收发器也可以称为收发单元、收发机、收发装置等。可选的，可以将收发单元中用于实现接收功能的器件视为接收单元，将收发单元中用于实现发送功能的器件视为发送单元，即收发单元包括接收单元和发送单元，接收单元也可以称为接收机、输入口、接收电路等，发送单元可以称为发射机、发射器或者发射电路等。

需要说明的是，图17所示第二设备具体可以用于实现图1A至图12所示方法实施例中网络设备所实现的步骤，并实现网络设备对应的技术效果，图17所示第二设备的具体实现方式，均可以参考图1A至图12所示方法实施例中的叙述，此处不再一一赘述。

请参阅图18，本申请实施例提供了另一种第二设备。为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该第二设备可以为包括手机、平板电脑、个人数字助理(personal digital assistant，PDA)、销售终端设备(point of sales，POS)、车载电脑等任意终端设备，以终端设备为手机为例：

图18示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图18，手机包括：射频(radio frequency，RF)电路1810、存储器1820、输入单元1830、显示单元1840、传感器1850、音频电路1860、无线保真(wireless fidelity，WiFi)模块1870、处理器1880、以及电源1890等部件。本领域技术人员可以理解，图18中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图18对手机的各个构成部件进行具体的介绍：

RF电路1810可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1880处理；另外，将设计上行的数据发送给基站。通常，RF电路1810包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noise amplifier，LNA)、双工器等。此外，RF电路1810还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(global system of mobile communication，GSM)、通用分组无线服务(general packet radio service，GPRS)、码分多址(code division multiple access，CDMA)、宽带码分多址(wideband code division multiple access，WCDMA)、长期演进(long term evolution，LTE)、电子邮件、短消息服务(short messaging service，SMS)等。

存储器1820可用于存储软件程序以及模块，处理器1880通过运行存储在存储器1820的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1820可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1820可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1830可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1830可包括触控面板1831以及其他输入设备1832。触控面板1831，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1831上或在触控面板1831附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1831可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1880，并能接收处理器1880发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1831。除了触控面板1831，输入单元1830还可以包括其他输入设备1832。具体地，其他输入设备1832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1840可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1840可包括显示面板1841，可选的，可以采用液晶显示器(liquid crystal display，LCD)、有机发光二极管(organic light-emitting diode，OLED)等形式来配置显示面板1841。进一步的，触控面板1831可覆盖显示面板1841，当触控面板1831检测到在其上或附近的触摸操作后，传送给处理器1880以确定触摸事件的类型，随后处理器1880根据触摸事件的类型在显示面板1841上提供相应的视觉输出。虽然在图18中，触控面板1831与显示面板1841是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1831与显示面板1841集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1850，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1841的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1841和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1860、扬声器1861，传声器1862可提供用户与手机之间的音频接口。音频电路1860可将接收到的音频数据转换后的电信号，传输到扬声器1861，由扬声器1861转换为声音信号输出；另一方面，传声器1862将收集的声音信号转换为电信号，由音频电路1860接收后转换为音频数据，再将音频数据输出处理器1880处理后，经RF电路1810以发送给比如另一手机，或者将音频数据输出至存储器1820以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图18示出了WiFi模块1870，但是可以理解的是，其并不属于手机的必须构成。

处理器1880是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1820内的软件程序和/或模块，以及调用存储在存储器1820内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器1880可包括一个或多个处理单元；优选的，处理器1880可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1880中。

手机还包括给各个部件供电的电源1890(比如电池)，优选的，电源可以通过电源管理系统与处理器1880逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端设备所包括的处理器1880可以执行前述图1A至图12所示实施例中的功能，此处不再赘述。

本申请实施例还提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，该处理器执行如前述实施例中第一设备/第二设备/第三设备可能的实现方式所述的方法。

本申请实施例还提供一种存储一个或多个计算机的计算机程序产品(或称计算机程序)，当计算机程序产品被该处理器执行时，该处理器执行上述第一设备/第二设备/第三设备可能实现方式的方法。

本申请实施例还提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持终端设备实现上述第一设备/第二设备/第三设备可能的实现方式中所涉及的功能。可选的，所述芯片系统还包括接口电路，所述接口电路为所述至少一个处理器提供程序指令和/或数据。在一种可能的设计中，该芯片系统还可以包括存储器，存储器，用于保存该终端设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，read-only memory)、随机存取存储器(RAM，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种通信方法，其特征在于，所述方法应用于第一设备，所述方法包括：

获取第一结果，所述第一结果为第二设备侧模型推理公共数据集得到的结果；

基于所述公共数据集与所述第一结果更新第一模型以得到第二模型，所述第一模型为所述第一设备的本地模型；

向第三设备发送第二模型；

接收所述第三设备发送的第三模型，所述第三模型由所述第二模型处理得到；

基于所述第三模型与所述公共数据集获取第二结果，所述第二结果用于更新所述第二设备侧模型。
根据权利要求1所述的方法，其特征在于，所述获取第一结果，包括：

接收来自第二设备的第一结果，所述第一结果为所述第二设备使用所述第二设备侧模型推理所述公共数据集得到的结果。
根据权利要求1所述的方法，其特征在于，所述获取第一结果，包括：

接收来自所述第二设备的所述第二设备侧模型；

使用所述第二设备侧模型推理所述公共数据集得到所述第一结果。
根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

向第二设备发送所述第二结果，所述第二结果用于所述第二设备更新所述第二设备侧模型。
根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

基于所述第二结果更新所述第二设备侧模型；

向所述第二设备发送更新后的第二设备侧模型。
根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

向所述第二设备发送指示信息，所述指示信息用于所述第一设备与所述第二设备同步所述公共数据集，所述同步对应的操作包括以下至少一项：增加、删除、修改；

接收所述第二设备发送的确认信息，所述确认信息用于同步所述公共数据集。
一种通信方法，其特征在于，所述方法应用于第二设备，所述方法包括：

获取第一模型，所述第一模型基于所述第二设备的第一信息与第二模型得到，所述第一模型为所述第二模型的一部分；所述第一信息包括能力信息和/或业务需求信息。
根据权利要求7所述的方法，其特征在于，所述第二模型包括N层第一网络，所述N层第一网络中至少一层第一网络包括两个以上并行的子网络，所述第一模型包括N层第二网络，第一数量小于第二数量，所述第一数量为所述N层第二网络中至少一层第二网络包括子网络的数量，所述第二数量为所述N层第一网络中对应所述至少一层第二网络的第一网络所包括子网络的数量，N为正整数。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

接收来自第一设备的第一参数，所述第一参数用于指示对所述子网络的调整；

基于所述第一参数更新所述第一模型。
根据权利要求7至9中任一项所述的方法，其特征在于，所述方法还包括：

接收来自第一设备的所述第二模型；

所述获取第一模型，包括：

基于所述第一信息从所述第二模型中确定所述第一模型。
根据权利要求10所述的方法，其特征在于，所述基于所述第一信息从所述第二模型中确定所述第一模型，包括：

基于所述第一信息确定所述N层第一网络中各层第一网络的子网络；

基于所述子网络构建所述第一模型。
根据权利要求7至11中任一项所述的方法，其特征在于，所述能力信息用于确定所述N层第二网络中各第二网络的子网络的数量，所述业务需求信息用于确定所述各第二网络中子网络。
根据权利要求7至9中任一项所述的方法，其特征在于，所述获取第一模型，包括：

向所述第一设备发送所述第一信息，所述第一信息用于第一设备从所述第二模型中确定所述第一模型；

接收所述第一设备发送的所述第一模型。
根据权利要求7至13中任一项所述的方法，其特征在于，所述方法还包括：

基于本地数据训练所述第一模型得到第三模型；

向所述第一设备发送所述第三模型，所述第三模型用于所述第一设备更新所述第二模型。
根据权利要求14所述的方法，其特征在于，所述方法还包括：

获取第四模型，所述第四模型由所述第三模型更新所述第二模型得到；

基于所述第四模型更新所述第三模型。
根据权利要求7所述的方法，其特征在于，所述第一模型包括N层第一网络，所述第二模型包括M层第一网络，N与M为正整数，且M小于或等于N。
一种通信方法，其特征在于，所述方法应用于第一设备，所述方法包括：

接收第二设备发送的第一信息，所述第一信息包括所述第二设备的能力信息和/或业务需求信息，所述第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

确定所述第一设备与所述第二设备的学习模式，所述学习模式为联邦学习模式或蒸馏学习模式；

向所述第二设备发送指示信息，所述指示信息用于指示所述学习模式；

接收所述第二设备发送的第二信息，所述第二信息用于更新第一设备侧的模型。
根据权利要求17所述的方法，其特征在于，在所述联邦学习模式下，所述第二信息为所述模型的权重或梯度。
根据权利要求17所述的方法，其特征在于，在所述蒸馏学习模式下，所述第二信息为所述模型推理公共数据集得到的结果。
一种通信方法，其特征在于，所述方法应用于第二设备，所述方法包括：

向第一设备发送第一信息，所述第一信息包括所述第二设备的能力信息和/或业务需求信息，所述第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

接收所述第一设备发送的指示信息，所述指示信息用于指示所述学习模式；

基于所述学习模式向所述第一设备发送第二信息，所述第二信息用于更新所述第一设备侧的模型。
根据权利要求20所述的方法，其特征在于，在所述联邦学习模式下，所述第二信息为所述模型的权重或梯度。
根据权利要求20所述的方法，其特征在于，在所述蒸馏学习模式下，所述第二信息为所述模型推理公共数据集得到的结果。
一种第一设备，其特征在于，所述第一设备包括：

获取第一结果，所述第一结果为第二设备侧模型推理公共数据集得到的结果；

基于所述公共数据集与所述第一结果更新第一模型以得到第二模型，所述第一模型为所述第一设备的本地模型；

向第三设备发送第二模型；

接收所述第三设备发送的第三模型，所述第三模型由所述第二模型处理得到；

基于所述第三模型与所述公共数据集获取第二结果，所述第二结果用于更新所述第二设备侧模型。
一种第二设备，其特征在于，所述第二设备包括：

获取第一模型，所述第一模型基于所述第二设备的第一信息与第二模型得到，所述第一模型为所述第二模型的一部分；所述第一信息包括能力信息和/或业务需求信息。
一种第一设备，其特征在于，所述第一设备包括：

接收第二设备发送的第一信息，所述第一信息包括所述第二设备的能力信息和/或业务需求信息，所述第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

确定所述第一设备与所述第二设备的学习模式，所述学习模式为联邦学习模式或蒸馏学习模式；

向所述第二设备发送指示信息，所述指示信息用于指示所述学习模式；

接收所述第二设备发送的第二信息，所述第二信息用于更新第一设备侧的模型。
一种第二设备，其特征在于，所述第二设备包括：

向第一设备发送第一信息，所述第一信息包括所述第二设备的能力信息和/或业务需求信息，所述第一信息用于确定模型的学习模式为联邦学习模式或蒸馏学习模式；

接收所述第一设备发送的指示信息，所述指示信息用于指示所述学习模式；

基于所述学习模式向所述第一设备发送第二信息，所述第二信息用于更新所述第一设备侧的模型。
一种第一设备，其特征在于，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序或指令，当所述程序或指令被所述处理器执行时，使得所述第一设备执行如权利要求1-6、17-19中任一项所述的方法。
一种第二设备，其特征在于，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序或指令，当所述程序或指令被所述处理器执行时，使得所述第二设备执行如权利要求7-16、20-22中任一项所述的方法。
一种通信系统，其特征在于，所述通信系统包括如权利要求27所述的第一设备，和/或如权利要求28所述的第二设备。
一种计算机可读存储介质，其特征在于，所述介质存储有指令，当所述指令被计算机执行时，实现权利要求1至22中任一项所述的方法。
一种计算机程序产品，其特征在于，包括指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至22中任一项所述的方法。