WO2024060002A1

WO2024060002A1 - 通信方法以及相关装置

Info

Publication number: WO2024060002A1
Application number: PCT/CN2022/119814
Authority: WO
Inventors: 张公正; 徐晨; 李榕
Original assignee: 华为技术有限公司
Priority date: 2022-09-20
Filing date: 2022-09-20
Publication date: 2024-03-28

Abstract

本申请实施例提供一种通信方法以及相关装置，用于降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。本申请提供的方法包括：第一装置接收来自第二装置的至少一个量化门限值；所述第一装置根据所述至少一个量化门限值对所述第一装置的第一模型的相关信息进行量化处理；所述第一装置向所述第二装置发送第一信息，所述第一信息用于指示量化处理后的所述第一模型的相关信息。

Description

通信方法以及相关装置

技术领域

本申请涉及通信技术领域，尤其涉及一种通信方法以及相关装置。

背景技术

分布式学习是实现联合学习的一种学习方法。具体的，多个节点设备利用本地数据训练得到本地模型，中心节点设备将多个本地模型融合得到全局模型。从而实现在保护节点设备的用户数据的隐私的前提下，实现联合学习。

多个节点设备可以分别训练其本地模型得到本地模型的相关参数。例如，本地模型的权重参数或权重梯度。然后，多个节点设备将本地模型的相关参数发送给中心节点设备。中心节点设备对多个节点设备发送的本地模型的相关参数进行融合得到全局模型的相关参数，并下发给各个节点设备。各个节点设备可以通过全局模型的相关参数更新该节点设备的本地模型。

由上述技术方案可知，各个节点设备分别向中心节点设备发送本地模型的相关参数。导致节点设备上报的数据量较大，通信开销较大。因此，节点设备如何以较低的通信开销来上报本地模型的相关参数，是亟待解决的问题。

发明内容

本申请实施例提供一种通信方法以及相关装置，用于降低第一装置上报第一模型的相关信息的通信开销，节省系统开销。

本申请第一方面提供一种通信方法，该通信方法可以由第一装置执行，第一装置可以是通信设备，也可以是通信设备中的组件(如，芯片(系统))，所述通信方法包括：

第一装置接收来自第二装置的至少一个量化门限值。然后，第一装置根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理。第一装置向第二装置发送第一信息，第一信息用于指示量化处理后的第一模型的相关信息。从而降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。

基于第一方面，一种可能的实现方式中，第一模型的相关信息包括：第一模型的输出参数或更新参数，更新参数包括第一模型的权重梯度或权重参数。在该实现方式中，示出了第一模型的相关信息包括的两种可能的参数，从而便于第二装置对各个装置上报的训练结果进行融合得到全局模型的相关信息。本申请中，每个装置上的模型可以理解为同一模型。为了区分不同装置上的模型，在第一装置侧，该模型可以称为第一模型。在第二装置侧，该模型可以称为全局模型。

基于第一方面，一种可能的实现方式中，在第一装置接收来自第二装置的至少一个量化门限值之前，方法还包括：第一装置向第二装置发送第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，第二信息用于指示第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息，第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1且小于Q的整数，Q为大于1的整数。

在该实现方式中，第一装置可以向第二装置发送第二信息，从而便于第二装置确定该至少一个量化门限值。有利于第二装置确定合适的量化门限值，便于第一装置对第一模型的相关信息进行合理的量化处理。从而在保证第一装置上报的第一模型的相关信息的精度的情况下，降低第一装置上报第一模型的相关信息的开销。

基于第一方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的输出参数，第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的取值的绝对值的平均值；或者，第一模型的相关信息包括第一模型的更新参数，第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的取值的绝对值的平均值。在该实现方式中，示出了第一模型的相关信息的两种可能的实现方式，第一装置可以将第一模型的输出参数的取值的绝对值的平均值或第一模型的更新参数的取值的绝对值的平均值上报给第二装置。从而便于第二装置确定合适的量化门限值。

基于第一方面，一种可能的实现方式中，方法还包括：第一装置接收来自第二装置的第三信息，第三信息用于指示第一模型的全局信息。在该实现方式中，第一装置可以结合该第一模型的全局信息实现对第一模型的更新或训练。

基于第一方面，一种可能的实现方式中，第一模型的全局信息包括第一模型的全局输出参数；或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。

在该实现方式中，示出了第一模型的全局信息的两种实现方式。例如，第一模型的全局信息包括第一模型的全局输出参数，从而便于第一装置通过该全局输出参数对第一模型进行训练，有利于提升第一模型的训练性能，提升第一模型的准确性。例如，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。从而便于第一装置结合该全局更新参数和/或全局学习率对第一模型进行更新，有利于提升第一模型的准确性。

基于第一方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；第一装置根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理，包括：第一装置根据至少一个量化门限值对N个参数进行量化，得到量化处理后的N个参数；第一信息包括量化处理后的N个参数；第一装置向第二装置发送第一信息，包括：第一装置对量化处理后的N个参数进行调制得到N个第一信号；第一装置向第二装置发送N个第一信号。

在该实现方式中，第一信息包括量化处理后的N个参数。第一装置可以对该第一模型的N个参数进行量化处理，并将量化处理后的N个参数进行调制，再发送调制得到的N个第一信号。从而实现对第一信息的发送。

基于第一方面，一种可能的实现方式中，至少一个量化门限值包括第一量化门限值和第二量化门限值；第一装置根据至少一个量化门限值对N个参数进行量化处理，得到量化处理后的N个参数，包括：若N个参数中的第i个参数大于第一量化门限值时，第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；或者，若N个参数中的第i个参数小于或等于第一量化门限值且大于或等于第二量化门限值时，第一装置将第i个参数量化为第二值；或者，若N个参数中第i个参数小于第二量化门限值时，第一装置将第i个参数量化为第三值。在该实现方式中，示出了第一装置量化第i个参数的具体量化过程，从而便于方案的实施。进一步的，该至少一个量化门限值包括多个量化门限值，从而实现第一装置对第一模型的参数的量化精度更细，有利于提升第一装置更新第一模型的准确度，提升第一模型的训练性能。

基于第一方面，一种可能的实现方式中，第一装置对量化处理后的N个参数进行调制得到N个第一信号，包括：第一装置对量化处理后的第i个参数进行调制得到第i个第一信号，该第i个第一信号对应两个序列；当量化处理后的第i个参数为所述第一值时，第一装置发送两个序列中的第一个序列的发送功率小于第一装置发送两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第二值时，第一装置发送两个序列中的第一个序列的发送功率等于第一装置发送所述两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第三值时，第一装置发送所述两个序列中的第一个序列的发送功率大于第一装置发送两个序列中的第二个序列的发送功率。

在该实现方式中，第一装置将第一模型的N个参数中每个参数调制到两个序列上。第一装置控制发送该两个序列中每个序列分别采用的发送功率，从而便于第二装置确定该参数的取值。第一装置无需进行信道的估计和均衡，从而无需相应的导频开销。

基于第一方面，一种可能的实现方式中，当量化处理后的第i个参数为第一值时，两个序列中的第一个序列为非全0序列，第二个序列为全0序列；当量化处理后的第i个参数为第二值时，两个序列均为全0序列；当量化处理后的第i个参数为第三值时，两个序列中的第一个序列为全0序列，第二个序列为非全0序列。在该实现方式中，第一装置可以通过全0序列和/或非全0序列承载该量化处理后的第i个参数。在相同的发送总功率下，有利于第二装置识别该量化处理后的第i个参数的取值，提升功率利用效率。

基于第一方面，一种可能的实现方式中，第一装置向第二装置发送第一信息，包括：第一装置向第二装置发送L次第一信息，L为大于或等于1的整数。在该实现方式中，当发送次数L大于1时，第一装置重复发送该第一信息，有利于第二装置分别判决后选择出现次数最多的判决结果作为最好的判决结果。从而降低判决错误概率，进而提升模型训练的性能。

基于第一方面，一种可能的实现方式中，方法还包括：第一装置接收来自第二装置的第一指示信息，第一指示信息用于指示第一装置向第二装置发送第一信息的发送次数L。在该实现方式中，第一装置可以接收第二装置指示的发送次数，并按照该发送次数发送第一信息。从而有利于第二装置结合实际需求确定该发送次数，从而合理利用通信资源。

基于第一方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的量化误差补偿后的N个参数，量化误差补偿后的N个参数是第一装置根据第一装置对第一模型进行第Q轮训练得到的N个参数分别对应的量化误差对N个参数进行误差补偿得到的，N个参数中的第i个参数对应的量化误差是根据第一装置对第一模型进行第Q-1轮训练且经过量化误差补偿得到的第i个参数确定的，i为大于或等于1且小于或等于N的整数，N为大于或等于1的整数，Q为大于1的整数。

在该实现方式中，第一装置可以先对第一模型的N个参数进行量化误差补偿，再根据该至少一个量化门限值对该量化误差补偿后的N个参数进行量化处理。从而有利于提升第一装置更新第一模型的准确度，提升第一模型的训练性能。

基于第一方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的经过稀疏处理得到的N个参数；第一模型的经过稀疏处理得到的N个参数是第一装置根据公共稀疏掩码从第一模型的K个参数中选择N个参数，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的参数，K为大于或等于N的整数，K为大于或等于1的整数，N为大于或等于1的整数。

在该实现方式中，第一装置可以先通过公共稀疏掩码从第一模型的K个参数选择N个参数，再根据该至少一个量化门限值对该N个参数进行量化处理。从而有利于降低第一装置上报第一模型的参数产生的开销。

基于第一方面，一种可能的实现方式中，公共稀疏掩码为比特序列，比特序列包括K个比特，K个比特与K个参数一一对应；当K个比特中的一个比特的取值为0时，用于指示第一装置不选择该比特对应的参数；当K个比特中的一个比特的取值为1时，用于指示第一装置选择该比特对应的参数。在该实现方式中，提供了公共稀疏掩码的一种具体形式，第一装置通过比特序列中的比特的取值选择哪些参数，操作简单方便。从而降低第一装置上报第一模型的参数的开销，降低通信资源的占用。

基于第一方面，一种可能的实现方式中，公共稀疏掩码是第一装置根据稀疏比例和伪随机数确定的，稀疏比例是第二装置向第一装置指示的。在该实现方式中，提供了公共稀疏掩码的一种生成方式，方便方案的实施。从而实现第一装置基于该公共稀疏掩码上报第一模型的部分参数，降低第一装置上报第一模型的参数产生的开销。

基于第一方面，一种可能的实现方式中，方法还包括：第一装置接收来自第二装置的第二指示信息，第二指示信息用于指示公共稀疏掩码。在该实现方式中，从而便于第一装置根据公共稀疏掩码从第一模型的K个参数选择N个参数。从而有利于降低第一装置上报第一模型的参数产生的开销。

基于第一方面，一种可能的实现方式中，方法还包括：第一装置向第二装置发送第三指示信息，第三指示信息用于指示K个参数中对应的取值的绝对值最大的N个参数的索引。

在该实现方式中，第一装置可以向第二装置指示其K个参数中对应的取值的绝对值最大的N个参数的索引。从而便于第二装置确定合适的公共稀疏掩码。第三指示信息用于指示K个参数中对应的取值的绝对值最大的N个参数的索引。有利于第一装置后续优先反馈变化较大的参数，从而提升模型训练的准确性，提升模型训练的性能。

基于第一方面，一种可能的实现方式中，第一模型为神经网络模型，第一模型的相关信息包括神经网络模型的其中P层的神经元的相关参数，P为大于或等于1的整数。在该实现方式中，第一装置可以上报的是神经网络模型中的某一层或某多层的参数。也就是第一装置以神经网络模型的层为单位上报该神经网络模型的参数，从而有利于第一装置准确上报各层的参数，提升模型训练的准确性。

本申请第二方面提供一种通信方法，该通信方法可以由第二装置执行，第二装置可以是通信设备，也可以是通信设备中的组件(如，芯片(系统))，所述通信方法包括：

第二装置向第一装置发送至少一个量化门限值，至少一个量化门限值用于对第一装置的第一模型的相关信息进行量化处理；第二装置接收来自第一装置发送的第一信息，第一信息用于指示量化处理后的第一模型的相关信息。由上述技术方案可知，有利于降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。

基于第二方面，一种可能的实现方式中，第一模型的相关信息包括：第一模型的输出参数或更新参数，更新参数包括第一模型的权重梯度或权重参数。在该实现方式中，示出了第一模型的相关信息包括的两种可能的参数，从而便于第二装置对各个装置上报的训练结果进行融合得到全局模型的相关信息。本申请中，各个装置上的模型可以理解为同一模型。为了区分不同装置上的模型，在第一装置侧，该模型可以称为第一模型，在第二装置侧，该模型可以称为全局模型。

基于第二方面，一种可能的实现方式中，方法还包括：

第二装置接收来自第一装置的第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，第二信息用于指示第一装置对第一模型进行第M轮训练并经过处理得到的信息，第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1且小于Q的整数，Q为大于1的整数；第二装置根据第二信息确定至少一个量化门限值。

在该实现方式中，第二装置接收来自第一装置的第二信息，从而实现第二装置根据第二信息确定至少一个量化门限值。有利于第二装置确定合适的量化门限值，便于第一装置对第一模型的相关信息进行合理的量化处理。从而在保证第一装置上报的第一模型的相关信息的精度的情况下，降低第一装置上报第一模型的相关信息的开销。

基于第二方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的输出参数，第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的取值的绝对值的平均值；或者，第一模型的相关信息包括第一模型的更新参数，第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的取值的绝对值的平均值。在该实现方式中，示出了第一模型的相关信息的两种可能的实现方式，第二装置可以接收来自第一装置的第一模型的输出参数的取值的绝对值的平均值或第一模型的更新参数的取值的绝对值的平均值。从而便于第二装置确定合适的量化门限值。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置接收来自第三装置的第三信息；其中，第三信息用于指示第三装置的第二模型的相关信息经过处理得到的信息；或者，第三信息用于指示第三装置对第二模型进行第S轮训练并经过处理得到的信息，第二模型的相关信息是第三装置对第二模型进行第R轮训练得到的相关信息，S为大于或等于1且小于R的整数，R为大于1的整数；第二装置根据第二信息确定至少一个量化门限值，包括：第二装置根据第二信息和第三信息确定至少一个量化门限值。

在该实现方式中，第二装置还可以接收第三装置的第三信息，并联合第二信息和第三信息确定至少一个量化门限值。有利于第二装置确定合适的量化门限值，从而在保证第一装置上报的第一模型的相关信息的精度的情况下，降低第一装置上报第一模型的相关信息的开销。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置根据第一信息确定第一模型的全局信息；第二装置向第一装置发送第四信息，第四信息用于指示第一模型的全局信息。在该实现方式中，第二装置可以结合第一信息确定该第一模型的全局信息，并向第一装置发送该第一模型的全局信息。从而实现第一装置对第一模型的更新或训练。

基于第二方面，一种可能的实现方式中，第一模型的全局信息包括第一模型的全局输出参数；或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置接收来自第三装置的第五信息，第五信息用于指示第三装置的第二模型的相关信息；第二装置根据第一信息确定第一模型的全局信息，包括：第二装置根据第一信息和第五信息确定第一模型的全局信息。在该实现方式中，第二装置还可以接收来自第三装置的第五信息，并联合第一信息和第五信息确定该第一模型的全局信息。有利于提升第二装置确定第一模型的全局信息的准确性，提升模型更新的准确度。

基于第二方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；第二模型的相关信息包括第二模型的N个参数；第一信息包括量化处理后的第一模型的N个参数；第二装置接收来自第一装置发送的第一信息，包括：第二装置接收来自第一装置的N个第一信号，N个第一信号承载量化处理后的第一模型的N个参数，N个第一信号与量化处理后的第一模型的N个参数一一对应；第五信息包括量化处理后的第二模型的N个参数；第二装置接收来自第三装置的第五信息，包括：第二装置接收来自第三装置的N个第二信号，N个第二信号承载量化处理后的第二模型的N个参数，N个第二信号与量化处理后的第二模型的N个参数一一对应；第二装置根据第一信息和第五信息确定第一模型的全局信息，包括：第二装置根据N个第一信号和N个第二信号确定第一模型的全局信息。

基于第二方面，一种可能的实现方式中，N个第一信号中第i个第一信号对应第一序列和第二序列，N个第二信号中第i个第二信号对应第三序列和第四序列，第一装置发送第一序列采用的时频资源与第三装置发送第三序列采用的时频资源相同，第一装置发送第二序列采用的时频资源与第三装置发送第四序列采用的时频资源相同；第一模型的全局信息包括第一模型的N个全局参数；i为大于或等于1且小于或等于N的整数；第二装置根据N个第一信号和N个第二信号确定第一模型的全局信息，包括：第二装置确定第二装置接收第一序列和第三序列的第一信号能量和；第二装置确定第二装置接收第二序列和第四序列的第二信号能量和；第二装置根据第一信号能量和与第二信号能量和确定N个全局参数中的第i个全局参数。由此可知，第二装置可以通过第二装置接收第i个第一信号对应的两个序列的信号能量以及接收第i个第二信号对应的两个序列的信号能量确定第i个全局参数。从而支持第二装置实现对多用户空中信号叠加传输的非相干接收，实现对衰落信道鲁棒。

基于第二方面，一种可能的实现方式中，第二装置根据第一信号能量和与第二信号能量和确定N个全局参数中的第i个全局参数，包括：若第一信号能量和与判决门限值的和小于第二信号能量和，则第二装置确定第i个全局参数的取值为第一值；或者，若第一信号能量和与判决门限值的和大于或等于第二信号能量和，且第二信号能量和与判决门限值的和大于或等于第一信号能量和，则第二装置确定第i个全局参数的取值为第二值；或者，若第二信号能量和与判决门限值的和小于第一信号能量和，则第二装置确第i个全局参数的取值为第三值。

在该实现方式中，示出了第二装置确定第i个全局参数的过程。由上述可知，第一信号能量和与第二信号能量和的三种可能的条件对应第i个全局参数的三种判决结果。从而实现对第i个全局参数的准确判决，有利于提升第一装置更新第一模型的准确度，提升第一模型的训练性能。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置向第一装置发送第一指示信息，第一指示信息用于指示第一装置向第二装置发送第一信息的发送次数L，L为大于或等于1的整数。在该实现方式中，第二装置向第一装置指示发送第一信息的发送次数，使得第一装置按照该发送次数发送第一信息。从而有利于第二装置结合实际需求确定该发送次数，从而合理利用通信资源。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。在该实现方式中，第二装置向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码。从而便于第一装置根据公共稀疏掩码从第一模型的K个参数选择N个参数。从而有利于降低第一装置上报第一模型的参数产生的开销。

基于第二方面，一种可能的实现方式中，方法还包括：第二装置接收来自第一装置的第三指示信息，第三指示信息用于指示第一装置对第一模型进行一轮训练得到的K个参数中对应的取值的绝对值最大的N个参数的索引；第二装置接收来自第三装置的第四指示信息，第四指示信息用于指示第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第二模型的K个参数是第三装置对第二模型进行一轮训练得到的K个参数；第二装置根据第三指示信息和第四指示信息确定公共稀疏掩码。在该实现方式中，各个装置指示其K个参数中对应的取值的绝对值最大的参数的索引，有利于第二装置根据第三指示信息和第四指示信息确定合适的公共稀疏掩码。这样第一装置根据该公共稀疏掩码可以优先反馈变化较大的参数，从而提升模型训练的准确性，提升模型训练的性能。

本申请第三方面提供一种通信方法，该通信方法可以由第一装置执行，第一装置可以是通信设备，也可以是通信设备中的组件(如，芯片(系统))，所述通信方法包括：

第一装置向第二装置发送第一指示信息，第一指示信息用于指示第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数。然后，第一装置接收来自第二装置的第二指示信息。该第二指示信息用于指示公共稀疏掩码，公共稀疏掩码是第二装置根据第一指示信息确定的；公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。

上述技术方案中，第一装置可以向第二装置上报第一指示信息，从而指示第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引。从而实现第二装置根据第一指示信息确定合适的公共稀疏掩码。第一装置接收来自第二装置的第二指示信息。该第二指示信息用于指示公共稀疏掩码。从而便于实现第一装置根据据该公共稀疏掩码可以优先反馈变化较大的参数。有利于降低第一装置上报第一模型的参数产生的开销，同时还提升了模型训练的准确性，提升模型训练的性能。

本申请第四方面提供一种通信方法，该通信方法可以由第二装置执行，第二装置可以是通信设备，也可以是通信设备中的组件(如，芯片(系统))，所述通信方法包括：

第二装置接收来自第一装置的第一指示信息，第一指示信息用于指示第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数；第二装置根据第一指示信息确定公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。然后，第二装置向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码。

上述技术方案中，第二装置接收来自第一装置的第一指示信息，该第一指示信息用于第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引。从而实现第二装置可以根据第一指示信息确定合适的公共稀疏掩码。便于第一装置根据该公共稀疏掩码可以优先反馈变化较大的参数，降低第一装置上报第一模型的参数产生的开销，同时还提升了模型训练的准确性，提升模型训练的性能。

基于第四方面，一种可能的实现方式中，方法还包括：第二装置接收来自第三装置的第三指示信息，第三指示信息用于指示第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第二模型的K个参数是第二装置对第二模型进行一轮训练得到的K个参数；第二装置根据第一指示信息确定公共稀疏掩码，包括：第二装置根据第一指示信息和第三指示信息确定公共稀疏掩码。

在该实现方式中，第二装置还可以结合第三装置上报的第三指示信息确定该公共稀疏掩码，从而便于第二装置为第一装置确定合适的公共稀疏掩码。实现第一装置根据该公共稀疏掩码可以优先反馈变化较大的参数，从而提升模型训练的准确性，提升模型训练的性能。

本申请第五方面提供一种第一装置，包括：

收发模块，用于接收来自第二装置的至少一个量化门限值；处理模块，用于根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理；收发模块，还用于向第二装置发送第一信息，第一信息用于指示量化处理后的第一模型的相关信息。

基于第五方面，一种可能的实现方式中，第一模型的相关信息包括：第一模型的输出参数或更新参数，更新参数包括第一模型的权重梯度或权重参数。

基于第五方面，一种可能的实现方式中，收发模块还用于：向第二装置发送第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，第二信息用于指示第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息，第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1且小于Q的整数，Q为大于1的整数。

基于第五方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的输出参数，第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的取值的绝对值的平均值；或者，第一模型的相关信息包括第一模型的更新参数，第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的取值的绝对值的平均值。

基于第五方面，一种可能的实现方式中，收发模块还用于：接收来自第二装置的第三信息，第三信息用于指示第一模型的全局信息。

基于第五方面，一种可能的实现方式中，第一模型的全局信息包括第一模型的全局输出参数；或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。

基于第五方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；处理模块具体用于：根据至少一个量化门限值对N个参数进行量化处理，得到量化处理后的N个参数；第一信息包括量化处理后的N个参数；收发模块具体用于：对量化处理后的N个参数进行调制得到N个第一信号；向第二装置发送N个第一信号。

基于第五方面，一种可能的实现方式中，至少一个量化门限值包括第一量化门限值和第二量化门限值；处理模块具体用于：

若N个参数中的第i个参数大于第一量化门限值时，将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；或者，若N个参数中的第i个参数小于或等于第一量化门限值且大于或等于第二量化门限值时，将第i个参数量化为第二值；或者，若N个参数中第i个参数小于第二量化门限值时，将第i个参数量化为第三值。

基于第五方面，一种可能的实现方式中，收发模块具体用于：对量化处理后的第i个参数进行调制得到第i个第一信号，该第i个第一信号对应两个序列；当量化处理后的第i个参数为第一值时，第一装置发送两个序列中的第一个序列的发送功率小于第一装置发送所述两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第二值时，第一装置发送两个序列中的第一个序列的发送功率等于第一装置发送两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第三值时，第一装置发送两个序列中的第一个序列的发送功率大于第一装置发送所述两个序列中的第二个序列的发送功率。

基于第五方面，一种可能的实现方式中，当量化处理后的第i个参数为第一值时，两个序列中的第一个序列为非全0序列，第二个序列为全0序列；当量化处理后的第i个参数为第二值时，两个序列均为全0序列；当量化处理后的第i个参数为第三值时，两个序列中的第一个序列为全0序列，第二个序列为非全0序列。

基于第五方面，一种可能的实现方式中，收发模块具体用于：向第二装置发送L次第一信息，L为大于或等于1的整数。

基于第五方面，一种可能的实现方式中，收发模块还用于：接收来自第二装置的第一指示信息，第一指示信息用于指示第一装置向第二装置发送第一信息的发送次数L。

基于第五方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的量化误差补偿后的N个参数，量化误差补偿后的N个参数是第一装置根据第一装置对第一模型进行第Q轮训练得到的N个参数分别对应的量化误差对N个参数进行误差补偿得到的，Q为大于1的整数，所述N个参数中的第i个参数对应的量化误差是根据第一装置对第一模型进行第Q-1轮训练且经过量化误差补偿得到的第i个参数确定的。

基于第五方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的经过稀疏处理得到的N个参数；第一模型的经过稀疏处理得到的N个参数是第一装置根据公共稀疏掩码从第一模型的K个参数中选择N个参数，第一模型的K个参数是第一装置对第一模型进行第Q轮训练得到的参数，K为大于或等于N的整数，K为大于或等于1的整数。

基于第五方面，一种可能的实现方式中，公共稀疏掩码为比特序列，比特序列包括K个比特，K个比特与K个参数一一对应；当K个比特中的一个比特的取值为0时，用于指示第一装置不选择该比特对应的参数；当K个比特中的一个比特的取值为1时，用于指示第一装置选择该比特对应的参数。

基于第五方面，一种可能的实现方式中，公共稀疏掩码是第一装置根据稀疏比例和伪随机数确定的，稀疏比例是第二装置向第一装置指示的。

基于第五方面，一种可能的实现方式中，收发模块还用于：接收来自第二装置的第二指示信息，第二指示信息用于指示公共稀疏掩码。

基于第五方面，一种可能的实现方式中，收发模块还用于：向第二装置发送第三指示信息，第三指示信息用于指示K个参数中对应的取值的绝对值最大的N个参数的索引。

基于第五方面，一种可能的实现方式中，第一模型为神经网络模型，第一模型的相关信息包括神经网络模型的其中P层的神经元的相关参数，P为大于或等于1的整数。

本申请第六方面提供一种第二装置，包括：

收发模块，用于向第一装置发送至少一个量化门限值，至少一个量化门限值用于对第一装置的第一模型的相关信息进行量化处理；接收来自第一装置发送的第一信息，第一信息用于指示量化处理后的第一模型的相关信息。

基于第六方面，一种可能的实现方式中，第一模型的相关信息包括：第一模型的输出参数或更新参数，更新参数包括第一模型的权重梯度或权重参数。

基于第六方面，一种可能的实现方式中，收发模块还用于：接收来自第一装置的第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，第二信息用于指示第一装置对第一模型进行第M轮训练并经过处理得到的信息，第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1且小于Q的整数，Q为大于1的整数；第二装置还包括处理模块，处理模块用于根据第二信息确定至少一个量化门限值。

基于第六方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的输出参数，第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的取值的绝对值的平均值；或者，第一模型的相关信息包括第一模型的更新参数，第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的取值的绝对值的平均值。

基于第六方面，一种可能的实现方式中，收发模块还用于：接收来自第三装置的第三信息；其中，第三信息用于指示第三装置的第二模型的相关信息经过处理得到的信息；或者，第三信息用于指示第三装置对第二模型进行第S轮训练并经过处理得到的信息，第二模型的相关信息是第三装置对第二模型进行第R轮训练得到的相关信息，S为大于或等于1且小于R的整数，R为大于1的整数；处理模块，用于根据第二信息和第三信息确定至少一个量化门限值。

基于第六方面，一种可能的实现方式中，处理模块还用于：根据第一信息确定第一模型的全局信息；收发模块还用于：向第一装置发送第四信息，第四信息用于指示第一模型的全局信息。

基于第六方面，一种可能的实现方式中，第一模型的全局信息包括第一模型的全局输出参数；或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。

基于第六方面，一种可能的实现方式中，收发模块还用于：接收来自第三装置的第五信息，第五信息用于指示第三装置的第二模型的相关信息；处理模块具体用于：根据第一信息和第五信息确定第一模型的全局信息。

基于第六方面，一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；第二模型的相关信息包括第二模型的N个参数；第一信息包括量化处理后的第一模型的N个参数；收发模块具体用于：接收来自第一装置的N个第一信号，N个第一信号承载第一模型的N个参数，N个第一信号与量化处理后的第一模型的N个参数一一对应；第五信息包括量化处理后的第二模型的N个参数；收发模块具体用于：接收来自第三装置的N个第二信号，N个第二信号承载量化处理后的第二模型的N个参数，N个第二信号与量化处理后的第二模型的N个参数一一对应；处理模块具体用于：根据N个第一信号和N个第二信号确定第一模型的全局信息。

基于第六方面，一种可能的实现方式中，N个第一信号中第i个第一信号对应第一序列和第二序列，N个第二信号中第i个第二信号对应第三序列和第四序列，第一装置发送第一序列采用的时频资源与第三装置发送第三序列采用的时频资源相同，第一装置发送第二序列采用的时频资源与第三装置发送所述第四序列采用的时频资源相同；第一模型的全局信息包括第一模型的N个全局参数；i为大于或等于1且小于或等于N的整数；处理模块具体用于：确定第二装置接收第一序列和第三序列的第一信号能量和；确定第二装置接收第二序列和第四序列的第二信号能量和；根据第一信号能量和与第二信号能量和确定N个全局参数中的第i个全局参数。

基于第六方面，一种可能的实现方式中，处理模块具体用于：若第一信号能量和与判决门限值的和小于第二信号能量和，则确定第i个全局参数的取值为第一值；或者，若第一信号能量和与判决门限值的和大于或等于第二信号能量和，且第二信号能量和与判决门限值的和大于或等于第一信号能量和，则确定第i个全局参数的取值为第二值；或者，若第二信号能量和与判决门限值的和小于第一信号能量和，则确定第i个全局参数的取值为第三值。

基于第六方面，一种可能的实现方式中，收发模块还用于：向第一装置发送第一指示信息，第一指示信息用于指示第一装置向第二装置发送第一信息的发送次数L，L为大于或等于1的整数。

基于第六方面，一种可能的实现方式中，收发模块还用于：向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。

基于第六方面，一种可能的实现方式中，收发模块还用于：接收来自第一装置的第三指示信息，第三指示信息用于指示第一装置对第一模型进行一轮训练得到的K个参数中对应的取值的绝对值最大的N个参数的索引；接收来自第三装置的第四指示信息，第四指示信息用于指示第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第二模型的K个参数是第三装置对第二模型进行一轮训练得到的K个参数；第二装置还包括处理模块，处理模块还用于：根据第三指示信息和第四指示信息确定公共稀疏掩码。

本申请第七方面提供一种第一装置，包括：

收发模块，用于向第二装置发送第一指示信息，第一指示信息用于指示第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数；接收来自第二装置的第二指示信息；该第二指示信息用于指示公共稀疏掩码，公共稀疏掩码是第二装置根据第一指示信息确定的；公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。

本申请第八方面提供一种第二装置，包括：

收发模块，用于接收来自第一装置的第一指示信息，第一指示信息用于指示第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数；

处理模块，用于根据第一指示信息确定公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数；

收发模块，还用于向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码。

基于第八方面，一种可能的实现方式中，收发模块还用于：

接收来自第三装置的第三指示信息，第三指示信息用于指示第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第二模型的K个参数是第三装置对第二模型进行一轮训练得到的K个参数；

处理模块具体用于：

根据第一指示信息和第三指示信息确定公共稀疏掩码。

针对上述第五方面或第七方面，该第一装置可以为通信设备，所述收发模块可以是收发器，或，输入/输出接口；所述处理模块可以是处理器。

在另一种实现方式中，该第一装置为配置于通信设备中的芯片、芯片系统或电路。当该第一装置为配置于通信设备中的芯片、芯片系统或电路时，所述收发模块可以是该芯片、芯片系统或电路上的输入/输出接口、接口电路、输出电路、输入电路、管脚或相关电路等；所述处理模块可以是处理器、处理电路或逻辑电路等。

针对上述第六方面或第八方面，该第二装置可以为通信设备，所述收发模块可以是收发器，或，输入/输出接口；所述处理模块可以是处理器。

在另一种实现方式中，该第二装置为配置于通信设备中的芯片、芯片系统或电路。当该第二装置为配置于通信设备中的芯片、芯片系统或电路时，所述收发模块可以是该芯片、芯片系统或电路上的输入/输出接口、接口电路、输出电路、输入电路、管脚或相关电路等；所述处理模块可以是处理器、处理电路或逻辑电路等。

本申请第九方面提供一种第一装置，该第一装置包括：处理器和存储器。该存储器中存储有计算机程序或计算机指令，该处理器用于调用并运行该存储器中存储的计算机程序或计算机指令，使得处理器实现如第一方面或第三方面的任意一种实现方式。

可选的，该第一装置还包括收发器，该处理器用于控制该收发器收发信号。

本申请第十方面提供一种第二装置，该第二装置包括：处理器和存储器。该存储器中存储有计算机程序或计算机指令，该处理器用于调用并运行该存储器中存储的计算机程序或计算机指令，使得处理器实现如第二方面或第四方面的任意一种实现方式。

可选的，该第二装置还包括收发器，该处理器用于控制该收发器收发信号。

本申请第十一方面提供一种第一装置，包括处理器和接口电路，所述处理器用于通过接口电路与其它装置通信，并执行上述第一方面或第三方面所述的方法。该处理器包括一个或多个。

本申请第十二方面提供一种第二装置，包括处理器和接口电路，所述处理器用于通过接口电路与其它装置通信，并执行上述第二方面或第四方面所述的方法。该处理器包括一个或多个。

本申请第十三方面提供一种第一装置，包括处理器，用于与存储器相连，用于调用所述存储器中存储的程序，以执行上述第一方面或第三方面所述的方法。该存储器可以位于该第一装置之内，也可以位于该第一装置之外。且该处理器包括一个或多个。

本申请第十四方面提供一种第二装置，包括处理器，用于与存储器相连，用于调用所述存储器中存储的程序，以执行上述第二方面或第四方面所述的方法。该存储器可以位于该第二装置之内，也可以位于该第二装置之外。且该处理器包括一个或多个。

在一种实现方式中，上述第五方面、第七方面、第九方面、第十一方面、第十三方面的第一装置，可以是芯片(系统)。

在一种实现方式中，上述第六方面、第八方面、第十方面、第十二方面、第十四方面的第二装置，可以是芯片(系统)。

本申请第十五方面提供一种包括指令的计算机程序产品，其特征在于，当其在计算机上运行时，使得该计算机执行如第一方面至第四方面中任一方面中的任一种的实现方式。

本申请第十六方面提供一种计算机可读存储介质，包括计算机指令，当该指令在计算机上运行时，使得计算机执行如第一方面至第四方面中任一方面中的任一种实现方式。

本申请第十七方面提供一种芯片装置，包括处理器，用于调用存储器中的计算机程序或计算机指令，以使得该处理器执行上述第一方面至第四方面中任一方面中的任一种实现方式。

可选的，该处理器通过接口与该存储器耦合。

本申请第十八方面提供一种通信系统，该通信系统包括如第五方面的第一装置和如第六方面的第二装置；或者，该通信系统包括如第七方面的第一装置和如第八方面的第二装置。

从以上技术方案可以看出，本申请实施例具有以下优点：

上述技术方案中，第一装置接收来自第二装置的至少一个量化门限值。然后，第一装置根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理。第一装置向第二装置发送第一信息，第一信息用于指示量化处理后的第一模型的相关信息。从而降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。

附图说明

图1为本发明实施例应用的通信系统的一个示意图；

图2为本申请实施例通信方法的一个实施例示意图；

图3为本申请实施例通信方法的一个流程示意图；

图4为本申请实施例通信方法的另一个实施例示意图；

图5为本申请实施例公共稀疏掩码的一个生成示意图；

图6为本申请实施例第一装置的一个结构示意图；

图7为本申请实施例第一装置的另一个结构示意图；

图8为本申请实施例第二装置的一个结构示意图；

图9为本申请实施例第二装置的另一个结构示意图；

图10为本申请实施例终端设备的一个结构示意图；

图11为本申请实施例网络设备的一个结构示意图。

具体实施方式

本申请实施例提供了一种通信方法以及相关装置，用于降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

在本申请的描述中，除非另有说明，“/”表示“或”的意思，例如，A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。此外，“至少一个”是指一个或多个，“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c；a和b；a和c；b和c；或a和b和c。其中a，b，c可以是单个，也可以是多个。

可以理解，在本申请中，“指示”可以包括直接指示、间接指示、显示指示、隐式指示。当描述某一指示信息用于指示A时，可以理解为该指示信息携带A、直接指示A，或间接指示A。

本申请中，指示信息所指示的信息，称为待指示信息。在具体实现过程中，对待指示信息进行指示的方式有很多种，例如但不限于，可以直接指示待指示信息，如待指示信息本身或者该待指示信息的索引等，也可以通过指示其他信息来间接指示待指示信息，其中，该其他信息与待指示信息之间存在关联关系。还可以仅仅指示待指示信息的一部分，而待指示信息的其他部分则是已知的或者提前约定的。例如，还可以借助预先约定(例如协议规定)的各个信息的排列顺序来实现对特定信息的指示，从而在一定程度上降低指示开销。

待指示信息可以作为一个整体一起发送，也可以分成多个子信息分开发送，而且这些子信息的发送周期和/或发送时机可以相同，也可以不同。具体发送方法本申请不进行限定。其中，这些子信息的发送周期和/或发送时机可以是预先定义的，例如根据协议预先定义的，也可以是发射端设备通过向接收端设备发送配置信息来配置的。

本申请的技术方案可以应用于第三代合作伙伴计划(3rd generation partnership project，3GPP)相关的蜂窝通信系统。例如，第四代(4th generation，4G)通信系统、第五代(5th generation，5G)通信系统、第五代通信系统之后的通信系统。例如，第六代通信系统。例如，第四代通信系统可以包括长期演进(long term evolution，LTE)通信系统。第五代通信系统可以包括新无线(new radio，NR)通信系统。本申请的技术方案也可以应用于无线保真(wireless fidelity，WiFi)系统，支持多种无线技术融合的通信系统、设备到设备(device-to-device，D2D)系统，车联网(vehicle to everything，V2X)通信系统等。

本申请的技术方案适用的通信系统包括第一装置和第二装置。可选的，通信系统还包括第三装置。

下面介绍第一装置、第二装置的一些可能的形态。对于其他形态本申请仍适用，下述实现方式不属于对本申请的限定。

1、第一装置为第一终端设备或第一终端设备内的芯片，第二装置为网络设备或网络设备内的芯片。在该实现方式中，第一装置和第二装置可以执行本申请提供的通信方法。

可选的，第三装置为第二终端设备或第二终端设备内的芯片。第三装置可以执行本申请提供的通信方法。

需要说明的是，上述是以第一终端设备和第二终端设备为例进行介绍。实际应用中，网络设备可以与更多终端设备执行本申请提供的通信方法。

2、第一装置为第一网络设备或第一网络设备内的芯片，第二装置为终端设备或终端设备内的芯片。在该实现方式中，第一装置和第二装置可以执行本申请提供的通信方法。

可选的，第三装置为第二网络设备或第二网络设备内的芯片。第三装置可以执行本申请提供的通信方法。

需要说明的是，上述是以第一网络设备和第二网络设备为例进行介绍。实际应用中，终端设备可以与更多网络设备可以执行本申请提供的通信方法。

3、第一装置为第一终端设备或第一终端设备内的芯片，第二装置为第二终端设备或第二终端设备的芯片。在该实现方式中，第一装置和第二装置可以执行本申请提供的通信方法。

可选的，第三装置为第三终端设备或第三终端设备内的芯片。第三装置可以执行本申请提供的通信方法。

需要说明的是，上述是以第一终端设备、第二终端设备和第三终端设备为例进行介绍。实际应用中，第一终端设备可以与更多终端设备执行本申请提供的通信方法。

下面介绍本申请涉及的终端设备和网络设备。

终端设备是具有无线收发功能的设备，还具有计算能力。终端设备可以通过本地的数据进行机器学习的训练，并向网络设备发送终端设备训练得到的模型的相关信息。

终端设备可以指用户设备(user equipment，UE)、接入终端、用户单元(subscriber unit)、用户站、移动台(mobile station)、远方站、远程终端、移动设备、用户终端、无线通信设备、用户代理或用户装置。终端设备还可以是卫星电话、蜂窝电话、智能手机、无线数据卡、无线调制解调器、机器类型通信设备、可以是无绳电话、会话启动协议(session initiation protocol，SIP)电话、无线本地环路(wireless local loop，WLL)站、个人数字处理(personal digital assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、高空飞机上搭载的通信设备、可穿戴设备、无人机、机器人、D2D中的终端、V2X中的终端、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端或者未来通信网络中的终端设备等，本申请不作限制。

网络设备具有无线收发功能，还具有计算能力。网络设备用于与终端设备进行通信。或者说，网络设备可以是一种将终端设备接入到无线网络的设备。例如，网络设备可以为具有计算能力的网络节点。例如，网络设备可以为网络侧(例如，接入网或核心网)的人工智能(artificial intelligence，AI)节点、算力节点、具有AI能力的接入网节点。网络设备可以对多个终端设备训练的模型进行融合，再发送给这些终端设备。从而实现多个终端设备之间的联合学习。

网络设备可以为无线接入网中的节点。网络设备可以称为基站，还可以称为无线接入网(radio access network，RAN)节点或RAN设备。网络设备可以是LTE中的演进型基站(evolved Node B，eNB或eNodeB)，或者5G网络中的下一代节点B(next generation node B，gNB)或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的基站，宽带网络业务网关(broadband network gateway，BNG)，汇聚交换机或者非第三代合作伙伴项目(3rd generation partnership project，3GPP)接入设备等。可选的，本申请实施例中的网络设备可以包括各种形式的基站。例如，宏基站，微基站(也称为小站)，中继站，接入点，5G之后演进的通信系统中实现基站功能的设备，WiFi系统中的接入点(access point，AP)，传输点(transmitting and receiving point，TRP)、发射点(transmitting point，TP)，移动交换中心、D2D通信、V2X设备通信或机器到机器(machine-to-machine，M2M)通信中承担基站功能的设备等。网络设备还可以包括云接入网(cloud radio access network，C-RAN)系统中的集中式单元(centralized unit，CU)和分布式单元(distributed unit，DU、非陆地通信网络(non-terrestrial network，NTN)通信系统中的网络设备，即可以部署于高空平台或者卫星，本申请不作限制。

下面介绍本申请适用的一种可能的通信系统。

图1为本申请实施例应用的通信系统的一个示意图。请参阅图1，通信系统包括终端设备101、终端设备102、网络设备103、网络设备104和服务器105。终端设备101可以与网络设备103建立通信连接，终端设备102可以与网络设备103建立通信连接。

一种可能的实现方式中，终端设备101、终端设备102与网络设备103可以执行本申请提供的通信方法。从而降低终端设备上报其模型的相关信息的开销，节省通信开销。

需要说明的是，上述图1仅仅是一种示例。实际应用中，该通信系统中包括至少一个网络设备和至少一个终端设备。

多个节点设备可以分别训练其本地模型得到本地模型的相关参数。例如，本地模型的权重参数或权重梯度。然后，多个节点设备将本地模型的相关参数发送给中心节点设备。中心节点设备对多个节点设备发送的本地模型的相关参数进行融合得到全局模型的相关参数，并下发给各个节点设备。各个节点设备可以通过全局模型的相关参数更新该节点设备的本地模型。由上述技术方案可知，各个节点设备分别向中心节点设备发送本地模型的相关参数。导致节点设备上报的数据量较大，通信开销较大。因此，节点设备如何以较低的通信开销来上报本地模型的相关参数，是亟待解决的问题。

下面介绍本申请涉及的数学符号。

mean(x)：表示求向量x中的所有元素的平均值。

abs(y)：表示求向量y中每个元素的绝对值。

mean(x ₁，y ₁)：表示求元素x ₁和元素y ₁的平均值。

下面结合具体实施例介绍本申请的技术方案。

图2为本申请实施例通信方法的一个实施例示意图。请参阅图2，方法包括：

201、第二装置向第一装置发送至少一个量化门限值。相应的，第一装置接收来自第二装置的至少一个量化门限值。

该至少一个量化门限值用于第一装置对第一模型的相关信息进行量化处理。可选的，该第一模型可以是第二装置为第一装置配置的模型。可选的，第一模型可以为神经网络模型。

可选的，第一模型的相关信息是第一装置对第一模型进行一轮训练得到的。

可选的，第一模型的相关信息包括第一模型的输出参数或更新参数。第一模型的输出参数可以理解为第一模型的输出数据，为了便于描述，后文将统一称为输出参数。第一模型的更新参数包括第一模型的权重参数或权重梯度。例如，第一模型为神经网络模型，第一模型的相关信息包括神经网络模型的输出参数。或者，第一模型的相关信息包括神经网络模型中的权重参数或权重梯度。

一种可能的实现方式中，第一装置为第一终端设备，第二装置为网络设备，该至少一个量化门限值可以承载于下行控制信息、无线资源控制(radio resource control，RRC)消息或媒体接入控制控制元素(medium accesscontrol control element，MAC CE)中。

另一种可能的实现方式中，第一装置为网络设备，第二装置为终端设备，该至少一个量化门限值可以承载于上行控制信息。

下面介绍第二装置确定该至少一个量化门限值的一种可能的实现方式。可选的，图2所示的实施例还包括步骤201a和步骤201b。步骤201a和步骤201b可以在步骤201之前执行。

201a、第一装置向第二装置发送第二信息。相应的，第二装置接收来自第一装置的第二信息。

下面介绍第二信息的两种可能的实现方式。

实现方式1：第二信息用于指示第一模型的相关信息经过处理得到的信息。

可选的，第二信息包括该第一模型的相关信息经过处理得到的信息，或者，第二信息指示该第一模型的相关信息经过处理得到的信息。

例如，第一模型的相关信息包括第一模型的输出参数。第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的绝对值的平均值或加权值。例如，第一模型的输出参数包括第一模型的输出参数A、输出参数B和输出参数C。第一装置对输出参数A、输出参数B和输出参数C分别对应的绝对值进行平均得到输出参数的绝对值的平均值。第二信息包括该第一模型的输出参数的绝对值的平均值或加权值。或者，第二信息指示该第一模型的输出参数的绝对值的平均值或加权值。

例如，第二信息为指示信息，该指示信息的取值与第一模型的输出参数的绝对值的平均值或加权值之间的对应关系可以如表1或表2所示：

表1

指示信息的取值	输出参数的绝对值的平均值或加权值
00	0.25
01	0.5
10	0.75
11	1

例如，第一模型的相关信息包括第一模型的更新参数。第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的绝对值的平均值或加权值。例如，第一模型的更新参数包括第一装置对第一模型进行第Q轮训练得到的权重梯度

权重梯度

和权重梯度

第一装置对权重梯度

权重梯度

和权重梯度

分别对应的绝对值进行平均，得到第一模型的权重梯度的绝对值的平均值。第二信息包括该第一模型的更新参数的绝对值的平均值或加权值。或者，第二信息指示该第一模型的更新参数的绝对值的平均值或加权值。例如，第二信息为指示信息，该指示信息的取值与第一模型的更新参数的绝对值的平均值或加权值之间的对应关系可以如表2所示：

表2

指示信息的取值	更新参数的绝对值的平均值或加权值
00	0.5
01	1
10	1.5
11	2

实现方式2：第二信息用于指示第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息。第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息。M为大于或等于1且小于Q的整数，Q为大于1的整数。

实现方式2中，第二信息包括第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息；或者，第二信息指示第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息。关于第一装置对第一模型进行第M轮训练得到的相关信息经过处理得到的信息可以参阅前述第一模型的相关信息经过处理得到的信息的相关介绍。

实现方式2与实现方式1类似，具体可以参阅实现方式1的相关介绍。

一种可能的实现方式中，第一装置为终端设备，第二装置为网络设备，该第二信息可以承载于下行控制信息、RRC消息或MAC CE中。另一种可能的实现方式中，第一装置为网络设备，第二装置为终端设备，该第二信息可以承载于上行控制信息。

201b、第二装置根据第二信息确定该至少一个量化门限值。

例如，至少一个量化门限值包括一个量化门限值。第二信息包括该第一模型的权重梯度的绝对值的平均值。该量化门限值γ ₁＝mean(abs(Δw _Q))*a，a为控制因子，用于控制量化处理的区间，a的取值范围为[0,+∞)。abs(Δw _Q)表示第一装置对第一模型进行第Q轮训练得到的权重梯度的绝对值。

例如，至少一个量化门限值包括两个量化门限值，分别为第一量化门限值和第二量化门限值。第一量化门限值γ ₁＝mean(abs(Δw _Q))*a，第二量化门限值-γ ₁＝-mean(abs(Δw _Q))*a。abs(Δw _Q)表示第一装置对第一模型进行第Q轮训练得到的权重梯度的绝对值。

可选的，图2所示的实施例还包括步骤201c。步骤201c可以在步骤201之前执行。

201c、第三装置向第二装置发送第三信息。相应的，第二装置接收来自第三装置的第三信息。

第三信息用于指示第三装置的第二模型的相关信息经过处理得到的信息。或者，第三信息用于指示第三装置对第二模型进行第S轮训练并经过处理得到的信息。第二模型的相关信息是第三装置对第二模型进行第R轮训练得到的相关信息。S为大于或等于1且小于R的整数，R为大于1的整数。第三信息与第二信息类似，具体可以参阅前述关于第二信息的相关介绍。

需要说明的是，第二模型可以是第二装置为第三装置配置的模型。第一模型和第二模型可以是同一模型，例如，第一模型和第二模型都为第二装置配置的全局模型。本文第一模型和第二模型是为了区别第一装置和第二装置上的模型，实际可以是同一模型。

基于上述步骤201c，可选的，上述步骤201b具体包括：

第二装置根据第二信息和第三信息确定该至少一个量化门限值。

例如，第二信息包括第一模型的权重梯度的绝对值的平均值。第三信息包括第二模型的权重梯度的绝对值的平均值。第二装置根据第一模型的权重梯度的绝对值的平均值和第二模型的权重梯度的绝对值的平均值确定该至少一个量化门限值。例如，该至少一个量化门限值包括两个量化门限值，分别为第一量化门限值和第二量化门限值。第一量化门限值γ ₁＝mean(mean(abs(Δw _Q)),mean(abs(Δw _R)))*a，第二量化门限值-γ ₁＝-mean(mean(abs(Δw _Q)),mean(abs(Δw _R)))*a。第一装置对第一模型进行第Q轮训练得到的N个权重梯度通过向量Δw _Q表示。第二装置对第二模型进行第R轮训练得到的N个权重梯度通过向量Δw _R表示。

需要说明的是，上述步骤201a至步骤201c仅仅是以第二装置根据第一装置的第二信息和第三装置的第三信息确定该至少一个量化门限值为例进行本申请的技术方案。实际应用中，第二装置可以接收多个装置指示的模型的相关信息，并结合这些模型的相关信息确定该至少一个量化门限值，具体本申请不做限定。

需要说明的是，步骤201c与步骤201a之间没有固定的执行顺序。可以先执行步骤201a，再执行步骤201c；或者，可以先执行步骤201c，再执行步骤201a；或者，依据情况同时执行步骤201a和步骤201c，具体本申请不做限定。

202、第一装置根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理。

由前述介绍可知，第一模型的相关信息包括第一模型的输出参数或更新参数。这里以第一模型的相关信息包括第一模型的N个参数为例介绍本申请的技术方案。N为大于或等于1的整数。因此上述步骤202具体包括：第一装置根据至少一个量化门限值对第一模型的N个参数进行量化处理，得到量化处理后的N个参数。例如，如图3所示，第一装置对第一模型进行第Q轮训练得到第一模型的相关信息。然后，第一装置对第一模型的相关信息进行量化处理。

一种可能的实现方式中，该至少一个量化门限值包括一个量化门限值γ ₁。第一模型的相关信息包括第一模型的N个参数。上述步骤202具体包括：若N个参数中第i个参数大于该量化门限值γ ₁，则第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数。若N个参数中第i个参数小于或等于该量化门限值γ ₁，则第一装置将第i个参数量化为第三值。或者，上述步骤202具体包括：若N个参数中第i个参数大于或等于该量化门限值γ ₁，则第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数。若N个参数中第i个参数小于该量化门限值γ ₁，则第一装置将第i个参数量化为第三值。

例如，第一值为+1，第三值为-1。第一模型的N个参数为第一模型的N个权重梯度。该N个权重梯度中第i个权重梯度表示为

当该权重梯度

大于量化门限值γ ₁，则该权重梯度

量化为+1，当该权重梯度

小于或等于量化门限值γ ₁，则该权重梯度

量化为-1。量化处理后的第i个权重梯度s _i可以通过如下公式1表示：

上述示出了第一装置对第一模型的N个参数中第i个参数的量化过程，对于该N个参数中的其他参数的量化过程同样适用，具体这里不再一一说明。

需要说明的是，可选的，若N个参数中第i个参数大于或等于该量化门限值γ ₁，则第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数。若N个参数中第i个参数小于或等于该量化门限值γ ₁，则第一装置将第i个参数量化为第三值。也就是说，如果第i个参数等于该量化门限值γ ₁，第一装置可以将该第i个参数量化为第一值或第三值。那么对于该情况，第一装置可以通过随机量化处理的方式随机将第i个参数量化为第一值或第三值。

另一种可能的实现方式中，至少一个量化门限值包括两个量化门限值，分别为第一量化门限值γ ₁和第二量化门限值-γ ₁。第一模型的相关信息包括第一模型的N个参数。上述步骤202具体包括：若N个参数中的第i个参数大于第一量化门限值γ ₁时，第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；若N个参数中的第i个参数小于或等于第一量化门限值γ ₁且大于或等于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第二值；若N个参数中第i个参数小于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第三值。或者，上述步骤202具体包括：若N个参数中的第i个参数大于或等于第一量化门限值γ ₁时，第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；若N个参数中的第i个参数小于第一量化门限值γ ₁且大于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第二值；或者，若N个参数中第i个参数小于或等于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第三值。

例如，第一值为+1，第二值为0，第三值为-1。第一模型的N个参数为第一模型的N个权重梯度。该N个权重梯度中第i个权重梯度表示为

当该权重梯度

大于第一量化门限值γ ₁，则该权重梯度

量化为+1。当该权重梯度

小于第二量化门限值-γ ₁，则该权重梯度

量化为-1。当该权重梯度

小于或等于第一量化门限值γ ₁且大于或等于第二量化门限值-γ ₁时，则该权重梯度

量化为0。因此，量化处理后的第i个权重梯度s _i可以通过如下公式2表示：

上述示出了第一装置对第一模型的N个参数中第i个参数的量化过程，对于该N个参数中的其他参数的量化过程同样适用，具体这里不再一一说明。上述实现方式中，第一装置可以通过多个量化门限值量化第一模型的参数，有利于提升量化精度。提升模型的收敛速度和性能。进一步的，由上述公式2可知，s _i可以取值为0，表示当该第i个参数的取值落在第二量化门限值至第一量化门限值之间的区间范围时，第一装置可以不更新该第i个参数。例如，如果该第i个参数是由于训练噪声带来的，那么第一装置不更新该第i个参数，有利于提高第二装置训练得到的第一模型的准确性。

需要说明的是，可选的，若N个参数中的第i个参数大于或等于第一量化门限值γ ₁时，第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；若N个参数中的第i个参数小于或等于第一量化门限值γ ₁且大于或等于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第二值；若N个参数中第i个参数小于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第三值。也就是说对于第i个参数来说，如果第i个参数等于第一量化门限值γ ₁，第一装置可以将该第i个参数量化为第一值或第二值。那么对于该情况，第一装置可以通过随机量化处理的方式随机将第i个参数量化为第一值或第二值。

需要说明的是，可选的，若N个参数中的第i个参数大于第一量化门限值γ ₁时，第一装置将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；若N个参数中的第i个参数小于或等于第一量化门限值γ ₁且大于或等于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第二值；若N个参数中第i个参数小于或等于第二量化门限值-γ ₁时，第一装置将第i个参数量化为第三值。也就是说对于第i个参数来说，如果第i个参数等于第二量化门限值-γ ₁，第一装置可以将该第i个参数量化为第二值或第三值。那么对于该情况，第一装置可以通过随机量化处理的方式随机将第i个参数量化为第二值或第三值。

上述示出了该至少一个量化门限值包括一个量化门限值和两个量化门限值的示例。实际应用中，该至少一个量化门限值可以包括三个量化门限值，四个量化门限值，或更多量化门限值，具体本申请不做限定，这里不再一一示例。

可选的，上述步骤202中，第一模型的相关信息包括第一模型的量化误差补偿后的N个参数。关于量化误差补偿后的N个参数请参阅下述步骤202a的相关介绍。

可选的，图2所示的实施例还包括步骤202a，步骤202a可以在步骤202之前执行。

202a、第一装置根据第一模型的N个参数分别对应的量化误差对N个参数进行误差补偿，得到量化误差补偿后的N个参数。

第一模型的N个参数是第一装置对第一模型进行第Q轮训练得到的。该N个参数中的第i个参数对应的量化误差是第一装置对第一模型进行第Q-1轮训练且经过量化误差补偿得到的第i个参数确定的。

例如，第一模型的N个参数中第i个参数为第i个权重梯度

量化误差补偿后的第i个权重梯度可以表示为

其中，

表示量化误差补偿后的第Q-1轮训练得到的第i个权重梯度，η为全局学习率。

表示对

进行量化处理。

需要说明的是，第一装置可以确定第Q+1轮训练得到的第i个参数对应的量化误差

从而便于第一装置对第Q+1轮训练得到的N个参数进行量化误差补偿。

基于上述步骤202a，上述第一模型的相关信息包括量化误差补偿后的N个参数。可选的，上述步骤202具体包括：第一装置根据该至少一个量化门限值对量化误差补偿后的N个参数进行量化处理。具体的量化处理过程请参阅前述步骤202的相关介绍。

由此可知，上述步骤202a中第一装置对第一模型的N个参数分别对应的量化误差对该N个参数进行量化误差补偿，从而有利于提高第二装置更新第一模型的准确性，提升模型训练的性能。

可选的，上述步骤202中，第一模型的相关信息包括第一模型的经过稀疏处理的N个参数。关于第一模型的经过稀疏处理的N个参数请参阅下述步骤202b的相关介绍。

可选的，图2所示的实施例还包括步骤202b。步骤202b可以在步骤202之前执行。

202b、第一装置根据公共稀疏掩码从第一模型的K个参数中选择N个参数，得到第一模型的经过稀疏处理的N个参数。

一种可能的实现方式中，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的。

另一种可能的实现方式中，第一模型的K个参数是第一装置对第一模型进行一轮训练并经过量化误差补偿得到的。第一装置对该K个参数进行量化误差补偿的过程与前述步骤202a类似，具体可以参阅前述步骤202a的相关介绍。

可选的，该公共稀疏掩码为比特序列，该比特序列包括K个比特。K个比特与该K个参数一一对应。当K个比特中的一个比特的取值为0时，用于指示第一装置不选择该比特对应的参数。当K个比特中的一个比特的取值为1时，用于指示第一装置选择该比特对应的参数。或者，当K个比特中的一个比特的取值为0时，用于指示第一装置选择该比特对应的参数。当K个比特中的一个比特的取值为1时，用于指示第一装置不选择该比特对应的参数。例如，K个参数包括第一模型的十个权重梯度。比特序列为1000111100，该比特序列从高位到低位与十个权重梯度一一对应。例如，比特序列的第一个比特对应该十个权重梯度中的第一个权重梯度。比特序列的第二个比特对应该十个权重梯度中的第二个权重梯度，以此类推。比特序列的第十个比特对应该十个权重梯度中的第十个权重梯度。那么可知，该第一模型的相关信息包括该十个权重梯度中的第一个权重梯度、第五个权重梯度、第六个权重梯度、第七个权重梯度以及第八个权重梯度。

下面介绍第一装置获取公共稀疏掩码的两种可能的实现方式。

实现方式1：公共稀疏掩码是第一装置根据稀疏比例和伪随机数确定的。该稀疏比例是第二装置向第一装置指示的。

需要说明的是，多个装置需要采用相同的公共稀疏掩码，从而实现多个装置中各个装置向第二装置发送各个装置上配置的模型的相同索引的参数。并且，该多个装置可以通过相同的时频资源发送索引相同的参数。有利于降低多个装置上报模型参数所需的通信资源。提高通信资源的利用率。从而支持第二装置在同一时频资源上接收到多个装置发送的索引相同的参数。即支持第二装置通过空中信号的叠加实现模型融合。

需要说明的是，第二装置在不同的训练阶段可以向第一装置指示不同的稀疏比例。例如，在训练开始阶段，该稀疏比例可以较小。这样方便第二装置获取更多模型的相关信息，实现模型的快速收敛。在训练收敛阶段，该稀疏比例可以较大。

实现方式2：下面结合步骤201e介绍实现方式2。

可选的，图2所示的实施例还包括步骤201e。步骤201e可以在步骤202b之前执行。

202b、第二装置向第一装置发送第二指示信息。相应的，第一装置接收来自第二装置的第二指示信息。第二指示信息用于指示公共稀疏掩码。

后文结合图4所示的实施例介绍第二装置确定该公共稀疏掩码的一种可能的实现方式，具体请参阅后文图4所示的实施例的相关介绍。

基于上述步骤202b，可选的，上述步骤202具体包括：第一装置根据该至少一个量化门限值对该第一模型的经过稀疏处理的N个参数进行量化处理。具体的量化处理过程可以参阅前述步骤202中的相关介绍。例如，如图3所示，第一装置对第一模型进行第Q轮训练得到第一模型的K个参数。然后，第一装置对第一模型的K个参数进行量化误差，得到量化误差补偿后的K个参数。第一装置根据公共稀疏掩码从量化误差补偿后的K个参数中选择N个参数，再根据该至少一个量化门限值对该N个参数进行量化处理。

由此可知，上述步骤202b中第一装置根据公共稀疏掩码选择第一模型的部分参数，从而有利于降低第一装置上报第一模型的参数的开销。

上述步骤201e与上述步骤201a、步骤201b、步骤201c和步骤201之间没有固定的执行顺序。可以先执行步骤201e，再执行步骤201a、步骤201b、步骤201c和步骤201。或者，可以先执行步骤201a、步骤201b、步骤201c和步骤201，再执行步骤201e；或者，依据情况同时步骤201e、步骤201a、步骤201b、步骤201c和步骤201。

203、第一装置向第二装置发送第一信息。第一信息用于指示量化处理后的第一模型的相关信息。相应的，第二装置接收来自第一装置的第一信息。

一种可能的实现方式中，第一信息包括量化处理后的第一模型的相关信息。例如，第一模型的相关信息包括第一模型的N个参数，第一信息包括量化处理后的第一模型的N个参数。

另一种可能的实现方式中，第一信息为指示信息，该指示信息指示量化处理后的第一模型的相关信息。

可选的，第一模型的相关信息包括量化处理后的第一模型的N个参数。下面介绍上述步骤203的一种可能的实现方式。可选的，上述步骤203具体包括步骤2003a和步骤2003b。

2003a、第一装置对量化处理后的第一模型的N个参数进行调制得到N个第一信号。其中，N个第一信号与该N个参数一一对应。

2003b、第一装置向第二装置发送N个第一信号。相应的，第二装置接收来自第一装置的N个第一信号。

下面结合上述公式2所示的量化示例介绍上述步骤2003a和步骤2003b。

第一装置对该量化处理后的第一模型的N个参数中的第i个参数进行调制得到第i个第一信号。该第i个第一信号对应两个序列，该两个序列中每个序列包括至少一个符号。下面介绍第一装置发送该两个序列的两种可能的实现方式，从而便于第二装置确定该量化处理后的第i个参数的取值。

实现方式1：当量化处理后的第i个参数为第一值时，第一装置发送两个序列中的第一个序列的发送功率小于第一装置发送两个序列中的第二个序列的发送功率。当量化处理后的第i个参数为第二值时，第一装置发送该两个序列中的第一个序列的发送功率等于第一装置发送该两个序列中的第二个序列的发送功率。当量化处理后的第i个参数为第三值时，第一装置发送该两个序列中的第一个序列的发送功率大于第一装置发送两个序列中的第二个序列的发送功率。

可选的，当量化处理后的第i个参数为第一值时，该两个序列中的第一个序列为全0序列，第二个序列为非全0序列。当量化处理后的第i个参数为第二值时，该两个序列均为全0序列。当量化处理后的第i个参数为第三值时，两个序列中的第一个序列为非全0序列，第二个序列为全0序列。例如，第一值为+1，第二值为0，第三值为-1。第i个第一信号承载第i个参数s _i，第i个参数对应的两个序列。对于第i个参数的各种取值下，对应的两个序列(即序列1和序列2)分别如表3所示：

表3

s _i	+1	-1
序列1	0	c ₁
序列2	c ₀	0

其中，c ₀和c ₁均为特定长度的序列。例如，c ₀的长度和c ₁的长度都为1，即都包括一个符号。可选的，c ₀和c ₁均可以为Zadoff–Chu序列，该Zadoff–Chu序列可以简称为ZC序列。

实现方式2：当量化处理后的第i个参数为第一值时，第一装置发送两个序列中的第一个序列的发送功率大于第一装置发送两个序列中的第二个序列的发送功率。当量化处理后的第i个参数为第二值时，第一装置发送该两个序列中的第一个序列的发送功率等于第一装置发送该两个序列中的第二个序列的发送功率。当量化处理后的第i个参数为第三值时，第一装置发送该两个序列中的第一个序列的发送功率小于第一装置发送两个序列中的第二个序列的发送功率。

可选的，当量化处理后的第i个参数为第一值时，该两个序列中的第一个序列为非全0序列，第二个序列为全0序列。当量化处理后的第i个参数为第二值时，该两个序列均为全0序列。当量化处理后的第i个参数为第三值时，两个序列中的第一个序列为全0序列，第二个序列为非全0序列。例如，第一值为+1，第二值为0，第三值为-1。第i个第一信号承载第i个参数s _i，第i个参数对应的两个序列。对于第i个参数的各种取值下，对应的两个序列(即序列1和序列2)分别如表4所示：

表4

s _i	+1	-1
序列1	c ₀	0
序列2	0	c ₁

关于c ₀和c ₁请参阅前述的相关介绍，这里不再说明。

需要说明的是，上述示出了第一值、第二值和第三值的一种可能的示例。实际应用中，第一值、第二值和第三值也可以是其他取值，具体本申请不做限定。例如，第一值为0.7，第二值为0，第三值为-0.7。

如图3所示，第一装置对第一模型的N个参数进行量化处理后，得到量化处理后的第一模型的N个参数。第一装置对量化处理后的第一模型的N个参数进行调制，再将调制得到的序列映射到相应的时频资源上，并进行波形成型得到该N个第一信号。第一装置向第二装置发送该N个第一信号。由上述介绍可知，第一装置将第一模型的N个参数中每个参数调制到两个序列上。第一装置控制发送该两个序列中每个序列分别采用的发送功率，从而便于第二装置确定该参数的取值。第一装置无需进行信道的估计和均衡，从而无需相应的导频开销。

由此可知，第一装置接收来自第二装置的至少一个量化门限值。然后，第一装置根据至少一个量化门限值对第一装置的第一模型的相关信息进行量化处理。第一装置向第二装置发送第一信息，第一信息用于指示量化处理后的第一模型的相关信息。从而降低第一装置上报第一模型的相关信息的通信开销，节省通信资源。

可选的，图2所示的实施例还包括步骤204和步骤205。步骤204和步骤205可以在步骤203之后执行。

204、第二装置根据第一信息确定第一模型的全局信息。

第一模型的全局信息包括第一模型的全局输出参数。或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。第一模型的全局输出参数可以理解为第一模型的全局输出数据。第一模型的全局更新参数包括第一模型的全局权重参数或全局权重梯度。

可选的，第一模型的全局信息包括第一模型的N个全局参数，全局参数为输出参数或更新参数。关于N个全局参数的确定过程可以参阅后文的相关介绍。

可选的，第一信息包括量化处理后的第一模型的N个参数，第二装置可以根据该第一模型的N个参数确定全局学习率η。

例如，量化处理后的第一模型的N个参数包括第一装置对第一模型进行第Q轮训练且经过量化处理得到的N个权重梯度。具体通过向量Δw _Q表示该第一模型的N个权重梯度。即向量Δw _Q包括第一装置对第一模型进行第Q轮训练得到的N个权重梯度。第二装置可以确定全局学习率η＝mean(abs(Δw _q))。向量Δw _q包括向量Δw _Q中的量化处理后的不为0的权重参数。

需要说明的是，可选的，第一装置也可以向第二装置发送第六信息。该第六信息用于指示该第一模型的N个参数中经过量化处理后的不为0的参数的取值的绝对值的平均值。第二装置根据该第六信息确定该全局学习率。

例如，该第一模型的N个参数是第一装置对第一模型进行第Q轮训练得到的N个权重梯度，具体通过向量Δw _Q表示该第一模型的N个权重梯度。那么第二装置可以确定全局学习率η＝mean(abs(Δw _q))，mean(abs(Δw _q))是第一装置通过第六信息向第二装置指示的，abs(Δw _q)是向量Δw _Q中量化处理后的不为0的权重参数的取值的绝对值。

需要说明的是，可选的，全局学习率η是可变的。例如，全局学习率η是随着训练轮数变化的常数。

需要说明的是，在上述步骤204中是以第二装置根据第一信息确定该全局学习率。实际应用中，第二装置可以根据第二信息确定该全局学习率。可选的，第二装置根据第二信息和第三信息确定该全局学习率，具体本申请不做限定。

一种可能的实现方式中，第一模型为神经网络模型。第一模型的相关信息包括神经网络模型的全部层的神经元的相关参数。基于该实现方式中，上述步骤204中第一模型的全局信息中包括的第一模型的N个全局参数是全部层的神经元的全局参数。

该实现方式中，该至少一个量化门限值和全局学习率是针对神经网络模型中各层的神经元统一设置的。

另一种可能的实现方式中，第一模型为神经网络模型。第一模型的相关信息包括神经网络模型的其中P层的神经元的相关参数，P为大于或等于1的整数。

基于该实现方式中，上述步骤204中第一模型的全局信息中包括的第一模型的N个全局参数是该P层的神经元的全局参数。

该实现方式中，该至少一个量化门限值和全局学习率是针对神经网络模型中该P层的神经元统一设置的。对于该神经网络模型的除了该P层之外的其他层的神经元，应当另外确定对应的量化门限值和全局学习率。

可选的，图2所示的实施例还包括步骤203a，步骤203a可以在步骤204之前执行。

203a、第三装置向第二装置发送第五信息。第五信息用于指示量化处理后的第二模型的相关信息。相应的，第二装置接收来自第三装置的第五信息。

具体的，量化处理后的第二模型的相关信息是第三装置根据该至少一个量化门限值量对第二模型的相关信息进行量化处理得到的。具体的量化处理过程可以参阅前述步骤202的相关介绍。

可选的，第二模型的相关信息包括第二模型的N个参数。关于第二模型请参阅前述的相关介绍。可选的，上述步骤203a具体包括步骤1和步骤2。

步骤1：第三装置对第二模型的N个参数进行调制得到N个第二信号。N个第二信号承载第二模型的N个参数，N个第二信号与第二模型的N个参数一一对应。

步骤2：第三装置向第二装置发送该N个第二信号。相应的，第二装置接收来自第三装置的N个第二信号。

步骤1至步骤2与前述步骤2003a至步骤2003b类似，具体可以参阅前述步骤2003a至步骤2003b的相关介绍，这里不再赘述。

可选的，N个第一信号中第i个第一信号对应第一序列和第二序列。第一序列是第i个第一信号对应的两个序列中的第一个序列，第二序列是第i个第一信号对应的两个序列中的第二个序列。N个第二信号中第i个第二信号对应第三序列和第四序列。第三序列是第i个第二信号对应的两个序列中的第一个序列，第四序列是第i个第二信号对应的两个序列中的第二个序列。i为大于或等于1且小于或等于N的整数。第一装置发送第一序列采用的时频资源与第三装置发送第三序列采用的时频资源相同。第一装置发送第二序列采用的时频资源与第三装置发送第四序列采用的时频资源相同。从而支持第二装置实现对多用户空中信号叠加传输的非相干接收。

需要说明的是，步骤203和步骤203a之间没有固定的执行顺序。可以先执行步骤203，再执行步骤203a；或者，先执行步骤203a，再执行步骤203；或者，依据情况同时执行步骤203和步骤203a，具体本申请不做限定。

基于上述步骤203和步骤203a，可选的，上述步骤204具体包括：第二装置根据第一信息和第五信息确定第一模型的全局信息。

具体的，第二装置根据N个第一信号和N个第二信号确定该第一模型的全局信息。下面以N个第一信号中第i个第一信号对应第一序列和第二序列，N个第二信号中第i个第二信号对应第三序列和第四序列为例介绍上述步骤204的一种可能的实现方式。其中，第一装置发送第一序列采用的时频资源与第三装置发送第三序列采用的时频资源相同。第一装置发送第二序列采用的时频资源与第三装置发送第四序列采用的时频资源相同。

可选的，上述步骤204具体包括步骤204a至步骤204c。

204a、第二装置确定第二装置接收第一序列和第三序列的第一信号能量和。

例如，该第一信号能量和可以表示为

204b、第二装置确定第二装置接收第二序列和第四序列的第二信号能量和。

例如，第二信号能量和可以表示为

204c、第二装置根据第一信号能量和和第二信号能量和确定N个全局参数中的第i个全局参数。

基于前述步骤2003b中的实现方式1，可选的，上述步骤204c具体包括：

若第一信号能量和与判决门限值的和小于第二信号能量和，则第二装置确定第i个全局参数的取值为第一值；或者，若第一信号能量和与判决门限值的和大于或等于第二信号能量和，且第二信号能量和与判决门限值的和大于或等于第一信号能量和，则第二装置确定第i个全局参数的取值为第二值；或者，若第二信号能量和与判决门限值的和小于第一信号能量和，则第二装置确定第i个全局参数的取值为第三值。

例如，第一值为+1，第二值为0，第三值为-1。第一模型的全局信息包括第一模型的N个全局权重梯度，N个全局权重梯度第i个全局权重梯度a _i可以表示为公式3：

其中，γ ₂为判决门限值，第一信号能量和可以表示为

第二信号能量和可以表示为

基于前述步骤2003b中的实现方式2，可选的，上述步骤204c具体包括：

若第一信号能量和大于第二信号能量和与判决门限值的和，则第二装置确定第i个全局参数的取值为第一值；或者，若第一信号能量和小于或等于第二信号能量和与判决门限值的和，且第二信号能量和小于或等于第一信号能量和与判决门限值的和，则第二装置确定第i个全局参数的取值为第二值；或者，若第二信号能量和大于第一信号能量和与判决门限值的和，则第二装置确定第i个全局参数的取值为第三值。

例如，第一值为+1，第二值为0，第三值为-1。第一模型的全局信息包括第一模型的N个全局权重梯度，N个全局权重梯度第i个全局权重梯度a _i可以表示为公式4：

其中，γ ₂为判决门限值，第一信号能量和可以表示为

第二信号能量和可以表示为

上述步骤204a至步骤204c的过程示出了第二装置确定第i个全局参数的过程。第二装置可以采用类似的过程确定该N个全局参数中的其他全局参数，具体这里不再一一说明。

需要说明的是，第二装置可以结合该N个第一信号和/或该N个第二信号确定该判决门限值。例如，第一装置向第二装置发送第i个第一信号，第三装置向第二装置发送第i个第二信号。第i个第一信号和第i个第二信号占用相同的时频资源。第二装置在该时频资源上接收到的叠加信号y _i。对于其他第一信号和第二信号同样类似，这里不再一一举例说明。例如，判决门限值γ ₂＝mean(abs(|y _2i| ²-|y _2i-1| ²)，0<i≤N，i为整数)*b。其中，

表示第一信号能量和，

表示第二信号能量和，关于第一信号能量和和第二信号能量和请参阅前述的相关介绍。b是控制因子，用于控制判决的门限，影响全局参数中非0元素的个数和第一模型的更新。

由此可知，第二装置可以通过第二装置接收第i个第一信号对应的两个序列的信号能量以及接收第i个第二信号对应的两个序列的信号能量确定第i个全局参数。从而支持第二装置实现对多用户空中信号叠加传输的非相干接收，实现对衰落信道鲁棒。

可选的，第二装置可以根据第一信息和第五信息确定该全局学习率。

例如，量化处理后的第一模型的N个参数包括第一装置对第一模型进行第Q轮训练且经过量化处理得到的N个权重梯度。具体通过向量Δw _Q表示该第一模型的N个权重梯度。即向量Δw _Q包括第一装置对第一模型进行第Q轮训练得到的N个权重梯度。量化处理后的第二模型的N个参数包括第二装置对第二模型进行第R轮训练且经过量化处理得到的N个权重梯度。具体通过向量Δw _R表示该第二模型的N个权重梯度。即向量Δw _R包括第二装置对第二模型进行第Q轮训练得到的N个权重梯度。因此，第二装置可以确定全局学习率η＝mean(mean(abs(Δw _q)),mean(abs(Δw _r)))。向量Δw _q包括向量Δw _Q中量化处理后的不为0的权重参数。向量Δw _r包括向量Δw _R中的量化处理后的不为0的权重梯度。

需要说明的是，可选的，第一装置可以向第二装置发送第六信息。该第六信息用于指示该第一模型的N个参数中经过量化处理后的不为0的参数的取值的绝对值。第三装置向第二装置发送第七信息。该第七信息用于指示第二模型的N个参数中经过量化处理后的不为0的参数的取值的绝对值的平均值。第二装置根据第六信息和第七信息确定该全局学习率。

例如，量化处理后的第一模型的N个参数包括第一装置对第一模型进行第Q轮训练且经过量化处理得到的N个权重梯度。具体通过向量Δw _Q表示该第一模型的N个权重梯度。即向量Δw _Q包括第一装置对第一模型进行第Q轮训练得到的N个权重梯度。量化处理后的第二模型的N个参数包括第二装置对第二模型进行第R轮训练且经过量化处理得到的N个权重梯度。具体通过向量Δw _R表示该第二模型的N个权重梯度。即向量Δw _R包括第二装置对第二模型进行第Q轮训练得到的N个权重梯度。第一装置通过第六信息向第二装置指示向量Δw _Q中量化处理后的不为0的权重梯度的取值的绝对值的平均值mean(abs(Δw _q))。第三装置通过第七信息向第二装置指示向量Δw _R中量化处理后的不为0的权重梯度的取值的绝对值的平均值mean(abs(Δw _r))。那么第二装置可以确定全局学习率η＝mean(mean(abs(Δw _q)),mean(abs(Δw _r)))。

205、第二装置向第一装置发送第四信息。第四信息用于指示第二装置确定的第一模型的全局信息。相应的，第一装置接收来自第二装置的第四信息。

其中，第四信息包括第二装置确定的第一模型的全局信息。或者，第四信息指示第二装置确定的第一模型的全局信息。例如，第二装置对该第一模型的全局信息进行编码或调制得到该第四信息，并通过第四信息向第一装置指示该第一模型的全局信息。关于第一模型的全局信息请参阅前述的相关介绍。

例如，第四信息包括第二装置确定的第一模型的N个全局权重梯度。该N个全局权重梯度通过向量A表示。因此第一装置可以将第一模型的权重参数更新为w _Q＝w _Q-1+η*A。w _Q-1为第一装置对第一模型进行第Q-1轮更新得到第一模型的全局权重参数。w _Q为第一装置对第一模型进行第Q轮更新得到的第一模型的全局权重参数。η为全局学习率。

例如，第四信息包括第二装置确定的第一模型的N个全局输出参数。第一装置可以对第一模型进行第Q+1轮训练得到第一模型的N个实际输出参数。第一装置根据该N个实际输出参数和该N个全局输出参数训练第一模型得到该第一模型的权重参数。

可选的，图2所示的实施例还包括步骤201d。步骤201d可以在步骤203之前执行。

201d、第二装置向第一装置发送第一指示信息。第一指示信息用于指示第一装置向第二装置发送第一信息的发送次数L。相应的，第一装置接收来自第二装置的第一指示信息。其中，L为大于或等于1的整数。

基于上述步骤201d，可选的，上述步骤203具体包括：第一装置向第二装置发送L次第一信息。相应的，第二装置接收L次来自第一装置的第一信息。

在该实现方式中，第二装置可以指示第一装置重复多次向第二装置发送第一信息。由上述步骤204的相关介绍可知，第二装置基于能量的梯度判决会因为信道噪声和信号非相干叠加的随机性出现判决错误。因此，第一装置重复发送该第一信息，有利于第二装置分别判决后选择出现次数最多的判决结果作为最好的判决结果，从而降低判决错误概率，进而提升模型训练的性能。

例如，如图3所示，第一装置将第一模型的N个参数进行量化处理后，得到量化处理后的第一模型的N个参数。第一装置对量化处理后的第一模型的N个参数进行调制。第一装置可以按照发送次数L将调制得到的序列映射到相应的时频资源上，并进行波形成型得到相应的第一信号。第一装置向第二装置发送该第一信号。例如，L等于2，第一装置可以重复两次将调制得到的序列映射到相应的时频资源上。

需要说明的是，可选的，发送次数L可以结合模型的训练阶段、参与模型训练的用户数量以及信道的信噪比中的至少一项因素设定。例如，在训练的后期阶段，参与模型训练的用户数较少以及信噪比较低的情况下，发送次数可以较大。

需要说明的是，上述是以第二装置结合第一信息确定全局学习率的方式为例介绍本申请的技术方案。第二装置可以结合第一信息和/或第三信息确定该全局学习率，具体本申请不做限定。

需要说明的是，上述图2所示的实施例中介绍的是第二装置根据第二信息和第三信息确定至少一个量化门限值的方案。实际应用中，第二装置可以向第一装置发送第三信息。第一装置根据第二信息和第三信息自行确定该至少一个量化门限值，具体本申请不做限定。

本申请还提供另一个实施例，该实施例与图2所示的实施例类似，不同的地方在于：步骤204。上述步骤204替换为步骤2004a，本实施例还包括步骤2004b和步骤2004c。步骤2004b和步骤2004c可以在步骤205之前执行。

2004a、第二装置向第四装置发送第一信息。相应的，第四装置接收来自第二装置的第一信息。

关于第一信息请参阅前述图2所示的实施例中的步骤203的相关介绍。例如，第二装置为网络设备，第四装置为服务器。服务器可以接收来自网络设备发送的第一信息。

2004b、第四装置根据该第一信息确定第一模型的全局信息。

步骤2004b与前述图2所示的实施例中的步骤204类似，具体可以参阅前述图2所示的实施例中的步骤204的相关介绍。

可选的，本实施例还包括步骤2004d，步骤2004d可以在步骤2004b之前执行。

2004d、第二装置向第四装置发送第五信息。相应的，第四装置接收来自第二装置的第五信息。

关于第五信息请参阅前述图2所示的实施例中的步骤203a中的相关介绍。

需要说明的是，步骤2004a与步骤2004d之间没有固定的执行顺序。可以先执行步骤2004a，再执行步骤2004d；或者，先执行步骤2004d，再执行步骤2004a；或者依据情况同时执行步骤2004a和步骤2004d。

2004c、第四装置向第二装置发送第四信息，该第四信息用于指示确定的第二模型的全局信息。相应的，第二装置接收来自第四装置的第四信息。

关于第四信息请参阅前述图2所示的实施例中的步骤205的相关介绍，这里不再赘述。

需要说明的是，第一装置可以为第一终端设备。第二装置可以为网络设备。第三装置可以为第二终端设备。第四装置可以为服务器。上述实施例介绍的是服务器获取该网络设备所管理的终端设备的模型的相关信息，并结合这些模型的相关信息确定第一模型的全局信息的过程。实际应用中，服务器可以获取多个网络设备分别所管理的终端设备的模型的相关信息，并结合这些模型的相关信息确定第一模型的全局信息的过程，具体本申请不做限定。

下面结合图4介绍第二装置确定公共稀疏掩码的一种可能的实现方式。

图4为本申请实施例通信方法的另一个实施例示意图。请参阅图4，方法包括：

401、第一装置向第二装置发送第三指示信息。第三指示信息用于指示第一装置对第一模型进行一轮训练得到的K个参数中对应的取值的绝对值最大的N个参数的索引。相应的，第二装置接收来自第一装置的第三指示信息。

该第一模型的K个参数是第一装置对第一模型进行一轮训练得到的。第一装置确定该 K个参数中对应的取值的绝对值最大的N个参数。然后，第一装置向第二装置发送该第三指示信息。

可选的，第三指示信息为比特序列，该比特序列包括K个比特，K个比特与该第一模型的K个参数一一对应。当比特序列中的一个比特的取值为0时，表示该第一装置不指示该比特对应的参数；当比特序列中的一个比特的取值为1时，表示该第一装置指示该比特对应的参数。关于比特序列的相关示例可以参阅后文图5的相关介绍。

402、第三装置向第二装置发送第四指示信息。第四指示信息用于指示第二装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引。相应的，第二装置接收来自第一装置的第四指示信息。

该第二模型的K个参数是第三装置对第二模型进行一轮训练得到的。第三装置确定该第二模型的K个参数中对应的取值的绝对值最大的N个参数。然后，第三装置向第二装置发送该第四指示信息。

可选的，第四指示信息的形式与第三指示信息类似，具体可以参阅前述步骤401中的相关介绍，这里不再赘述。

403、第二装置根据第三指示信息和第四指示信息确定公共稀疏掩码。

关于公共稀疏掩码请参阅前述图2所示的实施例中的相关介绍，这里不再赘述。

需要说明的是，上述图4介绍的是第二装置根据第三指示信息和第四指示信息确定公共稀疏掩码的过程。实际应用中，第二装置可以接收多个装置中每个装置发送的用于指示该装置的模型的K个参数中对应的取值的绝对值最大的N个参数的指示信息。然后，第二装置结合该多个装置的指示信息确定该公共稀疏掩码。

例如，如图5所示，网络设备可以接收来自多个终端设备中每个终端设备的用于指示该终端设备的模型的K个参数中对应的取值的绝对值最大的N个参数的指示信息。如图5所示，第一终端设备向网络设备发送第一比特序列，该第一比特序列为110010100。该第一比特序列中每个比特对应第一终端设备的模型的K个参数中的一个参数，即K等于9。例如，该第一比特序列中第一个比特对应K个参数中的第一个参数，第二个比特对应K个参数中的第二个参数，以此类推，最后一个比特对应K个参数中的最后一个参数。该第一比特序列中取值为1的比特对应的参数是该九个参数中对应的取值的绝对值最大的四个参数。第一终端设备通过该第一比特序列向该网络设备指示该四个参数的索引。

对于第二终端设备和第三终端设备同样类似。例如，第二终端设备向网络设备发送第二比特序列，该第二比特序列为101000101。该第二比特序列中每个比特对应第二终端设备的模型的K个参数中的一个参数，即K等于9。该第二比特序列中取值为1的比特对应的参数是该九个参数中对应的取值的绝对值最大的四个参数。第二终端设备通过该第二比特序列向该网络设备指示该四个参数的索引。第三终端设备向网络设备发送第三比特序列，该第三比特序列为110001001。该第三比特序列中每个比特对应第三终端设备的模型的K个参数中的一个参数，即K等于9。该第三比特序列中取值为1的比特对应的参数是该九个参数中对应的取值的绝对值最大的四个参数。第三终端设备通过该第三比特序列向该网络设备指示该四个参数的索引。可选的，网络设备根据第一比特序列、第二比特序列和第三比特序列确定公共稀疏掩码。如图5所示，该公共稀疏掩码为比特序列，具体为110001101。网络设备通过该比特序列指示终端设备上报该比特序列中取值为1的比特对应的模型参数。从而降低终端设备上报模型参数的开销，节省通信资源。

上述各个方法实施例可以单独实施，也可以结合实施。各实施例中涉及的术语和相关技术可以互相参考。也就是说不同实施例之间不矛盾或逻辑上没有冲突的技术方案之间是可以相互结合的，具体本申请不做限定。

下面对本申请实施例提供的第一装置进行描述。请参阅图6，图6为本申请实施例第一装置的一个结构示意图。第一装置600可以用于执行图2和图4所示的实施例中第一装置执行的步骤，具体请参阅上述方法实施例的相关介绍。

第一装置600包括收发模块601和处理模块602。

收发模块601，用于接收来自第二装置的至少一个量化门限值；

处理模块602，用于根据至少一个量化门限值对第一装置600的第一模型的相关信息进行量化处理；

收发模块601，还用于向第二装置发送第一信息，第一信息用于指示量化处理后的第一模型的相关信息。

一种可能的实现方式中，第一模型的相关信息包括：第一模型的输出参数或更新参数，更新参数包括第一模型的权重梯度或权重参数。

另一种可能的实现方式中，收发模块601还用于：

向第二装置发送第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，

第二信息用于指示第一装置600对第一模型进行第M轮训练得到的相关信息经过处理得到的信息，第一模型的相关信息是第一装置600对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1且小于Q的整数，Q为大于1的整数。

另一种可能的实现方式中，第一模型的相关信息包括第一模型的输出参数，第一模型的相关信息经过处理得到的信息包括第一模型的输出参数的取值的绝对值的平均值；或者，

第一模型的相关信息包括第一模型的更新参数，第一模型的相关信息经过处理得到的信息包括第一模型的更新参数的取值的绝对值的平均值。

另一种可能的实现方式中，收发模块601还用于：

接收来自第二装置的第三信息，第三信息用于指示第一模型的全局信息。

另一种可能的实现方式中，第一模型的全局信息包括第一模型的全局输出参数；或者，第一模型的全局信息包括第一模型的全局更新参数和/或全局学习率。

另一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；处理模块602具体用于：

根据至少一个量化门限值对N个参数进行量化处理，得到量化处理后的N个参数；

收发模块601具体用于：

对量化处理后的N个参数进行调制得到N个第一信号；

向第二装置发送N个第一信号。

另一种可能的实现方式中，至少一个量化门限值包括第一量化门限值和第二量化门限值；处理模块602具体用于：

若N个参数中的第i个参数大于第一量化门限值时，将第i个参数量化为第一值，i为大于或等于1且小于或等于N的整数；或者，

若N个参数中的第i个参数小于或等于第一量化门限值且大于或等于第二量化门限值时，将第i个参数量化为第二值；或者，

若N个参数中第i个参数小于第二量化门限值时，将第i个参数量化为第三值。

另一种可能的实现方式中，收发模块601具体用于：

对量化处理后的第i个参数进行调制得到第i个第一信号，该第i个第一信号对应两个序列；

当量化处理后的第i个参数为第一值时，第一装置600发送两个序列中的第一个序列的发送功率小于第一装置600发送所述两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第二值时，第一装置600发送两个序列中的第一个序列的发送功率等于第一装置600发送两个序列中的第二个序列的发送功率；当量化处理后的第i个参数为第三值时，第一装置600发送两个序列中的第一个序列的发送功率大于第一装置600发送所述两个序列中的第二个序列的发送功率。

另一种可能的实现方式中，当量化处理后的第i个参数为第一值时，两个序列中的第一个序列为非全0序列，第二个序列为全0序列；当量化处理后的第i个参数为第二值时，两个序列均为全0序列；当量化处理后的第i个参数为第三值时，两个序列中的第一个序列为全0序列，第二个序列为非全0序列。

另一种可能的实现方式中，收发模块601具体用于：

向第二装置发送L次第一信息，L为大于或等于1的整数。

另一种可能的实现方式中，收发模块601还用于：

接收来自第二装置的第一指示信息，第一指示信息用于指示第一装置600向第二装置发送第一信息的发送次数L。

另一种可能的实现方式中，第一模型的相关信息包括第一模型的量化误差补偿后的N个参数，量化误差补偿后的N个参数是第一装置600根据第一装置600对第一模型进行第Q轮训练得到的N个参数分别对应的量化误差对N个参数进行误差补偿得到的，N个参数中的第i个参数对应的量化误差是根据第一装置600对第一模型进行第Q-1轮训练得到的第i个参数和量化误差补偿后的第Q-1轮训练得到的第i个参数确定的，i为大于或等于1且小于或等于N的整数，N为大于或等于1的整数，Q为大于1的整数。

另一种可能的实现方式中，第一模型的相关信息包括第一模型的经过稀疏处理得到的N个参数；第一模型的经过稀疏处理得到的N个参数是第一装置600根据公共稀疏掩码从第一模型的K个参数中选择N个参数，第一模型的K个参数是第一装置600对第一模型进行一轮训练得到的参数，K为大于或等于N的整数，K为大于或等于1的整数，N为大于或等于1的整数。

另一种可能的实现方式中，公共稀疏掩码为比特序列，比特序列包括K个比特，K个比特与K个参数一一对应；当K个比特中的一个比特的取值为0时，用于指示第一装置600不选择该比特对应的参数；当K个比特中的一个比特的取值为1时，用于指示第一装置600选择该比特对应的参数。

另一种可能的实现方式中，公共稀疏掩码是第一装置600根据稀疏比例和伪随机数确定的，稀疏比例是第二装置向第一装置600指示的。

另一种可能的实现方式中，收发模块601还用于：

接收来自第二装置的第二指示信息，第二指示信息用于指示公共稀疏掩码。

另一种可能的实现方式中，收发模块601还用于：

向第二装置发送第三指示信息，第三指示信息用于指示K个参数中对应的取值的绝对值最大的N个参数的索引。

另一种可能的实现方式中，第一模型为神经网络模型，第一模型的相关信息包括神经网络模型的其中P层的神经元的相关参数，P为大于或等于1的整数。

图7为本申请实施例第一装置的另一个结构示意图。请参阅图7，第一装置700可以用于执行图4所示的实施例中第一装置执行的步骤，具体请参阅上述方法实施例的相关介绍。

第一装置700包括收发模块701。可选的，第一装置700还包括处理模块702。

收发模块701，用于向第二装置发送第一指示信息，第一指示信息用于指示第一装置700的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置700对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数；接收来自第二装置的第二指示信息；该第二指示信息用于指示公共稀疏掩码，公共稀疏掩码是第二装置根据第一指示信息确定的；公共稀疏掩码用于指示第一装置700上报第一装置训练第一模型得到的部分参数。

下面对本申请实施例提供的第二装置进行描述。请参阅图8，图8为本申请实施例第二装置的一个结构示意图。第二装置800可以用于执行图2和图4所示的实施例中第二装置执行的步骤，具体请参阅上述方法实施例的相关介绍。

第二装置800包括收发模块801。可选的，第二装置800还包括处理模块802。

收发模块801，用于向第一装置发送至少一个量化门限值，至少一个量化门限值用于对第一装置的第一模型的相关信息进行量化处理；接收来自第一装置发送的第一信息，第一信息用于指示量化处理后的第一模型的相关信息。

另一种可能的实现方式中，收发模块801还用于：

接收来自第一装置的第二信息；其中，第二信息用于指示第一模型的相关信息经过处理得到的信息；或者，

第二信息用于指示第一装置对第一模型进行第M轮训练并经过处理得到的信息，第一模型的相关信息是第一装置对第一模型进行第Q轮训练得到的相关信息，M为大于或等于1 且小于Q的整数，Q为大于1的整数；

处理模块802，用于根据第二信息确定至少一个量化门限值。

另一种可能的实现方式中，收发模块801还用于：

接收来自第三装置的第三信息；其中，第三信息用于指示第三装置的第二模型的相关信息经过处理得到的信息；或者，第三信息用于指示第三装置对第二模型进行第S轮训练并经过处理得到的信息，第二模型的相关信息是第三装置对第二模型进行第R轮训练得到的相关信息，S为大于或等于1且小于R的整数，R为大于1的整数；

处理模块802，用于根据第二信息和第三信息确定至少一个量化门限值。

另一种可能的实现方式中，处理模块802还用于：

根据第一信息确定第一模型的全局信息；

收发模块801还用于：

向第一装置发送第四信息，第四信息用于指示第一模型的全局信息。

另一种可能的实现方式中，收发模块801还用于：

接收来自第三装置的第五信息，第五信息用于指示第三装置的第二模型的相关信息；

处理模块802具体用于：

根据第一信息和第五信息确定第一模型的全局信息。

另一种可能的实现方式中，第一模型的相关信息包括第一模型的N个参数，N为大于或等于1的整数；第二模型的相关信息包括第二模型的N个参数；

收发模块801具体用于：

接收来自第一装置的N个第一信号，N个第一信号承载第一模型的N个参数，N个第一信号与第一模型的N个参数一一对应；

收发模块801具体用于：

接收来自第三装置的N个第二信号，N个第二信号承载第二模型的N个参数，N个第二信号与第二模型的N个参数一一对应；

处理模块802具体用于：

根据N个第一信号和N个第二信号确定第一模型的全局信息。

另一种可能的实现方式中，N个第一信号中第i个第一信号对应第一序列和第二序列，N个第二信号中第i个第二信号对应第三序列和第四序列，第一装置发送第一序列采用的时频资源与第三装置发送第三序列采用的时频资源相同，第一装置发送第二序列采用的时频资源与第三装置发送所述第四序列采用的时频资源相同；第一模型的全局信息包括第一模型的N个全局参数；i为大于或等于1且小于或等于N的整数；处理模块802具体用于：

确定第二装置800接收第一序列和第三序列的第一信号能量和；

确定第二装置800接收第二序列和第四序列的第二信号能量和；

根据第一信号能量和与第二信号能量和确定N个全局参数中的第i个全局参数。

另一种可能的实现方式中，处理模块802具体用于：

若第一信号能量和小于第二信号能量和与判决门限值的和，则确定第i个全局参数的取值为第一值；或者，

若第一信号能量和大于或等于第二信号能量和与判决门限值的和，且第二信号能量和小于或等于第一信号能量和与判决门限值的和，则确定第i个全局参数的取值为第二值；或者，

若第二信号能量和大于第一信号能量和与判决门限值的和，则确定第i个全局参数的取值为第三值。

另一种可能的实现方式中，收发模块801还用于：

向第一装置发送第一指示信息，第一指示信息用于指示第一装置向第二装置800发送第一信息的发送次数L，L为大于或等于1的整数。

另一种可能的实现方式中，收发模块801还用于：

向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数。

另一种可能的实现方式中，收发模块801还用于：

接收来自第一装置的第三指示信息，第三指示信息用于指示第一装置对第一模型进行一轮训练得到的K个参数中对应的取值的绝对值最大的N个参数的索引；

接收来自第三装置的第四指示信息，第四指示信息用于指示第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第二模型的K个参数是第三装置对第二模型进行一轮训练得到的K个参数；

处理模块802还用于：

根据第三指示信息和第四指示信息确定公共稀疏掩码。

图9为本申请实施例第二装置的另一个结构示意图。请参阅图9，第二装置900包括可以用于执行图4所示的实施例中第二装置执行的步骤，具体请参阅上述方法实施例的相关介绍。

第二装置900包括收发模块901和处理模块902。

收发模块901，用于接收来自第一装置的第一指示信息，第一指示信息用于指示第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，第一模型的K个参数是第一装置对第一模型进行一轮训练得到的K个参数，K为大于或等于所述N的整数，K为大于或等于1的整数，N为大于或等于1的整数；

处理模块902，用于根据第一指示信息确定公共稀疏掩码，公共稀疏掩码用于指示第一装置上报第一装置训练第一模型得到的部分参数；

收发模块901，还用于向第一装置发送第二指示信息，第二指示信息用于指示公共稀疏掩码。

一种可能的实现方式中，收发模块901还用于：

处理模块902具体用于：

根据第一指示信息和第三指示信息确定公共稀疏掩码。

本申请实施例还提供一种终端设备。图10是本申请实施例提供的终端设备1000的结构示意图。该终端设备1000可应用于如图1所示的系统中，例如终端设备1000可以为图1系统中的终端设备,用以执行上述方法实施例中第一装置或第二装置的功能。

如图所示，该终端设备1000包括处理器1010和收发器1020。可选地，该终端设备1000还包括存储器1030。其中，处理器1010、收发器1020和存储器1030之间可以通过内部连接通路互相通信，传递控制和/或数据信号，该存储器1030用于存储计算机程序，该处理器1010用于从该存储器1030中调用并运行该计算机程序，以控制该收发器1020收发信号。可选地，终端设备1000还可以包括天线1040，用于将收发器1020输出的上行数据或上行控制信令通过无线信号发送出去。

上述处理器1010可以和存储器1030可以合成一个处理装置，处理器1010用于执行存储器1030中存储的程序代码来实现上述功能。具体实现时，该存储器1030也可以集成在处理器1010中，或者独立于处理器1010。例如，该处理器1010可以与图6中的处理模块602对应。或者，该处理器1010可以与图7中的处理模块702对应。或者，该处理器1010可以与图8中的处理模块802对应。或者，该处理器1010可以与图9中的处理器902对应。

上述收发器1020可以与图6中的收发模块601对应，或者，该收发器1002可以与图7中的收发模块701对应。或者，该收发器1002可以与图8中的收发模块801对应。或者，该收发器1002可以与图9中的收发按模块901对应。该收发器1020也可以称为收发单元。收发器1020可以包括接收器(或称接收机、接收电路)和发射器(或称发射机、发射电路)。其中，接收器用于接收信号，发射器用于发射信号。

应理解，图10所示的终端设备1000能够实现图2和图4所示方法实施例中涉及第一装置或第二装置的各个过程。终端设备1000中的各个模块的操作和/或功能，分别为了实现上述装置实施例中的相应流程。具体可参见上述装置实施例中的描述，为避免重复，此处适当省略详述描述。

上述处理器1010可以用于执行前面装置实施例中描述的由第一装置或第二装置内部实现的动作，而收发器1020可以用于执行前面装置实施例中描述的第一装置或第二装置的收发动作。具体请见前面装置实施例中的描述，此处不再赘述。

可选地，上述终端设备1000还可以包括电源1050，用于给终端设备中的各种器件或电路提供电源。

除此之外，为了使得终端设备的功能更加完善，该终端设备1000还可以包括输入单元1060、显示单元1070、音频电路1080、摄像头1090和传感器1000等中的一个或多个，所述音频电路还可以包括扬声器1082、麦克风1084等。

本申请还提供一种网络设备。请参阅图11，图11是本申请实施例提供的网络设备1100的结构示意图，该网络设备1100可应用于如图1所示的系统中，例如网络设备1100可以为图1所示的系统中的网络设备，用以执行上述方法实施例中第一装置或第二装置的功能。应理解以下仅为示例，未来通信系统中，网络设备可以有其他形态和构成。

举例来说，在5G通信系统中，网络设备1100可以包括CU、DU和AAU，相比于LTE通信系统中的网络设备由一个或多个射频单元，如远端射频单元(remote radio unit，RRU)和一个或多个基带单元(base band unit，BBU)来说：

原BBU的非实时部分将分割出来，重新定义为CU，负责处理非实时协议和服务、BBU的部分物理层处理功能与原RRU及无源天线合并为AAU、BBU的剩余功能重新定义为DU，负责处理物理层协议和实时服务。简而言之，CU和DU，以处理内容的实时性进行区分、AAU为RRU和天线的组合。

CU、DU、AAU可以采取分离或合设的方式，所以，会出现多种网络部署形态，一种可能的部署形态如图11所示与传统4G网络设备一致，CU与DU共硬件部署。应理解，图11只是一种示例，对本申请的保护范围并不限制，例如，部署形态还可以是DU部署在BBU机房，CU集中部署或DU集中部署，CU更高层次集中等。

所述AAU11100可以实现收发功能称为收发单元11100，与图6中的收发模块601对应。或者，所述AAU11100可以实现收发功能称为收发单元11100，与图7中的收发模块701对应。或者，所述AAU11100可以实现收发功能称为收发单元11100，与图8中的收发模块801对应。或者，所述AAU11100可以实现收发功能称为收发单元11100，与图9中的收发模块901对应。可选地，该收发单元11100还可以称为收发机、收发电路、或者收发器等，其可以包括至少一个天线11101和射频单元11102。可选地，收发单元11100可以包括接收单元和发送单元，接收单元可以对应于接收器(或称接收机、接收电路)，发送单元可以对应于发射器(或称发射机、发射电路)。

所述CU和DU11200可以实现内部处理功能称为处理单元11200，与图6中的处理模块602对应。或者，所述CU和DU11200可以实现内部处理功能称为处理单元11200，与图7中的处理模块702对应。所述CU和DU11200可以实现内部处理功能称为处理单元11200，与图8中的处理模块802对应。或者，所述CU和DU11200可以实现内部处理功能称为处理单元11200，与图9中的处理模块902对应。可选地，该处理单元11200可以对网络设备进行控制等，可以称为控制器。所述AAU与CU和DU可以是物理上设置在一起，也可以物理上分离设置的。

另外，网络设备不限于图11所示的形态，也可以是其它形态：例如：包括BBU和自适应无线单元(adaptive radio unit，ARU)，或者包括BBU和有源天线单元(active antenna unit，AAU)；也可以为客户终端设备(customer premises equipment，CPE)，还可以为其它形态，本申请不限定。

在一个示例中，所述处理单元11200可以由一个或多个单板构成，多个单板可以共同支持单一接入制式的无线接入网(如LTE网)，也可以分别支持不同接入制式的无线接入网(如LTE网，5G网，未来网络或其他网)。所述CU和DU11200还包括存储器11201和处理器11202。所述存储器11201用以存储必要的指令和数据。所述处理器11202用于控制网络设备进行必要的动作，例如用于控制网络设备执行上述方法实施例中关于第一装置或第二装置的操作流程。所述存储器11201和处理器11202可以服务于一个或多个单板。也就是说，可以每个单板上单独设置存储器和处理器。也可以是多个单板共用相同的存储器和处理器。此外每个单板上还可以设置有必要的电路。

应理解，图11所示的网络设备1100能够实现图2和图4的方法实施例中涉及的第一装置或第二装置功能。网络设备1100中的各个单元的操作和/或功能，分别为了实现本申请方法实施例中由网络设备执行的相应流程。为避免重复，此处适当省略详述描述。图11示例的网络设备的结构仅为一种可能的形态，而不应对本申请实施例构成任何限定。本申请并不排除未来可能出现的其他形态的网络设备结构的可能。

上述CU和DU11200可以用于执行前面方法实施例中描述的由第一装置或第二装置内部实现的动作，而AAU 11100可以用于执行前面方法实施例中描述的第一装置或第二装置的收发动作。具体请见前面方法实施例中的描述，此处不再赘述。

本申请还提供一种计算机程序产品，该计算机程序产品包括：计算机程序代码，当该计算机程序代码在计算机上运行时，使得该计算机执行图2和图4所示实施例中任意一个实施例的方法。

本申请还提供一种计算机可读介质，该计算机可读介质存储有程序代码，当该程序代码在计算机上运行时，使得该计算机执行图2和图4所示实施例中任意一个实施例的方法。

本申请还提供一种通信系统，该通信系统包括第一装置和第二装置。第一装置用于执行上述图2和图4所示的实施例中第一装置执行的部分或全部步骤，第二装置用于执行上述图2和图4所示的实施例中第二装置执行的部分或全部步骤。

可选的，该通信系统还包括第三装置。第三装置用于执行图2和图4所示的实施例中第三装置执行的部分或全部步骤。

本申请实施例还提供一种芯片装置，包括处理器，用于调用该存储器中存储的计算机程度或计算机指令，以使得该处理器执行上述图2和图4所示的实施例的方法。

一种可能的实现方式中，该芯片装置的输入对应上述图2和图4所示的实施例中的接收操作，该芯片装置的输出对应上述图2和图4所示的实施例中的发送操作。

可选的，该处理器通过接口与存储器耦合。

可选的，该芯片装置还包括存储器，该存储器中存储有计算机程度或计算机指令。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制上述图2和图4所示的实施例的方法的程序执行的集成电路。上述任一处提到的存储器可以为只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

所属领域的技术人员可以清楚地了解到，为描述方便和简洁，上述提供的任一种通信装置中相关内容的解释及有益效果均可参考上文提供的对应的方法实施例，此处不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种通信方法，其特征在于，所述方法包括：

第一装置接收来自第二装置的至少一个量化门限值；

所述第一装置根据所述至少一个量化门限值对所述第一装置的第一模型的相关信息进行量化处理；

所述第一装置向所述第二装置发送第一信息，所述第一信息用于指示量化处理后的所述第一模型的相关信息。
根据权利要求1所述的方法，其特征在于，所述第一模型的相关信息包括：所述第一模型的输出参数或更新参数，所述更新参数包括所述第一模型的权重梯度或权重参数。
根据权利要求1或2所述的方法，其特征在于，在所述第一装置接收来自第二装置的至少一个量化门限值之前，所述方法还包括：

所述第一装置向所述第二装置发送第二信息；其中，第二信息用于指示所述第一模型的相关信息经过处理得到的信息；或者，

所述第二信息用于指示所述第一装置对所述第一模型进行第M轮训练得到的相关信息经过处理得到的信息，所述第一模型的相关信息是所述第一装置对所述第一模型进行第Q轮训练得到的相关信息，所述M为大于或等于1且小于所述Q的整数，所述Q为大于1的整数。
根据权利要求3所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的输出参数，所述第一模型的相关信息经过处理得到的信息包括所述第一模型的输出参数的取值的绝对值的平均值；或者，

所述第一模型的相关信息包括所述第一模型的更新参数，所述第一模型的相关信息经过处理得到的信息包括所述第一模型的更新参数的取值的绝对值的平均值。
根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自所述第二装置的第三信息，所述第三信息用于指示所述第一模型的全局信息。
根据权利要求5所述的方法，其特征在于，所述第一模型的全局信息包括所述第一模型的全局输出参数；或者，所述第一模型的全局信息包括所述第一模型的全局更新参数和/或全局学习率。
根据权利要求1至6中任一项所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的N个参数，所述N为大于或等于1的整数；

所述第一装置根据所述至少一个量化门限值对所述第一装置的第一模型的相关信息进行量化处理，包括：

所述第一装置根据所述至少一个量化门限值对所述N个参数进行量化处理，得到量化处理后的N个参数；

所述第一信息包括所述量化处理后的N个参数；所述第一装置向所述第二装置发送第一信息，包括：

所述第一装置对所述量化处理后的N个参数进行调制得到N个第一信号；

所述第一装置向所述第二装置发送所述N个第一信号。
根据权利要求7所述的方法，其特征在于，所述至少一个量化门限值包括第一量化门限值和第二量化门限值；所述第一装置根据所述至少一个量化门限值对所述N个参数进行量化处理，得到量化处理后的N个参数，包括：

若所述N个参数中的第i个参数大于所述第一量化门限值时，所述第一装置将所述第i个参数量化为第一值，所述i为大于或等于1且小于或等于N的整数；或者，

若所述N个参数中的第i个参数小于或等于所述第一量化门限值且大于或等于所述第二量化门限值时，所述第一装置将所述第i个参数量化为第二值；或者，

若所述N个参数中第i个参数小于所述第二量化门限值时，所述第一装置将所述第i个参数量化为第三值。
根据权利要求7或8所述的方法，其特征在于，所述第一装置对所述量化处理后的N个参数进行调制得到N个第一信号，包括：

所述第一装置对量化处理后的第i个参数进行调制得到第i个第一信号，该第i个第一信号对应两个序列；

当所述量化处理后的第i个参数为所述第一值时，所述第一装置发送所述两个序列中的第一个序列的发送功率小于所述第一装置发送所述两个序列中的第二个序列的发送功率；当所述量化处理后的第i个参数为所述第二值时，所述第一装置发送所述两个序列中的第一个序列的发送功率等于所述第一装置发送所述两个序列中的第二个序列的发送功率；当所述量化处理后的第i个参数为所述第三值时，所述第一装置发送所述两个序列中的第一个序列的发送功率大于所述第一装置发送所述两个序列中的第二个序列的发送功率。
根据权利要求9所述的方法，其特征在于，当所述量化处理后的第i个参数为所述第一值时，所述两个序列中的第一个序列为非全0序列，第二个序列为全0序列；当所述量化处理后的第i个参数为所述第二值时，所述两个序列均为全0序列；当所述量化处理后的第i个参数为所述第三值时，所述两个序列中的第一个序列为全0序列，第二个序列为非全0序列。
根据权利要求1至10中任一项所述的方法，其特征在于，所述第一装置向所述第二装置发送第一信息，包括：

所述第一装置向所述第二装置发送L次所述第一信息，所述L为大于或等于1的整数。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自所述第二装置的第一指示信息，所述第一指示信息用于指示所述第一装置向所述第二装置发送所述第一信息的发送次数L。
根据权利要求1至12中任一项所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的量化误差补偿后的N个参数，所述量化误差补偿后的N个参数是所述第一装置根据所述第一装置对所述第一模型进行第Q轮训练得到的N个参数分别对应的量化误差对所述N个参数进行误差补偿得到的，所述N个参数中的第i个参数对应的量化误差是根据所述第一装置对所述第一模型进行第Q-1轮训练且经过量化误差补偿得到的第i个参数确定的，所述i为大于或等于1且小于或等于N的整数，所述N为大于或等于1 的整数，所述Q为大于1的整数。
根据权利要求1至13中任一项所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的经过稀疏处理得到的N个参数；所述第一模型的经过稀疏处理得到的N个参数是所述第一装置根据公共稀疏掩码从所述第一模型的K个参数中选择N个参数，所述第一模型的K个参数是所述第一装置对所述第一模型进行一轮训练得到的参数，所述K为大于或等于N的整数，所述K为大于或等于1的整数，所述N为大于或等于1的整数。
根据权利要求14所述的方法，其特征在于，所述公共稀疏掩码为比特序列，所述比特序列包括K个比特，所述K个比特与所述K个参数一一对应；当所述K个比特中的一个比特的取值为0时，用于指示所述第一装置不选择所述比特对应的参数；当所述K个比特中的一个比特的取值为1时，用于指示所述第一装置选择所述比特对应的参数。
根据权利要求14或15所述的方法，其特征在于，所述公共稀疏掩码是所述第一装置根据稀疏比例和伪随机数确定的，所述稀疏比例是所述第二装置向所述第一装置指示的。
根据权利要求14或15所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自所述第二装置的第二指示信息，所述第二指示信息用于指示所述公共稀疏掩码。
根据权利要求14至17中任一项所述的方法，其特征在于，所述方法还包括：

所述第一装置向所述第二装置发送第三指示信息，所述第三指示信息用于指示所述K个参数中对应的取值的绝对值最大的N个参数的索引。
根据权利要求1至18中任一项所述的方法，其特征在于，所述第一模型为神经网络模型，所述第一模型的相关信息包括所述神经网络模型的其中P层的神经元的相关参数，所述P为大于或等于1的整数。
一种通信方法，其特征在于，所述方法包括：

第二装置向第一装置发送至少一个量化门限值，所述至少一个量化门限值用于对所述第一装置的第一模型的相关信息进行量化处理；

所述第二装置接收来自所述第一装置发送的第一信息，所述第一信息用于指示量化处理后的所述第一模型的相关信息。
根据权利要求20所述的方法，其特征在于，所述第一模型的相关信息包括：所述第一模型的输出参数或更新参数，所述更新参数包括所述第一模型的权重梯度或权重参数。
根据权利要求20或21所述的方法，其特征在于，所述方法还包括：

所述第二装置接收来自所述第一装置的第二信息；其中，所述第二信息用于指示所述第一模型的相关信息经过处理得到的信息；或者，

所述第二信息用于指示所述第一装置对所述第一模型进行第M轮训练并经过处理得到的信息，所述第一模型的相关信息是所述第一装置对所述第一模型进行第Q轮训练得到的相关信息，所述M为大于或等于1且小于所述Q的整数，所述Q为大于1的整数；

所述第二装置根据所述第二信息确定所述至少一个量化门限值。
根据权利要求22所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的输出参数，所述第一模型的相关信息经过处理得到的信息包括所述第一模型的输出参数的取值的绝对值的平均值；或者，

所述第一模型的相关信息包括所述第一模型的更新参数，所述第一模型的相关信息经过处理得到的信息包括所述第一模型的更新参数的取值的绝对值的平均值。
根据权利要求22或23所述的方法，其特征在于，所述方法还包括：

所述第二装置接收来自第三装置的第三信息；其中，所述第三信息用于指示所述第三装置的第二模型的相关信息经过处理得到的信息；或者，所述第三信息用于指示所述第三装置对所述第二模型进行第S轮训练并经过处理得到的信息，所述第二模型的相关信息是所述第三装置对所述第二模型进行第R轮训练得到的相关信息，所述S为大于或等于1且为小于所述R的整数，所述R为大于1的整数；

所述第二装置根据所述第二信息确定所述至少一个量化门限值，包括：

所述第二装置根据所述第二信息和所述第三信息确定所述至少一个量化门限值。
根据权利要求20至24中任一项所述的方法，其特征在于，所述方法还包括：

所述第二装置根据所述第一信息确定所述第一模型的全局信息；

所述第二装置向所述第一装置发送第四信息，所述第四信息用于指示所述第一模型的全局信息。
根据权利要求25所述的方法，其特征在于，所述第一模型的全局信息包括所述第一模型的全局输出参数；或者，所述第一模型的全局信息包括所述第一模型的全局更新参数和/或全局学习率。
根据权利要求25或26所述的方法，其特征在于，所述方法还包括：

所述第二装置接收来自第三装置的第五信息，所述第五信息用于指示所述第三装置的第二模型的相关信息；

所述第二装置根据所述第一信息确定所述第一模型的全局信息，包括：

所述第二装置根据所述第一信息和所述第五信息确定所述第一模型的全局信息。
根据权利要求27所述的方法，其特征在于，所述第一模型的相关信息包括所述第一模型的N个参数，所述N为大于或等于1的整数；所述第二模型的相关信息包括所述第二模型的N个参数；所述第一信息包括量化处理后的所述第一模型的N个参数；所述第五信息包括量化处理后的所述第二模型的N个参数；

所述第二装置接收来自所述第一装置发送的第一信息，包括：

所述第二装置接收来自所述第一装置的N个第一信号，所述N个第一信号承载所述量化处理后的第一模型的N个参数，所述N个第一信号与所述量化处理后的第一模型的N个参数一一对应；

所述第二装置接收来自第三装置的第五信息，包括：

所述第二装置接收来自所述第三装置的N个第二信号，所述N个第二信号承载所述量化处理后的第二模型的N个参数，所述N个第二信号与所述量化处理后的第二模型的N个参数一一对应；

所述第二装置根据所述第一信息和所述第五信息确定所述第一模型的全局信息，包括：

所述第二装置根据所述N个第一信号和所述N个第二信号确定所述第一模型的全局信息。
根据权利要求28所述的方法，其特征在于，所述N个第一信号中第i个第一信号对应第一序列和第二序列，所述N个第二信号中第i个第二信号对应第三序列和第四序列，所述第一装置发送所述第一序列采用的时频资源与所述第三装置发送所述第三序列采用的时频资源相同，所述第一装置发送所述第二序列采用的时频资源与所述第三装置发送所述第四序列采用的时频资源相同；所述第一模型的全局信息包括所述第一模型的N个全局参数；所述i为大于或等于1且小于或等于所述N的整数；

所述第二装置根据所述N个第一信号和所述N个第二信号确定所述第一模型的全局信息，包括：

所述第二装置确定所述第二装置接收所述第一序列和所述第三序列的第一信号能量和；

所述第二装置确定所述第二装置接收所述第二序列和所述第四序列的第二信号能量和；

所述第二装置根据所述第一信号能量和与所述第二信号能量和确定所述N个全局参数中的第i个全局参数。
根据权利要求29所述的方法，其特征在于，所述第二装置根据所述第一信号能量和与所述第二信号能量和确定所述N个全局参数中的第i个全局参数，包括：

若所述第一信号能量和与判决门限值的和小于所述第二信号能量和，则所述第二装置确定所述第i个全局参数的取值为第一值；或者，

若所述第一信号能量和与所述判决门限值的和大于或等于所述第二信号能量和，且所述第二信号能量和与所述判决门限值的和大于或等于所述第一信号能量和，则所述第二装置确定所述第i个全局参数的取值为第二值；或者，

若所述第二信号能量和与所述判决门限值的和小于所述第一信号能量和，则所述第二装置确定所述第i个全局参数的取值为第三值。
根据权利要求20至30中任一项所述的方法，其特征在于，所述方法还包括：

所述第二装置向所述第一装置发送第一指示信息，所述第一指示信息用于指示所述第一装置向所述第二装置发送所述第一信息的发送次数L，所述L为大于或等于1的整数。
根据权利要求20至31中任一项所述的方法，其特征在于，所述方法还包括：

所述第二装置向所述第一装置发送第二指示信息，所述第二指示信息用于指示公共稀疏掩码，所述公共稀疏掩码用于指示所述第一装置上报所述第一装置训练所述第一模型得到的部分参数。
根据权利要求32所述的方法，其特征在于，所述方法还包括：

所述第二装置接收来自所述第一装置的第三指示信息，所述第三指示信息用于指示所述第一装置对所述第一模型进行一轮训练得到的K个参数中对应的取值的绝对值最大的N个参数的索引；

所述第二装置接收来自所述第三装置的第四指示信息，所述第四指示信息用于指示所述第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，所述第二模型的K个参数是所述第三装置对所述第二模型进行一轮训练得到的K个参数；

所述第二装置根据所述第三指示信息和所述第四指示信息确定所述公共稀疏掩码。
一种通信方法，其特征在于，所述方法包括：

第一装置向第二装置发送第一指示信息，所述第一指示信息用于指示所述第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，所述第一模型的K个参数是所述第一装置对所述第一模型进行一轮训练得到的K个参数，所述K为大于或等于所述N的整数，所述K为大于或等于1的整数，所述N为大于或等于1的整数；

所述第一装置接收来自第二装置的第二指示信息，所述第二指示信息用于指示公共稀疏掩码，所述公共稀疏掩码是所述第二装置根据所述第一指示信息确定的；所述公共稀疏掩码用于指示所述第一装置上报所述第一装置训练所述第一模型得到的部分参数。
一种通信方法，其特征在于，所述方法包括：

第二装置接收来自第一装置的第一指示信息，所述第一指示信息用于指示所述第一装置的第一模型的K个参数中对应的取值的绝对值最大的N个参数的索引，所述第一模型的K个参数是所述第一装置对所述第一模型进行一轮训练得到的K个参数，所述K为大于或等于所述N的整数，所述K为大于或等于1的整数，所述N为大于或等于1的整数；

所述第二装置根据所述第一指示信息确定公共稀疏掩码，所述公共稀疏掩码用于指示所述第一装置上报所述第一装置训练所述第一模型得到的部分参数；

所述第二装置向所述第一装置发送第二指示信息，所述第二指示信息用于指示所述公共稀疏掩码。
根据权利要求35所述的方法，其特征在于，所述方法还包括：

所述第二装置接收来自第三装置的第三指示信息，所述第三指示信息用于指示所述第三装置的第二模型的K个参数中对应的取值的绝对值最大的N个参数的索引，所述第二模型的K个参数是所述第三装置对所述第二模型进行一轮训练得到的K个参数；

所述第二装置根据所述第一指示信息确定公共稀疏掩码，包括：

所述第二装置根据所述第一指示信息和所述第三指示信息确定所述公共稀疏掩码。
一种第一装置，其特征在于，所述第一装置包括收发模块和处理模块；所述收发模块用于执行如权利要求1至19中任一项所述的收发操作，所述处理模块用于执行如权利要求1至19中任一项所述的处理操作。
一种第一装置，其特征在于，所述第一装置包括收发模块；所述收发模块用于执行如权利要求34所述的收发操作。
一种第二装置，其特征在于，所述第二装置包括收发模块，所述收发模块用于执行如权利要求20至33中任一项所述的收发操作。
根据权利要求39所述的第二装置，其特征在于，所述第二装置还包括处理模块；所述处理模块用于执行如权利要求20至33中任一项所述的处理操作。
一种第二装置，其特征在于，所述第二装置包括收发模块和处理模块，所述收发模块用于执行如权利要求35或36所述的收发操作，所述处理模块用于执行如权利要求35或36所述的处理操作。
一种装置，其特征在于，所述装置包括处理器；所述处理器用于执行存储器中的计算机程序或计算机指令以执行如权利要求1至19中任一项所述的方法；或者，所述处理器用于执行所述存储器中的计算机程序或计算机指令以执行如权利要求20至33中任一项所述的方法；或者，所述处理器用于执行所述存储器中的计算机程序或计算机指令以执行如权利要求34所述的方法；或者，所述处理器用于执行所述存储器中的计算机程序或计算机指令以执行如权利要求35或36所述的方法。
根据权利要求42所述的装置，其特征在于，所述装置还包括所述存储器。
一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被装置执行时，使得所述装置执行如权利要求1至19中任一项所述的方法，或者，使得所述装置执行如权利要求20至33中任一项所述的方法，或者，使得所述装置执行如权利要求34所述的方法，或者，使得所述装置执行如权利要求35或36所述的方法。
一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如权利要求1至19中任一项所述的方法，或者，使得所述计算机执行如权利要求20至33中任一项所述的方法，或者，使得所述计算机执行如权利要求34所述的方法，或者，使得所述计算机执行如权利要求35或36所述的方法。