WO2023116787A1

WO2023116787A1 - 智能模型的训练方法和装置

Info

Publication number: WO2023116787A1
Application number: PCT/CN2022/140797
Authority: WO
Inventors: 马梦瑶; 刘坚能; 苏立群
Original assignee: 华为技术有限公司
Priority date: 2021-12-22
Filing date: 2022-12-21
Publication date: 2023-06-29
Also published as: EP4435675A1; CN116362334A; US20240346329A1

Abstract

本申请提供了一种智能模型的训练方法和装置。该方法包括：中心节点与多个参与节点组联合执行智能模型的训练，该智能模型由推理目标的多种特征对应的多个特征模型组成，一个参与节点组中的参与节点训练一个特征模型，该训练方法由一个参与节点执行，包括：接收来自中心节点的用于指示特征间约束变量的第一信息，该特征间约束变量用于表征不同该特征之间的约束关系。根据该特征间约束变量、第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到特征间约束变量对应的梯度信息，并发送给中心节点。实现了联邦学习基于不同特征的分布式训练，能够提升训练得到的模型的性能。

Description

智能模型的训练方法和装置

本申请要求于2021年12月22日提交中国国家知识产权局、申请号为202111582987.9、申请名称为“智能模型的训练方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信领域，并且更具体地，涉及一种智能模型的训练方法和装置。

背景技术

人工智能(artificial intelligence，AI)是未来无线通信网络(如物联网)中的一类非常重要的应用。其中，联邦学习(federated learning，FL)是一种分布式智能模型训练方法，服务器为多个设备提供模型参数，由多个设备各自基于各自的数据集执行智能模型训练后将损失函数的梯度信息反馈给服务器，服务器基于多个设备反馈的梯度信息更新的模型参数。

参与模型训练的多个设备中的模型与服务器的模型相同，参与模型训练的设备采用的训练数据的类型相同，如图像识别模型的训练中可以由多个图像采集设备使用各自采集到的图像数据对模型进行训练，这种方式可以提高训练数据的多样性，但未考虑推理目标的特征多样性，如何在联邦学习中实现特征多样性的模型训练以提升模型性能，目前还缺乏有效的解决方案。

发明内容

本申请提供了一种智能模型的训练方法和装置，实现了联邦学习基于不同特征的分布式训练，能够提升训练得到的模型的性能。

第一方面，提供了一种智能模型的训练方法，中心节点与多个参与节点组联合执行智能模型的训练，该智能模型由推理目标的多种特征对应的多个特征模型组成，一个该参与节点组中的参与节点训练一个该特征模型，该训练方法由该多个参与节点组中训练第一特征模型的第一参与节点执行，包括：接收来自该中心节点的第一信息，该第一信息用于指示特征间约束变量，该特征间约束变量用于表征不同该特征之间的约束关系。根据该特征间约束变量、该第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，该第一梯度信息为特征间约束变量对应的梯度信息。向该中心节点发送该第一梯度信息。

根据上述方案，不同类型的参与节点随着模型训练过程中模型参数的更新，计算特征间约束变量对应的梯度信息，并反馈给中心节点，中心节点基于不同特征模型对应的参与节点推理得到的特征间约束变量的梯度信息，更新表征特征间关联关系的特征间约束变量，以实现模型的特征间解耦，使得不同类型的参与节点可以基于特征间约束变量以及本地特征数据对不同特征模型进行训练，使得中心节点可以基于不同类型的参与节点反馈的特征间约束变量的梯度更新特征间约束变量。实现了在无需传输原始数据的情况下，实现了联邦学习的训练数据的多样性以及特征的多样性。即避免了原始数据泄露，由能够提升训练后的模型性能的效果。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：接收来自该中心节点的第一标识集合，该第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识。该根据该特征间约束变量、该第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，该第一梯度信息为特征间约束变量对应的梯度信息，包括：确定该第一参与节点的样本数据集合中包括第一标识对应的该第一样本数据，该第一标识属于该第一标识集合。根据该特征间约束变量、该第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，该第一梯度信息为特征间约束变量对应的梯度信息。

根据上述方案，中心节点通过第一标识集合选择了部分样本数据用于推理特征间约束变量的梯度信息。存储了被选择的样本数据的参与节点基于当前特征模型的模型参数以及样本数据推理特征间约束变量的梯度信息，并反馈给中心节点。相对于每个参与节点均参与反馈特征间约束变量的梯度信息的方式，能够减小资源开销和实现复杂度。

结合第一方面，在第一方面的某些实施方式中，该向该中心节点发送该第一梯度信息，包括：向该中心节点发送量化后的第一目标梯度信息，该第一目标梯度信息包括该第一梯度信息，或者该第一目标梯度信息包括该第一梯度信息和第一残差梯度信息，该第一残差梯度信息用于表征在得到该第一梯度信息之前未发送给该中心节点的特征间约束变量对应的梯度信息的残差量。

根据上述方案，参与节点可以在一次模型训练后，将训练得到的梯度信息以及本次模型训练之前未传输至中心节点的梯度信息的残差量发送给中心节点。使得中心节点能够获取到残差梯度信息，提高模型训练的效率。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：基于该第一目标梯度信息和量化后的该第一目标梯度信息，得到第二残差梯度信息，该第二残差梯度信息为该第一目标梯度信息中未发送给该中心节点的残差量。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：根据第一量化噪声信息和信道资源信息，确定第一门限值，其中，该第一量化噪声信息用于表征对该第一目标梯度信息的量化编解码的损失量。向该中心节点发送量化后的第一目标梯度信息，包括：确定该第一目标梯度信息的度量值大于该第一门限值；向该中心节点发送量化后的该第一目标梯度信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：若该第一目标梯度信息的度量值小于或等于该第一门限值，确定不向该中心节点发送量化后的该第一目标梯度信息。

根据上述方案，参与节点基于量化噪声信息和信道资源信息确定判断是否发送量化后的目标梯度信息的度量值的门限值。该方式考虑了目标信息的量化编解码损失量，确定是否向中心节点发送目标信息，实现了参与节点的对信道环境自适应调度，能够提高信号传输的可靠性以及信道资源的利用率。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：若该第一目标梯度信息的度量值小于该第一门限值，确定第三残差梯度信息，该第三残差梯度信息为该第一目标梯度信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：根据信道资源信息、通信代价信息和第一目标梯度信息，得到该第一量化噪声信息，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽。

根据上述方案，参与节点可以基于信道资源信息、通信代价信息和第一目标梯度信息得到第一量化噪声信息，从而可以基于该第一量化噪声信息实现自适应调度，提高信号传输的可靠性以及信道资源的利用率。

结合第一方面，在第一方面的某些实施方式中，该根据第一量化噪声信息和信道资源信息，确定第一门限值，包括：根据该第一量化噪声信息、通信代价信息、该信道资源信息和该第一目标梯度信息，确定传输带宽和/或传输功率，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽；根据该第一量化噪声信息和该通信资源，确定该第一门限值。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：接收来自该中心节点的第二信息，该第二信息用于指示该通信代价信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：根据该特征间约束变量和模型训练数据，训练该第一特征模型，得到第二梯度信息。向该中心节点发送该第二梯度信息。

根据上述方案，通过特征间约束变量实现了模型的特征间解耦，使得不同类型的参与节点可以基于特征间约束变量以及本地特征数据对不同特征模型进行训练，既实现了联邦学习中训练数据的多样性，又实现了针对不同特征的模型训练。从而达到提升训练后的模型性能的效果。

结合第一方面，在第一方面的某些实施方式中，该向该中心节点发送该第二梯度信息，包括：向该中心节点发送量化后的第二目标梯度信息，该第二目标梯度信息包括该第二梯度信息，或者该第二目标梯度信息包括该第二梯度信息和第四残差梯度信息，该第四残差梯度信息用于表征在得到该第二梯度信息之前未发送给该中心节点的梯度信息的残差量。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：基于该第二目标梯度信息和量化后的该第二目标梯度信息，得到第五残差梯度信息，该第五残差梯度信息用于表征该第二目标梯度信息中未发送给该中心节点的残差量。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：根据第二量化噪声信息和信道资源信息，确定第二门限值，其中，该第二量化噪声信息用于表征对该第二目标梯度信息的量化编解码的损失量。向该中心节点发送量化后的第二目标梯度信息，包括：确定该第二目标梯度信息的度量值大于该第二门限值；向该中心节点发送量化后的该第二目标梯度信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：若该第二目标梯度信息的度量值小于或等于该第二门限值，确定不向该中心节点发送量化后的该第二目标梯度信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：若该第二目标梯度信息的度量值小于该第二门限值，确定第六残差梯度信息，该第六残差梯度信息为该第二目标梯度信息。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：根据信道资源信息、通信代价信息和第二目标梯度信息，得到该第二量化噪声信息，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽。

结合第一方面，在第一方面的某些实施方式中，该根据第二量化噪声信息和信道资源信息，确定第二门限值，包括：根据该第二量化噪声信息、通信代价信息、该信道资源信息和该第二目标梯度信息，确定传输带宽和/或传输功率，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽；根据该第二量化噪声信息和该通信资源，确定该第二门限值。

结合第一方面，在第一方面的某些实施方式中，该方法还包括：接收来自该中心节点的第三信息，该第三信息用于指示该第一特征模型的更新后的参数；根据该第三信息，更新该第一特征模型的参数。

第二方面，提供了一种智能模型的训练方法，中心节点与多个参与节点组联合执行智能模型的训练，该智能模型由推理目标的多种特征对应的多个特征模型组成，一个该参与节点组中的参与节点训练一个该特征模型，该训练方法由该中心节点执行，包括：确定特征间约束变量，该特征间约束变量用于表征不同的该特征之间的约束关系；向该多个参与节点组中的参与节点发送第一信息，该第一信息包括该特征间约束变量。

结合第二方面，在第二方面的某些实施方式中，该方法还包括：接收来自第一参与节点组中的参与节点的至少一个第二目标梯度信息，该多个参与节点组包括该第一参与节点组；根据该至少一个第二目标梯度信息，确定第一特征模型的更新后的模型参数，该第一特征模型为该第一参与节点组中的参与节点训练的特征模型；向该第一参与节点组发送该更新后的模型参数。

可选地，上述中心节点接收来自第一参与节点组中的参与节点的至少一个第二目标梯度信息，具体可以是，中心节点接收来自第一参与节点组中的参与节点的至少一个量化后的第二目标梯度信息，并对量化后的第二目标梯度信息量化解码后得到第二目标梯度信息。应理解，基于本文具体实施方式中的描述中心节点量化解码得到的第二目标梯度信息相较于参与节点量化编码前的第二目标梯度信息可能存在因量化编解码带来的损失量。

结合第二方面，在第二方面的某些实施方式中，该方法还包括：向该多个参与节点组中的参与节点发送第一标识集合，该第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识。

结合第二方面，在第二方面的某些实施方式中，该方法还包括：接收来自多个该参与节点组中的参与节点的多个第一目标梯度信息，该第一目标梯度信息为该参与节点推理得到的特征间约束变量对应的梯度信息；以及，该确定特征间约束变量，包括：根据该多个第一目标梯度信息，确定该特征间约束变量。

结合第二方面，在第二方面的某些实施方式中，该方法还包括：向该多个参与节点组中的参与节点发送第二信息，该第二信息用于指示通信代价信息，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽。

第三方面，提供了一种通信方法，该方法包括：根据量化噪声信息、信道资源信息，确定门限值，其中，该量化噪声信息用于表征对目标信息的量化编解码的损失量；在该目标信息的度量值大于该门限值的情况下，发送量化后的该目标信息；在该目标信息的度量值小于或等于该门限值的情况下，不发送量化后的该目标信息。

根据上述方案，参与节点基于待传输的目标信息和中心节点广播的通信代价信息，考虑了目标信息的量化编解码损失量，确定是否向中心节点发送目标信息，实现了参与节点的对信道环境自适应调度，能够提高目标信号传输的可靠性以及信道资源的利用率。

结合第三方面，在第三方面的某些实施方式中，该目标信息包括第N次模型训练得到的梯度信息和第一目标残差信息，该第一目标残差信息为得到该梯度信息之前未发送的梯度信息的残差量。

结合第三方面，在第三方面的某些实施方式中，该方法还包括：在该目标信息的度量值大于该门限值的情况下，基于该目标信息和量化后的该目标信息，得到第二目标残差信息，该第二目标残差信息为该目标信息中未发送的残差量。

结合第三方面，在第三方面的某些实施方式中，该方法还包括：若该目标信息的度量值小于或等于该门限值，确定第三目标残差信息，该第三目标残差信息为该目标信息。

结合第三方面，在第三方面的某些实施方式中，该方法还包括：根据信道资源信息、通信代价信息和该目标信息，得到该量化噪声信息，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽。

结合第三方面，在第三方面的某些实施方式中，该根据量化噪声信息和信道资源信息，确定门限值，包括：根据该量化噪声信息、通信代价信息、该信道资源信息和该目标信息，确定传输带宽和/或传输功率，该通信代价信息用于指示通信资源的通信代价权重，该通信资源包括传输功率和/或传输带宽；根据该量化噪声信息和该通信资源，确定该门限值。

结合第三方面，在第三方面的某些实施方式中，该方法还包括：接收第二信息，该第二信息用于指示该通信代价信息。

第四方面，提供了一种智能模型的训练装置，包括：收发单元，用于接收来自中心节点的第一信息，该第一信息用于指示特征间约束变量，该特征间约束变量用于表征不同该特征之间的约束关系；处理单元，用于根据该特征间约束变量、该第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，该第一梯度信息为特征间约束变量对应的梯度信息；该收发单元，还用于向该中心节点发送该第一梯度信息。

第五方面，提供了一种智能模型的训练装置，包括：处理单元，用于确定特征间约束变量，该特征间约束变量用于表征不同的该特征之间的约束关系；收发单元，用于向多个参与节点组中的参与节点发送第一信息，该第一信息包括该特征间约束变量。

第六方面，提供了一种智通信装置，包括：处理单元，用于根据量化噪声信息、信道资源信息，确定门限值，其中，该量化噪声信息用于表征对目标信息的量化编解码的损失量。收发单元，用于在该目标信息的度量值大于该门限值的情况下，发送量化后的该目标信息；在该目标信息的度量值小于或等于该门限值的情况下，不发送量化后的该目标信息。

第七方面，提供了一种通信装置，包括处理器。该处理器可以实现上述第一方面以及第一方面中任一种可能实现方式中的方法，或实现上述第二方面以及第二方面中任一种可能实现方式中的方法，或实现上述第三方面以及第三方面中任一种可能实现方式中的方法。

可选地，该通信装置还包括存储器，该处理器与该存储器耦合，可用于执行存储器中的指令，以实现上述第一方面以及第一方面中任一种可能实现方式中的方法，或实现上述第二方面以及第二方面中任一种可能实现方式中的方法，或实现上述第三方面以及第三方面中任一种可能实现方式中的方法。

可选地，该通信装置还包括通信接口，处理器与通信接口耦合。本申请实施例中，通信接口可以是收发器、管脚、电路、总线、模块或其它类型的通信接口，不予限制。

在一种实现方式中，该通信装置为通信设备。当该通信装置为通信设备时，该通信接口可以是收发器，或，输入/输出接口。

在另一种实现方式中，该通信装置为配置于通信设备中的芯片。当该通信装置为配置于通信设备中的芯片时，该通信接口可以是输入/输出接口，该处理器可以是逻辑电路。

可选地，该收发器可以为收发电路。可选地，该输入/输出接口可以为输入/输出电路。

第八方面，提供了一种处理器，包括：输入电路、输出电路和处理电路。该处理电路用于通过该输入电路接收信号，并通过该输出电路发射信号，使得该处理器执行第一方面以及第一方面中任一种可能实现方式中的方法。

在具体实现过程中，上述处理器可以为一个或多个芯片，输入电路可以为输入管脚，输出电路可以为输出管脚，处理电路可以为晶体管、门电路、触发器和各种逻辑电路等。输入电路所接收的输入的信号可以是由例如但不限于接收器接收并输入的，输出电路所输出的信号可以是例如但不限于输出给发射器并由发射器发射的，且输入电路和输出电路可以是同一电路，该电路在不同的时刻分别用作输入电路和输出电路。本申请实施例对处理器及各种电路的具体实现方式不做限定。

第九方面，提供了一种计算机程序产品，该计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当该计算机程序被运行时，使得计算机执行上述第一方面以及第一方面中任一种可能实现方式中的方法，或实现上述第二方面以及第二方面中任一种可能实现方式中的方法，或实现上述第三方面以及第三方面中任一种可能实现方式中的方法。

第十方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序(也可以称为代码，或指令)当其在计算机上运行时，使得计算机执行上述第一方面以及第一方面中任一种可能实现方式中的方法，或实现上述第二方面以及第二方面中任一种可能实现方式中的方法，或实现上述第三方面以及第三方面中任一种可能实现方式中的方法。

第十一方面，提供了一种通信系统，包括前述的多个参与节点和至少一个中心节点。

上述第二方面至第十一方面中任一方面及其任一方面中任意一种可能的实现可以达到的技术效果，请参照上述第一方面及其第一方面中相应实现可以带来的技术效果描述，这里不再重复赘述。

附图说明

图1是适用于本申请实施例的通信系统的一个示意图；

图2是本申请实施例提供的智能模型训练方法的一个示意性流程图；

图3是本申请实施例提供的智能模型训练方法的另一个示意性流程图；

图4是本申请实施例提供的多个参与节点共享传输资源的一个示意图；

图5是本申请的通信装置的一例的示意性框图；

图6是本申请的通信设备的一例的示意性结构图。

具体实施方式

在本申请实施例中，“/”可以表示前后关联的对象是一种“或”的关系，例如，A/B可以表示A或B；“和/或”可以用于描述关联对象存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，其中A，B可以是单数或者复数。为了便于描述本申请实施例的技术方案，在本申请实施例中，可以采用“第一”、“第二”等字样对功能相同或相似的技术特征进行区分。该“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。在本申请实施例中，“示例性的”或者“例如”等词用于表示例子、例证或说明，被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念，便于理解。

在本申请实施例中，至少一个(种)还可以描述为一个(种)或多个(种)，多个(种)可以是两个(种)、三个(种)、四个(种)或者更多个(种)，本申请不做限制。

下面将结合附图，对本申请中的技术方案进行描述。

本申请实施例的技术方案可以应用于各种通信系统，例如：长期演进(long term evolution，LTE)系统、LTE频分双工(frequency division duplex，FDD)系统、LTE时分双工(time division duplex，TDD)、第五代(5th generation，5G)通信系统、未来的通信系统(如第六代(6th generation，6G)通信系统)、或者多种通信系统融合的系统等，本申请实施例不做限定。其中，5G还可以称为新无线(new radio,NR)。

图1是适用于本申请实施例的通信系统的示意图。

如图1所示，适用于本申请实施例的通信系统可以包括至少一个中心节点，以及多个参与节点组，中心节点与多个参与节点组执行智能模型的联邦学习，智能模型由推理目标的多种特征对应的多个特征模型组成，一个参与节点组中的参与节点训练一个特征模型。同一参与节点组中的参与节点用于训练特征模型的训练样本(或称为训练数据、样本数据)不同，或者说同一参与节点组中的参与节点的训练样本所属的样本空间不同；不同参与节点组中的参与节点用于训练特征模型的训练样本的样本特征不同，或者说不同参与节点组中的参与节点的训练样本所属的特征空间不同。中心节点与参与节点可以基于本申请实施例提供的智能模型训练方法实现将智能模型基于不同特征解耦为多个特征模型，由不同的参与节点组基于相应的特征样本数据训练不同的特征模型，再由中心节点对参与节点训练后反馈的梯度信息进行聚合，并更新智能模型的参数。实现了特征多样性的模型训练，能够提升模型的性能。

本申请实施例提供的中心节点可以是网络设备，例如，服务器、基站等。中心节点可以是一种部署在无线接入网中能够与参与节点进行直接或间接通信的设备。

本申请实施例提供的参与节点可以是一种具有收发功能的设备，如终端、终端设备，示例性地，参与节点可以是传感器或具有数据采集功能的设备。参与节点可以被部署在陆地上，包括室内、室外、手持、和/或车载；也可以被部署在水面上(如轮船等)；参与节点还可以被部署在空中(例如飞机、气球和卫星上等)。参与节点可以是用户设备(user equipment，UE)，UE包括具有无线通信功能的手持式设备、车载设备、可穿戴设备或计算设备。示例性地，UE可以是手机(mobile phone)、平板电脑或带无线收发功能的电脑。终端设备还可以是虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制中的无线终端、无人驾驶中的无线终端、远程医疗中的无线终端、智能电网中的无线终端、智慧城市(smart city)中的无线终端、和/或智慧家庭(smart home)中的无线终端等等。

本申请实施例提供的技术方案可以用于在多种场景中，例如，智能零售、智慧家庭、视频监控(video surveillance)、车辆网(如自动驾驶、无人驾驶等)、以及工业无线传感器网络(industrial wireless sens or network，IWSN)等。但本申请不限于此。

在一种实施方式中，本申请提供的技术方案可以应用于智能家庭，实现基于客户需求为客户提供个性化服务。中心节点可以是基站或服务器，参与节点可以是设置在各个家庭中的客户端设备。基于本申请提供的技术方案，客户端设备仅向服务器提供基于本地数据进行模型训练后通过路由器将合成梯度信息，能够在保护客户数据隐私的同时与服务器共享训练结果信息。服务器获取多个客户端设备提供的合成梯度信息的聚合梯度信息，确定更新后的模型参数并通知各个客户端设备，继续智能模型的训练，完成模型训练后客户端设备应用训练后的模型为客户提供个性化服务。

在另一种实施方式中，本申请提供的技术方案可以应用于工业无线传感器网络，实现工业智能化。中心节点可以是服务器，参与节点可以是工厂内的多个传感器(例如，可移动智能机器人等)，传感器基于本地数据进行模型训练后向服务器发送合成梯度信息，并由服务器获基于传感器提供的合成梯度信息的聚合梯度信息，确定更新后的模型参数并通知各个传感器，继续智能模型的训练，完成模型训练后传感器应用训练后的模型为执行工厂任务，例如，传感器为可移动智能机器人，可以基于训练后的模型获取移动路线，完成工厂搬运任务、快递分拣任务等。

为了更好地理解本申请实施例，下面对本文中涉及到的术语做简单说明。

1、人工智能AI

人工智能AI是让机器具有学习能力，能够积累经验，从而能够解决人类通过经验可以解决的诸如自然语言理解、图像识别和/或下棋等问题。

2、神经网络(neural network，NN)：作为人工智能的重要分支，是一种模仿动物神经网络行为特征进行信息处理的网络结构。神经网络的结构由大量的节点(或称神经元)相互联接构成。神经网络基于特定运算模型，通过对输入信息进行学习和训练达到处理信息的目的。一个神经网络包括输入层、隐藏层及输出层。输入层负责接收输入信号，输出层负责输出神经网络的计算结果，隐藏层负责特征表达等复杂的功能。隐藏层的功能由权重矩阵和对应的激活函数来表征。

深度神经网络(deep neural network，DNN)一般为多层结构。增加神经网络的深度和宽度，可以提高它的表达能力，为复杂系统提供更强大的信息提取和抽象建模能力。神经网络的深度可以表示为神经网络的层数。对于其中一层，神经网络的宽度可以表示为该层包括的神经元的个数。

DNN可以有多种构建方式，例如包括但不限于，递归神经网络(recurrent neural network，RNN)、卷积神经网络(convolutional neural network，CNN)以及全连接神经网络等。

3、训练(training)或学习

训练是指对模型(或称为训练模型)的处理过程。在该处理过程中通过优化该模型中的参数，如加权值，使该模型学会执行某项特定的任务。本申请实施例适用于但不限于以下一种或多种训练方法：监督学习、无监督学习、强化学习、和迁移学习等。有监督学习是利用一组具有已经打好正确标签的训练样本来训练。其中，已经打好正确标签是指每个样本有一个期望的输出值。与有监督学习不同，无监督学习是指一种方法，该方法没有给定事先标记过的训练样本，自动对输入的数据进行分类或分群。

4、推理

推理是指利用训练后的模型(训练后的模型可以称为推理模型)执行数据处理。将实际数据输入推理模型进行处理，得到对应的推理结果。推理还可以称为预测或决策，推理结果还可以称为预测结果、或决策结果等。

5、传统联邦学习(federated learning)

一种分布式AI训练方法，将AI算法的训练过程放在多个设备上进行，而不是聚合到一个服务器上，能够解决集中式AI训练时收集数据导致的耗时和大量通信开销问题。同时，由于不用将设备数据发送到服务器，也能够减少隐私安全问题。具体过程如下：中心节点向多个参与节点发送AI模型，参与节点基于自己的数据进行AI模型训练，并将自己训练的AI模型以梯度的方式上报给中心节点。中心节点对多个参与节点反馈的梯度信息进行聚合，得到新的AI模型的参数。中心节点可以将AI模型的更新后的参数发送给多个参与节点，参与节点再次执行对AI模型的训练。不同次联邦学习过程中，中心节点选择的参与节点可能相同，也可能不同，本申请对此不做限定。

在传统的联邦学习中，训练的多个参与节点中的模型与服务器的模型相同，参与模型训练的设备采用的训练数据的类型相同，可以称为同质网络(homogeneous network)。如图像识别模型的训练中可以由多个图像采集设备使用各自采集到的图像数据对模型进行训练，这种方式可以提高训练数据的多样性，但未考虑推理目标的特征多样性。例如，当同时基于动物的图像和音频进行分类时，猫和狗之间的分类可以更准确。再例如，在车联网中摄像机、定位系统和惯性测量单元(inertial measurement unit，IMU)用于收集不同类别(特征)的数据，以估计车辆的位置或区分道路网内的交通状况，能够提高学习性能。并且对于不同特征数据不同模型的训练效果不同，如一般使用结合分类神经网络的自动编码器来进行音频信号的特征提取和分类，而在处理图像数据时一般使用卷积神经网络。本申请考虑由不同类型的参与节点与中心节点组成异构网络(heterogeneous network)进行联邦学习，不同类型的参与节点分别训练智能模型中推理目标的不同特征对应的子模型，能够提升训练后的智能模型的性能。然而，不同特征之间具有关联关系(或者说具有耦合关系)，为了实现不同参与节点组分别独立的训练不同的子模型，本申请提出由中心节点为不同类型的参与节点提供表征特征间关联关系的特征间约束变量，以实现模型的特征间解耦，使得不同类型的参与节点可以基于特征间约束变量以及本地特征数据对不同特征模型进行训练，不同类型的参与节点随着模型训练过程中模型参数的更新，计算特征间约束变量的梯度，并反馈给中心节点，使得中心节点可以基于不同类型的参与节点反馈的特征间约束变量的梯度更新特征间约束变量。既实现了联邦学习中训练数据的多样性，又实现了针对不同特征的模型训练。从而达到提升训练后的模型性能的效果。

下面结合附图对本申请实施例提供的智能模型的训练方法进行说明。

图2是本申请实施例提供的智能模型的训练方法的一个示意性流程图。中心节点与多个参与节点组联合执行智能模型的训练，智能模型由推理目标的多种特征对应的多个特征模型组成，一个参与节点组的参与节点可以采集一种特征对应的训练数据，基于该特征对应的训练数据训练该特征对应的特征模型，图2所示的智能模型的训练方法由多个参与节点组中的第一参与节点执行。该第一参与节点属于第一参与节点组，该第一参与节点组中的参与节点训练的模型为第一特征模型。

例如，中心节点与该多个参与节点组联合训练的智能模型包括M个特征模型，该M个特征模型分别由M个参与节点组进行训练，一个参与节点组中的参与节点训练一个特征模型。其中第一参与节点组为M个参与节点组中的第m类参与节点组，或者说特征模型m对应的参与节点组，即第一特征模型为特征模型m或称为第m类特征模型。第一参与节点可以是该第一参与节点组中的第k个参与节点。即第一参与节点可以称为第m类参与节点组中的第k个参与节点。

图2为本申请实施例提供的智能模型的训练方法的一个示意性流程图。该方法包括但不限于以下步骤：

S201，中心节点向第一参与节点发送第一信息，该第一信息包括特征间约束变量，该特征间约束变量用于表征不同的特征之间的约束关系。

相应地，该第一参与节点接收来自中心节点的该第一信息，基于该第一信息确定特征间约束变量。

作为示例非限定，该第一信息为广播信息。每个参与节点组中的参与节点均能够接收到该第一信息，并基于该第一信息确定特征间约束变量。

S202，第一参与节点根据特征间约束变量、第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，该第一梯度信息为特征间约束变量对应的梯度信息。

中心节点向该第一参与节点组中的参与节点发送第三信息，该第三信息用于指示第一特征模型更新后的模型参数。该更新后的模型参数为中心节点基于第一参与节点组中的参与节点反馈的模型训练后的模型梯度信息得到的。该第一参与节点基于该模型参数信息，更新第一特征模型的参数，得到参数更新后的第一特征模型。第一参与节点可以采用图3中提供的模型训练方法训练参数更新后的该第一特征模型。具体可以参考下文对图3所示实施例的描述。

参与节点接收到该特征间约束变量后，可以基于该特征间约束变量、特征模型的模型参数和本地样本数据，利用梯度推理模型，推理特征间约束变量对应的梯度信息。以便中心节点可以获取一组或多组参与节点组中的参与节点反馈的特征间约束变量对应的梯度信息，中心节点可以基于获取到的特征间约束变量对应的梯度信息，更新特征间约束变量。

其中，第一特征模型的模型参数可以是最近一次接收到的来自中心节点的第三信息指示的更新后的模型参数。

一种实施方式中，参与模型训练的每个参与节点接收到特征间约束变量后，推理特征间约束变量对应的梯度信息，中心节点基于每个参与节点反馈的特征间约束变量对应的梯度信息更新特征间约束变量。

另一种实施方式中，由于同组的参与节点训练的特征模型相同，可以是参与模型训练的部分参与节点接收到特征间约束变量后，推理特征间约束变量对应的梯度信息，中心节点基于部分参与节点反馈的特征间约束变量对应的梯度信息更新特征间约束变量。

第一参与节点可以基于以下方式确定是否基于特征间约束变量、第一特征模型的模型参数以及本地样本数据，推理特征间约束变量对应的梯度信息。

方式一，由中心节点触发多个参与节点组中的部分或全部参与节点基于特征间约束变量、模型参数和参与节点的本地样本数据，推理(或计算)特征间约束变量的梯度信息。

也就是说，可以由中心节点选择全部或部分参与模型训练的参与节点推理特征间约束变量对应的梯度信息。由于同一参与节点组中的参与节点训练的特征模型相同，中心节点可以选择每个参与节点组中的一个或多个参与节点推理特征间约束变量对应的梯度信息。但本申请不限于此，或者中心节点可以基于不同特征之间的关系，选择部分参与节点组中的一个或多个参与节点推理特征间约束变量对应的梯度信息。

一个示例中，中心节点可以发送第一标识集合，该第一标识集合中包括中心节点选择的特征间约束变量的样本数据的标识。

第一参与节点接收到该第一标识集合后，基于该第一参与节点的样本数据集合中是否该第一标识集合中的标识对应的样本数据，确定是否推理特征间约束变量对应的梯度信息。

若第一参与节点的样本数据集合中包含第一标识集合中的标识对应的样本数据，如第一参与节点的样本数据集合中包括第一标识集合中的第一标识对应的第一样本数据，则第一参与节点基于特征间约束变量、第一特征模型的模型参数和该第一样本数据，推理特征间约束变量对应的梯度信息。

若第一参与节点的样本数据集合中不包含第一标识集合中的标识对应的样本数据，则第一参与节点不推理特征间约束变量对应的梯度信息。

其他参与节点采用相同的方式确定是否执行推理特征间约束变量对应的梯度信息。

另一个示例中，中心节点可以向参与节点发送推理指示信息，指示部分或全部参与节点推理特征间约束变量对应的梯度信息。

例如，中心节点可以向需要执行推理特征间约束变量对应的梯度信息的参与节点发送推理指示信息，接收到该推理指示信息的参与节点执行推理特征间约束变量对应的梯度信息。

再例如，中心节点可以广播该推理指示信息，该推理指示信息包括一个或多个参与节点的标识，推理指示信息中包含的标识对应的参与节点执行推理特征间约束变量对应的梯度信息。

方式二，中心节点与参与节点配置有相同的样本数据选择器，中心节点和参与节点可以基于样本数据选择器确定执行推理特征间约束变量对应的梯度信息的参与节点。

例如，该样本数据选择器可以生成样本数据的至少一个标识，该至少一个标识对应的样本数据用于本轮推理特征间约束对应的梯度信息，若第一参与节点的样本数据集合包括该至少一个标识中的标识对应的样本数据(如第一标识对应的第一样本数据)，则第一参与节点执行推理特征间约束变量对应的梯度信息；若第一参与节点的样本数据集合不包括该至少一个标识中的标识对应的样本数据，则第一参与节点不执行推理特征间约束变量对应的梯度信息。其他参与节点采用相同的方式确定是否执行推理特征间约束变量对应的梯度信息。

若第一参与节点确定执行推理特征间约束变量对应的梯度信息，第一参与节点根据特征间约束变量、第一特征模型的模型参数和第一样本数据，推理特征间约束变量对应的梯度信息。

例如，本轮(如第t次推理中)用于推理特征间约束变量对应的梯度信息的样本数据标识集合为I ^t，第一参与节点的第一样本数据的标识i属于I ^t，即i∈I ^t，则第一参与节点根据第一样本数据(即样本数据i)对应的特征间约束变量

第一特征模型的模型参数

和该第一样本数据，利用梯度推理模型，推理特征间约束变量

对应的梯度信息，得到第一梯度信息

其中，

表示训练特征模型m(即第一特征模型)的参与节点在第t次推理中基于标识i对应的样本数据(即第一样本数据)推理得到的特征间约束变量

的梯度信息。

为第一参与节点从中心节点获取到的更新后的模型参数，b ^t为第t次训练的偏置参数，

为第t次训练中的第i个训练数据对应的辅助变量。该偏置参数b ^t和辅助变量

来自中心节点。

为用于计算模型参数对应的梯度信息的函数。

第一参与节点得到特征间约束变量对应的梯度信息后，可以向中心节点发送量化后的第一目标梯度信息。量化后的第一目标梯度信息可以记作

一种实施方式中，该第一目标梯度信息为上述第一梯度信息。

第一参与节点得到第一梯度信息后，第一参与节点对该第一梯度信息进行量化编码，得到量化后的第一梯度信息

第一参与节点向中心节点发送该量化后的第一梯度信息。以便中心节点基于参与节点反馈的特征间约束变量对应的梯度信息，得到更新后的特征间约束变量λ ^t+1。

另一种实施方式中，该第一目标梯度信息包括第一梯度信息和第一残差梯度信息，该第一残差梯度信息用于表征第一参与节点在得到该第一梯度信息之前未发送给中心节点的特征间约束变量对应的梯度信息的残差量。

该第一目标梯度信息

可以表示为：

其中，β ^t＝τ ^t-1/τ ^t，τ ^t为第t次模型训练中模型参数的更新步长，即第t次模型训的学习率，τ ^t-1为第t-1次模型训练中模型参数的更新步长，即第t-1次模型训的学习率，

为第一残差梯度信息，即第t次推理特征间约束变量对应的梯度信息之前未发送给中心节点的特征间约束变量对应的梯度信息中的残差量。

第一参与节点向中心节点发送量化后的第一目标梯度信息，则该第一参与节点可以更新残差梯度信息，即第一参与节点基于第一目标梯度信息

和量化后的第一目标梯度信息

得到第二残差梯度信息，该第二残差梯度信息为第一参与节点第t+1次推理特征间约束变量对应的梯度信息之前未发送给中心节点的梯度信息的残差量

该第二残差梯度信息用于表征第一目标梯度信息中未发送给中心节点的残差量。该第二残差梯度信息作为第t+1次模型训练之前未发送给中心节点的特征间约束变量对应的梯度信息的残差量。也就是说，第一参与节点向中心节点发送了量化后的第一目标梯度信息，梯度信息的残差量更新为第一目标梯度信息中因量化编码而未发送给中心节点的残差量。

可选地，第一参与节点可以基于调度策略，确定是否向中心节点发送量化后的目标梯度信息。

例如，上述第一参与节点向中心节点发送量化后的第一目标梯度信息是基于调度策略，确定向中心节点发送量化后的目标梯度信息后，第一参与节点向中心节点发送该量化后的第一目标梯度信息

若第一参与节点基于调度策略，确定不向中心节点发送量化后的目标梯度信息。则第一参与节点确定第三残差梯度信息。该第三残差梯度信息为该第一目标梯度信息。则该第三残差梯度信息为第一参与节点执行第t+1次模型训练得到梯度信息之前未发送给中心节点的梯度信息的残差量

也就是说，若第一参与节点基于调度策略确定不向中心节点发送该第一目标梯度信息，则梯度信息的残差量

包括第t次推理得到的第一梯度信息

以及第t次图例之前推理得到特征间约束变量对应的梯度信息中未发送给中心节点的残差量

一个示例中，调度策略可以是中心节点通知第一参与节点的。

例如，中心节点向第一参与节点发送指示信息A，该指示信息A可以指示第一参与节点第t次推理特征间约束变量对应的梯度信息后向中心节点发送训练后得到的梯度信息，则第一参与节点在第t次推理后向中心节点发送量化后的第一目标梯度信息，并计算发送量化后的第一目标梯度信息后梯度信息的残差量(即第二残差梯度信息)，

为第二残差梯度信息。

或者，该指示信息A可以指示第一参与节点在第t次模型推理后不向中心节点发送得到的梯度信息，则该第一参与节点在第t次推理得到第一梯度信息后不向中心节点发送梯度信息，并将该第一梯度信息累加到残差梯度信息中得到第三残差梯度信息，

为第三残差梯度信息。

另一个示例中，该调度策略可以是第一参与节点基于量化噪声信息、信道资源信息和第一目标梯度信息确定的。

第一参与节点基于量化噪声信息、信道资源信息和目标梯度信息(如本示例中的第一目标梯度信息)确定调度策略的具体实施方式在实施例二中进行了详细说明。

若第一参与节点不包含样本数据标识集合I ^t中的标识对应的样本数据，则第一参与节点不执行推理特征间约束变量的梯度信息。第一参与节点更新残差梯度信息，得到

S203，中心节点接收来自多个参与节点的特征间约束变量对应的目标梯度信息。

以该多个参与节点中的第一参与节点为例，第一参与节点可以向中心节点发送推理得到的量化后的第一目标梯度信息。中心节点接收来自第一参与节点的量化后的第一目标梯度信息后，通过量化解码后得到第一目标梯度信息，中心节点根据接收到的该多个参与节点各自反馈的特征间约束变量对应的目标梯度信息，更新每个样本数据对应的特征间约束变量。

其中，N ^b是样本数据的个数，中心节点可以每次选择N ^b个样本数据。存储了被选择的样本数据的参与节点基于当前特征模型的模型参数以及样本数据推理特征间约束变量的梯度信息，并反馈给中心节点。相对于每个参与节点均参与反馈特征间约束变量的梯度信息的方式，能够减小资源开销和实现复杂度。

中心节点还基于每轮计算得到的特征间约束变量，更新偏置参数b ^t+1：

其中，

r(·)是块可分离(block-separable)的正则化函数。以及，中心节点还基于每轮更新得到的特征间约束变量，更新辅助变量

其中，

l _i(·)是第i个数据样本的采样损失函数。

中心节点得到更新后的特征间约束变量后，将更新后的偏置参数b ^t+1、辅助变量

特征间约束变量发送给参与节点，以便参与节点基于偏置参数、辅助变量和特征间约束变量训练特征模型。

图3为本申请实施例提供的智能模型的训练方法的另一个示意性流程图。该方法包括但不限于以下步骤：

S301，中心节点向第一参与节点发送第一信息，该第一信息包括特征间约束变量，该特征间约束变量用于表征不同的特征之间的约束关系。

S302，该第一参与节点基于该特征间约束变量和模型训练数据，训练第一特征模型，得到第二梯度信息。

第一参与节点获取到该特征间约束变量后，基于该特征间约束变量和模型训练数据，执行对第一特征模型的第t次模型训练。

中心节点还向该第一参与节点组中的参与节点发送第三信息，该第三信息用于指示第一特征模型更新后的模型参数。该更新后的模型参数为中心节点基于第一参与节点组中的参与节点反馈的第t-1次模型训练后的模型梯度信息得到的。

该第一参与节点基于该模型参数信息，更新第一智能模型的参数，得到更新后的第一智能模型。第一参与节点再执行第t次模型训练，基于该特征间约束变量和模型训练数据，训练参数更新后的该第一智能模型。第一参与节点第t次训练第一特征模型后，得到第二梯度信息。

例如，第二梯度信息可以记作

表示m类参与节点组中的第k个参与节点(即第一参与节点)在第t次训练后得到的梯度信息。该第二梯度信息

可以表示为：

其中，

为第一参与节点在第t次训练选定的训练数据的索引值集合。

为第一参与节点从中心节点获取到的更新后的模型参数，

为特征间约束变量，b ^t为第t次训练的偏置参数，

是第一参与节点从中心节点获取到的。

为用于计算模型参数对应的梯度信息的函数，该第二梯度信息用于更新第一特征模型的模型参数，具体第一参与节点将向中心节点反馈该梯度信息，由中心节点基于第一参与节点组中的参与节点反馈的梯度信息，确定更新后的模型参数。

第一参与节点基于训练数据的索引值集合中每个索引值对应的训练数据训练第一特征模型后得到一个梯度信息，并累加基于每个训练数据训练模型后得到的梯度信息，其中，由于第一智能模型为智能模型的M个特征模型中的一个，因此，累加得到的梯度信息除以M后，得到第一参与节点第t次训练第一智能模型后的第二梯度信息

但本申请不限于此。

第一参与节点第t次执行对第一智能模型的训练后，可以向中心节点发送量化后的第二目标梯度信息。量化后的第二目标梯度信息可以记作

一种实施方式中，该第二目标梯度信息为上述第二梯度信息。

第一参与节点对第一智能模型执行第t次模型训练后得到第二梯度信息，第一参与节点对该第二梯度信息进行量化编码，得到量化后的第二梯度信息

向中心节点发送该量化后的第二梯度信息。以便中心节点基于第一参与节点组中的参与节点反馈的第t次训练后得到的梯度信息，得到更新的第一特征模型的参数。

另一种实施方式中，该第二目标梯度信息包括第二梯度信息和第四残差梯度信息，该第四残差梯度信息用于表征第一参与节点在得到该第二梯度信息之前未发送给中心节点的梯度信息的残差量。

该第二目标梯度信息

可以表示为：

其中，α ^t＝η ^t-1/η ^t，η ^t为第t次模型训练中模型参数的更新步长，即第t次模型训的学习率，η ^t-1为第t-1次模型训练中模型参数的更新步长，即第t-1次模型训的学习率，

为第四残差梯度信息，即第t次模型训练之前的模型训练后得到的梯度信息中未发送给中心节点的梯度信息的残差量。

第一参与节点向中心节点发送量化后的第二目标梯度信息后，该第一参与节点可以更新残差梯度信息，即第一参与节点基于第二目标梯度信息

和量化后的第二目标梯度信息

得到第五残差梯度信息为第一参与节点执行第t+1次模型训练得到梯度信息之前未发送给中心节点的梯度信息的残差量

该第五残差梯度信息用于表征第二目标梯度信息中未发送给中心节点的残差量。该第五残差梯度信息作为第t+1次模型训练之前的模型训练后得到的梯度信息中未发送给中心节点的梯度信息的残差量。也就是说，第一参与节点向中心节点发送了量化后的第二目标梯度信息，梯度信息的残差量为第二目标梯度信息中因量化编码而未发送给中心节点的残差量。

例如，上述第一参与节点向中心节点发送量化后的第二目标梯度信息是基于调度策略，确定向中心节点发送量化后的目标梯度信息后，第一参与节点向中心节点发送该量化后的第二目标梯度信息

若第一参与节点基于调度策略，确定不向中心节点发送量化后的目标梯度信息。则第一参与节点确定第六残差梯度信息。该第六残差梯度信息为该第二目标梯度信息。则该第六残差梯度信息为第一参与节点执行第t+1次模型训练得到梯度信息之前未发送给中心节点的梯度信息的残差量

也就是说，若第一参与节点基于调度策略确定不向中心节点发送该第二目标梯度信息，则梯度信息的残差量

包括第t次模型训练得到的第二梯度信息

以及第t次模型训练得到第二梯度信息之前未发送给中心节点的残差量

例如，中心节点向第一参与节点发送指示信息A，该指示信息A可以指示第一参与节点第t次模型训练后向中心节点发送训练后得到的梯度信息，则第一参与节点在第t次训练后向中心节点发送量化后的第二目标梯度信息，并计算发送量化后的第二目标梯度信息后梯度信息的残差量(即第五残差梯度信息)，

为第五残差梯度信息。

或者，该指示信息A可以指示第一参与节点在第t次模型训练后不向中心节点发送训练后得到的梯度信息，则该第一参与节点在第t次训练得到第二梯度信息后不向中心节点发送梯度信息，并将该第二梯度信息累加到残差梯度信息中得到第六残差梯度信息，

为第六残差梯度信息。

另一个示例中，该调度策略可以是第一参与节点基于量化噪声信息、信道资源信息和第二目标梯度信息确定的。

第一参与节点基于量化噪声信息、信道资源信息和目标梯度信息确定调度策略的具体实施方式在实施例二中进行了详细说明。

中心节点接收来自第一参与节点组中的参与节点执行第t次模型训练后发送的量化后的目标梯度信息，

其中，

N ^b是数据采样的个数

实施例二

本申请实施例提供了一种参与节点基于信道资源信息和待传输信号

确定调度策略的方式。该待传输信号

可以是上述第二目标梯度信息

该调度策略用于第一参与节点确定是否向中心节点发送该第二目标梯度信息。该待传输信号

可以是上述第一目标梯度信息

该调度策略用于第一参与节点确定是否向中心节点发送该第一目标梯度信息。但本申请不限于此，该调度策略还可以用于其他待传输信号是否传输的决策中。

作为示例非限定，该信道资源信息包括信道状态信息和/或传输时间信息。

其中，信道状态信息为第一参与节点与中心节点之间信道的状态信息h _k，该传输时间信息为该第一参与节点占用信道资源传输梯度信息的持续时间T ₀。

第一参与节点可以基于信道资源信息和目标信息确定量化噪声信息，该量化噪声信息用于表征目标信息的量化编解码的损失量。例如，该目标信息可以是上述第一目标梯度信息，

或者可以是上述第二目标梯度信息

或者该目标信息还可以是其他信息，本申请对此不作限定。

例如图4所示，第一参与节点采用量化编码模块对待发送的目标信息

进行量化编码，得到量化后的目标信息

该第一参与节点通过第一参与节点的收发模块向中心节点发送该量化后的目标信息

该量化后的目标信息经过信道传播后由中心节点通过中心节点的收发模块接收到，由中心节点接收到的量化后的目标信息可以记作

中心节点通过量化解码器对

进行量化解码后得到恢复的目标信息

恢复得到的

相较于

的损失量即为量化噪声。

一个示例中，第一参与节点可以对目标信息量化编码再进行量化解码，得到量化噪声信息，该量化噪声信息为目标信息与对目标信息量化编码又解码得到的信号的差值。

另一个示例中，第一参与节点可以基于信道资源信息和目标信息估计目标信息的量化噪声信息。

也就是说，第一参与节点可以基于获取到的信道资源信息，估计量化后的目标信息经过信道传输以及中心节点的量化解码后该目标信息的损失量，得到量化噪声信息。可选地，信道资源信息可以包括信道状态信息和/或信道占用时间信息(即传输时间信息)。

可选地，第一参与节点根据信道资源信息、通信代价信息和目标信息，得到目标信息的量化噪声信息。其中，该通信代价信息用于指示通信资源的通信代价权重，其中，通信资源可以包括传输功率和/或传输带宽。

可选地，中心节点可以向第一参与节点发送第二信息，该第二信息用于指示该通信代价信息。相应地，第一参与节点接收来自中心节点的该第二信息，根据该第二信息确定该通信代价信息。

例如，通信代价信息可以指示传输功率的代价权重γ _p和传输带宽的代价权重γ _B，第一参与节点通过来自中心节点的第二信息获取到该传输通信代价信息，可以基于传输功率代价权重γ _p、信道资源信息即信道状态信息h _k和传输时间信息T ₀以及噪声功率谱密度N ₀计算得到参数q _k，该参数q _k满足：

第一参与节点还可以求解下式得到参数

第一参与节点根据参数

和目标信息

得到量化噪声信息，该量化噪声信息为目标信息的量化噪声的协方差矩阵。

其中，V _k为目标信息

的协方差矩阵。

第一参与节点可以根据该量化噪声信息、通信代价信息、信道资源信息和目标信息可以分别确定传输带宽

满足：

其中，I是单位矩阵，det(A)表示矩阵A的行列式，log(x)表示计算x的对数。

以及，第一参与节点可以根据该量化噪声信息、通信代价信息、信道资源信息和目标信息可以分别确定传输功率

满足：

第一参与节点得到传输带宽

和传输功率

后，可以根据传输带宽

传输功率

目标信息的量化噪声信息

以及通信代价，确定门限值

该门限值

满足：

其中，tr(A)表示矩阵A的迹，在线性代数中，一个n×n矩阵A的主对角线(从左上方至右下方的对角线)上各个元素的总和被称为矩阵A的迹(或迹数)，一般记作tr(A)。

第一参与节点可以比较目标信息

的度量值与门限值的大小，确定是否向中心节点发送量化后的目标信息。

作为示例非限定，该目标信息的度量值可以是该目标信息的范数

若该目标信息为向量，则该目标信息的范数

为该目标信息的l ₂范数；若该目标信息为矩阵，则该目标信息的范数

为该目标信息的Frobeius范数。

当目标信息的度量值大于门限值

如

时，第一参与节点向中心节点发送量化后的目标信息，即该第一参与节点处于活跃状态，否则当目标信息的度量值小于或等于门限值

如

时，第一参与节点不向中心节点发送该目标信息，即该第一参与节点处于非活跃状态。

上述图2、图3所示的实施例中，参与节点可以基于该实施例二提供的调度策略，确定是否向中心节点发送量化后的目标信息。

例如，在图2所示的示例中，第一参与节点根据第一量化噪声信息、信道资源信息，确定第一门限值，其中，第一量化噪声信息用于表征对第一目标梯度信息的量化编解码的损失量。如参考前文中的描述第一参与节点可以根据参数

和第一目标信息

得到第一量化噪声信息。若第一目标梯度信息的度量值大于第一门限值，第一参与节点向中心节点发送量化后的第一目标梯度信息；若第一目标梯度信息的度量值小于或等于第一门限值，第一参与节点不向中心节点发送量化后的第一目标梯度信息。

再例如，在图3所示的示例中，第一参与节点根据第二量化噪声信息、信道资源信息，确定第二门限值，其中，第二量化噪声信息用于表征对第二目标梯度信息的量化编解码的损失量。如参考前文中的描述第一参与节点可以根据参数

和第二目标信息

得到第二量化噪声信息。若第二目标梯度信息的度量值大于第二门限值，第一参与节点向中心节点发送量化后的第二目标梯度信息；若第二目标梯度信息的度量值小于或等于第二门限值，第一参与节点不向中心节点发送量化后的第二目标梯度信息。

在本申请的各个示例中，如果没有特殊说明以及逻辑冲突，不同的示例之间的术语和/或描述具有一致性、且可以相互引用，不同的示例中的技术特征根据其内在的逻辑关系可以组合形成新的示例。

本申请中，所涉及的节点可以执行该节点相关的部分或全部步骤或操作。这些步骤或操作仅是示例，本申请还可以执行其它操作或者各种操作的变形。此外，各个步骤可以按照本申请呈现的不同的顺序来执行，并且有可能并非要执行本申请中的全部操作。

以上，结合图2至图4详细说明了本申请实施例提供的方法。以下详细说明本申请实施例提供的装置。为了实现上述本申请实施例提供的方法中的各功能，各网元可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

图5是本申请实施例提供的智能模型的训练装置的示意性框图。如图5所示，该智能模型的训练装置500可以包括处理单元510和收发单元520。

在一种可能的设计中，该智能模型的训练装置500可对应于上文方法实施例中的参与节点，或者配置于(或用于)参与节点中的芯片，或者是其他能够实现参与节点执行的方法的装置、模块、电路或单元等。

应理解，该智能模型的训练装置500可对应于本申请实施例的方法中的参与节点，该智能模型的训练装置500可以包括用于执行图2、图3所示的方法的第一设备中的各个单元。并且，该智能模型的训练装置500中的各单元和上述其他操作和/或功能分别为了实现图2、图3所示的方法的相应流程。

当该智能模型的训练装置500用于实现上述方法实施例中的参与节点执行的相应流程时，该收发单元520，用于接收来自所述中心节点的第一信息，所述第一信息用于指示特征间约束变量，所述特征间约束变量用于表征不同所述特征之间的约束关系。该处理单元510，用于根据所述特征间约束变量、所述第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息。该处理单元510，还用于向所述中心节点发送所述第一梯度信息。

可选地，该处理单元510还用于根据量化噪声信息、信道资源信息，确定门限值，其中，所述量化噪声信息用于表征对目标信息的量化编解码的损失量。该收发单元520，还用于在所述目标信息的度量值大于所述门限值的情况下，发送量化后的所述目标信息；在所述目标信息的度量值小于或等于所述门限值的情况下，不发送量化后的所述目标信息。

还应理解，该智能模型的训练装置500为配置于(或用于)参与节点中的芯片时，该智能模型的训练装置500中的收发单元520可以为芯片的输入/输出接口或电路，该智能模型的训练装置500中的处理单元510可以为芯片中的逻辑电路。

在另一种可能的设计中，该智能模型的训练装置500可对应于上文方法实施例中的中心节点，例如，或者配置于(或用于)中心节点中的芯片，或者是其他能够实现中心节点执行的方法的装置、模块、电路或单元等。

应理解，该智能模型的训练装置500可对应于图2、图3所示的方法中的中心节点，该智能模型的训练装置500可以包括用于执行图2、图3所示的方法的中心节点的各个单元。并且，该智能模型的训练装置500中的各单元和上述其他操作和/或功能分别为了实现图2、图3所示的方法的相应流程。

当该智能模型的训练装置500用于实现上述方法实施例中的中心节点执行的相应流程时，该处理单元510用于确定特征间约束变量，所述特征间约束变量用于表征不同的所述特征之间的约束关系；该收发单元520用于向所述多个参与节点组中的参与节点发送第一信息，所述第一信息包括所述特征间约束变量。

还应理解，该智能模型的训练装置500为配置于(或用于)中心节点中的芯片时，该智能模型的训练装置500中的收发单元520可以为芯片的输入/输出接口或电路，该智能模型的训练装置500中的处理单元510可以为芯片中的逻辑电路。可选地，智能模型的训练装置500还可以包括存储单元530，该存储单元530可以用于存储指令或者数据，处理单元510可以执行该存储单元中存储的指令或者数据，以使该智能模型的训练装置实现相应的操作。

应理解，该智能模型的训练装置500中的收发单元520为可通过通信接口(如收发器或输入/输出接口)实现，例如可对应于图6中示出的通信设备600中的收发器610。该智能模型的训练装置500中的处理单元510可通过至少一个处理器实现，例如可对应于图6中示出的通信设备600中的处理器620。该智能模型的训练装置500中的处理单元510还可以通过至少一个逻辑电路实现。该智能模型的训练装置500中的存储单元530可对应于图6中示出的通信设备600中的存储器。

还应理解，各单元执行上述相应步骤的具体过程在上述方法实施例中已经详细说明，为了简洁，在此不再赘述。

图6是本申请实施例提供的终端设备600的结构示意图。

该通信设备600可对应于上述方法实施例中的参与节点，如图6所示，该参与节点600包括处理器620和收发器610。可选地，该参与节点600还包括存储器。其中，处理器620、收发器610和存储器之间可以通过内部连接通路互相通信，传递控制和/或数据信号。该存储器用于存储计算机程序，该处理器620用于执行该存储器中的该计算机程序，以控制该收发器610收发信号。

应理解，图6所示的通信设备600能够实现图2、图3所示方法实施例中涉及参与节点的过程。参与节点600中的各个模块的操作和/或功能，分别为了实现上述方法实施例中的相应流程。具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

该通信设备600可对应于上述方法实施例中的中心节点，如图6所示，该中心节点600包括处理器620和收发器610。可选地，该中心节点600还包括存储器。其中，处理器620、收发器610和存储器之间可以通过内部连接通路互相通信，传递控制和/或数据信号。该存储器用于存储计算机程序，该处理器620用于执行该存储器中的该计算机程序，以控制该收发器610收发信号。

应理解，图6所示的通信设备600能够实现图2、图3所示方法实施例中涉及中心节点的过程。中心节点600中的各个模块的操作和/或功能，分别为了实现上述方法实施例中的相应流程。具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

上述处理器620可以和存储器可以合成一个处理装置，处理器620用于执行存储器中存储的程序代码来实现上述功能。具体实现时，该存储器也可以集成在处理器620中，或者独立于处理器620。该处理器620可以与图5中的处理单元对应。

上述收发器610可以与图5中的收发单元对应。收发器610可以包括接收器(或称接收机、接收电路)和发射器(或称发射机、发射电路)。其中，接收器用于接收信号，发射器用于发射信号。

应理解，图6所示的通信设备600能够实现图2、图3所示方法实施例中涉及终端设备的过程。终端设备600中的各个模块的操作和/或功能，分别为了实现上述方法实施例中的相应流程。具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

本申请实施例还提供了一种处理装置，包括处理器和(通信)接口；所述处理器用于执行上述任一方法实施例中的方法。

应理解，上述处理装置可以是一个或多个芯片。例如，该处理装置可以是现场可编程门阵列(field programmable gate array，FPGA)，可以是专用集成芯片(application specific integrated circuit，ASIC)，还可以是系统芯片(system on chip，SoC)，还可以是中央处理器(central processor unit，CPU)，还可以是网络处理器(network processor，NP)，还可以是数字信号处理电路(digital signal processor，DSP)，还可以是微控制器(micro controller unit，MCU)，还可以是可编程控制器(programmable logic device，PLD)或其他集成芯片。

根据本申请实施例提供的方法，本申请还提供一种计算机程序产品，该计算机程序产品包括：计算机程序代码，当该计算机程序代码由一个或多个处理器执行时，使得包括该处理器的装置执行图2、图3所示实施例中的方法。

本申请实施例提供的技术方案可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、网络设备、终端设备、核心网设备、机器学习设备或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，数字视频光盘(digital video disc，DVD))、或者半导体介质等。

根据本申请实施例提供的方法，本申请还提供一种计算机可读存储介质，该计算机可读存储介质存储有程序代码，当该程序代码由一个或多个处理器运行时，使得包括该处理器的装置执行图2、图3所示实施例中的方法。

根据本申请实施例提供的方法，本申请还提供一种系统，其包括前述的一个或多个第一设备。还系统还可以进一步包括前述的一个或多个第二设备。

可选地，第一设备可以是网络设备或终端设备，第二设备可以是与第一设备通过无线链路进行通信的设备。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种智能模型的训练方法，其特征在于，中心节点与多个参与节点组联合执行智能模型的训练，所述智能模型由推理目标的多种特征对应的多个特征模型组成，一个所述参与节点组中的参与节点训练一个所述特征模型，所述训练方法由所述多个参与节点组中训练第一特征模型的第一参与节点执行，包括：

接收来自所述中心节点的第一信息，所述第一信息用于指示特征间约束变量，所述特征间约束变量用于表征不同所述特征之间的约束关系；

根据所述特征间约束变量、所述第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息；

向所述中心节点发送所述第一梯度信息。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收来自所述中心节点的第一标识集合，所述第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识；

所述根据所述特征间约束变量、所述第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息，包括：

确定所述第一参与节点的样本数据集合中包括第一标识对应的所述第一样本数据，所述第一标识属于所述第一标识集合；

根据所述特征间约束变量、所述第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息。
根据权利要求1或2所述的方法，其特征在于，所述向所述中心节点发送所述第一梯度信息，包括：

向所述中心节点发送量化后的第一目标梯度信息，所述第一目标梯度信息包括所述第一梯度信息，或者所述第一目标梯度信息包括所述第一梯度信息和第一残差梯度信息，所述第一残差梯度信息用于表征在得到所述第一梯度信息之前未发送给所述中心节点的特征间约束变量对应的梯度信息的残差量。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

基于所述第一目标梯度信息和量化后的所述第一目标梯度信息，得到第二残差梯度信息，所述第二残差梯度信息为所述第一目标梯度信息中未发送给所述中心节点的残差量。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

根据第一量化噪声信息和信道资源信息，确定第一门限值，其中，所述第一量化噪声信息用于表征对所述第一目标梯度信息的量化编解码的损失量；

向所述中心节点发送量化后的第一目标梯度信息，包括：

确定所述第一目标梯度信息的度量值大于所述第一门限值；

向所述中心节点发送量化后的所述第一目标梯度信息。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

若所述第一目标梯度信息的度量值小于或等于所述第一门限值，确定不向所述中心节点发送量化后的所述第一目标梯度信息。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

若所述第一目标梯度信息的度量值小于所述第一门限值，确定第三残差梯度信息，所述第三残差梯度信息为所述第一目标梯度信息。
根据权利要求5至7中任一项所述的方法，其特征在于，所述方法还包括：

根据信道资源信息、通信代价信息和第一目标梯度信息，得到所述第一量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求5至8中任一项所述的方法，其特征在于，所述根据第一量化噪声信息和信道资源信息，确定第一门限值，包括：

根据所述第一量化噪声信息、通信代价信息、所述信道资源信息和所述第一目标梯度信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；

根据所述第一量化噪声信息和所述通信资源，确定所述第一门限值。
根据权利要求8或9所述的方法，其特征在于，所述方法还包括：

接收来自所述中心节点的第二信息，所述第二信息用于指示所述通信代价信息。
根据权利要求1至10中任一项所述的方法，其特征在于，所述方法还包括：

根据所述特征间约束变量和模型训练数据，训练所述第一特征模型，得到第二梯度信息；

向所述中心节点发送所述第二梯度信息。
根据权利要求11所述的方法，其特征在于，所述向所述中心节点发送所述第二梯度信息，包括：

向所述中心节点发送量化后的第二目标梯度信息，所述第二目标梯度信息包括所述第二梯度信息，或者所述第二目标梯度信息包括所述第二梯度信息和第四残差梯度信息，所述第四残差梯度信息用于表征在得到所述第二梯度信息之前未发送给所述中心节点的梯度信息的残差量。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

基于所述第二目标梯度信息和量化后的所述第二目标梯度信息，得到第五残差梯度信息，所述第五残差梯度信息用于表征所述第二目标梯度信息中未发送给所述中心节点的残差量。
根据权利要求12或13所述的方法，其特征在于，所述方法还包括：

根据第二量化噪声信息和信道资源信息，确定第二门限值，其中，所述第二量化噪声信息用于表征对所述第二目标梯度信息的量化编解码的损失量；

向所述中心节点发送量化后的第二目标梯度信息，包括：

确定所述第二目标梯度信息的度量值大于所述第二门限值；

向所述中心节点发送量化后的所述第二目标梯度信息。
根据权利要求14所述的方法，其特征在于，所述方法还包括：

若所述第二目标梯度信息的度量值小于或等于所述第二门限值，确定不向所述中心节点发送量化后的所述第二目标梯度信息。
根据权利要求15所述的方法，其特征在于，所述方法还包括：

若所述第二目标梯度信息的度量值小于所述第二门限值，确定第六残差梯度信息，所述第六残差梯度信息为所述第二目标梯度信息。
根据权利要求14至16中任一项所述的方法，其特征在于，所述方法还包括：

根据信道资源信息、通信代价信息和第二目标梯度信息，得到所述第二量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求14至17中任一项所述的方法，其特征在于，所述根据第二量化噪声信息和信道资源信息，确定第二门限值，包括：

根据所述第二量化噪声信息、通信代价信息、所述信道资源信息和所述第二目标梯度信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；

根据所述第二量化噪声信息和所述通信资源，确定所述第二门限值。
根据权利要求1至18中任一项所述的方法，其特征在于，所述方法还包括：

接收来自所述中心节点的第三信息，所述第三信息用于指示所述第一特征模型的更新后的参数；

根据所述第三信息，更新所述第一特征模型的参数。
一种智能模型的训练方法，其特征在于，中心节点与多个参与节点组联合执行智能模型的训练，所述智能模型由推理目标的多种特征对应的多个特征模型组成，一个所述参与节点组中的参与节点训练一个所述特征模型，所述训练方法由所述中心节点执行，包括：

确定特征间约束变量，所述特征间约束变量用于表征不同的所述特征之间的约束关系；

向所述多个参与节点组中的参与节点发送第一信息，所述第一信息包括所述特征间约束变量。
根据权利要求20所述的方法，其特征在于，所述方法还包括：

接收来自第一参与节点组中的参与节点的至少一个第二目标梯度信息，所述多个参与节点组包括所述第一参与节点组；

根据所述至少一个第二目标梯度信息，确定第一特征模型的更新后的模型参数，所述第一特征模型为所述第一参与节点组中的参与节点训练的特征模型；

向所述第一参与节点组发送所述更新后的模型参数。
根据权利要求20或21所述的方法，其特征在于，所述方法还包括：

向所述多个参与节点组中的参与节点发送第一标识集合，所述第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识。
根据权利要求20至22中任一项所述的方法，其特征在于，所述方法还包括：

接收来自多个所述参与节点组中的参与节点的多个第一目标梯度信息，所述第一目标梯度信息为特征间约束变量对应的梯度信息；

以及，所述确定特征间约束变量，包括：

根据所述多个第一目标梯度信息，确定所述特征间约束变量。
根据权利要求20至23中任一项所述的方法，其特征在于，所述方法还包括：

向所述多个参与节点组中的参与节点发送第二信息，所述第二信息用于指示通信代价信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
一种智能模型的训练方法，其特征在于，包括：

根据量化噪声信息和信道资源信息，确定门限值，其中，所述量化噪声信息用于表征对目标信息的量化编解码的损失量；

在所述目标信息的度量值大于所述门限值的情况下，发送量化后的所述目标信息；

在所述目标信息的度量值小于或等于所述门限值的情况下，不发送量化后的所述目标信息。
根据权利要求25所述的方法，其特征在于，所述目标信息包括第N次模型训练得到的梯度信息和第一目标残差信息，所述第一目标残差信息为得到所述梯度信息之前未发送的梯度信息的残差量。
根据权利要求25或26所述的方法，其特征在于，所述方法还包括：

在所述目标信息的度量值大于所述门限值的情况下，基于所述目标信息和量化后的所述目标信息，得到第二目标残差信息，所述第二目标残差信息为所述目标信息中未发送的残差量。
根据权利要求25至27中任一项所述的方法，其特征在于，所述方法还包括：

若所述目标信息的度量值小于或等于所述门限值，确定第三目标残差信息，所述第三目标残差信息为所述目标信息。
根据权利要求25至28中任一项所述的方法，其特征在于，所述方法还包括：

根据信道资源信息、通信代价信息和所述目标信息，得到所述量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求25至29中任一项所述的方法，其特征在于，所述根据量化噪声信息和信道资源信息，确定门限值，包括：

根据所述量化噪声信息、通信代价信息、所述信道资源信息和所述目标信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；

根据所述量化噪声信息和所述通信资源，确定所述门限值。
根据权利要求29或30所述的方法，其特征在于，所述方法还包括：

接收第二信息，所述第二信息用于指示所述通信代价信息。
一种智能模型的训练装置，其特征在于，包括：

收发单元，用于接收来自中心节点的第一信息，所述第一信息用于指示特征间约束变量，所述特征间约束变量用于表征不同所述特征之间的约束关系；

处理单元，用于根据所述特征间约束变量、第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息；

所述收发单元，还用于向所述中心节点发送所述第一梯度信息。
根据权利要求32所述的装置，其特征在于，

所述收发单元还用于接收来自所述中心节点的第一标识集合，所述第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识；

以及，所述处理单元具体用于：

确定第一参与节点的样本数据集合中包括第一标识对应的所述第一样本数据，所述第一标识属于所述第一标识集合，所述训练装置配置于所述第一参与节点；

根据所述特征间约束变量、所述第一特征模型的模型参数和第一样本数据，利用梯度推理模型，得到第一梯度信息，所述第一梯度信息为特征间约束变量对应的梯度信息。
根据权利要求32或33所述的装置，其特征在于，

所述收发单元具体用于向所述中心节点发送量化后的第一目标梯度信息，所述第一目标梯度信息包括所述第一梯度信息，或者所述第一目标梯度信息包括所述第一梯度信息和第一残差梯度信息，所述第一残差梯度信息用于表征在得到所述第一梯度信息之前未发送给所述中心节点的特征间约束变量对应的梯度信息的残差量。
根据权利要求34所述的装置，其特征在于，

所述处理单元还用于基于所述第一目标梯度信息和量化后的所述第一目标梯度信息，得到第二残差梯度信息，所述第二残差梯度信息为所述第一目标梯度信息中未发送给所述中心节点的残差量。
根据权利要求34或35所述的装置，其特征在于，

所述处理单元还用于根据第一量化噪声信息和信道资源信息，确定第一门限值，其中，所述第一量化噪声信息用于表征对所述第一目标梯度信息的量化编解码的损失量；

所述处理单元还用于确定所述第一目标梯度信息的度量值大于所述第一门限值；

所述收发单元具体用于在所述第一目标梯度信息的度量值大于所述第一门限值的情况下，向所述中心节点发送量化后的所述第一目标梯度信息。
根据权利要求36所述的装置，其特征在于，所述处理单元还用于在所述第一目标梯度信息的度量值小于或等于所述第一门限值的情况下，确定不向所述中心节点发送量化后的所述第一目标梯度信息。
根据权利要求37所述的装置，其特征在于，所述处理单元还用于在所述第一目标梯度信息的度量值小于所述第一门限值的情况下，确定第三残差梯度信息，所述第三残差梯度信息为所述第一目标梯度信息。
根据权利要求36至38中任一项所述的装置，其特征在于，所述处理单元还用于根据信道资源信息、通信代价信息和第一目标梯度信息，得到所述第一量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求36至39中任一项所述的装置，其特征在于，所述处理单元具体用于：

在根据所述第一量化噪声信息、通信代价信息、所述信道资源信息和所述第一目标梯度信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；以及，

根据所述第一量化噪声信息和所述通信资源，确定所述第一门限值。
根据权利要求39或40所述的装置，其特征在于，所述收发单元还用于接收来自所述中心节点的第二信息，所述第二信息用于指示所述通信代价信息。
根据权利要求32至41中任一项所述的装置，其特征在于，所述处理单元还用于根据所述特征间约束变量和模型训练数据，训练所述第一特征模型，得到第二梯度信息；以及，

所述收发单元还用于向所述中心节点发送所述第二梯度信息。
根据权利要求42所述的装置，其特征在于，所述收发单元具体用于向所述中心节点发送量化后的第二目标梯度信息，所述第二目标梯度信息包括所述第二梯度信息，或者所述第二目标梯度信息包括所述第二梯度信息和第四残差梯度信息，所述第四残差梯度信息用于表征在得到所述第二梯度信息之前未发送给所述中心节点的梯度信息的残差量。
根据权利要求43所述的装置，其特征在于，所述处理单元还用于基于所述第二目标梯度信息和量化后的所述第二目标梯度信息，得到第五残差梯度信息，所述第五残差梯度信息用于表征所述第二目标梯度信息中未发送给所述中心节点的残差量。
根据权利要求43或44所述的装置，其特征在于，所述处理单元还用于根据第二量化噪声信息和信道资源信息，确定第二门限值，其中，所述第二量化噪声信息用于表征对所述第二目标梯度信息的量化编解码的损失量；

所述处理单元还用于确定所述第二目标梯度信息的度量值大于所述第二门限值；

所述收发单元具体用于在所述第二目标梯度信息的度量值大于所述第二门限值的情况下，向所述中心节点发送量化后的所述第二目标梯度信息。
根据权利要求45所述的装置，其特征在于，所述处理单元还用于在所述第二目标梯度信息的度量值小于或等于所述第二门限值的情况下，确定不向所述中心节点发送量化后的所述第二目标梯度信息。
根据权利要求46所述的装置，其特征在于，所述处理单元还用于在所述第二目标梯度信息的度量值小于所述第二门限值的情况下，确定第六残差梯度信息，所述第六残差梯度信息为所述第二目标梯度信息。
根据权利要求45至47中任一项所述的装置，其特征在于，所述处理单元还用于在根据信道资源信息、通信代价信息和第二目标梯度信息，得到所述第二量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求45至48中任一项所述的装置，其特征在于，所述处理单元具体用于：

根据所述第二量化噪声信息、通信代价信息、所述信道资源信息和所述第二目标梯度信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；

根据所述第二量化噪声信息和所述通信资源，确定所述第二门限值。
根据权利要求32至49中任一项所述的装置，其特征在于，

所述收发单元还用于接收来自所述中心节点的第三信息，所述第三信息用于指示所述第一特征模型的更新后的参数；

所述处理单元还用于根据所述第三信息，更新所述第一特征模型的参数。
一种智能模型的训练装置，其特征在于，所述训练装置配置于中心节点，包括：

处理单元，用于确定特征间约束变量，所述特征间约束变量用于表征不同的所述特征之间的约束关系；

收发单元，用于向多个参与节点组中的参与节点发送第一信息，所述第一信息包括所述特征间约束变量。
根据权利要求51所述的装置，其特征在于，

所述收发单元还用于接收来自第一参与节点组中的参与节点的至少一个第二目标梯度信息，所述多个参与节点组包括所述第一参与节点组；

所述处理单元还用于根据所述至少一个第二目标梯度信息，确定第一特征模型的更新后的模型参数，所述第一特征模型为所述第一参与节点组中的参与节点训练的特征模型；

所述收发单元还用于向所述第一参与节点组发送所述更新后的模型参数。
根据权利要求51或52所述的装置，其特征在于，所述收发单元还用于向所述多个参与节点组中的参与节点发送第一标识集合，所述第一标识集合包括中心节点选择的特征间约束变量的样本数据的标识。
根据权利要求51至53中任一项所述的装置，其特征在于，所述收发单元还用于接收来自多个所述参与节点组中的参与节点的多个第一目标梯度信息，所述第一目标梯度信息为特征间约束变量对应的梯度信息；

所述处理单元具体用于根据所述多个第一目标梯度信息，确定所述特征间约束变量。
根据权利要求51至54中任一项所述的装置，其特征在于，所述收发单元还用于向所述多个参与节点组中的参与节点发送第二信息，所述第二信息用于指示通信代价信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
一种智能模型的训练装置，其特征在于，包括：

处理单元，用于根据量化噪声信息和信道资源信息，确定门限值，其中，所述量化噪声信息用于表征对目标信息的量化编解码的损失量；

收发单元，用于在所述目标信息的度量值大于所述门限值的情况下，发送量化后的所述目标信息；

所述收发单元还用于在所述目标信息的度量值小于或等于所述门限值的情况下，不发送量化后的所述目标信息。
根据权利要求56所述的装置，其特征在于，所述目标信息包括第N次模型训练得到的梯度信息和第一目标残差信息，所述第一目标残差信息为得到所述梯度信息之前未发送的梯度信息的残差量。
根据权利要求56或57所述的装置，其特征在于，所述处理单元还用于在所述目标信息的度量值大于所述门限值的情况下，基于所述目标信息和量化后的所述目标信息，得到第二目标残差信息，所述第二目标残差信息为所述目标信息中未发送的残差量。
根据权利要求56至58中任一项所述的装置，其特征在于，所述处理单元还用于在所述目标信息的度量值小于或等于所述门限值的情况下，确定第三目标残差信息，所述第三目标残差信息为所述目标信息。
根据权利要求56至59中任一项所述的装置，其特征在于，所述处理单元还用于根据信道资源信息、通信代价信息和所述目标信息，得到所述量化噪声信息，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽。
根据权利要求56至60中任一项所述的装置，其特征在于，所述处理单元具体用于：

根据所述量化噪声信息、通信代价信息、所述信道资源信息和所述目标信息，确定传输带宽和/或传输功率，所述通信代价信息用于指示通信资源的通信代价权重，所述通信资源包括传输功率和/或传输带宽；

根据所述量化噪声信息和所述通信资源，确定所述门限值。
根据权利要求60或61所述的装置，其特征在于，所述收发单元还用于接收第二信息，所述第二信息用于指示所述通信代价信息。
一种通信装置，其特征在于，包括至少一个处理器，与存储器耦合；

所述存储器用于存储程序或指令；

所述至少一个处理器用于执行所述程序或指令，以使所述装置实现如权利要求1至19中任一项所述的方法，或者实现如权利要求20至24中任一项所述的方法，或者实现如权利要求25至31中任一项所述的方法。
一种芯片，其特征在于，包括至少一个逻辑电路和输入输出接口；

所述逻辑电路用于控制所述输入输出接口并执行如权利要求1至19中任一项所述的方法，或者实现如权利要求20至24中任一项所述的方法，或者实现如权利要求25至31中任一项所述的方法。
一种计算机可读存储介质，其特征在于，存储有指令，当所述指令在计算机上运行时，使得所述计算机执行如权利要求1至19中任一项所述的方法，或者实现如权利要求20至24中任一项所述的方法，或者实现如权利要求25至31中任一项所述的方法。
一种计算机程序产品，其特征在于，包括指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至19中任一项所述的方法，或者实现如权利要求20至24中任一项所述的方法，或者实现如权利要求25至31中任一项所述的方法。
一种通信系统，包括如权利要求32至50中任一项所述的训练装置，和/或如权利要求56至62中任一项所述的训练装置；以及还包括如权利要求51至55中任一项所述的训练装置。