WO2023088465A1

WO2023088465A1 - 一种模型训练方法及相关装置

Info

Publication number: WO2023088465A1
Application number: PCT/CN2022/133214
Authority: WO
Inventors: 乔云飞; 李榕; 王坚
Original assignee: 华为技术有限公司
Priority date: 2021-11-22
Filing date: 2022-11-21
Publication date: 2023-05-25
Also published as: CN116151348A

Abstract

本申请提供了一种模型训练方法及相关装置。该方法中，第二通信装置接收第一通信装置的第一神经网络参数，并在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息。第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值，表明第二神经网络参数对第一神经网络模型收敛的贡献较大。从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小，确定是否参与第一神经网络模型的训练，可减少第二通信装置的信令开销。

Description

一种模型训练方法及相关装置

本申请要求于2021年11月22日提交中国国家知识产权局、申请号为202111386640.7、申请名称为“一种模型训练方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及神经网络领域，尤其涉及一种模型训练方法及相关装置。

背景技术

3GPP在第五代移动通信(5th generation mobile communication，5G)网络中通过新增网络数据分析功能(network data analysis function，NWDAF)，引入了人工智能(artificial intelligence，AI)能力。NWDAF负责AI模型的训练。NWDAF训练的AI模型可应用于移动性管理、会话管理和网络自动化等网络自身领域。

目前常采用联邦学习(federated learning，FL)进行AI模型的训练。FL中，各分布节点参与中心节点的每轮训练时，需将上一轮更新的本地神经网络模型发送至中心节点。然后，中心节点将各分布节点的神经网络模型进行融合，获得全局神经网络模型。若全局神经网络模型不收敛，则中心节点将全局神经网络模型广播给各分布节点。各分布节点根据全局神经网络模型更新本地神经网络模型，再采用更新后的本地神经网络模型参与下一轮中心节点的神经网络模型的训练。

然而，经过多轮训练后，某些分布节点的本地神经网络模型对全局神经网络模型收敛的贡献逐渐降低，此时若这些分布节点的神经网络模型仍继续参与中心节点的神经网络模型的训练，将会造成信令开销的浪费。

发明内容

本申请实施例提供了一种模型训练方法及相关装置，可减少信令开销。

第一方面，本申请实施例提供一种模型训练方法。该方法中，第二通信装置接收第一通信装置的第一神经网络参数，并在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息。该第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。

本申请实施例中，第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值，表明第二神经网络参数对第一神经网络模型收敛的贡献较大。从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小，确定是否参与第一神经网络模型的训练，可避免第二通信装置在第二神经网络参数对第一神经网络模型收敛贡献较小时，仍参与第一神经网络模型的训练，进而可减少第二通信装置的信令开销。

一种可选的实施方式中，第一神经网络参数是第一神经网络的模型参数或第一神经网络的梯度；第二神经网络参数是第二神经网络的模型参数或第二神经网络的梯度。

也就是说，第一神经网络参数是第一神经网络的模型参数，第二神经网络参数是第二神经网络的模型参数。可选的，第一神经网络参数是第一通信装置的神经网络的梯度，第二神经网络参数是第二通信装置的神经网络的梯度。从而第二通信装置根据接收的第一神经网络参数所属的类型，确定第一神经网络参数与第二神经网络参数之间的相关系数。

一种可选的实施方式中，第一神经网络参数是在协作发现资源上接收的，该协作发现资源是在侧行链路配置信息中配置的。也就是说，第二通信装置采用侧行链路配置信息中的协作发现资源接收来自第一通信装置的第一神经网络参数。

一种可选的实施方式中，在上述相关系数小于第一阈值时，第二通信装置还可向第一通信装置发送第二神经网络参数，以使得第一通信装置根据该第二神经网络参数更新第一神经网络模型，从而第一通信装置是采用对第一神经网络模型收敛贡献度较高的第二神经网络参数更新第一神经网络模型的，有利于加快第一神经网络模型的收敛。

一种可选的实施方式中，第二通信装置还可接收来自第一通信装置的控制信号，该控制信号用于指示时频资源，且指示的时频资源用于第二通信装置发送第二神经网络参数。可见，第二通信装置通过接收来自第一通信装置的控制信号，获知到向第一通信装置发送第二神经网络参数的时频资源，进而第二通信装置可在该时频资源上发送第二神经网络参数。

一种可选的实施方式中，接收该控制信号的资源是协作控制资源，协作控制资源是在上述侧行链路配置信息中配置的。也就是说，第二通信装置采用侧行链路配置信息中的协作控制资源接收上述控制信号。

一种可选的实施方式中，第二通信装置还可在协作同步资源上接收同步信号，并根据该同步信号，与第一通信装置进行同步。从而第二通信装置与第一通信装置同步后，可与第一通信装置通信。其中，协作同步资源可是在上述侧行链路配置信息中配置的。

一种可选的实施方式中，上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源可是预先配置的，或是动态指示的，或是非授权频谱资源。

一种可选的实施方式中，第一神经网络参数是第一神经网络的模型参数，第二神经网络参数是第二神经网络的模型参数时，上述第一神经网络参数与第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的。

其中，第一参数是第二通信装置对第一神经网络模型输入训练数据时，第一神经网络模型输出的参数；所述第一神经网络模型是根据所述第一神经网络的模型参数确定的；第二参数是第二通信装置对第二通信装置的第二神经网络模型输入该训练数据时，第二神经网络模型输出的参数。也就是说，第一参数和第二参数是第二通信装置分别对第一神经网络模型和第二神经网络模型输入相同的训练数据时，第一神经网络模型和第二神经网络模型分别输出的参数。

另一种可选的实施方式中，第一神经网络参数是第一神经网络的梯度，第二神经网络参数是第二神经网络的梯度时，第一神经网络参数与第二神经网络参数之间的相关系数是根据第一神经网络参数的概率密度分布和第二神经网络参数的概率密度分布确定的。

可见，第二通信装置可根据接收的第一神经网络参数所属的类型，灵活采用相应的方式确定第一神经网络参数与第二神经网络参数之间的相关系数。

第二方面，本申请还提供了一种模型训练方法。该方面的模型训练方法与第一方面所述的模型训练方法相对应，该方面的模型训练方法是从第一通信装置侧进行阐述的。该方法中，第一通信装置发送该第一通信装置的第一神经网络参数。第一通信装置接收来自第二通信装置的第一指示信息，第一指示信息是第二通信装置在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时发送的，第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。

可见，本申请实施例中，第一通信装置接收的第一指示信息是第二通信装置在第一神经网络参数与第二神经网络参数的相关系数小于第一阈值时发送的，从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小，确定是否参与第一神经网络模型的训练，进而使得第一通信装置后续不是根据所有第二通信装置的第二神经网络参数更新第一神经网络模型，而是根据对第一神经网络模型收敛贡献较大的第二神经网络参数更新第一神经网络模型，可减少第一通信装置的信令开销。

一种可选的实施方式中，第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。

第一神经网络参数是第一神经网络的模型参数，第二神经网络参数是第二神经网络的模型参数。可选的，第一神经网络参数是第一通信装置的神经网络的梯度，第二神经网络参数是第二通信装置的神经网络的梯度。

一种可选的实施方式中，第一神经网络参数是在协作发现资源上发送的，该协作发现资源是在侧行链路配置信息中配置的。也就是说，第一通信装置采用侧行链路配置信息中的协作发现资源向第一通信装置发送第一神经网络参数。

一种可选的实施方式中，第一通信装置还可接收来自第二通信装置的第二神经网络参数，并根据第二神经网络参数，更新第一神经网络模型。可见，第一通信装置是根据反馈了第一指示信息的第二通信装置的第二神经网络参数，更新第一神经网络模型的，从而可节省第一通信装置的信令开销。

一种可选的实施方式中，第一通信装置还可向第二通信装置发送控制信号，该控制信号用于指示时频资源，指示的时频资源用于第二通信装置发送第二神经网络参数。可见，第一通信装置通过控制信号，向第二通信装置指示了发送第二神经网络参数的时频资源，有利于第二通信装置采用该时频资源发送第二神经网络参数。

一种可选的实施方式中，发送控制信号的资源是协作控制资源，协作控制资源是在上述侧行链路配置信息中配置的。也就是说，第一通信装置采用侧行链路配置信息中的协作控制资源发送上述控制信号。

一种可选的实施方式中，第一通信装置还可在协作同步资源上发送同步信号，以使得第二通信装置根据该同步信号与第一通信装置进行同步。另外，该协作同步资源可是在上述侧行链路配置信息中配置的。

第三方面，本申请还提供了一种模型训练方法。该方法中，第一通信装置发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。第一通信装置接收来自第二通信装置的第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

可见，本申请实施例中，第一通信装置将待训练的神经网络模型拆分为了多个训练任务，并通过协作请求信息将多个训练任务广播给周边的各第二通信装置，以请求各第二通信装置参与多个训练任务的训练。第一通信装置通过接收第二指示信息获知第二通信装置自身可参与的训练任务。该方式中，第一通信装置获知到周边的第二通信装置协助参与待训练的神经网络模型的训练，从而可降低对第一通信装置能力的需求。

一种可选的实施方式中，上述协作请求信息在协作发现资源上发送的，协作发现资源是在侧行链路配置信息中配置的。可见，第一通信装置采用侧行链路配置信息中的协作发现资源发送协作请求信息。

一种可选的实施方式中，第二通信装置发送的第二指示信息指示的第一训练任务包括多个训练任务，此时第一通信装置还可发送第三指示信息，第三指示信息用于指示第一训练任务中的其中一个训练任务。

可理解的，第一通信装置是根据接收的各第二指示信息指示的训练任务，确定的该第三指示信息，以保证每个参与训练的第二通信装置训练的训练任务不重复。

另一种可选的实施方式中，多个第二通信装置发送的第二指示信息指示的第一训练任务是多个训练任务中的相同训练任务，此时第一通信装置也可通过第三指示信息，向其中的一个第二通信装置指示参与训练的训练任务。从而接收到第三指示信息的第二通信装置获知到需进行训练的训练任务，而未接收到第三指示信息的第二通信装置不参与训练。

一种可选的实施方式中，第一通信装置还可向第二通信装置发送第四指示信息，第四指示信息用于指示第二通信装置需接收的第一输出、第一输出对应的时频资源位置，和/或需发送的第二输出、第二输出对应的时频资源位置。第一输出是第一通信装置训练的神经网络模型的输出，或者是除第二通信装置外的其他第二通信装置训练的神经网络模型的输出；第二输出是第二通信装置训练的神经网络模型的输出。

可见，第一通信装置通过第四指示信息告知了参与训练的第二通信装置需接收的参数、需接收的参数对应的时频资源位置，和/或，需发送的参数、需发送的参数对应的时频资源位置，从而有利于参与训练的任一第二通信装置在进行训练任务的训练过程中，进行相应输出的接收和/或发送，以保障其他各第二通信装置的协作训练。

一种可选的实施方式中，发送第四指示信息的资源是协作控制资源，协作控制资源是在侧行链路配置信息中配置的。可见，第一通信装置是采用侧行链路配置信息中的协作控制资源发送第四指示信息的。

一种可选的实施方式中，第一通信装置还可在协作同步资源上发送同步信号，以使得第二通信装置根据该同步信号与第一通信装置进行同步。另外，该协作同步资源是在侧行链路配置信息中配置的。

第四方面，本申请还提供了一种模型训练方法，该方面的模型训练方法与第三方面所述的模型训练方法相对应，该方面的模型训练方法是从第二通信装置侧进行阐述的。该方法中，第二通信装置接收协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。第二通信装置确定参与第一训练任务的训练时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

可见，本申请实施例中，第二通信装置在确定参与第一通信装置请求的多个训练任务中的第一训练任务的训练时，发送指示参与该第一训练任务的指示信息，以告知第一通信装置自身可协助第一通信装置参与第一训练任务的训练，从而有利于降低对第一通信装置能力的需求。

一种可选的实施方式中，协作请求信息在协作发现资源上接收的，协作发现资源是在侧行链路配置信息中配置的。可见，第二通信装置采用侧行链路配置信息中的协作发现资源接收协作请求信息。

一种可选的实施方式中，第二通信装置还可接收第三指示信息，第三指示信息用于指示第一训练任务中的其中一个训练任务，从而第二通信装置获知参与训练的训练任务。

一种可选的实施方式中，第二通信装置还可接收第四指示信息，第四指示信息用于指示第二通信装置接收的第一输出、第一输出对应的时频资源位置，和/或发送的第二输出、第二输出对应的时频资源位置。第一输出是第一通信装置训练的神经网络模型的输出，或者是除第二通信装置外的其他第二通信装置训练的神经网络模型的输出；第二输出是第二通信装置训练的神经网络模型的输出。从而，第二通信装置在进行训练任务的训练过程中，进行相应输出的接收和/或发送，以保障其他各第二通信装置的协作训练。

一种可选的实施方式中，接收第四指示信息的资源是协作控制资源，协作控制资源是在侧行链路配置信息中配置的。可见，第二通信装置是采用侧行链路配置信息中的协作控制资源接收第四指示信息的。

一种可选的实施方式中，第二通信装置还可在协作同步资源上接收同步信号，并根据同步信号，与第一通信装置进行同步。从而第二通信装置与第一通信装置同步后，可与第一通信装置通信。另外，协作同步资源是在上述侧行链路配置信息中配置的。

第五方面，本申请还提供一种通信装置。该通信装置具有实现上述第一方面所述的第二通信装置的部分或全部功能，或者具有实现上述第二方面所述的第一通信装置的部分或全部功能，或者具有实现上述第三方面所述的第一通信装置的部分或全部功能，或者具有实现上述第四方面所述的第二通信装置的部分或全部功能。比如，该通信装置的功能可具备本申请中第一方面所述的第二通信装置的部分或全部实施例中的功能，也可以具备单独实施本申请中的任一个实施例的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的单元或模块。

在一种可能的设计中，该通信装置的结构中可包括处理单元和通信单元，所述处理单元被配置为支持通信装置执行上述方法中相应的功能。所述通信单元用于支持该通信装置与其他通信装置之间的通信。所述通信装置还可以包括存储单元，所述存储单元用于与处理单元和通信单元耦合，其保存通信装置必要的程序指令和数据。

一种实施方式中，所述通信装置包括：处理单元和通信单元，处理单元用于控制通信单元进行数据/信令收发；通信单元，用于接收第一通信装置的第一神经网络参数；通信单元，还用于在第一神经网络参数与通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息；第一指示信息用于指示该通信装置参与第一通信装置的第一神经网络模型的训练。

另外，该方面中，通信装置其他可选的实施方式可参见上述第一方面的相关内容，此处不再详述。

另一种实施方式中，所述通信装置包括：处理单元和通信单元，处理单元用于控制通信单元进行数据/信令收发；该通信单元，用于发送该通信装置的第一神经网络参数；该通信单元，还用于接收来自第二通信装置的第一指示信息；第一指示信息是第二通信装置在第一神经网络参数与第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的；第一指示信息用于指示第二通信装置参与该通信装置的第一神经网络模型的训练。

另外，该方面中，通信装置其他可选的实施方式可参见上述第二方面的相关内容，此处不再详述。

又一种实施方式中，所述通信装置包括：处理单元和通信单元，处理单元用于控制通信单元进行数据/信令收发；该通信单元，用于发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；该通信单元，还用于接收来自第二通信装置的第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

另外，该方面中，通信装置其他可选的实施方式可参见上述第三方面的相关内容，此处不再详述。

又一种实施方式中，所述通信装置包括：处理单元和通信单元，处理单元用于控制通信单元进行数据/信令收发；该通信单元，用于接收协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；该通信单元，还用于确定参与第一训练任务的训练时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

另外，该方面中，通信装置其他可选的实施方式可参见上述第四方面的相关内容，此处不再详述。

作为示例，通信单元可以为收发器或通信接口，存储单元可以为存储器，处理单元可以为处理器。

一种实施方式中，所述通信装置包括：处理器和收发器，处理器用于控制收发器进行数据/信令收发；收发器，用于接收第一通信装置的第一神经网络参数；收发器，还用于在第一神经网络参数与通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息；第一指示信息用于指示该通信装置参与第一通信装置的第一神经网络模型的训练。

另外，该方面中，上行通信装置其他可选的实施方式可参见上述第一方面的相关内容，此处不再详述。

另一种实施方式中，所述通信装置包括：处理器和收发器，处理器用于控制收发器进行数据/信令收发；该收发器，用于发送该通信装置的第一神经网络参数；收发器，还用于接收来自第二通信装置的第一指示信息；第一指示信息是第二通信装置在第一神经网络参数与第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的；第一指示信息用于指示第二通信装置参与该通信装置的第一神经网络模型的训练。

又一种实施方式中，所述通信装置包括：处理器和收发器，处理器用于控制收发器进行数据/信令收发；收发器，用于发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；收发器，还用于接收来自第二通信装置的第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

又一种实施方式中，所述通信装置包括：处理器和收发器，处理器用于控制收发器进行数据/信令收发；该收发器，用于接收协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；收发器，还用于确定参与第一训练任务的训练时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

另一种实施方式中，该通信装置为芯片或芯片系统。所述处理单元也可以体现为处理电路或逻辑电路；所述收发单元可以是该芯片或芯片系统上的输入/输出接口、接口电路、输出电路、输入电路、管脚或相关电路等。

在实现过程中，处理器可用于进行，例如但不限于，基带相关处理，收发器可用于进行，例如但不限于，射频收发。上述器件可以分别设置在彼此独立的芯片上，也可以至少部分的或者全部的设置在同一块芯片上。例如，处理器可以进一步划分为模拟基带处理器和数字基带处理器。其中，模拟基带处理器可以与收发器集成在同一块芯片上，数字基带处理器可以设置在独立的芯片上。随着集成电路技术的不断发展，可以在同一块芯片上集成的器件越来越多。例如，数字基带处理器可以与多种应用处理器(例如但不限于图形处理器，多媒体处理器等)集成在同一块芯片之上。这样的芯片可以称为系统芯片(System on a Chip,SoC)。将各个器件独立设置在不同的芯片上，还是整合设置在一个或者多个芯片上，往往取决于产品设计的需要。本申请实施例对上述器件的实现形式不做限定。

第六方面，本申请还提供一种处理器，用于执行上述各种方法。在执行这些方法的过程中，上述方法中有关发送上述信息和接收上述信息的过程，可以理解为由处理器输出上述信息的过程，以及处理器接收输入的上述信息的过程。在输出上述信息时，处理器将该上述信息输出给收发器，以便由收发器进行发射。该上述信息在由处理器输出之后，还可能需要进行其他的处理，然后才到达收发器。类似的，处理器接收输入的上述信息时，收发器接收该上述信息，并将其输入处理器。更进一步的，在收发器收到该上述信息之后，该上述信息可能需要进行其他的处理，然后才输入处理器。

基于上述原理，举例来说，前述方法中提及的接收第一通信装置的第一神经网络参数可以理解为处理器输入第一通信装置的第一神经网络参数。

对于处理器所涉及的发送和接收等操作，如果没有特殊说明，或者，如果未与其在相关描述中的实际作用或者内在逻辑相抵触，则均可以更加一般性的理解为处理器输出和接收、输入等操作，而不是直接由射频电路和天线所进行的发送和接收操作。

在实现过程中，上述处理器可以是专门用于执行这些方法的处理器，也可以是执行存储器中的计算机指令来执行这些方法的处理器，例如通用处理器。上述存储器可以为非瞬时性(non-transitory)存储器，例如只读存储器(Read Only Memory，ROM)，其可以与处理器集成在同一块芯片上，也可以分别设置在不同的芯片上，本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。

第七方面，本申请还提供了一种通信系统，该系统包括上述方面的至少一个第一通信装置、至少两个第二通信装置。在另一种可能的设计中，该系统还可以包括本申请提供的方案中与第一通信装置、第二通信装置进行交互的其他设备。

第八方面，本申请提供了一种计算机可读存储介质，用于储存指令，当所述指令被计算机运行时，实现上述第一方面至第四方面任一项所述的方法。

第九方面，本申请还提供了一种包括指令的计算机程序产品，当其在计算机上运行时，实现上述第一方面至第四方面任一项所述的方法。

第十方面，本申请提供了一种芯片系统，该芯片系统包括处理器和接口，所述接口用于获取程序或指令，所述处理器用于调用所述程序或指令以实现或者支持第二通信装置实现第一方面所涉及的功能，或者用于调用所述程序或指令以实现或者支持第一通信装置备实现第二方面所涉及的功能，用于调用所述程序或指令以实现或者支持第一通信装置实现第三方面所涉及的功能，用于调用所述程序或指令以实现或者支持第二通信装置实现第四方面所涉及的功能。例如，确定或处理上述方法中所涉及的数据和信息中的至少一种。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存终端必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

附图说明

图1是本申请实施例提供的一种通信系统的结构示意图；

图2是本申请实施例提供的另一种通信系统的结构示意图；

图3是本申请实施例提供的一种联邦学习的系统示意图；

图4是本申请实施例提供的一种分割学习的示意图；

图5是本申请实施例提供的一种模型训练方法的交互流程示意图；

图6是本申请实施例提供的另一种模型训练方法的交互流程示意图；

图7是本申请实施例提供的又一种模型训练方法的交互流程示意图；

图8是本申请实施例提供的一种待训练的神经网络模型拆分示意图；

图9是本申请实施例提供的又一种模型训练方法的交互流程示意图；

图10是本申请实施例提供的一种通信装置的结构示意图；

图11是本申请实施例提供的另一种通信装置的结构示意图；

图12是本申请实施例提供的一种芯片的结构示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整的描述。

为了更好的理解本申请实施例公开的模型训练方法，对本申请实施例适用的通信系统进行描述。

本申请实施例可应用于第五代移动通信(5th generation mobile communication，5G)系统、卫星通信及短距等无线通信系统中，系统架构如图1所示。无线通信系统可以包括一个或多个网络设备以及一个或多个终端设备。无线通信系统也可以进行点对点通信，如多个终端设备之间互相通信。

可理解的，本申请实施例提及的无线通信系统包括但不限于：窄带物联网系统(narrow band-internet of things，NB-IoT)、长期演进系统(long term evolution，LTE)，5G移动通信系统的三大应用场景：增强移动宽带(enhanced mobile broadband，eMBB)、超可靠低时延通信(ultra reliable low latency communication，URLLC)和海量机器类通信(massive machine type of communication，mMTC)，无线保真(wireless fidelity，WiFi)系统，或者5G之后的移动通信系统等。

请参见图2，图2为本申请实施例提供的另一种通信系统的结构示意图。该通信系统可包括但不限于一个第一通信装置201、两个第二通信装置202。图2所示的设备数量和形态用于举例并不构成对本申请实施例的限定，实际应用中可以包括两个或两个以上的第二通信装置202，三个以上的第二通信装置202。其中，第一通信装置可以为网络设备，也可为终端设备，第二通信装置为终端设备。本申请实施例中以第一通信装置和第二通信装置均为终端设备为例进行阐述。

本申请实施例中，第二通信装置为第一通信装置的周边终端设备，即各第二通信装置和第一通信装置位于同一小区内。第一通信装置和第二通信装置中均设置有神经网络模型，第二通信装置可协作第一通信装置，参与第一通信装置的第一神经网络模型的训练。

本申请实施例中，网络设备是具有无线收发功能的设备，用于与终端设备进行通信，可以是LTE中的演进型基站(evolved Node B，eNB或eNodeB)；或者5G网络中的基站或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的基站，宽带网络业务网关(broadband network gateway，BNG)，汇聚交换机或者非第三代合作伙伴项目(3rd generation partnership project，3GPP)接入设备等。可选的，本申请实施例中的网络设备可以包括各种形式的基站，例如：宏基站、微基站(也称为小站)、中继站、接入点、未来实现基站功能的设备、WiFi系统中的接入节点，传输接收点(transmitting and receiving point，TRP)、发射点(transmitting point，TP)、移动交换中心以及设备到设备(Device-to-Device，D2D)、车辆外联(vehicle-to-everything，V2X)、机器到机器(machine-to-machine，M2M)通信中承担基站功能的设备等，本申请实施例对此不作具体限定。

网络设备可以和核心网设备进行通信交互，向终端设备提供通信服务。核心网设备例如为5G网络核心网(core network，CN)中的设备。核心网作为承载网络提供到数据网络的接口，为终端提供通信连接、认证、管理、策略控制以及对数据业务完成承载等。

本申请实施例所涉及到的终端设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备。终端设备也可以指用户设备(user equipment，UE)、接入终端、用户单元(subscriber unit)、用户代理、蜂窝电话(cellular phone)、智能手机(smart phone)、无线数据卡、个人数字助理(personal digital assistant，PDA)电脑、平板型电脑、无线调制解调器(modem)、手持设备(handset)、膝上型电脑(laptop computer)、机器类型通信(machine type communication，MTC)终端、高空飞机上搭载的通信设备、可穿戴设备、无人机、机器人、设备到设备通信(device-to-device，D2D)中的终端、车到一切(vehicle to everything，V2X)中的终端、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端或者未来通信网络中的终端设备等，本申请不作限制。

为了便于理解本申请公开的实施例，作以下两点说明。

(1)本申请公开的实施例中场景以无线通信网络中5G新空口(new radio，NR)网络的场景为例进行说明，应当指出的是，本申请公开的实施例中的方案还可以应用于其他无线通信网络中，相应的名称也可以用其他无线通信网络中的对应功能的名称进行替代。

(2)本申请公开的实施例将围绕包括多个设备、组件、模块等的系统来呈现本申请的各个方面、实施例或特征。应当理解和明白的是，各个系统可以包括另外的设备、组件、模块等，并且/或者可以并不包括结合附图讨论的所有设备、组件、模块等。此外，还可以使用这些方案的组合。

为了更好的理解本申请实施例公开的模型训练方法，对本申请实施例涉及的相关概念进行简单的介绍。

1.联邦学习FL。

联邦学习是在充分保障用户数据隐私和安全的前提下，通过促使各个周边设备和中心端服务器协同合作来高效地完成模型的一种学习方式。FL算法如下：

(1)在中心端服务器的第i∈[1,T]轮训练中，终端设备m采用局部数据集训练本地的神经网络模型，并将本地的梯度

通过空口传输至中心端服务器。其中，γ表示回传的梯度参数的数量，T为阈值次数，且T大于或等于2，M为终端设备的总个数，

代表第i轮训练中，终端设备m的第γ个梯度参数对应的梯度；

(2)中心端服务器汇总收集来自全部(部分)终端设备的梯度，并对其进行加权求均得到新的全局梯度：

(3)中心端根据新的全局梯度更新本地神经网络模型，获得更新后的神经网络模型，若更新后的神经网络模型不收敛，且训练次数未达到阈值，则将新的全局梯度广播给各终端设备。终端设备接收到该新的全局梯度后，根据该新的全局梯度更新自身本地神经网络模型，直至中心端的神经网络模型收敛或训练轮数达到阈值次数。

示例性的，联邦学习的系统示意图如图3所示。图3中，中心端为网络设备，周边设备为各种终端设备。联邦学习中，各终端设备将本地计算的梯度通过无线信道上传至网络设备。网络设备进行多个本地梯度的汇总，即将接收的多个梯度进行加权求均处理，获得全局梯度，并根据该全局梯度更新本地的神经网络模型。若更新后的神经网络模型仍不收敛，且训练次数未达到阈值次数，则将该全局梯度广播给各终端设备。任一终端设备接收到该全局梯度后，采用该全局梯度更新本终端设备的神经网络模型，并将更新的神经网络模型的梯度上传至网络设备，进行下一轮神经网络模型的训练，直至网络设备的神经网络模型收敛，或训练次数达到阈值次数。

2.分割学习(split learning)。

分割学习如图4所示。在分割学习中，完整的神经网络模型被分割为两部分(即两个子网络)，神经网络的一部分子网络部署在分布式节点上，另一部分子网络部署在中心节点上。完整的神经网络被分割的地方被称为“分割层”。神经网络模型的前向推理过程中，分布式节点将本地数据输入本地的子网络，推理到分割层，将分割层的结果F1通过通信链路发送到中心节点，中心节点将收到的F1输入自身部署的另一个子网络，并继续进行前向推理，得到最终的推理结果。神经网络模型训练的梯度反向传递中，梯度通过中心节点的子网络反向传递到分割层，得到反向传递结果G1，然后中心节点将G1发送给分布式节点，使得G1继续在分布式节点的子网络上进行梯度反向传递。

分割学习的前向推理和梯度反向传递过程中，只涉及一个分布式节点和一个中心节点。训练好的分布式节点上的子网络可以保存在分布式节点本地或特定的模型存储服务器上。当有新的分布式节点加入学习系统时，该新的分布式节点可以先下载已训练好的分布式节点子网络，再使用本地数据进行进一步的训练。

从上述的联邦学习可知，目前的分布式学习中，中心节点汇总各分布节点上报的本地模型，并将各分布节点的神经网络模型进行融合处理，再下发给各分布节点，进行下一轮训练，直至中心节点的神经网络模型收敛。然而在经过若干轮的训练后，部分分布节点对中心节点的神经网络模型的收敛的贡献会逐渐降低，此时若继续参与中心节点的神经网络模型的训练，带来的增益可能不足以弥补中心节点的信令开销。

本申请实施例提供了一种模型训练方法100。模型训练方法100中，第一通信装置发送该第一通信装置的第一神经网络参数。第二通信装置接收第一通信装置的第一神经网络参数，且第二通信装置在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息，该第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。从而第二通信装置接收该第一指示信息。第二通信装置在第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置反馈参与第一神经网络模型的训练，可避免第二通信装置在第一神经网络参数与第二神经网络参数之间的相关系数等于或大于第一阈值时，仍参与第一神经网络模型的训练，从而可减少第二通信装置的信令开销。

本申请实施例还提供了一种模型训练方法200。模型训练方法200中，第一通信装置发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。第二通信装置接收协作请求信息。第二通信装置确定参与第一训练任务时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。第一通信装置接收来自第二通信装置的第二指示信息。可见，第一通信装置将待训练的神经网络模型拆分为了多个训练任务，并通过协作请求信息将多个训练任务广播给周边的各第二通信装置，周边的第二通信装置反馈第二指示信息，以通过第二指示信息告知第一通信装置自身可参与训练的训练任务。也就是说，周边的各第二通信装置协助参与第一通信装置的待训练的神经网络模型的训练，从而可降低对第一通信装置能力的需求。

本申请实施例提出一种模型训练方法100，图5是该模型训练方法100的交互流程示意图。该模型训练方法100从第一通信装置与第二通信装置之间交互的角度进行阐述。该模型训练方法100包括但不限于以下步骤：

S101.第一通信装置发送第一通信装置的第一神经网络参数。

可理解的，第一神经网络参数是神经网络模型，或者是神经网络的梯度，或者还可以是训练神经网络模型的训练数据。也就是说，第一神经网络参数是第一通信装置的第一神经网络模型，或者是第一神经网络的梯度，或者是训练第一神经网络模型的训练数据。其中，神经网络模型包括神经网络中包括的神经元，以及每层神经元之间的权重。

一种可选的实施方式中，第一通信装置基于自身的本地数据集，训练第一神经网络模型。第一通信装置在经过阈值轮数的训练后，第一神经网络模型仍未满足预设收敛条件，则可触发协作机制。第一通信装置触发协作机制可以包括：第一通信装置向网络设备发送请求消息，以请求网络设备给该第一通信装置配置用于进行协作训练的相关资源。可选地，该请求消息可以是按需系统消息块(on demand system information block，on demand SIB)。网络设备接收到来自第一通信装置的请求消息后，为第一通信装置和第一通信装置的周边设备(各第二通信装置)发送侧行链路配置信息。

其中，侧行链路配置信息可以是SIB_AI_sidelink，且侧行链路配置信息用于配置协作同步资源、协作发现资源或协作控制资源。其中，协作同步资源可以是人工智能协作同步(AI-cooperation-sync)资源，该协作同步资源用于各第二通信装置与第一通信装置进行同步；协作发现资源可以是人工智能协作发现(AI-cooperation-discover)资源，该协作发现资源用于第一通信装置发送第一神经网络参数，还用于第二通信装置监听第一通信装置的第一神经网络参数；协作控制资源可以是人工智能控制发现(AI-cooperation-control)资源，该协作控制资源用于第一通信装置为各第二通信装置指示发送第二神经网络参数的资源。

从而，该方式中，第一神经网络参数是在协作发现资源上发送的，例如，第一神经网络参数是第一通信装置在AI-cooperation-discover资源上发送的。协作发现资源是在上述侧行链路配置信息中配置的。

另一种可选的实施方式中，当第一通信装置是网络设备时，可自行预配置上述侧行链路配置信息，并下发给各第二通信装置。

一种可选的实施方式中，第一通信装置在发送第一神经网络参数之前，还可在上述协作同步资源上发送同步信号，以使得第二通信装置根据该同步信号与第一通信装置进行同步。

S102.第二通信装置接收第一通信装置的第一神经网络参数。

一种可选的实施方式中，网络设备在接收到来自第一通信装置的请求消息后，为各第二通信装置发送侧行链路配置信息，从而第二通信装置在上述侧行链路配置信息所配置的协作发现资源上接收第一神经网络参数。

一种可选的实施方式中，第二通信装置接收第一神经网络参数之前，还可在上述侧行链路配置信息所配置的协作同步资源上监听同步信号，并根据该同步信号与第一通信装置进行同步。从而第二通信装置完成与第一通信装置的同步后，可与第一通信装置进行通信，比如接收来自第一通信装置的第一神经网络参数。

S103.第二通信装置在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置发送第一指示信息，第一指示信息用于指示第二通信装置参与第一通信装置第一神经网络模型的训练。

可理解的，当上述第一神经网络参数是第一神经网络的模型参数时，第二神经网络参数是第二神经网络的模型参数，第一神经网络是第一通信装置的神经网络，第二神经网络是第二通信装置的神经网络；当第一神经网络参数是第一神经网络模型的梯度时，第二神经网络参数是第二神经网络模型的梯度；当第一神经网络参数是训练第一神经网络模型的训练数据时，第二神经网络参数是训练第二神经网络模型的训练数据。其中，模型参数包括神经网络结构、神经网络结构中神经元之间的权重等。

其中，第一阈值是第二通信装置预先设定的。第二通信装置的第二神经网络参数是第二通信装置接收到第一神经网络参数后，根据第一神经网络参数更新第二通信装置的本地神经网络模型后的神经网络模型的神经网络参数。从而第二通信装置将更新后的神经网络模型的神经网络参数与第一神经网络参数进行对比，以确定第一神经网络参数与第二神经网络参数之间的相关系数。

示例性的，第二通信装置接收第一神经网络参数之前的本地神经网络模型为神经网络模型X，第二通信装置接收到第一神经网络参数之后，根据该第一神经网络参数对神经网络模型X进行更新，获得神经网络模型Y。该神经网络模型Y为第二神经网络模型，进而第二通信装置将神经网络模型Y的神经网络参数与第一神经网络参数进行对比，以确定第一神经网络参数与第二神经网络参数之间的相关系数。

另外，当第一神经网络参数和第二神经网络参数所属的类型不同时，其两者之间的相关系数的确定方式也不相同。以下，结合第一神经网络参数和第二神经网络参数所属的类型，阐述第一神经网络参数与第二神经网络参数之间的相关系数的确定方式：

1.第一神经网络参数是第一神经网络的模型参数，第二神经网络参数是第二神经网络的模型参数。

当第一神经网络参数是第一神经网络的模型参数，第二神经网络参数是第二神经网络的模型参数时，第一神经网络参数与第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的。其中，第一参数是第二通信装置对第一神经网络模型输入训练数据时，第一神经网络模型输出的参数；第一神经网络模型是根据第一神经网络的模型参数确定的；第二参数是第二通信装置对第二通信装置的第二神经网络模型也输入该训练数据时，第二神经网络模型输出的参数。

也就是说，第二通信装置接收到第一神经网络参数后，根据第一神经网络的模型参数确定第一神经网络模型，再根据第一神经网络模型和第二神经网络模型确定第一参数和第二参数，并根据第一参数和第二参数确定第一神经网络参数与第二神经网络参数之间的相关系数。其中，第一参数和第二参数是第二通信装置对第一神经网络模型和第二神经网络模型输入相同的训练数据时，第一神经网络模型和第二神经网络模型分别输出的参数。

一种可能的实现中，第二通信装置将第一参数和第二参数的协方差除以第一参数的标准差与第二参数的标准差之积的结果作为第一神经网络参数与第二神经网络参数之间相关性的评价准则。例如，第二通信装置对第一神经网络模型和第二神经网络模型输入相同的训练数据时，第一神经网络模型和第二神经网络模型分别输出X、Y，即X为第一参数，Y为第二参数，那么第一神经网络参数与第二神经网络参数之间的相关系数为：

其中，Cov(X,Y)表示X和Y的协方差，σ _X、σ _Y分别表示X和Y的标准差。

2.第一神经网络参数是第一神经网络模型的梯度，第二神经网络参数是第二神经网络模型的梯度；或者，第一神经网络参数是训练第一神经网络模型的训练数据，第二神经网络参数是训练第二神经网络模型的训练数据。

当第一神经网络参数是第一神经网络模型的梯度，第二神经网络参数是第二神经网络模型的梯度时，第一神经网络参数与第二神经网络参数之间的相关系数是根据第一神经网络模型的梯度的概率分布与第二神经网络模型的梯度的概率分布确定的。当第一神经网络参数是训练第一神经网络模型的训练数据，第二神经网络参数是训练第二神经网络模型的训练数据时，第一神经网络参数与第二神经网络参数之间的相关系数是根据训练第一神经网络模型的训练数据的概率分布与训练第二神经网络模型的训练数据的概率分布确定的。

一种可能的实现中，第一神经网络参数与第二神经网络参数之间的相关系数是根据第一神经网络参数的概率分布、第二神经网络参数的概率分布，以及海林格距离(hellinger distance)的定义确定的。即第一神经网络参数与第二神经网络参数之间的相关系数为：

其中，Z _a、Z _b分别表示第一神经网络参数和第二神经网络参数，S(Z _a)、S(Z _b)分别表示第一神经网络参数的概率分布、第二神经网络参数的概率分布。

可理解的，第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值，意味着第二神经网络参数与第一神经网络参数的相关性较大，从而第二神经网络参数对第一神经网络模型的收敛贡献较大。也就是说，第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小，确定是否参与第一神经网络模型的训练。第二通信装置在第二神经网络参数对第一神经网络模型的收敛贡献较大时，确定参数第一神经网络模型的训练，且通过第一指示信息告知给第一通信装置。从而可避免第二通信装置在第二神经网络参数对第一神经网络模型收敛的贡献较低时，仍参与第一神经网络模型的训练，进而可减少第二通信装置的信令开销，即减少第一通信装置不必要的传输开销。

一种可选的实施方式中，上述侧行链路配置信息中还配置了第二通信装置发送第一指示信息的协作响应资源，从而第二通信装置在该协作响应资源上向第一通信装置发送第一指示信息。

另一种可选的实施方式中，第二通信装置还可在上述协作控制资源上向第一通信装置发送第一指示信息。

另一种可选的实施方式中，第二通信装置在第一神经网络参数与第二神经网络参数的相关系数等于或大于第一阈值时，第二通信装置向第一通信装置发送第五指示信息，第五指示信息用于指示第二通信装置不参与第一神经网络模型的训练。也就是说，第二通信装置在确定不参与第一神经网络模型的训练时，通过第五指示信息向第一通信装置指示不参与第一神经网络模型的训练，从而第一通信装置获知到该第二通信装置不参与此轮神经网络参数的训练。

又一种可选的实施方式中，第一通信装置和第二通信装置预先约定，第二通信装置在第一神经网络参数与第二神经网络参数的相关系数等于或大于第一阈值时，不向第一通信装置反馈任何信息，即第二通信装置在本轮确定不参与第一神经网络模型的训练时，不做任何处理。从而第一通信装置在预设时间内未接收到来自第二通信装置的反馈信息时，确定该第二通信装置不参与本轮第一神经网络模型的训练，从而可节省系统的信令开销。

第二通信装置在确定不参与本轮第一神经网络模型的训练时，等待下一轮第一通信装置发送神经网络参数，并再次和第二通信装置更新的本地神经网络模型的神经网络参数进行对比，以确定是否参与下一轮的训练。

S104.第一通信装置接收来自第二通信装置的第一指示信息。

第一通信装置可在上述侧行链路配置信息所配置的协作响应资源上接收第一指示信息，也可以是在上述协作发现资源接收第一指示信息。本申请实施例不做限定。

第一通信装置通过接收第一指示信息，获知到愿意参与第一神经网络模型训练的第二通信装置，从而第二通信装置根据反馈了第一指示信息的第二通信装置的第二神经网络参数更新第一神经网络模型，有利于节省第二通信装置的信令开销，即节省第二通信装置的传输开销。

一种可选的实施方式中，第一通信装置通过第一指示信息获知到愿意参与第一神经网络模型训练的第二通信装置后，向该部分的第二通信装置发送控制信号，控制信号用于指示时频资源，指示的时频资源用于第二通信装置发送第二神经网络参数。

其中，第一通信装置发送控制信号的资源是协作控制资源，该协作控制资源是在上述侧行链路配置信息中配置的。

也就是说，第一通信装置在确定愿意参与第一神经网络模型训练的第二通信装置后，通过向该部分的第二通信装置发送控制信号，向该部分的第二通信装置指示发送第二神经网络参数的时频资源，以使该部分的第二通信装置在各自对应的时频资源上向第一通信装置发送第二神经网络参数。

一种可选的实施方式中，第二通信装置发送第二神经网络参数的时频资源是网络设备动态调度给第一通信装置的。第一通信装置通过控制信号将时频资源调度给反馈了第一指示信息的第二通信装置。第一通信装置给不同第二通信装置调度的时频资源是不相同的。该方式中，第一通信装置每次给反馈了第一指示信息的第二通信装置动态调度时频资源，可使得资源的利用率较高。

另一种可选的实施方式中，第二通信装置发送第二神经网络参数的时频资源是网络设备半静态配置给第一通信装置的。该半静态资源是周期性出现的，从而无需第一通信装置给第二通信装置调度时频资源。但第一通信装置仍需通过控制信号向反馈了第一指示信息的第二通信装置指示第二通信装置中的半静态资源，以激活该半静态资源。进而第二通信装置可采用该半静态资源向第一通信装置发送第二神经网络参数。该方式中，第一通信装置无需给第二通信装置调度时频资源，可减少信令开销。

一种可选的实施方式中，第二通信装置接收到上述控制信号后，采用控制信号指示的时频资源，向第一通信装置发送第二神经网络参数。从而第一通信装置接收来自第二通信装置的第二神经网络参数，并根据第二神经网络参数更新第一神经网络模型。可理解的，第一通信装置接收多个第二通信装置的第二神经网络参数，该多个第二通信装置均是反馈了第一指示信息的第二通信装置，从而第一通信装置根据多个第二神经网络参数更新第一神经网络模型。

可理解的，第一通信装置根据多个第二神经网络参数更新第一神经网络模型是指：第一通信装置将各个第二神经网络模型参数进行平均求和处理，获得处理后的第二神经网络参数，再根据处理后的第二神经网络参数，更新第一神经网络模型。若更新后的第一神经网络模型仍不收敛，且训练次数未达到阈值次数，则第一通信装置将更新后的第一神经网络模型的第一神经网络参数广播给周边的各第二通信装置，以使得各第二通信装置再次根据自身本地的神经网络参数与接收的神经网络参数，决策是否参与下一轮更新后的第一神经网络模型的训练。

如上所述，侧行链路配置信息所配置的协作同步资源、协作发现资源、协作控制资源可是网络设备在接收到请求消息后动态指示的。可选的，侧行链路配置信息所配置的协作同步资源、协作发现资源、协作控制资源也可以是网络设备预先配置的，还可以是非授权频谱资源。本申请实施例对此不做限定。

请参见图6，图6是本申请实施例以第一通信装置为终端设备A、第二通信装置包括终端设备B和终端设备C为例的模型训练方法的交互流程示意图。如图6所示：

601.若终端设备A在采用本地的训练数据进行N轮训练后，终端设备A的第一神经网络模型还未收敛，则终端设备A向周边终端设备(终端设备B和终端设备C)发送同步信号。可选的，N的数值小于阈值次数。

602.终端设备B和终端设备C监听到同步信号后，分别根据该同步信号与终端设备A进行同步，然后监听终端设备A的第一神经网络参数。终端设备B、终端设备C与终端设备A进行同步，是为了保证后续可与终端设备A进行通信。终端设备A发送同步信号的资源，以及终端设备B和终端设备C监听同步信号的资源均可以是上述侧行链路配置信息配置的协作同步资源，不再赘述。

603.终端设备A在上述协作发现资源上广播终端设备A的第一神经网络参数。

604.终端设备B和终端设备C在协作发现资源上监听到第一神经网络参数后，将第一神经网络参数和自身的第二神经网络参数进行对比，判断第一神经网络参数与第二神经网络参数之间的相关系数是否小于第一阈值。

605.终端设备B和终端设备C在两者的相关系数小于第一阈值时，向终端设备A发送用于指示参与第一神经网络模型的训练的第一指示信息。

606.终端设备A接收到来自终端设备B和终端设备C的第一指示信息后，向终端设备B和终端设备C发送控制信号，通过控制信号向终端设备B和终端设备C分别指示发送自身第二神经网络参数的时频资源。

607.终端设备B和终端设备C分别根据指示的时频资源，向终端设备A发送第二各自的第二神经网络参数。

例如，终端设备A向终端设备B发送的控制信号#b用于指示时频资源#b，向终端设备C发送的控制信号#c用于指示时频资源#c。从而终端设备B在时频资源#b上向终端设备A发送终端设备B的第二神经网络参数，终端设备C在时频资源#c上向终端设备A发送终端设备C的第二神经网络参数。

608.终端设备A接收到来自终端设备B的第二神经网络参数和终端设备C的第二神经网络参数后，对两个第二神经网络参数进行融合，即对两个神经网络参数加权求均，获得全局神经网络参数。

609.终端设备A再采用该全局神经网络参数开始第N+1轮训练，即根据该全局神经网络参数更新第一神经网络模型，获得更新后的第一神经网络模型。

若更新后的第一神经网络模型不收敛，且训练次数还未达到阈值次数时，终端设备A将更新后的第一神经网络模型的第一神经网络参数广播，终端设备B和终端设备C再次根据接收的神经网络参数和此时自身本地的神经网络参数，确定是否参与终端设备A的下一轮训练，直至终端设备A的神经网络模型收敛，或者训练次数达到阈值次数。

可见，本申请实施例中，第二通信装置将自身的第二神经网络参数与接收的第一神经网络参数进行比较，在第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值时，向第一通信装置反馈用于指示参与第一神经网络模型训练的第一指示信息，从而第一通信装置可根据反馈了第一指示信息的第二通信装置的第二神经网络参数，更新第一神经网络模型。第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值，表明第二神经网络参数对第一神经网络模型收敛的贡献较大。从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小，确定是否参与第一神经网络模型的训练，可避免第二通信装置在第二神经网络参数对第一神经网络模型收敛贡献较小时，仍参与第一神经网络模型的训练，进而可减少第二通信装置的信令开销。另外，第一通信装置不再是根据周边所有第二通信装置的第二神经网络参数更新第一神经网络模型，而是根据反馈了第一指示信息的第二通信装置的第二神经网络参数更新第一神经网络模型，从而可减少第一通信装置的信令开销。

本申请实施例还提出一种模型训练方法200，图7是该模型训练方法200的交互流程示意图。该模型训练方法200也从第一通信装置与第二通信装置之间交互的角度进行阐述。该模型训练方法200包括但不限于以下步骤：

S201.第一通信装置发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。

可理解的，第一通信装置在自身资源或能力有限，无法独立完成待训练的神经网络模型的训练时，将待训练的神经网络模型进行拆分，拆分为多个训练任务，并以协作请求信息的方式将该多个训练任务广播给周边的第二通信装置，以请求各第二通信装置协助第一通信装置参与多个训练任务的训练。

其中，每个训练任务包括一个简单神经网络模型，每个简单神经网络模型是该待训练的神经网络模型的一部分子网络。

一种可能的实现中，第一通信装置基于切分后子网络的延迟，对待训练的神经网络模型进行拆分。可选的，第一通信装置基于各第二通信装置的算力，对待训练的神经网络模型进行拆分。可选的，第一通信装置基于切分位置产生的数据量，对待训练的神经网络模型进行拆分。

一种可选的实施方式中，第一通信装置根据待训练的神经网络模型的结构，将待训练的神经网络模型平均分成多个训练任务，从而每个训练任务包括的待训练的神经网络模型的神经网络层数相同。本申请对每个训练任务包括的神经网络层数不做限定。

示例性的，如图8所示，第一通信装置将待训练的神经网络模型拆分为3个训练任务，分别为训练任务A、训练任务B、训练任务C，训练任务A、训练任务B、训练任务C均包括两层神经网络。第一通信装置将训练任务C作为自身的训练部分，将训练任务A和训练任务B作为两个训练任务，并以协作请求的方式广播给周边的第二通信装置。

另一种可选的实施方式中，第一通信装置将待训练的神经网络模型拆分为多个训练程度不均的训练任务，即每个训练任务中包括的神经网络层数不相同。从而有利于剩余资源或自身算力较小的第二通信装置参与神经网络层数较少的训练任务的训练，剩余资源或自身算力较大的第二通信装置参与神经网络层数较多的训练任务的训练。

一种可选的实施方式中，第一通信装置在确定无法完成待训练的神经网络模型时，向网络设备发送请求消息(例如，on demand SIB)，以请求网络设备给该第一通信装置配置用于进行协作训练的相关资源。网络设备接收到来自第一通信装置的请求消息后，为第一通信装置和第一通信装置的周边设备(各第二通信装置)发送侧行链路配置信息。

其中，侧行链路配置信息的实施方式可参见上述S101中所述，不再赘述。

从而，协作请求信息可是在该侧行链路配置信息所配置的协作发现资源上发送的。

一种可选的实施方式中，上述协作请求信息还可包括每个训练任务对应的预估开销等，从而有利于第二通信装置接收到该协作请求信息后，根据自身的剩余资源情况，确定是否可参与其中某些训练任务的训练。

S202.第二通信装置接收协作请求信息。

一种可选的实施方式中，网络设备为第二通信装置发送侧行链路配置信息，侧行链路配置信息配置有些用于接收请求信息的协作发现资源。因此，第二通信装置可在上述侧行链路配置信息所配置的协作发现资源上接收协作请求信息。

S203.第二通信装置确定参与第一训练任务时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

可理解的，第二通信装置根据自身的剩余资源量、自身的算力等，从协作请求信息中的多个训练任务中确定自身能参与的一个或多个训练任务。然后，第二通信装置通过第二指示信息，将自身能参与的第一训练任务告知给第一通信装置。第一训练任务包括第二通信装置能训练的一个或多个训练任务。

一种可选的实施方式中，第一通信装置和各第二通信装置预先约定：第二通信装置接收到协作请求信息后，若向第一通信装置反馈能参与的训练任务，反馈自身能参与训练的一个训练任务。也就是说，当第二通信装置可参与一个或多个训练任务的训练时，通过第二指示信息，向第一通信装置反馈上述一个或多个训练任务中的一个，即第一训练任务包括协作请求信息携带的多个训练任务的其中一个训练任务。

另一种可选的实施方式中，第一通信装置和各第二通信装置预先约定：第二通信装置接收到协作请求信息后，若向第一通信装置反馈能参与的训练任务，可反馈自身所有能参与训练的训练任务。也就是说，第二通信转置可通过第二指示信息向第一通信装置反馈自身所有能参与训练的训练任务，即第一训练任务包括协作请求信息中多个训练任务携带的一个或多个训练任务。

S204.第一通信装置接收来自第二通信装置的第二指示信息。

可理解的，第一通信装置通过接收来自第二通信装置的第二指示信息，获知到愿意参与训练的第二通信装置，以及每个第二通信装置可参与的训练任务。

由上述S203可知，第二通信装置向第一通信装置反馈可参与的一个训练任务，或者反馈所有能参与的训练任务。

当每个第二通信装置均反馈可参与的一个训练任务时，部分第二通信装置反馈的训练任务可能是同一训练任务。第一通信装置需从反馈相同训练任务的多个第二通信装置中，确定出训练该相同训练任务的第二通信装置。可理解的，第一通信装置通过协商的方式，或者第一通信装置根据多个第二通信装置的剩余资源，或算力大小，或每个第二通信装置与第一通信装置的信道质量等，确定出参与相同训练任务的一个第二通信装置，并向确定的第二通信装置发送第三指示信息，以告知该第二通信装置可进行第三指示信息指示的训练任务的训练。

其中，第一通信装置通过协商的方式可指第一通信装置与多个第二通信装置协商，确定距离第一通信装置最近的第二通信装置参与该相同训练任务的训练。本申请实施例并不限定具体的协商方式。

示例性的，第一通信装置根据多个第二通信装置中每个第二通信装置的算力大小，确定参与相同训练任务训练的第二通信装置，可指第一通信装置将多个第二通信装置中算力大小最大的第二通信装置参与该相同训练任务的训练，以保障该相同训练任务被完整训练。

示例性的，第一通信装置发送的协作请求信息中携带训练任务A、训练任务B，周边的第二通信装置A、第二通信装置B、第二通信装置C均接收到了该协作请求信息。第二通信装置A发送的第二指示信息指示了训练任务A，第二通信装置B和第二通信装置C发送的第二指示信息均指示了训练任务B。可见，第二通信装置B和第二通信装置C反馈了相同的训练任务，此时第一通信装置需从第二通信装置B和第二通信装置C中确定一个进行训练任务B训练的第二通信装置。若第一通信装置通过与第二通信装置B、第二通信装置C进行协商的方式，确定出让第二通信装置B参与训练任务B的训练，则第一通信装置向第二通信装置B发送第三指示信息，该第三指示信息用于指示训练任务B。从而第二通信装置B接收到该第三指示信息后，可进行训练任务B的训练。

示例性的，第一通信装置发送的协作请求信息中携带训练任务A、训练任务B，周边的第二通信装置A、第二通信装置B、第二通信装置C均接收到了该协作请求信息。第二通信装置A发送的第二指示信息指示了训练任务A和训练任务C，第二通信装置B和第二通信装置C发送的第二指示信息均指示了训练任务B。那么第一通信装置确定第二通信装置A参与训练任务A和训练任务C的训练，以及通过协商的方式确定第二通信装置C参与训练任务B的训练。从而第一通信装置向第二通信装置A发送的第三指示信息用于指示训练任务A和训练任务C，向第二通信装置C发送的第三指示信息用于指示训练任务B。

可选的，当每个第二通信装置均反馈可参与的一个训练任务，且每个第二通信装置反馈训练任务不相同时，第一通信装置也向每个反馈了第二指示信息的第二通信装置发送第三指示信息，该第三指示信息用于指示该第二通信装置反馈的训练任务，以告知每个反馈了第二指示信息的第二通信装置，可进行训练任务的训练。

另一种可选的实施方式中，第二通信装置向第一通信装置反馈自身能参与训练的所有训练任务，那么第一通信装置根据每个第二通信装置可参与训练的训练任务，确定每个通信装置需参与的训练任务，并以第三指示信息的方式告知每个第二通信装置需参与的训练任务。也就是说，第一通信装置向每个第二通信装置发送第三指示信息，第三指示信息用于指示第一训练任务中的其中一个训练任务。

示例性的，第一通信装置发送的协作请求信息中携带训练任务A、训练任务B、训练任务C，周边的第二通信装置A、第二通信装置B、第二通信装置C均接收到了该协作请求信息。第二通信装置A发送的第二指示信息中指示了训练任务C，第二通信装置B发送的第二指示信息中指示了训练任务B，第二通信装置C发送的第二指示信息中指示了训练任务A和训练任务B。从而第一通信装置确定第二通信装置可参与训练任务A的训练。进而，第一通信装置向第二通信装置A发送的第三指示信息用于指示训练任务C，向第二通信装置B发送的第三指示信息用于指示训练任务B，向第二通信装置C发送的第三指示信息用于训练任务A。

示例性的，第一通信装置发送的协作请求信息中携带训练任务A、训练任务B、训练任务C，周边的第二通信装置A、第二通信装置B、第二通信装置C均接收到了该协作请求信息。第二通信装置A发送的第二指示信息中指示了训练任务A和训练任务C，第二通信装置B发送的第二指示信息中指示了训练任务B，第二通信装置C发送的第二指示信息中指示了训练任务A和训练任务B。第二通信装置根据第二通信装置A、第二通信装置B、第二通信装置C分别可参与的训练任务，确定第二通信装置A可参与训练任务C的训练，第二通信装置B可参与训练任务B的训练，第二通信装置C可参与训练任务A的训练。从而第一通信装置向第二通信装置A发送的第三指示信息用于指示训练任务C，向第二通信装置B发送的第三指示信息用于指示训练任务B，向第二通信装置C发送的第三指示信息用于指示训练任务A。

可见，各愿意参与训练任务的第二通信装置通过第三指示信息获知到自身需训练的训练任务。从而该部分的第二通信装置根据本地的训练数据，训练对应的神经网络模型，直至第一通信装置确定神经网络模型收敛时，停止对神经网络模型的训练。可理解的，第一通信装置通过待训练的神经网络模型的输入和输出，确定神经网络模型是否收敛。

示例性的，第一通信装置将待训练的神经网络模型拆分为上述图8所示的三个训练任务，且第一通信装置进行训练任务C的训练，即第一通信装置进行包含有神经网络输出的子网络的训练。从而，第一通信装置与各第二通信装置协商神经网络的输入(X)，并通过自身训练的训练任务C的输出(神经网络的输出)Y，确定自身和各第二通信装置训练的神经网络模型是否收敛。

一种可选的实施方式中，第一通信装置确定出反馈了第二指示信息的第二通信装置中每个第二通信装置参与的训练任务后，向每个第二通信装置发送第四指示信息。该第四指示信息用于指示第二通信装置需接收的第一输出、第一输出对应的时频位置，和/或需发送的第二输出、第二输出对应的时频资源位置。

其中，第一输出是第一通信装置训练的神经网络模型的输出，或者是除该第二通信装置外的其他第二通信装置训练的神经网络模型的输出；第二输出是该第二通信装置训练的神经网络模型的输出。

可理解的，第一通信装置通过第四指示信息为每个参与训练任务的第二通信装置指示需接收和/或需接收的参数，以及为每个第二通信装置调度需接收和/或需发送的参数的时频资源，以使得参与训练的第二通信装置获知自身需在哪些时频资源上接收和/或发送哪些参数。

示例性的，第一通信装置将待训练的神经网络模型拆分为上述如图8所示的训练任务，且第一通信装置进行训练任务A的训练，第二通信装置A进行训练任务B的训练，第二通信装置B进行训练任务C的训练。那么对于第二通信装置A而言，第一输出是第一通信装置训练的神经网络模型的输出(输出A)，第二输出是第二通信装置A训练的训练任务B中神经网络模型的输出(输出B)。对于第二通信装置B而言，第一输出是第二通信装置A训练的训练任务B中神经网络模型的输出(输出B)，第二输出是第二通信装置B训练的训练任务C中神经网络模型的输出(输出C)。

第一通信装置确定自身需在时频资源#a上发送训练任务A中的神经网络模型的输出。另外，第一通信装置通过第四指示信息向第二通信装置A指示第二通信装置需在时频资源#b中的部分时频资源上接收输出A，并在时频资源#b中的另一部分时频资源上发送输出B，或者，第一通信装置通过第四指示信息向第二通信装置A指示第二通信装置需在时频资源#b对应的不同频域资源上接收输出A和发送输出B；以及第一通信装置通过第四指示信息向第二通信装置B指示第二通信装置B需在时频资源#c中的部分时频资源上接收输出B，以及在时频资源#c中的另一部分时频资源上发送输出C，或者，第一通信装置通过第四指示信息向第二通信装置B指示第二通信装置B需在时频资源#c对应的不同频域资源上接收输出B和发送输出C。可见，第二通信装置A和第二通信装置B按照时分的方式，传输自身的训练结果。

一种可选的实施方式中，发送第四指示信息的资源可是上述侧行配置信息所配置的协作控制资源。

另一种可选的实施方式中，第一通信装置发送协作请求信息之前，在协作同步资源上发送同步信号，从而第二通信装置在协作同步资源上接收同步信号，并根据该同步信号与第一通信装置进行同步，以使得后续可与第一通信装置进行通信。其中，协作同步资源是在上述侧行链路配置信息中配置的。

请参见图9，图9是本申请实施例以第一通信装置为终端设备A、第二通信装置包括终端设备B和终端设备C为例的另一种模型训练方法的交互流程示意图。如图9所示：

901.若终端设备确定自身无法独自完成待训练的神经网络模型，则终端设备A向周边终端设备(终端设备B和终端设备C)发送同步信号。

902.终端设备B和终端设备C监听到同步信号后，分别根据该同步信号与终端设备A进行同步，且监听终端设备A的协作请求信息。终端设备B、终端设备C与终端设备A进行同步是为了保证后续可与终端设备A进行通信。终端设备A发送同步信号的资源，以及终端设备B和终端设备C监听同步信号的资源均可以是上述侧行链路配置信息配置的协作同步资源，不再赘述。

903.终端设备A在上述协作发现资源上广播协作请求信息，以请求周边终端设备协助多个训练任务的训练。

904.终端设备B和终端设备C在协作发现资源上监听到协作请求信息后，根据自身的剩余资源情况，从协作请求信息携带的多个训练任务中确定自身可参与的一个或多个训练任务。

905.终端设备B和终端设备C向终端设备A发送第二指示信息，以通过第二指示信息向终端设备A反馈自身可参与的一个或多个训练任务。

906.终端设备A再根据终端设备B和终端设备C可参与的训练任务，确定终端设备B和终端设备C分别需参与的训练任务，并发送第三指示信息，以第三指示信息的方式告知终端设备B和终端设备C分别需参与的训练任务。另外，终端设备A向终端设备B和终端设备C发送第四指示信息，以告知终端设备B和终端设备C各自需接收和/或发送的参数，以及每个参数对应的时频资源位置。

907.终端设备B和终端设备C对第三指示信息指示的训练任务进行训练，并根据每个参数的时频资源位置，发送或接收对应的参数。

908.终端设备A确定神经网络模型收敛时，确定神经网络模型训练完成。

本申请实施例中，第一通信装置将待训练的神经网络模型拆分为多个简单的神经网络模型，即多个训练任务，并通过广播协作请求信息的方式，将多个训练任务广播给周边的第二通信装置。第二通信装置接收到该多个训练任务后，根据自身的资源剩余量，确定可参与的训练任务。第二通信装置通过第二指示信息的方式将自身可参与的训练任务指示给第一通信装置。从而第一通信装置根据各第二通信装置可参与的训练任务，确定每个第二通信装置的训练任务，并以第三指示信息告知给各第二通信装置。进而参与协作训练的各第二通信装置训练第三指示信息指示的训练任务。一个或多个第二通信装置通过训练协作请求信息携带的多个训练任务中的一个或多个训练任务，协作第一通信装置完成待训练的神经网络模型的训练，从而可降低对第一通信装置的能力需求。

本申请实施例中，待训练的神经网络模型的训练完成，没有网络设备的参与，只有各终端设备的协作参与。另外，第一通信装置根据周边各第二通信装置的本地数据，完成待训练的神经网络模型的训练，使得训练的神经网络模型更加准确。

为了实现上述本申请实施例提供的方法中的各功能，第一通信装置或第二通信装置可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

如图10所示，本申请实施例提供了一种通信装置1000。该通信装置1000可以是第一通信装置的部件(例如，集成电路，芯片等等)，也可以是第二通信装置的部件(例如，集成电路，芯片等等)。该通信装置1000也可以是其他通信单元，用于实现本申请方法实施例中的方法。该通信装置1000可以包括：通信单元1001和处理单元1002。可选的，还可以包括存储单元1003。

在一种可能的设计中，如图10中的一个或者多个单元可能由一个或者多个处理器来实现，或者由一个或者多个处理器和存储器来实现；或者由一个或多个处理器和收发器实现；或者由一个或者多个处理器、存储器和收发器实现，本申请实施例对此不作限定。所述处理器、存储器、收发器可以单独设置，也可以集成。

所述通信装置1000具备实现本申请实施例描述的第二通信装置的功能，可选的，通信装置1000具备实现本申请实施例描述的第一通信装置的功能。比如，所述通信装置1000包括第二通信装置执行本申请实施例描述的第二通信装置涉及步骤所对应的模块或单元或手段(means)，所述功能或单元或手段(means)可以通过软件实现，或者通过硬件实现，也可以通过硬件执行相应的软件实现，还可以通过软件和硬件结合的方式实现。详细可进一步参考前述对应方法实施例中的相应描述。

在一种可能的设计中，一种通信装置1000可包括：处理单元1002和通信单元1001，处理单元1002用于控制通信单元1001进行数据/信令收发；

通信单元1001，用于接收第一通信装置的第一神经网络参数；

通信单元1001，还用于在所述第一神经网络参数与所述装置的第二神经网络参数之间的相关系数小于第一阈值时，向所述第一通信装置发送第一指示信息；

所述第一指示信息用于指示所述装置参与所述第一通信装置的第一神经网络模型的训练。

一种可选的实现方式中，所述第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。

一种可选的实现方式中，所述第一神经网络参数是在协作发现资源上接收的；所述协作发现资源是在侧行链路配置信息中配置的。

一种可选的实现方式中，在所述相关系数小于所述第一阈值时，所述通信单元1001还用于：向所述第一通信装置发送所述第二神经网络参数。

另一种可选的实现方式中，所述通信单元1001还用于：接收来自所述第一通信装置的控制信号；所述控制信号用于指示时频资源；指示的时频资源用于所述装置发送所述第二神经网络参数。

一种可选的实现方式中，接收所述控制信号的资源是协作控制资源；所述协作控制资源是在所述侧行链路配置信息中配置的。

一种可选的实现方式中，所述通信单元1001，还用于在协作同步资源上接收同步信号；所述处理单元1002，用于根据所述同步信号，与所述第一通信装置进行同步；所述协作同步资源是在所述侧行链路配置信息中配置的。

一种可选的实现方式中，所述侧行链路配置信息所配置的所述协作发现资源、所述协作控制资源、所述协作同步资源中的一种或多种资源是预先配置的，或是动态指示的，或是非授权频谱资源。

一种可选的实现方式中，所述第一神经网络参数是所述第一神经网络的模型参数，所述第二神经网络参数是所述第二神经网络的模型参数；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的；所述第一参数是所述第二通信装置对所述第一神经网络模型输入训练数据时，所述第一神经网络模型输出的参数；所述第一神经网络模型是根据所述第一神经网络的模型参数确定的；所述第二参数是所述第二通信装置对所述第二通信装置的第二神经网络模型输入所述训练数据时，所述第二神经网络模型输出的参数。

另一种可选的实现方式中，所述第一神经网络参数是所述第一神经网络的梯度，所述第二神经网络参数是所述第二神经网络的梯度；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据所述第一神经网络参数的概率密度分布和所述第二神经网络参数的概率密度分布确定的。

本申请实施例和上述所示方法实施例基于同一构思，其带来的技术效果也相同，具体原理请参照上述所示实施例的描述，不再赘述。

在另一种可能的设计中，一种通信装置1000可包括：处理单元1002和通信单元1001，处理单元1002用于控制通信单元1001进行数据/信令收发；

通信单元1001，用于发送所述装置的第一神经网络参数；

通信单元1001，还用于接收来自第二通信装置的第一指示信息；

所述第一指示信息是所述第二通信装置在所述第一神经网络参数与所述第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的；

所述第一指示信息用于指示所述第二通信装置参与所述装置的第一神经网络模型的训练。

一种可选的实现方式中，所述第一神经网络参数是在协作发现资源上发送的；所述协作发现资源是在侧行链路配置信息中配置的。

又一种可选的实现方式中，所述通信单元1001，还用于接收来自所述第二通信装置的第二神经网络参数；所述处理单元1002，用于根据所述第二神经网络参数，更新所述第一神经网络模型。

又一种可选的实施方式中，所述通信单元1001，还用于向所述第二通信装置发送控制信号；所述控制信号用于指示时频资源；指示的时频资源用于所述第二通信装置发送所述第二神经网络参数。

一种可选的实现方式中，发送所述控制信号的资源是协作控制资源；所述协作控制资源是在所述侧行链路配置信息中配置的。

一种可选的实施方式中，所述通信单元1001，还用于在协作同步资源上发送同步信号；所述协作同步资源是在所述侧行链路配置信息中配置的。

一种可选的实施方式中，所述侧行链路配置信息所配置的所述协作发现资源、所述协作控制资源、所述协作同步资源中的一种或多种资源是预先配置的，或是动态指示的，或是非授权频谱资源。

在又一种可能的设计中，一种通信装置1000可包括：处理单元1002和通信单元1001，处理单元1002用于控制通信单元1001进行数据/信令收发；

通信单元1001，用于发送协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

通信单元1001，还用于接收来自第二通信装置的第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

一种可选的实施方式中，上述协作请求信息在协作发现资源上发送的，协作发现资源是在侧行链路配置信息中配置的。

另一种可选的实施方式中，多个第二通信装置发送的第二指示信息指示的第一训练任务是多个训练任务中的相同训练任务，此时第一通信装置也可通过第三指示信息，向其中的一个第二通信装置指示参与训练的训练任务。

一种可选的实施方式中，发送第四指示信息的资源是协作控制资源，协作控制资源是在侧行链路配置信息中配置的。

一种可选的实施方式中，上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。

通信单元1001，用于接收协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

通信单元1001，还用于确定参与第一训练任务的训练时，发送第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

一种可选的实施方式中，协作请求信息在协作发现资源上接收的，协作发现资源是在侧行链路配置信息中配置的。

一种可选的实施方式中，第二通信装置还可接收第三指示信息，第三指示信息用于指示第一训练任务中的其中一个训练任务。

一种可选的实施方式中，第二通信装置还可接收第四指示信息，第四指示信息用于指示第二通信装置接收的第一输出、第一输出对应的时频资源位置，和/或发送的第二输出、第二输出对应的时频资源位置。第一输出是第一通信装置训练的神经网络模型的输出，或者是除第二通信装置外的其他第二通信装置训练的神经网络模型的输出；第二输出是第二通信装置训练的神经网络模型的输出。

一种可选的实施方式中，接收第四指示信息的资源是协作控制资源，协作控制资源是在侧行链路配置信息中配置的。

一种可选的实施方式中，第二通信装置还可在协作同步资源上接收同步信号，并根据同步信号，与第一通信装置进行同步。

本申请实施例还提供一种通信装置1100，图11为通信装置1100的结构示意图。所述通信装置1100可以是第一通信装置或第二通信装置，也可以是支持第一通信装置实现上述方法的芯片、芯片系统、或处理器等，还可以是支持第二通信装置实现上述方法的芯片、芯片系统、或处理器等。该装置可用于实现上述方法实施例中描述的方法，具体可以参见上述方法实施例中的说明。

所述通信装置1100可以包括一个或多个处理器1101。所述处理器1101可以是通用处理器或者专用处理器等。例如可以是基带处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或中央处理器(Central Processing Unit，CPU)。基带处理器可以用于对通信协议以及通信数据进行处理，中央处理器可以用于对通信装置(如，基站、基带芯片，终端、终端芯片，分布单元(distributed unit，DU)或集中单元(centralized unit，CU)等)进行控制，执行软件程序，处理软件程序的数据。

可选的，所述通信装置1100中可以包括一个或多个存储器1102，其上可以存有指令1104，所述指令可在所述处理器1101上被运行，使得所述通信装置1100执行上述方法实施例中描述的方法。可选的，所述存储器1102中还可以存储有数据。所述处理器1101和存储器1102可以单独设置，也可以集成在一起。

存储器1102可包括但不限于硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)等非易失性存储器，随机存储记忆体(Random Access Memory，RAM)、可擦除可编程只读存储器(Erasable Programmable ROM，EPROM)、ROM或便携式只读存储器(Compact Disc Read-Only Memory，CD-ROM)等等。

可选的，所述通信装置1100还可以包括收发器1105、天线1106。所述收发器1105可以称为收发单元、收发机、或收发电路等，用于实现收发功能。收发器1105可以包括接收器和发送器，接收器可以称为接收机或接收电路等，用于实现接收功能；发送器可以称为发送机或发送电路等，用于实现发送功能。

所述通信装置1100为第二通信装置：收发器1105用于执行上述模型训练方法100中的S102、S103，以及用于执行模型训练方法200中的S202、S203。

所述通信装置1100为第二通信装置：收发器1105用于模型训练方法100中的S101、S104，以及用于执行模型训练方法200中的S201、S204。

另一种可能的设计中，处理器1101中可以包括用于实现接收和发送功能的收发器。例如该收发器可以是收发电路，或者是接口，或者是接口电路。用于实现接收和发送功能的收发电路、接口或接口电路可以是分开的，也可以集成在一起。上述收发电路、接口或接口电路可以用于代码/数据的读写，或者，上述收发电路、接口或接口电路可以用于信号的传输或传递。

又一种可能的设计中，可选的，处理器1101可以存有指令1103，指令1103在处理器1101上运行，可使得所述通信装置1100执行上述方法实施例中描述的方法。指令1103可能固化在处理器1101中，该种情况下，处理器1101可能由硬件实现。

又一种可能的设计中，通信装置1100可以包括电路，所述电路可以实现前述方法实施例中发送或接收或者通信的功能。本申请实施例中描述的处理器和收发器可实现在集成电路(integrated circuit，IC)、模拟IC、射频集成电路(radio frequency integrated circuit，RFIC)、混合信号IC、专用集成电路(application specific integrated circuit，ASIC)、印刷电路板(printed circuit board，PCB)、电子设备等上。该处理器和收发器也可以用各种IC工艺技术来制造，例如互补金属氧化物半导体(complementary metal oxide semiconductor，CMOS)、N型金属氧化物半导体(nMetal-oxide-semiconductor，NMOS)、P型金属氧化物半导体(positive channel metal oxide semiconductor，PMOS)、双极结型晶体管(Bipolar Junction Transistor，BJT)、双极CMOS(BiCMOS)、硅锗(SiGe)、砷化镓(GaAs)等。

以上实施例描述中的通信装置可以是第一通信装置或第二通信装置，但本申请实施例中描述的通信装置的范围并不限于此，而且通信装置的结构可以不受图11的限制。通信装置可以是独立的设备或者可以是较大设备的一部分。例如所述通信装置可以是：

(1)独立的集成电路IC，或芯片，或，芯片系统或子系统；

(2)具有一个或多个IC的集合，可选的，该IC集合也可以包括用于存储数据，指令的存储部件；

(3)ASIC，例如调制解调器(modulator)；

(4)可嵌入在其他设备内的模块；

(5)接收机、终端、智能终端、蜂窝电话、无线设备、手持机、移动单元、车载设备、网络设备、云设备、人工智能设备等等；

(6)其他等等。

对于通信装置可以是芯片或芯片系统的情况，可参见图12所示的芯片的结构示意图。图12所示的芯片1200包括处理器1201和接口1202。其中，处理器1201的数量可以是一个或多个，接口1202的数量可以是多个。该处理器1201可以是逻辑电路，该接口1202可以是输入输出接口、输入接口或输出接口。所述芯片1200还可包括存储器1203。

一种设计中，对于芯片用于实现本申请实施例中第二通信装置的功能的情况：处理器1201，用于控制接口1202进行输出或接收。

所述接口1202，用于接收第一通信装置的第一神经网络参数；

所述接口1202，还用于在所述第一神经网络参数与所述装置的第二神经网络参数之间的相关系数小于第一阈值时，输出第一指示信息；所述第一指示信息用于指示所述装置参与所述第一通信装置的第一神经网络模型的训练。

另一种设计中，对于芯片用于实现本申请实施例中第一通信装置的功能的情况：

所述接口1202，用于输出所述装置的第一神经网络参数；

所述接口1202，还用于接收来自第二通信装置的第一指示信息；

所述第一指示信息是所述第二通信装置在所述第一神经网络参数与所述第二装置的第二神经网络参数之间的相关系数小于第一阈值时输出的；所述第一指示信息用于指示所述第二通信装置参与所述装置的第一神经网络模型的训练。

又一种设计中，对于芯片用于实现本申请实施例中第一通信装置的功能的情况：

所述接口1202，用于输出协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

所述接口1202，还用于接收来自第二通信装置的第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

又一种设计中，对于芯片用于实现本申请实施例中第二通信装置的功能的情况：

所述接口1202，用于接收协作请求信息，协作请求信息包括多个训练任务，多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

所述接口1202，还用于确定参与第一训练任务的训练时，输出第二指示信息，第二指示信息用于指示第二通信装置参与第一训练任务的训练，第一训练任务是多个训练任务中的其中一个或多个。

本申请实施例中通信装置1100、芯片1200还可执行上述通信装置1000所述的实现方式。本领域技术人员还可以了解到本申请实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件，或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本申请实施例保护的范围。

本申请实施例和上述模型训练方法100和模型训练方法200所示方法实施例基于同一构思，其带来的技术效果也相同，具体原理请参照上述模型训练方法100和模型训练方法200所示实施例的描述，不再赘述。

本申请还提供了一种计算机可读存储介质，用于储存计算机软件指令，当所述指令被通信装置执行时，实现上述任一方法实施例的功能。

本申请还提供了一种计算机程序产品，用于储存计算机软件指令，当所述指令被通信装置执行时，实现上述任一方法实施例的功能。

本申请还提供了一种计算机程序，当其在计算机上运行时，实现上述任一方法实施例的功能。

本申请还提供了一种通信系统，该系统包括上述方面的至少一个第一通信装置、至少两个第二通信装置。在另一种可能的设计中，该系统还可以包括本申请提供的方案中与第一通信装置、第二通信装置进行交互的其他设备。

上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital video disc，DVD))、或者半导体介质(例如，SSD)等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种模型训练方法，其特征在于，所述方法包括：

第二通信装置接收第一通信装置的第一神经网络参数；

所述第二通信装置在所述第一神经网络参数与所述第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时，向所述第一通信装置发送第一指示信息；

所述第一指示信息用于指示所述第二通信装置参与所述第一通信装置的第一神经网络模型的训练。
根据权利要求1所述的方法，其特征在于，所述第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。
根据权利要求1或2所述的方法，其特征在于，所述第一神经网络参数是在协作发现资源上接收的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求1至3任一项所述的方法，其特征在于，在所述相关系数小于所述第一阈值时，所述方法还包括：

所述第二通信装置向所述第一通信装置发送所述第二神经网络参数。
根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

所述第二通信装置接收来自所述第一通信装置的控制信号；

所述控制信号用于指示时频资源；指示的时频资源用于所述第二通信装置发送所述第二神经网络参数。
根据权利要求5所述的方法，其特征在于，所述控制信号是在协作控制资源上接收的，所述协作控制资源是侧行链路配置信息中配置的。
根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

所述第二通信装置在协作同步资源上接收同步信号；

所述第二通信装置根据所述同步信号，与所述第一通信装置进行同步；

所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求3，6，7任一项所述的方法，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
根据权利要求1至8任一项所述的方法，其特征在于，所述第一神经网络参数是所述第一神经网络的模型参数，所述第二神经网络参数是所述第二神经网络的模型参数；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的；

所述第一参数是所述第二通信装置对所述第一神经网络模型输入训练数据时，所述第一神经网络模型输出的参数；所述第一神经网络模型是根据所述第一神经网络的模型参数确定的；所述第二参数是所述第二通信装置对所述第二通信装置的第二神经网络模型输入所述训练数据时，所述第二神经网络模型输出的参数。
根据权利要求1至8任一项所述的方法，其特征在于，所述第一神经网络参数是所述第一神经网络的梯度，所述第二神经网络参数是所述第二神经网络的梯度；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据所述第一神经网络参数的概率密度分布和所述第二神经网络参数的概率密度分布确定的。
一种模型训练方法，其特征在于，所述方法包括：

第一通信装置发送所述第一通信装置的第一神经网络参数；

所述第一通信装置接收来自第二通信装置的第一指示信息；

所述第一指示信息是所述第二通信装置在所述第一神经网络参数与所述第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时发送的；

所述第一指示信息用于指示所述第二通信装置参与所述第一通信装置的第一神经网络模型的训练。
根据权利要求11所述的方法，其特征在于，所述第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。
根据权利要求11或12所述的方法，其特征在于，所述第一神经网络参数是在协作发现资源上发送的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求11至13任一项所述的方法，其特征在于，所述方法还包括：

所述第一通信装置接收来自所述第二通信装置的所述第二神经网络参数；

所述第一通信装置根据所述第二神经网络参数，更新所述第一神经网络模型。
根据权利要求11至14任一项所述的方法，其特征在于，所述方法还包括：

所述第一通信装置向所述第二通信装置发送控制信号；

所述控制信号用于指示时频资源；指示的时频资源用于所述第二通信装置发送所述第二神经网络参数。
根据权利要求15所述的方法，其特征在于，所述控制信号是在协作控制资源上发送的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求11至15任一项所述的方法，其特征在于，所述方法还包括：

所述第一通信装置在协作同步资源上发送同步信号；

所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求13，16，17任一项所述的方法，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种模型训练方法，其特征在于，所述方法包括：

第一通信装置发送协作请求信息，所述协作请求信息包括多个训练任务，所述多个训练任务是所述第一通信装置将待训练的神经网络模型进行拆分获得的；

所述第一通信装置接收来自第二通信装置的第二指示信息，所述第二指示信息用于指示所述第二通信装置参与第一训练任务的训练，所述第一训练任务是所述多个训练任务中的其中一个或多个。
根据权利要求19所述的方法，其特征在于，所述协作请求信息在协作发现资源上发送的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求19或20所述的方法，其特征在于，所述第一训练任务是所述多个训练任务中的其中多个；所述方法还包括：

所述第一通信装置发送第三指示信息，所述第三指示信息用于指示第一训练任务中的其中一个训练任务。
根据权利要求19至21任一项所述的方法，其特征在于，所述方法还包括：

所述第一通信装置向第二通信装置发送第四指示信息，所述第四指示信息用于指示所述第二通信装置需接收的第一输出、所述第一输出对应的时频资源位置，和/或需发送的第二输出、所述第二输出对应的时频资源位置；

第一输出是所述第一通信装置训练的神经网络模型的输出，或者是除所述第二通信装置外的其他第二通信装置训练的神经网络模型的输出；所述第二输出是所述第二通信装置训练的神经网络模型的输出。
根据权利要求22所述的方法，其特征在于，所述第四指示信息是在协作控制资源上发送的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求19至23任一项所述的方法，其特征在于，所述方法还包括：

所述第一通信装置在协作同步资源上发送同步信号，以使所述第二通信装置根据所述同步信号与所述第一通信装置进行同步；

所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求20，23，24任一项所述的方法，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种模型训练方法，其特征在于，所述方法包括：

第二通信装置接收协作请求信息，所述协作请求信息包括多个训练任务，所述多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

所述第二通信装置确定参与第一训练任务的训练时，发送第二指示信息；所述第二指示信息用于指示所述第二通信装置参与第一训练任务的训练，所述第一训练任务是所述多个训练任务中的其中一个或多个。
根据权利要求26所述的方法，其特征在于，所述协作请求信息在协作发现资源上接收的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求26或27所述的方法，其特征在于，所述方法还包括：

所述第二通信装置接收第三指示信息；所述第三指示信息用于指示所述第一训练任务中的其中一个训练任务。
根据权利要求26至28任一项所述的方法，其特征在于，所述方法还包括：

所述第二通信装置接收第四指示信息，所述第四指示信息用于指示所述第二通信装置接收的第一输出、所述第一输出对应的时频资源位置，和/或发送的第二输出、所述第二输出对应的时频资源位置；

所述第一输出是所述第一通信装置训练的神经网络模型的输出，或者是除所述第二通信装置外的其他第二通信装置训练的神经网络模型的输出；所述第二输出是所述第二通信装置训练的神经网络模型的输出。
根据权利要求29所述的方法，其特征在于，所述第四指示信息是协作控制资源上接收的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求26至30任一项所述的方法，其特征在于，所述方法还包括：

所述第二通信装置在协作同步资源上接收同步信号；

所述第二通信装置根据所述同步信号，与所述第一通信装置进行同步。
根据权利要求27，30，31任一项所述的方法，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种通信装置，其特征在于，所述装置包括：

通信单元，用于接收第一通信装置的第一神经网络参数；

所述通信单元，还用于在所述第一神经网络参数与所述装置的第二神经网络参数之间的相关系数小于第一阈值时，向所述第一通信装置发送第一指示信息；

所述第一指示信息用于指示所述装置参与所述第一通信装置的第一神经网络模型的训练。
根据权利要求33所述的装置，其特征在于，所述第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。
根据权利要求33或34所述的装置，其特征在于，所述第一神经网络参数是在协作发现资源上接收的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求33至35任一项所述的装置，其特征在于，在所述相关系数小于所述第一阈值时，所述通信单元还用于：

向所述第一通信装置发送所述第二神经网络参数。
根据权利要求33至36任一项所述的装置，其特征在于，所述通信单元还用于：

接收来自所述第一通信装置的控制信号；所述控制信号用于指示时频资源；指示的时频资源用于所述装置发送所述第二神经网络参数。
根据权利要求37所述的装置，其特征在于，所述控制信号是在协作控制资源上接收的，所述协作控制资源是侧行链路配置信息中配置的。
根据权利要求33至38任一项所述的装置，其特征在于，所述装置还包括处理单元；

所述通信单元，还用于在协作同步资源上接收同步信号；

所述处理单元，用于根据所述同步信号，与所述第一通信装置进行同步；

所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求35，38，39所述的装置，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
根据权利要求33至40任一项所述的装置，其特征在于，所述第一神经网络参数是第一神经网络的模型参数，所述第二神经网络参数是第二神经网络的模型参数；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的；

所述第一参数是所述装置对所述第一神经网络模型输入训练数据时，所述第一神经网络模型输出的参数；所述第一神经网络模型是根据所述第一神经网络的模型参数确定的；所述第二参数是所述第二通信装置对所述装置的第二神经网络模型输入所述训练数据时，所述第二神经网络模型输出的参数。
根据权利要求33至40任一项所述的装置，其特征在于，所述第一神经网络参数是所述第一神经网络的梯度，所述第二神经网络参数是所述第二神经网络的梯度；所述第一神经网络参数与所述第二神经网络参数之间的相关系数是根据所述第一神经网络参数的概率密度分布和所述第二神经网络参数的概率密度分布确定的。
一种通信装置，其特征在于，所述装置包括：

通信单元，用于发送所述装置的第一神经网络参数；

所述通信单元，还用于接收来自第二通信装置的第一指示信息；

所述第一指示信息是所述第二通信装置在所述第一神经网络参数与所述第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的；

所述第一指示信息用于指示所述第二通信装置参与所述装置的第一神经网络模型的训练。
根据权利要求43所述的装置，其特征在于，所述第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度；所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。
根据权利要求43或44所述的装置，其特征在于，所述第一神经网络参数是在协作发现资源上发送的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求43至45任一项所述的装置，其特征在于，所述装置还包括处理单元；

所述通信单元，还用于接收来自所述第二通信装置的第二神经网络参数；

所述处理单元，用于根据所述第二神经网络参数，更新所述第一神经网络模型。
根据权利要求43至46任一项所述的装置，其特征在于，

所述通信单元，还用于向所述第二通信装置发送控制信号；

所述控制信号用于指示时频资源；指示的时频资源用于所述第二通信装置发送所述第二神经网络参数。
根据权利要求47所述的装置，其特征在于，所述控制信号是在协作控制资源上发送的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求43至48任一项所述的装置，其特征在于，

所述通信单元，还用于在协作同步资源上发送同步信号；所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求45，48，49任一项所述的装置，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种通信装置，其特征在于，所述装置包括：

通信单元，用于发送协作请求信息，所述协作请求信息包括多个训练任务，所述多个训练任务是所述第一通信装置将待训练的神经网络模型进行拆分获得的；

所述通信单元，还用于接收来自第二通信装置的第二指示信息，所述第二指示信息用于指示所述第二通信装置参与第一训练任务的训练，所述第一训练任务是所述多个训练任务中的其中一个或多个。
根据权利要求51所述的装置，其特征在于，所述协作请求信息在协作发现资源上发送的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求51或52所述的装置，其特征在于，所述第一训练任务是所述多个训练任务中的其中多个；

所述通信单元，还用于发送第三指示信息，所述第三指示信息用于指示第一训练任务中的其中一个训练任务。
根据权利要求51至53任一项所述的装置，其特征在于，所述通信单元，还用于：

向第二通信装置发送第四指示信息，所述第四指示信息用于指示所述第二通信装置需接收的第一输出、所述第一输出对应的时频资源位置，和/或需发送的第二输出、所述第二输出对应的时频资源位置；

第一输出是所述装置训练的神经网络模型的输出，或者是除所述第二通信装置外的其他第二通信装置训练的神经网络模型的输出；所述第二输出是所述第二通信装置训练的神经网络模型的输出。
根据权利要求54所述的装置，其特征在于，所述第四指示信息是在协作控制资源上发送的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求51至55任一项所述的装置，其特征在于，所述通信单元，还用于：

在协作同步资源上发送同步信号，以使所述第二通信装置根据所述同步信号与所述装置进行同步；

所述协作同步资源是在侧行链路配置信息中配置的。
根据权利要求52，55，56任一项所述的装置，其特征在于，所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种通信装置，其特征在于，所述装置包括：

通信单元，用于接收协作请求信息，所述协作请求信息包括多个训练任务，所述多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的；

处理单元，用于确定参与第一训练任务的训练时，发送第二指示信息；所述第二指示信息用于指示所述第二通信装置参与第一训练任务的训练，所述第一训练任务是所述多个训练任务中的其中一个或多个。
根据权利要求58所述的装置，其特征在于，所述协作请求信息在协作发现资源上接收的，所述协作发现资源是在侧行链路配置信息中配置的。
根据权利要求58或59所述的装置，其特征在于，所述通信单元，还用于：

接收第三指示信息；所述第三指示信息用于指示所述第一训练任务中的其中一个训练任务。
根据权利要求58至60任一项所述的装置，其特征在于，所述通信单元，还用于：

接收第四指示信息，所述第四指示信息用于指示所述装置接收的第一输出、所述第一输出对应的时频资源位置，和/或发送的第二输出、所述第二输出对应的时频资源位置；

所述第一输出是所述第一通信装置训练的神经网络模型的输出，或者是除所述装置外的其他装置训练的神经网络模型的输出；所述第二输出是所述装置训练的神经网络模型的输出。
根据权利要求61所述的装置，其特征在于，所述第四指示信息是协作控制资源上接收的，所述协作控制资源是在侧行链路配置信息中配置的。
根据权利要求58至62任一项所述的装置，其特征在于，

所述通信单元，还用于在协作同步资源上接收同步信号；

所述处理单元，还用于根据所述同步信号，与所述第一通信装置进行同步。
根据权利要求59，62，63任一项所述的装置，其特征在于，

所述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源是预先配置的，或是动态指示的，或是非授权频谱资源。
一种通信装置，其特征在于，包括处理器和收发器，所述收发器用于与其它通信装置进行通信；所述处理器用于运行程序，以使得所述通信装置实现权利要求1至10任一项所述的方法，或者，以使得所述通信装置实现权利要求11至18任一项所述的方法，或者，以使得所述通信装置实现权利要求19至25任一项所述的方法，或者，以使得所述通信装置实现权利要求26至32任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储有指令，当其在计算机上运行时，使得权利要求1至10任一项所述的方法被执行；或者权利要求11至18任一项所述的方法被执行，或者权利要求19至25任一项所述的方法被执行，或者权利要求26至32任一项所述的方法被执行。
一种包含指令的计算机程序产品，其特征在于，当其在计算机上运行时，使得权利要求1至10任一项所述的方法被执行；或者权利要求11至18任一项所述的方法被执行；或者权利要求19至25任一项所述的方法被执行；或者权利要求26至32任一项所述的方法被执行。