WO2024044881A1

WO2024044881A1 - 一种数据处理方法、训练方法及相关装置

Info

Publication number: WO2024044881A1
Application number: PCT/CN2022/115466
Authority: WO
Inventors: 王坚; 滕伟; 李榕
Original assignee: 华为技术有限公司
Priority date: 2022-08-29
Filing date: 2022-08-29
Publication date: 2024-03-07

Abstract

本申请提供了一种数据处理方法，应用于具有人工智能(artificial intelligence，AI)处理能力的无线通信系统中。在该方法中，通过在不同的通信装置上部署结构相同的机器学习模型，由多个装置联合完成数据的处理，以不断地提高所得到的数据的质量，减轻了每个装置的数据处理压力，保证计算能力较弱的装置也能够获得其所需质量的数据。

Description

一种数据处理方法、训练方法及相关装置

技术领域

本申请涉及人工智能(Artificial Intelligence，AI)技术领域，尤其涉及一种数据处理方法、训练方法及相关装置。

背景技术

随着大数据时代的来临，数据规模增长迅猛，如何从大规模数据中挖掘出有价值的信息成为大部分应用场景下亟待解决的问题。目前，通常是采用机器学习模型来对数据进行处理，以挖掘得到数据中有价值的信息。

在采用机器学习模型对数据进行处理之前，往往需要采用大量的数据对机器学习模型进行训练，以训练得到具有较高精度的机器学习模型。然而，在实际应用中，能够用于训练机器学习模型的高质量数据往往是难以获取的。尤其在无线通信网络中，由于干扰和噪声的影响，获取到的数据往往需要经过复杂的处理过程，才能够得到高质量的数据。因此，如何以较低的复杂度获取用于机器学习模型训练的高质量数据，是当前的热门研究方向。

在相关技术中，对原始数据进行处理以得到高质量数据的过程可以看作为一个数据降噪过程。通过机器学习模型对原始数据进行多次降噪处理，则能够得到高质量的数据，整个过程可以用马尔科夫链进行建模。然而，用于降噪的机器学习模型的训练过程复杂度较高，而使用该机器学习模型进行推理，即对数据进行降噪处理，往往需要执行较多次数的降噪处理，数据的处理过程较为复杂，因此设备上需要有大量的计算资源来支持模型的训练和推理，导致大部分计算能力较弱的设备难以实现。

发明内容

本申请提供一种数据处理方法，通过在不同的装置上部署结构相同的机器学习模型，由多个装置联合完成数据的处理，以不断地提高所得到的数据的质量，减轻了每个装置的数据处理压力，保证计算能力较弱的装置也能够实现数据的处理。

本申请第一方面提供一种数据处理方法，以该数据处理方法由第一装置执行为例，该第一装置可以是终端设备或网络设备，或者是终端设备或网络设备中的部分组件(例如处理器、芯片或芯片系统等)。或者，该第一装置还可以是能实现全部或部分终端设备功能的逻辑模块和/或软件。具体地，该方法包括：第一装置接收来自于第二装置的第一数据，第一数据为经过第一机器学习模型处理后的数据；即第二装置通过第一机器学习模型处理得到第一数据后，将第一数据发送给第一装置。然后，第一装置通过第二机器学习模型对第一数据进行处理，得到第二数据。其中，第一机器学习模型的结构与第二机器学习模型的结构相同，第一装置和第二装置用于联合执行数据的处理。

在一些情况下，第一装置和第二装置也可以称为分布式装置。不同的分布式装置之间通过交互数据来实现数据的联合处理。

简单来说，第二装置通过某个机器学习模型对数据进行处理后，将处理后的数据发送给第一装置；第一装置再基于相同结构的机器学习模型继续对数据进行处理，从而实现两个装置联合执行数据的处理。

本方案中，通过在不同的装置上部署机器学习模型，由多个装置联合完成数据的处理，以不断地提高所得到的数据的质量，减轻了每个装置的数据处理压力，保证计算能力较弱的装置也能够获得其所需质量的数据。

在一种可能的实现方式中，第二机器学习模型是扩散模型，使用扩散模型进行的数据处理过程可以建模为马尔科夫链，第二机器学习模型用于对第一数据进行降噪处理。其中，扩散模型可以通过神经网络实现，例如全连接神经网络、卷积神经网络、残差神经网络等。其中，通过扩散模型对数据进行处理的过程是指通过扩散模型不断地处理该扩散模型上一次数据处理所输出的数据，从而实现基于同一个扩散模型逐步对数据进行多步处理，最终得到高质量的输出数据。

本方案中，基于扩散模型的特点，将相同结构的扩散模型部署于不同的装置上，由不同的装置串行地实现数据的联合处理，在能够获得高质量数据的基础上，减轻了每个装置的数据处理压力。

在一种可能的实现方式中，该方法还包括：第一装置接收来自于第二装置的第一信息，该第一信息用于请求第一装置对第一数据执行处理。例如，在第二装置需要获得高质量的数据，且第二装置自身无法完成对数据进行处理的整个过程时，第二装置则通过第一机器学习模型对原始数据进行一部分处理，得到第一数据；并且第二装置向第一装置发送第一数据和第一信息，以请求第一装置协助第二装置继续完成数据的处理。

本方案中，通过在装置之间交互请求信息，使得数据处理能力较弱的装置可以向其他的装置请求协助完成数据的处理，充分地利用了各个装置上的数据处理能力，保证数据处理能力较弱的装置也能够获得其所需质量的数据。

在一种可能的实现方式中，第二装置向第一装置发送的第一信息用于指示第一数据待处理的次数为第一次数。第一装置通过第二机器学习模型对第一数据进行第一次数的处理，得到第二数据。其中，第一装置的能力支持对第一数据完成第一次数的处理。

在一种可能的实现方式中，由于第二装置是向第一装置请求协助完成数据的处理，因此在第一装置处理得到第二数据后，第一装置向第二装置发送第二数据，以实现向第二装置反馈已处理得到的第二数据。

或者，在第二装置并非是首个请求协助处理数据的装置的情况下，第一信息还用于指示源装置的信息，源装置即为首个请求协助处理数据的装置，而第二装置是其中一个协助处理数据的装置，第一装置则是另一个协助处理数据的装置。这样，在第一装置处理得到第二数据后，第一装置向源装置发送第二数据，保证源装置能够获得最终处理好的数据。

在一种可能的实现方式中，第二装置向第一装置发送的第一信息用于指示第一数据待处理的次数为第一次数。第一装置通过第二机器学习模型对第一数据进行第二次数的处理，得到第二数据，其中第一次数大于第二次数，第一装置的能力不支持对第一数据完成第一次数的处理。并且，第一装置向第三装置发送第二数据以及第二信息；其中，第二信息用于指示第二数据待处理的次数为第三次数，第三次数为第一次数与第二次数的差值，第三装置用于协助第一装置执行数据的处理。

简单来说，假设第二装置请求第一装置协助对第一数据处理1000次，而第一装置的能力只能支持第一装置对第一数据完成600次的处理，第一装置则对第一数据完成600次处理，得到第二数据；并且，第一装置向第三装置发送第二信息，以请求第三装置继续对第二数据完成400次处理。

本方案中，多个装置在联合处理数据的过程中，根据自身的能力分别完成对数据的一部分处理，并且将未完成处理的数据发送至下一个装置，由下一个装置继续完成对数据的处理。这样一来，能够在兼顾各个装置本身的数据处理能力的同时，协调了多个装置来联合完成数据的处理，充分利用了各个装置的数据处理能力，保证计算能力较弱的装置也能够获得其所需质量的数据。

在一种可能的实现方式中，该方法还包括：第一装置向第二装置发送请求协助信息，该请求协助信息用于请求第二装置协助处理数据。

也就是说，第一装置可以主动请求第二装置协助处理数据，且由第二装置先对数据进行处理后，再将处理后的数据交由第一装置继续进行处理，避免在第一装置和第二装置之间交互两次数据。

在一种可能的实现方式中，该方法还包括：第一装置向中心装置发送第三信息，第三信息用于指示第一装置所需的数据的处理次数；第一装置接收中心装置的反馈信息，该反馈信息用于指示第二装置为协助节点。也就是说，第一装置可以先向中心装置反馈第一装置所需的数据的处理次数，由中心装置实现多个装置之间的统筹，即中心装置指示第二装置协助第一装置处理数据。

其中，第二装置也可以是向中心装置反馈第二装置所需的数据的处理次数。在这种情况下，中心装置可以确定先由第二装置进行数据的处理，然后再由第一装置在第二装置所处理得到的数据的基础上继续进行数据的处理，从而有效地利用了第二装置处理得到的数据，提高第一装置处理数据的效率。

本方案中，通过中心装置来实现各个分布式装置之间联合处理数据的统筹，能够基于各个分布式装置的需求确定各个分布式装置的数据处理任务，提高分布式装置联合处理数据的效率。

在一种可能的实现方式中，该方法还包括：第一装置接收来自于中心装置的第四信息，第四信息用于指示第一装置从第二装置接收到的数据需执行的处理次数。第一装置根据第四信息，通过第二机器学习模型对第一数据进行处理，得到第一装置所需的第二数据。

也就是说，在中心装置统筹分布式装置联合处理数据的过程中，中心装置可以基于各个分布式装置对数据的处理需求来确定各个分布式装置之间的数据处理顺序以及数据处理次数，从而使得各个分布式装置在接收到其他分布式装置所发送的数据后能够确定数据处理次数。

在一种可能的实现方式中，该第四信息还用于指示第三装置的信息，第三装置为待接收第一装置处理后的数据的装置。其中，第一装置根据第四信息，向第三装置发送第二数据。也就是说，第一装置在第二装置的协助下处理得到第二数据之后，第一装置可以向第三装置发送第二数据，以便于第三装置使用第二数据或者是再继续对第二数据进行处理。

简单来说，中心装置可以在向分布式装置反馈的信息中指示分布式装置需要从哪个分布式装置接收数据、接收到数据后的处理次数以及需要将处理后的数据发送给哪个分布式装置，从而有效地实现协调分布式装置之间的数据联合处理。

在一种可能的实现方式中，该方法还包括：第一装置接收来自于第二装置的第五信息，第五信息用于指示第一数据对应的已处理次数。第一装置根据第一数据对应的已处理次数以及第一装置所需的数据的处理次数，通过第二机器学习模型对第一数据进行处理，得到第一装置所需的第二数据。

本方案中，在前一个分布式装置向后一个分布式装置发送处理后的数据的过程中，前一个分布式装置指示自身已对数据进行处理的次数，能够便于后一个分布式装置根据数据已处理的次数确定仍需对数据进行处理的次数，保证数据的联合处理，且无需由中心装置指定数据处理次数，有利于各个分布式装置根据实际运行情况动态调整数据处理次数。

本申请第二方面提供一种数据处理方法，以该数据处理方法由第一装置执行为例，该第一装置可以是终端设备或网络设备，或者是终端设备或网络设备中的部分组件(例如处理器、芯片或芯片系统等)。或者，该第一装置还可以是能实现全部或部分终端设备功能的逻辑模块和/或软件。

具体地，该方法包括：首先，第一装置通过第一机器学习模型对原始数据执行处理，得到第一数据。然后，第一装置向第二装置发送第一数据。最后，第一装置接收第二装置或其他装置发送的第二数据，第二数据是基于第二机器学习模型处理得到的，第一机器学习模型的结构与第二机器学习模型的结构相同。

可选的，第一装置和第二装置可以提前进行交互，以使得第二装置在接收到第一装置所发送的数据之后，即可确定需要对第一装置所发送的数据进行一定次数的处理。

也就是说，第一装置先确定原始数据需执行的处理次数，并对原始数据执行一定次数的处理，得到第一数据。由于第一装置对原始数据执行处理的次数少于原始数据需执行的处理次数，因此第一装置向第二装置发送第一数据，默认请求第二装置协助处理第一数据。

本方案中，通过在不同的装置上部署机器学习模型，由多个装置的设备联合完成数据的处理，以不断地提高所得到的数据的质量，减轻了每个装置的数据处理压力，保证计算能力较弱的装置也能够获得其所需质量的数据。

在一种可能的实现方式中，第一机器学习模型是扩散模型，使用扩散模型进行的数据处理过程可以建模为马尔科夫链，第一机器学习模型用于对原始数据进行降噪处理。

在一种可能的实现方式中，第一装置还可以是向第二装置发送第一信息，该第一信息用于请求第二装置对第一数据执行处理，和/或第一信息用于指示第一数据待处理的次数，该第一数据待处理的次数是基于原始数据需执行的处理次数以及第一装置对原始数据执行处理的次数确定的。

也就是说，第一装置除了向第二装置发送待处理的第一数据之外，还向第二装置发送第一信息，以指示第二装置如何处理第一数据。

本申请第三方面提供一种数据处理方法，以该数据处理方法由中心装置执行为例，该中心装置可以是终端设备或网络设备，或者是终端设备或网络设备中的部分组件(例如处理器、芯片或芯片系统等)。或者，该中心装置还可以是能实现全部或部分终端设备功能的逻辑模块和/或软件。

具体地，该方法包括：中心装置接收来自于第一装置的第一信息和第二装置的第二信息，其中第一信息用于指示第一装置所需的数据的第一处理次数，第二信息用于指示第二装置所需的数据的第二处理次数，第一处理次数对应的数据处理模型与第二处理次数对应的数据处理模型相同；中心装置向第二装置发送第三信息，第三信息用于指示第二装置向第一装置发送执行处理后的数据。其中，第二装置所需的数据的第二处理次数小于或等于第一装置所需的数据的第一处理次数。

简单来说，第一装置和第二装置也可以称为分布式装置，第一装置和第二装置均向中心装置反馈所需数据的处理次数。中心装置根据第一装置和第二装置所需数据的处理次数，确定第一装置和第二装置在联合处理数据过程中的数据处理顺序，从而指示第二装置向第一装置发送执行处理后的数据。即第二装置先处理数据后，再将处理后的数据发送给第一装置。

在一种可能的实现方式中，该方法还包括：中心装置向第一装置发送第四信息，第四信息用于指示第一装置从第二装置接收到的数据需执行的处理次数。

示例性地，假设第一装置所需数据的处理次数为1000次，第二装置所需数据的处理次数为600次，那么中心装置向第一装置发送的第四信息可以是指示第一装置从第二装置接收到的数据需执行的处理次数为400次。

本申请第四方面提供一种模型训练方法，该方法应用于训练系统中的第一装置，该第一装置可以是终端设备或网络设备，或者是终端设备或网络设备中的部分组件(例如处理器、芯片或芯片系统等)。或者，该第一装置还可以是能实现全部或部分终端设备功能的逻辑模块和/或软件。其中，训练系统包括多个分布式装置。具体地，该方法包括：首先，第一装置获取训练样本集合，该训练样本集合包括第一数据和第二数据，第一数据是基于第二数据得到的，且第二数据为第一数据的训练标签。然后，第一装置基于训练样本集合对第一机器学习模型进行训练，得到训练后的第一机器学习模型。在训练过程中，将第一数据作为第一机器学习模型的输入数据，由第一机器学习模型对第一数据进行处理，并根据处理后的数据和第二数据来计算损失函数，并基于该损失函数更新第一机器学习模型的参数，从而实现第一机器学习模型的训练。在训练结束后，第一装置向第二装置发送训练后的第一机器学习模型，第二装置是用于聚合由多个装置训练得到的结构相同且参数不同的机器学习模型的装置。其中，第二装置也可以称为聚合装置。

本方案中，通过在各个不同的分布式装置上部署相同的机器学习模型，并对相同的机器学习模型进行训练，最后由聚合装置将各个分布式装置所训练的机器学习模型进行聚合，能够实现将训练过程拆分至不同的分布式装置上来执行，减轻各个分布式装置的模型训练压力。

在一种可能的实现方式中，该方法还包括：第一装置向第三装置发送第一信息，第一信息用于指示第一装置上与模型训练相关的能力。其中，第三装置用于基于参与机器学习模型训练的多个装置的能力确定多个装置所负责的训练内容，因此第三装置也可以称为中心装置。在发送第一信息后，第一装置接收来自于第三装置的第二信息，第二信息用于指示第一装置上训练的第一机器学习模型对输入数据进行处理的次数。第二信息还用于指示第一机器学习模型的输入数据的需求。例如，在第一机器学习模型的输入数据是对目标数据进行加噪处理得到的情况下，第一机器学习模型的输入数据的需求可以为对目标数据进行加噪处理的次数。

在第一装置获取训练样本集合的过程中，包括：第一装置根据第二信息所指示的输入数据的需求以及第一机器学习模型对输入数据进行处理的次数，对目标数据进行处理，得到第二数据和第一数据。例如，假设输入数据的需求为对目标数据执行M-N次至M次加噪处理，得到一组数据，并从中得到第一数据和第二数据，其中第二数据是第一数据的训练标签，且获得第二数据所需的加噪次数小于获得其对应的第一数据所需的加噪次数。

在一种可能的实现方式中，该方法还包括：第一装置接收来自于第二装置的第二机器学习模型；第一装置基于训练样本集合对第二机器学习模型进行训练，得到训练后的第二机器学习模型；第一装置向第二装置发送训练后的第二机器学习模型。

也就是说，在第二装置聚合了多个分布式装置的机器学习模型之后，第二装置继续向第一装置发送聚合后得到的第二机器学习模型，以使得第一装置继续对第二机器学习模型进行训练。

本申请第五方面提供一种模型训练方法，该方法应用于第一装置，该第一装置可以是终端设备或网络设备，或者是终端设备或网络设备中的部分组件(例如处理器、芯片或芯片系统等)。或者，该第一装置还可以是能实现全部或部分终端设备功能的逻辑模块和/或软件。所述方法包括：第一装置接收多个能力信息，多个能力信息来自于多个不同的装置，且多个能力信息中的每个能力信息均用于指示装置上与模型训练相关的能力。然后，第一装置根据多个能力信息分别向多个不同的装置发送不同的训练配置信息，该训练配置信息用于指示装置上训练的机器学习模型对输入数据进行处理的次数，该训练配置信息还用于指示装置上训练的机器学习模型的输入数据的需求，多个不同的装置所训练的机器学习模型为结构相同的模型。其中，第一装置也可以称为中心装置。

简单来说，采用机器学习模型对数据不断地进行处理的过程可以视为一个马尔科夫链，采用机器学习模型对数据执行一次处理可以视为马尔科夫链中的一个环节。中心装置可以将马尔科夫链拆分为多个子链，并根据各个分布式装置的能力，将拆分得到的子链配置到不同的分布式装置中，即不同的分布式装置用于执行不同的训练任务。

可选的，分布式装置上与模型训练相关的能力可以包括分布式装置的计算能力、存储能力和通信能力等能力。其中，计算能力可以采用分布式装置每秒能够执行运算的次数来衡量；存储能力可以采用分布式装置上分配给模型训练的存储空间大小来衡量；通信能力可以采用分布式装置上分配给模型训练过程的数据传输速率来衡量。除了上述的多种能力之外，分布式装置上与模型训练相关的能力还可以是包括其他能够影响模型训练的能力，在此不做具体限定。

本申请第六方面提供一种通信装置，该通信装置包括：收发模块，用于接收来自于第二装置的第一数据，所述第一数据为经过第一机器学习模型处理后的数据；处理模块，用于通过第二机器学习模型对所述第一数据进行处理，得到第二数据，所述第一机器学习模型的结构与所述第二机器学习模型的结构相同，所述通信装置和所述第二装置用于联合执行数据的处理。

在一种可能的实现方式中，第二机器学习模型是扩散模型，使用扩散模型进行的数据处理过程可以建模为马尔科夫链，第二机器学习模型用于对第一数据进行降噪处理。

在一种可能的实现方式中，收发模块，还用于接收来自于第二装置的第一信息，第一信息用于请求通信装置对第一数据执行处理。

在一种可能的实现方式中，第一信息用于指示第一数据待处理的次数为第一次数；处理模块还用于通过第二机器学习模型对第一数据进行第一次数的处理，得到第二数据，其中第一装置的能力支持对第一数据完成第一次数的处理。

在一种可能的实现方式中，收发模块，还用于向第二装置发送第二数据；或者，收发模块用于向源装置发送第二数据，其中第一信息还用于指示源装置的信息，源装置为首个请求协助处理数据的装置。

在一种可能的实现方式中，第一信息用于指示第一数据待处理的次数为第一次数；处理模块还用于通过第二机器学习模型对第一数据进行第二次数的处理，得到第二数据，其中第一次数大于第二次数，第一装置的能力不支持对第一数据完成第一次数的处理；收发模块，还用于向第三装置发送第二数据以及第二信息；其中，第二信息用于指示第二数据待处理的次数为第三次数，第三次数为第一次数与第二次数的差值，第三装置用于协助通信装置执行数据的处理。

在一种可能的实现方式中，收发模块，还用于向第二装置发送请求协助信息，请求协助信息用于请求第二装置协助处理数据。

在一种可能的实现方式中，收发模块，还用于向中心装置发送第三信息，第三信息用于指示通信装置所需的数据的处理次数；收发模块，还用于接收中心装置的反馈信息，反馈信息用于指示第二装置为协助节点。

在一种可能的实现方式中，收发模块，还用于接收来自于中心装置的第四信息，第四信息用于指示通信装置从第二装置接收到的数据需执行的处理次数；处理模块，还用于根据第四信息，通过第二机器学习模型对第一数据进行处理，得到通信装置所需的第二数据。

在一种可能的实现方式中，第四信息还用于指示第三装置的信息，第三装置为待接收第一装置处理后的数据的装置；收发模块，还用于根据第四信息，向第三装置发送第二数据。

在一种可能的实现方式中，收发模块，还用于接收来自于第二装置的第五信息，第五信息用于指示第一数据对应的已处理次数；处理模块，还用于根据处理次数以及通信装置所需的数据的处理次数，通过第二机器学习模型对第一数据进行处理，得到通信装置所需的第二数据。

在一种可能的实现方式中，收发模块为收发器，处理模块为处理器。

本申请第七方面提供一种通信装置，包括：处理模块，用于通过第一机器学习模型对原始数据执行处理，得到第一数据；收发模块，用于向第二装置发送第一数据；收发模块，还用于接收第二装置或其他装置发送的第二数据，第二数据是基于第二机器学习模型对第一数据处理得到的，第一机器学习模型的结构与第二机器学习模型的结构相同。

在一种可能的实现方式中，收发模块，还用于向第二装置发送第一信息，第一信息用于请求第二装置对第一数据执行处理，和/或第一信息用于指示第一数据待处理的次数，第一数据待处理的次数是基于原始数据需执行的处理次数以及第一装置对原始数据执行处理的次数确定的。

本申请第八方面提供一种通信装置，包括：收发模块，用于接收来自于第一装置的第一信息和第二装置的第二信息，第一信息用于指示第一装置所需的数据的第一处理次数，第二信息用于指示第二装置所需的数据的第二处理次数，第一处理次数对应的数据处理模型与第二处理次数对应的数据处理模型相同；收发模块，用于向第二装置发送第三信息，第三信息用于指示第二装置向第一装置发送执行处理后的数据，其中第二装置所需的数据的第二处理次数小于或等于第一装置所需的数据的第一处理次数。

在一种可能的实现方式中，收发模块，还用于向第一装置发送第四信息，第四信息用于指示第一装置从第二装置接收到的数据需执行的处理次数。

在一种可能的实现方式中，收发模块为收发器。

本申请第九方面提供一种模型训练装置，包括收发模块，用于获取训练样本集合，训练样本集合包括第一数据和第二数据，第一数据是基于第二数据得到的，且第二数据为第一数据的训练标签；处理模块，用于基于训练样本集合对第一机器学习模型进行训练，得到训练后的第一机器学习模型，其中第一机器学习模型用于对第一数据进行处理；发送模块，用于向第二装置发送训练后的第一机器学习模型，第二装置是用于聚合由多个装置训练得到的结构相同且参数不同的机器学习模型的装置。

在一种可能的实现方式中，发送模块，还用于向第三装置发送第一信息，第一信息用于指示模型训练装置上与模型训练相关的能力，第三装置用于基于参与机器学习模型训练的多个装置的能力确定多个装置所负责的训练内容；收发模块，还用于接收来自于第三装置的第二信息，第二信息用于指示模型训练装置上训练的第一机器学习模型对输入数据进行处理的次数，第二信息还用于指示第一机器学习模型的输入数据的需求；处理模块，还用于：根据第二信息所指示的输入数据的需求以及第一机器学习模型对输入数据进行处理的次数，对原始数据进行处理，得到第二数据；根据第二信息所指示的第一机器学习模型对输入数据进行处理的次数，对第二数据进行处理，得到第一数据。

在一种可能的实现方式中，收发模块，还用于接收来自于第二装置的第二机器学习模型；处理模块，还用于基于训练样本集合对第二机器学习模型进行训练，得到训练后的第二机器学习模型；发送模块，还用于向第二装置发送训练后的第二机器学习模型。

本申请第十方面提供一种模型训练装置，包括收发模块，用于接收多个能力信息，多个能力信息来自于多个不同的装置，且多个能力信息中的每个能力信息均用于指示装置上与模型训练相关的能力；收发模块，用于根据多个能力信息分别向多个不同的装置发送不同的训练配置信息，训练配置信息用于指示装置上训练的机器学习模型对输入数据进行处理的次数，训练配置信息还用于指示装置上训练的机器学习模型的输入数据的需求，多个不同的装置所训练的机器学习模型为结构相同的模型。

在一种可能的实现方式中，收发模块为收发器。

本申请实施例第十一方面提供了一种通信装置，包括至少一个处理器，该至少一个处理器与存储器耦合；该存储器用于存储程序或指令；该至少一个处理器用于执行该程序或指令，以使该装置实现前述第一方面或第一方面任意一种可能的实现方式所述的方法，或，以使该装置实现前述第二方面或第二方面任意一种可能的实现方式所述的方法，或，以使该装置实现前述第三方面或第三方面任意一种可能的实现方式所述的方法，或，以使该装置实现前述第四方面或第四方面任意一种可能的实现方式所述的方法或，以使该装置实现前述第五方面或第五方面任意一种可能的实现方式所述的方法。

一种可能的实现方式中，该通信装置还包括上述存储器。可选地，该存储器和处理器集成在一起，或者，该存储器和处理器分开设置。

一种可能的实现方式中，该通信装置还包括收发器，用于收发数据或信令。

本申请实施例第十二方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，该处理器执行如上述第一方面或第一方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第二方面或第二方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第三方面或第三方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第四方面或第四方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第五方面或第五方面任意一种可能的实现方式所述的方法。

本申请实施例第十三方面提供一种存储一个或多个计算机的计算机程序产品(或称计算机程序)，当计算机程序产品被该处理器执行时，该处理器执行如上述第一方面或第一方面任意一种可能实现方式的方法，或，该处理器执行如上述第二方面或第二方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第三方面或第三方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第四方面或第四方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第五方面或第五方面任意一种可能的实现方式所述的方法。

本申请实施例第十四方面提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持通信装置实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能，或，用于支持通信装置实现上述第二方面或第二方面任意一种可能的实现方式中所涉及的功能，或，用于支持通信装置实现上述第三方面或第三方面任意一种可能的实现方式中所涉及的功能，或，用于支持通信装置实现上述第四方面或第四方面任意一种可能的实现方式中所涉及的功能，或，用于支持通信装置上述第五方面或第五方面任意一种可能的实现方式所述的方法。

在一种可能的设计中，该芯片系统还可以包括存储器，用于保存该通信装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。可选地，该芯片系统还包括接口电路，该接口电路为该至少一个处理器提供程序指令和/或数据。

本申请实施例第十五方面提供了一种通信系统，该通信系统包括上述第六方面和第七方面所涉及的通信装置，和/或，该通信系统包括上述第六方面、第七方面和第八方面所涉及的通信装置，和/或，该通信系统包括上述第九方面和第十方面的通信装置。

其中，第六方面至第十五方面中任一种设计方式所带来的技术效果可参见上述第一方面至第五方面中不同实现方式所带来的技术效果，在此不再赘述。

附图说明

图1为本申请实施例提供的一种扩散模型处理数据的过程示意图；

图2为本申请实施例提供的一种全连接神经网络的部分结构示意图；

图3为本申请实施例提供的一种神经网络训练的过程示意图；

图4为本申请实施例提供的一种神经网络执行反向传播的过程示意图；

图5为本申请实施例提供的一种无线通信系统的架构示意图；

图6为本申请实施例提供的一种智能家居通信系统的架构示意图；

图7为本申请实施例提供的一种模型训练方法的流程示意图；

图8为本申请实施例提供的一种模型训练方法的另一流程示意图；

图9A为本申请实施例提供的一种数据处理方法900的流程示意图；

图9B为本申请实施例提供的一种数据处理方法900的另一流程示意图；

图10A为本申请实施例提供的一种数据处理方法1000的流程示意图；

图10B为本申请实施例提供的一种数据处理方法1000的另一流程示意图；

图11为本申请实施例提供的一种数据处理方法1100的流程示意图；

图12为本申请实施例提供的一种数据处理方法1200的流程示意图；

图13为本申请实施例提供的一种通信装置1300的结构示意图；

图14为本申请实施例提供的一种模型训练装置1400的结构示意图；

图15为本申请实施例提供的一种通信装置1500的结构示意图；

图16为本申请实施例提供的一种通信装置1600的结构示意图；

图17为本申请实施例提供的一种通信装置1700的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象(例如，区分同一实施例中的对象)，而不必用于描述特定的顺序或先后次序，且在不同实施例中“第一”、“第二”等限定的对象(如“第一信息”、“第一装置”、“第二信息”、“第二装置”等)可能指代不同的对象，例如实施例一中“第一装置”可能指代分布式节点，实施例二中“第一装置”可能指代中心节点。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号，并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤，已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序，只要能达到相同或者相类似的技术效果即可。

为了便于理解，以下先介绍本申请实施例所涉及的技术术语。

(1)终端设备

终端设备是指能够接收网络设备发送的调度信息和指示信息的无线终端设备。无线终端设备可以是指向用户提供语音和/或数据连通性的设备，或具有无线连接功能的手持式设备，或连接到无线调制解调器的其他处理设备。

终端设备可以经无线接入网(wireless access network，RAN)与一个或多个核心网或者互联网进行通信。示例性地，终端设备可以是移动终端设备，如移动电话(或称为“蜂窝”电话，手机(mobile phone))、计算机和数据卡，例如，可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语音和/或数据。又例如，终端设备还可以是个人通信业务(personal communication service，PCS)电话、无绳电话、会话发起协议(Session initialization Protocol，SIP)话机、无线本地环路(wireless local loop，WLL)站、个人数字助理(personal digital assistant，PDA)、平板电脑(Tablet Personal Computer，Tablet PC)、带无线收发功能的电脑等设备。一般地，终端设备也可以称为系统、订户单元(subscriber unit)、订户站(subscriber station)，移动站(mobile station)、移动台(mobile station，MS)、远程站(remote station)、接入点(access point，AP)、远程终端设备(remote terminal)、接入终端设备(access terminal)、用户终端设备(user terminal)、用户代理(user agent)、用户站(subscriber station，SS)、用户端设备(customer premises equipment，CPE)、终端(terminal)、用户设备(user equipment，UE)、移动终端(mobile terminal，MT)等。

作为示例而非限定，在本申请实施例中，终端设备还可以是可穿戴设备。可穿戴设备也可以称为穿戴式智能设备或智能穿戴式设备等，是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称，如眼镜、手套、手表、服饰及鞋等。可穿戴设备即直接穿在身上，或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备，更是通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能，例如：智能手表或智能眼镜等，以及只专注于某一类应用功能，需要和其它设备如智能手机配合使用，如各类进行体征监测的智能手环、智能头盔、智能首饰等。

终端还可以是无人机、机器人、设备到设备通信(device-to-device，D2D)中的终端、车到一切(vehicle to everything，V2X)中的终端、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。

此外，终端设备也可以是第五代(5th generation，5G)通信系统、之后演进的通信系统(例如第六代(6th generation，6G)通信系统等)中的终端设备或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的终端设备等。示例性的，6G网络可以进一步扩展5G通信终端的形态和功能，6G终端包括但不限于车、蜂窝网络终端(融合卫星终端功能)、无人机、物联网(internet of things，IoT)设备。

在本申请实施例中，上述终端设备可以是具有AI处理能力，能够采用AI模型对数据进行处理。

(2)网络设备

网络设备可以是指无线网络中提供无线接入服务的设备。例如，网络设备可以为将终端设备接入到无线网络的RAN节点(或RAN设备)，又可以称为基站。目前，一些RAN设备的举例为：5G通信系统中的下一代基站(the next Generation Node B，gNB)、传输接收点(transmission reception point，TRP)、演进型节点B(evolved Node B，eNB)、无线网络控制器(radio network controller，RNC)、节点B(Node B，NB)、家庭基站(例如，home evolved Node B，或home Node B，HNB)、基带单元(base band unit，BBU)，或无线保真(wireless fidelity，Wi-Fi)接入点(Access Point，AP)等。另外，在一种网络结构中，网络设备可以包括集中单元(centralized unit，CU)节点、或分布单元(distributed unit，DU)节点、或包括CU节点和DU节点的RAN设备。

网络设备可以是其它为终端设备提供无线通信功能的装置。本申请的实施例对网络设备所采用的具体技术和具体设备形态不做限定。为方便描述，本申请实施例并不限定。

网络设备还可以包括核心网设备，核心网设备例如包括第四代(4th generation，4G)网络中的移动性管理实体(mobility management entity，MME)，归属用户服务器(home subscriber server，HSS)，服务网关(serving gateway，S-GW)，策略和计费规则功能(policy and charging rules function，PCRF)，公共数据网网关(public data network gateway，PDN gateway，P-GW)；5G网络中的访问和移动管理功能(access and mobility management function，AMF)、用户面功能(user plane function，UPF)或会话管理功能(session management function，SMF)等网元。此外，该核心网设备还可以包括5G网络以及5G网络的下一代或未来网络中的其他核心网设备。

本申请实施例中，上述网络设备还可以具有AI能力的网络节点，可以为终端或其他网络设备提供AI服务，例如，可以为网络侧(接入网或核心网)的AI节点、算力节点、具有AI能力的RAN节点、具有AI能力的核心网网元等。

本申请实施例中，用于实现网络设备的功能的装置可以是网络设备，也可以是能够支持网络设备实现该功能的装置，例如芯片系统，该装置可以被安装在网络设备中。

(3)马尔科夫链(Markov Chain,MC)

马尔可夫链是指概率论和数理统计中具有马尔可夫性质(Markov property)且存在于离散的指数集(index set)和状态空间(state space)内的随机过程(stochastic process)。

简单来说，马尔可夫链是一组具有马尔可夫性质的离散随机变量的集合。具体地，对概率空间(Ω，F，P)内以一维可数集为指数集的随机变量集合X，其中，概率空间(Ω，F，P)是一个总测度为1的测度空间；Ω是一个非空集合，也称为样本空间；F是样本空间Ω的幂集的一个非空子集；P为概率。若随机变量集合X中的随机变量的取值都在可数集内：X _i＝s _i，s _i∈s，且随机变量的条件概率满足公式1所示的关系：

p(X _t+1|X _t，...，X ₁)＝p(X _t+1|X _t) 公式1

那么，X被称为马尔可夫链，可数集S被称为状态空间(state space)，马尔可夫链在状态空间内的取值称为状态。其中，X _i为随机变量集合X中的随机变量，i可以为大于0的任意整数；S _i为可数集S中的元素。可数集S是指集合中的每个元素都能与自然数集的每个元素建立一一对应关系的集合。

(4)扩散模型

扩散模型是一种利用马尔科夫链原理来处理数据的人工智能模型。对于带有噪声的数据，能够采用扩散模型对数据进行降噪处理，从而能够获得更高质量的数据。以下将介绍扩散模型对数据进行降噪处理的原理。

请参阅图1，图1为本申请实施例提供的一种扩散模型处理数据的过程示意图。如图1所示，给定数据X ₀服从分布q(X ₀)，按照图1中从右到左的顺序对数据X ₀进行逐步加噪。其中，每一次加噪均能够得到一个新的数据。在对数据X ₀进行T次逐步加噪后，得到X ₁到X _T共T个数据。

具体地，数据的加噪过程可以看作是一个马尔科夫过程。基于数据X ₀获得X ₁到X _T的条件概率为：

其中，t的取值范围为1≤t≤T，∏表示求乘积，单步转移概率为

表示从X _t-1到X _t是一个以

为均值且以β _t为方差的高斯分布变换；方差参数β _t是可设计参数。在数据的加噪过程中，当加噪步数T足够大，且β _t选择合理时，最终得到的X _T将符合均值为0且方差为I的高斯分布，即

在这种情况下，可以通过一个反向过程来对数据进行降噪处理(即图1中从左往右处理数据的过程)。具体地，从一个高斯分布采样得到的样本开始，逐步生成符合给定分布的数据样本。由于反向过程的转移概率q(X _t|X _t-1)难以计算，因此可以通过神经网络进行近似。示例性地，用p _θ(X _t|X _t-1)近似反向过程的转移概率，并使得p _θ(X _t|X _t-1)符合高斯分布，即

其中，

表示从X _t到X _t-1是一个以μ _θ(Xt _，t)为均值且以Σ _θ(X _t，t)为方差的高斯分布变换；均值μ _θ(X _t，t)和方差Σ _θ(X _t，t)都可以通过神经网络进行近似。实验发现，方差项的影响较小，一般可以将其固定，如

其中σ _t为不进行学习的参数，即σ _t为可设计参数。通过神经网络学习均值μ _θ(X _t，t)，即神经网络的输入为第t步的数据X _t和步数索引t，可训练参数为θ。

实验显示，也可以使用神经网络来近似表达噪声项ε _θ(X _t，t)，其中噪声项ε _θ(X _t，t)表示从X _t-1到X _t的加噪参数，再通过

获得生成数据X ₀，其中， α _t＝1-β _t，

t＝1时z＝0，t＞1时

简单来说，如图1所示，通过对原始数据X ₀进行逐步加噪，最终能够得到噪声满足高斯分布的数据X _T。通过采用扩散模型，对数据X _T进行逐步降噪处理，最终能够还原得到数据X ₀。其中，扩散模型是一种神经网络模型，例如全连接神经网络、卷积神经网络、残差神经网络等，本实施例并不限定扩散模型的具体模型结构。

为便于理解，以下将以全连接神经网络为例，对神经网络以及其训练的方法进行介绍。其中，全连接神经网络又叫多层感知机(multilayer perceptron，MLP)。请参阅图2，图2为本申请实施例提供的一种全连接神经网络的部分结构示意图。如图2所示，一个MLP包含一个输入层(左侧)，一个输出层(右侧)，及多个隐藏层(中间)。

可选的，图2中的输入层对应的数据可以称为输入数据，该输入数据可以包括训练所需数据或推理所需数据，例如上述图1中的数据X _t。图2中的多个隐藏层部署有相应的模型参数，用于基于这些模型参数对输入数据进行处理。图2中的输出层对应的数据可以称为输出数据，是由多个隐藏层对输入数据进行处理后所得到的数据，例如上述图1中的数据X ₀。

此外，上述MLP的每层包含若干个节点，称为神经元。其中,相邻两层的神经元间两两相连。

可选的，考虑相邻两层的神经元，下一层的神经元的输出h为所有与之相连的上一层神经元的输出x的加权和并经过激活函数，可以表示为以下的公式2：

h＝f(wx+b) 公式2

其中，w为权重矩阵，b为偏置向量，f为激活函数。

进一步的，神经网络的输出可以表示为以下的公式3：

y＝f _n(w _nf _n-1(...)+b _n) 公式3

其中，n为神经网络的层数，且n的取值为大于1的整数。换言之，可以将神经网络理解为一个从输入数据集合到输出数据集合的映射关系。而通常神经网络都是随机初始化的，用已有数据从随机的w和b得到这个映射关系的过程被称为神经网络的训练。

可选的，训练的具体方式为采用损失函数(loss function)对神经网络的输出结果进行评价。请参阅图3，图3为本申请实施例提供的一种神经网络训练的过程示意图。如图3所示，可以将误差反向传播，通过梯度下降的方法即能迭代优化神经网络参数(包括w和b)，直到损失函数达到最小值，即图3中的“最优点”。可以理解的是，图3中的“最优点”对应的神经网络参数可以作为训练好的AI模型信息中的神经网络参数。

可选的，梯度下降的过程可以表示为以下的公式4：

其中，θ为待优化参数(包括w和b)，L为损失函数，η为学习率，控制梯度下降的步长，

表示求偏导数，

为损失函数L的偏导数，

为待优化参数的偏导数。

进一步的，反向传播的过程可以利用求偏导的链式法则。请参阅图4，图4为本申请实施例提供的一种神经网络执行反向传播的过程示意图。如图4所示，前一层参数的梯度可以由后一层参数的梯度递推计算得到，可以表达为以下的公式5：

其中，W _ij为节点j连接节点i的权重，S _i为节点i上的输入加权和。

以上介绍了本申请实施例所涉及的技术术语，以下将介绍本申请实施例提供的方法所应用的场景。

请参阅图5，图5为本申请实施例提供的一种无线通信系统的架构示意图。如图5所示，无线通信系统中包括网络设备501和终端设备502。其中，终端设备502可以包括一个或多个终端设备，例如图5中所示的智能手环、智能手机、智慧电视以及笔记本电脑。其中，网络设备501与终端设备502中的各个终端设备建立无线连接，终端设备502中的终端设备之间也可以建立有无线连接。在图5所示的无线通信系统中，网络设备501可以向终端设备502发送下行数据，例如需要训练的模型；终端设备502中的各个终端设备可以向网络设备501发送上行数据，例如训练好的模型。此外，终端设备502中的各个终端设备之间还可以互相发送数据，例如模型训练过程中所需的数据或模型推理过程中所需的数据。

需要说明的是，本申请实施例所提及的无线通信系统包括但不限于：第五代移动通信技术(5th Generation Mobile Communication Technology，5G)通信系统、6G通信系统、卫星通信系统、短距通信系统、窄带物联网系统(Narrow Band-Internet of Things，NB-IoT)、全球移动通信系统(Global System for Mobile Communications，GSM)、增强型数据速率GSM演进系统(Enhanced Data rate for GSM Evolution，EDGE)、宽带码分多址系统(Wideband Code Division Multiple Access，WCDMA)、码分多址2000系统(Code Division Multiple Access，CDMA2000)、时分同步码分多址系统(Time Division-Synchronization Code Division Multiple Access，TD-SCDMA)以及长期演进系统(Long Term Evolution，LTE)等通信系统。本申请实施例并不对无线通信系统的具体架构进行限定。

请参阅图6，图6为本申请实施例提供的一种智能家居通信系统的架构示意图。如图6所示，在智能家居场景中，各种智能家居产品之间通过无线网络连接，以实现智能家居产品之间能够互相传输数据。在图6中，以智慧电视、智能空气净化器、智能饮水机、智能音箱以及扫地机器人等智能家居产品为例，这些智能家居产品均通过无线路由器连接至同一个无线网络中，从而实现各个智能家居产品之间的数据交互。除了上述示例的智能家居产品之外，在实际应用中还可以包括其他类型的智能家居产品，例如智能冰箱、智能抽油烟机、智能窗帘等智能家居产品，本实施例并不对智能家居产品的类型进行限定。

此外，不同的智能家居产品之间也可以是直接进行无线连接，而不需要通过无线路由器接入到同一个无线网络中。例如，各个智能家居产品之间通过蓝牙来实现无线连接。

除了上述图5和图6所介绍的场景以外，本申请实施例提供的方法还可以应用于其他的通信系统场景下。例如，在智能工厂场景中，不同的设备(例如智能机器人、车床、搬运车辆等设备)之间通过无线网络进行连接，并通过无线网络互相传递数据。本申请实施例并不对数据处理方法所应用的具体场景进行限定。

以上介绍了本申请实施例提供的方法所应用的场景。为便于理解，以下将先介绍本申请实施例中执行于模型训练阶段的模型训练方法，再进一步介绍本申请实施例中执行于模型推理阶段的数据处理方法。

请参阅图7，图7为本申请实施例提供的一种模型训练方法的流程示意图。如图7所示，该模型训练方法包括以下的步骤701-708。

步骤701，中心装置接收多个能力信息。

本实施例中，中心装置用于获取各个分布式装置的能力信息，并基于各个分布式装置的能力信息为各个分布式装置分配训练任务。其中，中心装置所接收到的多个能力信息来自于多个不同的分布式装置(例如图7中所示的分布式装置1-分布式装置N)。并且，多个能力信息中的每个能力信息均用于指示分布式装置上与模型训练相关的能力。简单来说，每个分布式装置收集本装置上与模型训练相关的能力，并通过向中心装置发送能力信息的方式来向中心装置反馈自身与模型训练相关的能力。

具体地，中心装置例如为上述所介绍的终端设备或网络设备；或者，中心装置为用于实现上述终端设备或网络设备的功能的装置，例如中心装置为终端设备或网络设备中的芯片或芯片系统。分布式装置例如为上述的终端设备，或者用于实现上述终端设备的功能的装置。在一个具体的示例中，中心装置可以为上述的基站，分布式装置可以为智能手环、智能手表、智慧电视、智能手机或笔记本电脑等终端设备。

可选的，分布式装置上与模型训练相关的能力可以包括分布式装置的计算能力、存储能力和通信能力等能力中的一项或多项能力。其中，计算能力可以采用分布式装置每秒能够执行运算的次数来衡量；存储能力可以采用分布式装置上分配给模型训练的存储空间大小来衡量；通信能力可以采用分布式装置上分配给模型训练过程的数据传输速率来衡量。除了上述的多种能力之外，分布式装置上与模型训练相关的能力还可以是包括其他能够影响模型训练的能力，本实施例对此不做具体限定。

步骤702，中心装置根据多个能力信息分别向多个不同的分布式装置发送对应的训练配置信息。

在接收到多个能力信息后，中心装置能够获取参与模型训练的各个分布式装置执行模型训练的能力。基于各个分布式装置执行模型训练的能力，中心装置能够确定各个分布式装置在整个模型训练阶段的训练配置信息。其中，训练配置信息是指分布式装置在模型训练阶段需要执行的具体训练任务。

示例性地，由上述对扩散模型的介绍可知，通过扩散模型对数据进行降噪处理的过程实际上是采用同一个机器学习模型不断地对数据进行处理，从而逐步降低数据中的噪声，进而得到高质量的数据。扩散模型对数据执行降噪处理的次数越多，那么所得到的数据的质量则越高。

简单来说，采用机器学习模型对数据不断地进行处理的过程可以视为一个马尔科夫链，采用机器学习模型对数据执行一次处理可以视为马尔科夫链中的一个环节。中心装置可以将马尔科夫链拆分为多个子链，并根据各个分布式装置的能力，将拆分得到的子链配置到不同的分布式装置中。其中，在中心装置将拆分得到的子链配置到不同的分布式装置之后，不同的分布式装置用于执行不同的训练任务。例如，分布式装置1执行训练任务1，分布式装置2执行训练任务2，分布式装置3执行训练任务3。又或者，部分分布式装置可以是用于执行相同的训练任务。例如，分布式装置1执行训练任务1，分布式装置2也执行训练任务1，分布式装置3执行训练任务2。

示例性地，中心装置所发送的训练配置信息用于指示分布式装置上训练的机器学习模型对输入数据进行处理的次数。并且，由于各个分布式装置分别负责训练阶段中不同的环节，因此各个分布式装置上所训练的机器学习模型的输入数据的质量需求也是不同的。因此，训练配置信息还用于指示分布式装置上训练的机器学习模型的输入数据的需求。

例如，假设整个训练阶段中的训练任务为：通过机器学习模型对进行了T次加噪处理的数据X _T(输入数据)进行T次处理，得到数据X ₀；那么训练任务可以被分为三个不同的子训练任务，且这三个子训练任务部署于不同的分布式装置中。其中，第一个子训练任务可以为通过机器学习模型对进行了T次加噪处理的数据X _T进行n次处理，得到数据X _T-n；第二个子训练任务可以为通过机器学习模型对进行了T-m次加噪处理的数据X _T-m进行k次处理，得到数据X _T-m-k；第三个子训练任务可以为通过机器学习模型对进行了w次加噪处理的数据X _w进行w次处理，得到数据X ₀。

步骤703，聚合装置向多个分布式装置发送机器学习模型和目标数据样本。

本实施例中，聚合装置用于聚合各个分布式装置训练得到的模型，并向各个分布式装置反馈聚合后的模型。其中，聚合装置和前述的中心装置可以为同一个装置，也可以为不同的装置，本实施例对此不做具体限定。

示例性地，聚合装置例如为上述所介绍的终端设备或网络设备；或者，聚合装置为用于实现上述终端设备或网络设备的功能的装置，例如聚合装置为终端设备或网络设备中的芯片或芯片系统。在一个具体的示例中，中心装置可以为上述的基站，聚合装置可以为上述的基站或服务器，分布式装置可以为智能手环、智能手表、智慧电视、智能手机或笔记本电脑等终端设备。

可选的，聚合装置向多个分布式装置所发送的机器学习模型是相同的，以便于多个分布式装置对同一个机器学习模型执行模型训练。并且，聚合装置所发送的机器学习模型中的参数可以是随机初始化后所得到的初始参数。示例性地，聚合装置所发送的机器学习模型可以为扩散模型，该机器学习模型用于对数据进行降噪处理。

此外，聚合装置向多个分布式装置所发送的目标数据样本也可以是相同的，以便于不同的分布式装置根据训练配置信息生成相应的训练样本集合。其中，聚合装置向多个分布式装置所发送的目标数据样本可以为具有较高质量的数据，例如目标数据样本(例如图1中的X ₀)为一个没有噪声的图像。分布式装置对机器学习模型进行训练的过程是：分布式装置先通过对目标数据样本进行加噪处理，得到质量较低的训练样本；然后，分布式装置将训练样本输入机器学习模型，通过机器学习模型对训练样本进行降噪处理，并基于机器学习模型的输出结果对机器学习模型进行训练。

可选的，聚合装置所发送的目标数据样本可以是由需要训练的机器学习模型的类型来确定的，本实施例对目标数据样本的具体类型并不做具体限定。

例如，在需要训练的机器学习模型为通信系统中收发机各模块的机器学习模型时，比如发送机机器学习模型、接收机机器学习模型、信道估计机器学习模型、信道压缩反馈机器学习模型、预编码机器学习模型、波束管理机器学习模型或定位机器学习模型，数据样本则可以为信道数据。

又例如，在需要训练的机器学习模型为图像处理模型时，比如图像分类模型、图像增强模型、图像压缩模型或图像检测模型，数据样本则可以为图像数据。

再例如，在需要训练的机器学习模型为语音处理模型时，比如语音识别模型或语音生成模型，数据样本则可以为语音数据。

需要说明的是，本实施例中对步骤702和703之间的执行顺序并不做具体限定，步骤703可以是在步骤702之前执行，或者步骤703与步骤702同时执行。

步骤704，分布式装置基于目标数据样本生成训练样本集合。

由于中心装置向分布式装置所发送的训练配置信息中指示了分布式装置上训练的机器学习模型对输入数据(例如图1中的X _T)进行处理的次数以及输入数据的需求，因此分布式装置可以基于目标数据样本(例如图1中的X ₀)来生成训练样本集合，以用于后续机器学习模型的训练。其中，分布式装置所生成的训练样本集合中的各个训练样本均满足训练配置信息中所指示的输入数据的需求。

可选的，分布式装置基于目标数据样本所生成的训练样本集合可以包括第一数据和第二数据，其中第一数据为机器学习模型在训练过程中的输入数据，第二数据则为第一数据的训练标签。其中，机器学习模型的输入数据的训练标签用于结合机器学习模型的输出结果来生成损失函数，以便于基于损失函数更新机器学习模型，完成机器学习模型的训练。以第一数据和第二数据为例，在机器学习模型的一轮迭代训练中，将第一数据输入机器学习模型，得到机器学习模型的输出结果；然后，通过计算机器学习模型的输出结果与第二数据(即输入数据的训练标签)之间的差异来构建损失函数；最后，基于损失函数的值来更新机器学习模型中的参数，从而完成机器学习模型的一轮迭代训练。

在第一数据和第二数据的生成过程中，分布式装置根据训练配置信息所指示的输入数据的需求以及机器学习模型对输入数据进行处理的次数，对目标数据样本进行处理(例如加噪处理)，得到第二数据。然后，分布式装置根据训练配置信息所指示的机器学习模型对输入数据进行处理的次数，对第二数据进行处理(例如加噪处理)，得到第一数据。

其中，输入数据的需求用于指示输入数据是什么样的数据，例如输入数据为对目标数据样本执行指定次数加噪处理后得到的数据。分布式装置对目标数据样本进行处理后，得到第二数据，且分布式装置对目标数据样本进行处理的次数为输入数据的需求中所指示的次数与机器学习模型对输入数据进行处理的次数之间的差值。

然后，分布式装置根据训练配置信息所指示的机器学习模型对输入数据进行处理的次数，对第二数据进行处理，得到第一数据。

例如，假设输入数据的需求指示输入数据为对目标数据样本执行M次加噪处理所得到的数据，且机器学习模型对输入数据进行处理的次数为N次，那么分布式装置可以对目标数据样本X ₀执行M-N次至M次加噪处理，得到数据{X _M-N，X _M-N+1，…，X _M}，将其中的数据X _M-N作为第二数据，X _M作为第一数据。即，第一数据(输入数据)为对目标数据样本X ₀执行M次加噪处理后的数据X _M，第二数据为对目标数据样本X ₀执行M-N次加噪处理后的数据X _M-N，即训练标签，用于在机器学习模型的一轮迭代训练中(如降噪处理的训练)，作为与第一数据输入机器学习模型而得到的输出结果进行差异比较的对象，以用于确定损失函数来更新机器学习模型中的参数，从而完成机器学习模型的一轮迭代训练。

也就是说，在实际应用中，分布式装置是基于训练配置信息所指示的输入数据的需求以及机器学习模型对输入数据进行处理的次数，先对目标数据样本进行M-N次的加噪处理，得到第二数据后，再对第二数据进行N次的加噪处理，得到第一数据。

示例性地，假设分布式装置从聚合装置处获得的目标数据样本为数据X ₀，训练配置信息指示分布式装置上训练的机器学习模型对输入数据进行处理的次数为5，且机器学习模型的输入数据的需求指示输入数据为对目标数据样本加噪15次后的数据。那么，分布式装置可以先对从聚合装置处获得的目标数据样本X ₀执行10次至15次加噪处理，得到数据{X ₁₀，X ₁₁，X ₁₂，X ₁₃，X ₁₄，X ₁₅}。其中，数据X ₁₀是指对目标数据样本X ₀执行10次加噪处理所得到的数据(即第二数据)；数据X ₁₅是指对目标数据样本X ₀执行15次加噪处理所得到的数据(即第一数据)，数据X ₁₅可以是对X ₁₀进行5次加噪处理后得到的数据。然后，在训练过程中，将数据X ₁₅作为机器学习模型的输入数据(即上述的第一数据)，并将数据X ₁₀作为输入数据的训练标签(即上述的第二数据)。可选的，分布式装置对数据样本进行加噪处理的方式具体可以是根据公式

所示的条件概率分布来进行采样，从而获得输入数据。

步骤705，分布式装置基于训练样本集合训练机器学习模型，得到训练后的机器学习模型。

示例性地，在生成训练样本集合后，分布式装置将训练样本集合中作为输入数据的第一数据输入至机器学习模型中，得到机器学习模型的输出数据；然后，分布式装置基于输入数据的训练标签(即第二数据)和输出数据计算损失函数，并基于损失函数的值对机器学习模型进行更新，得到训练后的机器学习模型。其中，机器学习模型基于损失函数进行更新的过程具体可以参考上述的介绍，在此不再赘述。

步骤706，分布式装置向聚合装置发送训练后的机器学习模型。

在各个分布式装置基于本装置上所生成的训练样本对机器学习模型进行训练，并得到训练后的机器学习模型后，各个分布式装置向聚合装置发送训练后的机器学习模型，以便于聚合装置对机器学习模型进行聚合。

步骤707，聚合装置聚合各个分布式装置发送的训练后的机器学习模型，得到聚合模型。

可选的，由于各个分布式装置所训练的机器学习模型是结构相同的模型，因此各个分布式装置训练得到的机器学习模型为结构相同但参数不同的模型。在聚合装置接收到分布式装置所发送的多个训练后的机器学习模型后，聚合装置可以对多个训练后的机器学习模型中的参数进行加权求和，得到新的参数，其中新的参数则为聚合模型的参数。也就是说，在聚合装置对各个分布式装置发送的训练后的机器学习模型进行聚合后，所得到的聚合模型的结构不发生变化，但聚合模型中的参数发生了变化，且聚合模型中的参数是基于各个分布式装置所发送的训练后的机器学习模型得到的。

需要说明的是，除了上述对多个训练后的机器学习模型中的参数进行加权求和，以得到聚合模型的方式之外，聚合装置还可以通过其他的方式来实现模型的聚合，本实施例对此不做具体限定。

步骤708，聚合装置向各个分布式装置发送聚合模型。

在实现模型的聚合后，聚合装置则向各个分布式装置发送聚合模型，以便于各个分布式装置对聚合模型继续进行训练。

可以理解的是，以上步骤701-708介绍了分布式装置对机器学习模型进行第一轮迭代训练的过程。在实际应用中，分布式装置可能需要对机器学习模型进行多轮迭代训练。因此，在各个分布式装置接收到聚合装置发送的聚合模型后，各个分布式装置和聚合装置循环执行上述的步骤704-708，直至达到机器学习模型训练终止的条件。其中，机器学习模型训练终止的条件可以为分布式装置对机器学习模型进行迭代训练的轮数达到预设轮次数；或者，分布式装置训练得到的机器学习模型的性能达到了预设要求。

为了便于理解，以下将结合具体例子详细介绍本申请实施例提供的模型训练方法。如图8所示，图8中以基站为聚合装置，智能手机、智能手表、智能手环以及笔记本电脑等终端设备为多个分布式装置为例，对模型训练方法的过程进行详细介绍。如图8所示，模型训练方法的过程包括以下的四个阶段。

阶段1，基站向参与模型训练的多个终端设备发送目标数据样本X ₀和机器学习模型。

在机器学习模型的第一轮迭代训练过程中，基站向多个终端设备发送的机器学习模型可以为随机初始化参数后的机器学习模型。在第N(N大于1)轮迭代训练过程中，基站向多个终端设备发送的机器学习模型则为聚合上一轮迭代训练得到的多个机器学习模型后的聚合模型。

阶段2，多个终端设备分别基于目标数据样本X ₀生成训练样本，并基于训练样本训练机器学习模型。

由于智能手机、智能手表、智能手环以及笔记本电脑等终端设备被分配了不同的训练内容，因此各个终端设备分别基于目标数据样本生成匹配训练内容的训练样本，并基于训练样本来训练基站所发送的机器学习模型。

示例性地，如图8中所示，智能手机中所训练的机器学习模型的输入数据的需求指示输入数据为对目标数据样本X ₀进行T次加噪后所得到的数据；并且，智能手机中的机器学习模型需要对输入数据进行3次处理，得到输出数据。因此，在生成训练样本的过程中，智能手机对目标数据样本X ₀执行T-3次至T次加噪处理，得到数据{X _T-3，X _T-2，X _T-1，X _T}；基于数据{X _T-3，X _T-2，X _T-1，X _T}，智能手机可以构建得到一组包括输入数据和训练标签的训练样本(X _T，X _T-3)，其中训练样本中的数据X _T为输入数据，数据X _T-3为训练标签。在训练过程中，智能手机通过复用待训练的机器学习模型，得到由3个相同的待训练的机器学习模型依次连接构成的总模型，其中总模型中后一个机器学习模型的输入为前一个机器学习模型的输出；然后，智能手机将训练样本中的输入数据输入总模型中，得到总模型所输出的输出数据，以便于基于输出数据和训练样本中的训练标签构建用于更新机器学习模型的损失函数。

例如，对于训练样本(X _T，X _T-3)，将数据X _T-3输入总模型中，得到总模型的输出数据X _T’，根据输出数据X _T’和训练标签X _T计算损失函数的值。然后，再基于计算得到的损失函数的值来更新机器学习模型的参数。

可选的，由于总模型是由3个相同的机器学习模型依次连接得到的，因此实际上总模型中的每个机器学习模型都会具有对应的输出数据。在训练机器学习模型时，除了基于总模型的输出数据(即总模型中第三个机器学习模型的输出数据)来构建损失函数之外，还可以是基于总模型中其他的机器学习模型的输出数据来一并构建损失函数。

例如，将数据X _T-3输入总模型后，得到总模型中第一个机器学习模型所输出的输出数据X _T-2’、总模型中第二个机器学习模型所输出的输出数据X _T-1’、总模型中第三个机器学习模型所输出的输出数据X _T’。然后，基于训练标签X _T-2和输出数据X _T-2’构建损失函数1，基于训练标签X _T-1和输出数据X _T-1’构建损失函数2，基于训练标签X _T和输出数据X _T’构建损失函数3。最后，基于损失函数1、损失函数2和损失函数3计算得到总损失函数，并基于总损失函数的值更新机器学习模型，从而得到训练后的机器学习模型。

类似地，对于智能手表而言，智能手表中所训练的机器学习模型的输入数据为X _T-3，即对目标数据样本X ₀进行T-3次加噪后所得到的数据；并且，智能手表中的机器学习模型需要对输入数据进行2次处理，得到输出数据。在生成训练样本的过程中，智能手表对目标数据样本X ₀执行T-5次至T-3次加噪处理，得到数据{X _T-5，X _T-4，X _T-3}；基于数据{X _T-5，X _T-4，X _T-3}获得多组训练样本，该多组训练样本中的每组训练样本包括输入数据和训练标签，该多组训练样本例如为(X _T-5，X _T-4)、(X _T-4，X _T-3)、(X _T-5，X _T-3)。参照智能手机基于训练数据对机器学习模型进行训练的过程，智能手表基于生成的训练数据对机器学习模型进行训练，同样能够得到训练后的机器模型。

对于智能手环而言，智能手环中所训练的机器学习模型的输入数据为X ₄，即对目标数据样本X ₀进行4次加噪后所得到的数据；并且，智能手环中的机器学习模型需要对输入数据进行1次处理，得到输出数据。在生成训练样本的过程中，智能手环对数据样本X ₀执行3次至4次加噪处理，得到数据{X ₃，X ₄}，从而构建得到训练样本{X ₃，X ₄}。智能手环基于生成的训练样本{X ₃，X ₄}对机器学习模型进行训练，得到训练后的机器模型。

对于笔记本电脑而言，笔记本电脑中所训练的机器学习模型的输入数据为X ₃，即对目标数据样本X ₀进行3次加噪后所得到的数据；并且，笔记本电脑中的机器学习模型需要对输入数据进行3次降噪处理，得到输出数据。在生成训练样本的过程中，笔记本电脑对数据样本X ₀执行0次至3次加噪处理，得到数据{X ₀，X ₁，X ₂，X ₃}，从而构建得到训练样本{X ₀，X ₃}。智能手环基于生成的训练样本{X ₀，X ₃}对机器学习模型进行训练，得到训练后的机器模型。除了图8中所示出的智能手机、智能手表、智能手环以及笔记本电脑之外，还可以是由其他的终端设备基于数据X _T-5与数据X ₄之间的数据来负责训练机器模型，图8中并不一一示出。

可选的，在各个终端设备生成训练数据的过程中，终端设备之间可以相互发送已生成的训练数据，从而避免各个终端设备独立重复生成相同的训练数据，提高训练数据的生成效率。例如，对于智能手机而言，智能手机需要生成数据{X _T-3，X _T-2，X _T-1，X _T}，而智能手表也需要生成数据X _T-3，因此智能手机可以将所生成的数据X _T-3发送给智能手表，从而使得免去生成数据X _T-3的过程。

阶段3，多个终端设备分别向基站发送训练后的机器学习模型。

由于每个终端设备所负责的训练内容并不一样，且用于训练机器学习模型的训练数据也不一样，因此每个终端设备训练得到的机器学习模型往往也是不一样的。在各个终端设备结束一轮或多轮模型的迭代训练，得到训练后的机器学习模型之后，终端设备则向基站发送训练后的机器学习模型，以便于基站聚合各个训练后的机器学习模型。

阶段4，基站聚合多个训练后的机器学习模型，得到聚合模型。

在基站通过聚合各个终端设备所发送的训练后的机器学习模型并得到聚合模型之后，基站可以继续向各个终端设备发送聚合模型，以便于各个终端设备继续对聚合模型进行迭代训练。最终，在终端设备所训练的机器学习模型达到模型训练终止条件之后，终端设备不再对基站所发送的聚合模型进行训练，而是将基站最后一次所发送的聚合模型作为模型推理时所采用的模型，即将该聚合模型用于执行后续的数据处理任务。

以上介绍了多个分布式装置对机器学习模型进行联合训练的过程，以下将介绍多个分布式装置通过机器学习模型对数据进行联合处理的过程。其中，多个分布式装置通过机器学习模型对数据进行联合处理的场景有多种，以下将结合附图详细介绍多种场景下的数据联合处理过程。

需要说明的是，本实施例中所介绍的通过机器学习模型对数据进行联合处理的多个分布式装置可以是对机器学习模型进行联合训练的多个分布式装置，即多个分布式装置先联合训练得到机器学习模型后，再通过相同的机器学习模型对数据进行联合处理。或者，本实施例中多个分布式装置可以是通过预置的机器学习模型对数据进行联合处理，即多个分布式装置并没有执行联合训练机器学习模型的过程。简单来说，机器学习模型的联合训练过程和数据联合处理过程这两个过程可以是融合的，也可以是独立的，本实施例对此并不做具体限定。

请参阅图9A，图9A为本申请实施例提供的一种数据处理方法900的流程示意图。如图9A所示，数据处理方法900包括以下的步骤901-905。

步骤901，分布式装置1确定数据处理需求。

本实施例中，分布式装置1中的数据处理需求是对具有噪声的原始数据进行处理，以得到分布式装置1所需的目标数据。其中，目标数据的质量高于原始数据的质量，即目标数据中的噪声小于原始数据中的噪声。一般来说，分布式装置1期望得到的目标数据往往可以是用于执行其他的模型训练任务的数据。因此，分布式装置1可以根据其他模型训练任务针对于所需数据的需求，来确定数据处理需求，该数据处理需求用于指示对原始数据进行处理的程度。例如，分布式装置1期望得到质量较高的图像数据，以便于后续能够基于质量较高的图像数据来训练图像分类模型；因此，分布式装置1可以根据图像分类模型对输入数据的需求，来确定对原始图像数据进行处理的程度。

例如，在原始数据为信道数据的情况下，分布式装置1期望得到的目标数据可以是用于训练发送机机器学习模型、接收机机器学习模型或信道估计机器学习模型等模型的数据。又例如，在原始数据为图像数据的情况下，分布式装置1期望得到的目标数据可以是用于训练图像分类模型、图像增强模型、图像压缩模型或图像检测模型等模型的数据。因此，分布式装置1可以是根据采用目标数据来执行训练的模型的精度需求来确定目标数据的质量需求，进而基于目标数据与原始数据之间的质量差距来确定数据处理需求。

可选的，在采用机器学习模型(例如上述的扩散模型)对原始数据进行处理的情况下，数据处理需求可以为采用机器学习模型对原始数据进行处理的次数。例如，在所需数据的质量需求较高的情况下，分布式装置1可以确定数据处理需求为对原始数据依次处理10000次；又例如，在所需数据的质量需求不高的情况下，分布式装置1可以确定数据处理需求为对原始数据逐步处理1000次。

步骤902，分布式装置1通过机器学习模型处理原始数据，得到第一数据。

在确定数据处理需求后，分布式装置1基于本装置的数据处理能力，通过机器学习模型处理原始数据，得到第一数据。其中，分布式装置1的数据处理能力并不能满足分布式装置1的数据处理需求，因此分布式装置1所得到的第一数据也并非是分布式装置1所期望得到的目标数据。其中，分布式装置的数据处理能力可以是与分布式装置上的处理资源以及存储资源相关，本实施例对此不做具体限定。

示例性地，假设分布式装置1的数据处理需求为通过机器学习模型对原始数据逐步处理1000次，而分布式装置1的数据处理能力仅支持分布式装置1对原始数据逐步处理200次，则分布式装置1则通过机器学习模型对原始数据逐步处理200次，得到第一数据。其中，第一数据还需要被处理800次才能够得到满足分布式装置1的数据处理需求的数据。

可选的，分布式装置1通过机器学习模型对原始数据逐步处理200次的过程可以是指：分布式装置1通过将机器学习模型进行复用，得到由200个机器学习模型依次连接而成的总模型；然后，分布式装置1将原始数据输入至总模型中，由总模型中的200个机器学习模型依次处理数据，得到第一数据。其中，总模型中的任意一个机器学习模型的输入即为前一个机器学习模型的输出。

或者，分布式装置1通过机器学习模型对原始数据逐步处理200次的过程还可以是指：分布式装置1通过机器学习模型对原始数据进行一次处理，得到一次处理后的数据；然后，分布式装置1再将一次处理后的数据输入机器学习模型中，得到二次处理后的数据；其次，分布式装置1继续将二次处理后的数据输入机器学习模型中，得到三次处理后的数据，以此循环，直至分布式装置1通过机器学习模型对数据执行200次处理，得到第一数据。也就是说，分布式装置1是将机器学习模型每次对数据进行处理后所输出的数据作为下一次数据处理过程中机器学习模型的输入，从而实现基于同一个机器学习模型依次对数据进行多次处理。

可选的，分布式装置1上用于处理原始数据的机器学习模型例如为上述的扩散模型。

步骤903，分布式装置1向分布式装置2发送第一数据。

由于分布式装置1的数据处理能力并不能够支持分布式装置1完成数据的处理，即分布式装置1处理得到的第一数据达不到分布式装置1的数据处理需求，因此分布式装置1向分布式装置2发送第一数据，以请求分布式装置2协助分布式装置1继续处理第一数据。

可选的，在分布式装置1向分布式装置2发送第一数据的同时，分布式装置1还可以向分布式装置2发送第一信息，该第一信息用于请求分布式装置2对第一数据进行处理。其中，第一信息还可以指示第一数据待处理的次数，即分布式装置2对第一数据进行处理的次数。例如，假设分布式装置1的数据处理需求为通过机器学习模型对原始数据逐步处理1000次，而分布式装置1仅对原始数据逐步处理了200次，因此分布式装置1可以在第一信息中指示第一数据的待处理次数为800次。可选的，第一数据的发送和第一信息的发送可以分开执行。

可选的，分布式装置1也可以是提前与分布式装置2进行协商，以使得分布式装置2能够确定从分布式装置1接收到的数据需要进行处理的次数。在这种情况下，分布式装置1只需要向分布式装置2发送第一数据，而不需要再向分布式装置2发送上述的第一信息。例如，在分布式装置1需要对大量数据进行逐步处理的情况下，分布式装置1提前与分布式装置2进行协商，以使得分布式装置2能够确定接收到的数据需要执行处理的次数。这样，分布式装置1每次对一个数据进行处理特定次数后，则将处理得到的数据发送给分布式装置2，以使得分布式装置2根据提前协商的内容对数据继续进行处理，从而避免分布式装置1反复通知分布式装置2所带来的信令开销。

在本实施例中，分布式装置1和分布式装置2例如为上述的终端设备，或者用于实现上述终端设备的功能的装置。在一个具体的示例中，分布式装置1可以为智能手表，分布式装置2可以为智能手机。

步骤904，分布式装置2通过机器学习模型处理第一数据，得到第二数据。

本实施例中，分布式装置2的数据处理能力能够支持分布式装置2协助分布式装置1 完成数据的处理，即分布式装置2处理得到的第二数据能够满足分布式装置1的数据处理需求，第二数据即为分布式装置1期望得到的数据。

示例性地，在分布式装置1通过第一信息指示分布式装置2对第一数据进行处理的次数的情况下，分布式装置2可以根据第一信息所指示的处理次数，通过机器学习模型对第一数据逐步进行多次处理，从而得到第二数据。例如，在分布式装置1在第一信息中指示分布式装置2对第一数据处理800次的情况下，分布式装置2则通过机器学习模型对第一数据逐步处理800次，从而得到第二数据。

需要说明的是，在本实施例中，分布式装置2的数据处理能力能够支持分布式装置2对第一数据完成分布式装置1所指定次数的处理。

其中，分布式装置2用于处理第一数据的机器学习模型可以是与分布式装置1中处理得到第一数据的机器学习模型相同，以便于保证分布式装置2对第一数据进行降噪处理的性能，确保第二数据能够满足分布式装置1的数据处理需求。

步骤905，分布式装置2向分布式装置1发送第二数据。

在处理得到第二数据后，由于第二数据能够满足分布式装置1的数据处理需求，因此分布式装置2向分布式装置1发送第二数据，从而完成协助分布式装置1处理数据。这样一来，分布式装置1在接收到第二数据后，则能够基于第二数据执行其他数据处理任务，例如基于第二数据执行其他模型的训练任务。

请参阅图9B，图9B为本申请实施例提供的一种数据处理方法900的另一流程示意图。如图9B所示，在另一个可能的实施例中，数据处理方法900可以是包括以下的步骤906-910。其中，步骤906-910与上述的步骤901-905并没有顺序关联，步骤906-910与上述的步骤901-905可以是独立的两套步骤。分布式装置1和分布式装置2可以是通过执行上述的步骤901-905来完成数据的联合处理；分布式装置1和分布式装置2也可以是通过执行上述的步骤906-910来完成数据的联合处理。

步骤906，分布式装置1确定数据处理需求。

本实施例中，步骤906与上述的步骤901类似，具体请参考上述的步骤901，在此不再赘述。

步骤907，分布式装置1向分布式装置2发送请求协助信息。

分布式装置1在确定数据处理需求后，分布式装置1可以判断本装置的数据处理能力是否能够满足数据处理需求。在分布式装置1确定本装置的数据处理能力无法满足数据处理需求的情况下，分布式装置1可以向分布式装置2发送请求协助信息，以请求分布式装置2协助分布式装置1进行数据的处理。

可选的，分布式装置1所发送的请求协助信息中可以指示原始数据的待处理次数，即分布式装置2对原始数据进行处理的次数。例如，假设分布式装置1的数据处理需求为通过机器学习模型对原始数据逐步处理1000次，而分布式装置1的数据处理能力仅支持其对数据逐步处理200次，因此分布式装置1可以在请求协助信息中指示原始数据的待处理次数为800次，即分布式装置1指示分布式装置2对原始数据处理800次。

步骤908，分布式装置2通过机器学习模型处理原始数据，得到第一数据。

在接收到分布式装置1发送的请求协助信息后，分布式装置2则基于请求协助信息的指示，通过机器学习模型处理原始数据，得到第一数据。

例如，假设请求协助信息中指示原始数据的待处理次数为800次，分布式装置2则通过机器学习模型对原始数据进行处理800次，得到第一数据。

步骤909，分布式装置2向分布式装置1发送第一数据。

可选的，在分布式装置2向分布式装置1发送第一数据的同时，分布式装置2还可以向分布式装置1发送指示信息，该指示信息用于指示分布式装置2对原始数据进行处理的次数。例如，分布式装置2在通过机器学习模型对原始数据进行处理800次得到第一数据的情况下，分布式装置2所发送的指示信息则指示第一数据是对原始数据处理800次后得到的。可以理解，分布式装置2可以根据自身能力对原始数据处理的次数小于分布式装置1指示的待处理次数。

可选的，第一数据的发送和指示信息的发送可以分开执行。

步骤910，分布式装置1通过机器学习模型处理第一数据，得到第二数据。

在接收到第一数据后，分布式装置1可以基于本装置的数据处理需求，以及分布式装置2对原始数据进行处理的次数，确定分布式装置1对第一数据进行处理的次数，从而通过机器学习模型处理第一数据，得到第二数据。

例如，在分布式装置1通过请求协助信息指示分布式装置2对原始数据处理800次的情况下，分布式装置1可以根据自身的数据处理需求为对原始数据进行处理1000次，确定还需要对接收到的第一数据处理200次。因此，分布式装置1通过机器学习模型继续对第一数据进行800次处理，得到第二数据。

在上述的数据处理方法900中，分布式装置1向分布式装置2发送第一数据或请求协助信息后，分布式装置2则能够协助分布式装置1完成数据的处理。然而，在一些场景下，例如分布式装置1的数据处理需求较高或者是分布式装置2的数据处理能力较低，分布式装置2可能难以独自协助分布式装置1完成数据的处理，因此分布式装置2还可以将本装置处理后的数据发送给其他的分布式装置，让其他的分布式装置继续协助完成数据的处理；可选的，分布式装置1还可以请求其他分布式装置继续协助处理，与请求分布式装置2协助处理类似，在此不再赘述。

请参阅图10A，图10A为本申请实施例提供的一种数据处理方法1000的流程示意图。如图10A所示，数据处理方法1000包括以下的步骤1001-1007。

步骤1001，分布式装置1确定数据处理需求。

步骤1002，分布式装置1通过机器学习模型处理原始数据，得到第一数据。

步骤1003，分布式装置1向分布式装置2发送第一数据。

本实施例中，步骤1001-1003与上述的步骤901-903类似，具体请参考上述的步骤901-903，在此不再赘述。

步骤1004，分布式装置2通过机器学习模型处理第一数据，得到第二数据。

在本实施例中，分布式装置2的数据处理能力并不能够支持分布式装置2协助分布式装置1完成数据的处理。例如，假设分布式装置1的数据处理需求为通过机器学习模型对原始数据逐步处理1000次，而分布式装置1仅对原始数据逐步处理了200次，因此分布式装置1可以是指示分布式装置2对第一数据逐步处理800次；然而，分布式装置2的数据处理能力并不足以支持分布式装置2对第一数据逐步处理800次，分布式装置2可能是只能够对第一数据逐步处理200次，以得到第二数据。

也就是说，分布式装置2通过机器学习模型处理第一数据后所得到的第二数据仍不满足分布式装置1的数据处理需求，即第二数据并不是分布式装置1期望得到的目标数据。

步骤1005，分布式装置2向分布式装置3发送第二数据。

由于分布式装置2处理第一数据后所得到的第二数据并非是分布式装置1所期望得到的目标数据，因此分布式装置2可以继续请求其他的分布式装置来协助完成数据的处理。

具体地，分布式装置2向分布式装置3发送第二数据，以使得分布式装置3继续对第二数据进行处理，以协助分布式装置1完成数据的处理。

可选的，在分布式装置2向分布式装置3发送第二数据的同时，分布式装置2还可以向分布式装置3发送第二信息，该第二信息用于指示分布式装置2所发送的第二数据待处理的次数。其中，第二数据待处理的次数可以是根据第一信息中所指示的第一数据待处理的次数以及分布式装置2实际对第一数据进行处理的次数计算得到的。可选的，第二数据的发送和第二信息的发送可以分开执行。

例如，假设分布式装置1的数据处理需求为通过机器学习模型对原始数据逐步处理1000次，而分布式装置1仅对原始数据逐步处理了200次，因此分布式装置1通过第一信息指示第一数据待处理的次数为800次；分布式装置2接收到第一数据和第一信息后，分布式装置2对第一数据执行了200次处理，得到第二数据；因此，分布式装置2可以向分布式装置3发送第二数据和第二信息，该第二信息用于指示第二数据待处理的次数为600次(800-200)。

步骤1006，分布式装置3-分布式装置N依次协助处理数据。

类似地，分布式装置3接收到分布式装置2所发送的第二数据后，继续对第二数据进行处理。并且，如果分布式装置3对第二数据进行处理的次数仍然小于第二数据的待处理次数时，分布式装置3则继续向分布式装置3的下一个分布式装置发送分布式装置3处理后的数据，以指示后续的分布式装置继续协助完成数据的处理，直至分布式装置N处理得到能够满足分布式装置1的数据处理需求的目标数据。

在本实施例中，分布式装置3与分布式装置N可以为同一个分布式装置，也可以为不同的分布式装置。在图10A中，分布式装置3与分布式装置N被绘制为不同的分布式装置。

步骤1007，分布式装置N向分布式装置1发送目标数据。

在处理得到分布式装置1所需的目标数据后，由于该目标数据能够满足分布式装置1的数据处理需求，因此分布式装置N向分布式装置1发送目标数据，从而完成协助分布式装置1处理数据。这样一来，分布式装置1在接收到目标数据后，则能够基于目标数据执行其他数据处理任务，例如基于第二数据执行其他模型的训练任务。

可选的，分布式装置N可以是直接向分布式装置1发送目标数据；分布式装置N也可以是向分布式装置N的前一个分布式装置(即请求分布式装置N协助处理数据的分布式装置N-1)发送目标数据，以使得目标数据能够被逐跳发送至分布式装置1。

请参阅图10B，图10B为本申请实施例提供的一种数据处理方法1000的另一流程示意图。如图10B所示，在另一个可能的实施例中，数据处理方法1000可以是包括以下的步骤1008-1014。其中，步骤1008-1014与上述的步骤1001-1007并没有顺序关联，步骤1008-1014与上述的步骤1001-1007可以是独立的两套步骤。分布式装置1-分布式装置N可以是通过执行上述的步骤1001-1007来完成数据的联合处理；分布式装置1-分布式装置N也可以是通过执行上述的步骤1008-1014来完成数据的联合处理。

步骤1008，分布式装置1确定数据处理需求。

步骤1009，分布式装置1向分布式装置2发送请求协助信息。

本实施例中，步骤1008-1009与上述的步骤906-907类似，具体请参考上述的步骤906-907，在此不再赘述。

步骤1010，分布式装置2通过机器学习模型处理原始数据，得到中间数据。

与上述步骤908不同的是，分布式装置2的数据处理能力并不足以支持分布式装置2完成分布式装置1在请求协助信息中所指示的数据处理次数。因此，分布式装置2根据本装置的数据处理能力，通过机器学习模型处理原始数据，得到中间数据。其中，中间数据对应的数据处理次数小于分布式装置1在请求协助信息中所指示的数据处理次数。

例如，假设分布式装置1在请求协助信息中指示原始数据的待处理次数为800次，而分布式装置2的数据处理能力仅支持其对原始数据处理300次，那么分布式装置通过机器学习模型对原始数据进行300次处理后所得到的中间数据并不能够满足分布式装置1的需求，即中间数据并不是分布式装置1期望得到的数据。

步骤1011，分布式装置2向分布式装置3发送中间数据。

由于分布式装置2处理原始数据后所得到的中间数据并非是分布式装置1所期望得到的数据，因此分布式装置2可以继续请求其他的分布式装置来协助完成数据的处理。

具体地，分布式装置2向分布式装置3发送中间数据，以使得分布式装置3继续对中间数据进行处理，以协助分布式装置1完成数据的处理。

可选的，在分布式装置2向分布式装置3发送中间数据的同时，分布式装置2还可以向分布式装置3发送指示信息，该指示信息用于指示分布式装置2所发送的中间数据待处理的次数。其中，中间数据待处理的次数可以是根据请求协助信息中所指示的原始数据待处理的次数以及分布式装置2实际对原始数据进行处理的次数计算得到的。可选的，中间数据的发送和指示信息的发送可以分开执行。

步骤1012，分布式装置3-分布式装置N依次协助处理数据，得到分布式装置1所需的第一数据。

类似地，分布式装置3接收到分布式装置2所发送的中间数据后，继续对中间数据进行处理。并且，如果分布式装置3对中间数据进行处理的次数仍然小于中间数据的待处理次数时，分布式装置3则继续向分布式装置3的下一个分布式装置发送分布式装置3处理后的数据，以指示后续的分布式装置继续协助完成数据的处理，直至分布式装置N处理得到能够满足分布式装置1的数据处理需求的第一数据。

步骤1013，分布式装置N向分布式装置1发送第一数据。

其中，第一数据是能够满足分布式装置1在请求协助信息中所指示的数据处理需求，因此分布式装置N向分布式装置1发送第一数据。

步骤1014，分布式装置1通过机器学习模型处理第一数据，得到第二数据。

以上的方法900和方法1000介绍了某个分布式装置请求其他的分布式装置协助完成数据处理的过程。在一些场景下，不同的分布式装置可能需要对相同类型的数据进行处理，且不同分布式装置的数据处理需求是不相同的。在这种情况下，可以采用中心装置来统筹各个分布式装置的数据处理需求，从而实现在不同分布式装置之间联合处理数据。

请参阅图11，图11为本申请实施例提供的一种数据处理方法1100的流程示意图。如图11所示，数据处理方法1100包括以下的步骤1101-1108。

步骤1101，多个分布式装置分别向中心装置发送数据处理需求。

在本实施例中，以多个分布式装置为3个为例，示例性的，多个分布式装置包括分布式装置1、分布式装置2和分布式装置3。多个分布式装置的所需数据是相同类型的数据，但不同的分布式装置对所需数据的质量需求是不同的，即不同的分布式装置对原始数据进行降噪处理的次数的需求是不相同的。

例如，假设多个分布式装置的所需数据均为图像数据，分布式装置1需要采用图像数据来训练图像分类模型，该图像分类模型对图像数据的质量要求并不高，因此分布式装置1的数据处理需求具体可以为对原始图像数据进行降噪处理1000次。

分布式装置2可以是需要图像数据来训练语义分割模型，该语义分割模型用于识别图像中的各个物体，因此语义分割模型对图像数据的质量要求较高；分布式装置2的数据处理需求具体可以为对原始图像数据进行降噪处理5000次。

此外，分布式装置3可以是需要图像数据来训练图像增强模型，该图像增强模型用于识别图像中的特定物体并增强识别到的特定物体的清晰度，因此图像增强模型对图像数据的质量要求最高。分布式装置3的数据处理需求具体可以为对原始图像数据进行降噪处理10000次。

步骤1102，中心装置确定各个分布式装置处理数据的顺序。

由于各个分布式装置的数据处理需求并不相同，中心装置可以根据各个分布式装置针对于数据的处理次数需求，确定各个分布式装置处理数据的顺序。示例性地，中心装置先确定各个分布式装置的数据处理需求中的数据处理次数，然后按照数据处理次数从小到大的顺序来确定各个分布式装置处理数据的顺序。分布式装置的数据处理需求中的数据处理次数越小，则分布式装置处理数据的顺序越靠前；分布式装置的数据处理需求中的数据处理次数越大，则分布式装置处理数据的顺序越靠后。

例如，假设分布式装置1的数据处理需求为对原始图像数据进行降噪处理1000次，分布式装置2的数据处理需求为对原始图像数据进行降噪处理5000次，分布式装置3的数据处理需求为对原始图像数据进行降噪处理10000次，那么这三个分布式装置处理数据的顺序为：分布式装置1→分布式装置2→分布式装置3。

步骤1103，中心装置向各个分布式装置发送指示信息，以指示各个分布式装置处理数据的顺序。

在确定各个分布式装置处理数据的顺序之后，中心装置则向各个分布式装置发送指示信息，以指示各个分布式装置处理数据的顺序。这样，各个分布式装置在收到中心装置发送的指示信息之后，则能够确定从哪个分布式装置接收处理后的数据以及将本装置上处理后的数据发送给哪个分布式装置。

可选的，在各个分布式装置上处理数据的能力较为稳定的情况下，即各个分布式装置上分配给数据处理的计算资源和存储资源较为稳定时，中心装置还可以在向各个分布式装置发送的指示信息中指示各个分布式装置需要对数据进行处理的次数。

在一个可能的示例中，在分布式装置1、分布式装置2以及分布式装置3的数据处理需求分别为对原始图像数据进行降噪处理1000次、5000次以及10000次的情况下，中心装置向分布式装置1发送的指示信息1具体可以为：上一跳节点为空，本地处理数据次数为1000，下一跳节点为分布式装置2。即分布式装置1为开始处理数据的首个节点，且分布式装置1需要通过机器学习模型对数据处理1000次，并将处理后的数据发送给分布式装置2。此外，中心装置向分布式装置2发送的指示信息2具体可以为：上一跳节点为分布式装置1，本地处理数据次数为4000(即5000-1000)，下一跳节点为分布式装置3。中心装置向分布式装置3发送的指示信息3具体可以为：上一跳节点为分布式装置2，本地处理数据次数为5000，下一跳节点为空。其中，在本示例中，各个分布式装置的数据处理能力均满足本装置的数据处理需求，因此任意一个分布式装置从其他分布式装置接收到已处理一定次数的数据后，均能够对已处理的数据继续进行处理，从而得到满足本装置数据处理需求的数据。

在另外一些情况下，分布式装置的数据处理能力可能并不能够满足自身的数据处理需求，如果中心装置继续按照各个分布式装置的数据处理需求中数据处理次数的大小关系来确定分布式装置联合处理数据的方式，可能会导致部分分布式装置无法完成对数据的处理。因此，在本示例中，中心装置可以基于各个分布式装置的数据处理需求中数据处理次数的大小关系以及各个分布式装置的数据处理能力来确定分布式装置联合处理数据的方式。

示例性地，在分布式装置1、分布式装置2以及分布式装置3的数据处理需求分别为对原始图像数据进行降噪处理1000次、5000次以及10000次，且分布式装置1的数据处理能力支持其对数据进行1000次降噪处理，分布式装置2的数据处理能力支持其对数据进行2000次降噪处理，以及分布式装置3的数据处理能力支持其对数据进行9000次降噪处理的情况下，中心装置向分布式装置1发送的指示信息1具体可以为：上一跳节点为空，本地处理数据次数为1000，下一跳节点为分布式装置2。中心装置向分布式装置2发送的指示信息2具体可以为：上一跳节点为分布式装置1，本地处理数据次数为2000，下一跳节点为分布式装置3；上一跳节点为分布式装置3，本地处理数据次数为0，下一跳节点为空。中心装置向分布式装置3发送的指示信息3具体可以为：上一跳节点为分布式装置2，本地处理数据次数为2000时下一跳节点为分布式装置2，本地处理数据次数为7000时下一跳节点为空。

步骤1104，分布式装置1通过机器学习模型对原始数据进行T1次处理，得到第一数据。

在接收到中心装置所发送的指示信息后，分布式装置1可以确定自身为第一个处理数据的装置，因此分布式装置1通过机器学习模型对原始数据进行T1次处理，得到第一数据。

可选的，在各个分布式装置上处理数据的能力较为稳定的情况下，中心装置可以通过指示信息指定各个分布式装置处理数据的次数。其中，分布式装置1对原始数据进行处理的次数可以是与分布式装置1的数据处理需求匹配。即，分布式装置1的数据处理需求为对原始数据进行T1次处理，且分布式装置1实际对原始数据进行处理的次数也为T1次。

可选的，在各个分布式装置上处理数据的能力有波动的情况下，中心装置并不指定各个分布式装置处理数据的次数。分布式装置1对原始数据进行处理的次数可以是不与分布式装置1的数据处理需求匹配。即，分布式装置1实际对原始数据进行处理的次数可以是大于或小于分布式装置1所需求的数据处理次数。例如，分布式装置1的数据处理需求为对原始数据进行N1次处理，而分布式装置1实际对原始数据进行处理的次数为T1次，其中N1可以是大于或小于T1。当分布式装置1上的计算资源以及存储资源较为充裕的情况下，分布式装置1实际对原始数据进行处理的次数T1可以是大于需求的数据处理次数N1；当分布式装置1上的计算资源或存储资源较为紧张的情况下，分布式装置1实际对原始数据进行处理的次数T1可以是小于需求的数据处理次数N1。

步骤1105，分布式装置1向分布式装置2发送第一数据。

本实施例中，在分布式装置1从中心装置处所接收的指示信息中，还指示了分布式装置1需要向分布式装置2发送处理后的数据。因此，分布式装置1在对原始数据进行处理并得到第一数据之后，分布式装置1向分布式装置2发送第一数据。

可选的，在中心装置并没有指示各个分布式装置需要对数据进行处理的次数的情况下，分布式装置1可以向分布式装置2发送信息，以指示分布式装置1对原始数据已进行处理的次数。

步骤1106，分布式装置2通过机器学习模型对第一数据进行T2次处理，得到第二数据。

在接收到中心装置所发送的指示信息后，分布式装置2可以确定自身需要从分布式装置1接收数据，并继续对接收到的数据进行处理，因此分布式装置2通过机器学习模型对接收到的第一数据进行T2次处理，得到第二数据。其中，在分布式装置2对第一数据进行T2次处理所得到的第二数据能够满足分布式装置2的数据处理需求的情况下，第二数据则为分布式装置2所需要的数据。

可选的，在各个分布式装置上处理数据的能力较为稳定的情况下，中心装置可以通过指示信息指定分布式装置2处理数据的次数。分布式装置2根据中心装置的指示，对第一数据进行T2次处理后，即可得到分布式装置2所需的数据。例如，假设分布式装置2的数据处理需求为对原始数据进行T1+T2次处理，由于分布式装置2所接收到的第一数据是对原始进行T1次处理后所得到的数据，因此分布式装置2根据中心装置的指示对第一数据进行T2次处理后所得到的第二数据即为分布式装置2所需的数据。

可选的，在各个分布式装置上处理数据的能力有波动的情况下，分布式装置2对第一数据进行处理的次数可以是第一数据对应的数据处理次数以及分布式装置2的数据处理需求来确定。例如，在分布式装置1向分布式装置2指示分布式装置1实际对原始数据进行处理的次数为T1次的情况下，分布式装置2可以根据自身的数据处理需求为对原始数据处理N2次，确定分布式装置2需要对第一数据进行处理的次数可以为N2-T1＝T2次。

可选的，在分布式装置2的数据处理能力仅支持其对第一数据处理S1次(S1＜T2)，即分布式装置2不支持对第一数据处理T2次的情况下，分布式装置2可以是对第一数据处理S1次，得到第二数据。其中，该第二数据并非为分布式装置2所需的数据，分布式装置2可以向其他的分布式装置发送第二数据，以请求其他的分布式装置协助分布式装置2继续对第二数据进行处理。

又或者，在分布式装置2的数据处理能力支持其对第一数据处理S2次(S2＞T2)，即分布式装置2支持对第一数据进行处理的次数大于T2次的情况下，分布式装置2可以是对第一数据处理S2次，得到第二数据。其中，在分布式装置2可以对第一数据处理S2次的过程中，分布式装置2对第一数据处理的次数为T2次时所得到的数据即为分布式装置2所需的数据。

步骤1107，分布式装置2向分布式装置3发送第二数据。

本实施例中，在分布式装置2从中心装置处所接收的指示信息中，还指示了分布式装置2需要向分布式装置3发送处理后的数据。因此，分布式装置2在对第一数据进行处理并得到第二数据之后，分布式装置2向分布式装置3发送第二数据。

步骤1108，分布式装置3通过机器学习模型对第二数据进行T3次处理，得到第三数据。

在接收到中心装置所发送的指示信息后，分布式装置3可以确定自身需要从分布式装置2接收数据，并继续对接收到的数据进行处理，因此分布式装置3通过机器学习模型对第二数据进行T3次处理，得到第三数据。其中，在分布式装置3对第一数据进行T3次处理所得到的第三数据能够满足分布式装置3的数据处理需求的情况下，第三数据则为分布式装置3所需要的数据。

其中，分布式装置3在各种情况下对第二数据进行处理的过程与分布式装置2对第一数据进行处理的过程类似，具体可以参考上述步骤1106中分布式装置2对第一数据进行处理的过程，在此不再赘述。

可以理解的是，以上方法1100是以三个分布式装置联合处理数据为例进行了说明，在实际应用中，可以是两个或两个以上的分布式装置基于上述的流程来联合处理数据，本实施例并不对联合处理数据的分布式装置的数量进行限定。

此外，以上方法1100介绍了在各个分布式装置的数据处理需求不相同时，如何统筹分布式装置联合处理数据。在一些特殊的场景下，部分分布式装置的数据处理需求可能会相同，中心装置可以根据分布式装置的数据处理能力来为这部分分布式装置分配数据处理任务。

请参阅图12，图12为本申请实施例提供的一种数据处理方法1200的流程示意图。如图12所示，数据处理方法1200包括以下的步骤1201-1207。

步骤1201，分布式装置1和分布式装置2分别向中心装置发送数据处理需求以及数据处理能力。

本实施例中，分布式装置1和分布式装置2的数据处理需求是相同的。例如，分布式装置1和分布式装置2的数据处理需求均是对原始数据进行降噪处理1000次。

此外，分布式装置1的数据处理能力与分布式装置2的数据处理能力可以是相同的，也可以是不相同的，本实施例对此不做具体限定。

步骤1202，中心装置确定各个分布式装置处理数据的顺序以及处理数据的次数。

本实施例中，由于分布式装置1和分布式装置2的数据处理需求是相同的，代表分布式装置1所需的数据和分布式装置2所需的数据是相同的，因此中心装置可以处理数据的部分流程分配至分布式装置1中，并将处理数据的另一部分流程分配至分布式装置2中。

可选的，中心装置确定分布式装置处理数据的顺序的方式可以有多种。示例性地，中心装置可以随机确定分布式装置1和分布式装置2处理数据的顺序。或者，中心装置可以根据分布式装置1和分布式装置2需要处理的数据的来源来确定分布式装置1和分布式装置2处理数据的顺序。例如，假设分布式装置1和分布式装置2需要处理的数据来源于分布式装置0，且分布式装置1位于分布式装置0与分布式装置2之间，则中心装置可以确定分布式装置1先处理数据，然后由分布式装置2继续处理分布式装置1所处理得到的数据。又或者，中心装置可以根据分布式装置1和分布式装置2处理得到的数据的下一跳节点来确定分布式装置1和分布式装置2处理数据的顺序。例如，假设分布式装置1和分布式装置2最终处理得到的数据需要发送给分布式装置3，且分布式装置1位于分布式装置2与分布式装置3之间，则中心装置可以确定分布式装置2先处理数据，然后由分布式装置1继续处理分布式装置2所处理得到的数据，以便于分布式装置1能够以更快的速度将最终处理得到的数据发送给分布式装置3。

可选的，各个分布式装置处理数据的次数可以是由中心装置根据各个分布式装置的数据处理能力来决定的。分布式装置的数据处理能力越高，中心装置可以确定该分布式装置处理数据的次数越大；分布式装置的数据处理能力越低，中心装置可以确定该分布式装置处理数据的次数越小。

步骤1203，中心装置向各个分布式装置发送指示信息，以指示各个分布式装置处理数据的顺序以及次数。

示例性地，在分布式装置1的数据处理能力较低，而分布式装置2的数据处理能力较高的情况下，中心装置可以向分布式装置1发送指示信息1，以指示分布式装置1先处理数据200次并将处理得到的数据发送给分布式装置2。此外，中心装置还向分布式装置2发送指示信息2，以指示分布式装置2从分布式装置1接收数据并对接收到的数据进行800次处理，以及将处理后得到的数据发送给分布式装置1。

步骤1204，分布式装置1通过机器学习模型对待处理数据进行N1次处理，得到第一数据。

基于中心装置的指示，分布式装置1通过机器学习模型对待处理数据进行N1次数据。其中，待处理数据可以为预先存储于分布式装置1上的原始数据；待处理数据也可以是其他分布式装置发送给分布式装置1的已处理过的数据，本实施例并不对待处理数据进行具体限定。

步骤1205，分布式装置1向分布式装置2发送第一数据。

步骤1206，分布式装置2通过机器学习模型对第一数据进行N2次处理，得到第二数据。

本实施例中，分布式装置1和分布式装置2的数据处理需求为对待处理数据进行N1+N2次处理，因此在分布式装置2对第一数据进行N2次处理后，所得到的第二数据则为分布式装置1和分布式装置2所需的数据。此时，分布式装置2可以采用得到的第二数据来执行其他的任务，例如采用第二数据来训练图像处理模型。

步骤1207，分布式装置2向分布式装置1发送第二数据。

由于中心装置指示了分布式装置2需要向分布式装置1发送处理后的数据，因此分布式装置2在得到第二数据后向分布式装置1发送第二数据，以便于分布式装置1基于第二数据来执行其他的任务。

为了实现上述方法实施例，本申请还提供了一种通信装置。请参阅图13，本申请实施例提供了一种通信装置1300，该通信装置1300可以实现上述方法实施例中终端设备(或网络设备)的功能，因此也能实现上述方法实施例所具备的有益效果。在本申请实施例中，该通信装置1300可以是终端设备(或网络设备)，也可以是终端设备(或网络设备)内部的集成电路或者元件等，例如芯片。下文实施例以该通信装置1300为终端设备或网络设备为例进行说明。

在一个可能的实施例中，该通信装置1300包括：收发模块1301和处理模块1302。

收发模块1301，用于接收来自于第二装置的第一数据，第一数据为经过第一机器学习模型处理后的数据；处理模块1302，用于通过第二机器学习模型对第一数据进行处理，得到第二数据，第一机器学习模型的结构与第二机器学习模型的结构相同，通信装置和第二装置用于联合执行数据的处理。

在一种可能的实现方式中，第二机器学习模型是扩散模型，第二机器学习模型用于对第一数据进行降噪处理。

在一种可能的实现方式中，收发模块1301，还用于接收来自于第二装置的第一信息，第一信息用于请求通信装置对第一数据执行处理。

在一种可能的实现方式中，第一信息用于指示第一数据待处理的次数为第一次数；处理模块1302还用于通过第二机器学习模型对第一数据进行第一次数的处理，得到第二数据，其中第一装置的能力支持对第一数据完成第一次数的处理。

在一种可能的实现方式中，收发模块1301，还用于向第二装置发送第二数据；或者，收发模块1301用于向源装置发送第二数据，其中第一信息还用于指示源装置的信息，源装置为首个请求协助处理数据的装置。

在一种可能的实现方式中，第一信息用于指示第一数据待处理的次数为第一次数；处理模块1302还用于通过第二机器学习模型对第一数据进行第二次数的处理，得到第二数据，其中第一次数大于第二次数，第一装置的能力不支持对第一数据完成第一次数的处理；收发模块1301，还用于向第三装置发送第二数据以及第二信息；其中，第二信息用于指示第二数据待处理的次数为第三次数，第三次数为第一次数与第二次数的差值，第三装置用于协助通信装置执行数据的处理。

在一种可能的实现方式中，收发模块1301，还用于向第二装置发送请求协助信息，请求协助信息用于请求第二装置协助处理数据。

在一种可能的实现方式中，收发模块1301，还用于向中心装置发送第三信息，第三信息用于指示通信装置所需的数据的处理次数；收发模块1301，还用于接收中心装置的反馈信息，反馈信息用于指示第二装置为协助节点。

在一种可能的实现方式中，收发模块1301，还用于接收来自于中心装置的第四信息，第四信息用于指示通信装置从第二装置接收到的数据需执行的处理次数；处理模块1302，还用于根据第四信息，通过第二机器学习模型对第一数据进行处理，得到通信装置所需的第二数据。

在一种可能的实现方式中，第四信息还用于指示第三装置的信息，第三装置为待接收处理后的数据的装置；收发模块1301，还用于根据第四信息，向第三装置发送第二数据。

在一种可能的实现方式中，收发模块1301，还用于接收来自于第二装置的第五信息，第五信息用于指示第一数据对应的已处理次数；处理模块1302，还用于根据处理次数以及通信装置所需的数据的处理次数，通过第二机器学习模型对第一数据进行处理，得到通信装置所需的第二数据。

在另一个可能的实施例中，处理模块1302，用于通过第一机器学习模型对原始数据执行处理，得到第一数据；收发模块1301，用于向第二装置发送第一数据，以请求第二装置协助处理第一数据；收发模块1301，用于接收第二装置或其他装置发送的第二数据，第二数据是对第一数据执行处理得到的，第二数据是基于第二机器学习模型处理得到的，第一机器学习模型的结构与第二机器学习模型的结构相同。

在一种可能的实现方式中，第一机器学习模型是扩散模型，第一机器学习模型用于对原始数据进行降噪处理。

在一种可能的实现方式中，收发模块，还用于向第二装置发送第一信息，第一信息用于请求第二装置对第一数据执行处理，且第一信息还用于指示第一数据待处理的次数，第一数据待处理的次数是基于原始数据需执行的处理次数以及第一装置对原始数据执行处理的次数确定的。

在另一个可能的实施例中，收发模块1301，用于接收来自于第一装置的第一信息和第二装置的第二信息，第一信息用于指示第一装置所需的数据的第一处理次数，第二信息用于指示第二装置所需的数据的第二处理次数，第一处理次数对应的数据处理模型与第二处理次数对应的数据处理模型相同；收发模块1301，用于向第二装置发送第三信息，第三信息用于指示第二装置向第一装置发送执行处理后的数据，其中第二装置所需的数据的第二处理次数小于或等于第一装置所需的数据的第一处理次数。

在一种可能的实现方式中，收发模块1301，还用于向第一装置发送第四信息，第四信息用于指示第一装置从第二装置接收到的数据需执行的处理次数。

可选的，在上述的通信装置1300为终端设备或网络设备时，该通信装置1300中的收发模块1301可以为收发器，处理模块1302可以为处理器。在通信装置1300为终端设备或网络设备内部的集成电路或者元件等的情况下，例如通信装置1300为芯片时，该通信装置1300中的收发模块1301可以为芯片上的输出、输入管脚，处理模块1302可以为芯片上的运算部件。又例如，在通信装置1300为芯片系统时，该通信装置1300中的收发模块1301可以为芯片系统上的通信接口，处理模块1302可以为芯片系统上的处理核。

请参阅图14，本申请实施例提供了一种模型训练装置1400，该模型训练装置1400可以实现上述方法实施例中终端设备(或网络设备)的功能，因此也能实现上述方法实施例所具备的有益效果。在本申请实施例中，该模型训练装置1400可以是终端设备(或网络设备)，也可以是终端设备(或网络设备)内部的集成电路或者元件等，例如芯片。下文实施例以该模型训练装置1400为终端设备或网络设备为例进行说明。

如图14所示，模型训练装置1400包括：收发模块1401和处理模块1402。收发模块1401，用于获取训练样本集合，训练样本集合包括第一数据和第二数据，第一数据是基于第二数据得到的，且第二数据为第一数据的训练标签；处理模块1402，用于基于训练样本集合对第一机器学习模型进行训练，得到训练后的第一机器学习模型，其中第一机器学习模型用于对第一数据进行处理；收发模块1401，用于向第二装置发送训练后的第一机器学习模型，第二装置用于聚合由多个装置训练得到的结构相同且参数不同的机器学习模型装置。

在一种可能的实现方式中，收发模块1401，还用于向第三装置发送第一信息，第一信息用于指示模型训练装置上与模型训练相关的能力，第三装置用于基于参与机器学习模型训练的多个装置的能力确定多个装置所负责的训练内容；收发模块1401，还用于接收来自于第三装置的第二信息，第二信息用于指示模型训练装置上训练的第一机器学习模型对输入数据进行处理的次数，第二信息还用于指示第一机器学习模型的输入数据的需求；处理模块1402，还用于：根据第二信息所指示的输入数据的需求以及第一机器学习模型对输入数据进行处理的次数，对原始数据进行处理，得到第二数据；根据第二信息所指示的第一机器学习模型对输入数据进行处理的次数，对第二数据进行处理，得到第一数据。

在一种可能的实现方式中，收发模块1401，还用于接收来自于第二装置的第二机器学习模型；处理模块1402，还用于基于训练样本集合对第二机器学习模型进行训练，得到训练后的第二机器学习模型；收发模块1401，还用于向第二装置发送训练后的第二机器学习模型。

在另一个可能的实施例中，收发模块1401，用于接收多个能力信息，多个能力信息来自于多个不同的装置，且多个能力信息中的每个能力信息均用于指示装置上与模型训练相关的能力；发送模块1403，用于根据多个能力信息分别向多个不同的装置发送不同的训练配置信息，训练配置信息用于指示装置上训练的机器学习模型对输入数据进行处理的次数，训练配置信息还用于指示装置上训练的机器学习模型的输入数据的需求，多个不同的装置所训练的机器学习模型为结构相同的模型。

可选的，在上述的模型训练装置1400为终端设备或网络设备时，该模型训练装置1400中的收发模块1401可以为收发器，处理模块1402可以为处理器。在模型训练装置1400为终端设备或网络设备内部的集成电路或者元件等的情况下，例如模型训练装置1400为芯片时，该模型训练装置1400中的收发模块1401可以为芯片上的输出、输入管脚，处理模块1402可以为芯片上的运算部件。又例如，在模型训练装置1400为芯片系统时，该模型训练装置1400中的收发模块1401可以为芯片系统上的通信接口，处理模块1402可以为芯片系统上的处理核。

请参阅图15，为本申请提供的通信装置1500的另一种示意性结构图，通信装置1500至少包括输入输出接口1502。其中，通信装置1500可以为芯片或集成电路。

可选地，该通信装置还包括逻辑电路1501。

其中，图13所示收发模块1301可以为通信接口，该通信接口可以是图15中的输入输出接口1502，该输入输出接口1502可以包括输入接口和输出接口。或者，该通信接口也可以是收发电路，该收发电路可以包括输入接口电路和输出接口电路。

可选地，输入输出接口1502用于获取第一网络设备的AI模型信息；逻辑电路1501用于基于该第一网络设备的AI模型信息确定该第一网络设备的AI性能信息。其中，逻辑电路1501和输入输出接口1502还可以执行前述任一实施例中终端设备执行的其他步骤并实现对应的有益效果，此处不再赘述。

可选地，逻辑电路1501用于生成第一网络设备的AI模型信息；输入输出接口1502用于发送第一网络设备的AI模型信息。其中，逻辑电路1501和输入输出接口1502还可以执行任一实施例中网络设备执行的其他步骤并实现对应的有益效果，此处不再赘述。

在一种可能的实现方式中，图13所示的处理模块1302可以为图15中的逻辑电路1501。

可选地，逻辑电路1501可以是一个处理装置，处理装置的功能可以部分或全部通过软件实现。其中，处理装置的功能可以部分或全部通过软件实现。

可选地，处理装置可以包括存储器和处理器，其中，存储器用于存储计算机程序，处理器读取并执行存储器中存储的计算机程序，以执行任意一个方法实施例中的相应处理和/或步骤。

可选地，处理装置可以仅包括处理器。用于存储计算机程序的存储器位于处理装置之外，处理器通过电路/电线与存储器连接，以读取并执行存储器中存储的计算机程序。其中，存储器和处理器可以集成在一起，或者也可以是物理上互相独立的。

可选地，该处理装置可以是一个或多个芯片，或一个或多个集成电路。例如，处理装置可以是一个或多个现场可编程门阵列(field-programmable gate array，FPGA)、专用集成芯片(application specific integrated circuit，ASIC)、系统芯片(system on chip，SoC)、中央处理器(central processor unit，CPU)、网络处理器(network processor，NP)、数字信号处理电路(digital signal processor，DSP)、微控制器(micro controller unit，MCU)，可编程控制器(programmable logic device，PLD)或其它集成芯片，或者上述芯片或者处理器的任意组合等。

请参阅图16，为本申请的实施例提供的上述实施例中所涉及的通信装置1600，该通信装置1600具体可以为上述实施例中的作为终端设备的通信装置，图16所示示例为终端设备通过终端设备(或者终端设备中的部件)实现。

其中，该通信装置1600的一种可能的逻辑结构示意图，该通信装置1600可以包括但不限于至少一个处理器1601以及通信端口1602。

进一步可选地，该装置还可以包括存储器1603、总线1604中的至少一个，在本申请的实施例中，该至少一个处理器1601用于对通信装置1600的动作进行控制处理。

此外，处理器1601可以是中央处理器单元，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。该处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，图16所示通信装置1600具体可以用于实现前述方法实施例中终端设备所实现的步骤，并实现终端设备对应的技术效果，图16所示通信装置的具体实现方式，均可以参考前述方法实施例中的叙述，此处不再一一赘述。

请参阅图17，为本申请的实施例提供的上述实施例中所涉及的通信装置1700的结构示意图，该通信装置1700具体可以为上述实施例中的作为网络设备的通信装置，图17所示示例为网络设备通过网络设备(或者网络设备中的部件)实现，其中，该通信装置的结构可以参考图17所示的结构。

通信装置1700包括至少一个处理器1711以及至少一个网络接口1714。进一步可选地，该通信装置还包括至少一个存储器1717、至少一个收发器1713和一个或多个天线1715。处理器1711、存储器1717、收发器1713和网络接口1714相连，例如通过总线相连，在本申请实施例中，该连接可包括各类接口、传输线或总线等，本实施例对此不做限定。天线1715与收发器1713相连。网络接口1714用于使得通信装置通过通信链路，与其它通信设备通信。例如网络接口1714可以包括通信装置与核心网设备之间的网络接口，例如S1接口，网络接口可以包括通信装置和其他通信装置(例如其他网络设备或者核心网设备)之间的网络接口，例如X2或者Xn接口。

处理器1711主要用于对通信协议以及通信数据进行处理，以及对整个通信装置进行控制，执行软件程序，处理软件程序的数据，例如用于支持通信装置执行实施例中所描述的动作。通信装置可以包括基带处理器和中央处理器，基带处理器主要用于对通信协议以及通信数据进行处理，中央处理器主要用于对整个终端设备进行控制，执行软件程序，处理软件程序的数据。图17中的处理器1711可以集成基带处理器和中央处理器的功能，本领域技术人员可以理解，基带处理器和中央处理器也可以是各自独立的处理器，通过总线等技术互联。本领域技术人员可以理解，终端设备可以包括多个基带处理器以适应不同的网络制式，终端设备可以包括多个中央处理器以增强其处理能力，终端设备的各个部件可以通过各种总线连接。该基带处理器也可以表述为基带处理电路或者基带处理芯片。该中央处理器也可以表述为中央处理电路或者中央处理芯片。对通信协议以及通信数据进行处理的功能可以内置在处理器中，也可以以软件程序的形式存储在存储器中，由处理器执行软件程序以实现基带处理功能。

存储器主要用于存储软件程序和数据。存储器1717可以是独立存在，与处理器1711相连。可选地，存储器1717可以和处理器1711集成在一起，例如集成在一个芯片之内。其中，存储器1717能够存储执行本申请实施例的技术方案的程序代码，并由处理器1711来控制执行，被执行的各类计算机程序代码也可被视为是处理器1711的驱动程序。

图17仅示出了一个存储器和一个处理器。在实际的终端设备中，可以存在多个处理器和多个存储器。存储器也可以称为存储介质或者存储设备等。存储器可以为与处理器处于同一芯片上的存储元件，即片内存储元件，或者为独立的存储元件，本申请实施例对此不做限定。

收发器1713可以用于支持通信装置与终端之间射频信号的接收或者发送，收发器1713可以与天线1715相连。收发器1713包括发射机Tx和接收机Rx。具体地，一个或多个天线1715可以接收射频信号，该收发器1713的接收机Rx用于从天线接收该射频信号，并将射频信号转换为数字基带信号或数字中频信号，并将该数字基带信号或数字中频信号提供给该处理器1711，以便处理器1711对该数字基带信号或数字中频信号做进一步的处理，例如解调处理和译码处理。此外，收发器1713中的发射机Tx还用于从处理器1711接收经过调制的数字基带信号或数字中频信号，并将该经过调制的数字基带信号或数字中频信号转换为射频信号，并通过一个或多个天线1715发送该射频信号。具体地，接收机Rx可以选择性地对射频信号进行一级或多级下混频处理和模数转换处理以得到数字基带信号或数字中频信号，该下混频处理和模数转换处理的先后顺序是可调整的。发射机Tx可以选择性地对经过调制的数字基带信号或数字中频信号时进行一级或多级上混频处理和数模转换处理以得到射频信号，该上混频处理和数模转换处理的先后顺序是可调整的。数字基带信号和数字中频信号可以统称为数字信号。

收发器1713也可以称为收发单元、收发机、收发装置等。可选地，可以将收发单元中用于实现接收功能的器件视为接收单元，将收发单元中用于实现发送功能的器件视为发送单元，即收发单元包括接收单元和发送单元，接收单元也可以称为接收机、输入口、接收电路等，发送单元可以称为发射机、发射器或者发射电路等。

需要说明的是，图17所示通信装置1700具体可以用于实现前述方法实施例中网络设备所实现的步骤，并实现网络设备对应的技术效果，图17所示通信装置1700的具体实现方式，均可以参考前述方法实施例中的叙述，此处不再一一赘述。

本申请实施例还提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，该处理器执行如前述实施例中终端设备可能的实现方式所述的方法。

本申请实施例还提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，该处理器执行如前述实施例中网络设备可能的实现方式所述的方法。

本申请实施例还提供一种存储一个或多个计算机的计算机程序产品(或称计算机程序)，当计算机程序产品被该处理器执行时，该处理器执行上述终端设备可能实现方式的方法。

本申请实施例还提供一种存储一个或多个计算机的计算机程序产品，当计算机程序产品被该处理器执行时，该处理器执行上述网络设备可能实现方式的方法。

本申请实施例还提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持通信装置实现上述通信装置可能的实现方式中所涉及的功能。可选地，所述芯片系统还包括接口电路，所述接口电路为所述至少一个处理器提供程序指令和/或数据。在一种可能的设计中，该芯片系统还可以包括存储器，存储器，用于保存该通信装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件，其中，该通信装置具体可以为前述方法实施例中终端设备。

本申请实施例还提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持通信装置实现上述通信装置可能的实现方式中所涉及的功能。可选地，所述芯片系统还包括接口电路，所述接口电路为所述至少一个处理器提供程序指令和/或数据。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存该通信装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件，其中，该通信装置具体可以为前述方法实施例中网络设备。

本申请实施例还提供了一种通信系统，该网络系统架构包括上述任一实施例中的终端设备和网络设备。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种数据处理方法，其特征在于，包括：

第一装置接收来自于第二装置的第一数据，所述第一数据为经过第一机器学习模型处理后的数据；

所述第一装置通过第二机器学习模型对所述第一数据进行处理，得到第二数据，所述第一机器学习模型的结构与所述第二机器学习模型的结构相同，所述第一装置和所述第二装置用于联合执行数据的处理。
根据权利要求1所述的方法，其特征在于，所述第二机器学习模型是扩散模型，所述第二机器学习模型用于对所述第一数据进行降噪处理。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自于所述第二装置的第一信息，所述第一信息用于请求所述第一装置对所述第一数据执行处理。
根据权利要求3所述的方法，其特征在于，所述第一信息用于指示所述第一数据待处理的次数为第一次数；

所述第一装置通过第二机器学习模型对所述第一数据进行处理，得到第二数据，包括：

所述第一装置通过所述第二机器学习模型对所述第一数据进行所述第一次数的处理，得到所述第二数据，其中所述第一装置的能力支持对所述第一数据完成所述第一次数的处理。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

所述第一装置向所述第二装置发送所述第二数据；

或者，所述第一装置向源装置发送所述第二数据，其中所述第一信息还用于指示所述源装置的信息，所述源装置为首个请求协助处理数据的装置。
根据权利要求3所述的方法，其特征在于，所述第一信息用于指示所述第一数据待处理的次数为第一次数；

所述第一装置通过第二机器学习模型对所述第一数据进行处理，得到第二数据，包括：

所述第一装置通过所述第二机器学习模型对所述第一数据进行第二次数的处理，得到所述第二数据，其中所述第一次数大于所述第二次数，所述第一装置的能力不支持对所述第一数据完成所述第一次数的处理；

所述方法还包括：

所述第一装置向第三装置发送所述第二数据以及第二信息；

其中，所述第二信息用于指示所述第二数据待处理的次数为第三次数，所述第三次数为所述第一次数与所述第二次数的差值，所述第三装置用于协助所述第一装置执行数据的处理。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

所述第一装置向所述第二装置发送请求协助信息，所述请求协助信息用于请求所述第二装置协助处理数据。
根据权利要求1、2或7所述的方法，其特征在于，所述方法还包括：

所述第一装置向中心装置发送第三信息，所述第三信息用于指示所述第一装置所需的数据的处理次数；

所述第一装置接收所述中心装置的反馈信息，所述反馈信息用于指示所述第二装置为协助节点。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自于所述中心装置的第四信息，所述第四信息用于指示所述第一装置从所述第二装置接收到的数据需执行的处理次数；

所述第一装置通过第二机器学习模型对所述第一数据进行处理，得到第二数据，包括：

所述第一装置根据所述第四信息，通过所述第二机器学习模型对所述第一数据进行处理，得到所述第一装置所需的所述第二数据。
根据权利要求9所述的方法，其特征在于，所述第四信息还用于指示第三装置的信息，所述第三装置为待接收处理后的数据的装置；

所述方法还包括：

所述第一装置根据所述第四信息，向所述第三装置发送所述第二数据。
根据权利要求7或8所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自于所述第二装置的第五信息，所述第五信息用于指示所述第一数据对应的已处理次数；

所述第一装置根据所述处理次数以及所述第一装置所需的数据的处理次数，通过所述第二机器学习模型对所述第一数据进行处理，得到所述第一装置所需的所述第二数据。
一种数据处理方法，其特征在于，包括：

第一装置通过第一机器学习模型对原始数据执行处理，得到第一数据；

所述第一装置向第二装置发送所述第一数据；

所述第一装置接收第二装置或其他装置发送的第二数据，所述第二数据是基于第二机器学习模型对所述第一数据处理得到的，所述第一机器学习模型的结构与所述第二机器学习模型的结构相同。
根据权利要求12所述的方法，其特征在于，所述第一机器学习模型是扩散模型，所述第一机器学习模型用于对所述原始数据进行降噪处理。
根据权利要求12或13所述的方法，其特征在于，所述方法还包括：

所述第一装置向所述第二装置发送第一信息，所述第一信息用于请求所述第二装置对所述第一数据执行处理，和/或所述第一信息用于指示所述第一数据待处理的次数，所述第一数据待处理的次数是基于所述原始数据需执行的处理次数以及所述第一装置对所述原始数据执行处理的次数确定的。
一种数据处理方法，其特征在于，包括：

中心装置接收来自于第一装置的第一信息和第二装置的第二信息，所述第一信息用于指示所述第一装置所需的数据的第一处理次数，所述第二信息用于指示所述第二装置所需的数据的第二处理次数，所述第一处理次数对应的数据处理模型与所述第二处理次数对应的数据处理模型相同；

所述中心装置向所述第二装置发送第三信息，所述第三信息用于指示所述第二装置向所述第一装置发送执行处理后的数据，其中所述第二装置所需的数据的第二处理次数小于或等于所述第一装置所需的数据的第一处理次数。
根据权利要求15所述的方法，其特征在于，所述方法还包括：

所述中心装置向所述第一装置发送第四信息，所述第四信息用于指示所述第一装置从所述第二装置接收到的数据需执行的处理次数。
一种模型训练方法，其特征在于，包括：

第一装置获取训练样本集合，所述训练样本集合包括第一数据和第二数据，所述第一数据是基于是所述第二数据得到的，且所述第二数据为所述第一数据的训练标签；

所述第一装置基于所述训练样本集合对第一机器学习模型进行训练，得到训练后的第一机器学习模型，其中所述第一机器学习模型用于对所述第一数据进行处理；

所述第一装置向第二装置发送训练后的第一机器学习模型，所述第二装置是用于聚合由多个装置训练得到的结构相同且参数不同的机器学习模型的装置。
根据权利要求17所述的方法，其特征在于，所述方法还包括：

所述第一装置向第三装置发送第一信息，所述第一信息用于指示所述第一装置上与模型训练相关的能力，所述第三装置用于基于参与机器学习模型训练的多个装置的能力确定所述多个装置所负责的训练内容；

所述第一装置接收来自于所述第三装置的第二信息，所述第二信息用于指示所述第一装置上训练的所述第一机器学习模型对输入数据进行处理的次数，所述第二信息还用于指示所述第一机器学习模型的输入数据的需求；

所述第一装置根据所述第二信息所指示的输入数据的需求以及所述第一机器学习模型对输入数据进行处理的次数，对原始数据进行处理，得到所述第二数据；

所述第一装置根据所述第二信息所指示的所述第一机器学习模型对输入数据进行处理的次数，对所述第二数据进行处理，得到所述第一数据。
根据权利要求17或18所述的方法，其特征在于，所述方法还包括：

所述第一装置接收来自于所述第二装置的第二机器学习模型；

所述第一装置基于所述训练样本集合对所述第二机器学习模型进行训练，得到训练后的第二机器学习模型；

所述第一装置向所述第二装置发送所述训练后的第二机器学习模型。
一种模型训练方法，其特征在于，包括：

第一装置接收多个能力信息，所述多个能力信息来自于多个不同的装置，且所述多个能力信息中的每个能力信息均用于指示装置上与模型训练相关的能力；

所述第一装置根据所述多个能力信息分别向所述多个不同的装置发送不同的训练配置信息，所述训练配置信息用于指示装置上训练的机器学习模型对输入数据进行处理的次数，所述训练配置信息还用于指示装置上训练的机器学习模型的输入数据的需求，所述多个不同的装置所训练的机器学习模型为结构相同的模型。
一种通信装置，其特征在于，所述通信装置为第一装置，所述通信装置包括：

收发模块，用于接收来自于第二装置的第一数据，所述第一数据为经过第一机器学习模型处理后的数据；

处理模块，用于通过第二机器学习模型对所述第一数据进行处理，得到第二数据，所述第一机器学习模型的结构与所述第二机器学习模型的结构相同，所述第一装置和所述第二装置用于联合执行数据的处理。
根据权利要求21所述的装置，其特征在于，所述第二机器学习模型是扩散模型，所述第二机器学习模型用于对所述第一数据进行降噪处理。
根据权利要求21或22所述的装置，其特征在于，所述收发模块还用于接收来自于所述第二装置的第一信息，所述第一信息用于请求所述第一装置对所述第一数据执行处理。
根据权利要求23所述的装置，其特征在于，所述第一信息用于指示所述第一数据待处理的次数为第一次数；

所述处理模块还用于通过所述第二机器学习模型对所述第一数据进行所述第一次数的处理，得到所述第二数据，其中所述第一装置的能力支持对所述第一数据完成所述第一次数的处理。
根据权利要求24所述的装置，其特征在于，还包括：

发送模块，用于向所述第二装置发送所述第二数据；

或者，所述发送模块，用于向源装置发送所述第二数据，其中所述第一信息还用于指示所述源装置的信息，所述源装置为首个请求协助处理数据的装置。
根据权利要求23所述的装置，其特征在于，所述第一信息用于指示所述第一数据待处理的次数为第一次数；

所述处理模块还用于通过所述第二机器学习模型对所述第一数据进行第二次数的处理，得到所述第二数据，其中所述第一次数大于所述第二次数，所述第一装置的能力不支持对所述第一数据完成所述第一次数的处理；

所述收发模块，还用于向第三装置发送所述第二数据以及第二信息；

其中，所述第二信息用于指示所述第二数据待处理的次数为第三次数，所述第三次数为所述第一次数与所述第二次数的差值，所述第三装置用于协助所述第一装置执行数据的处理。
根据权利要求21或22所述的装置，其特征在于，

所述收发模块，还用于向所述第二装置发送请求协助信息，所述请求协助信息用于请求所述第二装置协助处理数据。
根据权利要求21、22或27所述的装置，其特征在于，所述收发模块，还用于：

向中心装置发送第三信息，所述第三信息用于指示所述第一装置所需的数据的处理次数；

接收所述中心装置的反馈信息，所述反馈信息用于指示所述第二装置为协助节点。
根据权利要求28所述的装置，其特征在于，

所述收发模块，还用于接收来自于所述中心装置的第四信息，所述第四信息用于指示所述第一装置从所述第二装置接收到的数据需执行的处理次数；

所述处理模块，还用于根据所述第四信息，通过所述第二机器学习模型对所述第一数据进行处理，得到所述第一装置所需的所述第二数据。
根据权利要求29所述的装置，其特征在于，所述第四信息还用于指示第三装置的信息，所述第三装置为待接收处理后的数据的装置；

所述收发模块，还用于根据所述第四信息，向所述第三装置发送所述第二数据。
根据权利要求27或28所述的装置，其特征在于，

所述收发模块，还用于接收来自于所述第二装置的第五信息，所述第五信息用于指示所述第一数据对应的已处理次数；

所述处理模块，还用于根据所述处理次数以及所述第一装置所需的数据的处理次数，通过所述第二机器学习模型对所述第一数据进行处理，得到所述第一装置所需的所述第二数据。
根据权利要求21-31任意一项所述的装置，其特征在于，所述收发模块为收发器，所述处理模块为处理器。
一种通信装置，其特征在于，所述通信装置为第一装置，包括：

处理模块，用于通过第一机器学习模型对原始数据执行处理，得到第一数据；

收发模块，用于向第二装置发送所述第一数据和第一信息；

所述收发模块，还用于接收第二装置或其他装置发送的第二数据，所述第二数据是基于第二机器学习模型对所述第一数据处理得到的，所述第一机器学习模型的结构与所述第二机器学习模型的结构相同。
根据权利要求33所述的装置，其特征在于，所述第一机器学习模型是扩散模型，所述第一机器学习模型用于对所述原始数据进行降噪处理。
根据权利要求33或34所述的装置，其特征在于，

所述收发模块，还用于向所述第二装置发送第一信息，所述第一信息用于请求所述第二装置对所述第一数据执行处理，和/或所述第一信息用于指示所述第一数据待处理的次数，所述第一数据待处理的次数是基于所述原始数据需执行的处理次数以及所述第一装置对所述原始数据执行处理的次数确定的。
根据权利要求33-35任意一项所述的装置，其特征在于，所述收发模块为收发器，所述处理模块为处理器。
一种通信装置，其特征在于，包括：

收发模块，用于接收来自于第一装置的第一信息和第二装置的第二信息，所述第一信息用于指示所述第一装置所需的数据的第一处理次数，所述第二信息用于指示所述第二装置所需的数据的第二处理次数，所述第一处理次数对应的数据处理模型与所述第二处理次数对应的数据处理模型相同；

所述收发模块，还用于向所述第二装置发送第三信息，所述第三信息用于指示所述第二装置向所述第一装置发送执行处理后的数据，其中所述第二装置所需的数据的第二处理次数小于或等于所述第一装置所需的数据的第一处理次数。
根据权利要求37所述的装置，其特征在于，所述收发模块，还用于向所述第一装置发送第四信息，所述第四信息用于指示所述第一装置从所述第二装置接收到的数据需执行的处理次数。
根据权利要求37-38任意一项所述的装置，其特征在于，所述收发模块为收发器。
一种模型训练装置，其特征在于，包括：

收发模块，用于获取训练样本集合，所述训练样本集合包括第一数据和第二数据，所述第一数据是基于是所述第二数据得到的，且所述第二数据为所述第一数据的训练标签；

处理模块，用于基于所述训练样本集合对第一机器学习模型进行训练，得到训练后的第一机器学习模型，其中所述第一机器学习模型用于对所述第一数据进行处理；

所述收发模块，还用于向第二装置发送训练后的第一机器学习模型，所述第二装置是用于聚合由多个装置训练得到的结构相同且参数不同的机器学习模型的装置。
根据权利要求40所述的装置，其特征在于，

所述收发模块，还用于向第三装置发送第一信息，所述第一信息用于指示所述第一装置上与模型训练相关的能力，所述第三装置用于基于参与机器学习模型训练的多个装置的能力确定所述多个装置所负责的训练内容；

所述收发模块，还用于接收来自于所述第三装置的第二信息，所述第二信息用于指示所述第一装置上训练的所述第一机器学习模型对输入数据进行处理的次数，所述第二信息还用于指示所述第一机器学习模型的输入数据的需求；

所述处理模块，还用于根据所述第二信息所指示的输入数据的需求以及所述第一机器学习模型对输入数据进行处理的次数，对原始数据进行处理，得到所述第二数据；

所述处理模块，还用于根据所述第二信息所指示的所述第一机器学习模型对输入数据进行处理的次数，对所述第二数据进行处理，得到所述第一数据。
根据权利要求40或41所述的装置，其特征在于，

所述收发模块，还用于接收来自于所述第二装置的第二机器学习模型；

所述处理模块，还用于基于所述训练样本集合对所述第二机器学习模型进行训练，得到训练后的第二机器学习模型；

所述收发模块，还用于向所述第二装置发送所述训练后的第二机器学习模型。
根据权利要求40-42任意一项所述的装置，其特征在于，所述收发模块为收发器，所述处理模块为处理器。
一种模型训练装置，其特征在于，包括：

收发模块，用于接收多个能力信息，所述多个能力信息来自于多个不同的装置，且所述多个能力信息中的每个能力信息均用于指示装置上与模型训练相关的能力；

所述收发模块，还用于根据所述多个能力信息分别向所述多个不同的装置发送不同的训练配置信息，所述训练配置信息用于指示装置上训练的机器学习模型对输入数据进行处理的次数，所述训练配置信息还用于指示装置上训练的机器学习模型的输入数据的需求，所述多个不同的装置所训练的机器学习模型为结构相同的模型。
根据权利要求44所述的装置，其特征在于，所述收发模块为收发器。
一种通信装置，其特征在于，包括至少一个处理器，所述至少一个处理器与存储器耦合，

所述存储器用于存储程序或指令；

所述至少一个处理器用于执行所述程序或指令，以使所述装置实现如权利要求1至11中任一项所述的方法；或者，实现如权利要求12至14中任一项所述的方法；或者，实现如权利要求15至16中任一项所述的方法；或者，实现如权利要求17至19中任一项所述的方法；或者，实现如权利要求20所述的方法。
一种通信装置，其特征在于，包括至少一个处理器；

所述至少一个处理器用于执行程序或指令，以使所述装置实现如权利要求1至11中任一项所述的方法；或者，实现如权利要求12至14中任一项所述的方法；或者，实现如权利要求15至16中任一项所述的方法；或者，实现如权利要求17至19中任一项所述的方法；或者，实现如权利要求20所述的方法。
一种通信系统，其特征在于，包括：如权利要求21至32中任一项所述的通信装置以及如权利要求33至36中任一项所述的通信装置。
根据权利要求48所述的系统，其特征在于，所述系统还包括：如权利要求37至39中任一项所述的通信装置。
一种通信系统，其特征在于，包括：如权利要求40至43中任一项所述的模型训练装置以及如权利要求44-45任一项所述的模型训练装置。
一种计算机可读存储介质，其特征在于，所述可读存储介质存储有指令，当所述指令被计算机执行时，使得权利要求1至11中任一项所述的方法被执行；或者，使得权利要求12至14任一项所述的方法被执行；或者，使得权利要求15至16任一项所述的方法被执行；或者，使得权利要求17至19任一项所述的方法被执行；或者，使得权利要求20所述的方法被执行。
一种计算机程序产品，其特征在于，所述程序产品包括指令，当所述指令在计算机上运行时，使得权利要求1至11中任一项所述的方法被执行；或者，使得权利要求12至14任一项所述的方法被执行；或者，使得权利要求15至16任一项所述的方法被执行；或者，使得权利要求17至19任一项所述的方法被执行；或者，使得权利要求20所述的方法被执行。