CN115668218A

CN115668218A - 通信系统

Info

Publication number: CN115668218A
Application number: CN202180037620.0A
Authority: CN
Inventors: F·艾特·奥迪亚; A·瓦尔卡斯·里亚尔; 达利娅-乔治亚娜·波佩斯库; J·霍伊迪斯
Original assignee: Nokia Technologies Oy
Current assignee: Nokia Technologies Oy
Priority date: 2020-05-22
Filing date: 2021-05-19
Publication date: 2023-01-31
Also published as: WO2021234027A2; WO2021234027A3; EP4154184A2; US20230188394A1

Abstract

描述了一种通信系统和方法，包括：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息，该训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数；在接收器处从发射器接收所标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。

Description

通信系统

技术领域

本说明书涉及通信系统，例如涉及训练通信系统(例如使用机器学习技术)。

背景技术

可以训练通信系统的许多方面。尽管存在一些协议，但仍需要在这一领域进一步发展。

US 2015193695 A1公开了一种由网络中的多个设备协作训练的机器学习模型。EP3418948 A1公开了一种用于训练数据传输网络的机器学习模型的方法，其中机器学习模型包括发射器模型、信道模型和接收器模型，发射器模型包括发射器神经网络，接收器模型包括接收器神经网络。WO 2020064093 A1公开了通信系统中的端到端学习。WO 2020015840A1公开了在通信系统中通过更新接收算法中的参数进行学习。US 2006104341 A1涉及在传输到一个或多个接收器的分组中提供训练数据的系统和方法。

发明内容

在第一方面中，本说明书描述了一种通信系统的接收器，该接收器包括用于执行以下的部件：与通信系统的发射器握手以发起训练过程，其中所述握手包括训练设置请求消息(例如，由发射器发送给接收器或反之亦然)，训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数(例如，发射器和/或接收器可以包括神经网络)；从发射器接收标识的训练数据(训练数据可以被标记为与用户流量区分)，其中训练信息包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。终止可以由发射器或接收器完成，也可以通过中断完成。接收器可以是具有可训练参数的符号解映射器(例如，用于QAM解调)，然而其他接收器配置(例如，MIMO接收器)也是可能的。

接收器还可以包括用于通过更新接收器的可训练参数来基于标记的训练数据训练接收器的部件，其中从发射器接收的训练数据包括接收器训练数据。接收器可以被训练使得接收器适于特定的无线电环境。通信系统可以是具有在OFDM传输的资源元素之间分配的导频信号的OFDM通信系统，其中训练接收器包括在给定发射器使用的导频分配的情况下学习接收信号和LLR之间的映射。训练可以寻求提高传输的信息速率。

接收器训练数据(例如，响应于接收器参数被优化的RX训练脉冲串)可以包括由发射器发送给接收器的已知符号(例如，已知QAM符号)的序列。符号可以包括可以在训练设置请求中提供的训练数据的标签。

标识的训练数据可以通过在专用训练数据信道中被提供被识别。

训练信息可以包括：反馈数据，指示接收器准备好从发射器接收进一步的接收器训练数据；和/或性能信息，其使发射器的可训练参数能够被训练。

接收器还可以包括用于执行以下的部件：向发射器发送接收器发起的训练设置请求，用于发起握手；和/或发射器还可以包括用于执行以下的部件：发送发射器发起的训练设置请求，用于发起握手。接收器或发射器可以发送训练接受消息以分别接受发射器发起的或接收器发起的训练设置请求。发射器或接收器都可以拒绝训练设置请求(无论发射器或接收器是否发出了初始设置请求)。

接收器还可以包括用于执行以下的部件：向发射器发送接收器训练完成消息，用于指示接收器的训练完成；和/或发射器还包括用于执行以下的部件：向接收器发送发射器训练完成消息，用于指示发射器的训练完成。

接收器还可以包括用于执行以下的部件：向发射器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止；和/或发射器还包括用于执行以下的部件：向接收器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止。

在第二方面中，本说明书描述了一种通信系统的发射器，该发射器包括用于执行以下操作的部件：与通信系统的接收器握手以发起训练过程，其中所述握手包括训练设置请求消息(例如，由发射器发送给接收器或反之亦然)，训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数(发射器和接收器可以包括神经网络)；向接收器发送标识的训练数据(训练数据可以被标记以将其与用户流量区分)，其中训练信息包括发射器训练数据和/或接收器训练数据；在发射器处从接收器接收训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。终止可以由发射器或接收器完成，也可以通过中断完成。

发射器还可以包括用于执行以下的部件：通过更新发射器的可训练参数来基于训练数据和训练信息训练发射器，其中发送给接收器的训练数据包括发射器训练数据。训练信息可以类似于在训练期间提供帮助的反馈。通信系统可以是OFDM系统，其中发射器在OFDM系统的资源元素之间分配导频信号，其中训练发射器包括训练(例如，提高传输的信息速率)导频信号在资源元素之间的分配。

接收器训练数据(例如，响应于接收器参数被优化的RX训练脉冲串)可以包括由发射器发送给接收器的已知符号的序列(例如，已知QAM符号)。符号可以包括可以在训练设置请求中提供的训练数据的标签。

标识的训练数据可以通过在专用训练数据信道中被提供被标识。

在第一方面和第二方面中，部件可以包括：至少一个处理器；以及包括计算机程序代码的至少一个存储器，至少一个存储器和计算机程序被配置为与至少一个处理器一起引起部件的执行。

在第三方面中，本说明书描述了一种方法，包括：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息，训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数；在接收器处从发射器接收标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。终止可以由发射器或接收器完成，也可以通过中断完成。接收器可以是具有可训练参数的符号解映射器(例如，用于QAM解调)，然而其他接收器配置(例如，MIMO接收器)也是可能的。

该方法可以包括：通过更新接收器的可训练参数基于标记的训练数据来训练接收器，其中从发射器接收的训练数据包括接收器训练数据。接收器可以被训练使得接收器适于特定的无线电环境。通信系统可以是具有在OFDM传输的资源元素之间分配的导频信号的OFDM通信系统，其中训练接收器包括在给定发射器使用的导频分配的情况下学习接收信号和LLR之间的映射。训练可以寻求提高传输的信息速率。

标识的训练数据可以通过在专用训练数据信道中被提供来标识。

训练信息可以包括：反馈数据，指示接收器准备好从发射器接收进一步的接收器训练数据；和/或性能信息，其能够训练发射器的可训练参数。

该方法可以包括：向发射器发送接收器发起的训练设置请求，用于发起握手；和/或发射器还可以包括用于执行以下的部件：发送发射器发起的训练设置请求，用于发起握手。接收器或发射器可以发送训练接受消息以分别接受发射器发起的或接收器发起的训练设置请求。发射器或接收器都可以拒绝训练设置请求(无论发射器或接收器是否发出了初始设置请求)。

该方法可以包括：向发射器发送接收器训练完成消息，用于指示接收器的训练完成；和/或发射器还包括用于执行以下的部件：向接收器发送发射器训练完成消息，用于指示发射器的训练完成。

该方法还可以包括：向发射器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止；和/或发射器还包括用于执行以下的部件：向接收器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止。

在第四方面，本说明书描述了一种方法，包括：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练建立请求消息，其中发射器包括可训练参数和/或接收器包括可训练参数；从发射器向接收器发送标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；在发射器处从接收器接收训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。终止可以由发射器或接收器完成，也可以通过中断完成。

该方法可以包括：通过更新发射器的可训练参数基于训练数据和训练信息来训练发射器，其中发送给接收器的训练数据包括发射器训练数据。训练信息可以类似于在训练期间提供帮助的反馈。通信系统可以是OFDM系统，其中发射器在OFDM系统的资源元素之间分配导频信号，其中训练发射器包括训练(例如，提高传输的信息速率)导频信号在资源元素之间的分配。

训练信息可以包括：反馈数据，指示接收器准备好从发射器接收进一步的接收器训练数据；和/或性能信息，器使发射器的可训练参数能够被训练。

该方法可以包括：向发射器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止；和/或发射器还包括用于执行以下的部件：向接收器发送训练中断消息，用于指示接收器和/或发射器的训练将被终止。

在第五方面，本说明书描述了一种方法，该方法包括：初始化(例如，随机初始化)导频分配算法的参数，其中导频分配方法在OFDM通信系统的多个资源元素之间分配导频符号，其中OFDM通信系统包括发射器、信道和接收器；根据导频分配算法生成用于传输的训练数据；基于损失函数更新导频分配算法的可训练参数(例如，神经网络的可训练权重)，其中损失函数基于通信系统的信息速率度量；以及重复生成和更新，直到达到第一条件。

导频分配算法可以在资源元素之间设置导频信号的数目和/或导频信号的分布。因此，导频信号在资源元素之间的数量和分布都是潜在的可训练参数。

发射器可以：调制数据比特以生成数据符号(调制本身可以被训练(例如，几何整形(shaping))，这可以是损失函数内的附加变量)；并且根据导频分配算法(例如基于由导频分配算法生成的导频矩阵)将数据符号与导频符号叠加。

导频分配可以包括叠加的导频信号或正交导频信号。

该方法可以包括：基于损失函数更新接收器算法的可训练参数(例如，神经网络的可训练权重)。损失函数与块错误率、比特错误率和分类交叉熵中的一个或多个有关。

可以使用随机梯度下降来训练导频分配算法(以及可选地，也可以训练接收器算法)的至少一些参数。

第一条件可以包括根据所述信息速率度量的定义的迭代数目和/或预定义的性能标准。

该方法可以包括：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息(例如，由发射器发送给接收器或反之亦然)，该训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数(例如，发射器和接收器可以是神经网络)；从发射器向接收器发送标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。可由发射器或接收器终止。终止可以通过中断完成。

在第六方面中，本说明书描述了一种装置，其被配置为执行(至少)参考第三至第五方面描述的任何方法。

在第七方面中，本说明书描述了计算机可读指令，该计算机可读指令在由计算设备执行时使得计算设备执行(至少)参考第三至第五方面描述的任何方法。

在第八方面中，本说明书描述了一种计算机可读介质(诸如非瞬态计算机可读介质)，包括存储在其上的程序指令，用于执行(至少)以上参考第三至第五方面描述的任何方法。

在第九方面中，本说明书描述了一种装置，包括：至少一个处理器；以及包括计算机程序代码的至少一个存储器，该计算机程序代码当由至少一个处理器执行时，使该装置执行(至少)以上参考第三至第五方面描述的任何方法。

在第十方面中，本说明书描述了一种计算机程序，该计算机程序包括用于使装置执行至少以下操作的指令：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息，该训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数；在接收器处从发射器接收标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。

在第十一方面，本说明书描述了一种计算机程序，该计算机程序包括用于使装置执行至少以下操作的指令：在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息，该训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数；从发射器向接收器发送标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；在发射器处从接收器接收训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。

在第十二方面，本说明书描述了一种装置，包括：用于在通信系统的发射器与接收器之间握手以发起训练过程的部件(诸如发起模块)，其中发射器包括可训练参数和/或接收器包括可训练参数；用于在接收器处从发射器接收标识的训练数据的部件(诸如第一输入)，其中训练数据包括发射器训练数据和/或接收器训练数据；用于从接收器向发射器发送训练信息的部件(诸如第一输出)，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及用于终止训练过程的部件(诸如控制模块)。

在第十三方面，本说明书描述了一种装置，包括：用于在通信系统的发射机与接收器之间握手以发起训练过程的部件(诸如发起模块)，其中所述握手包括训练设置请求消息，该训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数；用于从发射器向接收器发送标识的训练数据的部件(诸如第一输出)，其中训练数据包括发射器训练数据和/或接收器训练数据；用于在发射器处从接收器接收训练信息的部件(诸如第一输入)，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及用于终止训练过程的部件(诸如控制模块)。

附图说明

现在将参考以下示意图仅以示例的方式描述示例性实施例，其中：

图1是根据示例实施例的系统的框图；

图2是示出根据示例实施例的算法的流程图；

图3至图8示出了根据示例实施例的消息序列；

图9和图10是示出根据示例实施例的算法的流程图；

图11是根据示例实施例的消息序列；

图12和图13是根据示例实施例的系统的框图；

图14示出了根据示例实施例的资源元素的时频网格；

图15是根据示例实施例的系统的框图；

图16是示出根据示例实施例的算法的流程图；

图17是根据示例实施例的接收器的框图；

图18和图19示出了在示例实施例中使用的神经网络；以及

图20是示出根据示例实施例的算法的流程图；

图21是根据示例实施例的系统的组件的框图；以及

图22A和图22B分别示出了根据示例实施例的存储计算机可读代码的有形介质、可移动非易失性存储器单元和光盘(CD)，该计算机可读代码在由计算机运行时执行操作。

具体实施方式

独立权利要求规定了本发明的各种实施例所寻求的保护范围。说明书中描述的不属于独立权利要求范围的实施例和特征(如果有的话)将被解释为对理解本发明的各种实施例有用的示例。

在说明书和附图中，相同的附图标记始终表示相同的元件。

图1是根据示例实施例的系统的框图，总体上由附图标记10表示。系统10包括可以使用信道14进行通信的发射器12和接收器16。发射器12和接收器16可以与信道14进行双向通信。应该注意的是，在许多示例实施例中，发射器12可以用作接收器，而接收器16可以用作发射器。如下面详细描述的，可以提供训练过程来训练发射器12和/或接收器16。

本文描述的原理适用于许多通信技术中的训练，例如蓝牙发射器、802.11接收器、光收发机、点对多点蜂窝系统等。例如，通信系统10可以是OFDM通信系统，其中在OFDM传输的资源元素之间分配导频信号。在这样的系统中训练的示例是训练接收器16学习接收信号对数似然比(LLR)之间的映射，给定发射器12使用的导频分配(如下面详细讨论的)。本领域技术人员将意识到可以使用本文描述的原理的许多其他示例系统。

图2是示出根据示例实施例的总体上由附图标记20指示的算法的流程图。

算法20在操作22处开始，在操作22处开始训练过程。例如，可以使用发射器12和接收器16之间的握手过程来发起训练过程。下面还将描述许多示例握手过程。

随着训练过程的发起，算法20移动到操作24，在操作24处训练发射器12和/或接收器16。操作24可以采取多种形式，例如：

·接收器16的训练(不训练发射器12)。如何使用该过程的示例是典型QAM调制的基于神经网络的解映射器的L1训练。这种训练可以允许解映射器适应特定的无线电环境。

·发射器12的训练(不训练接收器16)。例如，该程序可用于优化特定接收器的发射器中基于神经网络的调制器。

·发射器12和接收器16的联合训练。例如，该过程可用于训练几何或概率整形，因为这些影响发射器和接收器。

在操作26处，算法20结束。下文还描述了用于终止示例训练过程的多个布置。

通信系统中的许多发射器和接收器利用机器学习应用在物理层及以上进行信号处理。其中许多应用需要某种形式的训练。下面描述了实现这种收发机组件的数据驱动优化的多个过程和消息交换。

尽管机器学习在改进通信系统各层的算法方面有很大的希望，但需要支持适合在线训练的数据交换的协议。

例如，在物理层，接收器16内的符号解映射器可以实现为神经网络而不是硬编码算法。为了解映射器的最佳功能，可能需要训练神经网络。例如，发射器12可以向接收器发送已知符号序列，接收器然后可以将接收到的序列用作用于训练的标记数据集。在另一个L1示例中，发射器12可以优化用于编码比特的调制(即，几何整形)的星座。为了做到这一点，发射器12可以向接收器16发送符号的训练序列，接收器将针对该序列计算反馈信号，发射器可以使用该反馈信号来改进现有星座几何结构。在这两个示例中，可以在发射器和接收器之间交换各种控制消息和元数据。

在更高层，本文描述的原理还可以用于协商、发起、管理和终止各种算法的训练会话。例如，可以在上行链路发射器和接收器之间建立训练会话，以优化接收器处的开环功率控制(OLPC)决策。

图3示出了根据示例实施例的消息序列，总体上由附图标记30指示。消息序列30发生在发射器12和接收器16之间。

消息序列30是三方训练设置握手，其是上述操作22的示例实现。消息序列30包括从发射器12发送给接收器16的训练设置请求32。在接收到请求32时，接收器向发射器发送训练设置接受消息34。在接收到接受消息时，发射器向接收器发送训练设置完成消息36。

图4示出了根据示例实施例的消息序列，总体上由附图标记40指示。消息序列40包括上述从发射器12发送到接收器16的训练设置请求消息32。然而，在消息序列40中，接收器16不是接受训练设置请求，而是以训练设置拒绝消息42进行响应。这终止了握手过程。

尽管消息序列30和40由发射器12发起，但这不是必需的。作为示例，图5示出了根据示例实施例的由附图标记50指示的消息序列，其中训练过程由接收器16发起。

消息序列50包括从接收器16发送到发射器12的训练设置请求52。在接收到请求52时，发射器向接收器发送训练设置接受消息54。在接收到接受消息时，接收器可以向接收器发送训练设置完成消息(类似于消息36)，但在特定的消息序列50中，接收器向发射器12发送训练拒绝消息56。

因此，接收器16可以包括用于向发射器12发送接收器发起的训练设置请求以发起握手的部件。作为响应，发射器可以接受或拒绝接收器发起的训练设置请求。类似地，发射器12可以包括用于发送发射器发起的用于发起握手的训练设置请求的部件，作为响应，接收器可以接受或拒绝训练设置请求。

图6示出了根据示例实施例的消息序列，总体上由附图标记60指示。消息序列60是上述算法20的示例实现。

消息序列60以消息交换61开始，消息交换61发起训练过程。消息61实现操作22，并且可以采取多种形式(诸如上述消息序列30)。

在初始化过程的握手成功完成之后，发射器12可以发送RX训练脉冲串62a。RX训练脉冲串62a可以包括由发射器12发送给接收器16的已知符号序列(例如，已知QAM符号)。

一旦接收到RX训练脉冲串62a，接收器16在训练时期62b期间优化其参数，并向发射器12返回训练信息消息62c。用于此优化的特定算法和方法是特定于实现的，这里不详细讨论。

响应于训练信息消息62c，发射器12发送另一个RX训练脉冲串64a，接收器承载另一个训练时期64b，并且接收器返回训练信息消息64c，依此类推。

消息序列60过程继续，直到接收器16向发射器发送训练完成消息(指示接收器的训练被认为已完成)或者发送终止训练过程的某个其他消息(例如，从发射器发送到接收器的训练中断消息)。在示例消息序列60中，发射机发送RX训练脉冲串66a，响应于接收器16承载训练时期66b并返回训练完成消息68，从而终止消息序列60。

下面提供了训练信息、训练中断和训练完成消息的示例格式。

RX训练脉冲串62a、64a和66a中的每一个都是能够(由接收器)评估接收器16的性能并相应地更新接收器参数的数据序列。为了支持用户平面和训练数据的同时传输，可以相应地标记RX训练脉冲串。RX训练脉冲串的持续时间可以任意大。

在L1接收器训练的实施例中，训练脉冲串可以采用在用户平面L1信道上发送的QAM符号的形式。由调制符号组成的训练脉冲串的标签可以是相关的调制比特或符号索引。可以显式或隐式地提供标签，例如通过指向预定义列表或通过随机数生成器的种子。该过程可以允许例如优化基于神经网络的解映射器。用于此的训练数据可以是在一些资源块上与相应的比特标签一起接收的调制符号。在训练脉冲串期间接收的符号可以被划分成多个小批，用于基于随机梯度下降(SGD)的神经网络训练。一旦训练收敛或达到固定迭代次数，接收器就终止训练过程。

用于接收器处OLPC优化目的的RX训练脉冲串的L2实施例可以是伪随机生成的伪数据。该数据可以被封装在传输块中，然后被发送到接收器16。请注意，如下面进一步讨论的，本文描述的过程允许从发射机或接收器端点发起训练会话。

图7示出了根据示例性实施例的消息序列，总体上由附图标记70指示。消息序列70是上述算法20的示例实现。

消息序列70以发起训练过程的消息71的交换开始。消息71实现操作22，并且可以采取多种形式(诸如上述消息序列30)。

在初始化过程的握手成功完成之后，发射器12发送RX训练脉冲串72a。一旦接收到该脉冲串，接收器16在训练时期72b期间优化其参数，并向发射器返回训练信息消息72c。消息71、72a、72b和72c可以与上述消息61、61a、62b和62c相同。

响应于训练信息消息72c，发射器12向接收器16发送训练中断消息74。消息74指示接收器的训练将被终止(从而实现算法20的操作26)。

图8示出了根据示例性实施例的消息序列，总体上由附图标记80指示。消息序列80是上述算法20的示例实现。

消息序列80以发起训练过程的消息81的交换开始。消息81实现操作22并且可以采取多种形式(诸如上述消息序列30)。

在初始化过程的握手成功完成之后，发射器12发送TX训练脉冲串82a。TX训练脉冲串82a可以是任意大的，并且可以被选择为使得反馈计算具有足够的统计意义。

在接收到TX训练脉冲串82a时，接收器16计算反馈信号，该反馈信号在训练信息消息82b内被发送回发射器。发射器12使用反馈信号和TX训练脉冲串82a的知识来优化训练时期82c期间的参数。在一些情况下，可以改变训练时期82c之后的发射器的配置，例如星座几何结构。因此，发射器向接收器发送可选的训练配置更新消息82d，以通知接收器计算下一个TX训练脉冲串的反馈信号所需的改变。

在训练时期82c之后，TX训练脉冲串82a、训练信息82b和训练配置更新82d的交换可以继续多次，直到它被发射器发送的训练完成消息终止(或者直到训练以某种其他方式终止，例如通过训练中断消息)。

举例来说，消息序列80包括第二TX训练脉冲串84a、第二训练信息消息84b、第二训练时期84c、第二训练配置更新消息84d、第三TX训练脉冲串88a、第三训练信息消息88b、第三训练时期88c和训练完成消息89。

与上述消息序列60和70一样，消息序列80中的TX训练过程可以在任何时间被发送训练中断消息的设备之一中断。

示例L1 TX训练过程可以是，当发射器想要学习用于低成本接收器的最佳调制星座时。这里，训练脉冲串可以由调制符号组成，接收器基于其接收来计算损失度量，例如二元交叉熵、误码率。然后，损耗在L1训练信息消息中反馈给接收器，发射器可以使用该L1训练信息消息来优化其调制符号的方式。

L3 TX训练过程的示例可以是针对发射器控制的接收器移动性的基于ML的移动性鲁棒性优化(MRO)算法的训练。MRO决策将发生在发射器上，并且其目的可以是让发射器为接收器选择移动性参数的最佳组合。该过程允许发射器为此目的与接收器协商训练会话，然后探索多个这样的参数组合。然后，发射器可以利用接收器提供的反馈来评估测试参数并收敛于最优解。

图9是示出根据示例性实施例的算法的流程图，总体上由附图标记90指示。算法90可以在通信系统10的接收器16处实现，其中发射器12和/或接收器16包括可训练参数。例如，发射器和接收器中的一个或两者可以实现为神经网络。

在算法90的操作92，接收器与通信系统的发射器进行握手以发起训练过程(由此实现上述算法20的操作22)。握手可以包括训练设置请求消息(由发射器发送到接收器，反之亦然)，该训练设置请求消息包括用于训练过程的参数。

在操作94，接收器从发射器接收标识的训练数据。训练数据(其可以被标记以便与用户流量区分)可以包括发射器训练数据和/或接收器训练数据。

在操作96，接收器向发射器发送训练信息。训练信息可以包括用于控制发射器和/或接收器处的训练的信息。

因此，算法20的操作24可以通过操作94和96中的一个或两者来实现(取决于正在实现的是发射器训练还是接收器训练)。

在完成操作96时，可以终止训练过程(例如，实现操作26)。例如，终止可以由发射器或接收器发起，并且可以采取算法完成或中断的形式。

图10是示出根据示例实施例的算法的流程图，总体上由附图标记100指示。算法100可以在通信系统10的接收器12处实现，其中发射器12和/或接收器16包括可训练参数。例如，发射器和接收器中的一个或两者可以实现为神经网络。

在算法100的操作102处，发射器与通信系统的发射器12进行握手以发起训练过程(从而实现上述算法20的操作22)。握手可以包括训练设置请求消息(由发射器发送到接收器，反之亦然)。

在操作104，发射器向接收器发送训练数据。训练数据(其可以被标记以便与用户流量区分)可以包括发射器训练数据和/或接收器训练数据。(在上述操作94中，可以在接收器处接收在操作104中发送的训练数据。)

在操作106，发射器从接收器16接收训练信息。训练信息可以包括用于控制发射器和/或接收器处的训练的信息。

因此，算法20的操作24由操作104和106中的一个或两者来实现(取决于正在实现的是发射器训练还是接收器训练)。

在完成操作106时，可以终止训练过程(例如，实现操作26)。例如，终止可以由发射器或接收器发起，并且可以采取算法完成或中断的形式。

尽管先前描述的用于发射器和接收器训练的过程已经实现了两者的联合训练(通过在多次迭代期间在发射器和接收器之间交替训练)，但是对于具有用于两者的优化的专用过程是有兴趣的。例如，该过程可用于几何和概率成形的优化。

图11是根据示例实施例的消息序列，总体上由附图标记110指示。消息序列110实现联合发射器和接收器训练，如下面进一步描述的。消息序列110是上述算法20的示例实现。

消息序列110以开始训练过程的消息111的交换开始。消息111实现操作22，并且可以采取多种形式(诸如上述消息序列30)。

在初始化过程111的握手成功完成之后，发射器12发送组合的TX训练脉冲串和RX训练脉冲串112a。一旦接收到TX训练脉冲串，接收器16计算反馈信号，并且一旦接收到RX训练脉冲，接收器16在第一训练时期112b期间开始其自身的优化。

在第一训练时期112b之后，接收器用训练信息消息112c进行响应，该消息承载反馈信号以及与它自己的训练过程有关的其它信息。发射器12使用消息112c中包括的反馈信号和TX训练脉冲串的知识来在第二训练时期112d期间优化其参数。在一些情况下，发射器的配置在第二训练时期112d之后已经改变，例如星座几何结构可能已经改变。因此，发射器可以向接收器发送可选的训练配置更新消息112e，其中包含计算下一个TX训练脉冲串的反馈信号所需的改变。

RX和TX训练脉冲串、训练信息和训练配置更新消息的交换可以持续多次。发射器和接收器都可以通过发送训练完成消息来发出其个人训练完成的信号。

在消息序列110中，发射器12发送第二组合TX训练脉冲串和RX训练脉冲串114a。在接收到第二TX训练脉冲串时，接收器16计算反馈信号，并且在接收第二RX训练脉冲时，接收器在第二训练时期114b期间开始其自身的优化。在第二训练时期114b之后，接收器发送第二训练信息消息114c，发射器实现第二训练时期114d，并且可选地向接收器发送第二训练配置更新消息114e，其中包含计算下一个TX训练脉冲串的反馈信号所需的改变。

在消息序列110中，发射器12发送第三组合TX训练脉冲串和RX训练脉冲串116a。在接收到第三TX训练脉冲串时，接收器实现训练时期116b，然后确定它已经完成训练。训练完成消息117从接收器被发送到发射器。从这一刻起，发射器只发送TX训练脉冲串，并且其余过程类似于上面已经描述的发射器训练。发射器也可能首先完成训练。在这种情况下，该过程像前面描述的接收器训练过程一样继续。通过发送训练中断消息，任何设备都可以随时中断该程序。

因此，消息序列110包括从发射器12发送到接收器16的TX训练脉冲串118a、训练信息消息118b和发射器训练时期118c，在这一点上发射器确定它已被完全训练。作为响应，发射器发送训练完成消息119，从而终止消息序列110。

与上述消息序列60、70和80一样，消息序列110中的训练过程可以在任何时候被发送训练中断消息的设备之一中断。

图12是根据示例性实施例的系统的框图，总体上由附图标记120指示。系统120可用于实现上述算法20、90或100中的任一个，或上述消息序列30、40、50、60、70、80或110中的任一个。

系统120示出了通信系统的一部分，例如包括通信节点(gNB)121和用户设备(UE)122的3GPP系统。

通信节点121包括无线电资源控制(RRC)模块123a、分组数据汇聚协议(PDCP)模块123b、无线电链路控制(RLC)模块124c、媒体接入控制(MAC)模块123d和物理层(PHY)123e。类似地，用户设备122包括无线电资源控制(RRC)模块124a、分组数据汇聚协议(PDCP)模块124b、无线电链路控制(RLC)模块125c、媒体接入控制(MAC)模块124d和物理层(PHY)124e。

本文描述的控制面消息通常在通信节点121的RRC模块123a和用户设备122的RRC124a之间交换。另一方面，训练数据通常在应用层产生和消耗，并且在接收期间不传送到上层。

如图12所示，在通信节点121处生成的应用流量被提供给专用流量信道(DTCH)，并且在RRC 123a处生成的控制信息被提供给专用控制信道(DCCH)。控制和流量信息被组合成下行链路共享信道(DL-SCH)，并通过物理层提供给用户设备122。

训练样本在物理层生成，并通过物理层从通信节点121发送到用户设备122。

控制信息、流量信息和训练样本被提供给用户设备的物理下行链路共享信道(PDSCH)，并且在用户设备处被分离，使得训练样本被给机器学习引擎，控制信息被提供给RRC 124a，并且应用流量被路由到应用层。

当然，系统120仅作为示例提供。本领域技术人员将意识到可以在示例实施例中使用的许多变型。

上面已经描述了许多消息。下面详细描述可在示例实施例中使用的示例消息格式。对于技术人员来说，明显的是，以下所述的消息格式仅作为示例提供，备选方案是可能的。

训练设置请求

训练设置请求消息可以由收发机发送到对等收发机(例如，从上述发射器12到接收器16，或者反之亦然)。训练设置请求是发起无线电链路训练会话的请求，可以具有以下格式。(请注意，存在是强制性的(M)或可选的(O)。

训练设置拒绝

训练设置拒绝消息可以由收发机发送给对等收发机。该消息指示为无线电链路发起训练会话的请求失败。

训练中断

训练中断消息可以由收发机发送到对等收发机。该消息指示发送节点不再能够出于训练目的支持接收节点。

训练设置接受

训练设置接受消息可以由收发机发送到对等收发机。如果发送的参数与接收到的训练设置请求消息中包含的参数相同，则表明发起无线电链路训练会话的请求已被批准。另一方面，如果用不同的参数发送，对等收发机必须通过发送后续的训练完成消息来确认这些参数是否被接受。如果新提出的训练参数不被接受，则对等收发机还可以用随后的训练拒绝消息来答复。

训练设置完成

训练设置完成消息可以由收发机发送到对等收发机。该消息指示对等收发机提出的训练参数已被接受。

训练配置更新

训练配置更新消息由发射器发送到对等接收器。该消息可以指示接收器必须用于训练的样本类别已经改变，并且它提供了新的样本类别。

训练信息

训练信息消息由接收器发送到某个堆栈层的发射器。该消息向发射器指示接收器准备好接收另一个训练样本脉冲串。在发射器训练的情况下，该消息还可以承载预测标签。

训练完成

训练完成消息由接收器发送到发射器。该消息向发射器指示接收器将不再对与该训练会话相关联的未来接收样本进行训练。发射器因此可以释放其为该训练会话分配的资源。

上述消息格式仅作为示例提供。可以使用其他消息格式。此外，上述消息格式的许多变体对于技术人员来说是明显的。

图13是根据示例性实施例的系统的框图，总体上由附图标记130指示。

系统130包括调制或映射模块131、发射器132、信道(例如，OFDM信道)134和接收器136。系统130可用于实现以上所述的至少一些实施例，使得发射器132、信道134和接收器136可实现上述发射器12、信道14和接收器16。然而，这并不重要。下面详细描述的示例实施例中的至少一些可以与上述的实施例组合或者与上面描述实施例分开来实现。

系统130可以是具有在OFDM传输的资源元素之间分配的导频信号的OFDM通信系统(如下面进一步讨论的)。给定发射器使用的导频分配，接收器136可以被训练以学习接收信号和LLR之间的映射。训练可以寻求增加传输的信息速率。训练不是所有实施例都必须的(例如，可以使用不可训练的接收器)。

图14示出了根据示例性实施例的资源元素的时频网格，总体上由附图标记140指示。OFDM信道(诸如信道134)可以由时频网格140表示。

网格140的每个小区(称为资源元素)可用于发送复杂信道符号。(一个这样的资源元素由附图标记142指示。)这样的符号可以是例如来自正交幅度调制(QAM)星座的数据承载调制符号，或者是确定性的导频符号。在某些情况下，调制符号和导频被叠加。让我们用传输时间间隔(TTI)内的子载波数N_F(网格140中的行)和时隙数N_T(网格中的列)来表示。在OFDM通信系统中，旨在发送一组N_B比特向量

的发射器根据星座图(例如，QAM)和标记方案(例如，格雷标记)将每个比特向量b_i映射到复杂信道符号

。假设N_B≤N_TN_F。调制符号x_i与导频符号p_i一起分布在时频网格上，以形成在OFDM信道上传输的N_T×N_F大小矩阵X。导频符号通常根据由通信标准定义的导频模式被分配给特定资源元素。OFDM信道传递函数由下式给出：

Y＝H⊙X+N

其中H是与X相同大小的信道矩阵，N是与X和H相同大小的高斯无关且相同分布的噪声的矩阵，并且⊙表示元素乘积。

在一些通信系统中，从接收器处的接收信号Y重构发射信号X需要估计信道矩阵H。信道估计可以通过利用发射的导频符号来实现。

应当注意的是，由于H是复杂矩阵，振幅响应(它是信道矩阵元素的平方范数)只是可能需要为每个H的条目估计的两个分量中的一个，另一个分量是相位响应。

OFDM系统中的导频分配(即，找出应将哪些可用资源分配给导频，以及应将导频放置在时频网格中的何处)是一个难题。将太少的资源分配给导频往往导致性能差，因为接收器将无法正确估计信道。另一方面，给导频分配过多的资源会导致资源浪费。此外，导频在时间频率网格内的位置可能与性能相关，因为最佳性能的接收器在估计信道矩阵时利用时间和频率相关性。

图15是根据示例实施例的系统的框图，总体上由附图标记150指示。

系统150包括调制和映射模块152、导频分配模块153、矩阵生成模块154、信道156和接收器158。

数据比特(从数据源)被提供给调制和映射模块152。调制和映射模块152调制数据比特以生成数据符号，例如，以N_F×N_T大小的调制数据符号的矩阵的形式(在图15中由X_D表示)。

导频分配矩阵A由导频分配模块153生成，并与调制和映射模块152输出的矩阵X_D一起提供给矩阵生成模块154。因此，导频分配阵列A可以通过具有可训练参数的算法被计算。

在系统150中，矩阵生成模块154(根据导频分配算法)将导频信号叠加到数据，使得每个资源元素携带与导频符号线性组合的数据符号(而不是每个资源元素完全专用于导频或数据符号)。在示例系统150中，导频分配包括确定分配给每个资源元素的导频的功率比。该分配由N_F×N_T大小的矩阵A给出，该矩阵A的元素取值范围为(0，1)，并表示分配给每个资源元素的导频的能量比率。传输的元素是数据符号和预定义导频符号的叠加。可以提供缩放以确保平均功率小于某个预定义最大功率。例如，导频符号X_P的矩阵是例如所有元素取相同值的矩阵，诸如

其他选项也可以确保X平均值为零。

信道符号矩阵X(即，矩阵生成模块154的输出)在OFDM信道156上传输，并且接收器158根据接收信号Y计算传输比特的对数似然比(LLR)。

图16是示出根据示例性实施例的算法的流程图，总体上由附图标记160指示。算法160可以在发射器132处和/或使用系统150的元素来实现。

在可选操作162，发射器估计关于信道的一些信息或从接收器获得这些信息。关于信道的可能信息包括信噪比(SNR)、相干带宽、角扩展等。

在操作164，例如基于在操作162中获得的信道信息来计算导频分配矩阵A。可以使用上述矩阵生成模块154来计算导导频分配阵。如下面进一步讨论的，可以使用神经网络来确定导频分配矩阵。注意，具有可训练参数的算法不需要是神经网络。在一些示例实施例中，可以直接优化矩阵A，在这种情况下不需要信道信息。

在操作166，如上所述，通过根据分配矩阵缩放导频和数据符号，使用分配矩阵A(例如由矩阵生成模块154)来将导频与数据符号叠加。

最后，在操作168，在信道134或156上传输如此获得的符号。

假设微分接收器可以训练端到端系统130或150以最大化信息速率。因此，可以联合优化分配给导频的功率比例及其在时频网格上的分布，以最大化信息速率。与“全能”方法相比，可以通过根据某些信道质量指标(例如SNR)调整导频分配来实现更高的速率。

图17是根据示例性实施例的总体上由附图标记170指示的接收信号的框图。接收器170包括估计模块172、均衡模块174和检测模块176。

估计模块172计算信道矩阵H的估计

这可以使用例如经典线性最小均方误差(LMMSE)估计器来完成。均衡模块174均衡接收的信号Y，即，信道的效果被反转。这可以使用例如迫零(ZF)均衡来实现。最后，均衡信号Y_EQ被馈送到计算LLR的检测模块176。这可以假设完美均衡并使用最佳AWGN信道解映射器来实现。请注意，此接收器是可微分的，因此可以与下面描述的训练过程一起使用。

可训练导频分配方案可以以多种方式实现(例如使用导频分配模块153)。一个简单的方法是有N_F×N_T大小的可训练矩阵

(通过可训练矩阵，我们认为所有

的元素是可训练的)。然后，分配矩阵由

给出，其中σ(·)是sigmoid函数，其取值范围为(0，1)。

另一种方法是使用具有可训练参数的算法(例如，神经网络)从给定输入生成分配矩阵。图18示出了在一些示例性实施例中使用的神经网络，总体上由附图标记180指示。

在该神经网络180中，分配矩阵A由卷积神经网络从SNR生成。在该特定示例中，SNR首先被馈送到密集层，该密集层输出大小为63的矢量，并被重新整形(reshape)为大小为97的矩阵。然后，该矩阵被馈送至一系列卷积层和上采样层。最后卷积层使用sigmoid激活函数将输出限制在范围(0，1)内。使用神经网络180，生成的导频分配矩阵具有7314的形状，其与OFDM信道兼容。在神经网络180中，可训练参数是密集层和卷积层的权重和偏差。

也可以使神经网络180直接输出导频符号X_P的矩阵。在这种情况下，可以将发射信号构造为X＝X_P+X_D，然后在发射之前将其归一化，以确保功率约束。还可以使神经网络180从用于在整个时频网格上执行均匀叠加导频分配的范围(0，1)计算单个标量。

应当注意，神经网络180的输入不限于SNR。其他可能的输入包括相干带宽、多普勒扩展和角扩展。

图19示出了在一些示例性实施例中使用的神经网络，总体上由附图标记190指示。在神经网络190中，N是每个信道使用的比特数。可训练参数是卷积层的权重和偏差。注意，对于架构190，不执行“显式”信道估计或均衡。由于Y是复杂值的，所以可以将其实部和虚部作为不同的信道馈送到第一卷积层。

应当注意，可训练接收器(例如，神经网络190)可以与导频分配方案联合优化。

当然，神经网络180和190的许多变型是可能的。

假设可微分(并且可能是可训练的)接收器，系统130或150可以以端到端的方式被优化。训练可以使用信道矩阵的数据集，该数据集可以通过测量或使用信道模拟器生成。图20是示出根据示例实施例的算法的流程图，总体上由附图标记200指示。算法200示出了可能的训练过程。

算法200在操作202处开始，其中叠加导频分配器的可训练参数被初始化。接收器的参数(如果可训练)也可被初始化。根据某些分布，例如高斯分布，操作202中的初始化可以是随机的或伪随机的。

如上所述，导频分配可以用于在OFDM通信系统的多个资源元素之间分配导频符号。更具体地，导频分配算法可以设置导频信号的数目和/或导频信号在资源元素之间的分布。因此，导频信号的数量和分布都可能是可训练的。

在操作204，从信道矩阵的数据集(例如，随机地或伪随机地)采样训练示例以(随机地)生成BKN_TN_F调制比特。

在操作206，例如通过对损失应用一步随机梯度下降(SGD)来更新可训练参数

其中上标(i)用于表示第i次训练示例，b_j，k是映射到第j个资源元素的第k个比特，并且p_j，k是映射到第j个资源元素的第k个比特被设置为1的概率。请注意，将比特设置为1的概率p是从接收器为该比特计算的LLR中获得的。

损失函数L等于比特度量解码速率直到常数，这是在实践中广泛使用的比特交织编码调制系统上可实现的信息速率。因此，通过在L上优化系统，可以优化分配给每个资源元素中的导频的功率比，以实现最高可能的信息速率。

在操作208，算法200确定是否停止算法(根据一些预定义条件，例如停止标准)。合适的停止标准包括在预定义次数的迭代之后或当损失函数没有减少预定义次数的重复时停止。如果不停止算法200，则算法返回到上述操作204。

上述实施例的许多变型和扩展是可能的。例如，一个或多个：

·接收器与导频分配方案的联合优化。

·对A进行稀疏约束，同时将A的值量化为0或1，以获得正交导频。这将确保与不允许超强导频的系统向后兼容。可以将A的稀疏性约束添加到L，同时将A的元素量化为o或1，以学习正交导频分配。稀疏可以通过在损失函数A上添加L1范数惩罚来实现。这将确保与不允许超强导频的系统向后兼容。

·使用不同的损失函数，例如基于块错误率、比特错误率或分类交叉熵的损失函数(例如，如果需要对符号而不是比特进行检测)。

·通过使映射和调制元件152可训练来优化所使用的调制格式，例如几何整形。

·SGD变量(Adam、RMSProp...)的学习率、批大小和可能的其他参数可以是优化超参数。

·可以使用其他训练方法(诸如基于进化的方法)使用相同的损失函数。

上述许多实施例包括与握手和其他协议特征有关的特征。这不是所有实施例都必须的。作为示例，本发明的一些方面在以下编号的条款中列出。

示例1.一种装置，包括用于执行以下的部件：初始化(例如，随机初始化)导频分配算法的参数，其中导频分配算法在OFDM通信系统的多个资源元素之间分配导频符号，其中OFDM通信系统包括发射器、信道和接收器；根据导频分配算法生成用于传输的训练数据；基于损失函数更新导频分配算法的可训练参数(例如，神经网络的可训练权重)，其中损失函数基于通信系统的信息速率度量；以及重复生成和更新，直到达到第一条件。

示例2.根据示例1所述的装置，其中导频分配算法在资源元素之间设置导频信号的数目和/或导频信号的分布。因此，导频信号在资源元素之间的数量和分布是潜在的可训练参数。

示例3.根据示例1或实施例2所述的装置，其中发射器还被配置为执行：调制数据比特以生成数据符号(调制本身可以被训练(例如，几何整形)，这可以是损失函数内的附加变量)；并且根据导频分配算法(例如，基于由导频分配算法生成的导频矩阵)将数据符号与导频符号叠加。

示例4.根据前述示例中任一个所述的装置，其中导频分配算法包括神经网络。

示例5.根据前述示例中任一个所述的装置，其中导频分配包括叠加导频信号或正交导频信号。

示例6.根据前述示例中任一个所述的装置，其中装置还被配置为执行：基于损失函数更新接收器算法的可训练参数(例如，神经网络的可训练权重)。

示例7.根据前述示例中任一个所述的装置，其中损失函数与块错误率、比特错误率和分类交叉熵中的一个或多个相关。

实施例8.根据前述示例中任一个所述的装置，其中使用随机梯度下降来训练导频分配算法(以及可选地，也可以训练接收器算法)的至少一些参数。

示例9.根据前述示例中任一个所述的装置，其中第一条件包括：根据信息速率度量的定义的迭代数目和/或预定义的性能标准。

示例10.根据前述示例中任一个所述的装置，还包括用于执行以下的部件：在通信系统的发射器与接收器之间握手以发起训练过程，其中握手包括训练设置请求消息(例如，由发射器发送给接收器或反之亦然)，训练设置请求消息包括用于训练过程的参数，其中发射器包括可训练参数和/或接收器包括可训练参数(例如，发射器和接收器可以是神经网络)；从发射器向接收器发送所标识的训练数据，其中训练数据包括发射器训练数据和/或接收器训练数据；从接收器向发射器发送训练信息，其中训练信息包括用于控制发射器和/或接收器处的训练的信息；以及终止训练过程。可由发射器或接收器终止。终止可以通过中断完成。

示例11.根据前述示例中任一个所述的装置，其中装置包括：至少一个处理器；以及包括计算机程序代码的至少一个存储器，至少一个存储器和计算机程序被配置为与至少一个处理器一起引起装置的执行。

示例12.一种方法，包括：初始化导频分配算法的参数，其中导频分配方法在OFDM通信系统的多个资源元素之间分配导频符号，其中OFDM通信系统包括发射器、信道和接收器；根据导频分配算法生成用于传输的训练数据；基于损失函数更新导频分配算法的可训练参数，其中损失函数基于通信系统的信息速率度量；以及重复生成和更新，直到达到第一条件。

示例13.一种OFDM通信系统的发射器，包括发射器、信道和接收器，其中发射器包括使用条款12的方法训练的导频分配算法。

示例14.根据示例13所述的发射器，其中发射器还被配置为执行：调制数据比特以生成数据符号；以及使用导频分配矩阵将数据符号与导频符号叠加。

示例15.一种系统，包括根据示例13或示例14的发射器，并且还包括OFDM系统的接收器。

示例16.一种计算机程序，包括用于使装置执行至少以下操作的指令：初始化导频分配算法的参数，其中导频分配演算法在OFDM通信系统的多个资源元素之间分配导频符号，其中OFDM通信系统包括发射器、信道和接收器；根据导频分配算法生成用于传输的训练数据；基于损失函数更新导频分配算法的可训练参数，其中损失函数基于通信系统的信息速率度量；以及重复生成和更新，直到达到第一条件。

为完整起见，图21是前面描述的一个或多个示例实施例的组件的示意图，这些组件在下文中统称为处理系统300。例如，处理系统300可以是以下权利要求中所述的装置。

处理系统300可以具有处理器302、与处理器紧密耦合并由RAM 314和ROM 312组成的存储器304，以及可选的用户输入310和显示器318。处理系统300可包括一个或多个网络/装置接口308，用于连接到网络/装置，例如可以是有线或无线的调制解调器。网络/装置接口308还可以作为到其他装置的连接来操作，例如不是网络侧装置的设备/装置。因此，设备/装置之间的直接连接而无需网络参与是可能的。

处理器302连接到每个其他组件以便控制其操作。

存储器304可以包括非易失性存储器，诸如硬盘驱动器(HDD)或固态驱动器(SSD)。存储器304的ROM 312存储操作系统315，并且可以存储软件应用316。存储器304的RAM 314被处理器302用于临时存储数据。操作系统315可以包含当由处理器执行时实现上述算法和消息序列20、30、40、50、60、70、80、90、100、110、160和200的各个方面的代码。注意，在小型设备/装置的情况下，存储器可能最适合小尺寸使用，即不总是使用硬盘驱动器(HDD)或固态驱动器(SSD)。

处理器302可以采取任何合适的形式。例如，它可以是微控制器、多个微控制器、处理器或多个处理器。

处理系统300可以是独立计算机、服务器、控制台或其网络。处理系统300和所需的结构部件可以全部在设备/装置(例如IoT设备/装置)内部，即嵌入到非常小的尺寸。

在一些示例实施例中，处理系统300还可以与外部软件应用相关联。这些可以是存储在远程服务器设备/装置上的应用，并且可以部分地或排他地在远程服务器设备/装置上运行。这些应用可以被称为云托管应用。处理系统300可以与远程服务器设备/装置通信，以便利用存储在那里的软件应用。

图22A和图22B示出了有形介质，分别是可移动存储单元365和光盘(CD)368，其存储当由计算机运行时可以执行根据上述示例实施例的方法的计算机可读代码。可去除存储器单元365可以是具有存储计算机可读代码的内部存储器366的记忆棒，例如USB记忆棒。计算机系统可以经由连接器367访问内部存储器366。CD 368可以是CD-ROM或DVD或类似物。可以使用其他形式的有形存储介质。有形介质可以是能够存储数据/信息的任何设备/装置，这些数据/信息可以在设备/装置/网络之间交换。

本发明的实施例可以以软件、硬件、应用逻辑或软件、硬件和应用逻辑的组合来实现。软件、应用逻辑和/或硬件可以驻留在存储器或任何计算机介质上。在示例实施例中，应用逻辑、软件或指令集被维护在各种常规计算机可读介质中的任何一种上。在本文件的上下文中，“存储器”或“计算机可读介质”可以是任何非暂时性介质或装置，其可以包含、存储、通信、传播或传输指令，以供指令执行系统、设备或装置(诸如计算机)使用或与之相关。

在相关情况下，提及“计算机可读介质”、“计算机程序产品”、“有形体现的计算机程序”等，或“处理器”或“处理电路”等，应理解为不仅包括具有不同架构的计算机，如单/多处理器架构和定序器/并行架构，还包括专用电路，如现场可编程门阵列FPGA、专用电路ASIC、信号处理设备/装置和其他设备/装置。对计算机程序、指令、代码等的引用应理解为将可编程处理器固件的软件(例如硬件设备/装置的可编程内容)表示为处理器的指令或固定功能设备/装置、门阵列、可编程逻辑设备/装置等的配置或配置设置。

如果需要，本文讨论的不同功能可以以不同的顺序和/或彼此同时执行。此外，如果需要，上述功能中的一个或多个可以是可选的或可以组合。类似地，还应理解，图2至图11、图16和图20的流程图和消息序列仅为示例，其中描述的各种操作可以省略、重新排序和/或组合。

应当理解，上述示例实施例纯粹是说明性的，并不限制本发明的范围。本领域技术人员在阅读本说明书后，其他变化和修改将是明显的。

此外，本申请的公开应理解为包括本文中明确或隐含公开的任何新颖特征或特征的任何新颖组合或其任何概括，可以制定新的权利要求以覆盖任何这样的特征和/或这样的特征的组合。

尽管在独立权利要求中阐述了本发明的各个方面，但本发明的其他方面包括来自所述示例实施例和/或从属权利要求的特征与独立权利要求的特点的其他组合，而不仅仅是权利要求中明确阐述的组合。

这里还应注意，虽然以上描述了各种示例，但这些描述不应被视为限制性的。相反，在不脱离所附权利要求书中定义的本发明的范围的情况下，可以进行若干变化和修改。

Claims

1.一种通信系统(10)的接收器(16)，所述接收器(16)包括用于执行以下的部件：

与所述通信系统(10)的发射器(12)握手(22、50、92)以发起训练过程(20)，其中所述握手包括训练设置请求消息(52)，所述训练设置请求消息(52)包括用于所述训练过程的参数，其中所述发射器(12)包括可训练参数和/或所述接收器(16)包括可训练参数；

从所述发射器接收(94)所标识的训练数据，其中所述训练数据包括发射器训练数据和/或接收器训练数据；

从所述接收器向所述发射器发送(96)训练信息，其中所述训练信息包括用于控制所述发射器处和/或所述接收器处的训练的信息；

向所述发射器发送训练中断消息，用于指示所述接收器和/或所述发射器的训练将被终止；以及

终止(26)所述训练过程。

2.根据权利要求1所述的接收器(16)，所述接收器还包括用于执行以下的部件：

通过更新所述接收器的所述可训练参数，基于所标记的所述训练数据来训练(24)所述接收器，其中从所述发射器接收的所述训练数据包括所述接收器训练数据。

3.根据权利要求2所述的接收器(16)，其中所述通信系统是OFDM通信系统(150)，其具有在OFDM传输的资源元素之间分配的导频信号(153)，其中训练所述接收器包括在给定由所述发射器(12)使用的导频分配的情况下，学习所接收的信号与LLR之间的映射。

4.一种通信系统(10)的发射机(12)，所述发射机(12)包括用于执行以下的部件：

与所述通信系统(10)的接收器(16)握手(22、30、102)以发起训练过程(20)，其中所述握手包括训练设置请求消息(32)，所述训练设置请求消息(32)包括用于所述训练过程的参数，其中所述发射器(12)包括可训练参数和/或所述接收器包括可训练参数；

向所述接收器发送(104)所标识的训练数据，其中所述训练数据包括发射器训练数据和/或接收器训练数据；

在所述发射器处从所述接收器接收(106)训练信息，其中所述训练信息包括用于控制所述发射器处和/或所述接收器处的训练的信息；

向所述接收器发送训练中断消息，用于指示所述接收器和/或所述发射器的训练将被终止；以及

终止所述训练过程。

5.根据权利要求4所述的发射器(12)，所述发射器(12)还包括用于执行以下的部件：

通过更新(82d)所述发射器的所述可训练参数，基于所述训练数据和所述训练信息来训练(82c)所述发射器(12)，其中发送给所述接收器的所述训练数据包括所述发射器训练数据。

6.根据权利要求5所述的发射器(12)，其中所述通信系统是OFDM系统，并且其中所述发射器在所述OFDM系统的资源元素之间分配导频信号，其中训练所述发射器包括训练所述导频信号在所述资源元素之间的分配。

7.根据权利要求1至3中任一项所述的接收器(16)，或根据权利要求4至6中任一项所述的发射器(12)，其中所述接收器训练数据包括由所述发射器发送给所述接收器的已知符号的序列。

8.根据权利要求1至3或权利要求7中任一项所述的接收器(16)，或根据权利要求4至7中任一项所述的发射器(12)，其中所标识的所述训练数据通过在专用训练数据信道中被提供来被标识。

9.根据权利要求1至3、权利要求7或权利要求8中任一项所述的接收器(16)，或根据权利要求4至8中任一项所述的发射器(12)，其中所述训练信息包括：

反馈数据，指示所述接收器准备好从所述发射器接收进一步的接收器训练数据；和/或

性能信息，使所述发射器的所述可训练参数能够被训练。

10.根据权利要求1至3或权利要求7至9中任一项所述的接收器(16)，或根据权利要求4至9中任一项所述述的发射器(12)，其中：

所述接收器(16)还包括用于执行以下的部件：向所述发射器发送(52)接收器发起的训练设置请求，用于发起所述握手；和/或

所述发射器(12)还包括用于执行以下的部件：发送(32)发射器发起的训练设置请求，用于发起所述握手。

11.根据权利要求1至3或权利要求7至10中任一项所述的接收器(16)，或根据权利要求4至10中任一项所述述的发射器(12)，其中：

所述接收器还包括用于执行以下的部件：向所述发射器发送接收器训练完成消息，用于指示所述接收器的训练完成；和/或

所述发射器还包括用于执行以下的部件：向所述接收器发送发射器训练完成消息，用于指示所述发射器的训练完成。

12.一种方法，包括：

在通信系统的发射器与接收器之间握手以发起训练过程，其中所述握手包括训练设置请求消息，所述训练设置请求消息包括用于所述训练过程的参数，其中所述发射器包括可训练参数和/或所述接收器包括可训练参数；

在所述接收器处从所述发射器接收所标识的训练数据，其中所述训练数据包括发射器训练数据和/或接收器训练数据；

从所述接收器向所述发射器发送训练信息，其中所述训练信息包括用于控制所述发射器处和/或所述接收器处的训练的信息；

终止所述训练过程。

13.一种方法，包括：

在通信系统的发射器与接收器之间握手(61)以发起训练过程，其中所述握手包括训练设置请求消息，所述训练设置请求消息包括用于所述训练过程的参数，其中所述发射器包括可训练参数和/或所述接收器包括可训练参数；

从所述发射器(12)向所述接收器(16)发送(62c)所标识的训练数据，其中所述训练数据包括发射器训练数据和/或接收器训练数据；

在所述发射器(12)处从所述接收器(16)接收(64c)训练信息，其中所述训练信息包括用于控制所述发射器处和/或所述接收器处的训练的信息；

向所述接收器发送(74)训练中断消息，用于指示所述接收器和/或所述发射器的训练将被终止；以及

终止(68)所述训练过程。

14.一种计算机程序，包括用于使装置执行至少以下操作的指令：

在通信系统的发射器(12)与接收器(16)之间握手(61)以发起训练过程，其中所述握手包括训练设置请求消息，所述训练设置请求消息包括用于所述训练过程的参数，其中所述发射器包括可训练参数和/或所述接收器包括可训练参数；

在所述接收器(16)处从所述发射器(12)接收(64a)所标识的训练数据，其中所述训练数据包括发射器训练数据和/或接收器训练数据；

从所述接收器向所述发射器发送(64c)训练信息，其中所述训练信息包括用于控制所述发射器处和/或所述接收器处的训练的信息；

向所述发射器(12)发送训练中断消息，用于指示所述接收器和/或所述发射器的训练将被终止，或者向所述接收器(16)发送(74)训练中断消息，用于指示所述接收器和/或所述发射器的训练将被终止；以及

终止所述训练过程。