CN115136730B

CN115136730B - 广播已知数据来训练人工神经网络

Info

Publication number: CN115136730B
Application number: CN202180015488.3A
Authority: CN
Inventors: H.佩泽什基; 骆涛; S.阿卡拉卡兰; J.鲍; A.古普塔; T.俞; V.V.梅农; W.南
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2020-02-21
Filing date: 2021-02-17
Publication date: 2024-07-16
Anticipated expiration: 2041-02-17

Abstract

一种由用户设备(UE)执行的无线通信的方法从基站接收包括已知有效载荷的广播或多播消息以及该已知有效载荷的配置。该方法还利用已知有效载荷来训练人工神经网络。一种由基站执行的无线通信的方法，配置用于多个UE的已知有效载荷，并且向UE信令通知哪个物理信道将包括已知有效载荷以及该已知有效载荷的时间/频率资源的指示。该方法还广播或多播已知有效载荷，以便于UE处的神经网络训练。

Description

广播已知数据来训练人工神经网络

相关申请的交叉引用

本申请要求于2021年2月16日提交的题为“BROADCASTING KNOWN DATA TO TRAINARTIFICIAL NEURAL NETWORKS”的美国专利申请No.17/176,755的权益，该美国专利申请要求于2020年2月21日提交的题为“BROADCASTING KNOWN DATA TO TRAIN ARTIFICIALNEURAL NETWORKS”的美国临时专利申请No.62/980,070的权益，前述美国专利申请的全部内容通过引用明确并入本文。

背景技术

广泛部署了无线通信系统以提供诸如电话、视频、数据、消息传递和广播的各种电信服务。典型的无线通信系统可以采用能够通过共享可用系统资源(例如，带宽、发送功率等)来支持与多用户通信的多址技术。这种多址技术的示例包括码分多址(CDMA)系统、时分多址(TDMA)系统、频分多址(FDMA)系统、正交频分多址(OFDMA)系统、单载波频分多址(SC-FDMA)系统、时分同步码分多址(TD-SCDMA)系统和长期演进(LTE)系统。LTE/LTE-先进是由第三代合作伙伴计划(3GPP)颁布的通用移动电信系统(UMTS)移动标准的增强功能的集合。

无线通信网络可以包括多个基站(BS)，基站(BS)可以支持多个用户设备(UE)进行通信。用户设备(UE)可以经由下行链路和上行链路与基站(BS)通信。下行链路(或前向链路)是指从BS到UE的通信链路，上行链路(或反向链路)是指从UE到BS的通信链路。如将更详细描述的，BS可以被称为节点B、gNB、接入点(AP)、无线电头端、发送接收点(TRP)、新无线电(NR)BS、第五代(5G)节点B等。

已经在各种电信标准中采用了上述多址技术，以提供使不同用户设备能够在市政、国家、地区甚至全球级别进行通信的通用协议。新无线电(NR)也可以被称为5G，是对第三代合作伙伴计划(3GPP)颁布的LTE移动标准的增强功能的集合。NR被设计为通过提高频谱效率、降低成本、改进服务、利用新频谱以及在下行链路(DL)上使用具有循环前缀(CP)的正交频分复用(OFDM)(CP-OFDM)、在上行链路(UL)上使用CP-OFDM和/或SC-FDM(例如，也被称为离散傅里叶变换扩频OFDM(DFT-s-OFDM))以及支持波束成形、多输入多输出(MIMO)天线技术和载波聚合与其它开放标准更好地集成，来更好地支持移动宽带互联网接入。然而，随着对移动宽带接入的需求不断增加，需要对NR和LTE技术的进一步改进。优选地，这些改进应该适用于其他多址技术和采用这些技术的电信标准。

人工神经网络可以包括互连的多组人工神经元(例如，神经元模型)。人工神经网络可以是计算设备或者被表示为要由计算设备执行的方法。卷积神经网络(诸如深度卷积神经网络)是一种前馈人工神经网络。卷积神经网络可以包括可以在平铺的感受野(receptive field)中配置的神经元的层。期望将神经网络处理应用于无线通信以实现更高的效率。

发明内容

根据本公开的一个方面，一种由用户设备(UE)执行的无线通信方法，从基站接收多个UE公共的已知有效载荷的配置。该方法可以从基站接收包括已知有效载荷的消息。该方法还可以利用已知有效载荷来执行机器学习模型的在线训练。

在另一个方面，一种由基站执行的无线通信方法，配置用于多个UE的已知有效载荷，以及向UE信令通知对哪个物理信道将包括已知有效载荷和已知有效载荷的时间/频率资源的指示。该方法还向UE发送已知有效载荷，以在UE处训练机器学习模型。

根据本公开的一个方面，一种用于无线通信的UE的装置具有存储器和至少一个处理器，该至少一个处理器耦合到该存储器，并且被配置为从基站接收多个UE公共的已知有效载荷的配置。处理器还被配置为从基站接收包括已知有效载荷的消息。处理器还被配置为利用已知有效载荷来执行机器学习模型的在线训练。

根据本公开的另一个方面，一种用于无线通信的基站的装置具有存储器和至少一个处理器，该至少一个处理器耦合到该存储器，并且被配置为配置用于多个UE的已知有效载荷，并且向UE信令通知对哪个物理信道将包括已知有效载荷和已知有效载荷的时间/频率资源的指示。处理器还被配置为向UE发送已知有效载荷，以在UE处训练机器学习模型。

各方面总体上包括参考附图和说明书以及如附图和说明书大体上描述的方法、装置、系统、计算机程序产品、非暂时性计算机可读介质、用户设备、基站、无线通信设备和处理系统。

上文已经相当广泛地概述了根据本公开的示例的特征和技术优势，以便可以更好地理解以下详细描述。下文将描述附加的特征和优点。所公开的概念和具体示例可以容易地用作修改或设计用于实现本公开的相同目的的其他结构的基础。这种等同结构未脱离所附权利要求的范围。当结合附图考虑时，从以下描述中将更好地理解本文公开的概念的特征、它们的组织和操作方法以及相关联的优点。每个附图是出于说明和描述的目的而提供的，而不是作为对权利要求的限制的限定而提供的。

附图说明

为了能够详细地理解本公开的上述特征，上文所简要概括的更具体的描述可以通过参考一些方面来获得，在附图中示出了其中的一些方面。然而，应该注意，附图仅说明了本公开的特定典型方面，因此不应被认为是对本公开范围的限制，因为本说明书可以容许其他同等有效的方面。不同附图中的相同附图标记可以标识相同或相似的元素。

图1是概念上示出根据本公开的各个方面的无线通信网络的示例的框图。

图2是概念上示出根据本公开的各个方面的、无线通信网络中基站与用户设备(UE)通信的示例的框图。

图3示出了根据本公开的特定方面的、使用片上系统(SOC)(包括通用处理器)设计神经网络的示例实现方式。

图4A、图4B和图4C是示出根据本公开的各方面的神经网络的示意图。

图4D是示出根据本公开的各方面的示例性深度卷积网络(DCN)的示意图。

图5是示出根据本公开的各方面的示例性深度卷积网络(DCN)的框图。

图6是示出根据本公开的各个方面的、例如由UE和基站执行的示例过程的时序图。

图7是示出根据本公开的各个方面的、例如由用户设备执行的示例过程的流程图。

图8是示出根据本公开的各个方面的、由例如基站执行的示例过程的流程图。

具体实施方式

在下文中参考附图更全面地描述了本公开的各个方面。然而，本公开可以以多种不同的形式来体现，并且不应被解释为限于贯穿本公开呈现的任何特定结构或功能。而是，提供这些方面是为了使本公开深入和完整，并将向本领域技术人员充分传达本公开的范围。基于本文的教导，本领域技术人员应当理解，本公开的范围旨在覆盖本文所公开的本公开的任何方面，无论是独立于本公开的任何其他方面实现还是与本公开的任何其他方面组合实现。例如，可以使用阐述的任何数量的方面来实现装置或实践方法。此外，本公开的范围旨在覆盖使用除了所阐述的本公开的各个方面以外的或与其不同的结构、功能或结构和功能来实践的装置或方法。应当理解，所公开的公开内容的任何方面都可以通过权利要求的一个或多个元素来实施。

现在将参考各种装置和技术来呈现电信系统的若干个方面。这些装置和技术将通过各种框、模块、组件、电路、步骤、过程、算法和/或类似物(统称为“元素”)在以下详细描述中进行描述并在附图中说明。这些元素可以使用硬件、软件或它们的组合来实现。这些元素是作为硬件还是软件实现取决于特定应用和施加在整个系统上的设计约束。

应当注意，尽管可以使用通常与5G及之后的无线技术相关联的术语来描述各方面，但是本公开的各方面可以应用于基于其他代(诸如并且包括3G和/或4G技术)的通信系统。

人工智能(AI)/机器学习(ML)算法(诸如包括人工神经网络的那些)可以改善无线通信。AI/ML模块可以在UE、基站处运行，或者在分布式算法的情况下，跨UE和基站联合运行。

为了获得有用的结果，需要训练执行AI/ML算法的神经网络。神经网络的离线训练可以从训练数据中导出神经网络的权重和偏差(bias)。然而，离线训练没有考虑无线通信的动态真实世界环境。在线训练考虑了动态环境，包括神经网络没有针对其被训练的条件。可以利用反映无线环境的已知空中传输(或信令)来完成在线训练。对于在线训练过程，代替从头开始训练，训练可以以从离线训练阶段导出的权重和偏差的值开始，并且进一步针对无线信道、噪声和/或其他环境特性微调(fine-tune)神经网络。

参考信号(诸如解调参考信号(DMRS)、信道状态信息参考信号(CSI-RS)等)是已知的传输。然而，参考信号可能无法为某些类型的机器学习模型提供适当类型的信息。根据本公开的各方面，为特定机器学习模型(诸如对于对数似然比(LLR)计算、MIMO解映射等)提供了已知的数据传输。已知的数据传输可以包括例如物理下行链路控制信道(PDCCH)、物理上行链路控制信道(PUCCH)、物理下行链路共享信道(PDSCH)和/或物理上行链路共享信道(PUSCH)的已知有效载荷。已知的数据传输可以被多播或广播到多个UE。

图1是示出可以在其中实践本公开的各方面的网络100的示意图。网络100可以是5G或NR网络、或者一些其他无线网络，诸如LTE网络。无线网络100可以包括多个BS 110(被示出为BS 110a、BS 110b、BS 110c和BS110d)和其他网络实体。BS是与用户设备(UE)通信的实体，并且也可以被称为基站、NR BS、节点B、gNB、5G节点B(NB)、接入点、发送接收点(TRP)等。每个BS可以为特定地理区域提供通信覆盖。在3GPP中，术语“小区”可以指BS的覆盖区域和/或服务该覆盖区域的BS子系统，这取决于使用该术语的上下文。

BS可以为宏小区、微微小区、毫微微小区和/或其他类型的小区提供通信覆盖。宏小区可以覆盖相对较大(例如，半径几公里)的地理区域，并且可以允许由具有服务订阅的UE不受限制地接入。微微小区可以覆盖相对较小的地理区域，并且可以允许由具有服务订阅的UE不受限制地接入。毫微微小区可以覆盖相对较小的地理区域(例如，家庭)，并且可以允许由与该毫微微小区相关联的UE(例如，封闭订户组(CSG)中的UE)进行受限接入。宏小区的BS可以被称为宏BS。微微小区的BS可以被称为微微BS。毫微微小区的BS可以被称为毫微微BS或家庭BS。在图1所示的示例中，BS 110a可以是宏小区102a的宏BS，BS 110b可以是微微小区102b的微微BS，而BS110c可以是毫微微小区102c的毫微微BS。BS可以支持一个或多个(例如，三个)小区。术语“eNB”、“基站”、“NR BS”、“gNB”、“TRP”、“AP”、“节点B”、“5G NB”和“小区”在本文中可以互换使用。

在一些方面，小区可能不一定是静止的，并且小区的地理区域可以根据移动BS的位置而移动。在一些方面，BS可以使用任何合适的传输网络通过各种类型的回程接口(诸如直接物理连接、虚拟网络等)而彼此互连和/或与接入网络100中的一个或多个其他BS或网络节点(未示出)互连。

无线网络100还可以包括中继站。中继站是可以从上游站(例如，BS或UE)接收数据传输并将数据传输发送到下游站(例如，UE或BS)的实体。中继站也可以是可以为其他UE中继传输的UE。在图1所示的示例中，中继站110d可以与宏BS 110a和UE 120d通信，以便促进BS 110a和UE 120d之间的通信。中继站还可以称为中继BS、中继基站、中继等。

无线网络100可以是包括不同类型的BS(例如，宏BS、微微BS、毫微微BS、中继BS等)的异构网络。这些不同类型的BS可以具有不同的发送功率水平、不同的覆盖区域以及对无线网络100中的干扰的不同影响。例如，宏BS可以具有高发送功率水平(例如，5至40瓦)，而微微BS、毫微微BS和中继BS可以具有更低发送功率水平(例如，0.1至2瓦)。

网络控制器130可以耦合到BS的集合，并且可以为这些BS提供协调和控制。网络控制器130可以经由回程与BS通信。BS还可以例如经由无线或有线回程直接或间接地彼此通信。

UE 120(例如，120a、120b、120c)可以分散在整个无线网络100中，并且每个UE可以是静止的或者移动的。UE还可以被称为接入终端、终端、移动站、订户单元、站等。UE可以是蜂窝电话(例如，智能电话)、个人数字助理(PDA)、无线调制解调器、无线通信设备、手持设备、膝上型计算机、无绳电话、无线本地环路(WLL)站、平板、相机、游戏设备、上网本、智能本、超极本、医疗设备或器材、生物测定传感器/设备、可穿戴设备(智能手表、智能服装、智能眼镜、智能腕带、智能珠宝(例如，智能戒指、智能手环))、娱乐设备(例如，音乐或视频设备或卫星收音机)、载具组件或传感器、智能仪表/传感器、工业制造器材、全球定位系统设备、或被配置为经由无线或有线介质通信的任何其他合适的设备。

一些UE可以被认为是机器类型通信(MTC)或者是演进型或增强型机器类型通信(eMTC)UE。MTC和eMTC UE包括例如机器人、无人机、远程设备、传感器、仪表、监视器、位置标签等，它们可以与基站、另外的设备(例如，远程设备)或一些其他实体通信。例如，无线节点可以经由有线或无线通信链路为网络(例如，诸如互联网或蜂窝网络的广域网)提供连接或者提供与网络的连接。一些UE可以被认为是物联网(IoT)设备，和/或可以被实现为NB-IoT(窄带物联网)设备。一些UE可以被认为是客户驻地设备(CPE)。UE 120可以包括在容纳UE120的组件(诸如处理器组件、存储器组件等)的外壳内。

一般地，可以在给定的地理区域中部署任意数量的无线网络。每个无线网络可以支持特定的RAT并且可以在一个或多个频率上操作。RAT也可以被称为无线电技术、空中接口等。频率也可以称为载波、频道等。为了避免不同RAT的无线网络之间的干扰，每个频率可以支持给定地理区域中的单种RAT。在一些情况下，可以部署NR或5G RAT网络。

在一些方面，两个或更多个UE 120(例如，被示出为UE 120a和UE 120e)可以使用一个或多个侧行链路信道直接通信(例如，不使用基站110作为彼此通信的中介)。例如，UE120可以使用对等(P2P)通信、设备到设备(D2D)通信、车辆对万物(V2X)协议(例如，其可以包括车辆到车辆(V2V)协议、车辆到基础设施(V2I)协议等)、网状网络等。在这种情况下，UE120可以执行调度操作、资源选择操作和/或在本文中其他地方描述为由基站110执行的其他操作。

如上所描述的，图1仅作为示例提供。其他示例可以与针对图1描述的不同。

图2示出了基站110和UE 120的设计200的框图，基站110和UE 120可以是图1中的基站之一和UE之一。基站110可以被配备有T个天线234a至234t，并且UE 120可以被配备有R个天线252a至252r，其中一般T≥1且R≥1。

在基站110处，发送处理器220可以从数据源212接收用于一个或多个UE的数据，至少部分地基于从UE接收到的信道质量指示(CQI)为每个UE选择一个或多个调制和编码方案(MCS)，至少部分地基于为UE选择的MCS针对每个UE处理(例如，解码和调制)数据，以及提供用于所有UE的数据符号。发送处理器220还可以处理系统信息(例如，用于半静态资源划分信息(SRPI)等)和控制信息(例如，CQI请求、许可、上层信令等)并提供开销符号和控制符号。发送处理器220还可以生成用于参考信号(例如，小区特定参考信号(CRS))和同步信号(例如，主同步信号(PSS)和辅同步信号(SSS))的参考符号。发送(TX)多输入多输出(MIMO)处理器230可以对数据符号、控制符号、开销符号和/或参考符号(如果适用)执行空间处理(例如，预编码)，并且可以向T个调制器(MOD)232a至232t提供T个输出符号流。每个调制器232可以处理相应的输出符号流(例如，用于OFDM等)以获得输出样本流。每个调制器232还可以处理(例如，转换为模拟、放大、滤波和上变频)输出样本流以获得下行链路信号。来自调制器232a至232t的T个下行链路信号可以分别经由T个天线234a至234t来发送。根据以下更详细描述的各个方面，可以利用位置编码来生成同步信号以传达附加信息。

在UE 120处，天线252a至252r可以接收来自基站110和/或其他基站的下行链路信号，并且可以将接收到的信号分别提供给解调器(DEMOD)254a至254r。每个解调器254可以调节(例如，滤波、放大、下变频和数字化)接收到的信号以获得输入样本。每个解调器254还可以处理输入样本(例如，用于OFDM等)以获得接收到的符号。MIMO检测器256可以从所有R个解调器254a至254r获得接收到的符号，对接收到的符号执行MIMO检测(如果适用)，并且提供经检测的符号。接收处理器258可以处理(例如，解调和解码)经检测的符号，将用于UE120的经解码的数据提供给数据宿260，并且将经解码的控制信息和系统信息提供给控制器/处理器280。信道处理器可以确定参考信号接收功率(RSRP)、接收信号强度指示符(RSSI)、参考信号接收质量(RSRQ)、信道质量指示符(CQI)等。在一些方面，UE 120的一个或多个组件可以包括在外壳中。

在上行链路上，在UE 120处，发送处理器264可以接收和处理来自数据源262的数据和来自控制器/处理器280的控制信息(例如，对于包括RSRP、RSSI、RSRQ、CQI等的报告)。发送处理器264还可以生成用于一个或多个参考信号的参考符号。来自发送处理器264的符号可以由TX MIMO处理器266预编码(如果适用)，由调制器254a至254r进一步处理(例如，用于DFT-s-OFDM、CP-OFDM等)，并且被发送到基站110。在基站110处，来自UE120和其他UE的上行链路信号可以由天线234接收，由解调器232处理，由MIMO检测器236检测(如果适用)，并且由接收处理器238进一步处理以获得经解码的由UE 120发送的数据和控制信息。接收处理器238可以将经解码的数据提供给数据宿239，并且将经解码的控制信息提供给控制器/处理器240。基站110可以包括通信单元244，并且经由通信单元244与网络控制器130通信。网络控制器130可以包括通信单元294、控制器/处理器290和存储器292。

基站110的控制器/处理器240、UE 120的控制器/处理器280和/或图2的任何其他组件可以执行与基于已知有效载荷的神经网络训练相关联的一种或多种技术，如在别处更详细描述的。例如，基站110的控制器/处理器240、UE 120的控制器/处理器280和/或图2的任何其他组件可以执行或指导例如图7和图8的过程700、800和/或所描述的其他过程的操作。存储器242和282可以分别存储用于基站110和UE 120的数据和程序代码。调度器246可以调度UE在下行链路和/或上行链路上进行数据传输。

在一些方面，UE 120或基站110可以包括用于接收的部件、用于执行在线训练的部件、用于配置的部件、用于信令通知的部件以及用于发送的部件。这些部件可以包括结合图2描述的UE 120或基站110的一个或多个组件。

如上所述，图2仅作为示例提供。其他示例可能不同于参考图2所描述的内容。

在一些情况下，支持不同类型的应用和/或服务的不同类型的设备可以共存于一个小区中。不同类型设备的示例包括UE手持式设备、客户驻地设备(CPE)、车辆、物联网(IoT)设备等。不同类型的应用的示例包括超可靠低时延通信(URLLC)应用、大规模机器类型通信(mMTC)应用、增强型移动宽带(eMBB)应用、车对万物(V2X)应用等。此外，在一些情况下，单个设备可以同时支持不同的应用或服务。

图3示出了根据本公开的特定方面的片上系统(SOC)300的示例实现方式，该片上系统(SOC)300可以包括被配置为基于广播或多播的已知有效载荷进行训练的中央处理单元(CPU)302或多核CPU。SOC 300可以包括在基站110或UE 120中。变量(例如，神经信号和突触权重)、与计算设备(例如，具有权重的神经网络)相关联的系统参数、延迟、频率仓(bin)信息和任务信息可以存储在与神经处理单元(NPU)108相关联的存储器块中、与CPU 302相关联的存储器块中、与图形处理单元(GPU)304相关联的存储器块中、与数字信号处理器(DSP)306相关联的存储器块中、存储器块318中或者可以分布在多个块中。在CPU 302处执行的指令可以从与CPU 302相关联的程序存储器加载、或者可以从存储器块318加载。

SOC 300还可以包括为特定功能定制的附加处理模块，诸如GPU 304、DSP 306、连接模块310(其可以包括第五代(5G)连接、第四代长期演进(4GLTE)连接、Wi-Fi连接、USB连接、蓝牙连接等)以及例如可以检测和辨识姿势的多媒体处理器312。在一种实现方式中，NPU在CPU、DSP和/或GPU中实现。SOC 300还可以包括传感器处理器314、图像信号处理器(ISP)316和/或导航模块320(其可以包括全球定位系统)。

SOC 300可以基于ARM指令集。在本公开的一个方面，加载到通用处理器302中的指令可以包括用于接收多个UE公共的已知有效载荷的配置的代码、用于接收包括已知有效载荷的消息的代码、以及用于利用已知有效载荷执行机器学习模型的在线训练的代码。加载到通用处理器302中的指令还可以包括配置用于多个UE的已知有效载荷的代码、向UE信令通知对哪个物理信道将包括已知有效载荷和已知有效载荷的时间/频率资源的指示的代码、以及向UE发送已知有效载荷以使UE能够训练本地机器学习模型的代码。

深度学习架构可以通过学习在每个层中以连续更高的抽象级别(level ofabstraction)表示输入从而建立输入数据的有用特征表示，来执行对象辨识任务。这样，深度学习解决了传统机器学习的主要瓶颈。在深度学习出现之前，针对对象辨识问题的机器学习方法可能严重依赖于人类工程设计的特征，可能与浅层分类器相组合。例如，浅层分类器可以是两类线性分类器，其中可以将特征向量分量的加权和与阈值进行比较，以预测输入属于哪个类。人类工程设计的特征可以是由具有领域专业知识的工程师针对特定问题领域定制的模板或核。相比之下，深度学习架构可以学习表示类似于人类工程师可能设计的特征，但是是通过训练。此外，深度网络可以学习表示和辨识人类可能没有考虑到的新类型的特征。

深度学习架构可以学习特征的层级。例如，如果以视觉数据来呈现，第一层可以学习辨识输入流中相对简单的特征，诸如边缘。在另一个示例中，如果以听觉数据来呈现，第一层可以学习辨识特定频率的频谱功率。将第一层的输出作为输入，第二层可以学习辨识特征的组合，诸如视觉数据的简单形状或听觉数据的声音组合。例如，更高层可以学习表示视觉数据中的复杂形状或听觉数据中的词语。再高层可以学习辨识常见视觉对象或口语短语。

当被应用于具有自然层级结构的问题时，深度学习架构可以表现得特别好。例如，机动车辆的分类可以受益于首先学习辨识车轮、挡风玻璃和其他特征。这些特征可以在更高层以不同的方式组合，以辨识汽车、卡车和飞机。

神经网络可以被设计有多种连接图样。在前馈网络中，信息从更低层传递到更高层，其中给定层中的每个神经元与更高层中的神经元通信。如上所述，可以在前馈网络的连续层中建立层级表示。神经网络还可以具有循环或反馈(也被称为自上而下(top-down))连接。在循环连接中，来自给定层中的神经元的输出可以被通信传送到同一层中的另一个神经元。循环架构可以有助于辨识跨越按序被传递到神经网络的输入数据组块(chunk)中的多于一个的图样。从给定层中的神经元到更低层中的神经元的连接被称为反馈(或自上而下)连接。当对高级概念的辨识可以有助于区分输入的特定低级特征时，具有许多反馈连接的网络可以是有帮助的。

神经网络的层之间的连接可以是完全连接的或局部连接的。图4A示出了完全连接神经网络402的示例。在完全连接神经网络402中，第一层中的神经元可以将其输出通信传送给第二层中的每一个神经元，使得第二层中的每个神经元将接收来自第一层中的每一个神经元的输入。图4B示出了局部连接神经网络404的示例。在局部连接神经网络404中，第一层中的神经元可以连接到第二层中有限数量的神经元。更一般地，局部连接神经网络404的局部连接层可以被配置为使得层中的每个神经元将具有相同或相似的连接图样，但是具有可以具有不同值的连接强度(例如，410、412、414和416)。局部连接的连接图样可以在更高层中产生空间上不同的感受野，因为给定区域中的更高层神经元可以接收通过训练被调整为网络的总输入的受限部分的属性的输入。

局部连接神经网络的一个示例是卷积神经网络。图4C示出了卷积神经网络406的示例。卷积神经网络406可以被配置为使得与第二层中的每个神经元的输入相关联的连接强度被共享(例如，408)。卷积神经网络可能非常适合于其中输入的空间位置有意义的问题。

一种类型的卷积神经网络是深度卷积网络(DCN)。图4D示出了被设计为从图像捕获设备430(诸如车载相机)输入的图像426中辨识出视觉特征的DCN 400的详细示例。当前示例的DCN 400可以被训练为识别交通标志和交通标志上提供的数字。当然，DCN 400可以被训练用于其他任务，诸如识别车道标志或识别交通灯。

可以利用监督学习来训练DCN 400。在训练期间，可以向DCN 400呈现图像(诸如限速标志的图像426)，然后可以计算前向传递(forward pass)以产生输出422。DCN 400可以包括特征提取部分和分类部分。在接收到图像426时，卷积层432可以将卷积核(未示出)应用于图像426，以生成第一特征图集418。例如，卷积层432的卷积核可以是生成28×28特征图的5×5核。在本示例中，因为在第一特征图集418中生成了四个不同的特征图，所以在卷积层432将四个不同的卷积核应用于图像426。卷积核也可以被称为滤波器或卷积滤波器。

可以通过最大池化层(未示出)对第一特征图集418进行子采样，以生成第二特征图集420。最大池化层减小第一特征图集418的尺寸。也就是说，第二特征图集420的尺寸(诸如14×14)小于第一特征图集418的尺寸(诸如28×28)。减小的尺寸为后续层提供了类似的信息，同时降低了存储器消耗。第二特征图集420可以经由一个或多个后续卷积层(未示出)被进一步卷积，以生成一个或多个后续特征图集(未示出)。

在图4D的示例中，第二特征图集420被卷积以生成第一特征向量424。此外，第一特征向量424被进一步卷积以生成第二特征向量428。第二特征向量428的每个特征可以包括与图像426的可能特征相对应的数字，诸如“标志”、“60”和“100”。softmax函数(未示出)可以将第二特征向量428中的数字转换成概率。这样，DCN 400的输出422是图像426包括一个或多个特征的概率。

在本示例中，输出422中“标志”和“60”的概率高于输出422中其他内容(诸如“30”、“40”、“50”、“70”、“80”、“90”和“100”)的概率。在训练之前，由DCN 400产生的输出422可能是不正确的。因此，可以计算输出422和目标输出之间的误差。目标输出是图像426的地面真值(例如，“标志”和“60”)。然后可以调整DCN 400的权重，使得DCN 400的输出422更接近目标输出。

为了调整权重，学习算法可以计算权重的梯度向量。梯度可以指示如果权重被调整，误差将增加或减少的量。在顶层，梯度可以直接对应于连接倒数第二层中的激活神经元和输出层中的神经元的权重的值。在更低层中，梯度可以取决于权重的值和更高层的计算出的误差梯度。然后可以调整权重以减小误差。这种调整权重的方式可以被称为“后向传播(back propagation)”，因为它涉及通过神经网络的“向后传递”。

在实践中，可以通过少量示例计算权重的误差梯度，以使计算出的梯度接近真实误差梯度。这种近似方法可以被称为随机梯度下降。可以重复随机梯度下降，直到整个系统的可实现误差率停止下降或者直到误差率达到目标水平为止。在学习之后，可以向DCN呈现新的图像(例如，图像426的限速标志)，并且通过网络的前向传递可以产生可以被认为是DCN的推断或预测的输出422。

深度置信网络(DBN)是包括多层隐藏节点的概率模型。DBN可以用于提取训练数据集的层级表示。DBN可以通过堆叠多层受限玻尔兹曼机(RBM)来获得。RBM是可以学习输入集的概率分布的人工神经网络。因为RBM可以在没有关于每个输入应该被分类到的类的信息的情况下学习概率分布，所以RBM经常用于无监督学习。使用混合无监督和监督范式，DBN的底部RBM可以以无监督方式来训练，并且可以用作特征提取器，而顶部RBM可以以监督方式(基于来自前一层和目标类的输入的联合分布)来训练，并且可以用作分类器。

深度卷积网络(DCN)是被配置有额外的池化和归一化层的卷积网络的网络。DCN已经在多种任务上实现了最先进的性能。可以使用监督学习来训练DCN，在监督学习中，输入和输出目标两者对于多个样本都是已知的，并且用于通过使用梯度下降方法来修改网络的权重。

DCN可以是前馈网络。此外，如上所述，从DCN的第一层中的神经元到下一更高层中的一组神经元的连接在第一层中的神经元之间共享。DCN的前馈和共享连接可以被用于快速处理。例如，DCN的计算负担可以比包括循环或反馈连接的类似尺寸的神经网络的计算负担小得多。

对卷积网络的每个层的处理可以被视为空间不变模板或基础投影。如果输入首先被分解成多个通道(诸如彩色图像的红色、绿色和蓝色通道)，那么在该输入上训练的卷积网络可以被认为是三维的，其中两个空间维度沿着图像的轴，并且第三个维度捕获颜色信息。卷积连接的输出可以被认为形成后续层中的特征图，特征图(例如，220)的每个元素接收来自前一层(例如，特征图218)中的一系列(a range of)神经元和来自多个通道中的每一个的输入。特征图中的值可以用非线性(诸如整流，max(0，x))进一步处理。来自相邻神经元的值可以被进一步池化(这对应于下采样)，并且可以提供额外的局部不变性(localinvariance)和维度减少。对应于白化的归一化也可以通过特征图中神经元之间的横向抑制(lateral inhibition)来应用。

深度学习架构的性能可以随着更多标记数据点变得可用或随着计算能力增加而提高。现代深度神经网络通常使用仅15年前典型研究人员可用资源的数千倍的计算资源进行训练。新的架构和训练范式可以进一步提高深度学习的性能。整流线性单元可以减少被称为消失梯度的训练问题。新的训练技术可以减少过拟合，从而使更大的模型能够实现更好的泛化。封装技术可以提取给定感受野中的数据，并且进一步提高整体性能。

图5是示出深度卷积网络550的框图。基于连接和权重共享，深度卷积网络550可以包括多个不同类型的层。如图5所示，深度卷积网络550包括卷积块554A、554B。卷积块554A、554B中的每个可以配置有卷积层(CONV)356、归一化层(LNorm)558和最大池化层(MAXPOOL)560。

卷积层556可以包括一个或多个卷积滤波器，其可以被应用于输入数据以生成特征图。尽管仅示出了卷积块554A、554B中的两个，但是本公开不限于此，相反，根据设计偏好，深度卷积网络550中可以包括任意数量的卷积块554A、554B。归一化层558可以归一化卷积滤波器的输出。例如，归一化层558可以提供白化或横向抑制。最大池化层560可以提供空间上的下采样聚合，以获得局部不变性和维度减少。

例如，可以将深度卷积网络的并行滤波器组加载到SOC 300的CPU 302或GPU 304上，以实现高性能和低功耗。在替代实施例中，并行滤波器组可以加载在SOC 300的DSP 306或ISP 316上。此外，深度卷积网络550可以访问可以存在于SOC 300上的其他处理块，诸如分别专用于传感器和导航的传感器处理器314和导航模块320。

深度卷积网络550还可以包括一个或多个完全连接层562(FC1和FC2)。深度卷积网络550还可以包括逻辑回归(LR)层564。在深度卷积网络550的每个层556、558、560、562、564之间是要被更新的权重(未示出)。层(例如，556、558、560、562、564)中的每个的输出可以用作深度卷积网络550中的层(例如，556、558、560、562、564)中的后续一个的输入，以从在卷积块554A中的第一个处提供的输入数据552(例如，图像、音频、视频、传感器数据和/或其他输入数据)中学习层级特征表示。深度卷积网络550的输出是输入数据552的分类分数566。分类分数566可以是概率集，其中每个概率是输入数据的概率，包括来自特征集的特征。

如上所述，图3-图5作为示例提供。其他示例可能不同于参考图3-图5所描述的内容。

如上所述，人工智能(AI)/机器学习(ML)算法可以改善无线通信。AI/ML模块可以在UE、基站上运行，或者在分布式算法的情况下，在UE和基站上联合运行。尽管本公开总体上涉及UE侧的AI模块，但是本公开还设想了其中联合训练发生的自动编码器场景。

为了获得有用的结果，需要训练执行AI/ML算法的神经网络。神经网络的离线训练可以从训练数据中导出神经网络的权重和偏差。然而，离线训练不考虑无线通信的动态真实世界环境。在线训练考虑动态环境，包括神经网络不针对其进行训练的条件。可以利用反映无线环境的已知空中传输(或信令)来完成在线训练。对于在线训练过程，代替从头开始训练，训练可以以从离线训练阶段导出的权重和偏差的值开始。在线训练过程然后进一步针对无线信道、噪声和/或其他环境特性微调神经网络。

参考信号(诸如解调参考信号(DMRS)、信道状态信息参考信号(CSI-RS)等)是已知的传输。然而，参考信号可能无法为某些类型的机器学习模型提供适当类型的信息。对于特定机器学习模型(诸如对于对数似然比(LLR)计算、MIMO解映射等)可能需要数据传输。已知的数据传输可以包括例如物理下行链路控制信道(PDCCH)、物理上行链路控制信道(PUCCH)、物理下行链路共享信道(PDSCH)和/或物理上行链路共享信道(PUSCH)的已知有效载荷。

用于MIMO解映射器的泛化机器学习(ML)模型可以表示为例如y＝Hx+n，其中y是接收到的向量，x是发送的符号向量，n是噪声向量，并且H是信道矩阵。神经网络(NN)可以被离线训练以确定(估计的符号)，并且可以受益于利用在线训练的微调。神经网络的输入是接收到的观测(y)和估计的信道矩阵(H)，并且输出是检测到的发送的符号，例如在这种情况下，地面真值标签是用于训练神经网络的已知有效载荷。因此，设备(例如，UE或gNB)可以执行进一步的在线训练，而不必解码y以使用经解码的作为神经网络的地面真值标签。因为有效载荷是已知的，所以机器学习模型可以使用训练数据来学习如何在存在信道特性、噪声特性等的情况下解释符号。

上述示例仅是已知的数据传输用于在线训练的目的时可能如何有用的说明性示例。上述示例一般适用于单播的上下文，其中基站专门向给定的UE发送训练数据(例如，具有给定的MIMO秩、MCS等)来训练其神经网络。然而，这些示例不限于单播。此外，用例不限于MIMO解映射器。也设想了其他用例，诸如利用任何其他类型的神经网络。

根据本公开的各方面，常规数据传输一旦被解码就可以被视为是已知的。常规数据传输包括已知(例如，当系统信息(SI)改变时在边界之间)周期性重复的系统信息块(SIB)。一旦循环冗余校验(CRC)通过，常规数据传输还可以包括单播传输。然而，对用于训练人工神经网络的常规数据传输进行解码可能使用过多的内存和计算开销，从而导致高时延。例如，接收到的调制符号被存储直到解码完成为止，只有在解码完成之后，经解码的符号才能用于训练目的。

因此，一种其中基站和UE两者都提前知道和/或约定特定物理信道传输的有效载荷/内容的模式可能是期望的。这些已知的传输可以立即用作神经网络的在线训练中的地面真值标签。

为了在线训练的目的，信令框架可以使UE能够训练它们各自的神经网络。发送双方都知道的已知有效载荷在多种上下文中可以是有益的，因为UE不需要完全解码有效载荷来找到用于训练的标签。

根据本公开的方面，基站可以发送已知数据，使得用户设备可以使用该数据来训练其神经网络。传输可以是UE特定的、UE组特定的(例如，多播)或者是真正的广播(例如，向小区中的每个UE)。

基于用户设备想要训练哪种类型的神经网络，用户设备可能需要不同类型的数据。因此，可以生成UE特定的已知有效载荷。尽管已知有效载荷包括针对特定UE的数据(例如，具有特定的MCS和秩)，但是在其他UE需要相同类型的数据的情况下，仍然可以广播已知有效载荷。如果基站想要训练特定的一组UE，则多播可能是合适的。小区特定的训练可以通过向小区内的所有UE广播来实现。

根据本公开的方面，可以以使得UE和基站能够独立生成已知有效载荷的方式来生成已知有效载荷。例如，已知有效载荷可以基于RRC配置的加扰种子。在其他方面，已知有效载荷可以基于UE和基站两者都已知的任何序列。

在一些方面，已知有效载荷的位置(例如，在哪个物理信道上)和已知有效载荷的准确时频资源(例如，周期性(非周期的、半持久的、周期的)、持续时间和聚合级别(对于PDCCH)、有效载荷尺寸等)可以被预先配置。在其他方面，基站显式地信令通知关于已知有效载荷的信息。显式信令可以经由RRC、MAC控制元素(CE)或者经由PDCCH。

已知数据位置的一些非限制性示例包括物理广播信道(PBCH)有效载荷、PDSCH和PDCCH。已知数据的位置可以基于其在神经网络中的用途来选择。

PBCH有效载荷在现有系统中广播，并且一旦被解码就可以被视为已知有效载荷。有效载荷的内容将随时间改变(由于系统帧号(SFN)改变)，但是改变的周期远大于同步信号块(SSB)周期。因此，UE可以解码PBCH并相应地定义标签。UE可以使用该地面真实标签来进行训练，直到PBCH有效载荷由于SFN改变而更新为止。

PDSCH携带系统信息块(SIB)。已知SIB(当系统信息(SI)可能改变时在边界之间)周期性地重复，类似于上面提到的PBCH有效载荷。因此，UE可以解码SIB并将其用于训练，直到SIB由于新的SI而改变为止。

PDCCH当前不包括已知有效载荷。根据本公开的方面，可以用已知有效载荷来定义PDCCH。如果需要，已知有效载荷可以被配置用于多播或广播。

图6是示出了根据本公开的各个方面的，例如由UE 120-1、120-2和基站110执行的示例过程的时序图。尽管图6示出了基于从基站110接收到的已知数据在UE 120-1、120-2处的训练，但是也可以设想相反的情况，其中基站110基于从UE 120接收到的已知数据来训练其神经网络。

在时间t0，基站110向UE 120-1、120-2配置已知有效载荷，例如，根据其生成已知数据的种子。在一些实现方式中，基站110使用RRC信令来配置用于生成已知数据的加扰种子。基站110还向UE 120-1、120-2信令通知对已知数据的参数的指示，诸如哪个物理信道将包括已知有效载荷以及已知有效载荷的时间/频率资源。基站110可以向UE 120-1、120-2广播或多播该信息。

在时间t1，基站110基于参数向UE 120-1、120-2发送已知数据。基站110可以向UE120-1、120-2广播或多播已知数据。在时间t2，UE 120-1基于已知数据执行其机器学习模型的在线训练。在时间t3，UE 120-2基于已知数据执行其机器学习模型的在线训练。在时间t4，基站110和UE 120-1之间的通信基于经训练的机器学习模型继续。例如，对数似然比(LLR)计算可以基于经训练的机器学习模型。在时间t5，基站110和UE 120-2之间的通信基于经训练的机器学习模型继续。

图7是示出根据本公开的各个方面的，例如由UE执行的示例过程700的流程图。示例过程700是接收多播或广播已知有效载荷例如以用于训练机器学习模型(诸如人工神经网络)的示例。

如图7所示，在一些方面，过程700可以包括从基站接收多个UE公共的已知有效载荷的配置(框720)。例如，UE(例如，使用天线252、DEMOD254、MIMO检测器256、接收处理器258、控制器/处理器280、存储器282等)可以接收该配置。过程700可以包括接收已知有效载荷(框720)。例如，UE(例如，使用天线252、DEMOD 254、MIMO检测器256、接收处理器258、控制器/处理器280、存储器282等)可以接收已知有效载荷。例如，已知有效载荷可以在PBCH、PDCCH或PDSCH内。可以在多播消息或广播消息中接收到已知有效载荷。因为有效载荷是已知的，所以UE可以不必解码有效载荷来确定其序列。相反，UE可以独立于基站，例如，基于RRC配置的加扰种子来生成有效载荷。UE知晓已知有效载荷在哪里。该知识可以是预先配置的、或者是从基站信令通知的。

如图7所示，在某些方面，过程700可以包括利用已知有效载荷来执行机器学习模型(其可以包括人工神经网络)的在线训练(框730)。例如，UE(例如，使用控制器/处理器280、存储器282等)可以利用已知有效载荷来训练人工神经网络。已知有效载荷可以用于生成用于训练神经网络的地面真值标签。

图8是示出根据本公开的各个方面的，例如由基站执行的示例过程800的流程图。示例过程800是广播或多播用于训练机器学习模型(诸如人工神经网络)的已知数据的示例。

如图8所示，在一些方面，过程800可以包括配置用于多个UE的已知有效载荷(框810)。例如，基站(例如，使用天线234、MOD 232、MIMO处理器230、发送处理器220、控制器/处理器240和存储器242等)可以广播或多播该配置。过程800可以包括信令通知对哪个物理信道将包括已知有效载荷和已知有效载荷的时间/频率资源的指示(框820)。例如，基站(例如，使用天线234、MOD 232、MIMO处理器230、发送处理器220、控制器/处理器240和存储器242等)可以广播或多播对哪个物理信道(例如，PBCH、PDSCH、PDCCH)将包括已知有效载荷的指示。该指示还可以定义时间/频率资源，包括周期性、持续时间、有效载荷尺寸以及在PDCCH传输情况下的聚合级别。

在发送指示后，过程800可以发送已知有效载荷(框830)。例如，基站(例如，使用天线234、MOD 232、MIMO处理器230、发送处理器220、控制器/处理器240和存储器242等)可以在PBCH上广播已知有效载荷或者多播已知有效载荷，以便于UE处的神经网络训练。

尽管图6、图7和图8在一些方面示出了过程600、700、800的示例框，但过程600、700、800可以包括比图6、图7和图8中所示更多的框、更少的框、不同的框或不同排列的框。附加地或可替代地，过程600、700、800的两个或更多个框可以并行执行。

实现方式示例在以下编号的条款中描述：

1.一种由用户设备(UE)进行的无线通信的方法，包括：

从基站接收已知有效载荷的配置，该已知有效载荷是多个UE公共的；

从基站接收包括已知有效载荷的消息；以及

利用已知有效载荷来执行机器学习模型的在线训练。

2.根据条款1的方法，其中，该配置包括无线电资源控制(RRC)配置的加扰种子。

3.根据前述条款中任一项的方法，还包括接收在哪里接收已知有效载荷的指示，该指示是预先配置的或者是经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)接收到的。

4.根据前述条款中任一项的方法，其中，该指示定义了已知有效载荷的周期性、持续时间、聚合级别和/或有效载荷尺寸。

5.根据前述条款中任一项的方法，其中，该已知有效载荷位于物理广播信道(PBCH)、物理下行链路共享信道(PDSCH)或物理下行链路控制信道(PDCCH)中。

6.根据前述条款中任一项的方法，其中，该消息包括多播消息。

7.根据条款1-5中任一项的方法，其中，该消息包括广播消息。

8.一种由基站进行的无线通信的方法，包括：

配置用于多个用户设备(UE)的已知有效载荷；

向多个UE信令通知对哪个物理信道将包括已知有效载荷和已知有效载荷的时间/频率资源的指示；以及

向多个UE发送已知有效载荷，以使得多个UE能够在多个UE处训练机器学习模型。

9.根据条款8的方法，其中，发送包括多播已知有效载荷。

10.根据条款8的方法，其中，发送包括广播已知有效载荷。

11.根据条款8-10中任一项的方法，其中，该物理信道包括物理下行链路控制信道(PDCCH)、物理广播信道(PBCH)或物理下行链路共享信道(PDSCH)，并且该时间/频率资源包括已知有效载荷的周期性、持续时间和有效载荷尺寸。

12.根据条款8-11中任一项的方法，其中，该已知有效载荷被定义在物理下行链路控制信道(PDCCH)内。

13.根据条款8-12中任一项的方法，还包括发送指示在哪里接收已知有效载荷的消息，该消息是预先配置的或者经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)发送的。

14.根据条款8-13中任一项的方法，其中，配置已知有效载荷包括经由无线电资源控制(RRC)信令发送加扰种子。

15.一种用于无线通信的用户设备(UE)的装置，包括：

存储器；以及

至少一个处理器，其耦合到该存储器，并且被配置为：

从基站接收多个UE公共的已知有效载荷的配置；

从基站接收包括已知有效载荷的消息；以及

利用已知有效载荷来训练机器学习模型。

16.根据条款15的装置，其中，该配置包括无线电资源控制(RRC)配置的加扰种子。

17.根据条款15或16的装置，其中，该至少一个处理器还被配置为接收在哪里接收已知有效载荷的指示，该指示是预先配置的或者经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)接收到的。

18.根据条款15-17中任一项的装置，其中，该指示定义了已知有效载荷的周期性、持续时间、聚合级别和/或有效载荷尺寸。

19.根据条款15-18中任一项的装置，其中，该已知有效载荷位于物理广播信道(PBCH)、物理下行链路共享信道(PDSCH)或物理下行链路控制信道(PDCCH)中。

20.根据条款15-19中任一项的装置，其中，该消息包括多播消息。

21.根据条款15-19中任一项的装置，其中，该消息包括广播消息。

22.一种用于无线通信的基站的装置，包括：

存储器；以及

至少一个处理器，其耦合到该存储器，并且被配置为：

配置用于多个用户设备(UE)的已知有效载荷；

23.根据条款22的装置，其中，该至少一个处理器被配置为通过多播已知有效载荷来发送已知有效载荷。

24.根据条款22的装置，其中，该至少一个处理器被配置为通过广播已知有效载荷来发送已知有效载荷。

25.根据条款22-24中任一项的装置，其中，该物理信道包括物理下行链路控制信道(PDCCH)、物理广播信道(PBCH)或物理下行链路共享信道(PDSCH)，并且该时间/频率资源包括已知有效载荷的周期性、持续时间和有效载荷尺寸。

26.根据条款22-25中任一项的装置，其中，该已知有效载荷被定义在物理下行链路控制信道(PDCCH)内。

27.根据条款22-26中任一项的装置，其中，该至少一个处理器还被配置为发送指示在哪里接收已知有效载荷的消息，该消息是预先配置的或者经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)发送的。

28.根据条款22-27中任一项的装置，其中，该至少一个处理器还被配置为通过经由无线电资源控制(RRC)信令发送加扰种子来配置该已知有效载荷。

29.一种装置，包括用于执行条款1至14中任一项的方法的至少一个部件。

30.一种存储用于无线通信的代码的非暂时性计算机可读介质，该代码包括可由处理器执行以执行条款1至14中任一项的方法的指令。

前述公开提供了说明和描述，但不旨在穷举或将各方面限制为所公开的精确形式。可以根据上述公开进行修改和变化、或者可以从这些方面的实践中获得修改和变化。

如本文所使用的，术语“组件”旨在广义地被解释为硬件、固件和/或硬件和软件的组合。如本文所使用的，处理器以硬件、固件和/或硬件和软件的组合来实现。

本文中结合阈值描述了一些方面。如本文所使用的，取决于上下文，满足阈值可以指大于阈值、大于或等于阈值、小于阈值、小于或等于阈值、等于阈值、不等于阈值等的值。

清楚的是，本文所描述的系统和/或方法可以以不同形式的硬件、固件和/或硬件和软件的组合来实现。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不限制这些方面。因此，本文描述了系统和/或方法的操作和行为，而没有参考具体的软件代码，应当理解，可以至少部分地基于本文的描述来将软件和硬件设计为实现系统和/或方法。

尽管权利要求书中叙述了和/或说明书中公开了特征的特定组合，但这些组合并不旨在限制各个方面的公开内容。事实上，这些特征中的多个可以以权利要求中未具体叙述的和/或说明书中未具体公开的方式相组合。尽管所列出的每个从属权利要求可能仅直接引用一个权利要求，但各个方面的公开内容包括每个从属权利要求与权利要求书中的每个另外的权利要求的组合。指向一系列项目中的“至少一个”的短语是指那些项目的任何组合(包括单个成员)。作为示例，“a、b或c中的至少一个”旨在涵盖a、b、c、a-b、a-c、b-c和a-b-c，以及与相同元素的倍数的任何组合(例如，a-a、a-a-a、a-a-b、a-a-c、a-b-b、a-c-c、b-b、b-b-b、b-b-c、c-c以及c-c-c，或a、b和c的任何其他排列)。

除非明确说明，否则不应将本文使用的任何元素、行为或指令解释为关键的或必要的。此外，如本文所使用的，冠词“一(a)”和“一个(an)”旨在包括一个或多个项目，并且可以与“一个或多个”互换使用。此外，如本文所使用的，术语“集”和“组”旨在包括一个或多个项目(例如，相关项目、不相关项目、相关和不相关项目的组合等)，并且可以与“一个或多个”互换使用。如果只打算使用一个项目，则使用短语“仅一个”或类似的语言。此外，如本文所使用的，术语“有”、“具有”等旨在作为开放式术语。此外，除非另有明确说明，否则短语“基于”旨在表示“至少部分地基于”。

Claims

1.一种由用户设备(UE)进行的无线通信的方法，包括：

从基站接收已知有效载荷的配置，所述已知有效载荷是多个UE公共的；

从基站接收包括所述已知有效载荷的消息，所述已知有效载荷包括地面真值标签，所述已知有效载荷在没有解码所述消息的情况下对于所述基站是已知的并且对于所述UE是已知的；以及

利用所述已知有效载荷来执行机器学习模型的在线训练。

2.根据权利要求1所述的方法，其中，所述配置包括无线电资源控制(RRC)配置的加扰种子。

3.根据权利要求1所述的方法，还包括接收对在哪里接收所述已知有效载荷的指示，所述指示是预先配置的或者是经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)接收到的。

4.根据权利要求3所述的方法，其中，所述指示定义了所述已知有效载荷的周期性、持续时间、聚合级别和/或有效载荷尺寸。

5.根据权利要求1所述的方法，其中，所述已知有效载荷位于物理广播信道(PBCH)、物理下行链路共享信道(PDSCH)或物理下行链路控制信道(PDCCH)中。

6.根据权利要求1所述的方法，其中，所述消息包括多播消息。

7.根据权利要求1所述的方法，其中，所述消息包括广播消息。

8.一种由基站进行的无线通信的方法，包括：

配置用于多个用户设备(UE)的已知有效载荷；

向多个UE信令通知对哪个物理信道将包括所述已知有效载荷和所述已知有效载荷的时间/频率资源的指示；以及

向所述多个UE发送所述已知有效载荷，以使得所述多个UE能够在所述多个UE处训练机器学习模型，所述已知有效载荷包括地面真值标签，所述已知有效载荷在没有解码所述已知有效载荷的情况下对于所述基站是已知的并且对于所述多个UE是已知的。

9.根据权利要求8所述的方法，其中，所述发送包括多播所述已知有效载荷。

10.根据权利要求8所述的方法，其中，所述发送包括广播所述已知有效载荷。

11.根据权利要求8所述的方法，其中，所述物理信道包括物理下行链路控制信道(PDCCH)、物理广播信道(PBCH)或物理下行链路共享信道(PDSCH)，并且所述时间/频率资源包括所述已知有效载荷的周期性、持续时间和有效载荷尺寸。

12.根据权利要求8所述的方法，其中，所述已知有效载荷被定义在物理下行链路控制信道(PDCCH)内。

13.根据权利要求8所述的方法，还包括发送指示在哪里接收所述已知有效载荷的消息，所述消息是预先配置的或者经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)发送的。

14.根据权利要求8所述的方法，其中，配置所述已知有效载荷包括经由无线电资源控制(RRC)信令来发送加扰种子。

15.一种用于无线通信的用户设备(UE)的装置，包括：

存储器；以及

至少一个处理器，其耦合到所述存储器，并且被配置为：

从基站接收多个UE公共的已知有效载荷的配置；

利用所述已知有效载荷来训练机器学习模型。

16.根据权利要求15所述的装置，其中，所述配置包括无线电资源控制(RRC)配置的加扰种子。

17.根据权利要求15所述的装置，其中，所述至少一个处理器还被配置为接收对在哪里接收所述已知有效载荷的指示，所述指示是预先配置的或者是经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)接收到的。

18.根据权利要求17所述的装置，其中，所述指示定义了所述已知有效载荷的周期性、持续时间、聚合级别和/或有效载荷尺寸。

19.根据权利要求15所述的装置，其中，所述已知有效载荷位于物理广播信道(PBCH)、物理下行链路共享信道(PDSCH)或物理下行链路控制信道(PDCCH)中。

20.根据权利要求15所述的装置，其中，所述消息包括多播消息。

21.根据权利要求15所述的装置，其中，所述消息包括广播消息。

22.一种用于无线通信的基站的装置，包括：

存储器；以及

至少一个处理器，其耦合到所述存储器，并且被配置为：

配置用于多个用户设备(UE)的已知有效载荷；

向所述多个UE信令通知对哪个物理信道将包括所述已知有效载荷和所述已知有效载荷的时间/频率资源的指示；以及

23.根据权利要求22所述的装置，其中，所述至少一个处理器被配置为通过多播所述已知有效载荷来发送所述已知有效载荷。

24.根据权利要求22所述的装置，其中，所述至少一个处理器被配置为通过广播所述已知有效载荷来发送所述已知有效载荷。

25.根据权利要求22所述的装置，其中，所述物理信道包括物理下行链路控制信道(PDCCH)、物理广播信道(PBCH)或物理下行链路共享信道(PDSCH)，并且所述时间/频率资源包括所述已知有效载荷的周期性、持续时间和有效载荷尺寸。

26.根据权利要求22所述的装置，其中，所述已知有效载荷被定义在物理下行链路控制信道(PDCCH)内。

27.根据权利要求22所述的装置，其中，所述至少一个处理器还被配置为发送指示在哪里接收所述已知有效载荷的消息，所述消息是预先配置的或者是经由无线电资源控制(RRC)信令、媒体访问控制(MAC)控制元素或物理下行链路控制信道(PDCCH)发送的。

28.根据权利要求22所述的装置，其中，所述至少一个处理器还被配置为通过经由无线电资源控制(RRC)信令发送加扰种子来配置所述已知有效载荷。

29.一种存储指令的用于无线通信的非暂时性计算机可读存储介质，所述指令使处理器执行以下操作：

从基站接收已知有效载荷的配置，所述已知有效载荷是多个用户设备(UE)公共的；

利用所述已知有效载荷来执行机器学习模型的在线训练。

30.一种存储指令的用于无线通信的非暂时性计算机可读存储介质，所述指令使处理器执行以下操作：

配置用于多个用户设备(UE)的已知有效载荷；

向所述多个UE发送所述已知有效载荷，以使得所述多个UE能够在所述多个UE处训练机器学习模型，所述已知有效载荷包括地面真值标签，所述已知有效载荷在没有解码所述已知有效载荷的情况下对于基站是已知的并且对于所述多个UE是已知的。