CN118556417A - 用于人工智能训练的可靠性自适应的装置和方法 - Google Patents

用于人工智能训练的可靠性自适应的装置和方法 Download PDF

Info

Publication number
CN118556417A
CN118556417A CN202280088838.3A CN202280088838A CN118556417A CN 118556417 A CN118556417 A CN 118556417A CN 202280088838 A CN202280088838 A CN 202280088838A CN 118556417 A CN118556417 A CN 118556417A
Authority
CN
China
Prior art keywords
data
communication mode
processor
control information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280088838.3A
Other languages
English (en)
Inventor
唐浩
张立清
马江镭
葛屹群
朱佩英
童文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN118556417A publication Critical patent/CN118556417A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1825Adaptation of specific ARQ protocol parameters according to transmission conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1867Arrangements specially adapted for the transmitter end
    • H04L1/1896ARQ related signaling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1822Automatic repetition systems, e.g. Van Duuren systems involving configuration of automatic repeat request [ARQ] with parallel processes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

目前用于无线通信的人工智能/机器学习(artificial intelligence/machine learning,AI/ML)模型的在线训练过程通常在训练中面临很大的通信开销和/或显著的延迟,尤其是在训练数据通过不可靠/恶意通信信道交换时。在一些实施例中,不同的可靠性模式用于提供不同可靠性级别,以实现减少开销和提高训练性能之间的权衡。

Description

用于人工智能训练的可靠性自适应的装置和方法
技术领域
本发明大体上涉及无线通信,在特定实施例中,涉及用于人工智能训练的可靠性自适应的方法和装置。
背景技术
人工智能技术可以应用于通信,包括物理层中的基于AI的通信和/或媒体接入控制(medium access control,MAC)层中的基于AI的通信。例如,在物理层中,基于AI的通信可以旨在优化组件设计和/或提高算法性能。在MAC层中,基于AI的通信可以旨在利用AI能力进行学习、预测和/或决策,以使用更好的策略和/或最优方案来解决复杂的优化问题,例如,优化MAC层中的功能。
在一些实施例中,无线通信网络中的AI架构可以包括多个节点,其中,多个节点可以在集中式和分布式这两种模式之一下组织,这两种模式都可以部署在接入网、核心网或边缘计算系统或第三方网络中。集中式训练和计算架构受限于可能存在的大量通信开销以及严格的用户数据隐私。分布式训练和计算架构可以包括几种框架,例如,分布式机器学习和联邦学习。
然而,无线通信系统中的通信,包括与多个节点的AI训练相关联的通信,通常在非理想信道上进行。例如,非理想条件,例如,电磁干扰、信号劣化、相位延迟、衰落和其它非理想情况,可能会使通信信号衰减和/或失真,或者以其它方式干扰或降低系统的通信能力。
传统的AI训练过程通常依赖于混合自动重传请求(hybrid automatic repeatrequest,HARQ)反馈和重传过程,以试图确保成功接收到在参与AI训练的设备之间传输的数据。然而,与这类重传相关的通信开销和延迟可能会成为问题。
由于这些原因和其它原因,需要新的协议和信令机制,以便可以在最大限度地减少与现有AI训练过程相关的信令和通信开销及延迟的同时,实现新的AI使能的应用和过程。
发明内容
根据本发明的第一广泛方面,本文提供了一种在第一设备中用于在无线通信网络中传输用于人工智能或机器学习(artificial intelligence or machine learning,AI/ML)模型训练的数据或控制信息的方法。所述方法可以包括:在所述第一设备处,根据第一通信模式与所述无线通信网络中的第二设备传输数据或控制信息。所述第一通信模式可以是至少包括所述第一通信模式和第二通信模式的多种通信模式中的一种通信模式。所述第二通信模式可以在一个或多个方面与所述第一通信模式不同。例如,所述第二通信模式可以在以下方面与所述第一通信模式不同:量化级别,用于量化所述数据或控制信息中的变量的值;和/或混合自动重传请求(Hybrid Automatic Repeat reQuest,HARQ)反馈和重传模式,用于选择性重传所述数据或控制信息的一个或多个部分。
支持多种通信模式实现了减少开销和提高训练性能之间的权衡。例如,在所述第一通信模式下避免重传和/或使用低精度量化可以在训练的早期阶段中减少通信开销。然而,一旦训练结果在所述第一通信模式下没有实质性改善,上述通信设备就可以切换到在所述第二通信模式下运行,以进一步提高训练性能。
在一些实施例中,与所述第二设备传输的所述数据或控制信息的传输通过下行控制信息(downlink control information,DCI)调度。例如,所述DCI的循环冗余校验(cyclic redundancy check,CRC)值可以通过第一无线网络临时标识(radio networktemporary identifier,RNTI)进行加扰,所述第一RNTI与小区RNTI(Cell RNTI,C-RNTI)不同。例如,所述第一RNTI可以是所述无线通信网络中专门用于AI/ML训练相关通信的RNTI。
在一些实施例中,所述方法还可以包括:根据与所述第二设备传输的所述数据或控制信息,在所述第一设备处训练AI/ML模型。例如,所述第一设备可以从所述第二设备接收数据或控制信息,并且根据从所述第二设备接收到的所述数据或控制信息训练AI/ML模型。
在一些实施例中,在所述第一通信模式下使用第一HARQ反馈和重传模式,在所述第二通信模式下使用第二HARQ反馈和重传模式。例如,在所述第一HARQ反馈和重传模式下,所述第一设备和所述第二设备之间不存在HARQ反馈过程且不存在所述数据或控制信息的重传。然而,在所述第二HARQ反馈和重传模式下,HARQ反馈过程可以用于请求重传所述数据或控制信息的一个或多个部分。在其它实施例中,所述第一HARQ反馈和重传模式和所述第二HARQ反馈和重传模式都可以支持HARQ反馈过程。例如,在一些实施例中,所述第一HARQ反馈和重传模式可以支持N1次重传,N1为整数,N1≥1;所述第二HARQ反馈和重传模式可以最多支持N2次重传,N2为整数,N2>N1。
在一些实施例中,可以在数据或控制信息通信过程的初始部分中默认使用所述第一通信模式。一旦满足用于切换通信模式的一个或多个准则,就可以在所述数据或控制信息通信过程的后续部分中使用所述第二通信模式。例如,在一些实施例中,所述第一设备可以在经过预定或预配置的AI/ML模型训练时间之后或在经过多次AI/ML模型训练迭代之后,从根据所述第一通信模式与所述第二设备传输数据或控制信息切换到根据所述第二通信模式与所述第二设备传输数据或控制信息。另外或替代地,在从所述第一通信模式切换到所述第二通信模式之前,所述第一设备可以向所述第二设备发送包括切换指令的控制信令。在一些实施例中,所述包括切换指令的控制信令可以是下行控制信息(downlinkcontrol information,DCI)消息。在发送所述控制信令之后,所述第一设备可以从所述第一通信模式切换到所述第二通信模式。在一些实施例中,所述第一设备可以在从所述第二设备接收到包括切换指令的控制信令之后,从所述第一通信模式切换到所述第二通信模式。
在一些实施例中,在切换到所述第二通信模式之后,所述第一设备可以从所述第二设备接收HARQ反馈信息,其中,所述HARQ反馈信息标识所述第二设备未成功接收到的数据的一个或多个部分。在这些实施例中,在接收到所述HARQ反馈信息之后,所述第一设备可以发送HARQ进程信息,其中,所述HARQ进程信息标识所述第一设备不会重传的所述数据的所述一个或多个未成功接收到的部分中的至少一个部分。此外,在发送所述HARQ进程信息之后,所述第一设备则可以重传所述一个或多个未成功接收到的部分的部分子集,其中,所述部分子集不包括所述HARQ进程信息中标识的所述至少一个未成功接收到的部分。在一些实施例中,对于所述第二设备未成功接收到的所述数据的每个部分,所述第一设备可以从所述第二设备接收与所述未成功接收到的部分对应的重要性指示信息。例如,与所述未成功接收到的部分对应的所述重要性指示信息可以指示所述未成功接收到的部分对于所述第二设备处的AI/ML模型训练是否重要。然后,所述第一设备可以根据来自所述第二设备的所述重要性指示信息,选择性地重传所述一个或多个未成功接收部分的所述部分子集。
在一些实施例中,所述方法还可以包括:从所述第一设备向所述第二设备发送控制信令,其中,所述控制信令包括停止训练指令,以配置所述第二设备停止训练所述第二设备处的AI/ML模型。如果设备不能对训练过程做出实质性贡献,则能够动态指示所述设备停止训练可能会带来几个好处。例如,停止非贡献设备参与训练可能会减少空口开销和/或可以更快地实现训练收敛。在一些实施例中,所述包括停止训练指令的控制信令可以是DCI消息。在一些实施例中,在从所述第二设备接收到包括停止训练指令的控制信令之后,所述第一设备可以停止向所述第二设备发送用于AI/ML模型训练的数据或控制信息。
在一些实施例中,所述第一设备可以向所述第二设备发送协助信息。例如,所述协助信息可以包括所述第一设备的训练停止请求,以停止训练所述第一设备处的所述AI/ML模型。
在一些实施例中,在切换到所述第二通信模式之后,所述第一设备可以向所述第二设备发送HARQ反馈信息,以向所述第二设备通知所述第一设备未成功接收到所述数据。在一些实施例中,除了发送所述传输HARQ反馈信息外,所述第一设备还可以发送与所述未成功接收到的数据对应的重要性指示信息。例如,与所述未成功接收到的数据对应的所述重要性指示信息可以指示所述未成功接收到的数据对于所述第一设备处的AI/ML模型训练是否重要。
本发明公开了用于执行上述方法的对应装置和设备。
例如,根据本发明的另一个方面,提供了一种设备。所述设备包括处理器和存储处理器可执行指令的存储器,所述处理器可执行指令在被执行时使得所述处理器执行根据上述本发明的第一广泛方面的方法。
根据本发明的其它方面,提供了一种包括一个或多个单元的装置。所述装置用于实现本发明公开的任何方法方面。术语“单元”是广义的,可以使用各种名称中的任一种名称来表示,包括模块、组件、元件、构件等。这些单元可以使用硬件、软件、固件或它们的任意组合来实现。
附图说明
下面仅通过示例参考示出本申请示例性实施例的附图,在附图中:
图1是一个示例提供的通信系统的简化示意图示;
图2示出了通信系统的另一个示例;
图3示出了电子设备(electronic device,ED)、地面发送和接收点(terrestrialtransmit and receive point,T-TRP)以及非地面发送和接收点(non-terrestrialtransmit and receive point,NT-TRP)的一个示例;
图4示出了设备中的示例性单元或模块;
图5示出了一个实施例提供的通信系统中的四个ED与网络设备进行通信;
图6A示出了一个实施例提供的包括多层神经元的神经网络的一个示例;
图6B示出了一个实施例提供的可以用作神经网络的构建块的神经元的一个示例;
图7、图8、图9和图10示出了各种实施例提供的由第一设备和第二设备执行的方法。
在不同的附图中可以使用相似的附图标记来表示相似的组件。
具体实施方式
出于说明性目的,下面结合附图详细解释了具体的示例性实施例。
示例性通信系统和设备
参考图1,图1是一个非限制性的说明性示例,提供了一种通信系统的简化示意图。通信系统100包括无线接入网120。无线接入网120可以是下一代(例如,第六代(sixthgeneration,6G)或更高)无线接入网或传统(例如,5G、4G、3G或2G)无线接入网。一个或多个通信电子设备(electric device,ED)110a至120j(一般称为110)可以彼此互连或者连接到无线接入网120中的一个或多个网络节点(170a、170b,一般称为170)。核心网130可以是通信系统的一部分,并且可以依赖于或独立于在通信系统100中使用的无线接入技术。此外,通信系统100包括公共交换电话网(public switched telephone network,PSTN)140、互联网150和其它网络160。
图2示出了示例性通信系统100。一般而言,通信系统100使多个无线或有线单元能够传输数据和其它内容。通信系统100的目的可以是通过广播、组播和单播等提供语音、数据、视频和/或文本等内容。通信系统100可以通过在其组成单元之间共享载波频谱带宽等资源运行。通信系统100可以包括地面通信系统和/或非地面通信系统。通信系统100可以提供各种各样的通信业务和应用(例如,地球监测、遥感、被动感知和定位、导航和跟踪、自主交付和移动性等)。通信系统100可以通过地面通信系统和非地面通信系统的联合操作来提供高度的可用性和鲁棒性。例如,将非地面通信系统(或其组件)集成到地面通信系统中可以产生包括多层的异构网络。与传统通信网络相比,异构网络可以通过高效的多链路联合操作、更灵活的功能共享以及地面网络和非地面网络之间更快的物理层链路切换来实现更好的整体性能。
地面通信系统和非地面通信系统可以是通信系统中的子系统。在所示的示例中,通信系统100包括电子设备(electronic device,ED)110a至110d(一般称为ED 110)、无线接入网(radio access network,RAN)120a和120b、非地面通信网120c、核心网130、公共交换电话网(public switched telephone network,PSTN)140、互联网150和其它网络160。RAN 120a和120b包括相应的基站(base station,BS)170a和170b,BS170a和170b一般可以称为地面发送和接收点(terrestrial transmit and receive point,T-TRP)170a和170b。非地面通信网络120c包括接入节点120c,接入节点120c一般可以称为非地面发射和接收点(non-terrestrial transmit and receive point,NT-TRP)172。
任何ED 110可以替代地或另外用于与任何其它T-TRP 170a和170b、NT-TRP 172、互联网150、核心网130、PSTN 140、其它网络160或前述各项的任意组合进行连接、接入或通信。在一些示例中,ED 110a可以通过接口190a与T-TRP 170a进行上行传输和/或下行传输。在一些示例中,ED 110a、110b和110d还可以通过一个或多个侧行链路空口190b相互直接通信。在一些示例中,ED 110d可以通过接口190c与NT-TRP 172进行上行传输和/或下行传输。
空口190a和190b可以使用类似的通信技术,例如,任何合适的无线接入技术。例如,通信系统100可以在空口190a和190b中实现一种或多种信道接入方法,例如,码分多址接入(code division multiple access,CDMA)、时分多址接入(time division multipleaccess,TDMA)、频分多址接入(frequency division multiple access,FDMA)、正交FDMA(orthogonal FDMA,OFDMA)或单载波FDMA(single-carrier FDMA,SC-FDMA)。空口190a和190b可以利用其它高维信号空间,这些高维信号空间可以包括正交维度和/或非正交维度的组合。
空口190c可以通过无线链路或简单的链路实现ED 110d和一个或多个NT-TRP 172之间的通信。在一些示例中,链路是用于单播传输的专用连接、用于广播传输的连接或用于组播传输的一组ED和一个或多个NT-TRP之间的连接。
RAN 120a和120b与核心网130进行通信,以向ED 110a、110b和110c提供各种业务,例如,语音、数据和其它业务。RAN 120a和120b以及/或者核心网130可以与一个或多个其它RAN(未示出)进行直接或间接通信,这些其它RAN可以直接也可以不直接由核心网130服务,而且可以采用也可以不采用与RAN 120a、RAN 120b或两者相同的无线接入技术。核心网130还可以用作(i)RAN 120a和120b或ED 110a、110b和110c或两者与(ii)其它网络(例如,PSTN140、互联网150和其它网络160)之间的网关接入。另外,ED 110a、110b和110c中的部分或全部ED可以包括用于使用不同的无线技术和/或协议通过不同的无线链路与不同的无线网络进行通信的功能。代替无线通信(或者除无线通信之外),ED 110a、110b和110c可以通过有线通信信道与服务提供商或交换机(未示出)进行通信以及与互联网150进行通信。PSTN140可以包括用于提供传统电话业务(plain old telephone service,POTS)的电路交换电话网。互联网150可以包括计算机网络和/或子网(内网),并且包括互联网协议(InternetProtocol,IP)、传输控制协议(Transmission Control Protocol,TCP)、用户数据报协议(User Datagram Protocol,UDP)等协议。ED 110a、110b和110c可以是能够根据多种无线接入技术运行的多模设备,并且可以包括支持这些技术所需的多个收发器。
图3示出了ED 110和基站170a、170b和/或170c的另一个示例。ED 110用于连接人、物体、机器等。ED 110可以广泛用于各种场景,例如,蜂窝通信、设备到设备(device-to-device,D2D)、车辆到万物(vehicle to everything,V2X)、点对点(peer-to-peer,P2P)、机器到机器(machine-to-machine,M2M)、机器类通信(machine-type communication,MTC)、物联网(Internet of things,IoT)、虚拟现实(virtual reality,VR)、增强现实(augmented reality,AR)、工业控制、自动驾驶、远程医疗、智能电网、智能家具、智能办公、智能穿戴、智能交通、智慧城市、无人机、机器人、遥感、被动感测、定位、导航和跟踪、自主交付和移动性等。
每个ED 110表示任何合适的用于无线操作的终端用户设备,并且可以包括如下设备(或可以称为):用户设备(user equipment/device,UE)、无线发送/接收单元(wirelesstransmit/receive unit,WTRU)、移动台、固定或移动用户单元、蜂窝电话、站点(station,STA)、机器类通信(machine type communication,MTC)设备、个人数字助理(personaldigital assistant,PDA)、智能手机、笔记本电脑、计算机、平板电脑、无线传感器、消费型电子设备、智能本、车辆、汽车、卡车、公交车、火车或IoT设备、工业设备,或上述设备中的装置(例如,通信模块、调制解调器或芯片),等等。下一代ED 110可以使用其它术语来指代。基站170a和170b是T-TRP,在下文中称为T-TRP 170。同样如图3所示,NT-TRP在下文中称为NT-TRP 172。连接到T-TRP 170和/或NT-TRP 172的每个ED 110可以动态或半静态地启动(即建立、激活或启用)、关闭(即释放、去激活或禁用)和/或响应于连接可用性和连接必要性中的一个或多个而进行配置。
ED 110包括耦合到一个或多个天线204的发送器201和接收器203。仅示出了一个天线204。其中一个、部分或全部天线也可以是面板。发送器201和接收器203可以集成为收发器等。收发器用于对数据或其它内容进行调制,以便通过至少一个天线204或网络接口控制器(network interface controller,NIC)发送。收发器还用于对通过至少一个天线204接收到的数据或其它内容进行解调。每个收发器包括任何合适的用于生成进行无线传输或有线传输的信号和/或用于处理通过无线方式或有线方式接收到的信号的结构。每个天线204包括任何合适的用于发送和/或接收无线信号或有线信号的结构。
ED 110包括至少一个存储器208。存储器208存储由ED 110使用、生成或收集的指令和数据。例如,存储器208可以存储软件指令或模块,这些软件指令或模块用于实现本文中描述的部分或全部功能和/或实施例并由一个或多个处理单元210执行。每个存储器208包括任何合适的一个或多个易失性和/或非易失性存储与检索设备。可以使用任何合适类型的存储器,例如,随机存取存储器(random access memory,RAM)、只读存储器(read onlymemory,ROM)、硬盘、光盘、用户识别模块(subscriber identity module,SIM)卡、记忆棒、安全数码(secure digital,SD)卡、处理器缓存等。
ED 110还可以包括一个或多个输入/输出设备(未示出)或接口(例如,连接到图1中的互联网150的有线接口)。输入/输出设备支持与网络中的用户或其它设备进行交互。每个输入/输出设备包括任何合适的用于向用户提供信息或从用户接收信息的结构,例如,扬声器、麦克风、小键盘、键盘、显示器或触摸屏,包括网络接口通信。
ED 110还包括处理器210,用于执行以下操作:与准备向NT-TRP 172和/或T-TRP170发送的上行传输有关的操作、与处理从NT-TRP 172和/或T-TRP 170接收到的下行传输有关的操作,以及与处理向其它ED 110发送和从其它ED 110发出的侧行链路传输有关的操作。与准备发送上行传输有关的处理操作可以包括编码、调制、发送波束赋形和生成用于传输的符号等操作。与处理下行传输有关的处理操作可以包括接收波束赋形、解调和解码接收符号等操作。根据实施例,下行传输可以由接收器203使用接收波束赋形来接收,处理器210可以从下行传输中(例如,通过检测和/或解码信令)提取信令。信令的一个示例可以是由NT-TRP 172和/或T-TRP 170发送的参考信号。在一些实施例中,处理器276根据从T-TRP170接收到的波束方向指示(例如,波束角度信息(beam angle information,BAI)),实现发送波束赋形和/或接收波束赋形。在一些实施例中,处理器210可以执行与网络接入(例如,初始接入)和/或下行同步有关的操作,例如,与检测同步序列、解码和获取系统信息等有关的操作。在一些实施例中,处理器210可以使用从NT-TRP 172和/或T-TRP 170接收到的参考信号等方式来执行信道估计。
处理器210可以是发送器201的一部分和/或接收器203的一部分,但未示出。存储器208可以是处理器210的一部分,但未示出。
处理器210、发送器201中的处理组件和接收器203中的处理组件可以分别由相同或不同的一个或多个处理器来实现,这些处理器用于执行存储在存储器(例如,存储器208)中的指令。可替代地,处理器210、发送器201中的处理组件和接收器203中的处理组件中的部分或全部可以使用编程的现场可编程门阵列(field-programmable gate array,FPGA)、图形处理单元(graphical processing unit,GPU)或专用集成电路(application-specific integrated circuit,ASIC)等专用电路来实现。
T-TRP 170在一些实现方式中可以使用其它名称表示,例如,基站、收发基站(basetransceiver station,BTS)、无线基站、网络节点、网络设备、网络侧设备、发送/接收节点、NodeB、演进型基站(evolved NodeB,eNodeB或eNB)、家庭eNodeB、下一代基站(nextgeneration NodeB,gNB)、发送点(transmission Point,TP)、站点控制器、接入点(accesspoint,AP)或无线路由器、中继站、远程射频头、地面节点、地面网络设备,或者地面基站、基带单元(base band unit,BBU)、射频拉远单元(remote radio unit,RRU)、有源天线处理单元(active antenna unit,AAU)、远程射频头(remote radio head,RRH)、集中式单元(central unit,CU)、分布式单元(distributed unit,DU)、定位节点,等等。T-TRP 170可以是宏BS、微微BS、中继节点、施主节点等或其组合。T-TRP 170可以指上述设备,也可以指上述设备中的装置(例如,通信模块、调制解调器或芯片)。
在一些实施例中,T-TRP 170的各个部分可以是分布式的。例如,T-TRP 170中的一些模块可以远离容纳T-TRP 170的天线的设备,并且可以通过有时候称为前传的通信链路(未示出)(例如,通用公共射频接口(common public radio interface,CPRI))耦合到容纳天线的设备。因此,在一些实施例中,术语“T-TRP 170”还可以指执行以下处理操作的网络侧模块:例如,确定ED 110的位置、资源分配(调度)、消息生成和编码/解码,这些模块不一定是容纳T-TRP 170的天线的设备的一部分。这些模块还可以耦合到其它T-TRP。在一些实施例中,T-TRP 170实际上可以是一起运行以通过协作多点传输等方式服务ED 110的多个T-TRP。
T-TRP 170包括耦合到一个或多个天线256的至少一个发送器252和至少一个接收器254。仅示出了一个天线256。其中一个、部分或全部天线也可以是面板。发送器252和接收器254可以集成为收发器。T-TRP 170还包括处理器260,用于执行与以下内容有关的操作:准备向ED 110发送的下行传输、处理从ED 110接收到的上行传输、准备向NT-TRP 172发送的回传传输和处理从NT-TRP 172通过回传接收到的传输。与准备发送下行传输或回传传输有关的处理操作可以包括编码、调制、预编码(例如,MIMO预编码)、发送波束赋形和生成用于传输的符号等操作。与处理上行中或回传上的接收传输有关的处理操作可以包括接收波束赋形、解调和解码接收符号等操作。处理器260还可以执行与网络接入(例如,初始接入)和/或下行同步有关的操作,例如,生成同步信号块(synchronization signal block,SSB)的内容、生成系统信息,等等。在一些实施例中,处理器260还生成调度器253可以调度用于传输的波束方向指示,例如,BAI。处理器260可以执行本文中描述的其它网络侧处理操作,例如,确定ED 110的位置、确定部署NT-TRP 172的位置,等等。在一些实施例中,处理器260可以生成信令,以配置ED 110的一个或多个参数和/或NT-TRP 172的一个或多个参数,等等。由处理器260生成的任何信令都由发送器252发送。需要注意的是,本文中使用的“信令”可以替代地称为控制信令。动态信令可以在物理下行控制信道(physical downlinkcontrol channel,PDCCH)等控制信道中发送,而静态或半静态高层信令可以包括在数据包中,该数据包在物理下行共享信道(physical downlink shared channel,PDSCH)等数据信道中发送。
调度器253可以耦合到处理器260。调度器253可以包括在T-TRP 170内,也可以与T-TRP 170分开工作。调度器253可以调度上行传输、下行传输和/或回传传输,包括下发调度授权和/或配置免调度(“配置授权”)资源。T-TRP 170还包括用于存储信息和数据的存储器258。存储器258存储由T-TRP 170使用、生成或收集的指令和数据。例如,存储器258可以存储软件指令或模块,这些软件指令或模块用于实现本文中描述的部分或全部功能和/或实施例并由处理器260执行。
处理器260可以是发送器252的一部分和/或接收器254的一部分,但未示出。此外,处理器260可以实现调度器253,但未示出。存储器258可以是处理器260的一部分,但未示出。
处理器260、调度器253、发送器252中的处理组件和接收器254中的处理组件可以分别由相同或不同的一个或多个处理器来实现,这些处理器用于执行存储在存储器(例如,存储器258)中的指令。可替代地,处理器260、调度器253、发送器252中的处理组件和接收器254中的处理组件中的部分或全部可以使用FPGA、GPU或ASIC等专用电路来实现。
虽然只将NT-TRP 172举例示为无人机,但NT-TRP 172可以使用任何合适的非地面形式实现。此外,NT-TRP 172在一些实现方式中可以使用非地面节点、非地面网络设备或非地面基站等其它名称。NT-TRP 172包括耦合到一个或多个天线280的发送器272和接收器274。仅示出了一个天线280。其中一个、部分或全部天线也可以是面板。发送器272和接收器274可以集成为收发器。NT-TRP 172还包括处理器276,用于执行与以下内容有关的操作:准备向ED 110发送的下行传输、处理从ED 110接收到的上行传输、准备向T-TRP 170发送的回传传输和处理从T-TRP 170通过回传接收到的传输。与准备发送下行传输或回传传输有关的处理操作可以包括编码、调制、预编码(例如,MIMO预编码)、发送波束赋形和生成用于传输的符号等操作。与处理上行中或回传上的接收传输有关的处理操作可以包括接收波束赋形、解调和解码接收符号等操作。在一些实施例中,处理器276根据从T-TRP 170接收到的波束方向信息(例如,BAI)实现发送波束赋形和/或接收波束赋形。在一些实施例中,处理器276可以生成信令,例如,用于配置ED 110的一个或多个参数。在一些实施例中,NT-TRP 172实现物理层处理,但不实现高层功能,例如,媒体接入控制(medium access control,MAC)或无线链路控制(radio link control,RLC)层处的功能。由于这只是一个示例,除了物理层处理之外,NT-TRP 172通常还可以实现高层功能。
NT-TRP 172还包括用于存储信息和数据的存储器278。处理器276可以是发送器272的一部分和/或接收器274的一部分,但未示出。存储器278可以是处理器276的一部分,但未示出。
处理器276、发送器272中的处理组件和接收器274中的处理组件可以分别由相同或不同的一个或多个处理器来实现,这些处理器用于执行存储在存储器(例如,存储器278)中的指令。可替代地,处理器276、发送器272中的处理组件和接收器274中的处理组件中的部分或全部可以使用编程的FPGA、GPU或ASIC等专用电路来实现。在一些实施例中,NT-TRP172实际上可以是一起运行以通过协作多点传输等方式服务ED 110的多个NT-TRP。
需要注意的是,本文中使用的“TRP”可以指T-TRP或NT-TRP。
T-TRP 170、NT-TRP 172和/或ED 110可以包括其它组件,但为了清楚起见,省略了这些组件。
本文中提供的示例性方法的一个或多个步骤可以由图4提供的对应单元或模块执行。图4示出了设备中(例如,ED 110中、T-TRP 170中或NT-TRP 172中)的单元或模块。例如,信号可以由发送单元或发送模块发送。例如,信号可以由发送单元或发送模块发送。信号可以由接收单元或接收模块接收。信号可以由处理单元或处理模块进行处理。其它步骤可以由人工智能(artificial intelligence,AI)或机器学习(machine learning,ML)模块执行。相应的单元或模块可以使用硬件、执行软件的一个或多个组件或设备或其组合来实现。例如,一个或多个单元或模块可以是集成电路,例如,编程的FPGA、GPU或ASIC。应当理解,如果这些模块使用供处理器等执行的软件来实现,则这些模块可以由处理器根据需要全部或部分检索,单独或集体检索用于处理,在一个或多个实例中检索,并且这些模块本身可以包括用于进一步部署和实例化的指令。
关于ED 110、T-TRP 170和NT-TRP 172的其它详细内容是本领域技术人员已知的。因此,这里省略了这些详细内容。
本文在一些实施例中讨论了控制信令。控制信令有时候还可以称为信令、控制信息、配置信息或配置。在一些情况下,控制信令可以动态指示,例如,在物理层控制信道中动态指示。动态指示的控制信令的一个示例是在物理层控制信令中发送的信息,例如,下行控制信息(downlink control information,DCI)。控制信令有时候还可以半静态指示,例如,在RRC信令中或在MAC控制单元(control element,CE)中半静态指示。动态指示可以是低层中的指示,例如,物理层/层1信令(例如,DCI中的指示),而不是高层中的指示(例如,不是RRC信令或MAC CE中的指示)。半静态指示可以是半静态信令中的指示。本文中使用的半静态信令可以指非动态的信令,例如,高层信令、RRC信令和/或MAC CE。本文中使用的动态信令可以指动态的信令,例如,在物理层中发送的物理层控制信令,例如,DCI。
空口通常包括许多组件和相关参数,这些组件和相关参数共同指定如何在两个或两个以上通信设备之间通过无线通信链路发送和/或接收传输。例如,空口可以包括限定通过无线通信链路发送信息(例如,数据)的一个或多个波形、一个或多个帧结构、一个或多个多址方案、一个或多个协议、一个或多个编码方案和/或一个或多个调制方案的一个或多个组件。无线通信链路可以支持无线接入网和用户设备之间的链路(例如,“Uu链路”),和/或无线通信链路可以支持设备和设备之间的链路,例如,两个用户设备之间的链路(例如,“侧行链路”),和/或无线通信链路可以支持非地面(non-terrestrial,NT)通信网络和用户设备(user equipment,UE)之间的链路。以下是上述组件的一些示例:
·波形组件可以指定发送中的信号的形状和形式。波形选项可以包括正交多址波形和非正交多址波形。这些波形选项的非限制性示例包括正交频分复用(OrthogonalFrequency Division Multiplexing,OFDM)、滤波OFDM(Filtered OFDM,f-OFDM)、时域加窗OFDM、滤波器组多载波(Filter Bank Multicarrier,FBMC)、通用滤波多载波(UniversalFiltered Multicarrier,UFMC)、广义频分复用(Generalized Frequency DivisionMultiplexing,GFDM)、小波包调制(Wavelet Packet Modulation,WPM)、超奈奎斯特(Faster Than Nyquist,FTN)波形和低峰值平均功率比波形(low Peak to Average PowerRatio Waveform,low PAPR WF)。
·帧结构组件可以指定一帧或一组帧的配置。帧结构组件可以指示一帧或一组帧的时间、频率、导频签名、编码或其它参数中的一个或多个。下文会详细讨论帧结构。
·多址方案组件可以指定多址技术选项,包括限定通信设备如何共享公共物理信道的技术,例如:时分多址(Time Division Multiple Access,TDMA)、频分多址(FrequencyDivision Multiple Access,FDMA)、码分多址(Code Division Multiple Access,CDMA)、单载波频分多址(Single Carrier Frequency Division Multiple Access,SC-FDMA)、低密度签名多载波码分多址(Low Density Signature Multicarrier Code DivisionMultiple Access,LDS-MC-CDMA)、非正交多址(Non-Orthogonal Multiple Access,NOMA)、图分多址(Pattern Division Multiple Access,PDMA)、格分多址(Lattice PartitionMultiple Access,LPMA)、资源扩展多址(Resource Spread Multiple Access,RSMA)和稀疏码多址(Sparse Code Multiple Access,SCMA)。此外,多址技术选项可以包括:调度接入与非调度接入,也称为免授权接入;非正交多址与正交多址,例如,通过专用信道资源(例如,多个通信设备之间不共享);基于竞争的共享信道资源与基于非竞争的共享信道资源,以及基于无线电的认知接入。
·混合自动重传请求(hybrid automatic repeat request,HARQ)协议组件可以指定如何进行传输和/或重传。传输和/或重传机制选项的非限制性示例包括指定调度数据管道大小、用于传输和/或重传的信令机制以及重传机制的示例。
·编码调制组件可以指定发送中的信息如何进行编码/解码和调制/解调以进行发送/接收。编码可以指错误检测和前向纠错的方法。编码选项的非限制性示例包括涡轮格形码、涡轮乘积码、喷泉码、低密度奇偶校验码和极化码。调制可以简单地指星座(例如,包括调制技术和阶数),或者具体地指各种类型的高级调制方法,例如,分层调制和低PAPR调制。
在一些实施例中,空口可能是“一刀切的概念”。例如,一旦限定了空口,空口内的组件就不能更改或调整。在一些实现方式中,只能配置空口的有限参数或模式,例如,循环前缀(cyclic prefix,CP)长度或多输入多输出(multiple input multiple output,MIMO)模式。在一些实施例中,空口设计可以提供统一或灵活的框架,以支持低于6GHz和超过6GHz频率(例如,mmWave)的频带进行授权接入和非授权接入。例如,通过可扩展系统参数(numerology)和符号持续期提供的可配置空口的灵活性可以实现不同频谱段和不同服务/设备的传输参数优化。又如,统一空口在频域上可能是自成一体的,频域上自成一体的设计可以通过不同服务在频率和时间上的信道资源共享来支持更加灵活的无线接入网(radioaccess network,RAN)切片。
帧结构
帧结构是无线通信物理层的特征,限定了时域信号传输结构,以实现基本时域传输单元的定时参考和定时对齐,等等。通信设备之间的无线通信可以在由帧结构控制的时频资源上进行。帧结构有时候还可以称为无线帧结构。
根据帧结构和/或帧结构中的帧配置,有可能进行频分双工(frequency divisionduplex,FDD)通信和/或时分双工(time-division duplex,TDD)通信和/或全双工(fullduplex,FD)通信。FDD通信是指不同方向(例如,上行与下行)上的传输在不同的频段中进行。TDD通信是指不同方向(例如,上行与下行)上的传输在不同的时长内进行。FD通信是指发送和接收在相同的时频资源上进行,即一个设备可以同时在相同的频率资源上进行发送和接收。
帧结构的一个示例是长期演进(long-term evolution,LTE)中的帧结构,具有以下规范:每个帧的时长为10ms;每个帧有10个子帧,每个子帧的时长为1ms;每个子帧包括两个时隙,每个时隙的时长为0.5ms;每个时隙用于传输7个OFDM符号(假设普通CP);每个OFDM符号具有符号持续期和与子载波数量和子载波间隔相关的特定带宽(或部分带宽或带宽分区);帧结构基于OFDM波形参数,例如,子载波间隔和CP长度(其中,CP具有固定长度或有限长度选项);TDD下的上行和下行之间的切换间隙必须是OFDM符号持续期的整数时间。
帧结构的另一个示例是新空口(new radio,NR)中的帧结构,具有以下规范:支持多个子载波间隔,每个子载波间隔对应于相应的系统参数;帧结构取决于系统参数,但在任何情况下,帧长度设置为10ms,包括10个子帧,每个子帧的时长为1ms;限定时隙包括14个OFDM符号;时隙长度取决于系统参数。例如,普通CP、15kHz子载波间隔(“系统参数1”)的NR帧结构与普通CP、30kHz子载波间隔(“系统参数2”)的NR帧结构不同。对于15kHz子载波间隔,时隙长度为1ms;对于30kHz子载波间隔,时隙长度为0.5ms。NR帧结构的灵活性可能比LTE帧结构的灵活性高。
帧结构的另一个示例是示例性灵活帧结构,例如,用于6G网络或下一代网络。在灵活帧结构中,可以限定符号块为最小时间段,该时间段可以在灵活帧结构中调度。符号块可以是具有可选冗余部分(例如,CP部分)和信息(例如,数据)部分的传输单元。OFDM符号是符号块的一个示例。符号块还可以称为符号。灵活帧结构的实施例包括可配置的不同参数,例如,帧长度、子帧长度、符号块长度等。在灵活帧结构的一些实施例中,可能的可配置参数的非详尽列表包括:
(1)帧:帧长度不需要限制为10ms,帧长度可以是可配置的并随着时间的推移而变化。在一些实施例中,每个帧包括一个或多个下行同步信道和/或一个或多个下行广播信道,每个同步信道和/或广播信道可以通过不同的波束赋形在不同的方向上发送。帧长度可以是多个可能的值,并且根据应用场景配置。例如,自动驾驶汽车可能需要相对较快的初始接入,在这种情况下,自动驾驶汽车应用对应的帧长度可以设置为5ms。又如,家用智能电表可能不需要快速的初始接入,在这种情况下,智能电表应用对应的帧长度可以设置为20ms。
(2)子帧时长:子帧可以在灵活帧结构中限定,也可以不在灵活帧结构中限定,具体取决于实现方式。例如,可以限定帧包括时隙,但不包括子帧。在限定有子帧的帧中,例如,为了时域对齐,子帧的时长可以是可配置的。例如,可以配置子帧具有0.1ms、0.2ms、0.5ms、1ms、2ms或5ms等长度。在一些实施例中,如果特定场景中不需要子帧,则可以限定子帧长度与帧长度一样,也可以不限定。
(3)时隙配置:时隙可以在灵活帧结构中限定,也可以不在灵活帧结构中限定,具体取决于实现方式。在限定有时隙的帧中,时隙的限定(例如,在时长和/或符号块数量上)可以是可配置的。在一个实施例中,时隙配置对所有UE或一组UE都是通用的。对于这种情况,时隙配置信息可以在广播信道或一个或多个公共控制信道中发送到UE。在其它实施例中,时隙配置可以是UE专用的,在这种情况下,时隙配置信息可以在UE专用控制信道中发送。在一些实施例中,时隙配置信令可以与帧配置信令和/或子帧配置信令一起发送。在其它实施例中,时隙配置可以独立于帧配置信令和/或子帧配置信令发送。一般而言,时隙配置可以是系统通用的、基站通用的、UE组通用的或UE专用的。
(4)子载波间隔(subcarrier spacing,SCS):SCS是可扩展系统参数中的一个参数,可扩展系统参数使得SCS的范围可能为15kHz至480kHz。SCS可以随着频谱频率和/或最大UE速度的变化而变化,以将多普勒偏移和相位噪声的影响降至最低。在一些示例中,可以存在单独的发送和接收帧,并且接收帧结构中的符号的SCS可以独立于发送帧结构中的符号的SCS配置。接收帧中的SCS可以与发送帧中的SCS不同。在一些示例中,每个发送帧的SCS可以是每个接收帧的SCS的一半。如果接收帧和发送帧之间的SCS不同,则例如,如果使用离散傅里叶逆变换(inverse discrete Fourier transform,IDFT)而不是快速傅里叶变换(fast Fourier transform,FFT)实现更灵活的符号持续期,差值不一定必须按因子2缩放。帧结构的其它示例可以用于不同的SCS。
(5)基本传输单元的灵活传输时长基本传输单元可以是符号块(还可以称为符号),该符号块通常包括冗余部分(称为CP)和信息(例如,数据)部分,但是在一些实施例中,CP可以从符号块中省略。CP长度可以是灵活、可配置的。CP长度可以在帧内固定,也可以在帧内灵活变化,而且CP长度可能随着帧的改变而改变、随着帧组的改变而改变、随着子帧的改变而改变、随着时隙的改变而改变,或者动态地随着调度方式的改变而改变。信息(例如,数据)部分可以是灵活、可配置的。与可以被限定的符号块有关的另一个可能的参数是CP时长与信息(例如,数据)时长之比。在一些实施例中,可以根据以下内容调整符号块长度:信道条件(例如,多径延迟、多普勒)和/或延迟要求和/或可用时长。又如,可以调整符号块长度以适应帧中的可用时长。
(6)灵活切换间隙帧可以包括用于基站发出的下行传输的下行部分和用于UE发出的上行传输的上行部分。每个上行部分和下行部分之间可以存在间隙,该间隙称为切换间隙。切换间隙长度(时长)可以是可配置的。切换间隙时长可以在帧内固定,也可以在帧内灵活变化,而且切换间隙时长可能随着帧的改变而改变、随着帧组的改变而改变、随着子帧的改变而改变、随着时隙的改变而改变,或者动态地随着调度方式的改变而改变。
小区/载波/带宽部分(Bandwidth Part,BWP)/占用带宽
基站等设备可以提供小区覆盖范围。与设备进行的无线通信可以在一个或多个载波频率上进行。载波频率称为载波。载波还可以称为分量载波(component carrier,CC)。载波的特征可以包括其带宽和参考频率,例如,载波的中心频率、最低频率或最高频率。载波可以在授权频谱上,也可以在非授权频谱上。与设备进行的无线通信可以另外或替代地在一个或多个带宽部分(bandwidth part,BWP)上进行。例如,载波可以具有一个或多个BWP。一般而言,与设备进行的无线通信可以在频谱上进行。频谱可以包括一个或多个载波和/或一个或多个BWP。
一个小区可以包括一个或多个下行资源,可选地还包括一个或多个上行资源,或者一个小区可以包括一个或多个上行资源,可选地还包括一个或多个下行资源,或者一个小区可以同时包括一个或多个下行资源和一个或多个上行资源。例如,一个小区可能只包括一个下行载波/BWP,或者只包括一个上行载波/BWP,或者包括多个下行载波/BWP,或者包括多个上行载波/BWP,或者包括一个下行载波/BWP和一个上行载波/BWP,或者包括一个下行载波/BWP和多个上行载波/BWP,或者包括多个下行载波/BWP和一个上行载波/BWP,或者包括多个下行载波/BWP和多个上行载波/BWP。在一些实施例中,一个小区可以替代地或另外包括一个或多个侧行链路资源,包括侧行链路发送和接收资源。
一个BWP是一个载波上的连续或非连续频率子载波的集合,或者是多个载波上的连续或非连续频率子载波的集合,或者是非连续或连续频率子载波的集合。这些频率子载波可以包括一个或多个载波。
在一些实施例中,一个载波可以具有一个或多个BWP。例如,一个载波可以具有20MHz的带宽且由一个BWP组成,或者一个载波可以具有80MHz的带宽且由两个相邻的连续BWP组成,依此类推。在其它实施例中,一个BWP可以具有一个或多个载波。例如,一个BWP可以具有40MHz的带宽且由两个相邻的连续载波组成,其中,每个载波具有20MHz的带宽。在一些实施例中,一个BWP可以包括由多个非连续载波组成的非连续频谱资源,其中,多个非连续载波中的第一载波可以处于mmW频段,第二载波可以处于低频段(例如,2GHz频段),第三载波(如果存在)可以处于THz频段,第四载波(如果存在)可以处于可见光频段。属于BWP的一个载波中的资源可以是连续的,也可以是非连续的。在一些实施例中,一个BWP在一个载波上具有非连续频谱资源。
无线通信可以在占用带宽上进行。占用带宽可以定义为频带的宽度,使得在频带的下限以下和上限以上(部分),发射的平均功率分别等于总平均发射功率的指定百分比/2,例如,/2的值取0.5%。
载波、BWP或占用带宽可以由网络设备(例如,基站)在下行控制信息(DownlinkControl Information,DCI)等物理层控制信令中动态指示,或者在无线资源控制(radioresource control,RRC)信令或媒体接入控制(medium access control,MAC)层等中半静态指示,或者根据应用场景预定义;或者由UE确定为UE已知的其它参数的函数,或者可以通过标准等固定。
人工智能(Artificial Intelligence,AI)和/或机器学习(Machine Learning,ML)
预计未来无线网络中的新设备会呈指数级增长,设备的功能也会越来越多样化。此外,还预计会出现许多新的应用和场景,它们对服务质量的要求比5G应用/场景更加多样化。这些场景都会为未来无线网络(例如,6G网络)带来极具挑战性的新关键性能指标(keyperformance indication,KPI)。ML技术(例如,深度学习)等AI技术已经引入到电信应用,目标是提高系统性能和效率。
另外,天线和带宽能力也在不断进步,从而可以通过无线链路进行更多和/或更好的通信。此外,通用引入通用图形处理单元(general-purpose graphics processingunit,GP-GPU)等,计算机架构和计算能力领域也在不断进步。未来几代通信设备的计算能力和/或通信能力可能比前几代强,这样可以采用AI来实现空口组件。未来几代网络还可以获取更准确和/或新的信息(与前几代网络相比),这些信息可以成为AI模型的输入基础,例如,设备移动的物理速度(speed/velocity)、设备的链路预算、设备的信道条件、一种或多种设备能力和/或需要支持的服务类型、感测信息和/或定位信息等。为了获取感测信息,TRP可以向目标对象(例如,潜在UE)发送信号,TRP或其它网络设备根据信号的反射计算角度(用于设备的波束赋形)、设备与TRP的距离和/或多普勒频偏信息。定位信息有时候称为位置信息,可以通过多种方式获取,例如,UE的定位报告(例如,UE的GPS坐标的报告)、使用定位参考信号(positioning reference signal,PRS)、使用上述感测、跟踪和/或预测设备的位置,等等。
AI技术(包括ML技术)可以应用于通信,包括物理层中的基于AI的通信和/或MAC层中的基于AI的通信。在物理层中,AI通信可以用于优化组件设计和/或提高算法性能。例如,AI可以用于实现以下方面:信道编码、信道建模、信道估计、信道解码、调制、解调、MIMO、波形、多址、物理层单元参数优化和更新、波束赋形、跟踪、感测和/或定位,等等。在MAC层中,AI通信可以利用AI能力进行学习、预测和/或决策,以使用更好的策略和/或最优方案来解决复杂的优化问题,例如,优化MAC层中的功能。例如,AI可以用于实现以下方面:智能TRP管理、智能波束管理、智能信道资源分配、智能功率控制、智能频谱利用、智能MCS、智能HARQ策略和/或智能发送/接收模式自适应,等等。
在一些实施例中,AI架构可以包括多个节点,其中,多个节点可以在集中式和分布式这两种模式之一下组织,这两种模式都可以部署在接入网、核心网或边缘计算系统或第三方网络中。集中式训练和计算架构受限于可能存在的大量通信开销以及严格的用户数据隐私。分布式训练和计算架构可以包括几种框架,例如,分布式机器学习和联邦学习。在一些实施例中,AI架构可以包括智能控制器,该智能控制器可以根据联合优化或单独优化作为单个代理或多代理执行。需要新的协议和信令机制,以便可以使用定制参数对相应的接口链路进行个性化,以满足特定要求,同时通过个性化的AI技术,最小化信令开销且最大化整个系统频谱效率。
在本文的一些实施例中,提供新的协议和信令机制是为了在用于AI训练的不同运行模式内运行和在不同运行模式之间切换,包括训练模式和正常运行模式之间的切换,而且也是为了进行测量和反馈,以适应可能需要反馈的不同可能的测量和信息,具体取决于实现方式。
AI训练
再次参考图1和图2,本发明实施例可以用于实现涉及通信系统100中的两个或两个以上通信设备的AI训练。例如,图5示出了一个实施例提供的通信系统100中的四个ED与网络设备452进行通信。这四个ED分别示为相应不同的UE,在下文中称为UE 402、404、406和408。然而,ED不一定非得是UE。
网络设备452是网络(例如,无线接入网120)的一部分。网络设备452可以部署在接入网、核心网、边缘计算系统或第三方网络中,具体取决于实现方式。网络设备452可以是T-TRP或服务器(或其一部分)。在一个示例中,网络设备452可以是T-TRP 170或NT-TRP 172(或在其中实现)。在另一个示例中,网络设备452可以是T-TRP控制器和/或NT-TRP控制器,它们可以管理T-TRP 170或NT-TRP 172。在一些实施例中,网络设备452中的组件可以是分布式的。例如,如果网络设备452是为UE 402、404、406和408提供服务的T-TRP的一部分,则UE 402、404、406和408可以直接与网络设备452进行通信。可替代地,UE 402、404、406和408可以通过T-TRP和/或NT-TRP等一个或多个中间组件与网络设备352进行通信。例如,网络设备452可以通过网络设备452与UE 402、404、406和408之间的回传链路和无线信道向/从UE402、404、406和408中的一个或多个UE发送和/或接收信息(例如,控制信令、数据、训练序列等)。
如上所述,每个UE 402、404、406和408包括相应的处理器210、存储器208、发送器201、接收器203和一个或多个天线204(或面板)。为了简单起见,仅示出了UE 402中的处理器210、存储器208、发送器201、接收器203和天线204,但其它UE 404、406和408也包括同样的相应组件。
对于每个UE 402、404、406和408,该UE与网络中的相应TRP之间的通信链路是空口。空口通常包括许多组件和相关参数,这些组件和相关参数共同指定如何通过无线介质发送和/或接收传输。
图5中的UE中的处理器210实现UE侧的一个或多个空口组件。空口组件配置和/或实现空口上的发送和/或接收。本文描述了空口组件的示例。空口组件可以位于物理层中,例如,实现UE的空口编码组件的信道编码器(或解码器),和/或实现UE的空口调制组件的调制器(或解调器),和/或实现UE的空口波形组件的波形发生器,等等。空口组件可以在MAC层等高层中(或其一部分),例如,实现信道预测/跟踪的模块,和/或实现重传协议(例如,实现UE的空口HARQ协议组件)的模块,等等。处理器210还直接执行(或控制UE执行)本文中描述的UE侧操作。
网络设备452包括处理器454、存储器456和输入/输出设备458。处理器454实现或指示其它网络设备(例如,T-TRP)实现网络侧的空口组件中的一个或多个空口组件。一个UE与其它UE的空口组件在网络侧的实现方式可能不同。处理器454直接执行(或控制网络组件执行)本文中描述的网络侧操作。
处理器454可以由用于执行存储在存储器(例如,存储器456)中的指令的相同或不同的一个或多个处理器实现。可替代地,处理器454中的部分或全部可以使用编程的FPGA、GPU或ASIC等专用电路来实现。存储器456可以由易失性和/或非易失性存储器来实现。可以使用任何合适类型的存储器,例如,RAM、ROM、硬盘、光盘、处理器缓存等。
输入/输出设备458支持通过接收(输入)和发送(输出)信息与其它设备进行交互。在一些实施例中,输入/输出设备458可以由发送器和/或接收器(或收发器)和/或一个或多个接口(例如,连接到内部网络或互联网等的有线接口)来实现。在一些实现方式中,输入/输出设备458可以由网络接口来实现,该网络接口可以实现为网络接口卡(networkinterface card,NIC)和/或计算机端口(例如,插头或电缆连接到的物理插座)和/或网络套接字等,具体取决于实现方式。
网络设备452和UE 402能够实现一个或多个AI使能的过程。具体地,在图5的实施例中,网络设备452和UE 402分别包括ML模块410和460。ML模块410由UE 402中的处理器210来实现,ML模块460由网络设备452中的处理器454来实现,因此图5示出了ML模块410在处理器210内,ML模块460在处理器454内。ML模块410和460执行一个或多个AI/ML算法以执行一个或多个AI使能的过程,例如,AI使能的链路自适应以优化网络和UE 402之间的通信链路,等等。
ML模块410和460可以使用AI模型来实现。术语“AI模型”可以指用于接受限定的输入数据并输出限定的推理数据的计算机算法,其中,算法的参数(例如,权重)可以通过训练(例如,使用训练数据集或使用现实生活中收集到的数据)进行更新和优化。AI模型可以使用一个或多个神经网络(例如,包括深度神经网络(deep neural network,DNN)、递归神经网络(recurrent neural network,RNN)、卷积神经网络(convolutional neural network,CNN)及其组合)以及使用各种神经网络架构(例如,自动编码器、生成对抗网络等)来实现。可以使用各种技术来训练AI模型,以便更新和优化该AI模型的参数。例如,反向传播是一种常用的训练DNN的技术,在这种技术中,损失函数在由DNN生成的推理数据和某个目标输出(例如,地面真值数据)之间计算出。计算出损失函数相对于DNN参数的梯度,并且使用计算出的梯度(例如,使用梯度下降算法)来更新参数,目标是最小化损失函数。
在一些实施例中,AI模型包括在机器学习中使用的神经网络。神经网络包括排列在一层或多层中的多个计算单元(还可以称为神经元)。在输入层处接收输入并在输出层处生成输出的过程可以称为前向传播。在前向传播中,每一层接收输入(可以是任何合适的数据格式,例如,向量、矩阵或多维数组),并且执行计算以生成输出(输出的维度可能与输入不同)。一层执行的计算通常包括将输入与一组权重(也称为系数)进行运算(例如,相乘)。除了神经网络的第一层(即输入层)之外,每一层的输入都是前一层的输出。神经网络可以包括介于第一层(即输入层)和最后一层(即输出层)之间的一层或多层,这些层可以称为内层或隐藏层。例如,图6A描述了包括输入层、输出层和两个隐藏层的神经网络600的一个示例。在这个示例中,可以看出神经网络600的输入层中的三个神经元中的每个神经元的输出都包括在输入向量中,该输入向量输入到第一个隐藏层中的三个神经元中的每个神经元。同样,第一个隐藏层中的三个神经元中的每个神经元的输出都包括在输入向量中,该输入向量输入到第二个隐藏层中的三个神经元中的每个神经元;第二个隐藏层中的三个神经元中的每个神经元的输出都包括在输入向量中,该输入向量输入到输出层中的两个神经元中的每个神经元。如上所述,神经网络中的基本计算单元是神经元,如图6A中的650所示。图6B示出了可以用作神经网络600的构建块的神经元650的一个示例。如图6B所示,在这个示例中,神经元650将向量x作为输入,并且将该向量与权重w的相关向量进行点积运算。神经元的最终输出z是点积的激活函数f()的结果。各种神经网络可以设计有不同的架构(例如,不同数量的层,每层执行不同的功能)。
训练神经网络以优化神经网络的参数(例如,权重)。这种优化以自动化方式执行,可以称为机器学习。神经网络的训练包括将输入数据样本进行前向传播以生成输出值(也称为预测输出值或推断输出值),然后将生成的输出值与已知或期望的目标值(例如,地面真值)进行比较。损失函数的定义是定量表示生成的输出值与目标值之间的差值,训练神经网络的目标是最小化损失函数。反向传播是一种用于训练神经网络的算法。反向传播用于调整(也称为更新)神经网络中的参数(例如,权重)的值,使得计算出的损失函数变小。反向传播包括计算损失函数相对于待优化参数的梯度,梯度算法(例如,梯度下降)用于更新参数以减小损失函数。反向传播是迭代执行的,因此损失函数在多次迭代中收敛或最小化。在满足训练条件(例如,损失函数已经收敛,或者已经执行了预定义次数的训练迭代)之后,神经网络即视为训练完成。可以部署(或执行)经过训练的神经网络,以从输入数据生成推断输出数据。在一些实施例中,即使在部署好神经网络之后,神经网络的训练也可以继续进行,这样神经网络的参数就可以使用最新的训练数据反复更新。
再次参考图5,在一些实施例中,UE 402和网络设备452可以交换信息以进行训练。UE 402和网络设备452之间交换的信息取决于具体实现方式,该信息可能不具有人类可理解的含义(例如,该信息可能是在执行ML算法时产生的中间数据)。另外或可替代地,交换的信息不是由标准预定义的,例如,可以交换比特,但这些比特可能与预定义的含义不相关联。在一些实施例中,网络设备452可以向UE 402提供或指示在UE 402处实现的ML模块410中使用的一个或多个参数。例如,网络设备452可以发送或指示更新后的神经网络权重,以便在UE侧的ML模块410执行的神经网络中实现,从而试图优化用于UE 402与T-TRP或NT-TRP之间通信的调制和/或编码的一个或多个方面。
在一些实施例中,UE 402本身可以实现AI,例如,执行学习,而在其它实施例中,UE402本身可以不执行学习,但可以通过以下操作与网络侧的AI实现协同工作:例如,从网络接收由ML模块410实现的AI模型(例如,神经网络或其它ML算法)的配置,和/或通过提供请求的测量结果或观测结果,协助其它设备(例如,网络设备或其它具备AI能力的UE)训练AI模型(例如,神经网络或其它ML算法)。例如,在一些实施例中,UE 402本身可以不执行学习或训练,但UE 402可以接收由网络设备452确定的ML模型的经过训练的配置信息,并且执行该模型。
虽然图5中的示例假设网络侧具有AI/ML能力,但可能存在网络本身不执行训练/学习的情况,而是UE自身可以执行学习/训练,可能使用的是从网络发出的专用训练信号。在其它实施例中,UE和网络设备452可以实现端到端(end-to-end,E2E)学习。
利用AI,例如,通过实现如上所述的AI模型,链路自适应等各种过程可以AI使能的。根据本发明实施例,下面描述了可能的AI/ML训练过程和训练阶段中设备之间的空中信息交换过程的一些示例,以促进AI使能的过程。
在现有的在线AI模型训练过程中,为了努力确保接收设备成功解码在发送设备和接收设备之间传输的训练数据(作为训练过程的一部分)且没有错误,使用HARQ-ACK反馈和重传。
例如,再次参考图5,对于无线联邦学习(federated learning,FL),网络设备452可以初始化由ML模块500实现的全局AI/ML模型,对一组UE(例如,图5所示的四个UE 402、404、406和408)进行采样,并且向这些UE广播全局AI/ML模型参数。然后,UE 402、404、406和408中的每个UE可以使用全局AI/ML模型参数初始化自己的局部AI/ML模型,并且使用自己的数据更新(训练)自己的局部AI/ML模型。接着,UE 402、404、406和408中的每个UE可以向网络设备452上报自己更新后的局部AI/ML模型的参数。网络设备452这时可以聚合从UE402、404、406和408上报的更新后的参数,并且更新全局AI/ML模型。上述过程是基于FL的AI/ML模型训练过程的一次迭代。网络设备452和UE 402、404、406和408执行多次迭代,直到AI/ML模型足够收敛以满足一个或多个训练目标/标准。
对于FL中的下行(downlink,DL)传输,例如,对于上述示例中的从网络设备452到UE 402、404、406和408的全局模型参数传输,如果UE 402、404、406和408中的一个UE的信道质量较差(例如,高干扰和/或衰落),则向该UE的DL传输很有可能失败,并且导致UE上报NACK以请求重传。这可能会导致在训练过程中进行多次重传,因此相关的通信开销会非常大。此外,在同步的基于FL的AI/ML训练过程中,网络设备452只有在参与训练的所有UE都成功解码DL传输并上报当前迭代更新后的局部模型参数之后,才会开始下一次迭代训练。在实践中,这表示迭代之间的传输延迟通常受具有最高丢包率的UE控制,这可能会导致AI/ML模型训练出现很大延迟。
除了FL之外,其它学习方法中也存在很大的通信开销和很大的学习延迟。例如,在分布式学习中,UE和网络设备以类似于FL的方式协同训练AI模型。FL和分布式学习之间的主要区别在于,在FL中,DL传输是通过广播传输或组播传输进行的,而在分布式学习中,DL传输是提高单播传输进行的。
现有AI/ML模型训练过程的另一个缺点与交换的数据的有效载荷大小有关,有效载荷大小通常非常大。例如,在许多情况下,交换的数据包括数百个或数千个AI/ML模型参数,例如,梯度、连接权重、偏差等。因此,由于无线通信中的传输通常不可靠,而且用于AI训练的设备之间交换的数据的数据量通常很大,因此AI/ML模型训练需要的空口资源开销可能会非常大。因此,非常需要减少与在线AI/ML模型训练相关的开销和延迟的技术。
用于AI训练的可靠性自适应
本发明描述了AI/ML模型训练过程的示例,以避免或至少减少传统AI/ML模型训练过程相关的上述一个或多个问题。例如,如下详述,在本文中描述的一些实施例中,在AI/ML模型训练过程的不同时间/阶段中使用不同的通信模式。例如,根据本发明的第一方面,与第二设备一起参与AI/ML模型训练过程的第一设备可以根据不同的通信模式与第二设备传输数据或控制信息,这些通信模式在AI/ML模型训练过程的不同阶段中反映了不同的可靠性级别。例如,不同的通信模式可以是不同的可靠性模式,至少包括第一可靠性模式和第二可靠性模式,其中,第二可靠性模式在以下方面与第一可靠性模式不同:量化级别,用于量化数据或控制信息中的变量的值,和/或HARQ反馈和重传过程,用于选择性重传数据或控制信息的一个或多个部分。一般而言,本文中描述的通信模式自适应技术可以应用于两个设备之间的任何通信,包括下行通信、上行通信和/或侧行链路通信。例如,在一些实施例中,第一设备可以是ED,例如,UE 404,第二设备可以是网络设备,例如,T-TRP 170、NT-TRP 172或网络设备452。在其它实施例中,第一设备可以是网络设备,第二设备可以是ED。在其它一些实施例中,两个设备都可以是ED。
例如,在训练的早期阶段中,交换的AI/ML模型训练数据很可能不完全准确/信息不全,因为参与训练过程的AI/ML模型尚未收敛。在这个阶段中,可以使用低可靠性模式,该模式可以具有以下一种或多种通信属性:
·不使用HARQ反馈或重传过程,以减少开销;和/或
·对交换的数据(例如,梯度、权重、偏置等)进行低精度量化。
然而,在训练过程中的某个点(例如,如果平均局部验证损失不再有实质性改善,例如,如果从一次训练迭代到下一次训练迭代的验证损失改善低于某个阈值),设备可以切换到第二可靠性模式,例如,高可靠性模式,以使AI训练收敛。例如,高可靠性模式可以具有以下一种或多种与低可靠性模式的通信属性不同的通信属性:
·可以使用基于HARQ反馈的重传来确保接收设备成功解码发送的训练数据;和/或
·可以对交换的数据进行高精度量化。
在这些实施例中,低可靠性模式和高可靠性模式之间的切换可以是半静态的或动态的,如下详述。
关于不同可靠性模式下可以使用的不同量化精度级别,需要说明的是,术语“低精度量化”和“高精度量化”在本文中是相对意义上的。具体地,本文中使用的低精度量化是指使用较少的比特来表示变量的值,而本文中使用的高精度量化是指使用较多的比特来表示变量的值,以便更精确地表示变量的精确值。例如,在表示连接的权重时,低精度量化可以只使用1个比特,而高精度量化可以使用2个比特。下表1举例说明了这种实现方式,包括可能的比特含义:
表1
需要说明的是,本发明实施例不限于两种可靠性模式。例如,在一些实现方式中,可以存在至少三种不同的模式来实现不同的可靠性,例如,以下三个非限制性示例:
·低可靠模式:不存在HARQ反馈且不存在重传,和/或在设备之间的数据传输中使用低精度量化
·中等可靠性模式:不存在HARQ-ACK反馈且不存在重传,以及在设备之间的数据传输中使用高精度量化;或存在HARQ反馈且存在重传,以及使用低精度量化
·高可靠性模式:存在HARQ-ACK反馈且存在重传,和/或在设备之间的数据传输中使用高精度量化。
需要说明的是,上述三种模式仅仅是示例,在一些实现方式中还可以包括更多的模式,例如,中等精度量化以及HARQ方法与不同量化方法之间的其它组合。
还需要说明的是,虽然以下许多示例是在基于联邦学习或基于分布式学习的AI/ML模型训练过程的上下文中描述的,但是本文中描述的技术也可以应用于其它学习方法中的AI训练,例如,集中式学习、自动编码器、深度神经网络(Deep Neural Network,DNN)、卷积神经网络(convolutional neural network,CNN),等等。
还需要说明的是,本发明实施例不限于从低可靠性模式切换到高可靠性模式。例如,也可以从高可靠性模式切换到低可靠性模式。此外,在包括两种以上通信模式的实施例中,可以从每个通信模式切换其它到任何通信模式。例如,在上述包括低可靠性模式、中等可靠性模式和高可靠性模式的示例中,可以从低可靠性模式切换到中等可靠性模式,也可以从低可靠性模式切换到高可靠性模式。同样,可以从高可靠性模式切换到低可靠性模式,也可以从高可靠性模式切换到中等可靠性模式。另外,通信设备可以在切换通信模式之间多次切换。例如,参与AI/ML模型训练过程的两个通信设备可以在训练过程中多次切换通信模式(例如,从低可靠性模式切换到高可靠性模式,反之亦然)。
图7示出了本发明一个方面提供的由第一设备和第二设备执行的方法的信号流图700。在一些实施例中,第一设备可以是网络设备,例如,TRP 452,第二设备可以是ED,例如,UE 402,但也不一定。例如,在其它实施例中,第一设备可以是ED,第二设备可以是网络设备。在其它一些实施例中,两个设备都可以是ED。
在步骤702处,第一设备根据第一通信模式与第二设备传输数据或控制信息。第一通信模式是至少包括第一通信模式和第二通信模式的多种通信模式中的一种通信模式,第二通信模式与第一通信模式在以下方面不同:量化级别,用于量化数据或控制信息中的变量的值;和/或HARQ反馈和重传模式,用于选择性重传数据或控制信息的一个或多个部分。
在702处根据第一通信模式与第二设备传输数据或控制信息可以包括:第一设备向第二设备发送数据或控制信息,可选地如704A所示;第二设备接收数据或控制信息,可选地如706A所示。在一些实施例中,704A处的数据或控制信息的传输通过DCI进行调度,其中,该DCI的CRC值通过与小区RNTI(Cell RNTI,C-RNTI)不同的RNTI进行加扰。
在702处与第二设备传输数据或控制信息可以另外或替代地包括:第二设备向第一设备发送数据或控制信息,可选地如704B所示;第一设备接收数据或控制信息,可选地如706B所示。
在步骤722处,第一设备从根据第一通信模式与第二设备传输数据或控制信息切换到根据第二通信模式与第二设备传输数据或控制信息。在一些实施例中,从第一通信模式切换到第二通信模式可以在经过预定或预配置的AI/ML模型训练时间之后或在经过多次AI/ML模型训练迭代等之后进行。另外或替代地,切换可以通过控制信令触发。例如,在一些实施例中,第一设备可以向第二设备发送包括切换指令的控制信令,可选地如710所示。在这些实施例中,在第一设备在710处发送控制信令并且第二设备在712处接收控制信令之后,第一设备和第二设备可以根据在710、712处传输的控制信令中包括的切换指令,从第一通信模式切换到第二通信模式。
在722处根据第二通信模式与第二设备传输数据或控制信息可以包括:第一设备向第二设备发送数据或控制信息,可选地如724A所示;第二设备接收数据或控制信息,可选地如726A所示。在702处与第二设备传输数据或控制信息可以另外或替代地包括:第二设备向第一设备发送数据或控制信息,可选地如724B所示;第一设备接收数据或控制信息,可选地如726B所示。
在一些实施例中,在第一通信模式下使用第一HARQ反馈和重传模式,其中,在第一HARQ反馈和重传模式下,第一设备和第二设备之间不存在HARQ反馈过程且不存在数据或控制信息的重传。相反,在第二通信模式下,可以使用第二HARQ反馈和重传模式,其中,在第二HARQ反馈和重传模式下,存在HARQ反馈过程以请求重传数据或控制信息的一个或多个部分。例如,如果第二设备在726A处未成功接收到数据或控制信息的一个或多个部分,则第二设备可以向第一设备发送HARQ反馈信息,可选地如730A所示,其中,HARQ反馈信息标识第二设备未成功接收到的数据的一个或多个部分。在一些实施例中,在730A处接收到的HARQ反馈信息可以包括,对于第二设备未成功接收到的数据的每个部分,与未成功接收到的部分对应的重要性指示信息。例如,与未成功接收到的部分对应的重要性指示信息可以指示未成功接收到的部分对于第二设备处的AI/ML模型训练是否重要。在这些实施例中,在732A处接收到HARQ反馈信息之后,第一设备可以向第二设备发送HARQ进程信息,可选地如734A所示。例如,HARQ进程信息可以标识第一设备不会重传的数据的一个或多个未成功接收到的部分中的至少一个部分。在这些实施例中,第一设备可以重传一个或多个未成功接收到的部分的部分子集,其中,该部分子集不包括在HARQ进程信息中标识的至少一个未成功接收到的部分。例如,第一设备可以发送重传,可选地如738A所示,然后,第二设备接收该重传,可选地如740A所示。在一些实施例中,可以支持多次重传,但是在经过预定或预配置次数的重传之后,给定的HARQ进程可能会终止。相反,如果第一设备在726B处未成功接收到数据或控制信息的一个或多个部分,第一设备不会向第二设备发送HARQ反馈信息,而是可以调度未成功接收到的数据的至少一部分的重传。例如,如果第一设备是网络设备,第二设备是UE,则第一设备可以通过向第二设备发送重传调度信息(可选地如730B所示)来调度这种重传。在这些实施例中,在732B处接收到重传调度信息之后,第二设备可以根据可选地如738B所示的重传调度信息来重传请求的数据,然后,第一设备可以接收该重传调度信息,可选地如740B所示。
在其它实施例中,第一通信模式和第二通信模式下都可能存在HARQ反馈过程。例如,在一些实施例中,在第一通信模式下使用第一HARQ反馈和重传模式,其中,第一HARQ反馈和重传模式支持N1次重传,N1为整数,N1≥1。在这些实施例中,在第二通信模式下使用第二HARQ反馈和重传模式,其中,第二HARQ反馈和重传模式下最多支持N2次重传,N2为整数,N2>N1。
在一些实施例中,从第一设备发出和第二设备接收到的数据或控制信息和/或从第二设备发出和第一设备接收到的数据或控制信息可以包括用于AI/ML模型训练的数据或控制信息。在这些实施例中,上述设备中的一个或两个可以根据与另一个设备传输的数据或控制信息来训练AI/ML模型。例如,第二设备可以根据可选地如708A和748A所示的从第一设备接收到的数据或控制信息来训练AI/ML模型,和/或第一设备可以根据可选地如708B和748B所示的从第二设备接收到的数据或控制信息来训练AI/ML模型。
在一些实施例中,第一设备可以向第二设备发送控制信令以结束第二设备参与AI/ML训练过程。例如,第一设备可以向第二设备发送控制信令,可选地如750所示,其中,该控制信令包括停止训练指令,以配置第二设备停止训练第二设备处的AI/ML模型。在这些实施例中,在752处接收到控制信令之后,第二设备可以停止参与AI/ML训练过程。在一些实施例中,响应于在752处接收停止训练指令,第二设备可以停止训练第二设备处的AI/ML模型。在其它实施例中,在752处接收到停止训练指令之后,第二设备可以继续训练第二设备处的AI/ML模型,但是可以不向第一设备提供AI/ML模型更新数据。
为了简单起见,图7所示的示例描述了两种通信模式(即第一通信模式和第二通信模式)之间的操作。然而,如上所述,在其它实施例中,通信模式可能不止两种。
图8至图10示出了本发明各种实施例提供的由第一设备和第二设备执行的通信模式自适应的方法的其它示例。
图8示出了一个实施例提供的由无线通信网络中的一对设备执行的方法的信号流图800。这一对设备可以是ED和网络设备,例如,UE 402和TRP 452,但也不一定。
为了简单起见,图8所示的示例描述了两种通信模式(即低可靠性模式802和高可靠性模式804)之间的操作。然而,如上所述,在其它实施例中,可靠性模式可能不止两种。一般而言,可靠性自适应方案可以应用于任何特定的数据传输,例如,AI训练过程中的数据交换(包括DL和UL,或侧行链路)。这些数据可以在物理(physical,PHY)层中标识。例如,可靠性自适应方案可以应用于通过DCI调度的数据,该DCI的CRC通过特定的RNTI(例如,AI训练RNTI)进行加扰。在这些情况下,特定的RNTI可以是组通用RNTI或UE特定的RNTI等。在图8所示的示例中,在基于联邦学习或基于分布式学习的AI/ML模型训练过程的上下文中,上述可靠性自适应方案应用于从网络设备(例如,TRP 452)到ED(例如,UE 402)的DL传输。然而,在一些实施例中,上述可靠性自适应方案可以另外或替代地应用于从ED到网络设备的UL传输和/或ED之间的侧行链路传输。
在图8所示的示例中,UE 402在训练过程开始时默认在低可靠性模式802下运行。在这个示例中,TRP 452通过在806处向UE 402发送训练激活信号来指示训练过程开始。例如,训练激活信号可以由TRP 452通过RRC、MAC-CE或DCI信令等指示。例如,TRP 452可以发送具有CRC的DCI以激活训练过程,其中,该CRC通过专用于AI/ML训练信令的RNTI(例如,AI训练RNTI)进行加扰。例如,DCI中的一些特定字段可以设置为预定义值以指示训练激活,例如,新数据指示、冗余版本、HARQ进程号、DAI、PUCCH的TPC、PUCCH资源指示或者HARQ定时等字段可以设置为预定义值以指示要激活AI训练。
在图8所示的示例中,一旦AI/ML训练过程通过在806处发送训练激活信号激活,则TRP 452和UE 402开始在低可靠性模式802下运行。在这个示例中,假设AI/ML训练过程是基于FL的AI/ML训练过程,其中,TRP 452和UE 402迭代地交换AI模型更新。例如,在图8中的迭代1所示的第一次迭代中,TRP 452在8081处发送AI模型更新信息,该AI模型更新信息可以包括如上所述的全局AI/ML模型参数。如上所述,在联邦学习中,TRP 452在8081处发送全局AI模型更新信息可以是向多个UE(包括UE 402)广播的广播传输,而在分布式学习中,在8081处进行发送可以是专用于UE 402的单播传输。
在8101处,UE 402根据在8081处接收到的AI模型更新信息(例如,使用在8081处接收到的AI模型更新信息中包括的全局AI/ML模型参数)初始化局部AI/ML模型,并且使用自己的数据来训练自己的局部AI/ML模型。
UE 402这时可以在8121处发送自己的AI模型更新信息,以向TRP 452上报更新后的局部AI/ML模型参数。
在8141处,TRP 452则可以聚合从UE 402和可能参与基于FL的训练过程的任何它一个或多个UE上报的更新后的参数,并且更新全局AI/ML模型。上述过程是基于FL的AI/ML模型训练过程的一次迭代,在本示例中包括低可靠性模式802下的多次迭代。例如,在图8所示的示例中,TRP 452通过在8082处发送更新后的AI模型更新信息开始第二次迭代。
需要说明的是,在这个示例中,在低可靠性模式802下,UE 402没有向TRP 452提供HARQ反馈,TRP 452也没有向UE 402重传下行AI模型更新传输。另外,在低可靠性模式802下,低精度量化可以用于表示(例如,在808x处)从TRP 452向UE 402发送的AI模型更新信息和/或(例如,在812x处)从UE 402向TRP 452发送的AI模型更新信息中包括的参数的值,如上所述。
在这个示例中,TRP 452和UE 402在低可靠性模式802下执行基于FL的AI/ML模型训练过程的N次迭代。例如,类似于第一次迭代(迭代1),在图8中的迭代N所示的第N次迭代中,TRP 452在808N处发送AI模型更新信息。UE 402根据在808N处接收到的AI模型更新信息来更新自己的局部AI/ML模型,在810N处使用自己的数据来训练自己的局部AI/ML模型,并且在812N处向TRP 452发送自己的AI模型更新信息。在814N处,TRP 452则可以聚合从UE 402和可能参与基于FL的训练过程的任何其它一个或多个UE上报的更新后的参数,并且更新全局AI/ML模型。
通信模式之间的动态切换
在图8中,TRP 452在816处发送切换信令,以便在AI/ML模型训练过程中在低可靠性模式802和高可靠性模式804之间动态切换。在一些实施例中,在816处,TRP 452可以使用DCI在低可靠性模式802和高可靠性模式804之间动态切换。除了模式切换之外,DCI还可以指示切换后模式下的量化级别,例如,用于表示变量的值的比特数。
在AI/ML模型训练过程中,有多种可能的方式可以使用DCI来触发可靠性模式切换。例如,在一些实施例中,可以使用调度DCI,而在其它实施例中,可以使用特定的切换DCI。
有多种方式可以使用现有的调度DCI(即,当前用于调度的DCI)进行可靠性模式切换。例如,调度DCI中的“模式切换”字段可以用于指示模式切换。例如,为了在2种模式之间切换,可以使用1个比特,例如,0表示不切换,1表示从当前模式切换到另一种模式(例如,从低可靠性模式802切换到高可靠性模式804,反之亦然)。可替代地,为了从低可靠性模式802切换到高可靠性模式804,由于在低可靠性模式下不使用HARQ相关字段(例如,新数据指示、冗余版本、HARQ进程号、DAI、PUCCH的TPC、PUCCH资源指示或HARQ定时字段),因此TRP 452可以使用DCI中的一个或多个HARQ相关字段来指示从低可靠性模式802动态切换到高可靠性模式804。
同样,有多种方式可以使用特定的切换DCI(即,不用于调度的DCI,例如,DCI中没有资源分配指示)进行可靠性模式切换。例如,UE特定的切换可以使用组通用DCI(即一组UE通用的DCI)来实现,该组通用DCI包括组内多个UE的切换指示。例如,对于一组M个UE,组通用DCI可以包括M个模式切换指示,例如,模式切换指示1、模式切换指示2……模式切换指示M。例如,对于UE 402,TRP 452可以在组通用DCI中为UE 402配置模式切换指示的比特位置,以便UE 402能够解码自己的模式切换指示。可替代地,UE组切换可以在联合学习等中通过广播指示进行,其中,组通用DCI中的一个切换指示适用于多个UE。
基于FL的AI/ML模型训练过程的迭代在高可靠性模式804下继续进行。具体地,如图8所示,在从低可靠性模式802切换到高可靠性模式804之后,TRP 452开始迭代N+1,迭代N+1与在低可靠性模式802下执行的前N次迭代类似,包括在808N+1处从TRP 452向UE 402发送AI模型更新,在810N+1处进行UE 402处的训练,在812N+1处从UE 402向TRP 452发送AI模型更新,以及在814N+1处进行TRP 452的训练。然而,与低可靠性模式802下的操作相反,在高可靠性模式804下,UE 402在每次迭代中上报HARQ反馈(如图8中的818x所示),并且当HARQ反馈指示未成功解码发送数据的一个或多个部分(例如,在808x处发送的AI模型更新信息的一个或多个部分),TRP 452可以调度重传。例如,在迭代N+1中,UE 402提供HARQ反馈818N+1,该HARQ反馈指示UE 402成功解码TRP 452在808N+1处发送的AI模型更新信息。然而,在迭代N+2中,UE 402未成功解码TRP 452在808N+2发送的AI模型更新信息的一个或多个部分,UE 402通过在818N+2,1处发送HARQ反馈向TRP 452上报未成功解码这一情况。在这个示例中,至少部分根据UE 402在818N+2,1处的HARQ反馈,TRP 452调度先前在808N+2处发送的AI模型更新信息的至少一部分的重传。TRP 452在820处发送重传。在这个示例中,假设UE 402在820处接收到重传之后成功解码迭代N+2的AI模型更新信息,UE 402通过在818N+2,2处发送其它HARQ反馈向TRP 452上报成功解码这一情况。UE 402这时在810N+2处继续训练自己的局部AI/ML模型,并且在812N+2处向TRP 452发送AI模型更新信息。与在之前的迭代中一样,TRP 452在814N+1处继续进行全局AI/ML模型训练,之后,如果需要进一步迭代,则TRP 452可以在808N+3处发送其它AI模型更新信息。有关何时以及如何停止AI/ML模型训练过程的详细内容将在本发明的稍后部分讨论。
对于在高可靠性模式下使用的HARQ方法,不使用上报肯定确认(positiveacknowledgement,ACK)和否定确认(negative acknowledgement,NACK)的完整ACK/NACK反馈,而是可以在一些实施例中使用仅ACK反馈或仅NACK反馈。在仅ACK HARQ反馈方案中,只有UE成功解码数据时才会上报HARQ反馈。如果未接收到ACK反馈,则假设未成功解码数据(例如,如果TRP 452未从UE 402接收到ACK反馈,则TRP 452可以将没有ACK视为NACK)。相反,在仅NACK HARQ反馈方案中,只有UE未成功解码数据时才会上报HARQ反馈(例如,如果TRP 452未从UE 402接收到NACK反馈,则TRP 452可以将没有NACK视为ACK)。
如上所述,本文中公开的可靠性自适应方案适用于DL传输、UL传输和侧行链路传输。例如,在高可靠性模式804下用于表示在808x处在从TRP452向UE402的下行方向上发送的AI模型更新信息中的参数值和/或在812x处在从UE 402向TRP 452的上行方向上发送的AI模型更新信息中的参数值的量化精度级别可以高于在低可靠性模式802下用于表示对应的上行传输和/或下行传输中的参数值的量化精度级别。然而,对于UL中的所有可靠性模式,上行传输不发送HARQ反馈(例如,从UE 402到TRP的上行传输不发送HARQ反馈)。例如,如果TRP 452未成功解码UE在812x处发送的AI模型更新信息,则TRP 452可以在不发送HARQ反馈的情况下调度UE 402发出的重传。
可靠性模式之间的动态切换,例如,低可靠性模式802和高可靠性模式804之间的动态切换,实现了减少开销和提高训练性能之间的权衡。例如,在低可靠性模式下避免重传和/或使用低精度量化可以在训练的早期阶段中减少通信开销。然而,一旦训练结果在低可靠性模式下没有实质性改善(例如,如果从一次训练迭代到下一次训练迭代的验证损失改善低于某个阈值),TRP 452就可以动态地将UE 402切换到在高可靠性模式804下运行,以进一步提高训练性能。
单个UE的动态停止训练
TRP 452可以监测AI/ML模型训练过程的进展,以确定AI/ML模型是否足够收敛以满足一个或多个训练目标/标准,例如,TRP 452可以在AI/ML模型训练过程的每次迭代之后检查收敛情况。例如,如图8所示,如果TRP 452确定AI/ML模型在迭代N+P结束时已经足够收敛,则在高可靠性模式804下,TRP 452可以在P次迭代之后在822处发送训练去激活信号。该训练去激活信号可以由TRP 452通过RRC、MAC-CE或DCI信令等来指示。例如,TRP 452可以发送具有CRC的DCI以去激活训练过程,其中,该CRC通过专用于AI/ML训练信令的RNTI(例如,AI训练RNTI)进行加扰。例如,DCI中的一些特定字段可以设置为预定义值以指示训练去激活,例如,频域/时域资源分配、新数据指示、冗余版本、HARQ进程号、DAI、PUCCH的TPC、PUCCH资源指示或HARQ定时等字段可以设置为预定义值(下表2给出了一个示例)以指示要去激活AI训练。在这种场景下,响应于在822处接收去激活信号中的通过特定的RNTI进行加扰的DCI,UE 402检查这些字段的值,如果发现DCI是去激活DCI,则UE 402停止学习过程。
表2
在一些实施例中,TRP 452等网络设备可以指示各个UE停止参与给定的训练过程,同时继续与其它一个或多个UE执行训练过程。例如,开始与一组UE进行基于联邦学习或基于分布式学习的训练过程的TRP可以在训练过程中的某个点指示这一组中的一个或多个参与UE应停止参与。在这种场景下,TRP和组中的剩余UE可以继续协同训练AI模型。如果AI模型的训练成功,则可以将经过训练的模型参数共享给停止参与的一个或多个UE。UE停止参与训练可能有多种原因。例如,UE可能是滞后UE,例如,信道质量差、AI能力差、AI训练的动态处理能力差(例如,UE处于省电模式或在实现一些复杂的信号处理算法)。在这些情况下,由于需要进行重传和/或AI模型收敛的延迟很大,因此UE参与训练过程很有可能导致空口开销很大。因此,在这些情况下,TRP可以通过RRC/MAC-CE/DCI信令动态指示UE停止训练过程。
如果UE不能对训练过程做出实质性贡献,则能够动态指示UE停止训练可能会带来几个好处。例如,停止非贡献UE参与训练可能会减少空口开销和/或可以更快地实现训练收敛。
UE协助的动态停止训练
在一些实施例中,UE可以向网络设备提供协助信息,以协助网络设备决定是否停止UE处的训练。例如,在联邦学习和分布式学习中,数据在UE之间的分布通常不完全相同,即不同UE之间的训练数据是异构的。在一些实施例中,如果UE 402在训练过程中观察到自己的局部AI/ML模型和全局AI/ML模型之间的相关性变差(这可能是由于数据异质性导致的),则UE 402可以向TRP 452上报协助信息,以协助TRP 452对UE 402做出停止训练决策。例如,上报的协助信息可以包括以下一项或多项:
·UE发出的显式训练停止请求;
·UE的局部模型状态,例如,局部AI模型的损失信息。
·在从UE 402接收到协助信息之后,TRP 452可以确定是否停止UE 402的训练。
UE协助的动态切换
除了提供协助信息以协助TRP 452对UE 402做出停止训练决策之外,当在给定模式下运行时,UE 402可以另外或替代地上报协助信息以协助TRP 452做出模式切换决策,例如,从低可靠性模式802切换到高可靠性模式804。例如,图9示出了UE 402和TRP 452之间的信号流图800的一个示例,信号流图800与图9所示的信号流图800的不同之处在于,UE 402在低可靠性模式802下在830处向TRP 452发送协助信息。在830处发送的协助信息可以包括以下一项或多项:
·UE发出的显式模式切换请求;
·优选的量化级别请求;
·AI模型训练性能的详细内容,例如,平均局部验证损失。
UE 402可以定期或不定期向TRP 452发送这类协助信息。从UE 402向TRP 452上报协助信息可以使用的通信资源有多种选择。例如,UE 402可以使用在调度DCI中指示的PUCCH资源,或者TRP 452可以配置用于协助信息上报的专用PUCCH。虽然示出了830处的协助信息传输在AI模型更新信息812N的传输之间,但更一般地,UE 402可以用于在低可靠性模式802下运行时的任何时间发送协助信息。此外,需要说明的是,在一些实施例中,在图9中的830处发送的协助信息可以替代地与在812N处发送的AI模型更新信息在相同的消息中发送。
UE协助的选择性重传
在可能进行重传的可靠性模式下,例如,在高可靠性模式804下,可以根据丢失的训练数据对训练是否重要而选择性地重传丢失的数据。例如,一些丢失的数据(例如,联邦学习中的全局梯度)可能对UE处的训练不重要。例如,未成功解码来自网络设备的AI模型更新信息的UE可以使用其它训练数据代替丢失的数据(例如,在基于FL的AI/ML模型训练过程中,如果全局梯度和局部梯度之间存在高相关性,则UE可以在下一次训练迭代中使用最近的局部梯度)。在这些情况下,UE可以在不需要重传丢失的数据的情况下完成下一次训练迭代。在其它场景中,即使一些参与UE未成功解码全局梯度传输,只要有足够多的参与基于FL的AI/ML模型训练过程的UE成功解码来自TRP的全局梯度传输,就可以在不需要重传丢失的数据的情况下高效继续进行训练。例如,如果至少Ki个UE(Ki是一个阈值)未成功解码某次训练迭代的全局梯度传输,则TRP可以认为全局梯度传输是重要的,并且重传丢失的数据。另一方面,如果丢失数据的UE少于Ki个,则TRP可以避免该训练迭代的重传,并且可以依赖于其它一个或多个参与UE的更新后的训练数据,这些UE成功解码了该迭代的全局梯度传输。因此,即使在高可靠性模式下,TRP也可能不会重传一些丢失的数据。
为了方便网络设备进行选择性重传,丢失数据的UE不仅可以发送HARQ-ACK反馈,而且还可以发送指示丢失的数据是否重要的信息,以协助网络设备做出重传决策。例如,图8至图10中的UE 402在818x处发送的HARQ反馈可以包括用于HARQ-ACK反馈的Q个比特和用于数据重要性的Q个比特,其中,每个比特与数据的一部分(例如,传输块或编码块组或编码块)对应。对于数据的每个部分,当UE 402上报ACK时,TRP 452可以忽略对应重要性比特的值(因为ACK报告指示UE成功解码了该数据部分)。然而,如果UE 402上报NACK,则TRP 452解码丢失的数据的对应重要性比特的值,并且确定是否执行重传。
在一些实施例中,如果TRP 452确定不会对UE 402丢失的数据执行重传,则TRP452可以向UE 402通知不会重传到UE 402的数据,使得UE 402在该迭代中可能使用其它训练数据进行AI模型更新。通过这种方式,可以减少与在UE侧等待重传相关联的延迟,因为UE可以使用其它训练数据进行AI模型更新,而不是等待重传丢失的数据。例如,为了向UE 402通知不会重传的丢失数据,TRP 452可以发送指示传输结束的一个或多个HARQ进程的DCI。在接收到指示之后,UE 402可以清空所指示的HARQ进程的HARQ缓冲区。用于此目的的DCI可以是UE特定的专用/调度DCI、组通用DCI或广播DCI等。
可靠性模式之间的半静态切换
在图8和图9中,TRP 452通过816处的动态切换信令将UE 402在可靠性模式之间动态切换。在其它实施例中,可靠性模式之间的切换可以半静态配置。以从低可靠性模式802切换到高可靠性模式804为例,低可靠性模式802的时长可以半静态配置。例如,半静态配置的时长可以与迭代步骤相关,也可以与时间相关。
例如,UE 402可以半静态用于在N个迭代步骤之后,即在参考时隙之后接收到用于AI训练模型更新的N次DL传输之后,从低可靠性模式802切换到高可靠性模式804。例如,参考时隙可以是训练过程的开始,例如,UE 402在806处接收训练激活信号的时间。图10描述了这种场景的一个示例,其中,UE 402在迭代N之后从低可靠性模式802切换到高可靠性模式804。
可替代地,UE 402可以半静态用于在N个子帧/时隙/符号之后,即在参考时隙之后的N个子帧/时隙/符号之后,从低可靠性模式802切换到高可靠性模式804。例如,参考时隙可以是训练过程的开始,例如,UE 402在806处接收训练激活信号的时间。
在任一种情况(与迭代步骤相关的情况或与时间相关的情况)下,N可以是预定义的或通过RRC/MAC-CE/DCI信令等配置。所使用的信令可以用于UE特定或UE组特定的配置。例如,如果806处的训练激活信号是通过DCI指示的,则N的值可以指示为相同DCI的一部分,该DCI用于指示训练激活信号,例如,通过重用HARQ相关字段中的一个字段来指示N,例如,以下字段之一:新数据指示、冗余版本、HARQ进程号、DAI、PUCCH的TPC、PUCCH资源指示或HARQ定时。
如果低可靠性模式802的时长是半静态配置的,则预配置的时长在实践中可能不合适,因此在一些实施例中,低可靠性模式802的时长可以动态更新。例如,在低可靠性模式802下,调度DCI可以用于指示低可靠性模式的更新后的时长。例如,调度DCI可以指示时间长度,例如,M个迭代步骤或M个子帧/时隙/符号。然后,从接收DCI的时间开始,在经过DCI指示的时间长度之后(即,在M个步骤或M个子帧/时隙/符号之后),UE从低可靠性模式802切换到高可靠性模式804。
对于调度DCI设计,可以包括用于“时间长度指示”的特定字段,以指示时间长度。可选地,在低可靠性模式802下可能不会使用的HARQ相关字段,例如,新数据指示、冗余版本、HARQ进程号、DAI、PUCCH的TPC、PUCCH资源指示或HARQ定时等字段,可以用于指示时间长度。
通过执行本文中公开的方法,可以减少与在线AI/ML模型训练相关联的空口资源开销和延迟,同时实现减少开销和提高训练性能之间的权衡。
还公开了用于执行本文中描述的各种方法的设备(例如,ED或UE和TRP或网络设备)的示例。
例如,第一设备可以包括用于存储处理器可执行指令的存储器和用于执行处理器可执行指令的处理器。当所述处理器执行所述处理器可执行指令时,可以使得所述处理器执行本文中结合图8至图10等描述的一个或多个设备的方法步骤。例如,所述处理器可以根据可靠性模式与第二设备传输AI/ML模型训练数据,其中,所述可靠性模式是本文中描述的多种可靠性模式中的一种可靠性模式。例如,所述处理器可以使得所述设备通过实现与运行模式一致的操作在所述运行模式下通过空口进行通信,所述操作包括,在所述运行模式下配置执行必要的测量并从这些测量中生成内容,准备上行传输和处理下行传输(例如,编码、解码等),以及在一个或多个RF链和一个或多个天线上配置和/或指示发送/接收。
需要注意的是,本文中使用的表述“A或B中的至少一个”能够与表述“A和/或B”互换。该表述是指可以选择A或B或A和B的列表。类似地,本文中使用的“A、B或C中的至少一个”能够与“A和/或B和/或C”或“A、B和/或C”互换。该表述是指可以选择以下各项的列表:A或B或C,或A和B,或A和C,或B和C,或A、B和C的全部。同样的原则适用于具有相同格式的较长列表。
虽然已经参考本发明的特定特征和实施例描述了本发明,但是在不脱离本发明的范围的情况下,可以进行各种修改和组合。说明书和附图因此仅被视为所附权利要求书界定的对本发明一些实施例的说明,并且考虑覆盖在本发明的范围内的任何和全部修改、变体、组合或等效物。因此,虽然本发明及其优点已详细描述,但是在不脱离所附权利要求书界定的本发明的情况下,可以作出各种改变、替代和更改。此外,本申请的范围并不限定于说明书中所述的过程、机器、制造品、物质成分、模块、方法和步骤的具体实施例。本领域普通技术人员根据本发明的公开内容容易理解,可以根据本发明使用现有的或即将开发出的、具有与本文所描述的对应实施例实质相同的功能,或能够取得与所述实施例实质相同的结果的过程、机器、产品、物质组成、模块、方法或步骤。因此,所附权利要求书旨在于其范围内包括这些过程、机器、制造品、物质组成、构件、方法或步骤。
此外,本文例示的执行指令的任何模块、组件或设备可以包括或以其它方式访问一个或多个非瞬时性计算机/处理器可读存储介质,以存储信息,例如计算机/处理器可读指令、数据结构,程序模块和/或其它数据。非瞬时性计算机/处理器可读存储介质的示例的非详尽列表包括磁带盒,磁带,磁盘存储器或其它磁存储设备,只读光盘(compact discread-only memory,CD-ROM)、数字视频光盘或数字多功能光盘(digital video disc/digital versatiledisc,DVD)、蓝光光盘TM等光盘,或其它光存储器,在任何方法或技术中实现的易失性和非易失性、可移动和不可移动介质,随机存取存储器(random-accessmemory,RAM),只读存储器(read-only memory,ROM),电可擦除可编程只读存储器(electrically erasable programmable read-only memory,EEPROM),闪存或其它存储技术。任何这些非瞬时性计算机/处理器存储介质可以是一种设备的一部分,也可以由一种设备访问或连接。本文中描述的任何应用或模块都可以使用计算机/处理器可读/可执行指令来实现,这些指令可以由这些非瞬时性计算机/处理器可读存储介质存储或以其它方式保存。
缩写词定义
LTE 长期演进(Long Term Evolution)
NR 新空口(New Radio)
BWP 带宽部分(Bandwidth part)
BS 基站(Base Station)
CA 载波聚合(Carrier Aggregation)
CC 分量载波(Component Carrier)
CG 小区组(Cell Group)
CSI 信道状态信息(Channel state information)
CSI-RS 信道状态信息参考信号(Channel state information
Reference Signal)
DC 双连接(Dual Connectivity)
DCI 下行控制信息(Downlink control information)
DL 下行(Downlink)
DL-SCH 下行共享信道(Downlink shared channel)
EN-DC 存在使用E-UTRA的MCG和使用NE的SCG的E-UTRA NR双连接(E-
UTRA NR dual connectivity with MCG using E-UTRA and
SCG using NR)
gNB 下一代(或5G)基站(Next generation(or 5G)base station)
HARQ-ACK 混合自动重传请求确认(Hybrid automatic repeat request
acknowledgement)
MCG 主小区组(Master cell group)
MCS 调制编码方案(Modulation and coding scheme)
MAC-CE 媒体接入控制层控制单元(Medium Access Control-Control
Element)
PBCH 物理广播信道(Physical broadcast channel)
PCell 主小区(Primary cell)
PDCCH 物理下行控制信道(Physical downlink control channel)
PDSCH 物理下行共享信道(Physical downlink shared channel)
PRACH 物理随机接入信道(Physical Random Access Channel)
PRG 物理资源块组(Physical resource block group)
PSCell 主SCG小区(Primary SCG Cell)
PSS 主同步信号(Primary synchronization signal)
PUCCH 物理上行控制信道(Physical uplink control channel)
PUSCH 物理上行共享信道(Physical uplink shared channel)
RACH 随机接入信道(Random access channel)
RAPID 随机接入前导标识(Random access preamble identity)
RB 资源块(Resource block)
RE 资源单元(Resource element)
RRM 无线资源管理(Radio resource management)
RMSI 剩余系统信息(Remaining systeminformation)
RS 参考信号(Reference signal)
RSRP 参考信号接收功率(Reference signal received power)
RRC 无线资源控制(Radio Resource Control)
SCG 辅小区组(Secondary cell group)
SFN 系统帧号(System frame number)
SL 侧行链路(Sidelink)
SCell 辅小区(Secondary Cell)
SPS 半静态调度(Semi-persistent scheduling)
SR 调度请求(Scheduling request)
SRI SRS资源指示(SRS resource indicator)
SRS 探测参考信号(Sounding reference signal)
SSS 辅同步信号(Secondary synchronization signal)
SSB 同步信号块(Synchronization Signal Block)
SUL 补充上行(Supplement Uplink)
TA 定时提前(Timing advance)
TAG 定时提前组(Timing advance group)
TUE 目标UE(Target UE)
UCI 上行控制信息(Uplink control information)
UE 用户设备(User Equipment)
UL 上行(Uplink)
UL-SCH 上行共享信道(Uplink shared channel)

Claims (39)

1.一种用于在无线通信网络中传输用于人工智能或机器学习(artificialintelligence/machine learning,AI/ML)模型训练的数据或控制信息的方法,其特征在于,所述方法包括:
在所述无线通信网络中的第一设备处:
根据第一通信模式与所述无线通信网络中的第二设备传输数据或控制信息,其中,所述第一通信模式是至少包括所述第一通信模式和第二通信模式的多种通信模式中的一种通信模式,所述第二通信模式在以下至少一个方面与所述第一通信模式不同:
量化级别,用于量化所述数据或控制信息中的变量的值;
混合自动重传请求(Hybrid Automatic Repeat reQuest,HARQ)反馈和重传模式,用于选择性重传所述数据或控制信息的一个或多个部分。
2.根据权利要求1所述的方法,其特征在于,与所述第二设备传输的所述数据或控制信息的传输通过下行控制信息(downlink control information,DCI)进行调度,所述DCI的循环冗余校验(cyclic redundancy check,CRC)值通过第一无线网络临时标识(radionetwork temporary identifier,RNTI)进行加扰,所述第一RNTI与小区RNTI(Cell RNTI,C-RNTI)不同。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据与所述第二设备传输的所述数据或控制信息,在所述第一设备处训练AI/ML模型。
4.根据权利要求1至3中任一项所述的方法,其特征在于,
在所述第一通信模式下使用第一HARQ反馈和重传模式,其中,在所述第一HARQ反馈和重传模式下,所述第一设备和所述第二设备之间不存在HARQ反馈过程且不存在所述数据或控制信息的重传;
在所述第二通信模式下使用第二HARQ反馈和重传模式,其中,在所述第二HARQ反馈和重传模式下,存在HARQ反馈过程以请求重传所述数据或控制信息的一个或多个部分。
5.根据权利要求1至3中任一项所述的方法,其特征在于,
在所述第一通信模式下使用第一HARQ反馈和重传模式,其中,所述第一HARQ反馈和重传模式支持N1次重传,N1为整数,N1≥1;
在所述第二通信模式下使用第二HARQ反馈和重传模式,其中,所述第二HARQ反馈和重传模式最多支持N2次重传,N2为整数,N2>N1。
6.根据权利要求4或5所述的方法,其特征在于,
在所述第一通信模式下,第一量化级别用于量化所述数据或控制信息中的变量的值;
在所述第二通信模式下,高于所述第一量化级别的第二量化级别用于量化所述数据或控制信息中的变量的值。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在数据或控制信息通信过程的初始部分中默认使用所述第一通信模式。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:
从根据所述第一通信模式与所述第二设备传输数据或控制信息切换到根据所述第二通信模式与所述第二设备传输数据或控制信息。
9.根据权利要求8所述的方法,其特征在于,所述切换包括在经过预定或预配置的AI/ML模型训练时间之后或在经过多次AI/ML模型训练迭代之后切换。
10.根据权利要求8所述的方法,其特征在于,所述切换包括:
从所述第一设备向所述第二设备发送控制信令,其中,所述控制信令包括切换指令;
在发送所述控制信令之后,从所述第一通信模式切换到所述第二通信模式。
11.根据权利要求8至10中任一项所述的方法,其特征在于,在切换到所述第二通信模式之后,所述方法还包括:
在所述第一设备处从所述第二设备接收HARQ反馈信息,其中,所述HARQ反馈信息标识所述第二设备未成功接收到的数据的一个或多个部分;
从所述第一设备发送HARQ进程信息,其中,所述HARQ进程信息标识所述第一设备不会重传的所述数据的所述一个或多个未成功接收到的部分中的至少一个部分。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
重传所述一个或多个未成功接收到的部分的部分子集,其中,所述部分子集不包括所述HARQ进程信息中标识的所述至少一个未成功接收到的部分。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
对于所述第二设备未成功接收到的所述数据的每个部分,在所述第一设备处从所述第二设备接收与所述未成功接收到的部分对应的重要性指示信息,其中,与所述未成功接收到的部分对应的所述重要性指示信息指示所述未成功接收到的部分对于所述第二设备处的AI/ML模型训练是否重要;
所述重传所述一个或多个未成功接收到的部分的部分子集包括根据来自所述第二设备的所述重要性指示信息,选择性地重传所述一个或多个未成功接收到的部分的所述部分子集。
14.根据权利要求1至13中任一项所述的方法,其特征在于,所述方法还包括:
从所述第一设备向所述第二设备发送控制信令,其中,所述控制信令包括停止训练指令,以配置所述第二设备停止训练所述第二设备处的AI/ML模型。
15.根据权利要求10或14所述的方法,其特征在于,所述控制信令包括下行控制信息(downlink control information,DCI)消息。
16.根据权利要求8所述的方法,其特征在于,所述切换包括:
在所述第一设备处从所述第二设备接收控制信令,其中,所述控制信令包括切换指令;
在接收到所述控制信令之后,从所述第一通信模式切换到所述第二通信模式。
17.根据权利要求16所述的方法,其特征在于,所述方法还包括:
在所述第一设备处从所述第二设备接收控制信令,其中,所述控制信令包括停止训练指令;
在接收到所述控制信令之后,停止向所述第二设备发送用于AI/ML模型训练的数据或控制信息。
18.根据权利要求3所述的方法,其特征在于,所述方法还包括:
从所述第一设备向所述第二设备发送协助信息,其中,所述协助信息包括所述第一设备的训练停止请求,以停止训练所述第一设备处的所述AI/ML模型。
19.根据权利要求8所述的方法,其特征在于,在切换到所述第二通信模式之后,所述方法还包括:
对于所述第一设备未成功接收到的数据,从所述第一设备向所述第二设备发送以下信息:
HARQ反馈信息,以向所述第二设备通知所述第一设备未成功接收到所述数据;
与所述未成功接收到的数据对应的重要性指示信息,其中,与所述未成功接收到的数据对应的所述重要性指示信息指示所述未成功接收到的数据对于所述第一设备处的AI/ML模型训练是否重要。
20.一种设备,其特征在于,所述设备包括:
处理器;
存储处理器可执行指令的存储器,其中,所述处理器可执行指令在被执行时使得所述处理器执行以下操作:
根据第一通信模式与无线通信网络中的其它设备传输数据或控制信息,其中,所述第一通信模式是至少包括所述第一通信模式和第二通信模式的多种通信模式中的一种通信模式,所述第二通信模式在以下至少一个方面与所述第一通信模式不同:
量化级别,用于量化所述数据或控制信息中的变量的值;
混合自动重传请求(Hybrid Automatic Repeat reQuest,HARQ)反馈和重传模式,用于选择性重传所述数据或控制信息的一个或多个部分。
21.根据权利要求20所述的设备,其特征在于,与所述其它设备传输的所述数据或控制信息的传输通过下行控制信息(downlink control information,DCI)进行调度,所述DCI的循环冗余校验(cyclic redundancy check,CRC)值通过第一无线网络临时标识(radionetwork temporary identifier,RNTI)进行加扰,所述第一RNTI与小区RNTI(Cell RNTI,C-RNTI)不同。
22.根据权利要求20或21所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
根据与所述其它设备传输的所述数据或控制信息,在所述设备处训练AI/ML模型。
23.根据权利要求20至22中任一项所述的设备,其特征在于,
在所述第一通信模式下使用第一HARQ反馈和重传模式,其中,在所述第一HARQ反馈和重传模式下,所述设备和所述其它设备之间不存在HARQ反馈过程且不存在所述数据或控制信息的重传;
在所述第二通信模式下使用第二HARQ反馈和重传模式,其中,在所述第二HARQ反馈和重传模式下,存在HARQ反馈过程以请求重传所述数据或控制信息的一个或多个部分。
24.根据权利要求20至22中任一项所述的设备,其特征在于,
在所述第一通信模式下使用第一HARQ反馈和重传模式,其中,所述第一HARQ反馈和重传模式支持N1次重传,N1为整数,N1≥1;
在所述第二通信模式下使用第二HARQ反馈和重传模式,其中,所述第二HARQ反馈和重传模式最多支持N2次重传,N2为整数,N2>N1。
25.根据权利要求23或24所述的设备,其特征在于,
在所述第一通信模式下,第一量化级别用于量化所述数据或控制信息中的变量的值;
在所述第二通信模式下,高于所述第一量化级别的第二量化级别用于量化所述数据或控制信息中的变量的值。
26.根据权利要求20至25中任一项所述的设备,其特征在于,在数据或控制信息通信过程的初始部分中默认使用所述第一通信模式。
27.根据权利要求20至26中任一项所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
从根据所述第一通信模式与所述其它设备传输数据或控制信息切换到根据所述第二通信模式与所述其它设备传输数据或控制信息。
28.根据权利要求27所述的设备,其特征在于,所述切换包括在经过预定或预配置的AI/ML模型训练时间之后或在经过多次AI/ML模型训练迭代之后切换。
29.根据权利要求27所述的设备,其特征在于,在被执行时使所述处理器从所述第一通信模式切换到所述第二通信模式的所述处理器可执行指令包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
从所述设备向所述其它设备发送控制信令,其中,所述控制信令包括切换指令;
在发送所述控制信令之后,从所述第一通信模式切换到所述第二通信模式。
30.根据权利要求27至29中任一项所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
在切换到所述第二通信模式之后并且响应于从所述其它设备接收HARQ反馈信息,从所述设备发送HARQ进程信息,其中,所述HARQ反馈信息标识所述其它设备未成功接收到的数据的一个或多个部分的,所述HARQ进程信息标识所述设备不会重传的所述数据的所述一个或多个未成功接收到的部分中的至少一个部分。
31.根据权利要求30所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
重传所述一个或多个未成功接收到的部分的部分子集,其中,所述部分子集不包括所述HARQ进程信息中标识的所述至少一个未成功接收到的部分。
32.根据权利要求31所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
对于所述其它设备未成功接收到的所述数据的每个部分,在所述设备处从所述其它设备接收与所述未成功接收到的部分对应的重要性指示信息,其中,与所述未成功接收到的部分对应的所述重要性指示信息指示所述未成功接收到的部分对于所述其它设备处的AI/ML模型训练是否重要;
所述重传所述一个或多个未成功接收到的部分的部分子集包括根据来自所述其它设备的所述重要性指示信息,选择性地重传所述一个或多个未成功接收到的部分的所述部分子集。
33.根据权利要求20至32中任一项所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
从所述设备向所述其它设备发送控制信令,其中,所述控制信令包括停止训练指令,以配置所述其它设备停止训练所述其它设备处的AI/ML模型。
34.根据权利要求29或33所述的设备,其特征在于,所述控制信令包括下行控制信息(downlink control information,DCI)消息。
35.根据权利要求27所述的设备,其特征在于,在被执行时使所述处理器从所述第一通信模式切换到所述第二通信模式的所述处理器可执行指令包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
在从所述其它设备接收到包括切换指令的控制信令之后,从所述第一通信模式切换到所述第二通信模式。
36.根据权利要求35所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
在从所述其它设备接收包括停止训练指令的控制信令之后,停止向所述其它设备发送用于AI/ML模型训练的数据或控制信息。
37.根据权利要求22所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
向所述其它设备发送协助信息,其中,所述协助信息包括所述设备的训练停止请求,以停止训练所述设备处的所述AI/ML模型。
38.根据权利要求27所述的设备,其特征在于,所述处理器可执行指令还包括在被执行时使得所述处理器执行以下操作的处理器可执行指令:
在切换到所述第二通信模式之后,对于所述设备未成功接收到的数据,从所述设备向所述其它设备发送以下信息:
HARQ反馈信息,以向所述其它设备通知所述设备未成功接收到所述数据;
与所述未成功接收到的数据对应的重要性指示信息,其中,与所述未成功接收到的数据对应的所述重要性指示信息指示所述未成功接收到的数据对于所述设备处的AI/ML模型训练是否重要。
39.一种装置,其特征在于,所述装置包括一个或多个单元,所述一个或多个单元用于执行根据权利要求1至19中任一项所述的方法。
CN202280088838.3A 2022-01-27 2022-01-27 用于人工智能训练的可靠性自适应的装置和方法 Pending CN118556417A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/074159 WO2023141847A1 (en) 2022-01-27 2022-01-27 Apparatus and methods for reliability adaptation for artificial intelligence training

Publications (1)

Publication Number Publication Date
CN118556417A true CN118556417A (zh) 2024-08-27

Family

ID=87470116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280088838.3A Pending CN118556417A (zh) 2022-01-27 2022-01-27 用于人工智能训练的可靠性自适应的装置和方法

Country Status (2)

Country Link
CN (1) CN118556417A (zh)
WO (1) WO2023141847A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113767662B (zh) * 2019-08-30 2024-06-07 Oppo广东移动通信有限公司 无线信号的类型确定方法、装置及系统
US11937129B2 (en) * 2020-04-08 2024-03-19 Qualcomm Incorporated Out-of-order handling without flow control feedback
CN113114335B (zh) * 2021-03-18 2021-11-19 中国电子科技集团公司第五十四研究所 一种基于人工智能的软件定义天基网络组网架构

Also Published As

Publication number Publication date
WO2023141847A1 (en) 2023-08-03

Similar Documents

Publication Publication Date Title
US11044735B2 (en) Methods and apparatus for supporting frequency division multiplexing of multiple waveforms
CN110521175B (zh) 支持多种波形的同步信令设计方法和装置
CN113767698A (zh) 省电模式下物理下行链路控制信道(pdcch)分配的确定
KR20190133284A (ko) 정보 타입 멀티플렉싱 및 전력 제어
CN110476394B (zh) 针对具有修改的循环前缀的参考信号和数据的虚拟时域复用的方法和装置
US11805518B2 (en) Method and device for determination of scheduling timing in communications system
CN115516965A (zh) 用于动态波束指示机制的方法和装置
WO2018103288A1 (en) Efficient control channel design using polar codes
CN115150023A (zh) 蜂窝通信系统中的上行链路传输方法和装置
WO2012118347A2 (ko) 무선 통신 시스템에서 제어 정보의 전송 방법 및 장치
US20220116967A1 (en) Method and apparatus for transmission and reception using narrowband in communications system
CN115462156A (zh) 无线通信系统中动态下行链路多波束操作的方法和装置
BR112020011219A2 (pt) determinação de versão de redundância com base em tempo para sinalização livre de concessão
US11576197B2 (en) Facilitating improved performance of multiple downlink control channels in advanced networks
US20230422271A1 (en) Apparatus and method for communicating two stage dci
KR20220009777A (ko) 통신 시스템에서 타이밍 어드밴스 지시 방법 및 장치
JP2023537347A (ja) 制御情報送受信のための装置及び方法
KR20190127193A (ko) 무선통신 시스템에서 그룹캐스트를 위한 동기화 방법 및 장치
KR20210133789A (ko) 통신 시스템에서 시간 및 주파수 오프셋 지시 방법 및 장치
US20240106508A1 (en) Artificial intelligence-enabled link adaptation
CN117280854A (zh) 一种用于灵活射频链配置的无线装置和通信方法
WO2023197300A1 (en) Apparatus and methods for multi-stage machine learning with cascaded models
US11627590B2 (en) Scheduling network resources in wireless communication devices
WO2023141847A1 (en) Apparatus and methods for reliability adaptation for artificial intelligence training
WO2024119350A1 (en) Methods and apparatuses for transmitting neural network parameters for artificial intelligence or machine learning model training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination