CN115842835A - 一种通信方法及装置 - Google Patents

一种通信方法及装置 Download PDF

Info

Publication number
CN115842835A
CN115842835A CN202111064144.XA CN202111064144A CN115842835A CN 115842835 A CN115842835 A CN 115842835A CN 202111064144 A CN202111064144 A CN 202111064144A CN 115842835 A CN115842835 A CN 115842835A
Authority
CN
China
Prior art keywords
submodel
model
output
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111064144.XA
Other languages
English (en)
Inventor
柴晓萌
吴艺群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202111064144.XA priority Critical patent/CN115842835A/zh
Priority to EP22866784.6A priority patent/EP4391474A1/en
Priority to PCT/CN2022/118269 priority patent/WO2023036323A1/zh
Publication of CN115842835A publication Critical patent/CN115842835A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)

Abstract

本公开提供一种通信方法及装置,用于解决模型传输开销大的问题。该方法包括:第一网元(如接入网设备/终端设备)确定第一子模型和第二子模型,第一子模型和第二子模型能够匹配使用;第一网元向第二网元(如终端设备/接入网设备)发送第一信息,第一信息用于指示第一子模型的输入数据和/或第一子模型的输出数据。第二网元可以根据第一信息训练第三子模型。第三子模型的功能和第一子模型的功能相同。

Description

一种通信方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种通信方法及装置。
背景技术
在无线通信网络中,例如在移动通信网络中,网络支持的业务越来越多样,因此需要满足的需求越来越多样。例如,网络需要能够支持超高速率、超低时延、和/或超大连接。该特点使得网络规划、网络配置、和/或资源调度越来越复杂。此外,由于网络的功能越来越强大,例如支持的频谱越来越高、支持高阶多入多出(multiple input multiple output,MIMO)技术、支持波束赋形、和/或支持波束管理等新技术,使得网络节能成为了热门研究课题。这些新需求、新场景和新特性给网络规划、运维和高效运营带来了前所未有的挑战。为了迎接该挑战,可以将人工智能技术引入无线通信网络中,从而实现网络智能化。基于此,如何在网络中有效地实现人工智能是一个值得研究的问题。
发明内容
本公开提供一种通信方法及装置,用于减少传输开销,提升通信安全。
第一方面,本公开提供一种通信方法,包括:确定第一子模型和第二子模型,所述第一子模型和所述第二子模型能够匹配使用;发送第一信息,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。
上述设计中,提供能够匹配使用的多个子模型中一个子模型的输入数据和/或输出数据,可以用于独立训练与该子模型功能相同的子模型,无需在空口传输子模型,能够减少传输开销,提升通信安全。
在一种可能的设计中,所述第一子模型的输出用于确定所述第二子模型的输入;或者,所述第二子模型的输出用于确定所述第一子模型的输入。这样的设计能够实现多个子模型之间的匹配使用。
在一种可能的设计中,所述第一子模型用于在发送端发送信息,所述第二子模型在接收端用于接收所述信息;或者,所述第二子模型用于在发送端发送信息,所述第一子模型用于在接收端接收所述信息。这样的设计可以用于诸如利用模型压缩/调制信息的场景,能够减少信息传输的开销。
在一种可能的设计中,所述第一子模型和所述第二子模型属于一个双边模型。这样的设计适用于需要部署双边模型的场景,可以减少发送双边模型中子模型的开销,避免双边模型算法泄露,提升通信安全。
在一种可能的设计中,所述第一信息用于第三子模型的训练;其中,所述第三子模型的功能与所述第一子模型的功能相同;和/或,所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;和/或,所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;和/或,所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。通过这样的设计,实现独立训练替代第一子模型的第三子模型,使得第三子模型能够与第二子模型匹配使用,能够减少发送第一子模型的传输开销。且,第三子模型与所述第二子模型也能够组成一个新的双边模型。
在一种可能的设计中,所述确定第一子模型和第二子模型,包括:根据训练数据,确定所述第一子模型和所述第二子模型;其中,所述训练数据包括N个信道信息,N为正整数,所述信道信息包括下行信道特征或者下行信道。通过这样的设计,能够实现利用匹配使用的子模型进行信道信息的反馈,减少反馈开销。
在一种可能的设计中,所述第一子模型的输入数据包括M个信道信息,M为正整数。
在一种可能的设计中,所述第一子模型的输出数据包括与M个信道信息对应的特征比特,M为正整数。
在一种可能的设计中,所述方法还包括:获取用于指示第一特征比特的信息,所述第三子模型的输出包括所述第一特征比特;根据所述第二子模型和所述第一特征比特,得到第一信道信息;其中,所述第二子模型的输入包括所述第一特征比特,所述第二子模型的输出包括所述第一信道信息。
在上述设计中,发送端利用根据第一子模型的输入输出独自训练的第三子模型发送特征比特,接收端侧可以利用与第一子模型匹配的第二子模型恢复出信道信息。无需在空口中传输子模型,能够减少传输开销,且提升通信安全。
在一种可能的设计中,所述第一子模型的输入数据包括M个特征比特,M为正整数。
在一种可能的设计中,所述第一子模型的输出数据包括与M个特征比特对应的信道信息,M为正整数。
在一种可能的设计中,所述方法还包括:根据第二信道信息和所述第二子模型,确定第二特征比特;其中,所述第二子模型的输入包括所述第二信道信息,所述第二子模型的输出包括所述第二特征比特;发送用于指示所述第二特征比特的信息。
在上述设计中,发送端侧利用与第一子模型匹配的第二子模型发送特征比特,接收端可以利用根据第一子模型的输入输出独自训练的第三子模型恢复出信道信息。无需在空口中传输子模型,能够减少传输开销,且提升通信安全。
第二方面,本公开提供一种通信方法,包括:获取第一信息,所述第一信息用于指示第一子模型的输入数据和/或者所述第一子模型的输出数据;根据所述第一信息训练第三子模型。
关于第一子模型、第三子模型等的介绍请参见第一方面,此处不再赘述。
在一种可能的设计中,所述方法还包括:根据第三信道信息和所述第三子模型,确定第一特征比特;其中,所述第三子模型的输入包括所述第三信道信息,所述第三子模型的输出包括所述第一特征比特;发送用于指示所述第一特征比特的信息。
在一种可能的设计中,所述方法还包括:获取用于指示第二特征比特的信息;根据所述第三子模型和所述第二特征比特,得到第四信道信息;其中,所述第三子模型的输入包括所述第二特征比特,所述第三子模型的输出包括所述第四信道信息。
第三方面,本公开提供一种通信装置,该通信装置可以是第一网元,也可以是第一网元中的装置,或者是能够和第一网元匹配使用的装置。其中,第一网元可以为接入网设备或者终端设备。一种设计中,该通信装置可以包括执行第一方面中所描述的方法/操作/步骤/动作所一一对应的模块,该模块可以是硬件电路,也可是软件,也可以是硬件电路结合软件实现。
一种设计中,该通信装置可以包括处理模块和通信模块。
处理模块,用于确定第一子模型和第二子模型,所述第一子模型和所述第二子模型能够匹配使用。
通信模块,用于发送第一信息,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。
关于第一子模型、第二子模型等的介绍请参见第一方面,此处不再赘述。
在一种可能的设计中,所述通信模块,还用于获取用于指示第一特征比特的信息,所述第三子模型的输出包括所述第一特征比特;所述处理模块,还用于根据所述第二子模型和所述第一特征比特,得到第一信道信息;其中,所述第二子模型的输入包括所述第一特征比特,所述第二子模型的输出包括所述第一信道信息。
在一种可能的设计中,所述处理模块,还用于根据第二信道信息和所述第二子模型,确定第二特征比特;其中,所述第二子模型的输入包括所述第二信道信息,所述第二子模型的输出包括所述第二特征比特;所述通信模块,还用于发送用于指示所述第二特征比特的信息。
第四方面,本公开提供一种通信装置,该通信装置可以是第二网元,也可以是第二网元中的装置,或者是能够和第二网元匹配使用的装置。其中,第二网元可以为接入网设备或者终端设备。一种设计中,该通信装置可以包括执行第二方面中所描述的方法/操作/步骤/动作所一一对应的模块,该模块可以是硬件电路,也可是软件,也可以是硬件电路结合软件实现。一种设计中,该通信装置可以包括处理模块和通信模块。
通信模块,用于获取第一信息,所述第一信息用于指示第一子模型的输入数据和/或者所述第一子模型的输出数据。
处理模块,用于根据所述第一信息训练第三子模型。
关于第一子模型、第三子模型等的介绍请参见第二方面,此处不再赘述。
在一种可能的设计中,所述处理模块,还用于根据第三信道信息和所述第三子模型,确定第一特征比特;其中,所述第三子模型的输入包括所述第三信道信息,所述第三子模型的输出包括所述第一特征比特。所述通信模块,还用于发送用于指示所述第一特征比特的信息。
在一种可能的设计中,所述通信模块,还用于获取用于指示第二特征比特的信息;所述处理模块,还用于根据所述第三子模型和所述第二特征比特,得到第四信道信息;其中,所述第三子模型的输入包括所述第二特征比特,所述第三子模型的输出包括所述第四信道信息。
第五方面,本公开提供一种通信装置,所述通信装置包括处理器,用于实现上述第一方面所描述的方法。所述通信装置还可以包括存储器,用于存储指令和数据。所述存储器与所述处理器耦合,所述处理器执行所述存储器中存储的指令时,可以实现上述第一方面描述的方法。所述通信装置还可以包括通信接口,所述通信接口用于该装置与其它设备进行通信,示例性的,通信接口可以是收发器、电路、总线、模块或其它类型的通信接口,其它设备可以为接入网设备。在一种可能的设备中,该通信装置包括:
存储器,用于存储程序指令;
处理器,用于确定第一子模型和第二子模型,所述第一子模型和所述第二子模型能够匹配使用。
处理器,还用于利用通信接口发送第一信息,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。
第六方面,本公开提供一种通信装置,所述通信装置包括处理器,用于实现上述第二方面所描述的方法。所述通信装置还可以包括存储器,用于存储指令和数据。所述存储器与所述处理器耦合,所述处理器执行所述存储器中存储的指令时,可以实现上述第二方面描述的方法。所述装置还可以包括通信接口,所述通信接口用于该装置与其它设备进行通信,示例性的,通信接口可以是收发器、电路、总线、模块或其它类型的通信接口,其它设备可以为终端设备。在一种可能的设备中,该装置包括:
存储器,用于存储程序指令;
处理器,用于利用通信接口,获取第一信息,所述第一信息用于指示第一子模型的输入数据和/或者所述第一子模型的输出数据。
处理器,还用于根据所述第一信息训练第三子模型。
第七方面,本公开提供了一种通信系统,包括如第三方面或第五方面所描述的通信装置,以及如第四方面或第六方面所描述的通信装置。
第八方面,本公开还提供了一种计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述第一方面或第二方面中任一方面提供的方法。
第九方面,本公开还提供了一种计算机程序产品,包括指令,当所述指令在计算机上运行时,使得计算机执行上述第一方面或第二方面中任一方面提供的方法。
第十方面,本公开还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或者指令在计算机上运行时,使得所述计算机执行上述第一方面或第二方面中提供的方法。
第十一方面,本公开还提供了一种芯片,所述芯片用于读取存储器中存储的计算机程序,执行上述第一方面或第二方面中提供的方法。
第十二方面,本公开还提供了一种芯片系统,该芯片系统包括处理器,用于支持计算机装置实现上述第一方面或第二方面中提供的方法。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器用于保存该计算机装置必要的程序和数据。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
附图说明
图1A为一种通信系统的结构示意图;
图1B为另一种通信系统的结构示意图;
图2A为神经元结构的一种示意图;
图2B为神经网络的层关系的一种示意图;
图3为一种相关技术中双边模型的部署流程示意图;
图4A为AI的一种应用框架的示意图;
图4B~图4E为几种网络架构的示意图;
图5A为本公开提供的通信方法的流程示意图之一;
图5B为本公开提供的双边模型的部署流程示意图之一;
图6A为本公开提供的通信方法的流程示意图之一;
图6B为本公开提供的双边模型的部署流程示意图之一;
图7A为本公开例提供的通信方法的流程示意图之一;
图7B为本公开提供的双边模型的部署流程示意图之一;
图8为本公开提供的通信方法的流程示意图之一;
图9为本公开提供的通信装置的结构示意图之一;
图10为本公开提供的通信装置的结构示意图之一。
具体实施方式
为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述。
本公开如下涉及的至少一个,指示一个或多个。多个,是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,应当理解,尽管在本公开中可能采用术语第一、第二等来描述各对象、但这些对象不应限于这些术语。这些术语仅用来将各对象彼此区分开。
本公开如下描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,本公开中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开中被描述为“示例性的”或者“例如”的任何方法或设计方案不应被解释为比其它方法或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本公开提供的技术可以应用于各种通信系统,例如,该通信系统可以是第三代(3thgeneration,3G)通信系统(例如通用移动通信系统(universal mobiletelecommunication system,UMTS))、第四代(4th generation,4G)通信系统(例如长期演进(long term evolution,LTE)系统)、第五代(5th generation,5G)通信系统、全球互联微波接入(worldwide interoperability for microwave access,WiMAX)或者无线局域网(wireless local area network,WLAN)系统、或者多种系统的融合系统,或者是未来的通信系统,例如6G通信系统等。其中,5G通信系统还可以称为新无线(new radio,NR)系统。
通信系统中的一个网元可以向另一个网元发送信号或从另一个网元接收信号。其中信号可以包括信息、配置信息或者数据等;网元也可以被称为实体、网络实体、设备、通信设备、节点、通信节点等等,本公开中以网元为例进行描述。例如,通信系统可以包括至少一个终端设备和至少一个接入网设备。其中,配置信息的发送网元可以为接入网设备,配置信息的接收网元可以为终端设备。此外可以理解的是,若通信系统中包括多个终端设备,多个终端设备之间也可以互发信号,即配置信息的发送网元和配置信息的接收网元均可以是终端设备。
参见图1A示意一种通信系统100,作为示例,该通信系统100包括接入网设备110以及两个终端设备,即终端设备120和终端设备130。终端设备120和终端设备130中的至少一个可以发送上行数据给接入网设备110,接入网设备110可以接收该上行数据。接入网设备110可以向终端设备120和终端设备130中的至少一个发送下行数据。
下面对图1A所涉及的终端设备和接入网设备进行详细说明。
(1)终端设备
终端设备又称之为终端、用户设备(user equipment,UE)、移动台(mobilestation,MS)、移动终端(mobile terminal,MT)等,是一种向用户提供语音和/或数据连通性的设备。例如,终端设备包括具有无线连接功能的手持式设备、或车载设备等。示例性的,一些终端的举例为:无线网络摄像头、手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备如智能手表、虚拟现实(virtual reality,VR)设备、增强现实(augmented reality,AR)设备、工业控制(industrial control)中的无线终端、车联网系统中的终端、无人驾驶(self driving)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端如智能加油器,高铁上的终端设备以及智慧家庭(smart home)中的无线终端,如智能音响、智能咖啡机、智能打印机等。
本公开中,用于实现终端设备功能的通信装置可以是终端设备,也可以是具有终端部分功能的终端设备,也可以是能够支持终端设备实现该功能的装置,例如芯片系统,该装置可以被安装在终端设备中。本公开中,芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。本公开提供的技术方案中,以用于实现终端设备功能的通信装置是终端设备或UE为例进行描述。
(2)接入网设备
接入网设备可以为基站(base station,BS),接入网设备还可以称为网络设备、接入节点(access node,AN)、无线接入节点(radio access node,RAN)。接入网设备可以为终端设备提供无线接入服务。接入网设备例如包括但不限于以下至少一个:基站、5G中的下一代节点B(generation nodeB,gNB)、开放无线接入网(open radio access network,O-RAN)中的接入网设备、演进型节点B(evolved node B,eNB)、无线网络控制器(radio networkcontroller,RNC)、节点B(node B,NB)、基站控制器(base station controller,BSC)、基站收发台(base transceiver station,BTS)、家庭基站(例如,home evolved nodeB,或homenode B,HNB)、基带单元(base band unit,BBU)、收发点(transmitting and receivingpoint,TRP)、发射点(transmitting point,TP)、和/或移动交换中心等。或者,接入网设备还可以是集中单元(centralized unit,CU)、分布单元(distributed unit,DU)、集中单元控制面(CU control plane,CU-CP)节点、或集中单元用户面(CU user plane,CU-UP)节点。或者,接入网设备可以为中继站、接入点、车载设备、可穿戴设备或者未来演进的公共陆地移动网络(public land mobile network,PLMN)中的接入网设备等。
本公开中,用于实现接入网设备功能的通信装置可以是接入网设备,也可以是具有接入网设备部分功能的网络设备,也可以是能够支持接入网设备实现该功能的装置,例如芯片系统,硬件电路、软件模块、或硬件电路加软件模块,该装置可以被安装在接入网设备中。本公开的方法中,以用于实现接入网设备功能的通信装置是接入网设备为例进行描述。
(3)接入网设备和终端设备之间的协议层结构
接入网设备和终端设备之间的通信遵循一定的协议层结构。该协议层结构可以包括控制面协议层结构和用户面协议层结构。例如,控制面协议层结构可以包括无线资源控制(radio resource control,RRC)层、分组数据汇聚层协议(packet data convergenceprotocol,PDCP)层、无线链路控制(radio link control,RLC)层、媒体接入控制(mediaaccess control,MAC)层和物理层等协议层的功能。例如,用户面协议层结构可以包括PDCP层、RLC层、MAC层和物理层等协议层的功能,在一种可能的实现中,PDCP层之上还可以包括业务数据适配协议(service data adaptation protocol,SDAP)层。
以接入网设备和终端设备之间的数据传输为例,数据传输需要经过用户面协议层,比如经过SDAP层、PDCP层、RLC层、MAC层、物理层。其中,SDAP层、PDCP层、RLC层、MAC层和物理层也可以统称为接入层。根据数据的传输方向分为发送或接收,上述每层又分为发送部分和接收部分。以下行数据传输为例,PDCP层自上层取得数据后,将数据传送到RLC层与MAC层,再由MAC层生成传输块,然后通过物理层进行无线传输。数据在各个层中进行相对应的封装。例如,某一层从该层的上层收到的数据视为该层的服务数据单元(service dataunit,SDU),经过该层封装后成为协议数据单元(protocol data unit,PDU),再传递给下一个层。
示例性的,终端设备还可以具有应用层和非接入层。其中,应用层可以用于向终端设备中所安装的应用程序提供服务,比如,终端设备接收到的下行数据可以由物理层依次传输到应用层,进而由应用层提供给应用程序;又比如,应用层可以获取应用程序产生的数据,并将数据依次传输到物理层,发送给其它通信装置。非接入层可以用于转发用户数据,比如将从应用层接收到的上行数据转发给SDAP层或者将从SDAP层接收到的下行数据转发给应用层。
(4)接入网设备的结构
接入网设备可以包括集中式单元(central unit,CU)和分布式单元(distributedunit,DU)。多个DU可以由一个CU集中控制。作为示例,CU和DU之间的接口可以称为F1接口。其中,控制面(control panel,CP)接口可以为F1-C,用户面(user panel,UP)接口可以为F1-U。CU和DU可以根据无线网络的协议层划分:比如,PDCP层及以上协议层的功能设置在CU,PDCP层以下协议层(例如RLC层和MAC层等)的功能设置在DU;又比如,PDCP层以上协议层的功能设置在CU,PDCP层及以下协议层的功能设置在DU。
可以理解的是,上述对CU和DU的处理功能按照协议层的划分仅仅是一种举例,也可以按照其他的方式进行划分,例如可以将CU或者DU划分为具有更多协议层的功能,又例如将CU或DU还可以划分为具有协议层的部分处理功能。在一种设计中,将RLC层的部分功能和RLC层以上的协议层的功能设置在CU,将RLC层的剩余功能和RLC层以下的协议层的功能设置在DU。在另一种设计中,还可以按照业务类型或者其他系统需求对CU或者DU的功能进行划分,例如按时延划分,将处理时间需要满足时延要求的功能设置在DU,不需要满足该时延要求的功能设置在CU。在另一种设计中,CU也可以具有核心网的一个或多个功能。示例性的,CU可以设置在网络侧方便集中管理。在另一种设计中,将DU的无线单元(radio unit,RU)拉远设置。其中,RU具有射频功能。
可选的,DU和RU可以在物理层(physical layer,PHY)进行划分。例如,DU可以实现PHY层中的高层功能,RU可以实现PHY层中的低层功能。其中,用于发送时,PHY层的功能可以包括添加循环冗余校验(cyclic redundancy check,CRC)码、信道编码、速率匹配、加扰、调制、层映射、预编码、资源映射、物理天线映射、和/或射频发送功能。用于接收时,PHY层的功能可以包括CRC、信道解码、解速率匹配、解扰、解调、解层映射、信道检测、资源解映射、物理天线解映射、和/或射频接收功能。其中,PHY层中的高层功能可以包括PHY层的一部分功能,例如该部分功能更加靠近MAC层,PHY层中的低层功能可以包括PHY层的另一部分功能,例如该部分功能更加靠近射频功能。例如,PHY层中的高层功能可以包括添加CRC码、信道编码、速率匹配、加扰、调制、和层映射,PHY层中的低层功能可以包括预编码、资源映射、物理天线映射、和射频发送功能;或者,PHY层中的高层功能可以包括添加CRC码、信道编码、速率匹配、加扰、调制、层映射和预编码,PHY层中的低层功能可以包括资源映射、物理天线映射、和射频发送功能。
示例性的,CU的功能可以由一个实体来实现,或者也可以由不同的实体来实现。例如,可以对CU的功能进行进一步划分,即将控制面和用户面分离并通过不同实体来实现,分别为控制面CU实体(即CU-CP实体)和用户面CU实体(即CU-UP实体)。该CU-CP实体和CU-UP实体可以与DU相耦合,共同完成接入网设备的功能。
上述架构中,CU产生的信令可以通过DU发送给终端设备,或者终端设备产生的信令可以通过DU发送给CU。例如,RRC或PDCP层的信令最终会处理为物理层的信令发送给终端设备,或者,由接收到的物理层的信令转变而来。在这种架构下,该RRC或PDCP层的信令,即可以认为是通过DU发送的,或者,通过DU和RU发送的。
可选的,上述DU、CU、CU-CP、CU-UP和RU中的任一个可以是软件模块、硬件结构、或者软件模块+硬件结构,不予限制。其中,不同实体的存在形式可以是不同的,不予限制。例如DU、CU、CU-CP、CU-UP是软件模块,RU是硬件结构。这些模块及其执行的方法也在本公开的保护范围内。
应理解,图1A所示的通信系统中各个设备的数量、类型仅作为示意,本公开并不限于此,实际应用中在通信系统中还可以包括更多的终端设备、更多的接入网设备,还可以包括其它设备,例如可以包括核心网设备,和/或用于实现人工智能功能的网元。
本公开提供的方法可以用于接入网设备和终端设备之间的通信,也可以用于其他通信设备之间的通信,例如无线回传链路中宏基站和微基站之间的通信,又如边链路(sidelink,SL)中两个终端设备之间的通信等,不予限制。本公开以接入网设备和终端设备之间的通信为例进行描述。
本公开提供的方法涉及到人工智能(artificial Intelligence,AI)。AI可以通过各种可能的技术实现,例如通过机器学习技术实现。在本公开中,可以在通信系统中已有网元内配置AI功能(如AI模块或者AI实体)来实现AI相关的操作。例如在5G新无线(newradio,NR)系统中,该已有网元可以是接入网设备(如gNB)、终端设备、核心网设备、或网管(operation,administration and maintenance,OAM)等。例如在图1A示意的通信系统中,可以在接入网设备110、终端设备120、终端设备130中的至少一个网元中配置AI功能。或者,在本公开中,也可以在通信系统中引入独立的网元来执行AI相关的操作。该独立的网元可以称为AI网元或者AI节点等,本公开对此名称不进行限制。在这种情况下,执行AI相关的操作的网元为内置AI功能(如AI模块或者AI实体)的网元。AI相关的操作还可以称为AI功能。AI功能的具体介绍请参见下文。AI网元可以和通信系统中的接入网设备之间直接连接,也可以通过第三方网元和接入网设备实现间接连接。其中,第三方网元可以是认证管理功能(authentication management function,AMF)网元、用户面功能(user plane function,UPF)网元等核心网网元。示例性的,参见图1B,在上述图1A所示的通信系统中引入了AI网元140。本公开以AI功能内置在已有的网元内部为例进行说明。
为了便于理解,下面结合A1~A3,对本公开涉及的AI的部分用语进行介绍。可以理解的是,该介绍并不作为对本公开的限定。
A1,AI模型
AI模型是AI功能的具体实现,AI模型表征了模型的输入和输出之间的映射关系。AI模型可以是神经网络或者其他机器学习模型。本公开中,AI功能可以包括以下至少一项:数据收集(收集训练数据和/或推理数据)、模型学习、模型信息发布(配置模型信息)、推理、或推理结果发布。本公开中,可以将AI模型简称为模型。另外,模型学习也可理解为模型训练。
A2,神经网络
神经网络是机器学习技术和AI模型的一种具体实现形式。根据通用近似定理,神经网络在理论上可以逼近任意连续函数,从而使得神经网络具备学习任意映射的能力。传统的通信系统需要借助丰富的专家知识来设计通信模块,而基于神经网络的深度学习通信系统可以从大量的数据集中自动发现隐含的模式结构,建立数据之间的映射关系,获得优于传统建模方法的性能。
神经网络的思想来源于大脑组织的神经元结构。例如,每个神经元都对其输入值进行加权求和运算,通过一个激活函数输出运算结果。如图2A所示,为神经元结构的一种示意图。假设神经元的输入为x=[x0,x1,…,xn],与各个输入对应的权值分别为w=[w,w1,…,wn],其中,wi作为xi的权值,用于对xi进行加权。根据权值对输入值进行加权求和的偏置例如为b。激活函数的形式可以有多种,假设一个神经元的激活函数为:y=f(z)=max(0,z),则该神经元的输出为:
Figure BDA0003257687060000091
Figure BDA0003257687060000092
再例如,一个神经元的激活函数为:y=f(z)=z,则该神经元的输出为:/>
Figure BDA0003257687060000093
Figure BDA0003257687060000094
其中,b可以是小数、整数(例如0、正整数或负整数)、或复数等各种可能的取值。神经网络中不同神经元的激活函数可以相同或不同。
神经网络一般包括多个层,每层可包括一个或多个神经元。通过增加神经网络的深度和/或宽度,能够提高该神经网络的表达能力,为复杂系统提供更强大的信息提取和抽象建模能力。其中,神经网络的深度可以是指神经网络包括的层数,其中每层包括的神经元个数可以称为该层的宽度。在一种实现方式中,神经网络包括输入层和输出层。神经网络的输入层将接收到的输入信息经过神经元处理,将处理结果传递给输出层,由输出层得到神经网络的输出结果。在另一种实现方式中,神经网络包括输入层、隐藏层和输出层,可参考图2B。神经网络的输入层将接收到的输入信息经过神经元处理,将处理结果传递给中间的隐藏层,隐藏层对接收的处理结果进行计算,得到计算结果,隐藏层将计算结果传递给输出层或者相邻的隐藏层,最终由输出层得到神经网络的输出结果。其中,一个神经网络可以包括一个隐藏层,或者包括多个依次连接的隐藏层,不予限制。
本公开涉及的神经网络例如深度神经网络(deep neural network,DNN),根据网络的构建方式,DNN可以包括前馈神经网络(feedforward neural network,FNN)、卷积神经网络(convolutional neural networks,CNN)和递归神经网络(recurrent neuralnetwork,RNN)。
另外,在神经网络的训练过程中,可以定义损失函数。损失函数描述了神经网络的输出值与理想目标值之间的差距或差异,本公开并不限制损失函数的具体形式。神经网络的训练过程就是通过调整神经网络的参数,使得损失函数的取值小于门限,或者使得损失函数的取值满足目标需求的过程。调整神经网络的参数,例如调整如下参数中的至少一种:神经网络的层数、宽度、神经元的权值、或、神经元的激活函数中的参数。
A3,训练数据
训练数据可以包括AI模型的输入,或者包括AI模型的输入和目标输出(标签),用于AI模型的训练。例如,训练数据包括多个训练样本,每个训练样本为神经网络的一次输入。训练数据也可以理解为训练样本的集合,或称为训练数据集。
训练数据集是机器学习重要的部分之一,模型的训练过程本质上就是从训练数据中学习它的某些特征,使得AI模型的输出尽可能接近目标输出,如AI模型的输出与目标输出之间的差异最小。其中,目标输出也可以被称为标签。
本公开提供的方法具体涉及到双边模型的训练及应用。其中,双边模型,或称为双端模型、协作模型。双边模型可以由两个或者多个子模型构成,两个或者多个子模型之间匹配使用,两个或者多个子模型可以分布在不同的网元。例如自编码器(auto-encoder,AE)是一种典型的双边模型,自编码器包括编码器和解码器,其中,编码器和解码器之间匹配使用,如编码器的输出可以用于确定解码器的输入。实际使用时,编码器和解码器分别部署在不同网元,如编码器部署在终端设备,解码器部署在接入网设备。
一种可能的实现中,由一个网元训练双边模型,然后再将训练好的两个子模型分别部署在两个网元上,完成双边模型训练的网元可以是两个部署子模型的网元之一,也可以是第三方网元。例如,在无线通信网络中,可以由接入网设备完成双边模型的训练,再将其中需要部署在终端设备上的子模型发送给终端设备。具体地,可参见图3,分为三个阶段,在模型训练阶段中,接入网设备独立的训练一个双边模型,该双边模型包括子模型1和子模型2,其中子模型1的输入类型为a,子模型2的输入类型与子模型1的输出类型相同,子模型2的输出类型为b。在子模型发送阶段中,接入网设备将子模型1发送给终端设备。在模型应用阶段(或称联合推断阶段)中,终端设备可以根据子模型1和类型a的数据,得到类型c的数据,即子模型1的输入类型为a,子模型1的输出类型为c;终端设备将类型c的数据发送给接入网设备;接入网设备可以根据子模型2和类型c的数据,得到类型b的数据,即子模型2的输入类型为c,子模型2的输出类型为b。
在相关技术中,需要在空口传输AI模型,例如子模型。一方面,当AI模型比较大时,在空口传输子模型的开销较大。另一方面,由于AI模型的类型AI模型的格式种类很多,例如,从神经网络分类上,有FNN、CNN和RNN;从神经网络内部结构上,涉及每层神经元的个数,每层神经元之间的连接关系,层与层之间的连接关系,激活函数类型等。定义AI模型或者AI模型的解读格式需要比较大量的标准化工作。且,由于终端设备的计算能力差异较大,可支持的AI模型规模也不尽相同。如果所有终端设备都从接入网设备下载AI模型,可能需要接入网设备针对各种计算能力的UE分别训练其对应的AI模型,这样对于接入网设备而言,所需的计算量和存储开销也比较大。此外,AI模型涉及相关算法设计,通常情况下,算法和AI模型属于比较隐私的内容,不同网元之间交互这类比较隐私的内容,较易导致算法泄露,不利于通信安全。
基于此,本公开提供一种通信方法,能够减少传输开销,并提升通信安全。本公开中,各网元可以独立训练子模型,各网元独立训练的子模型之间相互匹配,可以构成一个双边模型。以下结合附图对于本公开提供的通信方法进行详细说明。
本公开提供的通信方法可以应用于图1A或者图1B所示的通信系统,可以由通信系统中的一个网元训练双边模型,再将双边模型中子模型的输入数据和/或输出数据发送给通信系统中的其他网元,其他网元可以利用某一子模型的输入数据和/或输出数据,训练得到一个与该子模型功能相同的子模型。即实现各网元独立训练子模型,且各网元独立训练的子模型之间相互匹配,可以构成一个新的双边模型。
下面结合图4A所示的一种AI应用框架,对本公开涉及的双边模型训练以及子模型训练技术进行介绍。
在图4A中,数据源(data source)用于存储训练数据和推理数据。模型训练节点(model trainning host)通过对数据源提供的训练数据(training data)进行分析或训练,得到AI模型,且将AI模型部署在模型推理节点(model inference host)中。其中,AI模型表征了模型的输入和输出之间的映射关系。通过模型训练节点学习得到AI模型,相当于由模型训练节点利用训练数据学习得到模型的输入和输出之间的映射关系。模型推理节点使用AI模型,基于数据源提供的推理数据进行推理,得到推理结果。该方法还可以描述为:模型推理节点将推理数据输入到AI模型,通过AI模型得到输出,该输出即为推理结果。该推理结果可以指示:由执行对象使用(执行)的配置参数、和/或由执行对象执行的操作。推理结果可以由执行(actor)实体统一规划,并发送给一个或多个执行对象(例如,网元)去执行。
在本公开中,图4A所示的应用框架可以部署在图1A或者图1B中所示的网元,例如,图4A的应用框架可以部署在图1A的接入网设备,在接入网设备中,模型训练节点可对数据源提供的训练数据(training data)进行分析或训练,得到一个双边模型。模型推理节点可以使用该双边模型包括的子模型,根据子模型和数据源提供的推理数据进行推理,得到子模型的输出。即该子模型的输入包括推理数据,子模型的输出即为子模型所对应的推理结果。将终端设备视为图4A中的执行对象,接入网设备可以将子模型对应的推理数据和/或推理结果发送给终端设备,终端设备可以根据推理数据和/或推理结果独自训练一个对应的子模型。
下面结合图4B~图4E对本公开提供的通信方案能够应用的网络架构进行介绍。
如图4B所示,第一种可能的实现中,接入网设备中包括近实时接入网智能控制(RAN intelligent controller,RIC)模块,用于进行模型学习和/或推理。例如,近实时RIC可以从CU、DU和RU中的至少一个获得网络侧和/或终端侧的信息,该信息可以作为训练数据或者推理数据。可选的,近实时RIC可以将推理结果递交至CU、DU和RU中的至少一个。可选的,CU和DU之间可以交互推理结果。可选的,DU和RU之间可以交互推理结果,例如近实时RIC将推理结果递交至DU,由DU递交给RU。例如,近实时RIC可以用于训练双边模型,利用双边模型的子模型进行推理;或者,近实时RIC可以用于训练能够与其他网元上分布的子模型匹配使用的子模型。
如图4B所示,第二种可能的实现中,接入网设备除包括近实时RIC之外可以包括非实时RIC(可选的,非实时RIC可以位于OAM中或者核心网设备中),用于进行模型学习和推理。例如,非实时RIC可以从CU、DU和RU中的至少一个获得网络侧和/或终端侧的信息,该信息可以作为训练数据或者推理数据,该推理结果可以被递交至CU、DU和RU中的至少一个。可选的,CU和DU之间可以交互推理结果。可选的,DU和RU之间可以交互推理结果,例如非实时RIC将推理结果递交至DU,由DU递交给RU。例如,非实时RIC用于训练双边模型,利用双边模型的子模型进行推理;或者,非实时RIC可以用于训练能够与其他网元上分布的子模型匹配使用的子模型。
如图4B所示,第三种可能的实现中,接入网设备中包括近实时RIC,接入网设备之外包括非实时RIC(可选的,非实时RIC可以位于OAM中或者核心网设备中)。同上述第二种可能的实现,非实时RIC可以用于进行模型学习和/或推理;和/或,同上述第一种可能的实现,近实时RIC可以用于进行模型学习和/或推理;和/或,近实时RIC可以从非实时RIC获得AI模型信息,并从CU、DU和RU中的至少一个获得网络侧和/或终端侧的信息,利用该信息和该AI模型信息得到推理结果,可选的,近实时RIC可以将推理结果递交至CU、DU和RU中的至少一个,可选的,CU和DU之间可以交互推理结果,可选的,DU和RU之间可以交互推理结果,例如近实时RIC将推理结果递交至DU,由DU递交给RU。例如,近实时RIC用于训练双边模型A,利用双边模型A的子模型进行推理。例如,非实时RIC用于训练双边模型B,利用双边模型B的子模型进行推理。例如,非实时RIC用于训练双边模型C,将双边模型C递交给近实时RIC,近实时RIC利用双边模型C的子模型进行推理。
图4C所示为本公开提供的方法能够应用的一种网络架构的示例图。相对图4B,图4B中将CU分离为了CU-CP和CU-UP。
图4D所示为本公开提供的方法能够应用的一种网络架构的示例图。如图4D所示,可选的,接入网设备中包括一个或多个AI实体,该AI实体的功能类似上述近实时RIC。可选的,OAM中包括一个或多个AI实体,该AI实体的功能类似上述非实时RIC。可选的,核心网设备中包括一个或多个AI实体,该AI实体的功能类似上述非实时RIC。当OAM和核心网设备中都包括AI实体时,他们各自的AI实体所训练得到的模型不同,和/或用于进行推理的模型不同。
本公开中,模型不同包括以下至少一项不同:模型的结构参数(例如模型的层数、和/或权值等)、模型的输入参数、或模型的输出参数。
图4E所示为本公开提供的方法能够应用的一种网络架构的示例图。相对图4D,图4E中的接入网设备分离为CU和DU。可选的,CU中可以包括AI实体,该AI实体的功能类似上述近实时RIC。可选的,DU中可以包括AI实体,该AI实体的功能类似上述近实时RIC。当CU和DU中都包括AI实体时,他们各自的AI实体所训练得到的模型不同,和/或用于进行推理的模型不同。可选的,还可以进一步将图4E中的CU拆分为CU-CP和CU-UP。可选的,CU-CP中可以部署有一个或多个AI模型。和/或,CU-UP中可以部署有一个或多个AI模型。可选的,图4D或图4E中,接入网设备的OAM和核心网设备的OAM可以分开独立部署。
本公开中,一个模型可以推理得到一个参数,或者推理得到多个参数。不同模型的学习过程可以部署在不同的设备或节点中,也可以部署在相同的设备或节点中。不同模型的推理过程可以部署在不同的设备或节点中,也可以部署在相同的设备或节点中。
下面结合方案一和方案二对本公开提供的通信方法进行详细说明。在这些方法中,所包括的步骤或操作仅是示例,本公开还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照本公开呈现的不同的顺序来执行,并且有可能并非要执行全部操作。
方案一
参见图5A,示意一种通信方法,该方法包括如下流程。
S501,第一网元确定第一子模型和第二子模型。
其中,第一子模型和第二子模型能够匹配使用。关于第一子模型和第二子模型匹配使用可参照如下两种可选的方式中的任意一个可选的实施方式理解。
一种可选的实施方式中,所述第一子模型的输出用于确定所述第二子模型的输入。或者说,第一子模型的输出数据可以用于生成第二子模型的输入数据。例如第二子模型的输入数据包括第一子模型输出数据,或者例如第一子模型的输出数据经由相应预处理后,可以得到第二子模型的输入数据。其中第一子模型的输出和第二子模型的输入可以符合如下至少一个特征:第一子模型的输出类型与第二子模型的输入类型相同;或者第一子模型的输出数据的维度与第二子模型的输入数据的维度相同;或者第一子模型的输出数据的格式与第二子模型的输入数据的格式相同。
另一种可选的实施方式中,所述第二子模型的输出用于确定所述第一子模型的输入,或者说,第二子模型的输出数据可以用于生成第一子模型的输入数据。例如第一子模型的输入包括第二子模型的输出,或者例如第二子模型的输出经由相应预处理后,可以得到第一子模型的输入。其中第二子模型的输出和第一子模型的输入可以符合如下至少一个特征:第二子模型的输出类型与第一子模型的输入类型相同;或者第二子模型的输出数据的维度与第一子模型的输入数据的维度相同;或者第二子模型的输出数据的格式与第一子模型的输入数据的格式相同。
具体地,第一子模型和第二子模型可以属于一个双边模型。第一网元可以根据需要部署双边模型的场景,获取相关的训练数据;第一网元根据训练数据训练第一子模型和第二子模型。其中,需要部署双边模型的场景可以包括如下至少一种:信道信息的反馈,如第二网元侧利用其中一个子模型压缩信道状态信息(channel state Information,CSI),并将压缩后的CSI发送给第一网元,第一网元利用其中另一个子模型恢复CSI;双边的AI调制解调,例如第二网元侧利用其中一个子模型调制信号,第一网元利用其中另一个子模型解调信号;双边的AI波束预测,例如第二网元利用其中一个子模型生成一个或多个波束,并使用该一个或多个波束向第一网元发送参考信号,第一网元利用其中另一个子模型和接收到的一个或多个参考信号预测最优波束。
可选的,第一子模型和第二子模型可以应用于不同的网元。例如,第一子模型应用于第二网元,第二子模型应用于第一网元。其中,第一网元可以是接入网设备,第二网元可以是如终端设备。或者,第一网元可以是终端设备,第二网元可以是接入网设备。另外可以理解的是,对于涉及终端设备之间需要部署双边模型的场景,本公开中的第一网元和第二网元可以均为终端设备;或者对于涉及接入网设备之间需要部署双边模型的场景,本公开中的第一网元和第二网元可以均为接入网设备。本公开对网元的类型并不进行限制。
进一步地,所述第一子模型可以用于在发送端(或称作为发送端的网元)发送信息,所述第二子模型在接收端(或称作为接收端的网元)用于接收所述信息;或者,所述第二子模型用于在发送端((或称作为发送端的网元)发送信息,所述第一子模型在接收端(或称作为接收端的网元)用于接收所述信息。该场景包括但不限于上述CSI压缩和恢复、或上述调制和解调。
S502,第一网元确定第一子模型的输入数据和输出数据。
具体地,
第一网元可以根据S501中描述的训练数据,确定第一子模型的输入数据。例如,将S501中描述的训练数据作为第一子模型的输入数据,或者在S501中描述的训练数据基础上自行生成第一子模型的输入数据。另外,第一网元也可以根据第二网元发送的相关数据,确定该第一子模型的输入数据。或者,第一网元也可以通过相关测量获取该第一子模型的输入数据。
第一网元将前述确定的输入数据输入到第一子模型,通过第一子模型得到对应的输出数据。
另外可以理解,该S502中的第一子模型为训练好的模型,第一子模型的输入数据也可以称为第一子模型的推理数据,第一子模型的输出数据也可以称为第一子模型的推理结果。
S503,第一网元向第二网元发送第一信息。
其中,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。例如,若第一网元根据从第二网元中获取的相关数据,确定第一子模型的输入数据,第一网元可以向第二网元发送的第一信息可用于指示第一子模型的输出数据而不指示第一子模型的输入数据。该相关数据可以用于第二网元得到第一子模型的输入数据。例如,若第二网元侧无法自行确定第一子模型的输入数据和输出数据,第一网元向第二网元发送的第一信息可用于指示第一子模型的输入数据和第一子模型的输出数据。例如,若第二网元侧无法自行确定第一子模型的输出数据但可以确定输入数据,第一网元可以向第二网元发送的第一信息可用于指示第一子模型的输入数据而不指示第一子模型的输出数据。
可选的,第一网元也可以向第二网元发送多组子模型对应的输入数据和/或输出数据。
S504,第二网元根据第一信息训练第三子模型。
可以理解,第一信息用于第三子模型的训练,或者说第一信息用于第三子模型的确定。
其中,第三子模型和第一子模型可以符合如下至少一个特征:所述第三子模型的功能与所述第一子模型的功能相同;所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;所述第三子模型的输入数据的格式与所述第一子模型的输入数据的格式相同,所述第三子模型的输出数据的格式与所述第一子模型的输出数据的格式相同;所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。其中,差别可以通过NMSE、MSE或余弦相似度等参数进行体现。
第二网元训练的第三子模型可以替代第一网元此前训练的第一子模型,即第三子模型可以与第二子模型匹配使用,构成一个新的双边模型。可以理解的是,第三子模型和第一子模型的网络结构可以相同或者不相同;第三子模型和第一子模型所用的神经网络类型可以相同或者不相同。本公开对此不予限制。
具体地,第二网元可以根据第一信息确定第三子模型的训练数据,以及第三子模型的标签样本(以下简称标签)。第二网元可以根据第一子模型的输入数据确定第三子模型的训练数据,也即第三子模型的输入数据;第二网元可以将与第一子模型的输出数据作为标签。可以理解的是,前述第一子模型的输入数据与第一子模型的输出数据之间具有映射关系,如第一子模型的输入数据的数量为一个多个,其中每个第一子模型的输入数据输入至第一子模型,均可得到对应的一个输出数据。第二网元根据第一信息确定的第三子模型的训练数据可以包括一个或多个,每个训练数据对应一个标签。如下以第三子模型的训练数据包括多个为例,对第二网元训练第三子模型的方式进行说明。
一种可选的实施方式中,第二网元将每个第一子模型的输入数据输入待训练的AI模型,第二网元可以将该第一子模型的输入数据所对应的输出数据作为标签,训练得到第三子模型,损失函数可以表示第三子模型的输出和该输出对应的标签之间的差值,例如损失函数具体可以是第三子模型的输出和该输出对应的标签之间的NMSE或MSE或余弦相似度。其中,待训练的AI模型可以是如前述的DNN,例如FNN、CNN或者RNN等,或者也可以是其他AI模型,本公开对此不进行限制。另一种可选的实施方式中,第二网元将每个第一子模型的输入数据输入基础模型,第二网元可以将该第一子模型的输入数据所对应的输出数据作为标签,第二网元可以根据该训练数据对基础模型进行更新,得到第三子模型。其中,基础模型可以是第二网元历史训练得到的模型,或者基础模型也可以是预先配置在第二网元中的。例如,针对需要部署双边模型的场景,可以预先在第二网元侧配置场景相关的基础模型。
可选的,第二网元可以确定训练第三子模型阶段中的相关参数。例如,可以采用预定的方式在第二网元侧定义参数,或者是由第一网元将相关参数指示给第二网元。其中,参数包括训练结束条件,第二网元可以根据训练结束条件进行第三子模型的训练。训练结束条件可以包括以下至少一个:训练时长、训练迭代次数、或者第三子模型所需满足的性能门限。其中,性能门限可以是训练、测试或者验证的损失函数的收敛门限,或者性能门限也可以是其他的阈值,例如针对第三子模型的输出数据与标签之间的差异所设定的阈值,具体地,第三子模型的输出数据与标签之间的差异可以通过均方误差(mean square error,MSE)、归一化均方误差(normalization mean square error,NMSE)、交叉熵等表示。参数还可以包括第三子模型的结构、第三子模型的参数、训练第三子模型的损失函数等。
可选的,若第一网元发送了多组子模型的输入数据和/或输出数据,第二网元可以根据每组子模型的输入数据和/或输出数据训练对应的子模型,从而获取多个子模型。第二网元训练其中每组子模型可以参照前述训练第三子模型的方式实施,本公开对此不再进行赘述。在构建新的双边模型并利用该新的双边模型进行推断(或称推理)时,第一网元还可以向第二网元指示第二网元使用其中的一个或多个子模型。
本公开中,由第一网元训练一个双边模型,将该双边模型中子模型相关的输入/输出指示给第二网元,实现第二网元侧独立训练功能相同的子模型,与第一网元上的其他子模型匹配使用,能够满足双边模型的应用需求,无需在空口传输子模型,能够减少传输开销,提升通信安全。
需要说明的是,虽然图5A作为示例,仅示意出了两个网元之间的交互,但并不表示本公开限制于两个网元,也不表示本公开限制双边模型仅包括两个匹配使用的子模型。在本公开中可以参照图5A描述的方法,实现在两个以上的网元中分布子模型以及两个以上的网元中分布子模型匹配使用。结合图5A所述的方法,本公开还提供一种双边模型的部署流程示意图。在图5B中示意出四个阶段,在模型训练阶段1中,第一网元训练一个双边模型,该双边模型包括子模型1和子模型2,其中子模型A1的输入类型为a,子模型1的输出类型为c;子模型2的输入类型与子模型1的输出类型相同,子模型2的输出类型为b。在子模型数据发送阶段中,第一网元将子模型1的输入数据(记为a1)和/或输出数据(记为c1)发送给终端设备。在模型训练阶段2中,第二网元可以根据收到的a1和/或c1,训练子模型3。该子模型3与子模型1的功能相同。在模型应用阶段(或称联合推断阶段)中,第二网元可以根据子模型1和类型a的数据,得到类型c的数据,即子模型3的输入类型为a,子模型3的输出类型为c;第二网元将类型c的数据发送给第一网元;第一网元可以根据子模型2和类型c的数据,得到类型b的数据,即子模型2的输入类型为c,子模型2的输出类型为b。
结合图5A所述的方法,以需要部署双边模型的应用场景是信道信息反馈为例,本公开提供一种通信方法,参见图6A,该方法包括如下流程。
S601,接入网设备获取训练数据。
其中,该训练数据包括N个信道信息。其中,N为正整数,即N为大于或者等于1的整数。该训练数据用于确定双边模型,该双边模型包括第一子模型和第二子模型。
关于信道信息的定义可参照如下方式B1或者方式B2理解。
在方式B1中,信道信息包括下行信道特征。在TDD系统中,接入网设备可以利用信道的上下行互易性,根据上行信道获取下行信道特征。或者,在FDD系统中,接入网设备可以通过一些信号处理的方式,根据上行信道获取下行信道特征;或者,终端设备也可以向接入网设备上报CSI,该CSI包括预编码矩阵索引(precoding matrix index,PMI),PMI用于表示下行信道特征;则接入网设备也可以通过收集终端设备上报的PMI,获取下行信道特征。本公开对于接入网设备获取下行信道特征的方式不予限制。
可选的,下行信道特征可以指的是下行信道的特征向量或特征矩阵,该特征向量或特征矩阵可以由终端设备对下行信道进行奇异值分解(singular valuedecomposition,SVD)得到,或者该特征向量或特征矩阵也可以由终端设备根据下行信道的协方差矩阵进行特征值分解(eigen value decomposition,EVD)得到。此外,下行信道特征还可以指的是预编码矩阵索引(precoding matrix index,PMI),该PMI可以由终端设备根据预定义的码本,对下行信道、下行信道的特征向量或下行信道的特征矩阵进行处理得到。
在方式B2中,信道信息包括下行信道,即全信道信息。在TDD系统中,接入网设备可以利用信道的上下行互易性,根据上行信道获取下行信道。或者,在FDD系统中,接入网设备可以通过一些信号处理的方式,根据上行信道获取下行信道;或者,终端设备也可以向接入网设备上报下行信道的相关信息,则接入网设备也可以根据下行信道的相关信息,获取下行信道。本公开对于接入网设备获取下行信道的方式不予限制。
S602,接入网设备根据N个信道信息确定第一子模型和第二子模型。
其中,第一子模型和第二子模型构成一个用于信道信息反馈的双边模型,记为第一双边模型。具体地,接入网设备可以将获取到的N个信道信息,划分为一个或多个训练集。接入网设备可以利用该一个或多个训练集中的部分或全部,训练同一个模型。例如接入网设备可以使用一个训练集训练同一个双边模型。或者,例如接入网设备可以使用多个训练集训练同一个双边模型。
第一双边模型的输入包括信道信息,第一双边模型的输出包括恢复的信道信息。其中,信道信息可以是下行信道特征或者下行信道。有关信道信息的定义可参照S601理解,对此不再进行赘述。训练第一双边模型可以理解为尽可能最小化输入的信道信息和输出的信道信息之间的差异,第一双边模型对应的损失函数可以表现为输入的信道信息和输出的信道信息之间的MSE、输入的信道信息和输出的信道信息之间的交叉熵(cross-entropy),或者输入的信道信息和输出的信道信息之间的余弦相似度(cosine similarity)等。
可选的,在第一双边模型中,第一子模型的输入类型可以与第一双边模型的输入类型一致,即第一子模型的输入类型为信道信息,或者第一双边模型的输入即为第一子模型的输入。第一子模型的输出类型为特征比特,特征比特包括一个或多个二进制比特。可以理解,特征比特是信道信息的低维表达,第一子模型用于对信道信息进行压缩和/或量化得到特征比特。第二子模型的输入由第一子模型的输出确定,例如,第二子模型的输入类型与第一子模型的输出类型一致,均为特征比特;或者,第二子模型的输入数据的维度和第一子模型的输出数据的维度相同;或者,第二子模型的输入数据包括第一子模型的输出数据;或者,可以将第一子模型的输出数据进行预处理后输入至第二子模型,即第二子模型的输入数据包括预处理后的第一子模型的输出数据。第二子模型的输出为恢复的信道信息。示例性的,第一双边模型可以是自编码器,其中第一子模型为编码器,第二子模型为解码器。
接入网设备可以根据实际需求预先设置特征比特的维度,特征比特的维度也可以称为特征比特包括的比特数。例如,处于反馈开销的考虑,接入网设备可以将特征比特的维度减小,以减少反馈开销。具体地,接入网设备可以设定特征比特的维度小于第一维度阈值。例如,处于反馈精度的考虑,接入网设备可以将特征比特的维度增大,以提高反馈精度。具体地,接入网设备可以设定特征比特的维度大于第一维度阈值。
S603,接入网设备向终端设备发送第一子模型的输入数据和/或输出数据。
关于第一子模型的输入数据和输出数据的确定方式可参照S502实施,本公开对此不再进行赘述。具体地,所述第一子模型的输入数据包括M个信道信息,M为正整数。所述第一子模型的输出数据包括与M个信道信息对应的特征比特,M为正整数。
可选的,在终端设备可以自行确定第一子模型的输入数据的情况下,接入网设备可以只向终端设备发送第一子模型的输出数据。例如,第一子模型的输入数据是根据终端设备上报的信道信息确定的,接入网设备可以只向终端设备发送第一子模型的输出数据。
下面以终端设备向接入网设备上报PMI,实现信道信息反馈为例,结合实施方式C1或实施方式C2,对接入网设备可以仅发送第一子模型的输出数据的情况进行说明。
在实施方式C1中,终端设备向接入网设备上报PMI,接入网设备根据终端设备上报的PMI,获取对应的下行信道特征
Figure BDA0003257687060000181
接入网设备将/>
Figure BDA0003257687060000182
作为第一子模型的输入,获取对应的输出,记为特征比特B。接入网设备可只将特征比特B发送给终端设备。具体地,接入网设备可以在每次接收到终端设备上报的PMI,生成该PMI对应的特征比特,并向该终端设备发送该PMI对应的特征比特。可选的,可以设定终端设备将在上报一个PMI之后的T1个时间单元内收到的特征比特,为该PMI对应的特征比特。其中,时间单元可以是时隙或者符号等。T1的值可以根据实际需求设定,例如1个时隙,本公开对此不进行限定。
在实施方式C2中,接入网设备在收到终端设备上报的多个PMI后,获取该多个PMI对应的下行信道特征
Figure BDA0003257687060000183
接入网设备按照每次输入一个/>
Figure BDA0003257687060000184
依次将多个/>
Figure BDA0003257687060000185
按照输入至第一子模型,输出得到对应的多个特征比特。接入网设备可以将该多个特征比特发送给终端设备。
其中,多个PMI与多个特征比特之间具备映射关系,例如一一对应。一种可选的实施方式中,多个特征比特和多个PMI之间的映射关系可以是预定义的,例如接入网设备每收到M个PMI后,将对应的N个特征比特按特定顺序排布在一个消息中,终端设备可以根据该特定顺序将N个特征比特与M个PMI进行关联。其中,特定顺序可以为接入网设备接收PMI的先后顺序。可选的,前述包括N个特征比特的消息可以采用特定消息格式,特定的消息格式可以根据实际需求设定,本公开不予限制。另一种可选的实施方式中,多个特征比特和多个PMI之间的映射关系可以是由接入网设备配置给终端设备。
下面对于接入网设备向终端设备发送第一子模型的输入数据和输出数据的情况进行说明。接入网设备可以自行生成符合要求的一个或多个信道信息,将该一个或多个信道信息输入第一子模型,输出得到一个或多个对应的特征比特。接入网设备将该一个或者多个信道信息以及该一个或者多个特征比特发送给终端设备。在这个方式中,接入网设备可以不获取终端设备上报的PMI或者无需等待终端设备上报的PMI。
此外,接入网设备除训练S602描述的第一双边模型,还可能涉及其他双边模型的训练。则可选的,当接入网设备训练多个双边模型时,接入网设备可以在每个双边模型中获取需要应用于在终端设备的子模型,将确定出的多个子模型的输入数据和/或输出数据发送给终端设备。
S604,终端设备根据第一子模型的输入数据和/或输出数据,训练第三子模型。
该步骤可参照S504的描述实施。终端设备可以根据获取的第一子模型的输入数据和/或输出数据,确定第三子模型的训练数据,以及第三子模型的标签样本(以下简称标签)。以下分情况进行举例说明。
情况1,对应S601描述的方式B1,接入网设备获取的信道信息包括下行信道特征。该下行信道特征具体可以是PMI、特征向量或特征矩阵等。
示例性的,终端设备上报PMI,接入网设备向终端设备发送的可以是第一子模型的输出数据,即特征比特。终端设备根据自己上报的PMI和接入网设备发送的特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括PMI。第三子模型的输入包括PMI,输出包括特征比特。
示例性的,终端设备上报PMI,接入网设备向终端设备发送的可以是第一子模型的输出数据,即特征比特。终端设备根据自己上报的PMI,确定用于生成该PMI的特征向量或特征矩阵W。终端设备根据特征向量或特征矩阵W和接入网设备发送的特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括特征向量或特征矩阵W。第三子模型的输入包括特征向量或特征矩阵W,输出包括特征比特。
示例性的,终端设备上报PMI,接入网设备向终端设备发送的可以是第一子模型的输出数据,即特征比特。终端设备根据自己上报的PMI,采用与接入网设备相同的方法,基于PMI恢复出下行信道特征
Figure BDA0003257687060000191
终端设备根据下行信道特征/>
Figure BDA0003257687060000192
和接入网设备发送的特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括下行信道特征(如特征向量或特征矩阵)。第三子模型的输入包括下行信道特征/>
Figure BDA0003257687060000193
输出包括特征比特。
示例性的,接入网设备向终端设备发送的是第一子模型的输入数据和输出数据,即下行信道特征(如PMI、特征向量或特征矩阵)和特征比特。终端设备根据接入网设备发送的下行信道特征和特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括下行信道特征。第三子模型的输入包括下行信道特征,输出包括特征比特。
情况2,对应S601描述的方式B1,第三子模型的训练数据可以是下行信道。
示例性的,终端设备上报下行信道的相关信息,接入网设备向终端设备发送的可以是第一子模型的输出数据,即特征比特。终端设备根据自己上报的下行信道的相关信息,确定用于生成该下行信道的相关信息的下行信道。终端设备根据下行信道和接入网设备发送的特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括下行信道。第三子模型的输入包括下行信道,输出包括特征比特。
示例性的,终端设备上报下行信道的相关信息,接入网设备向终端设备发送的可以是第一子模型的输出数据,即特征比特。终端设备根据自己上报的下行信道的相关信息,采用与接入网设备相同的方法,基于下行信道的相关信息,恢复出下行信道。终端设备根据恢复出的下行信道和接入网设备发送的特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括恢复出的下行信道。第三子模型的输入包括恢复出的下行信道,输出包括特征比特。
示例性的,接入网设备向终端设备发送的是第一子模型的输入数据和输出数据,即下行信道和特征比特。终端设备根据接入网设备发送的下行信道和特征比特训练第三子模型。例如,终端设备可以将接入网设备发送的特征比特作为标签,用于训练第三子模型的训练数据可以包括下行信道。第三子模型的输入包括下行信道,输出包括特征比特。
S605,终端设备向接入网设备发送训练完成通知,该训练完成通知用于指示完成第三子模型的训练。
具体地,终端设备可以在经过S604完成第三子模型训练后,执行S605。接入网设备获取到该训练完成通知,即可获知终端设备侧可以使用第三子模型与接入网设备侧的第二子模型进行联合推断,或者可以理解,第三子模型和第二子模型能够构成一个新的用于信道信息的反馈的双边模型,记为第二双边模型。
此外,终端设备还可以将训练好的第三子模型的性能通知给接入网设备,例如终端设备在前述训练完成通知中包括性能信息。例如,该性能信息可以指包括训练好的第三子模型所满足的性能参数:训练/测试/验证的损失函数门限,或者MSE、NMSE、交叉熵等其他性能。又如,该性能信息仅用于指示第三子模型是否达到性能要求,而不具体指示性能参数。
进一步可选的,以下通过S606~S608示意出第三子模型与第二子模型匹配使用的一种示例。该S606~S608可以不执行,或者该S606~S608也可以替换为第三子模型与第二子模型匹配使用的其它示例,本公开不予限制。
S606,终端设备根据第三信道信息和第三子模型,确定第一特征比特;其中,所述第三子模型的输入包括所述第三信道信息,所述第三子模型的输出包括所述第一特征比特;
S607,终端设备向接入网设备发送用于指示所述第一特征比特的信息。
S608,接入网设备根据第二子模型和第一特征比特,得到第一信道信息;其中,所述第二子模型的输入包括所述第一特征比特,所述第二子模型的输出包括第一信道信息。
可选的,终端设备训练的第三子模型与第一子模型的性能差异越小,第一信道信息和第三信道信息之间的差异越小,能够使得该第一信道信息尽可能接近于S606中第三信道信息。
本公开中,由接入网设备训练用于信道信息反馈的双边模型,将该双边模型中子模型相关的输入/输出指示给终端设备。终端设备可以独立训练功能相同的子模型,与接入网设备上的其他子模型匹配使用,能够满足双边模型的应用需求,无需在空口传输模型,能够减少传输开销,提升通信安全。
结合图6A所述的方法,本公开还提供一种双边模型的部署流程示意图。在图6B中示意出四个阶段,在模型训练阶段1中,接入网设备训练一个双边模型,该双边模型包括子模型1和子模型2,其中子模型1的输入类型为下行信道特征如特征向量或特征矩阵W,子模型1的输出类型为特征比特;子模型2的输入类型与子模型1的输出类型相同,子模型2的输出类型为恢复的下行信道特征
Figure BDA0003257687060000201
在子模型数据发送阶段中,接入网设备将子模型1的输入数据(记为W1)和/或输出数据(记为特征比特B)发送给终端设备。在模型训练阶段2中,终端设备可以根据收到的W1和/或特征比特B,训练子模型3。该子模型3与子模型1的功能相同。在模型应用阶段(或称联合推断阶段)中,终端设备可以根据子模型1和类型W的数据,得到类型为特征比特的数据,即子模型3的输入类型为W,子模型3的输出类型为特征比特;终端设备将类型为特征比特的数据发送给接入网设备;接入网设备可以根据子模型2和类型为特征比特的数据,得到类型为/>
Figure BDA0003257687060000202
的数据,即子模型2的输入类型为特征比特,子模型2的输出类型为/>
Figure BDA0003257687060000203
可以理解,图6B中的子模型1可以是图6A中的第一子模型,图6B中的子模型2可以是图6A中的第二子模型,图6B中的子模型3可以是图6A中的第三子模型。
结合图5A所述的方法,以需要部署双边模型的应用场景是信道信息反馈为例,本公开提供另一种通信方法,参见图7A,该方法包括如下流程。
S701,终端设备获取训练数据。
其中,该训练数据包括N个信道信息。其中,N为正整数,即N为大于或者等于1的整数。该训练数据用于确定双边模型,该双边模型包括第一子模型和第二子模型。
对应S601中的相关描述,信道信息具体可以包括下行信道和下行信道特征。对于终端设备来说,终端设备可以根据下行参考信号的测量,确定信道信息。
S702,终端设备根据N个信道信息确定第一子模型和第二子模型。
其中,第一子模型和第二子模型构成一个用于信道信息反馈的双边模型,记为第三双边模型。具体地,终端设备可以将获取到的N个信道信息,划分为一个或多个训练集。终端设备可以利用该一个或多个训练集中的部分或全部,训练同一个模型。例如终端设备可以使用一个训练集训练同一个双边模型。或者,例如终端设备可以使用多个训练集训练同一个双边模型。
以信道信息为下行信道特征为例。如果终端设备获取的下行信道特征是下行信道特征矩阵或者向量W,终端设备可以根据获取到的下行信道特征训练双边模型;或者,终端设备也可以先将下行信道特征矩阵或者向量W转化为PMI,根据PMI恢复下行信道特征矩阵或者向量
Figure BDA0003257687060000211
然后再使用恢复出的下行信道特征矩阵或者向量/>
Figure BDA0003257687060000212
训练双边模型。
第三双边模型的输入包括信道信息,第三双边模型的输出包括恢复的信道信息。其中,信道信息可以是下行信道特征或者下行信道。有关信道信息的定义可参照S601理解,对此不再进行赘述。训练第三双边模型可以理解为尽可能最小化输入的信道信息和输出的信道信息之间的差异,第三双边模型对应的损失函数可以表现为输入的信道信息和输出的信道信息之间的MSE、输入的信道信息和输出的信道信息之间的交叉熵(cross-entropy),或者输入的信道信息和输出的信道信息之间的余弦相似度(cosine similarity)等。
可选的,在第三双边模型中,第二子模型的输入类型可以与第三双边模型的输入类型一致,即第二子模型的输入类型为信道信息,或者第三双边模型的输入即为第二子模型的输入。第二子模型的输出类型为特征比特,特征比特包括一个或多个二进制比特。可以理解,特征比特是信道信息的低维表达,第二子模型用于对信道信息进行压缩和/或量化得到特征比特。第一子模型的输入由第二子模型的输出确定,例如,第一子模型的输入类型与第二子模型的输出类型一致,均为特征比特;或者,第一子模型的输入数据的维度和第二子模型的输出数据的维度相同;或者,第一子模型的输入数据包括第二子模型的输出数据;或者,可以将第二子模型的输出数据进行预处理后输入至第一子模型,即第一子模型的输入数据包括预处理后的第二子模型的输出数据。第一子模型的输出为恢复的信道信息。示例性的,第三双边模型可以是自编码器,其中第二子模型为编码器,第一子模型为解码器。
终端设备可以根据实际需求预先设置特征比特的维度,特征比特的维度也可以称为特征比特包括的比特数。例如,处于反馈开销的考虑,终端设备可以将特征比特的维度减小,以减少反馈开销。具体地,终端设备可以设定特征比特的维度小于第一维度阈值。例如,处于反馈精度的考虑,终端设备可以将特征比特的维度增大,以提高反馈精度。具体地,终端设备可以设定特征比特的维度大于第一维度阈值。
S703,终端设备向接入网设备发送第一子模型的输入数据和输出数据。
具体地,终端设备可以利用第一子模型,生成第一子模型的输入数据和输出数据。例如,所述第一子模型的输入数据包括M个特征比特,所述第一子模型的输出数据包括与M个特征比特对应的信道信息,M为正整数。
以信道信息为下行信道特征为例,终端设备可以将M个下行信道特征和M个特征比特发送给接入网设备。或者,终端设备也可以将M个下行信道特征转化为M个PMI,然后将M个特征比特和M个PMI发送给接入网设备。
S704,接入网设备根据第一子模型的输入数据和输出数据,训练第三子模型。
接入网设备可以直接将终端设备发送的M个特征比特以及M个特征比特对应的信道信息,训练第三子模型。或者,若终端设备发送的信道新具体是PMI,则接入网设备也可以先将M个PMI恢复成M个下行信道特征向量或矩阵,然后使用M个特征比特和M个下行信道特征向量或矩阵训练第三子模型。
该步骤可参照S504的描述实施。本公开对此不再进行赘述。
S705,接入网设备向终端设备发送训练完成通知,该训练完成通知用于指示完成第三子模型的训练。
具体地,接入网设备可以在经过S704完成第三子模型训练后,执行S705。接入网设备获取到该训练完成通知,即可获知终端设备侧可以使用第三子模型与接入网设备侧的第二子模型进行联合推断,或者可以理解,第三子模型和第二子模型能够构成一个新的用于信道信息的反馈的双边模型,记为第四双边模型。
此外,终端设备还可以将训练好的第三子模型的性能通知给接入网设备,例如终端设备在前述训练完成通知中包括性能信息。例如,该性能信息可以指包括训练好的第三子模型所满足的性能参数:训练/测试/验证的损失函数门限,或者MSE、NMSE、交叉熵等其他性能。又如,该性能信息仅用于指示第三子模型是否达到性能要求,而不具体指示性能参数。
进一步可选的,以下通过S706~S708示意出第三子模型与第二子模型匹配使用的一种示例。该S706~S708可以不执行,或者该S706~S708也可以替换为第三子模型与第二子模型匹配使用的其它示例,本公开不予限制。
S706,终端设备根据第二信道信息和第二子模型,确定第二特征比特;其中,所述第二子模型的输入包括所述第二信道信息,所述第二子模型的输出包括所述第二特征比特;
S707,终端设备向接入网设备发送用于指示所述第二特征比特的信息。
S708,接入网设备根据第三子模型和第二特征比特,得到第四信道信息;其中,所述第三子模型的输入包括所述第二特征比特,所述第三子模型的输出包括第四信道信息。
可选的,接入网设备训练的第三子模型与第一子模型的性能差异越小,第四信道信息和第二信道信息之间的差异越小,能够使得该第四信道信息尽可能接近于S706中第二信道信息。
本公开中,由终端设备训练用于信道信息反馈的双边模型,将该双边模型中子模型相关的输入和输出指示给接入网设备。接入网设备可以独立训练功能相同的子模型,与终端设备上的其他子模型匹配使用,能够满足双边模型的应用需求,无需在空口传输模型,能够减少传输开销,提升通信安全。
结合图7A所述的方法,本公开还提供一种双边模型的部署流程示意图。在图7B中示意出四个阶段,在模型训练阶段1中,终端设备训练一个双边模型,该双边模型包括子模型1和子模型2,其中子模型1的输入类型为下行信道特征如特征向量或特征矩阵W,子模型1的输出类型为特征比特;子模型2的输入类型与子模型1的输出类型相同,子模型2的输出类型为恢复的下行信道特征
Figure BDA0003257687060000231
在子模型数据发送阶段中,终端设备将子模型2的输入数据(记为特征比特B)和输出数据(记为/>
Figure BDA0003257687060000232
)发送给接入网设备。在模型训练阶段2中,接入网设备可以根据收到的特征比特B和/>
Figure BDA0003257687060000233
训练子模型4。该子模型4与子模型2的功能相同。在模型应用阶段(或称联合推断阶段)中,终端设备可以根据子模型1和类型W的数据,得到类型为特征比特的数据,即子模型1的输入类型为W,子模型1的输出类型为特征比特;终端设备将类型为特征比特的数据发送给接入网设备;接入网设备可以根据子模型4和类型为特征比特的数据,得到类型为/>
Figure BDA0003257687060000234
的数据,即子模型4的输入类型为特征比特,子模型4的输出类型为/>
Figure BDA0003257687060000235
可以理解,图7B中的子模型1可以是图7A中的第二子模型,图7B中的子模型2可以是图7A中的第一子模型,图7B中的子模型4可以是图7A中的第三子模型。
方案二
参见图8,示意一种通信方法,该方法包括如下流程。
S801,第三方网元确定第一子模型和第二子模型。
具体地,可参照S501实施,本公开不再进行赘述。
本方案如下以第一子模型应用于第二网元,第二子模型应用于第一网元为例说明。其中,第一网元可以是接入网设备,第二网元可以是如终端设备。或者,第一网元可以是终端设备,第二网元可以是接入网设备。另外可选的,第三方网元可以是独立AI网元。
S802a,第三方网元确定第一子模型的输入数据和输出数据,然后执行S803a。
具体地,可参照S502实施,本公开不再进行赘述。
S802b,第三方网元确定第二子模型的输入数据和输出数据,然后执行S803b。
具体地,可参照S502实施,本公开不再进行赘述。
S803a,第三方网元向第二网元发送第一子模型的输入数据和/或输出数据,然后执行S804a。具体地,可参照S503实施,例如第三方网元向第二网元发送第一信息,第一信息包括第一子模型的输入数据和/或输出数据。
S803b,第三方网元向第一网元发送第二子模型的输入数据和/或输出数据,然后执行S803b。
具体地,可参照S503实施,例如第三方网元向第一网元发送第二信息,第二信息包括第二子模型的输入数据和/或输出数据。
S804a,第二网元根据第一子模型的输入数据和/或输出数据,训练第三子模型,然后执行S805。
具体地,可参照S504实施,本公开不再进行赘述。
S804b,第一网元根据第二子模型的输入数据和/或输出数据,训练第四子模型,然后执行S805。
具体地,可参照S504实施,本公开不再进行赘述。例如,第二子模型和第四子模型之间的关系,可以按照第一子模型和第三子模型之间的关系理解。
S805,第二网元上的第三子模型与第一网元上的第四子模型匹配使用。即第三子模型和第四子模型构成一个新的双边模型。
本公开中,由第三方网元训练一个双边模型,将该双边模型中多个子模型相关的输入/输出指示给多个网元,实现各个网元侧独立训练功能相同的子模型,与其它网元上的子模型匹配使用,能够满足双边模型的应用需求,无需在空口传输模型,能够减少传输开销,提升通信安全。
上述分别从第一网元、第二网元、第三方网元以及它们交互的角度对本公开提供的方法进行了介绍。为了实现上述方法中的各功能,第一网元、第二网元、第三方网元可以包括硬件结构和/或软件模块,以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行,取决于技术方案的特定应用和设计约束条件。
基于同一构思,参见图9,本公开提供了一种通信装置900,该通信装置900包括处理模块901和通信模块902。该通信装置900可以是第一网元,也可以是应用于第一网元或者和第一网元匹配使用,能够实现第一网元侧执行的通信方法的通信装置;或者,该通信装置900可以是第二网元,也可以是应用于第二网元或者和第二网元匹配使用,能够实现第二网元侧执行的通信方法的通信装置;或者,该通信装置900可以是第三方网元,也可以是应用于第三方网元或者和第三方网元匹配使用,能够实现第三方网元侧执行的通信方法的通信装置。
其中,通信模块也可以称为收发模块、收发器、收发机、收发装置等。处理模块也可以称为处理器,处理单板,处理单元、处理装置等。可选的,可以将通信模块中用于实现接收功能的器件视为接收单元,应理解,通信模块用于执行上述方法实施例中接入网设备侧或终端设备侧的发送操作和接收操作,将通信模块中用于实现发送功能的器件视为发送单元,即通信模块包括接收单元和发送单元。
该通信装置900应用于第一网元时,其通信模块902包括的接收单元用于执行第一网元侧的接收操作,例如接收来自第二网元的信号。其通信模块902包括的发送单元用于执行第一网元侧的发送操作,例如向第二网元发送信号。该通信装置900应用于第二网元时,其通信模块902包括的接收单元用于执行第二网元侧的接收操作,例如接收来自第一网元的信号;其通信模块902包括的发送单元用于执行第二网元侧的发送操作,例如向第一网元发送信号。该通信装置900应用于第三方网元时,其通信模块902包括的接收单元用于执行第三方网元侧的接收操作,例如接收来自第一网元或者第二网元的信号;其通信模块902包括的发送单元用于执行第三方网元侧的发送操作,例如向第一网元或者第二网元发送信号。
此外需要说明的是,若该装置采用芯片/芯片电路实现,所述通信模块可以是输入输出电路和/或通信接口,执行输入操作(对应前述接收操作)、输出操作(对应前述发送操作);处理模块为集成的处理器或者微处理器或者集成电路。
以下对该通信装置900应用于第一网元的实施方式进行详细说明。对应图5A所描述的方法,该第一网元可以是接入网设备或者终端设备。
该通信装置900包括:
处理模块901,用于确定第一子模型和第二子模型,所述第一子模型和所述第二子模型能够匹配使用。
通信模块902,用于发送第一信息,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。
本公开中,提供能够匹配使用的多个子模型中一个子模型的输入数据和/或输出数据,可以用于独立训练与该子模型功能相同的子模型,无需在空口传输子模型,能够减少传输开销,提升通信安全。
在一种可能的设计中,所述第一子模型的输出用于确定所述第二子模型的输入;或者,所述第二子模型的输出用于确定所述第一子模型的输入。
在一种可能的设计中,所述第一子模型用于在发送端发送信息,所述第二子模型在接收端用于接收所述信息;或者,所述第二子模型用于在发送端发送信息,所述第一子模型用于在接收端接收所述信息。
在一种可能的设计中,所述第一子模型和所述第二子模型属于一个双边模型。
在一种可能的设计中,所述第一信息用于第三子模型的训练;其中,所述第三子模型的功能与所述第一子模型的功能相同;和/或,所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;和/或,所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;和/或,所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。所述第三子模型与所述第二子模型组成一个新的双边模型。
在一种可能的设计中,所述处理模块901,具体用于:根据训练数据,确定所述第一子模型和所述第二子模型;其中,所述训练数据包括N个信道信息,N为正整数,所述信道信息包括下行信道特征或者下行信道。
在一种可能的设计中,所述第一子模型的输入数据包括M个信道信息,M为正整数。
在一种可能的设计中,所述第一子模型的输出数据包括与M个信道信息对应的特征比特,M为正整数。
在一种可能的设计中,所述通信模块902,还用于获取用于指示第一特征比特的信息,所述第三子模型的输出包括所述第一特征比特;所述处理模块901,还用于根据所述第二子模型和所述第一特征比特,得到第一信道信息;其中,所述第二子模型的输入包括所述第一特征比特,所述第二子模型的输出包括所述第一信道信息。
在一种可能的设计中,所述第一子模型的输入数据包括M个特征比特,M为正整数。
在一种可能的设计中,所述第一子模型的输出数据包括与M个特征比特对应的信道信息,M为正整数。
在一种可能的设计中,所述处理模块901,还用于根据第二信道信息和所述第二子模型,确定第二特征比特;其中,所述第二子模型的输入包括所述第二信道信息,所述第二子模型的输出包括所述第二特征比特;所述通信模块902,还用于发送用于指示所述第二特征比特的信息。
以下对该通信装置900应用于第二网元的实施方式进行详细说明。对应图5A所描述的方法,该第二网元可以是终端设备或者接入网设备。
通信模块902,用于获取第一信息,所述第一信息用于指示第一子模型的输入数据和/或者所述第一子模型的输出数据。
处理模块901,用于根据所述第一信息训练第三子模型。
上述设计中,根据获取的一个子模型的输入数据和/或输出数据,可以用于独立训练与该子模型功能相同的子模型。能够应用于部署双边模型的场景,无需在空口传输子模型,能够减少传输开销,提升通信安全。
在一种可能的设计中,所述第三子模型的功能与所述第一子模型的功能相同;和/或,所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;和/或,所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;和/或,所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。
在一种可能的设计中,所述第一子模型和第二子模型能够匹配使用。
在一种可能的设计中,所述第一子模型的输出用于确定所述第二子模型的输入;或者,所述第二子模型的输出用于确定所述第一子模型的输入。
在一种可能的设计中,所述第一子模型用于在发送端发送信息,所述第二子模型在接收端用于接收所述信息;或者,所述第二子模型用于在发送端发送信息,所述第一子模型用于在接收端接收所述信息。
在一种可能的设计中,所述第一子模型和所述第二子模型属于一个双边模型;所述第三子模型与所述第二子模型组成一个新的双边模型。
在一种可能的设计中,所述第一子模型的输入数据包括M个信道信息,M为正整数。
在一种可能的设计中,所述第一子模型的输出数据包括与所述M个信道信息对应的特征比特,M为正整数。
在一种可能的设计中,所述处理模块901,还用于根据第三信道信息和所述第三子模型,确定第一特征比特;其中,所述第三子模型的输入包括所述第三信道信息,所述第三子模型的输出包括所述第一特征比特。所述通信模块902,还用于发送用于指示所述第一特征比特的信息。
在一种可能的设计中,所述第一子模型的输入参数包括M个特征比特M为正整数。
在一种可能的设计中,所述第一子模型的输出参数包括与所述M个特征比特对应的信道信息,M为正整数。
在一种可能的设计中,所述通信模块902,还用于获取用于指示第二特征比特的信息;所述处理模块901,还用于根据所述第三子模型和所述第二特征比特,得到第四信道信息;其中,所述第三子模型的输入包括所述第二特征比特,所述第三子模型的输出包括所述第四信道信息。
以下对该通信装置900应用于第三方网元的实施方式进行详细说明。对应图8所描述的方法,该第三方网元可以是AI网元。
处理模块901,用于确定第一子模型和第二子模型。
通信模块902,用于向第二网元发送第一信息,所述第一信息包括第一子模型的输入数据和/输出数据,所述第一信息用于第三子模型的训练;以及向第一网元发送第二信息,所述第二信息包括第二子模型的输入数据和/或输出数据,所述第二信息用于第四子模型的训练。
关于第一子模型、第二子模型、第三子模型以及第四子模型之间的关系,可以参照上述方法实施例中的介绍理解,本公开对此不再进行赘述。
本公开中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本公开各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
基于相同的技术构思,本公开还提供了一种通信装置1000。该通信装置1000可以是芯片或者芯片系统。可选的,在本公开中芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
通信装置1000可用于实现图1A所示的通信系统中终端设备或接入网设备的功能或者用于实现图1B所示的通信系统中终端设备、接入网设备或AI网元的功能。通信装置1000可以包括至少一个处理器1010,该处理器1010与存储器耦合,可选的,存储器可以位于该装置之内,存储器可以和处理器集成在一起,存储器也可以位于该装置之外。例如,通信装置1000还可以包括至少一个存储器1020。存储器1020保存实施上述任一实施例中必要计算机程序、配置信息、计算机程序或指令和/或数据;处理器1010可能执行存储器1020中存储的计算机程序,完成上述任一实施例中的方法。
通信装置1000中还可以包括通信接口1030,通信装置1000可以通过通信接口1030和其它设备进行信息交互。示例性的,所述通信接口1030可以是收发器、电路、总线、模块、管脚或其它类型的通信接口。当该通信装置1000为芯片类的装置或者电路时,该装置1000中的通信接口1030也可以是输入输出电路,可以输入信息(或称,接收信息)和输出信息(或称,发送信息),处理器为集成的处理器或者微处理器或者集成电路或则逻辑电路,处理器可以根据输入信息确定输出信息。
本公开中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器1010可能和存储器1020、通信接口1030协同操作。本公开中不限定上述处理器1010、存储器1020以及通信接口1030之间的具体连接介质。
可选的,参见图10,所述处理模块1010、所述存储器1020以及所述通信接口1030之间通过总线1040相互连接。所述总线1040可以是外设部件互连标准(peripheralcomponent interconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本公开中,处理器可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本公开中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
在本公开中,存储器可以是非易失性存储器,比如硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)等,还可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本公开中的存储器还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
在一种可能的实施方式中,该通信装置1000可以应用于终端设备,具体通信装置1000可以是终端设备,也可以是能够支持终端设备,实现上述涉及的任一实施例中终端设备的功能的装置。存储器1020保存实现上述任一实施例中的终端设备的功能的必要计算机程序、计算机程序或指令和/或数据。处理器1010可执行存储器1020存储的计算机程序,完成上述任一实施例中终端设备执行的方法。应用于终端设备,该通信装置1000中的通信接口可用于与接入网设备进行交互,向接入网设备发送数据或者接收来自接入网设备的数据。
在另一种可能的实施方式中,该通信装置1000可以应用于接入网设备,具体通信装置1000可以是接入网设备,也可以是能够支持接入网设备,实现上述涉及的任一实施例中接入网设备的功能的装置。存储器1020保存实现上述任一实施例中的接入网设备的功能的必要计算机程序、计算机程序或指令和/或数据。处理器1010可执行存储器1020存储的计算机程序,完成上述任一实施例中接入网设备执行的方法。应用于接入网设备,该通信装置1000中的通信接口可用于与终端设备进行交互,向终端设备发送数据或者接收来自终端设备的数据。
在另一种可能的实施方式中,该通信装置1000可以应用于AI网元,具体通信装置1000可以是AI网元,也可以是能够支持AI网元,实现上述涉及的任一实施例中AI网元的功能的装置。存储器1020保存实现上述任一实施例中的AI网元的功能的必要计算机程序、计算机程序或指令和/或数据。处理器1010可执行存储器1020存储的计算机程序,完成上述任一实施例中AI网元执行的方法。应用于AI网元,该通信装置1000中的通信接口可用于与接入网设备进行交互,向接入网设备发送数据或者接收来自接入网设备的数据。
由于本实施例提供的通信装置1000可应用于终端设备,完成上述终端设备执行的方法,或者应用于接入网设备,完成接入网设备执行的方法,或者应用于AI网元,完成AI网元执行的方法。因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
基于以上实施例,本公开还提供了一种计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机从终端设备侧或者接入网设备侧角度执行图5A至图8所示的实施例中所提供的通信方法。
基于以上实施例,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,所述计算机程序被计算机执行时,使得计算机从终端设备侧或者接入网设备侧角度执行图5A至图8所示的实施例中所提供的通信方法。其中,存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、只读存储器(read-only memory,ROM)、电可擦可编程只读存储器(electrically erasableprogrammable read-only memory,EEPROM)、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。
基于以上实施例,本公开提供了一种通信系统,包括终端设备和接入网设备,其中,所述终端设备和接入网设备可以实现图5A至图8所示的实施例中所提供的通信方法。
基于以上实施例,本公开还提供了一种芯片,所述芯片用于读取存储器中存储的计算机程序,从终端设备侧或者接入网设备侧角度实现图5A至图8所示的实施例中所提供的通信方法。
基于以上实施例,本公开提供了一种芯片系统,该芯片系统包括处理器,用于支持计算机装置实现图5A至图8所示的实施例中终端设备或接入网设备所涉及的功能。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器用于保存该计算机装置必要的程序和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
本公开提供的技术方案可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本公开所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、接入网设备、终端设备、AI网元或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digital video disc,DVD))、或者半导体介质等。
在本公开中,在无逻辑矛盾的前提下,各实施例之间可以相互引用,例如方法实施例之间的方法和/或术语可以相互引用,例如装置实施例之间的功能和/或术语可以相互引用,例如装置实施例和方法实施例之间的功能和/或术语可以相互引用。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。

Claims (31)

1.一种通信方法,其特征在于,包括:
确定第一子模型和第二子模型,所述第一子模型和所述第二子模型能够匹配使用;
发送第一信息,所述第一信息用于指示所述第一子模型的输入数据和/或所述第一子模型的输出数据。
2.如权利要求1所述的方法,其特征在于,
所述第一子模型的输出用于确定所述第二子模型的输入;或者,
所述第二子模型的输出用于确定所述第一子模型的输入。
3.如权利要求1或2所述的方法,其特征在于,
所述第一子模型用于在发送端发送信息,所述第二子模型在接收端用于接收所述信息;或者,
所述第二子模型用于在发送端发送信息,所述第一子模型用于在接收端接收所述信息。
4.如权利要求1-3任一项所述的方法,其特征在于,所述第一子模型和所述第二子模型属于一个双边模型。
5.如权利要求1-4任一项所述的方法,其特征在于,所述第一信息用于第三子模型的训练;其中,
所述第三子模型的功能与所述第一子模型的功能相同;和/或,
所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;和/或,
所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;和/或,
所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。
6.如权利要求1-5任一项所述的方法,其特征在于,所述确定第一子模型和第二子模型,包括:
根据训练数据,确定所述第一子模型和所述第二子模型;其中,所述训练数据包括N个信道信息,N为正整数,所述信道信息包括下行信道特征或者下行信道。
7.如权利要求1-6任一项所述的方法,其特征在于,所述第一子模型的输入数据包括M个信道信息,M为正整数。
8.如权利要求1-7任一项所述的方法,其特征在于,所述第一子模型的输出数据包括与M个信道信息对应的特征比特,M为正整数。
9.如权利要求5-8任一项所述的方法,其特征在于,所述方法还包括:
获取用于指示第一特征比特的信息,所述第三子模型的输出包括所述第一特征比特;
根据所述第二子模型和所述第一特征比特,得到第一信道信息;其中,所述第二子模型的输入包括所述第一特征比特,所述第二子模型的输出包括所述第一信道信息。
10.如权利要求1-6任一项所述的方法,其特征在于,所述第一子模型的输入数据包括M个特征比特,M为正整数。
11.如权利要求1-6和10任一项所述的方法,其特征在于,所述第一子模型的输出数据包括与M个特征比特对应的信道信息,M为正整数。
12.如权利要求10或11所述的方法,其特征在于,所述方法还包括:
根据第二信道信息和所述第二子模型,确定第二特征比特;其中,所述第二子模型的输入包括所述第二信道信息,所述第二子模型的输出包括所述第二特征比特;
发送用于指示所述第二特征比特的信息。
13.一种通信方法,其特征在于,包括:
获取第一信息,所述第一信息用于指示第一子模型的输入数据和/或所述第一子模型的输出数据;
根据所述第一信息训练第三子模型。
14.如权利要求13所述的方法,其特征在于,所述第三子模型的功能与所述第一子模型的功能相同;和/或,
所述第三子模型的输入类型与所述第一子模型的输入类型相同,所述第三子模型的输出类型与所述第一子模型的输出类型相同;和/或,
所述第三子模型的输入数据的维度与所述第一子模型的输入数据的维度相同,所述第三子模型的输出数据的维度与所述第一子模型的输出数据的维度相同;和/或,
所述第三子模型的输入与所述第一子模型的输入相同时,所述第三子模型的输出与所述第一子模型的输出之间的差别小于第一阈值。
15.如权利要求13或14所述的方法,其特征在于,所述第一子模型和第二子模型能够匹配使用。
16.如权利要求15所述的方法,其特征在于,所述第一子模型的输出用于确定所述第二子模型的输入;或者,所述第二子模型的输出用于确定所述第一子模型的输入。
17.如权利要求15或16所述的方法,其特征在于,所述第一子模型用于在发送端发送信息,所述第二子模型在接收端用于接收所述信息;或者,所述第二子模型用于在发送端发送信息,所述第一子模型用于在接收端接收所述信息。
18.如权利要求13-17任一项所述的方法,其特征在于,所述第一子模型和所述第二子模型属于一个双边模型。
19.如权利要求13-18任一项所述的方法,其特征在于,所述第一子模型的输入数据包括M个信道信息,M为正整数。
20.如权利要求13-19任一项所述的方法,其特征在于,所述第一子模型的输出数据包括与所述M个信道信息对应的特征比特,M为正整数。
21.如权利要求13-20任一项所述的方法,其特征在于,所述方法还包括:
根据第三信道信息和所述第三子模型,确定第一特征比特;其中,所述第三子模型的输入包括所述第三信道信息,所述第三子模型的输出包括所述第一特征比特;
发送用于指示所述第一特征比特的信息。
22.如权利要求13-18任一项所述的方法,其特征在于,所述第一子模型的输入参数包括M个特征比特M为正整数。
23.如权利要求13-18和22任一项所述的方法,其特征在于,所述第一子模型的输出参数包括与所述M个特征比特对应的信道信息,M为正整数。
24.如权利要求22或23所述的方法,其特征在于,所述方法还包括:
获取用于指示第二特征比特的信息;
根据所述第三子模型和所述第二特征比特,得到第四信道信息;其中,所述第三子模型的输入包括所述第二特征比特,所述第三子模型的输出包括所述第四信道信息。
25.一种通信装置,其特征在于,用于实现权利要求1-12任一项所述的方法。
26.一种通信装置,其特征在于,用于实现权利要求13-24任一项所述的方法。
27.一种通信装置,其特征在于,包括:
处理器,所述处理器和存储器耦合,所述处理器用于执行权利要求1-12任一项所述的方法。
28.一种通信装置,其特征在于,包括:
处理器,所述处理器和存储器耦合,所述处理器用于执行权利要求13-24任一项所述的方法。
29.一种通信系统,其特征在于,包括权利要求25或27所述的通信装置,以及权利要求26或28所述的通信装置。
30.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得计算机执行权利要求1-12任一项所述的方法或权利要求13-24任一项所述的方法。
31.一种计算机程序产品,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行权利要求1-12任一项所述的方法或权利要求13-24任一项所述的方法。
CN202111064144.XA 2021-09-10 2021-09-10 一种通信方法及装置 Pending CN115842835A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111064144.XA CN115842835A (zh) 2021-09-10 2021-09-10 一种通信方法及装置
EP22866784.6A EP4391474A1 (en) 2021-09-10 2022-09-09 Communication method and apparatus
PCT/CN2022/118269 WO2023036323A1 (zh) 2021-09-10 2022-09-09 一种通信方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111064144.XA CN115842835A (zh) 2021-09-10 2021-09-10 一种通信方法及装置

Publications (1)

Publication Number Publication Date
CN115842835A true CN115842835A (zh) 2023-03-24

Family

ID=85506147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111064144.XA Pending CN115842835A (zh) 2021-09-10 2021-09-10 一种通信方法及装置

Country Status (3)

Country Link
EP (1) EP4391474A1 (zh)
CN (1) CN115842835A (zh)
WO (1) WO2023036323A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685202B (zh) * 2018-12-17 2023-03-21 腾讯科技(深圳)有限公司 数据处理方法及装置、存储介质和电子装置
US10944436B1 (en) * 2019-11-21 2021-03-09 Harris Global Communications, Inc. RF communication device using artificial intelligence (AI) model and associated methods
CN113365287A (zh) * 2020-03-06 2021-09-07 华为技术有限公司 通信方法及装置
CN112783807B (zh) * 2020-12-31 2023-12-29 深圳大普微电子科技有限公司 一种模型计算方法及系统

Also Published As

Publication number Publication date
EP4391474A1 (en) 2024-06-26
WO2023036323A1 (zh) 2023-03-16

Similar Documents

Publication Publication Date Title
US20230319585A1 (en) Methods and systems for artificial intelligence based architecture in wireless network
EP4387316A1 (en) Communication method and apparatus
JP2024522144A (ja) 通信方法および装置
EP4274299A1 (en) Information quantization method and apparatus, and communication device and storage medium
CN115842835A (zh) 一种通信方法及装置
WO2023282804A1 (en) Classification of csi compression quality
CN117459961A (zh) 一种通信方法、装置及系统
US20240211769A1 (en) Communication method and apparatus
CN116419257A (zh) 一种通信方法及装置
CN116233857A (zh) 通信方法和通信装置
WO2023006096A1 (zh) 一种通信方法及装置
WO2024008004A1 (zh) 一种通信方法及装置
CN114492784A (zh) 神经网络的测试方法和装置
WO2024046215A1 (zh) 一种通信方法及装置
WO2023231881A1 (zh) 一种模型应用方法及装置
WO2023115254A1 (zh) 处理数据的方法及装置
EP4373006A1 (en) Communication method and apparatus
WO2023231934A1 (zh) 一种通信方法及装置
EP4319095A1 (en) Automatic tsn model learning for 5g systems
US20240211770A1 (en) Communication method and apparatus
WO2024046419A1 (zh) 一种通信方法及装置
WO2024027424A1 (zh) 一种数据质量度量方法及装置
CN117693021A (zh) 一种波束管理方法
CN116800307A (zh) 一种通信方法及装置
CN116260552A (zh) 一种csi发送和接收方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication