CN113557704B - 使用基于极化的信号空间映射的用于无线通信的方法和装置 - Google Patents

使用基于极化的信号空间映射的用于无线通信的方法和装置 Download PDF

Info

Publication number
CN113557704B
CN113557704B CN202080020105.7A CN202080020105A CN113557704B CN 113557704 B CN113557704 B CN 113557704B CN 202080020105 A CN202080020105 A CN 202080020105A CN 113557704 B CN113557704 B CN 113557704B
Authority
CN
China
Prior art keywords
signal
information set
function
polarization
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080020105.7A
Other languages
English (en)
Other versions
CN113557704A (zh
Inventor
葛屹群
史无限
童文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN113557704A publication Critical patent/CN113557704A/zh
Application granted granted Critical
Publication of CN113557704B publication Critical patent/CN113557704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/10Polarisation diversity; Directional diversity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/046Wireless resource allocation based on the type of the allocated resource the resource being in the space domain, e.g. beams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/033Theoretical methods to calculate these checking codes
    • H03M13/036Heuristic code construction methods, i.e. code construction or code search based on using trial-and-error
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • H04L1/0042Encoding specially adapted to other signal generation operation, e.g. in order to reduce transmit distortions, jitter, or to improve signal shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/0001Arrangements for dividing the transmission path
    • H04L5/0003Two-dimensional division
    • H04L5/0005Time-frequency
    • H04L5/0007Time-frequency the frequencies being orthogonal, e.g. OFDM(A), DMT
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/65Purpose and implementation aspects
    • H03M13/6577Representation or format of variables, register sizes or word-lengths and quantization
    • H03M13/658Scaling by multiplication or division

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Complex Calculations (AREA)

Abstract

描述了极化流架构。发送器用以实现反向极化流以将第一信号空间中的第一源信号整形为第二信号空间中的第一目标信号。反向极化流通过级联反向极化各步骤实现。每个反向极化步骤包括:混洗函数、分割函数、缩放函数和偏移函数。可以使用机器学习技术来实现缩放函数和偏移函数。接收器可以实现极化流以用于恢复源信号。

Description

使用基于极化的信号空间映射的用于无线通信的方法和装置
相关申请的交叉引用
本公开内容要求2019年3月29日提交的题为“AMETHOD AND APPARATUS FORWIRELESS COMMUNICATION USING POLARIZATION-BASED SIGNAL SPACE MAPPING”的美国临时专利申请第62/826,034号以及2019年9月5日提交的题为“A METHOD AND APPARATUS FORWIRELESS COMMUNICATION USING POLARIZATION-BASED SIGNAL SPACE MAPPING”的美国专利申请第16/562,045号的优先权,上述申请的全部内容据此通过引用合并到本文中。
技术领域
本公开内容涉及用于无线通信的方法和装置,其中,使用基于极化的方法将信号映射到目标信号空间。
背景技术
在现代无线系统中,空中接口的目标通常是在有限的带宽和时间资源的情况下增加系统容量(例如,增加复用数据流和/或用户的数量)。通常,实现该目标的方法包括:向信号空间添加新维度和/或改进信号空间的资源分配分辨率。
实际上,通常难以向信号空间引入全新的且高质量的(例如,尽可能正交的)维度。例如,分别通过码分多址(code-division multiple access,CDMA)和多输入多输出(multiple-input multiple-output,MIMO)技术将编码和空间域引入到时频信号空间是迄今为止仅有的公认的且成功的维度。其他改进旨在提高频谱效率,即如何更好地利用现有信号空间,例如,基于正交频分复用(orthogonal frequency-division multiplexing,OFDM)的多址接入比频分多址(frequency-division multiple access,FDMA)具有更高频谱效率。
对于未来的无线发展(例如5G及后代),希望进一步扩展信号空间以获得更大的容量和更高的频谱效率。然而,这样做时,可能无法确保所有维度都保持正交,并且某些维度可能是非线性的。用于设计信号空间中的资源映射的常规方法(通常使用启发式方法)可能难以或不可能实现这样的较高维度信号空间。
此外,常规的收发器(或者分别地发送器和接收器)对于干扰和噪声信道随机性通常假定正态(即,高斯)分布。这样的假定可能不是实际情况的准确表示,并且可能导致发送器(编码器)和接收器(解码器)侧的信号空间的使用效率降低。
因此,特别是对于未来通信系统而言,有用的将是,提供有助于促进针对较高维度信号空间的信号空间映射的方法以及因此得到的执行该较高维度映射的通用收发器架构,这可能有助于提高使用信号空间的效率。
发明内容
在一些方面中,本公开内容描述了一种用于无线通信的装置(其可以是基站或电子装置)。该装置包括发送器,该发送器用于实现反向极化流以将第一信号空间(例如,较低维度信号空间)中的第一源信号整形为第二信号空间(例如,较高维度信号空间)中的第一目标信号。反向极化流通过级联一个或更多个反向极化步骤实现。每个反向极化步骤包括:混洗函数,其将输入信息集(例如,实数值信号、复数值信号或位)进行混洗,并且输出混洗信息集;分割函数,其将混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;缩放函数,其应用于第二分割信息组以生成缩放矢量(缩放矢量具有与第一分割信息组相同的维度大小);以及偏移函数,其应用于第二分割信息组以生成偏移矢量(偏移矢量具有与第一分割信息组相同的维度大小)。反向极化步骤输出第一输出信息组和第二输出信息组,第一输出信息组和第二输出信息组一起形成输出信息集,该一输出信息组为:第一分割信息组逐元素地乘以缩放矢量,并且逐元素地加上偏移矢量;并且该二输出信息组是第二分割信息组。发送器还用于将第一目标信号发送给至少一个接收装置。
在以上任何一项中,反向极化流可以与极化流可逆,极化流从第一目标信号恢复第一源信号(即使在由无线信道添加了噪声之后),混洗函数、分割函数、缩放函数(逐元素相除)和偏移函数(逐元素相减)在极化流中相同。
在以上任何一项中,反向极化步骤的数量可以大于一个。所有的反向极化步骤可以共享公共的混洗函数、分割函数、缩放函数和偏移函数。或者所有的反向极化步骤可以不共享公共的混洗函数、分割函数、缩放函数和偏移函数。例如,每个反向极化步骤可以具有其自己的混洗函数,但是可以共享公共的分割函数、缩放函数和偏移函数。
在以上任何一项中,可以使用至少一个神经网络来实现缩放函数和偏移函数。例如,一个神经网络可以接收第二分割信息组作为输入,并且输出缩放矢量和偏移矢量,缩放矢量和偏移矢量两者均与第一分割信息组具有相同的维度大小。
在以上任何一项中,使用第一神经网络来实现缩放函数(缩放函数根据第二分割信息组生成缩放矢量),并且可以使用第二神经网络来实现偏移函数(偏移函数根据第二分割信息组生成偏移矢量)。
在以上任何一项中,反向极化流可以与极化流可逆,极化流从第一目标信号恢复第一源信号。可以在极化流上训练至少一个神经网络。
在以上任何一项中,基站可以是发送装置,并且基站可以用于将至少一个神经网络的经过训练的权重发送到至少一个电子装置,以使得该至少一个电子装置能够以接收器的角色实现极化流。还可以使电子装置以发送器的角色实现反向极化流。
在一些示例中,基站可以向目标电子装置通知混洗函数、分割函数、缩放函数、偏移函数、维度大小以及极化流的极化步骤的数量,使得电子装置可以用接收器实现极化流。在电子装置充当上行链路通信的发送器的示例中,基站可以向电子装置提供这样的信息,以使得电子装置能够实现反向极化流,并且基站(作为接收器)可以实现对应的极化流。基站可以实现多个极化流,每个极化流被设计为接收和解码来自对应电子装置的上行链路通信。
在以上任何一项中,电子装置可以是发送装置,并且电子装置可以用于从基站接收至少一个神经网络的经过训练的权重,以使得电子装置能够以发送器的角色实现反向极化流。基站可以以接收器的角色实现极化流。
在以上任何一项中,发送器可以用于实现用于将第一源信号整形为第一目标信号的第一反向极化流,以及用于将第一信号空间(例如,较低维度信号空间)中的第二源信号整形为第二信号空间(例如,较高维度信号空间)中的第二目标信号的第二反向极化流,其中,第一目标信号用于发送到第一接收装置,并且第二目标信号用于发送到第二接收装置。
在以上任何一项中,第一源信号与第二源信号可以在第一信号空间中交叠,并且第一目标信号与第二目标信号可以在第二信号空间中不交叠(例如,作为复用信号)。
在以上任一项中,可以将第一源信号整形为第一目标信号以实现维度增益。
在一些方面中,本公开内容描述了一种用于无线通信的装置。该装置包括接收器,该接收器用于从基站接收第一接收信号。接收器还用于实现极化流以从第二信号空间(例如,较高维度信号空间)中的第一接收信号恢复第一信号空间(例如,较低维度信号空间)中的第一源信号。极化流是通过级联一个或更多个极化步骤实现的,每个极化步骤包括:混洗函数,其将输入信息集(例如,实数值信号、复数值信号或位)进行混洗,并且输出混洗信息集;分割函数,其将混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;缩放函数,其应用于第二分割信息组以生成缩放矢量(缩放矢量具有与第一分割信息组相同的维度大小);以及偏移函数,其应用于第二分割信息组以生成偏移矢量(偏移矢量具有与第一分割信息组相同的维度大小)。极化步骤输出第一输出信息组和第二输出信息组,第一输出信息组和第二输出信息组一起形成输出信息集,该第一输出信息组为:从第一分割信息组逐元素地减去偏移矢量,并且逐元素地除以缩放矢量;并且该第二输出信息组是第二分割信息组。
在以上任何一项中,可以使用至少一个神经网络来实现缩放函数和偏移函数。
在以上任何一项中,可以使用第一神经网络来实现缩放函数,并且可以使用第二神经网络来实现偏移函数。
在以上任何一项中,可以在极化流上训练至少一个神经网络,极化流与反向极化流可逆,反向极化流将第一源信号整形为第一目标信号以用于发送。
在以上任何一项中,装置可以是以接收器为角色的基站,并且基站可以用于将至少一个神经网络的经过训练的权重发送到至少一个电子装置,以使得至少一个电子装置能够以发送器的形式实现反向极化流。
在以上任何一项中,装置可以是电子装置,并且可以使用从基站接收的经过训练的权重来实现至少一个神经网络。
在以上任何一项中,装置可以是与第一电子装置和第二电子装置通信的基站,并且接收器可以用于实现用于从接收的复用信号恢复来自第一电子装置的第一源信号的第一极化流,并且接收器还可以用于实现用于从接收的复用信号恢复来自第二电子装置的第二源信号的第二极化流。
在以上任何一项中,接收器还可以用于实现作为极化流的逆的反向极化流,并且接收器还可以用于迭代地使用极化流和反向极化流来恢复第一源信号。
在一些方面中,本公开内容描述了用于评估候选信号的装置。该装置包括:处理器,用于实现神经网络,该神经网络被训练为在信号空间中的两个候选信号分布之间执行二元分类,并且输出两个候选信号分布之间的交叉熵值。当交叉熵值最大时,确定两个候选信号分布是令人满意的。
在以上任何一项中,两个候选信号分布可以表示将在两个不同电子装置处接收到的对应候选信号的概率。
附图说明
现在将通过示例的方式参照附图,附图示出了本申请的示例实施方式,并且在附图中:
图1是适合于实现本文描述的示例的示例通信系统的示意图;
图2和图3是分别示出适合于实现本文描述的示例的示例计算单元和示例基站/电子装置的框图;
图4是示例三步极性编码器的表示。
图5示出了用于极性编码器的示例极化核和示例生成矩阵;
图6是示出用于三步极化流的示例架构的示意图;
图7是示出示例通用反向极化流架构的示意图;
图8是示出示例通用极化流架构的示意图;
图9是示出示例通用偏移反向极化流架构的示意图;
图10是示出示例通用偏移极化流架构的示意图;
图11是双月形目标信号似然分布的示例;
图12是示出示例通用缩放偏移反向极化流架构(在本文中也称为g网络)的示意图;
图13是示出示例通用缩放偏移极化流架构(在本文中也称为f网络)的示意图;
图14示出了使用所公开的极化流架构在正向两个装置进行发送的发送器处进行的信号整形的示例;
图15示出了使用所公开的极化流架构在接收器处进行的信号恢复的示例,其中示出了假定的高斯球以用于比较;
图16A和图16B示出了时频域中的两个复用信号的分离和交叠的示例;
图17示出了可以如何确定时频域中的两个信号的分离的示例;
图18A和图18B示出了可以如何确定时频域中的两个信号的交叠的示例;
图19是用于确定两个信号的交叠的示例的基于机器学习的方法的示意图;
图20是用于确定两个信号的交叠的另一示例的基于机器学习的方法的示意图;
图21示出了使用所公开的极化流架构在使用MU-MIMO技术的发送器处进行的信号整形的示例;
图22示出了使用所公开的极化流架构在发送器处用于维度增益的信号整形的示例;以及
图23示出了迭代地使用f网络和g网络来对信号进行解码的接收器的示例。
在不同的图中可能使用相似的附图标记来指代相似的部件。
具体实施方式
本公开内容描述了可以用于设计用于无线通信的新空中接口的示例。本文描述的示例可以帮助使较高维度信号空间的实现成为可能和/或使向信号空间的更高效的资源分配成为可能。
已经存在旨在扩展信号空间的维数的无线技术。一个示例是多址(multiple-access,MA)技术。MA技术已用于大规模机器类型通信(massive machine typecommunication,mMTC),以在存在大数目且高密度的装置(例如,物联网(Internet ofthing,IoT)装置)时实现无线通信。对于MA复用的简单示例,时间和频率维度在诸如频分多址(frequency-division multiple access,FDMA)和时分多址(time-division multipleaccess,TDMA)的技术中定义了基本的、正交的且线性的2D信号空间。在码分多址(code-division multiple access,CDMA)技术中,引入了码域作为第三维度。在2D频率和时间子空间上交叠的复用信号可以在码维度上很好地分离,使得总体上信号在代码-频率-时间信号空间上是分离的。类似地,多输入多输出(multiple-input multiple-output,MIMO)技术添加了空间域作为附加维度来扩展信号空间以提高容量。诸如前向纠错(forward errorcorrection,FEC)之类的信道编码技术也可以视为维度扩展。编码器将冗余信息添加到源信息,从而生成码字。编码位的维度大于源信息位的维度。可以将编码率(即,信息位数与编码位数的比较)视为维度比。通常,增加信号空间的维数可能有助于增加系统容量。
附加信号维度可能不像频率和时间信号维度那样正交和线性。然而,附加维度可以帮助使多个用户和/或复用信号在多维信号空间中分离。在系统中添加维度(例如,除了频率和时间维度之外)意味着每个资源元素都将成为较高的维度,这通常会增加系统的复杂性。在本公开内容中,较高维度用于指代高于二维的维度(例如,除了时间和频率之外的一个或更多个维度),并且可以更具体地指代比当前无线接入技术更高的维度。
提高系统容量的另一种方法可以是提高系统的频谱效率。频谱效率可以指代是否充分利用了给定的信号空间。D维信号空间中的复用信号可以被认为是较高维度空间中的低维流形(manifold)。在这种情况下,频谱效率问题可以被认为是:在(具有有限维数的)给定的信号空间中可以放置多少流形,而不会引入不可接受的水平的干扰。通常,信号空间的分辨率越高,发送器就可以在可接受的干扰水平内越灵活地布置信号流形,从而实现更大的容量。增加信号空间的一些示例包括:从FDMA开发基于正交频分复用(orthogonalfrequency-division multiplexing,OFDM)的多址接入,从CDMA开发宽带CDMA(widebandCDMA,WCDMA),以及从2G到5G技术减少传输时间间隔(transmission time interval,TTI)的长度。
可以预期的是,未来无线通信技术的发展将与发现新维度并且将新维度添加到信号空间以及增加现有(或新)信号维度上的分辨率有关。为了帮助理解本公开内容,下面描述示例无线通信系统。
图1示出了可以在其中实现本公开内容的实施方式的示例无线通信系统100(也称为无线系统100)。通常,无线系统100使得多个无线或有线元件能够传送数据和其他内容。无线系统100可以使得内容(例如,语音、数据、视频、文本等)能够在系统100的实体中间进行传送(例如,经由广播、窄播、用户装置到用户装置等)。无线系统100可以通过共享资源例如带宽来进行操作。无线系统100可以适合于使用5G技术和/或后代无线技术(例如6G或更高)的无线通信。在一些示例中,无线系统100还可以容纳一些传统的无线技术(例如,3G或4G无线技术)。
在所示的示例中,无线系统100包括电子装置(electronic device,ED)110a-110c(通常称为ED 110)、无线电接入网络(radio access network,RAN)120a-120b(通常称为RAN 120)、核心网络130、公共交换电话网络(public switched telephone network,PSTN)140、因特网150和其他网络160。在一些示例中,可以省略一个或更多个网络,或者将一个或更多个网络替换为其他类型的网络。无线系统100中可以包括其他网络。虽然在图1中示出了特定数量的这些部件或元件,但是无线系统100中可以包括任何合理数量的这些部件或元件。
ED 110用于在系统100中操作和/或通信或者二者兼备。例如,ED 110可以用于经由无线或有线通信信道进行发送和/或接收或者二者兼备。每个ED 110表示用于无线操作的任何合适的终端用户装置并且可以包括如下装置(或可以被称为):用户设备/装置(userequipment,UE)、无线发送/接收单元(wireless transmit/receive unit,WTRU)、移动站、固定或移动用户单元、蜂窝电话、站(STA)、机器类型通信(machine type communication,MTC)装置、个人数字助理(personal digital assistant,PDA)、智能电话、膝上型计算机、计算机、平板电脑、无线传感器或消费电子装置,以及其他可能性。可以使用其他术语来指代后代ED 110。
在图1中,RAN 120分别包括基站(base station,BS)170a-170b(通常称为BS170)。每个BS 170用于与ED 110中的一个或更多个无线对接,以使得能够接入任何其他BS170、核心网络130、PSTN 140、因特网150和/或其他网络160。例如,BS 170可以包括(或可以是)若干众所周知的装置中的一个或更多个,例如基站收发信台(base transceiverstation,BTS)、无线电基站、Node-B(NodeB)、演进型NodeB(evolved NodeB,eNodeB)、家庭eNodeB、gNodeB(有时称为下一代Node B)、传输点(transmission point,TP)、发送和接收点(transmit and receive point,TRP)、站点控制器、接入点(access point,AP)或无线路由器等以及其他可能性。可以使用其他术语来指代后代BS 170。任何ED 110可以替选地或另外地用于与任何其他BS 170、因特网150、核心网络130、PSTN 140、其他网络160或前述的任何组合进行对接、接入或通信。如图所示,无线系统100可以包括诸如RAN 120b的RAN,其中,对应BS 170b经由因特网150接入核心网络130。
ED 110和BS 170是可以用于实现本文描述的功能和/或实施方式中的一些或全部的通信设备的示例。在图1所示的实施方式中,BS 170a形成了RAN 120a的一部分,RAN 120a可以包括其他BS、基站控制器(base station controller,BSC)、无线电网络控制器(radionetwork controller,RNC)、中继节点、元件和/或装置。任何BS 170可以是单个元件,如图所示,或者可以是分布在对应RAN中的多个元件,或者其他方式。此外,BS 170b形成RAN120b的一部分,RAN 120b可以包括其他BS、元件和/或装置。每个基站BS 170在特定地理区域或范围——有时被称为“小区”或“覆盖范围”——内发送和/或接收无线信号。小区可以被进一步划分成小区扇区,并且BS 170可以例如采用多个收发器以向多个扇区提供服务。在一些实施方式中,可以建立无线电接入技术支持的微微小区或毫微微小区。宏小区可以包含一个或更多个较小的小区。在一些实施方式中,可以例如使用多输入多输出(multiple-input multiple-output,MIMO)技术来针对每个单元使用多个收发器。所示的RAN 120的数量仅是示例性的。在设计无线系统100时可以设想任何数量的RAN。
BS 170使用无线通信链路(例如,射频(radio frequency,RF)、微波、红外(infrared,IR)等)通过一个或更多个空中接口190a与一个或更多个ED 110进行通信。ED110还可以经由一个或更多个侧链空中接口190b直接彼此通信。接口190a和190b通常可以被称为空中接口190。通过接口190a的BS-ED通信以及通过接口190b的ED-ED通信可以使用类似的通信技术。例如,本文公开的极化流架构可以用于BS-ED通信,并且也可以用于ED-ED通信。空中接口190可以利用任何合适的无线电接入技术。例如,无线系统100可以在空中接口190中实现一个或更多个信道接入方法,例如码分多址(code division multipleaccess,CDMA)、时分多址(time division multiple access,TDMA)、频分多址(frequencydivision multiple access,FDMA)、正交FDMA(orthogonal FDMA,OFDMA)或单载波FDMA(single-carrier FDMA,SC-FDMA)。根据本文描述的示例,空中接口190可以利用其他较高维度信号空间,较高维度信号空间可以包括正交和/或非正交维度的组合。使用本文所述的示例,除了上述信道接入方法之外或代替上述信道接入方法,可以实现用于空中接口190的新接入技术。
RAN 120与核心网络130进行通信以向ED 110提供各种服务例如语音、数据和其他服务。RAN 120和/或核心网络130可以与一个或更多个其他RAN(未示出)直接或间接通信,所述一个或更多个其他RAN可以或可以不直接由核心网络130服务,并且可以或可以不与RAN 120a、RAN 120b或两者采用相同的无线接入技术。核心网络130还可以用作(i)RAN 120或ED 110或两者与(ii)其他网络(例如PSTN 140、因特网150和其他网络160)之间的网关接入。另外,ED 110中的一些或全部可以包括使用不同的无线技术和/或协议通过不同的无线链路与不同的无线网络通信的功能。代替无线通信(或者除无线通信之外),ED 110可以经由有线通信信道与服务提供商或交换机(未示出)以及因特网150进行通信。PSTN 140可以包括用于提供普通老式电话服务(plain old telephone service,POTS)的电路交换电话网络。因特网150可以包括计算机和子网(内联网)或两者的网络,并且并入了诸如因特网协议(Internet Protocol,IP)、传输控制协议(Transmission Control Protocol,TCP)、用户数据报协议(User Datagram Protocol,UDP)之类的协议。ED 110可以是能够根据多种无线接入技术进行操作的多模装置,并且并入了支持这样的多模装置所需要的多个收发器。
图2和图3示出了可以实现根据本公开内容的方法和教示的示例装置。特别地,图2示出了示例计算单元(例如,服务器或数据中心)200,并且图3示出了示例BS 170或ED 110。这些部件可以在无线系统100或者任何其他合适的系统中使用。
如图2所示,计算单元200包括至少一个处理单元201。处理单元201实现计算单元200的各种处理操作。例如,处理单元201可以执行信号编码、数据处理、功率控制、输入/输出处理或者计算单元200的其他任何功能。处理单元201还可以用于实现本文更详细描述的功能和/或实施方式中的一些或全部。每个处理单元201包括用于执行一个或更多个操作的任何合适的处理或计算装置。例如,每个处理单元201可以包括微处理器、微控制器、数字信号处理器、现场可编程门阵列或者专用集成电路。
计算单元200还包括用于有线和/或无线通信的至少一个通信接口202。每个通信接口202包括用于生成用于无线或有线传输的信号以及/或者对无线地或通过有线接收的信号进行处理的任何合适的结构。在该示例中,计算机单元200包括至少一个天线204(在其他示例中,可以省略天线204)。每个天线204包括用于发送和/或接收无线信号或有线信号的任何合适的结构。可以在计算单元200中使用一个或更多个通信接口202。可以在计算单元200中使用一个或多个天线204。在一些示例中,一个或更多个天线204可以是天线阵列204,天线阵列204可以用于波束整形和波束控制操作。尽管被示为单个功能单元,但是计算单元200也可以使用至少一个发送器接口和至少一个分离的接收接口来实现。
计算单元200还包括一个或更多个输入/输出装置206或输入/输出接口(例如至因特网150的有线接口)。输入/输出装置206允许与用户或网络中的其他装置进行交互。每个输入/输出装置206包括用于向用户提供信息或者从用户接收信息——包括网络接口通信——的任何合适的结构,例如扬声器、麦克风、小键盘、键盘、显示器或触摸屏。
另外,计算单元200包括至少一个存储器208。存储器208存储由计算单元200使用、生成或收集的指令和数据。例如,存储器208可以存储被配置为实现本文描述的功能和/或实施方式中的一些或全部并且由处理单元201执行的软件指令或模块。每个存储器208包括任何合适的易失性和/或非易失性存储与检索装置。可以使用任何合适类型的存储器,例如随机存取存储器(random access memory,RAM)、只读存储器(read only memory,ROM)、硬盘、光盘、订户身份模块(subscriber identity module,SIM)卡、记忆棒和安全数码(secure digital,SD)存储卡等。
如图3中所示,ED 110或基站170包括至少一个处理单元250、至少一个发送器252、至少一个接收器254、一个或更多个天线256、至少一个存储器258以及一个或更多个输入/输出装置或接口266。处理单元250实现ED 110或基站170的各种处理操作,例如信号编码、数据处理、功率控制、输入/输出处理或任何其他功能。处理单元250还可以用于实现本文中描述的功能和/或实施方式中的一些或全部。每个处理单元250包括用于执行一个或更多个操作的任何合适的处理或计算装置。例如,每个处理单元250可以包括微处理器、微控制器、数字信号处理器、现场可编程门阵列或者专用集成电路。
每个发送器252包括用于生成用于无线或有线传输的信号的任何合适的结构。每个接收器254包括用于处理无线或有线接收的信号的任何合适的结构。虽然被示为分离的组件,但是至少一个发送器252和至少一个接收器254可以被组合成收发器。每个天线256包括用于发送和/或接收无线信号或有线信号的任何合适的结构。虽然此处公共天线256被示为耦接至发送器252和接收器254二者,但是可以将一个或更多个天线256耦接至发送器252,并且可将一个或更多个分开的天线256耦接至接收器254。在一些示例中,一个或更多个天线256可以是天线阵列,其可以用于波束整形和波束控制操作。每个存储器258包括任何合适的易失性和/或非易失性存储和检索装置,例如上面关于图2描述的装置。存储器258存储由ED 110或基站170使用、生成或收集的指令和数据。例如,存储器258可以存储被配置为实现本文描述的功能和/或实施方式中的一些或全部并且由一个或多个处理单元250执行的软件指令或模块。
每个输入/输出装置/接口266允许与用户或网络中的其他装置交互。每个输入/输出装置/接口266包括用于向用户提供信息或从用户接收/提供信息——包括网络接口通信——的任何合适的结构。
再次参照图1,空中接口190通常可以利用使用多个维度的接入技术。新接入技术的开发可能涉及诸如频率、时间、码、空间、交织器、多个收发器(例如,协作多点(coordinated multi-point,CoMP)和双连接技术)等的不同维度的组合。有些维度不像频率和时间维度那样正交,并且有些维度是非线性的,并且某些正交性随时间而变化。这为开发新的空中接口提出了挑战。还希望信号空间的分辨率适应于通常随时间变化的信道条件。例如,如果频率变得较不具有选择性,则通过沿频率维度增加分辨率(例如,通过减小OFDM子载波间隔)来进行适配可能是有用的。在另一个示例中,如果定时相干变长,则通过增加TTI的长度来进行适配可能是有用的。这样的适配性可能进一步增加新空中接口的开发的复杂性。
空中接口可以被认为是执行以特定方式将一个ED的一组一维输入信号(例如,规则的正交幅度调制(quadrature amplitude modulation,QAM)符号块)映射到特定D维信号空间中的信号块上的任务。若干信号块在D维信号空间内产生(表示似然分布的)流形。应当注意,流形可能不是同位的(也就是说,流形可能不会在所有维度上均等地扩展),因为可能期望两个不同ED的两个流形在公共信号空间中彼此分离。例如,一个流形可以在维度A上更多地扩展,而另一流形可以在维度B上更多地扩展。通常,常规的空气接口定义并提供了如下机制,该机制用于如何由规则信号块逐步启发式地生成非同位流形,并且定义了在信道条件发生变化时如何启发式地调整流形。
然而,启发式方法可能不适合在较高维度和/或较高分辨率信号空间中生产和调整流形。较高维度(可能包括正交或非正交维度,并且可能是线性或非线性的,并且可能是时变的或静态的)的复杂性可能使得难以甚至不可能将启发式方法用于较高维度信号空间。即使可以定义启发式方法,较高维度和较高分辨率通常也需要更复杂的物理层和资源调度器以及更多的测量和反馈。常规的规范驱动的调整方法通常是消耗时间和资源的。
常规方法遇到的另一个困难是,常规地,发送器和接收器(或收发器)假定干扰和有噪声信道随机性为正态(即,高斯)分布。该假定可以基于大数定律并且可以使用,因为可能难以对干扰和噪声信道随机性的真实分布进行建模。然而,多址干扰(multiple accessinterference,MAI)可能不是高斯噪声;而是,MAI可能会由ED的物理层发送器重新整形。因此,当使用高斯分布来对MAI建模时,结果是两个相邻的信号流形之间的间隔可能比实际所需的间隔更大。此外,可能需要对平均矢量和协方差矩阵进行大量计算(例如,使用奇异值分解(singular-value decomposition,SVD)或其逆操作)。如果平均矢量和协方差矩阵难以估计,则可以在通常较高的时间和/或资源成本下使用某些干扰消除接收算法来去除干扰。
机器学习和人工智能方法已用于解决许多困难且复杂的问题。然而,将机器学习或人工智能应用于为目标流形设计空中接口的挑战通常并不简单直接。这可能是因为通常使用成功的深度神经网络(例如卷积神经网络(convolutional neural network,CNN))来提取特征并且执行从较高维度空间到较低维度空间的分类;然而,通常的无线通信发送器用于将信号空间从较低维度空间扩展到较高维度空间。造成这种困难的原因还可能是因为与生成过程(即逐步)相比AI技术通常更关注生成结果(即从较低维度空间到较高维度空间),而无线通信发送器通常会定义参数化生成过程。
在各种示例中,本公开内容描述了用于信号空间映射的基于极化的方法。描述了极化流架构的示例,该极化流架构可以用于将信号整形为给定的多维信号空间中的目标流形。极化流可以在接收器(或解码器)中实现,并且反转(或反向)极化流可以在发送器(或编码器)中实现。反向极化流将一个信号空间中的输入信号(例如,时域中的QAM符号块或信息位块)的似然分布更改为另一信号空间中的目标分布;极化流从目标流形恢复信号(其可能具有增加的噪声)。从理论上讲,极化流和反向极化流都不会真正改变信号空间的维度以及该信号空间中的总体似然。每个极化步骤(或反向极化步骤)将一些维度上的似然移动到其他维度。在一系列极化步骤之后,一些维度将具有更高的似然,而其他维度将具有几乎为零的似然(即,在这些其他维度上存在信号能量的概率接近于零)。从严格意义上说,由于维度缩减(似然接近于零的维度被消除或减少了),在较高维度信号空间中输入目标信号并且在较低维度信号空间中输出源信号的接收器极化流正在进行极化。如下面进一步讨论的,示例极化流架构可以使得能够使用机器学习方法。
为了帮助理解本公开内容,现在提供机器学习的一些背景讨论。可以认为作为一种形式的机器学习的神经网络是一种拟合函数。深度学习是神经网络的一种实现,神经网络包含多于一个相互连接的人工神经元层。为了训练深度神经网络以拟合函数(例如,使用大量输入样本和输出样本进行训练),对每个神经元的权重和阈值迭代地更新,以使总体损失函数最小化或使总体回报函数最大化。可以通过训练样本上的梯度下降或上升反向传播算法来实现迭代,这可能要求深度神经网络架构以及损失或回报函数在数学上是可微的。
可训练性通常需要:函数集(神经网络架构),该函数集限定梯度下降算法可以在其中遍历的探索空间边界;以及相对于神经网络架构上的每个神经元的系数(用于梯度上升或下降训练)可微的一个或更多个损失(或回报)函数。
深度神经网络通常用于执行特征捕获,以及用于执行预测。特征捕获用于从许多复杂数据中提取有用的信息,这可以被认为是一种形式的维度降低。预测涉及内插或外推,以从样本数据中生成新数据(通常称为预测或估计数据)。这两个任务都可以假定输入数据具有固有的自回归特征。例如,图像的像素通常与其相邻像素具有某种关系。可以开发卷积神经网络(convolutional neural network,CNN)以使用这种关系来降低数据的维度。相反,随机独立噪声数据对于深度神经网络不提供有用的关系。因此,将深度神经网络应用于无线发送器的一个挑战是如何处理可能具有独立同分布(independent and identicallydistributed,IID)随机变量特征的输入信号。本文所述的示例提供了基于极化的方法,以促进针对适于较高维度信号空间的发送器或接收器的基于机器学习的解决方案。
前向纠错解决方案中使用的极性编码是极化的示例。假定到极性编码器的输入信号(例如,编码块或信息位)具有极化的似然:一些位位置具有较高的似然(将被解码),而其他位位置具有较低的似然。来自极性编码器的所有输出信号(例如,码字)在所有位置都具有相同的似然,因为它们将被加性高斯白噪声(additive white Gaussiannoise,AWGN)信道的噪声均匀地影响。注意,极化是从极化解码器的角度来看(对应于在降低信号维度的极化流接收器上发生的严格意义上的极化)。由于极化解码器使用连续消除算法,因此信息位(即要解码的位)具有不同的似然分布。对于卷积码,因为其解码器使用卷积解码器,所以信息位具有相等的似然分布。从这个意义上说,卷积码的输入和输出都具有相等的似然分布。
从概念上讲,极性编码器用于从连续消除解码器的角度更改从其输入(极化分布)到其输出(相等或均匀分布)的似然。在这个意义上,极性编码器是为了扩展信号的维数的去极化过程。实际上,极化码在输出信号(例如,码字)上引入单向条件概率级联。如果所有输入信号具有相等的似然,则输出信号将不具有均匀的似然。为了在输出上具有均匀的似然,输入信号应不具有相等的似然,即,输入信号应具有极化。这是开发密度演化算法(例如,基于连续消除的解码算法)以从输出(假定在极化码中该输出的似然分布等于一)向后计算输入信号的似然分布的原理。基于计算出的输入信号似然分布,将信息位分配给具有最大似然的位位置,并且将冻结位分配给具有最小似然的位位置。
图4是示出三步极性编码器400的示例的示意图。编码器400接收具有极化似然分布(由图4中的叠加数表示)的信号集x=<x1,x2,…x8>作为输入。x具有可以用于携带信息位的具有较高似然的位位置(例如,位位置x1、x2和x3)以及可以用于携带冻结位的具有较低似然的位位置(例如,位位置x4、x5、x6、x7和x8)。随着输入信号通过编码器400级联,概率发生变化,使得输出信号集y=<y1,y2,…y8>具有均匀的似然分布。极性编码器400可以基于极化核410,例如在图5中示意性表示的Arikan核。极化核410可以被表示为生成矩阵G2420。因此,可以使用三重矩阵
Figure GDA0003717945520000112
430达到图4的编码器400。码字y可以由输入x与三重矩阵
Figure GDA0003717945520000111
430的乘积形成。
如极化核410所示,极化不会改变信号的整体可靠性(似然),但是会改变似然分布,因为其生成矩阵G2 420的雅可比(Jacobian)矩阵[10;11]的行列式为1。
上面的讨论展示了极化(例如,使用极化码)可以在多维信号空间中从输入到目标输出对似然分布进行整形。
如上所述,假定码字均等分布的原因是由于假定了AWGN信道,该信道在每个码字位或符号上均等地加上了白噪声。在无线域中,这通常是重要的假定。然而,从理论上讲,可以假定码字具有任意分布,密度演化算法可以根据该分布来计算对应的输入分布。
在本文描述的示例中,目标似然分布可以是不均匀的。通常,目标似然分布(可以预先确定)可以在任何目标多维(也称为x维或x-D,其中x可以大于2)信号空间中。为简单起见,本讨论将基于如下示例:输入源似然分布是沿着时间维度的随机变量(例如,遵循QAM调制IID分布,或者直接为0和1或-1和+1伯努利(Bernoulli)分布)。可以在发送器中实现深度(即具有多个层或多个步骤)反向极化流架构,以对具有信号块的输入进行整形,每个信号遵循源似然分布,填充若干零直至x-D到目标x-D分布,而无需更改总似然分布。
在一些示例中,本文公开的深度反向极化流架构使输出的整形能够适合任何目标似然分布(也称为流形),而不只是仅使用极化码可获得的整形。例如,本文公开的深度反向极化流架构不仅可以提供信号分布的移位,而且可以在每个反向极化步骤处提供信号的缩放。这可以使得将输出整形为不连续的分布(例如,具有“双月”形状),这在使用仅移位驱动(shift-only-driven)的极化时(如在极性编码器的情况下)可能是困难的或不可能的。此外,本文公开的深度反向极化流架构是可逆架构。这可以使得能够在接收器或解码器处实现深度极化流架构(接收器或解码器处的深度极化流架构只是发送器或编码器处的深度反向极化流的逆版本(相反)),以在常规信号域中恢复或解码信号的源似然分布。
给定目标流形和输入源似然分布(例如,具有IID随机分布、正态分布或伯努利分布,这些分布在无线通信中可能是典型的),本文公开的深度极化流架构可训练用于机器学习目的。如上所述,极化流中每个步骤处的极化生成矩阵G2是下(或上)三角矩阵,并且其雅可比矩阵的行列式是对角元素的总和。如果行列式在每个步骤处都是可微的,则可以使用梯度下降或上升反向传播算法在这种极化流架构或反向极化流架构上进行训练。
在本公开内容中,深度极化流架构包括极化步骤的级联。因此,“深度”可以意味着流中存在多个这样的极化步骤。在每个极化步骤处,输入信号被分为两组(或两个子集)。一组信号保持不变并直接复制到输出,该组可以称为系统组(或系统子集)。另一组信号被移位(并且可选地如下面进一步讨论的那样被缩放)并且被输出,该组可以被称为编码组(或编码子集)。在图5的示例核410中,x2表示系统组,而x1表示编码组。应该理解,系统组和编码组均可以包含任意数量的信号(或信息),系统组和编码组不交叠(即,不共享任何公共信号或信息),并且系统组和编码组一起覆盖整个输入信号。系统组和编码组的大小可以相等(即,均具有相等的位数),或者大小可以不相等。每个极化步骤处的移位和缩放可以通过分别向输入施加移位矢量和缩放矢量来执行。示例核410示出了其中移位矢量和缩放矢量为1(实际上,移位为1而没有缩放)的示例。移位矢量和/或缩放矢量可以是固定的,或者可以是函数。例如,编码组上的缩放矢量和移位矢量可以是系统组中的信号(或信息)的函数。
如将在下面进一步讨论的,机器学习(例如,深度神经网络,例如深度卷积网络)可以用于提供用于生成缩放矢量和移位矢量的函数。深度神经网络的架构和系数可以取决于源信号似然分布和目标信号似然分布。例如,可以在标准中定义系数值的表和架构。
可以将每个极化步骤表达为输入信号矢量(例如,位、实数值或复数值矢量)乘以必须是上三角或下三角的极化生成矩阵(例如,位、实数值或复数值矩阵)的乘积。生成矩阵的雅可比矩阵的行列式的绝对值应为1,以便从该极化步骤的输入到输出不增加或减小总体似然。换言之,极化通过在多维空间中的不同位置之间重新分配似然来改变似然分布,而不增加或减少总的总体似然。极化步骤通过在信号空间中的另一位置处引起相应的似然降低、而不是通过在信号中增加额外的似然来增加一个位置上的似然。作为三角矩阵的属性,行列式是生成器矩阵的雅可比矩阵的对角元素之和。
可以将极化转换到对数域,从而使乘法变成加法。因此,对数域行列式是极化的生成矩阵的雅可比矩阵的对数域对角元素的总和,其绝对值(在对数域中)应为0。
设计良好的接收器或解码器应将目标信号的似然测量(通常会增加噪声)恢复到源分布的似然测量。因为每个步骤处的极化生成矩阵(其为三角的)都是可逆的,所以整个深度极化流都是可逆的。接收器或解码器可以在每个去极化步骤处将接收信号矢量乘以标量和移位矢量的逆或倒数(inverse或reciprocal)。因此,使用适当设计的生成矩阵,可以使用与用于产生极化步骤的神经网络相同的神经网络来获得去极化步骤。在一些示例中,如果(发送器处使用的)深度反向极化流对于接收器是已知的(例如,已知的函数集、神经元的权重和阈值),则接收器可以将深度反向去极化流反转为深度极化流,以恢复源信号。在一些示例中,接收器还可以应用诸如期望传播算法(expectation propagationalgorithm,EPA)之类的接收算法。在对数域中,缩放函数限定指数标量因子矢量。因此,传统的EPA接收器也可以在对数域中操作,使得乘法变为加法并且除法变为减法。
使用所公开的基于极化的机器学习辅助方法,波形设计和优化的挑战可以作为如何适当地训练极化神经网络的级联的问题来解决。这将在下面进一步讨论。高维复杂问题,例如在MIMO配对和非正交多址接入(non-orthogonal multiple access,NoMA)分组/复用中发现的问题(常规上需要使用高斯假定来求解高纬优化问题),可以作为神经网络训练问题来解决,神经网络训练问题会更易于管理。
在本文描述的示例中,在求解优化问题时可能不需要假定高斯分布。在某些情况下,基于神经网络的性质,大问题可以分为较小问题。使用常规(例如,启发式)方法可能非常复杂且非线性(并且实际上在计算上不可能求解)的问题在使用本文所述的基于神经网络的方法的情况下可以变得可行。
为了帮助理解本公开内容,现在提供对流形的讨论。可以认为若干信号块在信号空间中形成似然分布。在无线术语中,似然分布指示在信号空间的一个位置处编码的信息可以被解码器恢复的可能性有多大。从这个角度来看,有线或无线的通信物理层发送器将(例如,具有从0~1的均匀分布或QAM均匀分布的)源似然分布整形为目标似然分布。目标似然分布对于发送器和接收器二者都是已知的,但是源似然分布通常对于接收器是未知的。源分布和目标分布的维度可能不同。
当信号通过空中传输时,信号会沿所有维度例如时间、频率、空间、码等传播。一些维度可能是充分理解的,而其他维度则可能不是。一些维度或许能够被启发式地表示(例如时间和频率),而其他维度则可能无法被启发式地表示。一些维度可能无法使用现有技术来完全观察和理解。因此,信号(或“真实”信号)的最准确表示可能需要高维信号空间。收发器用于将高维信号投影到较低维度子信号空间(为简单起见称为信号空间)。该向较低维度信号空间的投影是由于可观察装置的局限性所致。从这个意义上讲,无线场中的作为信号块的集合的波形可以被认为是高维实际信号空间的低维流形。在本公开内容中,为简单起见,信号子空间可以被称为信号空间或多维信号空间,并且术语流形和似然分布可以互换使用。
如前所述,无线物理空中接口已朝两个方向发展,即在信号空间中引入新的维度以及增强现有信号空间的分辨率。
在信号空间中引入新的维度提供了维度增益或分集增益。例如,CDMA技术的发展引入了码维度;MIMO技术的发展引入了天线空间维度;CoMP/双连接的发展引入了地理空间维度。维度增益用于增加系统容量,并且是无线系统从一代到下一代演进的特征。
现有信号空间分辨率的增强使得可以更高效地利用信号空间。从无线电调度器的角度来看,信号空间是用于同时服务多个用户的无线系统的无线电资源池。更高的分辨率可以实现更精细的调度算法和更高的效率。例如,在从2G FDMA到4G OFDMA的演进中,子载波间隔减小(通过实现将两个交叠但是正交的相邻子载波分开的接收器),使得4G无线技术具有比2G更高的频谱效率。通常,可以以接受复杂性为代价来提高频谱效率。如果将一个用户的波形视为信号空间中的一个流形,则更高的分辨率提供更大的灵活性来并置多个流形(即来自多个用户),而在该公共信号空间中没有不可接受的干扰。因此,实现更高的分辨率也是无线系统从一代到下一代演进的特征。
到目前为止,上面讨论的两个发展方向是提高系统容量的最有效方法。然而,可能存在缺陷。
在添加新维度时,添加每个新维度更具挑战性。例如,在2G无线技术中,定时和频率维度是线性且正交的,从而实现了标准正交2D信号空间(称为射频-时间帧结构和参数集),在该空间中,可以以相对简单直接的方式将复用的信号分开。处理诸如由于信道失真而引起的频移和时间偏移之类的可能影响正交性的问题相对简单。对于3G无线技术,引入码维度作为线性且准正交维度。结果是标准正交3D信号空间(连同定时和频率维度)。然而,码维度的正交性取决于码和码的功率(power on the code),并且可能易受时变无线电信道的影响。因此,在3G中需要功率控制机制和复杂的定时提前机制,以在公共信号空间中对齐复用信号。在MIMO无线技术中,引入了空间维度。空间维度的正交性取决于天线的时变相关性或相似性。接收器的测量对于MIMO系统适当地调整发射天线组的功率和角度以及定时以便在信号到达接收器时形成标准正交的多维信号空间非常重要。通常,应该意识到,可能引入的未来维度可能较不线性(甚至非线性)、较不标准正交和/或更容易受到信道失真的影响。这可能需要显著的系统资源和复杂性,例如需要更多的测量、反馈、调度和/或解码复杂性以对这样的新维度进行正交化或正则化。
分辨率的任何提高也可能具有挑战性。通常,可以预期更高的分辨率导致更高的频谱效率。然而,由于接收器和信道条件的类型不同,这些优点可能无法完全实现。取决于不同的应用目的和环境,可以沿不同的维度使用大范围的分辨率。例如,在5G NR技术中,子载波间隔和TTI存在变化。
通常,无线发送器用于定义(常规上确定性且参数化的)方法,以将一维(通常在时间维度上)源似然分布(即信息位或调制符号的块)整形为用于特定用户的特定D维信号空间中的目标似然分布(也称为流形)。给定目标x维流形(其可能包含非线性且较不标准正交的维度以及具有变化的分辨率),本公开内容描述了如下示例:机器学习技术可以用于帮助设计自主整形函数,该自主整形函数对于接收器从x-D维目标流形(可能包括噪声)恢复或解码源似然分布是可逆的。
现在讨论似然分布的整形。考虑用于将1D源信号X整形为1D目标信号Y的整形函数。Zx是源随机变量X的似然分布,而Zy是目标随机变量Y的似然分布。Zx~(0,1)是均匀分布。在通过整形函数Y=1/2·(2·X+1)从X整形Y之后,||Zy||2=||Zx||2并且Zy~(1/2,3/2)。在该示例中,由于整形函数是纯线性的,所以经整形信号Y仍然具有均匀的分布Zy。然而,如果整形器包含非线性操作,则Zy可能不再均匀。然而,Zy在某种意义上可能具有自回归并且可能具有维度的扩展/降低。自回归意味着Y某些部分上的似然分布可能与其他部分相关(或是条件性的)。即,Y的某些部分具有比其他部分更高的可靠性。可以使用级联的整形函数将源分布整形为目标分布。
在上面讨论的示例中,整形函数包括1/2的缩放因子。缩放因子也可以被称为归一化因子。缩放因子可以用来从源到目标保留总体似然。结果是总体整形函数不会使总体似然增加或减少。
用更通用的术语来说,为了保留总体似然,归一化整形函数应满足以下条件(其中X是源分布,Y是目标分布):
X·dX=Y·dY
Y=X/(dY/dX)=X/det(J(X))=X/abs(det(J(X)))
其中,J(X)是雅可比矩阵(dY/dX),而det(·)是行列式。
如果abs(det(J(X)))=1,则整形函数将从X到Y保留似然。可以注意到,快速傅里叶变换(fast Fourier transform,FFT)(其在OFDM调制中用于将时域信号整形为频域信号)的abs(det(J(X)))为1。尽管理论上存在满足针对任何目标分布的似然保留标准的J(X),但是这样的J(X)可能难以找到,即使找到可能在实践中也难以实现。用代数几何术语来讲,可以将abs(det(J(X)))看作是将X整形为Y时体积的变化。从这个意义上讲,可以将保留标准认为是保持总体积不变。
在本公开内容中,描述了如下方法:使用机器学习来帮助找到期望的J(X),以将源分布整形为给定的目标分布。对于这样的方法的一些先前尝试是使用自动编码器。然而,到目前为止,自动编码器方法仅能够针对极少数X和Y找到J(X)。使用基于机器学习的方法的困难在于如下事实:在关系Y=X/abs(det(J(X)))中没有自动回归逻辑,并且假定X在无线系统中沿时间维度具有IID的属性。因此,缺少训练机器学习算法所需的相关/回归。在本文描述的示例中,描述了基于极化的方法,该方法创建固有回归,使得能够训练机器学习算法,从而找到J(X)。
如前所述,极化码是可靠性极化的示例(即,在信息位位置上存在不同的似然分布)。假定极性编码器的输出(码字)具有IID属性,因为假定该输出是通过AWGN信道传输的,该信道在传输的每个维度上都添加了均等的噪声。为了简单起见,将极性编码器的输入称为X,并且将极性编码器的输出称为Y。
为了形成具有IID属性的输出Y,X的输入分布不能具有IID似然。相反,X是极化的,这意味着某些位位置具有高似然,而其他位位置具有低似然。在图4所示的示例中,极性编码器400输出具有均匀概率分布0.25的Y,其中,输入X具有非均匀概率分布。在极化码的示例中,X和Y具有相同的维度大小。
通常,如果Y具有均匀的似然分布,则X必须具有极化的似然分布。密度演化算法是在给定Y均匀分布的情况下确定性地计算X的似然(即可靠性)的一种公知方法。从上面讨论的归一化整形原理的角度来看,密度演化算法可以被看作是将均匀似然分布Y转换为极化分布X的整形函数的级联。
然而,应当注意,Y不必均匀地分布。输入到密度演化算法中的任何形式的Y分布都将导致确定性的极化分布X。密度演化算法基于极化码架构。因此,极化码架构将似然从Y整形到X。在本文描述的一些示例中,描述了基于极化的架构,其中使用了整形函数的级联以从源输入X生成目标Y(其可以具有任何任意期望的似然分布)。换言之,尽管极性编码为本公开内容提供了背景,但是所公开的极性流架构不必限于生成具有均匀似然分布的目标Y。
以下是根据本公开内容的示例的用于将输入整形为目标分布的基于极化的架构的设计的讨论。极性编码器可以概括为反向极化步骤的级联。每个反向极化步骤都涉及生成矩阵。在图4和图5的示例中,生成矩阵G2420为[10;11],这是其雅可比矩阵J(X)的行列式为1的下三角矩阵。应注意,生成器矩阵G2420[10;11]也可以被表达为[11;01],这是也具有det(J(X))=1的上三角矩阵。
对于三角矩阵,其雅可比矩阵的行列式是其全为1的对角元素的累加。应该注意的是,反向极化步骤是可逆的,例如:
x2=y2
Figure GDA0003717945520000161
(其中
Figure GDA0003717945520000162
是位位置的异或)
还应注意,Y的分布具有回归特性。该特性有助于使用基于机器学习的方法。
图6是图4的极性编码器400的示意性表示。三个反向极化步骤被表示为三个步骤610a、610b、610c(通常称为610)的级联。为了简单起见,图6指示一个步骤610a的细节,但是应当理解,每个步骤610可以包括相同或相似的操作块。
级联中的一个步骤610包括用于实现混洗(shuffle)函数的混洗块612(其可以实现任何合适的混洗方法)。混洗块612接收一组输入位并且输出一组混洗位。步骤610还包括用于实现分割函数的分割块614。分割函数将混洗位分割成第一混洗位组和第二混洗位组。步骤610还包括执行极化的极化块616。在所示示例中,极化实现了Arikan核。这种架构可以被概括为如图7所示。通用架构可以应用于任何类型的信号;在极化码的情况下,信号是二进制信号。可以注意到,在图7中,存在shuffle(N+1)块,这不完全对应于图6的三步骤示例。这是因为图7是通用架构,该通用架构的步骤610的数目不是固定的,并且不是特定于N=8的极化码。
在当前附图中,极化块616中的符号“+”表示两个操作数矢量(位、实数或复数)之间的逐元素加法运算。步骤610中的每一个涉及:
Figure GDA0003717945520000171
Figure GDA0003717945520000172
其中
Figure GDA0003717945520000173
雅可比矩阵为:
Figure GDA0003717945520000174
应当指出,该雅可比矩阵的行列式为1,因为其所有对角元素均为1。因此,每个步骤610保留源分布X的总体似然,但是改变了分布以生成目标分布Y。
(从源分布X到目标分布Y的)整个整形过程可以写成:
Figure GDA0003717945520000175
因此,J(X)的整个雅可比矩阵为:
Figure GDA0003717945520000176
由于极化码的特性,混洗的雅可比行列式的行列式为:
Figure GDA0003717945520000177
然后,整个行列式为:
Figure GDA0003717945520000178
在本公开内容中,整形过程(即,过程
Figure GDA0003717945520000179
)可以被称为“反向极化流”、“极化g流”或“g函数”。在本文中,实现该反向极化流的架构被称为g网络。如图7所示,g网络将信号从源分布X处理到目标分布Y,如图7中的正向箭头所示。反向极化流是可逆的,并且其逆可以称为“极化流”、“极化f流”或“f函数”。极化流可以被表示为:
Figure GDA00037179455200001710
Figure GDA00037179455200001711
其中
Figure GDA00037179455200001712
图8示出了通用极化架构。极化架构包括极化步骤810a至810n(通常称为步骤810)的级联,从而反转图7中所示的反向极化流的操作。每个步骤810包括混洗块812、分割器块814和极化块816。当前附图中,极化块816中的符号“-”表示两个操作数矢量(位、实数或复数)之间的逐元素减法运算。实现极化流的架构在本文中称为f网络。如图8所示,f网络将信号从目标分布Y处理回到原始源分布X,如图8中的反向箭头所示。
上面是对f网络和g网络的总体描述,f网络与g网络彼此相反。f网络和g网络分别用于将似然分布从Y整形为X以及从X整形为Y。因此,给定输出Y的分布以及混洗函数的数量,可以确定X的似然分布。基于此,可以构造极化码并且可以推导其解码算法。
可以将这个构思扩展到极化码之外,以获得更大的灵活性和更广泛的适用性。
从极化码(例如Arikan核)的角度来看,极化步骤的数量和每个步骤处的混洗函数的数量由X和Y的维度大小固定,因为整个生成器矩阵是Arikan核的克罗内克(Knonecker)乘积(例如,如图5所示)。例如,如果维度大小为64(=26),则存在6个极化步骤和6个混洗函数。维度大小越大,极化就变得越深,实现的极化程度就越多(这可能导致更多的信道容量)。根据Arikan的证明,当维度大小达到无穷大时,极化程度可能会高到足以达到香农(Shannon)信道容量极限。另一种解释是,信号空间的维度大小较大会导致用于将可靠性从一个地方“移动”到另一个地方的高分辨率。在到目前为止描述的极化码架构中,极化步骤的数量以及混洗函数和极化核通过信号空间的维度而是固定的。以下描述了实现更大灵活性的进一步开发。
图9是包括偏移的g网络的示意图。图9所示的架构可以被称为反向偏移极化流网络。与图7所示的g网络相比,图9的g网络包括到极化块616的偏移函数u(·)618。应该注意的是,在每个步骤610中使用相同的偏移函数u(·)618。(理论上,每个步骤都可以具有其自己的偏移函数u(·),但以一致性和简单性为代价。)通过包含偏移函数618,每个步骤610变为:
Figure GDA0003717945520000181
Figure GDA0003717945520000182
Figure GDA0003717945520000183
在该示例中,偏移函数u(n)()是矢量输入和矢量输出函数。因此,雅可比矩阵为:
Figure GDA0003717945520000184
由于雅可比矩阵仍然是上三角矩阵,因此行列式仅取决于对角元素,该对角元素仍为1。因此,总体似然仍然得以保留。偏移函数618的引入使得通过操纵偏移函数un(·)618能够实现更大的灵活性来对Y和X分布转换进行整形。
图10示出了对应的偏移极化流f网络。当与图8的架构相比时,图10所示的架构将偏移函数u(·)818引入到极化块816。应当注意,偏移函数un(·)818在g网络与f网络之间是相同的。
如上所述,偏移函数u(·)的引入为将X整形为所需的目标Y分布实现了更大的灵活性,也就是说,极化整形加快了速度。偏移函数u(·)实现了偏移或移位以实现目标Y分布。然而,如果目标Y分布具有双月形状(例如,参见图11),则添加偏移函数u(·)可能不够。此外,在将X的低维分布转换为Y的高维分布的情况下,偏移的转换效率可能受到限制。添加缩放函数可以解决这样的问题。
图12是包括偏移函数并且还包括缩放函数的g网络的示意图。图12所示的架构可以被称为反向缩放偏移极化流网络。与图9所示的g网络相比,图12的g网络还向极化块616包括缩放函数v(·)619。应当注意,在每个步骤610中使用了相同的缩放函数v(·)619。在包含缩放函数619的情况下,每个步骤610变为:
Figure GDA0003717945520000191
Figure GDA0003717945520000192
Figure GDA0003717945520000193
其中,×运算符是逐点(或更通常地为逐元素)的乘法。因此,每个步骤610对输入信息或信号(例如,实值信号、复值信号或位)进行混洗,并且将混洗后的信息或信号分成两个信息组,即
Figure GDA0003717945520000194
(第一信息组)和
Figure GDA0003717945520000195
(第二信息组)。通常,本公开内容涉及“信息”,该“信息”可以是信号(实数或复数)或者位以及其他可能性。在极化码的特定情况下,信息采用位的形式。将缩放函数v(·)619应用于第二信息组以生成缩放矢量
Figure GDA0003717945520000196
并且将偏移函数u(·)618应用于第二信息组以生成偏移矢量
Figure GDA0003717945520000197
缩放矢量和偏移矢量二者的维度大小等于第一信息组。步骤610的输出由
Figure GDA0003717945520000198
(第一输出信息组)和
Figure GDA0003717945520000199
(第二输出信息组)形成。第二输出信息组是第二信息组
Figure GDA00037179455200001910
的副本。第一输出信息组是通过将第一信息组与缩放矢量逐元素相乘,然后与偏移矢量逐元素相加而获得的。
通过引入缩放函数v(·)619,每个步骤610处的雅可比矩阵为:
Figure GDA00037179455200001911
g网络的整体行列式为
Figure GDA00037179455200001912
所得到的Y可以除以
Figure GDA00037179455200001913
使得保留总似然。
图13示出了对应的缩放偏移极化流f网络。当与图10的架构相比时,图13所示的架构将(具有除法运算符的)缩放函数v(·)819引入到极化块816。应当注意,偏移函数u(·)818和缩放函数v(·)819在g网络与f网络之间相同。然而,f网络中的极化块816不是执行逐元素加法和逐元素乘法,而是执行逐元素减法和逐元素除法。因此,每个步骤810对输入信息进行混洗,并且将混洗的信息分成两个信息组,即
Figure GDA00037179455200001914
(第一信息组)和
Figure GDA00037179455200001915
(第二信息组)。将缩放函数v(·)819应用于第二信息组以生成缩放矢量
Figure GDA00037179455200001916
并且将偏移函数u(·)818应用于第二信息组以生成偏移矢量
Figure GDA00037179455200001917
缩放矢量和偏移矢量二者的维度大小等于第一信息组。步骤810的输出由
Figure GDA00037179455200001918
(第一输出信息组)和
Figure GDA00037179455200001919
(第二输出信息组)形成。第二输出信息组是第二信息组
Figure GDA00037179455200001920
的副本。第一输出信息组是通过从第一信息组逐元素减去偏移矢量,然后逐元素除以缩放矢量而获得的。从数学上讲,这可以表示为:
Figure GDA0003717945520000201
Figure GDA0003717945520000202
Figure GDA0003717945520000203
f网络的总体行列式是
Figure GDA0003717945520000204
缩放函数v(·)对于以各种方式操纵似然分布是有用的。例如,缩放函数的引入使得源X分布能够被整形为具有双月形状的目标Y分布。此外,缩放函数的添加有助于增强极化。极化可以被认为是实质上的维度降低。如果给定维度上的缩放因子接近零,则该给定维度会塌缩。一个给定维度上的缩放因子可以被视为标准偏差。如果标准偏差为零,则该维度对于传输信息熵是无用的。当只存在偏移函数时,为了具有极化点或维度(高可靠性),必须存在来自许多其他点或维度的可靠性的移动并求和。通过添加缩放函数,可以直接降低某些点或维度的可靠性并且提高其他点或维度的可靠性,这可以有助于提高效率和速度。因此,从低到高的维度转换成为可能并且可以是快速的。
缩放函数v()和偏移函数u()一起可以带来期望的灵活性,以“移置”或极化信号空间上的可靠性。这意味着,至少在理论上,目标分布的整形不需要受极化步骤的数量和每个极化步骤处的混洗函数的数量的限制。
在本公开内容中,术语“g网络”通常可以指代反向缩放偏移极化流架构(或者更简单地说是反向极化流),如图12的示例所示;并且术语“f网络”通常可以指代缩放偏移极化流架构(或者更简单地说是极化流),如图13的示例所示。应当理解,图6、图7和图9是图12所示的更一般的g网络的特殊情况;以及图8和图10是图13中所示的更一般的f网络的特殊情况。
在本公开内容的各个示例中,可以分别针对接收器和发送器实现包括缩放函数和偏移函数的f网络和g网络架构。例如,在图1和图3中所示的ED 110或BS 170中,可以在发送器252中实现反向极化流,并且可以在接收器254中实现极化流。在示例中,可以在BS 170的发送器252中实现反向极化流,并且可以在ED 110的接收器254中实现极化流。然而,应当理解,ED 110也可以执行向BS 170的传输,使得发送器和接收器的角色可以互换。例如,BS170可以实现极化流,而ED 110可以实现对应的反向极化流。BS 170可以实现多个不同的极化流,每个极化流对应于相应的不同ED 110的不同反向极化流。
在发送器252中,反向极化流通过级联一个或更多个反向极化步骤610来实现。每个反向极化步骤610包括(例如,混洗块612处的)混洗函数、(例如,分割块614处的)分割函数、偏移函数618和缩放函数619。发送器252使用反向极化流将较低维度信号空间中的源信号整形为较高维度信号空间中的目标信号(在较高维度空间中填充零),然后发送经整形的目标信号。在实现方式中,每个反向极化步骤610可以共享公共的混洗块612、公共的分割块614、公共的偏移函数618和/或公共的缩放函数619(它们中的每一个都可以使用软件、硬件或者软件与硬件的组合来实现)。在示例实现方式中,每个反向极化步骤610共享公共的分割块614、公共的偏移函数618和/或公共的缩放函数619,但是每个反向极化步骤610具有其自己的混洗块612。在接收器254中,实现极化流,该极化流是反向极化流的逆。极化流是一个或更多个极化步骤810的级联。每个极化步骤810包括(例如,混洗块812处的)混洗函数、(例如,分割块814处的)分割函数、偏移函数818和缩放函数819。接收器254使用极化流从较高维度信号空间中的接收信号恢复较低维度信号空间中的源信号,并且丢弃低可靠维度。在实现方式中,每个极化步骤810可以共享公共的混洗块812、公共的分割块814、公共的偏移函数818和/或公共的缩放函数819(它们中的每一个都可以使用软件、硬件或者软件与硬件的组合来实现)。在示例实现方式中,每个极化步骤810共享公共的分割块814、公共的偏移函数818和/或公共的缩放函数819,但是每个极化步骤810具有其自己的混洗块812。
上面的讨论描述了在发送器中使用g网络以及在接收器中使用f网络。然而,由于f网络和g网络都用于移置似然分布,因此也有可能将f网络用于发送器并且将g网络用于接收器。
给定Y的目标分布和X的源分布以及f网络和g网络中的步骤和混洗函数的固定数量的情况下,挑战就变成如何确定合适的偏移函数u()和缩放函数v()来实现期望的分布转换。在极化码的特殊情况下,x=u(x)并且1=v()。
在本文描述的示例中,机器学习技术可以用于例如使用深度神经网络(deepneural network,DNN)来实现函数u()和v()。由于反向极化流中的每个步骤都是可微的,因此反向传播(从Y到X)是可能的,这可以实现DNN的训练。为了使用DNN能够成功实现,需要定义损失或回报函数(以及正则化,如果适用的话),以确保DNN可以得到训练和在理论上收敛。在实践中,可能还有其他因素会影响DNN的性能及其训练。一个因素是源分布和目标分布本身。例如,可以针对特定的分布设计DNN的架构(例如,层数、每层的神经元数)。为了标准化的目的,可以针对所有发送器/接收器定义DNN架构和极化流架构。
以下是用于训练用于函数u()和v()的DNN的合适损失/回报函数的设计讨论。在多维信号空间中以似然分布X为条件的似然分布Y可以表示为多个微小信号子空间的总和或积分,如下所示:
p(y)=∫p(x)·p(y|x:θ)dx
其中,p(x)是每个微小信号子空间上的先验概率;θ表示DNN的系数(权重、偏差和阈值);以及p(y|x:θ)是(X->Y)的似然概率,并通过DNN用系数θ和p(X)的输入来近似。
对于给定的目标Y分布
Figure GDA0003717945520000211
目的是实现使转换后的Y(p(y))以尽可能地接近
Figure GDA0003717945520000212
换言之,目的是使似然概率(y|x:θ)最大化,其表示为最大似然:
Figure GDA0003717945520000221
上面的式子找到在对
Figure GDA0003717945520000222
的观察中使log(p(y))测量最大化的(uθ,vθ)。
如前所述,y=g(x)并且x=f(y),并且f()和g()彼此可逆。因此,从数学上讲,g网络或f网络对于训练而言可以是等效的。然而,从机器学习的角度来看,f网络是优选的。首先,如前所述,Y分布具有自回归特性,而X分布则没有。因此,如果将f网络用于训练目的,则类似于图像处理,可以使用特征捕获。其次,g网络中的似然概率p(y|x:θ)成为f网络中的后验概率。在许多情况下,后验概率比似然概率更容易获得。再者,从Y分布到X分布,存在维度降低,也就是极化。因此,g网络将低维X空间映射到高维Y空间。在无线通信的应用中,为发送器实现了g网络,并且为接收器实现了f网络。这意味着发送器使用g网络将低维X映射到高维Y,这引入了冗余的方面,冗余防止了传输过程中的干扰和噪声。在接收器处,f网络捕获散布在高维空间Y上的低维特征。
为了训练f网络,输入为Y,并且输出为X。出于训练的目的,Y和X二者都添加了噪声(例如,逼近真实世界的行为)。尽管不需要假定Y或X中的任何一个在整个信号空间上都具有高斯分布,但是当被分成微小子空间时,在通常的无线系统中,可以假定它们在每个微小子空间上的投影具有高斯分布。为了在整个信号空间上获得最大似然,目的是在每个微小子空间上获得最大似然。
在每个微小空间处,存在D大小的块(D维)X。每个元素彼此独立,并遵循Ν(μ,σ)。这可以容易地扩展到复正态分布。因此,似然分布可以表示为:
Figure GDA0003717945520000223
然后,p(y)(给定y=g(x)并且x=f(y))可以表示为:
Figure GDA0003717945520000224
Figure GDA0003717945520000225
最大似然回报函数(其将被最大化)是:
Figure GDA0003717945520000226
由于f网络被设计为在每个步骤处都具有极化,因此行列式为:
Figure GDA0003717945520000227
因此,回报函数可以写成:
Figure GDA0003717945520000231
vn(·)可以表示为exp(-wn(·)),使得回报函数变为:
Figure GDA0003717945520000232
在无线系统中,X的分布是确定性的(即具有先验概率)。因此,可以直接确定μ的值(例如,基于已知的QAM星座,OFDM符号或0/1位)。σ的值与工作信噪比(signal-to-noiseratio,SNR)有关。在示例无线系统中,调制编码方案(modulation coding scheme,MCS)可以定义目标SNR。
给定MCS,可以确定调制(μ)、工作SNR(σ)和码长(D)。给定目标波形Y,因此可以使用监督学习来训练f网络。
回报函数可以进一步分为:损失函数(将被最小化)和调节函数(将被最大化)。根据上式,损失函数为:
||f(y:wθ,uθ)-μ||2
因此,损失函数采取最小平方误差(minimum square error,MSE)的形式。调节函数为:
Figure GDA0003717945520000233
因此,要训练的f网络涉及用于偏移函数un(·)的DNN以及用于缩放函数vn(·)=exp(-wn(·))的DNN。用于训练DNN的输入是具有目标似然分布的目标波形Y。训练输出X的特征在于调制μ、工作SNRσ和码长D,这些由MCS确定。例如,在图13的示例中,可以使用第一经训练DNN来实现偏移函数818,并且可以使用第二经训练DNN来实现缩放函数819。一旦f网络已被充分训练,经训练的f网络的逆可以用于对应的g网络。g网络可以用作发送器的推理网络,而接收器可以使用f网络以用于解码器。应当注意,可以在发送器/接收器外部执行(例如,可以离线执行或者由另一网络实体执行)DNN的训练以得出偏移函数818和缩放函数819。发送器/接收器仅需要了解DNN的架构以及要用于DNN的经过训练的权重。
在一些示例中,不是使用分开的DNN来实现偏移函数和缩放函数,而是可以使用单个DNN来实现偏移函数和缩放函数。例如,一个DNN可以接收信号输入,并且输出缩放矢量和偏移矢量二者。可以对f网络和g网络的实现是使用单个DNN还是使用两个DNN进行标准化。
另一种方法是在自动编码器模式下训练f网络和g网络。然而,自动编码器训练可能不一定会得出彼此可逆的f()和g()。
应当理解,用于wθ和uθ的具体DNN架构可以对于单独实现方式是开放的。例如,可以基于特定应用(例如,要作为目标的分布转换)来设计DNN架构。对于真实世界的实现方式,可以对应该用于给定应用的特定DNN架构进行标准化(例如,按照商定的行业标准)。例如,标准化可以包括要使用的神经网络的类型以及神经网络的某些参数(例如,层数、每层中的神经元数等)的标准定义。标准化可以是特定于应用的。例如,可以使用表格列出要用于特定应用的标准定义的神经网络参数。由于目标信号和分布形状可能高度依赖于特定的环境和ED,因此可能无需标准化已训练的DNN的权重和系数。标准化还可以包括极化流架构的标准定义(例如,级联中的极化步骤的数量、要使用的混洗的类型)。在图1的无线系统100的上下文中,经标准化的定义可以存储在BS 170的存储器中,以使BS 170能够选择适当的极化流架构和适当的DNN架构,以针对特定的无线通信场景进行训练。
DNN(例如,实现缩放函数和偏移函数二者的单个DNN,或者针对缩放函数和偏移函数中的每一个的单独的DNN)的训练可以在BS 170处执行,并且可以在BS 170与ED 110之间的初始设置和关联之前或在BS 170与ED 110之间的初始设置和关联时来执行。例如,当要为MIMO通信添加新的ED 110时,BS 170可能需要重新训练偏移函数和缩放函数(使用一个或两个DNN来实现)以重新整形目标信号以适应与新ED 110的通信(例如,避免与当前正在与BS 170通信的其他ED发生干扰)。在一些示例中,由BS 170在设置(例如,与一个或更多个ED进行初始关联)时训练DNN可能就足够了。此外,BS 170也可以例如响应于相关联的ED和/或环境的显著变化(例如,添加新的ED、ED的解除关联、ED移动性的显著变化、ED状态的变化或者信道的重大变化,以及其他可能性)即时地执行对DNN的训练。在BS 170已经训练了DNN之后,BS 170可以将经过训练的DNN的权重转发给ED 110,以在接收器中使用。
在一些示例中,可以例如使用由BS 170收集的数据来离线执行DNN的训练。所收集的数据可以表示不同的无线通信场景,诸如一天中的不同时间、一周中的不同天、不同的业务水平等。可以针对特定场景执行训练,以针对不同场景生成不同的DNN权重集。可以将不同的权重集与不同的特定场景相关联地存储在例如BS 170的存储器中(例如,在查找表中)。然后,BS 170可以根据特定场景针对DNN选择并使用特定的权重集。例如,BS 170可以(例如,使用来自内部时钟和/或日历的信息)确定其正在处理周末晚上的通信,并且使用对应的权重集来实现用于偏移函数和缩放函数的DNN。这将导致BS 170的发送器执行适合于周末晚上典型的无线业务水平的信号整形。
如上所述,BS 170还可以响应于环境和/或ED 110的动态变化来即时地重新训练DNN。因此,BS 170可以动态地更新权重表。在一些示例中,权重表可以包括标准化的权重集(例如,标准中针对非常常见的场景所定义的),并且还可以包括针对某些场景即时生成的权重集。
BS 170可以向相关联的ED 110提供权重和相关联的场景的索引表。BS170可以例如通过指示要使用的选定权重集的对应索引来向ED 110指示(例如,经由广播消息)选定权重集。BS 170可以重新训练DNN并且更新权重表(例如,响应于新场景),并且将更新的表传送给ED110。在一些示例中,BS 170可以存储大的权重,并且仅将表的子集提供给ED 110。
以上讨论提及BS 170执行DNN的训练的示例。在其他示例中,DNN的训练可以不由BS 170执行。例如,可以由核心网络130或者在无线系统100中的其他地方(例如,使用云计算)来执行DNN训练。BS 170可以简单地收集相关数据并将该数据转发到适当的网络实体(例如,核心网络130)以执行必要的训练。然后,可以将经过训练的DNN的权重提供给BS170,例如以存储在BS 170的存储器中。
尽管以上讨论是在BS 170充当发送器的角色并且ED 110充当接收器的角色的上下文中进行的,但是应当理解,发送器和接收器的角色可以互换(例如,对于上行链路通信)。此外,应当理解,发送器和接收器的角色可以在两个或更多个ED 110a、110b、110c处(例如,对于侧链通信)。BS 170(或核心网络130或其他网络实体)可以执行DNN训练,并且可以将经过训练的权重提供给ED 110,以由ED 110实现用于发送到BS 170的DNN。
在以上讨论中,已经描述了将源似然分布整形为目标似然分布的通用深度极化流架构。对于给定数量的极化步骤、每个步骤处的混洗函数以及源分布和目标分布的维度,可以训练DNN以生成v()和u()函数,以实现期望的似然分布转换。
应当注意,输入X和输出Y可以具有相同的维度大小或不同的维度大小。通常,在无线域中,发送器扩展维度以得到维度增益和分集增益。通过使用本文描述的反向极化流架构,发送器可以将较低维度信号空间(X)中的信号整形并映射到较高维度信号空间(Y)中。可以将源信号空间映射到任何目标信号空间Y,并且不再需要针对Y假定高斯分布。
多用户通信可以受益于本文公开的方法。现在参照图14,图14从发送器的角度示出了从X到Y的似然分布整形。考虑存在由BS服务的两个ED UE-1和UE-2的情况。在低维X信号空间中,UE-1具有第一源信号似然分布1402,并且UE-2具有第二源信号似然分布1404。源似然分布1402和1404在X信号空间中交叠。发送器(例如,BS中)使用第一g网络1412将第一源信号似然分布1402整形为针对UE-1的第一目标信号似然分布1422;并且使用第二g网络1414将第二源信号似然分布1404整形为第二目标信号似然分布1424。每个g网络1412、1414可以具有各自的偏移函数和缩放函数集,以实现各自的期望的信号整形。特别地,g网络1412、1414可以被设计(例如,通过训练DNN以实现如上所述的偏移函数和缩放函数)成实现在较高维度Y信号空间中很好地分开(例如,在考虑到噪声的影响之后)的目标似然分布1422、1424。然后,经整形的信号可以由BS通过信道发送,以由ED接收。每个ED可以在Y信号空间中接收信号并使用对应f网络(其是g网络1412、1414的逆)来在X信号空间中恢复源信号。尽管图14示出了向两个ED的传输,但是应当理解,以上讨论同样适用于向多于两个的ED的传输。
在一些示例中,发送器(例如,在ED中)使用第一g网络1412来将第一源信号似然分布1402整形为针对UE-1的第一目标信号似然分布1422;并且使用第二g网络1414将第二源信号似然分布1404整形为第二目标信号似然分布1424。每个g网络1412、1414可以具有各自的偏移函数和缩放函数集,以实现各自的期望的信号整形。特别地,g网络1412、1414可以被设计(例如,通过训练DNN以实现如上所述的偏移函数和缩放函数)成实现在较高维度Y信号空间中很好地分开(例如,在考虑到噪声的影响之后)的目标似然分布1422、1424。然后,可以由ED通过信道发送经整形的信号,以由BS接收。每个ED可以在Y信号空间中发送信号并且使用对应的g网络。BS可以使用对应的f网络(其是g网络1412、1414的逆)来并行且独立地恢复针对UE-1和UE-2的X信号空间中的源信号。
由于在发送器处实现的反向极化流是可逆的,因此定义由发送器使用的反向极化流会是足够的。对于给定的反向极化流,极化流可以容易地由接收器或解码器确定和使用。因此,在任何标准中仅定义发送器会是足够的。此外,BS向ED通知发送器实现方式会是足够的,并且ED本身可以通过计算求逆来确定接收器实现方式。
如前所述,与传统的高斯假定解码器或接收器不同,所公开的基于深度极化流的系统不需要假定高斯分布。在使用高斯假定的传统接收器中,接收器必须假定包含整个信号似然的高斯球。为了帮助理解高斯假定的影响,现在参照图15。
图15示出了从接收器的角度来看的使用所公开的极化流方法的从Y到X的似然分布整形。尽管图15示出了旨在用于两个ED的信号,但是应当理解,以下讨论同样适用于旨在由多于两个ED接收的信号。考虑存在由BS服务的两个ED UE-1和UE-2的情况。每个接收ED接收具有在较高维度Y信号空间中的接收信号似然分布1422、1424的信号。似然分布1422、1424可以被添加了噪声(由围绕每个似然分布1422、1424的虚线指示)。UE-1使用第一f网络1512从第一接收信号似然分布1422恢复第一源信号似然分布1402。类似地,UE-2使用第二f网络1514从第二接收信号似然分布1424恢复第二源信号似然分布1404。
在另一示例中,考虑存在同时向BS发送的两个ED UE-1和UE-2的情况。BS接收具有在较高维度Y信号空间中的接收且复用的信号似然分布1422、1424的信号。似然分布1422、1424可以被添加了噪声(由围绕每个似然分布1422、1424的虚线指示)。对于UE-1的似然分布1422,BS使用第一f网络1512从第一接收信号似然分布1422恢复第一源信号似然分布1402。类似地,对于UE-2的似然分布1424,BS使用第二f网络1512从第二接收信号似然分布1424恢复第二源信号似然分布1404。
为了比较,图15还示出了在使用高斯假定的情况下包围每个接收信号似然分布1422、1424的高斯球。例如,期望是球的中心;而方差是球的半径。如图所示,似然分布1422、1424的高斯球交叠。理想情况下,两个高斯球应具有零交叠以避免干扰。为了满足该理想情况,有必要进一步将似然分布1422、1424在Y信号空间中分开,从而导致较低的频谱效率。如果两个高斯球之间存在某些交叠,则下行链路上的接收ED或上行链路上的接收BS处的接收器必须使用某种算法(例如Turbo接收器或干扰消除)来解决干扰。这样的算法趋向于相对复杂并且实现起来昂贵。相比之下,深度极化流接收器不依赖于高斯假定。因此,使用本文公开的示例,发送器可以将目标似然分布1422、1424整形为被更紧密地填充,以实现更高的频谱效率,而不会在接收器处引起明显更高的成本或复杂性。除非两个接收信号分布实际上彼此交叠,否则接收器不会将这些分布视为交叠。在该上下文中,每个ED处的接收器或者每个ED的BS侧接收器都是单用户接收器,并且可以不需要考虑旨在用于另一个ED的信号。
这引出了以下问题,即如何确定两个ED的信号分布在高维信号空间中是否交叠,尤其是当两个(或多于两个的)ED的发射信号受到不同的信道失真和功率衰减时。为了概括起见,考虑每个ED的信号分布在上行链路上经受不同的信道失真和衰减的情况。对于给定的UE-P,可以将信道视为函数fp(·),该函数将已发送信号分布在信号空间中进行再整形。假定另一个UE-Q,其在相同信号空间上发送其信号,但其信号经受不同的信道,该不同信道被表示为另一个函数fq(·)。两个信号在接收器处与附加的白噪声一起被复用,使得:
Y=fp(Txp(Zp))+fq(Txq(Zq))+N
其中,Y是接收信号分布,表示将在接收器处接收到的对应信号的概率分布;Txp()和Txq()分别是表示UE-P和UE-Q的物理层发送器的函数;Zp和Zq分别是UE-P和UE-Q的源位;以及N是噪声。
假定已知<fp(),fq()>(例如,通过先前的信道估计、反馈或信道上行链路/下行链路互易性)。如果可以知道两个接收信号fp(Txp(Zp))与fq(Txq(Zq))之间的交叠,则有可能调整<Txp(),Txq()>(例如,通过使用上面讨论的深度极化流),以在公共资源分配上产生最佳的分开的复用信号分布。
用于确定信号分布的这样的分开的传统方法通常取决于大量的离线模拟以及若干经验和启发式公式。在本公开内容中,该测量问题可以变成分类问题,该分类问题可以使用机器学习技术(例如,DNN)来(间接地)解决。
在本公开内容的示例中,用于确定两个接收信号分布之间的交叠的度量是<fp(Txp(Zp)),fq(Txq(Zq))>互信息。互信息越高,两个信号分布就越散开。通过使用DNN,接收器可以针对估计的<fp(),fq()>和给定的<Txp(),Txq()>测量互信息。互信息的测量可以从接收信号分布本身完全获悉,而不需要任何启发式推理。
图16A示出了TDMA的示例(2D信号空间中的最简单示例),其中来自UE-P和UE-Q的两个信号分布被复用到公共信号空间中(在该示例中,为10TTI和100MHz)。可以注意到,频率和时间是两个正交的维度。它们在频率维度上的投影是交叠的,但在时间维度上是完全分开的。结果是信号分布Xp和Xq严格彼此远离。
在图16B中,来自UE-P的信号中引入了时间延迟(例如由于信道失真)。因此,在接收器侧观察到了时间维度上的MAI。换言之,由于信道失真,信号分布Xp′在TTI#1处出现的概率从零增加到某非零不确定值。来自两个UE的信号分布在公共信号空间上传输,但具有不同的接收功率。假定这两个信号分布具有归一化功率偏移:wp和wq,其中wp+wq=1。Xp′与Xq′之间的互信息I可以表示为归一化功率偏移<wp,wq>和交叉熵Hcross(Xp′,Xq′)=-∑ip(i)·log(q(i))的函数,如下:
I(Xp′,Xq′)=wp·Hcross(X′p||wp·X′p+wq·X′q)+wq·Hcross(X′q||wp·X′p+wq·X′q)
互信息I(Xp′,Xq′)越大,Xp′与Xq′对将传递的信息越多。与香农(Shannon)容量极限类似,该互信息具有取决于<wp,wq>的极限。此外,互信息I(Xp′,Xq′)是对称的,意味着I(X′p,X′q)=I(Xq′,Xp′)。
如果<wp,wq>=<1/2,1/2>,则将I(Xp′,Xq′)简化为詹森-香农散度(Jenson-Shannon Divergence,JSD):
Figure GDA0003717945520000281
参照图17,考虑互信息测量的示例。假定存在两个UE即UE-P和UE-Q,它们被相等地供电,使得<wp,wq>=<1/2,1/2>。假定信号空间具有两个维度,即频率(100MHz)和时间(10TTI),由UE-Q和UE-P共享或复用。TDMA用于将来自两个UE的信号分布分开。UE-P占用TTI#0处的所有频带;而UE-Q占用TTI#θ处的所有100MHz频带。为了简单起见,这里不考虑信道失真。
在θ>=1的情况下(在TDMA中是完全正交的):
I(X′p,X′q)=log(2)
在此,互信息I(X′p,X′q)达到其在<wp,wq>=<1/2,1/2>情况下的最大值(log(2))。Xp′和Xq′被认为彼此完全散开并且不交叠。
在θ=1/2的情况下(在TDMA中部分交叠):
Figure GDA0003717945520000282
在此,互信息I(X′p,X′q)达到中值(小于最大值,但大于零),以指示Xp′和Xq′部分交叠的程度。
在θ=0的情况下:
I(X′p,X′q)=0
在此,互信息I(X′p,X′q)达到其在<wp,wq>=<1/2,1/2>情况下的最小值0。Xp′和Xq′被认为彼此完全交叠。
因此,如果互信息达到其最大值,则信号分布Xp′和Xq′不交叠,并且单用户检测器可以容易地检测到关注的信号。
Xp′与Xq′之间的互信息是:
I(Xp′,Xq′)=wp·Hcross(X′p||wp·X′p+wq·X′q)+wq·Hcross(X′q||wp·X′p+wq·X′q)
Figure GDA0003717945520000283
Figure GDA0003717945520000284
因此,互信息测量是:给定<Xp′,Xq′>,函数Ωp,q是划分两个信号分布的最佳尝试。因此,Ωp,q是尝试在信号空间中将两个信号分布进行划分的函数(或超平面)。图17通过绘制将两个信号分布Xp′和Xq′分开的log(Ω)和log(1-Ω)示出了这一点。为了比较,图18A示出了用于仅在信号空间(仍完全正交)中接触(但不交叠)的两个信号分布的log(Ω)和log(1-Ω);以及图18B示出了用于信号空间中交叠(仅部分正交)的两个信号分布的log(Ω)和log(1-Ω)。
不是测量p(i)和q(i),而是确定针对信号空间中的每个位置的Ω(i)就足够了。在空间(space)中的位置i处,可以证明:
Figure GDA0003717945520000291
其中,Ω(i)是一个位置i的解。总体解是:
Figure GDA0003717945520000292
通过使交叉熵最大化,可以将上式视为二元分类问题。在神经网络领域,已经对分类问题进行了深入研究。例如,DNN已用于执行图像分类。为了确定Xp'与Xq'的相似度(表示分开或交叠的量),可以使用类似的方法来训练DNN以执行分类。例如,
Figure GDA0003717945520000293
可以由DNN(或CNN)表示。Ω*(Xp′,Xq′)是可以区分Xp'与Xq'的DNN
Figure GDA0003717945520000294
的一组系数。
图19示出了示例DNN
Figure GDA0003717945520000295
1905,其可以替选地为CNN。在该示例中,对DNN 1905进行训练,以对输入信号空间——此处用信号分布Xp'和Xq'(但是可以存在多于两个信号分布)表示——进行分类并且输出针对所有i的交叉熵。目标/损失函数实际上是为了使
Figure GDA0003717945520000296
最大化。输出是Xp'与Xq'之间的交叉熵的实数值。例如,可以使用梯度上升后向传播来训练DNN 1905:
Figure GDA0003717945520000297
在对DNN进行充分训练(收敛)之后,DNN可以测量Xp'与Xq'之间的交叉熵。对于输入Y=Xp'+Xq',DNN的输出是测得的最大交叉熵:
Figure GDA0003717945520000298
将V与I(X′p,X′q)进行比较:
Figure GDA0003717945520000299
上面的讨论集中在Ω函数上,Ω函数将两个发送信号分布进行划分。然而,更令人关注的是表示接收信号分布的分开的互信息。这在图20中示意性地表示。在图20中,通过相应的编码器对UE-P和UE-Q的源位Zp、Zq分别进行编码,以生成源信号分布X p、Xq。对应的源信号各自以相应的功率wp、wq发送,并且经受可能的信道失真fp(·,t)、fq(·,t),以生成接收信号分布Xp'和Xq'。因此,DNN 1905的输入是Xp'与Xq',而输出是交叉熵的度量。
接收器可以将若干V值(由若干输入数据得出)取平均为
Figure GDA0003717945520000301
其使
Figure GDA0003717945520000302
小于(wp·log(wp)+wq·log(wq))以获得互信息I(X′p,X′q)。其范围为[0,-(wp·log(wp)+wq·log(wq))]。DNN 1905可以用于测量与候选目标Xp和Xq的集合(其表示对应的候选目标信号的概率)对应的Xp'与Xq'之间的交叉熵。如果DNN 1905确定Xp'与Xq'有足够的间隔(例如,交叉熵被最大化),则选择具有分布Xp和Xq的候选目标信号作为极化流的目标信号分布。然后可以如上所述使用所选择的目标信号来训练f网络。如果DNN 1905确定Xp'与Xq'的间隔不足(例如,交叉熵接近于0),则应生成(例如,通过在一个或更多个维度上增加间隔)并评估候选目标分布Xp和Xq的新集合。可以注意到,使用DNN 1905来测量交叉熵可以指示两个信号分布是分开的(即,在信号空间中没有交叠),但是它不能量化分开的量。
在图1的示例无线系统100的上下文中,在一些示例中,DNN 1905可以由BS 170实现。例如,当新的ED 110加入BS 170时,BS 170可能需要找到较高维度Y信号空间中的不干扰其他ED 110的用于新的ED 110的目标信号分布。BS 170可以使用DNN 1905(例如,由BS170的通用处理器或专用处理器来实现)来评估候选目标信号分布,并且确定候选目标信号分布对于与新ED 110的通信是否令人满意。令人满意的候选目标信号分布可以是在较高维度Y信号空间中不与和其他ED的现有通信交叠的候选信号分布。换言之,如果DNN 1905输出最大化的交叉熵值,则候选目标信号分布将是令人满意的。一旦BS 170找到用于新ED 110的令人满意的目标信号分布,BS 170就可以训练f网络以找到实现用于新ED 110的目标信号分布的(例如,在下行链路通信的BS 170的发送器中的对应的反向极化流中实现的,或者在上行链路通信的ED 110的发送器中实现的)极化流的缩放函数和偏移函数(例如,使用与DNN分开的单个DNN或两个DNN实现)。然后,BS 170可以与新ED 110进行通信。在一些示例中,候选目标信号分布的评估可以由系统100中的另一实体执行。例如,BS 170可以请求核心网络130找到用于新ED 110的令人满意的目标信号分布。核心网络130可以实现DNN1905,以评估候选目标信号分布并且找到用于新ED 110的令人满意的目标信号分布。
这里讨论的示例将用于实现缩放函数和偏移函数的一个或更多个DNN描述为与用于输出交叉熵值的DNN 1905分开。然而,在一些实现方式中,可以使用单个DNN以用于输出交叉熵值,以及用于实现缩放函数和/或偏移函数。例如,可以训练单个DNN以输出针对两个候选目标信号分布的交叉熵值,并且(如果交叉熵值指示候选目标信号分布充分非交叠),则进一步训练该单个DNN以实现缩放函数和偏移函数以实现候选目标信号分布。
本文公开的示例可以适用于不同的无线通信场景。为了在多址技术中实现,例如,可以(例如,通过标准)定义Y的复用信号空间,并且机器学习算法(例如,DNN)可以学习如何针对要复用的所有信号将常规信号转换为Y的目标分布区域。
图21示出了MU-MIMO的示例。在该示例中,从发送器(在这种情况下为BS)的角度进行说明,在X信号空间中分别存在针对UE-1、UE-2和UE-3的源信号似然分布2102、2104、2106。发送器使用相应的g网络2112、2114、2116将每个源信号似然分布2102、2104、2106整形为MIMO信号空间(复用的Y信号空间)中的相应目标似然分布2122、2124、2126。然后,可以将复用的信号似然分布2122、2124、2126发送到UE-1、UE-2和UE-3。值得注意的是,可以使用已经被训练成将源信号似然分布2102、2104、2106整形为在MIMO信号空间中不交叠的目标分布2122、2124、2126的DNN来实现g网络2112、2114、2116。因此,不是求解最小均方误差(minimum mean square error,MMSE)配对的最佳方程(如传统上所做的那样),而是使用基于机器学习的方法,这种方法的计算开销可以较小。每个ED接收器可以使用对应的f网络作为接收器,以从MIMO接收信号空间(具有噪声的Y信号空间)解码其自身的信号。
在传统方法中,求解MIMO配对或分组涉及遍历所有可能性并求解大维度特征值分解(eigenvalue decomposition,EVD)问题。在实践中,这是非常昂贵的,并且对于较大的维度可能是过分昂贵的。在本公开内容中,使用由机器学习辅助的深度极化流方法,可以解决该问题。
即使对于单用户系统(例如,广播通信),本文公开的深度极化流方法也可以用于扩展一个低维信号以完全占据较高维度信号空间以使维度增益最大化。在图22中示出了示例,该示例示出了从X信号空间到较高维度Y信号空间的传输信号的整形。如图所示,源信号似然分布2202占据X信号空间的相对较小的部分。发送器可以使用经过训练的g网络2212来将源信号似然分布2202整形为占据Y信号空间的较大部分的目标信号似然分布2222。如果在极化流的每个步骤处的混洗函数都经过精心设计,则接收发送信号的基于连续消除的接收器可以用来充分利用维度增益。
在一些示例中,接收器可以迭代地使用f网络和g网络以进一步提高解码性能。图23中示出了示例。在该示例中,存在两个ED,即UE-1和UE-2。UE-1处的第一接收器使用第一f网络2342从较高维度Y信号空间中的第一接收信号似然分布2322(其可能具有添加的噪声,如由围绕信号似然分布2322的虚线所示)恢复较低维度X信号空间中的第一源信号似然分布2302。类似地,UE-2处的第二接收器使用第二f网络2344从Y信号空间中的第二接收信号似然分布2324恢复X信号空间中的第二源信号似然分布2304。
第一接收器可以进一步使用第一g网络2312将第一源信号似然分布2302转换到Y信号空间,并且将结果迭代回第一f网络2342。第二接收器可以使用第二g网络2314执行类似的操作。从单用户的角度来看,在f网络与g网络之间迭代的解码器的操作类似于消息传递算法。如果f网络和g网络在解码期间定期掉出一些神经元,则解码器的行为可能类似于连续消除算法。
在一些示例中,接收器是BS,在这种情况下,第一g网络2312、第二g网络2314、第一f网络2342和第二f网络2344可以全部在BS的接收器中实现。在这种情况下,可以将第一g网络2312的输出提供给第二f网络2344,并且类似地,可以将第二g网络2314的输出提供给第一f网络2342。从多用户的角度来看,如果将来自一个用户的重构信号传递给另一个用户,则接收器的行为类似于干扰消除算法。通常,因为f网络和g网络二者在接收器处都是已知的,所以接收器或解码器可以使各种不同的算法演进,以帮助提高解码器的性能。
本公开内容包括描述了对于下行链路通信作为发送器的角色的BS以及作为接收器的角色的ED的示例。应当理解,本发明还适用于:对于上行链路通信,BS为接收器的角色并且ED为发送器的角色的场景;以及对于侧链或者设备到设备(device-to-device,D2D)通信,多个ED为发送器和接收器的角色的场景。BS通常可以确定用于实现f网络和g网络的DNN和权重,并且可以将该信息传达给相关的ED。在BS与多个ED通信的情况下,BS可以并行使用多个f网络和/或g网络来与不同的ED通信。
在上述示例中,可以使用两个神经网络来实现偏移函数和缩放函数,或者可以使用一个神经网络来实现偏移函数和缩放函数二者。
在本文描述的示例中,已将g网络描述为用于发送器的反向极化流,并且已将f网络描述为用于接收器的极化流。然而,在其他示例中,可以将f网络用于发送器,并且可以将g网络用于接收器。
尽管本公开内容以一定顺序描述了具有步骤的方法和过程,但是可以适当地省略或改变方法和过程中的一个或更多个步骤。一个或更多个步骤可以适当地按照与其被描述的顺序不同的顺序进行。
尽管至少部分地在方法方面描述了本公开内容,但是本领域普通技术人员将理解,本公开内容也涉及用于执行所描述的方法的至少一些方面和特征的各种部件,这可以通过硬件部件、软件或两者的任何组合。因此,本公开内容的技术解决方案可以以软件产品的形式实施。合适的软件产品可以存储在预先记录的存储设备或者其他类似的非易失性或非暂态计算机可读介质中,包括例如DVD、CD-ROM、USB闪存盘、可移动硬盘或其他存储介质。软件产品包括其上有形存储的指令,所述指令使得处理设备(例如,个人计算机、服务器或网络设备)能够执行本文中所公开的方法的示例。机器可执行指令可以是代码序列、配置信息或其他数据的形式,其在被执行时使机器(例如,处理器或其他处理设备)执行根据本公开内容的示例的方法中的步骤。
在不脱离权利要求的主题的情况下,本公开内容可以以其他特定形式实施。所描述的示例实施方式在所有方面都应被视为仅是说明性而非限制性的。可以将来自一个或更多个上述实施方式的选定特征进行组合以创建未明确描述的替选实施方式,适合于这样的组合的特征被理解为在本公开内容的范围内。
还公开了所公开范围内的所有值和子范围。此外,尽管本文所公开和示出的系统、设备和过程可以包括特定数量的元件/组件,但是可以修改系统、设备和组件以包括附加的或更少的这样的元件/组件。例如,尽管所公开的任何元件/部件可以被认为是单数,但是可以修改本文所公开的实施方式以包括多个这样的元件/部件。本文所描述的主题旨在涵盖和包含所有合适的技术变化。

Claims (22)

1.一种用于无线通信的装置,所述装置包括:
发送器,用于实现反向极化流以将第一信号空间中的第一源信号整形为第二信号空间中的第一目标信号,其中,所述反向极化流是通过级联一个或更多个反向极化步骤实现的,每个反向极化步骤包括:
混洗函数,其将输入信息集进行混洗,并且输出混洗信息集;
分割函数,其将所述混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;
缩放函数,其应用于所述第二分割信息组以生成缩放矢量;以及
偏移函数,其应用于所述第二分割信息组以生成偏移矢量;并且
所述反向极化步骤输出第一输出信息组和第二输出信息组,所述第一输出信息组和所述第二输出信息组一起形成输出信息集,所述第一输出信息组为:所述第一分割信息组逐元素地乘以所述缩放矢量,并且逐元素地加上所述偏移矢量;并且所述第二输出信息组是所述第二分割信息组;并且
所述发送器还用于将所述第一目标信号发送给至少一个接收装置。
2.根据权利要求1所述的装置,其中,所述反向极化流与极化流可逆,所述极化流从所述第一目标信号恢复所述第一源信号,所述混洗函数、分割函数、缩放函数和偏移函数在所述极化流中相同。
3.根据权利要求1或权利要求2所述的装置,其中,所述反向极化流中的所有反向极化步骤至少共享:公共的混洗函数、公共的分割函数、公共的缩放函数或公共的偏移函数。
4.根据权利要求1或2所述的装置,其中,使用至少一个神经网络来实现所述缩放函数和所述偏移函数。
5.根据权利要求4所述的装置,其中,使用第一神经网络来实现所述缩放函数,并且使用第二神经网络来实现所述偏移函数。
6.根据权利要求4所述的装置,其中,所述反向极化流与极化流可逆,所述极化流从所述第一目标信号恢复所述第一源信号,其中,在所述极化流上训练所述至少一个神经网络。
7.根据权利要求6所述的装置,其中,所述装置是基站,并且所述基站用于将所述至少一个神经网络的经过训练的权重发送到至少一个电子装置,使得所述至少一个电子装置能够实现所述极化流。
8.根据权利要求6所述的装置,其中,所述装置是电子装置,并且所述电子装置用于从基站接收所述至少一个神经网络的经过训练的权重,以使得所述电子装置能够实现所述反向极化流。
9.根据权利要求1或2所述的装置,其中,所述发送器用于实现用于将所述第一源信号整形为所述第一目标信号的第一反向极化流,以及用于将所述第一信号空间中的第二源信号整形为所述第二信号空间中的第二目标信号的第二反向极化流,其中,所述第一目标信号用于发送到第一接收装置,并且所述第二目标信号用于发送到第二接收装置。
10.根据权利要求9所述的装置,其中,所述第一源信号与所述第二源信号在所述第一信号空间中交叠,并且其中,所述第一目标信号与所述第二目标信号在所述第二信号空间中不交叠,其中,将所述第一目标信号和所述第二目标信号作为复用信号进行发送。
11.根据权利要求1或2所述的装置,其中,将所述第一源信号整形为所述第一目标信号以实现维度增益。
12.一种用于无线通信的装置,所述装置包括:
接收器,用于从发送装置接收第一接收信号;
所述接收器还用于实现极化流以从第二信号空间中的所述第一接收信号恢复第一信号空间中的第一源信号,其中,所述极化流是通过级联一个或更多个极化步骤实现的,每个极化步骤包括:
混洗函数,其将输入信息集进行混洗,并且输出混洗信息集;
分割函数,其将所述混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;
缩放函数,其应用于所述第二分割信息组以生成缩放矢量;以及
偏移函数,其应用于所述第二分割信息组以生成偏移矢量;并且
所述极化步骤输出第一输出信息组和第二输出信息组,所述第一输出信息组和所述第二输出信息组一起形成输出信息集,所述第一输出信息组为:从所述第一分割信息组逐元素地减去所述偏移矢量,并且逐元素地除以所述缩放矢量;并且所述第二输出信息组是所述第二分割信息组。
13.根据权利要求12所述的装置,其中,使用至少一个神经网络来实现所述缩放函数和所述偏移函数。
14.根据权利要求13所述的装置,其中,使用第一神经网络来实现所述缩放函数,并且使用第二神经网络来实现所述偏移函数。
15.根据权利要求13或权利要求14所述的装置,其中,在所述极化流上训练所述至少一个神经网络,所述极化流与反向极化流可逆,所述反向极化流将所述第一源信号整形为第一目标信号以用于发送。
16.根据权利要求15所述的装置,其中,所述装置是基站,并且所述基站用于将所述至少一个神经网络的经过训练的权重发送到至少一个电子装置,以使得所述至少一个电子装置能够实现所述反向极化流。
17.根据权利要求13或14所述的装置,其中,所述装置是电子装置,并且其中,使用从基站接收的经过训练的权重来实现所述至少一个神经网络。
18.根据权利要求12至14中任一项所述的装置,其中,所述装置是与第一电子装置和第二电子装置通信的基站,其中,所述接收器用于实现用于从接收的复用信号恢复来自所述第一电子装置的第一源信号的第一极化流,并且所述接收器还用于实现用于从所述接收的复用信号恢复来自所述第二电子装置的第二源信号的第二极化流。
19.根据权利要求12至14中任一项所述的装置,其中,所述接收器还用于实现作为所述极化流的逆的反向极化流,并且所述接收器还用于迭代地使用所述极化流和所述反向极化流来恢复所述第一源信号。
20.一种用于无线通信方法,包括:
实现反向极化流以将第一信号空间中的第一源信号整形为第二信号空间中的第一目标信号,其中,所述反向极化流是通过级联一个或更多个反向极化步骤实现的,每个反向极化步骤包括:
混洗函数,其将输入信息集进行混洗,并且输出混洗信息集;
分割函数,其将所述混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;
缩放函数,其应用于所述第二分割信息组以生成缩放矢量;以及
偏移函数,其应用于所述第二分割信息组以生成偏移矢量;并且
所述反向极化步骤输出第一输出信息组和第二输出信息组,所述第一输出信息组和所述第二输出信息组一起形成输出信息集,所述第一输出信息组为:所述第一分割信息组逐元素地乘以所述缩放矢量,并且逐元素地加上所述偏移矢量;并且所述第二输出信息组是所述第二分割信息组;并且
将所述第一目标信号发送给至少一个接收装置。
21.一种用于无线通信方法,包括:
从发送装置接收第一接收信号;
实现极化流以从第二信号空间中的所述第一接收信号恢复第一信号空间中的第一源信号,其中,所述极化流是通过级联一个或更多个极化步骤实现的,每个极化步骤包括:
混洗函数,其将输入信息集进行混洗,并且输出混洗信息集;
分割函数,其将所述混洗信息集进行分割,并且输出第一分割信息组和第二分割信息组;
缩放函数,其应用于所述第二分割信息组以生成缩放矢量;以及
偏移函数,其应用于所述第二分割信息组以生成偏移矢量;并且
所述极化步骤输出第一输出信息组和第二输出信息组,所述第一输出信息组和所述第二输出信息组一起形成输出信息集,所述第一输出信息组为:从所述第一分割信息组逐元素地减去所述偏移矢量,并且逐元素地除以所述缩放矢量;并且所述第二输出信息组是所述第二分割信息组。
22.一种计算机可读存储介质,用于存储指令,当所述指令在无线通信装置中运行时,使得如权利要求20或21所述的方法被执行。
CN202080020105.7A 2019-03-29 2020-03-28 使用基于极化的信号空间映射的用于无线通信的方法和装置 Active CN113557704B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962826034P 2019-03-29 2019-03-29
US62/826,034 2019-03-29
US16/562,045 US10980030B2 (en) 2019-03-29 2019-09-05 Method and apparatus for wireless communication using polarization-based signal space mapping
US16/562,045 2019-09-05
PCT/CN2020/081902 WO2020200129A1 (en) 2019-03-29 2020-03-28 A method and apparatus for wireless communication using polarization-based signal space mapping

Publications (2)

Publication Number Publication Date
CN113557704A CN113557704A (zh) 2021-10-26
CN113557704B true CN113557704B (zh) 2022-11-11

Family

ID=72605206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080020105.7A Active CN113557704B (zh) 2019-03-29 2020-03-28 使用基于极化的信号空间映射的用于无线通信的方法和装置

Country Status (4)

Country Link
US (1) US10980030B2 (zh)
EP (1) EP3932039A4 (zh)
CN (1) CN113557704B (zh)
WO (1) WO2020200129A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11710042B2 (en) * 2020-02-05 2023-07-25 Adobe Inc. Shaping a neural network architecture utilizing learnable sampling layers
US11663481B2 (en) 2020-02-24 2023-05-30 Adobe Inc. Neural network architecture pruning
WO2022244904A1 (ko) * 2021-05-21 2022-11-24 엘지전자 주식회사 오토 인코더를 이용하는 무선 통신 시스템에서 신호를 송수신하기 위한 방법 및 이를 위한 장치
US11777812B2 (en) * 2021-06-25 2023-10-03 Qualcomm Technologies, Inc. Zone-based federated learning
CN114244666B (zh) * 2021-12-20 2023-09-12 北京零壹空间电子有限公司 极化分集接收方法、装置、计算机设备和存储介质
CN115296750B (zh) * 2022-09-28 2023-01-17 鹏城实验室 一种基于高斯近似改进法构造极化码的水声通信系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594767A (zh) * 2012-02-09 2012-07-18 复旦大学 通信系统中信号的极化和幅度结合的三维调制方法
WO2019015743A1 (en) * 2017-07-17 2019-01-24 Huawei Technologies Duesseldorf Gmbh APPARATUS AND METHOD FOR ENCODING A MESSAGE INCLUDING TARGET PROBABILITY DISTRIBUTION OF CODE SYMBOLS

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7751873B2 (en) * 2006-11-08 2010-07-06 Biotronik Crm Patent Ag Wavelet based feature extraction and dimension reduction for the classification of human cardiac electrogram depolarization waveforms
CN102611713B (zh) 2012-04-10 2015-03-25 西南交通大学 基于熵运算的网络入侵检测方法和装置
GB2514111A (en) * 2013-05-13 2014-11-19 British Broadcasting Corp Transmission techniques
CN103281166B (zh) 2013-05-15 2016-05-25 北京邮电大学 一种基于极化码的混合自动重传请求传输方法
CN103746708A (zh) 2013-10-25 2014-04-23 中国农业大学 一种Polar-LDPC级联码的构造方法
US9747089B2 (en) * 2014-10-21 2017-08-29 International Business Machines Corporation Automatic conversion of sequential array-based programs to parallel map-reduce programs
US10762891B2 (en) * 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN107194336B (zh) * 2017-05-11 2019-12-24 西安电子科技大学 基于半监督深度距离度量网络的极化sar图像分类方法
CN107909115B (zh) 2017-12-04 2022-02-15 上海师范大学 一种图像中文字幕生成方法
CN108256453A (zh) * 2018-01-06 2018-07-06 天津大学 一种基于一维ecg信号提取二维cnn特征的方法
CN108491925A (zh) * 2018-01-25 2018-09-04 杭州电子科技大学 基于隐变量模型的深度学习特征泛化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594767A (zh) * 2012-02-09 2012-07-18 复旦大学 通信系统中信号的极化和幅度结合的三维调制方法
WO2019015743A1 (en) * 2017-07-17 2019-01-24 Huawei Technologies Duesseldorf Gmbh APPARATUS AND METHOD FOR ENCODING A MESSAGE INCLUDING TARGET PROBABILITY DISTRIBUTION OF CODE SYMBOLS

Also Published As

Publication number Publication date
US10980030B2 (en) 2021-04-13
WO2020200129A1 (en) 2020-10-08
US20200314827A1 (en) 2020-10-01
EP3932039A4 (en) 2022-07-20
EP3932039A1 (en) 2022-01-05
CN113557704A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN113557704B (zh) 使用基于极化的信号空间映射的用于无线通信的方法和装置
Awan et al. Detection for 5G-NOMA: An online adaptive machine learning approach
US20220376956A1 (en) Transmission System with Channel Estimation Based on a Neural Network
CN114208120B (zh) 用于在通信系统中使用的基于神经网络的距离度量
Wei et al. Weighted message passing algorithm for SCMA
JP2023535198A (ja) 大規模ビームフォーミングシステムのためのハイブリッド・メッセージ・パッシング・アルゴリズム・ベースの深層学習ニューラルネットワーク
US20220418008A1 (en) Transmitting device, receiving device, and methods for random-access communication
WO2023024850A1 (en) Methods and systems for source coding using a neural network
Mattu et al. Deep channel prediction: A DNN framework for receiver design in time-varying fading channels
Struminsky et al. A new approach for sparse Bayesian channel estimation in SCMA uplink systems
JP2023520245A (ja) Csiエラーを伴うノイズの多い過負荷無線通信システムにおける離散デジタル信号の推定方法
CN113273106B (zh) 上行链路数据流的处理
US20220374685A1 (en) Provision of Optimized Action for Application in a Wireless Communication Network to Affect Data Transmission Over a Communication Channel
Sanjana et al. Deep learning approaches used in downlink MIMO-NOMA system: a survey
Zhu et al. Joint transceiver optimization for wireless communication PHY with convolutional neural network
CN114830607A (zh) 用于大型多维无线系统的无线x2x接入方法和接收器
Kim AI-Enabled Physical Layer
Hedaoo et al. Design of Low Complexity Channel Estimation and Reduced BER in 5G Massive MIMO OFDM System
Mirzaei Channel Estimation in TDD and FDD-Based Massive MIMO Systems
He et al. 5 Channel Estimation, Feedback, and Signal Detection
Xie Applications of deep learning for physical layer of wireless communication systems
Wang Compressive Sensing Based Grant-Free Communication
Ye et al. Artificial Intelligence for Wireless Physical-Layer Technologies (AI4PHY): A Comprehensive Survey
Van Luong Reliable and Low-complexity Multicarier Systems
Kim Multiuser MIMO techniques with feedback

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant