CN116368749A

CN116368749A - 使用条件变分自编码器对无线信道的数据驱动概率建模

Info

Publication number: CN116368749A
Application number: CN202180069391.0A
Authority: CN
Inventors: A·贝布迪; S·郑; J·B·索里亚加; M·威林; T·奥雷康迪
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2020-10-19
Filing date: 2021-10-19
Publication date: 2023-06-30
Also published as: US20220123966A1; EP4229557A1; KR20230091093A; US11929853B2; WO2022086962A1

Abstract

一种由人工神经网络执行的方法包括基于传送和接收序列的数据集来确定表示信道的条件概率分布。该方法还包括基于该条件概率分布来确定该信道的隐表示。该方法进一步包括基于该隐表示来执行基于信道的功能。

Description

使用条件变分自编码器对无线信道的数据驱动概率建模

相关申请的交叉引用

本申请要求于2021年10月18日提交的题为“DATA-DRIVEN PROBABILISTICMODELING OF WIRELESS CHANNELS USING CONDITIONAL VARIATIONAL AUTO-ENCODERS(使用条件变分自编码器对无线信道的数据驱动概率建模)”的美国专利申请No.17/504,341的优先权，后者要求于2020年10月19日提交的题为“DATA-DRIVEN PROBABILISTIC MODELINGOF WIRELESS CHANNELS USING CONDITIONAL VARIATIONAL AUTO-ENCODERS(使用条件变分自编码器对无线信道的数据驱动概率建模)”的美国临时专利申请No.63/093,728的权益，这些申请的公开内容通过援引整体明确纳入于此。

公开领域

本公开的各方面一般涉及无线通信，尤其涉及用于对无线信道的数据驱动概率建模的技术和装置。

背景

无线通信系统被广泛部署以提供诸如电话、视频、数据、消息接发、和广播等各种电信服务。典型的无线通信系统可以采用能够通过共享可用的系统资源(例如，带宽、发射功率等)来支持与多个用户通信的多址技术。此类多址技术的示例包括码分多址(CDMA)系统、时分多址(TDMA)系统、频分多址(FDMA)系统、正交频分多址(OFDMA)系统、单载波频分多址(SC-FDMA)系统、时分同步码分多址(TD-SCDMA)系统、以及长期演进(LTE)。LTE/高级LTE是对由第三代伙伴项目(3GPP)颁布的通用移动电信系统(UMTS)移动标准的增强集。

无线通信网络可包括能支持数个用户装备(UE)通信的数个基站(BS)。用户装备(UE)可经由下行链路和上行链路来与基站(BS)通信。下行链路(或即前向链路)指从BS到UE的通信链路，而上行链路(或即反向链路)指从UE到BS的通信链路。如将更详细描述的，BS可以被称为B节点、gNB、接入点(AP)、无线电头端、传送接收点(TRP)、新无线电(NR)BS、5G B节点等等。

以上多址技术已经在各种电信标准中被采纳以提供使得不同的用户装备能够在城市、国家、地区、以及甚至全球级别上进行通信的共同协议。新无线电(NR)(其还可被称为5G)是对由第三代伙伴项目(3GPP)颁布的LTE移动标准的增强集。NR被设计成通过在下行链路(DL)上使用具有循环前缀(CP)的正交频分复用(OFDM)(CP-OFDM)、在上行链路(UL)上使用CP-OFDM和/或SC-FDM(例如，还被称为离散傅里叶变换扩展OFDM(DFT-s-OFDM))以及支持波束成形、多输入多输出(MIMO)天线技术和载波聚集以改善频谱效率、降低成本、改善服务、利用新频谱、以及与其他开放标准更好地整合，来更好地支持移动宽带因特网接入。

人工神经网络可以包括诸群互连的人工神经元(例如，神经元模型)。人工神经网络可以是计算设备或表示为要由计算设备执行的方法。卷积神经网络(诸如深度卷积神经网络)是一种前馈人工神经网络。卷积神经网络可以包括可以在平铺感受野中配置的各神经元层。将神经网络处理应用于无线通信以达成更高的效率将是合乎需要的。

概述

在本公开的一个方面，公开了一种使用人工神经网络的方法。该方法包括：基于传送和接收序列的数据集来确定表示信道的条件概率分布。该方法还包括：基于该条件概率分布来确定该信道的隐表示。该方法进一步包括：基于该隐表示来执行基于信道的功能。

本公开的另一方面涉及一种设备，包括：用于基于传送和接收序列的数据集来确定表示信道的条件概率分布的装置。该设备还包括：用于基于传送和接收序列的数据集来确定表示信道的条件概率分布的装置。该设备进一步包括：用于基于隐表示来执行基于信道的功能的装置。

在本公开的另一方面，公开了一种其上记录有非瞬态程序代码的非瞬态计算机可读介质。该程序代码由处理器执行并且包括：用于基于传送和接收序列的数据集来确定表示信道的条件概率分布的程序代码。该程序代码还包括：用于基于该条件概率分布来确定该信道的隐表示的程序代码。该程序代码进一步包括：用于基于该隐表示来执行基于信道的功能的程序代码。

本公开的另一方面涉及一种用于人工神经网络的装置。该装置具有存储器、耦合到该存储器的一个或多个处理器、以及存储在该存储器中的指令。这些指令在由该处理器执行时能操作用于使得该装置：基于传送和接收序列的数据集来确定表示信道的条件概率分布。这些指令还使得该装置：基于该条件概率分布来确定该信道的隐表示。这些指令附加地使得该装置：基于该隐表示来执行基于信道的功能。

各方面一般包括如基本上参照附图和说明书描述并且如附图和说明书所解说的方法、装置、系统、计算机程序产品、非瞬态计算机可读介质、用户装备、基站、无线通信设备和处理系统。

前述内容已较宽泛地勾勒出根据本公开的示例的特征和技术优势以力图使下面的详细描述可被更好地理解。附加的特征和优势将在此后描述。所公开的概念和具体示例可容易地被用作修改或设计用于实施与本公开相同目的的其他结构的基础。此类等效构造并不背离所附权利要求书的范围。所公开的概念的特性在其组织和操作方法两方面以及相关联的优势将因结合附图来考虑以下描述而被更好地理解。每一附图是出于解说和描述目的来提供的，而非定义对权利要求的限定。

附图简述

为了可以详细地理解本公开的特征，可以参照各方面进行更具体的描述，其中一些方面在附图中解说。然而应注意，附图仅解说了本公开的某些方面，故不应被认为限定其范围，因为本描述可允许有其他等同有效的方面。不同附图中的相同附图标记可标识相同或相似的元素。

图1是概念性地解说根据本公开的各个方面的无线通信网络的示例的框图。

图2是概念性地解说根据本公开的各个方面的无线通信网络中基站与用户装备(UE)处于通信的示例的框图。

图3解说了根据本公开的某些方面的使用片上系统(SOC)(包括通用处理器)来设计神经网络的示例实现。

图4A、4B和4C是解说根据本公开的各方面的神经网络的示图。

图4D是解说根据本公开的各方面的示例性深度卷积网络(DCN)的示图。

图5是解说根据本公开的各方面的示例性深度卷积网络(DCN)的框图。

图6是解说根据本公开的各方面的条件变分自编码器(VAE)的示例的框图。

图7A是解说根据本公开的各方面的信道的示例的框图。

图7B是解说根据本公开的各方面的信道建模系统的示例的框图。

图8是解说根据本公开的各个方面的例如由人工神经网络执行的示例过程的流程图。

详细描述

以下参照附图更全面地描述本公开的各个方面。然而，本公开可用许多不同形式来实施并且不应解释为被限于本公开通篇给出的任何具体结构或功能。相反，提供这些方面是为了使得本公开将是透彻和完整的，并且其将向本领域技术人员完全传达本公开的范围。基于本教导，本领域技术人员应领会，本公开的范围旨在覆盖本文中所描述的本公开的任何方面，不论其是与本公开的任何其他方面相独立地实现还是组合地实现的。例如，可使用所阐述的任何数目的方面来实现装置或实践方法。另外，本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者另外的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解，所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。

现在将参照各种装置和技术给出电信系统的若干方面。这些装置和技术将在以下详细描述中进行描述、在附图中由各种框、模块、组件、电路、步骤、过程、算法等(统称为“元素”)来解说。这些元素可使用硬件、软件、或其组合来实现。此类元素是实现成硬件还是软件取决于具体应用和加诸于整体系统上的设计约束。

应当注意到，虽然各方面可使用通常与5G和后代无线技术相关联的术语来描述，但本公开的各方面可以在基于其他代的通信系统(诸如并包括3G和/或4G技术)中应用。

常规无线通信系统可以将无线信道建模为线性系统。在此类系统中，可通过与增益和延迟相关联的信道抽头群集来捕获传播信道属性。在一些示例中，常规系统基于射频(RF)传播的数学抽象和物理特性(例如，物理定律)来对信道进行建模。在此类示例中，诸如延迟扩展、多普勒、载波频率和带宽之类的参数可以被提供给模型。随后可以基于这些参数来对信道进行建模。在该示例中，可能难以从经建模信道推断信道属性。此外，为信道指定的模型可能受限于一般场景和/或构建成本高昂。

在其他示例中，常规系统可通过将参数模型拟合(例如，模型拟合)到信道测量(诸如输入-输出序列)来对信道进行建模。模型拟合可能无法对复杂信道进行建模。附加地，模型拟合是不易处理的。即，模型拟合是不可微分的。相比之下，易处理模型可由神经网络来表示。附加地，易处理模型是可微分的。因此，一个或多个参数可经由反向传播来学习。

机器学习系统可实现生成建模，以学习数据集{x_i,＝1,…,}中数据x的隐表示z。隐表示可基于生成过程P_θ(x|z)来学习。生成过程是指在给定隐表示z的情况下数据x的条件分布。生成模型可改进推断并且可学习有向概率模型。变分自编码器(VAE)和生成对抗网络(GAN)是生成模型的示例。在一些示例中，条件VAE执行基于信道的功能以用于估计信道、解码信道码、压缩信道状态和/或检测经由信道接收的信号。压缩是指压缩信道状态。例如，信道可被压缩以用于信道状态反馈(CSF)。解码是指解码信道码，诸如低密度奇偶校验(LDPC)解码。作为示例，可基于信道的条件概率来确定关于所传送比特的对数似然比(LLR)。LLR可被用于解码，诸如LDPC解码。最后，检测是指找到所传送码元，诸如多输入多输出(MIMO)检测。

如所描述的，生成模型(诸如VAE)可被用于估计信道。在此类示例中，信道可由条件概率分布P_θ(y|来表示，其中参数y表示信道输出并且参数x表示信道输入。可期望基于易处理且可微分架构(例如，神经网络架构)来近似信道(例如，复杂信道)的条件概率P_θ(y|)。附加地，可能期望改进用于生成新信道实例的过程。

本公开的各方面一般涉及用于在无线通信系统中使用生成模型的技术和装置。可实现本公开中所描述的主题内容的特定方面以达成以下潜在优点中的一者或多者。在一些方面，生成建模可改进新信道(诸如用于模拟的新信道)的生成。作为另一示例，生成建模可学习对应于信道的条件分布。附加地，生成模型可被用于端到端地训练基于深度学习的收发机。在这些示例中，梯度可通过信道反向传播以训练生成模型。此外，生成模型可被用作通过其可以反向传播梯度的信道的微分模拟器。

图1是解说可以在其中实践本公开的各方面的网络100的示图。网络100可以是5G或NR网络或某个其他无线网络，诸如LTE网络。无线网络100可包括数个基站(BS)110(示为BS 110a、BS 110b、BS 110c、以及BS 110d)和其他网络实体。BS是与用户装备(UE)通信的实体并且还可被称为基站、NR BS、B节点、gNB、5G B节点(NB)、接入点、传送接收点(TRP)、等等。每个BS可为特定地理区域提供通信覆盖。在3GPP中，术语“蜂窝小区”可以指BS的覆盖区域和/或服务该覆盖区域的BS子系统，这取决于使用该术语的上下文。

BS可以为宏蜂窝小区、微微蜂窝小区、毫微微蜂窝小区、和/或另一类型的蜂窝小区提供通信覆盖。宏蜂窝小区可覆盖相对较大的地理区域(例如，半径为数千米)，并且可允许由具有服务订阅的UE无约束地接入。微微蜂窝小区可覆盖相对较小的地理区域，并且可允许由具有服务订阅的UE无约束地接入。毫微微蜂窝小区可覆盖相对较小的地理区域(例如，住宅)，并且可允许由与该毫微微蜂窝小区有关联的UE(例如，封闭订户群(CSG)中的UE)有约束地接入。用于宏蜂窝小区的BS可被称为宏BS。用于微微蜂窝小区的BS可被称为微微BS。用于毫微微蜂窝小区的BS可被称为毫微微BS或家用BS。在图1中示出的示例中，BS 110a可以是用于宏蜂窝小区102a的宏BS，BS 110b可以是用于微微蜂窝小区102b的微微BS，并且BS 110c可以是用于毫微微蜂窝小区102c的毫微微BS。BS可支持一个或多个(例如，三个)蜂窝小区。术语“eNB”、“基站”、“NR BS”、“gNB”、“TRP”、“AP”、“B节点”、“5G NB”和“蜂窝小区”可以可互换地使用。

在一些方面，蜂窝小区可以不必是驻定的，并且蜂窝小区的地理区域可根据移动BS的位置而移动。在一些方面，BS可通过各种类型的回程接口(诸如直接物理连接、虚拟网络等等)使用任何合适的传输网络来彼此互连和/或互连至无线网络100中的一个或多个其他BS或网络节点(未示出)。

无线网络100还可以包括中继站。中继站是能接收来自上游站(例如，BS或UE)的数据的传输并向下游站(例如，UE或BS)发送该数据的传输的实体。中继站也可是能为其他UE中继传输的UE。在图1中示出的示例中，中继站110d可与宏BS 110a和UE 120d进行通信以促成BS 110a与UE 120d之间的通信。中继站还可被称为中继BS、中继基站、中继等等。

无线网络100可以是包括不同类型的BS(例如，宏BS、微微BS、毫微微BS、中继BS等)的异构网络。这些不同类型的BS可具有不同的发射功率电平、不同的覆盖区域、以及对无线网络100中的干扰的不同影响。例如，宏BS可具有高发射功率电平(例如，5到40瓦)，而微微BS、毫微微BS和中继BS可具有较低发射功率电平(例如，0.1到2瓦)。

网络控制器130可耦合至BS集，并且可提供对这些BS的协调和控制。网络控制器130可以经由回程来与各BS进行通信。这些BS还可例如经由无线或有线回程直接或间接地彼此通信。

UE 120(例如，120a、120b、120c)可分散遍及无线网络100，并且每个UE可以是驻定或移动的。UE还可被称为接入终端、终端、移动站、订户单元、站、等等。UE可以是蜂窝电话(例如，智能电话)、个人数字助理(PDA)、无线调制解调器、无线通信设备、手持设备、膝上型计算机、无绳电话、无线本地环路(WLL)站、平板、相机、游戏设备、上网本、智能本、超级本、医疗设备或装备、生物测定传感器/设备、可穿戴设备(智能手表、智能服装、智能眼镜、智能腕带、智能首饰(例如，智能戒指、智能手环))、娱乐设备(例如，音乐或视频设备、或卫星无线电)、交通工具组件或传感器、智能仪表/传感器、工业制造装备、全球定位系统设备、或者被配置成经由无线或有线介质通信的任何其他合适的设备。

一些UE可被认为是机器类型通信(MTC)UE、或者演进型或增强型机器类型通信(eMTC)UE。MTC和eMTC UE例如包括机器人、无人机、远程设备、传感器、仪表、监视器、位置标签等等，其可与基站、另一设备(例如，远程设备)或某个其他实体进行通信。无线节点可以例如经由有线或无线通信链路来为网络(例如，广域网(诸如因特网)或蜂窝网络)提供连通性或提供至该网络的连通性。一些UE可被认为是物联网(IoT)设备，和/或可被实现为NB-IoT(窄带物联网)设备。一些UE可被认为是客户端装备(CPE)。UE 120可被包括在外壳的内部，该外壳容纳UE 120的组件，诸如处理器组件、存储器组件、等等。

一般而言，在给定的地理区域中可部署任何数目的无线网络。每个无线网络可支持特定的RAT，并且可在一个或多个频率上操作。RAT还可被称为无线电技术、空中接口、等等。频率还可被称为载波、频率信道、等等。每个频率可在给定的地理区域中支持单个RAT以避免不同RAT的无线网络之间的干扰。在一些情形中，可部署NR或5G RAT网络。

在一些方面，两个或更多个UE 120(例如，被示为UE 120a和UE 120e)可使用一个或多个侧链路信道来直接通信(例如，不使用基站110作为中介来彼此通信)。例如，UE 120可使用对等(P2P)通信、设备到设备(D2D)通信、车联网(V2X)协议(例如，其可包括交通工具到交通工具(V2V)协议、交通工具到基础设施(V2I)协议等等)、网状网络等等进行通信。在该情形中，UE 120可执行调度操作、资源选择操作、和/或在他处描述为由基站110执行的其他操作。例如，基站110可以经由下行链路控制信息(DCI)、无线电资源控制(RRC)信令、媒体接入控制-控制元素(MAC-CE)或经由系统信息(例如，系统信息块(SIB))来配置UE 120。

如以上所指示的，图1仅仅是作为示例来提供的。其他示例可以不同于关于图1所描述的示例。

图2示出了基站110和UE 120的设计200的框图，基站110和UE 120可以是图1中的各基站之一和各UE之一。基站110可装备有T个天线234a到234t，并且UE 120可装备有R个天线252a到252r，其中一般而言T≥1且R≥1。

在基站110处，发射处理器220可从数据源212接收给一个或多个UE的数据，至少部分地基于从每个UE接收到的信道质量指示符(CQI)来为该UE选择一种或多种调制和编码方案(MCS)，至少部分地基于为每个UE选择的(诸)MCS来处理(例如，编码和调制)给该UE的数据，并提供针对所有UE的数据码元。减小MCS会降低吞吐量，但会提高传输的可靠性。发射处理器220还可处理系统信息(例如，针对半静态资源划分信息(SRPI)等)和控制信息(例如，CQI请求、准予、上层信令等)，并提供开销码元和控制码元。发射处理器220还可生成用于参考信号(例如，因蜂窝小区而异的参考信号(CRS))和同步信号(例如，主同步信号(PSS)和副同步信号(SSS))的参考码元。发射(TX)多输入多输出(MIMO)处理器230可在适用的情况下对数据码元、控制码元、开销码元、和/或参考码元执行空间处理(例如，预编码)，并且可将T个输出码元流提供给T个调制器(MOD)232a到232t。每个调制器232可处理各自的输出码元流(例如，针对OFDM等)以获得输出采样流。每个调制器232可进一步处理(例如，转换至模拟、放大、滤波、及上变频)输出采样流以获得下行链路信号。来自调制器232a到232t的T个下行链路信号可分别经由T个天线234a到234t被传送。根据以下更详细描述的各个方面，可以利用位置编码来生成同步信号以传达附加信息。

在UE 120处，天线252a到252r可接收来自基站110和/或其他基站的下行链路信号并且可分别向解调器(DEMOD)254a到254r提供收到信号。每个解调器254可调理(例如，滤波、放大、下变频、及数字化)收到信号以获得输入采样。每个解调器254可进一步处理输入采样(例如，针对OFDM等)以获得收到码元。MIMO检测器256可获得来自所有R个解调器254a到254r的收到码元，在适用的情况下对这些收到码元执行MIMO检测，并且提供检出码元。接收处理器258可处理(例如，解调和解码)这些检出码元，将针对UE 120的经解码数据提供给数据阱260，并且将经解码的控制信息和系统信息提供给控制器/处理器280。信道处理器可确定参考信号收到功率(RSRP)、收到信号强度指示符(RSSI)、参考信号收到质量(RSRQ)、信道质量指示符(CQI)等等。在一些方面，UE 120的一个或多个组件可被包括在外壳中。

在上行链路上，在UE 120处，发射处理器264可接收和处理来自数据源262的数据和来自控制器/处理器280的控制信息(例如，针对包括RSRP、RSSI、RSRQ、CQI等的报告)。发射处理器264还可生成用于一个或多个参考信号的参考码元。来自发射处理器264的码元可在适用的情况下由TX MIMO处理器266预编码，由调制器254a到254r进一步处理(例如，针对DFT-s-OFDM、CP-OFDM等)，并且被传送到基站110。在基站110处，来自UE 120和其他UE的上行链路信号可由天线234接收，由解调器254处理，在适用的情况下由MIMO检测器236检测，并由接收处理器238进一步处理以获得经解码的由UE 120发送的数据和控制信息。接收处理器238可将经解码数据提供给数据阱239并将经解码控制信息提供给控制器/处理器240。基站110可包括通信单元244并且经由通信单元244与网络控制器130通信。网络控制器130可包括通信单元294、控制器/处理器290、以及存储器292。

基站110的控制器/处理器240、UE 120的控制器/处理器280、和/或图2的(诸)任何其他组件可执行与用于信道建模的机器学习相关联的一种或多种技术，如在他处更详细地描述的。例如，基站110的控制器/处理器240、UE 120的控制器/处理器280、和/或图2的(诸)任何其他组件可执行或指导例如图6的过程的操作。存储器242和282可分别存储用于基站110和UE 120的数据和程序代码。调度器246可调度UE以进行下行链路和/或上行链路上的数据传输。

如以上所指示的，图2仅仅是作为示例来提供的。其他示例可以不同于关于图2所描述的示例。

在一些情形中，支持不同类型的应用和/或服务的不同类型的设备可以共存于蜂窝小区中。不同类型的设备的示例包括UE手持机、客户端装备(CPE)、交通工具、物联网(IoT)设备等等。不同类型的应用的示例包括超可靠低等待时间通信(URLLC)应用、大规模机器类型通信(mMTC)应用、增强型移动宽带(eMBB)应用、车联网(V2X)应用等等。此外，在一些情形中，单个设备可同时支持不同的应用或服务。

图3解说了根据本公开的某些方面的片上系统(SOC)300的示例实现，其可包括被配置成用于生成用于神经网络训练的梯度的中央处理单元(CPU)302或多核CPU。SOC 300可被包括在基站110或UE 120中。变量(例如，神经信号和突触权重)、与计算设备(例如，带有权重的神经网络)相关联的系统参数、延迟、频率槽信息、以及任务信息可被存储在与神经处理单元(NPU)308相关联的存储器块、与CPU 302相关联的存储器块、与图形处理单元(GPU)304相关联的存储器块、与数字信号处理器(DSP)306相关联的存储器块、存储器块318中，或可跨多个块分布。在CPU 302处执行的指令可从与CPU 302相关联的程序存储器加载或者可从存储器块318加载。

SOC 300还可包括为具体功能定制的附加处理块，诸如GPU 304、DSP 306、连通性块310(其可包括第五代(5G)连通性、第四代长期演进(4G LTE)连通性、Wi-Fi连通性、USB连通性、蓝牙连通性等)以及例如可检测和识别姿势的多媒体处理器312。在一种实现中，NPU实现在CPU、DSP、和/或GPU中。SOC 300还可包括传感器处理器314、图像信号处理器(ISP)316、和/或导航模块320(其可包括全球定位系统)。

SOC 300可基于ARM指令集。在本公开的一方面，被加载到通用处理器302中的指令可包括用于进行以下操作的代码：基于传送和接收序列的数据集来确定表示信道的条件概率分布；基于该条件概率分布来确定该信道的隐表示；以及基于该隐表示来执行基于信道的功能。

深度学习架构可通过学习在每一层中以逐次更高的抽象程度来表示输入、藉此构建输入数据的有用特征表示来执行对象识别任务。以此方式，深度学习解决了传统机器学习的主要瓶颈。在深度学习出现之前，用于对象识别问题的机器学习办法可能严重依赖人类工程设计的特征，或许与浅分类器相结合。浅分类器可以是两类线性分类器，例如，其中可将特征向量分量的加权和与阈值作比较以预测输入属于哪一类。人类工程设计的特征可以是由拥有领域专业知识的工程师针对具体问题领域定制的模版或内核。相反，深度学习架构可学习以表示与人类工程师可能会设计的相似的特征，但它是通过训练来学习的。此外，深度网络可以学习以表示和识别人类可能还没有考虑过的新类型的特征。

深度学习架构可以学习特征阶层。例如，如果向第一层呈递视觉数据，则第一层可学习以识别输入流中的相对简单的特征(诸如边)。在另一示例中，如果向第一层呈递听觉数据，则第一层可学习以识别特定频率中的频谱功率。取第一层的输出作为输入的第二层可以学习以识别特征组合，诸如对于视觉数据识别简单形状或对于听觉数据识别声音组合。例如，更高层可学习以表示视觉数据中的复杂形状或听觉数据中的词语。再高层可学习以识别常见视觉对象或口述短语。

深度学习架构在被应用于具有自然阶层结构的问题时可能表现特别好。例如，机动交通工具的分类可受益于首先学习以识别轮子、挡风玻璃、以及其他特征。这些特征可在更高层以不同方式被组合以识别轿车、卡车和飞机。

神经网络可被设计成具有各种连通性模式。在前馈网络中，信息从较低层被传递到较高层，其中给定层中的每个神经元向更高层中的神经元进行传达。如上所述，可在前馈网络的相继层中构建阶层式表示。神经网络还可具有回流或反馈(也被称为自顶向下(top-down))连接。在回流连接中，来自给定层中的神经元的输出可被传达给相同层中的另一神经元。回流架构可有助于识别跨越不止一个按顺序递送给该神经网络的输入数据组块的模式。从给定层中的神经元到较低层中的神经元的连接被称为反馈(或自顶向下)连接。当高层级概念的识别可辅助辨别输入的特定低层级特征时，具有许多反馈连接的网络可能是有助益的。

神经网络的各层之间的连接可以是全连通的或局部连通的。图4A解说了全连通神经网络402的示例。在全连通神经网络402中，第一层中的神经元可将它的输出传达给第二层中的每个神经元，从而第二层中的每个神经元将从第一层中的每个神经元接收输入。图4B解说了局部连通神经网络404的示例。在局部连通神经网络404中，第一层中的神经元可连接到第二层中有限数目的神经元。更一般化地，局部连通神经网络404的局部连通层可被配置成使得一层中的每个神经元将具有相同或相似的连通性模式，但其连接强度可具有不同的值(例如，410、412、414和416)。局部连通的连通性模式可能在更高层中产生空间上相异的感受野，这是由于给定区域中的更高层神经元可接收到通过训练被调谐为到网络的总输入的受限部分的性质的输入。

局部连通神经网络的一个示例是卷积神经网络。图4C解说了卷积神经网络406的示例。卷积神经网络406可被配置成使得与针对第二层中每个神经元的输入相关联的连接强度被共享(例如，408)。卷积神经网络可能非常适合于其中输入的空间位置有意义的问题。

一种类型的卷积神经网络是深度卷积网络(DCN)。图4D解说了被设计成从自图像捕获设备430(诸如车载相机)输入的图像426识别视觉特征的DCN 400的详细示例。可对当前示例的DCN 400进行训练以标识交通标志以及在交通标志上提供的数字。当然，DCN 400可被训练用于其他任务，诸如标识车道标记或标识交通信号灯。

可以用受监督式学习来训练DCN 400。在训练期间，可向DCN 400呈递图像(诸如限速标志的图像426)，并且随后可计算前向传递(forward pass)以产生输出422。DCN 400可包括特征提取区段和分类区段。在接收到图像426之际，卷积层432可向图像426应用卷积核(未示出)，以生成第一组特征图418。作为示例，卷积层432的卷积核可以是生成28x28特征图的5x5内核。在本示例中，由于在第一组特征图418中生成四个不同的特征图，因此在卷积层432处四个不同的卷积核被应用于图像426。卷积核还可被称为过滤器或卷积过滤器。

第一组特征图418可由最大池化层(未示出)进行子采样以生成第二组特征图420。最大池化层减小了第一组特征图418的大小。即，第二组特征图420的大小(诸如14x14)小于第一组特征图418的大小(诸如28x28)。减小的大小向后续层提供类似的信息，同时降低存储器消耗。第二组特征图420可经由一个或多个后续卷积层(未示出)被进一步卷积，以生成后续的一组或多组特征图(未示出)。

在图4D的示例中，第二组特征图420被卷积以生成第一特征向量424。此外，第一特征向量424被进一步卷积以生成第二特征向量428。第二特征向量428的每个特征可包括与图像426的可能特征(诸如，“标志”、“60”和“100”)相对应的数字。softmax(软最大化)函数(未示出)可将第二特征向量428中的数字转换为概率。如此，DCN 400的输出422是图像426包括一个或多个特征的概率。

在本示例中，输出422中关于“标志”和“60”的概率高于输出422的其他特征(诸如“30”、“40”、“50”、“70”、“80”、“90”和“100”)的概率。在训练之前，由DCN 400产生的输出422很可能是不正确的。由此，可计算输出422与目标输出之间的误差。目标输出是图像426的真值(例如，“标志”和“60”)。DCN 400的权重可随后被调整以使得DCN 400的输出422与目标输出更紧密地对齐。

为了调整权重，学习算法可为权重计算梯度向量。梯度可指示在权重被调整情况下误差将增加或减少的量。在顶层，梯度可直接对应于连接倒数第二层中的活化神经元与输出层中的神经元的权重的值。在较低层中，梯度可取决于权重的值以及所计算出的较高层的误差梯度。权重可随后被调整以减小误差。这种调整权重的方式可被称为“反向传播”，因为其涉及在神经网络中的反向传递(“backward pass”)。

在实践中，权重的误差梯度可能是在少量示例上计算的，从而计算出的梯度近似于真实误差梯度。这种近似方法可被称为随机梯度下降法。随机梯度下降法可被重复，直到整个系统可达成的误差率已停止下降或直到误差率已达到目标水平。在学习之后，可向DCN呈递新图像(例如，图像426的限速标志)并且通过网络前向传递可产生输出422，其可被认为是该DCN的推断或预测。

深度置信网络(DBN)是包括多层隐藏节点的概率性模型。DBN可被用于提取训练数据集的阶层式表示。DBN可通过堆叠多层受限波尔兹曼机(RBM)来获得。RBM是一类可在输入集上学习概率分布的人工神经网络。由于RBM可在没有关于每个输入应该被分类到哪个类的信息的情况下学习概率分布，因此RBM经常被用在无监督式学习中。使用混合无监督式和受监督式范式，DBN的底部RBM可按无监督方式被训练并且可以用作特征提取器，而顶部RBM可按受监督方式(在来自先前层的输入和目标类的联合分布上)被训练并且可用作分类器。

深度卷积网络(DCN)是卷积网络的网络，其配置有附加的池化和归一化层。DCN已在许多任务上达成现有最先进的性能。DCN可以使用受监督式学习来训练，其中输入和输出目标两者对于许多典范是已知的并被用于通过使用梯度下降法来修改网络的权重。

DCN可以是前馈网络。另外，如上所述，从DCN的第一层中的神经元到下一更高层中的神经元群的连接跨第一层中的各神经元被共享。DCN的前馈和共享连接可被用于进行快速处理。DCN的计算负担可比例如类似大小的包括回流或反馈连接的神经网络的计算负担小得多。

卷积网络的每一层的处理可被认为是空间不变模版或基础投影。如果输入首先被分解成多个通道，诸如彩色图像的红色、绿色和蓝色通道，则在该输入上训练的卷积网络可被认为是三维的，其具有沿着该图像的轴的两个空间维度以及捕获颜色信息的第三维度。卷积连接的输出可被认为在后续层中形成特征图，该特征图(例如，220)中的每个元素从先前层(例如，特征图218)中一定范围的神经元以及从该多个通道中的每个通道接收输入。特征图中的值可以用非线性(诸如矫正，max(0,x))进一步处理。来自毗邻神经元的值可被进一步池化(这对应于降采样)并可提供附加的局部不变性以及维度缩减。还可通过特征图中神经元之间的侧向抑制来应用归一化，其对应于白化。

深度学习架构的性能可随着有更多被标记的数据点变为可用或随着计算能力提高而提高。现代深度神经网络用比仅仅十五年前可供典型研究者使用的计算资源多数千倍的计算资源来例行地训练。新的架构和训练范式可进一步推升深度学习的性能。经矫正的线性单元可减少被称为梯度消失的训练问题。新的训练技术可减少过度拟合(over-fitting)并因此使更大的模型能够达成更好的普遍化。封装技术可抽象出给定的感受野中的数据并进一步提升总体性能。

图5是解说深度卷积网络550的框图。深度卷积网络550可包括多个基于连通性和权重共享的不同类型的层。如图5中示出的，深度卷积网络550包括卷积块554A、554B。卷积块554A、554B中的每一者可配置有卷积层(CONV)356、归一化层(LNorm)558、和最大池化层(MAX POOL)560。

卷积层556可包括一个或多个卷积过滤器，其可被应用于输入数据以生成特征图。尽管仅示出了两个卷积块554A、554B，但本公开不限于此，而是代之以根据设计偏好可将任何数目的卷积块554A、554B包括在深度卷积网络550中。归一化层558可对卷积过滤器的输出进行归一化。例如，归一化层558可提供白化或侧向抑制。最大池化层560可提供在空间上的降采样聚集以实现局部不变性以及维度缩减。

例如，深度卷积网络的并行过滤器组可被加载到SOC 300的CPU 302或GPU 304上以达成高性能和低功耗。在替换实施例中，并行过滤器组可被加载到SOC 300的DSP 306或ISP 316上。另外，深度卷积网络550可访问其他可存在于SOC 300上的处理块，诸如分别专用于传感器和导航的传感器处理器314和导航模块320。

深度卷积网络550还可包括一个或多个全连通层562(FC1和FC2)。深度卷积网络550可进一步包括逻辑回归(LR)层564。深度卷积网络550的每一层556、558、560、562、564之间是要被更新的权重(未示出)。每一层(例如，556、558、560、562、564)的输出可以用作深度卷积网络550中一后续层(例如，556、558、560、562、564)的输入以从第一卷积块554A处供应的输入数据552(例如，图像、音频、视频、传感器数据和/或其他输入数据)学习阶层式特征表示。深度卷积网络550的输出是针对输入数据552的分类得分566。分类得分566可以是概率集，其中每个概率是输入数据包括来自特征集的特征的概率。

如以上所指示的，图3-图5是作为示例来提供的。其他示例可以不同于关于图3-图5所描述的示例。

如上面讨论的，机器学习系统可实现生成建模以学习数据集{x_i,＝1,…,m}中数据x的隐表示z。隐表示可基于生成过程P_θ(x|z)来学习。生成过程是指在给定隐表示z的情况下数据x的条件分布。在一些示例中，生成模型可估计密度函数并通过随机选择隐表示z来生成新样本。变分自编码器(VAE)和生成对抗网络(GAN)是生成模型的示例。可能期望针对无线信道使用生成建模。例如，生成建模可改进新信道(诸如用于模拟的新信道)的生成。作为另一示例，生成建模可学习对应于信道的条件分布。附加地，生成模型可被用于端到端地训练基于深度学习的收发机。为了训练这些模型，可通过信道来反向传播梯度。此外，生成模型可被用作通过其可以反向传播梯度的信道的微分模拟器。

本公开的各方面涉及使用生成模型来对通信信道(诸如无线通信信道)进行建模。信道可使用其条件分布来表示以包括非线性效应。非线性效应(例如，信道非线性)可由例如设备、放大器和/或量化器引起。在一种配置中，可使用条件变分自编码器来学习条件分布。在一些方面，信道解码器可包括可微分信道模型，其可将通信信道建模为条件概率分布。附加地，可基于隐变量来生成新信道。新信道可被用于从现场数据构建神经信道模型。

在通信系统(诸如无线通信系统)中，信道可接收输入x并提供输出y。输入x和输出y可被称为传送-接收序列或输入-输出序列。如所描述的，本公开的各方面涉及学习信道的概率分布(例如，概率表示)。在该示例中，概率分布是在给定输入x的情况下获得输出y的概率。在学习概率分布之后，信道可通过机器学习模型来模拟或近似。

在一些示例中，信道的条件概率分布可被表示为P_θ(y|，其中参数y表示信道输出，并且参数x表示信道输入。可能期望基于易处理且可微分架构(例如，神经网络架构)来近似信道(例如，复杂信道)的条件概率P_θ(y|)。附加地，可能期望改进用于生成新信道实例的过程。

如所讨论的，条件VAE可执行基于信道的功能以用于估计信道、解码信道码、压缩信道状态和/或检测经由信道接收的信号。压缩是指压缩信道状态。例如，信道可被压缩用于信道状态反馈(CSF)。解码是指解码信道码，诸如低密度奇偶校验(LDPC)解码。作为示例，可基于信道的条件概率来确定所传送比特的对数似然比(LLR)。LLR可被用于解码，诸如LDPC解码。最后，检测是指找到所传送码元，诸如多输入多输出(MIMO)检测。

图6是解说根据本公开的各方面的条件变分自编码器(CVAE)600的示例的框图。CVAE 600还可被称为条件VAE 600。如图6中所示，条件VAE 600可被纳入传送方设备或接收方设备中的一者或两者中。在图6的示例中，条件VAE 600可学习以信道输入x为条件的隐表示z。如图6的示例中所示，条件VAE 600包括编码器602和解码器604。编码器602可以是实现编码函数q_φ(z|x,y)的人工神经网络。在一种配置中，编码器602接收输入x和输出y。在本公开中，输入x可被称为信道输入x，并且输出y可被称为信道输出y。在一些示例中，信道输入x可以是信道输入x的样本，诸如收到的正交频分(OFDM)波形的样本。附加地，信道输出y可以是信道输出y的样本，诸如所传送OFDM波形的样本。如图6的示例中所示，编码器602确定信道输入x和信道输出y的均值μ(x,y)(被示为“μ”)，以及与隐表示z的高斯分布相关联的、信道输入x和信道输出y的方差σ(x,y)(被示为“σ”)。均值μ(x,y)和方差σ(x,y)可基于信道输入x和信道输出y。由此，编码器602可基于信道输入x和信道输出y来生成隐表示z。

附加地，解码器604可以是实现解码函数p_θ(y|z,x)的人工神经网络。解码器604假定高斯后验，以使得在给定信道输入x和信道状态信息的情况下信道输出y的条件分布是由接收机的加性噪声确定的高斯分布。如图6中所示，解码器604可基于隐表示z和输入信道x来确定输出信道y。隐表示z可从高斯分布的均值μ(x,y)和方差σ(x,y)采样(例如，随机采样)。编码函数q_φ(z|x,y)和解码函数p_θ(y|z,y)中的每一者表示概率分布。

在一些示例中，在训练期间，损失函数基于均值μ、方差σ和隐表示z的L个随机样本来确定损失。即，隐表示z可随机地基于高斯分布z^(l)＝σ⊙∈+μ，其中参数∈表示随机变量并且参数l表示L个随机样本中的当前随机样本。损失可被定义为：

根据本公开的各方面，在训练期间，Loss_CVAE(损失_CVAE)可被最小化以训练条件VAE600。在式1中，

表示Kullback-Leibler散度项，其中所获得的σ_j,μ_j作为编码器602的输出。附加地，/>

表示使用解码器604的输出来计算的重构损失的期望值。在训练期间，L可以等于一。VAE通过使n证据下界最大化来使数据似然性logp_θ(y|x)最大化。证据下界包括两项。第一项是Kullback-Leibler散度项，并且第二项是重构损失。在训练之后，经训练编码器602和经训练解码器604可被用于各种建模和推断任务。

在一些方面，条件VAE 600可以是信道建模系统的组件。在一些此类方面，信道建模系统收集信道输入x和对应的信道输出y(例如，输入-输出序列)并生成所收集样本的数据集(x_i,y_i)(其中i＝1,…,N)。

图7是解说根据本公开的各方面的信道750的示例的框图。如所讨论的，信道750可以是无线信道。然而，信道不限于无线信道并且可以是另一类型的通信信道。如图7A的示例中所示，信道750包括信道输入x和信道输出y。在图7A的示例中，信道输入x可由发射机(诸如图1和2中所描述的UE 120或基站110)传送。附加地，信道输出y可在接收机(诸如图1和2中所描述的UE 120或基站110)处被接收。信道750的非线性效应会引起信道输入x与信道输出y之间的差异。非线性效应可由例如网络设备、放大器和/或量化器引起。

如所描述的，本公开的各方面涉及学习信道750的概率分布P_θ(y|x)(例如，概率表示)。在该示例中，概率分布P_θ(y|x)是在给定信道输入x的情况下获得信道输出y的概率。附加地，如所讨论的，条件VAE(诸如图6中所描述的条件VAE 600)可学习以信道输入x为条件的信道750的隐表示z。

如上面所讨论的，信道750包括信道输入x和信道输出y。在一些示例中，信道输入x可以是由发射机生成的波形，并且信道输出y可以是在接收机处接收的波形。图7B是解说根据本公开的各方面的信道建模系统700的示例的框图。在图7B的示例中，信道建模系统700包括用于生成波形706(对应于如图7A中所描述的信道输入x)的发射机702和用于接收波形714(对应于如图7A中所描述的信道输出y)的接收机704。发射机702和接收机704可以是如图1和2中所描述的UE 120或基站110的示例。即，UE 120和基站110两者都包括执行发射机702和接收机704的功能的组件。在图7B的示例中，发射机702可传送发射机波形706，诸如正交频率解调(OFDM)波形。发射机波形706可以是信道输入x的示例。在传送发射机波形706之前，发射机702可在调制组件708处调制信号720，在快速傅里叶逆变换(IFFT)组件710处执行IFFT，并在循环前缀(CP)组件712处添加CP。在一些示例中，调制组件708可经由正交相移键控(QPSK)调制来调制信号。

如图7B中所示，信道750接收信道输入x(例如，发射机波形706)并产生信道输出y(例如，接收机波形714)。信道750可以是图7A中所描述的信道750的示例。传输可在接收机704处被接收为接收机波形714，诸如OFDM波形。如图7B的示例中所示，接收机704可在循环前缀(CP)组件716处移除CP并在快速傅里叶变换(FFT)组件718处执行FFT以获得信号720。根据本公开的各方面，用于信道建模系统700的数据集包括不同的信道输入和信道输出样本(x_i,y_i)。

在一种配置中，信道建模是数据驱动的。例如，生成模型可基于现场测量来构建。现场测量可包括有限分辨率的输入和输出波形，或高分辨率的信道脉冲响应测量(例如，延迟、角度和多普勒曲线)。附加信息也可以被用于模型构建，此类信息可包括例如位置信息、延迟扩展、载波频率或带宽中的一者或多者。在此类配置中，编码函数q_φ(z|x,y)(例如，信道表示)的后验分布和解码函数p_θ(y|x；z)(例如，近似条件分布)可从现场测量学习。

信道的条件概率可以是可微分的并且可被用于设计数据驱动的通信系统。解码函数p_θ(y|x；z)可被用于解码和/或信道检测。作为另一示例，编码函数q_φ(z|y；x)或解码函数p_θ(y|x；z)可被用于信道估计和/或信道压缩。

在一些方面，信道可通过随机选择隐表示z来模拟。在此类方面，可以针对每个隐表示z获得新信道实例。如所讨论的，隐表示z可表示信道。因此，对于特定环境，如果确定了隐表示z，则信道是已知的。在一些示例中，隐表示z可通过知晓信道输入x和信道输出y来确定。

在一种配置中，信道似然性(例如，条件概率分布)可被用于估计信道。即，条件概率分布可从信道输入和输出测量来学习。在该配置中，条件变分自编码器(VAE)(诸如图6的条件VAE 600)可被用于学习信道的隐表示z。条件VAE 600可通过使用重新参数化的反向传播来训练。在一些示例中，隐表示z可基于导频信号x_pilot(x导频)(例如，信道输入)和信道输出y来确定。在该示例中，条件概率P_θ(y|x,z)可估计隐表示z：

参数/>

可基于梯度下降法来确定。在该示例中，参数/>

是基于隐表示z的使基于导频信号x_pilot获得输出y的概率最大化的值来确定的。

在另一配置中，信道输入x可从信道输出y和隐表示z(例如，经估计信道)来估计。在该示例中，条件概率P_θ(y|x,z)可使用从信道估计获得的隐表示z来估计输入x：

在该示例中，参数/>

可基于梯度下降法来确定。具体而言，参数/>

可基于隐表示z的使基于隐表示z获得信道输出y的概率最大化的值来确定。

在又一配置中，隐表示z可被用于设计端到端基于深度学习的通信系统，其中常规信道编码器(例如，发射机)和解码器(例如，接收机)可由人工神经网络代替。可实现本公开的各方面以通过信道反向传播，因为信道模型是可微分的。因此，基于神经网络的信道编码器和解码器可基于可微分信道来训练。

如所讨论的，根据本公开的各方面，生成模型可生成新信道以用于模拟、测试和/或其他目的。附加地或替换地，信道的经压缩表示可基于隐表示来生成。作为示例，经压缩表示可被用于信道状态反馈(CSF)。

在一些示例中，生成模型可被用于模拟通信系统和/或设计通信系统。在此类示例中，生成模型可从条件VAE(诸如图6的条件VAE 600)获得。条件VAE可假定隐变量上的高斯分布。附加地，条件VAE的解码函数p_θ(y|x,z)可通过随机选择遵循标准高斯分布的隐分布来z生成新信道实例。可针对现有模拟器训练生成模型以改进可微分模型的样本生成。

图8是解说根据本公开的各个方面的例如由人工神经网络执行的示例过程800的流程图。示例过程800是基于根据表示信道的条件概率分布确定的隐表示来执行基于信道的功能的示例。过程800可由包括条件VAE(诸如图6的条件VAE 600)的人工神经网络(ANN)来执行。如图8中所示，在框802，ANN基于传送和接收序列的数据集来确定表示信道的条件概率分布。传送和接收序列可基于由发射机在信道上传送的第一数据和在接收机处在信道上接收的第二数据来收集。在一些示例中，对于每个传送和接收序列，第一数据对应于第二数据。附加地，在一些示例中，ANN通过对隐表示的高斯分布进行采样来获得隐变量的实例，并基于该隐变量的实例来确定条件概率分布。

附加地，如图8中所示，在框804，ANN基于该条件概率分布来确定该信道的隐表示。此外，在框806，ANN基于该隐表示来执行基于信道的功能。在一些示例中，基于信道的功能可经由条件VAE来执行。附加地，基于信道的功能可包括以下一者或多者：估计与信道相关联的一个或多个属性、解码信道码、压缩信道状态、或检测码元。

在以下经编号条款中描述了各实现示例。

1.一种由人工神经网络执行的方法，包括：基于传送和接收序列的数据集来确定表示信道的条件概率分布；基于该条件概率分布来确定该信道的隐表示；以及基于该隐表示来执行基于信道的功能。

2.如条款1的方法，其中，该人工神经网络包括条件变分自编码器(VAE)，该条件VAE包括编码器和解码器。

3.如条款2的方法，进一步包括：经由该条件VAE来执行该基于信道的功能，该基于信道的功能包括估计与该信道相关联的一个或多个属性、解码信道码、压缩信道状态、以及检测码元。

4.如条款2-3中的任一者的方法，其中，执行基于信道的功能包括：从该隐表示中随机选择隐变量的实例以通过该条件VAE的该解码器生成模拟信道。

5.如条款2-3中的任一者的方法，其中，执行基于信道的功能包括：通过该信道反向传播以端到端地训练基于神经网络的通信系统。

6.如条款5的方法，其中，该基于神经网络的通信系统是包括以下各项的混合系统：

神经网络接收机或神经网络发射机；或者

包括该神经网络接收机和该神经网络发射机的完整的基于神经网络的系统。

7.如条款2-6中的任一者的方法，进一步包括：经由该条件VAE来确定该条件概率分布。

8.如条款2-7中的任一者的方法，进一步包括：

通过对该隐表示的高斯分布进行采样来获得隐变量的实例；以及

基于该隐变量的实例来确定该条件概率分布。

9.如条款8的方法，进一步包括：基于该隐变量的实例来生成新信道。

10.如条款1-9中的任一者的方法，进一步包括：基于由发射机在该信道上传送的第一数据和接收机处在该信道上接收的第二数据来收集该传送和接收序列。

11.如条款10的方法，其中，对于每个传送和接收序列，该第一数据对应于该第二数据。

12.一种人工神经网络，包括处理器、与该处理器耦合的存储器、以及指令，这些指令存储在该存储器中并且在由该处理器执行时能操作用于使得该人工神经网络执行条款1至11中的任一者。

13.一种用于促成信道上的通信的设备，包括用于执行条款1至11中的任一者的至少一个装置。

14.一种计算机程序，包括用于使得人工神经网络执行条款1至11中的任一者的代码。

前述公开提供了解说和描述，但不旨在穷举或将各方面限于所公开的精确形式。修改和变体可以鉴于以上公开内容来作出或者可通过实践各方面来获得。

如所使用的，术语“组件”旨在被宽泛地解释为硬件、固件和/或硬件与软件的组合。如所使用的，处理器用硬件、固件、和/或硬件与软件的组合来实现。

一些方面是与阈值相结合地描述的。如所使用的，取决于上下文，满足阈值可以指值大于阈值、大于或等于阈值、小于阈值、小于或等于阈值、等于阈值、不等于阈值等。

所描述的系统和/或方法可以按硬件、固件、和/或硬件与软件的组合的不同形式来实现将会是显而易见的。用于实现这些系统和/或方法的实际的专用控制硬件或软件代码不限制各方面。由此，这些系统和/或方法的操作和行为在不参照特定软件代码的情况下描述——理解到，软件和硬件可被设计成至少部分地基于本描述来实现这些系统和/或方法。

尽管在权利要求书中叙述和/或在说明书中公开了特定特征组合，但这些组合不旨在限制各个方面的公开。事实上，许多这些特征可以按权利要求书中未专门叙述和/或说明书中未公开的方式组合。尽管以下列出的每一项从属权利要求可以直接从属于仅仅一项权利要求，但各个方面的公开包括每一项从属权利要求与这组权利要求中的每一项其他权利要求相组合。引述一列项目“中的至少一个”的短语指代这些项目的任何组合，包括单个成员。作为示例，“a、b或c中的至少一个”旨在涵盖：a、b、c、a-b、a-c、b-c、和a-b-c，以及具有多重相同元素的任何组合(例如，a-a、a-a-a、a-a-b、a-a-c、a-b-b、a-c-c、b-b、b-b-b、b-b-c、c-c、和c-c-c，或者a、b和c的任何其他排序)。

所使用的元素、动作或指令不应被解释为关键或必要的，除非被明确描述为这样。而且，如所使用的，冠词“一”和“某一”旨在包括一个或多个项目，并且可以与“一个或多个”互换地使用。此外，如所使用的，术语“集(集合)”和“群”旨在包括一个或多个项目(例如，相关项、非相关项、相关和非相关项的组合等)，并且可以与“一个或多个”可互换地使用。在旨在仅有一个项目的场合，使用短语“仅一个”或类似语言。而且，如所使用的，术语“具有”、“含有”、“包含”等旨在是开放性术语。此外，短语“基于”旨在意指“至少部分地基于”，除非另外明确陈述。

Claims

1.一种使用人工神经网络的计算机实现的方法，包括：

基于传送和接收序列的数据集来确定表示信道的条件概率分布；

基于所述条件概率分布来确定所述信道的隐表示；以及

基于所述隐表示来执行基于信道的功能。

2.如权利要求1所述的计算机实现的方法，其中，所述人工神经网络包括条件变分自编码器(VAE)，所述条件VAE包括编码器和解码器。

3.如权利要求2所述的计算机实现的方法，进一步包括：经由所述条件VAE来执行所述基于信道的功能，所述基于信道的功能包括估计与所述信道相关联的一个或多个属性、解码信道码、压缩信道状态、以及检测码元。

4.如权利要求2所述的计算机实现的方法，其中，执行所述基于信道的功能包括：从所述隐表示中随机选择隐变量的实例以通过所述条件VAE的所述解码器生成模拟信道。

5.如权利要求2所述的计算机实现的方法，其中，执行所述基于信道的功能包括：通过所述信道反向传播以端到端地训练基于神经网络的通信系统。

6.如权利要求5所述的计算机实现的方法，其中，所述基于神经网络的通信系统是包括以下各项的混合系统：

神经网络接收机或神经网络发射机；或者

包括所述神经网络接收机和所述神经网络发射机的完整的基于神经网络的系统。

7.如权利要求2所述的计算机实现的方法，进一步包括：经由所述条件VAE来确定所述条件概率分布。

8.如权利要求2所述的计算机实现的方法，进一步包括：

通过对所述隐表示的高斯分布进行采样来获得隐变量的实例；以及

基于所述隐变量的实例来确定所述条件概率分布。

9.如权利要求8所述的计算机实现的方法，进一步包括：基于所述隐变量的实例来生成新信道。

10.如权利要求1所述的计算机实现的方法，进一步包括：基于由发射机在所述信道上传送的第一数据和接收机处在所述信道上接收的第二数据来收集所述传送和接收序列。

11.如权利要求10所述的计算机实现的方法，其中，对于每个传送和接收序列，所述第一数据对应于所述第二数据。

12.一种用于促成信道上的通信的设备，所述设备包括：

用于基于传送和接收序列的数据集来确定表示所述信道的条件概率分布的装置；

用于基于所述条件概率分布来确定所述信道的隐表示的装置；以及

用于基于所述隐表示来执行基于信道的功能的装置。

13.如权利要求12所述的设备，其中，所述设备包括用于条件变分编码的装置，用于条件变分编码的装置包括用于编码的装置和用于解码的装置。

14.如权利要求13所述的方法，进一步包括：用于经由用于条件变分编码的装置来执行所述基于信道的功能的装置，所述基于信道的功能包括估计与所述信道相关联的一个或多个属性、解码信道码、压缩信道状态、以及检测码元。

15.如权利要求13所述的方法，其中，用于执行所述基于信道的功能的装置包括：用于从所述隐表示中随机选择隐变量的实例以通过用于解码的装置生成模拟信道的装置。

16.如权利要求13所述的方法，其中，用于执行所述基于信道的功能的装置包括：用于通过所述信道反向传播以端到端地训练基于神经网络的通信系统的装置。

17.如权利要求16所述的方法，其中，所述基于神经网络的通信系统是包括以下各项的混合系统：

神经网络接收机或神经网络发射机；或者

18.如权利要求13所述的方法，进一步包括：用于经由用于条件变分编码的装置来确定所述条件概率分布的装置。

19.如权利要求13所述的方法，进一步包括：

用于通过对所述隐表示的高斯分布进行采样来获得隐变量的实例的装置；以及

用于基于所述隐变量的实例来确定所述条件概率分布的装置。

20.如权利要求19所述的方法，进一步包括：用于基于所述隐变量的实例来生成新信道的装置。

21.如权利要求13所述的方法，进一步包括：用于基于由发射机在所述信道上传送的第一数据和接收机处在所述信道上接收的第二数据来收集所述传送和接收序列的装置。

22.如权利要求21所述的方法，其中，对于每个传送和接收序列，所述第一数据对应于所述第二数据。

23.一种用于人工神经网络的装置，包括：

处理器；

与所述处理器耦合的存储器；以及

指令，所述指令存储在所述存储器中并且在由所述处理器执行时能操作用于使得所述装置：

基于所述条件概率分布来确定所述信道的隐表示；以及

基于所述隐表示来执行基于信道的功能。

24.如权利要求23所述的装置，其中，所述人工神经网络进一步包括条件变分自编码器(VAE)，所述条件VAE包括编码器和解码器。

25.如权利要求24所述的装置，其中，所述指令进一步使得所述装置：经由所述条件VAE来执行所述基于信道的功能，所述基于信道的功能包括估计与所述信道相关联的一个或多个属性、解码信道码、压缩信道状态、以及检测码元。

26.如权利要求24所述的装置，其中，执行所述基于信道的功能包括：从所述隐表示中随机选择隐变量的实例以通过所述条件VAE的所述解码器生成模拟信道。

27.如权利要求24所述的装置，其中，执行所述基于信道的功能包括：通过所述信道反向传播以端到端地训练基于神经网络的通信系统。

28.如权利要求27所述的装置，其中，所述基于神经网络的通信系统是包括以下各项的混合系统：

神经网络接收机或神经网络发射机；或者

29.如权利要求24所述的装置，其中，所述指令进一步使得所述人工神经网络经由所述条件VAE来确定所述条件概率分布。

30.如权利要求24所述的装置，其中，所述指令进一步使得所述装置：

基于所述隐变量的实例来确定所述条件概率分布。

31.如权利要求30所述的装置，其中，所述指令进一步使得所述装置基于所述隐变量的实例来生成新信道。

32.如权利要求23所述的装置，其中，所述指令进一步使得所述装置：基于由发射机在所述信道上传送的第一数据和接收机处在所述信道上接收的第二数据来收集所述传送和接收序列。

33.如权利要求32所述的装置，其中，对于每个传送和接收序列，所述第一数据对应于所述第二数据。

34.一种非瞬态计算机可读介质，其上记录有用于人工神经网络的程序代码，所述程序代码由处理器执行并且包括：

用于基于传送和接收序列的数据集来确定表示信道的条件概率分布的程序代码；

用于基于所述条件概率分布来确定所述信道的隐表示的程序代码；以及

用于基于所述隐表示来执行基于信道的功能的程序代码。

35.如权利要求34所述的非瞬态计算机可读介质，其中，所述人工神经网络进一步包括条件变分自编码器(VAE)，所述条件VAE包括编码器和解码器。

36.如权利要求35所述的非瞬态计算机可读介质，其中，所述程序代码进一步包括：用于经由所述条件VAE来执行所述基于信道的功能的程序代码，所述基于信道的功能包括估计与所述信道相关联的一个或多个属性、解码信道码、压缩信道状态、以及检测码元。

37.如权利要求35所述的人工神经网络，其中，执行所述基于信道的功能包括：从所述隐表示中随机选择隐变量的实例以通过所述条件VAE的所述解码器生成模拟信道。

38.如权利要求35所述的人工神经网络，其中，执行所述基于信道的功能包括：通过所述信道反向传播以端到端地训练基于神经网络的通信系统。

39.如权利要求38所述的人工神经网络，其中，所述基于神经网络的通信系统是包括以下各项的混合系统：

神经网络接收机或神经网络发射机；或者

40.如权利要求35所述的人工神经网络，其中，所述程序代码进一步包括：经由所述条件VAE来确定所述条件概率分布的程序代码。