CN114097202A - 用于机器学习辅助的球解码的装置和方法 - Google Patents

用于机器学习辅助的球解码的装置和方法 Download PDF

Info

Publication number
CN114097202A
CN114097202A CN202080048315.7A CN202080048315A CN114097202A CN 114097202 A CN114097202 A CN 114097202A CN 202080048315 A CN202080048315 A CN 202080048315A CN 114097202 A CN114097202 A CN 114097202A
Authority
CN
China
Prior art keywords
radius
current
sphere
algorithm
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080048315.7A
Other languages
English (en)
Inventor
G·雷卡亚
A·阿斯科利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institut Mines Telecom IMT
Original Assignee
Institut Mines Telecom IMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institut Mines Telecom IMT filed Critical Institut Mines Telecom IMT
Publication of CN114097202A publication Critical patent/CN114097202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L25/03178Arrangements involving sequence estimation techniques
    • H04L25/03203Trellis search techniques
    • H04L25/03242Methods involving sphere decoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03433Arrangements for removing intersymbol interference characterised by equaliser structure
    • H04L2025/03439Fixed structures
    • H04L2025/03445Time domain
    • H04L2025/03458Lattice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03433Arrangements for removing intersymbol interference characterised by equaliser structure
    • H04L2025/03439Fixed structures
    • H04L2025/03445Time domain
    • H04L2025/03464Neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

一种解码器,用于使用搜索球半径对通过由信道矩阵表示的传输信道接收的信号进行解码。解码器包括半径确定装置(307),用于根据初步半径确定搜索球半径。半径确定装置(307)被配置成:i.对根据接收信号、信道矩阵和当前半径得到的输入数据应用机器学习算法,当前半径最初被设定为初步半径,通过应用机器学习算法提供与当前半径相关联的晶格点当前预测数量;ii.将晶格点当前预测数量与给定阈值进行比较;iii.如果晶格点当前预测数量严格高于给定阈值,则更新当前半径,当前半径是通过对当前半径应用线性函数来更新的;迭代步骤i至iii,直到满足终止条件,终止条件与当前预测数量有关,半径确定装置(307)被配置成响应于满足终止条件而将搜索球半径设定为当前半径。

Description

用于机器学习辅助的球解码的装置和方法
技术领域
本发明总体上涉及数字通信,具体涉及用于对数据信号进行解码的方法和装置。
背景技术
“智慧革命”在包括通信、商业、保健服务和教育在内的现代生活的所有方面都发生了重大变化。从智能电话、智能手表和智能汽车到智能家居和智能城市,使用了越来越多的智能设备并且它们正在改变通信系统。
随着这种具有web和连接功能的设备的出现,对系统容量的更多需求日益增长。开发了多输入多输出(MIMO)技术以增加这种系统容量并提供较好的链路可靠性。MIMO系统利用空间和时间维度在多个时隙上使用多个发送天线和/或接收天线来编码和复用较多的数据码元。结果,可以增强基于MIMO的通信系统的容量、距离和可靠性。MIMO技术的这些关键优点使其成为例如在局域网和广域网中应用的许多有线、无线和光通信系统中的理想候选。
对于MIMO系统而言,一个主要挑战是适应实时服务及应用的数据速率的不断增长的需求。另一挑战涉及收发器装置处的信号处理的复杂性和能量消耗。特别地,高要求的挑战涉及开发能够提供所需服务质量而同时消耗低功率和低计算资源的MIMO解码器。
在接收器装置中实现的MIMO解码器被配置成根据接收信号和信道矩阵确定原始传送的信息码元的估计。解码器在接收信号与发送的信息码元向量的可能值之间进行比较。
存在多种解码算法,并且其实际用途依赖于服务质量(QoS)规范中所要求的性能和可用硬件资源(诸如计算和存储器(存储部)供应)而不同。在存在等概率信息码元的情况下,通过应用最大似然(ML)解码标准来获得最佳解码性能。ML解码器提供最佳性能。
可以使用MIMO系统的两个不同但等效的表示来解决ML估计问题:晶格表示和树表示。
在晶格表示中,MIMO系统与由信道矩阵产生的晶格相关联。根据这种表示,由晶格中的点表示信息码元向量的各个可能值。接收信号被视为晶格的受噪声向量干扰的点。因此,对ML解的求解相当于求解最接近向量问题。ML解在这种情况下在欧几里德距离最小化的意义上对应于与接收信号最接近的晶格点。寻找ML解的计算复杂性依赖于在搜索最接近的晶格点期间所检查的晶格点的数量。
已经提出了诸如球解码器和球边界栈解码器(SB-栈)的基于球树搜索的估计算法,以通过将最接近的晶格点的搜索空间限制到给定半径的球区域来降低搜索阶段的复杂性。球解码器在“E.Viterbo and J.Boutros,A Universal Lattice Code Decoder forFading Channels,IEEE Transactions on Information Theory,45(5),pages 1639-1642,1999”中公开,并且SB-栈解码器在“G.Rekaya Ben-Othman et al.,The SphericalBound Stack Decoder,In Proceedings of the IEEE International Conference onWireless and Mobile Computing,Networking and Communications,2008”中公开。
偏离给定半径(以下称为“初始球半径”或“搜索球半径”),基于球搜索的估计算法在半径等于给定半径的球区域内搜索与信息码元向量的可能值之一相关联的第一晶格点。在找到该晶格点时,将球半径的值更新为在球区域中找到的该晶格点与表示接收信号的点之间的欧几里德距离的值。迭代地执行该球约束搜索和半径更新,直到找到ML解,该ML解对应于包括晶格点并以表示接收信号的点为中心的最小球。
根据MIMO系统的树表示,这种搜索空间限制被看作解码树中被访问节点数量的限制。球区域的半径确定了在解码树的各个层上的被访问节点的边界限制。在树搜索过程期间,仅访问属于由这些边界限制施加的间隔的节点。与诸如栈解码器的一些顺序解码器相比,限制搜索空间能够降低搜索ML解的计算复杂性。
树搜索阶段的计算复杂性主要依赖于搜索球半径的选择。因此,这种解码器的主要问题是选择初始设定的用于启动晶格点搜索的球半径。具体地,为了在球内部包括至少一个晶格点,要求初始半径足够大。相反,较小的初始半径是优选的以避免指数型的搜索,因为太大的半径促进球内存在许多晶格点。因此,应当在用于确保至少一个晶格点被包括在球内的足够大的初始半径和用于优化计算复杂性并且大大加速解码器的足够小的半径之间找到相关的折中。
已经提出了多种选择搜索球半径的方法。在一种方案中,考虑由信道矩阵产生的晶格的覆盖半径。在另一种方案中,使用覆盖半径的上边界,如在文章“A universaldecoding algorithm for lattice codes”,14th colloque GRETSI,1993,E.Viterbo andE.Biglieri中进一步公开的。然而,随着在访问晶格点数量增加,这种基于覆盖半径或上边界的选择方法具有高计算复杂性。
在又一种方案中,可以根据称为SDIRS的方法,在考虑噪声功率的统计特性的情况下来选择搜索球半径,该方法在“W.Zhao and G.B.Giannakis,Sphere DecodingAlgorithms with Improved Radius Search,In Proceedings of IEEE Transactions onCommunications,53(7):1104–1109,July 2005”中公开。这种用于初始半径选择的方法的一个主要缺点是其造成初始半径增加。实际上,当初始半径太小而不能成功地在具有该初始半径的球内搜索到至少一个晶格点时,增加半径直到在球内找到至少一个晶格点。
此外,利用这样的方案,包括在球内部的晶格点的数量随着半径的增加而增加,使得太多的晶格点可以被包括在球内部,这极大地增加了解码器的复杂性。
用于选择初始半径的又一解决方案是基于考虑接收信号与迫零(ZF)估计之间的欧几里德距离,如US2008/0313252或文章“B.Hassibi and H.Vikalo,On the ExpectedComplexity of Sphere Decoding,In Proceedings of Asilomar Conference onSignals,Systems and Computers,vol.2,pages 1051–1055,November 2001”中所公开的。这确保了ZF估计和至少一个晶格点被包括在球内部。然而,该解决方案具有高计算复杂性。
此外,在“M-A.Khsiba and G.Rekaya-Ben Othman,Sphere Decoder withDichotomic Search,PIMRC,Montreal,CANADA,October 2017”中公开了基于二分搜索的选择初始半径的另一解决方案。具有二分搜索的球解码器实现二分法半径更新策略,其中在搜索球区域内的晶格点期间执行的半径更新基于各次找到有效晶格点时将当前半径除以2。
虽然用这样的方法选择初始半径确保了具有初始半径的球内包括多个晶格点,但是初始半径可能仍然太大,从而增加了解码器的计算复杂性。
因此,需要能够以快速解码收敛和降低的解码复杂性实现最佳ML性能的球半径确定装置。
发明内容
为了解决这些和其它问题,提供了一种解码器,所述解码器被配置成使用搜索球半径对通过由信道矩阵表示的传输信道接收的信号进行解码,所述解码器包括半径确定装置,所述半径确定装置用于根据初步半径确定所述搜索球半径。所述半径确定装置被配置成:
i.对根据所接收的信号、所述信道矩阵和当前半径得到的输入数据应用机器学习算法,所述当前半径最初被设定为所述初步半径,通过应用所述机器学习算法提供与所述当前半径相关联的晶格点当前预测数量;
ii.将所述晶格点当前预测数量与给定阈值进行比较;
iii.如果所述晶格点当前预测数量严格高于所述给定阈值,则更新所述当前半径,所述当前半径是通过对所述当前半径应用线性函数来更新的;
迭代步骤i至iii,直到满足终止条件,所述终止条件与所述当前预测数量有关,所述半径确定装置被配置成响应于满足终止条件而将所述搜索球半径设定为所述当前半径。
根据一些实施方式,如果所述晶格点当前预测数量小于或等于所述给定阈值,则可以满足所述终止条件。
根据一些实施方式,所述线性函数可以具有等于1/2的斜率参数和等于零的截距参数。
根据一些实施方式,所述机器学习算法可以是在包括以下各项的组中选择的监督式机器学习算法:支持向量机、线性回归、逻辑回归、朴素贝叶斯、线性判别分析、决策树、k-最近邻算法、神经网络和相似性学习。
根据一些实施方式,所述监督式机器学习算法可以是包括输入层、一个或更多个隐藏层和输出层的多层深度神经网络,各层包括多个计算节点,所述多层深度神经网络与模型参数和激活函数相关联,所述激活函数在所述一个或更多个隐藏层的所述多个计算节点中的至少一个计算节点中实现。
根据一些实施方式,所述激活函数可以是在包括以各项的组中选择的:线性激活函数、S形函数、Relu函数、Tanh、柔性最大值函数和CUBE函数。
根据一些实施方式,所述半径确定装置可以被配置成在训练阶段根据所接收的训练数据来预先确定所述模型参数,所述半径确定装置被配置成根据所述训练数据和预期晶格点数量来确定多组训练数据,各预期晶格点数量与所述多组训练数据中的一组训练数据相关联,所述训练阶段包括以下步骤的两次或更多次迭代:
-使用所述多个训练数据中的一组训练数据作为输入来处理所述深度神经网络,通过处理所述深度神经网络提供与该组训练数据相关联的晶格点中间数量;
-根据与该组训练数据相关联的预期晶格点数量和晶格点中间数量确定损失函数,以及
-根据所述损失函数的最小化,通过应用优化算法来确定经更新的模型参数。
根据一些实施方式,所述优化算法可以是在包括以下各项的组中选择的:Adadelta优化算法、Adagrad优化算法、自适应矩估计算法、Nesterov加速梯度算法、Nesterov加速自适应矩估计算法、RMSprop算法、随机梯度优化算法和自适应学习速率优化算法。
根据一些实施方式,所述损失函数可以是在包括均方误差函数和指数对数似然函数的组中选择的。
根据一些实施方式,所述半径确定装置可以被配置成通过应用列表球解码算法或列表球边界栈解码器来根据所述搜索球半径和所述信道矩阵先前确定所述预期晶格点数量。
根据一些实施方式,所述半径确定装置可以被配置成根据噪声方差、所述信道矩阵的对角分量以及表示所接收的信号与估计向量之间的距离的欧几里德距离中的至少一个参数来确定所述初步半径,所述估计向量是通过应用次优估计算法来确定的,所述次优估计算法是在包括迫零判决反馈均衡器和最小均方误差估计算法的组中选择的。
根据一些实施方式,所述半径确定装置可以被配置成将步骤i至iii的迭代次数确定为信噪比的线性函数,所述信噪比的所述线性函数由斜率系数和截距系数定义,所述截距系数与发送功率、所述给定阈值以及所述信道矩阵的行列式有关。
根据一些实施方式,所述解码器可以还包括码元估计单元,所述码元估计单元被配置成通过应用基于球搜索的估计算法来确定由所接收的信号携带的信息码元向量的至少一个估计,所述基于球搜索的估计算法根据在以表示所接收的信号的点为中心并由所述搜索球半径定义的球区域内找到的晶格点来确定信息码元向量的所述至少一个估计。
根据一些实施方式,所述基于球搜索的估计算法可以是在包括球解码器和球边界栈解码器的组中选择的。
还提供了一种用于使用搜索球半径对通过由信道矩阵表示的传输信道接收的信号进行解码的方法,所述方法包括根据初步半径确定所述搜索球半径,并且
i.对根据所接收的信号、所述信道矩阵和当前半径得到的输入数据应用机器学习算法,所述当前半径最初被设定为所述初步半径,通过应用所述机器学习算法提供与所述当前半径相关联的晶格点当前预测数量;
ii.将所述晶格点当前预测数量与给定阈值进行比较;
iii.如果所述晶格点当前预测数量严格高于所述给定阈值,则更新所述当前半径,所述当前半径是通过对所述当前半径应用线性函数来更新的。
可以迭代步骤i至iii,直到满足终止条件,所述终止条件与所述当前预测数量有关,所述方法包括响应于满足终止条件而将所述搜索球半径设定为所述当前半径。
有利地,本发明的实施方式提供了有效的球半径设计和控制技术,其允许在不损害解码错误性能的情况下降低基于球搜索的顺序ML解码器的复杂性。
有利地,本发明的实施方式通过减少在搜索ML解期间访问的晶格点的数量能够加速基于连续球搜索的ML解码器的收敛时间。本发明的实施方式尤其适用于涉及大量发送天线和/或接收天线的高维系统。
通过阅读附图和详细说明,本领域技术人员将清楚本发明的其它优点。
附图说明
结合在本说明书中并构成其一部分的附图示出了本发明的各种实施方式。
图1是本发明在通信系统中的示例性应用的示意图。
图2是根据一些实施方式的无线单用户MIMO系统中的空间-时间解码器的实现的示意图。
图3是示出根据本发明一些实施方式的空间-时间解码器的框图。
图4示出了根据本发明的一些实施方式的使用深度神经网络的机器学习算法的示意图。
图5是示出根据本发明一些实施方式的解码方法的流程图。
图6是示出根据本发明一些实施方式的半径确定方法的流程图。
图7是示出根据本发明一些实施方式的用于训练深度神经网络的方法的流程图。
图8是示出根据本发明的一些实施方式作为获得的信噪比的函数的误码率性能的图。
图9是示出根据本发明的一些实施方式的作为对于8×8MIMO系统针对MMSE、SDIRS、NN-SD和SSD解码器获得的信噪比的函数的平均处理时间的图。
图10是示出根据本发明的一些实施方式的作为对于16×16MIMO系统针对MMSE、SDIRS、NN-SD和SSD解码器获得的信噪比的函数的平均处理时间的图。
图11是示出根据本发明的一些实施方式的作为对于8×8MIMO系统针对SDIRS和NN-SD解码器获得的信噪比的函数的落在球区域内的晶格点的平均数量的图。
图12是示出根据本发明的一些实施方式的作为对于16×16MIMO系统针对SDIRS和NN-SD解码器获得的信噪比的函数的落在球区域内的晶格点的平均数量的图。
具体实施方式
本发明的实施方式提供了用于以降低的计算复杂性在通信系统中对来自通过传输信道接收的信号的信息码元向量进行解码的装置、方法和计算机程序。特别地,本发明的实施方式提供了用于有效设计和控制在包括球解码器和球边界栈解码器的基于球搜索的ML顺序解码器中使用的搜索球半径的装置、方法和计算机程序产品。根据本发明实施方式的搜索球半径的设计和控制依赖于机器学习技术。
为了便于理解本发明的一些实施方式的描述,下面叙述一些定义和标记。
Λ是指在欧几里得空间
Figure BDA0003445557380000071
上构造的n维晶格,并且表示欧几里得空间
Figure BDA0003445557380000072
的加性离散子群。晶格Λ跨越由
Figure BDA0003445557380000073
的n个线性无关向量v1,…,vn,并且由根据下式的整数线性组合的集合给出:
Figure BDA0003445557380000074
晶格生成器矩阵
Figure BDA0003445557380000075
是指包含实数值分量
Figure BDA0003445557380000076
的实数值矩阵。属于晶格Λ的晶格点u是n维向量,
Figure BDA0003445557380000077
其可以根据下式被写为晶格生成器矩阵H的函数:
Figure BDA0003445557380000078
m(.)=‖.‖2定义了欧几里得度量(也称为“欧几里得距离”)作为在欧几里得空间中的两个点之间的距离。
最接近向量问题是指在给定欧几里得向量空间
Figure BDA0003445557380000079
中的向量v的情况下,找到晶格Λ中最接近向量v的向量u的优化问题,向量v和向量u之间的距离由度量m来测量。最接近向量问题将是求解由以下给出的优化问题:
Figure BDA0003445557380000081
r0表示初步球半径。
rs表示在解码过程的搜索阶段在基于球搜索的估计算法中使用的搜索球半径(也称为“初始球半径”)。
D(K,θk=1,…,K,σ)是指由输入层和包括一个或更多个隐藏层和输出层的K≥2个层以及彼此连接的人工神经元(以下称为“节点”或“计算节点”)组成的多层深度神经网络。层的数量K表示深度神经网络的深度,各个层中的节点的数量表示深度神经网络的宽度。N(k)表示第k层的宽度并且对应于第k层中的计算节点的数量。
多层深度神经网络与表示为θk=1,…,K的模型参数和表示为σ的激活函数相关联。激活函数σ是表示义多层深度神经网络的隐藏层中的神经元的输出的计算非线性函数。模型参数θk=1,…,K包括多组参数θk,k=1,…,K,第k个组
Figure BDA0003445557380000082
Figure BDA0003445557380000083
表示与多层深度神经网络的第k个层相关联的一组层参数,包括:
-第一层参数,表示为
Figure BDA0003445557380000084
代表包括实数值系数的权重矩阵,各个系数表示与属于第k层的节点和属于第k-1层的节点之间的连接相关联的权重值;
-第二层参数,表示为
Figure BDA0003445557380000085
代表与第k层相关联的偏置值的向量。
L表示损失函数,并且是指用于在深度神经网络的训练过程中估计值(也称为“中间”)和期望值之间的损失(也称为“误差”或“成本”)的数学函数。
优化器(以下称为“优化算法”或“梯度下降优化算法”)是指用于在训练阶段更新深度神经网络的参数的优化算法。
历元(epoch)指训练数据在训练阶段通过深度神经网络的次数。
小批量(mini-batch)是指从训练数据中提取并在训练阶段的迭代中使用的训练数据的子集。小批量大小是指划分的各个小批量中训练数据样本的数量。
梯度下降算法的学习速率(也称为“步长”)是指与梯度的大小相乘的标量值。
本发明的实施方式提供了总体上使得能够使用基于球搜索的顺序算法(也称为“基于球搜索的估计算法”)以降低的复杂性来解决最接近向量问题的装置、方法和计算机程序产品。最接近向量问题出现在几个领域和应用中,包括但不限于计算机科学、编码、数字通信和存储、以及密码学。因此,本发明的实施方式可以在设计成以数字形式存储、处理或传送信息的各种数字系统中实现。示例性应用包括但不限于:
-数字电子装置;
-通信(例如,使用晶格结构化的信号星座的数字数据编码和解码);
-数据处理(例如,在计算网络/系统,数据中心中);
-数据存储(例如云计算);
-密码学(例如,线-抽头信道中的编码)
-等等。
示例性数字系统包括但不限于:
-通信系统(例如,无线电、无线、单天线通信系统、多天线通信系统、基于光纤的通信系统);
-通信设备(例如,单天线或多天线设备中的收发器、基站、用于编码和/或解码由信号星座图表示的数字未编码或编码信号的中继站、移动电话设备、计算机、膝上型电脑、平板电脑、无人机、IoT设备);
-用于实现基于晶格的加密方案(例如GGH加密方案和NTRUEEncrypt)、基于晶格的签名(例如GGH签名方案)和基于晶格的哈希函数(例如SWIFFT和LASH)的通信、数据处理或存储的密码系统和设备;
-定位系统(例如在GNSS中用于载波相位的整数模糊度解算);
-等等。
本发明的实施方式可以具体地在通信系统中实现,以确定从一个或更多个发送器装置传送到接收器装置的信息码元向量的估计,该估计问题等效于求解由表示传输信道的信道矩阵生成的晶格中的最接近向量问题。
仅用于说明目的,本发明的一些实施方式的以下描述将主要参照通信系统进行。然而,本领域技术人员将容易理解,本发明的各种实施方式可以应用于其它类型的系统,例如信号处理系统、密码系统和定位系统。
图1是根据一些实施方式的通信系统100的示例性应用的框图。通信系统100可以是有线的、无线的或光学的(例如基于光纤的)。通信系统100可以包括至少一个发送器装置11(以下称为“发送器”),其被配置成通过传输信道13向至少一个接收器装置15(以下称为“接收器”)发送多个信息码元。接收器15可以包括MIMO解码器10(也称为“解码器”或“空间-时间解码器”),以对由一个或更多个发送器装置11发送的信息码元进行解码。传输信道13可以是任何有线连接、无线介质或光链路。
在本发明对无线电通信的应用中,通信系统100可以是无线单用户MIMO系统,其包括无线发送器装置11和无线接收器装置15,无线发送器装置11被配置成传递表示输入数据的信息流码元流,无线接收器装置15被配置成对发送器11传送的码元进行解码。
发送器装置11可以配备有一个或更多个发送天线,接收器装置15可以配备有一个或更多个接收天线,发送天线的数量nt和接收天线的数量nr大于或等于1。
在本发明对无线电通信的另一应用中,通信系统100可以是无线多用户MIMO系统,其中多个无线发送器装置11和接收器装置15彼此通信。在这样的实施方式中,通信系统100还可以单独或组合地使用任何多址技术,例如时分多址(TDMA)、频分多址(FDMA)、码分多址(CDMA)和空分多址(SDMA)。
在本发明对光通信(例如自由空间光通信和卫星通信)的应用中,通信系统100可以是基于光纤的通信系统。因此,发送器11和接收器15可以是能够在基于光纤的传输系统中操作的任何光收发机。传输信道13可以是被设计成在短距离或长距离上传送数据的任何光纤链路。使用短距离上的光纤链路的示例性应用包括诸如数据中心互连的高容量网络。使用长距离光纤链路的示例性应用包括陆地和越洋传输。在这样的实施方式中,由发送器11传送的信息码元可以由根据光纤的不同偏振状态偏振的光信号承载。光信号根据一个或更多个传播模式沿着基于光纤的传输信道11传播,直到到达接收器15。
在本发明对光通信的另一应用中,可以使用单波长激光器产生承载信息码元的光信号。
在其他实施方式中,可以在发送器11处使用波分复用(WDM)技术,以使得能够使用多个独立波长产生光信号。
在本发明对使用多模和/或多芯光纤的光通信系统的又一应用中,空分复用技术可用于根据各种传播模式来复用信息码元。
此外,在本发明的一些应用中,可以将诸如WDMA(波分多址)的多址技术用于光通信系统。
传输信道13可以是任何线性加性白高斯噪声(AWGN)信道或使用诸如OFDM(正交频分复用)和FBMC(滤波器组多载波)的单载波或多载波调制格式以减轻频率选择性、干扰和延迟的多径信道。
仅出于说明的目的,将参照无线单用户MIMO系统进行以下描述,该无线单用户MIMO系统包括配备有nt≥1个发送天线的发送器装置11和配备有nr≥1个接收天线的接收器装置15,用于对发送器11发送的信息码元进行解码。然而,本领域技术人员将容易理解,本发明的实施方式适用于其它通信系统,例如无线多用户MIMO系统和光MIMO系统。更一般地,本发明可以应用于以接收器装置处的信道输出的线性表示(等效地,晶格表示)为特征的任何通信系统。此外,虽然不限于这样的实施方式,但是本发明在存在大于或等于2的发送天线数量和/或大于或等于2的接收天线数量的情况下具有特别的优点。
参照图2,示出了其中可以实现本发明的各种实施方式的示例性无线单用户MIMO通信系统200。无线单用户MIMO通信系统200可以包括发送器20,其实现空间-时间块码(STBC)以在时间和空间维度上(即在发送天线上)复用信息码元。根据无线通信系统200,站的各个发送器20可以与另一站的接收器21交换数据。
无线单用户MIMO通信系统200可以呈现对称配置。如本文所使用的,对称配置是指其中发送器20和接收器21配备有相同数量的天线nt=nr的配置。或者,MIMO配置可以是非对称的,接收天线的数量nr不同于发送天线的数量nt。特别地,在一个实施方式中,为了避免秩不足问题,接收天线的数量nr可以大于发送器处的天线的数量nt。示例性非对称MIMO配置包括例如在LTE标准和WIFITM标准中支持的2×4(nt=2,nr=4)和4×8(nt=4,nr=8)。
发送器20可以通过由信道矩阵Hc表示的有噪声无线MIMO信道向接收器21传送信号。发送器20可以在能够在无线环境中工作的不同装置或系统中实现。适用于这种应用的示例性装置包括移动电话、无人机、膝上型电脑、平板电脑、机器人、IoT(物联网)装置、基站等。发送器20可以是固定的或移动的。其可包括例如:
-信道编码器201,其实现一个或更多个前向纠错(FEC)码,例如线性分组码、卷积码、极化码、低奇偶校验码(LDPC)等;
-调制器203,其实现诸如正交幅度调制(QAM)的调制方案,以传递调制码元向量sc
-空间-时间编码器205,用于传递码字矩阵X;
-nt个发送天线207,各个发送天线与诸如OFDM或FBMC调制器的单载波或多载波调制器相关联。
发送器20可以被配置成使用FEC编码器201将接收到的信息比特流编码为数据输入,FEC编码器201实现例如线性块码、卷积码、低密度奇偶校验(LDPC)码或极性码。然后可以使用调制器203将经编码的二进制信号调制为码元向量sc。可以实现不同的调制方案,例如具有2q个码元或状态的2q-QAM或22q-PSK。调制向量sc可以是包括к个复数值码元s1,s2,…,sк的复数值向量,各个码元q个比特。
信息码元sj具有平均功率Es,并且可以写为以下形式:
Figure BDA0003445557380000121
在算式(4)中,i表示使得i2=-1的复数,并且算子
Figure BDA0003445557380000122
Figure BDA0003445557380000123
分别输出输入值的实部和虚部。
当使用诸如2q-QAM的调制格式时,2q个码元或状态表示整数字段
Figure BDA0003445557380000124
的子集。对应的星座由表示不同状态或码元的2q个点组成。此外,在平方调制的情况下,信息码元的实部和虚部属于相同的有限字母表A=[–(q-1),(q-1)]。调制方案的最小距离dmin表示星座中的两个相邻点之间的欧几里得距离,并且在这样的示例中等于2。
空间-时间编码器205可用于根据经编码的码元生成码字矩阵X。空间-时间编码器205可以使用长度为T的线性STBC,并且可以传递属于码本C并且是在T个时隙上发送的尺寸为nt×T的码字矩阵X。这种码的编码率等于
Figure BDA0003445557380000125
个每信道使用的复数码元,其中к是在这种情况下构成维度为к的向量sc=[s1,s2,…,sк]t的经编码的复数值码元的数量。当使用全速率码时,空间-时间编码器205对к=ntT个复数值码元进行编码。STBC的示例是理想码。理想码通过对数量
Figure BDA0003445557380000126
个复数信息码元进行编码来提供全编码率,并且满足非消失的行列式特性。
在一些实施方式中,空间-时间编码器205可以通过在不同的发送天线上复用接收到的复数值信息码元来使用被称为V-BLAST方案的空间复用方案,而不在时间维度上执行编码。
这样构造的码字可以使用多载波调制技术(例如使用OFDM或FBMC调制器)从时域转换到频域,并且在发送天线207上扩展。信号可以在可选的滤波、频率变换和放大之后从发送天线207发送。
接收器21可以被配置成接收和解码由无线网络中的发送器20通过经受衰落和干扰并且由复数值信道矩阵Hc表示的传输信道(也称为“通信信道”)传送的信号。此外,通信信道可能是有噪声的,例如受到高斯噪声的影响。
接收器21可以集成在基站中,例如蜂窝网络中的节点b、局域网或自组织网络中的接入点或在无线环境中操作的任何其它接口装置。接收器21可以是固定的或移动的。在一个示例性实施方式中,接收器21可以包括:
-空间-时间解码器211(也称为“MIMO解码器”),其被配置成从信道矩阵Hc和信道输出信号Yc传递经调制的码元向量sc的估计
Figure BDA0003445557380000131
-解调器213,其被配置成通过对所估计的码元向量
Figure BDA0003445557380000132
进行解调来生成二进制序列,以及
-信道解码器215,其被配置成使用例如维特比算法来传递二进制信号作为输出,该二进制信号是所发送的比特的估计。
接收器21执行与发送器20所执行的处理相反的处理。因此,如果在发送器处使用了单载波调制而不是多载波调制,则FBMC解调器的nr OFDM可以由相应的单载波解调器代替。
图3表示根据应用于无线瑞利衰落多天线系统的一些实施方式的空间-时间解码器300的块结构,解码器300被配置成接收和解码从配备有nt个发送天线的发送器发送的信号,解码器300在配备有nr个接收天线的接收器装置中实现。
根据其中在发送器处使用对к个码元进行编码的长度为T的空间-时间码执行空间-时间编码的一些实施方式,接收到的复数值信号可以以下形式写出:
Yc=HcXc+Wc (5)
在算式(5)中,Yc表示nr×T矩阵,其表示接收信号,Xc表示维度为nt×T的复数值码字矩阵。
根据使用V-BLAST空间复用的一些实施方式,接收到的复数值信号可以以如下形式写出:
yc=Hcsc+wc (6)
在算式(6)中,yc是nr维向量,sc表示所传输的nt维信息码元的复数值向量。
复数值nr×nt矩阵Hc表示包括衰落增益的信道矩阵。在瑞利衰落信道中,信道矩阵Hc的条目是独立同分布(i.i.d)复高斯类型的。可以使用诸如最小平方估计器的估计技术在接收器处的相干传输中估计信道矩阵。除了多径衰落效应之外,传输信道可以是有噪声的。噪声可以由系统组件的热噪声、用户间干扰和天线截取的干扰辐射引起。总噪声可以通过分别由nr×T复数值矩阵Wc和nr维复数值向量wc建模的各个实数值维度的方差为σ2的零均值加性白高斯噪声来建模。
解码器可以包括复-实转换器301,其被配置成将复数值信道矩阵Hc转换为实数值等效信道矩阵H,并将复数值接收信号转换为实数值信号。
在使用V-BLAST空间复用的一个实施方式中,复-实转换器301可以被配置成将复数值系统转换为:
Figure BDA0003445557380000141
Figure BDA0003445557380000142
Figure BDA0003445557380000143
算子表示构成基础向量或矩阵的各个元素的实部和虚部。可以考虑向量元素的任意顺序来执行复数到实数的转换,并且不限于该示例性转换。
在发送器处使用线性空间-时间块编码的另一实施方式中,复-实转换器301可以被配置成将复数值系统变换为可以以线性表示形式写出的实数值系统,其中等效信道矩阵是由下式给出的实数值2nrT×2к矩阵Heq
Figure BDA0003445557380000144
2nrT×2к矩阵G表示在发送器处使用的线性空间-时间块码的被称为生成器矩阵或编码矩阵的实数值矩阵。IT表示维数T的单位矩阵,并且算子
Figure BDA0003445557380000145
是克罗内克(Kronecker)矩阵乘积。
为了便于理解下面的实施方式,下面的描述将参照空间复用方案并涉及对称MIMO配置,其中发送器和接收器配备有相同数量的天线nt=nr,这仅用于说明的目的。因此,实数值系统可以以线性形式写为:
y=Hs+w (9)
在算式(9)中,向量y、s和w是n=2nt=2nr的n维向量,并且等效实数值信道矩阵H是平方n×n矩阵。向量s包括包含在向量sc中的原始复数值信息码元的实部和虚部。在使用例如2q-QAM调制的实施方式中,向量s的分量属于相同的有限字母表A=[–(q-1),(q-1)]。
在给定向量s的整数性质的情况下,形式为x=Hs的任何信号可以被认为是来自实数值信道矩阵H的生成器矩阵的n维晶格ΛH的点。因此,实数值MIMO系统可以与晶格表示相关联。包括原始复数值信息码元的实部和虚部的向量s的各个可能值可以由晶格ΛH中的晶格点表示。此外,由于噪声向量w的存在,实数值接收信号y不对应于晶格点。其可以被视为晶格ΛH的受噪声向量w干扰的点。
晶格根据定义是无限的,即包括无限的晶格点。当使用诸如QAM的调制时,码元向量s的可能值的集合是有限的,并且由有限的字母表A确定。在这种情况下,与向量s的可能值相关联的晶格点构成晶格ΛH中的有限数量的点。这样的晶格点在以下描述中将被称为“有效晶格点”。
根据ML解码准则,向量s的最优估计
Figure BDA0003445557380000151
是由下式给出的优化问题的解:
Figure BDA0003445557380000152
使用MIMO系统的晶格表示,求解ML解码问题简化为求解晶格ΛH中的最接近向量问题。在这种情况下,ML解在欧几里德距离最小化的意义上对应于与接收信号最接近的有效晶格点。
对于实际实现,可以基于QR分解来使用MIMO系统的等效树表示。因此,解码器300可以包括QR分解器303,其被配置成通过对实数值信道矩阵应用QR分解以使得H=QR来生成正交矩阵
Figure BDA0003445557380000153
和上三角矩阵
Figure BDA0003445557380000154
上三角矩阵的分量由Rij表示,其中i,j=1,…,n。
解码器300还可以包括乘法单元305,其被配置成通过利用从实数值信道矩阵的QR分解获得的正交矩阵Q的转置对实数值信号y进行缩放来确定接收信号y,使得:
Figure BDA0003445557380000155
在算式(11)中,在矩阵Q是正交的情况下,
Figure BDA0003445557380000156
表示具有与噪声向量w相同的统计特性(相同的协方差矩阵)的经缩放的噪声向量。相应地,等效的晶格表示可以由上三角矩阵R的生成器矩阵的晶格ΛR来定义。ML解码问题可以相应地表示为:
Figure BDA0003445557380000157
ML度量可以被定义为:
Figure BDA0003445557380000158
此外,给定矩阵R的上三角结构,树表示可以与MIMO系统相关联。树表示由解码树(以下称为“树”或“搜索树”)定义。解码树是包括多个节点、层次、分支和路径的图形数据结构。更具体地,解码树包括n个层次,其中各个层次至多包括card(A)个节点,card(A)表示有限字母表A的基数。
树中的节点对应于包含在向量s中的复数值信息码元的实部和虚部的不同的可能值。
层次以相反的顺序对应于向量s中的解码码元的次序,使得位于树的第一层次中的节点对应于码元s的向量的最后分量,第二层次对应于倒数第二,依此类推。通过写向量s=(s1,s2,…,sn)t,位于树中的层次k处的节点对应于码元sn-k+1的可能值。位于树的最后一层次的节点被称为叶节点,并且对应于第一码元s1的可能值。
分支从称为“根节点”的虚拟节点离开并且将位于两个连续层次的链路节点链接起来。根节点可以被表示为sroot或sn+1。表示为(si+1,si)的分支对应于位于连续层次n-i和n-i+1中的两个节点si+1和si之间的连接。将根节点连接到位于树的第一层次的节点sn的分支按照惯例表示为(sn+1,sn)。
各个分支与成本函数(在下文中也称为“部分度量”或“部分欧几里德距离”)相关联。与分支(si+1,si)相关联的成本函数可以使用ML度量来定义为:
Figure BDA0003445557380000161
Figure BDA0003445557380000162
表示向量
Figure BDA0003445557380000163
的第i个分量,Rij表示位于第i行第j列中的上三角矩阵R的分量。与在根节点处开始的分支(sn+1,sn)相关联的成本函数由下式给出:
Figure BDA0003445557380000164
树中的各个节点可以与度量相关联。使用分支的部分度量的定义,与树中的给定节点相关联的度量可以被看作构成从根节点到该给定节点的路径的不同分支的部分度量的总和。因此,与位于层次k的节点sn-k+1相关联的度量可以表示为:
Figure BDA0003445557380000165
从根节点到叶节点的路径对应于码元向量s的可能值
Figure BDA0003445557380000166
与叶节点相关联的度量对应于等效接收信号
Figure BDA0003445557380000167
与使用向量
Figure BDA0003445557380000168
获得的向量
Figure BDA0003445557380000169
之间的欧几里德距离。
根据MIMO系统的树表示,可以通过在解码树中执行树搜索来等效地求解ML优化问题。因此,ML解对应于解码树中的得到最低度量的路径。
树搜索的计算复杂性与树搜索期间访问的节点的数量成比例,访问的节点的数量依赖于各个层次的节点的数量以及解码树的总层次数量。
为了减少所检查的节点的数量并因此减少解码复杂性,本发明的实施方式提供了基于基于球搜索的估计算法的解码方法和装置,其通过为解码树的各个层次施加搜索间隔来减少树搜索期间访问的节点的数量。在探查具有最低度量的路径时,仅检查属于这些搜索间隔的节点。使用MIMO系统的等效晶格表示,访问的节点的数量的减少可以等效地看作将在晶格点搜索期间访问的晶格点的数量减少到落在以表示接收信号
Figure BDA0003445557380000171
的实数值的点为中心的搜索球半径rs的球区域
Figure BDA0003445557380000172
内的晶格点。因此,通过求解由以下给出的优化问题来确定ML解:
Figure BDA0003445557380000173
偏离搜索球半径rs,基于球搜索的估计算法搜索与球区域
Figure BDA0003445557380000174
内的信息码元向量的可能值之一相关联的第一晶格点。在找到有效晶格点时,将搜索球半径的值更新为在球区域
Figure BDA0003445557380000175
中找到的该晶格点与表示接收信号
Figure BDA0003445557380000176
的点之间的欧几里德距离的值。迭代地执行该球约束搜索和半径更新,直到找到ML解,该ML解对应于包括有效晶格点并且以表示接收信号的点为中心的最小球。
晶格点搜索阶段的复杂性主要依赖于搜索球半径rs的选择。本发明的实施方式提供了用于确定搜索球半径rs的有效装置和方法,其能够在不牺牲最优性能的情况下降低树搜索阶段的复杂性。
因此,解码器300可以包括半径确定装置307,其被配置成通过对依赖于接收信号
Figure BDA0003445557380000177
和信道矩阵R的输入数据应用机器学习算法来根据初步半径r0确定搜索球半径rs
根据一些实施方式,半径确定装置307可以被配置成通过在多次迭代Niter期间更新当前半径直到满足停止条件(也被称为“终止条件”)来根据迭代过程确定搜索球半径rs。对应于第i次迭代的当前半径由
Figure BDA0003445557380000178
表示,其中i=1,…,Niter。因此,在i=1的第一迭代中,半径确定装置307可以被配置成初始地将当前半径设定为初步半径r0,使得
Figure BDA0003445557380000179
在初始化了当前半径之后,半径确定装置307可以被配置成在Niter迭代期间迭代地更新当前半径。对于i=1,…,Niter,各个第i次迭代包括以下步骤:
i.对根据接收信号
Figure BDA00034455573800001710
信道矩阵R和当前半径
Figure BDA00034455573800001711
得到的输入数据应用机器学习算法,通过应用所述机器学习算法提供与当前半径
Figure BDA00034455573800001712
相关联的晶格点的数量的当前预测
Figure BDA00034455573800001713
(也称为“晶格点当前预测数量”);
ii.将晶格点当前预测数量
Figure BDA00034455573800001714
与由Nth表示的给定阈值进行比较;
iii.半径确定装置307被配置成如果晶格点数量的当前预测
Figure BDA00034455573800001715
严格高于该给定阈值,即如果
Figure BDA00034455573800001716
则通过将线性函数f(.)应用于当前半径来更新当前半径
Figure BDA00034455573800001717
因此,首先更新迭代的索引,使得i=i+1,然后更新当前球半径,使得
Figure BDA00034455573800001718
终止条件与晶格点当前预测数量有关。更具体地,如果晶格点当前预测数量
Figure BDA0003445557380000181
小于或等于给定阈值Nth,则满足终止条件。半径确定装置307可以被配置成一旦满足停止条件,将搜索球半径rs设定为与满足停止条件的晶格点当前预测数量
Figure BDA0003445557380000182
相关联的最后更新的当前半径
Figure BDA0003445557380000183
使得
Figure BDA0003445557380000184
这意味着半径确定半径307可以被配置成响应于满足终止条件而将搜索球半径设定为当前半径。
根据一些实施方式,半径确定装置307可以被配置成使用线性函数来更新当前半径,该线性函数具有等于1/2的斜率参数和等于零的截距参数,该线性函数保持将当前半径除以2,即
Figure BDA0003445557380000185
在各次迭代i=1,…,Niter时,半径确定装置307可以被配置成应用机器学习算法来确定与落在以接收信号
Figure BDA0003445557380000186
为中心并且具有当前半径
Figure BDA0003445557380000187
的球半径的球区域内的晶格点的预测数量相对应的晶格点的预测数量
Figure BDA0003445557380000188
机器学习算法在各次迭代i=1,…,Niter时将由
Figure BDA0003445557380000189
表示的输入向量作为输入,该输入向量包括接收信号
Figure BDA00034455573800001810
的n个分量、当前半径
Figure BDA00034455573800001811
以及上三角信道矩阵R中的n2个分量。
根据一些实施方式,半径确定装置307可以被配置成根据噪声方差σnoise、信道矩阵R的对角分量以及表示接收信号
Figure BDA00034455573800001812
与估计向量yest之间的距离的欧几里德距离中的至少一个参数来确定初步半径r0,估计向量是通过应用次优估计算法来确定的,该次优估计算法是在包括迫零判决反馈均衡器(ZF-DFE)和最小均方误差估计(MMSE)算法的组中选择的。
根据一些实施方式,半径确定装置307可以被配置成根据下式基于信道加性噪声的方差来确定初步半径:
Figure BDA00034455573800001813
根据一些实施方式,半径确定装置307可以被配置成依赖于信道矩阵R的对角分量来确定初步半径,以考虑传输信道的动态特性和根据下式的信号衰落的变化:
r0=min(diag(HtH))=min(diag(RtR)) (19)
根据其中半径确定装置307被配置成根据
Figure BDA00034455573800001814
将初步半径确定为信道噪声的方差的函数的一些实施方式,半径确定装置307可以被配置成将步骤i至iii的迭代次数Niter确定为信噪比的线性函数,该线性函数以分贝表示为
Figure BDA00034455573800001815
Figure BDA00034455573800001816
其中Pt表示发送功率。更具体地,半径确定装置307可以被配置成通过利用将给定阈值Nth与晶格ΛR的晶格生成器矩阵R的行列式相关的计数函数来确定信噪比的线性函数,该计数函数由下式给出:
Figure BDA0003445557380000191
rth表示包含等于阈值Nth的数量的晶格点的球的半径,det(ΛR)表示晶格ΛR的生成器矩阵的行列式,并且Vn表示实向量空间
Figure BDA0003445557380000192
中的单位半径球的体积。
使用该计数函数,发明人确定通过在Niter个迭代期间将初步半径
Figure BDA0003445557380000193
连续除以2,迭代次数Niter可以根据线性函数Niter=aρ+b表示为信噪比ρ的函数,线性函数Niter=aρ+b由表示为a的斜率系数和表示为b的截距系数定义,斜率系数是根据下式给出的:
Figure BDA00034455573800001910
截距系数b根据下式依赖于发送功率Pt、给定阈值Nth和晶格ΛR的生成器矩阵R的行列式:
Figure BDA0003445557380000194
通过利用将迭代次数与信噪比关联的线性函数,半径确定装置307可以被配置成将搜索半径设定为等于
Figure BDA0003445557380000195
而不执行机器学习处理。该技术被称为“基于智能球的解码”或SSD。
解码器300还可以包括码元估计单元309,其被配置成通过应用基于球搜索的估计算法来求解ML优化问题,以确定信息码元向量s的至少一个估计
Figure BDA0003445557380000196
信息码元向量的至少一个估计是根据在晶格点搜索阶段在半径rs的球区域
Figure BDA0003445557380000197
内找到的晶格点来确定的。
根据一些实施方式,可以在包括球解码器和SB-栈解码器的组中选择基于球搜索的估计算法。
根据其中考虑球解码器的一些实施方式,码元估计单元309可以被配置成针对信息码元向量=(s1,s2,…,sn)t中的各个解码码元st定义被表示为It=[binf,t,bsup,t]的搜索间隔,搜索间隔It的下边界binf,t和上边界bsup,t被确定为搜索球半径rs的函数。通过根据分支和边界方案扫描半径为rs的球区域
Figure BDA0003445557380000198
中的点,并选择满足ML优化问题中表示的成形约束的有效晶格点,可以递归地找到球约束。球解码器基于深度优先树搜索策略。每当在球
Figure BDA0003445557380000199
内找到有效晶格点时,通过将搜索球半径设定为等于所发现的晶格点与接收信号之间的欧几里德距离的新值可以更新搜索球半径。当已经递归地搜索了所有晶格点时,可以从球区域内的所发现的晶格点选择具有到接收信号的最小欧几里德距离的所发现的晶格点来确定信息码元向量的至少一个估计。
根据其中考虑SB-栈的其它实施方式,可以使用最佳第一树搜索来探查解码树中的节点。从根节点开始,探查所有子节点或子节点的子集,并为各个探查的子节点计算部分度量。只有具有满足球约束和搜索间隔的部分度量的节点被生成并存储在栈中。继续搜索直到找到叶节点,并且返回对应于ML解的最优路径,而不更新搜索球半径。
解码器300还可以包括实-复转换器311,其被配置成传送复数值向量
Figure BDA0003445557380000201
作为复数值码元的原始向量sc的估计。然后,可以将所获得的候选向量
Figure BDA0003445557380000202
转换成复数值向量
Figure BDA0003445557380000203
使得对于j=1,…,n/2,分量
Figure BDA0003445557380000204
由下式给出:
Figure BDA0003445557380000205
(u)j表示向量u的第j个元素。
根据一些实施方式,机器学习算法可以是监督式机器学习算法,该监督式机器学习算法使用基于由输出对组成的经标记的训练数据确定的函数将输入数据映射到预测数据。示例性监督机器学习算法包括但不限于:支持向量机(SVM)、线性回归、逻辑回归、朴素贝叶斯、线性判别分析、决策树、k-最近邻算法、神经网络和相似性学习。
在优选实施方式中,监督式机器学习算法可以是多层感知器,其是多层前馈人工神经网络。
参照图4,例示了由输入层和包括一个或更多个隐藏层403和输出层405的至少两个层(K≥2)组成的多层深度神经网络D(K,θk=1,…,K,σ)400。输入层401、一个或更多个隐藏层403和输出层405中的各个层包括多个人工神经元或计算节点4011。
多层深度神经网络400是完全连接的。因此,一层中的各个计算节点以某个权重连接到下一层中的各个计算节点,即,将来自前一层的连接节点的输入与放大或衰减输入值的一组权重组合。从被配置成接收输入数据的输入层401开始,各个层的输出同时是后续层的输入。
除了输入计算节点,即输入层中的计算节点4011,包括在一个或更多个隐藏层中的各个计算节点4011实现将计算节点的加权输入映射到计算节点的输出的非线性激活函数σ。
根据多层结构,深度神经网络定义映射
Figure BDA0003445557380000206
其通过K个迭代机器学习处理步骤在各次迭代i=1…Niter处将输入向量
Figure BDA0003445557380000211
映射到表示为
Figure BDA0003445557380000212
的输出向量,深度神经网络的K个层中的第k层携带由
Figure BDA0003445557380000213
Figure BDA0003445557380000214
表示的映射,其将第k层作为输入接收的输入向量
Figure BDA0003445557380000215
映射到输出向量
Figure BDA0003445557380000216
第k层处的映射依赖于输入向量
Figure BDA0003445557380000217
该输入向量对应于前一层的输出向量以及与第k层相关联的参数集
Figure BDA0003445557380000218
与第k层(除了输入层之外)相关联的映射
Figure BDA0003445557380000219
可以表示为:
Figure BDA00034455573800002110
在第k层的计算节点处执行的输入权重乘积由权重矩阵W(k)与作为输入由第k层处理的输入向量
Figure BDA00034455573800002111
之间的乘积函数
Figure BDA00034455573800002112
表示,然后将这些输入权重乘积求和,并将该和传递通过激活函数σ。
根据一些实施方式,激活函数可以在一个或更多个隐藏层403的多个计算节点中的至少一个计算节点4011中实现。
根据一些实施方式,可以在隐藏层的各个节点处实现激活函数。
根据一些实施方式,可以在包括线性激活函数、S形(sigmoid)函数、Tanh、柔性最大值(softmax)函数、整流线性单位(ReLu)函数和CUBE函数的组中选择激活函数。
线性激活函数是其中信号不改变的恒等函数。
S形函数将几乎无限范围的自变量转换成“0”和“1”之间的简单概率。它是将值作为输入并输出在“0”到“1”之间的另一值的非线性函数。
tanh函数表示双曲正弦和双曲余弦之间的关系tanh(x)=sinh(x)/cosh(x)。
柔性最大值激活概括逻辑回归并返回互斥输出类上的概率分布。可以在深度神经网络的输出层中实现柔性最大值激活函数。
如果神经元的输入高于给定阈值,则ReLu激活函数激活该神经元。具体地,该给定阈值可以等于零(“0”),在这种情况下,如果输入变量是负值,则ReLu激活函数输出零值,并且如果输入变量是正值,则根据单位函数输出该输入变量。在数学上,ReLu函数可以表示为σ(x)=max(0,x)。
根据一些实施方式,半径确定装置307可以被配置成在训练阶段根据训练数据预先确定和更新多层深度神经网络的模型参数。半径确定装置307可以被配置成在实施为了确定搜索球半径rs而执行的Niter迭代之前离线地执行训练阶段。在确定了模型参数时,在各次迭代i=1…Niter时使用该模型参数来更新当前半径,直到达到停止条件。训练阶段(也称为“学习阶段”)是全局优化问题,其被执行来以使得能够最小化预测误差的方式调整模型参数θk=1,…,K,该预测误差量化多层深度神经网络与提供最佳预测的理想模型参数的接近程度。模型参数可以最初被设定为初始参数,初始参数例如可以是随机生成的。初始参数然后在训练阶段进行更新,并以使神经网络能够收敛到最佳预测的方式进行调整。
根据一些实施方式,可以使用后向传播监督式学习技术来训练多层深度神经网络,并且使用训练数据来预测未观测的数据。
后向传播技术是通过多层深度神经网络的不同层进行信息的前向和后向传播的迭代过程。
在前向传播阶段,神经网络接收训练数据,该训练数据包括训练输入值和与训练输入值相关联的期望值(也称为“标记”),当训练输入值被用作输入时,期望值对应于神经网络的期望输出。半径确定装置307在监督机器学习技术的应用中知道期望值。神经网络将训练数据传递通过整个多层神经网络,以确定对应于针对训练输入值获得的预测的估计值(也称为“中间值”)。训练数据以这样的方式传递,即包括在多层深度神经网络的不同层中的所有计算节点将它们的变换或计算应用到它们从先前层的计算节点接收的输入值,并将它们的输出值发送到随后层的计算节点。当数据已经穿过所有层并且所有计算节点已经进行了它们的计算时,输出层传送对应于训练数据的估计值。
前向传播阶段的最后一步包括将与训练数据相关联的期望值与当训练数据作为输入穿过神经网络时获得的估计值进行比较。该比较使得能够测量估计值相对于期望值有多好/多坏,并以使估计值接近期望值从而使得预测误差(也称为“估计误差”或“成本”)接近零为目的来更新模型参数。可以使用基于梯度过程的损失函数来估计预测误差,该梯度过程在目标函数的梯度方向上更新模型参数。
前向传播阶段之后是后向传播阶段,在后向传播阶段,通过应用优化算法以相反的顺序逐渐调整模型参数,例如计算节点4011的互连的权重,直到获得良好的预测并最小化损失函数。
首先,所计算的预测误差从输出层开始向后传播到一个或更多个隐藏层403的直接有助于计算估计值的所有计算节点4011。各个计算节点基于其对深度神经网络的输出的相对贡献接收总预测误差的一部分。逐层地重复该过程,直到深度神经网络中的所有计算节点已经接收到与它们对总预测误差的相对贡献相对应的预测误差。一旦预测误差向后扩展,可以通过根据损失函数的最小化应用优化算法来更新层参数,例如第一层参数(即权重)和第二层参数(即偏差)。
根据一些实施方式,半径确定装置307可以被配置成通过计算损失函数并针对整个训练数据更新模型参数,来在训练阶段根据“批量梯度下降方案”更新模型参数。
根据一些实施方式,半径确定装置307可以被配置成在训练阶段根据在线学习通过调整针对训练数据的各个样本的模型参数来更新模型参数。使用在线学习,针对训练数据的各个样本评估损失函数。在线学习也被称为“在线训练”和“随机梯度下降”。
根据其他实施方式,半径确定装置307可以被配置成在训练阶段使用小批量数据根据小批量学习(也被称为“小批量梯度下降”)根据训练数据更新模型参数,大小为sb的小批量数据是训练样本的数量为sb个的子集。因此,半径确定装置307可以被配置成将训练数据划分为大小为sb的两个或多个批量数据,各个批量包括sb个输入数据样本。输入数据然后批量地通过网络。对通过神经网络的各个小批量数据评估损失函数,并对各个小批量数据更新模型参数。因此,对各个小批量数据执行前向传播和后向传播阶段,直到最后批量。
根据一些实施方式,半径确定装置307可以被配置成在训练过程中通过深度神经网络400多次传递所有训练数据,称为历元。可以增加历元的数量,直到评估训练数据的准确度的准确度度量开始降低或继续增加(例如当检测到潜在的过拟合时)。
表示为
Figure BDA0003445557380000231
的接收到的训练数据可以包括表示为
Figure BDA0003445557380000232
的Nbs个训练样本,这些训练样本包括独立训练样本,独立训练样本依赖于训练接收信号
Figure BDA0003445557380000233
的分量、训练上三角矩阵R*的分量,以及训练球半径值
Figure BDA0003445557380000234
基于监督式学习,训练样本可以被标记,即当训练样本被用作深度神经网络的输入时,与对应于深度神经网络的输出的已知预期输出值(也称为“目标”或“标记”)相关联。更具体地,对于m=1,…,Nbs,各个样本x*,m可以与落在半径
Figure BDA0003445557380000235
的球区域内的晶格点数量的期望值
Figure BDA0003445557380000236
相关联。
根据使用小批量学习的一些实施方式,半径确定装置307可以被配置成在训练阶段确定(更新或调整)从接收的训练数据中提取的小批量的模型参数。在这样的实施方式中,半径确定单元307可以被配置成将接收到的训练数据划分为表示为x(*,1),x(*,2),…,x(*,NB)的NB组训练数据,训练数据d组是包括来自训练数据的sb个训练示例集的大小为s_b的小批量,即各个小批量x(*,1)包括sb个样本x(*,m),其中m在1和Nbs之间变化。小批量x(*,1)也由Sl表示,具有从Nbs个训练样本提取的训练样本,即
Figure BDA0003445557380000241
对于l=1,…,NB,各个小批量x(*,l)可以与以下目标值相关联,该目标值对应于当小批量数据x(*,l)用作深度神经网络的输入时预期由深度神经网络获得的晶格点的预期数量
Figure BDA0003445557380000242
可以将训练数据组和目标值分组为向量对,使得表示为
Figure BDA0003445557380000243
的各个向量对对应于第l个小批量的训练示例和目标值。
在给定训练数据和期望输出值的情况下,半径确定装置307可以被配置成执行训练过程的前向传播和后向传播阶段。
基于小批量训练,训练阶段可以包括两次或更多次处理迭代。在各个处理迭代处,半径确定器307可以被配置成:
-使用多组训练中的小批量x(*,l)作为输入来处理深度神经网络,通过处理深度神经网络提供与小批量x(*,l)相关联的被表示为
Figure BDA0003445557380000244
的晶格点的中间数量。晶格点的中间数量
Figure BDA0003445557380000245
是在多层深度神经网络的输出层预测的;
-根据与小批量x(*,l)相关联的晶格点的预期数量
Figure BDA0003445557380000246
和通过处理小批量数据x(*,l)确定的晶格点的中间数量
Figure BDA0003445557380000247
计算针对经处理的小批量x(*,l)的损失函数,该损失函数被表示为
Figure BDA0003445557380000248
-通过应用优化算法,根据损失函数
Figure BDA0003445557380000249
的最小化来确定在处理小批量x(*,l)之后的更新的模型参数。更具体地,半径确定单元307可以被配置成确定与多层深度神经网络D(K,θk=1,…,K,σ)的K个层中的各个层相关联的经更新的第一层参数
Figure BDA00034455573800002410
和经更新的第二层参数
Figure BDA00034455573800002411
第一层参数和第二层参数分别对应于与深度神经网络的神经元之间的连接相关联的权重和偏置值。
对于第一处理迭代,半径确定装置307可以被配置成确定将在训练过程的第一处理迭代的前向传播阶段使用的初始模型参数。更具体地,半径确定单元307可以被配置成确定与多层深度神经网络D(K,θk=1,…,K,σ)的K个层中的各个个相关联的初始第一层参数
Figure BDA00034455573800002412
和初始第二层参数
Figure BDA00034455573800002413
根据一些实施方式,半径确定装置307可以被配置成从一组随机值中随机地确定与深度神经网络的不同层相关联的初始第一层参数和初始第二层参数,例如遵循标准正态分布。
根据一些实施方式,可以在包括Adadelta优化算法、Adagrad优化算法、为各个模型参数计算自适应学习速率的自适应矩估计算法(ADAM)、Nesterov加速梯度(NAG)算法、Nesterov加速自适应矩估计(Nadam)算法、RMSprop算法、随机梯度优化算法和自适应学习速率优化算法的组中选择用于调整模型参数和确定更新的模型参数的优化算法。
根据一些实施方式,可以在包括用于线性回归的均方误差函数(MSE)和用于泊松回归的指数对数似然(EXPLL)函数的组中选择被考虑用来评估预测误差或损失的损失函数。
根据其中使用均方误差函数的一些实施方式,针对第l个小批量数据计算的损失函数表示为:
Figure BDA0003445557380000251
根据一些实施方式,半径确定装置307可以被配置成通过应用列表球解码算法(LSD)或列表球边界栈解码算法,根据球半径r和信道矩阵R预先确定与l=1,…,NB的各个小批量Sl相关联的期望晶格点数量
Figure BDA0003445557380000252
LSD和列表球边界栈解码算法是解决最接近向量问题的基于球的解码算法。它们输出位于给定半径的给定有界区域内的码字的列表。关于LSD实现方式的更多细节在“M.El-Khamy et al.,Reduced Complexity List SphereDecoding for MIMO Systems,Digital Signal Processing,Vol.25,Pages 84-92,2014”中公开。
参照图5,还提供了一种用于对通过通信系统中的传输信道接收的信号进行解码的解码方法,所述信号包括信息码元向量s=(s1,s2,…,sn)t,并且所述传输信道由信道矩阵R表示。
在步骤501,可以接收包括接收信号
Figure BDA0003445557380000253
信道矩阵R、初始半径r0和给定阈值Nth的输入。
在步骤503,可以通过对依赖于接收信号
Figure BDA0003445557380000254
和信道矩阵R的输入数据应用机器学习算法来确定搜索球半径rs
在步骤505,可以通过应用基于球搜索的估计算法来求解ML优化问题,来确定信息码元向量s的至少一个估计
Figure BDA0003445557380000255
信息码元向量的至少一个估计是根据在晶格点搜索阶段在半径rs的球区域
Figure BDA0003445557380000256
内发现的晶格点来确定的。
根据一些实施方式,可以在包括球解码器和SB-栈解码器的组中选择基于球搜索的估计算法。
根据一些实施方式,步骤501可以包括根据噪声方差σnoise、信道矩阵R的对角分量、以及测量接收信号
Figure BDA0003445557380000261
与通过应用次优估计算法确定的估计向量yest之间的距离的欧几里德距离中的一个或更多个来预先确定初步半径r0,该次优估计算法在包括迫零判决反馈均衡器(ZF-DFE)和最小均方误差估计(MMSE)算法的组中选择。
图6是示出根据一些实施方式在步骤502执行的用于确定搜索球半径rs的方法的流程图,其中在多次迭代Niter期间执行迭代过程以更新当前半径。该方法包括根据初步半径确定搜索球半径rs。更具体地,该方法包括:
i.对根据接收信号、信道矩阵和当前半径得到的输入数据应用机器学习算法,当前半径最初被设定为初步半径,通过应用所述机器学习算法提供与当前半径相关联的晶格点当前预测数量;
ii.将晶格点当前预测数量与给定阈值进行比较;
iii.如果晶晶格点当前预测数量严格高于给定阈值,则更新当前半径,当前半径是通过将线性函数f(.)应用于当前半径来更新的。
可以迭代步骤i到iii,直到满足终止条件,该终止条件与当前预测有关。该方法包括响应于满足终止条件而将搜索球半径设定为当前半径。
更具体地,在步骤601,可以将迭代过程的迭代索引初始化为i=1,并且可以将当前半径初始设定为初步半径
Figure BDA0003445557380000262
可以在多次迭代Niter期间重复步骤603至607,直到满足停止条件(也称为“终止条件”)。
在步骤603,可以对根据接收信号
Figure BDA0003445557380000263
信道矩阵R和当前半径
Figure BDA0003445557380000264
得到的输入数据应用机器学习算法,通过应用所述机器学习算法提供与当前半径
Figure BDA0003445557380000265
相关联的晶格点的当前预测数量
Figure BDA0003445557380000266
(也称为“晶格点当前预测数量”)。晶格点当前预测数量
Figure BDA0003445557380000267
对应于落入以接收信号
Figure BDA0003445557380000268
为中心并且具有当前半径
Figure BDA0003445557380000269
的球半径的球区域内的预测的晶格点数量。机器学习算法将输入向量
Figure BDA00034455573800002610
作为输入,其包括接收信号
Figure BDA00034455573800002611
的n个分量、当前半径
Figure BDA00034455573800002612
和上三角信道矩阵R中的n2个分量。
在步骤605,可以将晶格点当前预测数量
Figure BDA00034455573800002613
与给定阈值Nth进行比较。
如果在步骤605处确定晶格点当前预测数量
Figure BDA00034455573800002614
小于或等于给定阈值Nth,则在步骤609处可以将搜索球半径rs设定为最后更新的当前半径
Figure BDA0003445557380000271
其与满足步骤605的停止条件的晶格点当前预测数量
Figure BDA0003445557380000272
相关联。
如果在步骤605确定晶格点数量的当前预测
Figure BDA0003445557380000273
严格高于给定阈值,即,如果
Figure BDA0003445557380000274
则可以在步骤607更新当前半径。因此,可以递增迭代的索引,使得i=i+1,可以通过将线性函数f(.)应用于当前半径来更新当前半径,并且可以将所执行的迭代次数递增1,使得Niter=Niter+1。
根据一些实施方式,该线性函数可以具有等于1/2的斜率参数和等于零的截距参数,这对应于通过将当前半径除以二来更新当前半径,使得
Figure BDA0003445557380000275
根据一些实施方式,机器学习算法可以是在包括但不限于以下个项目的组中选择的监督式机器学习算法:支持向量机、线性回归、逻辑回归、朴素贝叶斯、线性判别分析、决策树、k-最近邻算法、神经网络和相似性学习。
在优选实施方式中,监督式机器学习算法可以是多层感知器,该多层感知器是由输入层和包括一个或更多个隐藏层和输出层的至少两个层(K≥2)组成的多层前馈人工神经网络D(K,θk=1,…,K,σ),并且与模型参数θk=1,…,K和激活函数σ相关联,模型参数θk=1,…,K包括多组层参数
Figure BDA0003445557380000276
各组层参数包括第一层参数W(k)和第二层参数b(k)
根据一些实施方式,可以在包括线性激活函数、S形函数、Tanh、柔性最大值函数、整流线性单位函数和CUBE函数的组中选择激活函数。
根据其中机器学习算法是多层深度神经网络的一些实施方式,步骤603可以包括被执行以根据后向传播监督式训练或学习过程来确定经更新的模型参数的子步骤,所述后向传播监督式训练或学习过程在在解码过程期间处理神经网络以确定当前半径之前使用训练数据来训练多层深度神经网络。
根据一些实施方式,可以在训练过程期间根据“批量梯度下降方法”通过计算损失函数并针对整个训练数据的模型参数来更新模型参数。
根据一些实施方式,可以在训练过程期间根据在线学习通过调整训练数据的各个样本的模型参数并计算训练数据的各个样本的损失来更新模型参数。
根据其他实施方式,可以在训练过程期间根据使用小批量数据的小批量学习从训练数据更新模型参数,大小为sb的小批量数据是sb个训练样本的子集。因此,训练数据可以被划分为大小为sb的两个或更多个小批量的数据,各个批量包括输入数据的sb个样本。然后输入数据以小批量通过网络。针对各个小批量数据评估损失函数,并对各个小批量数据更新模型参数。
图7是描绘根据一些实施方式的用于训练多层深度神经网络D(K,θk=1,…,K,σ)以确定在最小化预测误差方面提供最佳预测的模型参数θk=1,…,K的方法的流程图。
在步骤701,可以接收包括Nbs个训练样本
Figure BDA0003445557380000281
和期望的晶格点数量
Figure BDA0003445557380000282
的训练数据
Figure BDA0003445557380000283
对于m=1,…,Nbs,各个样本x*,m与落在半径
Figure BDA0003445557380000284
的球区域内的晶格点的数量的期望值
Figure BDA0003445557380000285
相关联。
在步骤703,训练数据可以被划分为多个NB组训练数据x(*,1),x(*,2),…,x(*,NB)。对于l=1,…,NB,各个小批量x(*,1)可以与目标值相关联,该目标值对应于当小批量数据x(*,1)被用作深度神经网络的输入时预期由深度神经网络获得的晶格点的预期数量
Figure BDA0003445557380000286
训练过程可以包括将两次或更多次的处理迭代重复直到达到训练条件。训练条件可以与处理的训练数据的小批量的数量和/或更新的模型参数关于由更新的模型参数产生的预测误差的最小化的优度有关。
在步骤705,可以执行第一处理迭代,在该第一处理迭代期间可以确定用于第一小批量数据的处理的初始模型参数。更具体地,可以在步骤705处确定与多层深度神经网络D(K,θk=1,…,K,σ)的K个层中的各个层相关联的初始第一层参数
Figure BDA0003445557380000287
Figure BDA0003445557380000288
和初始第二层参数
Figure BDA0003445557380000289
根据一些实施方式,与深度神经网络的不同层相关联的初始第一层参数和初始第二层参数可以从随机的一组值随机地确定,例如遵循标准正态分布。
可以重复步骤707到713以处理小批量的数据,直到达到停止条件。训练过程的处理迭代由步骤709至713组成,并且涉及对针对l=1,…,NB的多组训练x(*,l)中的小批量x(*,l)的处理。
在步骤709,可以使用多组训练中的小批量x(*,l)作为输入来处理多层深度神经网络,通过处理所述多层深度神经网络提供与小批量x(*,l)相关联的晶格点的表示为
Figure BDA00034455573800002810
的中间数量。晶格点的中间数量
Figure BDA00034455573800002811
在多层深度神经网络的输出层预测。
在步骤711,可以根据与小批量x(*,l)相关联的晶格点的已知预期数量
Figure BDA00034455573800002812
和通过在步骤709处理小批量x(*,l)的数据而确定的晶格点的中间数量
Figure BDA00034455573800002813
来计算针对经处理的小批量x(*,l)的损失函数
Figure BDA00034455573800002814
在步骤713,通过应用优化算法,根据损失函数
Figure BDA0003445557380000291
的最小化,在处理小批量x(*,l)之后,可以确定经更新的模型参数。更具体地,可以在步骤713更新与多层深度神经网络D(K,θk=1,…,K,σ)的K个层中的各个层相关联的第一层参数
Figure BDA0003445557380000292
和第二层参数
Figure BDA0003445557380000293
第一层参数和第二层参数分别对应于与深度神经网络的神经元之间的连接相关联的权重和偏置值。
根据一些实施方式,可以在包括Adadelta优化算法、Adagrad优化算法、自适应矩估计算法、Nesterov加速梯度算法、Nesterov加速自适应矩估计算法、RMSprop算法、随机梯度优化算法和自适应学习速率优化算法的组中选择优化算法。
根据一些实施方式,可以在包括均方误差函数和指数对数似然函数的组中选择损失函数。
根据一些实施方式,步骤701可以包括通过应用列表球解码算法或列表球边界栈解码算法,根据球半径r和信道矩阵R确定与l=1,…,NB的各个小批量Sl相关联的晶格点的期望数量
Figure BDA0003445557380000294
还提供了一种用于在解码器中确定搜索球半径的计算机程序产品,该解码器被配置成对通过传输信道接收的信号进行解码,所述信号包括信息码元向量s=(s1,s2,…,sn)t,并且所述传输信道由信道矩阵R表示。该计算机程序产品包括非暂时计算机可读存储介质,当由处理器执行时,该非暂时计算机可读存储介质使得该处理器通过迭代地更新当前半径直到满足终止条件来确定搜索球半径rs。使处理器初始地将当前半径
Figure BDA0003445557380000295
设定为初步半径r0,使得
Figure BDA0003445557380000296
并且在Niter次迭代期间迭代地更新当前半径
Figure BDA0003445557380000297
对于i=1,…,Niter的各个第i次迭代包括以下步骤:
-使用根据接收信号
Figure BDA0003445557380000298
信道矩阵R和当前半径
Figure BDA0003445557380000299
得到的输入数据来处理机器学习算法,通过处理所述机器学习算法提供与当前半径
Figure BDA00034455573800002910
相关联的晶格点数量的当前预测
Figure BDA00034455573800002911
(也称为“晶格点当前预测数量”);
-将晶格点数量的当前预测
Figure BDA00034455573800002912
与由Nth表示的给定阈值进行比较;
-如果晶格点数量的当前预测
Figure BDA00034455573800002913
严格高于给定阈值,即如果
Figure BDA00034455573800002914
则更新当前半径
Figure BDA00034455573800002915
当前半径
Figure BDA00034455573800002916
是通过向当前半径应用线性函数f(.)来更新的。因此,可以首先更新迭代的索引,使得i=i+1,然后可以更新当前球半径,使得
Figure BDA00034455573800002917
在一些实施方式中,线性函数可以具有等于1/2的斜率参数和等于零的截距参数。
如果晶格点数量的当前预测
Figure BDA0003445557380000301
小于或等于给定阈值Nth,则满足停止条件。一旦满足停止条件,搜索球半径rs可以被设定为与满足停止条件的晶格点当前预测数量
Figure BDA0003445557380000302
相关联的最后更新的当前半径
Figure BDA0003445557380000303
使得
Figure BDA0003445557380000304
已经在误码率、平均处理时间和球区域内晶格点的平均数量方面评估了使用所提供的球半径确定装置和方法的球解码器的性能。“NN-SD”是指使用深度神经网络确定搜索球半径的球解码器实现方式,“SDIRS”是指基于噪声统计确定搜索球半径的球解码器实现方式,并且“SSD”是指在不处理机器学习算法的情况下根据信噪比的线性函数确定搜索球半径的球解码器实现方式。考虑了使用16-QAM调制的8×8和16×16MIMO系统。使用了由一个输入层、一个隐藏层和一个输出层组成的多层深度神经网络。
图8示出了对作为对于8×8MIMO系统获得的针对SDIRS、NN-SD和MMSE解码器的信噪比的函数的误码率(BER)性能进行评估的图。数值结果表明,NN-SD提供了最佳的ML性能。
图9和图10示出了评估作为分别对于8×8和16×16MIMO系统的针对MMSE、SDIRS、NN-SD和SSD解码器获得的信噪比的函数的平均处理时间的图。数值结果表明,与现有的SDIRS相比,NN-SD解码时间大大缩短。在给定搜索球半径的选择的情况下,该处理时间的减少是在给定该搜索球半径的选择的情况下提供的,该搜索球半径的选择预期了在搜索阶段要访问的晶格点的数量的阈值。随着MIMO系统的维数增加,处理时间和计算复杂性的益处是显著的。
图11和图12示出了评估分别对于8×8和16×16MIMO系统而言落在球区域内的晶格点的平均数作为针对SDIRS和NN-SD解码器获得的信噪比的函数的图。数值结果表明,使用NN-SD时,晶格点的平均数几乎是信噪比的常函数,而使用SDIRS解码器时,对于低信噪比和中信噪比,晶格点的平均数较高。
虽然主要参照以相同数量的发送和接收天线为特征的对称MIMO配置来描述了本发明的实施方式,但是应当注意,本发明也可以应用于nt<nr的非对称MIMO配置。
此外,虽然已经关于无线单用户MIMO系统描述了本发明的一些实施方式,但是应当注意,本发明不限于这种应用。本发明可以集成在以信道输出的线性表示为特征的任何线性通信系统中操作的任何接收器装置中。通信系统可以是有线的、无线的或基于光纤的,可容纳单个或多个用户,使用单个或多个天线,以及单个或多载波通信技术。例如,本发明可以集成在无线分布式MIMO系统中实现的接收器装置中。分布式MIMO可以用于例如应用在3G、4G、LTE、WiFiTM和未来5G标准等中的蜂窝通信。例如在自组织网络(无线传感器网络、机器对机器通信、物联网等)中应用的协作通信也是分布式MIMO系统的示例。除了无线网络之外,本发明可以被集成到在基于光纤的通信系统中实现的光接收器装置中,所述基于光纤的通信系统例如是偏振分复用OFDM(PDM-OFDM)系统。
此外,本发明不限于通信设备,并且可以被集成到信号处理设备中,诸如在音频应用(如音频交叉和音频母版制作)中使用的有限脉冲响应(FIR)的电子滤波器。因此,在给定M阶FIR滤波器的输出序列的情况下,一些实施方式可用于确定输入序列的估计。
在另一应用中,根据本发明一些实施方式的方法、装置和计算机程序产品可以在全球导航卫星系统(GNSS)中实现,诸如IRNSS、Beidou、GLONASS、Galileo;在GPS中实现,包括例如用于使用例如载波相位测量来估计定位参数的至少一个GPS接收器。
此外,根据本发明一些实施方式的方法、装置和计算机程序产品可以在密码系统中实现,用于确定对密码算法中使用的私有秘密值的估计,所述密码算法用于在数据或消息的存储、处理或通信期间对数据或消息进行加密/解密。在基于网格的密码应用中,数据/消息以晶格点的形式被加密。根据本发明的一些实施方式,可以有利地执行这种加密数据的解密,使得能够以降低的复杂性高概率成功恢复秘密值。
本文描述的装置、方法和计算机程序产品可以通过各种手段来实现。例如,这些技术可以用硬件、软件或其组合来实现。对于硬件实现,晶格预测设备200的处理元件可以例如根据纯硬件配置(例如在具有相应存储器的一个或更多个FPGA、ASIC或VLSI集成电路中)或根据使用VLSI和数字信号处理器(DSP)两者的配置来实现。
此外,在此描述的方法可以由提供给任何类型的计算机的处理器的计算机程序指令来实现,以产生具有执行指令以实现在此指定的功能/动作的处理器的机器。这些计算机程序指令还可以存储在计算机可读介质中,该计算机可读介质可以指示计算机以特定方式工作。为此,可以将计算机程序指令加载到计算机上,以使得执行一系列操作步骤,从而产生计算机实现的过程,使得所执行的指令提供用于实现这里所指定的功能的过程。

Claims (15)

1.一种解码器,所述解码器被配置成使用搜索球半径对通过由信道矩阵表示的传输信道接收的信号进行解码,所述解码器包括半径确定装置(307),所述半径确定装置用于根据初步半径确定所述搜索球半径,其中,所述半径确定装置(307)被配置成:
i.对根据所接收的信号、所述信道矩阵和当前半径得到的输入数据应用机器学习算法,所述当前半径最初被设定为所述初步半径,通过应用所述机器学习算法提供与所述当前半径相关联的晶格点当前预测数量;
ii.将所述晶格点当前预测数量与给定阈值进行比较;
iii.如果所述晶格点当前预测数量严格高于所述给定阈值,则更新所述当前半径,所述当前半径是通过对所述当前半径应用线性函数来更新的;
迭代步骤i至iii,直到满足终止条件,所述终止条件与所述当前预测数量有关,所述半径确定装置(307)被配置成响应于满足所述终止条件而将所述搜索球半径设定为所述当前半径。
2.根据权利要求1所述的解码器,其中,如果所述晶格点当前预测数量小于或等于所述给定阈值,则满足所述终止条件。
3.根据前述权利要求1和2中任一项所述的解码器,其中,所述线性函数具有等于1/2的斜率参数和等于零的截距参数。
4.根据前述权利要求中任一项所述的解码器,其中,所述机器学习算法是在包括以下各项的组中选择的监督式机器学习算法:支持向量机、线性回归、逻辑回归、朴素贝叶斯、线性判别分析、决策树、k-最近邻算法、神经网络和相似性学习。
5.根据权利要求4所述的解码器,其中,所述监督式机器学习算法是包括输入层(401)、一个或更多个隐藏层(403)和输出层(405)的多层深度神经网络(400),各层包括多个计算节点(4011),所述多层深度神经网络(400)与模型参数和激活函数相关联,所述激活函数在所述一个或更多个隐藏层的所述多个计算节点中的至少一个计算节点(4011)中实现。
6.根据权利要求5所述的解码器,其中,所述激活函数是在包括以各项的组中选择的:线性激活函数、S形函数、Relu函数、Tanh、柔性最大值函数和CUBE函数。
7.根据权利要求5所述的解码器,其中,所述半径确定装置(307)被配置成在训练阶段根据所接收的训练数据来预先确定所述模型参数,所述半径确定装置(307)被配置成根据所述训练数据和预期晶格点数量来确定多组训练数据,各预期晶格点数量与所述多组训练数据中的一组训练数据相关联,所述训练阶段包括以下步骤的两次或更多次迭代:
-使用所述多组训练数据中的一组训练数据作为输入来处理所述深度神经网络(400),通过所述处理提供与该组训练数据相关联的晶格点中间数量;
-根据与该组训练数据相关联的预期晶格点数量和晶格点中间数量确定损失函数,以及
-根据所述损失函数的最小化,通过应用优化算法来确定经更新的模型参数。
8.根据权利要求7所述的解码器,其中,所述优化算法是在包括以下各项的组中选择的:Adadelta优化算法、Adagrad优化算法、自适应矩估计算法、Nesterov加速梯度算法、Nesterov加速自适应矩估计算法、RMSprop算法、随机梯度优化算法和自适应学习速率优化算法。
9.根据权利要求7所述的解码器,其中,所述损失函数是在包括均方误差函数和指数对数似然函数的组中选择的。
10.根据权利要求7所述的解码器,其中,所述半径确定装置(307)被配置成通过应用列表球解码算法或列表球边界栈解码器来根据所述搜索球半径和所述信道矩阵先前确定所述预期晶格点数量。
11.根据前述权利要求中任一项所述的解码器,其中,所述半径确定装置(307)被配置成根据噪声方差、所述信道矩阵的对角分量以及表示所接收的信号与估计向量之间的距离的欧几里德距离中的至少一个参数来确定所述初步半径,所述估计向量是通过应用次优估计算法来确定的,所述次优估计算法是在包括迫零判决反馈均衡器和最小均方误差估计算法的组中选择的。
12.根据权利要求3所述的解码器,其中,所述半径确定装置(307)被配置成将步骤i至iii的迭代次数确定为信噪比的线性函数,所述信噪比的所述线性函数由斜率系数和截距系数定义,所述截距系数与发送功率、所述给定阈值以及所述信道矩阵的行列式有关。
13.根据前述权利要求中任一项所述的解码器,其中,所述解码器(300)还包括码元估计单元(309),所述码元估计单元被配置成通过应用基于球搜索的估计算法来确定由所接收的信号携带的信息码元向量的至少一个估计,所述基于球搜索的估计算法根据在以表示所接收的信号的点为中心并由所述搜索球半径定义的球区域内找到的晶格点来确定信息码元向量的所述至少一个估计。
14.根据权利要求13所述的解码器,其中,所述基于球搜索的估计算法是在包括球解码器和球边界栈解码器的组中选择的。
15.一种用于使用搜索球半径对通过由信道矩阵表示的传输信道接收的信号进行解码的方法,所述方法包括根据初步半径确定所述搜索球半径,其中,所述方法包括以下步骤:
i.对根据所接收的信号、所述信道矩阵和当前半径得到的输入数据应用机器学习算法,所述当前半径最初被设定为所述初步半径,通过应用所述机器学习算法提供与所述当前半径相关联的晶格点当前预测数量;
ii.将所述晶格点当前预测数量与给定阈值进行比较;
iii.如果所述晶格点当前预测数量严格高于所述给定阈值,则更新所述当前半径,所述当前半径是通过对所述当前半径应用线性函数来更新的;
迭代步骤i至iii,直到满足终止条件,所述终止条件与所述当前预测数量有关,所述方法包括响应于满足所述终止条件而将所述搜索球半径设定为所述当前半径。
CN202080048315.7A 2019-07-01 2020-06-23 用于机器学习辅助的球解码的装置和方法 Pending CN114097202A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305886.4A EP3761237A1 (en) 2019-07-01 2019-07-01 Devices and methods for machine learning assisted sphere decoding
EP19305886.4 2019-07-01
PCT/EP2020/067396 WO2021001199A1 (en) 2019-07-01 2020-06-23 Devices and methods for machine learning assisted sphere decoding

Publications (1)

Publication Number Publication Date
CN114097202A true CN114097202A (zh) 2022-02-25

Family

ID=67988948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080048315.7A Pending CN114097202A (zh) 2019-07-01 2020-06-23 用于机器学习辅助的球解码的装置和方法

Country Status (6)

Country Link
US (1) US11888655B2 (zh)
EP (1) EP3761237A1 (zh)
JP (1) JP2022537978A (zh)
KR (1) KR20220027966A (zh)
CN (1) CN114097202A (zh)
WO (1) WO2021001199A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11625610B2 (en) * 2019-03-12 2023-04-11 Samsung Electronics Co., Ltd Multiple-input multiple-output (MIMO) detector selection using neural network
US11742901B2 (en) * 2020-07-27 2023-08-29 Electronics And Telecommunications Research Institute Deep learning based beamforming method and apparatus
CN112887237B (zh) * 2021-03-12 2022-02-11 苏州大学 光纤通信系统的复信道均衡器设计方法
WO2022207321A1 (en) * 2021-03-31 2022-10-06 Nokia Technologies Oy Method and system for decoding a signal at a receiver in a multiple input multiple output (mimo) communication system
US11769079B2 (en) 2021-04-30 2023-09-26 Samsung Electronics Co., Ltd. Method and device for decoding data
CN117172135B (zh) * 2023-11-02 2024-02-06 山东省科霖检测有限公司 一种智能噪声监测管理方法与系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090257530A1 (en) * 2008-04-14 2009-10-15 Qualcomm Incorporated Radius adaptive sphere decoding with probabilistic noise constraint
CN107276935A (zh) * 2016-04-06 2017-10-20 法国矿业电信学校联盟 用于顺序球形解码的方法和设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100804796B1 (ko) 2004-12-21 2008-02-20 한국전자통신연구원 구 복호기 및 그의 복호 방법
US20180357530A1 (en) * 2017-06-13 2018-12-13 Ramot At Tel-Aviv University Ltd. Deep learning decoding of error correcting codes
EP3642970A4 (en) * 2017-06-19 2021-03-31 Virginia Tech Intellectual Properties, Inc. INFORMATION ENABLING AND DECODING FOR WIRELESS TRANSMISSION USING MULTI-ANTENNA TRANSCEIVERS
WO2020242898A1 (en) * 2019-05-26 2020-12-03 Genghiscomm Holdings, LLC Non-orthogonal multiple access
US10872045B1 (en) * 2019-07-11 2020-12-22 Nokia Technologies Oy Method and apparatus for symbol detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090257530A1 (en) * 2008-04-14 2009-10-15 Qualcomm Incorporated Radius adaptive sphere decoding with probabilistic noise constraint
CN102007737A (zh) * 2008-04-14 2011-04-06 高通股份有限公司 具有概率噪声约束的半径自适应球形解码
CN107276935A (zh) * 2016-04-06 2017-10-20 法国矿业电信学校联盟 用于顺序球形解码的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MOSTAFA MOHAMMADKARIMI等: "deep learning-base sphere decoding" *

Also Published As

Publication number Publication date
EP3761237A1 (en) 2021-01-06
WO2021001199A1 (en) 2021-01-07
KR20220027966A (ko) 2022-03-08
JP2022537978A (ja) 2022-08-31
US11888655B2 (en) 2024-01-30
US20220247605A1 (en) 2022-08-04

Similar Documents

Publication Publication Date Title
US11888655B2 (en) Devices and methods for machine learning assisted sphere decoding
CN114051701B (zh) 用于机器学习辅助预编码的设备和方法
CN101499840B (zh) 多入多出系统的迭代检测方法
CN107094063B (zh) 半穷举迭代块解码方法和设备
CN107070525B (zh) 参数化顺序解码
CN108234072B (zh) 用于对数据信号进行子块解码的方法和设备
US10284334B2 (en) Methods and devices for sequential sphere decoding
US10284276B2 (en) Weighted sequential decoding
Tato et al. Deep learning assisted rate adaptation in spatial modulation links
Zhu et al. Joint transceiver optimization for wireless communication PHY with convolutional neural network
Castillo‐Soria et al. Quadrature spatial modulation based multiuser MIMO transmission system
Ramasamy et al. Evolutionary gravitational Neocognitron neural network based differential spatial modulation detection scheme for uplink multiple user huge MIMO systems
Kim AI-Enabled Physical Layer
AU2020369979B2 (en) M-MIMO receiver
KR102441253B1 (ko) 무선 통신 시스템에서 신호를 수신하기 위한 장치 및 방법
Lien et al. Deep Neural Network Based Active User Detection for Grant-Free Multiple Access
Kang et al. Channel Estimation and Reflecting Design of RIS-Aided Coded Systems Over Time-Varying Channels
Olutayo et al. Dynamic Conjugate Gradient Unfolding for Symbol Detection in Time-Varying Massive MIMO
SHARAFUDEN DESIGN AND ANALYSIS OF A ROBUST CODEC FOR WIRELESS CHANNEL USING MACHINE LEARNING
Chen et al. An Intelligent Signal Detection Method Based on DNN for MBM System
Kairouz MIMO communications over multi-mode optical fibers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination