CN113283592B - 基于低复杂度lstm的接收端均衡方法及系统 - Google Patents
基于低复杂度lstm的接收端均衡方法及系统 Download PDFInfo
- Publication number
- CN113283592B CN113283592B CN202110522832.XA CN202110522832A CN113283592B CN 113283592 B CN113283592 B CN 113283592B CN 202110522832 A CN202110522832 A CN 202110522832A CN 113283592 B CN113283592 B CN 113283592B
- Authority
- CN
- China
- Prior art keywords
- lstm
- symbol
- complexity
- received
- equalizer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Neurology (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
本发明公开一种基于低复杂度LSTM的接收端均衡方法及系统,属于光通信传输领域,通过训练出低复杂度LSTM均衡器,该低复杂度LSTM均衡器具有简化的均衡结构,基于该低复杂度LSTM均衡器对待均衡的接收符号进行均衡,在进行均衡时采用简化的计算流程。该低复杂度LSTM均衡器在相较于传统LSTM均衡器具有相似的均衡性能的前提下,能够显著降低均衡过程的计算复杂度。
Description
技术领域
本发明属于光通信传输领域,涉及一种光通信传输系统接收端均衡方法及系统,尤其涉及一种基于低复杂度长短期记忆网络的接收端均衡方法及系统。
背景技术
光纤通信传输系统具有容量大、成本低等优点。克服光信号在传输过程中受到的线性与非线性损伤已成为进一步提高光纤通信传输系统容量所面临的首要问题。针对这一问题,传统的解决方法共有两类,一类是时域均衡(TDE),另一类是频域均衡(FDE)。
近年来,神经网络由于其强大的拟合能力,已被成功应用于光纤通信传输系统中,用以补偿光信号在传输过程中受到的线性与非线性损伤。神经网络作为一种数据驱动的算法,其既可在时域对信号进行补偿,又可在频域对信号进行补偿。
长短期记忆网络(Long Short-Term Memory,LSTM)是一种专门处理时间序列的神经网络,其通过对传统循环神经网络的内部结构进行改进,一定程度上解决了网络在优化过程中的梯度消失的问题,传统LSTM均衡器结构如图1所示,其中h0为零向量。采用LSTM来均衡光信号的传输损伤,其性能一般会优于传统循环神经网络。但是LSTM的计算复杂度远高于传统循环神经网络,因此如何降低基于LSTM均衡器的计算复杂度是一个十分重要的问题。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种基于低复杂度LSTM的接收端均衡方法及系统,在不影响均衡性能的前提下,显著降低均衡过程的计算复杂度。
为实现上述目的,本发明采用如下技术方案:
一种基于低复杂度LSTM的接收端均衡方法,包括以下步骤:
将光纤通信传输系统接收端的接收符号序列划分为两部分:训练集与均衡集;训练集包含LA个接收符号,用以训练低复杂度LSTM均衡器;均衡集包含LB个待均衡的接收符号,采用训练完成的低复杂度LSTM均衡器对其进行均衡;
对训练集中的每个接收符号生成其对应的左特征向量和右特征向量,并将左特征向量与右特征向量分别输入到两个长短期记忆网络LSTML与LSTMR中进行训练,LSTML从左到右计算每个左特征向量最后时间步的左隐藏状态向量,LSTMR从右到左计算右特征向量最后时间步的右隐藏状态向量;将每个接收符号对应的最后时间步的左右两个隐藏状态向量拼接,将拼接后的向量经过一个全连接层(Fully Connected Layer,FCL)映射后得到输出符号,利用梯度下降算法优化LSTML、LSTMR与FCL的参数,由优化后的LSTML、LSTMR与FCL组成低复杂度LSTM均衡器;
对于均衡集中的接收符号序列,采用低复杂度LSTM均衡器中的LSTML从左到右计算每个接收符号在每个时间步内被处理时输出的左隐藏状态向量,采用低复杂度LSTM均衡器中的LSTMR从右到左计算每个接收符号在每个时间步内被处理时输出的右隐藏状态向量;将每个接收符号对应的左右两个隐藏状态向量拼接后,将拼接后的向量经过一个全连接层从左至右映射,得到最终均衡的输出符号序列。
进一步地,生成左特征向量和右特征向量的方法为:对于第n个接收符号Sn,将当前接收符号Sn与其相邻的前k个接收符号拼接,得到当前符号的左特征向量将当前接收符号Sn与其相邻的后k个接收符号拼接,得到当前符号的右特征向量
进一步地,将训练集中接收符号对应的发送符号的实部与虚部组成一个一维向量,并该一维向量作为标签。
进一步地,在对低复杂度LSTM均衡器进行训练时,采用平方误差损失函数计算输出符号与标签之间的误差L(yn,yn)=(yn-yn)2,其中L表示平方误差损失函数,yn表示输出符号,yn表示标签。
一种基于低复杂度LSTM的接收端均衡系统,包括存储器和处理器,在该存储器上存储有计算机程序,该处理器执行该程序时实现上述方法的步骤。
一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
与现有技术相比,本发明的积极效果为:
本发明提出的低复杂度LSTM均衡器具有简化的均衡结构,此外在对接收符号进行均衡时具有简化的计算流程。该低复杂度LSTM均衡器在相较于传统LSTM均衡器具有相似的均衡性能的前提下,能够显著降低均衡过程的计算复杂度。
附图说明
图1是传统LSTM均衡器结构示意图。
图2是本发明实施例的低复杂度LSTM均衡器结构示意图。
图3是本发明实施例的两种处理模式的处理流程图。
图4是两种LSTM均衡器的复杂度与单侧抽头长度之间的关系图。
具体实施方式
下面通过具体实施例和附图,对本发明做进一步详细说明。
本实施例公开一种基于低复杂度LSTM的接收端均衡方法,包含训练和均衡这两个阶段,具体说明如下:
1.训练阶段,将该训练阶段的处理流程称为标准模式。
1.1.光纤通信传输系统接收端的光信号经过前端数字处理后得到接收符号,该处理方法包括色散补偿、相位恢复等,根据训练集中的接收符号生成对应的左右特征向量,其对应的发送端的发送符号作为标签。第n个接收符号Sn的左特征向量由其本身及其前k个相邻接收符号组成,右特征向量由其本身及其后k个相邻接收符号组成,即 其中 Re(Sn)表示复数接收符号Sn的实部,Im(Sn)表示复数接收符号Sn的虚部,H与V表示接收符号的两个偏振方向,k为单侧抽头长度,k的取值需要根据实际系统进行优化,一般系统的传输速率越高,传输距离越远,k的取值就越大,T为矩阵转置。
1.2.将生成的左特征向量与右特征向量输入两个长短期记忆网络LSTML与LSTMR,将LSTML与LSTMR的最后一个时间步的隐藏状态向量拼接为一个向量,拼接后的向量经过一个全连接层(Fully Connected Layer,FCL)映射输出后得到yn,其对应的发送符号的实部与虚部组成一个一维向量作为标签yn;采用平方误差损失函数训练本发明提出的低复杂度LSTM均衡器,低复杂度LSTM均衡器的输出与标签yn之间的损失为L(yn,yn)=(yn-yn)2,L表示平方误差损失函数。采用梯度下降类算法优化低复杂度LSTM均衡器的参数。当损失收敛时得到训练完成的低复杂度LSTM均衡器。本低复杂度LSTM均衡器结构如图2所示。
2.均衡阶段,将均衡阶段的处理流程称为简化模式,简化模式的处理流程分为两个阶段:
2.1.第一阶段:对于待均衡的符号序列,分别采用LSTML从左到右以及采用LSTMR从右到左计算每个符号的左右隐藏状态向量hL与hR。
2.2第二阶段:将第一阶段计算得到的每个符号对应的左右两个隐藏状态向量拼接后,采用一个FCL从左至右映射输出得到最终均衡输出符号序列。
上述标准模式和简化模式的处理流程图3所示。
本实施例采用波分复用场景下经过960km标准单模光纤传输后的64Gbaud 16QAM信号进行均衡器性能验证。本发明的低复杂度LSTM均衡器(在均衡阶段采用简化模式)与传统LSTM均衡器在均衡阶段的计算复杂度(均衡单个符号所需的实数乘法次数)与均衡性能对比如下表所示。
表1两种LSTM均衡器的计算复杂度与性能对比
其中CL=4nhidden(ninput+nhidden)+3nhidden为单个时间步内LSTM单元的计算复杂度,ninput与nhidden分别为LSTM单元的输入层与隐藏层神经元数量,LB为待均衡符号序列长度,且LB>>k。可以看到,本发明的低复杂度LSTM均衡器的均衡性能与传统的LSTM均衡器性能相当,但能够显著降低计算复杂度。图4是两种LSTM均衡器的复杂度与单侧抽头长度k之间的关系,其中ninput=4,nhidden=12,LB=10000。可以看到随着单侧抽头长度k的增加,本发明的低复杂度LSTM均衡器的计算复杂度基本保持不变,而传统的LSTM均衡器复杂度与单侧抽头长度k呈线性关系。因此本发明的低复杂度LSTM均衡器的计算复杂度与传统的LSTM均衡器复杂度的比例η与单侧抽头长度k基本满足η=1/(2k+1)的关系。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求所述为准。
Claims (7)
1.一种基于低复杂度LSTM的接收端均衡方法,其特征在于,包括以下步骤:
将光纤通信传输系统接收端的接收符号序列划分为训练集与均衡集;
对训练集中的每个接收符号生成其对应的左特征向量和右特征向量,并将左特征向量与右特征向量分别输入到两个长短期记忆网络LSTML与LSTMR中进行训练,LSTML从左到右计算每个左特征向量最后时间步的左隐藏状态向量,LSTMR从右到左计算右特征向量最后时间步的右隐藏状态向量;将每个接收符号对应的最后时间步的左右两个隐藏状态向量拼接,将拼接后的向量经过一个全连接层FCL映射后得到输出符号,利用梯度下降算法优化LSTML、LSTMR与FCL的参数,由优化后的LSTML、LSTMR与FCL组成低复杂度LSTM均衡器;
对于均衡集中的接收符号序列,采用低复杂度LSTM均衡器中的LSTML从左到右计算每个接收符号在每个时间步内被处理时输出的左隐藏状态向量,采用低复杂度LSTM均衡器中的LSTMR从右到左计算每个接收符号在每个时间步内被处理时输出的右隐藏状态向量;将每个接收符号对应的左右两个隐藏状态向量拼接后,将拼接后的向量经过一个全连接层从左至右映射,得到最终均衡的输出符号序列。
4.如权利要求1所述的方法,其特征在于,将训练集中接收符号对应的发送符号的实部与虚部组成一个一维向量,并该一维向量作为标签。
5.如权利要求4所述的方法,其特征在于,在对低复杂度LSTM均衡器进行训练时,采用平方误差损失函数计算输出符号与标签之间的误差L(yn,yn)=(yn-yn)2,其中L表示平方误差损失函数,yn表示输出符号,yn表示标签。
6.一种基于低复杂度LSTM的接收端均衡系统,其特征在于,包括存储器和处理器,在该存储器上存储有计算机程序,该处理器执行该程序时实现权利要求1-5任一项所述的方法的步骤。
7.一种计算机可读存储介质,其特征在于,存储有计算机程序,该程序被处理器执行时实现权利要求1-5任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110522832.XA CN113283592B (zh) | 2021-05-13 | 2021-05-13 | 基于低复杂度lstm的接收端均衡方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110522832.XA CN113283592B (zh) | 2021-05-13 | 2021-05-13 | 基于低复杂度lstm的接收端均衡方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113283592A CN113283592A (zh) | 2021-08-20 |
CN113283592B true CN113283592B (zh) | 2022-08-05 |
Family
ID=77278842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110522832.XA Active CN113283592B (zh) | 2021-05-13 | 2021-05-13 | 基于低复杂度lstm的接收端均衡方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283592B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111988249A (zh) * | 2020-07-16 | 2020-11-24 | 北京大学 | 一种基于自适应神经网络的接收端均衡方法及接收端 |
WO2021057186A1 (zh) * | 2019-09-24 | 2021-04-01 | 华为技术有限公司 | 训练神经网络的方法、数据处理方法和相关装置 |
-
2021
- 2021-05-13 CN CN202110522832.XA patent/CN113283592B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021057186A1 (zh) * | 2019-09-24 | 2021-04-01 | 华为技术有限公司 | 训练神经网络的方法、数据处理方法和相关装置 |
CN111988249A (zh) * | 2020-07-16 | 2020-11-24 | 北京大学 | 一种基于自适应神经网络的接收端均衡方法及接收端 |
Non-Patent Citations (3)
Title |
---|
Multi-Aspect-Aware Bidirectional LSTM Networks for Synthetic Aperture Radar Target Recognition;Fan Zhang et al.;《IEEE Access》;20171113;第05卷;全文 * |
基于数据驱动深度学习方法的无线信道均衡;杨旸 等;《中兴通讯技术》;20180329(第02期);全文 * |
基于机器学习的可见光通信信号处理研究现状;邹鹏 等;《激光与光电子学进展》;20200110(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113283592A (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112036543B (zh) | 神经网络均衡与线性均衡相结合的时域均衡器及均衡方法 | |
Lee et al. | Channel equalization using radial basis function network | |
CN110943785B (zh) | 二级均衡器及实现方法 | |
CN109740690A (zh) | 用于短距离光通信的基于特征工程的knn均衡算法 | |
CN114499601B (zh) | 一种基于深度学习的大规模mimo信号检测方法 | |
CN111988249B (zh) | 一种基于自适应神经网络的接收端均衡方法及接收端 | |
CN114301529B (zh) | 基于多符号处理的Volterra均衡方法及系统 | |
CN112887237B (zh) | 光纤通信系统的复信道均衡器设计方法 | |
CN114513394A (zh) | 一种基于注意力机制图神经网络的信号调制格式识别方法、系统、装置及存储介质 | |
CN113283592B (zh) | 基于低复杂度lstm的接收端均衡方法及系统 | |
Shahkarami et al. | Complexity reduction over Bi-RNN-based nonlinearity mitigation in dual-pol fiber-optic communications via a CRNN-based approach | |
CN115882959A (zh) | 一种基于机器学习的非线性补偿方法 | |
Glentis et al. | Electronic dispersion compensation of fiber links using sparsity induced volterra equalizers | |
Wang et al. | Low-complexity nonlinear equalizer based on artificial neural network for 112 Gbit/s PAM-4 transmission using DML | |
Yuan et al. | A post-equalizer based on dual self-attention network in UVLC system | |
Yang et al. | Deep learning based detection and channel tracking for mimo systems | |
CN113938198B (zh) | 光纤传输系统、基于lda简化非线性均衡器的方法及模块 | |
WO2022048355A1 (zh) | 频域广义线性均衡方法、装置、系统及非易失性存储介质 | |
CN117040976B (zh) | 非合作通信条件下的双模式联合盲均衡方法及盲均衡器 | |
CN114204993B (zh) | 基于多项式映射的特征构建的非线性均衡方法及系统 | |
CN113630667B (zh) | 用于光通信的方法、设备、装置和计算机可读介质 | |
CN115361068B (zh) | 一种多芯少模光纤信号的自适应损伤均衡方法及装置 | |
Zeng et al. | Adaptive Newton algorithms for blind equalization using the generalized constant modulus criterion | |
CN114500189B (zh) | 一种可见光通信直接预均衡方法、系统、装置及介质 | |
CN116418405A (zh) | 基于微扰理论的复值卷积神经网络光纤非线性均衡方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |