CN113794660B - 面向多输入多输出检测的模型驱动的深度神经网络方法 - Google Patents

面向多输入多输出检测的模型驱动的深度神经网络方法 Download PDF

Info

Publication number
CN113794660B
CN113794660B CN202111061017.4A CN202111061017A CN113794660B CN 113794660 B CN113794660 B CN 113794660B CN 202111061017 A CN202111061017 A CN 202111061017A CN 113794660 B CN113794660 B CN 113794660B
Authority
CN
China
Prior art keywords
layer
signal
matrix
denotes
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111061017.4A
Other languages
English (en)
Other versions
CN113794660A (zh
Inventor
方俊
万千
黄银森
段惠萍
李鸿彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202111061017.4A priority Critical patent/CN113794660B/zh
Publication of CN113794660A publication Critical patent/CN113794660A/zh
Application granted granted Critical
Publication of CN113794660B publication Critical patent/CN113794660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/024Channel estimation channel estimation algorithms
    • H04L25/0254Channel estimation channel estimation algorithms using neural network algorithms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Power Engineering (AREA)
  • Radio Transmission System (AREA)

Abstract

本发明属于无线通信技术领域,具体涉及一种面向多输入多输出检测的模型驱动的深度神经网络方法。符号检测方法是提高系统频谱效率的重要一环,所以本发明致力于设计更优的符号检测器,以此来提升系统性能以及降低时间复杂度。本发明采用基于模型驱动的深度学习方法,将贝叶斯估计算法展开成多层深度学习网络,通过最大化松弛的证据下界(ELBO)来优化学习参数,可以获得具有性能优势和较低时间复杂度的检测器。不同于现有深度学习方案,本发明所提出的方案无需知道噪声方差,这是由于本发明所提出的方法可以自动更新噪声,这具有现实意义。同时,本发明所提出方案适用于离线和在线训练两种模式。

Description

面向多输入多输出检测的模型驱动的深度神经网络方法
技术领域
本发明属于无线通信技术领域,具体涉及一种面向多输入多输出检测的模型驱动的深度神经网络方法。
背景技术
大规模多输入多输出(massive MIMO)系统是下一代无线通信系统的关键技术,通过采用大规模阵列天线,可以有效提高系统的频谱效率。符号检测是大规模多输入多输出系统中的关键信号处理问题,典型传统方案包括迫零方法(ZF)和极大似然方法(ML),尽管迫零方法时间复杂度低,但是性能比较差,极大似然方法性能最优的检测器但是其计算复杂度很高。为了平衡系统性能以及计算复杂度,本发明将通过基于模型驱动的深度学习技术,基于变分贝叶斯推断并引入少量可学习参数,从而获得更优的符号检测性能。由于需要学习的参数数量少,网络结构容易训练。该发明具有性能优、计算复杂度低、易于训练的特点。
发明内容
本发明的目的在于提出性能更优的多输入多输出符号检测器,更好地平衡系统性能与计算复杂度之间的关系。通过设计一个基于贝叶斯学习的模型驱动的深度网络,以此获得更优的符号检测器。本发明将分别针对独立同分布高斯信道(i.i.d.Gaussianchannel)和任意相关信道(correlated channel)来设计两种模型驱动深度学习检测器。同时,本发明提出的深度网络的学习参数数量很少,所以在较少的样本条件下可以进行有效训练。同时,所提出的方法既可以线上训练也可以线下训练。不同于现有的基于深度学习的检测方案,本发明所提出的方案无需知道噪声方差,这是由于本发明所提出的方法可以自动更新噪声参数,因此可以在噪声方差未知的环境中取得更优越的性能。在多种信道模型下,本发明所对应提出的方法有着良好性能以及较低的时间复杂度。
本发明的技术方案为:
一种面向多输入多输出检测的模型驱动的深度神经网络方法,系统包括天线数为Nt的基站和Nr个单天线用户,将复信道矩阵表示为
Figure BDA0003256370400000011
发射信号x为正交振幅调制(QAM),x的每个元素属于离散星座集合
Figure BDA0003256370400000012
M为离散星座集合中的元素总个数,信号x的先验分布为
Figure BDA0003256370400000021
且x第i个元素的概率为
Figure BDA0003256370400000022
Π表示连乘符号,δ(·)表示狄拉克函数;在接收端,加性噪声为
Figure BDA0003256370400000023
其中
Figure BDA0003256370400000024
表示均值为0和方差为
Figure BDA0003256370400000025
的复高斯分布,ε是噪声的逆方差,接收信号为:
y=Hx+n
已知y和H,所述信号检测方法为:
S1、判断信道类型,若是独立同分布高斯信道,进入步骤S2-S3,若是相关瑞利信道,进入步骤S4-S5;
S2、构建深度网络检测器,所述深度网络检测器共有Llayer层,设置学习参数为
Figure BDA0003256370400000026
其中
Figure BDA0003256370400000027
表示从第1层到第Llayer层ct的集合。对于第(t+1)层,输入包括y,H,xt和εt,其中xt和εt分别表示第t层的信号估计和噪声方差估计,输出为xt+1和εt+1;每层深度网络检测器包括线性估计器、非线性估计器和噪声估计,其中:
第t层的线性估计器输出信号为
rt=xt+T-1HH(y-Hxt)
其中,对角矩阵T设置为
Figure BDA0003256370400000028
此处⊙为点乘符号,Υ是一个可学习的对角矩阵,对角矩阵Hd的第i个对角元素为Hd[i,i]=(hi)Hhi,且hi表示信道矩阵H的第i列,(hi)H表示hi的共轭转置。
Figure BDA0003256370400000029
第t层的非线性估计器输出信号为
xt+1=ctE{x;rtt}+(1-ct)xt
其中E{x;rtt}表示变量x以rt为均值和以Φt为方差下的均值,信号x的第i个元素的期望为
Figure BDA0003256370400000031
所有i
其中N(xi;ri,ti,t)表示xi在均值ri,t和方差Φi,t下的高斯分布概率,同时,ri,t和Φi,t分别表示rt和Φt的第i个元素,p(xi)为xi的先验分布,信号x的第i个元素的二阶矩的期望为
Figure BDA0003256370400000032
所有i
第t层输出信号的协方差矩阵表示为
Figure BDA0003256370400000033
该协方差矩阵
Figure BDA0003256370400000034
为对角矩阵且它的第i个对角元素可以表示为
Figure BDA0003256370400000035
所有i
同时,
Figure BDA0003256370400000036
此处函数
Figure BDA00032563704000000312
表示取复数的实部,则噪声逆方差更新为
Figure BDA0003256370400000037
其中a和b是固定的常数值,取10-10
S3、利用Pytorch框架下的Adam优化器来训练深度网络检测器的网络参数,通过最小化代价函数
Figure BDA0003256370400000038
进行训练,其中
Figure BDA0003256370400000039
表示第t层输出信号xt和真实信号xtrue之间的平方误差,定义
Figure BDA00032563704000000310
是最后一层网络输出的估计信号,则最终输出网络参数以及检测信号
Figure BDA00032563704000000311
S4、构建深度网络检测器,所述深度网络检测器共有Llayer层,设置深度网络检测器的学习参数为
Figure BDA0003256370400000041
其中
Figure BDA0003256370400000042
表示从第1层到第Llayer层δt的集合,其中
Figure BDA0003256370400000043
表示从第1层到第Llayer层ct的集合,其中
Figure BDA0003256370400000044
表示从第1层到第Llayer
Figure BDA0003256370400000045
的集合。令信道矩阵的奇异值分解为H=UΣVH,U是矩阵H的左奇异矩阵,V是矩阵H的右奇异矩阵,Σ是矩阵H的奇异值,对于第(t+1)层,输入包括y,A,Σ,V,st和εt,其中st和εt分别表示第t层对信号和噪声方差的估计;每层深度网络检测器包括线性估计器、非线性估计器和噪声估计,其中:
第t层的线性估计器输出信号为
Figure BDA0003256370400000046
Figure BDA0003256370400000047
其中,对角矩阵Tt设置为
Figure BDA0003256370400000048
Figure BDA0003256370400000049
同时
Figure BDA00032563704000000410
Figure BDA00032563704000000411
表示矩阵V的第i行,ri,t表示rt的第i个元素,xi表示x的第i个元素,xi,t+1表示xt+1的第i个元素,则第t层的非线性估计器输出信号为
xi,t+1=E{xi;ri,ti,t},所有i
st+1=ctVHxt+1+(1-ct)st
此处E{xi;ri,ti,t}表示变量xi以ri,t为均值和以Φi,t为方差下的均值,信号xi的期望为
Figure BDA00032563704000000412
所有i
其中N(xi;ri,ti,t)表示xi在均值ri,t和方差Φi,t下的高斯分布概率,同时,ri,t和Φi,t分布表示rt和Φt的第i个元素,p(xi)为xi的先验分布;
第t层输出信号的协方差矩阵表示为
Figure BDA00032563704000000413
该协方差对角矩阵
Figure BDA00032563704000000414
Figure BDA0003256370400000051
此处I为单位矩阵,同时,
Figure BDA0003256370400000052
此处函数
Figure BDA0003256370400000058
表示取复数的实部,则噪声逆方差更新为
Figure BDA0003256370400000053
其中a和b是固定的常数值,取10-10
S5、采用Pytorch框架下的Adam优化器来训练深度网络检测器的网络参数,通过最小化代价函数
Figure BDA0003256370400000054
进行训练,其中
Figure BDA0003256370400000055
表示第t层输出信号Vst和真是信号xtrue之间的平方误差,定义
Figure BDA0003256370400000056
是最后一层网络输出的估计信号,则最终输出网络参数以及检测信号
Figure BDA0003256370400000057
本发明的有益效果为,本发明所提出的贝叶斯学习深度网络下的通信系统符号检测方法适用于独立同分布高斯信道以及相关信道,实验表明,在较低复杂度下获得很好的性能,同时本发明所提出的符号检测方法,可以自动更新噪声方差,也就是无需提前知道噪声方差,这具有现实意义。
附图说明
图1为各深度学习方法误符号率(SER)与网络层数(Layer number)的关系,实验条件为独立同分布高斯信道和QPSK调制;
图2为各深度学习方法误符号率(SER)与SNR的关系,实验条件为独立同分布高斯信道和QPSK调制;
图3为各深度学习方法误符号率(SER)与SNR的关系,实验条件为3GPP信道模型和QPSK调制;
图4为各深度学习方法误符号率(SER)与SNR的关系,实验条件为相关瑞利信道和QPSK调制;
图5为各深度学习方法误符号率(SER)与SNR的关系,实验条件为输入噪声方差与真实噪声方差有偏差,同时信道为独立同分布高斯信道和调制方式为QPSK调制;
图6为各深度学习方法误符号率(SER)与SNR的关系,实验条件为输入噪声方差与真实噪声方差有偏差,同时信道为相关瑞利信道和调制方式为QPSK调制。
具体实施方式
下面结合附图和仿真示例对本发明进行详细的描述,以证明本发明的实用性。
本发明考虑上行链路多输入多输出(MIMO)系统的符号检测问题,基站配置天线数为Nt和单天线用户数为Nr,则复信道矩阵表示为
Figure BDA0003256370400000061
在接收端,加性噪声为
Figure BDA0003256370400000062
其中
Figure BDA0003256370400000063
表示均值为0和方差为
Figure BDA0003256370400000064
的复高斯分布,ε是噪声的逆方差。接收信号可以表示为
y=Hx+n
此处发射符号x为正交振幅调制(QAM),那么x的每个元素属于离散星座集合
Figure BDA0003256370400000065
M为离散星座集合中的元素总个数。同时,信号x的先验分布为
Figure BDA0003256370400000066
Figure BDA0003256370400000067
Π表示连乘符号,δ(·)表示狄拉克函数。最终,接收信号的似然函数为
Figure BDA0003256370400000068
同时,p(y|x,ε)的下界为
Figure BDA0003256370400000069
Figure BDA0003256370400000071
此处函数
Figure BDA0003256370400000072
表示取复数的实部,需要注意的是T为对角矩阵且满足
Figure BDA0003256370400000073
此处的
Figure BDA0003256370400000074
表示函数f(x)二阶梯度。定义变量θ={x,ε},此时松弛的证据下界(ELBO)所对应的联合概率函数有
Figure BDA0003256370400000075
我们采用变分贝叶斯推断来交替更新各个变量,包括E更新和M更新,更新细节如下:E更新
1)更新qx(x)。忽略与x无关的项,则近似后验分布qx(x)可以如下获得
Figure BDA0003256370400000076
此处
Figure BDA0003256370400000077
r=<ε>Φ(HHy+Tz-HHHz)=z+T-1HH(y-Hz)
由于N(x;r,Φ)表示变量x以r为均值和以Φ为方差下的高斯分布,那么x的第i个元素的期望为
Figure BDA0003256370400000078
所有i
同时,
Figure BDA0003256370400000081
的期望为
Figure BDA0003256370400000082
所有i
2)更新qε(ε)。忽略与ε无关的项,则近似后验分布qε(ε)可以如下获得
Figure BDA0003256370400000083
则ε服从伽马分布,且a,b为很小的常数,如a=b=10-10。此时
Figure BDA0003256370400000084
此处
Figure BDA0003256370400000085
Figure BDA0003256370400000086
Figure BDA0003256370400000087
此处函数
Figure BDA00032563704000000810
表示取复数的实部,且Σx表示x的协方差矩阵,忽略信号x之间的相关性,此时Σx为对角矩阵且第i个对角元为
Figure BDA0003256370400000088
所有i
最终,ε的期望为
Figure BDA0003256370400000089
M更新
3)更新z。通过如下优化可以获得的估计值,
Figure BDA0003256370400000091
将对数函数求偏导等于0,可以估计出z,即
Figure BDA0003256370400000092
由于<ε>>0和T≥HHH,则z的解为
znew=<x>
根据以上框架,引入少量学习参数,可提出基于模型驱动下的深度学习检测器,命名为VBINet。所提出的深度网络检测器共有层数为Llayer,学习参数为
Figure BDA0003256370400000093
对于第(t+1)层,输入包括y,H,xt和εt,其中xt和εt分别表示第t层对信号和噪声方差的估计。通过最小化每一层估计信号与真实信号之间的最小均方差,来更新网络参数,进而获得估计信号。第一步是线性估计器,第t层的线性估计器输出信号为
rt=xt+T-1HH(y-Hxt)
其中,对角矩阵T设置为
Figure BDA0003256370400000096
此处⊙为矩阵点乘符号,Υ是一个可学习的对角矩阵,对角Hd的第i个对角元素为Hd[i,i]=(hi)Hhi,且hi表示信道矩阵H的第i列,(hi)H表示hi的共轭转置。
第二步时非线性估计器,令
Figure BDA0003256370400000094
第t层的非线性估计器输出信号为
xt+1=ctE{x;rtt}+(1-ct)xt
此处E{x;rtt}表示变量x以rt为均值和以Φt为方差下的均值,更具体一点,信号x的第i个元素的期望为
Figure BDA0003256370400000095
所有i
其中N(xi;ri,ti,t)表示xi在均值ri,t和方差Φi,t下的高斯分布概率,同时,ri,t和Φi,t分布表示rt和Φt的第i个元素,p(xi)为xi的先验分布。第三步是估计噪声,第t层输出信号的协方差矩阵表示为
Figure BDA0003256370400000101
该协方差矩阵
Figure BDA0003256370400000102
为对角矩阵且第i个对角元素可以表示为
Figure BDA0003256370400000103
所有i
同时,
Figure BDA0003256370400000104
则噪声逆方差可以更新为
Figure BDA0003256370400000105
其中a和b是固定的常数值,可以取10-10。最后一步是,利用Pytorch框架下的Adam优化器来训练网络参数,且代价函数为
Figure BDA0003256370400000106
其中
Figure BDA0003256370400000107
表示第t层输出信号xt和真实信号xtrue之间的平方误差,最终输出网络参数以及检测信号xt
以上深度网络方案针对的是独立同分布信道,接下来的方案是针对相关信道的方案。令信道矩阵的奇异值分解为H=UΣVH,U是矩阵H的左奇异矩阵,V是矩阵H的右奇异矩阵,Σ是矩阵H的奇异值。定义
Figure BDA0003256370400000108
Figure BDA0003256370400000109
则接收信号可以等价表示为
y=As+n
最终,接收信号的似然函数为
Figure BDA00032563704000001010
同时,p(y|x,ε)的下界为
Figure BDA0003256370400000111
Figure BDA0003256370400000112
需要注意的是T为对角矩阵且满足T≥Σ2。定义变量
Figure BDA0003256370400000113
δ为一个固定参数,I为单位矩阵,此时松弛的证据下界(ELBO)所对应的联合概率函数有
G(y,s,ε,z)=F(y,s,ε,z)p(s)p(ε)
本发明采用变分贝叶斯推断来交替更新各个变量,包括E更新和M更新,更新细节如下:E更新
1)更新qs(s)。忽略与s无关的项,则近似后验分布qs(s)可以如下获得
Figure BDA0003256370400000114
此处式子(a)满足
Figure BDA0003256370400000115
Figure BDA0003256370400000116
同时,
Figure BDA0003256370400000117
<ε>表示变量ε的期望。由于很难获得的近似后验分布qs(s),因此
本发明先获得x的后验分布,再通过等式x=Vs获得s的后验分布,即
lnqx(x)∝lnN(x;r,Φ)+lnp(x)
且有
Figure BDA0003256370400000121
Figure BDA0003256370400000122
此处忽略信号x之间的相关性,则x的第i个元素的一阶矩和二阶矩的期望为
Figure BDA0003256370400000123
所有i
Figure BDA0003256370400000124
所有i此时信号x的对角协方差矩阵Σx的第i个对角元为
Figure BDA0003256370400000125
所有i
那么信号s的期望和方差分别满足
<s>=VH<x>,Σs=VHΣxV
2)更新qε(ε)。忽略与ε无关的项,则近似后验分布qε(ε)可以如下获得
Figure BDA0003256370400000126
则ε服从伽马分布,且a,b为很小的常数,如a=b=10-10。此时
Figure BDA0003256370400000127
此处
Figure BDA0003256370400000131
Figure BDA0003256370400000132
Figure BDA0003256370400000133
最终,ε的期望为
Figure BDA0003256370400000134
M更新
3)更新z。通过如下优化可以获得的估计值,
Figure BDA0003256370400000135
将对数函数求偏导等于0,可以估计出z,即
Figure BDA0003256370400000136
由于<ε>>0和
Figure BDA0003256370400000137
则z的解为
znew=<s>
根据以上框架,针对相关信道,提出模型驱动下基于贝叶斯学习的深度网络检测器,命名为Improved-VBINet。所提出的深度学习检测器共有层数为Llayer,学习参数为
Figure BDA0003256370400000138
对于第(t+1)层,输入包括y,A,Σ,V,st和εt,其中st和εt分别表示第t层对信号和噪声方差的估计。
通过最小化每一层估计信号与真实信号之间的最小均方差,来更新网络参数,进而获得估计信号。第一步是线性估计器,第t层的线性估计器输出信号为
Figure BDA0003256370400000141
Figure BDA0003256370400000142
其中,对角矩阵Tt设置为
Figure BDA0003256370400000143
第二步时非线性估计器,令
Figure BDA0003256370400000144
同时
Figure BDA0003256370400000145
Figure BDA0003256370400000146
表示矩阵V的第i行,ri,t表示rt的第i个元素,xi表示x的第i个元素。定义xi,t+1表示xt+1的第i个元素,则第t层的非线性估计器输出信号为
xi,t+1=E{xi;ri,ti,t},所有i
st+1=ctVHxt+1+(1-ct)st
此处E{xi;ri,ti,t}表示变量xi以ri,t为均值和以Φi,t为方差下的均值,更具体一点,信号xi的期望为
Figure BDA0003256370400000147
所有i
其中N(xi;ri,ti,t)表示xi在均值ri,t和方差Φi,t下的高斯分布概率,同时,ri,t和Φi,t分布表示rt和Φt的第i个元素,p(xi)为xi的先验分布。第三步是估计噪声,第t层输出信号的协方差矩阵表示为
Figure BDA0003256370400000148
且满足
Figure BDA0003256370400000149
同时,
Figure BDA00032563704000001410
则噪声逆方差可以更新为
Figure BDA00032563704000001411
其中a和b是固定的常数值,可以取10-10。最后一步是,利用Pytorch框架下的Adam优化器来训练网络参数,第t层输出信号xt=Vst,通过最小化代价函数
Figure BDA0003256370400000151
其中
Figure BDA0003256370400000152
表示第t层输出信号xt和真实信号xtrue之间的平方误差,最终输出网络参数以及检测信号xt
仿真中,考虑上行链路MIMO系统,本发明针对独立同分布高斯信道和相关信道提出相对应的VBINet和Improved-VBINet方案。在误符号率(SER)性能分析中,对比算法为迫零算法(ZF)、线性最小均方差(LMMSE)、正交估计信息传播(OAMP)、极大似然估计(ML)以及深度学习方法OAMPNet和MMNet-iid/MMNet。同时,将矩阵T设置为固定值时,且ct=0,此时的方案命名为IFVB。定义为Niter训练批次数,Nbatch为每批次样本数。
图1描述了各方法SER与网络层数(Layer number)的关系,实验条件设置Nt=16,Nr=32,Nbatch=500,Niter=104。从图1可以观察出,所提出VBINet方案在10层以内收敛,同时可以获得比OMAPNet2和MMNet-iid更好的性能。
图2描述了各方法误符号率(SER)与信噪比(SNR)的关系,实验条件设置为Nt=16,Nr=32,Nbatch=500,Niter=104。此处,对于IFVB中的对角矩阵T进行两种选择,即
Figure BDA0003256370400000153
Figure BDA0003256370400000154
同时给IFVB设置比较优的信号初始值,从图2可以观测出,检测性能对于对角矩阵T的选择十分敏感,这也是采用深度学习技术来训练矩阵T的原因。实验表明,所提出的VBINet有着和ML相当的性能,同时所提出的VBINet性能优于OAMPNet2以及MMNet-iid。
接下来,考虑3GPP信道模型,Nt=16,Nr=32,相关参数设置与MMNet基本相同,且带宽为1M,有效子载波个数为F=128,时间序列数为2,生成多个3D信道对性能求平均。图3描述了SER与SNR的关系,训练模式为在线训练,不同时间序列之间单独训练,同时上一个子载波训练好的网络参数作为下个子载波网络参数训练的初始值。对于第一个子载波,训练批次为1000次,每个批次的样本数为500,对于随后的子载波,训练批次为10,每个批次的子载波为500。需要注意的是,对于MMNet,本实验也考虑了针对随后子载波训练批次为20的情景。从图3中可以发现,当在线训练批次增加时,MMNet的性能显著增加,这是由于MMNet的学习参数很多,需要更多的样本学习。对于本发明所提出的Improved-VBINet,有着和OAMPNet2相近的性能,同时所提出方案的计算复杂度更低。
在图4中,我们考虑相关瑞利信道场景,此时考虑离线训练,也就是说,测试信道与训练不同。设置相关参数为0.8,且Nt=16,Nr=32,Nbatch=500,Niter=104。我们可以发现,MMNet在离线模式下基本无法工作,原因在于无法用一个矩阵去拟合所有的矩阵。同时可以发现,对于离线或者在线训练模式,所提出的Improved-VBINet和OAMPNet有着富有竞争力的性能。
在图5和图6中,我们考虑噪声未知对MMNet-iid以及OAMPNet2的影响。其中,定义估计噪声方差
Figure BDA0003256370400000161
η反应了估计的精确度,因此可以定义噪声未知因子
Figure BDA0003256370400000162
当NUF=0dB时,表示输入噪声为真实的噪声方差。图5和图6分别考虑独立同分布高斯信道和相关瑞利信道,对于图6而言,相关系数取0.8,同时,对于图5和图6,所取参数为Nt=16,Nr=32,Nbatch=500,Niter=104。从图中我们可以发现,MMNet-iid和OAMPNet2的性能会受未知噪声一定程度上的影响。对于OAMPNet2,当估计噪声与真实噪声相差越大时,相对于本发明所提出的方案的性能差距将会越大。
综上所述,本发明研究了通信系统符号检测问题,采用的方法是基于模式驱动下的贝叶斯深度网络检测器。针对独立同分布高斯信道和相关信道提出了对应方案,同时为了提升性能以及降低计算复杂度,本发明通过引入学习参数,可以获得一个松弛的证据下界(ELBO)。进而通过最大化松弛的ELBO,来优化网络参数,进而获得更优的符号检测器。仿真结果表明,本专利所提出的方案,相对于现有方案,可以在性能和计算复杂度之间达到更好的平衡,同时可以自动更新噪声方差,以及适用于离线和在线训练两种模式。

Claims (1)

1.面向多输入多输出检测的模型驱动的深度神经网络方法,系统包括天线数为Nt的基站和Nr个单天线用户,将复信道矩阵表示为
Figure FDA0003256370390000011
发射信号x为正交振幅调制(QAM),x的每个元素属于离散星座集合
Figure FDA0003256370390000012
M为离散星座集合中的元素总个数,信号x的先验分布为
Figure FDA0003256370390000013
且x第i个元素的概率为
Figure FDA0003256370390000014
Π表示连乘符号,δ(·)表示狄拉克函数;在接收端,加性噪声为
Figure FDA0003256370390000015
其中
Figure FDA0003256370390000016
表示均值为0和方差为
Figure FDA0003256370390000017
的复高斯分布,ε是噪声的逆方差,接收信号为:
y=Hx+n
已知y和H,其特征在于,所述方法为:
S1、判断信道类型,若是独立同分布高斯信道,进入步骤S2-S3,若是相关瑞利信道,进入步骤S4-S5;
S2、构建深度网络检测器,所述深度网络检测器共有Llayer层,设置学习参数为
Figure FDA0003256370390000018
其中
Figure FDA0003256370390000019
表示从第1层到第Llayer层ct的集合,Υ是一个可学习的对角矩阵,对于第(t+1)层,输入包括y,H,xt和εt,其中xt和εt分别表示第t层的信号估计和噪声方差估计,输出为xt+1和εt+1;每层深度网络检测器包括线性估计器、非线性估计器和噪声估计,其中:
第t层的线性估计器输出信号为
rt=xt+T-1HH(y-Hxt)
其中,对角矩阵T设置为
Figure FDA00032563703900000110
此处⊙为点乘符号,对角矩阵Hd的第i个对角元素为Hd[i,i]=(hi)Hhi,且hi表示信道矩阵H的第i列,(hi)H表示hi的共轭转置;
Figure FDA00032563703900000111
第t层的非线性估计器输出信号为
xt+1=ctE{x;rtt}+(1-ct)xt
其中E{x;rtt}表示变量x以rt为均值和以Φt为方差下的均值,信号x的第i个元素的期望为
Figure FDA0003256370390000021
所有i
其中N(xi;ri,ti,t)表示xi在均值ri,t和方差Φi,t下的高斯分布概率,同时,ri,t和Φi,t分别表示rt和Φt的第i个元素,p(xi)为xi的先验分布,信号x的第i个元素的二阶矩的期望为
Figure FDA0003256370390000022
所有i
第t层输出信号的协方差矩阵表示为
Figure FDA0003256370390000023
该协方差矩阵
Figure FDA0003256370390000024
为对角矩阵且它的第i个对角元素可以表示为
Figure FDA0003256370390000025
所有i
同时,
Figure FDA0003256370390000026
此处函数
Figure FDA0003256370390000027
表示取复数的实部,则噪声逆方差更新为
Figure FDA0003256370390000028
其中a和b是固定的常数值,取10-10
S3、利用Pytorch框架下的Adam优化器来训练深度网络检测器的网络参数,通过最小化代价函数
Figure FDA0003256370390000029
进行训练,其中
Figure FDA0003256370390000031
表示第t层输出信号xt和真实信号xtrue之间的平方误差,定义
Figure FDA0003256370390000032
是最后一层网络输出的估计信号,则最终输出网络参数以及检测信号
Figure FDA0003256370390000033
S4、构建深度网络检测器,所述深度网络检测器共有Llayer层,设置深度网络检测器的学习参数为
Figure FDA0003256370390000034
其中
Figure FDA0003256370390000035
表示从第1层到第Llayer层δt的集合,其中
Figure FDA0003256370390000036
表示从第1层到第Llayer层ct的集合,其中
Figure FDA0003256370390000037
表示从第1层到第Llayer层kt的集合;令信道矩阵的奇异值分解为H=UΣVH,U是矩阵H的左奇异矩阵,V是矩阵H的右奇异矩阵,Σ是矩阵H的奇异值,对于第(t+1)层,输入包括y,A,Σ,V,st和εt,其中st和εt分别表示第t层对信号和噪声方差的估计;每层深度网络检测器包括线性估计器、非线性估计器和噪声估计,其中:
第t层的线性估计器输出信号为
Figure FDA0003256370390000038
Figure FDA0003256370390000039
其中,对角矩阵Tt设置为
Figure FDA00032563703900000310
Figure FDA00032563703900000311
同时
Figure FDA00032563703900000312
Figure FDA00032563703900000313
表示矩阵V的第i行,ri,t表示rt的第i个元素,xi表示x的第i个元素,xi,t+1表示xt+1的第i个元素,则第t层的非线性估计器输出信号为
xi,t+1=E{xi;ri,t,Fi,t},所有i
st+1=ctVHxt+1+(1-ct)st
此处E{xi;ri,ti,t}表示变量xi以ri,t为均值和以Fi,t为方差下的均值,信号xi的期望为
Figure FDA00032563703900000314
所有i
其中N(xi;ri,t,Fi,t)表示xi在均值ri,t和方差Fi,t下的高斯分布概率,同时,ri,t和Φi,t分布表示rt和Φt的第i个元素,p(xi)为xi的先验分布;
第t层输出信号的协方差矩阵表示为
Figure FDA0003256370390000041
该协方差对角矩阵
Figure FDA0003256370390000042
Figure FDA0003256370390000043
此处I为单位矩阵,同时,
Figure FDA0003256370390000044
此处函数
Figure FDA0003256370390000045
表示取复数的实部,则噪声逆方差更新为
Figure FDA0003256370390000046
其中a和b是固定的常数值,取10-10
S5、采用Pytorch框架下的Adam优化器来训练深度网络检测器的网络参数,通过最小化代价函数
Figure FDA0003256370390000047
进行训练,其中
Figure FDA0003256370390000048
表示第t层输出信号Vst和真是信号xtrue之间的平方误差,定义
Figure FDA0003256370390000049
是最后一层网络输出的估计信号,则最终输出网络参数以及检测信号
Figure FDA00032563703900000410
CN202111061017.4A 2021-09-10 2021-09-10 面向多输入多输出检测的模型驱动的深度神经网络方法 Active CN113794660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111061017.4A CN113794660B (zh) 2021-09-10 2021-09-10 面向多输入多输出检测的模型驱动的深度神经网络方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111061017.4A CN113794660B (zh) 2021-09-10 2021-09-10 面向多输入多输出检测的模型驱动的深度神经网络方法

Publications (2)

Publication Number Publication Date
CN113794660A CN113794660A (zh) 2021-12-14
CN113794660B true CN113794660B (zh) 2022-06-07

Family

ID=79182962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111061017.4A Active CN113794660B (zh) 2021-09-10 2021-09-10 面向多输入多输出检测的模型驱动的深度神经网络方法

Country Status (1)

Country Link
CN (1) CN113794660B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115664893A (zh) * 2022-03-21 2023-01-31 东南大学 一种mimo通信系统中基于深度学习的符号检测方法
CN114726419A (zh) * 2022-04-07 2022-07-08 重庆邮电大学 基于深度学习的共轭梯度大规模mimo检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019138156A1 (en) * 2018-01-12 2019-07-18 Nokia Technologies Oy Profiled channel impulse response for accurate multipath parameter estimation
WO2020035684A1 (en) * 2018-08-15 2020-02-20 Imperial College Of Science, Technology And Medicine Joint source channel coding of information sources using neural networks
CN111224906A (zh) * 2020-02-21 2020-06-02 重庆邮电大学 基于深度神经网络的近似消息传递大规模mimo信号检测算法
CN112910810A (zh) * 2021-02-01 2021-06-04 中国人民解放军国防科技大学 多输入多输出正交频分复用系统的同步方法、装置及介质
CN113347125A (zh) * 2021-06-09 2021-09-03 浙江大学 针对mimo-ofdm通信系统的贝叶斯神经网络信道估计方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110142153A1 (en) * 2009-12-15 2011-06-16 Electronics And Telecommunications Research Institute Multiple-input multiple-output system, receiving apparatus and method of receiving signals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019138156A1 (en) * 2018-01-12 2019-07-18 Nokia Technologies Oy Profiled channel impulse response for accurate multipath parameter estimation
WO2020035684A1 (en) * 2018-08-15 2020-02-20 Imperial College Of Science, Technology And Medicine Joint source channel coding of information sources using neural networks
CN111224906A (zh) * 2020-02-21 2020-06-02 重庆邮电大学 基于深度神经网络的近似消息传递大规模mimo信号检测算法
CN112910810A (zh) * 2021-02-01 2021-06-04 中国人民解放军国防科技大学 多输入多输出正交频分复用系统的同步方法、装置及介质
CN113347125A (zh) * 2021-06-09 2021-09-03 浙江大学 针对mimo-ofdm通信系统的贝叶斯神经网络信道估计方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Joao Vieira 等.Deep convolutional neural networks for massive MIMO fingerprint-based positioning.《2017 IEEE 28th Annual International Symposium on Personal, Indoor, and Mobile Radio Communications》.2018, *
方俊 等.空间信息网络中毫米波MIMO通信系统关键技术.《通信学报》.2017,第38卷(第Z1期), *
朱啸豪等.MIMO检测算法与深度学习方法探讨.《微型电脑应用》.2020,(第01期),98-101. *
王小瑞.MIMO雷达杂波环境中的自适应目标检测新方法研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2020,I136-720. *

Also Published As

Publication number Publication date
CN113794660A (zh) 2021-12-14

Similar Documents

Publication Publication Date Title
CN113794660B (zh) 面向多输入多输出检测的模型驱动的深度神经网络方法
CN110719239B (zh) 一种数据模型双驱动的联合mimo信道估计和信号检测方法
CN113472706B (zh) 一种基于深度神经网络的mimo-ofdm系统信道估计方法
Goutay et al. Machine learning for MU-MIMO receive processing in OFDM systems
CN109560846B (zh) 一种基于模型驱动深度学习的三维预编码方法
CN112637093A (zh) 一种基于模型驱动深度学习的信号检测方法
CN110166401B (zh) 大规模mimo正交频分复用系统的相位噪声抑制方法
Mei et al. Performance analysis on machine learning-based channel estimation
CN114785384B (zh) 智能超表面辅助大规模mimo相关信道的容量分析与优化方法
Wan et al. A variational Bayesian inference-inspired unrolled deep network for MIMO detection
Ge et al. Improving approximate expectation propagation massive MIMO detector with deep learning
Zhang et al. On the performance of deep neural network aided channel estimation for underwater acoustic OFDM communications
Gizzini et al. Joint TRFI and deep learning for vehicular channel estimation
CN113676431A (zh) 一种基于模型驱动的无循环前缀mimo-ofdm接收方法
CN113285902B (zh) 一种ofdm系统检测器设计方法
CN114650199A (zh) 一种基于数据驱动的深度神经网络信道估计方法及系统
Huttunen et al. DeepTx: Deep learning beamforming with channel prediction
Sarwar et al. Channel estimation in space time block coded MIMO-OFDM system using genetically evolved artificial neural network
Ozdemir et al. Toward real-time adaptive low-rank LMMSE channel estimation of MIMO-OFDM systems
Berra et al. Deep unfolding of Chebyshev accelerated iterative method for massive MIMO detection
KR102355383B1 (ko) Massive MIMO 시스템에서 고 신뢰도를 위한 딥러닝 기반 신호 검출 기법
Ahmed et al. A review: Deep learning aided channel estimation techniques for wireless communication system
WO2023121659A1 (en) Communication device and method for performing communication signal processing
Shi et al. Deep learning based robust precoder design for massive MIMO downlink
Kondepogu et al. Hybrid AE and Bi-LSTM-aided sparse multipath channel estimation in OFDM systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant