CN112821971A - 一种基于对抗式学习的时变信道信号检测方法 - Google Patents

一种基于对抗式学习的时变信道信号检测方法 Download PDF

Info

Publication number
CN112821971A
CN112821971A CN202110137406.4A CN202110137406A CN112821971A CN 112821971 A CN112821971 A CN 112821971A CN 202110137406 A CN202110137406 A CN 202110137406A CN 112821971 A CN112821971 A CN 112821971A
Authority
CN
China
Prior art keywords
channel
generator
training
discriminator
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110137406.4A
Other languages
English (en)
Inventor
孙黎
王宇威
吴迎笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Zhejiang Lab
Original Assignee
Xian Jiaotong University
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University, Zhejiang Lab filed Critical Xian Jiaotong University
Priority to CN202110137406.4A priority Critical patent/CN112821971A/zh
Publication of CN112821971A publication Critical patent/CN112821971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Electromagnetism (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Error Detection And Correction (AREA)

Abstract

本发明公开一种基于对抗式学习的时变信道信号检测方法,使用了一种专属的生成对抗网络结构,并且采用适用于时变信道的神经网络数据集构造以及训练方法,训练生成器G以生成信道转移概率,并且把之运用于Viterbi算法中,实现了未知信道模型的时变通信系统的信号检测。

Description

一种基于对抗式学习的时变信道信号检测方法
技术领域
本发明涉及信号检测技术领域,特别涉及一种基于对抗式学习的时变信道信号检测方法。
背景技术
在现代的数字通信系统中,信号检测是一个重要的组成部分。信号在发送端经过编码,调制之后发送出去,经过信道之后来到接收端,这时候接收端收到的信号是经过噪声干扰或者码间串扰的信号,所以就需要使用信号检测来对接收到的信号进行判决,而传统的信号检测算法依赖于信道的统计模型。在无线通信中,利用的是电磁波来传输信息,传播机理可以由麦克斯韦方程组进行描述,所以可以使用数学公式建立信道的概率统计模型,从而执行信号检测算法。但是在一些新型的通信系统,例如水声通信、分子通信等,或者在信道状况比较复杂的传统系统中,难以建立有效的描述信号传播的模型,就无法使用传统的信号检测算法进行信号检测;除此之外,在大部分的实际的通信系统中,信道的会随时间变化,所以在这些情况下,使用一种不依赖于信道先验知识的并且能够适用于时变信道的方法来进行信号检测就具有重要的实际意义。
机器学习当中的深度学习比较适用于在难以进行信道建模的通信系统中的信号检测问题。深度学习的优势在于其隐藏层可以在一定的误差范围内拟合任何的函数,具有巨大的灵活性,所以研究未知信道模型且信道时变条件下基于对抗式学习的信号检测方法就具有重要意义。
发明内容
针对现有技术的不足,本发明提出一种基于对抗式学习的时变信道信号检测方法,该方法可以在难以建立信道模型并且信道时变的通信系统中进行信号检测,具体技术方案如下:
一种基于对抗式学习的时变信道信号检测方法,所述时变信道每过相干时间τ信道就会变化一次,在每一个时隙内传输一个序列,序列由N=N1+N2个符号组成,第一个时隙内传输的序列为导频序列,全部的符号都是导频数据,其余时隙传输的序列为组合序列,其中前N1个符号为导频数据,后N2个符号为荷载数据;
所述时变信道信号检测方法包括以下步骤:
(1)在第一个时隙内发送长度为N的导频符号序列,其中第i时刻的发送符号x[i]从信号集c中等概率地随机选取,x[i]∈C,i∈{1,2,...,N},C是一个包含m个信号星座点的离散信号集;在接收端采集信道输出y[i];把信道输入状态向量s[i]与信道输出y[i]进行组合得到一对训练数据Ti=(s[i],y[i]),
Figure BDA0002927240300000021
l是信道的记忆长度,l<N,且y[i]是关于信道输入状态向量s[i]的随机映射;收集每一个时刻的信道输入状态向量与信道输出,从而得到初始训练集TS1=[T1,T2,...TN];
(2)设定误码率阈值THa和软判决阈值THb,初始化两个全连接神经网络,使其参数满足标准高斯分布;其中一个全连接神经网络作为生成器G,其初始参数集为
Figure BDA0002927240300000022
θg包含生成器G中的所有权值Wg与所有偏置bg,另外一个全连接神经网络作为鉴别器D,其初始参数集为
Figure BDA0002927240300000023
θd包含生成器D中的所有权值Wd与所有偏置bd
把信道输入状态向量s输入初始化的生成器G生成转移概率向量p0,基于转移概率向量p0采样生成n个信道输出
Figure BDA0002927240300000024
把这n个信道输出按照从小到大的顺序排列,得到生成样本向量
Figure BDA0002927240300000025
并且在训练集中也收集n个信道输入的状态向量为s时信道的输出样本y1,y2,...,yn,按照从小到大的顺序排列,得到真实样本向量q;
(3)使用初始训练集TS1对生成器G和鉴别器D迭代地进行对抗式训练,得到训练完成的生成器G和鉴别器D;
(4)把所有ml种状态向量分别输入到步骤(3)训练完成的生成器G中,得到所有的给定信道输入状态向量下信道输出的条件概率密度,即信道转移概率pY|S(y|s);
(5)在下一个时隙发送一个组合序列,把步骤(4)得到的信道转移概率运用于Viterbi算法中对该序列的导频数据部分进行信号检测,统计其误码率Pe,根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在步骤(3)的训练的基础上继续进行迭代的对抗式训练;
(6)把所有的ml种状态向量分别输入到步骤(5)训练得到的训练得到的生成器G中,得到所有状态向量下的信道转移概率,并且把其运用于Viterbi的软判决算法对本时隙发送的组合序列的荷载数据部分进行软判决,得到所有符号的输出的软判决值
Figure BDA0002927240300000026
根据软判决值重新构造数据集,并且对生成器G和鉴别器D在步骤(5)的训练的基础上继续进行迭代的对抗式训练;
(7)把所有的ml种状态向量分别输入到步骤(6)训练得到的生成器G中,得到最终学习得到的信道转移概率;并且把其运用于Viterbi算法对本时隙发送的组合序列的荷载数据部分进行判决,得到最终的判决结果;
(8)重复步骤(5)~步骤(7),直至对每一个时隙的发送序列完成信号检测,得到所有时隙的判决结果。
进一步地,所述生成器G包括如下部分:
a.生成器G的输入为状态向量s,则输入层的神经元个数为l;
b.生成器G的隐含层数为Ng,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure BDA0002927240300000031
其中
Figure BDA0002927240300000032
为第n层隐含层的输出,
Figure BDA0002927240300000033
为第n层隐含层的权值,
Figure BDA0002927240300000034
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure BDA0002927240300000035
为第n+1层隐含层的输出;
c.生成器G的输出为:
Figure BDA0002927240300000036
其中p为生成的信道转移概率向量,σsm()表示Softmax函数。
鉴别器D包括以下部分:
a.鉴别器D的输入为s和q或者s和
Figure BDA0002927240300000037
则输入层的神经元个数为l+n,其中n为信号样本向量q或者
Figure BDA0002927240300000038
的维度,且q与
Figure BDA0002927240300000039
维度相等;
b.全连接神经网络鉴别器D的隐含层数为Nd,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure BDA00029272403000000310
其中
Figure BDA00029272403000000311
为第n层隐含层的输出,
Figure BDA00029272403000000312
为第n层隐含层的权值,
Figure BDA00029272403000000313
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure BDA00029272403000000314
为第n+1层隐含层的输出;
c.全连接神经网络鉴别器D的输出为
Figure BDA00029272403000000315
Figure BDA00029272403000000316
其中,σsig()表示Sigmoid函数。
进一步地,所述步骤三、步骤五、步骤六中,使用训练集T对生成器G和鉴别器D迭代地进行对抗式训练,包括以下步骤:
(1)首先训练鉴别器D,即采用梯度上升算法对D的参数进行更新
Figure BDA0002927240300000041
Figure BDA0002927240300000042
其中,η为学习率,
Figure BDA0002927240300000043
表示梯度运算,M为训练一次所使用的数据批次的大小,
Figure BDA0002927240300000044
和qi分别为生成样本向量和真实样本向量;
(2)再训练生成器G,即采用梯度上升法进行G的参数更新:
Figure BDA0002927240300000045
Figure BDA0002927240300000046
Figure BDA0002927240300000047
Figure BDA0002927240300000048
其中,b为一个偏置值;
Figure BDA0002927240300000049
表示对于给定的生成器参数θg,在信道输入状态向量为s的条件下产生的生成样本向量为
Figure BDA00029272403000000410
的概率;
Figure BDA00029272403000000411
为状态向量为s的条件下,对转移概率向量p采样之后得到生成样本
Figure BDA00029272403000000412
的概率;fmeang)为把P作为一个时域信号的平均频率;Ntot是p的频谱中频率间隔的个数,fk为频谱中第k个频率间隔的频率,Ik为对应的频谱幅度。Λ为用于平衡前后两项的权重;
(3)让生成器G重新生成向量p,根据其采样得到n个新的信道输出样本
Figure BDA00029272403000000413
得到新的
Figure BDA00029272403000000414
并且在训练集中也重新收集n个输出样本y1,y2,...,yn,得到新的q;
(4)重复步骤(1)~(3),迭代地训练D和G,达到设定迭代次数之后,即训练收敛,输出生成器G的最终参数,并得到所需的信道转移概率估计结果。
进一步地,所述的步骤(5)中所述的根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在之前训练的基础上继续进行迭代的对抗式训练包括以下步骤:
比较误码率Pe与误码率阈值THa的大小关系:
若Pe≥THa,则使用本时隙发送的序列中的导频数据作为新的训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练;
若Pe<THa,则使用上一个时隙和本时隙发送的序列中的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,然后再随机选取上一个时隙中一半的导频数据以及本时隙所有的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,最后再使用本时隙的导频数据作为训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练。
进一步地,所述的步骤(6)中所述的根据软判决值重新构造数据集包括以下步骤:
(a)使用本时隙发送的序列中的导频数据构造一个训练集;
(b)比较连续l个符号的软判决值[SOi,SOi+1,...,SOi+l-1],i∈{1,2,...,N2-l+1}与软判决阈值THb的大小关系,若连续l个符号的软判决值都小于软判决阈值THb,则把这连续l个符号都加入训练集中,遍历所有连续的l个符号,得到新的数据集。
本发明的有益效果如下:
本发明的基于对抗式学习的时变信道信号检测方法,采用专用的生成对抗网络结构,并设计针对时变信道的训练方法,用于学习未知信道模型的通信系统的信道转移概率,并将学习所得到的信道转移概率运用于Viterbi算法,实现了未知信道模型且信道时变条件下的信号检测。
附图说明
图1为本发明的时变信道下每一个时隙的训练方法的流程图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基于对抗式学习的时变信道信号检测方法,针对通信系统的信道为时变信道的情况,即每过相干时间τ信道就会变化一次,在每一个时隙内传输一个序列,序列由N=N1+N2个符号组成。
第一个时隙内传输的序列为导频序列,全部的符号都是导频数据,其余时隙传输的序列为组合序列,其中前N1个符号为导频数据,后N2个符号为荷载数据(Payload data)。
本发明的时变信道下的信号检测方法包括如下步骤:
步骤一:在第一个时隙内发送长度为N的导频符号序列,其中第i时刻的发送符号x[i]从信号集C中等概率地随机选取,x[i]∈C,i∈{1,2,...,N},c是一个包含m个信号星座点的离散信号集;在接收端采集信道输出y[i];把信道输入状态向量s[i]与信道输出y[i]进行组合得到一对训练数据Ti=(s[i],y[i]),
Figure BDA0002927240300000051
l是信道的记忆长度,l<N,且y[i]是关于信道输入状态向量s[i]的随机映射;收集每一个时刻的信道输入状态向量与信道输出,从而得到初始训练集TS1=[T1,T2,...TN];
步骤二:设定误码率阈值THa和软判决阈值THb,初始化两个全连接神经网络,使其参数满足标准高斯分布;其中一个全连接神经网络作为生成器G,其初始参数集为
Figure BDA0002927240300000061
θg包含生成器G中的所有权值Wg与所有偏置bg,另外一个全连接神经网络作为鉴别器D,其初始参数集为
Figure BDA0002927240300000062
θd包含生成器D中的所有权值Wd与所有偏置bd
把信道输入状态向量s输入初始化的生成器G生成转移概率向量p0,基于转移概率向量p0采样生成n个信道输出
Figure BDA0002927240300000063
把这n个信道输出按照从小到大的顺序排列,得到生成样本向量
Figure BDA0002927240300000064
并且在训练集中也收集n个信道输入的状态向量为s时信道的输出样本y1,y2,...,yn,按照从小到大的顺序排列,得到真实样本向量q。
生成器G包括如下部分:
a.生成器G的输入为状态向量s,则输入层的神经元个数为l;
b.全连接神经网络生成器G的隐含层数为Ng,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure BDA0002927240300000065
其中
Figure BDA0002927240300000066
为第n层隐含层的输出,
Figure BDA0002927240300000067
为第n层隐含层的权值,
Figure BDA0002927240300000068
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure BDA0002927240300000069
为第n+1层隐含层的输出;
c.全连接神经网络生成器G的输出为:
Figure BDA00029272403000000610
其中p为生成的信道转移概率向量,σsm()表示Softmax函数。
鉴别器D包括以下部分:
a.鉴别器D的输入为s和q或者s和
Figure BDA00029272403000000611
则输入层的神经元个数为l+n,其中n为信号样本向量q或者
Figure BDA00029272403000000612
的维度(q与
Figure BDA00029272403000000613
维度相等);
b.全连接神经网络鉴别器D的隐含层数为Nd,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure BDA00029272403000000614
其中
Figure BDA0002927240300000071
为第n层隐含层的输出,
Figure BDA0002927240300000072
为第n层隐含层的权值,
Figure BDA0002927240300000073
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure BDA0002927240300000074
为第n+1层隐含层的输出;
c.全连接神经网络鉴别器D的输出为
Figure BDA0002927240300000075
Figure BDA0002927240300000076
其中,σsig()表示Sigmoid函数。
步骤三:使用初始训练集TS1对生成器G和鉴别器D迭代地进行对抗式训练,得到训练完成的生成器G和鉴别器D;
步骤四:把所有ml种状态向量分别输入到步骤(3)训练完成的生成器G中,得到所有的给定信道输入状态向量下信道输出的条件概率密度,即信道转移概率pY|S(y|s);
步骤五:在下一个时隙发送一个组合序列,把步骤(4)得到的信道转移概率运用于Viterbi算法中对该序列的导频数据部分进行信号检测;统计其误码率Pe,根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在之前训练的基础上继续进行迭代的对抗式训练;
所述根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在之前训练的基础上继续进行迭代的对抗式训练,具体通过如下子步骤来实现(如图1所示):
比较误码率Pe与误码率阈值THa的大小关系,
若Pe≥THa,则使用本时隙发送的序列中的导频数据作为新的训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练;
若Pe<THa,则使用上一个时隙和本时隙发送的序列中的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,然后再随机选取上一个时隙中一半的导频数据以及本时隙所有的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,最后再使用本时隙的导频数据作为训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练。
步骤六:把所有ml种状态向量分别输入到步骤(5)训练得到的生成器G中,得到所有状态向量下的信道转移概率,并且把其运用于Viterbi的软判决算法对本时隙发送的组合序列的荷载数据部分进行软判决,得到所有符号的输出的软判决值
Figure BDA0002927240300000077
根据软判决值重新构造数据集,并且对生成器G和鉴别器D在步骤五的训练的基础上继续进行迭代的对抗式训练;
所述根据软判决值重新构造数据集具体包括如下步骤:
a.使用本时隙发送的序列中的导频数据构造一个训练集:
b.比较连续l个符号的软判决值[SOi,SOi+1,...,SOi+l-1],i∈{1,2,...,N2-l+1}与软判决阈值THb的大小关系,若连续l个符号的软判决值都小于软判决阈值THb,则把这连续l个符号都加入训练集中,遍历所有连续的l个符号,得到新的数据集。
步骤七:把所有的ml种状态向量分别输入到步骤六训练得到的生成器G中,得到最终学习得到的信道转移概率;并且把其运用于Viterbi算法对本时隙发送的组合序列的荷载数据部分进行判决,得到最终的判决结果;
步骤八:重复步骤五~步骤七,直至对每一个时隙的发送序列完成信号检测,得到所有时隙的判决结果。
所述的步骤三、步骤五、步骤六中,使用训练集T对生成器G和鉴别器D迭代地进行对抗式训练,包括以下步骤:
(1)训练鉴别器D,即:更新D的参数以使如下目标函数最大化:
Figure BDA0002927240300000081
其中,M为训练一次所使用的数据批次的大小(batch size),
Figure BDA0002927240300000082
和qi分别为生成样本向量和真实样本向量。为了实现这一优化任务,采用梯度上升(gradient ascent)算法,D的参数更新公式为:
Figure BDA0002927240300000083
其中,η为学习率,
Figure BDA0002927240300000084
表示梯度运算。
(2)训练生成器G,即:更新G的参数以使如下目标函数最大化:
Figure BDA0002927240300000085
其中,b为一个偏置值,
Figure BDA0002927240300000086
表示对于给定的生成器参数θg,在信道输入状态向量为s的条件下,产生的生成样本向量为
Figure BDA0002927240300000087
的概率,其计算公式为:
Figure BDA0002927240300000088
其中
Figure BDA0002927240300000089
为状态向量为s的条件下,对转移概率向量p采样之后得到生成样本
Figure BDA00029272403000000810
的概率,因为
Figure BDA00029272403000000811
是由向量p采样之后得到的,所以
Figure BDA00029272403000000812
的值等于向量p中与
Figure BDA00029272403000000813
所对应的那一维的值。另外,fmeang)为把p作为一个时域信号的平均频率,其计算方法为先对p进行快速傅里叶变换,得到其频谱,然后再通过如下公式计算平均频率:
Figure BDA0002927240300000091
其中Ntot是p的频谱中频率间隔的个数,fk为频谱中第k个频率间隔的频率,Ik为对应的频谱幅度。Λ为用于平衡前后两项的权重。
为了实现上述优化任务,使用梯度上升法进行G的参数更新:
Figure BDA0002927240300000092
更新了μg之后,再让生成器G重新生成向量p,根据其采样得到n个新的信道输出样本
Figure BDA0002927240300000093
得到新的
Figure BDA0002927240300000094
并且在训练集中也重新收集n个输出样本y1,y2,...,yn,得到新的q。
(3)重复步骤(1)和(2),迭代地训练D和G,达到设定迭代次数之后,即训练收敛,输出生成器的最终参数,并得到所需的信道转移概率估计结果。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (5)

1.一种基于对抗式学习的时变信道信号检测方法,其特征在于,所述时变信道每过相干时间τ信道就会变化一次,在每一个时隙内传输一个序列,序列由N=N1+N2个符号组成,第一个时隙内传输的序列为导频序列,全部的符号都是导频数据,其余时隙传输的序列为组合序列,其中前N1个符号为导频数据,后N2个符号为荷载数据;
所述时变信道信号检测方法包括以下步骤:
(1)在第一个时隙内发送长度为N的导频符号序列,其中第i时刻的发送符号x[i]从信号集c中等概率地随机选取,x[i]∈c,i∈{1,2,...,N},c是一个包含m个信号星座点的离散信号集;在接收端采集信道输出y[i];把信道输入状态向量s[i]与信道输出y[i]进行组合得到一对训练数据
Figure FDA0002927240290000011
l是信道的记忆长度,l<N,且y[i]是关于信道输入状态向量s[i]的随机映射;收集每一个时刻的信道输入状态向量与信道输出,从而得到初始训练集TS1=[T1,T2,...TN];
(2)设定误码率阈值THa和软判决阈值THb,初始化两个全连接神经网络,使其参数满足标准高斯分布;其中一个全连接神经网络作为生成器G,其初始参数集为
Figure FDA0002927240290000012
θg包含生成器G中的所有权值Wg与所有偏置bg,另外一个全连接神经网络作为鉴别器D,其初始参数集为
Figure FDA0002927240290000013
θd包含生成器D中的所有权值Wd与所有偏置bd
把信道输入状态向量s输入初始化的生成器G生成转移概率向量p0,基于转移概率向量p0采样生成n个信道输出
Figure FDA0002927240290000014
把这n个信道输出按照从小到大的顺序排列,得到生成样本向量
Figure FDA0002927240290000015
并且在训练集中也收集n个信道输入的状态向量为s时信道的输出样本y1,y2,...,yn,按照从小到大的顺序排列,得到真实样本向量q;
(3)使用初始训练集TS1对生成器G和鉴别器D迭代地进行对抗式训练,得到训练完成的生成器G和鉴别器D;
(4)把所有ml种状态向量分别输入到步骤(3)训练完成的生成器G中,得到所有的给定信道输入状态向量下信道输出的条件概率密度,即信道转移概率pY|S(y|s);
(5)在下一个时隙发送一个组合序列,把步骤(4)得到的信道转移概率运用于Viterbi算法中对该序列的导频数据部分进行信号检测,统计其误码率Pe,根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在步骤(3)的训练的基础上继续进行迭代的对抗式训练;
(6)把所有的ml种状态向量分别输入到步骤(5)训练得到的训练得到的生成器G中,得到所有状态向量下的信道转移概率,并且把其运用于Viterbi的软判决算法对本时隙发送的组合序列的荷载数据部分进行软判决,得到所有符号的输出的软判决值
Figure FDA0002927240290000021
根据软判决值重新构造数据集,并且对生成器G和鉴别器D在步骤(5)的训练的基础上继续进行迭代的对抗式训练;
(7)把所有的ml种状态向量分别输入到步骤(6)训练得到的生成器G中,得到最终学习得到的信道转移概率;并且把其运用于Viterbi算法对本时隙发送的组合序列的荷载数据部分进行判决,得到最终的判决结果;
(8)重复步骤(5)~步骤(7),直至对每一个时隙的发送序列完成信号检测,得到所有时隙的判决结果。
2.根据权利要求1所述的基于对抗式学习的时变信道信号检测方法,其特征在于,所述生成器G包括如下部分:
a.生成器G的输入为状态向量s,则输入层的神经元个数为l;
b.生成器G的隐含层数为Ng,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure FDA0002927240290000022
其中
Figure FDA0002927240290000023
为第n层隐含层的输出,
Figure FDA0002927240290000024
为第n层隐含层的权值,
Figure FDA0002927240290000025
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure FDA0002927240290000026
为第n+1层隐含层的输出;
c.生成器G的输出为:
Figure FDA0002927240290000027
其中p为生成的信道转移概率向量,σsm()表示Softmax函数。
鉴别器D包括以下部分:
a.鉴别器D的输入为s和q或者s和
Figure FDA0002927240290000028
则输入层的神经元个数为l+n,其中n为信号样本向量q或者
Figure FDA0002927240290000029
的维度,且q与
Figure FDA00029272402900000210
维度相等;
b.全连接神经网络鉴别器D的隐含层数为Nd,在神经网络隐含层前后层之间为全连接结构,隐含层的第n层向n+1层的传播方式为:
Figure FDA0002927240290000031
其中
Figure FDA0002927240290000032
为第n层隐含层的输出,
Figure FDA0002927240290000033
为第n层隐含层的权值,
Figure FDA0002927240290000034
为第n层隐含层的偏置,σr()表示ReLu激活函数,
Figure FDA0002927240290000035
为第n+1层隐含层的输出;
c.全连接神经网络鉴别器D的输出为
Figure FDA0002927240290000036
Figure FDA0002927240290000037
其中,σsig()表示Sigmoid函数。
3.根据权利要求1所述的基于对抗式学习的时变信道信号检测方法,其特征在于,所述步骤三、步骤五、步骤六中,使用训练集T对生成器G和鉴别器D迭代地进行对抗式训练,包括以下步骤:
(1)首先训练鉴别器D,即采用梯度上升算法对D的参数进行更新
Figure FDA0002927240290000038
Figure FDA0002927240290000039
其中,η为学习率,
Figure FDA00029272402900000310
表示梯度运算,M为训练一次所使用的数据批次的大小,
Figure FDA00029272402900000311
和qi分别为生成样本向量和真实样本向量;
(2)再训练生成器G,即采用梯度上升法进行G的参数更新:
Figure FDA00029272402900000312
Figure FDA00029272402900000313
Figure FDA00029272402900000314
Figure FDA00029272402900000315
其中,b为一个偏置值;
Figure FDA00029272402900000316
表示对于给定的生成器参数θg,在信道输入状态向量为s的条件下产生的生成样本向量为
Figure FDA00029272402900000317
的概率;
Figure FDA00029272402900000318
为状态向量为s的条件下,对转移概率向量p采样之后得到生成样本
Figure FDA00029272402900000319
的概率;fmeang)为把p作为一个时域信号的平均频率;Ntot是p的频谱中频率间隔的个数,fk为频谱中第k个频率间隔的频率,Ik为对应的频谱幅度。Λ为用于平衡前后两项的权重;
(3)让生成器G重新生成向量p,根据其采样得到n个新的信道输出样本
Figure FDA0002927240290000041
得到新的
Figure FDA0002927240290000042
并且在训练集中也重新收集n个输出样本y1,y2,...,yn,得到新的q;
(4)重复步骤(1)~(3),迭代地训练D和G,达到设定迭代次数之后,即训练收敛,输出生成器G的最终参数,并得到所需的信道转移概率估计结果。
4.根据权利要求1所述的基于对抗式学习的时变信道信号检测方法,其特征在于,所述的步骤(5)中所述的根据误码率重新构造数据集,并且使用步进式方法对生成器G和鉴别器D在之前训练的基础上继续进行迭代的对抗式训练包括以下步骤:
比较误码率Pe与误码率阈值THa的大小关系:
若Pe≥THa,则使用本时隙发送的序列中的导频数据作为新的训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练;
若Pe<THa,则使用上一个时隙和本时隙发送的序列中的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,然后再随机选取上一个时隙中一半的导频数据以及本时隙所有的导频数据作为数据集,使用其对生成器G和鉴别器D迭代地进行对抗式训练,最后再使用本时隙的导频数据作为训练集,使用其对生成器G和鉴别器D迭代地进行对抗式训练。
5.根据权利要求1所述的基于对抗式学习的时变信道信号检测方法,其特征在于,所述的步骤(6)中所述的根据软判决值重新构造数据集包括以下步骤:
(a)使用本时隙发送的序列中的导频数据构造一个训练集;
(b)比较连续l个符号的软判决值[SOi,SOi+1,...,SOi+l-1],i∈{1,2,...,N2-l+1}与软判决阈值THb的大小关系,若连续l个符号的软判决值都小于软判决阈值THb,则把这连续l个符号都加入训练集中,遍历所有连续的l个符号,得到新的数据集。
CN202110137406.4A 2021-02-01 2021-02-01 一种基于对抗式学习的时变信道信号检测方法 Pending CN112821971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110137406.4A CN112821971A (zh) 2021-02-01 2021-02-01 一种基于对抗式学习的时变信道信号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110137406.4A CN112821971A (zh) 2021-02-01 2021-02-01 一种基于对抗式学习的时变信道信号检测方法

Publications (1)

Publication Number Publication Date
CN112821971A true CN112821971A (zh) 2021-05-18

Family

ID=75861106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110137406.4A Pending CN112821971A (zh) 2021-02-01 2021-02-01 一种基于对抗式学习的时变信道信号检测方法

Country Status (1)

Country Link
CN (1) CN112821971A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023077272A1 (zh) * 2021-11-02 2023-05-11 Oppo广东移动通信有限公司 信道数据生成方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106961684A (zh) * 2017-03-24 2017-07-18 厦门大学 基于深度强化学习的认知无线电空频二维抗敌意干扰方法
CN109255364A (zh) * 2018-07-12 2019-01-22 杭州电子科技大学 一种基于深度卷积生成对抗网络的场景识别方法
CN110969186A (zh) * 2019-10-28 2020-04-07 浙江工业大学 基于通道检测的面向无线信号识别的对抗攻击防御方法与装置
CN111669344A (zh) * 2020-06-01 2020-09-15 西北工业大学 一种基于深度学习的时变ofdm系统信号检测方法
CN111711585A (zh) * 2020-06-11 2020-09-25 西安交通大学 一种基于深度学习的实时信号序列检测方法
US10879946B1 (en) * 2018-10-30 2020-12-29 Ball Aerospace & Technologies Corp. Weak signal processing systems and methods

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106961684A (zh) * 2017-03-24 2017-07-18 厦门大学 基于深度强化学习的认知无线电空频二维抗敌意干扰方法
CN109255364A (zh) * 2018-07-12 2019-01-22 杭州电子科技大学 一种基于深度卷积生成对抗网络的场景识别方法
US10879946B1 (en) * 2018-10-30 2020-12-29 Ball Aerospace & Technologies Corp. Weak signal processing systems and methods
CN110969186A (zh) * 2019-10-28 2020-04-07 浙江工业大学 基于通道检测的面向无线信号识别的对抗攻击防御方法与装置
CN111669344A (zh) * 2020-06-01 2020-09-15 西北工业大学 一种基于深度学习的时变ofdm系统信号检测方法
CN111711585A (zh) * 2020-06-11 2020-09-25 西安交通大学 一种基于深度学习的实时信号序列检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI SUN等: "Generative-Adversarial-Network Enabled Signal Detection for Communication Systems With Unknown Channel Models", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023077272A1 (zh) * 2021-11-02 2023-05-11 Oppo广东移动通信有限公司 信道数据生成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108566257B (zh) 一种基于反向传播神经网络的信号恢复方法
US20200257985A1 (en) Adversarially generated communications
CN113381828B (zh) 基于条件生成对抗网络的稀疏码多址接入随机信道建模方法
CN112737987B (zh) 一种新型的基于深度学习的时变信道预测方法
CN111614584B (zh) 基于神经网络的变换域自适应滤波信道估计方法
CN111884976B (zh) 基于神经网络的信道插值方法
CN112115821B (zh) 一种基于小波近似系数熵的多信号智能调制模式识别方法
CN102123115A (zh) 基于粒子群优化的正交小波盲均衡方法
CN112422208B (zh) 未知信道模型下基于对抗式学习的信号检测方法
CN114268388B (zh) 一种在大规模mimo中基于改进gan网络的信道估计方法
CN112821971A (zh) 一种基于对抗式学习的时变信道信号检测方法
CN110474798B (zh) 一种利用回声状态网络预测无线通信未来信号的方法
CN110233808B (zh) 一种ftn系统信号检测方法
CN116405158A (zh) 一种非高斯噪声下基于深度学习的端到端通信系统
CN108574653B (zh) 基于双Sigmoid迟滞噪声混沌神经网络的信号盲检测方法
CN113890799B (zh) 一种基于域对抗网络的水声通信信道估计与信号检测方法
CN113852434B (zh) 一种LSTM与ResNets辅助的深度学习端到端智能通信方法与系统
Myburgh et al. Low complexity MLSE equalization in highly dispersive Rayleigh fading channels
CN113489545B (zh) 基于k均值聚类的光空间脉冲位置调制分步分类检测方法
Li et al. Performance evaluation of GAP-RBF network in channel equalization
CN114614920B (zh) 基于学习因子图的数据与模型联合驱动的信号检测方法
CN115834306B (zh) 干扰条件下多通信信号符号序列直接估计方法
CN117176517A (zh) 采用遗传算法和深度学习对mimo-ofdm可见光通信实施信道估计的方法及系统
CN114528925B (zh) 一种基于深层分类网络的时变信道ofdm信号均衡方法
CN114915361B (zh) 一种基于小样本学习的物联网上行信号检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210518