CN114614920B - 基于学习因子图的数据与模型联合驱动的信号检测方法 - Google Patents
基于学习因子图的数据与模型联合驱动的信号检测方法 Download PDFInfo
- Publication number
- CN114614920B CN114614920B CN202210245167.9A CN202210245167A CN114614920B CN 114614920 B CN114614920 B CN 114614920B CN 202210245167 A CN202210245167 A CN 202210245167A CN 114614920 B CN114614920 B CN 114614920B
- Authority
- CN
- China
- Prior art keywords
- data
- network
- model
- cnn
- probability density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 claims abstract description 71
- 230000005540 biological transmission Effects 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 39
- 239000000203 mixture Substances 0.000 claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 238000003909 pattern recognition Methods 0.000 claims abstract description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 230000001575 pathological effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 239000000919 ceramic Substances 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/20—Monitoring; Testing of receivers
- H04B17/29—Performance testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/391—Modelling the propagation channel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Electromagnetism (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于学习因子图的数据与模型联合驱动的信号检测方法,通过收集通信的发送数据X与接收数据Y;搭建CNN‑BiLSTM网络作为分类神经网络;使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度;模式识别网络重构训练集,对CNN‑BiLSTM网络进行线下训练,得到条件概率密度;计算得到通过因子图的消息传递算法实现信号检测所需要的因子节点;根据有限记忆信道的记忆长度与学习到的因子节点在学习因子图上进行前向后向的消息传递算法,实现最大后验概率准则下的信号检测;该方法能够在不需要信道知识的无信道模型中实现接近最优的信号检测性能,具有更准确的检测结果,且对不确定性训练的具有优秀的鲁棒性。
Description
技术领域
本发明涉及一种基于学习因子图的数据与模型联合驱动的信号检测方法,属于通信技术领域。
背景技术
在过去的几十年里,通信技术取得了巨大的成功,迄今为止,在几乎所有通信系统中,信号检测一直是接收机设计中的一个重要环节,它的创新也促进了通信系统的不断发展。因此,信号检测一直是接收机设计中需要考虑的重要组成部分。近年来,迭代处理发展成为最优接收机设计的主流思想,从而逐渐出现因子图概念和沿着图迭代的消息传递算法如和积算法SP。例如,信号检测领域中的BCJR算法可以在有限记忆因果信道中利用因子图上的前后的消息迭代实现最大后验概率准则下的最优检测。
常见的基于模型的检测方法,如上面提到的BCJR算法以及维特比算法,都有一个特点,即它们不可避免地需要依赖于信道知识,如信道模型和参数。然而,获得信道模型的输入输出之间的统计关系需要大量的开销。此外,基于模型的方法对信道知识的依赖性过于敏感,导致了估计的信道状态与实际状态稍有偏差时,信号检测性能将严重恶化的现象。例如,在一些新兴的通信系统中,如广泛应用于遥感和导航的水下光通信系统中,对于底层物理层没有统一的信道模型。由于吸收和散射引起的能量损失和方向变化,以及对湍流对水声信道衰落影响的研究不足,很难建立一个简单而封闭的精确模型。此外,在蜂窝无线通信领域也有类似的限制。例如,很难在复杂和高度动态的通信网络场景(如车辆网络)中对信道进行建模。
近年来,为了解决基于模型的方法对底层信道统计关系的依赖问题,深度学习的引入变成一个主流趋势,可以将底层模型和中间训练参数封装为一个黑盒子,从数据中学习到输入输出之间的统计关系。基于深度学习的相关方法虽然被广泛应用于信号检测,但是在无信道模型场景下,数据驱动的相关研究很少。另外,单纯的数据驱动方法具有一些不可避免的缺陷,如神经网络学习到的参数关系是无法解释的,导致网络性能改善和学习任务效果提高的方向不可控。另一方面,深度神经网络需要大量的训练样本和训练时间,这与通信延迟作为一个重要的测量指标的现实背道而驰。
上述问题是在基于学习因子图的数据与模型联合驱动的信号检测过程中应当予以考虑并解决的问题。
发明内容
本发明的目的是提供一种基于学习因子图的数据与模型联合驱动的信号检测方法,能够可以在无信道模型的情况下以小训练样本完成更高准确度的信号检测,克服了传统的基于模型的算法对信道模型的统计关系依赖敏感的问题,突破了数据驱动方法的训练时间长、训练参数多、学习关系不可控的限制。
本发明的技术解决方案是:
一种基于学习因子图的数据与模型联合驱动的信号检测方法,包括以下步骤,
S1、收集通信的发送数据X与接收数据Y,并获得有限记忆信道的记忆长度L:
S2、搭建并设计CNN-BiLSTM网络作为分类神经网络;
S3、使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度PY[k](y);
S6、根据有限记忆信道的记忆长度L与学习到的因子节点在学习因子图上进行前向后向的消息传递算法,实现最大后验概率准则下的信号检测。
进一步地,步骤S2中,搭建并设计高分类精确度的CNN-BiLSTM网络,具体为:选择双向长短期记忆网络即BiLSTM网络,在BiLSTM网络之前放置包括卷积层和池化层的CNN网络,接收数据Y经过序列折叠层分别输出给CNN网络与序列展开层,由序列展开层与扁平层作为CNN网络与BiLSTM网络数据转换的过渡,将CNN网络与BiLSTM网络衔接,搭建CNN-BiLSTM网络,允许CNN网络在时间维度中提取隐式信息,然后将高质量特征传递给BiLSTM网络。
进一步地,步骤S2中,CNN-BiLSTM网络的数据处理过程为:将接收数据Y经过序列折叠层输入CNN网络,序列折叠层去除接收数据Y的序列结构,以使卷积操作独立应用于每一时刻;序列折叠层的输出与提取特征后的CNN输出经过一个序列展开层和一个扁平层,以恢复序列结构,将卷积层的输出重塑为特征向量序列,作为BiLSTM网络的输入,由BiLSTM网络输出条件概率密度。
进一步地,步骤S3中,使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度PY[k](y),具体为:使用混合高斯模型方法拟合接收数据Y的分布,考虑到数据拟合时的病态协方差以及信道模型不匹配的问题,引入了Akaike信息准则来提高混合高斯模型的数据拟合程度,最终得到每个时刻k的边缘概率密度PY[k](y)。
进一步地,步骤S3中,得到每个时刻k的边缘概率密度PY[k](y),具体为,
S31、假设信道输出具有与参数λ相关的条件概率f(y|λ),Y的真实分布为g(y)=f(y|λ0),基于K-L距离的AIC准则为
其中,AIC准则的第一项Eln g(Y)是极大似然函数的对数,反映模型拟合情况;第二项Eln f(Y|λ)是对模型复杂度的惩罚,在保证模型拟合的有效性条件下避免参数个数过多;
S33、将AIC准则输出的Kopt应用于混合高斯模型,由高斯混合模型的原理可知,任意形状的概率分布都可以由多个高斯分布函数近似;假设某时刻接收符号的分布是Kopt个高斯模型的线性叠加,其概率分布如下:
S34、为了获得中间参数{αi,θi},使用经典的期望最大化算法即EM算法做参数估计,进而确定边缘概率密度PY[k](y)。
进一步地,步骤S34中,使用EM算法做参数估计,进而确定边缘概率密度PY[k](y),具体为,
S341、初始化:通过K-means确定初始化参数;
S342、确定目标函数期望,设定第k个分模型对观测数据yj的响应程度为目标函数:
其中,αi是混合系数,θi是参数合集;
S343、使目标函数期望最大化,利用极大似然估计,拉格朗日乘数法去最大化目标函数,得到更新参数公式如下:
S344、判断迭代终止条件:若相邻两次迭代的似然函数差值小于阈值,返回步骤S342,继续更新参数;否则,终止迭代,进入步骤S345;
S345、输出:将估计得到的参数回带到步骤S342,确定边缘概率密度PY[k](y)。
进一步地,步骤S41中,设计模式识别网络,隐层由10个神经元组成,激活函数为tansig,它完成的任务是将发送数据X中每一个元素x[k]识别为决定此刻输出y[k]的输入向量其输入向量空间共mL种可能,因此只需要mL个样本就可以训练好该网络。
进一步地,步骤S5中,将通信的接收数据Y输入到CNN-BiLSTM网络,输出的条件概率密度与混合高斯模型的边缘概率密度PY[k](y)联合计算,得到通过因子图的消息传递算法实现信号检测所需要的因子节点,具体为:
S52、学习到的因子节点f表示为:
进一步地,步骤S6中,根据有限记忆信道的记忆长度L与学习到的因子节点,在学习因子图上进行前向后向的消息传递算法,实现最大后验概率准则下的信号检测,具体为,
S61、有限记忆信道信号检测的因子图模型的输入输出联合分布由因子节点表示为:
S62、基于学习到的因子节点以及输入输出序列的联合分布,得到有限记忆信道信号检测的因子图结构以及沿图的消息传递过程;
其中,PX[k]|Y(x|y)表示泛指的条件概率密度,PX[k],Y(x,y)表示联合概率密度;
S64、沿着因子图进行消息传递,得到前向传递的消息为:
S65、沿着因子图进行消息传递,得到后向传递的消息为:
S66、将步骤S63中提到的联合概率密度PX[k],Y(x,y)展开,
根据消息传递算法的特性,联合概率密度表示为
最终得到MAP准则的基于消息传递的迭代表示形式:
S67、在学习到的因子图上进行前向与后向迭代的消息传递,迭代过程中利用步骤S66中arg函数不断搜索,直到确定最大可能的发送信号,实现MAP准则下的信号检测,获得发送数据x的值。
本发明的有益效果是:
一、该种基于学习因子图的数据与模型联合驱动的信号检测方法,提出先通过数据驱动获得关键信息,再应用基于模型的算法的混合方法,相比于传统的基于模型方法,能在无信道模型场景中保证信号检测结果的准确性,又能表现出对不确定训练的优越的鲁棒性;相比于单纯的数据驱动方法,能够节省训练参数以及训练难度,以小样本训练的同时保证信号检测准确性。
二、该种基于学习因子图的数据与模型联合驱动的信号检测方法,采用CNN-BiLSTM来求解必要的信道知识,相比于传统的近似计算和数值计算,提出的分类神经网络具有更高的分类精度。
三、本发明,采用了基于Akaike信息准则的混合高斯模型去拟合接收序列的边缘概率密度,避免了现有方法中信道模型失配的问题。
四、该种基于学习因子图的数据与模型联合驱动的信号检测方法,即避免了传统基于模型的信号检测方法中对信道状态信息的高度敏感,也解决了单纯数据驱动方法实现信号检测的问题:训练难度随训练参数增多而增大、内部学习关系不可解释以及提升性能的方向不可控的问题。同时,本发明方法能够避免了基于模型方法对信道知识的高度依赖问题,节省了获取必要的信道模型及其参数的开销,能够实现无信道状态信息下的近似最优的信号检测。
附图说明
图1是本发明实施例基于学习因子图的数据与模型联合驱动的信号检测方法的流程示意图。
图2是实施例中CNN-BiLSTM网络结构的说明示意图。
图3是实施例中具有消息传递过程的学习因子图结构的说明示意图。
图4是实施例中具有完美信道状态信息(CSI)的泊松信道中的仿真结果示意图。
图5是实施例中具有不完美CSI的泊松信道中的仿真结果示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
一种基于学习因子图的数据与模型联合驱动的信号检测方法,如图1,包括以下步骤,
S1、收集通信的发送数据X与接收数据Y,并获得有限记忆信道的记忆长度L。
根据有限记忆信道特点,确定是信道脉冲响应,τ∈{1,2,...,L},L=4,令γ在[0.1,2]区间取值间隔0.1仿真信道衰减系数。考虑具有信道估计误差的不完美信道状态信息情况,此时接收机只能获得含噪声估计的具有不确定性的信道脉冲响应,估计噪声是零均值,方差为0.08的高斯过程。
S2、搭建具有较高分类精确度的CNN-BiLSTM网络作为分类神经网络。
将通信中涉及时间序列恢复的信号检测问题抽象为为信号的分类问题,需要搭建分类神经网络,因此,实施例设计了具有较高分类精确度的CNN-BiLSTM网络作为分类神经网络。实施例采用一种具有良好序列数据处理能力的循环神经网络搭建网络,为了增加通信接收序列之间的相关性并更好地捕获长距离信息,选择双向长短期记忆网络即BiLSTM。另外,本发明采用具有更高抽象特征能力的卷积神经网络CNN去提取多个时间点的通信接收数据的特征,CNN可去除冗余数据的同时减少通信信号检测过程的计算量。
如图2所示,步骤S2中,搭建并设计高分类精确度的CNN-BiLSTM网络,具体为:选择双向长短期记忆网络即BiLSTM网络,在BiLSTM网络之前放置包括卷积层和池化层的CNN网络,接收数据Y经过序列折叠层分别输出给CNN网络与序列展开层,由序列展开层与扁平层作为CNN网络与BiLSTM网络数据转换的过渡,将CNN网络与BiLSTM网络衔接,搭建CNN-BiLSTM网络,允许CNN网络在时间维度中提取隐式信息,然后将高质量特征传递给BiLSTM网络。
CNN-BiLSTM网络的数据处理过程为:将接收数据Y经过序列折叠层输入CNN网络,序列折叠层去除接收数据Y的序列结构,以使卷积操作独立应用于每一时刻;序列折叠层的输出与提取特征后的CNN输出经过一个序列展开层和一个扁平层,以恢复序列结构,将卷积层的输出重塑为特征向量序列,作为BiLSTM网络的输入,由BiLSTM网络输出条件概率密度。
S3、使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度PY[k](y)。具体为:使用混合高斯模型方法拟合接收数据Y的分布,考虑到数据拟合时的病态协方差以及信道模型不匹配的问题,引入了Akaike信息准则来提高混合高斯模型的数据拟合程度,最终得到每个时刻k的边缘概率密度PY[k](y)。
S31、假设信道输出具有与参数λ相关的条件概率f(y|λ),Y的真实分布为g(y)=f(y|λ0),基于K-L距离的AIC准则为
其中,AIC准则的第一项Eln g(Y)是极大似然函数的对数,反映模型拟合情况;第二项Eln f(Y|λ)是对模型复杂度的惩罚,在保证模型拟合的有效性条件下避免参数个数过多;
S33、将AIC准则输出的Kopt应用于混合高斯模型,由高斯混合模型的原理可知,任意形状的概率分布都可以由多个高斯分布函数近似;假设某时刻接收符号的分布是Kopt个高斯模型的线性叠加,其概率分布如下:
S34、为了获得中间参数{αi,θi},使用经典的期望最大化算法即EM算法做参数估计,进而确定边缘概率密度PY[k](y)。
S341、初始化:通过K-means确定初始化参数;
S342、确定目标函数期望,设定第k个分模型对观测数据yj的响应程度为目标函数:
其中,αi是混合系数,θi是参数合集;
S343、使目标函数期望最大化,利用极大似然估计,拉格朗日乘数法去最大化目标函数,得到更新参数公式如下:
S344、判断迭代终止条件:若相邻两次迭代的似然函数差值小于阈值,返回步骤S342,继续更新参数;否则,终止迭代,进入步骤S345;
S345、输出:将估计得到的参数回带到步骤S342,确定边缘概率密度PY[k](y)。
一般的分类网络将接收到的序列y[k]作为训练样本,发送序列x[k]作为标签,但由于在有限记忆信道中,y[k]是由输入向量决定的,因此需要将神经网络的标签由x[k]转换为/>CNN-BiLSTM网络的训练集为/>
实施例设计一个小型模式识别网络,隐层由10个神经元组成,激活函数为tansig。它完成的任务是将发送序列X中每一个元素x[k]识别为决定此刻输出y[k]的输入向量其输入向量空间共mL种可能,因此只需要mL个样本就可以训练好该网络。
S52、学习到的因子节点f表示为:
S6、根据有限记忆信道的记忆长度L与学习到的因子节点在学习因子图上进行前向后向的消息传递算法,实现最大后验概率准则下的近似最优的信号检测工作。
S61、有限记忆信道信号检测的因子图模型的输入输出联合分布由因子节点表示为:
S62、基于学习到的因子节点以及输入输出序列的联合分布,得到有限记忆信道信号检测的因子图结构以及沿图的消息传递过程,如图2;
其中,PX[k]|Y(x|y)表示泛指的条件概率密度,PX[k],Y(x,y)表示联合概率密度;
S64、沿着图3的因子图进行消息传递,得到前向传递的消息为:
S65、沿着图3的因子图进行消息传递,得到后向传递的消息为:
S66、将步骤S63中提到的联合概率密度PX[k],Y(x,y)展开,
根据消息传递算法的特性,联合概率密度表示为
最终得到MAP准则的基于消息传递的迭代表示形式:
S67、在学习到的因子图上进行前向与后向迭代的消息传递,迭代过程中利用步骤S66中arg函数不断搜索,直到确定最大可能的发送信号,实现MAP准则下的信号检测,获得发送数据x的值。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,将传统的基于模型的方法所依赖的未知信道转移概率密度分解为条件概率密度和边缘概率密度,分别进行求解。该方法利用CNN-BiLSTM网络结构来确定信道模型的条件概率密度并采用参数估计中带赤池信息量准则即Akaike的高斯混合模型学习边缘概率密度。随后将CNN-BiLSTM网络输出的分类结果与混合高斯模型的数据拟合结果联合计算,得到了通过因子图的消息传递算法实现信号检测所需要的因子节点。最终,根据信道记忆长度与学习到的因子节点在学习因子图上进行前向后向的消息传递算法,实现了不需要信道状态信息下的最大后验概率准则下的近似最优的信号检测工作。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,避免了传统基于模型的信号检测方法中对信道状态信息的高度敏感,也解决了单纯数据驱动方法实现信号检测的问题:训练难度随训练参数增多而增大、内部学习关系不可解释以及提升性能的方向不可控的问题。该方法避免了基于模型方法对信道知识的高度依赖问题,节省了获取必要的信道模型及其参数的开销,可以实现无信道状态信息下的近似最优的信号检测,能够解决有限记忆信道场景下的信道状态信息很难获取或获取代价很高的信号检测问题。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,能够在不需要信道知识的无信道模型中实现接近最优的信号检测性能。该方法,能够在无信道模型情况下实现比传统的BCJR算法更准确的检测结果,并且对不确定性训练的具有优秀的鲁棒性。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,采用了基于Akaike信息准则的混合高斯模型去拟合接收序列的边缘概率密度,避免了现有方法中信道模型失配的问题。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,采用CNN-BiLSTM来求解必要的信道知识,相比于传统的近似计算和数值计算,提出的分类神经网络具有更高的分类精度。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,基于CNN-BiLSTM网络的学习因子图,设计了深度学习中具有强学习能力的神经网络,确定了传统的基于模型的方法所依赖的信道模型的局部统计关系。基于已学习到的统计关系,结合了可以解决边缘概率密度的参数估计方法,该发明可以自主学习到有效描述有限记忆信道信号检测问题的完整因子图(具体为因子节点)。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,提出先通过数据驱动获得关键信息,再应用基于模型的算法的混合方法,相比于传统的基于模型方法,能在无信道模型场景中保证信号检测结果的准确性,又能表现出对不确定训练的优越的鲁棒性;相比于单纯的数据驱动方法,能够节省训练参数以及训练难度,以小样本训练的同时保证信号检测准确性。
如图4所示,在完美CSI下,基于CNN-BILSTM学习因子图的检测性能最大程度接近理想状态下基于模型的BCJR算法,明显优于现存的BCJRNet。
如图5所示,在不完美CSI下,传统的基于模型的BCJR算法性能极度恶化,而实施例的基于学习因子图的数据与模型联合驱动的信号检测方法,检测性能仍然保持最佳,比起现存的BCJRNet检测方法,实施例方法利用考虑Akaike信息准则的混合高斯模型去拟合数据,因此避免了信道模型不匹配导致的误码率升高现象,使实施例方法在不完美CSI下性能明显优于BCJRNet检测方法。因此,实施例方法可以在无信道模型情况下实现比传统的BCJR算法以及现存的BCJRNet更准确的检测结果,并且对不确定性训练的具有优秀的鲁棒性。
该种基于学习因子图的数据与模型联合驱动的信号检测方法,通过设计CNN-BILSTM结构的分类网络实现数据驱动方式的信号检测;采用了基于Akaike信息准则的混合高斯模型去拟合接收序列的边缘概率密度,不仅可以提高数据拟合的准确程度,还可以避免实际模型与高斯模型不匹配时导致的病态协方差问题。不同于传统的BCJR信号检测算法,实施例方法不需要依赖信道模型以及底层的信道统计关系,可以在无信道模型情况下完成MAP准则下的信号检测。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:包括以下步骤,
S1、收集通信的发送数据X与接收数据Y,并获得有限记忆信道的记忆长度L;
S2、搭建并设计CNN-BiLSTM网络作为分类神经网络;
S3、使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度PY[k](y);
S52、学习到的因子节点f表示为:
S6、根据有限记忆信道的记忆长度L与学习到的因子节点在学习因子图上进行前向后向的消息传递算法,实现最大后验概率准则下的信号检测;具体为,
S61、有限记忆信道信号检测的因子图模型的输入输出联合分布由因子节点表示为:
S62、基于学习到的因子节点以及输入输出序列的联合分布,得到有限记忆信道信号检测的因子图结构以及沿图的消息传递过程;
其中,PX[k]|Y(x|y)表示泛指的条件概率密度,PX[k],Y(x,y)表示联合概率密度;
S64、沿着因子图进行消息传递,得到前向传递的消息为:
S65、沿着因子图进行消息传递,得到后向传递的消息为:
S66、将步骤S63中提到的联合概率密度PX[k],Y(x,y)展开,
根据消息传递算法的特性,联合概率密度表示为
最终得到MAP准则的基于消息传递的迭代表示形式:
S67、在学习到的因子图上进行前向与后向迭代的消息传递,迭代过程中利用步骤S66中arg函数不断搜索,直到确定最大可能的发送信号,实现MAP准则下的信号检测,获得发送数据x的值。
2.如权利要求1所述的基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:步骤S2中,搭建并设计高分类精确度的CNN-BiLSTM网络,具体为:选择双向长短期记忆网络即BiLSTM网络,在BiLSTM网络之前放置包括卷积层和池化层的CNN网络,接收数据Y经过序列折叠层分别输出给CNN网络与序列展开层,由序列展开层与扁平层作为CNN网络与BiLSTM网络数据转换的过渡,将CNN网络与BiLSTM网络衔接,搭建CNN-BiLSTM网络,允许CNN网络在时间维度中提取隐式信息,然后将高质量特征传递给BiLSTM网络。
3.如权利要求2所述的基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:步骤S2中,CNN-BiLSTM网络的数据处理过程为:将接收数据Y经过序列折叠层输入CNN网络,序列折叠层去除接收数据Y的序列结构,以使卷积操作独立应用于每一时刻;序列折叠层的输出与提取特征后的CNN输出经过一个序列展开层和一个扁平层,以恢复序列结构,将卷积层的输出重塑为特征向量序列,作为BiLSTM网络的输入,由BiLSTM网络输出条件概率密度。
4.如权利要求1所述的基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:步骤S3中,使用基于Akaike信息准则的混合高斯模型去拟合信道接收数据Y的分布,得到边缘概率密度PY[k](y),具体为:使用混合高斯模型方法拟合接收数据Y的分布,考虑到数据拟合时的病态协方差以及信道模型不匹配的问题,引入了Akaike信息准则来提高混合高斯模型的数据拟合程度,最终得到每个时刻k的边缘概率密度PY[k](y)。
5.如权利要求4所述的基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:步骤S3中,得到每个时刻k的边缘概率密度PY[k](y),具体为,
S31、假设信道输出具有与参数λ相关的条件概率f(y|λ),Y的真实分布为g(y)=f(y|λ0),基于K-L距离的AIC准则为
其中,AIC准则的第一项Eln g(Y)是极大似然函数的对数,反映模型拟合情况;第二项Eln f(Y|λ)是对模型复杂度的惩罚,在保证模型拟合的有效性条件下避免参数个数过多;
S33、将AIC准则输出的Kopt应用于混合高斯模型,由高斯混合模型的原理可知,任意形状的概率分布都可以由多个高斯分布函数近似;假设某时刻接收符号的分布是Kopt个高斯模型的线性叠加,其概率分布如下:
S34、为了获得中间参数{αi,θi},使用经典的期望最大化算法即EM算法做参数估计,进而确定边缘概率密度PY[k](y)。
6.如权利要求5所述的基于学习因子图的数据与模型联合驱动的信号检测方法,其特征在于:步骤S34中,使用EM算法做参数估计,进而确定边缘概率密度PY[k](y),具体为,
S341、初始化:通过K-means确定初始化参数;
S342、确定目标函数期望,设定第k个分模型对观测数据yj的响应程度为目标函数:
其中,αi是混合系数,θi是参数合集;
S343、使目标函数期望最大化,利用极大似然估计,拉格朗日乘数法去最大化目标函数,得到更新参数公式如下:
S344、判断迭代终止条件:若相邻两次迭代的似然函数差值小于阈值,返回步骤S342,继续更新参数;否则,终止迭代,进入步骤S345;
S345、输出:将估计得到的参数回带到步骤S342,确定边缘概率密度PY[k](y)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210245167.9A CN114614920B (zh) | 2022-03-10 | 2022-03-10 | 基于学习因子图的数据与模型联合驱动的信号检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210245167.9A CN114614920B (zh) | 2022-03-10 | 2022-03-10 | 基于学习因子图的数据与模型联合驱动的信号检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114614920A CN114614920A (zh) | 2022-06-10 |
CN114614920B true CN114614920B (zh) | 2023-06-30 |
Family
ID=81862739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210245167.9A Active CN114614920B (zh) | 2022-03-10 | 2022-03-10 | 基于学习因子图的数据与模型联合驱动的信号检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114614920B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106059594A (zh) * | 2016-05-19 | 2016-10-26 | 清华大学 | 一种基于状态转移模型的联合信道状态检测和译码方法 |
CN111224906A (zh) * | 2020-02-21 | 2020-06-02 | 重庆邮电大学 | 基于深度神经网络的近似消息传递大规模mimo信号检测算法 |
WO2021203242A1 (zh) * | 2020-04-07 | 2021-10-14 | 东莞理工学院 | 基于深度学习的mimo多天线信号传输与检测技术 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9722691B2 (en) * | 2012-12-10 | 2017-08-01 | Agence Spatiale Europeenne | Data detection method and data detector for signals transmitted over a communication channel with inter-symbol interference |
-
2022
- 2022-03-10 CN CN202210245167.9A patent/CN114614920B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106059594A (zh) * | 2016-05-19 | 2016-10-26 | 清华大学 | 一种基于状态转移模型的联合信道状态检测和译码方法 |
CN111224906A (zh) * | 2020-02-21 | 2020-06-02 | 重庆邮电大学 | 基于深度神经网络的近似消息传递大规模mimo信号检测算法 |
WO2021203242A1 (zh) * | 2020-04-07 | 2021-10-14 | 东莞理工学院 | 基于深度学习的mimo多天线信号传输与检测技术 |
Also Published As
Publication number | Publication date |
---|---|
CN114614920A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108566257B (zh) | 一种基于反向传播神经网络的信号恢复方法 | |
CN111342867A (zh) | 一种基于深度神经网络的mimo迭代检测方法 | |
CN111884976B (zh) | 基于神经网络的信道插值方法 | |
CN111614584B (zh) | 基于神经网络的变换域自适应滤波信道估计方法 | |
CN112861927B (zh) | 基于自适应特征提取与融合的信号调制分类方法 | |
CN113381828B (zh) | 基于条件生成对抗网络的稀疏码多址接入随机信道建模方法 | |
CN110336594A (zh) | 一种基于共轭梯度下降法的深度学习信号检测方法 | |
WO2021088465A1 (zh) | 基于多分布测试数据融合的多层感知器快速调制识别方法 | |
CN112115821A (zh) | 一种基于小波近似系数熵的多信号智能调制模式识别方法 | |
CN114720938A (zh) | 基于深度展开的大规模天线阵列单比特采样doa估计方法 | |
CN112422208B (zh) | 未知信道模型下基于对抗式学习的信号检测方法 | |
CN113872904A (zh) | 一种基于集成学习的多分类通信信号自动调制识别方法 | |
CN114614920B (zh) | 基于学习因子图的数据与模型联合驱动的信号检测方法 | |
CN110474798B (zh) | 一种利用回声状态网络预测无线通信未来信号的方法 | |
CN110233808B (zh) | 一种ftn系统信号检测方法 | |
CN113890799B (zh) | 一种基于域对抗网络的水声通信信道估计与信号检测方法 | |
CN113852434B (zh) | 一种LSTM与ResNets辅助的深度学习端到端智能通信方法与系统 | |
CN115329821A (zh) | 一种基于配对编码网络和对比学习的舰船噪声识别方法 | |
CN112821971A (zh) | 一种基于对抗式学习的时变信道信号检测方法 | |
Wang et al. | Modulation recognition method for underwater acoustic communication signal based on relation network under small sample set | |
CN113709075A (zh) | 一种利用水声信道多径效应的水声通信接收机的实现方法 | |
CN115834306B (zh) | 干扰条件下多通信信号符号序列直接估计方法 | |
CN114157544B (zh) | 基于卷积神经网络的帧同步方法、设备及介质 | |
CN116319195B (zh) | 基于剪枝卷积神经网络的毫米波和太赫兹信道估计方法 | |
CN114024803B (zh) | 一种ofdm系统下的信道估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |