CN117692101B - 一种基于卷积神经网络的突发误码检测方法及装置 - Google Patents
一种基于卷积神经网络的突发误码检测方法及装置 Download PDFInfo
- Publication number
- CN117692101B CN117692101B CN202311646199.0A CN202311646199A CN117692101B CN 117692101 B CN117692101 B CN 117692101B CN 202311646199 A CN202311646199 A CN 202311646199A CN 117692101 B CN117692101 B CN 117692101B
- Authority
- CN
- China
- Prior art keywords
- burst error
- neural network
- convolutional neural
- error code
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 99
- 238000001514 detection method Methods 0.000 title claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000006870 function Effects 0.000 claims description 45
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 12
- 208000011580 syndromic disease Diseases 0.000 claims description 10
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000005562 fading Methods 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0057—Block codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0001—Systems modifying transmission characteristics according to link quality, e.g. power backoff
- H04L1/0009—Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Error Detection And Correction (AREA)
Abstract
本发明提供一种基于卷积神经网络的突发误码检测方法及装置,属于信道编码技术领域。所述方法包括:搭建用于突发误码检测的卷积神经网络;利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的突发误码训练集;利用生成的突发误码训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;计算待检测码字的误码指示序列;将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。本发明能够提高LDPC码的抗突发误码能力。与现有技术相比,本发明方法不受具体码字结构和信道特性的影响,具有更强的适用性,并且无需在接收端进行统计特性计算,实现更为简单,实时性更强。
Description
技术领域
本发明涉及信道编码技术领域,特别是指一种基于卷积神经网络的突发误码检测方法及装置。
背景技术
低密度奇偶校验(LDPC,low density parity check)码是一种纠错性能逼近香农限的线性分组码,已广泛应用于光通信、深空通信、卫星通信、移动通信、甚高速率数字用户线和磁记录等系统中,且已被采纳为5G数据信道的编码方案。LDPC码在设计构造以及迭代译码过程中,一般都是基于加性高斯白噪声信道进行的。LDPC译码的性能受译码初始信息准确性的直接影响,然而在实际的无线通信系统中,信号在无线信道中传输可能受到干扰、信道衰落等因素的影响,容易导致接收码字中存在突发误码。突发误码的表现特征为:误码集中连续出现,且误码率接近1/2;同时,接收码字的信道似然信息也受干扰或衰落影响,不再满足高斯特性。这两种因素都会导致基于置信传播的迭代译码算法失效,或者存在难以接受的性能回退。
以采用LDPC编码的OFDM通信系统为例,多径效应引起的频率选择性衰落或窄带干扰等,都会导致部分子载波的信噪比急剧恶化,使得相应子载波上传输的信息误码率大大增加。如果这种情况发生在导频子载波上,误码情况还会在信道均衡后发生进一步扩散。当这种连续突发误码的长度或者信道似然信息恶化到一定程度,错误的信道信息在LDPC迭代译码中不断扩散,最终导致译码出现高的误码平层。
针对LDPC信道编译码面临的突发误码问题,现有研究成果已经证明通过对严重错误码元位置的初始译码信息进行置零操作,可以有效避免错误的初始信息参与译码迭代,从而大大改善LDPC的译码性能。但是对于如何对接收码字中的突发误码进行准确定位,依然是一个开放问题。传统基于信号特征的检测方法,只有在信号衰落很严重的时候才能有效发挥作用。因此,研究设计一种更为鲁棒的突发误码检测方法,是提升LDPC抗突发误码能力的重要前提和基础,具有重要的应用价值。
针对信道编码中突发误码的检测识别,现有技术一是采用混合级联的方法,在编码过程中先采用传统方法进行外编码,然后将码字分段并选取其中一段采用RS码进行编码,其它部分采用LDPC码编码,可有效对抗突发误码。但是,这种方法会引起传输效率的降低,且会增加编译码的整体实现复杂度。
现有技术二是基于LDPC接收码字的硬判决结果,计算伴随式并统计每个信息比特不满足校验方程的个数,估计误码指示序列,然后利用双向迭代窗口搜索的方法估计对突发误码的位置进行估计。这种方法与LDPC码字的具体构造和信道特性关联较大,通用性略有不足。
发明内容
针对上述问题,本发明的目的在于提供一种基于卷积神经网络的突发误码检测方法及装置,以提高LDPC码的抗突发误码能力。
为解决上述技术问题,本发明提供如下技术方案:
一方面,提供了一种基于卷积神经网络的突发误码检测方法,该方法包括以下步骤:
S1、搭建用于突发误码检测的卷积神经网络;
S2、利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的突发误码训练集;
S3、利用生成的突发误码训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;
S4、计算待检测码字的误码指示序列;
S5、将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
优选地,所述卷积神经网络包括卷积层与全连接层;
所述步骤S1具体包括:
步骤S101、搭建卷积神经网络中的卷积层,共h层;选取一维卷积核进行卷积,每层卷积层使用fl个卷积核,l为对应卷积层的编号;卷积层激活函数为ReLU函数,其表达式为:
ReLU(x)=max(x,0)
其中,x表示卷积层的输入数据;每层卷积层后添加池化层,池化层采用最大池化方式,以选取相对重要的特征值;
步骤S102、通过Flatten层,将卷积层的多维输出展平为一维输出,作为全连接层的输入,实现卷积层到全连接层的过渡;
步骤S103、搭建卷积神经网络中的全连接层,共g层;前g-1层全连接层激活函数使用ReLU函数;最后一层全连接层为输出层,激活函数使用Softmax函数,其表达式为:
步骤S104、为搭建的卷积神经网络中权重赋随机初值w。
优选地,所述突发误码信道能够设置突发误码长度,根据所述突发误码长度能够生成突发误码存在性标签;标签z={z0,z1}用于指示突发误码存在概率,对于真实值标签zi∈{0,1},z0+z1=1,对于预测标签,zi∈[0,1],z0+z1=1;标签zi中的下标0代表不存在突发误码,1代表存在突发误码;
所述步骤S2具体包括:
步骤S201、将已知码字x={x1,x2,…,xn}通过突发误码信道,获得接收码字y={y1,y2,…,yn},其中,n为LDPC码字长度;通过对接收码字进行硬判决得到LDPC码字判决序列,b={b1,b2,…,bn},判决方式为:如果yi≥0,则bi=0;否则bi=1;1≤i≤n;
步骤S202、使用判决序列b和m×n维校验矩阵H计算伴随式:S={s1,s2,…,sm}=b·HT;其中HT表示矩阵H的转置矩阵;
步骤S203、根据伴随式S计算判决码字bi的可靠度vi=Σk∈M(i)sk(,得到v={v1,v2,…,vn},其中M(i)表示与变量节点i相连的校验节点集合;
步骤S204、根据判决码字的可靠度vi生成误码指示信号;如果vi=λi则ei=1,否则ei=0;得到已知码字的误码指示序列e={e1,e2,…,en},其中λi表示校验矩阵H第i列的列重;
步骤S205、将已知码字的误码指示序列e={e1,e2,…,en}及标签z={z0,z1}一一对应进行存储,得到用于训练卷积神经网络的突发误码训练集。
优选地,所述步骤S3具体包括:
步骤S301、使用误码指示序列作为卷积神经网络的输入,以突发误码存在性标签作为卷积神经网络的输出;将突发误码训练集中的误码指示序列组E={e1,e2,…,ek}作为输入,其中ei={e1 i,e2 i,…,en i}为第i组码字的误码指示序列,k为突发误码训练集中码字的数量;在网络中进行前向传播,计算得到每一组码字的预测标签,其中
步骤S302、根据码字的预测标签及真实值标签z={z1,z2,…,zk}计算损失函数J;损失函数采用稀疏分类交叉熵损失函数,表达式如下:
其中,p是样本个数,和分别是第i个样本中第j个标签对应的真实值概率和预测概率;
步骤S303、进行反向传播,计算损失函数J对卷积神经网络中各神经元权重的偏导数,作为梯度修改权重;优化算法采用自适应运动估计算法,无需设置学习率;评估标准设置为预测准确度,当误差达到期望值或训练周期数达到预设值,完成卷积神经网络训练。
优选地,所述步骤S4具体包括:
依据步骤S201至步骤S204计算待检测码字的误码指示序列et={et1,et2,...,etn}。
优选地,所述步骤S5具体包括:
将待检测码字的误码指示序列et={et1,et2,...,etn}作为输入,使用训练完成的卷积神经网络进行检测,输出检测的突发误码存在性标签比较与的概率大小,得到突发误码检测结果zout;
其中检测结果zout为0代表不存在突发误码,1代表存在突发误码。
另一方面,提供了一种基于卷积神经网络的突发误码检测装置,该装置包括:
搭建模块,用于搭建卷积神经网络,所述卷积神经网络用于突发误码检测;
生成模块,用于利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的训练集;
训练模块,用于利用生成的训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;
计算模块,用于计算待检测码字的误码指示序列;
检测模块,用于将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述突发误码检测方法的步骤。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述突发误码检测方法的步骤。
本发明提供的技术方案带来的有益效果至少包括:
本发明针对信道传输中的突发误码问题,由突发误码的错误信息扩散导致的LDPC迭代译码性能恶化问题,提出了一种基于卷积神经网络的连续突发误码检测方法。首先搭建用于突发误码检测的卷积神经网络(CNN),利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的训练集,完成所搭建CNN的训练。然后对经过信道传输的码字通过校验矩阵计算伴随式,得到误码指示序列。最后将误码指示序列输入训练完成的CNN,得到突发误码存在性标签,判断是否存在突发误码,从而为后续译码的抗突发误码模块提供依据,提高LDPC码的抗突发误码能力。
本发明采用机器学习的方法,使得该检测方法不受具体码字结构和信道特性的影响,具有更强的适用性。相比现有基于统计特性的突发误码检测技术,本发明提出的检测方法无需在接收端进行统计特性计算,实现更为简单,实时性更强。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于卷积神经网络的突发误码检测方法的流程图;
图2是本发明实施例提供的卷积神经网络的结构示意图;
图3是本发明实施例提供的突发误码训练集构建流程示意图;
图4是本发明实施例提供的一种基于卷积神经网络的突发误码检测装置的结构框图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于卷积神经网络的突发误码检测方法,如图1所示,所述方法包括以下步骤:
S1、搭建用于突发误码检测的卷积神经网络(CNN),所述卷积神经网络包括卷积层与全连接层,本步骤具体包括:
步骤S101、搭建卷积神经网络中的卷积层,共h层;选取一维卷积核进行卷积,每层卷积层使用fl个卷积核,l为对应卷积层的编号;卷积层激活函数为ReLU函数,其表达式为:
ReLU(x)=max(x,0)
其中,x表示卷积层的输入数据;每层卷积层后添加池化层,池化层采用最大池化(MaxPool)方式,以选取相对重要的特征值;
步骤S102、通过Flatten层,将卷积层的多维输出展平为一维输出,作为全连接层的输入,实现卷积层到全连接层的过渡;
步骤S103、搭建卷积神经网络中的全连接层,共g层;前g-1层全连接层激活函数使用ReLU函数;最后一层全连接层为输出层,激活函数使用Softmax函数,其表达式为:
步骤S104、为搭建的卷积神经网络中权重赋随机初值w。
搭建完成的卷积神经网络的结构如图2所示。
S2、利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的突发误码训练集。
所述突发误码信道能够设置突发误码长度,根据突发误码长度能够生成突发误码存在性标签(简称标签);标签z={z0,z1}用于指示突发误码存在概率,对于真实值标签zi∈{0,1},z0+z1=1,对于预测标签,zi∈[0,1],z0+z1=1;标签zi中的下标0代表不存在突发误码,1代表存在突发误码。
突发误码训练集的构建流程如图3所示,具体包括以下步骤:
步骤S201、将已知码字x={x1,x2,…,xn}通过突发误码信道,获得接收码字y={y1,y2,…,yn},其中,n为LDPC码字长度;通过对接收码字进行硬判决得到LDPC码字判决序列,b={b1,b2,…,bn},判决方式为:如果yi≥0,则bi=0;否则bi=1;1≤i≤n;
步骤S202、使用判决序列b和m×n维校验矩阵H计算伴随式:S={s1,s2,…,sm}=b·HT;其中HT表示矩阵H的转置矩阵;
步骤S203、根据伴随式S计算判决码字bi的可靠度vi=∑k∈M(i)sk(,得到v={v1,v2,…,vn},其中M(i)表示与变量节点i相连的校验节点集合;
步骤S204、根据判决码字的可靠度vi生成误码指示信号;如果vi=λi则ei=1,否则ei=0;得到已知码字的误码指示序列e={e1,e2,…,en},其中λi表示校验矩阵H第i列的列重;
步骤S205、将已知码字的误码指示序列e={e1,e2,…,en}及标签z={z0,z1}一一对应进行存储,得到用于训练卷积神经网络的突发误码训练集。
S3、利用生成的突发误码训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络。本步骤具体包括:
步骤S301、使用误码指示序列作为卷积神经网络的输入,以突发误码存在性标签作为卷积神经网络的输出;将突发误码训练集中的误码指示序列组E={e1,e2,…,ek}作为输入,其中ei={e1 i,e2 i,…,en i}为第i组码字的误码指示序列,k为突发误码训练集中码字的数量;在网络中进行前向传播,计算得到每一组码字的预测标签,其中
步骤S302、根据码字的预测标签及真实值标签z={z1,z2,…,zk}计算损失函数J;损失函数采用稀疏分类交叉熵损失函数(sparse categoricalcrossentropy),表达式如下:
其中,p是样本个数,和分别是第i个样本中第j个标签对应的真实值概率和预测概率;
步骤S303、进行反向传播,计算损失函数J对卷积神经网络中各神经元权重的偏导数,作为梯度修改权重;优化算法采用自适应运动估计算法(Adam),无需设置学习率;评估标准设置为预测准确度,当误差达到期望值或训练周期(epoch)数达到预设值,完成卷积神经网络训练。
训练完成后,可利用训练后的卷积神经网络进行突发误码检测,包括以下步骤S4和S5。
S4、计算待检测码字的误码指示序列。
依据步骤S201至步骤S204记载的方法,可计算出待检测码字的误码指示序列et={et1,et2,...,etn}。
S5、将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。本步骤具体包括:
将待检测码字的误码指示序列et={et1,et2,…,etn}作为输入,使用训练完成的卷积神经网络进行检测,输出检测的突发误码存在性标签比较与z^1的概率大小,得到突发误码检测结果zout;
其中检测结果zout为0代表不存在突发误码,1代表存在突发误码。
本发明提供的如上所述的基于卷积神经网络的连续突发误码检测方法,能够为后续译码的抗突发误码模块提供依据,提高LDPC码的抗突发误码能力。并且,本发明采用机器学习的方法,使得该检测方法不受具体码字结构和信道特性的影响,具有更强的适用性。相比现有基于统计特性的突发误码检测技术,本发明提出的检测方法无需在接收端进行统计特性计算,实现更为简单,实时性更强。
为了对本发明的技术方案进行更详细的阐述,下面以CCSDS近地空间通信标准中的LDPC(8176,7154)码为例,对本发明提出的检测方法实现步骤进行详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
假设信道是加性高斯白噪声(AWGN,additive white Guassian noise),发送的信息比特长度为7154,且经过LDPC编码和BPSK调制。为了更真实地模拟连续突发误码的场景,在接收端的每帧数据中引入一段长度随机设置为[0,200]的突发误码。本实施例中的LDPC码校验矩阵H具有如下结构:
A1,1 A1,2 A1,3 A1,4 A1,5 A1,6 A1,7 A1,8 A1,9 A1,10 A1,11 A1,12 A1,13 A1,14 A1,15 A1,16
A2,1 A2,2 A2,3 A2,4 A2,5 A2,6 A2,7 A2,8 A2,9 A2,10 A2,11 A2,12 A2,13 A2,14 A2,15 A2,16
校验矩阵是一个由511x511循环移位子矩阵构成的2x16块矩阵,校验矩阵的维度是1022x8176。由于循环移位子矩阵Ai,j(i=1,2;j=1,2,…,16)的行重和列重均为2,因此校验矩阵的行重为32,列重为4。
本发明所述基于卷积神经网络的LDPC突发误码检测方法的具体实施步骤如下:
步骤S1:搭建用于突发误码检测的卷积神经网络(CNN),包括卷积层与全连接层,具体包括以下步骤:
步骤S101:搭建CNN网络中的卷积层,共2层。每个卷积层均选取一维卷积核进行卷积,卷积层激活函数为ReLU函数。具体如下:
第一层卷积层共32个一维卷积核,每个卷积核大小为3,卷积核滑动步长为2,卷积的填充方式为相同填充(same padding),即允许卷积核超出边界,并使得卷积后结果大小与原来一致。
第二层卷积层共64个一维卷积核,每个卷积核大小为3,卷积核滑动步长为2,卷积的填充方式为相同填充。
每层卷积层后添加池化层,池化方式选择最大池化(MaxPool),池化窗口大小为2,以选取相对重要的特征值。
步骤S102:通过Flatten层,将卷积层的多维输出展平为一维输出,作为全连接层的输入,实现卷积层到全连接层的过渡。
步骤S103:搭建CNN网络中的全连接层,共2层。具体如下:
第一层全连接层神经元个数设置为64,激活函数使用ReLU函数。
第二层全连接层神经元个数设置为2,激活函数使用Softmax函数。
步骤S104:为所搭建CNN中全部权重赋随机初值w。
步骤S2:利用已知60000组码字与突发误码信道生成包含误码指示序列及标签的训练集。其中突发误码信道可设置突发误码长度,在本实施例中,认为突发误码长度设置为50及以下时即不存在突发误码;标签z={z0,z1}用于指示突发误码存在概率,对于真实标签zi∈{0,1},z0+z1=1,对于预测标签,zi∈[0,1],z0+z1=1。标签zi中的下标0代表不存在突发误码,1代表存在突发误码。具体包括如下步骤:
步骤S201:将已知码字x={x1,x2,…,x8176}通过突发误码信道,获得接收码字y={y1,y2,…,y8176},LDPC码字长度为8176。通过对接收码字进行硬判决得到LDPC码字判决序列,b={b1,b2,…,b8176},判决方式为:如果yi≥0,则bi=0;否则bi=1。
步骤S202:使用判决序列b和校验矩阵H(1022×8176维)计算伴随式:S={s1,s2,…,s1022}=b·HT。
步骤S203:根据伴随式S计算判决码字bi的可靠度vi=∑k∈M(i)sk(1≤i≤8176),得到v={v1,v2,…,v8176},其中M(i)表示与变量节点i相连的校验节点集合。
步骤S204:根据判决码字的可靠度vi生成误码指示信号。如果vi=λi则ei=1,否则ei=0;得到每一组已知码字的误码指示序列e={e1,e2,…,e8176},其中λi表示校验矩阵H第i列的列重。
步骤S205:将已知码字的误码指示序列e={e1,e2,…,e8176}及标签z={z0,z1}一一对应进行存储,得到用于训练CNN的突发误码训练集。
步骤S3:使用步骤S2生成的突发误码训练集,对步骤S1搭建的CNN进行训练,具体包括以下步骤:
步骤S301:搭建的CNN网络使用误码指示序列作为输入,突发误码存在性标签作为输出。将突发误码训练集中的误码指示序列组E={e1,e2,…,e60000}作为输入,其中ei={e1 i,e2 i,…,en i}为第i组码字的误码指示序列,k为训练集码字数量。在网络中进行前向传播,计算得到每一组码字的预测结果,其中
步骤S302:根据码字预测标签及真实值标签z={z1,z2,…,z60000}计算损失函数J。损失函数采用稀疏分类交叉熵损失函数,表达式如下:
步骤S303:进行反向传播,通过计算损失函数J对各神经元权重的偏导数,作为梯度修改权重,优化算法采用自适应运动估计算法(Adam),无需设置学习率。评估标准设置为预测准确度,设置训练周期(epoch)为5,完成CNN网络训练。
接下来,使用训练完成的CNN进行突发误码检测,具体步骤如下:
S4、计算待检测码字的误码指示序列。
依据步骤S201至步骤S204计算待检测码字的误码指示序列et={et1,et2,...,et8176}。
S5、将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
将待检测码字的误码指示序列et={et1,et2,...,et8176}作为输入,使用训练完成的卷积神经网络进行检测,输出检测的突发误码存在性标签比较与的概率大小,得到突发误码检测结果zout;
其中检测结果zout为0代表不存在突发误码,1代表存在突发误码。
本实施例中突发误码检测结果如下表所示:
表1
相应地,本发明的实施例还提供了一种基于卷积神经网络的突发误码检测装置,如图4所示,该装置包括:
搭建模块201,用于搭建卷积神经网络,所述卷积神经网络用于突发误码检测;
生成模块202,用于利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的训练集;
训练模块203,用于利用生成的训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;
计算模块204,用于计算待检测码字的误码指示序列;
检测模块205,用于将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在示例性实施例中,本发明还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述突发误码检测方法的步骤。
图5是本发明实施例提供的一种电子设备的结构示意图,如图5所示,电子设备300可以包括处理器3001和存储器3002。可选地,电子设备300还可以包括收发器3003。其中,处理器3001与存储器3002以及收发器3003,如可以通过通信总线连接。存储器3002上存储有计算机可读指令,所述计算机可读指令被处理器3001执行时,实现如上述突发误码检测方法的步骤。
在具体的实现中,作为一种实施例,处理器3001可以包括一个或多个CPU,例如图5中所示出的CPU0和CPU1。
在具体实现中,作为一种实施例,电子设备300也可以包括多个处理器,例如图5中所示的处理器3001和处理器3004。这些处理器中的每一个可以是一个单核处理器(single-CPU),也可以是一个多核处理器(multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
其中,所述存储器3002用于存储执行本发明方案的软件程序,并由处理器3001来控制执行,具体实现方式可以参考上述方法实施例,此处不再赘述。
收发器3003,用于与网络设备通信,或者与终端设备通信。
可选地,收发器3003可以包括接收器和发送器。其中,接收器用于实现接收功能,发送器用于实现发送功能。
可选地,收发器3003可以和处理器3001集成在一起,也可以独立存在,并通过电子设备300的接口电路与处理器3001耦合,本发明实施例对此不作具体限定。
需要说明的是,图5中示出的电子设备300的结构并不构成对该电子设备的限定,实际的电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。此外,电子设备300的技术效果可以参考上述方法实施例的技术效果,此处不再赘述。
在示例性实施例中,本发明还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述突发误码检测方法的步骤。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
在说明书中提到“一个实施例”、“实施例”、“示例性实施例”、“一些实施例”等指示所述的实施例可以包括特定特征、结构或特性,但未必每个实施例都包括该特定特征、结构或特性。另外,在结合实施例描述特定特征、结构或特性时,结合其它实施例(无论是否明确描述)实现这种特征、结构或特性应在相关领域技术人员的知识范围内。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系,但也可能表示的是一种“和/或”的关系,具体可参考前后文进行理解。
本发明中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。另外,为了避免对本发明的实质造成不必要的混淆,并没有详细说明众所周知的方法、过程、流程、元件和电路等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于卷积神经网络的突发误码检测方法,其特征在于,包括以下步骤:
S1、搭建用于突发误码检测的卷积神经网络;
S2、利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的突发误码训练集;
所述突发误码信道能够设置突发误码长度,根据所述突发误码长度能够生成突发误码存在性标签;标签z={z0,z1}用于指示突发误码存在概率,对于真实值标签zi∈{0,1},z0+z1=1,对于预测标签,zi∈[0,1],z0+z1=1;标签zi中的下标0代表不存在突发误码,1代表存在突发误码;
所述步骤S2具体包括:
步骤S201、将已知码字x={x1,x2,…,xn}通过突发误码信道,获得接收码字y={y1,y2,…,yn},其中,n为LDPC码字长度;通过对接收码字进行硬判决得到LDPC码字判决序列,b={b1,b2,…,bn},判决方式为:如果yi≥0,则bi=0;否则bi=1;1≤i≤n;
步骤S202、使用判决序列b和m×n维校验矩阵H计算伴随式:S={s1,s2,…,sm}=b·HT;其中HT表示矩阵H的转置矩阵;
步骤S203、根据伴随式S计算判决码字bi的可靠度vi=∑k∈M(i)sk,得到v={v1,v2,…,vn},其中M(i)表示与变量节点i相连的校验节点集合;
步骤S204、根据判决码字的可靠度vi生成误码指示信号;如果vi=λi则ei=1,否则ei=0;得到已知码字的误码指示序列e={e1,e2,…,en},其中λi表示校验矩阵H第i列的列重;
步骤S205、将已知码字的误码指示序列e={e1,e2,…,en}及标签z={z0,z1}一一对应进行存储,得到用于训练卷积神经网络的突发误码训练集;
S3、利用生成的突发误码训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;
S4、计算待检测码字的误码指示序列;
S5、将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
2.根据权利要求1所述的基于卷积神经网络的突发误码检测方法,其特征在于,所述卷积神经网络包括卷积层与全连接层;
所述步骤S1具体包括:
步骤S101、搭建卷积神经网络中的卷积层,共h层;选取一维卷积核进行卷积,每层卷积层使用fl个卷积核,l为对应卷积层的编号;卷积层激活函数为ReLU函数,其表达式为:
ReLU(x)=max(x,0)
其中,x表示卷积层的输入数据;每层卷积层后添加池化层,池化层采用最大池化方式,以选取相对重要的特征值;
步骤S102、通过Flatten层,将卷积层的多维输出展平为一维输出,作为全连接层的输入,实现卷积层到全连接层的过渡;
步骤S103、搭建卷积神经网络中的全连接层,共g层;前g-1层全连接层激活函数使用ReLU函数;最后一层全连接层为输出层,激活函数使用Softmax函数,其表达式为:
步骤S104、为搭建的卷积神经网络的权重赋随机初值w。
3.根据权利要求1所述的基于卷积神经网络的突发误码检测方法,其特征在于,所述步骤S3具体包括:
步骤S301、使用误码指示序列作为卷积神经网络的输入,以突发误码存在性标签作为卷积神经网络的输出;将突发误码训练集中的误码指示序列组E={e1,e2,…,ek}作为输入,其中ei={e1 i,e2 i,…,en i}为第i组码字的误码指示序列,k为突发误码训练集中码字的数量;在网络中进行前向传播,计算得到每一组码字的预测标签,其中
步骤S302、根据码字的预测标签及真实值标签z={z1,z2,…,zk}计算损失函数J;损失函数采用稀疏分类交叉熵损失函数,表达式如下:
其中,p是样本个数,和分别是第i个样本中第j个标签对应的真实值概率和预测概率;
步骤S303、进行反向传播,计算损失函数J对卷积神经网络中各神经元权重的偏导数,作为梯度修改权重;优化算法采用自适应运动估计算法,无需设置学习率;评估标准设置为预测准确度,当误差达到期望值或训练周期数达到预设值,完成卷积神经网络训练。
4.根据权利要求3所述的基于卷积神经网络的突发误码检测方法,其特征在于,所述步骤S4具体包括:
依据步骤S201至步骤S204计算待检测码字的误码指示序列et={et1,et2,...,etn}。
5.根据权利要求4所述的基于卷积神经网络的突发误码检测方法,其特征在于,所述步骤S5具体包括:
将待检测码字的误码指示序列et={et1,et2,...,etn}作为输入,使用训练完成的卷积神经网络进行检测,输出检测的突发误码存在性标签比较与的概率大小,得到突发误码检测结果zout;
其中检测结果zout为0代表不存在突发误码,1代表存在突发误码。
6.一种基于卷积神经网络的突发误码检测装置,用于实现权利要求1至5中任一项所述的方法,其特征在于,所述装置包括:
搭建模块,用于搭建卷积神经网络,所述卷积神经网络用于突发误码检测;
生成模块,用于利用已知的若干组码字与突发误码信道生成包含误码指示序列及标签的训练集;
训练模块,用于利用生成的训练集对搭建的卷积神经网络进行训练,得到训练完成的卷积神经网络;
计算模块,用于计算待检测码字的误码指示序列;
检测模块,用于将待检测码字的误码指示序列输入训练完成的卷积神经网络进行突发误码检测,确定是否存在突发误码。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311646199.0A CN117692101B (zh) | 2023-12-04 | 2023-12-04 | 一种基于卷积神经网络的突发误码检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311646199.0A CN117692101B (zh) | 2023-12-04 | 2023-12-04 | 一种基于卷积神经网络的突发误码检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117692101A CN117692101A (zh) | 2024-03-12 |
CN117692101B true CN117692101B (zh) | 2024-07-09 |
Family
ID=90136415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311646199.0A Active CN117692101B (zh) | 2023-12-04 | 2023-12-04 | 一种基于卷积神经网络的突发误码检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117692101B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110048827A (zh) * | 2019-04-15 | 2019-07-23 | 电子科技大学 | 一种基于深度学习卷积神经网络的类模板攻击方法 |
CN113055020A (zh) * | 2021-06-02 | 2021-06-29 | 北京科技大学 | 一种基于编码约束的突发误码检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10491243B2 (en) * | 2017-05-26 | 2019-11-26 | SK Hynix Inc. | Deep learning for low-density parity-check (LDPC) decoding |
CN108364017B (zh) * | 2018-01-24 | 2019-11-05 | 华讯方舟科技有限公司 | 一种图像质量分类方法、系统及终端设备 |
CN111385022B (zh) * | 2018-12-29 | 2022-02-25 | 深圳市海思半导体有限公司 | 误码检测方法及相关设备 |
CN113420294A (zh) * | 2021-06-25 | 2021-09-21 | 杭州电子科技大学 | 基于多尺度卷积神经网络的恶意代码检测方法 |
CN113610216B (zh) * | 2021-07-13 | 2022-04-01 | 上海交通大学 | 基于极性转变软信息辅助的多任务神经网络及多磁道检测方法 |
EP4156691A2 (en) * | 2021-09-27 | 2023-03-29 | Nokia Technologies Oy | A method, an apparatus and a computer program product for video encoding and video decoding |
CN114896598B (zh) * | 2022-05-11 | 2024-05-21 | 武汉科技大学 | 一种基于卷积神经网络的恶意代码检测方法 |
-
2023
- 2023-12-04 CN CN202311646199.0A patent/CN117692101B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110048827A (zh) * | 2019-04-15 | 2019-07-23 | 电子科技大学 | 一种基于深度学习卷积神经网络的类模板攻击方法 |
CN113055020A (zh) * | 2021-06-02 | 2021-06-29 | 北京科技大学 | 一种基于编码约束的突发误码检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117692101A (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jafarpour et al. | Efficient and robust compressed sensing using optimized expander graphs | |
CN106888026B (zh) | 基于lsc-crc译码的分段极化码编译码方法及系统 | |
US20220294471A1 (en) | Smart decoder | |
US20080235559A1 (en) | Strengthening parity check bit protection for array-like LDPC codes | |
US11973513B2 (en) | Decoders and systems for decoding encoded data using neural networks | |
CN111917420B (zh) | 一种ldpc自适应译码方法及ldpc自适应译码器 | |
US20070033482A1 (en) | Decoder device and decoding method and program | |
CN113055020A (zh) | 一种基于编码约束的突发误码检测方法 | |
CN118101136B (zh) | 一种联合信源信道编码基础矩阵的构造方法、设备和介质 | |
CN111480324A (zh) | 用于检测相互干扰的信息流的装置和方法 | |
CN106209312B (zh) | 一种利用软判决的循环码参数盲识别方法 | |
CN117692101B (zh) | 一种基于卷积神经网络的突发误码检测方法及装置 | |
Peng et al. | Low complexity receiver of sparse code multiple access based on dynamic trellis | |
CN110661535A (zh) | 一种提高Turbo译码性能的方法、装置及计算机设备 | |
CN110212922B (zh) | 一种极化码自适应译码方法及系统 | |
Huang et al. | Functional error correction for reliable neural networks | |
CN109039531B (zh) | 一种基于机器学习调整lt码编码长度的方法 | |
KR20230142195A (ko) | 극 부호 신뢰 전파 비트 반전 복호 장치 및 방법 | |
Carli et al. | Average consensus on digital noisy networks | |
CN115714632B (zh) | 一种基于高斯列消的极化码码长盲识别方法 | |
WO2021210079A1 (en) | Communication method and device using recurrent decoding iterations for polar codes | |
Qin et al. | Research on efficient channel decoding algorithm for memory channel and short packet transmission in smart grid | |
CN113114273B (zh) | Ldpc码的校验矩阵提取方法及系统、设备 | |
CN113300717B (zh) | 一种基于码率自适应的高效化ldpc编码器电路 | |
CN117896040B (zh) | 下行控制信息检测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |