CN113364540A - 基于堆栈降噪自编码的lte上行干扰分类方法及系统 - Google Patents

基于堆栈降噪自编码的lte上行干扰分类方法及系统 Download PDF

Info

Publication number
CN113364540A
CN113364540A CN202110632135.XA CN202110632135A CN113364540A CN 113364540 A CN113364540 A CN 113364540A CN 202110632135 A CN202110632135 A CN 202110632135A CN 113364540 A CN113364540 A CN 113364540A
Authority
CN
China
Prior art keywords
layer
training
coding
self
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110632135.XA
Other languages
English (en)
Other versions
CN113364540B (zh
Inventor
许鸿奎
李鑫
周俊杰
张子枫
卢江坤
姜彤彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jianzhu University
Original Assignee
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jianzhu University filed Critical Shandong Jianzhu University
Priority to CN202110632135.XA priority Critical patent/CN113364540B/zh
Publication of CN113364540A publication Critical patent/CN113364540A/zh
Application granted granted Critical
Publication of CN113364540B publication Critical patent/CN113364540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • H04B17/345Interference values
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Electromagnetism (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了基于堆栈降噪自编码的LTE上行干扰分类方法及系统,包括:获取待分类的LTE基站上行数据;对待分类的LTE基站上行数据进行预处理;将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。该模型提高了LTE网络上行干扰分析的效率,同时具有较强的鲁棒性。

Description

基于堆栈降噪自编码的LTE上行干扰分类方法及系统
技术领域
本发明涉及LTE上行干扰分类技术领域,特别是涉及基于堆栈降噪自编码的LTE上行干扰分类方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
当前移动通信网络的规模不断扩大,基站数量也随之增加,2G/3G/4G网络共存,5G网络也大规模商用,频率分配不当或系统间设备隔力度不足等问题日益突出,使得LTE系统上行干扰日益严重。而当前干扰排查工作主要采用人工排查的方式进行识别,通过对比LTE系统带宽内的频域干扰分布特征与常见干扰信号的特征,实现定位干扰源。但网络规模的不断扩大,使得传统人工识别的方法难以满足当前工作需求,因此建立智能化的通信网络干扰识别算法势在必行。为实现自动化的LTE网络上行干扰识别,部分学者将机器学习算法引入到通信网络的优化工作中。
翁文迪等针对时分双工长期演进(TD-LTE,Time Division Duplexing-Long TermEvolution)系统F频段上行干扰,提出了对不同干扰波形的特征提取方法,结合站址信息匹配实现TD-LTE系统间干扰识别。刘思等基于TD-LTE上行干扰功率平均值来进行提取时频特征,根据不同干扰各项特征阈值的不同来进行TD-LTE的自系统干扰识别。李颖等同样对TD-LTE中F频段的上行干扰功率平均值进行了时域和频域上的人工特征提取,通过随机森林算法进行干扰识别。孙黎明利用同类波形特征提出了基于BP神经网络的自动干扰排查算法。一方面传统的机器学习方法需在特征提取过程中受多方面因素影响,需要丰富的工程经验和专业知识。另一方面基于梯度下降的反向传播算法容易陷入局部最优值,使得模型分类精度不理想。
发明人发现,现有技术存在的技术问题是,对LTE上行干扰分类精度不够准确。
发明内容
为了解决现有技术的不足,本发明提供了基于堆栈降噪自编码的LTE上行干扰分类方法及系统;
第一方面,本发明提供了基于堆栈降噪自编码的LTE上行干扰分类方法;
基于堆栈降噪自编码的LTE上行干扰分类方法,包括:
获取待分类的LTE基站上行数据;
对待分类的LTE基站上行数据进行预处理;
将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
第二方面,本发明提供了基于堆栈降噪自编码的LTE上行干扰分类系统;
基于堆栈降噪自编码的LTE上行干扰分类系统,包括:
获取模块,其被配置为:获取待分类的LTE基站上行数据;
预处理模块,其被配置为:对待分类的LTE基站上行数据进行预处理;
分类模块,其被配置为:将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
第三方面,本发明还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
第四方面,本发明还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果是:
针对LTE(Long Term Evolution)网络上行干扰分类模型中噪声敏感、训练时间长的问题,本发明建立结合堆栈降噪自编码器与极限学习机的LTE网络上行干扰分析模型。使用上行干扰原始数据无监督地预训练堆栈降噪自编码SDAE(Stacked DenoisingAutoencoder)提取高层抽象特征,并为极限学习机ELM(Extreme Learning Machine)分类器提供初始参数。该模型发挥了ELM收敛快和SDAE抑制噪声的优势,同时克服了ELM参数随机赋值造成的鲁棒性不足的问题。实验结果表明,该模型提高了LTE网络上行干扰分析的效率,同时具有较强的鲁棒性。
本发明将堆栈降噪自编码器与极限学习机结合,通过堆栈降噪自编码来进行特征提取和降噪,ELM进行分类,分类过程无需反复迭代,提高模型的训练速度。同时通过无监督预训练为ELM产生初始参数,克服了ELM因参数随机赋值造成的网络结构复杂,降噪自编码器的引入改善了ELM对噪声数据敏感的缺点,提高模型的稳定性。
本发明将该算法应用在FDD-LTE网络上行干扰分类中,能很好的适应FDD-LTE网络易受噪声影响的情景,提高干扰识别准确率,同时快速的学习速度为模型的工程应用提供条件。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的极限学习机结构图;
图2为第一个实施例的降噪自编码网络结构;
图3为第一个实施例的SDAE-ELM网络结构;
图4为第一个实施例的数据提取流程图;
图5为第一个实施例的原始MR数据格式;
图6为第一个实施例的某小区12小时上行干扰功率数据可视化;
图7为第一个实施例的SDAE-ELM模型不同参数组合性能分析;
图8为第一个实施例的加噪数据集中的分类准确率变化。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
术语解释:
LTE,英文全称是Long Term Evolution,中文解释是:长期演进;
SDAE,英文全称是Stacked Denoising Autoencoder,中文解释是:堆栈降噪自编码;
ELM,英文全称是Extreme Learning Machine,中文解释是:极限学习机。
极限学习机(Eltreme Learning Machine,ELM)被提出以来以学习速度快、泛化性能优被广泛应用在计算机视觉、故障诊断、语音识别、电力系统、等众多领域。其网络参数通过最小二乘法计算得出,无需反复迭代。但输入层参数随机赋值使得其需要更多的隐含层节点来保持网络的泛化能力,从而使得网络结构更复杂。研究表明,通过将ELM拓展到深度学习领域,可以在处理大规模高维数据时降低深层网络的计算复杂度,减少训练时间。有文献通过将卷积神经网络(Convolutional Neural Network,CNN)和ELM相结合,提出CNN2ELM集成学习框架,提高了识别人脸图像年龄的鲁棒性,王晓丹将降噪极限学习机进行堆叠构成深度降噪极限学习机,较传统深度模型性能有一定提升,鲁棒性增强,但其参数随机赋值使得算法性能有一定的波动。文献将栈式自编码与ELM融合进行药品鉴别,减少模型训练时间,同时提高准确率。
堆栈降噪自编码器(Stacked Denoising Autoencoder,SDAE)通过无监督的逐层预训练,使得网络参数经过合理的初始化,避免了监督学习中的梯度传播问题,可降低监督准则函数给出的梯度更新方向不可靠的影响,相比较其他自编码器提取的特征有更强的抗噪能力。因此,将堆栈降噪自编码网络与极限学习机相结合,通过ELM代替SDAE的Softmax分类层,继承ELM算法训速度快的优势,提高深度学习的实际应用能力。利用SDAE来提取原始数据特征,同时优化ELM的输入权重和隐含层偏置,克服了参数赋值的随机性,增强了算法鲁棒性和抗噪能力。本发明将堆栈降噪自编码结合极限学习机(Stacked DenoisingAutoencoder combine Extreme Learning Machine,SDAE-ELM)模型应用于LTE网络上行干扰识别,并将实验结果与ELM、ELM-AE算法进行对比,分析其在LTE网络上行干扰识别中的可行性。
实施例一
本实施例提供了基于堆栈降噪自编码的LTE上行干扰分类方法;
基于堆栈降噪自编码的LTE上行干扰分类方法,包括:
S101:获取待分类的LTE基站上行数据;
S102:对待分类的LTE基站上行数据进行预处理;
S103:将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
进一步地,所述待分类的LTE基站上行数据,包括:
基站标识号eNB id、主服务小区标号、上报时间、物理资源块PRB(physicalresource block)粒度上行干扰功率值。
进一步地,所述S102:对待分类的LTE基站上行数据进行预处理;具体包括:
对待分类的LTE基站上行数据,删除空值数据,删除格式损坏数据;
对待分类的LET基站上行数据进行归一化处理。
进一步地,所述隐含层h1,其获取步骤包括:
构建第一降噪自编码模型;
所述第一降噪自编码模型,包括依次连接的:输入层c1、加噪层c2、隐含层c3和输出层c4;
构建第一训练集,所述第一训练集为无干扰类别标签的LTE基站上行数据;
将第一训练集输入到第一降噪自编码模型中,对第一降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第一降噪自编码模型,训练前的第一降噪自编码模型中的隐含层c3经过训练后已经变成隐含层c3’,将训练后的第一降噪自编码模型中的隐含层c3’作为隐含层h1。
进一步地,所述隐含层h2,其获取步骤包括:
构建第二降噪自编码模型;
所述第二降噪自编码模型,包括依次连接的:输入层c1、加噪层c2、隐含层c3’、隐含层d4和输出层d5;
将第一训练集输入到第二降噪自编码模型中,对第二降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第二降噪自编码模型,训练前的第一降噪自编码模型中的隐含层d4经过训练后已经变成隐含层d4’,将训练后的第一降噪自编码模型中的隐含层d4’作为隐含层h2。
进一步地,所述隐含层h3,其获取步骤包括:
构建第三降噪自编码模型;
所述第三降噪自编码模型,包括依次连接的:输入层e1、加噪层e2、隐含层e3和输出层e4;其中,输入层e1使用隐含层d4’来实现;
将第一训练集输入到第三降噪自编码模型中,对第三降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第三降噪自编码模型,
训练前的第三降噪自编码模型中的隐含层e3经过训练后已经变成隐含层e3’,将训练后的第三降噪自编码模型中的隐含层e3’作为隐含层h3。
进一步地,所述分类层,是指Softmax分类层。
进一步地,所述训练后的基于堆栈降噪自编码的极限学习机,其训练步骤包括:
构建第二训练集,所述第二训练集为已知干扰类别标签的LTE基站上行数据;
将第二训练集输入到基于堆栈降噪自编码的极限学习机中;当损失函数达到最小值时,或者训练迭代次数满足设定要求时,停止训练,得到训练后的基于堆栈降噪自编码的极限学习机。
进一步地,所述将待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;具体原理包括:
隐含层h1对待分类的LET基站上行数据进行第一次特征提取,得到第一特征;
隐含层h2对第一特征进行第二次特征提取,得到第二特征;
隐含层h3对第二特征进行解码得到重构数据;
分类层对重构数据进行分类得到分类结果。
极限学习机ELM是一种具有单隐藏层的前馈神经网络(Single-hidden LayerFeed Neural Network,SLFN),它的网络结构与传统神经网络算法例如BP神经网络相同,由输入层,隐藏层,输出层组成。典型的ELM网络结构如图1所示,设输入层、隐含层、输出层节点数分别为(m,l,n)。
对于任意的N个样本:
(xi,ti),xi=[xi1,xi2,...,xim]T∈Rm,ti=[ti1,ti2,...tin]T∈Rn,g(x)为激活函数,则ELM的输出:
Figure BDA0003104091750000091
其中,wi=[wi1,wi2,...,wim]T为输入层与隐含层的第i个节点之间的权值向量;βi=[βi1i2,...,βin]T为第i个隐含层节点与输出层之间的权值向量;bi为隐含层节点i的偏置,g(·)为隐含层的激活函数,wi·xi为wi和xi的内积,根据定理我们可知ELM可无限逼近这N个样本使得
Figure BDA0003104091750000092
既存在βi,wi,bi使得:
Figure BDA0003104091750000093
写成矩阵形式为:
Hβ=T;(3)
其中,H为隐含层的输出矩阵,每一列对应每个隐含层节点的输出,T表示样本目标输出
β为隐含层与输出层之间的权值矩阵。
Figure BDA0003104091750000101
Figure BDA0003104091750000102
Figure BDA0003104091750000103
从理论上,黄广斌进行了严格的证明:
(1)如果激活函数g(x)无限可微,那么可以随机初始化输入层与隐含层之间的权重wi和偏置bi,这时整个网络看作一个线性系统,只需求解隐含层与输出层之间的权值β就可以确定整个网络的参数;
(2)对于含有N个隐含层节点的单隐含层前馈神经网络(Single-hidden LayerFeed Neural Network,SLFN),激活函数g:R→R是无限可微的。对于任意的N个样本(xi,ti),xi=[xi1,xi2,…,xim]T∈Rm,ti=[ti1,ti2,…,tin]T∈Rn,随机初始化参数wi和bi,无论他们复合怎样的连续分布,以下公式均成立。
Figure BDA0003104091750000106
基于以上结论,ELM算法的实现过程为:给定训练集S=|(xi,ti)|xi∈Rm,ti∈Rn,网络的训练过程相当于求解式(3)的最小二乘解
Figure BDA0003104091750000104
Figure BDA0003104091750000105
一般情况下,隐含层节点数l小于训练样本N,因此求解隐含层数输出层之间的权值β为:
Figure BDA0003104091750000111
其中H+为矩阵H的Moore-Penrose广义逆矩阵,具体计算方式入式(7)所示,此解为该系统的最小二乘解,是唯一最优解,从而保证网络的泛化性能。
Figure BDA0003104091750000112
相比于传统的训练方法,ELM避免反复迭代来求解网络权重的过程,节省了训练时间,加快了网络的收敛速度;但其输入权值和隐层偏置随机赋值降低了算法鲁棒性,当数据中含有噪声时,算法性能明显下降。
降噪自编码器由Vincent等人于2008年提出,他们认为一个好的表达应该能够捕获输入信号的稳定结构,具有一定的鲁棒性,同时对重建信号是有用的。降噪自编码器(DAE)主要目的是排除噪声的干扰,更好的重构原始数据。它通过对原始输入信号进行退化处理得到被局部破坏的信号,然后将受损害信号输入到DAE中,使其尽可能的重建出未受干扰的原始数据,具体过程如图2所示。
DAE主要学习过程主要包括退化、编码、解码三个阶段。首先对原始数据x按照一定比例退化得到含噪声数据
Figure BDA0003104091750000113
对含噪声数据
Figure BDA0003104091750000114
进行编码得到隐层输出h,对隐层输出h进行解码得到对原始数据的重构y,通过参数优化来最小化重构误差,从而获得输入数据的最优特征表示,此试DAE具备从含噪声数据中提取原始数据抽象特征的能力。
假定输入数据x∈Rn×l,对x按照设定的退化率v进行一定比例的随机置0得到
Figure BDA0003104091750000115
通过非线性激活函数g(·)对
Figure BDA0003104091750000116
进行编码:
Figure BDA0003104091750000117
其中w∈Rn×d为编码层的权重矩阵,b∈Rn为编码层的偏置,g(·)为激活函数,如sigmoid函数。
解码过程可以看作编码过程的逆变换,通过解码将h转换为原始数据的重构y,具体过程为:
y=g(wTh+b2);(9)
其中wT、b2为解码的权重和偏置。
降噪自编码器的损失函数表达式为:
Figure BDA0003104091750000121
y为原始数据x的重构数据,降噪自编码器通过反向传播算法不断调整参数,使得重构误差达到最小,来学习样本数据的原始抽象特征。单层的降噪自编码属于浅层网络,学习能力有限,而堆栈降噪自编码器通过堆栈多个DAE组成深度网络,将前一个自编码器的隐含层输出作为后一个自编码器的输入进行逐层无监督预训练,以层次结构学习深层抽象特征,在提取高维数据特征是效果要优于浅层网络。
SDAE-ELM:ELM在训练过程中对输入层与隐含层之间的权重和偏置进行随机赋值,使其鲁棒性降低,算法性能容易受噪声和数据维度的影响。而SDAE通过降噪功能,使网络能更好的学习数据中的结构特征,降低噪声的敏感性。所以将SDAE与ELM结合,用SDAE提取高层数据特征,作为ELM分类器的的输入,并用SDAE的预训练结果为ELM分类器赋值输入权重和偏置,可以提高分类器对含噪声数据的处理能力。SDAE-ELM网络结构如图3所示。
SDAE-ELM的训练过程如下:
1)特征提取部分
对每一个DAE进行无监督预训练,前一个隐含层的输出作为后一个DAE的输入进行逐层预训练,然后将其隐含层进行堆叠,构成多隐含层的SDAE模型来提取原始数据的特征。结构如图3中SDAE部分所示,h2作为原始数据的抽象特征,过滤了输入数据的部分噪声,更能代表输入数据的本质。同时,数据维度过高时可以起降维的作用,h2作为ELM的输入,可提高ELM的性能。
2)ELM参数预训练
训练DAE3,生成ELM的输入层权重和隐含层偏置。网络结构如图3中DAE3所示,将h2作为DAE3的输入进行无监督预训练,得到网络参数:隐含层输出h3,输入层权重w3,隐含层偏置b3。此时将w3、b3作为ELM输入层与隐含层之间的权重和偏置参数,这样能克服ELM参数随机生成带来的鲁棒性不足的问题,优化网络结构,提高模型稳定性。
3)分类部分
训练ELM作为分类器,其中ELM的输入为SDAE提取的特征h2,输入层权值和隐含层为DAE的输入层权值w3和隐含层偏置b3,隐含层输出为h3,根据ELM的训练方式由式(7)可求解输出层权重β,此时整个网络的参数训练完成。
综上,SDAE-ELM模型训练过程如下:
输入训练集(xi,ti),其中xi∈Rm,ti∈Rn,退化率参数v。
输出ELM权重β。
步骤1对x进行退化处理,逐层训练SDAE,得到原始数据的特征h2
步骤2h2作为输入,训练DAE3,得到网络参数w3、b3和隐含层输出h3
步骤3将h2作为ELM的输入,w3、b3作为ELM输入层权重和隐含层偏置,h3为层输出。由公式(7)求解输出层权值β为:当h3h3 T非奇异时,
Figure BDA0003104091750000131
Figure BDA0003104091750000132
非奇异时,
Figure BDA0003104091750000133
FDD-LTE系统的干扰参量主要来源于网管中心统计类测量报告MRS(MeasurementReport Statistics,)、具体流程如图4所示。
首先从后台网管中心获取统计类测量报告(MRS)文件,然后对原始数据进行初步筛选,剔除格式损坏的数据和空白数据的小区。接下来通过算法编程实现批量提取所需要的数据指标,例如eNB id、主服务小区标号、上报时间、PRB粒度上行干扰功率值(MR.RIPPRB)。如图5所示,是某小区15分钟为上报周期的PRB粒度上行干扰功率指标的原始数据,表1为计算后每个小区对应的部分PRB的上行干扰功率。通过原始数据得到每个取值区间内采样点个数,从而计算每个PRB点对应的上行干扰功率,已PRB0为例,计算公式为:
Figure BDA0003104091750000141
其中ni(i=1、2……52)为每个取值区间内的采样点数,RIPi(i=1、2……52)为每个取值区间对应的功率值。
表1部分PRB上行干扰功率统计表
Figure BDA0003104091750000142
本发明选择的数据样本为小区12小时的PRB上行干扰功率。每个小区的样本可以表示为49*25的数据矩阵,15分钟为一个上报周期,12小时共计49个上报周期,每行数据为25个RB。每个样本数据可视化如图6所示,横轴表示PRB序号,纵轴为时间,颜色深浅表示上行干扰功率值的大小,范围是从-80dBm到-120dBm。根据提取的样本数据,结合每个小区上行干扰频域波形特征图和网络优化专家的分析完成标定工作。
在将样本数据送入自编码网络之前,首先要对原始数据进行归一化处理,使得每个RB上的上行干扰功率值都归一化到[0,1]的范围内,这样有利于提高算法精度,加快梯度下降求解的速度,归一化处理如公式(12)所示:
Figure BDA0003104091750000151
本实验运行环境为Windows10系统,处理器Intel(R)Core i5-5200U,运行内存4G,编程环境python3.7。
实验数据集为某地区LTE网络PRB上行干扰功率,采集时长12h,根据保密要求数据脱敏后使用,共3495条数据,其中包括互调干扰795个,阻塞干扰900个,外部干扰900个和无干扰904个,其中随机划分70%为训练集完成栈式自编码分类模型的训练,30%为测试集用来检测模型效果。数据集分配如表2所示。
表2数据集组成分配表
Figure BDA0003104091750000152
网络超参数确定:
目前对于神经网络隐含层参数、节点数等超参数暂无明确的指导方法,普遍按照一定的规则采用试错法对网络结构进行多次实验,选择表现最优的网络模型。普遍来说,随着网络层数的增加,可获得更抽象的特征,但网络层数并非越多越好,层数太多会造成梯度弥散,同时过多的网络参数增加算法复杂度。本发明采用1225维度的LTE网路上行干扰数据进行测试,根据输入数据维度将SDAE隐含层设置为2层是较好的选择。为选择最优网络参数,SDAE-ELM采用6种模型进行测试,参数配置如表3所示,在SDAE-ELM模型中,ELM添加在SDAE的顶端作为分类器实现LTE网络上行干扰分类,根据测试结果选择最佳的参数组合。如图7所示Model5(X-600-50-300)的参数组合下SDAE-ELM模型拥有最优的分类性能,因此在SDAE-ELM模型中,将SDAE设置为2层,ELM隐含层节点设置为300,此参数组合本实验的最优网络参数。
表3SDAE-ELM模型参数组合
Figure BDA0003104091750000161
算法训练时间是评价模型性能的一个重要因素,本发明在多种参数组合下,分析对比了SDAE SDAE-ELM算法的训练时间,如表4所示,在数据集和网络参数相同的情况下,SDAE-ELM模型的训练时间少于SDAE,这是因为SDAE模型在训练过程中有无监督预训练与有监督的微调过程。而本发明用ELM分类器来替代SDAE中softmax层,通过最小二乘法求解全局最优解,无需反复迭代,减少了模型的训练时间。
表4SDAE与SDAE-ELM训练时间对比
Figure BDA0003104091750000171
LTE网络上行干扰受周围环境影响,使得数据中含有一定的噪声,这就要求模型需具备一定的去噪能力,为验证SDAE-ElM的鲁棒性,对LTE网络上行数据集加入不同比例的高斯白噪声,观察其准确率的变化。结果如图7所示。
由结果可以看出,随着加入噪声比例的增加,模型的分类性能略有下降,但变化不大,在2%以内。这表明在LTE网络上行干扰分类中,一定比例的噪声对模型分类准确率影响不大,模型有很好的鲁棒性。这主要是因为在SDAE训练过程中对模型的输入数据进行了加噪处理,使得模型具有从含噪声数据中提取原始数据抽象特征的能力。通过提取的抽象特征来优化ELM的输入权值和隐含层偏置,避免了ELM参数的随机赋值,从而增强模型的鲁棒性和稳定性。
为验证SDAE-ELM模型在LTE网络上行干扰分类中的表现,本发明将ELM、SDAE、SDAE-LEM、ELM-AE算法在LTE网络上行干扰分类中的准确率进行对比。使用某地区LTE网络上行干扰数据,并在其基础上加入一定比例的高斯白噪声,增强数据集的多样性。
表5不同算法分类准确率对比
Figure BDA0003104091750000172
由表5和图8所示,可以看出,在LTE网络上行干扰分类中,SDAE-ELM的分类准确率要高于ELM、ELM-AE算法,同时数据中加入噪声对SDAE-ELM算法影响较小。在数据集不含噪声情况下,相比ELM算法,SDAE算法准确率提高3%,在含噪声数据集中提高6.5%。原因在于SDAE能够从原始数据中提取深层抽象特征作为ELM的输入数据,同时可以为ELM产生输入权重和隐层偏执,克服ELM参数随机赋值造成模型稳定性差的问题。同时ELM-AE算法与SDAE算法结构性似,但ELM-AE仅为单层自编码器与极限学习机结合,网络深度较浅,且易受噪声影响,相比ELM-AE算法,SADE算法准确率提高2.6%。主要是因为SDAE算法在训练过程中对原始数据进行加噪处理,使得模型具备从含噪声数据中提取原始数据的能力,从而有更好的抗噪性能。
实施例二
本实施例提供了基于堆栈降噪自编码的LTE上行干扰分类系统;
基于堆栈降噪自编码的LTE上行干扰分类系统,包括:
获取模块,其被配置为:获取待分类的LTE基站上行数据;
预处理模块,其被配置为:对待分类的LTE基站上行数据进行预处理;
分类模块,其被配置为:将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
此处需要说明的是,上述获取模块、预处理模块和分类模块对应于实施例一中的步骤S101至S103,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,包括:
获取待分类的LTE基站上行数据;
对待分类的LTE基站上行数据进行预处理;
将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
2.如权利要求1所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,所述隐含层h1,其获取步骤包括:
构建第一降噪自编码模型;
所述第一降噪自编码模型,包括依次连接的:输入层c1、加噪层c2、隐含层c3和输出层c4;
构建第一训练集,所述第一训练集为无干扰类别标签的LTE基站上行数据;
将第一训练集输入到第一降噪自编码模型中,对第一降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第一降噪自编码模型,训练前的第一降噪自编码模型中的隐含层c3经过训练后已经变成隐含层c3’,将训练后的第一降噪自编码模型中的隐含层c3’作为隐含层h1。
3.如权利要求2所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,所述隐含层h2,其获取步骤包括:
构建第二降噪自编码模型;
所述第二降噪自编码模型,包括依次连接的:输入层c1、加噪层c2、隐含层c3’、隐含层d4和输出层d5;
将第一训练集输入到第二降噪自编码模型中,对第二降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第二降噪自编码模型,训练前的第一降噪自编码模型中的隐含层d4经过训练后已经变成隐含层d4’,将训练后的第一降噪自编码模型中的隐含层d4’作为隐含层h2。
4.如权利要求3所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,所述隐含层h3,其获取步骤包括:
构建第三降噪自编码模型;
所述第三降噪自编码模型,包括依次连接的:输入层e1、加噪层e2、隐含层e3和输出层e4;其中,输入层e1使用隐含层d4’来实现;
将第一训练集输入到第三降噪自编码模型中,对第三降噪自编码模型进行训练,当训练达到设定迭代次数时,停止训练,得到训练后的第三降噪自编码模型,
训练前的第三降噪自编码模型中的隐含层e3经过训练后已经变成隐含层e3’,将训练后的第三降噪自编码模型中的隐含层e3’作为隐含层h3。
5.如权利要求1所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,所述训练后的基于堆栈降噪自编码的极限学习机,其训练步骤包括:
构建第二训练集,所述第二训练集为已知干扰类别标签的LTE基站上行数据;
将第二训练集输入到基于堆栈降噪自编码的极限学习机中;当损失函数达到最小值时,或者训练迭代次数满足设定要求时,停止训练,得到训练后的基于堆栈降噪自编码的极限学习机。
6.如权利要求1所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,所述将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;具体原理包括:
隐含层h1对待分类的LET基站上行数据进行第一次特征提取,得到第一特征;
隐含层h2对第一特征进行第二次特征提取,得到第二特征;
隐含层h3对第二特征进行解码得到重构数据;
分类层对重构数据进行分类得到分类结果。
7.如权利要求1所述的基于堆栈降噪自编码的LTE上行干扰分类方法,其特征是,对待分类的LTE基站上行数据进行预处理;具体包括:
对待分类的LTE基站上行数据,删除空值数据,删除格式损坏数据;
对待分类的LET基站上行数据进行归一化处理。
8.基于堆栈降噪自编码的LTE上行干扰分类系统,其特征是,包括:
获取模块,其被配置为:获取待分类的LTE基站上行数据;
预处理模块,其被配置为:对待分类的LTE基站上行数据进行预处理;
分类模块,其被配置为:将预处理后的待分类的LET基站上行数据,输入到训练后的基于堆栈降噪自编码的极限学习机中,得到LTE基站上行数据的干扰类别;
其中,基于堆栈降噪自编码的极限学习机,包括依次连接的:输入层、隐含层h1、隐含层h2、隐含层h3、分类层和输出层。
9.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
CN202110632135.XA 2021-06-07 2021-06-07 基于堆栈降噪自编码的lte上行干扰分类方法及系统 Active CN113364540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110632135.XA CN113364540B (zh) 2021-06-07 2021-06-07 基于堆栈降噪自编码的lte上行干扰分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110632135.XA CN113364540B (zh) 2021-06-07 2021-06-07 基于堆栈降噪自编码的lte上行干扰分类方法及系统

Publications (2)

Publication Number Publication Date
CN113364540A true CN113364540A (zh) 2021-09-07
CN113364540B CN113364540B (zh) 2022-05-17

Family

ID=77532796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110632135.XA Active CN113364540B (zh) 2021-06-07 2021-06-07 基于堆栈降噪自编码的lte上行干扰分类方法及系统

Country Status (1)

Country Link
CN (1) CN113364540B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688387A (zh) * 2024-01-30 2024-03-12 东北石油大学三亚海洋油气研究院 储层分类模型的训练和分类方法、相关设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210089842A1 (en) * 2019-09-24 2021-03-25 Robert Bosch Gmbh Method and system to classify sensor data with improved training robustness
CN112633315A (zh) * 2020-10-21 2021-04-09 广东电网有限责任公司广州供电局 一种电力系统扰动分类方法
CN112734000A (zh) * 2020-11-11 2021-04-30 江西理工大学 一种入侵检测方法、系统、设备及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210089842A1 (en) * 2019-09-24 2021-03-25 Robert Bosch Gmbh Method and system to classify sensor data with improved training robustness
CN112633315A (zh) * 2020-10-21 2021-04-09 广东电网有限责任公司广州供电局 一种电力系统扰动分类方法
CN112734000A (zh) * 2020-11-11 2021-04-30 江西理工大学 一种入侵检测方法、系统、设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张卫东,路皓翔,甘博瑞,杨辉华: "基于栈式自编码融合极限学习机的药品鉴别", 《计算机工程与设计》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688387A (zh) * 2024-01-30 2024-03-12 东北石油大学三亚海洋油气研究院 储层分类模型的训练和分类方法、相关设备及存储介质

Also Published As

Publication number Publication date
CN113364540B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN110163261B (zh) 不平衡数据分类模型训练方法、装置、设备及存储介质
CN112084974B (zh) 一种基于元学习的多标签滚动轴承故障诊断方法
US11645541B2 (en) Machine learning model interpretation
CN109033719B (zh) 一种风力涡轮机轴承故障诊断方法
CN108985365B (zh) 基于深度子空间切换集成学习的多源异构数据融合方法
CN105678343B (zh) 基于自适应加权组稀疏表达的水电机组噪声异常诊断方法
CN110349597B (zh) 一种语音检测方法及装置
CN110289081B (zh) 深度网络堆栈模型自适应加权特征融合的癫痫检测方法
CN109948726B (zh) 一种基于深度森林的电能质量扰动分类方法
CN110726898B (zh) 一种配电网故障类型识别方法
CN104091602A (zh) 一种基于模糊支持向量机的语音情感识别方法
CN112418175A (zh) 基于域迁移的滚动轴承故障诊断方法、系统及存储介质
CN113364540B (zh) 基于堆栈降噪自编码的lte上行干扰分类方法及系统
CN114818806A (zh) 一种基于小波包与深度自编码器的变速箱故障诊断方法
CN113705396A (zh) 一种电机故障诊断方法、系统及设备
CN111291918B (zh) 平稳子空间外源矢量自回归的旋转机械退化趋势预测方法
Braun et al. Parameter uncertainty for end-to-end speech recognition
Murphy et al. Residual learning for marine mammal classification
CN113343801B (zh) 基于轻量化卷积神经网络的无线信号自动调制识别方法
CN105303051A (zh) 一种空气污染物浓度预测方法
CN117952646A (zh) 一种基于小波包分解的tcn-lstm组合电价预测方法
CN114331214A (zh) 基于强化学习的域自适应轴承声纹故障诊断方法及系统
CN113299298A (zh) 残差单元及网络及目标识别方法及系统及装置及介质
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质
CN116055270B (zh) 一种调制识别模型及其训练方法、信号调制处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant