CN112202625B - 网元异常诊断方法、装置、计算设备及计算机存储介质 - Google Patents

网元异常诊断方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN112202625B
CN112202625B CN201910609419.XA CN201910609419A CN112202625B CN 112202625 B CN112202625 B CN 112202625B CN 201910609419 A CN201910609419 A CN 201910609419A CN 112202625 B CN112202625 B CN 112202625B
Authority
CN
China
Prior art keywords
test data
network element
data
reconstruction
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910609419.XA
Other languages
English (en)
Other versions
CN112202625A (zh
Inventor
邢彪
郑屹峰
张卷卷
凌啼
章淑敏
李海良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910609419.XA priority Critical patent/CN112202625B/zh
Publication of CN112202625A publication Critical patent/CN112202625A/zh
Application granted granted Critical
Publication of CN112202625B publication Critical patent/CN112202625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例涉及通信技术领域,公开了一种所述网元异常诊断方法、装置、计算设备及计算机存储介质,该方法包括:获取所述网元的每一种错误码的产生次数,得到测试数据;将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数;计算所述重建测试数据与所述测试数据之间的重建误差;当所述重建误差大于预设阈值时,确定所述网元异常。通过上述方式,本发明实施例实现了网元的异常诊断。

Description

网元异常诊断方法、装置、计算设备及计算机存储介质
技术领域
本发明实施例涉及通信技术领域,具体涉及一种网元异常诊断方法、装置、计算设备及计算机存储介质。
背景技术
随着移动通信技术的进步,数据业务发展迅速,移动通信网络的结构越来越复杂,移动通信网络中的网元数量也在不断增加,这对通信网络的维护工作提出了更高的要求。
通信网络的维护工作的重点工作之一是网元故障诊断,在实现本发明实施例的过程中,发明人发现:现有的网元故障诊断方法主要通过对错误码产生次数直接设置阈值,由于阈值的设置主要依靠专家经验,所以这种方法对于网元的误诊概率较高。
发明内容
鉴于上述问题,本发明实施例提供了一种网元异常诊断方法、装置、计算设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种网元异常诊断方法,所述方法包括:获取所述网元的每一种错误码的产生次数,得到测试数据;将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数;计算所述重建测试数据与所述测试数据之间的重建误差;当所述重建误差大于预设阈值时,确定所述网元异常。
在一种可选的方式中,计算重建测试数据与测试数据之间的重建误差,包括:根据公式计算所述重建测试数据与所述测试数据之间的重建误差,其中,xi表示测试数据中第i个错误码的产生次数,/>表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
在一种可选的方式中,在获取所述网元的每一种错误码产生次数,得到测试数据之后,所述方法还包括:对所述测试数据进行归一化处理,得到标准测试数据;将所述测试数据输入重建模型中,得到重建测试数据,包括:将所述标准测试数据输入到重建模型中,得到重建测试数据。
在一种可选的方式中,在获取网元的每一种错误码的产生次数,得到测试数据之前,所述方法还包括:获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集;根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识;将所述总数据集按照预设比例划分为训练数据集和测试数据集;将所述训练数据集中网元运行状态标识为正常状态的数据作为所述多组训练数据。
在一种可选的方式中,在将所述训练数据集中网元运行状态标识为正常状态的数据作为所述多组测试数据之后,所述方法还包括:构建自编码神经网络模型;根据测试数据集对自编码神经网络模型进行训练,得到重建模型;根据所述多组测试数据对所述重建模型进行验证;当验证不通过时,重新对所述自编码神经网络模型进行训练。
在一种可选的方式中,所述构建自编码神经网络模型包括:构建包含一个输入层、一个输出层及八个隐藏层的自编码神经网络模型,其中,所述八个隐藏层包含四个编码器层和四个解码器层,所述四个编码器层用于对训练数据压缩降维,得到特征数据;所述四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。
在一种可选的方式中,根据所述多组训练数据对所述自编码神经网络模型进行训练,得到重建模型,包括:根据所述多组训练数据得到所述自编码神经网络模型的权重;根据所述权重计算损失函数值;根据优化算法重复更新所述权重,直至所述损失函数值最小;根据所述损失函数值最小的权重,得到重建模型。
根据本发明实施例的另一方面,提供了一种网元异常诊断装置,包括:获取模块、输入模块、计算模块和确定模块,其中,获取模块用于获取所述网元的每一种错误码的产生次数,得到测试数据;输入模块,用于将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数。计算模块,用于计算所述重建测试数据与所述测试数据之间的重建误差。确定模块,用于当所述重建误差大于预设阈值时,确定所述网元异常。
在一种可选的方式中,计算模块进一步用于:根据公式计算所述重建测试数据与所述测试数据之间的重建误差,其中,xi表示测试数据中第i个错误码的产生次数,/>表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
在一种可选的方式中,所述装置还包括归一化模块,用于对所述测试数据进行归一化处理,得到标准测试数据。输入模块进一步用于,将所述标准测试数据输入到重建模型中,得到重建测试数据。
在一种可选的方式中,所述装置还包括:第一获取模块、标记模块、划分模块和第一确定模块,其中,第一获取模块用于获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集。标记模块用于根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识。划分模块用于将所述总数据集按照预设比例划分为训练数据集和测试数据集。第一确定模块用于将所述训练数据集中网元运行状态标识为正常状态的数据作为多组训练数据。
在一种可选的方式中,所述装置还包括:构建模块、训练模块和验证模块,构建模块用于构建自编码神经网络模型。训练模块用于根据多组训练数据对自编码神经网络模型进行训练,得到重建模型。验证模块用于根据所述多组测试数据对所述重建模型进行验证。训练模块进一步用于,当验证模块验证不通过时,重新对所述自编码神经网络模型进行训练。
在一种可选的方式中,构建模块进一步用于:构建包含一个输入层、一个输出层及八个隐藏层的自编码神经网络模型,其中,所述八个隐藏层包含四个编码器层和四个解码器层,所述四个编码器层用于对训练数据压缩降维,得到特征数据;所述四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。
在一种可选的方式中,训练模块进一步用于,根据所述多组训练数据得到所述自编码神经网络模型的权重;根据所述权重计算损失函数值;根据优化算法重复更新所述权重,直至所述损失函数值最小;根据所述损失函数值最小的权重,得到重建模型。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种网元异常诊断方法对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述的一种网元异常诊断方法对应的操作。
本发明实施例通过重建测试数据与测试数据之间的重建误差对网元进行异常诊断,重建测试数据是根据重建模型得到的,重建模型是通过多组包含网元正常状态下的错误码产生次数训练得到的,对于网元正常状态下的测试数据,重建测试数据与测试数据之间的重建误差很小,对于网元异常状态下的测试数据,重建测试数据与测试数据之间的重建误差大,根据网元正常状态下的重建误差设置阈值,从而可以对网元异常进行有效诊断。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网元异常诊断方法的流程图;
图2示出了本发明实施例提供的一种网元异常诊断方法中S-CSCF在IMS核心网中所处的位置示意图;
图3示出了本发明实施例提供的一种网元异常诊断方法中自编码神经网络的结构示意图;
图4示出了本发明实施例提供的一种网元异常诊断装置的功能框图;
图5示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明一种网元异常诊断方法实施例的流程图,如图1所示,该方法包括以下步骤:
步骤110:获取网元的每一种错误码的产生次数,得到测试数据。
本发明实施例的应用场景是根据网元的错误码对网元进行异常诊断,该网元可以是任意可以在网元运行中通过错误码发现网元异常的网元,例如S-CSCF网元,S-CSCF(Serving-Call Session Control Function,服务呼叫会话控制功能)网元是IMS(IPMultimedia Subsystem,IP多媒体子系统)的核心网元,用于提供注册服务、会话控制、维持业务需要的会话状态、产生计费信息等。S-CSCF的可靠性对IMS的可靠性起着决定性作用。S-CSCF在IMS核心网中所处的位置如图2所示,主叫侧及被叫侧均包含的主要网元有P-CSCF、I-CSCF和S-CSCF,主叫侧及被叫侧的归属签约用户服务器均为HSS(Home SubscriberServer),用于对主叫侧和被叫侧的设备进行鉴权,在鉴权成功后从HSS下载用户的业务签约数据,并根据iFC进行第三方鉴权。主叫侧的主叫设备通过S-CSCF网元对被叫侧的被叫设备进行呼叫会话控制。下面以S-CSCF网元的异常诊断为例对本发明实施例做进一步的说明。
IMS的主要呼叫协议是SIP(Session Initiation Protocol,会话初始协议),该协议的消息类型包括请求消息和响应消息,响应消息的状态码可用于表示请求是否成功,失败的请求对应的状态码为错误码,响应消息的状态码可以分为以下六种:1XX(临时响应)、2XX(成功)、3XX(重定向)、4XX(客户端错误)、5XX(服务器故障)、6XX(全局失败),每一种状态码有若干种具体表现形式,对于S-CSCF网元来说,用于表示S-CSCF网元异常的错误码的次数主要有以下几种:S-CSCF_IMS注册失败500服务内部错误次数、S-CSCF_IMS注册失败503服务不可用次数、S-CSCF_IMS注册失败504服务超时次数、S-CSCF主叫404未找到次数、S-CSCF主叫408请求超时次数、S-CSCF主叫480久叫不应次数、S-CSCF主叫484Request-URI不完整次数、S-CSCF主叫487请求终止次数、S-CSCF主叫500服务内部错误次数、S-CSCF主叫503服务不可用次数、S-CSCF被叫403请求禁止次数、S-CSCF被叫404未找到次数、S-CSCF被叫408请求超时次数、S-CSCF被叫480久叫不应次数、S-CSCF被叫484Request-URI不完整次数、S-CSCF被叫487请求终止次数、S-CSCF被叫500服务内部错误次数、S-CSCF被叫503服务不可用次数。将上述用于表示S-CSCF网元异常的错误码产生次数作为测试数据。
步骤120:将测试数据输入重建模型中,得到重建测试数据。
其中,重建模型是通过多组训练数据训练得到的,多组训练数据中的每一组均包含网元正常状态下的每一种错误码的产生次数。在确定多组训练数据时,首先获取每一预设时间窗口内,网元的每一种错误码的历史产生次数,得到总数据集;根据网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识;将总数据集按照预设比例划分为训练数据集和测试数据集;将训练数据集中网元运行状态标识为正常状态的数据作为所述多组训练数据。网元运行状态标识用于表示网元运行状态正常或网元运行状态异常。在对总数据集中的每一组数据进行标记时,标记的方式可以由本领域技术人员人为定义,例如,对于网元正常状态下的一组训练数据标注为0,对于网元异常状态下的一组训练数据标注为1,便于选取网元正常状态下的训练数据作为训练重建模型的训练数据。
在一些实施例中,在将测试数据输入重建模型中之前,对测试数据进行归一化处理,得到标准测试数据,将得到的标准测试数据输入到重建模型中,得到重建测试数据。归一化是将测试数据按照比例进行缩放,使之落入一个特定的区间,以消除不同种类的测试数据之间的数量级差异。在具体实施方式中,该特定的区间一般为[0,1],在一种具体的实施方式中,标准测试数据按照以下公式得到:
Xstd=Xsca×(Xmax-Xmin)+Xmin
可以理解的是,在训练重建模型的过程中,也通过归一化将训练数据集及测试数据集中的数据进行归一化,并将归一化后的训练数据作为训练重建模型的训练数据。
在一些实施方式中,通过构建自编码神经网络模型,通过多组训练数据对自编码神经网络进行训练,得到重建模型;根据测试数据集对重建模型进行验证;当验证不通过时,重新对自编码神经网络模型进行训练。自编码神经网络通过将输入数据进行压缩,然后再解压重建,对比重建数据和输入数据之间的误差,进行反向传递,来提升自编码神经网络的准确性。构建的自编码神经网络模型的框架可以由本领域的技术人员在实施本发明实施例时进行设计,本发明实施例并不以此为限。
在一种具体的实施方式中,构建的自编码神经网络模型包含一个输入层、一个输出层及八个隐藏层,其中,八个隐藏层包含四个编码器层和四个解码器层,四个编码器层用于对训练数据压缩降维,得到特征数据;四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。构建的自编码神经网络的具体结构示意图如图3所示,其中,输入层设置的神经元个数为18个,x1至x18分别对应于输入的18种类型的S-CSCF网元异常的错误码的次数,输出层设置的神经元个数为18个,至/>对应于通过自编码神经网络模型得到的重建的18种类型的S-CSCF网元异常的错误码的次数。四层编码器在对训练数据压缩降维时,将原本的18维数据降至2维。隐藏层第一层对应于第一个编码器,设置的神经元个数为18个,激活函数选择为“tanh”函数,第二层隐藏层对应于第二个编码器,设置的神经元个数为9个,选择的激活函数为“relu”函数,第三层隐藏层对应于第三个编码器,设置的神经元个数为4个,选择的激活函数为“relu”函数,第四层隐藏层对应于第四个编码器,设置的神经元个数为2个,选择的激活函数为“relu”函数。四个解码器与四个编码器相对应,第一个解码器对应的神经元个数为2个,选择的激活函数为“tanh”函数,第二个解码器对应的神经元个数为4个,选择的激活函数为“tanh”函数,第三个解码器对应的神经元个数为9个,选择的激活函数为“tanh”函数,第四个解码器对应的神经元个数为18个,选择的激活函数为“relu”函数。
自编码神经网络训练的过程如下:根据多组训练数据得到自编码神经网络模型的权重;根据该权重计算损失函数值;根据优化算法重复更新权重,直至损失函数值最小;根据损失函数值最小的权重,得到重建模型。损失函数可以由本领域的技术人员在实施本发明实施例的过程中选取,本发明实施例并不限定损失函数的具体形式。在一种具体的实施方式中,损失函数为均方误差损失函数MSE(Mean Squared Error),选择Adam算法重复更新权重,直至损失函数最小。在具体实施过程中,将训练回合数设置为2000,即epochs=2000,批处理大小设置为32,即batch_size=32,随着训练回合数的增加,损失函数值逐渐下降,模型逐渐收敛,训练完成,将训练得到的权重导出,即得到重建模型。
在对重建模型进行验证时,通过预先设置准确率确定验证是否通过,当验证通过时,表示重建模型训练完成,不需要重新训练,如果准确率低于预先设置准确率,则需要重新对自编码神经网络模型进行训练。
步骤130:计算重建测试数据与测试数据之间的重建误差。
重建测试数据是由重建模型得到的,而重建模型是根据网元正常状态下的错误码产生次数训练得到的,因此,对于网元正常状态下的测试数据,重建误差很小,对于网元异常状态下的测试数据,重建误差很大,根据重建误差的大小可以判断网元是否异常。
在一些具体的实施方式中,重建误差为重建测试数据与测试数据差值的绝对值的平方,重建误差的具体计算公式为:
其中,xi表示测试数据中第i个错误码的产生次数,表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
步骤140:当重建误差大于预设阈值时,确定网元异常。
在本步骤中,预设阈值是根据重建误差进行设定的,例如,在使用测试数据进行测试重建模型时,对于正常状态网元的重建误差最大值为a,网元异常状态的重建误差均大于a,则预设阈值设置为a。当重建误差大于预设阈值时,说明网元异常,当重建误差不大于预设阈值时,说明网元正常。
本发明实施例通过重建测试数据与测试数据之间的重建误差对网元进行异常诊断,重建测试数据是根据重建模型得到的,重建模型是通过多组包含网元正常状态下的错误码产生次数训练得到的,对于网元正常状态下的测试数据,重建测试数据与测试数据之间的重建误差很小,对于网元异常状态下的测试数据,重建测试数据与测试数据之间的重建误差大,根据网元正常状态下的重建误差设置阈值,从而可以对网元异常进行有效诊断。
图4示出了本发明一种网元异常诊断装置实施例的功能框图。如图4所示,该装置包括:获取模块310、输入模块320、计算模块330和确定模块340,其中,获取模块310用于获取网元的每一种错误码的产生次数,得到测试数据。输入模块320用于将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数。计算模块330,用于计算所述重建测试数据与所述测试数据之间的重建误差。确定模块340,用于当所述重建误差大于预设阈值时,确定所述网元异常。
在一种可选的方式中,计算模块330进一步用于:根据公式计算所述重建测试数据与所述测试数据之间的重建误差,其中,xi表示测试数据中第i个错误码的产生次数,/>表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
在一种可选的方式中,所述装置还包括归一化模块350,用于对所述测试数据进行归一化处理,得到标准测试数据。输入模块320进一步用于,将所述标准测试数据输入到重建模型中,得到重建测试数据。
在一种可选的方式中,所述装置还包括:第一获取模块360、标记模块370、划分模块380和第一确定模块390,其中,第一获取模块360用于获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集。标记模块370用于根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识。划分模块380用于将所述总数据集按照预设比例划分为训练数据集和测试数据集。第一确定模块390用于将所述训练数据集中网元运行状态标识为正常状态的数据作为多组训练数据。
在一种可选的方式中,所述装置还包括:构建模块300、训练模块301和验证模块302,构建模块300用于构建自编码神经网络模型。训练模块301用于根据多组训练数据对自编码神经网络模型进行训练,得到重建模型。验证模块302用于根据所述多组测试数据对所述重建模型进行验证。训练模块301进一步用于,当验证模块验证不通过时,重新对所述自编码神经网络模型进行训练。
在一种可选的方式中,构建模块300进一步用于:构建包含一个输入层、一个输出层及八个隐藏层的自编码神经网络模型,其中,所述八个隐藏层包含四个编码器层和四个解码器层,所述四个编码器层用于对训练数据压缩降维,得到特征数据;所述四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。
在一种可选的方式中,训练模块301进一步用于,根据所述多组训练数据得到所述自编码神经网络模型的权重;根据所述权重计算损失函数值;根据优化算法重复更新所述权重,直至所述损失函数值最小;根据所述损失函数值最小的权重,得到重建模型。
本发明实施例通过计算模块330根据重建测试数据与测试数据之间的重建误差对网元进行异常诊断,重建测试数据是根据重建模型得到的,重建模型是通过多组包含网元正常状态下的错误码产生次数训练得到的,对于网元正常状态下的测试数据,重建测试数据与测试数据之间的重建误差很小,对于网元异常状态下的测试数据,重建测试数据与测试数据之间的重建误差大,根据网元正常状态下的重建误差设置阈值,从而可以对网元异常进行有效诊断。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述一种网元异常诊断方法对应的操作。
本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述一种网元异常诊断方法对应的操作。
图5示出了本发明一种计算设备实施例的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于网元异常诊断方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行以下操作:
获取所述网元的每一种错误码的产生次数,得到测试数据;将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数;计算所述重建测试数据与所述测试数据之间的重建误差;当所述重建误差大于预设阈值时,确定所述网元异常。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:根据公式计算所述重建测试数据与所述测试数据之间的重建误差,其中,xi表示测试数据中第i个错误码的产生次数,/>表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:对所述测试数据进行归一化处理,得到标准测试数据;将所述测试数据输入重建模型中,得到重建测试数据,包括:将所述标准测试数据输入到重建模型中,得到重建测试数据。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集;根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识;将所述总数据集按照预设比例划分为训练数据集和测试数据集;将所述训练数据集中网元运行状态标识为正常状态的数据作为所述多组训练数据。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:构建自编码神经网络模型;根据测试数据集对自编码神经网络模型进行训练,得到重建模型;根据所述多组测试数据对所述重建模型进行验证;当验证不通过时,重新对所述自编码神经网络模型进行训练。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:构建包含一个输入层、一个输出层及八个隐藏层的自编码神经网络模型,其中,所述八个隐藏层包含四个编码器层和四个解码器层,所述四个编码器层用于对训练数据压缩降维,得到特征数据;所述四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。
在一种可选的方式中,程序410具体可以用于使得处理器402执行以下操作:根据所述多组训练数据得到所述自编码神经网络模型的权重;根据所述权重计算损失函数值;根据优化算法重复更新所述权重,直至所述损失函数值最小;根据所述损失函数值最小的权重,得到重建模型。
本发明实施例通过重建测试数据与测试数据之间的重建误差对网元进行异常诊断,重建测试数据是根据重建模型得到的,重建模型是通过多组包含网元正常状态下的错误码产生次数训练得到的,对于网元正常状态下的测试数据,重建测试数据与测试数据之间的重建误差很小,对于网元异常状态下的测试数据,重建测试数据与测试数据之间的重建误差大,根据网元正常状态下的重建误差设置阈值,从而可以对网元异常进行有效诊断。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (9)

1.一种网元异常诊断方法,其特征在于,所述方法包括:
获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集;
根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识;
将所述总数据集按照预设比例划分为训练数据集和测试数据集;
将所述训练数据集中网元运行状态标识为正常状态的数据作为所述多组训练数据;
获取所述网元的每一种错误码的产生次数,得到测试数据;
将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数;
计算所述重建测试数据与所述测试数据之间的重建误差;
当所述重建误差大于预设阈值时,确定所述网元异常。
2.根据权利要求1所述的方法,其特征在于,计算所述重建测试数据与所述测试数据之间的重建误差,包括:
根据公式计算所述重建测试数据与所述测试数据之间的重建误差,其中,xi表示测试数据中第i个错误码的产生次数,/>表示重建后的测试数据中第i个错误码的产生次数,n表示错误码的总个数。
3.根据权利要求1所述的方法,其特征在于,在获取所述网元的每一种错误码的产生次数,得到测试数据之后,所述方法还包括:
对所述测试数据进行归一化处理,得到标准测试数据;
将所述测试数据输入重建模型中,得到重建测试数据,包括:
将所述标准测试数据输入到重建模型中,得到重建测试数据。
4.根据权利要求1所述的方法,其特征在于,在将所述训练数据集中网元运行状态标识为正常状态的数据作为所述多组训练数据之后,所述方法还包括:
构建自编码神经网络模型;
根据所述多组训练数据对所述自编码神经网络模型进行训练,得到重建模型;
根据所述测试数据集对所述重建模型进行验证;
当验证不通过时,重新对所述自编码神经网络模型进行训练。
5.根据权利要求4所述的方法,其特征在于,所述构建自编码神经网络模型包括:
构建包含一个输入层、一个输出层及八个隐藏层的自编码神经网络模型,其中,所述八个隐藏层包含四个编码器层和四个解码器层,所述四个编码器层用于对训练数据压缩降维,得到特征数据;所述四个解码器层用于对所述特征数据进行还原重建,得到重建训练数据。
6.根据权利要求4所述的方法,其特征在于,所述根据所述多组训练数据对所述自编码神经网络模型进行训练,得到重建模型,包括:
根据所述多组训练数据得到所述自编码神经网络模型的权重;
根据所述权重计算损失函数值;
根据优化算法重复更新所述权重,直至所述损失函数值最小;
根据所述损失函数值最小的权重,得到重建模型。
7.一种网元异常诊断装置,其特征在于,所述装置包括:
第一获取模块,用于获取每一预设时间窗口内,所述网元的每一种错误码的历史产生次数,得到总数据集;
标记模块,用于根据所述网元的运行状态对所述总数据集中的每一组数据进行标记,得到每一组数据对应的网元运行状态标识;
划分模块,用于将所述总数据集按照预设比例划分为训练数据集和测试数据集;
第一确定模块,用于将所述训练数据集中网元运行状态标识为正常状态的数据作为多组训练数据;
获取模块,用于获取所述网元的每一种错误码的产生次数,得到测试数据;
输入模块,用于将所述测试数据输入重建模型中,得到重建测试数据,所述重建模型是通过多组训练数据训练得到的,所述多组训练数据中的每一组均包含所述网元正常状态下的每一种错误码的产生次数;
计算模块,用于计算所述重建测试数据与所述测试数据之间的重建误差;
确定模块,用于当所述重建误差大于预设阈值时,确定所述网元异常。
8.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-6任一项所述的一种网元异常诊断方法对应的操作。
9.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-6任一项所述的一种网元异常诊断方法对应的操作。
CN201910609419.XA 2019-07-08 2019-07-08 网元异常诊断方法、装置、计算设备及计算机存储介质 Active CN112202625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910609419.XA CN112202625B (zh) 2019-07-08 2019-07-08 网元异常诊断方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910609419.XA CN112202625B (zh) 2019-07-08 2019-07-08 网元异常诊断方法、装置、计算设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN112202625A CN112202625A (zh) 2021-01-08
CN112202625B true CN112202625B (zh) 2023-08-15

Family

ID=74004602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910609419.XA Active CN112202625B (zh) 2019-07-08 2019-07-08 网元异常诊断方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112202625B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086876B (zh) * 2018-09-21 2022-07-22 广州发展集团股份有限公司 设备的运行状态检测方法、装置、计算机设备和存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103404066A (zh) * 2011-04-22 2013-11-20 三菱电机株式会社 使用多条通信路径的通信装置
CN104008420A (zh) * 2014-05-26 2014-08-27 中国科学院信息工程研究所 一种基于自动编码机的分布式离群点检测方法及系统
CN105550113A (zh) * 2015-12-18 2016-05-04 网易(杭州)网络有限公司 Web测试方法与测试机
CN105790968A (zh) * 2014-12-18 2016-07-20 中国移动通信集团黑龙江有限公司 一种评估监测互联网业务异常变化情况的方法及装置
CN106357458A (zh) * 2016-10-31 2017-01-25 中国联合网络通信集团有限公司 网元异常检测方法及装置
CN106708669A (zh) * 2015-11-13 2017-05-24 中兴通讯股份有限公司 设备测试方法、装置及系统
CN107154880A (zh) * 2016-03-03 2017-09-12 阿里巴巴集团控股有限公司 系统监控方法及装置
CN108287782A (zh) * 2017-06-05 2018-07-17 中兴通讯股份有限公司 一种多维数据异常检测方法及装置
CN109101986A (zh) * 2018-06-07 2018-12-28 国网山东省电力公司青岛供电公司 基于栈式降噪自编码器的输变电设备状态异常检测方法和系统
CN109145595A (zh) * 2018-07-31 2019-01-04 顺丰科技有限公司 一种用户异常行为检测系统、方法、设备及存储介质
CN109188502A (zh) * 2018-07-05 2019-01-11 中国科学技术大学 一种基于自编码器的束流位置监测器异常检测方法及装置
CN109347485A (zh) * 2018-09-29 2019-02-15 山东存储之翼电子科技有限公司 构造ldpc码校验矩阵的方法及ldpc码编译方法
CN109615019A (zh) * 2018-12-25 2019-04-12 吉林大学 基于时空自动编码器的异常行为检测方法
CN109741292A (zh) * 2017-10-27 2019-05-10 罗伯特·博世有限公司 用对抗自编码器检测第一图像数据集当中异常图像的方法
CN113807396A (zh) * 2021-08-12 2021-12-17 华南理工大学 一种物联网高维数据异常检测方法、系统、装置及介质
CN114584153A (zh) * 2022-03-08 2022-06-03 中国矿业大学 一种极化码的比特翻转译码方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101882681B1 (ko) * 2011-10-27 2018-07-31 삼성전자 주식회사 메모리 장치 및 그 구동 방법
EP3493120A1 (en) * 2017-12-01 2019-06-05 Koninklijke Philips N.V. Training a neural network model

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103404066A (zh) * 2011-04-22 2013-11-20 三菱电机株式会社 使用多条通信路径的通信装置
CN104008420A (zh) * 2014-05-26 2014-08-27 中国科学院信息工程研究所 一种基于自动编码机的分布式离群点检测方法及系统
CN105790968A (zh) * 2014-12-18 2016-07-20 中国移动通信集团黑龙江有限公司 一种评估监测互联网业务异常变化情况的方法及装置
CN106708669A (zh) * 2015-11-13 2017-05-24 中兴通讯股份有限公司 设备测试方法、装置及系统
CN105550113A (zh) * 2015-12-18 2016-05-04 网易(杭州)网络有限公司 Web测试方法与测试机
CN107154880A (zh) * 2016-03-03 2017-09-12 阿里巴巴集团控股有限公司 系统监控方法及装置
CN106357458A (zh) * 2016-10-31 2017-01-25 中国联合网络通信集团有限公司 网元异常检测方法及装置
CN108287782A (zh) * 2017-06-05 2018-07-17 中兴通讯股份有限公司 一种多维数据异常检测方法及装置
CN109741292A (zh) * 2017-10-27 2019-05-10 罗伯特·博世有限公司 用对抗自编码器检测第一图像数据集当中异常图像的方法
CN109101986A (zh) * 2018-06-07 2018-12-28 国网山东省电力公司青岛供电公司 基于栈式降噪自编码器的输变电设备状态异常检测方法和系统
CN109188502A (zh) * 2018-07-05 2019-01-11 中国科学技术大学 一种基于自编码器的束流位置监测器异常检测方法及装置
CN109145595A (zh) * 2018-07-31 2019-01-04 顺丰科技有限公司 一种用户异常行为检测系统、方法、设备及存储介质
CN109347485A (zh) * 2018-09-29 2019-02-15 山东存储之翼电子科技有限公司 构造ldpc码校验矩阵的方法及ldpc码编译方法
CN109615019A (zh) * 2018-12-25 2019-04-12 吉林大学 基于时空自动编码器的异常行为检测方法
CN113807396A (zh) * 2021-08-12 2021-12-17 华南理工大学 一种物联网高维数据异常检测方法、系统、装置及介质
CN114584153A (zh) * 2022-03-08 2022-06-03 中国矿业大学 一种极化码的比特翻转译码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于性能改善深度置信网络的风电机组主轴承状态分析;赵洪山;刘辉海;;电力自动化设备(第02期);全文 *

Also Published As

Publication number Publication date
CN112202625A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
CN109163913B (zh) 一种汽车故障诊断方法及相关设备
KR101331935B1 (ko) 추적점 기반의 고장 진단/복구 시스템 및 그 방법
CN111325159B (zh) 故障诊断方法、装置、计算机设备和存储介质
CN112527838B (zh) 基于规则引擎的业务决策方法、装置、设备及存储介质
CN112202625B (zh) 网元异常诊断方法、装置、计算设备及计算机存储介质
CN112433896A (zh) 一种服务器磁盘故障预测方法、装置、设备及存储介质
CN112685207A (zh) 错误评估的方法、设备和计算机程序产品
CN113392893A (zh) 业务故障的定位方法、装置、存储介质及计算机程序产品
CN111400162B (zh) 一种测试方法及测试系统
US20090161559A1 (en) Error identification in a computer-based network
CN112154415A (zh) 大型计算机系统中的高效事件管理
CN108600007B (zh) 一种云平台责任追溯方法和系统
CN110543462A (zh) 微服务可靠性预测方法、预测装置、电子设备及存储介质
CN108415819B (zh) 一种硬盘故障追踪方法和装置
CN116991615A (zh) 一种基于在线学习的云原生系统故障自愈方法及装置
CN115085867B (zh) 一种can总线报文的e2e校验方法及装置
CN113825161B (zh) 基于深度自编码神经网络的5g切片异常检测方法及装置
CN112203311A (zh) 网元异常诊断方法、装置、设备及计算机存储介质
CN114840422A (zh) 测试方法、装置、电子设备及存储介质
CN115408182A (zh) 业务系统故障定位方法及装置
EP4364043A1 (en) Method and apparatus for detecting and explaining anomalies
CN112203272B (zh) Hss用户搬迁的异常诊断方法、装置及计算设备
CN112463444A (zh) 一种数据不一致修复方法及相关装置
Elhadef A modified Hopfield neural network for diagnosing comparison-based multiprocessor systems using partial syndromes
Bittel et al. Data Center Silent Data Errors: Implications to Artificial Intelligence Workloads & Mitigations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant