CN113890820A - 一种数据中心网络故障节点诊断方法及系统 - Google Patents

一种数据中心网络故障节点诊断方法及系统 Download PDF

Info

Publication number
CN113890820A
CN113890820A CN202111148361.7A CN202111148361A CN113890820A CN 113890820 A CN113890820 A CN 113890820A CN 202111148361 A CN202111148361 A CN 202111148361A CN 113890820 A CN113890820 A CN 113890820A
Authority
CN
China
Prior art keywords
node
fault
nodes
suspected
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202111148361.7A
Other languages
English (en)
Inventor
王小平
马名磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202111148361.7A priority Critical patent/CN113890820A/zh
Publication of CN113890820A publication Critical patent/CN113890820A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种数据中心网络故障节点诊断方法及系统,涉及监督监控技术领域;本发明设置了数据采集模块,该设置通过动态生成树选取测试节点,并获取测试节点与待检测节点之间的时间差值,避免选择故障节点作为测试节点,有助于提高故障节点的检测精度;本发明设置了初步判定模块,该设置根据时间差值对待检测节点进行初步分析,并生成正常节点集、故障节点集和嫌疑节点集,提高了故障节点的检测效率,为分类检测模块的分类奠定基础;本发明设置了分类检测模块,该设置根据分类模型对嫌疑节点进行分类,并对正常节点集和故障节点集进行更新,有助于提高网络节点的故障判断精度和判断效率。

Description

一种数据中心网络故障节点诊断方法及系统
技术领域
本发明属于监督监控技术领域,具体是一种数据中心网络故障节点诊断方法及系统。
背景技术
随着大数据时代的到来,云计算需求的不断增加使得数据中心网络规模不断扩大。如今,数据中心网络包含数十万台通过网络接口卡、交换机、路由器、电缆和光线连接的服务器,这些服务器大部分是分布式的并且具有高流量的特点。在大型系统中,检测和定位故障对于网络管理系统通过故障恢复机制恢复网络通信非常重要。
公开号为CN108933694A的发明专利公开了一种基于拨测数据的数据中心网络故障节点诊断方法及系统,依据现有的故障探测信息生成动态广度优先生成树作为节点间的探测路径;基于给定的先验概率P分析拨测数据来初步确定网络成员的故障概率;通过分析概率分配函数选择一个合理的阈值来识别故障节点,将可疑节点集分类为故障节点集和正常节点集。
上述方案在检测数量和诊断精度方面具有较好的性能,在不同规模的网络拓扑结构中都能在较低的探测次数下识别网络中的故障节点;但是,上述方案过程繁琐,且数据处理过程负载,鲁棒性不足;因此,上述方案仍需进一步改进。
发明内容
为了解决上述方案存在的问题,本发明提供了一种数据中心网络故障节点诊断方法及系统。
本发明的目的可以通过以下技术方案实现:一种数据中心网络故障节点诊断系统,包括处理器、数据采集模块、初步判定模块、分类检测模块、攻击监测模块、预警维护模块和数据存储模块;
所述初步判定模块用于对网络节点的故障进行初步分析,包括:
当初步判定模块接收到时间差值Sij之后,通过公式
Figure BDA0003286274820000021
获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;
将正常节点进行整合生成正常节点集,将故障节点整合生成故障节点集,将嫌疑节点整合生成嫌疑节点集;通过处理器将正常节点集、故障节点集和嫌疑节点集发送至数据存储模块进行存储,同时,将嫌疑节点集发送至分类检测模块;
所述分类检测模块用于对嫌疑节点进行深度分析,包括:
当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;
获取嫌疑节点的时间矩阵;
将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签;所述嫌疑标签为嫌疑节点对应的节点标签;
当嫌疑标签为1时,则判定嫌疑节点为正常节点;当嫌疑标签为0时,则判定嫌疑节点为故障节点;
对正常节点集和故障节点集进行更新;
获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;所述第三方地图平台包括百度地图、腾讯地图和高德地图;
通过处理器将目标位置示意图发送至预警维护模块,同时将目标位置示意图、正常节点集和故障节点集发送至数据存储模块进行存储。
优选的,所述分类模型的具体获取步骤包括:
获取正常节点的时间矩阵,获取故障节点的时间矩阵;所述时间矩阵包括时间差值Sij和时间差值Sij对应的待检测节点i和测试节点j之间的节点总数;
为正常节点和故障节点设置节点标签;其中正常节点的节点标签为1,故障节点的节点标签为0;
按照设定比例将正常节点的时间矩阵、故障节点的时间矩阵以及对应的节点标签划分为训练集和测试集;所述设定比例包括4:1、3:2和2:1;
构建融合模型;所述融合模型通过SVM、LR和GBDT三种基线模型结合融合方式构建的模型,所述融合方式包括线性加权融合法、交叉融合法、瀑布融合法、特征融合法和预测融合法;
利用经过数据预处理之后的训练集和测试集对融合模型进行训练、验证和测试,当融合模型的精度达到目标精度要求时,则判定融合模型训练完成,将训练完成的融合模型标记为分类模型;
通过处理器将分类模型发送至数据存储模块进行存储。
优选的,所述数据采集模块用于采集网络节点之间的时间差值,包括:
将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j,j=1,2,……,N,其中N>5;所述测试节点根据动态生成树搜索结果获取;
通过测试节点j发送第一状态信号至待检测节点i,当待检测节点i接收到第一状态信号之后立即发送第二状态信号至测试节点j;所述第一状态信号选择待检测节点i与测试节点j之间通信路径中网络节点最少的路径进行发送;
当测试节点j接收到第二状态信号之后立即获取第二状态信号被接收时刻与第一状态信号发送时刻的时间差值,并将时间差值标记为Sij;其中时间差值Sij的取值为0和1,当时间差值Sij=0时表示时间差值大于时间阈值,即测试节点j将待检测节点标记为故障节点;当时间差值Sij=1时表示时间差值小于等于时间阈值,即测试节点j将待检测节点标记为正常节点;
通过处理器将待检测节点i、测试节点j和时间差值Sij发送至数据存储模块进行存储,同时将时间差值Sij发送至初步判定模块。
优选的,所述预警维护模块用于调度维护人员对目标位置对应的故障节点进行维护,包括:
当预警维护模块接收到目标位置示意图时,获取维护人员的位置并标记为初始位置;
通过第三方地图平台规划目标位置与初始位置之间的路径,选取距离最短的路径作为目标路径;
通过预警维护模块将目标路径发送至维护人员的智能终端,同时在目标位置示意图中显示维护人员的实时位置;所述智能终端与预警维护模块通信连接,所述智能终端包括智能手机、平板电脑和笔记本电脑;
通过处理器将维护人员的调度记录发送至数据存储模块进行存储;所述调度记录包括时间、目标路径、维护人员的姓名和手机号。
优选的,所述攻击监测模块用于对数据中心网络节点遭受的攻击进行监测,包括:
通过对黑客入侵方式进行分析建立黑客入侵特征库;
对数据中心网络中的数据包进行分析获取分析结果;将分析结果与黑客入侵特征库中的攻击方式进行对比匹配,当二者匹配成功时,则发送黑客攻击信号至预警维护模块,且将对应的黑客攻击方式也发送至预警维护模块;
将黑客入侵特征库和黑客攻击信号的发送记录通过处理器发送至数据存储模块进行存储。
优选的,所述处理器分别与数据采集模块、初步判定模块、分类检测模块、攻击监测模块、预警维护模块和数据存储模块通信连接;所述预警维护模块分别与数据存储模块和攻击监测模块通信连接,所述初步判定模块分别与数据采集模块和分类检测模块通信连接,所述分类检测模块和攻击监测模块通信连接。
一种数据中心网络故障节点诊断方法,所述诊断方法的具体步骤包括:
步骤一:将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j;获取时间差值并标记为Sij;将时间差值Sij发送至初步判定模块;
步骤二:当初步判定模块接收到时间差值Sij之后,获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;生成正常节点集、故障节点集和嫌疑节点集;将嫌疑节点集发送至分类检测模块;
步骤三:当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;获取嫌疑节点的时间矩阵;将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签,根据嫌疑标签分析嫌疑节点;对正常节点集和故障节点集进行更新;获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;通过处理器将目标位置示意图发送至预警维护模块。
与现有技术相比,本发明的有益效果是:
1、本发明设置了数据采集模块,该设置用于采集网络节点之间的时间差值;数据采集模块通过动态生成树选取测试节点,并获取测试节点与待检测节点之间的时间差值,避免选择故障节点作为测试节点,有助于提高故障节点的检测精度;
2、本发明设置了初步判定模块,该设置用于对网络节点的故障进行初步分析;初步判定模块根据时间差值对待检测节点进行初步分析,并生成正常节点集、故障节点集和嫌疑节点集,提高了故障节点的检测效率,为分类检测模块的分类奠定基础;
3、本发明设置了分类检测模块,该设置用于对嫌疑节点进行深度分析;分类检测模块根据分类模型对嫌疑节点进行分类,并对正常节点集和故障节点集进行更新,有助于提高网络节点的故障判断精度和判断效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的原理示意图;
图2为本发明的步骤示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-图2,一种数据中心网络故障节点诊断系统,包括处理器、数据采集模块、初步判定模块、分类检测模块、攻击监测模块、预警维护模块和数据存储模块;
初步判定模块用于对网络节点的故障进行初步分析,包括:
当初步判定模块接收到时间差值Sij之后,通过公式
Figure BDA0003286274820000071
获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;
将正常节点进行整合生成正常节点集,将故障节点整合生成故障节点集,将嫌疑节点整合生成嫌疑节点集;通过处理器将正常节点集、故障节点集和嫌疑节点集发送至数据存储模块进行存储,同时,将嫌疑节点集发送至分类检测模块;
分类检测模块用于对嫌疑节点进行深度分析,包括:
当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;
获取嫌疑节点的时间矩阵;
将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签;嫌疑标签为嫌疑节点对应的节点标签;
当嫌疑标签为1时,则判定嫌疑节点为正常节点;当嫌疑标签为0时,则判定嫌疑节点为故障节点;
对正常节点集和故障节点集进行更新;
获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;第三方地图平台包括百度地图、腾讯地图和高德地图;
通过处理器将目标位置示意图发送至预警维护模块,同时将目标位置示意图、正常节点集和故障节点集发送至数据存储模块进行存储。
进一步地,分类模型的具体获取步骤包括:
获取正常节点的时间矩阵,获取故障节点的时间矩阵;时间矩阵包括时间差值Sij和时间差值Sij对应的待检测节点i和测试节点j之间的节点总数;
为正常节点和故障节点设置节点标签;其中正常节点的节点标签为1,故障节点的节点标签为0;
按照设定比例将正常节点的时间矩阵、故障节点的时间矩阵以及对应的节点标签划分为训练集和测试集;设定比例包括4:1、3:2和2:1;
构建融合模型;融合模型通过SVM、LR和GBDT三种基线模型结合融合方式构建的模型,融合方式包括线性加权融合法、交叉融合法、瀑布融合法、特征融合法和预测融合法;
利用经过数据预处理之后的训练集和测试集对融合模型进行训练、验证和测试,当融合模型的精度达到目标精度要求时,则判定融合模型训练完成,将训练完成的融合模型标记为分类模型;
通过处理器将分类模型发送至数据存储模块进行存储。
进一步地,数据采集模块用于采集网络节点之间的时间差值,包括:
将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j,j=1,2,……,N,其中N>5;测试节点根据动态生成树搜索结果获取;
通过测试节点j发送第一状态信号至待检测节点i,当待检测节点i接收到第一状态信号之后立即发送第二状态信号至测试节点j;第一状态信号选择待检测节点i与测试节点j之间通信路径中网络节点最少的路径进行发送;
当测试节点j接收到第二状态信号之后立即获取第二状态信号被接收时刻与第一状态信号发送时刻的时间差值,并将时间差值标记为Sij;其中时间差值Sij的取值为0和1,当时间差值Sij=0时表示时间差值大于时间阈值,即测试节点j将待检测节点标记为故障节点;当时间差值Sij=1时表示时间差值小于等于时间阈值,即测试节点j将待检测节点标记为正常节点;
通过处理器将待检测节点i、测试节点j和时间差值Sij发送至数据存储模块进行存储,同时将时间差值Sij发送至初步判定模块。
进一步地,预警维护模块用于调度维护人员对目标位置对应的故障节点进行维护,包括:
当预警维护模块接收到目标位置示意图时,获取维护人员的位置并标记为初始位置;
通过第三方地图平台规划目标位置与初始位置之间的路径,选取距离最短的路径作为目标路径;
通过预警维护模块将目标路径发送至维护人员的智能终端,同时在目标位置示意图中显示维护人员的实时位置;智能终端与预警维护模块通信连接,智能终端包括智能手机、平板电脑和笔记本电脑;
通过处理器将维护人员的调度记录发送至数据存储模块进行存储;调度记录包括时间、目标路径、维护人员的姓名和手机号。
进一步地,攻击监测模块用于对数据中心网络节点遭受的攻击进行监测,包括:
通过对黑客入侵方式进行分析建立黑客入侵特征库;
对数据中心网络中的数据包进行分析获取分析结果;将分析结果与黑客入侵特征库中的攻击方式进行对比匹配,当二者匹配成功时,则发送黑客攻击信号至预警维护模块,且将对应的黑客攻击方式也发送至预警维护模块;
将黑客入侵特征库和黑客攻击信号的发送记录通过处理器发送至数据存储模块进行存储。
进一步地,黑客入侵方式包括Land攻击、TCP SYN攻击、Ping Of Death攻击、WinNuke攻击、Teardrop攻击和TCP/UDP端口扫描攻击,黑客入侵方式的具体判断步骤为:
当数据包的源地址和目标地址相同时,判断该攻击方式为Land攻击,并标记为L;
当单位时间内收到的SYN连接超过系统设定的阈值时,判断该攻击方式为TCP SYN攻击,并标记为S;
当数据包的大小大于65535个字节时,判断该攻击方式为Ping Of Death攻击,并标记为D;
当数据包的目标端口为137、138或139,且URG位为“1”时,判断该方式为WinNuke攻击,并标记为W;
当数据包中分片数据的片偏移量错误时,判断该攻击方式为Teardrop攻击,并标记为T;
当数据包对非常用端口发送连接请求时,判断该攻击方式为TCP/UDP端口扫描攻击,并标记为U。
进一步地,处理器分别与数据采集模块、初步判定模块、分类检测模块、攻击监测模块、预警维护模块和数据存储模块通信连接;预警维护模块分别与数据存储模块和攻击监测模块通信连接,初步判定模块分别与数据采集模块和分类检测模块通信连接,分类检测模块和攻击监测模块通信连接。
一种数据中心网络故障节点诊断方法,诊断方法的具体步骤包括:
步骤一:将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j;获取时间差值并标记为Sij;将时间差值Sij发送至初步判定模块;
步骤二:当初步判定模块接收到时间差值Sij之后,获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;生成正常节点集、故障节点集和嫌疑节点集;将嫌疑节点集发送至分类检测模块;
步骤三:当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;获取嫌疑节点的时间矩阵;将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签,根据嫌疑标签分析嫌疑节点;对正常节点集和故障节点集进行更新;获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;通过处理器将目标位置示意图发送至预警维护模块。
上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
本发明的工作原理:
将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j;通过测试节点j发送第一状态信号至待检测节点i,当待检测节点i接收到第一状态信号之后立即发送第二状态信号至测试节点j;当测试节点j接收到第二状态信号之后立即获取第二状态信号被接收时刻与第一状态信号发送时刻的时间差值,并将时间差值标记为Sij;通过处理器将待检测节点i、测试节点j和时间差值Sij发送至数据存储模块进行存储,同时将时间差值Sij发送至初步判定模块;
当初步判定模块接收到时间差值Sij之后,获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;将正常节点进行整合生成正常节点集,将故障节点整合生成故障节点集,将嫌疑节点整合生成嫌疑节点集;通过处理器将正常节点集、故障节点集和嫌疑节点集发送至数据存储模块进行存储,同时,将嫌疑节点集发送至分类检测模块;
当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;获取嫌疑节点的时间矩阵;将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签;所述嫌疑标签为嫌疑节点对应的节点标签;当嫌疑标签为1时,则判定嫌疑节点为正常节点;当嫌疑标签为0时,则判定嫌疑节点为故障节点;对正常节点集和故障节点集进行更新;获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;通过处理器将目标位置示意图发送至预警维护模块,同时将目标位置示意图、正常节点集和故障节点集发送至数据存储模块进行存储。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (6)

1.一种数据中心网络故障节点诊断系统,其特征在于,包括处理器、数据采集模块、初步判定模块、分类检测模块、攻击监测模块、预警维护模块和数据存储模块;
所述初步判定模块用于对网络节点的故障进行初步分析,包括:
当初步判定模块接收到时间差值Sij之后,通过公式
Figure FDA0003286274810000011
Figure FDA0003286274810000012
获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;
将正常节点进行整合生成正常节点集,将故障节点整合生成故障节点集,将嫌疑节点整合生成嫌疑节点集;通过处理器将正常节点集、故障节点集和嫌疑节点集发送至数据存储模块进行存储,同时,将嫌疑节点集发送至分类检测模块;
所述分类检测模块用于对嫌疑节点进行深度分析,包括:
当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;
获取嫌疑节点的时间矩阵;
将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签;所述嫌疑标签为嫌疑节点对应的节点标签;
当嫌疑标签为1时,则判定嫌疑节点为正常节点;当嫌疑标签为0时,则判定嫌疑节点为故障节点;
对正常节点集和故障节点集进行更新;
获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;所述第三方地图平台包括百度地图、腾讯地图和高德地图;
通过处理器将目标位置示意图发送至预警维护模块,同时将目标位置示意图、正常节点集和故障节点集发送至数据存储模块进行存储。
2.根据权利要求1所述的一种数据中心网络故障节点诊断系统,其特征在于,所述分类模型的具体获取步骤包括:
获取正常节点的时间矩阵,获取故障节点的时间矩阵;所述时间矩阵包括时间差值Sij和时间差值Sij对应的待检测节点i和测试节点j之间的节点总数;
为正常节点和故障节点设置节点标签;其中正常节点的节点标签为1,故障节点的节点标签为0;
按照设定比例将正常节点的时间矩阵、故障节点的时间矩阵以及对应的节点标签划分为训练集和测试集;所述设定比例包括4∶1、3∶2和2∶1;
构建融合模型;所述融合模型通过SVM、LR和GBDT三种基线模型结合融合方式构建的模型,所述融合方式包括线性加权融合法、交叉融合法、瀑布融合法、特征融合法和预测融合法;
利用经过数据预处理之后的训练集和测试集对融合模型进行训练、验证和测试,当融合模型的精度达到目标精度要求时,则判定融合模型训练完成,将训练完成的融合模型标记为分类模型;
通过处理器将分类模型发送至数据存储模块进行存储。
3.根据权利要求1所述的一种数据中心网络故障节点诊断系统,其特征在于,所述数据采集模块用于采集网络节点之间的时间差值,包括:
将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j,j=1,2,……,N,其中N>5;所述测试节点根据动态生成树搜索结果获取;
通过测试节点j发送第一状态信号至待检测节点i,当待检测节点i接收到第一状态信号之后立即发送第二状态信号至测试节点j;所述第一状态信号选择待检测节点i与测试节点j之间通信路径中网络节点最少的路径进行发送;
当测试节点j接收到第二状态信号之后立即获取第二状态信号被接收时刻与第一状态信号发送时刻的时间差值,并将时间差值标记为Sij;其中时间差值Sij的取值为0和1,当时间差值Sij=0时表示时间差值大于时间阈值,即测试节点j将待检测节点标记为故障节点;当时间差值Sij=1时表示时间差值小于等于时间阈值,即测试节点j将待检测节点标记为正常节点;
通过处理器将待检测节点i、测试节点j和时间差值Sij发送至数据存储模块进行存储,同时将时间差值Sij发送至初步判定模块。
4.根据权利要求1所述的一种数据中心网络故障节点诊断系统,其特征在于,所述预警维护模块用于调度维护人员对目标位置对应的故障节点进行维护,包括:
当预警维护模块接收到目标位置示意图时,获取维护人员的位置并标记为初始位置;
通过第三方地图平台规划目标位置与初始位置之间的路径,选取距离最短的路径作为目标路径;
通过预警维护模块将目标路径发送至维护人员的智能终端,同时在目标位置示意图中显示维护人员的实时位置;所述智能终端与预警维护模块通信连接,所述智能终端包括智能手机、平板电脑和笔记本电脑;
通过处理器将维护人员的调度记录发送至数据存储模块进行存储;所述调度记录包括时间、目标路径、维护人员的姓名和手机号。
5.根据权利要求1所述的一种数据中心网络故障节点诊断系统,其特征在于,所述攻击监测模块用于对数据中心网络节点遭受的攻击进行监测,包括:
通过对黑客入侵方式进行分析建立黑客入侵特征库;
对数据中心网络中的数据包进行分析获取分析结果;将分析结果与黑客入侵特征库中的攻击方式进行对比匹配,当二者匹配成功时,则发送黑客攻击信号至预警维护模块,且将对应的黑客攻击方式也发送至预警维护模块;
将黑客入侵特征库和黑客攻击信号的发送记录通过处理器发送至数据存储模块进行存储。
6.一种数据中心网络故障节点诊断方法,其特征在于,所述诊断方法的具体步骤包括:
步骤一:将网络节点的待检测节点标记为i,选取N个网络节点作为测试节点,并将测试节点标记为j;获取时间差值并标记为Sij;将时间差值Sij发送至初步判定模块;
步骤二:当初步判定模块接收到时间差值Sij之后,获取故障评估系数GPXi;当故障评估系数GPXi满足GPXi=N+1时,则判定对应的待检测节点i正常,并将对应的待检测节点i标记为正常节点;当故障评估系数GPXi满足GPXi=0时,则判定对应的待检测节点i异常,将对应的待检测节点i标记为故障节点;否则,将对应的待检测节点i标记为嫌疑节点;生成正常节点集、故障节点集和嫌疑节点集;将嫌疑节点集发送至分类检测模块;
步骤三:当分类检测模块接收到嫌疑节点集时,通过数据存储模块获取分类模型;获取嫌疑节点的时间矩阵;将嫌疑节点的时间矩阵经过数据预处理之后输入至分类模型获取输出结果,并将输出结果标记为嫌疑标签,根据嫌疑标签分析嫌疑节点;对正常节点集和故障节点集进行更新;获取故障节点集中故障节点的位置并标记为目标位置,通过第三方地图平台生成目标位置示意图;通过处理器将目标位置示意图发送至预警维护模块。
CN202111148361.7A 2021-09-29 2021-09-29 一种数据中心网络故障节点诊断方法及系统 Withdrawn CN113890820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111148361.7A CN113890820A (zh) 2021-09-29 2021-09-29 一种数据中心网络故障节点诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111148361.7A CN113890820A (zh) 2021-09-29 2021-09-29 一种数据中心网络故障节点诊断方法及系统

Publications (1)

Publication Number Publication Date
CN113890820A true CN113890820A (zh) 2022-01-04

Family

ID=79007781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111148361.7A Withdrawn CN113890820A (zh) 2021-09-29 2021-09-29 一种数据中心网络故障节点诊断方法及系统

Country Status (1)

Country Link
CN (1) CN113890820A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422379A (zh) * 2022-01-20 2022-04-29 昕锐至成(江苏)光电科技有限公司 一种多平台设备无线组网的分析方法
CN114628016A (zh) * 2022-05-17 2022-06-14 西南医科大学附属医院 一种基于大数据的腹腔镜手术器械运行故障预测系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422379A (zh) * 2022-01-20 2022-04-29 昕锐至成(江苏)光电科技有限公司 一种多平台设备无线组网的分析方法
CN114422379B (zh) * 2022-01-20 2023-02-28 昕锐至成(江苏)光电科技有限公司 一种多平台设备无线组网的分析方法
CN114628016A (zh) * 2022-05-17 2022-06-14 西南医科大学附属医院 一种基于大数据的腹腔镜手术器械运行故障预测系统

Similar Documents

Publication Publication Date Title
CN108964995A (zh) 基于时间轴事件的日志关联分析方法
CN113890820A (zh) 一种数据中心网络故障节点诊断方法及系统
CN111325463A (zh) 数据质量检测方法、装置、设备及计算机可读存储介质
CN108933694A (zh) 基于拨测数据的数据中心网络故障节点诊断方法及系统
CN115118581A (zh) 一种基于5g的物联网数据全链路监控和智能保障系统
CN115378711B (zh) 一种工控网络的入侵检测方法和系统
CN114374626B (zh) 一种5g网络条件下的路由器性能检测方法
CN113053063A (zh) 基于移动端的灾害在线处置流程实现方法
CN108769042B (zh) 一种基于微分流形的网络安全风险评估的方法
CN117221087A (zh) 告警根因定位方法、装置及介质
CN117596133B (zh) 基于多维数据的业务画像及异常监测系统及监测方法
CN108234435A (zh) 一种基于ip分类的自动检测方法
CN117149486B (zh) 告警和根因定位方法、模型训练方法、装置、设备及介质
CN117934998A (zh) 隧道火灾数字孪生模型可信度评估方法及系统
CN115643108B (zh) 面向工业互联网边缘计算平台安全评估方法、系统及产品
Wang et al. LSTM-based alarm prediction in the mobile communication network
CN112235309A (zh) 一种云平台网络隐蔽信道多尺度检测系统
CN115659351B (zh) 一种基于大数据办公的信息安全分析方法、系统及设备
Glass et al. Automatically identifying the sources of large Internet events
CN114978878B (zh) 定位方法、装置、电子设备及计算机可读存储介质
CN111614083B (zh) 一种适用于400v供电网络拓扑识别的大数据分析方法
CN111162929B (zh) 一种分级管理方法和系统
CN114338088A (zh) 变电站电力监控系统网络安全等级的评估算法及评估系统
CN112598025A (zh) 电力设备目标信息的处理方法、装置、设备和介质
CN110544182A (zh) 一种基于机器学习技术的配电通信网融合控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220104

WW01 Invention patent application withdrawn after publication