CN116074180A - 故障定位方法、故障修复方法、装置及存储介质 - Google Patents
故障定位方法、故障修复方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116074180A CN116074180A CN202310184122.XA CN202310184122A CN116074180A CN 116074180 A CN116074180 A CN 116074180A CN 202310184122 A CN202310184122 A CN 202310184122A CN 116074180 A CN116074180 A CN 116074180A
- Authority
- CN
- China
- Prior art keywords
- fault
- network
- module
- repair
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000008439 repair process Effects 0.000 title claims description 91
- 238000012216 screening Methods 0.000 claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 239000013307 optical fiber Substances 0.000 claims description 42
- 238000007726 management method Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 24
- 239000000835 fiber Substances 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 16
- 238000003062 neural network model Methods 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000000903 blocking effect Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 238000005067 remediation Methods 0.000 claims description 4
- 230000004807 localization Effects 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 21
- 230000015654 memory Effects 0.000 description 41
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 239000000306 component Substances 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000008358 core component Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004451 qualitative analysis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供一种故障定位方法、故障修复方法、装置及存储介质,涉及数据中心运维技术领域。该故障定位方法包括:对数据中心的网络信息进行采集和感知,网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。
Description
技术领域
本申请涉及数据中心运维技术领域,尤其涉及一种故障定位方法、故障修复方法、装置及存储介质。
背景技术
数据中心作为新型数字信息基础设施的核心组成部分,随着业务种类的多样化,网络拓扑的复杂化演进,传统的运维方式难以满足数字化转型要求。现有的数据中心运维方案中大多集中于对数据中心能耗策略的制定,但是当数据中心网络出现故障时缺乏相对应的故障检测定位与修复方法。
现有的数据中心运维系统中,主要是通过告警信息的定性分析实现网络故障定位,故障检测不全面,且修复主要针对的是逻辑链路的故障。如此,现有方案存在以下问题:检测不全面、没有针对物理链路的故障进行修复。
发明内容
本申请提供一种故障定位方法、故障修复方法、装置及存储介质,能够解决数据中心运维存在故障检测不全面,且没有能够针对物理链路的故障进行修复的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种故障定位方法,该方法包括:对数据中心的网络信息进行采集和感知,所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对所述网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。
基于上述技术方案,本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,对更多更典型的网络信息进行特征筛选,并基于筛选后的数据来定位故障原因。
在第一方面的第一种可能的实现方式中,上述对网络信息进行数据存储和特征筛选,包括:对上述网络信息进行监控并对上述网络信息进行记录并存储;对所述网络信息进行安全鉴权,得到安全鉴权结果;基于上述安全鉴权结果,对上述网络信息进行特征筛选。
在第一方面的第二种可能的实现方式中,上述基于特征筛选后的数据进行网络故障检测,以定位故障原因,包括:采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果;通过上述聚类结果定位所述故障原因,上述聚类结果与上述故障原因存在映射关系;其中,上述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
在第一方面的第三种可能的实现方式中,上述所述采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果之前,上述方法还包括:对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后上述历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为上述BP神经网络模型。
第二方面,本申请提供一种故障修复方法,该方法包括:基于故障原因,生成对应的修复策略;基于修复策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备修复数据中心的网络故障。
基于上述技术方案,本申请实施例提供的故障修复方法,故障修复平台根据故障原因生成对应的修复策略并下发给光纤机器人设备,光纤机器人设备根据指令实现对数据中心物理链路常见故障如物理断路、网络阻塞和设备宕机的修复,通过将光纤机器人设备应用于数据中心的故障修复,实现了对数据中心物理链路故障的修复。
在第二方面的第一种可能的实现方式中,上述基于故障原因,生成对应的修复策略,包括:在故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略;基于修复策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备修复所述数据中心的网络故障,包括:基于路由修复策略,下发修复指令给所述光纤机器人设备,以通过光纤机器人设备对所述数据中心的各个端口进行物理连接。
在第二方面的第二种可能的实现方式中,基于故障原因,生成对应的修复策略,包括:在故障原因为设备宕机原因的情况下,生成备用设备连接策略;基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复数据中心的网络故障,包括:基于备用设备连接策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
第三方面,本申请提供一种故障定位装置,该装置包括:数据采集模块、网络管理模块和故障定位模块。数据采集模块,用于对数据中心的网络信息进行采集和感知;网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;网络管理模块,用于对数据采集模块采集的网络信息进行特征筛选;故障定位模块,用于基于网络管理模块筛选后的数据进行网络故障检测,以定位故障原因。
在第三方面的第一种可能的实现方式中,上述网络管理模块包括:系统监控模块、日志记录模块和安全鉴权模块。其中,系统监控模块,具体用于对网络信息进行监控。日志记录模块,具体用于对网络信息进行记录并存储。安全鉴权模块,具体用于对网络信息进行安全鉴权,以基于安全鉴权结果,对所述网络信息进行特征筛选。
在第三方面的第二种可能的实现方式中,上述故障定位模块,具体用于采用反向传播BP神经网络模型,对网络管理模块筛选后的数据进行聚类计算,得到聚类结果;通过聚类结果定位所述故障原因,聚类结果与故障原因存在映射关系;其中,所述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
在第三方面的第三种可能的实现方式中,上述装置还包括:模型训练模块。上述模型训练模块,具体用于对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为所述BP神经网络模型。
第四方面,本申请提供一种故障修复装置,该装置包括:生成模块、发送模块和修复模块;生成模块,用于基于故障原因,生成对应的修复策略;发送模块,基于修复策略下发修复指令给光纤机器人设备;修复模块,通过光纤机器人设备修复数据中心的网络故障。
在第四方面的第一种可能的实现方式中,上述修复模块,具体用于在所述故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略。上述发送模块,具体用于基于路由修复策略下发修复指令给光纤机器人设备。上述发送模块,具体用于通过光纤机器人设备对数据中心的各个端口进行物理连接。
在第四方面的第一种可能的实现方式中,上述修复模块,具体用于在所述故障原因为设备宕机原因的情况下,生成备用设备连接策略。上述发送模块,具体用于基于路由修复策略下发修复指令给光纤机器人设备。上述发送模块,具体用于通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
第五方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行如第一方面和第一方面的任一种可能的实现方式中描述的故障定位方法,或者使得终端执行如第二方面和第二方面的任一种可能的实现方式中描述的故障修复方法。
第六方面,本申请实施例提供一种包含指令的计算机程序产品,当计算机程序产品在故障定位装置上运行时,使得故障定位装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的故障定位方法,或者当计算机程序产品在故障修复装置上运行时,使得故障修复装置执行如第二方面和第二方面的任一种可能的实现方式中所描述的故障修复方法。
第七方面,本申请实施例提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的故障定位方法,或者以实现如第二方面和第二方面的任一种可能的实现方式中所描述的故障修复方法。
具体的,本申请实施例中提供的芯片还包括存储器,用于存储计算机程序或指令。
附图说明
图1为本申请实施例提供的一种故障定位方法的流程图;
图2为本申请实施例提供的一种BP神经网络模型的训练过程的流程图;
图3为本申请实施例提供的一种故障修复方法的流程图;
图4为本申请实施例提供的一种数据中心运维系统的架构图之一;
图5为本申请实施例提供的一种数据中心运维系统网络管理模块的结构示意图;
图6为本申请实施例提供的一种数据中心运维系统的架构图之二;
图7为本申请实施例提供的一种光纤机器人设备的结构示意图;
图8为本申请实施例提供的一种光纤机器人设备的运行状态示意图;
图9为本申请实施例提供的一种故障定位装置的结构示意图;
图10为本申请实施例提供的一种故障修复装置的结构示意图;
图11为本申请实施例提供的另一种故障定位装置的结构示意图;
图12为本申请实施例提供的另一种故障修复装置的结构示意图;
图13为本申请实施例提供的一种芯片的结构示意图。
具体实施方式
下面结合附图对本申请实施例提供的数据中心运维系统方法及装置进行详细地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
数据中心作为新型数字信息基础设施的核心组成部分,随着业务种类的多样化,网络拓扑的复杂化演进,传统的运维方式难以满足数字化转型要求现有的数据中心运维方案中大多集中于对数据中心能耗策略的制定,但是当数据中心网络出现故障时缺乏相对于的故障检测定位与修复方法。
现有的网络故障检测和修复方法中,一方面只能通过告警信息的定性分析实现网络故障定位,另一方面现有的方法大多需要提前建立故障条件和故障修复策略的先验数据库,并且主要针对的是逻辑链路实现故障修复。
为了解决现有技术中,故障检测不全面、没有针对物理链路的故障进行修复的问题,本申请提供了一种故障定位方法,该方法包括:对数据中心的网络信息进行采集和感知,所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对所述网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。
基于上述技术方案,本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,对更多更典型的网络信息进行特征筛选,并基于筛选后的数据来定位故障原因。
本申请数据中心运维系统方法应用于当数据中心网络出现故障时,进行故障检测定位与修复的场景。
如图1所示,为本申请实施例提供的故障定位方法的流程图,该方法包括以下步骤S101至S103:
步骤S101、对数据中心的网络信息进行采集和感知。
本申请实施例中,上述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息。
可选的,本申请实施例中,上述网络设备状态信息可以用于指示数据中心的各个网络设备是否开启、各个网络设备的运行情况等。
可选的,本申请实施例中,上述端口的流量统计数据可以包括数据中心的各个端口使用的数据流量大小、数据流量速率中的至少一项。
可选的,本申请实施例中,上述snmp告警上报信息可以用于指示数据中心的各个网络设备运行状况,包括温度故障、电压故障、设备错误。
可选的,本申请实施例中,上述协议分析信息可以用于指示数据中心的各个网络设备之间的交互协议所表示的数据信息。
本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,通过采集更多的网络信息来定位故障原因,提升故障检测的全面性。
步骤S102、对网络信息进行数据特征筛选。
可选的,本申请实施例中,上述步骤S102具体可以通过下述的步骤S102A、步骤S102B和步骤S102C实现。
步骤S102A、对网络信息进行监控,并对网络信息进行记录并存储。
步骤S102B、对网络信息进行安全鉴权,得到安全鉴权结果。
步骤S102C、基于安全鉴权结果,对网络信息进行特征筛选。
本申请实施例提供的故障定位方法,对采集的数据中心更多更典型的网络信息,进行监控、记录和安全鉴权,对通过安全鉴权结果的网络信息进行特征筛选,提升故障检测的全面性。
步骤S103、基于特征筛选后的数据进行网络故障检测,以定位故障原因。
可选的,本申请实施例中,上述步骤S103具体可以通过下述的步骤S103A和步骤S103B实现。
步骤S103A、采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果。
步骤S103B、通过聚类结果定位故障原因。
本申请实施例中,上述聚类结果与故障原因存在映射关系。
本申请实施例中,上述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
可选的,本申请实施例中,上述物理短线原因可以用于指示数据中心的各个网络设备之间的物理连接线路出现问题。
可选的,本申请实施例中,上述网络拥塞原因可以用于指示数据中心的各个网络设备对网络资源(包括链路带宽、存储空间和处理器处理能力等)的需求超过了固有的处理能力和容量,而造成网络传输性能下降。
可选的,本申请实施例中,上述设备宕机原因可以用于指示数据中心的各个网络设备由于一些原因而长时间无响应,导致网络设备不能正常工作。
本申请实施例提供的故障定位方法,对采集的数据中心更多更典型的网络信息,进行监控、记录和安全鉴权,对通过安全鉴权结果的网络信息进行特征筛选,提升故障检测的全面性。
可选的,本申请实施例中,在上述步骤S103A之前,本申请实施例提供的故障定位方法还包括下述步骤S103C-S103E。
步骤S103C、对历史网络信息进行归一化处理;
步骤S103D、初始化BP神经网络参数,并基于归一化后历史网络信息进行模型训练;
步骤S103E、通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为BP神经网络模型。
示例性的,本实施例中,BP神经网络故障检测算法(即BP神经网络模型)如图2所示,BP神经网络算法分为两个阶段,第一阶段主要用于迭代寻找最优隐藏层神经元数目,提高BP神经网络的训练效果和泛化能力,首先将采集到端口流量、告警信息等网元设备参数进行归一化,然后初始化BP神经网络参数并进行模型训练,然后通过计算损失函数来判断是否找到最优隐藏层参数。第二阶段主要用于保存训练好的神经网络模型,然后利用训练好的模型对采集到的参数进行聚类计算并输出故障检测结果。
基于上述技术方案,本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,对更多更典型的网络信息进行特征筛选,并基于筛选后的数据来定位故障原因。
本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,对更多更典型的网络信息进行特征筛选,并基于筛选后的数据来定位故障原因。
如图3所示,为本申请实施例提供的故障修复方法的流程图,该方法包括以下步骤S201和步骤S202:
步骤S201、基于故障原因,生成对应的修复策略。
可选的,本申请实施例中,上述步骤S201具体可以通过下述的步骤S201A实现。
步骤S201A、在故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略。
可选的,本申请实施例中,上述步骤S201具体可以通过下述的步骤S201B实现。
步骤S201B、在故障原因为设备宕机原因的情况下,生成备用设备连接策略。
步骤S202、基于修复策略下发修复指令给光纤机器人设备,以通过光纤机器人设备修复数据中心的网络故障。
可选的,本申请实施例中,上述步骤S202具体可以通过下述的步骤S202A实现。
步骤S202A、基于路由修复策略下发修复指令给光纤机器人设备,以通过光纤机器人设备对数据中心的各个端口进行物理连接。
可选的,本实施例中,光纤机器人设备通过动态路由和接口复用解决网络阻塞故障。
可选的,本实施例中,光纤机器人设备通过光纤跳接解决物理断路故障。
可选的,本申请实施例中,上述步骤S202具体可以通过下述的步骤S202B实现。
步骤S202B、基于备用设备连接策略下发修复指令给光纤机器人设备,以通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
可选的,本实施例中,通过在数据中心提前部署备用网元设备,实现容灾备份,在检测到设备宕机故障时,通过光纤机器人设备实现对备用设备的跳接启用。
本申请实施例提供的故障修复方法,故障修复平台根据故障原因生成对应的修复策略并下发给光纤机器人设备,光纤机器人设备根据指令实现对数据中心物理链路常见故障如物理断路、网络阻塞和设备宕机的修复,通过将光纤机器人设备应用于数据中心的故障修复,实现了对数据中心物理链路故障的修复。
如图4所示,为本申请实施例提供的数据中心运维系统,该数据中心运维系统10包括故障定位平台11和故障自动修复平台12。
本申请实施例中,上述故障定位平台11包括数据采集模块110、网络管理模块111和故障定位模块112。
本申请实施例中,上述数据采集模块110,用于对数据中心的网络信息进行采集和感知;上述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息。
本申请实施例中,上述网络管理模块111,用于对上述网络信息进行数据存储和特征筛选。
本申请实施例中,上述故障定位模块112,用于基于上述网络管理模块111筛选后的数据进行网络故障检测,以定位故障原因。
本申请实施例中,上述故障自动修复平台12,用于基于上述故障原因,生成对应的修复策略,并基于上述修复策略下发修复指令给光纤机器人设备,以通过上述光纤机器人设备修复上述数据中心的网络故障。
可选的,本申请实施例中,如图5所示,上述网络管理模块111包括:系统监控模块1110、日志记录模块1111和安全鉴权模块1112。
其中,上述系统监控模块1110,用于对上述网络信息进行监控。上述日志记录模块1111,用于对上述网络信息进行记录并存储。上述安全鉴权模块1112,用于对上述网络信息进行安全鉴权,以基于安全鉴权结果,对上述网络信息进行特征筛选。
本申请实施例中,上述系统监控模块1110可以实时监控数据中心的各个网络设备,以获得各个网络设备产生的数据,即上述的网络信息,从而实现对数据中心及时、精准地监控,以便于后续的故障定位和修复。
本申请实施例中,上述安全鉴权模块1112可以对数据中心的网络信息进行安全鉴权,以确定网络信息是否存在异常数据,得到安全鉴权结果,以将网络信息中存在异常数据的信息筛选出来。
可选的,本申请实施例中,上述故障定位模块112,具体用于采用反向传播(Back-propagation,BP)神经网络模型,对上述网络管理模块筛选后的数据进行聚类计算,得到聚类结果,以通过该聚类结果定位上述故障原因。
可选的,本申请实施例中,上述故障自动修复平台12,具体用于在上述故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略,并基于上述路由修复策略下发修复指令给上述光纤机器人设备,以通过上述光纤机器人设备对上述数据中心的各个端口进行物理连接。
本申请实施例中,在数据中心故障原因为物理短路原因或网络阻塞原因的情况下,故障自动修复平台12通过控制光纤机器人设备对数据中心的各个端口进行物理连接,实现数据中心的各个端口的路由修复,从而实现数据中心的物理链路的恢复。
可选的,本申请实施例中,上述故障自动修复平台12,具体用于在上述故障原因为设备宕机原因的情况下,生成备用设备连接策略,并基于上述备用设备连接策略下发修复指令给上述光纤机器人设备,以通过上述光纤机器人设备对上述数据中心的备用网元设备进行跳接启用。
本申请实施例中,在数据中心故障原因为设备宕机的情况下,故障自动修复平台12通过控制光纤机器人设备跳过启动数据中心的宕机设备,而直接启用数据中心的备用网元设备,避免启动宕机设备造成的交互异常,以实现数据中心各个网络设备之间的数据正常交互。
可选的,本申请实施例中,如图6所示,示出了本申请实施例提供的数据中心运维系统的整个架构图,该数据中心运维系统包括故障定位平台(包括如图6所示的故障定位、网络管理层,以及数据采集层)和故障自动修复平台(即如图6所示的基于光纤机器人的故障自动修复平台)。
本数据中心运维系统可以分为故障定位和故障自动修复两大部分。上图中左边为故障定位,首先通过数据采集模块/数据采集层将数据中心的网络设备状态信息,端口的流量统计数据,snmp告警上报信息和协议分析信息进行数据采集和感知;其次网络管理模块/网络管理层将采集到的网络信息通过安全鉴权模块、日志记录模块和系统监控模块进行数据存储和特征筛选;然后通过BP神经网络算法进行网络故障检测,并将故障原因定位到物理短线原因,网络拥塞原因和设备宕机原因这三种典型故障。上述右边的故障自动修复,根据故障定位模块输出的故障原因,故障自动修复平台生成相对于的修复策略,下发修复指令给光纤机器人设备,通过光纤机器人设备实现对光纤的自动跳接、设备端口的复用、路由策略的自适应调整和网元硬件的备份,修复相对应的网络故障。
示例性的,本申请实施例中,如图7所示,展示了光纤机器人设备的物理结构,主要分为阳连接器(Male connectors)和阴连接器(Female connectors)两个光纤平面,给个光纤平面包含256根活动光纤。
示例性的,本申请实施例中,如图8所示,展示了光纤机器人设备的运行状态图,每个光纤平面通过物理抓手带动活动光纤运行到指定栅格,实现256x256的光纤跳接。
本申请实施例提供一种数据中心运维系统,数据采集模块采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,网络管理模块利用更多更典型的网络信息进行特征筛选,定位模块基于筛选后的数据定位故障原因,自动修复平台根据故障原因生成对应的修复策略并下发给光纤机器人设备,光纤机器人设备根据指令实现对数据中心物理链路常见故障如物理断路、网络阻塞和设备宕机的自动修复,通过将光纤机器人设备应用于数据中心的故障修复,实现了对数据中心物理链路故障的自动修复。
本申请实施例可以根据上述方法示例对故障定位装置和故障修复装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图9所示,为本申请实施例提供的一种故障定位装置的结构示意图,该装置包括:数据采集模块41、网络管理模块42和故障定位模块43。
数据采集模块41,用于对数据中心的网络信息进行采集和感知;网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;网络管理模块42,用于对数据采集模块采集的网络信息进行特征筛选;故障定位模块43,用于基于网络管理模块筛选后的数据进行网络故障检测,以定位故障原因。
在一种可能的实现方式中,上述网络管理模块42,包括:系统监控模块、日志记录模块和安全鉴权模块。其中,系统监控模块,具体用于对所述网络信息进行监控。日志记录模块,具体用于对网络信息进行记录并存储。安全鉴权模块,具体用于对网络信息进行安全鉴权,以基于安全鉴权结果,对网络信息进行特征筛选。
在一种可能的实现方式中,上述故障定位模块43,具体用于采用反向传播BP神经网络模型,对网络管理模块筛选后的数据进行聚类计算,得到聚类结果;通过聚类结果定位所述故障原因,聚类结果与故障原因存在映射关系;其中,所述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
在一种可能的实现方式中,上述故障定位装置还包括:模型训练模块。模型训练模块,具体用于对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为所述BP神经网络模型。
在通过硬件实现时,本申请实施例中的数据采集模块41可以集成在通信接口上,本申请实施例中的网络管理模块42、故障定位模块43和模型训练模块可以集成在处理器上。具体实现方式如图11所示。
图11示出了上述实施例中所涉及的故障定位装置的又一种可能的结构示意图。该故障定位装置包括:处理器302和通信接口303。处理器302用于对故障定位装置的动作进行控制管理,例如,执行上述网络管理模块42、故障定位模块43和模型训练模块执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信接口303用于支持故障定位装置与其他网络实体的通信,例如,执行上述数据采集模块41执行的步骤。故障定位装置还可以包括存储器301和总线304,存储器301用于存储故障定位装置的程序代码和数据。
其中,存储器301可以是故障定位装置中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
上述处理器302可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线304可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
如图10所示,为本申请实施例提供的一种故障修复装置的结构示意图,该装置包括:生成模块51、发送模块52和修复模块53。生成模块、发送模块和修复模块;上述生成模块,用于基于故障原因,生成对应的修复策略;上述发送模块,基于所述修复策略下发修复指令给光纤机器人设备;上述修复模块,通过所述光纤机器人设备修复所述数据中心的网络故障。
在一种可能的实现方式中,上述生成模块51,具体用于在故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略;上述发送模块52,具体用于基于路由修复策略下发修复指令给光纤机器人设备;上述修复模块53,具体用于通过光纤机器人设备对数据中心的各个端口进行物理连接。
在一种可能的实现方式中,上述生成模块51,具体用于在设备宕机原因的情况下,生成备用设备连接策略;上述发送模块52,具体用于基于备用设备连接策略下发修复指令给光纤机器人设备;上述修复模块53,具体用于通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
在通过硬件实现时,本申请实施例中的发送模块52可以集成在通信接口上,本申请实施例中的生成模块51和修复模块53可以集成在处理器上。具体实现方式如图12所示。
图12示出了上述实施例中所涉及的故障修复装置的又一种可能的结构示意图。该故障修复装置包括:处理器402和通信接口403。处理器402用于对生成模块51和修复模块53的动作进行控制管理,例如,执行上述故障修复装置执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信接口403用于发送模块52与其他网络实体的通信,例如,执行上述故障修复装置执行的步骤。故障修复装置还可以包括存储器401和总线404,存储器401用于存储故障修复装置的程序代码和数据。
其中,存储器401可以是故障修复装置中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
上述处理器402可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线404可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
图13是本申请实施例提供的芯片170的结构示意图。芯片170包括一个或两个以上(包括两个)处理器1710和通信接口1730。
可选的,该芯片170还包括存储器1740,存储器1740可以包括只读存储器和随机存取存储器,并向处理器1710提供操作指令和数据。存储器1740的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。
在一些实施方式中,存储器1740存储了如下的元素,执行模块或者数据结构,或者他们的子集,或者他们的扩展集。
在本申请实施例中,通过调用存储器1740存储的操作指令(该操作指令可存储在操作系统中),执行相应的操作。
其中,上述处理器1710可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,单元和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,单元和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
存储器1740可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
总线1720可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线1720可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述方法实施例中的数据中心运维系统方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得该计算机执行上述方法实施例所示的方法流程中的数据中心运维系统方法。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本发明的实施例提供一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行如上述的数据中心运维系统方法。
由于本发明的实施例中的数据中心运维系统、计算机可读存储介质、计算机程序产品可以应用于上述方法,因此,其所能获得的技术效果也可参考上述方法实施例,本发明实施例在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (11)
1.一种故障定位方法,其特征在于,所述方法包括:
对数据中心的网络信息进行采集和感知,所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;
对所述网络信息进行数据特征筛选;
基于特征筛选后的数据进行网络故障检测,以定位故障原因。
2.根据权利要求1所述的方法,其特征在于,所述对所述网络信息进行数据存储和特征筛选,包括:
对所述网络信息进行监控,并对所述网络信息进行记录并存储;
对所述网络信息进行安全鉴权,得到安全鉴权结果;
基于所述安全鉴权结果,对所述网络信息进行特征筛选。
3.根据权利要求1所述的方法,其特征在于,所述基于特征筛选后的数据进行网络故障检测,以定位故障原因,包括:
采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果;
通过所述聚类结果定位所述故障原因,所述聚类结果与所述故障原因存在映射关系;
其中,所述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
4.根据权利要求3所述的方法,其特征在于,所述采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果之前,所述方法还包括:
对历史网络信息进行归一化处理;
初始化BP神经网络参数,并基于归一化后所述历史网络信息进行模型训练;
通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为所述BP神经网络模型。
5.一种故障修复方法,其特征在于,所述方法包括:
基于故障原因,生成对应的修复策略;
基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复所述数据中心的网络故障。
6.根据权利要求5所述的方法,其特征在于,所述基于所述故障原因,生成对应的修复策略,包括:
在所述故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略;
所述基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复所述数据中心的网络故障,包括:
基于所述路由修复策略,下发修复指令给所述光纤机器人设备,以通过所述光纤机器人设备对所述数据中心的各个端口进行物理连接。
7.根据权利要求5所述的方法,其特征在于,所述基于所述故障原因,生成对应的修复策略,包括:
在所述故障原因为设备宕机原因的情况下,生成备用设备连接策略;
所述基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复所述数据中心的网络故障,包括:
基于所述备用设备连接策略,下发修复指令给所述光纤机器人设备,以通过所述光纤机器人设备对所述数据中心的备用网元设备进行跳接启用。
8.一种故障定位装置,其特征在于,所述故障定位装置包括:数据采集模块、网络管理模块和故障定位模块;
所述数据采集模块,用于对数据中心的网络信息进行采集和感知;所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;
所述网络管理模块,用于对所述数据采集模块采集的网络信息进行特征筛选;
所述故障定位模块,用于基于所述网络管理模块筛选后的数据进行网络故障检测,以定位故障原因。
9.根据权利要求8所述的装置,其特征在于,所述网络管理模块包括:系统监控模块、日志记录模块和安全鉴权模块;
其中,所述系统监控模块,用于对所述网络信息进行监控;
所述日志记录模块,用于对所述网络信息进行记录并存储;
所述安全鉴权模块,用于对所述网络信息进行安全鉴权,以基于安全鉴权结果,对所述网络信息进行特征筛选。
10.一种故障修复装置,其特征在于,所述故障修复装置包括:生成模块、发送模块和修复模块;
所述生成模块,用于基于故障原因,生成对应的修复策略;
所述发送模块,基于所述修复策略下发修复指令给光纤机器人设备;
所述修复模块,通过所述光纤机器人设备修复所述数据中心的网络故障。
11.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当计算机执行该指令时,该计算机执行上述权利要求1-4中任一项所述的故障定位方法,或者该计算机执行上述权利要求5-7中任一项所述的故障修复方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310184122.XA CN116074180A (zh) | 2023-02-20 | 2023-02-20 | 故障定位方法、故障修复方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310184122.XA CN116074180A (zh) | 2023-02-20 | 2023-02-20 | 故障定位方法、故障修复方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116074180A true CN116074180A (zh) | 2023-05-05 |
Family
ID=86180207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310184122.XA Pending CN116074180A (zh) | 2023-02-20 | 2023-02-20 | 故障定位方法、故障修复方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116074180A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117674993A (zh) * | 2023-11-09 | 2024-03-08 | 中交广州航道局有限公司 | 光纤网络的运行状态检测系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103199919A (zh) * | 2013-04-19 | 2013-07-10 | 重庆邮电大学 | 一种多参数感知的高精度网络故障筛选定位系统及方法 |
CN112181758A (zh) * | 2020-08-19 | 2021-01-05 | 南京邮电大学 | 一种基于网络拓扑及实时告警的故障根因定位方法 |
CN113328872A (zh) * | 2020-02-29 | 2021-08-31 | 华为技术有限公司 | 故障修复方法、装置和存储介质 |
-
2023
- 2023-02-20 CN CN202310184122.XA patent/CN116074180A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103199919A (zh) * | 2013-04-19 | 2013-07-10 | 重庆邮电大学 | 一种多参数感知的高精度网络故障筛选定位系统及方法 |
CN113328872A (zh) * | 2020-02-29 | 2021-08-31 | 华为技术有限公司 | 故障修复方法、装置和存储介质 |
CN112181758A (zh) * | 2020-08-19 | 2021-01-05 | 南京邮电大学 | 一种基于网络拓扑及实时告警的故障根因定位方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117674993A (zh) * | 2023-11-09 | 2024-03-08 | 中交广州航道局有限公司 | 光纤网络的运行状态检测系统及方法 |
CN117674993B (zh) * | 2023-11-09 | 2024-04-26 | 中交广州航道局有限公司 | 光纤网络的运行状态检测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107179957B (zh) | 物理机故障分类处理方法、装置和虚拟机恢复方法、系统 | |
CN102355368B (zh) | 一种网络设备的故障处理方法及系统 | |
CN106789306B (zh) | 通信设备软件故障检测收集恢复方法和系统 | |
TW202032932A (zh) | 一種拓撲處理方法和裝置以及系統 | |
CN104796273A (zh) | 一种网络故障根源诊断的方法和装置 | |
CN110807064A (zh) | Rac分布式数据库集群系统中的数据恢复装置 | |
CN109062723A (zh) | 服务器故障的处理方法和装置 | |
CN113946499A (zh) | 一种微服务链路跟踪及性能分析方法、系统、设备及应用 | |
CN116074180A (zh) | 故障定位方法、故障修复方法、装置及存储介质 | |
CN109542781B (zh) | 区块链共识算法测试方法、装置、计算装置和存储介质 | |
CN110291505A (zh) | 减少应用的恢复时间 | |
CN111488050B (zh) | 一种电源监控方法、系统及服务器 | |
CN107070747A (zh) | 一种在网卡绑定模式下自动化测试网卡网络连接稳定性的方法 | |
CN102484603B (zh) | 创建冗余逻辑连接的方法和设备和存储自动化系统设备 | |
CN103701657A (zh) | 用于不间断运行的数据处理系统的异常监控及处理装置和方法 | |
CN105119765B (zh) | 一种智能处理故障体系架构 | |
CN114625074A (zh) | 一种用于火电机组dcs系统的安全防护系统及方法 | |
CN116483613B (zh) | 故障内存条的处理方法及装置、电子设备及存储介质 | |
KR101288535B1 (ko) | 통신 시스템 모니터링 방법 및 이를 위한 장치 | |
CN112817827A (zh) | 运维方法、装置、服务器、设备、系统及介质 | |
CN116149954A (zh) | 一种服务器智能运维系统及其方法 | |
CN104699597A (zh) | 基于unix操作系统的计算软件监控系统 | |
CN113629878B (zh) | 一种配电网三遥开关遥控控制校验方法及系统 | |
CN106534262A (zh) | 一种网络信息系统故障的切换方法 | |
CN112383462B (zh) | 一种网络设备以及总线配置方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |