CN110417623B - 智能变电站以太网交换机故障诊断方法 - Google Patents

智能变电站以太网交换机故障诊断方法 Download PDF

Info

Publication number
CN110417623B
CN110417623B CN201910761135.2A CN201910761135A CN110417623B CN 110417623 B CN110417623 B CN 110417623B CN 201910761135 A CN201910761135 A CN 201910761135A CN 110417623 B CN110417623 B CN 110417623B
Authority
CN
China
Prior art keywords
switch
information
fault
network
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910761135.2A
Other languages
English (en)
Other versions
CN110417623A (zh
Inventor
黎强
杨庆
许平凡
翁铖
谢杰勇
黄嘉颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CYG Sunri Co Ltd
Original Assignee
CYG Sunri Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CYG Sunri Co Ltd filed Critical CYG Sunri Co Ltd
Priority to CN201910761135.2A priority Critical patent/CN110417623B/zh
Publication of CN110417623A publication Critical patent/CN110417623A/zh
Application granted granted Critical
Publication of CN110417623B publication Critical patent/CN110417623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/24Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using dedicated network management hardware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/101Access control lists [ACL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1458Denial of Service

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种智能变电站以太网交换机故障诊断方法,包括以下步骤:A、数据采集,变电站监控系统根据交换机检测信息模型定期获取交换机检测量,交换机检测信息模型包括交换机外部参数、软件配置参数、硬件配置参数和其他类;B、基于上述交换机状态检测量,通过自动检测方法诊断交换机的故障,自动检测方法依次按顺序进行装置外部到交换机检测、交换机软件检测和交换机硬件检测,并对自动检测的结果进行故障判断;C、针对自动检测的故障进行后台监控反馈,提供故障诊断定位并进行故障排除。本发明能让交换机故障诊断更加智能和快速,保证了变电站消缺效率和投运成功。

Description

智能变电站以太网交换机故障诊断方法
技术领域
本发明涉及智能变电站领域,特别涉及一种智能变电站以太网交换机故障诊断方法。
背景技术
随着电力系统的快速发展,基于IEC61850建设的新一代智能变电站已大量投产使用,其自动化程度也迅速提高。作为变电站内的核心装置交换机承担着各种装置的数据交互,而交换机在运行中出现故障常造成各种通讯网络中断、测控装置信息采集错误等,威胁电网安全。一般情况下变电站交换机发生故障时,需要到站厂家人工定位排查,而排查过程容易忽略某些重要信息,导致判断错误。与此同时,在现场收集大量的信息需要消耗大量的时间。这无疑会也增加了智能变电站交换机此类缺陷的消缺时间。
发明内容
本发明的目的在于提供一种智能变电站以太网交换机故障诊断方法,解决交换机故障人工定位易错耗时的问题。
本发明的目的可以这样实现,设计一种智能变电站以太网交换机故障诊断方法,包括以下步骤:
A、数据采集,变电站监控系统根据交换机检测信息模型定期获取交换机检测量,交换机检测信息模型包括交换机外部参数、软件配置参数、硬件配置参数和其他类;
B、基于上述交换机状态检测量,通过自动检测方法诊断交换机的故障,自动检测方法依次按顺序进行装置外部到交换机检测、交换机软件检测和交换机硬件检测,并对自动检测的结果进行故障判断;故障自动诊断方法包括装置到交换机的外观参数、交换机软件配置诊断和交换机硬件配置诊断;
C、针对自动检测的故障进行后台监控反馈,提供故障诊断定位并进行故障排除。
进一步地,定期为5~10秒。
进一步地,外部参数类包括物理链路信息、双工模式信息、光模块信息、告警指示灯信息;软件参数类包括端口VLAN划分信息、端口流量越限信息、端口异常中断信息、报文统计信息、接口错误统计信息、静态组播配置信息、风暴抑制信息、LLDP链路信息、RSTP环网配置信息、SNTP对时信息、61850参数信息、交换机ACL配置信息、IP黑白名单配置信息;硬件参数类信息包括CPU负载率信息、系统内存磁盘使用信息、电源配置信息、板上工作电压信息、内部温度信息;其他类包括交换机EMC信息。
进一步地,所述物理链路信息,用于判断装置到交换机的物理线路连接,包括连接相应装置的双绞线连接了错误的交换机接口、RJ45连接头松脱、网线光纤线出现破损;
所述双工模式信息,用于判断装置到交换机的双工模式,包括自协商、速率;
所述光模块信息,用于判断所使用端口光模块是否正常,包括单模或多模、千兆或百兆;
所述告警指示灯信息,用于判断交换机是否存在告警状态,包括电源配置为非双电源、端口异常中断;
所述端口VLAN划分信息,用于判断端口VLAN划分是否正确,数据传输是否在同一VLAN内;
所述端口流量越限信息,用于判断交换机的端口配置带宽是否超过额定限值;
所述端口异常中断信息,表述为端口所连装置在数据传输过程中突然出现链路中断;
所述报文统计信息,用于判断报文接收信息,包括字节帧长、报文端口收发数目;
所述接口错误统计信息,用于判断所接收不规范报文信息,包括对齐错误、帧校验错误、过长或过短帧、过载冲突;
所述静态组播配置信息,用于判断报文中的组播地址是否在交换机中配置;
所述风暴抑制信息,用于判断交换机网络中广播报文、未知组播和未知单播报文是否配置了抑制值;
所述LLDP链路信息,用于判断交换机是否与相邻交换机设备发生链路中断;
所述RSTP环网配置信息,用于判断交换机网络是否产生环网故障;
所述SNTP对时配置信息,用于判断交换机对时协议是否起效,功能是否正常作用客户端或者服务器端;
所述61850参数配置信息,用于判断交换机是否开启上送61850模型信息;
所述交换机ACL配置信息,用于判断交换机是否配置相关防DOS攻击安全规则;
所述IP黑白名单配置信息,用于判断交换机登录IP是否符合网络安全使用;
所述CPU负载率信息,用于判断交换机CPU使用是否过载;
所述系统内存磁盘使用信息,用于判断交换机系统内存磁盘使用是否过载。
所述电源配置信息,用于判断交换机内部电源是否正常;
所述板上工作电压信息,用于判断交换机内部PCB板上的电压供电是否正常;
所述内部温度信息,用于判断交换机内部是否存在温度过高;
所述EMC信息,用于判断交换机的使用环境是否符合要求。
进一步地,故障自动诊断方法根据采集交换机的状态信息,先从装置到交换机的外观参数诊断,然后根据故障指示,再从交换机的软件配置诊断,最后通过硬件配置的相关信息来诊断交换机。
进一步地,从装置到交换机的外观参数诊断,沿着装置、端口模块、水平线缆、跳线、交换机这样一条路线,对外部参数逐个检查,排除远端故障的可能;
所述交换机的软件配置诊断,根据系统软件配置信息进行排查以确定具体的故障所在;
所述交换机的硬件配置诊断,如果排除了软件系统和配置上的各种可能都不能解决问题,那很有可能就是硬件有问题了,通过硬件的相关信息来诊断交换机。
进一步地,诊断结果反馈包括反馈变电站系统交换机常见的故障以及定位故障点,交换机常见故障包括交换机网络通信中断、交换机网络风暴、交换机满负荷丢帧、交换机网络协议失效、交换机网络安全告警、交换机硬件错误,定位故障点即为步骤B检测状态信息中的异常信息。
进一步地,所述交换机网络通信中断,主要指通过与交换机连接的装置或者后台不能互相通信;
所述交换机网络风暴,主要指交换机网络内有大量广播或非正常报文在传输,最终影响正常的装置通信;
所述交换机满负荷丢帧,主要指交换机网络内传输的数据使用带宽超过交换机满配带宽,导致装置不能正常通信;
所述交换机网络协议失效,主要指交换机使用网络协议并未生效,HTTP/RSTP/LLDP/SNTP/GMRP等协议功能不能正常工作;
所述交换机网络安全告警,主要指交换机受到网络非法攻击或者非法登录交换机进行违规操作;
所述交换机硬件错误,主要指交换机硬件发生错误,导致交换机不能正常开启或者出现档机状态。
进一步地,自动检测包括以下步骤:
S1:后台监控系统根据交换机的状态检测模型,检测装置到交换机的外部参数,检测交换机能否上电正常使用,交换机外观的电源指示灯和运行灯是否正常运行;
S2:检测交换机的物理链路连接是否正确;如果不正确,定位所在端口物理连接错误,反馈交换机网络通信中断故障并进行故障排除;
S3:检测交换机各个端口的光模块配置是否正确;如果不正确,定位所在端口的光模块非正常工作错误,反馈通信中断故障并进行故障排除;
S4:自动检测方法进行交换机的软件配置诊断,检测交换机的端口模式和VLAN划分是否正确;如果不正确,定位所在端口的双工配置或VLAN划分错误,反馈交换机网络通信中断故障并进行故障排除;
S5:检测端口接口统计信息是否出错;如果不正确,定位所在端口的接口统计报文错误,反馈交换机网络通信故障并进行故障排除;
S6:检测端口流量是否越限;如果不正确,定位所在端口的带宽的额定配置错误,反馈交换机满负荷丢帧故障并进行故障排除;
S7:检测交换机静态组播配置是否正确;如果不正确,定位静态组播未配置或者GOOSE报文和SV报文的流量限值配置错误信息,反馈交换机满负荷丢帧故障并进行故障排除;
S8:检测交换机风暴抑制配置是否正确;如果不正确,定位广播报文、未知组播或未知单播报文未配置抑制值错误;反馈交换机网络风暴故障;
S9:检测交换机环网配置是否正确;如果不正确,定位RSTP环网功能是否开启,接入环网的端口非正常工作错误导致网络环网风暴;反馈交换机网络风暴故障;
S10:检测交换机其他网络协议是否配置正确;如果不正确,定位HTTP/LLDP/SNTP/GMRP协议可能未生效;反馈交换机网络协议失效故障并进行故障排除;
S11:检测交换机ACL安全配置是否正确;如果不正确,定位网络攻击报文、非法泛洪报文、非法MAC地址报文;反馈交换机网络安全告警故障并进行故障排除;
S12:检测交换机IP黑白名单配置是否正确;如果不正确,定位登录交换机的IP未符合网络安全规则;反馈交换机网络安全告警故障并进行故障排除;
S13:自动检测方法最后进行交换机的硬件配置诊断,检测交换机的CPU负载率、系统内存磁盘使用信息、电源使用信息、板上工作电压和内部温度信息是否正确;如果不正确,定位交换机硬件配置错误,反馈交换机硬件错误故障并进行返厂维修;
S14:交换机自动检测诊断结果反馈给监控后台,检修人员根据定位故障信息,申请退出异常的线路保护,并对交换机进行现场或者返厂维修。
相较于传统的人工故障定位,本发明能让交换机故障诊断更加智能和快速,保证了变电站消缺效率和投运成功。
附图说明
图1是本发明较佳实施例的流程图;
图2是本发明较佳实施例的结构示意图。
具体实施方式
下面将结合附图及实施例对本发明作进一步说明:
如图2所示,一种智能变电站以太网交换机故障诊断方法,包括以下步骤:
A、数据采集,变电站监控系统根据交换机检测信息模型5~10秒获取交换机检测量,交换机检测信息模型包括交换机外部参数、软件配置参数、硬件配置参数和其他类;
B、基于上述交换机状态检测量,通过自动检测方法诊断交换机的故障,自动检测方法依次按顺序进行装置外部到交换机检测、交换机软件检测和交换机硬件检测,并对自动检测的结果进行故障判断;
C、针对自动检测的故障进行后台监控反馈,提供故障诊断定位并进行故障排除。
外部参数类包括物理链路信息、双工模式信息、光模块信息、告警指示灯等信息;软件参数类包括端口VLAN划分信息、端口流量越限信息、端口异常中断信息、报文统计信息、接口错误统计信息、静态组播配置信息、风暴抑制信息、LLDP链路信息、RSTP环网配置信息、SNTP对时信息、61850参数信息、交换机ACL配置信息、IP黑白名单配置信息等;硬件参数类信息包括CPU负载率信息、系统内存磁盘使用信息、电源配置信息、板上工作电压信息、内部温度等信息;其他类包括交换机EMC信息等。
所述物理链路信息,用于判断装置到交换机的物理线路连接,包括连接相应装置的双绞线连接了错误的交换机接口、RJ45连接头松脱、网线光纤线出现破损。
所述双工模式信息,用于判断装置到交换机的双工模式,包括自协商、速率等。
所述光模块信息,用于判断所使用端口光模块是否正常,包括单模或多模、千兆或百兆。
所述告警指示灯信息,用于判断交换机是否存在告警状态,包括电源配置为非双电源、端口异常中断等。
所述端口VLAN划分信息,用于判断端口VLAN划分是否正确,数据传输是否在同一VLAN内。
所述端口流量越限信息,用于判断交换机的端口配置带宽是否超过额定限值。比如百兆端口额定限值为80Mbps,那么端口数据传输流量不能超过该额定值。
所述端口异常中断信息,表述为端口所连装置在数据传输过程中突然出现链路中断。
所述报文统计信息,用于判断报文接收信息,包括字节帧长、报文端口收发数目等。
所述接口错误统计信息,用于判断所接收不规范报文信息,包括对齐错误、帧校验错误、过长或过短帧、过载冲突等。
所述静态组播配置信息,用于判断报文中的组播地址是否在交换机中配置;比如配置GOOSE和SV报文组播地址,以及其限值是否配置正确,GOOSE报文流量限值2Mbits/s,SV报文流量限值15Mbits/s。
所述风暴抑制信息,用于判断交换机网络中广播报文、未知组播和未知单播报文是否配置了抑制值。
所述LLDP链路信息,用于判断交换机是否与相邻交换机设备发生链路中断。
所述RSTP环网配置信息,用于判断交换机网络是否产生环网故障。
所述SNTP对时信息,用于判断交换机对时协议是否起效,功能是否正常作用客户端或者服务器端。
所述61850参数信息,用于判断交换机是否开启上送61850模型信息。
所述交换机ACL配置信息,用于判断交换机是否配置相关防DOS攻击安全规则;比如各种FLOOD攻击等。
所述IP黑白名单配置信息,用于判断交换机登录IP是否符合网络安全使用。
所述CPU负载率信息,用于判断交换机CPU使用是否过载。
所述系统内存磁盘使用信息,用于判断交换机系统内存磁盘使用是否过载。
所述电源配置信息,用于判断交换机内部电源是否正常。
所述板上工作电压信息,用于判断交换机内部PCB板上的电压供电是否正常。
所述内部温度信息,用于判断交换机内部是否存在温度过高。
所述EMC信息,用于判断交换机的使用环境是否符合要求。
故障自动诊断方法包括装置到交换机的外观参数、交换机软件配置诊断和交换机硬件配置诊断。故障自动诊断方法根据采集交换机的状态信息,先从装置到交换机的外观参数诊断,然后根据故障指示,再从交换机的软件配置诊断,最后通过硬件配置的相关信息来诊断交换机。
由于以太网交换机的一般故障(如:端口故障)都是通过所连接装置而发现的,所以经常从装置开始检查。从装置到交换机的外观参数诊断,沿着装置、端口模块、水平线缆、跳线、交换机这样一条路线,对外部参数逐个检查,排除远端故障的可能。交换机存在故障可以先从外部的各种指示灯上辨别,然后根据故障指示,再来检查软件内部的相应功能是否配置。
所述交换机的软件配置诊断,根据系统软件配置信息进行排查以确定具体的故障所在;无论能否从外观参数找出故障所在,都必须登录交换机从系统配置或系统软件上着手进行排查以确定具体的故障所在,并进行相应的排障措施。
所述交换机的硬件配置诊断,如果排除了软件系统和配置上的各种可能都不能解决问题,那很有可能就是硬件有问题了,通过硬件的相关信息来诊断交换机。
诊断结果反馈包括反馈变电站系统交换机常见的故障以及定位故障点,交换机常见故障包括交换机网络通信中断、交换机网络风暴、交换机满负荷丢帧、交换机网络协议失效、交换机网络安全告警、交换机硬件错误等,所谓的定位故障点即为上述检测状态信息中的异常信息。
所述交换机网络通信中断,主要指通过与交换机连接的装置或者后台不能互相通信。
所述交换机网络风暴,主要指交换机网络内有大量广播或非正常报文在传输,最终影响正常的装置通信。
所述交换机满负荷丢帧,主要指交换机网络内传输的数据使用带宽超过交换机满配带宽,导致装置不能正常通信。
所述交换机网络协议失效,主要指交换机使用网络协议并未生效,HTTP/RSTP/LLDP/SNTP/GMRP等协议功能不能正常工作等。
所述交换机网络安全告警,主要指交换机受到网络非法攻击或者非法登录交换机进行违规操作。
所述交换机硬件错误,主要指交换机硬件发生错误,导致交换机不能正常开启或者出现档机状态。
如图1所示,具体自动检测流程包括以下步骤:
S1:后台监控系统根据交换机的状态检测模型,检测装置到交换机的外部参数,检测交换机能否上电正常使用,交换机外观的电源指示灯和运行灯是否正常运行;
S2:检测交换机的物理链路连接是否正确;如果不正确,定位所在端口物理连接错误,反馈交换机网络通信中断故障并进行故障排除;
S3:检测交换机各个端口的光模块配置是否正确;如果不正确,定位所在端口的光模块非正常工作错误,反馈交换机网络通信中断故障并进行故障排除;
S4:自动检测方法进行交换机的软件配置诊断,检测交换机的端口模式和VLAN划分是否正确;如果不正确,定位所在端口的双工配置或VLAN划分错误,反馈交换机网络通信中断故障并进行故障排除;
S5:检测端口接口统计信息是否出错;如果不正确,定位所在端口的接口统计报文错误,反馈交换机网络通信中断故障并进行故障排除;
S6:检测端口流量是否越限;如果不正确,定位所在端口的带宽的额定配置错误,反馈交换机满负荷丢帧故障并进行故障排除;
S7:检测交换机静态组播配置是否正确;如果不正确,定位静态组播未配置或者GOOSE报文和SV报文的流量限值配置错误信息,反馈交换机满负荷丢帧故障并进行故障排除;
S8:检测交换机风暴抑制配置是否正确;如果不正确,定位广播报文、未知组播或未知单播报文未配置抑制值错误;反馈交换机网络风暴故障;
S9:检测交换机环网配置是否正确;如果不正确,定位RSTP环网功能是否开启,接入环网的端口非正常工作错误导致网络环网风暴;反馈交换机网络风暴故障;
S10:检测交换机其他网络协议是否配置正确;如果不正确,定位HTTP/LLDP/SNTP/GMRP协议可能未生效;反馈交换机网络协议失效故障并进行故障排除;
S11:检测交换机ACL安全配置是否正确;如果不正确,定位网络攻击报文、非法泛洪报文、非法MAC地址报文;反馈交换机网络安全告警故障并进行故障排除;
S12:检测交换机IP黑白名单配置是否正确;如果不正确,定位登录交换机的IP未符合网络安全规则;反馈交换机网络安全告警故障并进行故障排除;
S13:自动检测方法最后进行交换机的硬件配置诊断,检测交换机的CPU负载率、系统内存磁盘使用信息、电源使用信息、板上工作电压和内部温度信息是否正确;如果不正确,定位交换机硬件配置错误,反馈交换机硬件错误故障并进行返厂维修;
S14:交换机的自动检测诊断结果反馈给监控后台,检修人员根据定位故障信息,申请退出异常的线路保护,并对交换机进行现场或者返厂维修。
检修完毕保护投运。
本发明的有益效果:相较于传统的人工故障定位,本发明通过变电站监控系统定期采集交换机的状态检测量,采用自动检测模型对交换机状态检测量进行分析,生成自动诊断的结果,最后将诊断结果反馈给变电站监控系统后台显示并进行故障消除;能让交换机故障诊断更加智能和快速,保证了变电站消缺效率和投运成功。

Claims (7)

1.一种智能变电站以太网交换机故障诊断方法,其特征在于,包括以下步骤:
A、数据采集,变电站监控系统根据交换机检测信息模型定期获取交换机检测量,交换机检测信息模型包括交换机外部参数、软件配置参数、硬件配置参数;外部参数类包括物理链路信息、双工模式信息、光模块信息、告警指示灯信息;软件参数类包括端口VLAN划分信息、端口流量越限信息、端口异常中断信息、报文统计信息、接口错误统计信息、静态组播配置信息、风暴抑制信息、LLDP链路信息、RSTP环网配置信息、SNTP对时信息、61850参数信息、交换机ACL配置信息、IP黑白名单配置信息;硬件参数类信息包括CPU负载率信息、系统内存磁盘使用信息、电源配置信息、板上工作电压信息、内部温度信息;其他类包括交换机EMC信息;
B、基于上述交换机状态检测量,通过自动检测方法诊断交换机的故障,自动检测方法依次按顺序进行装置外部到交换机检测、交换机软件检测和交换机硬件检测,并对自动检测的结果进行故障判断;故障自动诊断方法包括装置到交换机的外观参数、交换机软件配置诊断和交换机硬件配置诊断;
所述物理链路信息,用于判断装置到交换机的物理线路连接,包括连接相应装置的双绞线连接了错误的交换机接口、RJ45连接头松脱、网线光纤线出现破损;
所述双工模式信息,用于判断装置到交换机的双工模式,包括自协商、速率;
所述光模块信息,用于判断所使用端口光模块是否正常,包括单模或多模、千兆或百兆;
所述告警指示灯信息,用于判断交换机是否存在告警状态,包括电源配置为非双电源、端口异常中断;
所述端口VLAN划分信息,用于判断端口VLAN划分是否正确,数据传输是否在同一VLAN内;
所述端口流量越限信息,用于判断交换机的端口配置带宽是否超过额定限值;
所述端口异常中断信息,表述为端口所连装置在数据传输过程中突然出现链路中断;
所述报文统计信息,用于判断报文接收信息,包括字节帧长、报文端口收发数目;
所述接口错误统计信息,用于判断所接收不规范报文信息,包括对齐错误、帧校验错误、过长或过短帧、过载冲突;
所述静态组播配置信息,用于判断报文中的组播地址是否在交换机中配置;
所述风暴抑制信息,用于判断交换机网络中广播报文、未知组播和未知单播报文是否配置了抑制值;
所述LLDP链路信息,用于判断交换机是否与相邻交换机设备发生链路中断;
所述RSTP环网配置信息,用于判断交换机网络是否产生环网故障;
所述SNTP对时信息,用于判断交换机对时协议是否起效,功能是否正常作用客户端或者服务器端;
所述61850参数信息,用于判断交换机是否开启上送61850模型信息;
所述交换机ACL配置信息,用于判断交换机是否配置相关防DOS攻击安全规则;
所述IP黑白名单配置信息,用于判断交换机登录IP是否符合网络安全使用;
所述CPU负载率信息,用于判断交换机CPU使用是否过载;
所述系统内存磁盘使用信息,用于判断交换机系统内存磁盘使用是否过载;
所述电源配置信息,用于判断交换机内部电源是否正常;
所述板上工作电压信息,用于判断交换机内部PCB板上的电压供电是否正常;
所述内部温度信息,用于判断交换机内部是否存在温度过高;
所述EMC信息,用于判断交换机的使用环境是否符合要求;
C、针对自动检测的故障进行后台监控反馈,提供故障诊断定位并进行故障排除。
2.根据权利要求1所述的智能变电站以太网交换机故障诊断方法,其特征在于:步骤A中定期获取交换机检测量,定期为5~10秒。
3.根据权利要求1所述的智能变电站以太网交换机故障诊断方法,其特征在于:故障自动诊断方法根据采集交换机的状态信息,先从装置到交换机的外观参数诊断,然后根据故障指示,再从交换机的软件配置诊断,最后通过硬件配置的相关信息来诊断交换机。
4.根据权利要求3所述的智能变电站以太网交换机故障诊断方法,其特征在于:从装置到交换机的外观参数诊断,沿着装置、端口模块、水平线缆、跳线、交换机这样一条路线,对外部参数逐个检查,排除远端故障的可能;
所述交换机的软件配置诊断,根据系统软件配置信息进行排查以确定具体的故障所在;
所述交换机的硬件配置诊断,如果排除了软件系统和配置上的各种可能都不能解决问题,那很有可能就是硬件有问题了,通过硬件的相关信息来诊断交换机。
5.根据权利要求1所述的智能变电站以太网交换机故障诊断方法,其特征在于:诊断结果反馈包括反馈变电站系统交换机常见的故障以及定位故障点,交换机常见故障包括交换机网络通信中断、交换机网络风暴、交换机满负荷丢帧、交换机网络协议失效、交换机网络安全告警、交换机硬件错误,定位故障点即为步骤B检测状态信息中的异常信息。
6.根据权利要求5所述的智能变电站以太网交换机故障诊断方法,其特征在于:所述交换机网络通信中断,主要指通过与交换机连接的装置或者后台不能互相通信;
所述交换机网络风暴,主要指交换机网络内有大量广播或非正常报文在传输,最终影响正常的装置通信;
所述交换机满负荷丢帧,主要指交换机网络内传输的数据使用带宽超过交换机满配带宽,导致装置不能正常通信;
所述交换机网络协议失效,主要指交换机使用网络协议并未生效,HTTP/RSTP/LLDP/SNTP/GMRP协议功能不能正常工作;
所述交换机网络安全告警,主要指交换机受到网络非法攻击或者非法登录交换机进行违规操作;
所述交换机硬件错误,主要指交换机硬件发生错误,导致交换机不能正常开启或者出现档机状态
7.根据权利要求1所述的智能变电站以太网交换机故障诊断方法,其特征在于,自动检测包括以下步骤:
S1:后台监控系统根据交换机的状态检测模型,检测装置到交换机的外部参数,检测交换机能否上电正常使用,交换机外观的电源指示灯和运行灯是否正常运行;
S2:检测交换机的物理链路连接是否正确;如果不正确,定位所在端口物理连接错误,反馈交换机网络通信中断故障并进行故障排除;
S3:检测交换机各个端口的光模块配置是否正确;如果不正确,定位所在端口的光模块非正常工作错误,反馈通信中断故障并进行故障排除;
S4:自动检测方法进行交换机的软件配置诊断,检测交换机的端口模式和VLAN划分是否正确;如果不正确,定位所在端口的双工配置或VLAN划分错误,反馈交换机网络通信中断故障并进行故障排除;
S5:检测端口接口统计信息是否出错;如果不正确,定位所在端口的接口统计报文错误,反馈交换机网络通信故障并进行故障排除;
S6:检测端口流量是否越限;如果不正确,定位所在端口的带宽的额定配置错误,反馈交换机满负荷丢帧故障并进行故障排除;
S7:检测交换机静态组播配置是否正确;如果不正确,定位静态组播未配置或者GOOSE报文和SV报文的流量限值配置错误信息,反馈交换机满负荷丢帧故障并进行故障排除;
S8:检测交换机风暴抑制配置是否正确;如果不正确,定位广播报文、未知组播或未知单播报文未配置抑制值错误;反馈交换机网络风暴故障;
S9:检测交换机环网配置是否正确;如果不正确,定位RSTP环网功能是否开启,接入环网的端口非正常工作错误导致网络环网风暴;反馈交换机网络风暴故障;
S10:检测交换机其他网络协议是否配置正确;如果不正确,定位HTTP/LLDP/SNTP/GMRP协议未生效;反馈交换机网络协议失效故障并进行故障排除;
S11:检测交换机ACL安全配置是否正确;如果不正确,定位网络攻击报文、非法泛洪报文、非法MAC地址报文;反馈交换机网络安全告警故障并进行故障排除;
S12:检测交换机IP黑白名单配置是否正确;如果不正确,定位登录交换机的IP未符合网络安全规则;反馈交换机网络安全告警故障并进行故障排除;
S13:自动检测方法最后进行交换机的硬件配置诊断,检测交换机的CPU负载率、系统内存磁盘使用信息、电源使用信息、板上工作电压和内部温度信息是否正确;如果不正确,定位交换机硬件配置错误,反馈交换机硬件错误故障并进行返厂维修;
S14:交换机自动检测诊断结果反馈给监控后台,检修人员根据定位故障信息,申请退出异常的线路保护,并对交换机进行现场或者返厂维修。
CN201910761135.2A 2019-08-17 2019-08-17 智能变电站以太网交换机故障诊断方法 Active CN110417623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910761135.2A CN110417623B (zh) 2019-08-17 2019-08-17 智能变电站以太网交换机故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910761135.2A CN110417623B (zh) 2019-08-17 2019-08-17 智能变电站以太网交换机故障诊断方法

Publications (2)

Publication Number Publication Date
CN110417623A CN110417623A (zh) 2019-11-05
CN110417623B true CN110417623B (zh) 2023-03-31

Family

ID=68367879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910761135.2A Active CN110417623B (zh) 2019-08-17 2019-08-17 智能变电站以太网交换机故障诊断方法

Country Status (1)

Country Link
CN (1) CN110417623B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111093124B (zh) * 2019-12-13 2022-02-18 苏州浪潮智能科技有限公司 一种异常定位方法、装置、主干网交换机及可读存储介质
CN111698119B (zh) * 2020-05-07 2023-05-16 深圳市联洲国际技术有限公司 通信模块及其控制方法、通信设备
CN111557676B (zh) * 2020-05-13 2023-12-19 山东省肿瘤防治研究院(山东省肿瘤医院) 放疗过程中由肿瘤的变化动态调整靶区位置的系统及设备
CN114124664A (zh) * 2021-11-23 2022-03-01 上海新炬网络技术有限公司 一种基于日志与设备邻居关系判断网络设备重启的方法
CN114500236A (zh) * 2022-04-15 2022-05-13 北京全路通信信号研究设计院集团有限公司 基于交换机信息状态和日志的设备故障分析方法及装置
CN115086155B (zh) * 2022-06-01 2024-05-14 上海方甸智能科技有限公司 一种基于物联网的设备故障检测诊断方法及系统
CN115622907A (zh) * 2022-09-07 2023-01-17 国网青海省电力公司信息通信公司 线路检测方法、装置、非易失性存储介质和计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203827367U (zh) * 2014-04-22 2014-09-10 贵州电力试验研究院 一种数字化变电站交换机在线监测装置
CN104104558A (zh) * 2014-06-27 2014-10-15 南京国电南自电网自动化有限公司 一种智能变电站过程层通信中网络风暴抑制的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0171385B1 (ko) * 1995-08-05 1999-03-30 양승택 전자식 교환기의 장애 진단 방법
US7447147B2 (en) * 2003-02-28 2008-11-04 Cisco Technology, Inc. Ethernet switch with configurable alarms
CN103916292B (zh) * 2014-04-14 2017-02-15 贵州电力试验研究院 基于iec61850标准的数字化变电站交换机在线监测系统
CN105933249A (zh) * 2016-06-28 2016-09-07 成都启源电子信息技术有限公司 一种以太网交换机自动检测系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203827367U (zh) * 2014-04-22 2014-09-10 贵州电力试验研究院 一种数字化变电站交换机在线监测装置
CN104104558A (zh) * 2014-06-27 2014-10-15 南京国电南自电网自动化有限公司 一种智能变电站过程层通信中网络风暴抑制的方法

Also Published As

Publication number Publication date
CN110417623A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN110417623B (zh) 智能变电站以太网交换机故障诊断方法
CN110380907B (zh) 一种网络故障诊断方法、装置、网络设备及存储介质
CN103872640B (zh) 一种配电自动化终端单元离线故障快速自愈控制方法
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN112468592B (zh) 一种基于电力信息采集的终端在线状态侦测方法及系统
CN103278739B (zh) 一种高压直流输电控制系统Profibus现场总线故障诊断方法
CN110611596B (zh) 一种局域网故障定位系统
CN110995741B (zh) 一种基于电网开关通信数据的极光攻击检测系统、方法
WO2006047583A2 (en) A system for rapid remote management of equipment
CN110752959A (zh) 一种智能变电站过程层物理链路故障定位系统
CN106154071B (zh) 一种检测智能电能表rs485总线故障的装置及方法
US7719992B1 (en) System for proactive time domain reflectometry
EP1733506B1 (en) Fault management in an ethernet based communication system
CN101980478A (zh) 设备故障的检测处理方法、装置和网络设备
Huang A practical guide of troubleshooting IEC 61850 GOOSE communication
CN115051803B (zh) 一种找回智能路由器后台账户密码的系统及方法
CN115242686A (zh) 一种电力二次设备网络通讯故障检测系统及方法
CN114301948A (zh) 一种用于高炉生产的工业控制网络架构
Han et al. Computer network failure and solution
Cisco Overview of Cisco Hub/Ring Manager for Windows
Cisco Overview of Cisco Hub/Ring Manager for Windows
Cisco Overview of Cisco Hub/Ring Manager for Windows
Cisco Overview of Cisco Hub/Ring Manager for Windows
Cisco Overview of Cisco Hub/Ring Manager for Windows
Cisco Overview of Cisco Hub/Ring Manager for Windows

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant