CN114584456A - 一种环网冗余交换机的故障报警方法及装置 - Google Patents
一种环网冗余交换机的故障报警方法及装置 Download PDFInfo
- Publication number
- CN114584456A CN114584456A CN202210258755.6A CN202210258755A CN114584456A CN 114584456 A CN114584456 A CN 114584456A CN 202210258755 A CN202210258755 A CN 202210258755A CN 114584456 A CN114584456 A CN 114584456A
- Authority
- CN
- China
- Prior art keywords
- fault
- ring network
- switch
- ring
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000003993 interaction Effects 0.000 claims abstract description 17
- 230000008878 coupling Effects 0.000 claims description 46
- 238000010168 coupling process Methods 0.000 claims description 46
- 238000005859 coupling reaction Methods 0.000 claims description 46
- 230000015654 memory Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 230000007257 malfunction Effects 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims 2
- 230000006870 function Effects 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 16
- 238000012423 maintenance Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013024 troubleshooting Methods 0.000 description 4
- 238000013523 data management Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/42—Loop networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/42—Loop networks
- H04L12/437—Ring fault isolation or reconfiguration
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Small-Scale Networks (AREA)
Abstract
本发明提供了一种环网冗余交换机的故障报警方法及装置。上述故障报警方法包括:接收各个交换机的状态报文数据,根据各交换机的状态报文数据确定各交换机所在环网的环网类型以及各环网的特定交换机;根据各特定交换机的状态报文数据判断各环网是否发生故障以及故障类型;对于每一个故障环网,根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,故障信息包括故障交换机和故障原因;根据故障信息生成报警信息,报警信息包括文字形式和拓扑图形式的故障信息;以及将报警信息输出至对应的人机交互界面。根据本发明,能够及时、准确地进行故障报警,并且报警信息形式多样,一目了然,便于用户快速了解故障细节。
Description
技术领域
本发明涉及故障报警领域,尤其涉及环网冗余交换机的故障报警方法及装置。
背景技术
随着工业以太网技术的广泛应用,为提高工业以太网可靠性,达到工业控制领域对以太网可靠性的要求,环网冗余技术得到了越来越多的重视。环网冗余是一种以太网高速冗余技术。此项技术能够保证网络在遇到故障时,通讯能在极短时间内恢复。
传统的环网冗余交换机发生故障时通过出错继电器、指示灯或SNMP发出警报,这需要值班人员24小时值守,如果运维人员不在现场,不容易得知环网发生故障,即便在现场,排查故障需要花费大量时间,工作效率低,而且运维成本高。
现有技术中存在有一种具有短信监控功能的环网冗余交换机,解决了传统环网冗余交换机需要运维人员随时在场的弊端。但这类具有短信监控功能的环网冗余交换机仅仅通过文本信息提醒运维人员当前环网冗余交换机可能出现故障,运维人员还是需要在抵达现场后花费大量时间排查故障,没有彻底提高运维效率、降低运维成本。
有鉴于此,希望能够提供一种环网冗余交换机的故障报警方法及装置,能够在发现故障后及时通知运维人员,并且能够提供足够的故障信息,减少故障的误报或者漏报,以帮助运维人员快速排查故障,提高工作效率和信息准确性。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
为了解决现有技术中,环网冗余交换机的故障提示不够及时、准确,运维人员在获悉发生故障后,仍然需要花费精力进行故障排查的问题,本发明提供了一种环网冗余交换机的故障报警方法及装置。
本发明的一方面提供了一种环网冗余交换机的故障报警方法,应用于云服务器,所述故障报警方法包括:接收各个交换机的状态报文数据,并根据各所述交换机的状态报文数据确定各个交换机所在环网的环网类型以及各个环网的特定交换机;根据各个特定交换机的状态报文数据判断各个环网是否发生故障以及故障类型;对于每一个故障环网,根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,所述故障信息包括发生故障的故障交换机和故障原因;根据所述故障信息生成报警信息,所述报警信息包括文字形式和拓扑图形式的故障信息;以及将所述报警信息输出至对应的人机交互界面。
在上述故障报警方法的一实施例中,可选地,接收各所述交换机基于第一预设频率输出的状态报文数据;或者接收各所述交换机响应于存在出现断点的交换机而输出的状态报文数据。
在上述故障报警方法的一实施例中,可选地,响应于所述故障环网存在多种类型的故障,根据所述故障环网的故障类型的优先级优先输出优先级最高的故障对应的报警信息。
在上述故障报警方法的一实施例中,可选地,将所述报警信息输出至对应的人机交互界面进一步包括:将所述报警信息基于与所述故障类型的优先级对应的第二预设频率重复输出至对应的人机交互界面,直至接收到用户的确认指令或所述故障环网修复了故障。
在上述故障报警方法的一实施例中,可选地,所述故障类型按优先级从高到低依次包括:冲突故障、直接故障、间接故障、离线故障、未知故障。
在上述故障报警方法的一实施例中,可选地,所述环网类型包括:单环网、双切环网、双归环网、环耦合环网;其中,响应于所述环网为所述单环网或所述双切环网,所述单环网或所述双切环网的特定交换机为各独立回环的主站;响应于所述环网为所述双归环网,所述双归环网的特定交换机为双归环控制端;响应于所述环网为所述环耦合环网,所述环耦合环网的特定交换机为环耦合主、备节点。
本发明的另一方面还提供了一种环网冗余交换机的故障报警装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现:接收各个交换机的状态报文数据,并根据各所述交换机的状态报文数据确定各个交换机所在环网的环网类型以及各个环网的特定交换机;根据各个特定交换机的状态报文数据判断各个环网是否发生故障以及故障类型;对于每一个故障环网,根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,所述故障信息包括发生故障的故障交换机和故障原因;根据所述故障信息生成报警信息,所述报警信息包括文字形式和拓扑图形式的故障信息;以及将所述报警信息输出至对应的人机交互界面。
在上述故障报警装置的一实施例中,可选地,所述故障报警装置接收各所述交换机基于第一预设频率输出的状态报文数据;或者所述故障报警装置接收各所述交换机响应于存在出现断点的交换机而输出的状态报文数据。
在上述故障报警装置的一实施例中,可选地,响应于所述故障环网存在多种类型的故障,所述故障报警装置根据所述故障环网的故障类型的优先级优先输出优先级最高的故障对应的报警信息。
在上述故障报警装置的一实施例中,可选地,所述故障报警装置将所述报警信息输出至对应的人机交互界面进一步包括:将所述报警信息基于与所述故障类型的优先级对应的第二预设频率重复输出至对应的人机交互界面,直至接收到用户的确认指令或所述故障环网修复了故障。
在上述故障报警装置的一实施例中,可选地,所述故障类型按优先级从高到低依次包括:冲突故障、直接故障、间接故障、离线故障、未知故障。
在上述故障报警装置的一实施例中,可选地,所述环网类型包括:单环网、双切环网、双归环网、环耦合环网;其中,响应于所述环网为所述单环网或所述双切环网,所述单环网或所述双切环网的特定交换机为各独立回环的主站;响应于所述环网为所述双归环网,所述双归环网的特定交换机为双归环控制端;响应于所述环网为所述环耦合环网,所述环耦合环网的特定交换机为环耦合主、备节点。
本发明的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任意一项实施例所描述的环网冗余交换机的故障方法。
根据本发明所提供的环网冗余交换机的故障报警方法和装置,能够及时、准确地进行故障报警,并且报警信息形式多样,一目了然,便于运维人员快速了解故障细节,从而及时解除故障,使环网冗余交换机恢复正常工作。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了本发明的一方面所提供的环网冗余交换机的故障报警方法的应用场景。
图2示出了本发明的一方面所提供的环网冗余交换机的故障报警方法的流程示意图。
图3A-3D分别示出了本发明中的环网冗余交换机所组环网的形态。
图4示出了单环网、双切环网的故障分析流程示意图。
图5示出了双归环网的故障分析流程示意图。
图6示出了环耦合环网的故障分析流程示意图。
图7示出了本发明的另一方面所提供的故障报警装置的结构示意图。
附图标记
100-108 交换机;
200 云服务器;
300 用户端;
400 故障报警装置;
401 存储器;
402 处理器;
403 总线;
404 随机存取存储器;
405 高速缓存存储器;
406 存储系统;
407 程序模块;
408 外部设备;
409 显示器;
410 输入/输出(I/O)接口;
411 网络适配器;。
具体实施方式
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
给出以下描述以使得本领域技术人员能够实施和使用本发明并将其结合到具体应用背景中。各种变型、以及在不同应用中的各种使用对于本领域技术人员将是容易显见的,并且本文定义的一般性原理可适用于较宽范围的实施例。由此,本发明并不限于本文中给出的实施例,而是应被授予与本文中公开的原理和新颖性特征相一致的最广义的范围。
在以下详细描述中,阐述了许多特定细节以提供对本发明的更透彻理解。然而,对于本领域技术人员显而易见的是,本发明的实践可不必局限于这些具体细节。换言之,公知的结构和器件以框图形式示出而没有详细显示,以避免模糊本发明。
请读者注意与本说明书同时提交的且对公众查阅本说明书开放的所有文件及文献,且所有这样的文件及文献的内容以参考方式并入本文。除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。
注意,在使用到的情况下,标志左、右、前、后、顶、底、正、反、顺时针和逆时针仅仅是出于方便的目的所使用的,而并不暗示任何具体的固定方向。事实上,它们被用于反映对象的各个部分之间的相对位置和/或方向。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
注意,在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
如上文所描述的,为了解决现有技术中,环网冗余交换机的故障提示不够及时、准确,运维人员在获悉发生故障后,仍然需要花费精力进行故障排查的问题,本发明提供了一种环网冗余交换机的故障报警方法及装置。利用云平台的大型网络数据库的优势,可以保存每个工业环网冗余交换机的原始数据,实现对环网冗余交换机的实时监控和报警功能,报警信息不仅包含文本信息,还包含了环网冗余交换机的故障拓扑图。
首先,请结合图1来理解本发明所提供的故障报警方法的应用场景。如图1所示出的,本发明的一方面所提供的故障报警方法应用于云服务器200(或简称为云端、云平台),用以对环网冗余交换机(简称交换机100)的故障情况进行分析,从而能够在交换机100出现故障的时候,向用户端300发送报警信息,从而使运维人员能够基于用户端300及时、准确、详细地了解故障情况,从而便于用户快速排除故障。
换句话说,可以认为交换机100属于设备层,是故障报警方法的数据源基础,需要将其数据通过工业以太网实时上传到云服务器。云服务器200属于数据处理层,系统应用层,主要执行数据处理、数据交换和数据存储。在数据处理层,云服务器用于管理交换机数据的存储和分析,并将分析后的报警结果发送给用户。在系统应用层,云服务器可以实现包括用户认证管理、历史数据管理、实时数据查询和报警信息发布,实现用户对数据的查询和报警信息的获取。用户端300则属于用户层,用户可以通过计算机,移动电话和其他智能设备的人机交互界面获取当前的报警信息和查看交换机实时数据。
进一步的,如图2所示出的,本发明的一方面所提供的故障报警方法包括步骤:
S100:接收各个交换机的状态报文数据,并根据各所述交换机的状态报文数据确定各个交换机所在环网的环网类型以及各个环网的特定交换机;
S200:根据各个特定交换机的状态报文数据判断各个环网是否发生故障以及故障类型;
对于每一个故障环网,还包括步骤:
S310:根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,所述故障信息包括发生故障的故障交换机和故障原因;
S320:根据所述故障信息生成报警信息,所述报警信息包括文字形式和拓扑图形式的故障信息;以及
S332:将所述报警信息输出至对应的人机交互界面。
在步骤S100中,首先,云服务器200接受各交换机输出的状态报文数据。对于交换机而言,各个交换机至少包括数据检测模块和数据发送模块。数据发送模块可以采用现有或将有的能够发送数据的通信模块,包括但不限于wifi模块或者2G、3G、4G、5G移动网络模块。
在组成环网后,各个交换机通过数据检测模块检测环网是否有断点,即形成环网后,交换机自己会检测端口上已经连接的设备,如检测不到,则认为发生断点。若有断点,交换机立即通过数据发送模块发送状态报文数据到云端,并切换至备用路径。当环网恢复正常后,交换机切换回主路径。通过使交换机在出现断点后立刻发送状态报文数据到云端,能够使得云端及时发现交换机发生故障,从而能够及时报告故障情况。
若没有断点,在一实施例中,设置使交换机按照一定预设频率发送一次状态报文数据,例如,可以在100ms~5s内设定间隔发送状态报文数据的时间。可以理解的是,通过周期上报数据,可周期性地、时刻关注到交换机的工作状态,能够使云服务器及时注意到例如设备离线这样的故障,从而能够减少故障漏报的现象。
所述数据发送模块发送的状态报文数据包括网络参数、设备配置信息、环网状态以及端口状态信息等。网络参数包含ip地址、MAC地址和子网掩码等。设备配置信息包含产品型号和序列号等。环网状态包含环网连接状态、是否使能等。端口状态信息包含第一端口号、第二端口号、主端口号、备端口号、与哪一台环网交换机的哪一个端口连接在一起等。
各个环网冗余交换机100所在环网的环网类型可以是实现配置好的。用户可以根据使用需求将环网冗余交换机配置为单环网、双切环网、双归环网和环耦合环网等四种环网结构类型。而云服务器200根据各个交换机所发送的状态报文数据,尤其是环网状态和端口状态信息,能够确定出各个交换机所在环网的环网类型,以及各个环网的特定交换机。
请进一步结合图3来理解本发明中所适用的四种类型的环网结构以及其中的特定交换机。首先,图3A示意了单环网的环网结构,单环网是指多个交换机(图3A中示意了四个交换机101-104,在其他实施例中,组成环网的交换机的数量不限于4个)组成一个单独的回环,每个单独的回环具有一个独立的主站,如图3A中的交换机101,其余的交换机102-104均为从站。在单环网中,特定交换机为各个独立回环的主站,即交换机101。
图3B示意了双切环网的环网结构。双切环网由两个独立环网组成,其中有一个交换机同时作为两个独立环网的从站。如图3B所示意的,交换机101-104组成一个回环(换1)、交换机104-107组成一个回环(环2),其中交换机101为环1的主站,交换机105为环2的主站。而交换机104则同时作为两个回环的从站。在双切环网中,特定交换机为各个独立回环的主站,即交换机101、105。
图3C示意了双归环网的环网结构。双归环网由两个环网组成,交换机101-104组成一个独立的回环(环1,交换机101为主站)、交换机105-108组成一个独立的回环(环2,交换机105为主站),其中一个环(例如环1)上的一个交换机从站(交换机104)作为双归环控制端,双归环控制端(交换机104)与环2的主站(交换机105)和环2的一个从站(交换机107)连接。双归环网的特定交换机为双归环控制端,即交换机104。
图3D示意了环耦合环网的环网结构。环耦合环网由两个环网组成,交换机101-104组成一个独立的回环(环1,交换机101为主站)、交换机105-108组成一个独立的回环(环2,交换机105为主站)。其中一个环(例如环1)设置有环耦合主、备节点,该环的主站,即交换机101为环耦合主节点,该环的一个从站,即交换机103为环耦合备节点。具有环耦合主、备节点的环的环耦合主节点交换机101与环2的主站交换机105连接,环耦合备节点交换机103与环2的从站交换机107连接。环耦合环网的特定交换机为环耦合主、备节点,即交换机101、103。
在步骤S200中,云服务器200根据各个特定交换机的状态报文数据,尤其是其中的环网状态以及端口状态来判断各个环网是否发生故障以及故障类型。
在本发明中,基于四种环网结构类型,定义了以下五种故障类型,当故障发生时,云服务器能够根据交换机的状态报文数据中环网状态和端口状态来确定故障类型。
故障类型A:冲突故障,一个环网上存在两台或以上的主站,环耦合存在两台或以上主节点交换机、没有备节点交换机、存在两台或以上备节点交换机。
故障类型B:直接故障,与当前交换机相连的端口链路出现故障。
故障类型C:间接故障,环网或环耦合出现故障,故障点不在当前交换机相连的端口链路上。
故障类型D:离线故障,当服务器连续预设次数(例如五次)检测不到某一设备的数据,则认定该设备离线。
故障类型E:未知故障,如果出现与上述几种故障均不吻合的故障,则认定为未知故障。
进一步的,本发明中,对上述的五种故障类型分别定义了发生故障时,进行报警的优先级,其中,故障类型A的报警优先级最高,随后依次是故障类型B、C、D、E。
在一实施例中,若某一故障环网同时发生了多种故障,在步骤S330输出报警信息至对应的人机交互界面时,首先发送高优先级的报警信息。例如,环耦合环的故障B和故障C是同时发生的,由于故障B的优先级较高,在输出报警信息时,优先输出故障B对应的报警信息。当用户在人机交互界面查看到故障报警信息时,首先看到的是故障B的报警信息,随后是故障C的报警信息。或者说,在同一个交互界面同时能够显示故障B和故障C的报警信息时,故障B的报警信息显示在前段。以方便用户优先处理优先级高的故障。
在另一实施例中,响应于发生了故障,在步骤S330中,会根据故障类型的优先级对应的第二预设频率重复多次输出报警信息至人机交互界面,直至接收到用户确认已经知晓故障的确认指令或者故障环网修复了故障才停止发送故障信息,以免用户错过相关报警信息。
上述与优先级对应的第二预设频率可以根据用户的需要预先设定,例如,在一实施例中,用户设定故障类型A、B、C的故障报警信息的发送频率为每30s一次,故障D的故障报警信息的发送频率为每60s一次,而故障E的故障报警信息的发送频率为每120s一次。从而能够结合故障的紧急程度调整故障报警的频率。
请结合图4-6来进一步理解本发明的步骤S310和步骤S320的具体实现方式。其中,图4示出了单环网、双切环网的故障分析流程示意图。图5示出了双归环网的故障分析流程示意图。图6示出了环耦合环网的故障分析流程示意图。
单环网与双切环网拥有同样的故障种类,故障分析流程如图4所示出的,首先,分析上传故障的环1/环2主站,即分析环网中主站的环网状态和端口状态。出现故障A时,由于此时是分析了上报故障的主站信息,步骤S310中确定的、步骤S320中文字描述的故障信息为“单环中存在多个主站(交换机X和Y),发生冲突”。
当主站出现故障B时,说明有环网功能端口连接断开,先检测主站的第一端口与第二端口是否全部断开,如果全部断开,则步骤S310中确定的、步骤S320中文字描述的故障信息为“主站第一、第二端口之间连接断开”。如果主站只有一个端口断开,则进一步分析该环网中报告故障B的从站交换机(从站X),并检测出连接断开的环网功能端口,从而在步骤S310中确定的、步骤S320中文字描述的故障信息为“哪一个交换机的哪一个端口与哪一个交换机的哪一个端口之间的连接已断开”。当主站出现故障C时,说明有两个从站(从站Y、从站Z)之间的连接断开,查看该环网中报告故障B的从站交换机,并检测出连接断开的环网功能端口,从而在步骤S310中确定的、步骤S320中文字描述的故障信息为“哪一个交换机的哪一个端口与哪一个交换机的哪一个端口之间的连接已断开”。
在上述的步骤S320中,进一步的,由于已经十分明确环网的形态,可以直观地采用拓扑图(如图3A所示意的)来表征故障信息,即在拓扑图中示意出发生故障的交换机及故障原因。从而能够非常快速地帮助用户锁定出现故障的交换机和故障原因。
双归环网特有的故障为故障B,其故障分析流程如图5所示出的,当双归环网故障发生时,先检测特殊节点(即特定交换机,双归环控制端,图3C中的交换机104)的故障上报情况和配置了双归环功能的端口(图3C中的交换机105、107)连接状况,如果特定交换机上报了故障B并且检测到配置了双归环网功能的端口连接断开,则在步骤S310中确定的、步骤S320中文字描述的故障信息为“双归环特殊节点的哪一个/全部端口已断开”。如果不是出现上述情况,则按照单环网的故障分析思路来分析故障。
在上述的步骤S320中,进一步的,由于已经十分明确环网的形态,可以直观地采用拓扑图(如图3C所示意的)来表征故障信息,即在拓扑图中示意出发生故障的交换机及故障原因。从而能够非常快速地帮助用户锁定出现故障的交换机和故障原因。
随后请参考图6来理解环耦合环网故障分析流程,环耦合环网的一个单环中主节点与备节点必须成对出现(一个主节点与一个备节点为一对),且最多有一对主、备节点。
首先对环耦合环进行解耦,即分析是否是单环网中的故障A,如果是,做出与单环网的相同处理;分析是否是单环网中的故障B、C,如果是,做出与单环网的相同处理。环耦合环网的故障B、C总是同时出现,主节点出现故障B,备节点就会出现故障C;主节点出现故障C,备节点就会出现故障B。由于故障B、C总是同时出现,可以通过两步判断来更好地进行故障分析,即出现故障B,进一步分析故障C,出现故障C,进一步分析故障B。
由于是在环耦合环中出现故障B、C,需要进一步分析出现故障B的交换机是否为主、备节点,再分析该交换机的环耦合功能端口连接是否断开,之后分析出现故障C的交换机是否为备、主节点,环耦合功能端口连接是否完好。
如果报告故障B的主、备节点的环耦合功能端口连接断开,报告故障C的备、主节点的环耦合功能端口连接完好,应根据情况在步骤S310中确定的、步骤S320中文字描述的故障信息为“主节点的环耦合功能端口连接断开”、“备节点的环耦合功能端口连接断开”。
如果主、备节点同时报告故障B,且主、备节点的环耦合功能端口连接全部断开,在步骤S310中确定的、步骤S320中文字描述的故障信息为“主节点与备节点的环耦合功能端口连接全部断开”。
在上述的步骤S320中,进一步的,由于已经十分明确环网的形态,可以直观地采用拓扑图(如图3D所示意的)来表征故障信息,即在拓扑图中示意出发生故障的交换机及故障原因。从而能够非常快速地帮助用户锁定出现故障的交换机和故障原因。
当云服务器200连续预设次数检测不到某一设备的定时报文(即前文描述的交换机按照第一预设频率向云服务器发送的状态报文数据),则认定该设备离线,在步骤S310中确定的、步骤S320中文字描述的故障信息为“设备(交换机X)离线”。并且在步骤S320中,可以直观地采用拓扑图来表征离线的设备。从而能够非常快速地帮助用户锁定出现故障的交换机和故障原因。
如果出现与上述几种故障均不吻合的故障,则认定为未知故障,在步骤S310中确定的、步骤S320中文字描述的故障信息为“出现未知故障”。
至此已经描述的本发明的一方面所提供的故障报警方法。根据本发明所提供的环网冗余交换机的故障报警方法,能够及时、准确地进行故障报警,并且报警信息形式多样,一目了然,便于运维人员快速了解故障细节,从而及时解除故障,使环网冗余交换机恢复正常工作。
本发明的另一方面还提供了一种环网冗余交换机的故障报警装置400,即上文中的云服务器200。云服务器采用SaaS服务模式,包含数据处理层和系统应用层。
云服务器的系统应用层包含用户认证管理、历史数据管理、实时数据查询和报警信息发布功能。用户认证管理模块主要管理用户的账号、密码等身份认证信息。历史数据管理模块用于调用和管理上传到云平台的交换机设备配置信息、环网状态以及端口状态等历史数据;实时数据查询模块提供可让用户实时监控交换机状态。报警信息发布模块根据不同的故障类型和报警级别,发送报警信息给用户。当用户确认此次报警信息后,云平台将不再发送该报警信息。故障修复后会发送故障恢复信息给用户,恢复信息只发送一次。
数据处理层包含共享数据库和环网故障分析,数据存储在共享数据库中时,为不同的企业和用户分配了相应的ID,通过该ID对用户数据进行分类以保证不同的企业和用户之间数据的安全性。
云服务器200处于交换机100和用户端300之间,将交换机100的相关状态数据发送至用户端300。
用户端300可以包括移动电话和其他智能设备,用户可以经由用户端300的人机交互界面实时监控和查看环网冗余交换机信息。发生故障时,用户可接收到故障报警信息,报警信息包含对故障的文字描述、一个“故障拓扑图”按钮和一个“确认报警信息”按钮,点击“故障拓扑图”按钮可显示完整的环网拓扑图,图中显示发生故障的设备变成红色并闪烁,点击“确认报警信息”按钮后云平台不再发送报警,通过报警信息中对故障的描述以及故障拓扑图中的环网拓扑图能够判断出故障发生的位置以及原因。在故障恢复后,用户可以及时获悉环网故障恢复信息。
进一步的,如图7所示,本实施例中,故障报警装置400以通用的计算机设备的形式表现,用于实现上述任意一种实施例所描述的环网冗余交换机的故障报警方法的步骤。具体请详见上文关于环网冗余交换机的故障报警方法的描述,在此不再赘述。
该故障报警装置400的组件可以包括一个或者多个存储器401,一个或多个处理器402,以及连接不同系统组件(包括存储器401和处理器402)的总线403。
总线403包括数据总线、地址总线以及控制总线。数据总线的位数与工作频率的乘积正比于数据传输率,地址总线的位数决定了可寻址的最大内存空间,控制总线(读/写)指出总线周期的类型和本次输入/输出操作完成的时刻。处理器402通过总线403连接存储器401,并配置用于实施上述任意一个实施例所提供的环网冗余交换机的故障报警方法。
处理器402作为故障报警装置400的运算和控制核心,是信息处理、程序运行的最终执行单元。计算机系统中所有软件层的操作,最终都将通过指令集映射为处理器402的操作。处理器402的功效主要为处理指令、执行操作、控制时间、处理数据。
存储器401是指计算机中由存放程序和数据的各种存储设备。存储器401可以包括存储易失性存储器形式的计算机系统可读介质。例如随机存取存储器(RAM)404和/或高速缓存存储器405。
随机存取存储器(RAM)404是与处理器402直接交换数据的内部存储器。它可以随时读写(刷新时除外),而且速度很快,通常作为操作系统或其他正在运行中的程序的临时数据存储介质,一旦断电其中所存储的数据将随之丢失。高速缓存存储器(Cache)405是存在于主存与处理器402之间的一级存储器,其容量比较小但速度比主存高得多,接近于处理器402的速度。
需要注意的是,在故障报警装置400包括多个存储器401和多个处理器402的情况下,多个存储器401之间和多个处理器402之间都可以具有分布式的结构,例如,位于不同物理位置的多端的存储器和处理器,由多端共同实现上述的环网冗余交换机的故障报警方法。更进一步的,在采用分布式结构的实施例中,各个步骤可以根据实际情况调整具体的执行终端,各个步骤在特定终端实现的具体方案不应不当地限制本发明的保护范围。
故障报警装置400还可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。本实施例中,存储系统406可以用于读写不可移动的、非易失性磁介质。
存储器401还可以包括至少一组程序模块407。程序模块407可以存储在存储器401中。程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
故障报警装置400也可以与一个或多个外部设备408通信。本实施例中的外部设备408包括交换机100和用户端300等。外部设备408还包括显示器409,在实施环网冗余交换机的故障报警方法时,故障报警装置400可以通过显示器409显示云服务器的工作状态。
故障报警装置400也可与一个或者多个使得用户能与该故障报警装置400交互的设备通信,和/或与使得该故障报警装置400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口410进行。
故障报警装置400还可以通过网络适配器411与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,如因特网)通信。如图2所示,网络适配器411通过总线403与故障报警装置400的其它模块通信。应当明白,尽管图中未示出,可以结合故障报警装置400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
至此,已经描述了本发明所提供的环网冗余交换机的故障报警方法和装置,根据本发明,能够及时、准确地进行故障报警,并且报警信息形式多样,一目了然,便于运维人员快速了解故障细节,从而及时解除故障,使环网冗余交换机恢复正常工作。
本发明的另一方面还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现如上文任意一项实施例所描述的环网冗余交换机的故障报警方法的步骤,具体请参考上文的描述,在此不再赘述。
结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟
(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供之前的描述是为了使本领域中的任何技术人员均能够实践本文中所描述的各种方面。但是应该理解,本发明的保护范围应当以所附权利要求书为准,而不应被限定于以上所解说实施例的具体结构和组件。本领域技术人员在本发明的精神和范围内,可以对各实施例进行各种变动和修改,这些变动和修改也落在本发明的保护范围之内。
Claims (13)
1.一种环网冗余交换机的故障报警方法,应用于云服务器,其特征在于,所述故障报警方法包括:
接收各个交换机的状态报文数据,并根据各所述交换机的状态报文数据确定各个交换机所在环网的环网类型以及各个环网的特定交换机;
根据各个特定交换机的状态报文数据判断各个环网是否发生故障以及故障类型;
对于每一个故障环网,
根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,所述故障信息包括发生故障的故障交换机和故障原因;
根据所述故障信息生成报警信息,所述报警信息包括文字形式和拓扑图形式的故障信息;以及
将所述报警信息输出至对应的人机交互界面。
2.如权利要求1所述的故障报警方法,其特征在于,接收各所述交换机基于第一预设频率输出的状态报文数据;或者
接收各所述交换机响应于存在出现断点的交换机而输出的状态报文数据。
3.如权利要求1所述的故障报警方法,其特征在于,响应于所述故障环网存在多种类型的故障,根据所述故障环网的故障类型的优先级优先输出优先级最高的故障对应的报警信息。
4.如权利要求1所述的故障报警方法,其特征在于,将所述报警信息输出至对应的人机交互界面进一步包括:
将所述报警信息基于与所述故障类型的优先级对应的第二预设频率重复输出至对应的人机交互界面,直至接收到用户的确认指令或所述故障环网修复了故障。
5.如权利要求3或4所述的故障报警方法,其特征在于,所述故障类型按优先级从高到低依次包括:冲突故障、直接故障、间接故障、离线故障、未知故障。
6.如权利要求1所述的故障报警方法,其特征在于,所述环网类型包括:单环网、双切环网、双归环网、环耦合环网;其中,
响应于所述环网为所述单环网或所述双切环网,所述单环网或所述双切环网的特定交换机为各独立回环的主站;
响应于所述环网为所述双归环网,所述双归环网的特定交换机为双归环控制端;
响应于所述环网为所述环耦合环网,所述环耦合环网的特定交换机为环耦合主、备节点。
7.一种环网冗余交换机的故障报警装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现:
接收各个交换机的状态报文数据,并根据各所述交换机的状态报文数据确定各个交换机所在环网的环网类型以及各个环网的特定交换机;
根据各个特定交换机的状态报文数据判断各个环网是否发生故障以及故障类型;
对于每一个故障环网,
根据环网类型、故障类型以及该故障环网中至少一个交换机的状态报文数据确定故障信息,所述故障信息包括发生故障的故障交换机和故障原因;
根据所述故障信息生成报警信息,所述报警信息包括文字形式和拓扑图形式的故障信息;以及
将所述报警信息输出至对应的人机交互界面。
8.如权利要求7所述的故障报警装置,其特征在于,所述故障报警装置接收各所述交换机基于第一预设频率输出的状态报文数据;或者
所述故障报警装置接收各所述交换机响应于存在出现断点的交换机而输出的状态报文数据。
9.如权利要求7所述的故障报警装置,其特征在于,响应于所述故障环网存在多种类型的故障,所述故障报警装置根据所述故障环网的故障类型的优先级优先输出优先级最高的故障对应的报警信息。
10.如权利要求7所述的故障报警装置,其特征在于,所述故障报警装置将所述报警信息输出至对应的人机交互界面进一步包括:
将所述报警信息基于与所述故障类型的优先级对应的第二预设频率重复输出至对应的人机交互界面,直至接收到用户的确认指令或所述故障环网修复了故障。
11.如权利要求9或10所述的故障报警装置,其特征在于,所述故障类型按优先级从高到低依次包括:冲突故障、直接故障、间接故障、离线故障、未知故障。
12.如权利要求7所述的故障报警装置,其特征在于,所述环网类型包括:单环网、双切环网、双归环网、环耦合环网;其中,
响应于所述环网为所述单环网或所述双切环网,所述单环网或所述双切环网的特定交换机为各独立回环的主站;
响应于所述环网为所述双归环网,所述双归环网的特定交换机为双归环控制端;
响应于所述环网为所述环耦合环网,所述环耦合环网的特定交换机为环耦合主、备节点。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的环网冗余交换机的故障方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210258755.6A CN114584456A (zh) | 2022-03-16 | 2022-03-16 | 一种环网冗余交换机的故障报警方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210258755.6A CN114584456A (zh) | 2022-03-16 | 2022-03-16 | 一种环网冗余交换机的故障报警方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114584456A true CN114584456A (zh) | 2022-06-03 |
Family
ID=81780490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210258755.6A Pending CN114584456A (zh) | 2022-03-16 | 2022-03-16 | 一种环网冗余交换机的故障报警方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114584456A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680397A (en) * | 1995-03-13 | 1997-10-21 | International Business Machines Corporation | Multi-port LAN switch for a token-ring network |
CN101483570A (zh) * | 2009-02-17 | 2009-07-15 | 杭州华三通信技术有限公司 | 一种防止中继链路的环网临时环路的方法、系统及设备 |
CN102223277A (zh) * | 2010-04-15 | 2011-10-19 | 上海和旭电子科技有限公司 | 一种铁路客运专线站间通信网络设计方案 |
CN102891771A (zh) * | 2012-11-02 | 2013-01-23 | 淮南矿业(集团)有限责任公司 | 监控环网故障检测定位报警装置、系统和方法 |
CN105353272A (zh) * | 2015-11-10 | 2016-02-24 | 四川东方电气自动控制工程有限公司 | 一种风力发电场单环网多点故障快速定位方法 |
US20160072688A1 (en) * | 2014-09-08 | 2016-03-10 | Mayank DESAI | Fault monitoring in multi-domain networks |
CN106161114A (zh) * | 2016-08-31 | 2016-11-23 | 北京信而泰科技股份有限公司 | 支持故障点快速定位的以太网环网模块 |
-
2022
- 2022-03-16 CN CN202210258755.6A patent/CN114584456A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680397A (en) * | 1995-03-13 | 1997-10-21 | International Business Machines Corporation | Multi-port LAN switch for a token-ring network |
CN101483570A (zh) * | 2009-02-17 | 2009-07-15 | 杭州华三通信技术有限公司 | 一种防止中继链路的环网临时环路的方法、系统及设备 |
CN102223277A (zh) * | 2010-04-15 | 2011-10-19 | 上海和旭电子科技有限公司 | 一种铁路客运专线站间通信网络设计方案 |
CN102891771A (zh) * | 2012-11-02 | 2013-01-23 | 淮南矿业(集团)有限责任公司 | 监控环网故障检测定位报警装置、系统和方法 |
US20160072688A1 (en) * | 2014-09-08 | 2016-03-10 | Mayank DESAI | Fault monitoring in multi-domain networks |
CN105353272A (zh) * | 2015-11-10 | 2016-02-24 | 四川东方电气自动控制工程有限公司 | 一种风力发电场单环网多点故障快速定位方法 |
CN106161114A (zh) * | 2016-08-31 | 2016-11-23 | 北京信而泰科技股份有限公司 | 支持故障点快速定位的以太网环网模块 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018126645A1 (zh) | 一种通信网络管理方法及其装置 | |
US20200162283A1 (en) | Method and system for transmitting train network data based on canopen protocol, and apparatus thereof | |
WO2016045353A1 (zh) | 一种故障诊断分析方法、装置、系统及存储介质 | |
CN102740112B (zh) | 一种基于视频监控系统的设备轮巡的控制方法 | |
CN107480389A (zh) | 一种面向调度主站的智能告警测试仿真系统及方法 | |
CN104065526A (zh) | 一种服务器故障报警的方法和装置 | |
CN102026042A (zh) | 一种高级电信计算架构控制面的保活、自愈方法和装置 | |
CN104753712A (zh) | 一种告警上报方法、告警上报节点及告警上报系统 | |
CN102231674A (zh) | 以太网远端故障的处理方法及装置 | |
CN109062184A (zh) | 双机应急救援设备、故障切换方法和救援系统 | |
CN101854263B (zh) | 网络拓扑的分析处理方法、系统和管理服务器 | |
CN114690616A (zh) | 检测并行冗余协议通信中的路径故障 | |
CN104272667A (zh) | 诊断并报告网络中断 | |
CN114584456A (zh) | 一种环网冗余交换机的故障报警方法及装置 | |
JP2011160086A (ja) | 障害区間判定装置 | |
JP2015192202A (ja) | 鉄鋼プラント制御システム | |
CN103812744A (zh) | 基于rs-422总线结构的双向双环报警通信控制系统 | |
CN201576345U (zh) | 报警响应器 | |
CN109905290B (zh) | 一种异地备班自动告警系统、方法和计算机可读存储介质 | |
JPH04213246A (ja) | 障害情報送信抑制方式 | |
JPH0250540A (ja) | ネットワーク障害監視装置 | |
CN108809768B (zh) | 一种共享交换平台的故障监控和恢复系统 | |
CN109284218A (zh) | 一种检测服务器运行故障的方法及其装置 | |
US20230097452A1 (en) | Systems and methods for managing prp networks | |
CN103326774B (zh) | 用于光传输设备监控的2m电路系统及其测试方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |