CN103001802A - 以太端口故障自动修复方法及系统 - Google Patents

以太端口故障自动修复方法及系统 Download PDF

Info

Publication number
CN103001802A
CN103001802A CN2012105214737A CN201210521473A CN103001802A CN 103001802 A CN103001802 A CN 103001802A CN 2012105214737 A CN2012105214737 A CN 2012105214737A CN 201210521473 A CN201210521473 A CN 201210521473A CN 103001802 A CN103001802 A CN 103001802A
Authority
CN
China
Prior art keywords
port
ether
monitoring
ether port
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105214737A
Other languages
English (en)
Other versions
CN103001802B (zh
Inventor
吴瑞
王焕章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201210521473.7A priority Critical patent/CN103001802B/zh
Publication of CN103001802A publication Critical patent/CN103001802A/zh
Application granted granted Critical
Publication of CN103001802B publication Critical patent/CN103001802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明涉及以太端口故障检测及自动修复技术。本发明针对现有技术以太端口故障修复耗时长,数据中断时间长,而且必须人工干预的缺点,公开了一种以太端口故障自动修复方法及系统。本发明的技术方案,采用轮询监控以太端口的状态及自动修复机制,系统由端口监控模块和端口修复模块两部分组成。端口监控模块筛选需要监控的以太端口,并进行监控。在监控到以太端口故障后,发送以太端口故障消息到端口修复模块处理。本发明不需要人工干预,并且能够大大缩短故障恢复时间,保证通信业务传输的可靠性。从故障发生到故障自动恢复耗时能够控制在毫秒级内。

Description

以太端口故障自动修复方法及系统
技术领域
本发明涉及网络通信技术,尤其涉及以太端口故障检测及自动修复技术。
背景技术
网络通信系统中,一般网络设备的以太端口(有时也简称端口)之间通过物理线路连接,图1示出了以太端口1与以太端口2连接的示意图。网络设备的以太端口包括MAC芯片、PHY芯片和物理端口,以太端口通过物理线路互联。在网络设备的物理线路连接状态正常情况下,有可能出现一端互联的以太端口为UP(正常连接)状态,而另一端以太端口为DOWN(断开连接)状态,从而出现数据通信中断故障。此类故障现象为,物理线路连接为正常UP状态,但是PHY(物理层)芯片与MAC(媒体访问控制)芯片连接出现故障为异常状态,以太端口此时表现为DOWN状态。以太端口的UP状态,必须为物理线路连接、PHY芯片与MAC芯片的连接都为正常状态。
在物理线路连接状态正常情况下,有可能出现互联端口一端为UP状态,而另一端为DOWN状态,则发生端口数据中断故障。在要求高可靠性环境,如数据中心,这将会产生重大通信中断事故,也可能造成巨大经济损失。目前对这种物理线路互联端口一端UP,另一端DOWN的故障没有有效的手段检测及处理。在故障出现时,只能手动重启设备才能恢复,这种处理故障的方式,不能及时发现故障原因,故障出现也不能及时恢复,从故障发生开始到故障恢复耗时长,数据中断时间长,而且必须人工干预。
发明内容
本发明所要解决的技术问题,就是提供一种以太端口故障自动修复方法及系统缩短故障恢复时间与业务恢复时间。
本发明的以太端口故障自动修复方法,包括以下步骤:
端口监控模块建立端口监控区,将满足监控条件的以太端口加入端口监控区;
所述端口监控模块对加入端口监控区中的以太端口进行轮询监控;监控到以太端口故障后,对以太端口故障信息进行封装,将封装后的以太端口故障信息传送到端口修复模块,并将该故障以太端口从端口监控区中删除;
端口修复模块收到以太端口故障信息后,将所述以太端口置于修复模式,对以太端口状态进行确认;如果确认以太端口故障,则读取并保存以太端口配置信息后执行以太端口修复操作;如果确认以太端口此时为正常状态,则将该以太端口正常的信息发送到端口监控模块,将该以太端口重新加入端口监控区。
进一步的,所述以太端口故障是指以太端口的物理线路连接为正常状态,PHY芯片与MAC芯片连接为异常状态。
进一步的,所述以太端口配置信息包括端口速率、单双工工作模式、协商模式、媒体独立接口交叉MDIX属性和帧长。
进一步的,所述以太端口修复操作包括复位端口和/或修改以太端口报文封装模式。
进一步的,加入所述端口监控区中的以太端口满足的监控条件为:
以太端口报文封装模式为IEEE 802.3标准模式;物理线路连接为正常状态;没有修复失败记录。
本发明的另一个目的,提供一种以太端口故障自动修复系统,包括端口监控模块、端口修复模块:
所述端口监控模块,用于建立端口监控区,对满足监控条件加入端口监控区中的以太端口进行轮询监控;监控到以太端口故障后,对以太端口故障信息进行封装;将封装后的以太端口故障信息传送到端口修复模块,并将该故障以太端口从端口监控区中删除;
所述端口修复模块,用于收到以太端口故障信息后,将所述以太端口置于修复模式,对以太端口状态进行确认;如果确认以太端口故障,则读取并保存以太端口配置信息后执行以太端口修复操作;如果确认该以太端口此时为正常状态,则将该以太端口正常的信息发送到端口监控模块,将该以太端口重新加入端口监控区。
进一步的,所述以太端口故障是指端口物理线路连接为正常状态,PHY芯片与MAC芯片连接为异常状态。
进一步的,所述端口配置信息包括端口速率、单双工工作模式、协商模式、媒体独立接口交叉MDIX属性和帧长。
进一步的,所述以太端口修复操作包括复位端口和/或修改以太端口报文封装模式。
进一步的,加入所述端口监控区中的以太端口满足的监控条件为:
以太端口报文封装模式为IEEE 802.3标准模式;物理线路连接为正常状态;没有修复失败记录。
本发明的有益效果是,不需要人工干预,并且能够大大缩短故障恢复时间,保证通信业务传输的可靠性。从故障发生到故障自动恢复耗时能够控制在毫秒级内。
附图说明
图1是网络设备端口互联示意图;
图2是端口监控模块示意图;
图3是端口修复模块示意图;
图4是端口监控与自动修复流程意示图。
具体实施方式
下面结合附图详细描述本发明的技术方案。
本发明采用轮询监控以太端口的状态及自动修复机制,系统由端口监控模块和端口修复模块两部分组成。端口监控模块筛选需要监控的以太端口,并进行监控。在监控到以太端口故障后,发送以太端口故障消息到端口修复模块处理。
端口修复模块在收到需要修复以太端口消息后,将以太端口置于修复模式。端口修复模块再次确认以太端口故障后,读取并保存以太端口配置信息,进行以太端口修复操作。以太端口修复操作包括修改以太端口报文封装模式和/或复位端口。在经过以太端口修复操作后,恢复以太端口配置信息,最后发送端口故障信息到网络管理平台,端口故障恢复完成。
本发明的端口监控模块,如图2所示,采用轮询监控端口状态的检测机制。首先端口监控模块建立端口监控区,如在内存中申请一块空间,将需要监控的以太端口加入端口监控区,可以将需要监控的以太端口的索引存入该内存空间,完成待监控端口的筛选,获得目标监控端口;其次对端口监控区中的目标监控端口进行端口状态轮询监控;最后在监控到以太端口故障后,封装以太端口故障信息,向端口修复模块发送以太端口故障消息。加入端口监区控区的端口满足的监控条件为:
1、以太端口报文封装模式为IEEE 802.3(一种串行通信标准)标准模式;
2、物理线路连接为正常状态;
3、没有修复失败记录。
满足上述监控条件的以太端口,端口监控模块才会将其加入端口监控区。若以太设备在工作过程中有新的以太端口参与数据通信,并满足监控条件,会自动增加到监控区,反之若端口退出数据通信,如拔线或执行命令关闭(SHUT DOWN)端口,则该以太端口将从监控区内剔除。
在以太端口被加入监控区后,每隔监控轮询时间轮询端口PHY芯片与MAC芯片的连接状态,监控轮询时间默认为60ms,亦可根据实际运行环境情况配置。若轮询结果以太端口为UP状态,继续轮询下一个以太端口,若轮询结果为DOWN状态,则认为此以太端口出现故障,需要进行故障修复。此时端口监控模块将此以太端口的故障信息进行封装,并将故障信息发送给端口修复模块,同时将此以太端口从端口监控区删除,继续监控剩下的以太端口。
端口修复模块见图3,在收到端口故障消息后,端口修复模块将故障端口置于修复模式。此时端口修复模块会再次确认该故障端口的PHY芯片与MAC芯片的连接状态,若此时状态已经为UP状态,则将此以太端口UP消息发送给端口监控模块,由端口监控模块将该以太端口重新加入端口监控区,继续监控此以太端口,并结束对此以太端口的修复操作;若确认此以太端口仍然为DOWN状态,则确定此以太端口需要进行修复,在读取并保存该以太端口信息后,执行以太端口修复操作。以太端口信息包括:端口速率、单双工工作模式(双工、半双工或单工)、协商模式(自动协商或非自动协商)、媒体独立接口交叉MDIX(Auto MDI或MDI或MDI-X)属性和帧长(MTU)等。端口修复操作包括复位端口和/或修改以太端口报文封装模式。复位端口主要是复位端口PHY芯片,使其重新工作;修改以太端口报文封装模式主要是将以太端口报文封装模式修改为HIGIG(一种串行总线互联标准)模式后,再还原为原有IEEE 802.3标准模式。在经过端口修复操作后,恢复端口信息,端口恢复为UP状态。若此时端口依然为DOWN状态,进行第二次修复,再次修复失败后,则认为此时为硬件问题,必须更换硬件才能恢复故障,同时通知端口监控模块不再监控此端口,发送端口故障信息到网络管理平台,结束端口修复,等待下一次端口修复任务。
整个过程中,端口监控模块与端口修复模块通过消息紧密联系起来,贯穿本发明的整个流程,如图4所示。

Claims (10)

1.以太端口故障自动修复方法,其特征在于,包括以下步骤:
端口监控模块建立端口监控区,将满足监控条件的以太端口加入端口监控区;
所述端口监控模块对加入端口监控区中的以太端口进行轮询监控;监控到以太端口故障后,对以太端口故障信息进行封装,将封装后的以太端口故障信息传送到端口修复模块,并将该故障以太端口从端口监控区中删除;
端口修复模块收到以太端口故障信息后,将所述以太端口置于修复模式,对以太端口状态进行确认;如果确认以太端口故障,则读取并保存以太端口配置信息后执行以太端口修复操作;如果确认以太端口此时为正常状态,则将该以太端口正常的信息发送到端口监控模块,将该以太端口重新加入端口监控区。
2.根据权利要求1所述的以太端口故障自动修复方法,其特征在于,所述以太端口故障是指以太端口的物理线路连接为正常状态,PHY芯片与MAC芯片连接为异常状态。
3.根据权利要求1所述的以太端口故障自动修复方法,其特征在于,所述以太端口配置信息包括端口速率、单双工工作模式、协商模式、媒体独立接口交叉MDIX属性和帧长。
4.根据权利要求1所述的以太端口故障自动修复方法,其特征在于,所述以太端口修复操作包括复位端口和/或修改以太端口报文封装模式。
5.根据权利要求1所述的以太端口故障自动修复方法,其特征在于,加入所述端口监控区中的以太端口满足的监控条件为:
以太端口报文封装模式为IEEE 802.3标准模式;物理线路连接为正常状态;没有修复失败记录。
6.以太端口故障自动修复系统,包括端口监控模块、端口修复模块,其特征在于:
所述端口监控模块,用于建立端口监控区,对满足监控条件加入端口监控区中的以太端口进行轮询监控;监控到以太端口故障后,对以太端口故障信息进行封装;将封装后的以太端口故障信息传送到端口修复模块,并将该故障以太端口从端口监控区中删除;
所述端口修复模块,用于收到以太端口故障信息后,将所述以太端口置于修复模式,对以太端口状态进行确认;如果确认以太端口故障,则读取并保存以太端口配置信息后执行以太端口修复操作;如果确认该以太端口此时为正常状态,则将该以太端口正常的信息发送到端口监控模块,将该以太端口重新加入端口监控区。
7.根据权利要求6所述的以太端口故障自动修复系统,其特征在于,所述以太端口故障是指端口物理线路连接为正常状态,PHY芯片与MAC芯片连接为异常状态。
8.根据权利要求6所述的以太端口故障自动修复系统,其特征在于,所述端口配置信息包括端口速率、单双工工作模式、协商模式、媒体独立接口交叉MDIX属性和帧长。
9.根据权利要求6所述的以太端口故障自动修复系统,其特征在于,所述以太端口修复操作包括复位端口和/或修改以太端口报文封装模式。
10.根据权利要求6所述的以太端口故障自动修复系统,其特征在于,加入所述端口监控区中的以太端口满足的监控条件为:
以太端口报文封装模式为IEEE 802.3标准模式;物理线路连接为正常状态;没有修复失败记录。
CN201210521473.7A 2012-12-07 2012-12-07 以太端口故障自动修复方法及系统 Active CN103001802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210521473.7A CN103001802B (zh) 2012-12-07 2012-12-07 以太端口故障自动修复方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210521473.7A CN103001802B (zh) 2012-12-07 2012-12-07 以太端口故障自动修复方法及系统

Publications (2)

Publication Number Publication Date
CN103001802A true CN103001802A (zh) 2013-03-27
CN103001802B CN103001802B (zh) 2016-02-17

Family

ID=47929961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210521473.7A Active CN103001802B (zh) 2012-12-07 2012-12-07 以太端口故障自动修复方法及系统

Country Status (1)

Country Link
CN (1) CN103001802B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219573A (zh) * 2014-09-01 2014-12-17 联想(北京)有限公司 一种数据处理方法及芯片级系统
CN105915385A (zh) * 2016-05-31 2016-08-31 深圳市双赢伟业科技股份有限公司 一种交换机端口状态提醒方法及装置
CN108874595A (zh) * 2018-06-28 2018-11-23 郑州云海信息技术有限公司 一种hba卡重置方法、系统及hba卡和存储介质
CN110648524A (zh) * 2019-08-27 2020-01-03 上海航天控制技术研究所 多探头星敏感器数据传输故障监测及自主恢复方法
WO2022068302A1 (zh) * 2020-09-30 2022-04-07 华为技术有限公司 一种芯片、通信系统及通信方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1691615A (zh) * 2004-04-27 2005-11-02 华为技术有限公司 检测默认网关工作状态的方法及其装置
CN101212287A (zh) * 2006-12-30 2008-07-02 北京三星通信技术研究有限公司 基于端口的冗余备份的方法
CN101340315A (zh) * 2008-08-26 2009-01-07 中兴通讯股份有限公司 一种端到端以太网保护方法及采用该方法的通信装置
CN102255768A (zh) * 2010-05-19 2011-11-23 大唐移动通信设备有限公司 一种检测端口的方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1691615A (zh) * 2004-04-27 2005-11-02 华为技术有限公司 检测默认网关工作状态的方法及其装置
CN101212287A (zh) * 2006-12-30 2008-07-02 北京三星通信技术研究有限公司 基于端口的冗余备份的方法
CN101340315A (zh) * 2008-08-26 2009-01-07 中兴通讯股份有限公司 一种端到端以太网保护方法及采用该方法的通信装置
CN102255768A (zh) * 2010-05-19 2011-11-23 大唐移动通信设备有限公司 一种检测端口的方法和设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219573A (zh) * 2014-09-01 2014-12-17 联想(北京)有限公司 一种数据处理方法及芯片级系统
CN105915385A (zh) * 2016-05-31 2016-08-31 深圳市双赢伟业科技股份有限公司 一种交换机端口状态提醒方法及装置
CN108874595A (zh) * 2018-06-28 2018-11-23 郑州云海信息技术有限公司 一种hba卡重置方法、系统及hba卡和存储介质
CN110648524A (zh) * 2019-08-27 2020-01-03 上海航天控制技术研究所 多探头星敏感器数据传输故障监测及自主恢复方法
WO2022068302A1 (zh) * 2020-09-30 2022-04-07 华为技术有限公司 一种芯片、通信系统及通信方法

Also Published As

Publication number Publication date
CN103001802B (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
CN103001802A (zh) 以太端口故障自动修复方法及系统
CN102170342B (zh) 一种高冗余配置下的iec104通信主备切换方法
CN113468162B (zh) 用于针对异常数据进行处理的方法、设备和介质
CN103442035A (zh) 一种空管自动化系统的双网热备冗余实现方法
WO2022016823A1 (zh) 一种光纤网络系统故障节点处理方法
CN103905247A (zh) 一种基于多客户裁决的双机备份方法及系统
CN105068763B (zh) 一种针对存储故障的虚拟机容错系统和方法
CN107026780B (zh) 一种基于物联网的配电光纤环网故障点定位方法及系统
CN108134728A (zh) 一种环形冗余串联网络结构及其环形冗余和热插拔的方法
CN104079396A (zh) 网络冗余结构
CN102244589A (zh) 处理虚拟交换单元系统中链路故障的方法及对端设备
CN101237355B (zh) 实现业务监控的方法和网络监控装置
CN110247809B (zh) 双环网控制系统的通信控制方法
CN113721448B (zh) 一种冗余模块切换方法和装置
CN114095462B (zh) 一种雷达处理机srio通信系统的容错方法及系统
CN113315235B (zh) 一种采用环形光纤通信的多单元故障准确定位方法
CN103051678A (zh) 一种高可靠性的数据通信方法和装置
CN114301948A (zh) 一种用于高炉生产的工业控制网络架构
CN210166773U (zh) 一种智能安全防护终端及系统
CN112751688A (zh) 一种otn设备的流控处理方法、电子设备及存储介质
CN112836989A (zh) 一种变电站远动通信装置参数在线初始化方法
CN108650115A (zh) 集抄系统多通道级联拓扑结构故障处理方法
CN111901709B (zh) 一种多网络控制备份的光纤通信网络系统
CN102043688B (zh) 用于刀片服务器的双机热备的方法和装置
CN100375441C (zh) 网络连线备援系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant