CN111245506A - 存储区域网络交换设备远程链路不稳定检测方法及系统 - Google Patents

存储区域网络交换设备远程链路不稳定检测方法及系统 Download PDF

Info

Publication number
CN111245506A
CN111245506A CN202010037630.1A CN202010037630A CN111245506A CN 111245506 A CN111245506 A CN 111245506A CN 202010037630 A CN202010037630 A CN 202010037630A CN 111245506 A CN111245506 A CN 111245506A
Authority
CN
China
Prior art keywords
port
same period
judging
optical fiber
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010037630.1A
Other languages
English (en)
Inventor
王炳臣
孙宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiruibo Information Technology Co Ltd
Original Assignee
Beijing Zhiruibo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiruibo Information Technology Co Ltd filed Critical Beijing Zhiruibo Information Technology Co Ltd
Priority to CN202010037630.1A priority Critical patent/CN111245506A/zh
Publication of CN111245506A publication Critical patent/CN111245506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0791Fault location on the transmission path

Abstract

本发明实施例公开了一种存储区域网络交换设备远程链路不稳定检测方法及系统,按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。通过实时采集网络交换设备端口的指标信息实时监控链路出现问题的情景,能够对链路出现问题的环节进行快速判断并定位。

Description

存储区域网络交换设备远程链路不稳定检测方法及系统
技术领域
本发明实施例涉及链路检测技术领域,具体涉及一种存储区域网络交换设备远程链路不稳定检测方法。
背景技术
存储区域网中用户的核心数据会存放在两个或多个数据中心,在数据中心之间会通过远程链路连接,用容灾或双活的方式保证数据中心之间的数据同步。当数据中心之间的物理链路出现传输信号弱、信号衰减大或者链路中断的时候,会导致数据中心之间数据的不同步,甚至会影响正常生产的数据中心的业务响应慢,严重时会导致业务中断。
通常用户是在容灾环境和双活环境的业务应用系统发生问题的时候去查询和判断问题出现在哪里、是否是链路问题,如果疑似是链路问题,则通过更换链路两端的连接设备或线缆去排查,然后再观察是否仍然有问题,问题定位及排查缓慢,在排查的过程中容灾或双活环境会暂停服务,中断中间的同步连接链路,只使用一个生产数据中心的数据,这样会对核心业务数据产生安全隐患,并且处理的时间周期比较长。
发明内容
为此,本发明实施例提供存储区域网络交换设备远程链路不稳定检测方法,以解决现有的无法对存储区域网络数据中心之间的远程链路不稳定问题进行快速定位的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例的第一方面,提出了一种存储区域网络交换设备远程链路不稳定检测方法,所述方法包括:
按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储;
根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
进一步地,所述方法还包括:
根据所述不稳定问题检测结果生成告警信息。
进一步地,所述端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Disc c3、Frbsy指标信息。
进一步地,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果,具体包括:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out、Link fail、Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
进一步地,所述网络交换设备包括光纤交换机。
根据本发明实施例的第二方面,提出了一种存储区域网络交换设备远程链路不稳定检测系统,所述系统包括:
指标信息采集模块,用于按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储;
问题检测模块,用于根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
进一步地,所述系统还包括:
告警模块,用于根据所述不稳定问题检测结果生成告警信息。
进一步地,所述端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Disc c3、Frbsy指标信息。
进一步地,所述问题检测模块具体用于:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out/Link fail/Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
本发明实施例具有如下优点:
本发明实施例提出的一种存储区域网络交换设备远程链路不稳定检测方法及系统,按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。通过实时采集网络交换设备端口的指标信息实时监控链路出现问题的情景,能够对链路出现问题的环节进行快速判断并定位。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例1提供的一种存储区域网络交换设备远程链路不稳定检测方法的流程示意图;
图2为本发明实施例2提供的一种存储区域网络交换设备远程链路不稳定检测系统的结构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例1提出了一种存储区域网络交换设备远程链路不稳定检测方法,具体如图1所示,该方法包括:
步骤110、按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储。
本实施例中,网络交换设备包括光纤交换机,存储区域网络双数据中心或者多个数据中心之间通过光纤交换机远程链路模块连接,光纤交换机端口模块的多个指标通常单独表示模块或者信号等信息的状态。本实施例通过多个指标的组合状态分级别判断筛选出链路不稳定的原因,以帮助用户在容灾或双活环境的业务系统出现问题时第一时间发现和定位链路的问题。
可以以按照分钟间隔实时采集光纤交换机的模块端口指标信息,并存入数据库中,采集的端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Disc c3、Frbsy指标信息。
Enc out:8b/10b或者64b/66b数据帧帧外编码错误。
Link fail:当交换机端口在LR Receive State时间超过R_A_TOV就会产生这个错误。
Loss sync:bit或者transmission-word synchronization失败都会产生这个错误,当交换机端口offline/online会产生这个问题。
Loss signal:链路收不到信号。
Disc c3:Class 3被交换机丢弃的数据帧。
Frbsy:用于class 2,数据帧无法在E_D_TOV时间内传输出去,超时后会产生这个问题。
步骤120、根据端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
具体的,根据指标组合规则判断链路产生问题的原因,判断规则如下:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out、Link fail、Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
该方法还包括:步骤130、根据不稳定问题检测结果生成告警信息。根据规则匹配采集的数据,产生告警信息,通知用户判断结果。
本发明实施例提出的一种存储区域网络交换设备远程链路不稳定检测方法,按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。通过实时采集网络交换设备端口的指标信息实时监控链路出现问题的情景,能够对链路出现问题的环节进行快速判断并定位。
实施例2
本发明实施例2提出了一种存储区域网络交换设备远程链路不稳定检测系统,具体如图2所示,该系统包括:
指标信息采集模块210,用于按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储;
问题检测模块220,用于根据端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
进一步地,该系统还包括:
告警模块230,用于根据不稳定问题检测结果生成告警信息。
进一步地,端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Discc3、Frbsy指标信息。
进一步地,问题检测模块220具体用于:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out、Link fail、Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
本发明实施例2提供的一种存储区域网络交换设备远程链路不稳定检测系统中各部件所执行的功能均已在上述实施例1中做了详细介绍,因此这里不做过多赘述。
本发明实施例提出的一种存储区域网络交换设备远程链路不稳定检测系统,按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。通过实时采集网络交换设备端口的指标信息实时监控链路出现问题的情景,能够对链路出现问题的环节进行快速判断并定位。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (9)

1.一种存储区域网络交换设备远程链路不稳定检测方法,其特征在于,所述方法包括:
按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储;
根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
2.根据权利要求1所述的一种存储区域网络交换设备远程链路不稳定检测方法,其特征在于,所述方法还包括:
根据所述不稳定问题检测结果生成告警信息。
3.根据权利要求1所述的一种存储区域网络交换设备远程链路不稳定检测方法,其特征在于,所述端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Disc c3、Frbsy指标信息。
4.根据权利要求3所述的一种存储区域网络交换设备远程链路不稳定检测方法,其特征在于,根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果,具体包括:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out、Link fail、Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
5.根据权利要求1所述的一种存储区域网络交换设备远程链路不稳定检测方法,其特征在于,所述网络交换设备包括光纤交换机。
6.一种存储区域网络交换设备远程链路不稳定检测系统,其特征在于,所述系统包括:
指标信息采集模块,用于按照预设时间间隔采集存储区域网络交换设备的端口指标信息并存储;
问题检测模块,用于根据所述端口指标信息,按照预设问题定位规则获得远程链路不稳定问题检测结果。
7.根据权利要求6所述的一种存储区域网络交换设备远程链路不稳定检测系统,其特征在于,所述系统还包括:
告警模块,用于根据所述不稳定问题检测结果生成告警信息。
8.根据权利要求6所述的一种存储区域网络交换设备远程链路不稳定检测系统,其特征在于,所述端口指标信息包括Enc out、Link fail、Loss sync、Loss signal、Disc c3、Frbsy指标信息。
9.根据权利要求8所述的一种存储区域网络交换设备远程链路不稳定检测系统,其特征在于,所述问题检测模块具体用于:
当Enc out、Link fail、Loss signal三个指标在同一周期内同时增长,则判断为连接端口的服务器重新启动;
当Enc out、Loss signal两个指标在同一周期内同时增长,则判断为连接端口的HBA故障/删除、光纤故障或拔出光纤;
当Loss sync、Loss signal两个指标在同一周期内同时增长,则判断为端口重新识别到HBA卡;
当Link fail、Loss sync两个指标在同一周期内同时增长,则判断为端口识别到插上光纤;
当Enc out、Link fail、Loss sync三个指标在同一周期内同时增长,则判断为端口光纤虚插;
当Loss signal指标在同一周期内单独增长,则判断为端口拔出光纤模块;
当Enc out、Link fail、Loss sync、Loss signal四个指标在同一周期内同时增长,则判断为连接端口的光纤疑似有问题;
当Disc c3、Frbsy两个指标在同一周期内同时增长,则判断为连接端口的链路疑似不通或不稳定,建议优先排查光纤故障。
CN202010037630.1A 2020-01-14 2020-01-14 存储区域网络交换设备远程链路不稳定检测方法及系统 Pending CN111245506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010037630.1A CN111245506A (zh) 2020-01-14 2020-01-14 存储区域网络交换设备远程链路不稳定检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010037630.1A CN111245506A (zh) 2020-01-14 2020-01-14 存储区域网络交换设备远程链路不稳定检测方法及系统

Publications (1)

Publication Number Publication Date
CN111245506A true CN111245506A (zh) 2020-06-05

Family

ID=70880910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010037630.1A Pending CN111245506A (zh) 2020-01-14 2020-01-14 存储区域网络交换设备远程链路不稳定检测方法及系统

Country Status (1)

Country Link
CN (1) CN111245506A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1423876A (zh) * 2000-03-03 2003-06-11 明亮网络公司 由于故障链路的检测而动态重新路由选择业务的路由交换机
US20110243558A1 (en) * 2010-04-02 2011-10-06 Hitachi, Ltd. Optical transmission system and optical transmission method
CN103312556A (zh) * 2013-05-09 2013-09-18 国家电网公司 一种光纤以太网实时性能监视与测试的装置及方法
US8705371B2 (en) * 2010-03-19 2014-04-22 At&T Intellectual Property I, L.P. Locally diagnosing and troubleshooting service issues
CN103986515A (zh) * 2014-05-09 2014-08-13 浙江中烟工业有限责任公司 光纤通道交换机的性能指标监控方法
CN109245819A (zh) * 2018-07-19 2019-01-18 郑州云海信息技术有限公司 一种故障定位方法及相关装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1423876A (zh) * 2000-03-03 2003-06-11 明亮网络公司 由于故障链路的检测而动态重新路由选择业务的路由交换机
US8705371B2 (en) * 2010-03-19 2014-04-22 At&T Intellectual Property I, L.P. Locally diagnosing and troubleshooting service issues
US20110243558A1 (en) * 2010-04-02 2011-10-06 Hitachi, Ltd. Optical transmission system and optical transmission method
CN103312556A (zh) * 2013-05-09 2013-09-18 国家电网公司 一种光纤以太网实时性能监视与测试的装置及方法
CN103986515A (zh) * 2014-05-09 2014-08-13 浙江中烟工业有限责任公司 光纤通道交换机的性能指标监控方法
CN109245819A (zh) * 2018-07-19 2019-01-18 郑州云海信息技术有限公司 一种故障定位方法及相关装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林强: "光纤通道交换机在强实时约束下的分组调度", 《计算机学报》 *
鸿爪雪泥: "Brocade交换机PortErrShow命令er_bad_os各输出项释义", 《博客园》 *

Similar Documents

Publication Publication Date Title
EP0570882B1 (en) A distributed control methodology and mechanism for implementing automatic protection switching
CN101582787B (zh) 一种双机备份系统及备份方法
US5623481A (en) Automated path verification for SHN-based restoration
CN106789386B (zh) 检测通信总线上错误的方法以及用于网络系统的检错器
CN110677292A (zh) 一种光口速率配置方法及装置
CN104579791A (zh) 一种实现k-db主备自动切换容灾集群的方法
CN103744743A (zh) 一种基于数据库rac模式心跳信号的冗余配置的方法
CN107918570A (zh) 一种双活系统共享仲裁盘的方法
CN107688547A (zh) 一种控制器主备切换的方法及系统
CN111953808B (zh) 一种双机双活架构的数据传输切换方法及架构构建系统
CN111245506A (zh) 存储区域网络交换设备远程链路不稳定检测方法及系统
CN117527653A (zh) 一种集群的心跳管理方法、系统、设备及介质
CN115549775A (zh) 光信号传输异常的处理方法、光传输设备及系统
RU2596999C1 (ru) Способ и устройство для обработки отказов одиночного оптического волокна
CN116302716A (zh) 一种集群部署方法、装置、电子设备及计算机可读介质
CN110086530A (zh) 一种光缆故障报警系统
CN111817892B (zh) 一种网络管理方法、系统、电子设备及存储介质
Cisco Chapter 1, Alarm Troubleshooting
Cisco Chapter 1, Alarm Troubleshooting
Cisco Chapter 1, Alarm Troubleshooting
CN109861745B (zh) 一种故障处理方法和集群路由器
US6373819B1 (en) Routine testing parity maintenance
Cisco Chapter 1, Alarm Troubleshooting
Cisco Chapter 1, Alarm Troubleshooting
Cisco Troubleshooting the Cisco 10000 ESR

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605