CN109510725B - 通信设备故障检测系统及方法 - Google Patents

通信设备故障检测系统及方法 Download PDF

Info

Publication number
CN109510725B
CN109510725B CN201811434697.8A CN201811434697A CN109510725B CN 109510725 B CN109510725 B CN 109510725B CN 201811434697 A CN201811434697 A CN 201811434697A CN 109510725 B CN109510725 B CN 109510725B
Authority
CN
China
Prior art keywords
equipment
communication
console port
fault
communication device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811434697.8A
Other languages
English (en)
Other versions
CN109510725A (zh
Inventor
杨超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201811434697.8A priority Critical patent/CN109510725B/zh
Publication of CN109510725A publication Critical patent/CN109510725A/zh
Application granted granted Critical
Publication of CN109510725B publication Critical patent/CN109510725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/133Protocols for remote procedure calls [RPC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明涉及数据通信领域,其公开了一种通信设备故障检测系统及方法,解决传统技术中在设备网络故障时需要到现场进行故障定位,增加设备维护成本的问题。该方法包括:a.通过远程方式登录到另一台未出故障的通信设备;b.在所述另一台未出故障的通信设备上创建代理进程;c.通过创建的所述代理进程访问和控制出现故障的通信设备。本发明适用于远程对互为主备的设备中的一台设备出现网络故障时的故障定位,或者对两台物理部署在一起的设备中的一台设备出现网络故障时的故障定位。

Description

通信设备故障检测系统及方法
技术领域
本发明涉及数据通信领域,具体涉及一种通信设备故障检测系统及方法。
背景技术
传统的两台设备之间为了实现主备功能,通常采用HA(双机集群系统)线连接两台设备的两个网口。这条HA线也是普通的网线,运行TCP/IP协议,如果其中一台设备出了故障,通过HA线上运行的协议,另一台设备就可以检测到,从而完成主备切换。通过扩展HA线,主设备可以控制到备份设备。
然而,有些情况下,如果一台设备上的网络协议出了问题,这时无论是HA线两端的网口还是出故障的设备自身的网口都无法访问,那么另一台设备就没有任何方式可以管理到这台出故障的设备了。
出现上述情况时,现有技术中的通常做法是由管理员使用console(控制台,也可以称为配置口)端口登录到出故障的设备上排查原因。但是很多时候,设备并不在管理员身边,需要管理员到出故障的设备所在现场进行排查定位,增加了设备维护成本。
发明内容
本发明所要解决的技术问题是:提出一种通信设备故障检测系统及方法,解决传统技术中在设备网络故障时需要到现场进行故障定位,增加设备维护成本的问题。
为解决上述技术问题,一方面,本发明的实施例提供了一种通信设备故障检测系统,包括:两台配置有console端口的通信设备,所述两台通信设备的console端口之间建立物理连接;所述两台通信设备上均配置有远程访问模块和代理进程创建模块;
所述远程访问模块,用于向外提供对本设备的远程访问功能;
所述代理进程创建模块,用于创建代理进程,所述代理进程用于监听对端设备通过console端口发送至本设备的消息;以及用于将在本设备上输入的控制指令,通过console端口发送至对端设备。
作为进一步优化,所述两台通信设备为互为备份的主、备设备。
作为进一步优化,所述代理进程具有显示界面。
作为进一步优化,所述代理进程具体用于,通过接管本设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,从而监听对端设备通过console端口发送至本设备的消息。
作为进一步优化,所述代理进程具体还用于,通过显示界面获取在本设备上输入的控制指令,并回送到本设备的console端口文件句柄,通过console端口发送至对端设备。
另一方面,本发明的实施例还提供了一种通信设备故障检测方法,应用于上述故障检测系统中两台通信设备的其中一台通信设备出现网络故障时的检测,其包括以下步骤:
a.通过远程方式登录到另一台未出故障的通信设备;
b.在所述另一台未出故障的通信设备上创建代理进程;
c.通过创建的所述代理进程访问和控制出现故障的通信设备。
作为进一步优化,步骤a中,所述远程方式为telnet(远程登录)或者SSH(secureshell安全访问)。
作为进一步优化,步骤c中,所述通过创建的所述代理进程访问和控制出现故障的通信设备,具体包括:通过创建的所述代理进程接管本设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,从而监听出现故障的通信设备通过console端口发送至本设备的消息。
作为进一步优化,步骤c中,在监听到出现故障的通信设备通过console端口发送至本设备的消息后,在显示界面上进行显示。
作为进一步优化,步骤c中,所述通过创建的所述代理进程访问和控制出现故障的通信设备,具体还包括:通过显示界面获取在本设备上输入的控制指令,并回送到本设备的console端口文件句柄,通过console端口发送至出现故障的通信设备。
本发明的有益效果是:将两台通信设备之间的console端口通过console线连接,在一台设备协议栈出问题的时候,通过远程登录到另一台设备的方式,间接控制故障设备,提高了可靠性。而不需要派专人到出问题的现场进行故障定位,降低了设备维护成本。
附图说明
图1为实施例中的通信设备故障检测系统结构框图;
图2为实施例中的通信设备故障检测方法流程图。
具体实施方式
本发明旨在提出一种通信设备故障检测系统及方法,解决传统技术中在设备网络故障时需要到现场进行故障定位,增加设备维护成本的问题。本发明的核心思想是:考虑到console的稳定性相对于网口的稳定性要高很多,本发明将两台设备之间的console端口互相连接起来,每台设备都可以通过console端口访问到另外一台设备,如此可以提高稳定性;当其中一台设备的网口不可用时,就可以通过远程方式登录到没有出故障的设备上,然后在没有出故障的设备上通过console端口登录到出故障的设备上。
而为了实现在远程通过一个设备的console端口访问与其通过console线相连的对端设备,还需要创建一个代理进程;在一个设备上运行该代理进程后,代理进程接管该设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,不再发往VTY(Virtual Teletype Terminal虚拟终端);并且,该代理进程将该设备上的所有输入通过console端口发送给对端设备,从而实现对对端设备的访问和控制。
需要说明的是,本发明中所述的两台设备可以为双机的环境下部署的主、备设备,也可以为在物理上部署在一起的两台通信设备(未做主备)。
实施例:
如图1所示,本实施例中的通信设备故障检测系统,包括:配置有console端口的通信设备A和通信设备B,设备A和设备B的console端口之间通过console线(配置线)连接;在两台通信设备上均配置有远程访问模块和代理进程创建模块;
所述远程访问模块,用于向外提供对本设备的远程访问功能;
所述代理进程创建模块,用于创建代理进程,所述代理进程用于监听对端设备通过console端口发送至本设备的消息;以及用于将在本设备上输入的控制指令,通过console端口发送至对端设备。
基于上述检测系统,本实施例提出的故障检测方法如图2所示,其应用于其中一个设备出现网络故障的场景,包括以下实现步骤:
a.通过远程方式登录到另一台未出故障的通信设备;
本步骤中,设备管理人员可以通过telnet或者SSH远程方式,利用未出故障的设备上的远程访问模块登录所述未出故障的设备。
b.在所述另一台未出故障的通信设备上创建代理进程;
本步骤中,设备管理人员在远程登录后,启用所述未出故障的设备上的代理进程创建模块,创建一个代理进程,该代理进程用于作为一个代理,具有显示界面,以便进行控制指令的输入以及对端反馈信息的回显。
c.通过创建的所述代理进程访问和控制出现故障的通信设备。
本步骤中,设备管理人员通过创建的代理进程访问和控制出现故障的设备,代理进程在创建后即接管本设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,从而监听出现故障的通信设备通过console端口发送至本设备的消息;并通过代理进程的显示界面获取在本设备上输入的控制指令,并回送到本设备的console端口文件句柄,通过console端口发送至出现故障的通信设备。
以图1中的设备A正常,而设备B故障为例,设备管理人员希望通过远程方式对设备B进行故障定位,实施方案如下:
首先,设备管理人员通过远程方式(telnet或者SSH等)登录到设备A上;
然后,在设备A上开启一个代理进程,该代理进程有显示界面,完成接管console文件句柄的操作,监听从设备B发送来的消息,此时设备B为服务角色
如果要通过设备A查看设备B上的信息,则在代理进程的显示界面上输入查询命令,查询命令会通过设备A的console端口发送到设备B,设备B执行完查询操作后,将反馈信息通过设备B的console端口发送到设备A,设备A上的代理进程的显示界面即可显示设备B反馈的信息;
如果要通过设备A来重启设备B,则在设备A的代理进程的显示界面上输入重启命令(例如reboot),重启命令会通过设备A的console端口发送到设备B,设备B执行完重启操作后,将重启完成的反馈信息通过设备B的console端口发送到设备A,设备A上的代理进程的显示界面即可显示设备B反馈的信息。
同理,若设备A出现故障,设备B正常工作,设备管理人员希望通过远程方式对设备A进行故障定位时,通过远程访问设备B,并开启设备B上的代理进程,利用设备B上的代理进程实现对故障的设备A的访问和控制。

Claims (9)

1.通信设备故障检测系统,包括:两台配置有console端口的通信设备,其特征在于,所述两台通信设备的console端口之间建立物理连接;所述两台通信设备上均配置有远程访问模块和代理进程创建模块;所述两台通信设备为互为备份的主、备设备;
所述远程访问模块,用于向外提供对本设备的远程访问功能;
所述代理进程创建模块,用于创建代理进程,所述代理进程用于监听对端设备通过console端口发送至本设备的消息;以及用于将在本设备上输入的控制指令,通过console端口发送至对端设备。
2.如权利要求1所述的通信设备故障检测系统,其特征在于,所述代理进程具有显示界面。
3.如权利要求2所述的通信设备故障检测系统,其特征在于,所述代理进程具体用于,通过接管本设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,从而监听对端设备通过console端口发送至本设备的消息。
4.如权利要求3所述的通信设备故障检测系统,其特征在于,所述代理进程具体还用于,通过显示界面获取在本设备上输入的控制指令,并回送到本设备的console端口文件句柄,通过console端口发送至对端设备。
5.通信设备故障检测方法,应用于如权利要求1-4任意一项所述的通信设备故障检测系统中两台通信设备的其中一台通信设备出现网络故障时的检测,其特征在于,包括以下步骤:
a.通过远程方式登录到另一台未出故障的通信设备;
b.在所述另一台未出故障的通信设备上创建代理进程;
c.通过创建的所述代理进程访问和控制出现故障的通信设备。
6.如权利要求5所述的通信设备故障检测方法,其特征在于,
步骤a中,所述远程方式为telnet或者SSH。
7.如权利要求5所述的通信设备故障检测方法,其特征在于,
步骤c中,所述通过创建的所述代理进程访问和控制出现故障的通信设备,具体包括:通过创建的所述代理进程接管本设备的console端口文件句柄,将console端口的所有输出重定向到该代理进程,从而监听出现故障的通信设备通过console端口发送至本设备的消息。
8.如权利要求7所述的通信设备故障检测方法,其特征在于,
步骤c中,在监听到出现故障的通信设备通过console端口发送至本设备的消息后,在代理进程的显示界面上进行显示。
9.如权利要求7所述的通信设备故障检测方法,其特征在于,
步骤c中,所述通过创建的所述代理进程访问和控制出现故障的通信设备,具体还包括:通过代理进程的显示界面获取在本设备上输入的控制指令,并回送到本设备的console端口文件句柄,通过console端口发送至出现故障的通信设备。
CN201811434697.8A 2018-11-28 2018-11-28 通信设备故障检测系统及方法 Active CN109510725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811434697.8A CN109510725B (zh) 2018-11-28 2018-11-28 通信设备故障检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811434697.8A CN109510725B (zh) 2018-11-28 2018-11-28 通信设备故障检测系统及方法

Publications (2)

Publication Number Publication Date
CN109510725A CN109510725A (zh) 2019-03-22
CN109510725B true CN109510725B (zh) 2022-05-17

Family

ID=65750995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811434697.8A Active CN109510725B (zh) 2018-11-28 2018-11-28 通信设备故障检测系统及方法

Country Status (1)

Country Link
CN (1) CN109510725B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110753039B (zh) * 2019-09-29 2022-04-22 苏州浪潮智能科技有限公司 一种远程登录安全防护的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808112A (zh) * 2010-02-06 2010-08-18 大连大学 一种基于telnet和代理的设备远程维护方法
CN103036611A (zh) * 2012-10-29 2013-04-10 上海电信工程有限公司 工程中的光路连接检测方法及其系统
CN103188234A (zh) * 2011-12-30 2013-07-03 上海可鲁系统软件有限公司 一种基于分布式系统的远程维护方法及其装置
CN103957115A (zh) * 2014-03-14 2014-07-30 李志敏 一种对计算机网络设备远程辅助运维的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130030875A1 (en) * 2011-07-29 2013-01-31 Panasonic Corporation System and method for site abnormality recording and notification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808112A (zh) * 2010-02-06 2010-08-18 大连大学 一种基于telnet和代理的设备远程维护方法
CN103188234A (zh) * 2011-12-30 2013-07-03 上海可鲁系统软件有限公司 一种基于分布式系统的远程维护方法及其装置
CN103036611A (zh) * 2012-10-29 2013-04-10 上海电信工程有限公司 工程中的光路连接检测方法及其系统
CN103957115A (zh) * 2014-03-14 2014-07-30 李志敏 一种对计算机网络设备远程辅助运维的方法

Also Published As

Publication number Publication date
CN109510725A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN104363117A (zh) 一种基于ipmi实现串口重定向的方法
US20080313319A1 (en) System and method for providing multi-protocol access to remote computers
JP6299640B2 (ja) 通信装置
CN106060088A (zh) 一种服务管理方法及装置
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
CN103905247A (zh) 一种基于多客户裁决的双机备份方法及系统
CN109510725B (zh) 通信设备故障检测系统及方法
CN108270593B (zh) 一种双机热备份方法和系统
JP2006260223A (ja) iSCSIストレージシステムおよびそのシステムにおけるパス多重化方法
CN107302452B (zh) 一种用于pbx业务连续性的控制方法
JP2012075009A (ja) 冗長化装置及び冗長化プログラム
CN112667428A (zh) Bmc故障处理电路、方法、装置、电子设备及存储介质
JP2008204113A (ja) ネットワーク監視システム
KR101565348B1 (ko) PoE 인젝터를 이용한 이더넷 스위치의 원격 전원 제어 방법
GB2455075A (en) A network controller for mirroring server applications
US20090019140A1 (en) Method for backup switching spatially separated switching systems
CN108418626B (zh) 用于DPoE网络中的光链路保护的方法和设备
CN106254156B (zh) 设备访问方法及装置
JP2006319683A (ja) ネットワークシステム監視方式およびネットワークシステム監視装置
CN111427861A (zh) 分布式文件系统配置方法及装置
JP2019197352A (ja) サービス継続システムおよびサービス継続方法
KR101401006B1 (ko) 고가용성 시스템에서 소프트웨어 업데이트를 수행하기 위한 방법 및 장치
CN117440410B (zh) 一种基于ftp协议的调试控制方法和调试控制器
JP7346172B2 (ja) 通信機器
JPH10107792A (ja) サーバ監視装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant