CN102833093A - 网络故障处理方法、装置及系统 - Google Patents

网络故障处理方法、装置及系统 Download PDF

Info

Publication number
CN102833093A
CN102833093A CN201210230413XA CN201210230413A CN102833093A CN 102833093 A CN102833093 A CN 102833093A CN 201210230413X A CN201210230413X A CN 201210230413XA CN 201210230413 A CN201210230413 A CN 201210230413A CN 102833093 A CN102833093 A CN 102833093A
Authority
CN
China
Prior art keywords
central server
data
management domain
network
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210230413XA
Other languages
English (en)
Other versions
CN102833093B (zh
Inventor
陈训逊
孙永
云晓春
刘庆云
周渊
杨嵘
吴震
谢云
李超
李高超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Original Assignee
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS, National Computer Network and Information Security Management Center filed Critical Institute of Information Engineering of CAS
Priority to CN201210230413.XA priority Critical patent/CN102833093B/zh
Publication of CN102833093A publication Critical patent/CN102833093A/zh
Application granted granted Critical
Publication of CN102833093B publication Critical patent/CN102833093B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明涉及一种网络故障处理方法、装置及系统。网络故障处理方法应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,包括:在管理域到中心服务器的链路出现故障时,所述管理域中预先指定的超级节点通知所述管理域中的其他主机将数据发送到该超级节点,所述超级节点为所述管理域中的主机之一;所述超级节点接收、存储并按照预设的规则处理所述其他主机发送的数据,并记录对所述数据的处理过程信息。本发明的网络故障处理方法、装置及系统,能够及时处理中心化拓扑结构的网络管理系统的链路中断、堵塞和服务器失效的故障,并使得客户端在与服务器的链路中断的情况下也可以保证网络管理策略的有效,提高了被管理系统及网络的可靠性和安全性。

Description

网络故障处理方法、装置及系统
技术领域
本发明涉及通信领域,尤其涉及一种网络故障处理方法、装置及系统。
背景技术
P2P(Peer to Peer,对等连接)网络又称为对等网络或点对点网络。目前P2P网络已经被越来越多的用户所需要,并且作为一种标准的分发信息的标准方式越来越普遍,因为它的结构使得网络富有延展性,相较普通网络有更高的效率和更好的表现。P2P网络是去中心、自组织和从单纯意义上来说的动态的网络,并且为传统的服务器-客户端计算模型提供另外一种选择。服务器-客户端结构容许用户链接到某一个服务器,尽管服务器是可扩展的,但这总有限制。而P2P网络却拥有几乎无限的扩展可能。根据结构关系可以将P2P网络系统分为如下四种拓扑形式:中心化拓扑、全分布式非结构化拓扑、全分布式结构化拓扑、半分布式拓扑。
中心化拓扑最大的优点是维护简单、发现效率高。由于资源的发现依赖中心化的目录系统,发现算法灵活高效并能够实现复杂查询。最大的问题与传统客户机/服务器结构类似,容易造成单点故障,访问的“热点”现象和等相关问题,这是第一代P2P网络采用的结构模式,如著名的MP3共享软件Napster。
在Napster模型中,一群高性能的中央服务器保存着网络中所有活动对等计算机共享资源的目录信息。当需要查询某个文件时,对等机会向一台中央服务器发出文件查询请求。中央服务器进行相应的检索和查询后,会返回符合查询要求的对等机地址信息列表。查询发起对等机接收到应答后,会根据网络流量和延迟等信息进行选择,与合适的对等机建立连接,并开始文件传输。
图1为中心化拓扑结构的P2P网络示意图。如图1所示,当客户端C3想要下载某文件时,其过程如下:1、首先,客户端C3向服务器S查询拥有该文件的客户端主机;2、服务器S将查询结果(即拥有该文件的客户端C5的信息)返回给客户端C3;3、接着,客户端C3与客户端C5建立连接;4、客户端C3与客户端C5之间进行数据传输,客户端C5将文件传送给客户端C3。其中,客户端是指用户端的主机。
这种中心化拓扑结构的P2P网络模型存在很多问题,从系统稳定性来看,最主要的问题有如下两点:
a)中央服务器的瘫痪容易导致整个网络的崩馈,可靠性和安全性较低;
b)若某客户端与服务器的链路中断,将导致该客户端无法访问P2P网络。
网络维护系统是一个软硬件结合、以软件为主的分布式网络应用系统,其目的是管理网络,使网络高效正常运行,由于需要对网络上主机的信息集中进行分析,因此网络维护系统的模型与P2P中的中心化拓扑模型极其类似。网络维护系统的结构如图2所示。
图2为网络维护系统的结构示意图。如图2所示,网络维护系统将其所维护的网络上的主机分成N个管理域,每个管理域的主机个数根据实际情况而定。中心服务器会定期采集主机的硬件信息、操作系统信息、应用系统信息等信息。当每个管理域的主机与中心服务器通信时,该主机首先将数据发送给对应的交换机,例如,管理域1中的主机先将数据发送给交换机1,交换机1再将数据通过链路1发送给与中心服务器相连的交换机,最后再转发给中心服务器。
通常的网络维护系统功能中的故障管理功能提供对网络故障监测、故障定位、保护切换与恢复,并存储故障信息供以后查询。对来自硬件设备或路径结点的报警进行监控、报告和存储,对故障进行诊断、定位和处理,是故障管理的重要工作。当监测到网络、设备故障或异常时,系统实时产生报警。
对于大部分故障,系统可以自行进行处理而不会影响系统,但是有两种情况会导致系统失效:
第一种是中心服务器瘫痪。此时,所有管理域中的主机所发送的数据均不会被中心服务器所接收,整个系统的管理域将处于失控的状态,系统失效。
第二种是某一条或几条链路中断的故障。图3为网络维护系统中链路中断的示意图。如图3所示,交换机1与和中心服务器相连的交换机的链路1是管理域1中所有主机共享的,由于链路1的带宽有限,如果管理域1中每台主机返回的数据量过大,就会导致链路1拥塞,中心服务器将接收不到管理域1中主机的任何数据,那么此时管理域1将会失去控制。图4为管理域到中心服务器的链路正常示意图,图5为管理域到中心服务器的链路中断示意图。如图4和图5所示,管理域到中心服务器的链路中断也会使管理域失去控制,从而导致该管理域中的客户端无法访问中心服务器。
发明内容
本发明所要解决的技术问题是提供一种网络故障处理方法、装置及系统,提高网络管理系统的可靠性和安全性。
为解决上述技术问题,本发明提出了一种网络故障处理方法,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,包括:
在管理域到中心服务器的链路出现故障时,所述管理域中预先指定的超级节点通知所述管理域中的其他主机将数据发送到该超级节点,所述超级节点为所述管理域中的主机之一;
所述超级节点接收、存储并按照预设的规则处理所述其他主机发送的数据,并记录对所述数据的处理过程信息。
进一步地,上述网络故障处理方法还可具有以下特点,还包括:
所述超级节点检测所述管理域到中心服务器的链路状态。
进一步地,上述网络故障处理方法还可具有以下特点,还包括:
若所述链路状态恢复正常,则所述超级节点通知所述管理域中的其他主机将数据发送到中心服务器。
进一步地,上述网络故障处理方法还可具有以下特点,还包括:
所述超级节点将在所述管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
进一步地,上述网络故障处理方法还可具有以下特点,所述故障为如下三种情况之一:所述管理域到中心服务器的链路中断、所述管理域到中心服务器的链路堵塞、中心服务器失效。
为解决上述技术问题,本发明还提出了一种网络故障处理装置,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,包括:
第一通知模块,用于在管理域到中心服务器的链路出现故障时,通知所述管理域中的其他主机将数据发送到本网络故障处理装置;
数据处理模块,用于接收、存储并按照预设的规则处理所述其他主机发送的数据,并记录对所述数据的处理过程信息。
进一步地,上述网络故障处理装置还可具有以下特点,还包括:
检测模块,用于检测所述管理域到中心服务器的链路状态。
进一步地,上述网络故障处理装置还可具有以下特点,还包括:
第二通知模块,用于在所述链路状态恢复正常时通知所述管理域中的其他主机将数据发送到中心服务器。
进一步地,上述网络故障处理装置还可具有以下特点,还包括:
发送模块,用于将在所述管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
进一步地,上述网络故障处理装置还可具有以下特点,所述故障为如下三种情况之一:所述管理域到中心服务器的链路中断、所述管理域到中心服务器的链路堵塞、中心服务器失效。
为解决上述技术问题,本发明还提出了一种网络终端,该网络终端处于中心化拓扑结构的网络管理系统中,该网络终端包括上述任一项所述的网络故障处理装置。
为解决上述技术问题,本发明还提出了一种网络故障处理系统,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,包括中心服务器和与该中心服务器相连的网络终端,所述网络终端包括超级节点和普通终端,所述超级节点包括上述任一项所述的网络故障处理装置,所述中心服务器从所述网络终端中指定所述超级节点,在出现故障时,所述普通终端将数据发送给所述超级节点进行存储和处理,所述超级节点在网络终端与所述中心服务器的链路恢复正常后通知所述普通终端将数据发送给所述中心服务器,并将自身在故障期间处理的数据以及数据的处理过程信息发送给所述中心服务器。
本发明的网络故障处理方法、装置及系统,能够及时处理中心化拓扑结构的网络管理系统的链路中断、堵塞和服务器失效的故障,并使得客户端在与服务器的链路中断的情况下也可以保证网络管理策略的有效,提高了被管理网络系统的可靠性和安全性。
附图说明
图1为中心化拓扑结构的P2P网络示意图;
图2为网络维护系统的结构示意图;
图3为网络维护系统中链路中断的示意图;
图4为管理域到中心服务器的链路正常示意图;
图5为管理域到中心服务器的链路中断示意图;
图6为本发明实施例中网络故障处理方法的流程图;
图7为本发明实施例中网络故障处理装置的结构图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图6为本发明实施例中网络故障处理方法的流程图,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理。如图6所示,本实施例中,网络故障处理方法的流程包括如下步骤:
步骤601,管理域到中心服务器的链路出现故障;
这里所说的故障可以是如下三种情况之一:管理域到中心服务器的链路中断、管理域到中心服务器的链路堵塞、中心服务器失效。中心服务器失效可以看成是中心服务器与所有管理域的链路都中断的情况。
步骤602,该管理域中的超级节点通知本管理域中的其他主机将数据发送到该超级节点;
其中,超级节点为管理域中的主机之一,是预先指定好的。网络维护系统在初始化时为每一个管理域指定一个超级节点,超级节点的功能在链路正常时与其他主机一样,一旦出现故障,那么超级节点则作为临时的中心服务器来对该管理域进行管理。具体地,超级节点可以由网络维护系统中的中心服务器指定。
步骤603,超级节点接收、存储以及按照预设的规则处理其他主机发送的数据,并记录对数据的处理过程信息;
其中,预设的规则可以由中心服务器预先发给超级节点。
步骤604,超级节点检测管理域到中心服务器的链路状态;
此处,链路状态是指链路正常和链路出现故障这两种状态。
超级节点可以采用定期向中心服务器发送心跳检测包的方式来检测链路状态。
步骤605,判断链路状态是否恢复正常,若链路状态恢复正常,则执行步骤606,否则执行步骤603;
步骤606,超级节点通知该管理域中的其他主机将数据发送到中心服务器;
步骤607,超级节点将在管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
本发明的网络故障处理方法,能够及时处理中心化拓扑结构的网络管理系统的链路中断、堵塞和服务器失效的故障,并使得客户端在与服务器的链路中断的情况下也可以保证网络管理策略的有效,提高了被管理网络系统的可靠性和安全性。
本发明还提出了一种网络故障处理装置,用以实施上述的网络故障处理方法。
图7为本发明实施例中网络故障处理装置的结构图,该网络故障处理装置应用于中心化拓扑结构的网络管理系统的骨干链路故障处理。如图7所示,该网络故障处理装置包括第一通知模块710和数据处理模块720。其中,第一通知模块710用于在管理域到中心服务器的链路出现故障时,通知该管理域中的其他主机将数据发送到本网络故障处理装置。此处,故障可以是如下三种情况之一:管理域到中心服务器的链路中断、管理域到中心服务器的链路堵塞、中心服务器失效。数据处理模块720用于接收、存储以及按照预设的规则处理其他主机发送的数据,并记录对数据的处理过程信息。其中,预设的规则可以由中心服务器预先发给网络故障处理装置。
在本发明的其他实施例中,网络故障处理装置还可以包括检测模块。检测模块用于检测管理域到中心服务器的链路状态。
在本发明的其他实施例中,网络故障处理装置还可以包括第二通知模块。第二通知模块用于在链路状态恢复正常时通知管理域中的其他主机将数据发送到中心服务器。
在本发明的其他实施例中,网络故障处理装置还可以包括发送模块。发送模块用于将在管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
本发明的网络故障处理装置,能够及时处理中心化拓扑结构的网络管理系统的链路中断、堵塞和服务器失效的故障,并使得客户端在与服务器的链路中断的情况下也可以保证网络管理策略有效,提高了被管理网络系统的可靠性和安全性。
本发明还提出了一种网络终端,该网络终端处于中心化拓扑结构的网络管理系统中,且该网络终端包括前述的任意一种网络故障处理装置。该网络终端即前面提到的管理域中作为超级节点的主机。
本发明还提出了一种网络故障处理系统,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,该网络故障处理系统包括中心服务器和与该中心服务器相连的网络终端,其中,网络终端包括超级节点和普通终端,超级节点包括上述的任意一种网络故障处理装置。中心服务器从网络终端中指定超级节点,在出现故障时,普通终端将数据发送给超级节点进行存储和处理,超级节点在网络终端与该中心服务器的链路恢复正常后通知普通终端将数据发送给中心服务器,并将自身在故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
本发明的网络故障处理系统,能够及时处理中心化拓扑结构的网络管理系统的链路中断、堵塞和服务器失效的故障,并使得客户端在与服务器的链路中断的情况下也可以保证网络管理策略有效,提高了被管理网络系统的可靠性和安全性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种网络故障处理方法,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,其特征在于,包括:
在管理域到中心服务器的链路出现故障时,所述管理域中预先指定的超级节点通知所述管理域中的其他主机将数据发送到该超级节点,所述超级节点为所述管理域中的主机之一;
所述超级节点接收、存储并按照预设的规则处理所述其他主机发送的数据,并记录对所述数据的处理过程信息。
2.根据权利要求1所述的网络故障处理方法,其特征在于,还包括:
所述超级节点检测所述管理域到中心服务器的链路状态。
3.根据权利要求2所述的网络故障处理方法,其特征在于,还包括:
若所述链路状态恢复正常,则所述超级节点通知所述管理域中的其他主机将数据发送到中心服务器。
4.根据权利要求3所述的网络故障处理方法,其特征在于,还包括:
所述超级节点将在所述管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
5.根据权利要求1所述的网络故障处理方法,其特征在于,所述故障为如下三种情况之一:所述管理域到中心服务器的链路中断、所述管理域到中心服务器的链路堵塞、中心服务器失效。
6.一种网络故障处理装置,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,其特征在于,包括:
第一通知模块,用于在管理域到中心服务器的链路出现故障时,通知所述管理域中的其他主机将数据发送到本网络故障处理装置;
数据处理模块,用于接收、存储并按照预设的规则处理所述其他主机发送的数据,并记录对所述数据的处理过程信息。
7.根据权利要求6所述的网络故障处理装置,其特征在于,还包括:
检测模块,用于检测所述管理域到中心服务器的链路状态。
8.根据权利要求7所述的网络故障处理装置,其特征在于,还包括:
第二通知模块,用于在所述链路状态恢复正常时通知所述管理域中的其他主机将数据发送到中心服务器。
9.根据权利要求8所述的网络故障处理装置,其特征在于,还包括:
发送模块,用于将在所述管理域到中心服务器的链路出现故障期间处理的数据以及数据的处理过程信息发送给中心服务器。
10.根据权利要求6所述的网络故障处理装置,其特征在于,所述故障为如下三种情况之一:所述管理域到中心服务器的链路中断、所述管理域到中心服务器的链路堵塞、中心服务器失效。
11.一种网络终端,该网络终端处于中心化拓扑结构的网络管理系统中,其特征在于,该网络终端包括权利要求6至10任一项所述的网络故障处理装置。
12.一种网络故障处理系统,应用于中心化拓扑结构的网络管理系统的骨干链路故障处理,其特征在于,包括中心服务器和与该中心服务器相连的网络终端,所述网络终端包括超级节点和普通终端,所述超级节点包括权利要求6至10任一项所述的网络故障处理装置,所述中心服务器从所述网络终端中指定所述超级节点,在出现故障时,所述普通终端将数据发送给所述超级节点进行存储和处理,所述超级节点在网络终端与所述中心服务器的链路恢复正常后通知所述普通终端将数据发送给所述中心服务器,并将自身在故障期间处理的数据以及数据的处理过程信息发送给所述中心服务器。
CN201210230413.XA 2012-07-04 2012-07-04 网络故障处理方法、装置及系统 Expired - Fee Related CN102833093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210230413.XA CN102833093B (zh) 2012-07-04 2012-07-04 网络故障处理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210230413.XA CN102833093B (zh) 2012-07-04 2012-07-04 网络故障处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN102833093A true CN102833093A (zh) 2012-12-19
CN102833093B CN102833093B (zh) 2016-05-11

Family

ID=47336072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210230413.XA Expired - Fee Related CN102833093B (zh) 2012-07-04 2012-07-04 网络故障处理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN102833093B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501251A (zh) * 2013-10-11 2014-01-08 北京奇虎科技有限公司 断网情况下的数据包处理方法及装置
CN107992415A (zh) * 2017-11-28 2018-05-04 中国银联股份有限公司 一种交易系统的故障定位和分析方法及相关服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101018408A (zh) * 2007-02-01 2007-08-15 华为技术有限公司 业务实现的方法、网络设备以及网络
CN101437031A (zh) * 2008-12-03 2009-05-20 腾讯科技(深圳)有限公司 计算机网络数据的传输处理方法与系统
CN102123161A (zh) * 2010-01-08 2011-07-13 中国移动通信集团公司 一种分布式移动性管理的方法及分布式移动性管理系统
CN102123100A (zh) * 2008-02-05 2011-07-13 华为技术有限公司 一种维护路由信息的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101018408A (zh) * 2007-02-01 2007-08-15 华为技术有限公司 业务实现的方法、网络设备以及网络
CN102123100A (zh) * 2008-02-05 2011-07-13 华为技术有限公司 一种维护路由信息的方法及装置
CN101437031A (zh) * 2008-12-03 2009-05-20 腾讯科技(深圳)有限公司 计算机网络数据的传输处理方法与系统
CN102123161A (zh) * 2010-01-08 2011-07-13 中国移动通信集团公司 一种分布式移动性管理的方法及分布式移动性管理系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501251A (zh) * 2013-10-11 2014-01-08 北京奇虎科技有限公司 断网情况下的数据包处理方法及装置
CN103501251B (zh) * 2013-10-11 2017-01-25 北京奇虎科技有限公司 断网情况下的数据包处理方法及装置
CN107992415A (zh) * 2017-11-28 2018-05-04 中国银联股份有限公司 一种交易系统的故障定位和分析方法及相关服务器
CN107992415B (zh) * 2017-11-28 2021-04-16 中国银联股份有限公司 一种交易系统的故障定位和分析方法及相关服务器

Also Published As

Publication number Publication date
CN102833093B (zh) 2016-05-11

Similar Documents

Publication Publication Date Title
JP5815891B2 (ja) ネットワーク自己保護
Song et al. Control path management framework for enhancing software-defined network (SDN) reliability
CN104852857B (zh) 基于负载均衡的分布式数据传输方法和系统
CN107066569A (zh) 一种分布式网络爬虫系统及信息爬取的方法
EP3353952A1 (en) Managing groups of servers
CN109218126B (zh) 监测节点存活状态的方法、装置及系统
CN103858382A (zh) 防火墙群集中的应用状态共享
CN112491700A (zh) 网络路径调整方法、系统、装置、电子设备及存储介质
CN103731482A (zh) 一种集群负载均衡系统及其实现方法
Valetto et al. A self-organized load-balancing algorithm for overlay-based decentralized service networks
CN108809678A (zh) 一种信息推送的方法以及服务器
CN102833093A (zh) 网络故障处理方法、装置及系统
Forestiero et al. Antares: An ant-inspired P2P information system for a self-structured grid
CN110661836B (zh) 消息路由方法、装置及系统、存储介质
CN111880932A (zh) 一种基于多网口的数据存储方法及装置
CN116647476A (zh) 网络管理方法、装置、计算机设备、存储介质和程序产品
US8458529B2 (en) Logical entity fault isolation in network systems management
CN102647424A (zh) 一种数据传输方法及其装置
Feng et al. Efficient and adaptive stateful replication for stream processing engines in high-availability cluster
CN102752335B (zh) 对等叠加网中节点过负荷信息订阅方法及系统
CN115426250B (zh) 一种用于靶场指控的双机热备切换方法及装置
US10277700B2 (en) Control plane redundancy system
Liabotis et al. Self-organising management of Grid environments
CN117411772B (zh) 一种分布式网络节点管理与安全重组方法
Ai et al. Combining SDN and ICN for network survivability improvement

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160511

Termination date: 20210704