CN101026529A - 环形网络和主节点 - Google Patents
环形网络和主节点 Download PDFInfo
- Publication number
- CN101026529A CN101026529A CNA2007100073731A CN200710007373A CN101026529A CN 101026529 A CN101026529 A CN 101026529A CN A2007100073731 A CNA2007100073731 A CN A2007100073731A CN 200710007373 A CN200710007373 A CN 200710007373A CN 101026529 A CN101026529 A CN 101026529A
- Authority
- CN
- China
- Prior art keywords
- grouping
- node
- mentioned
- ring
- host node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
检测出环上的多重故障的发生和从多重故障中至少一个的恢复,并适当更新环构成节点的传送用数据库。主节点(110)沿环的两个方向发送用于确认在环上连接的网络的状态的探测分组(140)。从节点(120)增加接收到的探测分组(140)中包含的跳数而发送到相邻的环构成节点,并且,将跳计数报告分组(150)发送到主节点(110)。主节点(110)通过接收不到自身发送的探测分组,而检测出环上的故障。进一步,根据从环的两个方向接收的跳计数报告分组(150)的跳数的最大值的和,检测出多重故障的发生和多重故障的至少一个的故障已恢复,而发送促使分组传送用数据库更新的分组。
Description
技术领域
本发明涉及环形网络和主节点,尤其涉及在环上具有主从关系的网络装置中,可检测出环上的多重故障的发生和从多重故障检测出一个位置以上的恢复的环形网络和主节点。
背景技术
作为实现网络的高可靠性的手段,提出了环形协议(ringprotocol)。环形协议中有使构成环的节点具有主从关系(主设备/从设备)的方式(例如参照非专利文献1)。该方式中,主节点具有环的支配权。主节点为了确认环的状态,每隔一定时间从与环相连的第一端口发送健康检查分组。另外,主节点为了防止数据分组在环上陷入循环状态,逻辑上阻断与环相连的第二端口。上述第二端口中,对包含健康检查分组的控制分组不进行逻辑上的阻断。因此,主节点在每隔一定时间不能在上述第二端口上接收健康检查分组的情况下,识别为环上发生了故障。
在发生了环上的故障时,主节点解除对于上述第二端口的逻辑阻断。解除之后,主节点更新装置内的数据分组的传送用数据库。同时,对构成环的所有从节点,发出促使传送用数据库更新的消息。通过传送用数据库的更新,数据分组不通过环上的故障位置来进行传送。另外,主节点在故障发生过程中还从上述第一端口继续进行健康检查分组的发出。主节点在可通过上述第二端口接收健康检查分组的情况下,识别为环上的故障已恢复。这时,主节点逻辑上阻断上述第二端口,并更新装置内的传送用数据库。同时,对构成环的所有从节点,发出促使传送用数据库更新的消息。即,输入到环中的数据分组在与故障发生前相同的线路上传送。
除此之外,公开了构成以双向传送路径连接的环的各节点在环的两个方向上发出包含分组残余时间的健康检查,并根据从其他节点发出的健康检查的到达状况来更新自身节点和其他节点的关系的方式(例如,参照专利文献1)。
另外,公开了下面的方式,即,接收了从通过光纤相连的环的主节点发出的导频分组(pilot packet)的节点,向主节点通知是否可以正常接收导频分组,从而主节点识别出环中的故障节点的方式(例如,参照专利文献2)。
【专利文献1】日本特开2003-234747号公报
【专利文献2】日本特开2004-248316号公报
【非专利文献1】RFC3619,Extreme Networks’Ethernet AutomaticProtection Switching(EAPS)Version 1,2003年10月
专利文献1中,某个节点根据从其他节点发出的分组的残余时间,来求出与发送源节点之间的关系,但是没有公开对环中的多重故障的应对。专利文献2中,主节点仅确认了环中的其他节点的状态,但是没有公开对环中的多重故障的应对。
另外,非专利文献1中,未记载对环上的多重故障的应对。可以认为,假设在发生了多重故障的情况下,非专利文献1的主节点仅在识别为环上的最初的故障发生时和环上的所有故障恢复了的情况下,对构成环的所有节点,促使传送用数据库的更新。因此,在环上的多重故障发生后,在一个位置的故障恢复的情况下,认为非专利文献1的主节点不对构成环的所有节点促使传送用数据库的更新。即,可以预想在从多重故障恢复的情况下,数据传送的可靠性降低。
另外,非专利文献1中,没有用于应对环上的主节点故障的记述。因此,可以认为非专利文献1的从节点并未促使进行传送用数据库的更新。因而,在环上发生主节点故障的情况下,有网络的可靠性下降的可能性。
发明内容
本发明鉴于上述问题,其目的是在使环具有的节点具备主从关系的网络上,在主节点检测出发生了环上的至少一个位置的故障和多重故障的情况下,在检测后更新环具有的各节点的传送用数据库。进一步,本发明的目的是在使环具有的节点具备主从关系的网络中,主节点在环上的多重故障中检测出了至少一个位置的恢复的情况下,在检测后使环具有的各节点的传送用数据库更新。另外,本发明的目的是提供一种通过适当更新环构成节点的传送用数据库,而不管环上的主节点有无故障,来提供通信网络的高可靠性。本发明的目的之一是将从主节点不能接收到探测分组的从节点之一作为主节点来动作。
本发明的目的之一是在环形网络中多重故障的发生位置变化的情况下,适当更新环构成节点的传送用数据库。
根据本发明的第一解决手段,提供了一种环形网络,其特征在于:
包括多个节点,该多个节点参照分组传送用的数据库来传送分组;
多个上述节点按环状连接;
上述节点中的至少一个是发送探测分组的主节点,该探测分组用于确认按环状连接的网络的状态,其他节点是按照来自上述主节点的指示进行处理的从节点;
上述主节点每隔预定的时间或不定期地,从第一端口和第二端口向环的两个方向一次一个地或一次预定个数地发送跳数被初始化了的探测分组;
上述各从节点,若经与环相连的两个端口的一个接收到探测分组,则增加探测分组中包含的跳数,将包含增加后的跳数的该探测分组经与接收的端口不同的另一个端口发送到相邻的上述从节点或上述主节点,并且,生成包含增加后的跳数的跳计数报告分组,并经接收了探测分组的端口发送到上述主节点;
上述主节点,经第一端口和第二端口接收来自各从节点的多个跳计数报告分组,并按每个端口管理跳计数报告分组中包含的跳数的最大值,求出对应于第一端口的跳数的最大值和对应于第二端口的跳数的最大值的和,并根据所求出的和来求出从上述主节点可进行通信的从节点总数,通过所求出的可进行通信的从节点总数的变动,检测出环中的多重故障的发生和该多重故障的至少一个故障的恢复,并且,在所求出的可进行通信的从节点总数不变动的情况下,通过对应于第一端口或第二端口的跳数的最大值的变动,检测出环中的拓扑的变化;每次检测出这些事件时,更新装置内的上述数据库和/或对上述从节点发送用于更新分组传送用的上述数据库的分组。
根据本发明的第二解决手段,提供一种环形网络,其特征在于:
包括多个节点,该多个节点参照分组传送用的数据库来传送分组;
多个上述节点按环状连接;
上述节点中的至少一个是发送探测分组的主节点,该探测分组用于确认按环状连接的网络的状态,其他节点是按照来自上述主节点的指示进行处理的从节点;
上述主节点每隔预定的时间或不定期地,从第一端口和第二端口向环的两个方向一次一个地或一次预定个数地发送跳数被初始化了的探测分组;
上述各从节点,若经与环相连的两个端口的一个接收到探测分组,则增加探测分组中包含的跳数,将包含增加后的跳数的该探测分组经与接收的端口不同的另一个端口发送到相邻的上述从节点或上述主节点,并且,生成包含增加后的跳数的跳计数报告分组,并经接收了探测分组的端口发送到上述主节点;
上述主节点,经第一端口和第二端口接收来自各从节点的多个跳计数报告分组,并按每个端口管理跳计数报告分组中包含的跳数的最大值,求出对应于第一端口的跳数的最大值和对应于第二端口的跳数的最大值的和,并根据所求出的和来求出从上述主节点可进行通信的从节点总数,通过所求出的可进行通信的从节点总数的变动,检测出环中的多重故障的发生和该多重故障的至少一个故障的恢复;每次检测出这些事件时,更新装置内的上述数据库和/或对上述从节点发送用于更新分组传送用的上述数据库的分组。
根据本发明的第三解决手段,提供一种主节点,其特征在于:
在按环状连接了参照分组传送用的数据库来传送分组的多个节点的环形网络中,
具有:
与环连接的第一端口和第二端口;和
环管理部,检测出环中的故障的发生和恢复;
上述环管理部每隔预定的时间或不定期地,从上述第一端口和上述第二端口向环的两个方向一次一个地或一次预定个数地发送跳数被初始化了的探测分组;
经与环连接的两个端口的一个,接收探测分组,增加该探测分组中包含的跳数,并将包含增加后的跳数的该探测分组经与接收的端口不同的另一端口传送到相邻的节点或上述主节点,并且,生成包含增加后的跳数的跳计数报告分组,并经接收了探测分组的端口发送到上述主交换器;
构成环的其他节点增加探测分组包含的跳数并返回,经上述第一端口及第二端口接收包含增加了的跳数的多个跳计数报告分组,按每个端口管理跳计数报告分组中包含的跳数的最大值;
求出对应于第一端口的跳数的最大值和对应于第二端口的跳数的最大值的和,并根据所求出的和来求出可进行通信的节点总数;
通过所求出的可进行通信的节点总数的变动,检测出环中的多重故障的发生和该多重故障的至少一个故障的恢复;
每次检测出这些事件时,更新装置内的上述数据库和/或对构成环的其他节点发送用于更新分组传送用的上述数据库的分组。
【发明的效果】
根据本发明,在使环具备的节点具有主从关系的网络中,主节点在检测出了环上至少一个位置的故障发生的情况下,可以在检测后使环具有的各节点的传送用数据库更新。进一步,根据本发明,在使环具备的节点具有主从关系的网络中,主节点在环上的多重故障中检测出了至少一个故障的恢复的情况下,可以在检测之后马上更新环构成节点的传送用数据库。进一步,根据本发明,不管环上的主节点有无故障,通过适当更新环构成节点的传送用数据库,可以提供不损害通信的可靠性的网络。进一步,根据本发明,从主节点不能接收探测分组的一个从节点可以作为主节点动作。
另外,根据本发明,在环形网络中多重故障的发生位置改变了的情况下,也可适当更新环构成节点的传送用数据库。
附图说明
图1是单一环形网络100的结构图;
图2是表示在单一环形网络100上传送的可变长分组的格式例的说明图;
图3是表示主节点110发出的探测分组140和从节点120发出的跳计数报告分组150之间的关系的说明图;
图4是基于从节点120的探测分组140的发送接收和跳计数报告分组150的发出处理的流程图;
图5是对基于主节点110的故障的应对动作的流程图;
图6是副主节点的动作的流程图;
图7是环具有的节点装置900的结构图;
图8是对基于包含副主节点的环的主节点110的故障的应对动作的流程图;
图9是环管理部930的结构图;
图10是分组传送部920的结构图;
图11是说明在分组传送时的分组传送数据库922中存储的检索结果信息800的格式的说明图;
图12是传送基于从节点120的跳计数报告分组150的处理的流程图;
图13是发生多重故障的单一环形网络100的结构图;
图14是第二实施方式中的环形网络的结构图;
图15是多重故障例的说明图;
图16是第四实施方式中的拓扑变化的说明图;
图17是对基于第四实施方式中的主节点110的故障的应对动作的流程图;
图18是对基于包含第五实施方式中的副主节点的环的主节点110的故障的应对动作的流程图。
具体实施方式
第一实施方式
下面,参照附图来说明本实施方式。本实施方式中,描述了单一的环形网络。其中,所使用的装置、分组的种类并不限于此。
(硬件结构)
图1是表示环形网络的结构例的图。
单一环形网络100包括负责环状态的确认和数据分组的传送用数据库更新的主节点(主交换器)110和根据主节点110的指示的从节点(从交换器)120-1~120-5。各交换器上连接例如终端130-1、130-2。
主节点110在自身没有发生故障的情况下,为了检测出环上的多重故障的发生和从多重故障的恢复,求出可从主节点110进行通信的从节点数。主节点110为了求出可进行通信的从节点数,从第一端口1101和第二端口1102发送探测分组(probe packet)140。探测分组140中包含表示可从主节点110进行通信的从节点数(以下为跳计数)的项目。
各从节点120在接收到探测分组140之后,立即将跳计数例如增1。之后,向(不是接收侧的)相邻的环构成节点传送探测分组140。另外,从节点120在探测分组140的跳计数增加后,生成跳计数报告分组150,并向主节点110进行发送。跳计数报告分组150用于将探测分组140的到达程度传递给主节点110。
主节点110在一定时间内自身发送的探测分组140在环中传送而没有返回的情况下,识别出环上发生故障。这时,主节点110在各从节点120发送的跳计数报告分组150内,计算可由第一端口1101接收的跳计数的最大值、和可由第二端口1102接收的跳计数的最大值之和。通过可由第一端口1101和第二端口1102接收的跳计数的最大值之和的增减,主节点110在环上的故障发生时,可以检测出多重故障的发生和从多重故障的恢复。
图2是表示在单一环形网络100上传送的分组格式的例子的说明图。
可变长分组200包含OSI参照模型中第二层(数据链路层)的L2头210和L2有效载荷220。L2头210的形状根据构成网络的装置所收容的线路的种类而不同。例如,在收容的线路是以太网(注册商标)的情况下,L2头210中包含目标MAC地址211、发送源MAC地址212、标签(tag)213和帧类型214。
图7是表示环具有的节点装置900的结构例的图。
主节点110和从节点120-1~120-5可以使用节点装置900。自身装置可以通过预先决定是主节点110、还是从节点120,来定义两个节点的其中之一的功能。
节点装置900具有多个线路接口910-i(i=1~N)、分组传送部920、环管理部930和装置控制部940。
图10是表示分组传送部920的结构例的图。
分组传送部920具有表示应适用于接收分组的后级处理的分组传送数据库922,和执行分组传送处理与分组传送用数据库922的控制的分组传送处理器921。
分组传送部920决定所接收的分组的后级处理。这里,分组传送部920作为对于接收分组的后级处理,例如可举出有发送用线路接口的检索、向控制环形协议的分组的环管理部930的传送、和向装置控制部940的传送。
图9是表示环管理部930的结构例的图。
环管理部930具有环分组输入部931、探测分组管理部932、环状态管理部933、环形协议控制分组生成部934和环分组输出部935。后面描述各部分的细节。
图7中,与管理终端30相连的装置控制部940执行在网络上传送的控制分组的分析、和包含分组传送部920的装置整体的控制。另外,装置控制部940使用分析的结果,来执行装置内的状态更新或对所接收的控制分组的响应。
线路接口910-i执行在收容线路上传送的分组的发送接收。
(模式设定)
环具有的节点装置900在节点装置900启动时的模式设定中决定用于使设备具有主从关系的“主设备”和“从设备”的各模式。对环具有的各节点的模式设定,网络管理者使用管理终端30按每个节点来进行输入。网络管理者输入的模式的信息经信号线L7输入到装置控制部940中。输入了模式信息的装置控制部940生成在L2有效载荷220上记载了模式信息的分组(模式信息分组),并向信号线L3输出所生成的模式信息分组。从信号线L3输入了模式信息分组的环管理部930的分组输入部931,识别为输入分组是模式信息分组,并输出到信号线L92。从信号线L92输入了模式信息分组的环状态管理部933以所输入的模式信息分组上记载的信息为基础来设定自身装置的模式(主节点(master node)、副主节点(submaster node)和从(slave node)节点)。
(分组传送)
主节点110和从节点120-1~120-5在接收到分组200后,向目标传送分组。
具体说明如下,各节点装置900中,接收了分组200的线路接口910-i向信号线L8-i(i=1~N)输出所接收的分组200。分组传送部920的分组传送处理器921从信号线L8-i中输入分组200,并从所接收的分组200上记载的信息中识别分组的类别。这时,在接收分组200是环分组的情况下,将接收分组200输出到信号线L1中。
另一方面,在所接收的分组200不是环分组的情况下,分组传送处理器921生成用于从L2头210中检索分组传送数据库922的检索键,并将所生成的检索键和检索命令输出到信号线L10中。检索的结果,将检索结果信息从L11输入到分组传送处理器921。这里,说明检索结果信息的结构。
图11是表示分组传送时的分组传送数据库922中存储的检索结果信息800的格式的说明图。
检索结果信息800包含后级处理指示标志811和输出接口信息820。
分组传送处理器921根据后级处理指示标志810决定适用于接收分组200的后级处理。这里,分组传送处理器921在后级处理指示标志810表示的后级处理例如是“向装置控制部的传送”的情况下,将接收分组200输出到信号线L5上。另外,分组传送处理器921在后级处理是“通常传送”的情况下,为了从输出接口信息820上记载的线路接口910-j(j=1~N,j≠i)发送接收分组200,而将接收分组200输出到信号线L8-j。另外,分组传送处理器921在后级处理是“丢弃”的情况下,丢弃接收分组200。
下面,说明环具有的所有节点装置900(模式设定已完成)中的环形协议启动后的动作。
环形协议在网络管理者进行的对主节点110的管理终端30输入启动命令之后启动。通过网络管理者输入的启动命令经信号线L7输入到装置控制部940中。输入了启动命令的装置控制部940生成在L2有效载荷220上记载了模式信息的分组(环形协议启动分组),并向信号线L3输出所生成的环形协议启动分组。从信号线L3输入了记载模式信息的分组的分组输入部931,识别为输入分组是环形协议启动分组,输出到信号线L92。从信号线L92输入了环形协议启动分组的环状态管理部933,与将环形协议启动分组输出到信号线L96同时地或大致同时地,启动环形协议管理定时器。这时,环状态管理部933使环状态转移到“正常”。
之后,主节点110中,环形协议控制分组生成部934生成用于确认环状态的探测分组140。探测分组140使用分组200的形式。在探测分组140生成时,环形协议控制分组生成部934在L2有效载荷220中,记载可从主节点110进行通信的从节点120的数(跳计数)为“0”的(初始化后的)跳计数、和用于识别探测分组140的信息。环形协议控制分组生成部934在生成探测分组140后,输出到信号线L97。
从信号线L97输入了探测分组140的环分组输出部935识别出输入分组是探测分组140,并输出到信号线L2中。
从信号线L2输入了探测分组140的分组传送处理器921根据所输入的分组的L2有效载荷220上记载的信息,识别为是探测分组140。这时,分组传送处理器921复制探测分组140。分组传送处理器921将复制结果成为2个的探测分组140分别输出到与作为线路接口910的构成要素的第一端口1101和第二端口1102相对应的信号线L8中。之后,各探测分组140经对应于第一端口1101和第二端口1102的线路接口910来进行发送。
在环状态是正常的情况下,从图1的第一端口1101发送的探测分组140向第二端口1102顺时针在环上进行传送。另外,从第二端口1102发送的探测分组140向第一端口1101逆时针在环上传送。
第一端口1101和第二端口1102的定义可以与网络管理者通过管理终端30进行的模式设定同时进行。进一步,在模式设定时,在主交换器上定义环具有的从交换器数。
虽然在图1中没有记载,但是主节点110的第二端口1102在逻辑上阻断数据分组。例如,在主节点110通过第二端口1102接收了从终端130-2向终端130-1的数据分组的情况下,丢弃所接收的数据分组。逻辑上阻断数据分组的理由是:防止因数据分组因无限制在环上循环的“循环”状态而发生线路拥挤。另外,该逻辑上的阻断仅丢弃数据分组,而不丢弃包含探测分组140的用于控制环的分组(控制分组)。
(流程图)
图3是表示探测分组140和跳计数报告分组150之间的关系的说明图。图4是基于从节点120的探测分组140的发送接收和跳计数报告分组150的发出处理的流程图。
从节点120接收探测分组140,而将探测分组140的跳计数增加1(步骤S401)。从节点120在探测分组140的跳计数增加后,从与接收端口相反侧的环用线路收容端口向相邻节点发送增加了跳计数后的探测分组140(步骤S402)。另外,从节点120在与步骤S402同时或在其前后,生成用于将探测分组140的到达程度传递给主节点110的跳计数报告分组150。跳计数报告分组150包含在步骤S401中增加后的跳计数。从节点120从接收了探测分组140的线路接口,向主节点110发送所生成的跳计数报告分组150(步骤S403)。主节点110通过接收跳计数报告分组150,可以了解可从主节点110进行通信的最大跳数。
下面表示上述各步骤的装置内动作。在从节点120中,线路接口910-i在主节点110接收到发送源的探测分组140后,输出到信号线L8-i中。从信号线L8-i输入了探测分组140的分组传送处理器921,根据所输入的分组上记载的信息,识别为是探测分组140。这时,分组传送处理器921更新在识别出的探测分组140内的L2有效载荷220上记载的接收线路接口信息。之后,分组传送处理器921将更新了接收线路接口信息的探测分组140输出到信号线L1。从信号线L1输入了探测分组140的环分组输入部931识别为输入分组是探测分组140,并输出到信号线L91。在从节点120中,从信号线L91输入了探测分组140的探测分组管理部932将所输入的探测分组140的L2有效载荷220上记载的跳计数例如增加1。进一步,探测分组管理部932将复制结果成为2个的探测分组140分别输出到信号线L94和信号线L95。在从节点120中,从信号线L95输入了探测分组140的环分组输出部935与主节点110的环分组输出部935一样,将所输入的探测分组140输出到信号线L2上。
在从节点120中,从信号线L2输入了探测分组140的分组传送处理器921,从与所输入的探测分组140的L2有效载荷220上记载的接收线路接口信息不同的环用线路收容端口发送探测分组140。即,发送探测分组140,使得在环上形成一周。因此,分组传送处理器921将所输入的探测分组140,输出到对应于与所输入的探测分组140的L2有效载荷220上记载的接收线路接口信息不同的环用线路收容端口的信号线L8-m(m=1~N)。之后,探测分组140经信号线L8-m,从对应于信号线L8-m的线路接口910-m加以发送。
另外,将向信号线L94输出的探测分组140输出到环形协议控制分组生成部934中。在从节点120中,从信号线L94输入了探测分组140的环形协议控制分组生成部934,生成用于将探测分组140的到达程度传递给主节点的跳计数报告分组150。环形协议控制分组生成部934在生成时,使得跳计数报告分组150上应记载的跳计数,使用所输入的探测分组140上记载的跳计数(增加计数后的计数)。另外,在L2有效载荷220上,记载输入了探测分组140的跳计数、和用于识别为是跳计数报告分组150的信息的探测分组140内的接收线路接口信息。生成后,环形协议控制分组生成部934将所生成的跳计数报告分组150输出到信号线L97。从节点120中,从信号线L97输入了跳计数报告分组150的环分组输出部935识别所输入的跳计数报告分组150,并输出到信号线L2。
从信号线L2输入了跳计数报告分组150的分组传送处理器921为了从与在所输入的跳计数报告分组150的L2有效载荷220上记载的接收线路接口信息相对应的线路接口910-I、发送所输入的跳计数报告分组150,而将跳计数报告分组150输出到对应于线路接口910-i的信号线L8-i。
接收了探测分组140的相邻从节点120和其他多个从节点120执行同样的处理。
图12是传送基于从节点120的跳计数报告分组150的处理的流程图。
首先,从节点120接收跳计数报告分组150(步骤S1201)。另外,不执行对所接收的跳计数报告分组150上记载的信息的更新。从节点120在接收到跳计数报告分组150后,为了传送到主交换器110,而从与接收端口相反侧的环用线路收容端口向相邻节点发送跳计数报告分组150(步骤S1202)。
下面表示上述步骤的装置内动作。从相邻的从交换器120-a(a=1~M)接收了跳计数报告分组150的从交换器120-b(b=1~M,b≠a)中,线路接口910-c(c=1~N)在接收到从相邻的从交换器120-a发送来的跳计数报告分组150后,将所接收的跳计数报告分组150输出到信号线L8-c。从信号线L8-c输入了跳计数报告分组150的分组传送处理器921根据所接收的分组上记载的信息识别为是跳计数报告分组150。这时,分组传送处理器921为了从与接收了跳计数报告分组150的接收线路接口不同的环用线路收容端口,发送所接收到的跳计数报告分组150,而将跳计数报告分组150输出到与不同于接收了跳计数报告分组150的接收线路接口的环用线路收容端口相对应的信号线L8-d(d=1~N,d≠c)。之后,从对应于信号线L8-d的线路接口910-d发送跳计数报告分组150。
图5是对基于主节点110的故障的应对动作的流程图。使用图5的处理流程来说明对基于主节点110的故障的应对。另外,参照图7、图9和图10,来详细描述各节点中的处理。
首先,主节点110如上所述,向自身收容的两个方向的环线路发出探测分组140(步骤S501)。主节点110检查在一定时间内,是否可以接收自身发出的、在环上成为一周并通过各从节点120相加了跳计数后的探测分组140,并且,所接收的探测分组140上记载的跳计数是否与环具有的从节点120的数目一致(步骤S502)。另外,环具有的从节点120的数目预先设定在适当的存储器中。另外,在步骤S502中,也可判断探测分组140是否可接收、或跳计数是否与从节点120的数目一致的其中之一。主节点110若在步骤S502中为是,则回到步骤S501,另一方面,若是否,则移到步骤S503。
若详细描述步骤S502,则在主节点110中,首先,线路接口910-i将所接收的探测分组140输出到信号线L8-i。从信号线L8-i输入了探测分组140的分组传送处理器921根据所输入的分组上记载的信息识别出是探测分组140,并输出到信号线L1。从信号线L1输入了探测分组140的环分组输入部931识别为所输入的分组是探测分组140,而输出到信号线L91。主节点110中,从信号线L91输入了探测分组140的探测分组管理部932与从节点120不同,不进行所输入的探测分组140的跳计数的增加,而将所输入的探测分组140输出到信号线L93。从信号线L93输入了探测分组140的环状态管理部933确认输入了探测分组140的定时是否在预先设定的环形协议管理定时器的有效时间内。另外,环状态管理部933同时或大致同时地比较在探测分组140的L2有效载荷220上记载的跳计数、和在模式设定时所定义的环具有的从节点数。环状态管理部933在预先设定的环形协议管理定时器的有效时间内输入探测分组140,且探测分组140的L2有效载荷220上记载的跳计数与在模式设定时定义的环具有的从节点数一致的情况下,经信号线L96将用于生成新的探测分组140的指令输出到环形协议控制分组生成部934。另外,对于由环形协议控制分组生成部934生成的探测分组140的处理如上述那样。
在满足步骤S502的条件的情况下,主节点110执行步骤S501。另一方面,在不满足的情况下(步骤S502),主节点110解释为环上发生了故障,并将环状态管理部933的环的状态转移到“发生故障”。之后,解除逻辑上阻断数据分组的第二端口1102的逻辑阻断。
步骤S503中,主节点110在解除第二端口1102的逻辑块后或在阻断之后立即地,发出促使传送用数据库更新的第一消息(FlushFDB-1)(步骤S503)。另外,Flush FDB-1有促使故障发生时的传送用数据库更新的含义。另外,主节点110开始对可以从主节点110进行通信的从节点数进行计测。例如,设可从主节点110进行通信的从节点数为“0”。
下面,详细描述步骤S503。环状态管理部933在预先设定的环形协议管理定时器的有效时间内没有输入探测分组140的情况下(步骤S502),或所输入的探测分组140的L2有效载荷220上记载的跳计数与在模式设定时定义的环具有的从节点数不一致的情况下(步骤S502),判断为发生环上的故障(第一故障)。这时,应进行管理的环的状态转移到“故障发生”。环状态管理部933同时或大致同时,开始对可从主节点110进行通信的从节点数进行计测。例如,这里设从主节点110可进行通信的从节点数为“0”。之后或之后立即地,环状态管理部933对环形协议控制分组生成部934通知环上发生故障。环形协议控制分组生成部934为了将环上发生故障通知给装置控制部940,而经环分组输出部935将故障发生通知分组输出到信号线L4。
从信号线L4输入了故障发生通知分组的装置控制部940将所输入的故障发生通知分组输出到信号线L6和L7。从信号线L7输入了故障发生通知分组的管理终端30中,将故障发生通知和故障发生通知分组的输入时刻显示在例如显示部上。
从信号线L6输入了故障发生通知分组的分组传送处理器921解除在模式设定时所定义的第二端口1102的逻辑阻断。分组传送处理器921在解除第二端口1102的逻辑阻断后或之后立即地,将用于删除在分组传送数据库922上记载的分组传送用信息的指令输出到信号线L10。另外,分组传送处理器921为了从在模式设定时所定义的第一端口1101和第二端口1102发送传送用数据库更新分组,而将传送用数据库更新分组(Flush FDB-1)输出到对应于第一端口1101和第二端口1102的信号线L8-e(e=1~N)和信号线L8-f(f=1~N,e≠f)上。传送用数据库更新分组可以使用分组200的形式。在传送用数据库更新分组的生成时,分组传送处理器921在L2有效载荷220上记载用于识别环上的故障的发生和传送用数据库更新分组的信息。
主节点110中,分组传送数据库922根据来自分组传送处理器921的指示,删除了分组传送用信息的结果,变为没有传送数据分组用的信息的状态。这时,分组传送处理器921即使输入数据分组,作为分组传送数据库922的检索结果也不表示所输入的数据分组的目标。分组传送处理器921为了经所收容的所有线路接口910,来发送所输入的数据分组,而将所输入的数据分组分别输出到信号线L8-1~L8-N。该动作称作洪泛(flooding)。
洪泛的结果,数据分组的目标在所发送的数据分组到达目标时,将通知数据分组的接收用的消息发送到洪泛执行节点。接收了数据分组接收确认消息的洪泛执行节点将所发送的数据分组的目标、和接收了数据分组接收确认消息的线路接口910-i相对应。把这个称作地址学习。主节点110中,通过洪泛和地址学习的重复,来更新分组传送数据库922。
从相邻的节点接收了Flush FDB-1的从节点120的分组传送处理器921根据接收分组上记载的信息识别为是传送用数据库更新分组。之后,分组传送处理器921将删除在分组传送数据库922上记载的分组传送用信息用的指令输出到信号线L10。另外,与从节点120的分组传送数据库922的更新有关的动作与主节点110相同。同时或在其之后,分组传送处理器921为了从与在传送用数据库更新分组的L2有效载荷220上记载的接收线路接口信息不同的环用线路收容端口,发送传送用数据库更新分组,而将传送用数据库更新分组输出到对应于与接收线路接口信息不同的环用线路收容端口的信号线L8-m。
接着,步骤S504中,主节点110继续进行探测分组140的发出,而不管有无故障(步骤S504)。另外,主节点110与步骤S502相同,检查在一定时间内是否可以接收自身发出的由从节点120相加了跳计数的探测分组140,且所接收的探测分组140上记载的跳计数是否与在模式设定时所定义的环具有的从节点120的数目一致(步骤S505)。
在满足步骤S505的条件的情况下(步骤S505,是),主节点110识别为环上没有故障。这时,主节点110使应进行管理的环的状态转移为“正常”。另外,在逻辑上阻断第二端口1102,并发出促使传送用数据库更新的消息(Flush FDB-2)(步骤S507)。FlushFDB-2具有促使故障恢复时的传送用数据库的更新的含义。
下面,详细描述步骤S504~S505和步骤S507,以及与这些步骤有关的环内的分组处理过程。主节点110的环状态管理部933在识别应进行管理的环中的故障发生后,还继续进行环状态的诊断。因此,环状态管理部933为了使环形协议控制分组生成部934生成探测分组140,而将促使探测分组140生成的信号输出到信号线L96。另外,对于主节点110的生成后的探测分组140的处理和上述相同。环状态管理部933与促使探测分组140的生成的信号输出同时地或大致同时地,复位环形协议管理定时器。
在探测分组140的发送后,在不满足作为与步骤S502相同条件的步骤S505的情况下,环状态管理部933识别为环中的故障继续。另一方面,在满足步骤S505的情况下,环状态管理部933识别为环上的所有故障已恢复,而将环的状态转移为“正常”。之后,环状态管理部933对环形协议控制分组生成部934通知环上的故障的恢复。另外,环状态管理部933在识别应进行管理的环中的故障恢复后,继续进行环状态的诊断。因此,环状态管理部933与识别故障发生后一样,为了使环形协议控制分组生成部934生成探测分组140,而将促使探测分组140的生成的信号输出到信号线L96。环形协议控制分组生成部934为了向装置控制部940通知环上的故障恢复,而将故障恢复通知分组输出到信号线L4。
从信号线L4输入了故障恢复通知分组的装置控制部940将所输入的故障恢复通知分组输出到信号线L6和L7。在从信号线L7输入了故障恢复通知分组的管理终端30中,将故障恢复通知和故障恢复通知分组的输入时刻例如显示在显示部上。
从信号线L6输入了故障恢复通知分组的分组传送处理器921逻辑上阻断在模式设定时所定义的第二端口1102。分组传送处理器921在逻辑上阻断第二端口1102后或者之后立即地,将删除在分组传送数据库922上记载的分组传送用信息用的指令输出到信号线L10。另外,分组传送处理器921与故障发生时同样,为了从模式设定时所定义的第一端口1101和第二端口1102中发送传送用数据库更新分组,而输出到对应于第一端口1101和第二端口1102的信号线L8-e和信号线L8-f。传送数据库更新分组使用分组200的形式。在传送用数据库更新分组的生成时,分组传送处理器921在传送用数据库更新分组的L2有效载荷220上记载识别环上的故障发生和传送用数据库更新分组用的信息。环具有的节点装置900中的传送用数据库的更新步骤如上述那样。
另一方面,在不满足步骤S505的条件,即,环上的故障在继续的情况下(步骤S505,否),主节点110计算在一定时间内从环的两个方向(第一端口1101和第二端口1102)报告(接收)的最大跳计数的和(步骤S509)。另外,主节点110按每个端口来管理从各端口接收的跳计数报告分组150中包含的跳计数的最大值。主节点110确认是否更新在步骤S503中开始测量的“可从主节点110进行通信的从节点数”(步骤S510)。这里,在“可从主节点110进行通信的从节点数”未更新的情况下(或“可从主节点110进行通信的从节点数”为“0”的情况下),主节点110求出步骤S509中求出的“在一定时间内从环的两个方向报告的最大跳计数的和”,代入(更新)至“可从主节点110进行通信的从节点数”(步骤S511)。返回到步骤S504。
下面,详细描述步骤S509~S511。首先,说明主节点110中的跳计数报告分组150的接收时的动作。主节点110中,收容第一端口1101和第二端口1102的线路接口910-e和线路接口910-f在接收到跳计数报告分组150后,输出到对应的信号线L8-e或信号线L8-f。输入了从信号线L8-e或信号线L8-f接收的跳计数报告分组150的分组传送处理器921,根据所输入的分组上记载的信息识别为是跳计数报告分组150。这时,更新在所输入的跳计数报告分组150内的L2有效载荷220上记载的接收线路接口信息(这种情况下,将接收线路接口910-e和线路接口910-f作为更新对象的信息来使用)。之后,分组传送处理器921将所输入的跳计数报告分组150输出到信号线L1。从信号线L1输入了跳计数报告分组150的环分组输入部931识别为输入分组是跳计数报告分组150,而输出到信号线L92。主节点110中,从信号线L91输入了跳计数报告分组150的环状态管理部933确认环形协议管理定时器的限制时间是否有效。在环形协议管理定时器的限制时间为有效的情况下,环状态管理部933记录在L2有效载荷220上记载的接收线路接口信息和跳计数。环状态管理部933在环形协议管理定时器的有效时间内接收后续的跳计数报告分组150时,在后续的跳计数报告分组150上记载的接收线路接口信息、与环状态管理部933上记载的跳计数报告分组150的接收线路接口信息相同的情况下,将对应于接收线路接口的跳计数的值更新为后续的跳计数报告分组150上记载的跳计数值(或值大的一方的计数值)。
环状态管理部933在没有环形协议管理定时器的限制时间时,将对应于接收线路接口910-e的跳计数的值和对应于接收线路接口910-f的跳计数的值相加。即,得到由接收线路接口910-e和910-f接收的跳计数的最大值之和。
之后,环状态管理部933在故障发生时确认设定为“0”的“可从主节点110进行通信的从节点数”的值。这里在仍为“0”(未更新)的情况下,环状态管理部933使用在步骤S509中求出的“一定时间内从环的两个方向报告的最大跳计数的和”,来更新“可从主节点110进行通信的从节点数”。更新后,主节点110内的环状态管理部933设置(掛ける)执行步骤S504用的触发。通过该触发来执行步骤S504之后的处理。
在步骤S510中,在“可从主节点110进行通信的从节点数”的值不是“0”的情况下(“可从主节点110进行通信的从节点数”的值已经更新完毕的情况下),主节点110内的环状态管理部933确认步骤S509中求出的“一定时间内从环的两个方向报告的最大跳计数的和”是否小于“可从主节点110进行通信的从节点数”(步骤S512)。在“一定时间内从环的两个方向报告的最大跳计数的和”小于“可从主节点110进行通信的从节点数”的情况下(步骤S512),主节点110内的环状态管理部933识别出环中的多重故障的发生。这时,主节点100内的环状态管理部933使用“一定时间内从环的两个方向报告的最大跳计数的和”,来更新“可从主节点110进行通信的从节点数”(步骤S513)。在更新“可从主节点110进行通信的从节点数”后,主节点110内的环状态管理部933设置执行步骤S504用的触发。
在步骤S512中,主节点110内的环状态管理部933在步骤S509中求出的“一定时间内从环的两个方向报告的最大跳计数的和”不小于“可从主节点110进行通信的从节点数”的情况下(步骤S512),确认“可从主节点110进行通信的从节点数”是否小于“在一定时间内从环的两个方向报告的最大跳计数的和”(步骤S514)。在“可从主节点110进行通信的从节点数”与“在一定时间内从环的两个方向报告的最大跳计数的和”为相同值的情况下(步骤S514中否),主节点110内的环状态管理部933设置执行步骤S504用的触发。另一方面,在“可从主节点110进行通信的从节点数”小于“在一定时间内从环的两个方向报告的最大跳计数的和”的情况下(步骤S514,是),环状态管理部933识别为环上的一个以上的故障恢复了。这时,使用“在一定时间内从环的两个方向报告的最大跳计数的和”,来更新“可从主节点110进行通信的从节点数”,而发出Flush FDB-2(步骤S515)。但是,由于环中的所有故障没有恢复,所以环状态管理部933不转移应进行管理的环的状态而仍为“故障发生”,并设置执行步骤S504用的触发。如上所述,重复执行步骤S504~S515,直到环上的所有故障恢复。
这里,说明图1的单一环形网络100中的故障位置的例子。例如,在主节点110的第一端口1101不能接收跳计数报告分组150的情况下,可以进行估计的故障位置,有主节点110的线路接口的故障、从节点120-1的线路接口的故障、和从节点120-1装置内的故障等的可能性。作为装置内的故障,例如有因分组传送部的故障不能传送探测分组140和跳计数报告分组150的情况,或因环管理部的故障而不能生成跳计数报告分组150的情况等。
另外,在主节点110的第一端口1101上不能接收跳计数报告分组150的情况下,可以根据跳计数报告分组150的跳计数的数,估计哪里的节点上发生了故障。例如,在跳计数报告分组150的跳计数的数为1的情况下,可进行估计的故障位置,有从节点120-1将探测分组140发送到从节点120-2用的线路接口的故障、从节点120-2的线路接口的故障、从节点120-2装置内的故障等的可能性。这里的故障的例子仅说明了第一端口1101,但对于第二端口1102也相同。
这里,举环上的多个故障(多重故障)的发生和跳计数数之和的关系的例子来进行说明(例如参照图15)。例如,在图1的环形网络上,在从交换器120-2和从交换器120-3之间的信号线或线路接口上发生了故障(第一故障)的情况下,主节点110从第一端口1101接收跳计数数为2的跳计数报告分组150,从第二端口1102接收跳计数数为3的跳计数报告分组150(和是5)。这里,进一步,在从交换器120-4的装置内发生了故障(第二故障)的情况下,主节点110从第一端口1101接收跳计数数为2的跳计数报告分组150,从第二端口1102接收跳计数数为1的跳计数报告分组150(和减少为3)。由此,主节点110识别出在环上发生了多重故障。
接着,例如,若从交换器120-2和从交换器120-3之间的信号线的故障恢复,则主节点110从第一端口1101接收跳计数数为3的跳计数报告分组150,从第二端口1102接收跳计数数为1的跳计数报告分组150(和增加为4)。主节点110识别为至少一个故障恢复了。主节点110在识别故障发生和故障恢复后,输出传送用数据库更新分组(Flush FDB-1或Flush FDB-2),并适当更新环构成节点的传送用数据库。
另外,在该例中,说明了信号线或线路接口、和装置内的故障的多重故障,但是对于信号线的多重故障或装置内的多重故障,同样地跳计数数之和增加或减少。
2.第二实施方式
图14是第二实施方式中的环形网络的结构图。
第二实施方式中,说明图1所示的主节点110上发生了故障的情况,或因多重故障而不能从主节点110接收探测分组140的情况。对于网络的结构,与第一实施方式相同。但是,本实施方式中,将从节点120之一定义为“副主节点”120-6。
副主节点120-6在主节点110上发生了故障的情况下,将状态转移到“主设备”,而实现与主节点110相同的作用。处于“主设备”状态的副主节点120-6在本来的主节点110从故障恢复的情况下,转换为原来的状态(“副主设备”的状态)。另外,副主节点120-6在主节点110上没有发生故障的情况下,执行与其他从节点相同的动作。
图6是主节点110发生故障时的副主节点120-6的动作的流程图。
副主节点120-6在环正常的情况下,作为从节点来进行动作。副主节点120-6接收以主节点110为发送源的探测分组140(步骤S601),将探测分组140的跳计数例如增加1。副主节点120-6在跳计数增加后,从与接收了以主节点110为发送源的探测分组140的端口相反侧的环用线路收容端口,向相邻节点发送探测分组140(步骤S602)。副主节点120-6同时或在其前后,生成跳计数报告分组150,对主节点110发送所生成的跳计数报告分组150(步骤S603)。副主节点120-6在向主节点110发送了跳计数报告分组150后,每隔一定时间确认是否可接收来自主节点110的探测分组140(步骤S604)。这里,在可以每隔一定时间接收探测分组140的情况下(步骤S604),副主节点120-6将以主节点110为发送源的探测分组140的跳计数增加1(步骤S605),而执行步骤S602。
在本实施方式中的步骤S601~S603的细节内,省略第一实施方式中描述的部分。下面,描述与步骤S601和步骤S604有关的情况。副主节点120-6中,在网络管理者进行通过管理终端30的模式设定时,来设定副主设备模式。这时,副主设备模式内的环状态管理部933不启动环形协议管理定时器,而变为待机(standby)状态。环状态管理部933在步骤S601中接收到以主节点110为发送源的探测分组140后,启动环形协议管理定时器。副主节点120-6内的环分组输入部931在环形协议管理定时器启动后,若在一定时间内接收到了以主节点110为发送源的探测分组140,则识别为输入分组是探测分组140,并输出到信号线L91。从信号线L91输入了以主节点110为发送源的探测分组140的探测分组管理部932与作为从节点120而被设定的情况稍有不同,进行复制,使得以主节点110为发送源的探测分组140为3个。探测分组管理部932将复制的结果成为3个的以主节点110为发送源的探测分组140输出到信号线L93、信号线L94和信号线L95(由于输出到信号线L94和信号线L95的以主节点110为发送源的探测分组140的处理已经在基于上述的从节点120的探测分组140的发送接收中描述了,所以加以省略)。从信号线L93输入了以主节点110为发送源的探测分组140的环状态管理部933,确认探测分组140的输入是否在预先设定的环形协议管理定时器的有效时间内。环状态管理部933在预先设定的环形协议管理定时器的有效时间内输入了以主节点110为发送源的探测分组140的情况下,复位环形协议管理定时器。
另一方面,副主节点120-6在每隔一定时间不能接收以主节点110为发送源的探测分组140的情况下(步骤S640),判断为主节点110上产生了故障,将自身的模式转移到“主设备”(步骤S606)。在步骤S606中,环状态管理部933在环形协议管理定时器的启动后,在有效时间内没有从信号线L93输入以主节点110为发送源的探测分组140的情况下,识别出主节点110中的故障发生,而将自身的模式转移到“主设备”。另外,有从主节点110不能接收探测分组140的情况,和因主节点110本身的故障或连接副主节点120-6及主节点110的两个路径上分别产生了故障、不能接收探测分组140的情况等。这里,作为主节点110的故障来加以说明。
状态转移到“主设备”的副主节点120-6为了实现对多重故障的应对,而每隔一定时间向自身收容的两个方向的环线路发出探测分组140(步骤S607)。处于主设备模式的节点动作的细节与第一实施方式的主节点110相同,这里省略详细的说明。
处于主设备状态的副主节点120-6确认有无以主节点110为发送源的探测分组140的接收(步骤S608)。这里,环管理部930监视是否可以接收以主节点100为发送源的探测分组140。副主节点120-6在不能通过环管理部930接收以主节点110为发送源的探测分组140的情况下,执行步骤S607。
另外,副主节点120-6在可以接收以主节点110为发送源的探测分组140的情况下,解释为主节点110已恢复,将自身的模式转移到“副主设备”(步骤S609)。这时,副主节点120-6停止自身的探测分组140的发出,并与其他从节点120相同地进行动作(步骤S610)。
下面,详细描述步骤S609和步骤S610。环分组输入部931在识别为输入分组是以主节点110为发送源的探测分组140后,输出到信号线L91。从信号线L91输入了以主节点110为发送源的探测分组140的探测分组管理部932如上所述,复制为使得以主节点110为发送源的探测分组140为3个。探测分组管理部932将复制结果成为3个的以主节点110为发送源的探测分组140输出到信号线L93、信号线L94和信号线L95。另外,通过输出到信号线L94和信号线L95的以主节点110为发送源的探测分组140,执行探测分组140的传送和发送到主节点110的跳计数报告分组150的生成。从信号线L93输入了以主节点110为发送源的探测分组140的环状态管理部933判断为主节点110的故障已恢复,将自身的模式转移到“副主设备”。将自身的模式转移为“副主设备”的环状态管理部933停止以副主节点120-6为发送源的探测分组140的发出,同时或大致同时地,不考虑从其他的从节点120发送的跳计数报告分组150上记载的信息(不执行作为主节点的处理)。
第二实施方式中,将从节点120-6定义为副主节点,但是通过将从节点120-i中的任一个以上定义为副主节点,可得到与第二实施方式相同的效果。
3.第三实施方式
第三实施方式中,说明在包含第二实施方式中描述的副主节点120-6的环中,对基于主节点110的多重故障恢复的应对动作。但是,本实施方式中,仅描述与第一实施方式和第二实施方式的不同。另外,对于网络的结构,与上述第二实施方式相同。
图13是发生多重故障的环形网络100的结构图。图8是对基于包含副主节点120-6的环的主节点110的故障的应对动作的流程图。另外,对于与上述相同的处理,标以相同符号,而省略详细的说明。
使用附图来说明故障恢复时的主节点110的动作。图13的例子中,在从节点120-1~从节点120-2之间(故障A)、和从节点120-4~从节点120-5之间(故障B)产生了故障(多重故障)。另外,设图13的副主节点120-6已经在主设备模式下动作,并发出探测分组140。
在不满足图8中的步骤S805(步骤S505)的条件的情况下,主节点110确认有无以副主节点120-6为发送源的探测分组140的接收(步骤S806)。这里,监视是否从多重故障恢复,即,主节点110的环管理部930监视是否可接收以副主节点120-6为发送源的探测分组140。主节点110在不能通过环管理部930接收以副主节点120-6为发送源的探测分组140的情况下,执行步骤S809(步骤S509)。
步骤S806中,主节点110的多重故障的一部分(例如故障B)恢复,而可接收以副主节点120-6为发送源的探测分组140的情况下,丢弃所接收的以副主节点120-6为发送源的探测分组140(步骤S808)。之后,执行步骤S809(步骤S509)。
若详细描述步骤S808,则主节点110与第二实施方式中描述的副主节点120-6不同,在接收从与自身不同的装置发送的探测分组140时,不进行所接收的探测分组140的传送。另外,不对作为所接收的探测分组140的发出源的副主节点120-6发出跳计数报告分组150。不执行这些动作是为了避免环上的混乱。
如上所述,根据本实施方式,可以检测出环上的多重故障的发生和从多重故障的一部分恢复,而不管主节点110有无故障。
4.第四实施方式
作为进一步的例子,描述了在图1的环网路上,在发生了多重故障的中途,不改变跳计数数之和,而拓扑发生变化的情况。这里,所谓拓扑表示例如网络的结构。例如,如图15所示,在作为多重故障,发生了上述的第一故障和第二故障的情况下,主节点110中的跳计数的和为3。
图16是本实施方式中的拓扑变化的说明图。
这里,与完全消除上述故障同时地,在发生了从交换器120-1~从交换器120-2之间的信号线或线路接口故障、和从交换器120-3的装置内故障的情况下(图16),主节点110中的跳计数的和仍为3。本实施方式中,除了上述实施方式的处理之外,进一步,主节点110识别为在环的各方向上接收的跳计数的最大值变化,并判断为拓扑发生了变化而发出传送用数据库更新分组(Flush FDB-2)。由此,在跳计数数之和不变而故障发生位置变化了的情况下,也可以进行检测,可以更新传送用数据库。
另外,主节点110与上述的实施方式相同,按每个端口来管理从各端口接收的跳计数报告分组150中包含的跳计数的最大值。另外,可按每个端口、且按每个探测分组来管理跳计数的最大值。例如,探测分组和对于探测分组的跳计数报告分组包含识别探测分组用的识别符,也可按每个端口,对应于其识别符来管理跳计数的最大值。因此,主节点110中跳计数的和不变化的状况继续,且在环的各方向中接收的跳计数的最大值不变的情况下,判断为拓扑没有变化,而不发出传送用数据库更新分组(Flush FDB-2)。另外,拓扑的变化并不限于上述的例子。
接着,说明本实施方式的处理。另外,硬件结构、探测分组的发送/传送等与上述的第一实施方式相同。
图17是对基于本实施方式中的主节点110的故障的应对动作的流程图。步骤S501~S513的各处理与第一实施方式相同,所以省略说明。
步骤S512中,主节点110内的环状态管理部933在步骤S509中求出的“一定时间内从环的两个方向报告的最大跳次数的和”不小于“可从主节点110进行通信的从节点数”的情况下(步骤S512),确认“可从主节点110进行通信的从节点数”是否小于“一定时间内从环的两个方向报告的最大跳次数的和”(步骤S514’)。
在“可从主节点110进行通信的从节点数”小于“一定时间内从环的两个方向报告的最大跳次数的和”的情况下(S514’,是),环状态管理部933识别为环上的一个以上的故障恢复了。这时,使用“一定时间内从环的两个方向报告的最大跳次数的和”,来更新“可从主节点110进行通信的从节点数”,而发出Flush FDB-2(步骤S515)。但是,由于环中的所有故障并未恢复,所以环状态管理部933不转移应进行管理的环的状态而仍为“发生故障”,并设置执行步骤S504用的触发。
另一方面,在“可从主节点110进行通信的从节点数”不小于“一定时间内从环的两个方向报告的最大跳次数的和”的情况下(S514,否),通过步骤S513、S514的结果,主节点110内的环状态管理部933判断为“可从主节点110进行通信的从节点数”与“一定时间内从环的两个方向报告的最大跳次数的和”为相同的值。这时,环状态管理部933如上所述,使用按每个端口进行管理的“从各端口接收的跳计数报告分组150中包含的跳计数的最大值”,来确认各端口中的跳计数的最大值是否在一定时间内(或按每个探测分组)变化(步骤S516)。
例如,在发出探测分组之前等的适当的定时中,将之前的时间内的每个端口的跳计数的最大值(第一值)存储到其他区域,之后复位跳计数的最大值。另外,例如在步骤S509中,根据所接收的跳计数报告分组来依次更新复位后的跳计数的最大值,并求出该时间内的跳计数的最大值(第二值)。步骤S516中,按每个端口来比较该时间内的跳计数的最大值(第二值)和前面的时间中的跳计数的最大值(第一值),来判断是否变化了。
另外,在按每个端口且按每个探测分组来管理跳计数的最大值的情况下,也可比较对于两个探测分组的跳计数的最大值。例如,也可比较对于连续的两个探测分组的值。
“在主节点110的各端口中的跳计数的最大值”在一定时间内没有变化的情况下(步骤S516,否),环状态管理部933设置执行步骤S504用的触发。另一方面,“在主节点110的各端口中的跳计数的最大值”在一定时间内变化的情况下(步骤S516,是),环状态管理部933判断为应进行管理的环上的拓扑变化了,而发出FlushFDB-2(步骤S517)。但是,由于环中的所有故障并未恢复,所以环状态管理部933不转移应进行管理的环的状态而仍为“发生故障”,并设置执行步骤S504用的触发。如上述这样,重复执行步骤S504~S517,直到环上的所有故障恢复。
5.第五实施方式
用于应对上述第四实施方式中的拓扑的变化的处理(例如S516、S517)还可适用于第二、第三实施方式。硬件结构、探测分组的发送/传送等与上述第二、第三实施方式相同。
图18是对本实施方式中的基于包含副主节点的环的主节点110的故障的应对动作的流程图。各步骤的处理细节与上述第三、第四实施方式相同,所以标以相同符号,而省略说明。
【产业上的可用性】
本发明可以适用于在环中具有主从关系的节点群。
Claims (14)
1、一种环形网络,其特征在于:
包括多个节点,该多个节点参照分组传送用的数据库来传送分组;
多个上述节点按环状连接;
上述节点中的至少一个是发送探测分组的主节点,该探测分组用于确认按环状连接的网络的状态,其他节点是按照来自上述主节点的指示进行处理的从节点;
上述主节点每隔预定的时间或不定期地,从第一端口和第二端口向环的两个方向一次一个地或一次预定个数地发送跳数被初始化了的探测分组;
上述各从节点,若经与环相连的两个端口的一个接收到探测分组,则增加探测分组中包含的跳数,将包含增加后的跳数的该探测分组经与接收的端口不同的另一个端口发送到相邻的上述从节点或上述主节点,并且,生成包含增加后的跳数的跳计数报告分组,并经接收了探测分组的端口发送到上述主节点;
上述主节点,经第一端口和第二端口接收来自各从节点的多个跳计数报告分组,并按每个端口管理跳计数报告分组中包含的跳数的最大值,求出对应于第一端口的跳数的最大值和对应于第二端口的跳数的最大值的和,并根据所求出的和来求出从上述主节点可进行通信的从节点总数,通过所求出的可进行通信的从节点总数的变动,检测出环中的多重故障的发生和该多重故障的至少一个故障的恢复,并且,每次检测出这些事件时,更新装置内的上述数据库和/或对上述从节点发送用于更新分组传送用的上述数据库的分组。
2、根据权利要求1所述的环形网络,其特征在于:
上述主节点,还在所求出的可进行通信的从节点总数不变动的情况下,通过对应于第一端口或第二端口的跳数的最大值的变动,来检测出环中的拓扑的变化,每次检测出该变化时,更新装置内的上述数据库和/或对上述从节点发送用于更新分组传送用的上述数据库的分组。
3、根据权利要求1所述的环形网络,其特征在于:
上述主节点,通过第二端口中没有接收到已从第一端口发送的探测分组的情况和/或第一端口中没有接收到已从第二端口发送的探测分组的情况,检测出环的第一故障;
在检测出第一故障后,通过上述可进行通信的从节点总数的变动,检测出第二故障的发生以及第一与第二故障中的至少一个故障的恢复。
4、根据权利要求1所述的环形网络,其特征在于:
上述主节点,在没有故障的正常环中,在收容环用线路的第一和第二端口的其中一个端口上阻止数据分组的通过,在发生环上的一个或多个故障时,在第一和第二端口上允许数据分组的通过,并且,在环中的故障全部恢复时,在第一和第二端口的其中一个端口上阻止数据分组的通过。
5、根据权利要求1所述的环形网络,其特征在于:
在环的故障发生过程中,上述主节点通过上述从节点总数较以前的状态减少,检测出发生了多重故障。
6、根据权利要求1所述的环形网络,其特征在于:
在环的多重故障发生过程中,上述主节点通过上述从节点总数较以前的状态增加,从多重故障中检测出至少一个位置的恢复。
7、根据权利要求2所述的环形网络,其特征在于:
在环的多重故障发生过程中,上述主节点在上述从节点总数与以前的状态相比没有改变的情况下,通过对应于第一或第二端口的跳数的最大值的变动,检测出拓扑的变化或多重故障的发生位置的变化。
8、根据权利要求1所述的环形网络,其特征在于:
上述从节点在从上述主节点接收到用于更新上述数据库的分组时,删除在上述数据库中存储的信息,并执行地址学习。
9、根据权利要求1所述的环形网络,其特征在于:
上述从节点中的至少一个,是根据所设定的模式作为主节点和从节点的其中之一来动作的副主节点;
上述副主节点在预定的时间内可以从上述主节点接收到一个以上的探测分组的情况下,将模式设定为副主设备而作为从节点动作;
上述副主节点在预定的时间内不能从上述主节点接收到一个以上的探测分组的情况下,将模式设定为主设备而作为主节点动作。
10、根据权利要求9所述的环形网络,其特征在于:
模式被设定为主设备的上述副主节点在通过故障的至少一个恢复而从上述主节点接收到探测分组时,对构成环的上述从节点和/或上述主节点发送用于更新分组传送用的上述数据库的分组,并且,使模式转移为副主设备。
11、根据权利要求9所述的环形网络,其特征在于:
上述主节点在从上述副主节点接收到探测分组时,丢弃该探测分组。
12、根据权利要求9所述的环形网络,其特征在于:
从上述主节点和/或上述副主节点发送的探测分组包含表示该探测分组的发送源的识别符。
13、一种主节点,其特征在于:
在按环状连接了参照分组传送用的数据库来传送分组的多个节点的环形网络中,
具有:
与环连接的第一端口和第二端口;和
环管理部,检测出环中的故障的发生和恢复;
上述环管理部每隔预定的时间或不定期地,从上述第一端口和上述第二端口向环的两个方向一次一个地或一次预定个数地发送跳数被初始化了的探测分组;
构成环的其他各节点经与环连接的两个端口的一个,接收通过上述环管理部发送的或通过其他节点传送的探测分组,增加该探测分组中包含的跳数,并将包含增加后的跳数的该探测分组经与接收的端口不同的另一端口传送到相邻的节点,并且,生成包含增加后的跳数的跳计数报告分组,并经上述第一端口和上述第二端口接收经接收了探测分组的端口发送的、多个上述跳计数报告分组;
按每个端口管理跳计数报告分组中包含的跳数的最大值;
求出对应于第一端口的跳数的最大值和对应于第二端口的跳数的最大值的和,并根据所求出的和来求出可进行通信的节点总数;
通过所求出的可进行通信的节点总数的变动,检测出环中的多重故障的发生和该多重故障的至少一个故障的恢复;
每次检测出这些事件时,更新装置内的上述数据库和/或对构成环的其他节点发送用于更新分组传送用的上述数据库的分组。
14、根据权利要求13所述的主节点,其特征在于:
上述环管理部,还在所求出的可进行通信的从节点总数不变动的情况下,通过对应于第一端口或第二端口的跳数的最大值的变动,检测出环中的拓扑的变化,在每次检测出该变化时,更新装置内的上述数据库和/或对其他节点发送用于更新分组传送用的上述数据库的分组。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP048855/2006 | 2006-02-24 | ||
JP2006048855 | 2006-02-24 | ||
JP204931/2006 | 2006-07-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101026529A true CN101026529A (zh) | 2007-08-29 |
CN100555976C CN100555976C (zh) | 2009-10-28 |
Family
ID=38744454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007100073731A Expired - Fee Related CN100555976C (zh) | 2006-02-24 | 2007-01-31 | 环形网络和主节点 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100555976C (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262401B (zh) * | 2007-12-28 | 2010-12-29 | 上海自动化仪表股份有限公司 | 一种环形网络中实现网络恢复的方法 |
CN101999223A (zh) * | 2008-04-04 | 2011-03-30 | 极进网络有限公司 | 减少eaps系统中的流量损失 |
CN102026042A (zh) * | 2009-09-18 | 2011-04-20 | 中兴通讯股份有限公司 | 一种高级电信计算架构控制面的保活、自愈方法和装置 |
CN101788965B (zh) * | 2010-02-25 | 2011-08-03 | 上海乐春重工机电设备有限公司 | 多点自动识别和主从同步的串行通讯方法 |
CN102457420A (zh) * | 2010-10-26 | 2012-05-16 | 智邦科技股份有限公司 | 建立路径数据的网络装置及其方法 |
CN106464562A (zh) * | 2014-05-22 | 2017-02-22 | 三菱电机株式会社 | 中继装置 |
CN107360016A (zh) * | 2016-05-10 | 2017-11-17 | Ls 产电株式会社 | 从装置控制方法 |
CN107490132A (zh) * | 2017-08-07 | 2017-12-19 | 广东美的制冷设备有限公司 | 多联机空调系统的通讯方法、装置、家居系统及存储介质 |
CN108781172A (zh) * | 2016-03-22 | 2018-11-09 | 高通股份有限公司 | 使用可用的网络连接的独立网络探测 |
CN109923839A (zh) * | 2017-10-04 | 2019-06-21 | 三菱电机株式会社 | 网络管理系统及网络管理方法 |
CN109937409A (zh) * | 2016-11-28 | 2019-06-25 | 特博数据实验室公司 | 分布式系统 |
CN111093249A (zh) * | 2019-12-05 | 2020-05-01 | 合肥中感微电子有限公司 | 无线局域网通信方法、系统及无线收发设备 |
CN112033458A (zh) * | 2018-05-28 | 2020-12-04 | 蓝箭航天技术有限公司 | 火箭测量系统及故障检测方法 |
CN112511397A (zh) * | 2020-11-30 | 2021-03-16 | 浙江杰芯科技有限公司 | 一种epa环形网络的自愈方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2812268B2 (ja) * | 1995-09-29 | 1998-10-22 | 日本電気株式会社 | リングネットワークシステムにおける障害回避制御方法 |
TW353838B (en) * | 1996-11-12 | 1999-03-01 | Toshiba Corp | Ring network system and control method of its communication path |
TW419917B (en) * | 1998-03-30 | 2001-01-21 | Toshiba Corp | Communication network system |
ATE371999T1 (de) * | 2000-05-10 | 2007-09-15 | Ericsson Telefon Ab L M | Kanalschutz |
US7088679B2 (en) * | 2001-12-12 | 2006-08-08 | Lucent Technologies Inc. | Method and system for providing failure protection in a ring network that utilizes label switching |
-
2007
- 2007-01-31 CN CNB2007100073731A patent/CN100555976C/zh not_active Expired - Fee Related
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262401B (zh) * | 2007-12-28 | 2010-12-29 | 上海自动化仪表股份有限公司 | 一种环形网络中实现网络恢复的方法 |
CN101999223A (zh) * | 2008-04-04 | 2011-03-30 | 极进网络有限公司 | 减少eaps系统中的流量损失 |
CN102026042A (zh) * | 2009-09-18 | 2011-04-20 | 中兴通讯股份有限公司 | 一种高级电信计算架构控制面的保活、自愈方法和装置 |
CN101788965B (zh) * | 2010-02-25 | 2011-08-03 | 上海乐春重工机电设备有限公司 | 多点自动识别和主从同步的串行通讯方法 |
CN102457420A (zh) * | 2010-10-26 | 2012-05-16 | 智邦科技股份有限公司 | 建立路径数据的网络装置及其方法 |
CN106464562B (zh) * | 2014-05-22 | 2018-06-01 | 三菱电机株式会社 | 中继装置 |
CN106464562A (zh) * | 2014-05-22 | 2017-02-22 | 三菱电机株式会社 | 中继装置 |
CN108781172A (zh) * | 2016-03-22 | 2018-11-09 | 高通股份有限公司 | 使用可用的网络连接的独立网络探测 |
CN107360016A (zh) * | 2016-05-10 | 2017-11-17 | Ls 产电株式会社 | 从装置控制方法 |
CN107360016B (zh) * | 2016-05-10 | 2020-05-08 | Ls 产电株式会社 | 从装置控制方法 |
CN109937409A (zh) * | 2016-11-28 | 2019-06-25 | 特博数据实验室公司 | 分布式系统 |
CN107490132A (zh) * | 2017-08-07 | 2017-12-19 | 广东美的制冷设备有限公司 | 多联机空调系统的通讯方法、装置、家居系统及存储介质 |
CN109923839A (zh) * | 2017-10-04 | 2019-06-21 | 三菱电机株式会社 | 网络管理系统及网络管理方法 |
CN112033458A (zh) * | 2018-05-28 | 2020-12-04 | 蓝箭航天技术有限公司 | 火箭测量系统及故障检测方法 |
CN111093249A (zh) * | 2019-12-05 | 2020-05-01 | 合肥中感微电子有限公司 | 无线局域网通信方法、系统及无线收发设备 |
CN111093249B (zh) * | 2019-12-05 | 2022-06-21 | 合肥中感微电子有限公司 | 无线局域网通信方法、系统及无线收发设备 |
CN112511397A (zh) * | 2020-11-30 | 2021-03-16 | 浙江杰芯科技有限公司 | 一种epa环形网络的自愈方法 |
CN112511397B (zh) * | 2020-11-30 | 2021-12-17 | 浙江杰芯科技有限公司 | 一种epa环形网络的自愈方法 |
Also Published As
Publication number | Publication date |
---|---|
CN100555976C (zh) | 2009-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100555976C (zh) | 环形网络和主节点 | |
KR100898432B1 (ko) | 링 네트워크 및 마스터 노드 | |
JP5033856B2 (ja) | ネットワーク構成の想定のための装置、システム | |
JP2007259406A5 (zh) | ||
JP4554964B2 (ja) | 分散警報相関を使用する障害診断のシステムおよび方法 | |
CN103210612B (zh) | 通信装置、通信系统以及通信方法 | |
US5771274A (en) | Topology-based fault analysis in telecommunications networks | |
CA2392942A1 (en) | Protection system and method for resilient packet ring (rpr) interconnection | |
CN101106424A (zh) | 用于监视传输光网络的光连接通道的方法和设备 | |
KR20110070049A (ko) | 무선 센서 네트워크에서의 데이터 수집 장치 및 방법 | |
JP6115148B2 (ja) | 警報管理装置、通信装置、警報制御装置、警報管理方法、通信方法、警報制御方法、警報管理プログラム、通信プログラム、及び警報制御プログラム | |
JP4562081B2 (ja) | 光クロスコネクト装置と伝送装置の連係方式 | |
EP2515477A1 (en) | Method and system for service protection | |
CN102104521A (zh) | 以太环网链路故障恢复方法、以太环网及节点设备 | |
JP3402733B2 (ja) | 伝送装置の制御システム | |
JP4061153B2 (ja) | ループ型伝送路の障害監視システム | |
JPH0955739A (ja) | ネットワーク故障管理システム | |
JP3149924B2 (ja) | ネットワーク監視制御方法とそのシステム | |
JP2833281B2 (ja) | 二重化ループネットワークのクロック同期方法 | |
CN108322315A (zh) | 一种大规模通信网络路由交换设备软件故障诊断方法、系统和设备 | |
JPS63304744A (ja) | 障害診断方式 | |
JP3456078B2 (ja) | リング型ネットワークにおける隣接中継装置の識別方法 | |
JP6418633B2 (ja) | 網管理サーバ、疎通判定方法及びプログラム | |
JP2001244930A (ja) | 通信ネットワークシステムおよびそのネットワーク形態管理方法 | |
JP2629597B2 (ja) | 接続状態解析機能付き伝送網 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091028 Termination date: 20180131 |
|
CF01 | Termination of patent right due to non-payment of annual fee |