CN102317885A - 计算机系统及其配置时钟的方法 - Google Patents

计算机系统及其配置时钟的方法 Download PDF

Info

Publication number
CN102317885A
CN102317885A CN2011800011937A CN201180001193A CN102317885A CN 102317885 A CN102317885 A CN 102317885A CN 2011800011937 A CN2011800011937 A CN 2011800011937A CN 201180001193 A CN201180001193 A CN 201180001193A CN 102317885 A CN102317885 A CN 102317885A
Authority
CN
China
Prior art keywords
node
clock
nodes
computer system
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800011937A
Other languages
English (en)
Other versions
CN102317885B (zh
Inventor
吴登奔
张羽
俞柏峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102317885A publication Critical patent/CN102317885A/zh
Application granted granted Critical
Publication of CN102317885B publication Critical patent/CN102317885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/12Synchronisation of different clock signals provided by a plurality of clock generators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1604Error detection or correction of the data by redundancy in hardware where the fault affects the clock signals of a processing unit and the redundancy is at or within the level of clock signal generation hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种计算机系统及配置时钟方法,计算机系统包括至少两个节点,其中,所述至少两个节点均包括选择模块及CPU,所述选择模块的输入为本节点的时钟及其他节点输出的时钟,输出端与所述CPU及其他节点的选择模块的输入端相连;所述计算机系统还包括时钟控制模块,所述时钟控制模块的输出端与所述选择模块的控制端相连,用于控制所述至少两个节点的时钟为同一个时钟。当多个节点的时钟异常时,只要该计算机系统还存在一个正常的时钟,该计算机系统仍能正常工作。

Description

计算机系统及其配置时钟的方法
技术领域
本发明涉及计算机系统技术,尤其涉及一种计算机系统及用于实现计算机系统同一分区系统的节点时钟同步的时钟配置方法。
背景技术
通常,计算机系统,如对计算以及容错性能要求较高的小型机,由多个不同的节点构成,其中,节点为硬分区的最小单元,每个节点可以单独组成一个分区,也可以与其他节点互联组成一个分区,每个分区上都可以运行独立的操作系统具体地,计算机系统中几个独立的节点通过CPU互联技术形成一个整体即分区系统,在该整体下可以运行一个操作系统,该操作系统可以访问任何该分区所属节点上的有效设备。
一个分区系统中的每个节点不仅需要时钟,而且每个节点需要相同来源的时钟。这是因为时钟在数字电路中非常重要,一旦没有了时钟,数字逻辑完全无法正常工作,而分区系统中的各个节点若不使用相同来源的时钟,则整个分区也无法正常工作。
现有技术中,分区系统采用单一式时钟同步方案实现分区系统内的时钟同步。即一个分区系统内只有一个时钟,作为该分区系统内各节点的时钟源,该时钟放在该分区系统的某一节点上,或者与各节点分开,单独设置。
现有技术存在的缺陷在于:一个分区系统只有一个时钟可作为时钟源,当该时钟异常时,该分区系统无时钟源可用,无法实现该分区系统的各节点的时钟同步。
发明内容
本发明实施例的目的在于提出一种计算机系统及用于实现计算机系统同一分区系统的节点时钟同步的时钟配置方法,以在分区系统内的时钟源故障时,仍然能够实现计算机系统中同一分区系统的各节点时钟同步。
本发明实施例提供了一种计算机系统,包括至少两个节点,其中,所述至少两个节点均包括选择模块及CPU,所述选择模块的输入为本节点的时钟及其他节点输出的时钟,输出端与所述CPU及其他节点的选择模块的输入端相连;
所述计算机系统还包括时钟控制模块,所述时钟控制模块的输出端与所述选择模块的控制端相连,用于控制所述至少两个节点的时钟为同一个时钟。
本发明实施例提供的计算机系统中,每个节点的选择模块的输入端有本节点的时钟源,也有其他节点的时钟输出,通过第三方如上述的时钟控制模块来控制选择模块选择一个时钟输入作为该节点的时钟输入,并且可以为其他的节点提供时钟,以保证每个节点使用同一个时钟源,当多个节点的时钟异常时,只要该计算机系统还存在一个正常的时钟,该计算机系统仍能正常工作。
本发明实施例还提供了一种用于实现上述计算机系统中同一分区系统的节点时钟同步的时钟配置方法,包括:
选择一节点的时钟作为所属分区系统的时钟源的选择步骤;
开通所述节点作为起点,与所述节点之间相连的节点作为终点的连接通道作为所述节点及与之直接相连的节点之间的时钟通道的开通步骤;
判断作为终点的节点是否与所述分区系统中剩余的节点相连,若是,则执行所述开通步骤;否则,完成所述分区系统的时钟配置。
本发明实施例提供的用于实现计算机系统同一分区系统的节点时钟同步的时钟配置方法中,利用计算机系统的同一分区系统中每个节点都有多个时钟可选的结构特点,通过为同一分区系统的相连两个节点选择一条连接通道保证同一分区系统内的各节点的时钟源统一,从而实现同一分区系统内的各节点的时钟同步,并且在时钟通道异常,可选择其他连接通道,仍然保证了同一分区系统内的各节点的时钟源统一,实现了同一分区系统内的各节点的时钟同步。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的计算机系统中节点的结构示意图;
图2为本发明实施例提供的计算机系统中两个节点的时钟连接示意图;
图3A为本发明实施例提供的计算机系统中四个节点的时钟连接示意图;
图3B为图3A的框架示意图;
图4A为本发明实施例提供的计算机系统中8个节点的时钟连接框架示意图;
图4B为本发明实施例提供的计算机系统中16个节点的时钟连接框架示意图;
图5为本发明实施例提供的计算机系统中32个节点的时钟连接框架示意图;
图6为本发明实施例提供的8节点计算机系统的结构示意图;
图7为本发明实施例提供的用于实现上述计算机系统中同一分区系统的节点时钟同步的时钟配置方法流程图;
图8A为图7配置完时钟后的时钟路径图;
图8B为图7配置过程中未被配置的剩余节点示意图;
图8C为图6所示计算机系统中节点0与节点1之间时钟通道异常后的替换时钟路径图;
图8D为图8C形成过程中未被配置的剩余节点示意图;
图9为图6所示计算机系统中8个节点的另外一种时钟连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的计算机系统,包括至少两个节点,其中,如图1所示,所述至少两个节点均包括选择模块11及CPU 12,所述选择模块11的输入Input 1、...、Input N为本节点的时钟src及其他节点输出的时钟,输出端(output)与所述CPU 12及其他节点的选择模块的输入端相连;
所述计算机系统还包括时钟控制模块13,所述时钟控制模块13的输出端与所述选择模块的控制端相连,用于控制所述至少两个节点的选择模块输出端输出的时钟为同一个时钟。
上述技术方案中,每个节点的选择模块的输入端有本节点的时钟源,也有其他节点的时钟输出,通过第三方如上述的时钟控制模块来控制选择模块选择一个时钟输入作为该节点的时钟输入,并且可以为其他的节点提供时钟,以保证每个节点使用同一个时钟源,当多个节点的时钟异常时,只要该计算机系统还存在一个正常的时钟,该计算机系统仍能正常工作。
当计算机系统中有两个节点时,两节点直接相连。如图2所示,节点21中选择模块211的输出端,与节点22中选择模块221的输入端直接连接,节点22中选择模块221的输出端与节点21中选择模块211的输入端相连。并且,节点21及节点22中,选择模块的另一个输入为本节点的时钟src。节点21中选择模块211的输出端与本节点的CPU 212相连,节点22中选择模块221的输出端与本节点的CPU 222相连。节点21与节点22为双向连接,使用时可关闭一条连接,当开启的连接异常时,启用关闭的连接。
选择模块211及选择模块221的控制端均由时钟控制模块23控制输出。换句话说,每个节点中选择模块的输入为本节点的时钟与其他节点的时钟,在时钟控制模块23的控制下,将一个节点的时钟src作为共同的时钟源,从而保证每个节点的时钟同步。
当计算机系统中有四个节点时,连接方式与图2类似,所述四个节点通过选择模块连接为环形,每个节点的选择模块的输入为本节点的时钟及相连的两个节点的选择模块的输出。如图3A、图3B所示,计算机系统中共有节点31、节点32、节点33及节点34共四个节点,四个节点的选择模块依次相连为一个环形,如图3B所示。具体地,节点31中,选择模块311的输出端与节点32中选择模块321及节点34中选择模块341的输入端相连,并与本节点的CPU 312相连;节点32中,选择模块321的输出端与节点31中选择模块311及节点33中选择模块331的输入端相连,并与本节点的CPU 332相连;节点33中,选择模块331的输出端与节点32中选择模块321及节点34中选择模块341的输入端相连,并与本节点的CPU 322相连;节点34中,选择模块341的输出端与节点31中选择模块311及节点33中选择模块331的输入端相连,并与本节点的CPU 342相连。且所有选择模块的控制端均与时钟控制模块35相连,在时钟控制模块35的控制下,所有节点选择同一个节点的时钟源src作为共同的时钟源。同样,图3A中,任意两个节点之间的连接均为双向连接,即相连的两个节点之间有两个连接通道也即时钟通道,使用时需关闭未启用的连接通道,。当使用的时钟通路异常时,则根据时钟通道正常情况重新选择时钟通道。
当计算机系统中有8个节点时,8个节点位于一个长方体的各个顶点处,所述长方体各个表面内的4个节点通过选择模块交叉连接或通过选择模块两两相邻连接,且每个节点与三个节点通过选择模块连接。如图4A所示,长方体的各个表面的4个节点通过选择模块顺次连接为一个环形,其中,环形的连接与图3A类似,每个节点均与三个节点通过选择模块相连,任意两个节点之间的连接均为双向连接即相连的两个节点之间有两条连接通道也即时钟通道,使用时可关闭其中一条连接通道,使用另一条连接通道。当使用的连接通道异常时,启用关闭的连接通道。得到的长方体连接方式与图3A的不同之处在于,每个节点与三个节点相连,具体地,每个节点的选择模块的输入为本节点的时钟及相连的三个节点的选择模块的输出。
当计算机系统中有n×8个节点时,每8个节点位于一个长方体的各个顶点处,所述长方体各个表面内的4个节点通过选择模块交叉连接或通过选择模块顺次连接,且每个节点与3+n个节点通过选择模块连接,长方体的连接与图4A类似,每个所述长方体相同位置上的节点通过选择模块相连,每个节点的选择模块的输入为本节点的时钟与相连的3+n个节点的选择模块的输出,其中,n为自然数。同样,任意两个节点之间的连接均为双向连接即相连的两个节点之间有两条连接通道也即时钟通道,使用时可关闭其中一条连接通道,使用另一条连接通道。当使用的连接异常时,启用关闭的连接通道。
例如,当计算机系统中有16个节点时,连接后得到如图4B所示的结构,当计算机系统中有32个节点时,连接后得到如图5所示的结构。64节点、128节点等等计算机系统的节点连接类似。8个节点位于一个长方体的各个顶点处,每个节点与相邻的3个节点相联。当系统中有8的整数倍个节点时,以上述方式连接的各个8个节点整体又可以分别看成一个点,再利用上述连接方式将各个点连接。如,16个节点位于两个长方体的各个顶点处,两个长方体的同一个位置点再相联,以此类推,实现32个节点、64个节点的联接,这里不一一列举。
对上述实施例提供的计算机系统进行分区时,为了保证分区系统容错率达到最高,应尽可能选择连接最多的几个节点组成一个分区,如将直接相连的两个节点创建为一个分区系统,或将连接为一个环形的4个节点创建为一个分区系统。如对于n×8节点计算机系统还可将连接为一个长方体的8个节点创建为一个分区系统。这是因为时钟同步仅仅是对同一分区系统有要求,将连接最多的几个节点组成一个分区系统,可以最大程度上保证在该分区系统内某些节点异常的情况下,找到替换路径,且不影响其他分区系统。
并且,当节点时钟存在异常,创建分区系统时应保证分区内的节点时钟至少有一个正常,否则该分区系统只能使用其他分区系统的时钟。计算机系统中创建分区后,所述计算机系统中属于同一个分区系统的节点相互之间直接连接或间接连接,所述间接连接的中间节点与所述间接连接的两端节点位于同一个分区系统内。例如对于n×8节点计算机系统中,连接为一个长方体的8个节点创建为一个分区系统。
上述实施例提供的计算机系统进行分区后,某一分区系统内若时钟源异常,只要该分区系统内存在正常时钟,则该分区系统的运行不受影响。若该分区系统的某一时钟通道异常,该时钟通道的下游节点可以正常工作,则只要存在其他正常通道,该分区系统仍然可以正常工作。若该分区系统内某一节点功能异常,剔除后,只要剩余节点间的时钟可以路由互联,则该分区系统还可以正常工作。这样,若该分区系统内节点异常个数过多,造成剩余节点间时钟通道无法路由互联,则剩余节点无法组建一个分区,但可以根据分区情况重新组建几个独立的分区。
下面以8节点小机型为例做进一步详细说明。
如图6所示,节点0、节点1、...、节点7通过选择模块连接,表现为一个长方体,或者说,节点0~节点7位于立方体的各个顶点处,立方体的前后表面及下表面上,4节点各顺次连接为一个环形,上表面的4个节点交叉相连,作为备份时钟同步路由,如:前后表面顺次联接,上表面交叉联接,这是因为当出现多个节点错误时,直接相联的几个节点同时出现的概率会相对较大,因此时钟连接中采用一些交叉联接的方式,总体上每个节点的相联个数都不会变。通过图6可以直观的说明某个节点时钟异常时,如何找到相应的时钟通道,从而保证时钟链正常。
根据图6所示的连接关系,生成如下表1所示的时钟关系路由表。
表1时钟关系连接表
  起点   终点
  0   1、2、6
  1   0、3、7
  2   0、3、5
  3   1、2、4
  4   3、5、6
  5   2、4、7
  6   0、4、7
  7   1、5、6
当任意有限个时钟及时钟通道异常时,都可以从尝试从时钟关系路由表中找到其他替代的时钟通道,用找到的替代时钟通道替代异常的时钟通道。另外时钟选择时,不仅需要选择是否使用该节点的时钟,还需要选择启用的时钟通路,保证所有节点的时钟来源唯一。
由于不是任意两个节点之间都存在时钟连接,部分时钟通道需要通过其他节点路由形成通道,为了减少出错概率及提高设置速度,在创建分区时,按照上述分区方式进行分区。
假设创建2P分区系统,则选择直接联接的2个节点组成一个分区系统。一般情况下,分区系统中各节点时钟都由分区内的节点提供,以免分区系统之间相互影响。若某分区系统内的所有节点时钟都异常,此时可以由相联分区系统的一个节点为该分区系统的所有节点提供时钟,但该分区系统时钟是否正常工作,受控于另一分区。这种情况下,可以将这两节点分开,进行重新分区,与其他相联的节点分别组成两个独立的2P分区。
假设创建4P分区系统,正常情况下,任意选择上下或前后相互连接构成环形的4个节点组建一个分区系统,此时容错概率最高。但若创建分区时,多个节点时钟已存在异常,则应该根据上述分区原则合理创建分区,保证所有分区系统可以正常工作。
假设创建6P分区系统,则按照创建4P分区的方式先选择4个节点,然后再任意选择相邻的可以组成2P的两个节点,即直接相连的两个节点一起创建为6P分区系统。
假设创建8P分区系统,则该计算机系统中的所有节点可以组成一个8P分区系统。
下面以8P分区系统为例对分区系统的时钟配置进行说明。
如图7所示,配置流程包括:
步骤701、根据时钟联接方式创建时钟关系连接表,如表1所示,表1的每一行都即一层,每层均有起点和终点。起点与终点之间的连接为双向连接通道,既有起点到终点的连接通道,也有终点到起点的连接通道,如在表1的第2行节点0为起点,节点1为终点,第3行节点1为起点,节点0为终点。后续的步骤就是对直接或间接的多次连接的节点简化为单向且不重复地连接,且对直接相连的节点之间的双向连接通道进行选择,选择一条连接通道作为直接相连的节点之间的时钟通道,另一条连接通道作为备份,以在时钟异常、通道异常或节点异常的情况下重新对分区系统进行时钟配置。
步骤702、检测各节点时钟是否正常;
步骤703、选择并开启时钟源。具体地,按照主节点时钟→本分区节点时钟→其他分区节点时钟的顺序,从主节点时钟、本分区节点时钟、其他分区节点时钟中选择一个正常的节点时钟作为时钟源,并开启该时钟。
一般选择主节点的时钟为时钟源,若没有异常,则选择主节点为时钟,若出现异常,则选择同一分区与主节点直接相联的节点时钟作为时钟源。假设图6中,若创建8P分区,节点0为主节点,但节点0的时钟异常,则选择与节点0相连的节点即节点1、节点2或节点6的时钟的任意一个正常时钟作为时钟源。
步骤704、将时钟源所在节点添加到时钟关系路由表中,设置该节点为当前层起点。时钟关系路由表与表1类似,表项包含起点和终点,不同之处在于时钟关系路由表开始时,起点列和终点列均为空,通过执行后续步骤逐渐添加。以图6所示计算机系统为例,若节点0的时钟为时钟源,则将节点0添加到时钟关系路由表中第一层的起点项。
步骤705、判断该分区系统中所有节点是否都已添加到时钟关系路由表中。若所有节点已添加到时钟关系路由表中,完成时钟配置,否则,执行步骤706。
步骤706、判断该分区系统中与当前层起点直接相联的节点是否都已在时钟关系路由表中。若已在时钟关系路由表中,则执行步骤709,否则,执行步骤707。
步骤707、从与当前层起点直接相连且时钟通道正常,并未被添加到时钟关系路由表的节点中,选择一个与当前层起点直接相连的节点;
步骤708、将步骤707中选择的节点作为当前层的终点,添加到时钟关系路由表的当前层的终点项中,开启当前层节点到步骤707中选择的节点方向上的时钟通道,并将选择的节点作为下一层起点添加到时钟关系路由表的新一行表项中。然后,再次执行步骤706。
步骤709、判断是否还存在与当前层起点同级的节点如与时钟源之间均为N跳的节点,若存在与当前层起点同级的节点未加入到时钟关系路由表,且该节点作为上一层终点时与该上一层起点之间的时钟通道正常,则执行步骤712,否则,执行步骤710。
步骤710、判断是否存在下一层起点,若存在下一层起点,则执行步骤711,否则完成时钟配置。
步骤711、将存在的第一个下一层起点设置为当前层起点,继续执行步骤705。
步骤712、选择该节点为当前层起点,继续执行步骤705。
以图6所示计算机系统为例,假设计算机系统中节点0为主节点,且节点0的时钟正常。
则选择节点0的时钟为时钟源,将节点0添加到时钟关系路由表中。如表2所示。
表2时钟关系路由表
  起点   终点
  节点0
系统中未被配置的剩余节点如图8B中的第一个竖框所示。
然后判断与节点0直接相连的节点1、节点2及节点6之间的连接通道是否正常,若节点0与节点1、节点2及节点6之间的连接通道均正常,则开通或选择节点0到节点1、节点2及节点6方向上的连接通道作为节点0与节点1、节点2及节点6之间的时钟通道,并将节点1、节点2及节点6作为第一层的终点添加到时钟关系路由表中。
表3
  起点   终点
  节点0   节点1、节点2、节点6
系统中未被配置的剩余节点如图8B中的第二个竖框所示。
进一步地,将节点1、节点2及节点6作为下一层起点,判断与节点1直接连接的节点3、节点7之间的连接通道是否正常,若节点1与节点3、节点7之间的连接通道均正常,则开通或选择节点1到节点3、节点7方向上的连接通道作为节点1与节点3、节点7之间的时钟通道,并将节点1及节点3、节点7作为一层即以节点1为一层的起点,节点3、节点7为该层的终点,添加到时钟关系路由表中;如表4所示。
表4
  起点   终点
  节点0   节点1、节点2、节点6
  节点1   节点3、节点7
判断剩余的与节点2直接连接的节点5之间的连接通道是否正常,若节点2与节点5之间的连接通道正常,则将节点2到节点5方向上的连接通道作为节点2与节点5之间的时钟通道,并将节2及节点5作为一层即以节点2为一层的起点,节点5为一层的终点,添加到时钟关系路由表中;如表5所示。
表5
  起点   终点
  节点0   节点1、节点2、节点6
  节点1   节点3、节点7
  节点2   节点5
判断剩余的于节点6直接连接的节点4之间的连接通道是否正常,若节点6与节点4之间的连接通道正常,则将节点6到节点4方向上的连接通道作为节点6与节点4之间的时钟通道,并将节点6及节点4作为一层即以节点6为一层的起点,节点4为该层的终点,添加到时钟关系路由表中,如表6所示。
表6
  起点   终点
  节点0   节点1、节点2、节点6
  节点1   节点3、节点7
  节点2   节点5
  节点6   节点4
相应的时钟路由如图8A所示。
当配置的节点0与节点1之间的时钟通道发生异常,则节点1、节点3及节点7将无法得到时钟源提供的时钟,此时,可根据时钟关系连接表表1,获知节点3与节点2之间还备份有连接通道,而节点1与节点3直接相连,因此可开通或选择节点2到节点3方向上的连接通道作为节点2与节点3之间的时钟通道,并关闭节点1到节点3方向上的连接通道,开通节点3到节点1上的连接通道作为节点3与节点1之间的时钟通道,如图8C所示,从而节点1、节点3仍可得到时钟源提供的时钟。配置过程中未被配置的剩余节点如图8D所示。并且,根据时钟连接表表1还可获知节点7与节点6之间还备份有连接通道,开通节点6到节点7方向上的连接通道作为节点6与节点7之间的时钟通道,如图8C所示,这样,节点7仍可得到时钟源提供的时钟。
图9为图6所示计算机系统中8个节点的另外一种时钟连接示意图。其表现也是一个长方体,上下前后左右都为顺序环,不交叉,其时钟关系连接表如表7所示。
表7
  起点   终点
  0   1、3、4
  1   0、2、5
  2   1、3、6
  3   0、2、7
  4   0、5、7
  5   1、4、6
  6   2、5、7
  7   3、4、6
上述装置及方法实施例通过节点之间的时钟连接通道及时钟配置方法,保证了分区系统内各节点的时钟同步;并且,当部分节点时钟异常时,不会对系统有所影响,即系统还没起来时,若部分节点时钟异常时,也可以组建一个分区,正常的把系统运行起来;当部分节点时钟通道异常,最大程度地保证了分区系统不受影响;当部分节点异常时,最大程度地保证了剩余节点所组成的分区系统不受影响;当节点异常数过多时无法组建一个分区时,还可以将剩余节点组建几个独立的分区系统。
上述装置及方法实施例中的节点之间的时钟连接方式也可应用于分区的快速通道互联(Quick Path Interconnect,QPI)联接,及类似地其他系统中节点之间的联接。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种计算机系统,包括至少两个节点,其特征在于,所述至少两个节点均包括选择模块及CPU,所述选择模块的输入为本节点的时钟及其他节点输出的时钟,输出端与所述CPU及其他节点的选择模块的输入端相连;
所述计算机系统还包括时钟控制模块,所述时钟控制模块的输出端与所述选择模块的控制端相连,用于控制所述至少两个节点的时钟为同一个时钟。
2.根据权利要求1所述的计算机系统,其特征在于,所述至少两个节点为四个节点,所述四个节点通过选择模块连接为环形,每个节点的选择模块的输入为本节点的时钟及相连的两个节点的选择模块的输出。
3.根据权利要求1所述的计算机系统,其特征在于,所述至少两个节点为8个节点,位于一个长方体的各个顶点处,所述长方体各个表面内的4个节点通过选择模块交叉连接或通过选择模块两两相邻连接,且每个节点与三个节点通过选择模块连接,每一节点的选择模块的输入为该节点的时钟及相连的三个节点的选择模块的输出。
4.根据权利要求1所述的计算机系统,其特征在于,所述至少两个节点为n×8个节点,其中,每8个节点位于一个长方体的各个顶点处,所述长方体各个表面内的4个节点通过选择模块交叉连接或通过选择模块顺次连接,且每个节点与3+n个节点通过选择模块连接,每个所述长方体相同位置上的节点通过选择模块相连,每个节点的选择模块的输入为本节点的时钟与相连的3+n个节点的选择模块的输出,其中,n为大于0的自然数。
5.根据权利要求2-4任一项所述的计算机系统,其特征在于,所述计算机系统中属于同一个分区系统的节点相互之间直接连接或间接连接,所述间接连接的中间节点与所述间接连接的两端节点位于同一个分区系统内。
6.根据权利要求1-4任一项所述的计算机系统,其特征在于,所述选择模块的输出端与其他节点的选择模块的输入端的连接通过CPU互联线缆实现。
7.一种用于实现权利要求1-6任一项所述的计算机系统中同一分区系统的节点时钟同步的时钟配置方法,其特征在于,包括:
选择一节点的时钟作为所属分区系统的时钟源的选择步骤;
开通所述节点作为起点,与所述节点之间相连的节点作为终点的连接通道作为所述节点及与之直接相连的节点之间的时钟通道的开通步骤;
判断作为终点的节点是否与所述分区系统中剩余的节点相连,若是,则执行所述开通步骤;否则,完成所述分区系统的时钟配置。
8.根据权利要求7所述的时钟配置方法,其特征在于,还包括:根据所述计算机系统中节点之间的时钟连接关系建立时钟关系连接表;
所述开通步骤根据所述时钟关系连接表得到节点之间的连接关系。
9.根据权利要求7或8所述的时钟配置方法,其特征在于,执行所述开通步骤时或之后,还包括:
建立时钟关系路由表,将所述起点及终点添加到所述时钟关系路由表中。
10.根据权利要求9所述的时钟配置方法,其特征在于,根据所述时钟关系路由表,重新开通由于时钟异常、时钟通道异常或节点异常导致时钟通道断开的节点与时钟源所在节点之间的时钟通道。
CN201180001193.7A 2011-07-26 2011-07-26 计算机系统及其配置时钟的方法 Active CN102317885B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/077625 WO2012106929A1 (zh) 2011-07-26 2011-07-26 计算机系统及其配置时钟的方法

Publications (2)

Publication Number Publication Date
CN102317885A true CN102317885A (zh) 2012-01-11
CN102317885B CN102317885B (zh) 2014-05-07

Family

ID=45429409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180001193.7A Active CN102317885B (zh) 2011-07-26 2011-07-26 计算机系统及其配置时钟的方法

Country Status (4)

Country Link
US (1) US9026835B2 (zh)
EP (1) EP2573643B1 (zh)
CN (1) CN102317885B (zh)
WO (1) WO2012106929A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012106929A1 (zh) * 2011-07-26 2012-08-16 华为技术有限公司 计算机系统及其配置时钟的方法
CN105022715A (zh) * 2015-07-08 2015-11-04 浪潮(北京)电子信息产业有限公司 一种服务器背板互连方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5398317A (en) * 1989-01-18 1995-03-14 Intel Corporation Synchronous message routing using a retransmitted clock signal in a multiprocessor computer system
CN1394004A (zh) * 2001-06-29 2003-01-29 深圳市中兴通讯股份有限公司上海第二研究所 光同步数字传送网时钟源选择控制方法及其装置
CN1493040A (zh) * 2001-02-24 2004-04-28 �Ҵ���˾ 用于计算结构的全局树形网络
CN101192913A (zh) * 2007-08-08 2008-06-04 中兴通讯股份有限公司 一种在光传送网络完成时钟同步和时钟倒换的系统和方法
US20100318831A1 (en) * 2009-06-12 2010-12-16 Cray Inc. Global clock via embedded spanning tree

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4239982A (en) * 1978-06-14 1980-12-16 The Charles Stark Draper Laboratory, Inc. Fault-tolerant clock system
US5249206A (en) * 1989-08-11 1993-09-28 International Business Machines Corporation Fault-tolerant clock for multicomputer complex
US5404363A (en) * 1991-11-27 1995-04-04 Honeywell Inc. Two-fail-operational fault-tolerant multiple clock system
JPH0778039A (ja) * 1993-09-08 1995-03-20 Fujitsu Ltd クロック選択制御方式
US5758132A (en) * 1995-03-29 1998-05-26 Telefonaktiebolaget Lm Ericsson Clock control system and method using circuitry operating at lower clock frequency for selecting and synchronizing the switching of higher frequency clock signals
SE504920C2 (sv) * 1995-09-29 1997-05-26 Ericsson Telefon Ab L M Förfarande och system för redundant klockdistribution till telekommunikationsutrustningar i vilka byte av vald klocksignal bland de inkommande klocksignalerna ständigt sker
JPH11103312A (ja) * 1997-09-26 1999-04-13 Mitsubishi Electric Corp ネットワークのクロック同期管理装置
US6754171B1 (en) * 2000-05-18 2004-06-22 Enterasys Networks, Inc. Method and system for distributed clock failure protection in a packet switched network
US6592449B2 (en) 2001-02-24 2003-07-15 International Business Machines Corporation Smart fan modules and system
US7089442B2 (en) * 2003-02-07 2006-08-08 Rambus Inc. Fault-tolerant clock generator
US7230468B2 (en) * 2004-03-10 2007-06-12 Hewlett-Packard Development Company, L.P. Systems and methods for providing distributed control signal redundancy among electronic circuits
US7602869B2 (en) 2005-07-29 2009-10-13 International Business Machines Corporation Methods and apparatus for clock synchronization and data recovery in a receiver
US7562247B2 (en) * 2006-05-16 2009-07-14 International Business Machines Corporation Providing independent clock failover for scalable blade servers
US7870413B2 (en) * 2006-08-15 2011-01-11 Mitac International Corp. Synchronization clocking scheme for small scalable multi-processor system
CN100525212C (zh) * 2007-08-10 2009-08-05 中控科技集团有限公司 网络时钟同步的方法及系统
US8161311B2 (en) * 2007-08-23 2012-04-17 Stratus Technologies Bermuda Ltd Apparatus and method for redundant and spread spectrum clocking
EP2460074B1 (en) * 2009-07-31 2014-12-31 Hewlett-Packard Development Company, L.P. Providing fault-tolerant spread spectrum clock signals in a system
US8212601B2 (en) * 2010-10-29 2012-07-03 Netgear, Inc. Method and apparatus for providing system clock failover
WO2012106929A1 (zh) * 2011-07-26 2012-08-16 华为技术有限公司 计算机系统及其配置时钟的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5398317A (en) * 1989-01-18 1995-03-14 Intel Corporation Synchronous message routing using a retransmitted clock signal in a multiprocessor computer system
CN1493040A (zh) * 2001-02-24 2004-04-28 �Ҵ���˾ 用于计算结构的全局树形网络
CN1394004A (zh) * 2001-06-29 2003-01-29 深圳市中兴通讯股份有限公司上海第二研究所 光同步数字传送网时钟源选择控制方法及其装置
CN101192913A (zh) * 2007-08-08 2008-06-04 中兴通讯股份有限公司 一种在光传送网络完成时钟同步和时钟倒换的系统和方法
US20100318831A1 (en) * 2009-06-12 2010-12-16 Cray Inc. Global clock via embedded spanning tree

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012106929A1 (zh) * 2011-07-26 2012-08-16 华为技术有限公司 计算机系统及其配置时钟的方法
US9026835B2 (en) 2011-07-26 2015-05-05 Huawei Technologies Co., Ltd. Computer system for configuring a clock
CN105022715A (zh) * 2015-07-08 2015-11-04 浪潮(北京)电子信息产业有限公司 一种服务器背板互连方法和系统

Also Published As

Publication number Publication date
US9026835B2 (en) 2015-05-05
WO2012106929A1 (zh) 2012-08-16
US20130103971A1 (en) 2013-04-25
CN102317885B (zh) 2014-05-07
EP2573643A1 (en) 2013-03-27
EP2573643A4 (en) 2014-08-27
EP2573643B1 (en) 2015-09-23

Similar Documents

Publication Publication Date Title
US9106578B2 (en) Core network architecture
US7899930B1 (en) Integration of an operative standalone router into a multi-chassis router
US9720766B2 (en) Self-healing, fault-tolerant FPGA computation and architecture
US9360884B2 (en) Clocking for pipelined routing
US9166599B1 (en) Methods and apparatus for building bus interconnection networks using programmable interconnection resources
US20100150147A1 (en) System and method for implementing a multistage network using a two-dimensional array of tiles
CN103036787B (zh) 一种网络路由收敛处理方法和装置
EP3214822B1 (en) Network on chip, communication control method and controller
CN102891813A (zh) 支持多传输模式的以太网端口架构
JPH0766718A (ja) プログラム可能論理用ウェファ・スケール構造
CN106160907B (zh) 一种同步网的配置方法和装置
CN103856357B (zh) 一种堆叠系统故障处理方法及堆叠系统
EP0343611A3 (en) Routing method for fast packet switching systems
AU2009202686A1 (en) Method and system for providing redundancy within a network element
EP3213441B1 (en) Redundancy for port extender chains
CN105187499A (zh) 一种基于zookeeper双平面数据架构的分布式调度方法及系统
CN102317885A (zh) 计算机系统及其配置时钟的方法
Sem-Jacobsen et al. Topology agnostic dynamic quick reconfiguration for large-scale interconnection networks
CN102377677B (zh) Mpls网络中保护路径的快速切换方法及系统
CN109327410A (zh) 一种基于fpga交叉的改进三级clos路由算法
US10284457B2 (en) System and method for virtual link trunking
CN102651712A (zh) 多处理器系统的节点路由方法、控制器及多处理器系统
JP2019008648A (ja) 情報処理システム及び情報処理方法
US8204049B2 (en) Add-drop benes networks
CN103746941A (zh) 一种板级互联大数据一体机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant