CN102449621B - 一种节点控制器链路的切换方法、处理器系统和节点 - Google Patents

一种节点控制器链路的切换方法、处理器系统和节点 Download PDF

Info

Publication number
CN102449621B
CN102449621B CN201180001863.5A CN201180001863A CN102449621B CN 102449621 B CN102449621 B CN 102449621B CN 201180001863 A CN201180001863 A CN 201180001863A CN 102449621 B CN102449621 B CN 102449621B
Authority
CN
China
Prior art keywords
node
link
hba
chip
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180001863.5A
Other languages
English (en)
Other versions
CN102449621A (zh
Inventor
谭海波
王振国
俞柏峰
黄平
赵俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102449621A publication Critical patent/CN102449621A/zh
Application granted granted Critical
Publication of CN102449621B publication Critical patent/CN102449621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2017Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0882Utilisation of link capacity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种NC链路的切换方法、处理器系统和节点,其中,所述处理器系统中包括两个以上可相互通信的节点,每个节点包括一个节点控制器NC芯片、一个主机总线适配器HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;所述方法包括:当检测到某一NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上。通过使用HBA装置布置冗余链路,在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本。

Description

一种节点控制器链路的切换方法、处理器系统和节点
技术领域
本发明实施例涉及通信技术领域,特别是涉及一种NC链路的切换方法、处理器系统和节点。
背景技术
随着技术的进步,人们对处理器的性能提出越来越高的要求,应此需求人们开发出了处理能力更强的处理器系统,例如SMP(Symmetric Multi-Processor,对称多处理器)系统、Cluster(机群)系统、MPP(Massive ParallelProcessing,大规模并行处理)系统以及NUMA(Non Uniform Memory Access,非一致内存访问)系统等处理器系统架构。这些架构主要通过共享内存及IO总线的方式,达到系统性能的提升。例如NUMA系统架构中的各节点之间通过互联模块进行连接和信息交互,在一个OS(操作系统)下面,可以共享所有CPU及整个系统的内存,达到处理器系统性能优化和提升。
目前无论是SMP系统还是NUMA系统,都采用双NC(Node Controller,节点控制器)芯片冗余链路方案,当其中一条NC链路出现故障时,该NC链路上所有的业务都将切换到另外一个冗余的NC链路上面,以确保业务不会中断、处理器系统性能不会受到影响,从而提高整个处理器系统的可用度。
发明人在实现本发明的过程中,发现现有技术至少存在如下问题:
由于NC芯片的成本较高,且开发周期长,导致布置冗余的NC链路的成本过高。进一步的,冗余的NC链路利用率非常低,还占用处理器系统总线(例如QPI(快速通道互联)接口、HT(超传输)总线等)资源,当处理器系统总线资源比较紧张时,不利于处理器系统的扩展。
发明内容
本发明实施例提供一种NC链路的切换方法、处理器系统和节点,以在保持处理器系统可靠性的前提下,降低冗余链路的成本。
本发明实施例提供了一种节点控制器链路的切换方法,处理器系统中包括两个以上可相互通信的节点,每个节点包括一个节点控制器NC芯片、一个主机总线适配器HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;所述方法包括:
当检测到某一NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
本发明实施例还提供了一种处理器系统,所述处理器系统包括两个以上可相互通信的节点;
每个节点包括一个节点控制器NC芯片、一个主机总线适配器HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;
所述节点用于:当检测到自身NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
本发明实施例还提供了一种节点,所述节点包括:
一个节点控制器NC芯片、一个主机总线适配器HBA装置、控制器和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;
所述控制器用于:当检测到自身NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
本发明实施例的NC链路的切换方法、处理器系统和节点,使用HBA装置布置冗余链路,由于HBA装置的硬件成本较低、设计简单、开发周期较短,因此采用HBA装置布置冗余的HBA链路能够在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本;由于与CPU或北桥芯片连接的HBA装置支持热插拔,在连接和更换HBA装置时非常方便,提高了处理器系统的RAS特性;由于HBA装置不占用系统总线资源,便于处理器系统扩展;当NC链路上的业务达到一定的负荷时,通过将NC链路上一部分业务切换到HBA链路上,实现了业务负载分配均衡,同时提高了HBA链路的利用率。
附图说明
图1是本发明HBA装置与CPU第一种连接方式的示意图;
图2是本发明HBA装置与CPU第二种连接方式的示意图;
图3是本发明NC链路的切换方法的实施例的流程示意图;
图4是本发明NC交换网和HBA交换网的示意图;
图5是本发明NC链路和HBA链路的示意图;
图6是本发明NC芯片、HBA装置与交换设备的一种连接方式示意图;
图7是本发明NC芯片、HBA装置与交换设备的另一种连接方式示意图;
图8是本发明NC链路的切换方法的一个具体例子的示意图;
图9是本发明处理器系统的结构示意图;
图10是本发明节点的第一实施例的框架示意图;
图11是本发明节点的第二实施例的框架示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
实施例一
本实施例提供了一种NC链路的切换方法,该切换方法涉及的处理器系统中包括两个以上可相互通信的节点,每个节点包括一个NC芯片、一个主机总线适配器HBA(Host Bus Adapter,主机总线适配器)装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应。
所述HBA装置与所在节点内每一个CPU连接的方式可以有两种:
(1),HBA装置插接在北桥芯片上,北桥芯片与所述每一个CPU通过前端总线相连。参见图1,以一个节点中包含两个CPU为例。
通常,HBA装置都采用PCIE(Peripheral Component Interconnect Express,快速外设互联标准)接口,可以在北桥芯片上扩展PCIE插槽来连接HBA装置。
(2)参见图2,HBA装置直接挂接在所述每一个CPU上。
一些CPU芯片内部集成有PCIE控制器,因此可以直接将HBA装置挂接在CPU引出的PCIE插槽上面。
所述方法可以包括如下步骤(参见图3):
S101,当检测到某一NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上。
执行所述检测动作的可以是处理器系统中的交换设备(例如交换机、路由器等),也可以是出现故障的NC芯片所在的节点;发起切换动作的可以是出现故障的NC芯片所在的节点。
由于HBA装置的硬件成本较低、设计简单,因此采用HBA装置布置冗余的HBA链路能够在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本。
主板上通常会预留有很多PCIE插槽,而且很多HBA装置支持热插拔,这样在连接和更换HBA装置时非常方便,提高了处理器系统的RAS(Reliability,Availability,Serviceability,高可靠性、高可用性、高服务性)特性。另外,HBA装置不占用系统总线资源,不限制处理器系统的扩展。
所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应,具体可以通过在每个节点内预置第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
通过第一路由表和第二路由表看到的节点资源是一致的,节点资源可以包括CPU、内存、IO资源(例如PCIE设备)等。
若NC芯片没有交换功能,则需要分别通过交换设备建立NC链路和HBA链路,则第一路由表中除了节点地址以外,还包括NC交换网中与该节点对应的交换设备的端口,以及,第二路由表中除了节点地址以外,还包括HBA交换网中与该节点对应的交换设备的端口。
无论节点中的NC芯片是否具有交换功能,都存在NC交换网和HBA交换网。所述NC交换网为NC芯片之间的交换网,HBA交换网为HBA装置之间的交换网(参见图4),NC交换网和HBA交换网可以各自使用两个独立的交换设备,也可以共用同一个交换设备(参见图5),其中,NC链路用实线表示,HBA链路用虚线表示。交换设备中也需要存储第一路由表和第二路由表,可以由操作系统控制交换设备与各个节点上的第一路由表和第二路由表同步。
正常情况下,NC链路和HBA链路是一直畅通的,承载链路的双方(如节点和节点之间或节点与交换设备之间)会不停的在相应的链路上发送握手信号,以检测链路是否畅通可用。若节点中NC芯片正常,与其对应的HBA链路未被使用,则节点可以为HBA链路分配一个线程进行握手信号的训练;当NC芯片出现故障,节点会为该HBA链路多分配一些线程以便于接收NC链路切换过来的业务,实现业务的平滑切换,保证处理器系统的可靠性。
S101中将NC链路上的业务切换到对应的HBA链路上可以包括:
出现故障的NC芯片所在的节点利用第一路由表查找本节点的地址;
利用第二路由表查找与所述地址对应的HBA装置;
将所述出现故障的NC芯片承载的NC链路上的业务切换到所述对应的HBA装置承载的HBA链路上。
进一步的,所述方法还可以包括:S102,当操作系统检测到某一节点上NC链路的带宽占用率超过阈值时,通知所述节点将符合预置列表的业务从所述NC链路切换到对应的HBA链路上。
所述阈值可以由用户提前指定,并可根据实际需要进行调整,由此来确定业务量是否超出一定的负荷。所述预置列表中罗列了适合从NC链路切换到HBA链路的业务类型,可以是一些实时性要求较低的业务,例如可以为PCIE设备、外挂存储设备或IO存储设备等的业务;预置列表可以缓存在节点的某个内存中。由此,可以在NC链路上的业务量达到一定负荷时,实现业务负载分配均衡,并提高了HBA链路的利用率。
对于具有交换功能的NC芯片来说,NC链路为NC芯片之间直接形成的链路,参见图6。对于不具有交换功能的NC芯片来说,NC链路为NC芯片与交换设备之间形成的链路,参见图7。而HBA链路则始终为HBA装置与交换设备之间形成的链路。
下面,以一个具体的例子介绍上述切换方法。
参见图8,假设处理器系统中的两个节点:节点1和节点2,节点1和节点2中的NC芯片和HBA装置通过同一交换设备形成NC链路和HBA链路。若节点1中的CPU1要访问节点2中CPU4的内存,正常情况下,CPU1访问CPU4的内存的一般路径为:CPU1-NC芯片1-交换设备-NC芯片2-CPU4-内存4。当NC芯片1出现故障、导致NC芯片1与交换设备之间的NC链路出现故障时,节点1将NC芯片1承载NC链路上的业务切换到HBA装置1对应承载的HBA链路上,则CPU1访问CPU4的内存的路径为:CPU1-HBA装置1-交换设备-NC芯片2-CPU4-内存4。
上述NC链路的切换方法可以应用于SMP系统架构、NUMA系统架构、机群和云计算等,若将本实施例的处理器系统整个看作一个节点,则还可以运用在MMP系统架构中。
本实施例的NC链路的切换方法,使用HBA装置布置冗余链路,由于HBA装置的硬件成本较低、设计简单、开发周期较短,因此采用HBA装置布置冗余的HBA链路能够在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本;由于与CPU或北桥芯片相连的HBA装置支持热插拔,在连接和更换HBA装置时非常方便,提高了处理器系统的RAS特性;由于HBA装置不占用系统总线资源,便于处理器系统扩展;当NC链路上的业务达到一定的负荷时,通过将NC链路上一部分业务切换到HBA链路上,实现了业务负载分配均衡,同时提高了HBA链路的利用率。
实施例二
本实施例提供了一种处理器系统,参见图9,所述处理器系统包括两个以上可相互通信的节点。
每个节点包括一个NC芯片、一个HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应。
所述节点用于:当检测到自身NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上。
所述节点还可以用于:
存储预置的第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
所述节点还可以用于:
当收到操作系统对本节点NC链路的切换通知后,将所述NC链路上符合预置列表的业务切换到对应的HBA链路上。
本实施例的处理器系统,使用HBA装置布置冗余链路,由于HBA装置的硬件成本较低、设计简单、开发周期较短,因此采用HBA装置布置冗余的HBA链路能够在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本;由于与CPU或北桥芯片相连的HBA装置支持热插拔,在连接和更换HBA装置时非常方便,提高了处理器系统的RAS特性;由于HBA装置不占用系统总线资源,便于处理器系统扩展;当NC链路上的业务达到一定的负荷时,通过将NC链路上一部分业务切换到HBA链路上,实现了业务负载分配均衡,同时提高了HBA链路的利用率。
实施例三
本实施例提供了一种节点,参见图10,所述节点包括:
一个NC芯片10、一个主机总线适配器HBA装置20、控制器30和至少一个CPU40(图10中以包含3个CPU进行示例),所述NC芯片10与所在节点内每一个CPU40连接,所述HBA装置20与所在节点内每一个CPU40连接;所述NC芯片10承载的NC链路与所述HBA装置20承载的HBA链路相对应。
所述控制器30用于:当检测到自身NC芯片出现故障时,将所述NC芯片10承载的NC链路上的业务切换到对应的HBA链路上。
参见图11,所述节点还包括存储器件50,用于:存储预置的第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
所述控制器30还用于:
当收到操作系统对本节点NC链路的切换通知后,将所述NC链路上符合预置列表的业务切换到对应的HBA链路上。预置列表可以位于节点内某一CPU的内存;也可以是控制器单独配置有内存,预置列表位于所述控制器的内存中;预置列表还可以存储在所述存储器件50中。
本实施例的节点,使用HBA装置布置冗余链路,由于HBA装置的硬件成本较低、设计简单、开发周期较短,因此采用HBA装置布置冗余的HBA链路能够在保证处理器系统可靠性的前提下,有效降低布置冗余链路的成本;由于与CPU或北桥芯片相连的HBA装置都支持热插拔,在连接和更换HBA装置时非常方便,提高了处理器系统的RAS特性;由于HBA装置不占用系统总线资源,便于处理器系统扩展;当NC链路上的业务达到一定的负荷时,通过将NC链路上一部分业务切换到HBA链路上,实现了业务负载分配均衡,同时提高了HBA链路的利用率。
由于实施例二、实施例三与实施例一的相似内容较多,因此介绍的比较简略,相关之处请参见实施例一。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读存储介质中,如:ROM/RAM、磁碟、光盘等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种节点控制器链路的切换方法,其特征在于,处理器系统中包括两个以上可相互通信的节点,每个节点包括一个节点控制器NC芯片、一个主机总线适配器HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;所述方法包括:
当检测到某一NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
2.如权利要求1所述的方法,其特征在于,所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应包括:每个节点内预置有第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
3.如权利要求2所述的方法,其特征在于,所述将NC链路上的业务切换到对应的HBA链路上具体包括:
利用第一路由表查找出现故障的NC芯片所在节点的地址;
利用第二路由表查找与所述地址对应的HBA装置;
将所述出现故障的NC芯片承载的NC链路上的业务切换到所述对应的HBA装置承载的HBA链路上。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:当操作系统检测到某一节点上NC链路的带宽占用率超过阈值时,通知所述节点将符合预置列表的业务从所述NC链路切换到对应的HBA链路上。
5.如权利要求1-4任一项所述的方法,其特征在于,所述HBA装置与所在节点内每一个CPU连接的方式为:HBA装置插接在北桥芯片上,北桥芯片与所述每一个CPU通过前端总线相连。
6.如权利要求1-4任一项所述的方法,其特征在于,所述HBA装置与所在节点内每一个CPU连接的方式为:HBA装置直接挂接在所述每一个CPU上。
7.一种处理器系统,其特征在于,所述处理器系统包括两个以上可相互通信的节点;
每个节点包括一个节点控制器NC芯片、一个主机总线适配器HBA装置和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;
并且所述节点在检测到自身NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
8.如权利要求7所述的处理器系统,其特征在于,所述节点还用于:
存储预置的第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
9.如权利要求7所述的处理器系统,其特征在于,所述节点还用于:
当收到操作系统对本节点NC链路的切换通知后,将所述NC链路上符合预置列表的业务切换到对应的HBA链路上。
10.一种节点,其特征在于,所述节点包括:
一个节点控制器NC芯片、一个主机总线适配器HBA装置、控制器和至少一个CPU,所述NC芯片与所在节点内每一个CPU连接,所述HBA装置与所在节点内每一个CPU连接;所述NC芯片承载的NC链路与所述HBA装置承载的HBA链路相对应;
所述控制器用于:当检测到自身NC芯片出现故障时,将所述NC芯片承载的NC链路上的业务切换到对应的HBA链路上;所述HBA链路为所述HBA装置与所述节点间的交换设备之间形成的链路。
11.如权利要求10所述的节点,其特征在于,所述节点还包括存储器件,用于:存储预置的第一路由表和第二路由表,第一路由表为各个节点中NC芯片的路由表,每个NC芯片对应其所在节点的地址,第二路由表为各个节点中HBA装置的路由表,每个HBA装置对应其所在节点的地址,第一路由表和第二路由表通过节点地址对应起来。
12.如权利要求11所述的节点,其特征在于,所述控制器还用于:
当收到操作系统对本节点NC链路的切换通知后,将所述NC链路上符合预置列表的业务切换到对应的HBA链路上。
CN201180001863.5A 2011-08-25 2011-08-25 一种节点控制器链路的切换方法、处理器系统和节点 Active CN102449621B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/078893 WO2012149714A1 (zh) 2011-08-25 2011-08-25 一种节点控制器链路的切换方法、处理器系统和节点

Publications (2)

Publication Number Publication Date
CN102449621A CN102449621A (zh) 2012-05-09
CN102449621B true CN102449621B (zh) 2013-11-06

Family

ID=46010198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180001863.5A Active CN102449621B (zh) 2011-08-25 2011-08-25 一种节点控制器链路的切换方法、处理器系统和节点

Country Status (4)

Country Link
US (1) US9015521B2 (zh)
EP (1) EP2605451B1 (zh)
CN (1) CN102449621B (zh)
WO (1) WO2012149714A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880583B (zh) * 2012-08-01 2015-03-11 浪潮(北京)电子信息产业有限公司 一种多路服务器动态链路配置装置和方法
US9710341B2 (en) * 2014-12-16 2017-07-18 Dell Products L.P. Fault tolerant link width maximization in a data bus
CN106708551B (zh) * 2015-11-17 2020-01-17 华为技术有限公司 一种热添加中央处理器cpu的配置方法及系统
KR102092660B1 (ko) * 2015-12-29 2020-03-24 후아웨이 테크놀러지 컴퍼니 리미티드 Cpu 및 다중 cpu 시스템 관리 방법
CN105700975B (zh) * 2016-01-08 2019-05-24 华为技术有限公司 一种中央处理器cpu热移除、热添加方法及装置
CN107291653B (zh) * 2016-03-31 2020-06-16 华为技术有限公司 一种多处理器系统及配置多处理器系统的方法
CN106776459B (zh) * 2016-12-14 2020-06-26 华为技术有限公司 信号处理方法、节点控制器芯片与多处理器系统
EP3605350A4 (en) * 2017-05-04 2020-04-29 Huawei Technologies Co., Ltd. INTERCONNECTION SYSTEM, AND INTERCONNECTION CONTROL METHOD AND APPARATUS
CN108632142B (zh) * 2018-03-28 2021-02-12 华为技术有限公司 节点控制器的路由管理方法和装置
CN109189699B (zh) * 2018-09-21 2022-03-22 郑州云海信息技术有限公司 多路服务器通信方法、系统、中间控制器及可读存储介质
CN112711503B (zh) * 2020-12-28 2024-03-26 北京同有飞骥科技股份有限公司 一种基于飞腾2000+cpu的存储测试方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1805411A (zh) * 2006-01-23 2006-07-19 杭州华为三康技术有限公司 一种处理标签绑定的方法
CN101741831A (zh) * 2008-11-10 2010-06-16 国际商业机器公司 动态物理和虚拟多路径输入/输出的方法、系统和装置
CN102141975A (zh) * 2011-04-01 2011-08-03 华为技术有限公司 计算机系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187987A1 (en) * 2002-03-29 2003-10-02 Messick Randall E. Storage area network with multiple pathways for command paths
US9264384B1 (en) * 2004-07-22 2016-02-16 Oracle International Corporation Resource virtualization mechanism including virtual host bus adapters
US7430629B2 (en) * 2005-05-12 2008-09-30 International Business Machines Corporation Internet SCSI communication via UNDI services
US20060274787A1 (en) * 2005-06-07 2006-12-07 Fong Pong Adaptive cache design for MPT/MTT tables and TCP context
US8195892B2 (en) * 2006-06-19 2012-06-05 International Business Machines Corporation Structure for silent invalid state transition handling in an SMP environment
US7821973B2 (en) * 2006-10-24 2010-10-26 Hewlett-Packard Development Company, L.P. Sharing of host bus adapter context
US7778157B1 (en) * 2007-03-30 2010-08-17 Symantec Operating Corporation Port identifier management for path failover in cluster environments
CN100553189C (zh) 2007-06-15 2009-10-21 南京恩瑞特实业有限公司 基于缓冲管理的多链路冗余的实现方法
US8107360B2 (en) * 2009-03-23 2012-01-31 International Business Machines Corporation Dynamic addition of redundant network in distributed system communications
JP5550089B2 (ja) * 2009-03-30 2014-07-16 エヌイーシーコンピュータテクノ株式会社 マルチプロセッサシステム、ノードコントローラ、障害回復方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1805411A (zh) * 2006-01-23 2006-07-19 杭州华为三康技术有限公司 一种处理标签绑定的方法
CN101741831A (zh) * 2008-11-10 2010-06-16 国际商业机器公司 动态物理和虚拟多路径输入/输出的方法、系统和装置
CN102141975A (zh) * 2011-04-01 2011-08-03 华为技术有限公司 计算机系统

Also Published As

Publication number Publication date
WO2012149714A1 (zh) 2012-11-08
CN102449621A (zh) 2012-05-09
EP2605451B1 (en) 2015-07-01
US20130103975A1 (en) 2013-04-25
US9015521B2 (en) 2015-04-21
EP2605451A1 (en) 2013-06-19
EP2605451A4 (en) 2013-08-14

Similar Documents

Publication Publication Date Title
CN102449621B (zh) 一种节点控制器链路的切换方法、处理器系统和节点
JP2018029337A5 (zh)
CN102622279B (zh) 冗余控制系统、方法及管理控制器
US20150261698A1 (en) Memory system, memory module, memory module access method, and computer system
CN103188173B (zh) 一种交换机设备
CN102870374B (zh) 负荷分担方法及装置、单板
CN104333586A (zh) 一种基于光纤链路的san存储设计方法
CN109684257B (zh) 一种远程内存扩展管理系统
CN102983989B (zh) 一种服务器虚拟地址的迁移方法、装置和设备
CN108009115A (zh) 一种具有时钟冗余功能的双节点服务器板卡
CN105763488B (zh) 数据中心汇聚核心交换机及其背板
CN104408014A (zh) 一种计算系统之间处理单元互连的系统及方法
CN104750581A (zh) 一种冗余互连的内存共享的服务器系统
CN101599907B (zh) 流量转发方法和系统
CN102937997A (zh) 数据处理系统
CN102768561A (zh) 一种双桥片主板冗余的设计方法
CN211149445U (zh) 一种高速数据处理平台
CN116089176A (zh) 一种用于auv的热备双冗余计算机控制系统
CN112612741B (zh) 一种多路服务器
US8462652B2 (en) Transmission device and switchover processing method
CN212785408U (zh) 一种PCIe云平台资源池化装置
CN104699655A (zh) 网络芯片及云服务器系统
CN104182307A (zh) 一种基于自主冗余服务器的串口冗余切换方法
CN209248518U (zh) 一种固态硬盘扩展板卡及服务器
CN102301650A (zh) 计算机系统中子网管理方法、总线适配器及计算机系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211223

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: xFusion Digital Technologies Co., Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right