CN108509371A

CN108509371A - 一种高端容错计算机节点互联系统及实现方法

Info

Publication number: CN108509371A
Application number: CN201810311007.3A
Authority: CN
Inventors: 邹晓峰; 刘同强; 周玉龙
Original assignee: Zhengzhou Yunhai Information Technology Co Ltd
Current assignee: Zhengzhou Yunhai Information Technology Co Ltd
Priority date: 2018-04-09
Filing date: 2018-04-09
Publication date: 2018-09-07

Abstract

本发明公开一种高端容错计算机节点互联系统及实现方法，涉及计算技术领域，根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联；本发明满足高端容错计算机处理器规模增大带来的节点间通信带宽需求，节点之间可以通过高速全双工接口互联，可通过光纤传输，不需要网络控制器转发，降低通信延迟，大大提高系统的性能。

Description

一种高端容错计算机节点互联系统及实现方法

技术领域

本发明公开一种高端容错计算机节点互联系统及实现方法，涉及计算技术领域。

背景技术

随着摩尔定律的不断变缓，微处理器技术发展面临的挑战越来越大，而多个处理器互联组成的多处理机大大加快了计算机整机性能的提高，但是通过提高并行性来提升性能也随之带来一系列问题。大规模多处理机采用多个CPU和存储器，并且分布于多个节点。多个节点的网络开销与带宽性能之间往往存在矛盾，本发明提出的一种高端容错计算机节点互联系统及实现方法，不仅使网络带宽与计算机用户程序中的通信要求匹配，提高CPU跨节点内存访问效率，而且降低了硬件开销，减少了成本，大大提高系统的灵活性、可靠性和可用性。

NGN Next Generation Network 下一代网络。

发明内容

本发明针对目前技术发展的需求和不足之处，提供一种高端容错计算机节点互联系统及实现方法。

一种高端容错计算机节点互联的实现方法，根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

所述的方法中单节点内部的CPU通过QPI接口与节点控制芯片的接口连接进行互联。

所述的方法中单节点内部的CPU为偶数个，则将CPU按照偶数个划分，利用节点控制芯片的接口互联。

所述的方法中节点控制芯片的接口采用光纤传输的方式。

一种高端容错计算机节点互联系统，根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

所述的系统中单节点内部的CPU通过QPI接口与节点控制芯片的接口连接进行互联。

所述的系统中单节点内部的CPU为偶数个，则将CPU按照偶数个划分，利用节点控制芯片的接口互联。

所述的系统中节点控制芯片的接口采用光纤传输的方式。

本发明与现有技术相比具有的有益效果是：

本发明提出的一种高端容错计算机节点互联系统及实现方法，可以满足高端容错计算机处理器规模增大带来的节点间通信带宽需求，节点之间可以通过高速全双工接口互联，可通过光纤传输，不需要网络控制器转发，降低通信延迟，大大提高系统的性能，提高CPU跨节点内存访问效率，而且降低了硬件开销，减少了成本，同时还具备一定的可扩展性。

附图说明

图1 本发明中16路系统节点互联网络平面结构示意图；

图2本发明中64路系统节点互联立体结构示意图；

图3本发明方法流程示意图。

具体实施方式

本发明提供一种高端容错计算机节点互联的实现方法，根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

同时提供与上述方法相对应的一种高端容错计算机节点互联系统，根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本发明进一步详细说明。

利用本发明方法及系统，以建立64路高端容错计算机系统为例，

组建单节点内部CPU与Node Controler互联网络，其中Node Controler为节点控制芯片，简称NC，由NC板承载，每个单节点包含两个Node Controler，每个Node Controler带有8个全双工接口作为节点间网络互联接口，Node Controler 0和Node Controler 1之间的互联网络完全相同，每个单节点包含4颗CPU，每两个CPU互联一个Node Controler，CPU通过QPI接口与节点控制芯片的接口连接进行互联；

4个单节点组成一个16路系统，16路系统中每个单节点利用每个Node Controler上的3个接口实现网络结构全互联，可参考图1，如图1中NC0与NC2，NC4，NC6互联；

划分四个16路系统为两组，每组16路系统利用内部的节点控制芯片的4个接口实现互联，如图2中NC0，分别与NC1，NC2，NC3，NC4互联，将两组16路系统划分为两套32路系统，并利用每套32路系统中的节点控制芯片的1个接口完成成套系统间网络结构的互联，如图2中NC0与NC8互联，则64路系统的互联网络建立了超立方体结构，实现了网络开销与带宽性能之间的折中，既降低了多处理机中的远程访问延迟，又实现了较大的系统规模，得到最优的系统加速比。

其中上述Node Controler的接口可以是全双工NI接口，通过光模块进行光纤传输，光模块主要作用是基于NI接口物理层，通过内部处理芯片实现光、电信号之间的转换，可以大大提高系统的稳定性、可靠性和可用性。此外，Node Controler主要功能是维护系统Cache一致性，本发明系统还可设置NI接口控制器，负责收发节点之间Cache一致性报文，以及报文的路由转发。

利用本发明实现网络开销与带宽性能之间的折中，既降低了多处理机中的远程访问延迟，又实现了较大的系统规模，得到最优的系统加速比，系统的网络互连线还可采用光纤传输，大大提高系统的稳定性、可靠性和可用性。

Claims

1.一种高端容错计算机节点互联的实现方法，其特征在于根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

2.根据权利要求1所述的方法，其特征在于单节点内部的CPU通过QPI接口与节点控制芯片的接口连接进行互联。

3.根据权利要求2所述的方法，其特征在于单节点内部的CPU为偶数个，则将CPU按照偶数个划分，利用节点控制芯片的接口互联。

4.根据权利要求1-3任一所述的方法，其特征在于所述节点控制芯片的接口采用光纤传输的方式。

5.一种高端容错计算机节点互联系统，其特征在于根据实际应用情况将单节点内部的CPU利用节点控制芯片的接口互联，再将单节点利用节点控制芯片的接口互联，组成多路系统，将多路系统分组，每组多路系统间利用节点控制芯片的接口互联，根据实际应用情况将多组多路系统划分为成套系统，并利用节点控制芯片的接口完成成套系统的互联。

6.根据权利要求5所述的系统，其特征在于单节点内部的CPU通过QPI接口与节点控制芯片的接口连接进行互联。

7.根据权利要求6所述的系统，其特征在于单节点内部的CPU为偶数个，则将CPU按照偶数个划分，利用节点控制芯片的接口互联。

8.根据权利要求5-8任一所述的系统，其特征在于节点控制芯片的接口采用光纤传输的方式。