WO2012119533A1

WO2012119533A1 - 一种高端容错计算机系统及实现方法

Info

Publication number: WO2012119533A1
Application number: PCT/CN2012/071956
Authority: WO
Inventors: 王恩东; 胡雷钧; 李仁刚
Original assignee: 浪潮(北京)电子信息产业有限公司
Priority date: 2011-03-07
Filing date: 2012-03-06
Publication date: 2012-09-13
Also published as: CN102129418A; US20130346934A1; US8769459B2; CN102129418B

Description

一种高端容错计算机系统及实现方法

技术领域

本发明涉及高端计算机设计领域，具体涉及一种高端容错计算机系统及实现方法。

背景技术

随着计算机技术的飞速发展，为了满足经济社会发展的需要，高可靠的计算机系统成为制约社会发展关键领域的瓶颈之一。金融、电信等关键领域对计算机系统的可靠性要求极高，因此需要构建高可靠的庞大的多路计算机系统，以便更好适应当今各领域的应用需求，但是另一方面也陷入了多路计算机系统互联带来的系统可靠性的技术难题中，计算机系统的处理器数量不断增多，越来越高的集成密度使系统可靠性设计难度加大。

发明内容

本发明要解决的技术问题是，提供一种高端容错计算机系统及实现方法，能够有效实现全局存储器共享，均衡系统传输带宽和延迟，有效解决了多路 CPU系统集成可靠性的问题，具有很高的技术价值。

为了解决上述技术问题，本发明提出一种高端容错计算机系统，包括 N 个单结点原型验证系统和 M个交叉开关互联路由器芯片组，每个所述交叉开关互联路由器芯片组均用于实现所述 N个单结点原型验证系统之间互联，各所述交叉开关互联路由器芯片组之间不做转接， M, N均为大于等于 2的正整数，其中：

所述单结点原型验证系统包括：

计算板，为一 4路紧耦合计算板；

芯片验证板，包括 2个结点控制器芯片组，其中：每一结点控制器芯片组包括 2个现场可编程门阵列（FPGA )芯片，共同承载 1个结点控制器的逻辑；互联板，包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，设置为：实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联。

优选地，上述系统还可具有以下特点：

所述 4路紧耦合计算板包括 4个 CPU, 所述 4个 CPU内部互联，彼此共享存储器；

所述 N个单结点原型验证系统中的各 CPU之间经所述结点控制器芯片组和交叉开关互联路由器芯片组彼此互联，共享存储器。

优选地，上述系统还可具有以下特点：

所述结点控制器的逻辑包括：高速緩冲存储器（Cache ) —致性控制和互联网络接口控制。

优选地，上述系统还可具有以下特点：

所述芯片验证板具有网络接口（NI ) ；

所述多个单结点原型验证系统经各自的芯片验证板上的 NI接口与所述交叉开关互联路由器芯片组相连。

优选地，上述系统还可具有以下特点：

N的取值为 8;

M的取值为 4。

为了解决上述技术问题，本发明还提出一种高端容错计算机系统的实现方法，包括：

选择计算板，所述计算板为一 4路紧耦合计算板；

选择芯片验证板，所述芯片验证板包括 2个结点控制器芯片组，其中：每一结点控制器芯片组包括 2个现场可编程门阵列（FPGA )芯片，共同承载 1个结点控制器的逻辑；

选择互联板，所述互联板包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，用于实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联；将所述计算板中的 2路经所述互联板中的 1个 FPGA芯片连接至所述计算板中的一个结点控制器芯片组，将所述计算板中的另外 2路经所述互联板中的另外 1个 FPGA芯片连接至所述计算板中的另外一个结点控制器芯片组，从而组成一个单结点原型验证系统；

将 N个所述单结点原型验证系统中的每一个单结点原型验证系统分别与

M个交叉开关互联路由器芯片组中的每一个交叉开关互联路由器芯片组相连，各交叉开关互联路由器芯片组之间不做转接，任意一个交叉开关互联路由器芯片组实现与其连接的 N个所述单结点原型验证系统内部互联，以构成一个 N结点 4*N路系统； M, N均为大于等于 2的正整数。

优选地，上述方法还可具有以下特点：

所述芯片验证板具有网络接口（NI ) ；

在将所述 N个所述单结点原型验证系统互联时，是将所述 N个单结点原型验证系统经各自的芯片验证板上的 NI接口与所述交叉开关互联路由器芯片组相连。

优选地，上述方法还可具有以下特点：

N的取值为 8;

M的取值为 4。

一种高端容错计算机系统，包括: N个单结点和 M个交叉开关互联路由器芯片组（NR ) , 每个所述交叉开关互联路由器芯片组均用于实现所述 N个所述单结点内部互联，各所述交叉开关互联路由器芯片组之间不做转接， M, N均为大于等于 2的正整数，其中：所述单结点包括：

计算板，为一 4路紧耦合计算板；

结点控制器，实现对计算板上的 2路 CPU的控制。

优选地，所述 4路紧耦合计算板包括 4个 CPU,所述 4个 CPU内部互联，彼此共享存储器。

优选地，所述 N个单结点中的各 CPU之间经所述结点控制器和交叉开关互联路由器芯片组彼此互联，共享存储器。

优选地， N的取值为 8; M的取值为 4。

如上所述的高端容错计算机系统的实现方法，包括：

选择计算板，所述计算板为一 4路紧耦合计算板；

选择结点控制器，实现对计算板上的 2路 CPU的控制，组成一个单结点互联；

使用互联路由器芯片组将多个所述单结点互联，其中， N个单结点和 M 个交叉开关互联路由器芯片组（NR ) , 每个所述交叉开关互联路由器芯片组均用于实现所述 N个所述单结点内部互联，各所述交叉开关互联路由器芯片组之间不做转接， M, N均为大于等于 2的正整数。

优选地， N的取值为 8; M的取值为 4。

本发明实施例提供的一种高端容错计算机系统及实现方法，能够有效实现全局存储器共享，均衡系统传输带宽和延迟，有效解决了多路 CPU系统集成可靠性的问题，具有很高的技术价值。附图概述图 1是本发明实施例一种高端容错计算机系统方框图；

图 2是本发明实施例一种高端容错计算机系统的实现方法流程图。本发明的较佳实施方式

下面将结合附图来详细说明本发明实施方案。

参见图 1 , 该图示出了本发明实施例一种高端容错计算机系统示意图，包括 N个单结点原型验证系统和 M个交叉开关互联路由器芯片组（NR ) , 每个所述交叉开关互联路由器芯片组均用于实现所述 N个所述单结点原型验证系统内部互联，以构成一个 N结点 4*N路系统，各所述交叉开关互联路由器芯片组之间不做转接，从而保证 M个交叉开关互联路由器芯片组构成的 M 套平行网络彼此独立， M, N均为大于等于 2的正整数，其中：

所述单结点原型验证系统包括：

计算板，为一 4路紧耦合计算板；

芯片验证板，包括 2个结点控制器芯片组，其中：每一结点控制器芯片组包括 2个现场可编程门阵列（FPGA )芯片，共同承载 1个结点控制器的逻辑；

互联板，包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，用于实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联。

其中，在图 1中，互联板和芯片验证板构成 2个结点控制器（NC ) , 每个结点控制器包括芯片验证板上的一个结点控制器芯片组和互联板上的一个现场可编程门阵列（ Field Programmable Gate Array, FPGA ) 芯片，实现对计算板上的 2路 CPU的控制。

其中，所述 4路紧耦合计算板包括 4个 CPU , 所述 4个 CPU内部互联，彼此共享存储器；所述 N个单结点原型验证系统中的各 CPU之间经所述结点控制器芯片组和交叉开关互联路由器芯片组彼此互联，共享存储器，即整个 N结点 4*N路系统内部的 4*N个 CPU彼此共享存储器。

其中，所述结点控制器的逻辑包括：高速緩冲存储器（ Cache )—致性控制和互联网络接口控制。

其中，互联板的 2个 FPGA芯片除了实现物理层逻辑，保证互联链路握手初始化以及信号传输质量外，还可以为验证工作提供了多种调试手段和测试方法。

其中，所述交叉开关互联路由器芯片组可以通过例如 PCIe接口、 NI

( Network Interface )接口、光接口、 AMD HT接口、 Intel QPI接口、以及自主开发的其他协议接口等高速接口实现多个所述单结点原型验证系统内部互联，实现多 CPU系统集成，有效实现全局存储器共享，有效解决了多路 CPU 系统中超大规模集成电路设计验证复杂度的问题，在保证计算机系统验证和高端服务器关键芯片组验证的基础上，实现了高端计算机系统性能的要求，具有很高的技术价值。同时板级多级互联为调试验证提供了大量的调试接口和验证手段，大大减少了验证难度和复杂度，节约了项目研制开销，缩短了项目研制周期。

本发明巧妙地釆用多单元板互联方式实现大规模结点控制器芯片组 FPGA验证，经过深入研究和反复试验，最终设计出上述实施例所述的单结点原型验证系统，其为一 4路单结点系统，其中：

在选择系统最小的计算单元时，从实现最的优化角度出发，充分考虑到 4路以上会增加计算板规模不利于制版， 4路以下会增加计算板数量，不利于全系统集成，因此，综合考虑后选择 4路紧耦合计算板作为系统最小的计算单元。

自主设计逻辑验证单元，即结点控制器芯片组，实现系统 Cache—致性控制和互联网络接口控制：通过釆用 2片大容量高端 FPGA芯片实现 1个结点控制器芯片组逻辑，从而有效保证结点控制器芯片组 FPGA验证覆盖率，确保对结点控制器逻辑进行全面验证，为芯片 ASIC 实现打下基础。其中，基于选定的计算单元（即 4路紧耦合计算板）的设计规格和接口，需为所述计算单元配备 2个结点控制器芯片组，分别负责两路 CPU的互联。

基于选定的计算单元（即 4路紧耦合计算板）的设计规格和接口，选择 4端口互联单板完成计算单元与逻辑验证单元的 4端口协议互联，以 2片高端 FPGA芯片分别提供 2个高速互联端口，保证整个系统的高速互联协议，且能为逻辑验证提供丰富的调试接口和验证手段。

上述单结点原型验证系统还具有很好的扩展性，能够方便地将多个上述单结点原型验证系统级联，从而实现多 CPU系统集成，有效实现全局存储器共享，有效解决多路 CPU系统中超大规模集成电路设计验证复杂度的问题，具有很高的技术价值。

进一步地，本发明针对多路计算机系统集成密度高的结构特点，为提高系统性能，减少设计难度和设计复杂度，提高设计的可复用特性，在上述单结点原型验证系统的基础上，釆用系统互联路由器芯片组实现 N个同构的单结点原型验证系统内部互联，以构成一个 N结点 4*N路系统，从而实现紧耦合共享存储器的设计要求。同时， N个单结点原型验证系统对称的同构结构实现了系统处理器间互访同步长，保证了紧耦合共享存储器系统的性能，并且对称的同构结构也大大减少了多路系统的设计复杂度，提高了设计的可重用性，并且为设计验证和板级调试工作节省了大量项目研制时间，缩短了项目研制周期。

进一步地，本发明充分考虑多路处理器系统集成的特点和系统高可靠的设计要求，在上述 N结点 4*N路系统的基础上，使用 M个交叉开关互联路由器芯片组平行同构扩展出 M个同构的 N结点 4*N路系统，由于各所述交叉开关互联路由器芯片组之间不做转接，从而保证 M个交叉开关互联路由器芯片组构成的 M个 N结点 4*N路系统彼此独立，这种容错机制大大提高了高端计算机系统的可靠性，提高了其特殊领域应用的容错机制。

较佳地，本发明还针对 32路的高端系统的特点，充分考虑系统效率、设计复杂性，以及成本，从实现最优化的角度出发，经反复试验及比较后，提供一种最合理的 32路高端容错计算机系统，即，选择 8个所述单结点原型验证系统，釆用上述方式组成 8结点 32路原型验证系统，并使用 4个交叉开关互联路由器芯片组平行同构扩展出 4个 8结点 32路系统，如图 1所示。这是根据系统可靠性的要求提出来的，经反复试验比较后，发现平行同构扩展出的 8结点 32路原型验证系统的数量小于 4套时，系统可靠性较低，大于 4套可靠性会越高，但是系统规模太大，对机箱、散热等架构设计带来难度，综合考虑可以选择 4套为最佳选择。图 1中，包括 4套平行同构的 8结点 32路系统，结合系统自适应路由机制，保证系统在 3套网络发生故障时，仍能够使用唯一的非故障网络进行通信，从而大大提高了高端计算机系统的可靠性，提高了其特殊领域应用的容错机制；对于每一个 8结点 32路系统而言，则是以单结点 4路原型验证系统为基础，分析互联芯片组结构特点，以及协议处理能力和处理机制，扩展实现的，整个 32路系统中的 16个结点控制器芯片组实现整个系统的 Cache—致性控制和互联网络接口控制。

本发明实施例还提供了一种高端容错计算机系统的实现方法，如图 2所示，包括：

步骤 S201 : 选择计算板，所述计算板为一 4路紧耦合计算板；

所述 4路紧耦合计算板包括 4个 CPU, 所述 4个 CPU内部互联，彼此共享存储器。

步骤 S202: 选择芯片验证板，所述芯片验证板包括 2个结点控制器芯片组，其中：每一结点控制器芯片组包括 2个现场可编程门阵列（FPGA )芯片，共同承载 1个结点控制器的逻辑；

所述结点控制器的逻辑包括：高速緩冲存储器（Cache )—致性控制和互联网络接口控制。

步骤 S203: 选择互联板，所述互联板包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，用于实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联；

步骤 S204: 将所述计算板中的 2路经所述互联板中的 1个 FPGA芯片连接至所述计算板中的一个结点控制器芯片组，将所述计算板中的另外 2路经所述互联板中的另外 1个 FPGA芯片连接至所述计算板中的另外一个结点控制器芯片组，从而组成一个单结点原型验证系统；

步骤 S205:将 N个所述单结点原型验证系统中的每一个单结点原型验证系统分别与 M个交叉开关互联路由器芯片组中的每一个交叉开关互联路由器芯片组相连，各交叉开关互联路由器芯片组之间不做转接，任意一个交叉开关互联路由器芯片组实现与其连接的 N个所述单结点原型验证系统内部互联，以构成一个 N结点 4*N路系统； M, N均为大于等于 2的正整数。

在所述构成的一个 N结点 4*N路系统中， N个单结点原型验证系统中的各 CPU之间经所述结点控制器芯片组和交叉开关互联路由器芯片组彼此互联，共享存储器，即整个 N结点 4*N路系统内部的 4*N个 CPU彼此共享存储器。

其中，在执行步骤 S205时，所述交叉开关互联路由器芯片组可以通过例如 PCIe接口、 NI ( Network Interface )接口、光接口、 AMD HT接口、 Intel QPI 接口、以及自主开发的其他协议接口等高速接口实现多个所述单结点原型验证系统内部互联，实现多 CPU系统集成，有效实现全局存储器共享。

其中，针对 32路的高端系统的特点，在执行步骤 S205时，可以选择 8 个所述单结点原型验证系统，组成 8结点 32路原型验证系统，并使用 4个交叉开关互联路由器芯片组平行同构扩展出 4个 8结点 32路系统，以最合理的方式提供 32路系统的可靠性和容错性。

在另一实施例中，仍然釆用类似图 1所示的结构，高端容错计算机系统平行网络结构设计主要包括：单套 32路系统结构设计（1 ) 、 4套平行网络结构容错结构设计（2 ) 。根据多路计算机系统集成密度高的结构特点，为实现系统容错机制，提高系统可靠性，以及设计的可复用，釆用 4路计算板为系统最少计算模块， 32路系统釆用 8套同构的计算单元，计算板内部实现处理器内部互联，实现紧耦合共享存储器的设计要求。根据处理器（即 CPU ) 配置结构的特点，釆用单计算板配备两个结点控制器芯片组的结构，每两个处理器连接一个结点控制器实现与整个系统的互联控制，并且实现其 Cache—致性控制， 32路系统总共 16 个结点控制器芯片组通过各自的互联网络接口控制与系统互联交叉开关互联路由器芯片组的互联，从而实现 32路紧耦合共享存储器高端容错计算机系统。具体地，高端容错计算机系统包括：

N个单结点和 M个交叉开关互联路由器芯片组（NR ) , 每个所述交叉开关互联路由器芯片组均用于实现所述 N个所述单结点内部互联，以构成一个 N结点 4*N路系统，各所述交叉开关互联路由器芯片组之间不做转接，从而保证 M个交叉开关互联路由器芯片组构成的 M套平行网络彼此独立， M , N均为大于等于 2的正整数，其中：所述单结点包括：

计算板，为一 4路紧耦合计算板；

结点控制器，实现对计算板上的 2路 CPU的控制。

其中，所述 4路紧耦合计算板包括 4个 CPU , 所述 4个 CPU内部互联，彼此共享存储器；所述 N个单结点中的各 CPU之间经所述结点控制器和交叉开关互联路由器芯片组彼此互联，共享存储器，即整个 N结点 4*N路系统内部的 4*N个 CPU彼此共享存储器。

相应地，上述高端容错计算机系统的实现方法，包括：

选择计算板，所述计算板为一 4路紧耦合计算板；其中，所述 4路紧耦合计算板包括 4个 CPU, 所述 4个 CPU内部互联，彼此共享存储器。

选择结点控制器，实现对计算板上的 2路 CPU的控制。

在所述构成的一个 N结点 4*N路系统中， N个单结点中的各 CPU之间经所述交叉开关互联路由器芯片组彼此互联,共享存储器，即整个 N结点 4*N 路系统内部的 4*N个 CPU彼此共享存储器。

N的取值为 8; M的取值为 4。

上述实施例的有益效果是：单套 32路系统结构设计的特性，主要是指系统结构设计阶段根据系统规模以及性能分析，设计整个计算机系统以 4路计算板系统为基础，计算板内部实现处理器内部互联，满足其共享存储器设计要求， 2路处理器通过 1个结点控制器实现对远程处理器访问报文的处理和控制，整个 32路系统釆用 16个结点控制器实现整个系统的 Cache—致性控制和互联网络接口控制，系统中 16个结点控制器芯片组各通过一个互联网络端口连接到交叉开关互联路由器芯片组，由交叉开关互联路由器芯片组实现整个系统的互联； 4 套平行网络结构容错结构设计的特性，主要是指在单套 32路系统结构设计的基础上釆用 4个交叉开关互联路由器芯片组平行扩展为 4套网络结构， 4个交叉开关互联路由器芯片组之间不做转接，保证系统在 3 套网络发生故障时，仍能够使用唯一的非故障网络进行通信，大大提高了系统的可靠性和容错机制。这种计算机系统体系结构的设计实现了多路 CPU的系统集成，有效实现了全局存储器共享，均衡系统传输带宽和延迟，有效解决了多路 CPU系统集成可靠性的问题。

当然，本发明还可有其他多种实施例，在不背离本发明精神及其实质的些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

工业实用性

本发明实施例提供的一种高端容错计算机系统及实现方法，能够有效实现全局存储器共享，均衡系统传输带宽和延迟，有效解决了多路 CPU系统集成可靠性的问题，具有很高的技术价值。

Claims

权利要求书

1、一种高端容错计算机系统，包括 N个单结点原型验证系统和 M个交叉开关互联路由器芯片组，每个所述交叉开关互联路由器芯片组均用于实现所述 N个单结点原型验证系统之间互联，各所述交叉开关互联路由器芯片组之间不做转接， M, N均为大于等于 2的正整数，其中：

所述单结点原型验证系统包括：

计算板，为一 4路紧耦合计算板；

互联板，包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，设置为：实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联。

2、如权利要求 1所述的系统，其中，

所述 4路紧耦合计算板包括 4个 CPU , 所述 4个 CPU内部互联，彼此共享存储器；

3、如权利要求 1所述的系统，其中，

4、如权利要求 1所述的系统，其中，

所述芯片验证板具有网络接口（NI ) ；

5、如权利要求 1 -4中任何一项所述的系统，其中，

N的取值为 8;

M的取值为 4。

6、一种高端容错计算机系统的实现方法，包括：

选择计算板，所述计算板为一 4路紧耦合计算板；

选择互联板，所述互联板包括 2个 FPGA芯片，其中：每个 FPGA芯片提供一个高速互联端口，用于实现所述计算板中的 2路与 1个所述结点控制器芯片组之间的协议互联；

将所述计算板中的 2路经所述互联板中的 1个 FPGA芯片连接至所述计算板中的一个结点控制器芯片组，将所述计算板中的另外 2路经所述互联板中的另外 1个 FPGA芯片连接至所述计算板中的另外一个结点控制器芯片组，从而组成一个单结点原型验证系统；

将 N个所述单结点原型验证系统中的每一个单结点原型验证系统分别与 M个交叉开关互联路由器芯片组中的每一个交叉开关互联路由器芯片组相连，各交叉开关互联路由器芯片组之间不做转接，任意一个交叉开关互联路由器芯片组实现与其连接的 N个所述单结点原型验证系统内部互联，以构成一个 N结点 4*N路系统； M, N均为大于等于 2的正整数。

7、如权利要求 6所述的方法，其中，

8、如权利要求 6所述的方法，其中，所述结点控制器的逻辑包括：高速緩冲存储器（Cache )—致性控制和互联网络接口控制。

9、如权利要求 6所述的方法，其中，

所述芯片验证板具有网络接口（NI ) ；

10、如权利要求 6-9中任何一项所述的方法，其中，

N的取值为 8;

M的取值为 4。

11、一种高端容错计算机系统，包括：

N个单结点和 M个交叉开关互联路由器芯片组（NR ) , 每个所述交叉开关互联路由器芯片组均用于实现所述 N个所述单结点内部互联，各所述交叉开关互联路由器芯片组之间不做转接， M, N均为大于等于 2的正整数，其中：所述单结点包括：

计算板，为一 4路紧耦合计算板；

结点控制器，实现对计算板上的 2路 CPU的控制。

12、如权利要求 11所述的系统，其中，所述 4路紧耦合计算板包括 4 个 CPU, 所述 4个 CPU内部互联，彼此共享存储器。

13、如权利要求 11所述的系统，其中，所述 N个单结点中的各 CPU 之间经所述结点控制器和交叉开关互联路由器芯片组彼此互联，共享存储器。

14、如权利要求 11所述的系统，其中， N的取值为 8; M的取值为 4。

15、一种如权利要求 11-14任一所述的高端容错计算机系统的实现方法，包括：

选择计算板，所述计算板为一 4路紧耦合计算板；

16、如权利要求 15所述的方法，其中， N的取值为 8; M的取值为 4。