CN1072788A

CN1072788A - 动态多方式并行处理器阵列体系结构的计算机系统

Info

Publication number: CN1072788A
Application number: CN92111552A
Authority: CN
Inventors: 彼得·迈克尔·科格
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1991-11-27
Filing date: 1992-10-20
Publication date: 1993-06-02
Anticipated expiration: 2007-10-20
Also published as: KR970008529B1; EP0544127B1; DE69228586T2; US5475856A; CN1044646C; EP0544127A3; DE69228586D1; CA2073516A1; ATE177547T1; JP2647315B2; MX9206864A; JPH05233569A; EP0544127A2; KR930010758A

Abstract

对一个并行RISC计算机系统提供了动态多方式并行处理器阵列。所展示的微密耦合VLSI实施例的体系结构能通过互连网络扩展到更大范围分布的处理单元，该网络将多个能以MIMD方式处理和处理器彼此耦合，在控制处理器控制下将指令广播到选定的单元组。处理单元耦合逻辑能实现动态方式分派和动态方式变换，允许SIMD方式操作的处理器最大限度利用存储器和周期时间。操作方式能在逐条指令一级从SIMD方式变换到MIMD方式。

Description

本发明涉及计算机系统，具体地说，本发明是关于这样一种计算机系统，它能在处理单元阵列之内利用处理器阵列并行地执行程序以动态地实现多种处理方式。

已经发展出能利用可以并行执行程序的处理器阵列的计算机系统。

VLSI（甚大规模集成电路）技术现在能将多个处理器（每个带有自己的存储器）非常靠近地放在一个或多个芯片上。这种并行处理器阵列能够成“单指令流多数据流（SIMD）”，或“多指令流多数据流（MIMD）”，或“单指令流单数据流（SISD）配置，但到目前为止，还没有利用任何多种方式类型，而且尚没有机器提供一种形式能在程序执行过程中动态地和有效地改变处理方式。

某些工作看来是部分地以本发明人的“流水线计算机体系结构”一书为基础，该书由半球出版公司在1981年出版，国际标准书号是0-86116-494-4。该著作有一历史性的展望，在这一领域十年进展之后，它仍然是有用的（见11-20页）。

以不同方式为目标的机器在继续发展。例如，对于SIMD方式，最近的美国专利4，992，933号（题为“具有全局指令控制和可重新编程指令译码器的SIMD阵列处理器”，于1991年2月12日颁发给James L.Taylor）是关于阵列处理器的，它提供了一个处理单元的多维阵列，而且提供了一种机制，使多个处理单元可以同时以SIMD方式更新，以响应一个迫使所有处理单元产生一次中断的全局加载指令。

当今最先进的机器是MIMD。美国专利4，916，652号（1990年4月10日颁发给Schwarz和Vassiliadis，题为“用于浮点单指令流单数据体系结构的动态多指令流多数据多流水线设备”）提出通过多功能流水线来实现MIMD机器，并将不同的指令流交错送入这些流水线。该专利设想使机器从MIMD切换到SISD运行一短暂时间以处理某些复杂的浮点操作指令。

还有其他专利对机器的MIMD方式进行中断。都是颁发给David K.Gifford的美国专利4，873，626号（1989年10月10日颁发）及美国专利4，891，787号（1990年1月2日颁发）描述了一个并行MIMD处理系统，它的处理器阵列具有SISD/MIMD指令处理系统。这两个专利确定了一个单CPU（中央处理器），它是多组处理器（PEs）和存储器的总控制器，这里每一组有一个某种形式的互连路径。一个并行总线将主CPU与各组互连。这个机器已经证明所有PEs能以MIMD方式运行独立的程序代码。与上述其他专利相似，它具有中断由单个主控制处理器控制的PEs处理的能力。

当前，大多数SIMD处理器（例如“连接机（Connection Machine）”（CM-2）或者是作为独有的单元，或者是作为一个MIMD主机的前端或后端来运行。所建立的每个处理器用于完成一个特定的功能。其结构与那些要求中断的结构相似，需要相当大量的额外开销去完成有限的专用方式操作。然而，大多数计算机算法或程序可能以几种方式（SIMD或MIMD）之一对有效的并行执行具有某种强的匹配能力。再有，所有的算法最终会从允许对问题的不同部分使用不同执行方式的机器体系结构中受益。现有的建议没有充分地针对这一要求。

这里所描述的发明使一种机器体系结构能允许对问题的不同部分采用不同的执行方式。再有，机器使用同一组系统资源能实现多方式应用。本发明人已经描述过的计算机系统是一个具有多组处理器（处理单元）和存储器的多处理器计算机系统，其中的处理器通过互连路径相互耦合在一起，系统中还有控制系统处理器指令执行的操作装置。根据本发明的最佳实施例，处理器可以组合成动态地以SIMD和/或MIMD方式执行指令。这种方式变换可以在逐条指令的基础上实现。各处理器可以是物理构造完全相同的，然而却能完成多方式功能。

在本发明人的最佳实施例中，每个计算机处理单元至少要有一个指令寄存器、程序计数器、和一个状态码寄存器。利用所描述的体系结构，本发明已提供了各种控制，它们能使这些MIMD方式操作中必须的通用处理单元在SISD方式下使用而且有用。本发明的动态切换方面利用一个计算机处理单元的指令寄存器直接控制利用其他通用单元作为SIMD操作方式下的双重目的资源的指令处理。

相应地，本发明对程序计数器赋予了基址寄存器功能。

本发明还给状态码寄存器赋予了局部启动功能（local enable functon）。

本发明还利用指令寄存器作为输送SIMD指令的流水线。

每个处理器在其指令寄存器中有一个值用于动态指示为执行当前指令所设置的操作方式。在指令集中的一条指令能被发送给系统中被选定的那些处理器以便将选定的一组处理器动态切换到所希望的操作方式。

在最佳实施例中，在执行一个指令流的一组处理器的每个处理单元的指令寄存器之间提供了一条路径，通过在这一路径上传送指令来启动一组处理器的SIMD操作。

在另一个实施例中，一个互连网络能实现各处理器之间的通信功能。在这一实施例中，能与处理器间直接通信路径相结合的一个多级互连网络提供了通向指令寄存器的补充路径。这一补充的互连网络是一个动态多级双边切换网络，能点对点连接各处理器而不会阻塞。

此外，还能在同一计算机系统上动态地运行几个相互动态转换的处理方式组。还没有已知的系统允许这样一种配置。

在下面的详细描述中将提出说明所有体系结构的手段的这些或其他改进。为了更好地理解本发明及其优点和特点，可参考前面引入的为其他发展目的而提出的共同未决申请。然而，具体到这里描述的改进、优点和特点。在下文的描述中将是参考即将描述的附图。

图1（a）说明通用资源系统的SIMD方式结构。

图1（b）说明通用资源系统的MIMD方式结构。

图2举例说明系统操作资源的一种假设时序。

图3说明该系统的新的可能特点，其中包括根据最佳实施例实现的各处理器之间直接信号耦合通信。

图4说明图3所示系统的另一实施例，其通信由互连网络实现，利用最佳多级ALLNODE（全节点）互连网络提供到达指令寄存器的另一种路径。

图5说明根据最佳实施例的SIMD时序。

（注：为图示说明方便，各图可能分成几部分。使用多张的情况中，当看图时，按照惯例我们把图的顶部作为第一张，其后各张为向下和横向部分。

下面的详细描述作为以例说明本发明最佳实施例的部分。

根据本发明，将要描述的计算机系统及其结构使一个机器处理单元能以桢的资源以适当的方式（例如图1（a）的SIMD方式或图1（b）的MIMD方式）来执行问题的不同部分。此外，如将要描述的SISD方式也在图1（a）的含义之中。在本发明的最佳实施例中，机器使用同一组系统资源来启动多方式应用，但这些资源动态地重新配置。本发明所描述的计算机系统是一个具有多个处理器组1…N的多处理器计算机系统。处理单元（以最佳的RISC配置）具有一个控制单元、一个数据流单元、和一个存储器。处理器通过一个互连路径相互耦合，该互连路径可以是任何一种通用形式的互连网络，例如纵横（crossbar）、或电路交换（circuit switching）网络、二元超立方（binary hypercube）网络或其他连接网络。在本发明最佳实施例及另一个实施例中，用于所描述体系结构的最好的连接网络因而也是本发明最希望使用的网络是以ALLNODE（全节点）开关为基础的那些网络之一。ALLNODE开关在题为“用于执行广播/多播（multi-cast）的广播/交换设备”的美国专利申请中描述过，该专利申请由H.T.Olnowich等提出（USSN 07/748，316），1991年8月21日提交。该网络是作为并行连接介质的多级网络，适用于RS/6000以及其处理器的异步连接，允许各处理器节点由同时发送的或以任何方式重叠的指令来彼此链接。该网络是在VLSI（甚大规模集成电路）上实现的，它提供在芯片（多级双侧芯片）内有规则的等距离的带有与被耦合的处理器相连接的端口的无阻塞转接选择路径。这些处理器或在一个芯片内，或在一块板上，或通过通信通道连接。该系统能提供一个双优优先级结构，用于上述参考申请（本发明人是发明者之一）中描述的单纯网络。有关的专利申请包括前面提到的那些，它们在这里被引入作为参考。该开关网络使本发明的一些特点能够实现。

计算机处理器将具有MIMD处理能够利用的那些资源，包括一个可在SIHD方式中被赋予基址寄存器功能的程序计数器，一个可被赋予局部启动功能的状态码寄存器，以及一个指令寄存器，它用于在SIMD方式下流水线输送SIMD指令。

本发明所描述的体系结构提供了控制系统处理器指令执行的操作手段。根据最佳实施例，处理器能配置成动态地以SIMD和/或MIMD方式执行指令的结构。这种方式变换能以逐条指令为基础。这些处理器在物理上可以是完全相同的，但却能实现多方式的功能。

由于在本发明最佳实施例中，计算机处理单元将具有指令寄存器、程序计数器、及状态码寄存器，计算机系统将具有控制能力使这些在MIMD方式下必须的通用处理单元资源能用于MIMD方式并在MIMD方式下发挥作用。

为便于讨论，象在最佳实施例中那样，我们假定一个单个处理器将具有由图2所概括的特点。这些特点是许多可能的RISC体系结构的特征，在国际商用机器公司（IBM）出售的RS/6000RISC处理器中能发现这些特点，这种处理器是本发明希望使用的。然而，在本发明范围内，单个处理单元将具有：

1.一个指令集，其中所有对数据的存储器访问是通过LOAD（加载）和STORE（存储）指令来实现的，就象在RISC类指令集体系结构中通用的那样;

2.这种数据存取的寻址将是基址加位移，但在一个存储器操作已经开始之后应对加法和变址寄存器进行更新，作为后地址更新（post address update）;

3.所有完成计算操作的指令，例如加或减，都是寄存器对寄存器的，并且能在一个或多个执行周期内执行，无需访问存储器（在本说明中，为简化叙述而假定这个周期时间为一个周期时间）;

4.除了立即指令占两个存储器字（第二个字为数据）外，其他所有指令均严格地置于一个存储器字中;

5.所有指令应置于一个机器周期中，在周期开始，可从机器寄存器中选取存储器操作数地址，在周期结尾，在读操作中接收结果的寄存器能让结果存入。

在当今的典型RISC机器中能发现所有这些特点，它们也能在具有当前正在发展的某些先进性的更复杂体系结构中实现。这里的要点在于尽管本发明人宁愿使用简化的RISC机器（它被详细描述），但是所描述的特点中没有任何一点不能经过修正而用于其他更传统的体系结构。

体系结构扩展

下面将对两种可能的方式描述使计算机系统能在逐条指令水平上在SIMD（作为举例）和MIMD方式之间进行动态变换的体系结构扩展。

我假定一个通常根据图3构成的处理器阵列。进入每个处理器的指令寄存器（IR）中的指令字可以来自标号为控制处理器（PE＃1）的处理器，在全局总线上（或在另一个实施例中通过网络）的一次广播，或者来自该处理器自己的存储器。

根据本发明，每个处理器的指令寄存器识别一个新的处理方式位（PMB），这一位指出该处理器是处于SIMD方式还是MIMD方式。这一位控制新指令的来源。

再有，每条指令的格式中包含一个单独的并行执行类型位（PET），它有两个值，指出是“局部”操作还是“阵列”操作。

最后，在指令集中系统提供了一条“变换方式”指令，它改变处理器的处理方式位，使该处理器以变换了的方式执行指令流中跟随“变换方式”指令的那些指令。

这些体系结构扩展使能逐条指令地动态变换方式，使计算机系统的机器能在SIMD和/或MIMD方式下操作以适应需由该计算机系统执行的算法的要求。

SIMD方式操作举例

每个处理器在其指令寄存器中有一个值用于动态地指出为执行当前指令所设置的操作方式。在指令集中的一条指令能被播发到系统中被选定的那些处理器，用来将选定的这一组处理器动态地变换到所希望的操作方式。本例中说明SIMD操作。

在接通电源时，除标号为PE＃1的处理器外，所有处理器均使其处理方式位（PMB）置于SIMD。处理器＃1被置于MIDM并在这一配置期间不能从该MIMD方式变换成其他方式。

再有，处理器＃1作为所配置的系统的控制器，它作为控制器发挥作用并提取指令。当处理器＃1提取一条指令时，所有其他处理器将该指令拷贝到各自的指令寄存器中。这样，在提取该指令结束时，所有处理器在其IR有相同的指令供执行。

现在，在下一个机器周期的开始，每个处理器要检查其PBM和指令并行执行类型位（PET）（在IR中发现这些位）。对于处理器＃1（它处于MIMD方式），若PET为“局部”则使该处理器将该指令作为通常指令来译码和执行。这样，下一个机器周期将用于处理器＃1中的指令执行，其存储器能用于取数和存储。也可能机器设计允许预先提取指令，而指令不需要存储器，在这种情况下这一周期可以用于提取下一条指令。在SIMD方式，所有其他处理器将看到“局部”PET并忽略这条指令。它们将处于休闲状态。这一操作方式用于需要由控制处理器进行某些总体状态或控制操作的时候。每当控制处理器＃1提取另一条指令时便重复这一过程，而且所有处于SIMD方式的处理器同时在它们的指令寄存器中俘获该存储器访问。

在这SIMD方式的配置中，若PET为“阵列”则使所有处于SIMD方式处理器（也就是除控制处理器＃1之外的所有其他处理器）去译码和执行该阵列指令。然而，处理器＃1将利用这个“阵列”PET作为标志跳过其执行周期而直接进入下一条指令的提取操作。这使得下一条指令的提取操作与所有其他被选定为SIMD方式的处理器（阵列组中的所有处理器）的执行操作重叠。这样，一个“阵列”指令串将会完全重叠于所有的指令提取操作，允许这些处理器的存储器在这些周期的每个周期中供数据操作数使用。

这些SIMD阵列方式指令的执行与普通处理器执行情况完全相同，只是在一条指令执行之后处理器的程序计数器PC不自动增量，除非该指令是双字立即指令。这就允许这些SIMD机器将其程序计数器作为另一个基址寄存器使用。这对任何门有限的（gatelimited）设计是一个有价值的特点，那里处理器都放在一个芯片上，那里“不动产”是宝贵的而且不想被浪费。

当程序计数器作为基址寄存器时，对其进行修改的指令是：

1.由控制处理器＃1提取的但PET设置等于“阵列”的“Jump（跳转）”指令，其作用是使每个SIMD方式处理器的程序计数器设置成该值;

2.由控制处理器提取的但PET设备等于“阵列”的“Load Immediate立即装入）”指令，其作用是按处理器程序计数器指定的地址将处理器存储器内容装入每个处理器的寄存器，并使PC在提取操作后增量;

3.“Branch and Link（分支和链接）”指令将从（slave）处理机的PC保存在指定的链寄存器中，并以新地址重新装入PC，这等效于在同一条指令中保存基址并重新装入它;

4.“Return（返回）”指令从其他寄存器之一取出基址重新装入程序计数器。

这样，这些指令一起使处理器PC能用于指向常数和其他数据数组的指针，这在矩阵运算中是很有用的。

在本结构中包括一条“STOR IMMEDIATE（立即存）”也可能是方便的，它是“立即装入”的逆指令。虽然通常它不是一条有用的指令，在所描述的机器中，它允许SIMD处理器使用它们的程序计数器作为基址寄存器也可用于存储。

图5以图表示出一个指令流举例。将会注意到所描述的发明在SIMD方式中允许很高的存储器利用率，因为在很高百分率的存储器周期中该阵列在进行一些有用的工作，可以达到100%的利用率。

图5给出的程序举例将两个数组加在一起，这里可在每个处理单元中找到一个数组。图中顶部一行对每个存储器周期又有一个细分部分，指出在那个周期里控制PE（＃1）和SIMD方式处理器在存取什么。IR中每条指令的RET也表示在每个周期上。再有，这里所示简化汇编语言在每个操作码的开头标以“X：”。这是那条指令的PET位。若“X”为“A”表示阵列方式;或“X”为“L”表示局部方式。这里所示程序是选来显示本发明的许多新特点。

如图5所示，控制处理器以局部方式的一条指令开始其执行，该指令以一循环计数设置它自己的R1寄存器（如RISC类机器中能出现的累加器或通用寄存器）。这占用了两个机器周期，一个用于提取指令，一个用于操作。在这段时间里其余PEs休间。

然后，以一个值为“阵列”的PET，它提取并分送指令“LOADBASE，X”，使SIMD方式的每个处理单元的基址寄存器装入X数组的地址。这占用了一个机器周期用于提取指令，在SIMD方式的PEs中以流水线方式使其机器周期与后面的周期重叠。

在下一个周期中看到PE＃1）再次提取和分送一个阵列方式指令-在这一情况下是“JUMPY”。这条指令的作用是使SIMD方式的所用PEs的另一数组起始地址装入它们的PC。

下面的三个指令是循环的核，所有指令都严格地用提取和分送这些指令的PE＃1的一个机器周期。第一条指令使所有SIMD一方式PEs在其工作寄存器R1之一装入取自X数组的一个值。第二条指令完成从Y数组取数对R2进行类似的装入。请注意，这里“LOADIMM（立即装入）”指令使用PC（先前装入了Y数组基址），而且有使PC增加1的副作用（如通常SISD机器中的立即方式指令所做的那样）。这使PC进到下一个Y数组元素。这三条指令中的最后一条将结果存回基址（BASE）寄存器所指定的位置（在第一条指令中取出的X数组元素位置），然后将修改的地址1+基址存回基址寄存器。这个调整后的基址指向下一个X数组元素。

最后两条指令是局部方式的，一条是使循环计数（可在PE＃1的R1中找到）减1，另一条是“Jump not Zero（非零跳转）”跳转回循环开始。这最后的跳转以局部方式执行，只影响PE＃1的PC，并将用作指入Y数组的一个指针的PC留给SIMD方式的PEs。这类功能的其他实现方法（例如在IBM系统/370机器体系结构中可以发出的BRANCH ON COUNT（根据计数分支）能使这两条指令压缩成一条。

MIMD方式举例

尽管已经描述的SIMD方式操作的结构和方法在许多应用中有用，MIMD方式同样是很重要的。考虑到这一点，本发明将给出一个MIMD操作事例。

假定控制处理器＃1取出一条“变换方式”指令，它的PET是“阵列”。处理器1将忽略它。然而，所有SIMD方式处理器将执行这条指令并将它们的操作方式改变成MIMD方式。或者这条指令能提供一个程序计数器PC值并在此开始执行（允许所有处理器在同一时刻在程序中的同一地方开始），或者让PC保持该指令之前的值，允许每个SIMD处理器计算出它自己的开始程序地址。

一旦在MIMD方式，在逐条指令水平的一个动态变化之后，处理器将作为单个处理器独立地可作为一个阵列的一部分去提取指令。其PET “局部”的指令执行程序流时完全象普通计算机那样。其PET为“阵列”的指令能以多种方式操作。一种具体应用方式是当指令为RISC意义下的LOAD（装入）和STORE（存储）时的情况。在这种情况下，由指令产生的地址被用作进入处理器互连网络的处理器地址。该处理器将暂停，直到该地址指定的处理器执行一条相反的指令（对STORE（存储）执行LOAD（装入），对LOAD（装入）执行STORE（存储））并将执行存储指令的处理器的数据传送给执行装入指令的处理器。首选的ALLNODE交换网络的优点在于该网络的等待时间最短。

类似地，由处理器执行的其PMB值为“阵列”的“变换方式”指令也能以多种方式完成。最简单的方式要算是简单地变换到SIMD方式并等待控制处理器＃1的下一条PET为“阵列”的指令。然而，此后控制处理器要完成一个等效变换的企图可能等待到所有其他处理器都已变换成SIMD方式。但是，利用具有某些有潜在价值的特点的另一种方式也能实现。这个另外的方式会使其他处理器遇到这种指令时暂停而不是处理器＃1暂停，并用指令所提供的地址作为回到处理器＃1手关键字。当处理器＃1执行一个变换而其“地址”与该关键字匹配，该处理器便脱离暂停状态。恢复追踪控制处理器的指令。

在这个另外方式中，一个有用的关键值应是一个二进制模式（pattern），它逻辑“或”到返回处理器＃1的某个公共总线信号上。当处理器＃1的地址与这个“或”后的值匹配时，这些处理器便脱离暂停状态，返回SIMD方式。这个公共总线信号能通过网络传送。这就允许原来的SIMD处理器组中有可变的处理器子集合从MIMD方式跳出进入SIMD方式，然后可能再次返回MIMD。再有，当一个处理器集合在SIMD方式下运行时，其他处理能仍旧保持在独立的MIMD方式。

也可能这样构成变换方式指令，以便向互连网络提供它的地址，作为被当作控制单元使用的处理单元的地址，允许任何PE作为任何其他PEs子集合的SIMD控制器，甚至可以动态地选择。

这样，可以在利用或不利用ALLNODE（全节点）网络特点的情况下采用子集合分组特点，但ALLNODE网络特点还有其他一些优越性，这将在下文中解释。

此外，在另一个实施例中，能有几个可以组间动态改变的处理方式组动态地运行于同一机器上。利用ALLNODE网络特性，能用互连网络代替全局同步总线来实现广播功能。这两种情况能在相同（结构）特性内实现。

ALLNODE互连网络举例

通过下文将可以理解，一个理想的系统可以利用象USSN07/661594号（1990年11月13日提交，题为“并行相联处理器系统”）所显示和描述的那些特性，那里有一组能实现SIMD处理的“前哨”处理器，但是，还能以更普通的MIMD概念用同一组资源来应用这一系统。在该系统内，你能进行混合与匹配，在可选性基础上你能有SIMD和MIMD两种操作方式，某些处理器运行SIMD而另一些处理器运用MIMD。能实现SIMD处理的“前哨”处理器见于题为“并行相联处理器系统”的申请（USSN：07/611，594，由J.W.Diff-enderfe等提出，1990年11月13日提交），这这里引入它作为参考。

利用ALLNODE互连网络，一个动态变换多级网络其中无阻塞转接选择路径选择处理器能很快地作为一个互连网络的一部分被建立起来，你能在一个网络上选择具有所需的资源的、不同的处理器组并用它们运行程序，从而能利用应用程序所需的SIMD和MIMD的优点。由此，对控制处理器的指定便不限于一个控制处理器，这提供了动态地轮流充当控制器的机会。如果所选择的网络选定了将哪些组互连，而且那些被选组成为一个动态网络的一部分，你能使用该网络去广播指令。这允许不必须用硬件而是用有关的软件来控制谁是路径处理器（route processor）。

这就更加多样化了，而且或许能比使用其他互连网络提供更多的特性。利用这样的系统，你现在有了一个能由任何一个（所选系统的任何一个处理器）运行SIMD方式的系统。一个处理器在一个时间段内能作为控制方，然后另一个处理器成为控制方，而且在这一动态资源分配之间，根据系统的流（fuidics）和资源所确定的那样，附属于该网络的不同资源能被利用。你能有多个处理器向多个处理器子集合广播，你还能有多个任意的SIMD机器集合运行在同一个物理硬件上。

返回图1，在MIMD方式下任意一个处理器能对任何其他处理单元子集合广播一条指令。你能将该广播数据送入它们的指令寄存器并象在SIMD方式那样去执行。在图4中，互连网络会广播指令，这时不需要对指令寄存器进行同步通信的另一条路径来增加一条到指令寄存器的补充路径。在这个使用ALLNODE网络（它是异步网络）的补充实施例中，你会通过互连网络传送指令并在内部达到指令寄存器，这便能根据需要使用更通用的机器单元。需要付出的代价是一个周期（它通常可以被吸收）。从根本上说，通过网络广播可能是与其他替代方式一样快的。而且或许比其他替代方式更可靠。当有多个处理器的阵列紧密地耦合在一个芯片上时，选择如在最佳实施例中描述的那种直接路径可能是更理想的。然而，对于本发明的系统应用，当处理器在物理上是彼此远离的，当每个集合以高频率运行，一个利用快速异步广播网络（如具有广播能力的ALLNODE开关网络）的配置是理想的。如图4所示，ALLNODE开关互连网络能用作从网络到指令寄存器的一条替代路径。

尽管纯粹的与有限的SIMD机器在向阵列内其他处理单元广播前一条指令时能提取一条指令，而且某些SIMD机器能独立地使用它们的存储器，如在USSN07/611，594（1990年11月13日提交，其申请题目是“并行相联处理器系统”）中描述的“前哨”（PICKET）处理器中那样，但本体系结构是RISC能力的一种扩展。在RISC处理器中，提取一条指令然后完成一个存储器操作是可能的。在本系统中，当提取下一条指令时，标志为参加操作的每个处理器适当地对它们各自的存储器提取和存储数据。事实上，被指定为控制单元的控制单元所执行和提取的每个单个指令能触发其他处理器的每一个中存储器的活动。

这样，便存在着100%使用存储器的潜力。每当需要存储器时，它便可以供使用，而只有当程序不需要它时才是它不被使用的时候。再有，本系统中，某些处理器能以SIMD方式运行而其他处理器能以MIMD方式进行它们自己的存储器提取。这是前哨（PICKET）””概念与更普通的MIMD概念的结合，并在该进程中使用了同一组资源。

ALLNODE开关使得将更普通的处理器用于正在描述的图4的示系统成为可能。虽然某些处理器能利用来自控制处理器1的公共存储器指令通信路径，但另一条路径（图4中的虚线）能被用来互连公共处理器。这些公共处理器能够是稍作修改的PS/2或RS/6000机器。其修改是利用一个端口提供一条指令和一个状态位或值，并带有适当的译码逻辑以告知每个处理器是取得它们自己的指令还是等待来自控制器处理器的广播。除此之外机器不需物理修改。这个改变会涉及一个传送，该传送允许另一个处理器提供一条指令来代替它们自己提取的指令。这个传送是通过到达指令寄存器的该另一条路径提供的。按这种方式，便不需要修改标准指令寄存器或在它下面的许多译码逻辑。通过硬件ALLNODE开关来指定处理器，便使哪个处理器作为控制一方的动态轮转成为可能，因为随后这一建立路径过程能由软件完成，它将允许软件去控制谁是路径处理器。以这样的系统，系统中任何处理器都能以SIMD方式运行。一个处理器在一段时间里可以是控制器，然后其他某一处理器可以是控制器。如前所述，这允许多个处理器向多个子集合广播，在同一物理硬件上提供SIMD机器的多种任意组合，而且以相同。硬件也能运行通常的MIMD处理过程。

与先前的多方式方案相比，在其他不同点当中有一点是在SIMD方式下的一个特殊PE完成指令提取，该指令被直接送到每个处理器而无需专门指令或中断。如果该指令标志为一条并行指令（我们称为将PET位置成“阵列”），则所有处理单元直接执行该指令。这本身与SIMD处理器的通用广播方式相似，但利用这个新的体系结构，在同一指令流也能在主（控制）处理器中完成局部计算。此外，在PET置位（ON）的情况下通过执行“动态”变换方式”指令也能使PEs解脱，回到独立的MIMD方式。

在最佳实施例中将会注意到，没有使用中断屏蔽位来指出一个PE是否将参与SIMD操作，但代之以PMB位来通知处理单元从哪里得到它的指令，是从它的局部存储器得到还是由控制处理器＃1提取那条指令。

当前途径的简单性与源于MIT的专利4，873，626及4，891，787成为对照，它们本身借用了对并行IF-RHEN-ELSE条件执行问题（该问题在1960年代提出1970年代实现的ILLIACIV处理器中解决）的经典解决办法。在每个处理器中有一个启动位，它允许每个处理单元去执行一条SIMD指令。在这种情况中，所有PEs并行地对它们自己的数据完成一个IF（条件）测试，并置好它们的ENABLE（启动）位。然后，启动位被置成“真”的所有PEs有条件地执行THEN代码。然后，启动位被置成“伪”的所有PEs有条件的执行FALSE代码。其结果由控制器检查，TRUE（真）和FALSE（伪）代码均由阵列执行。

然而，本系统不需要一个显性启动位来完成这类操作。如果希望的话，已经在每个PE（因为它能独立操作）中的“状态码”或等效的状态位与COMPARE（比较）或其等效指令一起提供了同样的功能。然而，由于这里描述的系统所具有的从SIMD到MIMD的动态快速变换能力，本系统提供了一个处理和加速获得结果的另一种重要途径。

这一过程会使所有的PEs以SIMD方式执行IF（条件）测试。然后控制器用一条指令将它们全部释放回MIMD方式。然后每个PE将执行与它的数据有关的“唯一路径（JUST THE ONEPATH）。当所有PEs已经完成它们的路径，它们将变换回SIMD方式。这样，总时间是测试时间加上这两个路径中的最大时间，而不是经典方式所需要的总和时间。对于复杂的代码，这一改进能实现速度增加因子2。

本发明所公开的最佳实施例会被认为是理想地适用于紧密耦合的高性能RISC类处理器体系结构。但是，它能扩展到更大范围分布的体系结构，取决于互连网络的能力。在最佳实施例中，本系统由微密的VLSI（甚大规模集成电路）实现，那里存储器和逻辑（电路）能放在一块芯片上，这便允许更多PEs及它们的存储器位于一块芯片上。通过将相对有限数目的若干系统微密地耦合于单一的一块芯片上，便能实现指令执行的SIMD方式，使在每个可能的存储周期内对每个PE有一条指令的机会。

迅速地变换到MIMD方式和MIMD方式变换成其他方式甚至对固有的顺序计算在控制处理机上变换成SISD方式的能力允许程序员或编译器为系统建立的程序使用对应用程序最有意义的最佳并行操作类型（SISD、SIMD、MIMD）。再有，所建立起来的这种部分地以SIMD方式进行的执行过程能使几乎每一个存储器周期时间都被用于计算，从而造成一种可以在存储器极限运行的机器设计。利用ALLNODE开关及补充路径，对于许多处理器能在几个周期内建立系统。这个系统在初始建立期间的周期时间有一个小的牺牲，但通用硬件的优越性，极大的扩展能力及配置的灵活性可以造成另一个系统，它利用被选定为所选系统的互连网络作为补充路径。

这里，已经详细叙述的几种替代系统表明，为识别哪种执行方式最理想而限定的简单机制实现起来是相当经济的，而且它们能被移杆到多种体系结构和技术中。这一方案允许计算机系统能很自然地使用处理单元的全部资源而对每个处理单元只需作很小改变或不作改变，造成一个以多种方式操作的“并行RISC”机器，并能灵活地动态地配置系统，以适应具体的应用。

尽管本发明已描述了最佳实施例，但应该理解，那些在现在和将来精通本门技艺的人们根据对这些讨论的理解将能作出各种改造和扩充，而这些都属于下文中的权利要求的范围。这些权利要求的构成应能保持对首先披露的本发明的适当保护。

Claims

1、一个计算机系统，包括多组处理器和存储器，以及处理器之间的一个互连通道，其特征在于控制系统的处理器指令执行的操作手段，所述操作手段使处理器组能动态地配置，以便作为MIMD、SIMD或SIMD处理器组进行操作，这些处理器组是通过动态地改变一个或多个程序的指令执行方式来配置。

2、根据权利要求1的一个计算机系统，其特征在于所述方式变换是在逐条指令基础上实现的。

3、根据权利要求1的一个计算机系统，其特征在于至少某些所述处理器是物理上完全相同的，然而能完成多方式功能。

4、根据权利要求1的一个计算机系统，其特征在于至少有一些所述处理器中的每一个具有为实现单个SISD或成组MIMD功能所必须的一个指令寄存器、一个程序计数器和一个状态码寄存器，用于它们的计算机处理单元。

5、根据权利要求1的一个计算机系统，其特征在于至少有一些所述处理器中的每一个具有为MIMD方式操作所必须的资源，用于它们的计算机处理单元，所述相同资源也用于SIMD方式操作。

6、根据权利要求1的一个计算机系统，其特征在于：当所述操作手段使选定的处理器动态地实现SIMD功能时，作为资源为MIMD操作所必需的所述处理器的程序计数器被赋予执行SIMD方式操作的基址寄存器功能。

7、根据权利要求1的一个计算机系统，其特征在于：当所述操作手段使选定的处理顺动态地实现SIMD功能时，作为资源为MIMD操作所必需的所述处理器的指令寄存器被赋予执行SIMD方式操作的局部启动功能。

8、根据权利要求1的一个计算机系统，其特征在于：当所述操作手段使选定的处理器动态地实现SIMD功能时，作为资源为MIMD操作所必需的所述处理器的指令寄存器被赋予执行SIMD方式操作的局部启动功能，而且这里所述指令寄存器还用于流水线方式输送SIMD指令。

9、根据权利要求1的一个计算机系统，其特征在于：当所述操作手段使选定的处理器动态地实现SIMD功能时，作为资源为MIMD操作所必需的所述处理器的指令寄存器被赋予执行SIMD操作的方式局部启动功能。

10、根据权利要求1的一个计算机系统，其特征在于：当所述操作手段使选定的处理顺动态地实现SIMD功能时，作为资源为MIMD操作所必需的所述处理器的指令寄存器被赋予执行SIMD方式操作的局部启动功能，而且这里所述指令寄存器还用于以流水线方式输送SIMD指令。

11、根据权利要求1的一个计算机系统，其特征在于所述处理器组在所述指令寄存器中有一个值设置寄存器，它动态地指示一个程序指令流中当前指令的当前执行方式。

12、根据权利要求1的一个计算机系统，其特征在于：在操作手段指令集中的一条指令能被广播到该系统的被选定处理器，以将系统中被选定的处理器集合动态地变换到所希望的操作方式。

13、根据权利要求1的一个计算机系统，其特征在于提供了多个可相互动态变换的处理方式组运行于同一计算机系统上，在完成任务过程中在各操作方式之间动态地变换。

14、根据权利要求1的一个计算机系统，其特征在于机器使用同一组系统资源去启动多方式应用程序，但这些资源被动态地重新配置。

15、根据权利要求1的一个计算机系统，其特征在于该计算机系统是一个多处理机计算机系统，它具有多个处理器组1…N，每个组有若干处理单元每个处理单元有一个控制单元，一个数据流单元，以及与一个处理器相关联的一个存储器，在所述多个组中的每个处理器通过互连网络彼此相连。

16、根据权利要求1的一个计算机系统，其特征在于互连网络是一个动态变换连接网络。

17、根据权利要求1的一个计算机系统，其特征在于：在SIMD方式，其方式间的变换利用在MIMD方式中使用的计算机处理单元指令寄存器去变换到SIMD方式，而指令处理利用在MIMD方式操作中使用的其他单元作为SIMD操作方式的双重目的资源。

18、根据权利要求1的一个计算机系统，其特征在于：互连网络是一个动态多级双侧变换网张，能对处理器点对点耦合而无阻塞。

19、根据权利要求1的一个计算机系统，其特征在于：在执行一个指令流的一个处理器组中每个处理单元的指令寄存器之间提供一个广播路径，利用这样提供的广播路径进行广播使该组中的多个处理器能进行SIMD操作。

20、根据权利要求1的一个计算机系统，其特征在于：一个互连网络提供广播功能用于向一个处理器组中的多个处理顺广播指令，使这些处理器能执行一种操作方式。

21、根据权利要求1的一个计算机系统，其特征在于：一个多级互连网络提供通向执行一个公共程序的一组处理器指令寄存器的替代路径。

22、根据权利要求1的一个计算机系统，其特征在于：一个多级线连网络提供通向执行一个公共程序的一组处理器指令寄存器的广播路径。

23、根据权利要求1的一个计算机系统，其特征在于：一个多级互连网络提供通向执行一个公共程序的一组处理器的指令寄存器的替代路径，而所述互连网络是一个动态多级双侧变换网络，能使各计算器点对点耦合而无阻塞。

24、根据权利要求1的一个计算机系统，其特征在于：一个多级互连网络提供通向执行一个公共程序的一组处理器的指令寄存器的广播路径，而所述互连网络是一个动态多级双侧变换网络，能使各处理器点对点耦合而无阻塞。

25、根据权利要求1的一个计算机系统，其特征在于：一组交互处理器的单个处理单元具有

一个指令集，这里对存储器的所有数据访问都是通过LOAD（装入）STORE（存储）指令实现的，而且这里

对数据访问的寻址是基址加位移，而且这里

加法和变址寄存器的更新应在存储器操作已经开始之后进行，作为后地址更新;而且这里

所有执行计算操作的指令是寄存器对寄存器，而且所述处理器能在一个或多个执行周期内执行指令而不需访问内存。

26、根据权利要求1的一个计算机系统，其特征在于：指令是在一个机器周期内可执行的，其存储器操作地址可在周期开始时从机器寄存器中选择，还提供一个寄存器用于在“读”指令中接收结果，该寄存器能在周期结尾销存。

27、根据权利要求1的一个计算机系统，其特征在于：进入一个处理器指令寄存器（IR）的指令字或者来自由冠以“控制”的处理器所发起的一次广播，或者来自处理器自己的存储器。

28、根据权利要求1的一个计算机系统，其特征在于：提供给每个处理器一个指令寄存器，它认识一个指示该执行周期处理器方式的处理方式值（PMB）。

29、根据权利要求28的一个计算机系统，其特征在于：该处理方式值是指示新指令源于何处的一位。

30、根据权利要求1的一个计算机系统，其特征在于：处理器每个指令的格式包括一个独立的并行执行类型变量（PET），它有两个值，其值指示“局部”操作或“阵列”操作。

31、根据权利要求1有一个计算机系统，其特征在于：该系统的指令集中提供了一个变换方式指令用于系统的操作手段中，该指令改变处理器的操作方式，使其按变换了的方式执行指令流中跟随变换方式指令的那些指令。

32、根据权利要求1的一个计算机系统，其特征在于：每个处理器在其指令寄存器中有一个值，用于动态地指示为执行当前指令设置的操作方式，这里，一条指令能广播到系统的选定处理器，用以将系统中选定的一组处理器动态地变换到所希望的操作方式。

33、根据权利要求32的一个计算机系统，其特征在于：在接通电源时一组交互处理器中除控制处理器外全都使方式变量置成SIMD方式，而控制处理器保持为MIMD方式，并且在一个程序结构的交互处理期间不从这一MIMD方式变换成其他方式。

34、根据权利要求32的一个计算机系统，其特征在于：一个交互作用处理器组的控制处理器控制其配置（configuration）并作为控制器和提取指令，这里，在控制处理器提取每条指令时其他处理器将该指令的拷贝销存到它们的指令寄存器中，使得在指令提取结束时所有其他处理器均在它们的指令寄存器中有被提取的那条指令供执行。

35、根据权利要求34的一个计算机系统，其特征在于：在下一个机器程序周期开始时，每个处理器查看其指令寄存器中代表方式与执行类型值的变量，这里，若类型变量为“局部”，则使处理器将该指令作为通常的指令来译码和执行。

36、根据权利要求35的一个计算机系统，其特征在于下一个机器周期允许在控制处理器执行指令时其存储器可用于装入和存储。

37、根据权利要求35的一个计算机系统，其特征在于：如果预先提取的指令不需要存储器，那么在这种情况下该周期可以用于提取下一条指令，这里所有SIMD方式处理器将看到“局部”类型并忽略该指令。

38、根据权利要求37的一个计算机系统，其特征在于：每当控制处理器提取下一条指令时，所有SIMD方式的处理器同时在它们的指令寄存器中获取存储器访问。

39、根据权利要求34的一个计算机系统，其特征在于：在下一个机器程序周期开始时，每个处理器查看其指令寄存器中代表方式与执行类型值的变量，这里，若类型变量为“阵列”，则使SIMD方式的所有处理器译码和执行该阵列指令，而控制处理器将把该阵列类型作为标志以跳过其执行周期并直接进入它的下一条指令提取。

40、根据权利要求34的一个计算机系统，其特征在于执行SIMD方式指令时以程序计数器作为基址寄存器。

41、根据权利要求34的一个计算机系统，其特征在于操作手段包括修改一个处理器程序计数器使其作为基址寄存器的指令，这些指令包括：

由控制处理器提取的一条“跳转（Jump）指令，但这里的类型值等于“阵列”所需要的作用是将每个SIMD方式处理器的程序计数器置成该值;

由控制处理器提取的一条“立即装入（Load Immediate）”指令，但类型值被置成等于“阵列”所具有的作用是按照每个处理器程序计数器指定的地址将该处理器存信内容装入每个处理器的寄存器，并使其程序计数器在提取应增量;

一条“分支和链接（Branch and Link）”指令保存从处理器的程序计数器的指定的链寄存器，并将一个新地址重新装入程序计数器，这等效于在同一条指令中保存一个基址并重新装入它;以及

一条“返回（Return）”指令从处理器的其他寄存器之一取出基址重新装入程序计数器。

42、根据权利要求34的一个计算机系统，其特征在于操作手段包括修改处理程序计数器使其作为基址寄存器的指令，包括以“立即存（Store Immediate）”指令设置的程序，该指令是“立即装入”指令的逆指令，它允许SIMD方式处理器在存储时使用程序计数器作为基址寄存器。

43、根据权利要求31的一个计算机系统，其特征在于：该系统的指令集中提供了一条变换方式指令用于系统的操作手段中，该指令改变处理器的操作方式，使其按变换了的方式执行指令流中跟随变换方式指令的那些指令，这里，如果控制处理器提取一条变换方式指令，它指示其处理类型为“阵列”，那么在这种情况下控制处理器将忽略它，而其他方式的处理器将执行它并将它们的方式变换成MIMD方式。

44、根据权利要求43的一个计算机系统，其特征在于一条方式变换指令提供了一个用于开始执行的程序计数器值。

45、根据权利要求43的一个计算机系统，其特征在于：该变换指令使处理器程序计数器保持其原来的状态直至该指令允许每个其他处理器计算出它自己的起始程序地址。

46、根据权利要求31的一个计算机系统，其特征在于：通过逐条指令水平的动态变化，于是在MIMD方式中各处理器作为单个处理器，独立地或作为阵列的一部分，来进行指令提取。

47、根据权利要求46的一个计算机系统，其特征在于：指明方式类型为“局部”的指令使处理器接收该执令并执行该程序流，犹如他们不属于任何处理器组。

48、根据权利要求46的一个计算机系统，其特征在于：指明为“阵列”方式的指令能以多种方式与处理器组中的其他处理器共同操作。

49、根据权利要求46的一个计算机系统，其特征在于：对于“阵列”型指令，当该指令为装入（LOAD）工存储（STORE）时，它产生一个地址用作进入处理器互连网络的地址，而该处理器将暂停，甚至由该地址指定的处理器执行一条相反指令（对“存储”执行“装入”，对“装入”执行“存储”）并将执行存储指令的处理器的数据传送给执行装入指令的处理器。

50、根据权利要求46的一个计算机系统，其特征在于：处于阵列方式的一个处理器执行一条变换方式指令会使控制处理器之外的其他处理器在遇到这条指令时暂停，并使用该指令提供的地址作为回送给控制处理器的一个关键值，该控制处理器可能执行一个带有与那关键值匹配的“地址”的变换，从而使其他处理器脱离暂停状态并恢复跟踪控制处理器的指令。

51、根据权利要求1的一个计算机系统，其特征在于：操作手段的结构使可改变的处理器子集合能从MIMD方式跳入SIMD方式，然后，在程序列执行过程中原来为SIMD的处理器组内有可能（potentally）再返回MIMD方式。

52、根据权利要求51的一个计算机系统，其特征在于：当一个处理器集合在执行SIMD方式时其他处理器能保持其独立的MIMD方式。

53、根据权利要求1的一个计算机系统，其特征在于：利用互连网络传送广播信息，并将一个处理器组内的多个处理器子集合互连起来，从而使各处理器能在选择的基础上实现SIMD和MIMD操作，某些处理器运行SIMD而其他处理器运行MIMD。

54、根据权利要求1的一个计算机系统，其特征在于包括一个动态变换多级网络用于处理器互连，其中无阻塞转接选择路径选择处理器能作为一个主连系统的一部分被建立起来，允许在网络上选择具有所需资源的各种处理器组，并用它们运行能利用应用程序所需SIMD和MIMD优点的程序。

55、根据权利要求1的一个计算机系统，其特征在于：不只一个处理器能指定本身或被指定为该计算机系统处理器组中选定处理器的控制处理器，允许动态轮流作为控制处理器。

56、根据要求要求1的一个计算机系统，其特征在于：能由软件从网络的处理器动态地选出一个路径（route）处理器，在逐条指令基础上控制该路径控制处理器是哪一个。

57、根据权利要求1的一个计算机系统，其特征在于通过一个异步网络将系统的处理器的指令寄存器互连，使控制处理器能通过该互连网络指令传送到经由所述网络耦合的其他处理器指令寄存器。

58、根据权利要求1的一个计算机系统，其特征在于对每个处理器提供一个端口，通过这一端口传送一条指令，指令系统的每个节点处理器是否提取它们自己的指令或等待来自控制处理器的广播。

59、根据权利要求1的一个计算机系统，其特征在于：对不贩处理器能由软件完成通过互连网络指定控制处理器的动态轮流，这将允许由软件控制系统中哪一个处理器作为控制处理器，使任何处理器能在一个时刻以SIMD方式运行，这里，在所述时刻一个处理器作为控制器，而其后系统中另外某个处理器可能作为控制器，允许多个处理器向多个子集合广播，以提供在同一物理硬件运行的SIMD机器的多种任意组合，并且以相同的硬件也能运行MIMD处理。

60、根据权利要求1的一个计算机系统，其特征在于：如果一条指令标志为并行“阵列”指令，则处理单元直接执行这条指令，而且同一指令流也能在控制处理器中完成局部计算。

61、根据权利要求1的一个计算机系统，其特征在于处理器能通过执行带有MIMD方式值的动态变换方式指令使处理器释放回独立的MIMD方式。

62、根据权利要求1的一个计算机系统，其特征在于：每个处理器能独立操作且能在各方式间动态变换，允许在指令级周期处于SIMD方式的处理器去执行一个处理进程，然后以一条指令释放回MIMD方式，在这种方式执行该处理进程的每个处理器执行一条与其本身有关的路径，当所有这些处理器已完成有关路径执行时，它们被转换到SIMD方式。

63、根据权利要求1的一个计算机系统，其特征在于：每个处理器具有迅速变换成MIMD方式和从MIMD方式变换成其他方式的能力，甚至对固有的顺序计算在控制处理机上变换成SIMD方式的能力，这种能力使程序员或编译器为计算机系统建立的程序使用对应用程序最有意义的最佳并行操作类型SISD、SIMD、MIMD）。

64、根据权利要求1的一个计算机系统，其特征在于每个处理器能以同样的资源操作，而且在SIMD方式操作的所有处理器能在MIMD方式下操作。

65、根据权利要求1的一个计算机系统，其特征在于每个处理顺有一个“局部”和“阵列”指令执行设置。

66、根据权利要求1的一个计算机系统，其特征在于：当系统有一组处理器设置于SIMD方式操作时，一个特殊的控制处理器能进行指令提取，该指令能直接送到该组中其他每个处理器，如果该指令标记为一条并行指令，则所有这些处理器直接执行该指令。

67、根据权利要求1的一个计算机系统，其特征在于：当系统使程序的同一指令流能在一个主处理器上完成局部计算并在下一个周期使用其结果时，可由所有处理单元执行。