KR0155266B1 - Fault tolerant computer system - Google Patents

Fault tolerant computer system

Info

Publication number
KR0155266B1
KR0155266B1 KR1019940024007A KR19940024007A KR0155266B1 KR 0155266 B1 KR0155266 B1 KR 0155266B1 KR 1019940024007 A KR1019940024007 A KR 1019940024007A KR 19940024007 A KR19940024007 A KR 19940024007A KR 0155266 B1 KR0155266 B1 KR 0155266B1
Authority
KR
South Korea
Prior art keywords
node
nodes
computer system
bus
multiprocessor computer
Prior art date
Application number
KR1019940024007A
Other languages
Korean (ko)
Other versions
KR960011739A (en
Inventor
이홍신
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019940024007A priority Critical patent/KR0155266B1/en
Publication of KR960011739A publication Critical patent/KR960011739A/en
Application granted granted Critical
Publication of KR0155266B1 publication Critical patent/KR0155266B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake

Abstract

본 발명은 병렬처리 컴퓨터 시스템 구성방법에 관한 것으로서, 특히 폴트-토울러런트 컴퓨터(fault tolerant computer) 시스템의 인터커넥션 네트워크를 구성하는 방법에 관한 것으로, 폴트-토울러런트 컴퓨터(fault tolerant computer) 시스템의 인터커넥션 네트워크(Interconnection Network)를 구성하는 방법에 있어서, 복수개의 노드로 구성되어 다면체 형태로 상호 인터페이스하는 노드그룹에 있어서 하나의 다면체의 각 꼭지점에 위치하는 N개(N은 자연수이며, 이하 동일함)의 노드와 상기 N개의 노드를 상호 인터페이스시키기 위해 상기 다면체의 내부에 위치한 노드를 포함하여 이웃하는 노드간에 직접 인터페이스하는 방법으로 노드간에 연결된 제1노드그룹을 구성하여 인터커넥션 네트워크를 구성하는 방법을 포함한다. 따라서, 본 발명은 노드간에 2개 이상의 채널을 채택하고 있으므로 결함허용능력(Fault Tolerancy)에의 신뢰성은 충분하며 또한, 각각의 노드마다 최대 24개의 채널로써 시스템의 확장성(Scalability)을 무한히 제공할 수 있고, 어느 하나의 특정 노드에 결함이 발생한다 하여도 복수개의 최단거리 경로를 갖추고 있어 인터커넥션 네트워크(IN)를 실현하는데 커다란 영향을 끼칠 수 없어 정상적인 대부분의 시스템을 가동하는데 방해용인이 될 수 없는 효과가 있다.The present invention relates to a method for constructing a parallel processing computer system, and more particularly, to a method for configuring an interconnection network of a fault-tolerant computer system, and to a fault-tolerant computer system. In a method of configuring an interconnection network of N, N nodes located at each vertex of one polyhedron in a node group composed of a plurality of nodes and interfacing in a polyhedral form (N is a natural number A first node group connected between nodes in a method of directly interfacing between neighboring nodes, including nodes located inside the polyhedron to interface the N nodes with the N nodes. It includes. Therefore, since the present invention adopts two or more channels between nodes, the reliability of Fault Tolerancy is sufficient, and it is possible to provide infinite scalability of the system with up to 24 channels for each node. In addition, even if one specific node fails, it has a plurality of shortest paths, so it cannot affect the realization of the interconnection network (IN) and thus cannot interfere with the operation of most normal systems. It works.

Description

멀티프로세서 컴퓨터 시스템Multiprocessor computer systems

제1a도는 밀결합(Tighty Coupled)방식을 채택한 종래의 컴퓨터 시스템을 설명하기 위한 도면이다.FIG. 1A is a diagram for explaining a conventional computer system employing a tightly coupled method.

제1b도는 제1a도의 구성을 지닌 복수의 시스템들이 결합한 상태를 설명하기 위한 도면이다.FIG. 1B is a diagram for describing a state in which a plurality of systems having the configuration of FIG. 1A are combined.

제2a도는 소결합(Loosely Coupled)방식에서 사용되는 종래의 노드 구성을 나타내는 도면이다.Figure 2a is a diagram showing a conventional node configuration used in the loosely coupled (Loosely Coupled) method.

제2b도는 제2a도에 도시된 복수개의 노드들로 구성된 소결합 방식의 멀티프로세서 컴퓨터 시스템을 설명하기 위한 도면이다.FIG. 2B is a diagram for explaining a small-combined multiprocessor computer system composed of a plurality of nodes shown in FIG. 2A.

제3도는 본 발명에 의한 노드의 구성을 나타내는 도면이다.3 is a diagram showing the configuration of a node according to the present invention.

제4a도는 제3도에 도시된 2개의 노드를 연결한 구조를 나타내는 도면이다.4A is a diagram illustrating a structure in which two nodes shown in FIG. 3 are connected.

제4b도는 제4a도를 간략히 표현하기 위한 도면이다.FIG. 4B is a diagram for briefly describing FIG. 4A.

제5도는 본 발명에 의한 레벨 0 구조의 상호연결망을 나타내는 도면이다.5 is a diagram illustrating an interconnection network of a level 0 structure according to the present invention.

제6도는 본 발명에 의한 레벨 1 구조의 상호연결망을 나타내는 도면이다.6 is a diagram illustrating an interconnection network of a level 1 structure according to the present invention.

제7도는 본 발명에 의한 레벨 2 구조의 상호연결망을 나타내는 도면이다.7 is a diagram illustrating an interconnection network of a level 2 structure according to the present invention.

제8도는 본 발명에 의한 레벨 3 구조의 상호연결망을 나타내는 도면이다.8 is a diagram illustrating an interconnection network of a level 3 structure according to the present invention.

본 발명은 멀티프로세서 컴퓨터 시스템에 관한 것으로서, 특히 폴트-토울러런트 특성을 갖는 멀티프로세서 컴퓨터 시스템(fault tolerant computer system)에 관한 것이다.The present invention relates to a multiprocessor computer system, and more particularly to a fault tolerant computer system having fault-tolerant characteristics.

각종의 정보 고속화가 요구됨에 따라 더욱 빠른 장애 허용(fault tolerant) 컴퓨터가 요구되고 있다. 이를 충족시키기 위하여 많은 방법들이 제안되고 있고, 여러 분야의 기술지류가 모여 이를 충족시켜주고자 하는 노력이 있다.As various information speedups are required, faster fault tolerant computers are required. Many methods have been proposed to meet this problem, and there are efforts to meet and meet technical branches of various fields.

또한, 그 기술지류의 한 분야인 폴트-토울러런트(Fault Tolerant) 시스템에서 시스템 퍼포먼스(system performance)를 향상시키기 위하여 보다 많은 CPU(중앙처리장치)들을 효율적으로 서로 연결시켜 처리능력을 높이려는 시도들이 있어 왔다. 여러 가지 방법들이 있지만 본 발명에서는 장애허용능력(Fault Tolerancy)을 보장함과 동시에 시스템의 확장(scalability)을 용이하게 할 수 있는 새로운 상호연결망(Interconnect Network) 방법을 사용한 확장성(scalability)있는 폴트-토울러런트 아키텍쳐(Fault Tolerant architecture)를 제안하고자 한다.It also attempts to increase throughput by efficiently interconnecting more CPUs in order to improve system performance in fault-tolerant systems, a branch of the technology branch. Have been. Although there are several methods, the present invention provides a scalable fault using a new interconnect network method that can facilitate fault scalability while ensuring fault tolerance. I would like to propose a Fault Tolerant architecture.

폴트-토울러런트(Fault Tolerant) 즉, 장애허용능력이란 어떠한 단일 이상현상(Fault)에도 시스템이 다운(down)되지 않도록 하는 정상적인 시스템 가동능력을 말한다. 이는 단일개의 채널이 아닌 2개 이상의 채널을 설치함으로써 이에 접근하고자 한다. 하나의 채널이 소정의 이유로 인하여 다운 되었다 하더라도 여분의 나머지 하나의 채널을 통신로로 사용할 수 있음에 기인한다. 또한, 동시에 2개의 채널이 다운된다 하더라도 다른 경로(path)를 사용하여 연결될 수 있어 그의 신뢰성은 상당히 높다 할 수 있다.Fault Tolerant, or Fault Tolerant, is the normal system operation that prevents the system from going down in the event of any single fault. This is approached by installing two or more channels instead of a single channel. Even if one channel is down for some reason, it is due to the fact that the remaining one channel can be used as a communication path. Also, even if two channels are simultaneously down, they can be connected using different paths, so that their reliability can be quite high.

이러한 폴트-토울러런트(Fault Tolerant)를 갖도록 하는 여러 시도중에 하나로서 지금까지 여러 상호 연결망(Interconnection Network)방법이 제안되고 있지만 대규모 병렬처리(Massively Parallel Processing)시스템의 경우 확장성(scalability)이 효율적으로 고려되지 못하였다.As one of several attempts to have such a fault tolerant, several interconnection network methods have been proposed so far, but the scalability is efficient in a massively parallel processing system. Was not considered.

밀결합(Tighty Coupled)방식을 사용한 경우에는 시스템의 확장성에 제한이 있었고, 소결합(Loosely Coupled)방식을 채택한 경우에는 한 노드 또는 하나의 경로(path)에 결함이 생기면 그에 따른 장애 노드가 제거된 상태로 동작하기 때문에 시스템 수행능력이 크게 떨어지게 된다.In the case of tightly coupled method, the scalability of the system was limited. In the case of the loosely coupled method, if one node or one path failed, the faulty node was removed. Because it operates in the state, system performance greatly decreases.

즉, 폴트-토울러런트(Fault Tolerant)를 가지며 시스템의 효율적인 확장성을 시도했던 종래의 방법들은 더욱 빠른 처리를 요구하는 대규모 병렬처리 시스템의 기대에 부응하지 못한 것이 사실이다.In other words, the conventional methods with fault tolerant and attempted efficient scalability of the system do not meet the expectations of large parallel processing systems that require faster processing.

따라서, 본 발명의 목적은 종래 기술의 문제점을 개선하기 위하여 안출된 것으로서, 폴트-토울러런트(Fault Tolerant)를 가지며 고정된 채널만을 가지고도 무한한 상호연결망(Interconnection Network)를 형성할 수 있는 멀티프로세서 컴퓨터 시스템을 제공하고자 한다.Accordingly, an object of the present invention is to solve the problems of the prior art, and has a fault-tolerant and a multiprocessor capable of forming an infinite interconnection network with only a fixed channel. To provide a computer system.

상술한 목적을 달성하기 위한 복수개의 노드들 및 상기 노드들간에 데이터 전송통로를 제공하는 상호연결망을 포함하여 구성된 본 발명에 의한 멀티프로세서 컴퓨터 시스템이 있어서, 상기 노드는 정보 전송을 위한 제1버스; 정보 전송을 위한 제2버스; 상기 제1버스 및 제2버스에 접속된 복수개의 연산소자; 상기 제1버스 및 제2버스에 접속된 복수개의 기억소자; 상기 제1버스 및 제2버스에 접속된 복수개의 입출력소자; 상기 제1버스에 접속되어 다른 노드와의 통신채널을 제공하는 제1네트워크간 통신소자; 및 상기 제2버스에 접속되어 다른 노드와의 통신 채널을 제공하는 제2네트워크간 통신소자를 구비하고, 상기 상호연결망은 정육면체 형태의 각 꼭지점과 내부에 상기 노드를 하나씩 위치시키고, 상기 정육면체 형태의 각 모서리에 의해 노드들을 연결하는 각각 한쌍의 통신채널 및 상기 정육면체 형태의 각 꼭지점에 위치한 노드들과 그 내부에 위치한 노드간의 8쌍의 통신채널을 구비함을 특징으로 한다.A multiprocessor computer system according to the present invention comprising a plurality of nodes for achieving the above object and an interconnection network for providing a data transmission path between the nodes, the node comprising: a first bus for transmitting information; A second bus for transmitting information; A plurality of computing elements connected to the first bus and the second bus; A plurality of memory elements connected to the first bus and the second bus; A plurality of input / output elements connected to the first bus and the second bus; A first inter-network communication element connected to the first bus to provide a communication channel with another node; And a second inter-network communication element connected to the second bus to provide a communication channel with another node, wherein the interconnection network places one node at each vertex of the cube shape and the inside of the cube shape. And a pair of communication channels connecting nodes by each corner and eight pairs of communication channels between nodes located at each vertex of the cube shape and nodes located therein.

이하, 첨부한 도면을 참조하여 본 발명을 보다 상세히 설명하고자 한다. 우선, 본 발명을 설명하기에 앞서 본 발명의 올바른 이해를 위해 통상적인 종래 기술에 대해 간략히 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail the present invention. First, prior to describing the present invention, a conventional prior art will be briefly described for a proper understanding of the present invention.

제1a도는 밀결합(Tighty Coupled)방식을 채택한 종래의 방법을 설명하기 위한 도면이다. 제1a도에 있어서, 참조부호 10은 복수개의 연산소자(Processing Element Module;이하 PE라 칭함)이고, 12는 복수개의 기억소자(Memory Element Module;이하 ME라 칭함)이고, 14는 복수개의 입출력소자(Input/Output Processing Module;이하 IOP라 칭함)이고, 16은 2개의 버스인터페이스소자(Bus Interface Module)이며, 2개의 버스(Bus) 즉, A버스와 B버스로써 상호간의 인터페이스를 수행하는 하나의 시스템을 구성한다.FIG. 1A is a diagram for explaining a conventional method employing a tightly coupled method. In FIG. 1A, reference numeral 10 denotes a plurality of processing element modules (hereinafter referred to as PE), 12 denotes a plurality of memory elements (hereinafter referred to as ME), and 14 denotes a plurality of input / output elements. (Input / Output Processing Module; hereinafter referred to as IOP), 16 are two bus interface devices, and two buses, namely, A bus and A bus, are used to interface with each other. Configure the system.

제1b도는 밀결합(Tighty Coupled)방식을 채택한 제1a도의 개개의 시스템들이 복수개를 형성하는 상태를 설명하기 위한 도면이다. 제1b도에 있어서, 참조부호 20, 22, 및 24는 상기 제1a도에서 보인 각각의 시스템1(20), 시스템2(22), 및 시스템n(24)이다. 도면에서 볼 수 있듯이 시스템1(20)과 시스템2(22)와의 인터페이스는 A버스와 B버스로 직접 연결되나, 시스템1(20)과 시스템n(24)는 시스템2(22)를 포함하여 많은 시스템을 거쳐야 연결된다. 2개의 버스를 이용하기 때문에 폴트-토울러런트(Fault Tolerant)는 충족할 수 있으나, 시스템의 확장성에는 많은 제한이 따르는 문제점을 갖고 있다.FIG. 1B is a view for explaining a state in which a plurality of individual systems in FIG. 1A employing a tightly coupled method are formed. In FIG. 1B, reference numerals 20, 22, and 24 denote respective system 1 20, system 2 22, and system n 24 shown in FIG. 1A. As can be seen in the drawing, the interface between system 1 (20) and system 2 (22) is directly connected to bus A and bus B, but system 1 (20) and system n (24) are not limited to system 2 (22). The connection is made through the system. Fault Tolerant can be satisfied by using two buses, but there are many limitations in the scalability of the system.

또 하나의 종래의 방법을 보자.Let's look at another conventional method.

제2a도는 소결합(Loosely Coupled)방식을 채택한 종래의 방법을 설명하기 위한 도면이다. 제2a도에 있어서, 참조부호 30은 제1a도에서 약술한 바와 같이 PE이고, 32는 ME, 이고, 34는 IOP이며, 로컬버스(Local Bus)로써 상호간의 인터페이스를 수행하는 하나의 노드(시스템)를 구성한다.Figure 2a is a view for explaining a conventional method adopting the loosely coupled (Loosely Coupled) method. In FIG. 2A, reference numeral 30 denotes a PE as outlined in FIG. 1A, 32 is ME, 34 is IOP, and a node (system) which performs an interface with each other as a local bus. ).

제2b도는 소결합(Loosely Coupled)방식을 채택한 제2a도의 개개의 노드(시스템)들이 복수개를 형성하는 상태를 설명하기 위한 도면이다. 제2b도에 있어서, 참조부호 40, 42, 및 44는 상기 제2a도에서 보인 각각의 노드1(40), 노드2(42), 및 노드n(44)이다. 도면에서 볼 수 있듯이 노드1(40)과 노드2(42) 및 노드n(44)의 상호간의 인터페이스는 원활히 이루어질 수 있다. 즉, 시스템의 확장성은 충족하고 있다. 그러나, 이 경우 한 노드에 결함이 발생하면 그에 따른 장애 노드가 제거된 상태로 동작하기 때문에 역시 시스템 수행능력이 크게 떨어지는 문제점이 있다.FIG. 2B is a diagram for explaining a state in which a plurality of individual nodes (systems) in FIG. 2A, which adopt a loosely coupled method, are formed. In FIG. 2B, reference numerals 40, 42, and 44 are each node 1 40, node 2 42, and node n 44 shown in FIG. 2A. As shown in the figure, the interface between the node 1 40, the node 2 42, and the node n 44 may be smoothly performed. In other words, the scalability of the system is met. However, in this case, when a fault occurs in one node, the faulty node is operated in a state in which the fault node is removed.

그러면, 상술한 바와 같이 도면을 참조하여 본 발명을 설명한다.Then, the present invention will be described with reference to the drawings as described above.

제3도는 하나의 노드(node)를 구성하는 가장 기본적인 구조를 갖는 본 발명에 따른 도면이다. 제3도에 있어서, 참조부호 50은 복수개의 PE이고, 52는 복수개의 ME이고, 54는 복수개의 IOP이고, 56은 12개의 채널을 각각 갖는 네트워크간 통신소자(Interconnect Network Communication Module; 이하 INC라 함)로서 INC X이고, 58은 12개의 채널을 갖는 INC Y이며, 2개의 버스(Bus) 즉, A Bus와 B Bus로써 상호간의 인터페이스를 수행하는 하나의 노드(시스템)를 구성한다.3 is a diagram according to the present invention having the most basic structure that constitutes a node. In FIG. 3, reference numeral 50 denotes a plurality of PEs, 52 denotes a plurality of MEs, 54 denotes a plurality of IOPs, and 56 denotes an Interconnect Network Communication Module having 12 channels, respectively. Is INC X, 58 is INC Y having 12 channels, and constitutes one node (system) that performs an interface between two buses, namely, A bus and B bus.

본 발명에서는 필요에 따라 여러 노드를 연결시켜 얼마든지 시스템 확장을 시킬 수 있다. 2개의 노드를 연결시켰을 경우를 제4a도에 도시하였다.In the present invention, the system can be expanded as much as necessary by connecting several nodes. The case where two nodes are connected is shown in FIG. 4A.

제4a도는 제3도와 같은 2개의 노드를 연결시켰을 경우를 보이는 도면이다. 설명의 편의상 상기 제4a도를 제4b도와 같이 도시하기로 한다. 노드간의 연결은 채널 X와 채널 Y가 항상 쌍으로 동시에 연결되며 하나의 채널에 이상이 발생하여도 다른 채널로 데이터 전송이 이루어 진다. 즉, 폴트-토울러런트(Fault Tolerant)를 갖고 있다.FIG. 4A is a diagram showing a case where two nodes as shown in FIG. 3 are connected. For convenience of description, FIG. 4A is shown as FIG. 4B. In the connection between nodes, channel X and channel Y are always connected in pairs at the same time, and data is transmitted to another channel even when one channel is abnormal. That is, it has a fault-tolerant.

제4a도의 채널 X와 채널 Y를 한데 묶어 제4b도에서 보이듯 하나로 표현하기로 한다. 이렇게 간단하게 표현하는 이유는 더욱 복잡한 상호연결망(IN)을 설명하기 위한 목적이 있다. 그러면, 고정된 개수의 채널만을 사용하여 상기 제3도와 같은 노드가 복수개로 무한히 연결될 수 있음을 보이고자 한다.Channel X and channel Y of FIG. 4a are grouped together to be expressed as one as shown in FIG. 4b. The reason for this simplicity is to explain the more complicated interconnection network (IN). Then, it will be shown that a plurality of nodes as shown in FIG. 3 can be infinitely connected using only a fixed number of channels.

제5도는 상호연결망을 구성하는 레벨 0구조를 나타내는 도면이다. 이는 제3도와 같은 노드가 9개 연결된 상태를 설명하기 위한 도면이다. 그러면, 제5도의 각각의 노드를 명명한다. 제5도에 있어서, 참조부호 60은 C(Center)이고, 62는 UN(Upper North)이고, 64는 UE(Upper East)이고, 66은 UW(Upper West)이고, 68은 US(Upper South)이고, 70은 LN(Lower North)이고, 72는 LE(Lower East)이고, 74는 LW(Lower West)이고, 76은 LS(Lower South)이다. 제5도에 있어서, 노드 C(60)는 다른 8개의 노드와 직접 인터페이스 가능하고, 노드 UN(62)의 경우는 노드 UE(64), 노드 UW(66), 노드 LN(70), 노드 C(60)와는 직접 인터페이스 가능하고, 그 외의 노드와는 하나의 노드를 거쳐 인터페이스 가능하다. 제5도와 같이 IN을 형성할 경우는 최대 8쌍의 채널이면 모든 노드와 인터페이스 가능하다. 그러면, 좀더 복잡한 IN을 형성할 경우를 보자.5 is a diagram illustrating a level 0 structure constituting an interconnection network. This is a view for explaining a state in which nine nodes as shown in FIG. Then, each node of FIG. 5 is named. In FIG. 5, reference numeral 60 is C (Center), 62 is Upper North (UN), 64 is Upper East (UE), 66 is Upper West (UW), and 68 is Upper South (US). 70 is Lower North (LN), 72 is Lower East (LE), 74 is Lower West (LW), and 76 is Lower South (LS). In FIG. 5, node C 60 can directly interface with eight other nodes, and in the case of node UN 62, node UE 64, node UW 66, node LN 70, node C. It is possible to interface directly with (60), and to interface with other nodes via one node. In the case of forming the IN as shown in FIG. Then, let's look at the case of forming a more complex IN.

제6도는 상호연결망(IN)을 구성하는 레벨1의 구조를 나타내는 도면이다. 이는 제3도와 같은 노드가 19개 연결된 상태를 설명하기 위한 도면이다. 그러면, 제6도의 각각의 노드를 명명한다.FIG. 6 is a diagram showing the structure of Level 1 constituting the interconnection network IN. This is a diagram for explaining a state in which 19 nodes as shown in FIG. 3 are connected. Then, each node of FIG. 6 is named.

제6도에 있어서, 참조부호 80은 노드 C이고, 82는 C/W/UN이고, 84는 C/E/UN이고, 86은 C/W/UE이며, 88은 C/E/UE이다. 나머지 노드의 명명은 설명의 간편성을 고려하여 생략하기로 한다. 즉, 제6도는 새로운 센터(C)를 중심으로 2개의 상기 제5도와 같은 구조가 좌우로 연결되어 있다. 이때 좌우에 있는 기본 구조의 센터(Center)는 새로운 센터(Center)에 대한 W(West)와 E(East)가 되어 각 노드에 대한 고유이름을 디렉토리 방식으로 명명하였다. 좌우의 각각 레벨0구조의 8개의 노드는 다음과 같이 서로 연결한다.In Fig. 6, reference numeral 80 is node C, 82 is C / W / UN, 84 is C / E / UN, 86 is C / W / UE, and 88 is C / E / UE. Naming of the remaining nodes will be omitted for simplicity. That is, in FIG. 6, two structures similar to those of FIG. 5 are connected to the left and right about the new center C. As shown in FIG. At this time, the center of the basic structure on the left and right became W (West) and E (East) for the new center, so that the unique name for each node was named in a directory manner. The eight nodes of each level 0 structure on the left and right sides are connected to each other as follows.

이 경우 노드 C(80)은 2쌍의 X, Y채널 즉, 4개의 채널이 필요하게 되고, 좌우 각각의 레벨0 구조의 노드 C(참조부호 명명하지 않음)는 9쌍의 X, Y채널 즉, 18개의 채널이 필요하게 되고, 노드 C/W/UN(82)는 5쌍의 X, Y채널 즉, 10개의 채널이 필요하다. 또한, 상기 노드 C/W/UN(82)와 같은 모서리에 위치하는 16개(상기 노드 C/W/UN(82)를 포함)의 각각의 노드들은 마찬가지로 5쌍의 X, Y채널 즉, 10개의 채널이 필요하다. 그러면, 더욱 복잡한 구조를 설명한다.In this case, the node C 80 needs two pairs of X and Y channels, that is, four channels, and the node C (not designated by reference numerals) of each level 0 structure on the left and right sides has nine pairs of X and Y channels. 18 channels are needed, and the node C / W / UN 82 needs 5 pairs of X and Y channels, that is, 10 channels. In addition, each of the 16 nodes (including the node C / W / UN 82) located at the same corner as the node C / W / UN 82 is similarly paired with 5 pairs of X and Y channels, that is, 10 Channels are required. The more complicated structure will then be described.

제7도는 상호연결망을 구성하는 레벨2의 구조를 나타내는 도면이다. 이는 제3도와 같은 노드가 37개 연결된 상태를 설명하기 위한 도면이다. 그러면, 제7도의 각각의 노드를 명명한다.FIG. 7 is a diagram illustrating a structure of Level 2 constituting an interconnection network. This is a diagram for explaining a state in which 37 nodes as shown in FIG. 3 are connected. Then, each node of FIG. 7 is named.

제7도에 있어서, 참조부호 90은 노드 C이고, 92는 C/N이고, 94는 C/N/UN이고, 96은 C/E/UN이며, 98은 C/W/UN이다. 설명의 간편성을 고려하여 나머지 노드들은 명명을 생략하겠다. 레벨2 구조에서는 노드 C(90)에서 가장 먼 노드들끼리 다음과 같이 서로 연결한다.In FIG. 7, reference numeral 90 is node C, 92 is C / N, 94 is C / N / UN, 96 is C / E / UN, and 98 is C / W / UN. For simplicity, the remaining nodes will be omitted. In the level 2 structure, the nodes farthest from the node C 90 are connected to each other as follows.

이 경우 노드 C(90)은 4쌍의 X, Y채널 즉, 8개의 채널이 필요하고, 노드 C/N(92)를 비롯하여 같은 위치의 C/E(참조부호 명명하지 않음), C/W(참조부호 명명하지 않음), 및 C/S(참조부호 명명하지 않음)는 11쌍의 X, Y채널 즉, 22개의 채널이 필요하고, 노드 C/N/UN(94)를 포함하는 32개의 각각의 노드들은 6쌍의 X, Y채널 즉, 12개의 채널이 필요하다.In this case, node C 90 needs four pairs of X and Y channels, i.e., eight channels, and C / E (not named) and C / W in the same location, including node C / N 92. (Not named), and C / S (not named) require 11 pairs of X, Y channels, or 22 channels, and 32 nodes including node C / N / UN 94. Each node needs six pairs of X and Y channels, or 12 channels.

그러면, 더욱 복잡한 구조를 보자.Let's look at a more complicated structure.

제8도는 상호연결망(IN)을 구성하는 레벨3의 구조를 나타내는 도면이다. 이는 제3도와 같은 노드가 73개 연결된 상태를 설명하기 위한 도면이다. 그러면, 제8도의 각각의 노드를 명명한다.8 is a diagram showing the structure of Level 3 constituting the interconnection network IN. This is a diagram for explaining a state in which 73 nodes as shown in FIG. 3 are connected. Then, each node of FIG. 8 is named.

제8도에 있어서, 참조부호 100은 노드 C이고, 102는 노드 C/UN이고, 104는 노드 C/UE이고, 106은 노드 C/UW이고, 108은 노드 C/US이고, 110은 노드 C/LN이고, 112는 노드 C/LE이고, 114는 노드 C/LW이고, 116은 노드 C/LS이고, 118은 노드 C/UN/UN이고, 120은 노드 C/UE/UN이고, 122는 노드 C/UW/UN이며, 124는 노드 C/LN/UN이다. 이하의 노드 명명은 생략한다. 또한, 서로간의 연결은 도면에서는 노드 C/UN/UN(118), 노드 C/UE/UN(120), 노드 C/UW/UN(122), 및 노드 C/LN/UN(124)만이 연결됨으로 보였지만, 이는 도면 파악의 용이성을 고려하여 다른 노드들간의 연결은 생략하였다. 제8도에 도시한 레벨3 구조의 경우, 노드 C(100)은 8쌍의 X, Y채널 즉, 16개의 채널이 필요하고, 노드 102, 104, 106, 108, 110, 112, 114 및 116은 12쌍의 X, Y채널 즉, 24개의 채널이 필요하고, 노드 118을 포함하는 64개의 노드는 7쌍의 X, Y채널 즉, 14개의 채널이 필요하다. 그러면, 지금까지 레벨 0구조부터 레벨3 구조까지 노드간의 인터페이스에 필요한 채널의 수를 살펴 보았다. 최대 24개의 채널을 갖는 노드들로 복잡한 노드간의 인터페이스를 가능하게 한다.In FIG. 8, reference numeral 100 is node C, 102 is node C / UN, 104 is node C / UE, 106 is node C / UW, 108 is node C / US, 110 is node C / LN, 112 is node C / LE, 114 is node C / LW, 116 is node C / LS, 118 is node C / UN / UN, 120 is node C / UE / UN, 122 is Node C / UW / UN, 124 is node C / LN / UN. The following naming of nodes is omitted. In addition, in the drawing, only nodes C / UN / UN 118, node C / UE / UN 120, node C / UW / UN 122, and node C / LN / UN 124 are connected to each other. Although shown, this connection is omitted between the nodes in consideration of the ease of drawing. For the level 3 structure shown in FIG. 8, node C 100 requires eight pairs of X, Y channels, or 16 channels, and nodes 102, 104, 106, 108, 110, 112, 114, and 116. Requires 12 pairs of X and Y channels, i.e., 24 channels, and 64 nodes including node 118 need 7 pairs of X and Y channels, i.e., 14 channels. So far, we have looked at the number of channels needed for the interface between nodes from level 0 structure to level 3 structure. Nodes with up to 24 channels enable complex inter-node interfaces.

그러면, 이보다 더욱 복잡한 상호연결망을 형성해야 하는 경우를 보자. 이는 다음과 같은 방법으로 실현시킬 수 있다.Let's look at a more complex interconnection network. This can be achieved in the following way.

제8도 전체의 상호연결망을 하나의 셀(cell)로 보고 제5도의 각각의 노드를 하나의 셀(cell)로 생각하여 상호연결망을 형성하는 방법이다. 또한, 더욱 방대한 상호연결망을 형성하고자 하면 마찬가지로 제8도 전체의 상호연결망을 하나의 셀(cell)로 보고 제6도의 각각의 노드를 하나의 셀(cell)로 생각하여 상호연결망을 형성하는 방법이다. 이런 식으로 상호연결망은 무한히 방대해질 수 있다. 단, 아무리 방대해지는 IN이라도 최대 24개의 채널이면 얼마든지 가능한 것이다. 또한, 노드간의 경로는 최단거리로 채택하면 되고 어느 하나의 노드에 결함이 발생한다 할지라도 최단거리의 경로는 유일한 것이 아닌 이유로 해서 이외의 신뢰성을 충분함이 명백하다.The interconnection network of FIG. 8 is regarded as a cell, and each node of FIG. 5 is considered as a cell, thereby forming an interconnection network. In addition, if a larger interconnection network is to be formed, likewise, the entire interconnection network of FIG. 8 is regarded as one cell, and each node of FIG. 6 is regarded as a cell. . In this way, the interconnection network can be infinitely large. However, even the largest IN can be any number of 24 channels. In addition, it is apparent that the path between nodes should be adopted as the shortest distance, and even if a fault occurs in any one node, the shortest path is sufficient for reasons other than the only reason.

상술한 바와 같이 구성한 본 발명은 노드간에 2개 이상의 채널을 채택하고 있으므로 장애허용능력(Fault Tolerancy)에의 신뢰성은 충분하며 또한, 각각의 노드마다 최대 24개의 채널로써 시스템의 확장성(scalability)을 무한히 제공할 수 있고, 어느 하나의 특정 노드에 결함이 발생한다 하여도 복수개의 최단거리경로를 갖추고 있어 상호연결망을 실현하는데 커다란 영향을 끼칠 수 없어 정상적인 대부분의 시스템을 가동하는데 방해요인이 될 수 없는 효과가 있다.Since the present invention configured as described above employs two or more channels between nodes, the reliability of fault tolerance is sufficient, and the maximum scalability of the system is infinitely increased by 24 channels for each node. Even if a particular node fails, it has multiple shortest paths, so it can't affect the realization of the interconnection network. There is.

Claims (3)

복수개의 노드들 및 상기 노드들간에 데이터 전송통로를 제공하는 상호연결망을 포함하여 구성된 본 발명에 의한 멀티프로세서 컴퓨터 시스템이 있어서, 상기 노드는 정보 전송을 위한 제1버스 및 제2버스; 상기 제1버스 및 제2버스에 접속된 복수개의 연산소자들; 상기 제1버스 및 제2버스에 접속된 복수개의 기억소자들; 상기 제1버스 및 제2버스에 접속된 복수개의 입출력소자들; 상기 제1버스에 접속되어 다른 노드와의 12개의 통신채널을 제공하는 제1네트워크간 통신소자; 및 상기 제2버스에 접속되어 다른 노드와의 12개의 통신 채널을 제공하는 제2네트워크간 통신소자를 구비하여, 외부 노드와의 관계에서 뿐만 아니라 내부적으로도 장애 발생시 상호 대체되도록 구성되고, 상기 상호연결망은 정육면체 형태의 각 꼭지점과 내부에 상기 노드를 하나씩 위치시키고, 상기 정육면체 형태의 각 모서리에 의해 노드들을 상기 제1네트워크간 통신소자 및 제2네트워크간 통신소자에 의해 상호 연결하는 각각 한쌍의 통신채널 및 상기 정육면체 형태의 각 꼭지점에 위치한 노드들과 그 내부에 위치한 노드간을 상기 제1네트워크간 통신소자 및 제2네트워크간 통신소자에 의해 상호 연결하는 8쌍의 통신채널을 구비함을 특징으로 하는 멀티프로세서 컴퓨터 시스템.A multiprocessor computer system according to the present invention comprising a plurality of nodes and an interconnection network for providing data transmission paths between the nodes, the node comprising: a first bus and a second bus for transmitting information; A plurality of computing elements connected to the first bus and the second bus; A plurality of storage devices connected to the first bus and the second bus; A plurality of input / output devices connected to the first bus and the second bus; A first inter-network communication element connected to the first bus and providing twelve communication channels with other nodes; And a second inter-network communication element connected to the second bus to provide twelve communication channels with other nodes, and configured to be interchanged when a failure occurs not only in relation to external nodes but also internally. The network connects each node of the cube-shaped vertex and the inside one by one pair, and each pair of communication interconnecting the nodes by the first inter-network communication device and the second inter-network communication device by each corner of the cube shape. And eight pairs of communication channels interconnecting nodes located at each vertex of the channel and the cube shape and nodes located therein by the first inter-network communication device and the second inter-network communication device. Multiprocessor computer system. 복수개의 노드들 및 상기 노드들간에 데이터 전송통로를 제공하는 상호연결망을 포함하여 구성된 멀티프로세서 컴퓨터 시스템이 있어서, 제1항의 멀티프로세서 컴퓨터 시스템과 동일한 구성의 제1노드그룹; 제1항에 멀티프로세서 컴퓨터 시스템과 동일한 구성의 제2노드그룹; 및 제1항에 멀티프로세서 컴퓨터 시스템에 포함된 노드와 동일한 구성의 중앙노드를 포함하고, 상기 중앙노드는 상기 제1노드그룹의 정육면체 형태의 내부에 위치한 노드 및 상기 제2노드그룹의 정육면체 형태의 내부에 위치한 노드와 접속되고, 상기 제1노드그룹의 정육면체 형태의 각 꼭지점에 위치한 노드들은 각각 제2노드그룹의 정육면체 형태의 대응하는 각 꼭지점에 위치한 노드들과 접속됨을 특징으로 하는 멀티프로세서 컴퓨터 시스템.A multiprocessor computer system comprising a plurality of nodes and an interconnection network providing a data transmission path between the nodes, the multiprocessor computer system comprising: a first node group having the same configuration as the multiprocessor computer system of claim 1; A second node group of the same configuration as the multiprocessor computer system; And a central node having the same configuration as a node included in the multiprocessor computer system, wherein the central node is located inside a cube shape of the first node group and a cube shape of the second node group. And a node located at each vertex of the cube shape of the first node group connected to a node located at each vertex of the cube shape of the second node group. . 복수개의 노드들 및 상기 노드들간에 데이터 전송통로를 제공하는 상호연결망을 포함하여 구성된 멀티프로세서 컴퓨터 시스템이 있어서, 상기 상호연결망은 정육면체 형태의 각 꼭지점에 제1항의 멀티프로세서 컴퓨터 시스템과 동일한 구성의 노드그룹을 위치시키고, 상기 정유면체 형태의 내부에는 제1항의 멀티프로세서 컴퓨터 시스템에 포함된 노드와 동일한 구성의 중앙노드를 위치시키고, 상기 정육면체 형태의 각 모서리에 의해 노드그룹들에 포함된 대응되는 노드들을 연결하는 각각 9쌍의 통신채널 및 각 노드그룹에 형성된 정육면체 형태 내부의 노드들과 상기 중앙 노드간의 8쌍의 통신채널을 구비함을 특징으로 하는 멀티프로세서 컴퓨터 시스템.A multiprocessor computer system comprising a plurality of nodes and an interconnection network providing a data transmission path between the nodes, the interconnection network having nodes having the same configuration as the multiprocessor computer system of claim 1 at each vertex in the form of a cube. Locate a group, and place a central node of the same configuration as the node included in the multiprocessor computer system of claim 1, and a corresponding node included in the node groups by each corner of the cube shape. And nine pairs of communication channels connecting each of the two channels, and eight pairs of communication channels between the nodes in the cube shape formed in each node group and the central node.
KR1019940024007A 1994-09-23 1994-09-23 Fault tolerant computer system KR0155266B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940024007A KR0155266B1 (en) 1994-09-23 1994-09-23 Fault tolerant computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940024007A KR0155266B1 (en) 1994-09-23 1994-09-23 Fault tolerant computer system

Publications (2)

Publication Number Publication Date
KR960011739A KR960011739A (en) 1996-04-20
KR0155266B1 true KR0155266B1 (en) 1998-11-16

Family

ID=19393338

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940024007A KR0155266B1 (en) 1994-09-23 1994-09-23 Fault tolerant computer system

Country Status (1)

Country Link
KR (1) KR0155266B1 (en)

Also Published As

Publication number Publication date
KR960011739A (en) 1996-04-20

Similar Documents

Publication Publication Date Title
US6504841B1 (en) Three-dimensional interconnection geometries for multi-stage switching networks using flexible ribbon cable connection between multiple planes
US10409766B2 (en) Computer subsystem and computer system with composite nodes in an interconnection structure
JP2647227B2 (en) Reconfigurable signal processor
US6243361B1 (en) Multistage interconnect network uses a master processor to perform dynamic configuration for all switch nodes based on a predetermined topology
US8433816B2 (en) Network topology for a scalable multiprocessor system
EP2549388A1 (en) Computer system
US5729756A (en) Torus networking method and apparatus having a switch for performing an I/O operation with an external device and changing torus size
US5669008A (en) Hierarchical fat hypercube architecture for parallel processing systems
US20130124597A1 (en) Node aggregation system for implementing symmetric multi-processing system
KR19980066621A (en) Expandable Interconnect Network
US8160061B2 (en) Redundant network shared switch
KR0155266B1 (en) Fault tolerant computer system
Khan et al. Rapid prototyping fault-tolerant heterogeneous digital signal processing systems
Ku et al. Systematic design of fault-tolerant multiprocessors with shared buses
KR0146562B1 (en) A processor connecting apparatus applied the scheme of hierachical crossbar switch at a parallel computer system
Das et al. Dynamically reconfigurable multi-transputer systems
Yang et al. Fault-tolerance on boolean n-cube architectures
Abdulla Reliability of modular fault-tolerant hypercube networks
Kung et al. A General Switch Architecture for Fault-Tolerant VLSI Processor Arrays
Cioffi Functional organization of MIMD machines
Jindal Simulation Analysis of Permutation Passibility behavior of Multi-stage Interconnection Networks A Thesis Report Submitted in the partial fulfillment of the requirements for the award of the degree of ME in Software Engineering
Streitz Transputers in Technical Applications
CA2016193A1 (en) Optimized interconnect networks

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060629

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee