JPH0581224A - Parallel processor - Google Patents

Parallel processor

Info

Publication number
JPH0581224A
JPH0581224A JP3241095A JP24109591A JPH0581224A JP H0581224 A JPH0581224 A JP H0581224A JP 3241095 A JP3241095 A JP 3241095A JP 24109591 A JP24109591 A JP 24109591A JP H0581224 A JPH0581224 A JP H0581224A
Authority
JP
Japan
Prior art keywords
message
error
processor
data
transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3241095A
Other languages
Japanese (ja)
Inventor
Junji Nakakoshi
順二 中越
Naoki Hamanaka
直樹 濱中
Shigeo Takeuchi
茂雄 武内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi ULSI Engineering Corp
Hitachi Ltd
Original Assignee
Hitachi ULSI Engineering Corp
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi ULSI Engineering Corp, Hitachi Ltd filed Critical Hitachi ULSI Engineering Corp
Priority to JP3241095A priority Critical patent/JPH0581224A/en
Publication of JPH0581224A publication Critical patent/JPH0581224A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To efficiently drive plural jobs by reducing the network frozen due to a parity error during the transfer of a message through the network as less as possible. CONSTITUTION:This parallel processor is provided with a judging means 201 for judging information relating to routing in a message which is necessary for determining the route of the message in the network 101, and when a parity error is generated by the information relating to the routing in the message, the message is frozen as a machine check by the means 201. When a parity error is generated by information other than the information concerned in the message, no machine check is executed by the means 201 and the message is transferred to a receiving destination PE 102. The PE 102 executes the parity checks of all messages, and when a parity error is generated, executes machine check interruption.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は並列プロセッサに関わ
り、特にネットワークでメッセージ転送中にデータの誤
りが発生した場合の誤り制御に好適な並列プロセッサの
ネットワークに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel processor, and more particularly to a parallel processor network suitable for error control when a data error occurs during message transfer in a network.

【0002】[0002]

【従来の技術】従来、パリティによる誤り検出を含むデ
ータ構造の誤り制御については、萱島、”電子計算機の
方式設計”、第216ページから第218ページに論じ
られている。ここでは、データは全てバイトごとにパリ
ティをもって転送される。パリティチェックの論理は、
誤りの発生した箇所をできるだけ細かく識別可能にす
る、誤りが検出された時、再実行できるように必要なデ
ータが書き替えられる前にできるだけ、その誤りを検出
するなどを考慮して設定する。またパリティチェックの
結果はフリップフロップに保持し、誤りの状態をできる
だけ正確に保存する。また、この時、正常な論理への波
及を防ぐためにシステム全体のタイミングパルスを止め
る。この操作を凍結と呼ぶ。このタイミングパルスを止
めることにより、プロセッサの実行は凍結し、その凍結
された状態を記録として取り出し、誤り発生箇所の識別
に設ける。
2. Description of the Related Art Conventionally, error control of a data structure including error detection by parity is discussed in Kayashima, "System Design of Computers", pages 216 to 218. Here, all data is transferred with parity for each byte. The logic of parity check is
It should be set in consideration of making it possible to identify the location of the error as finely as possible and detecting the error as much as possible before rewriting the necessary data so that it can be re-executed when the error is detected. The result of the parity check is held in the flip-flop, and the error state is saved as accurately as possible. At this time, the timing pulse of the entire system is stopped to prevent the influence on the normal logic. This operation is called freezing. By stopping this timing pulse, the execution of the processor is frozen, the frozen state is taken out as a record, and it is provided for identifying the error occurrence location.

【0003】[0003]

【発明が解決しようとする課題】上記従来技術を並列プ
ロセッサのネットワークについて適用すると、パリティ
エラーの発生によりネットワーク全体を凍結するためネ
ットワークでのメッセージ転送が全くできなくなる。こ
れは、並列プロセッサが複数のプロセッシングエレメン
ト(以下PE)を任意のPE間でデータ転送可能なネッ
トワークに接続し、そのPE間で複数のジョブを実行可
能な構成であった場合、そのネットワークのエラーに直
接関係しない、即ちそのエラーの経路を使用しない、別
のジョブの実行に影響がでる。
When the above-mentioned conventional technique is applied to a network of parallel processors, the entire network is frozen due to the occurrence of a parity error, and message transfer in the network cannot be performed at all. This is because if a parallel processor connects multiple processing elements (hereinafter PE) to a network that can transfer data between arbitrary PEs and multiple jobs can be executed between the PEs, the network error will occur. Is not directly related to, that is, does not use the route of the error, it affects the execution of another job.

【0004】またネットワーク全体を凍結するのでな
く、パリティエラーが発生した箇所のみ凍結すると、ネ
ットワークが多段クロスバスイッチなどで構成されてお
り、かつ、そのエラー箇所の経路が他のメッセージ転送
で集中的に使用されていた場合には、凍結によりその前
段のスイッチの出力がつまり、その前段のスイッチの入
力が受け付けられなくなる。さらにその前段のスイッチ
の入力に接続されているスイッチの出力がつまることに
なり、最終的には、その経路に関係しないメッセージま
でが転送できなくなる。
If, instead of freezing the entire network, only the place where a parity error occurs is frozen, the network is composed of multistage crossbar switches and the route of the error place is concentrated in other message transfer. If it has been used, the output of the switch at the preceding stage is blocked due to freezing, and the input of the switch at the preceding stage cannot be accepted. Furthermore, the output of the switch connected to the input of the switch at the preceding stage is blocked, and eventually, even a message not related to the route cannot be transferred.

【0005】従来技術では上記の点について配慮がされ
ておらず、ネットワークでメッセージ転送中にパリティ
エラーが発生し、ネットワークが凍結すると、その経路
に関係しないメッセージまでが転送できなくなるという
問題があった。
In the prior art, no consideration has been given to the above points, and there is a problem in that when a parity error occurs during message transfer in the network and the network freezes, even messages unrelated to the route cannot be transferred. ..

【0006】本発明の目的は、ネットワークでメッセー
ジ転送中のパリティエラーによる凍結をできるだけ少な
くし、複数のジョブを効率よく動作させる並列プロセッ
サを提供することにある。
It is an object of the present invention to provide a parallel processor which minimizes freezing due to a parity error during message transfer in a network and operates a plurality of jobs efficiently.

【0007】[0007]

【課題を解決するための手段】上記目的はネットワーク
のメッセージ転送において、メッセージの全てのデータ
について誤り検出を行ない、その結果で凍結するのでな
く、ネットワークでメッセージの経路を決定するのに必
要な情報に誤りが発生した場合にだけ凍結することによ
り達成される。これは、この情報に誤りが生じるとメッ
セージの経路が正しく決定できず、全く関係のないPE
に転送され、誤動作を招くためである。一方、その情報
以外では誤りが生じてもメッセージの経路は正しく決定
できるため凍結を行なう必要はなく、そのまま受信PE
に転送してもよい。
The above object is to provide information necessary for determining the route of a message in the network, instead of performing error detection on all data of the message in the message transfer of the network and freezing as a result. This is achieved by freezing only if an error occurs in. This is because PEs that are completely irrelevant cannot be correctly routed if this information is incorrect.
This is because it is transferred to the computer and causes a malfunction. On the other hand, if there is an error other than that information, the route of the message can be correctly determined, so there is no need to freeze it.
May be forwarded to.

【0008】このため、ネットワーク内に転送されてき
たメッセージの誤りを検出する誤り検出手段と、メッセ
ージの全てのデータについて誤り検出結果を保持する保
持手段1と、誤り検出手段の結果を保持し、それが誤り
の場合は凍結することを示す指示手段2と、メッセージ
のルーティングに関係する情報が転送されたことを判別
し、保持手段2に誤り検出手段の結果をセットすること
を指示する判別手段を設ける。また各PEにはネットワ
ークと同じ誤り検出手段と保持手段1を設ける。
Therefore, the error detecting means for detecting an error in the message transferred in the network, the holding means 1 for holding the error detection result for all data of the message, and the result of the error detecting means are held, If it is an error, the instruction means 2 indicating that the message is frozen and the determination means that determines that the information relating to the routing of the message has been transferred and that instructs the holding means 2 to set the result of the error detecting means. To provide. Further, each PE is provided with the same error detecting means and holding means 1 as the network.

【0009】[0009]

【作用】ネットワークではメッセージが転送されてくる
と、判別手段によりメッセージのルーティングに関係す
る情報が転送されたことを判別する。ルーティングに関
係する情報が転送されている場合は、その情報について
誤り検出手段により誤りを検出し、その結果を保持手段
2で保持することを指示する。この保持手段2の出力が
誤りであることを示していると、それに関係する情報を
凍結する。誤りでないことを示していると何も動作はし
ない。またルーティングに関係する情報以外が転送され
ている場合では、その時の誤り検出手段の結果は保持手
段2には保持されない。またネットワークには凍結を行
なうか否かにかかわらず、メッセージの全てのデータに
ついて誤り検出を行ない、その結果を保持する保持手段
1により故障箇所の特定も従来通り行なえる。
When the message is transferred in the network, the determining means determines that the information related to the routing of the message has been transferred. When the information related to the routing is transferred, the error detecting means detects an error in the information and instructs the holding means 2 to hold the result. When the output of the holding means 2 indicates an error, the information related to it is frozen. If it is not wrong, no action is taken. When information other than routing-related information is transferred, the result of the error detecting means at that time is not held in the holding means 2. In addition, regardless of whether or not the network is frozen, error detection is performed on all data of the message, and the holding unit 1 that holds the result can specify the fault location as in the conventional case.

【0010】一方、各PEではメッセージが転送されて
くると、メッセージの全てのデータについて誤り検出手
段により誤りの検出を行ない、その結果を保持手段1に
保持する。この保持手段の出力が誤りが発生したことを
示す。
On the other hand, when a message is transferred to each PE, the error detecting means detects an error in all the data of the message and holds the result in the holding means 1. The output of this holding means indicates that an error has occurred.

【0011】これによりネットワークのメッセージ転送
中の誤りの検出において、メッセージの全てのデータに
ついて誤りによる凍結を行なうのでなく、ネットワーク
でメッセージの経路を決定するのに必要な情報について
だけ凍結を行なうことができる。
Thus, in detecting an error during the transfer of a message in the network, not all the data of the message is frozen due to the error, but only the information necessary for determining the route of the message in the network is frozen. it can.

【0012】[0012]

【実施例】以下、本発明の一実施例を図を用いて説明す
る。ここでの並列プロセッサは、複数のプロセッシング
エレメント(以下PE)が任意のPE間でデータ転送可
能なネットワークに接続され、そのPE間で複数のジョ
ブを実行可能な構成である。この並列プロセッサは、た
とえば図6に示すような構成であり、複数のPE10
2、PE間の任意のデータ転送を可能にするネットワー
ク101、ジョブの割当て、起動、終結などの制御を行
なうホスト103、およびネットワーク101、PE1
02、ホスト103の構成制御や保守/診断機能をサポ
ートするサービスプロセッサ(以下SVP)104によ
り構成される。
An embodiment of the present invention will be described below with reference to the drawings. The parallel processor here has a configuration in which a plurality of processing elements (hereinafter referred to as PEs) are connected to a network capable of data transfer between arbitrary PEs, and a plurality of jobs can be executed between the PEs. This parallel processor has, for example, a configuration as shown in FIG.
2. A network 101 that enables arbitrary data transfer between PEs, a host 103 that controls job allocation, activation, termination, etc., and network 101, PE1
02, a service processor (hereinafter referred to as SVP) 104 that supports the configuration control and maintenance / diagnosis functions of the host 103.

【0013】この並列プロセッサではユーザから依頼さ
れる複数のジョブを同時に並列処理可能である。このた
めホストでは、ユーザから依頼されるジョブを複数受け
付け、ジョブが割当てられてないPEや負荷が軽いPE
などに対して、ネットワーク101を介して、それらに
ジョブを割り当て、並列処理の実行を起動する。これに
より各PE102は並列処理の実行を開始する。各PE
102ではメモリがあり、他のPEとは独立に動作可能
である。またPE102間でデータ転送が必要な場合に
はネットワーク101を介してデータ転送を行なう。各
PE102は並列処理の実行が終了すると、ネットワー
ク101を介してホスト103にそれを伝える。ホスト
103では、そのジョブに関係する複数のPE102全
てから報告があった場合にユーザにジョブが終了したこ
とを伝える。またネットワークは多段クロスバスイッチ
など如何なる構成であってもよい。さらにホストはPE
と同じ構成であってもよい。一方、SVPはネットワー
ク101、PE102、ホスト103に対して専用パス
を用いて接続され、故障発生時にその状態を読み出し、
再実行の解析などを行なう。
This parallel processor can simultaneously process a plurality of jobs requested by the user in parallel. Therefore, the host accepts a plurality of jobs requested by the user, and PEs to which no jobs are assigned or PEs with a light load
For example, jobs are assigned to them via the network 101, and execution of parallel processing is started. As a result, each PE 102 starts execution of parallel processing. Each PE
102 has a memory and can operate independently of other PEs. When data transfer is required between the PEs 102, the data transfer is performed via the network 101. When each PE 102 finishes executing the parallel processing, it notifies the host 103 via the network 101. The host 103 notifies the user that the job has ended when all the plurality of PEs 102 related to the job report. Further, the network may have any configuration such as a multistage crossbar switch. Furthermore, the host is PE
The same configuration may be used. On the other hand, the SVP is connected to the network 101, the PE 102, and the host 103 using a dedicated path, and reads out the status when a failure occurs,
Perform analysis of re-execution.

【0014】次にメッセージの転送について説明する。
図4にPE間で転送される情報を示す。この情報は、こ
れを受け取るPEを表わす受信PE番号401、ネット
ワークの転送方法を表わす転送制御402、メッセージ
を送出したPEを表わす送信PE番号403、受信PE
に転送データ406が届いた時にその転送データ406
をPE102内のメモリに書き込むための転送データ格
納アドレス404、転送データ406の長さを示す転送
データ長405および転送データ406により構成され
る。ここでネットワークでこの情報の経路を決定するの
に必要なのは、受信PE番号401と転送制御402で
ある。
Next, message transfer will be described.
FIG. 4 shows information transferred between PEs. This information includes a reception PE number 401 indicating a PE that receives the information, a transfer control 402 indicating a network transfer method, a transmission PE number 403 indicating a PE that sent the message, and a reception PE.
When the transfer data 406 arrives at the transfer data 406
Of the transfer data storage address 404 for writing into the memory in the PE 102, the transfer data length 405 indicating the length of the transfer data 406, and the transfer data 406. Here, it is the reception PE number 401 and the transfer control 402 that are necessary to determine the route of this information in the network.

【0015】転送長が長くなるとこの情報の長さが実装
上の物理限界を越え、実現できないことがある。このた
め本実施例では、この情報を一定長、たとえば1又は複
数バイト単位に区切り、複数の部分メッセージとして転
送を行なう。図5はそのような部分メッセージ列を示
す。各部分メッセージは、メッセージ開始信号122、
メッセージ終了信号123、データ信号124およびデ
ータ誤り信号125の4つに分けられる。
If the transfer length becomes long, the length of this information may exceed the physical limit in mounting and may not be realized. For this reason, in this embodiment, this information is divided into units of a certain length, for example, one or a plurality of bytes, and transferred as a plurality of partial messages. FIG. 5 shows such a partial message sequence. Each partial message includes a message start signal 122,
It is divided into four, a message end signal 123, a data signal 124, and a data error signal 125.

【0016】メッセージ開始信号122は先頭の部分メ
ッセージの転送時に1になる。メッセージ終了信号12
3はメッセージを分割して転送した時最後の部分メッセ
ージの転送する時だけ1になる。データ誤り信号118
は、転送中の部分メッセージ内のデータ信号124に誤
りがあるか否かを示し、誤りが発生したとき1になる。
ここでメッセージは図4の左側から、即ち受信PE番号
401より転送が開始されるものとする。
The message start signal 122 becomes 1 when the top partial message is transferred. Message end signal 12
3 becomes 1 only when the last partial message is transferred when the message is divided and transferred. Data error signal 118
Indicates whether or not there is an error in the data signal 124 in the partial message being transferred, and becomes 1 when an error occurs.
Here, it is assumed that transfer of the message is started from the left side of FIG. 4, that is, from the reception PE number 401.

【0017】あるPE102より送出された部分メッセ
ージ列は、ネットワーク101が先頭の部分メッセージ
内の受信PE番号401又は転送制御402を用いて経
路を決定し、目的の受信PEに到着する。ここで転送制
御402はその部分メッセージ列を全てのPEに転送す
る(いわゆる、移送をする)か否かを示す情報やメッセ
ージの衝突があった場合の優先順位を決定する情報など
により構成される。部分メッセージ列が届いた受信PE
では、その部分メッセージ列内の転送データ406を転
送データ格納アドレス404に従いPE内のメモリに書
き込む。
The network 101 determines the route of the partial message sequence sent from a certain PE 102 using the reception PE number 401 or transfer control 402 in the first partial message, and arrives at the target reception PE. Here, the transfer control 402 is constituted by information indicating whether or not the partial message sequence is transferred to all PEs (so-called transfer), information for determining the priority order in the case of message collision, and the like. .. Receiving PE that received the partial message string
Then, the transfer data 406 in the partial message string is written to the memory in the PE according to the transfer data storage address 404.

【0018】以下では簡単化のために、部分メッセージ
群あるいは各部分メッセージをメッセージと呼ぶことが
ある。
In the following, for simplification, a partial message group or each partial message may be referred to as a message.

【0019】本実施例におけるネットワークはクロスバ
スイッチ、多段スイッチなど如何なる構成であってもよ
い。
The network in this embodiment may have any configuration such as a crossbar switch and a multistage switch.

【0020】図1にクロスバスイッチを用いたネットワ
ーク101の構成を示す。ネットワーク101は、ネッ
トワーク101に接続されるPE102などから送出さ
れるメッセージを一時保持し、そのメッセージをメッセ
ージ送信制御130の要求に応じて取り出しを行なうメ
ッセージ受信制御110および、そのメッセージの受信
PE番号401と転送制御402により自ポートへ出力
するかを決定し、各メッセージ受信制御110からの要
求の優先順位を決定し、各ポートにメッセージを送出す
るメッセージ送出制御130を各ポート対応に設け、さ
らに各メッセージ送出制御130がどのポートに接続さ
れているかを示すポート番号を保持するポート番号レジ
スタ140、SVP104とのインタフェースをとるS
VPアダプタ150、ネットワーク101全体の基本ク
ロックを生成する基本クロック生成回路160、および
各ポート対応に設けられ、基本クロック生成回路160
からクロックを入力し対応するポート内の回路にクロッ
クを分配するクロック分配回路161により構成され
る。
FIG. 1 shows the configuration of a network 101 using crossbar switches. The network 101 temporarily holds a message sent from the PE 102 or the like connected to the network 101, and extracts the message in response to a request from the message transmission control 130. The message reception control 110 and the reception PE number 401 of the message. And the transfer control 402 determine whether to output to its own port, determine the priority of the request from each message reception control 110, and provide a message transmission control 130 for transmitting a message to each port corresponding to each port. A port number register 140 that holds a port number indicating which port the message transmission control 130 is connected to, and an S that interfaces with the SVP 104
The VP adapter 150, the basic clock generation circuit 160 that generates the basic clock of the entire network 101, and the basic clock generation circuit 160 that is provided for each port.
The clock distribution circuit 161 receives the clock from the input port and distributes the clock to the circuit in the corresponding port.

【0021】メッセージ受信制御110は、メッセージ
を一時保持するバッファ111、バッファ111に保持
されたメッセージを読み出し、それをセットするための
セット条件信号をレジスタ113に送るバッファ読み出
し制御112、セット条件信号114をディレイさせて
記憶するディレイラッチ115、レジスタ113に保持
されたメッセージのパリティをチェックするパリティチ
ェック116、パリティチェック116の結果をパリテ
ィチェックセット条件回路201の指示により保持する
凍結指示ラッチ117、パリティチェック116の結果
をディレイラッチ115の指示により保持する故障箇所
ラッチ119および凍結指示ラッチ117の条件を作成
するパリティチェックセット条件回路201により構成
する。
The message reception control 110 reads a message held in the buffer 111, a buffer 111 for temporarily holding the message, and sends a set condition signal for setting the message to the register 113, and a set condition signal 114. A delay latch 115 for delaying and storing the data, a parity check 116 for checking the parity of the message held in the register 113, a freeze instruction latch 117 for holding the result of the parity check 116 according to an instruction from the parity check set condition circuit 201, a parity check The parity check set condition circuit 201 creates conditions for the failure point latch 119 and the freeze instruction latch 117 that hold the result of 116 according to the instruction of the delay latch 115.

【0022】このようなネットワークにおいて、まずメ
ッセージの転送手順について説明する。メッセージ受信
制御110ではバッファ読み出し制御112が、バッフ
ァ111から出力されるEMPTY信号120が0であ
ることを確認してリードストローブ121を送出し、バ
ッファ111に保持されたメッセージを読みだす。この
EMPTY信号120は、バッファ111に1個もデー
タが入ってない時は1で、それ以外は0である。バッフ
ァ111から読みだされたメッセージは、セット条件信
号114によりレジスタ113に保持される。レジスタ
113は、メッセージ開始信号122、メッセージ終了
信号123、データ信号124およびデータ誤り信号1
25に区別して保持される。
In such a network, a message transfer procedure will be described first. In the message reception control 110, the buffer read control 112 confirms that the EMPTY signal 120 output from the buffer 111 is 0, sends out the read strobe 121, and reads the message held in the buffer 111. The EMPTY signal 120 is 1 when no data is stored in the buffer 111, and is 0 otherwise. The message read from the buffer 111 is held in the register 113 by the set condition signal 114. The register 113 has a message start signal 122, a message end signal 123, a data signal 124 and a data error signal 1.
It is stored separately in 25.

【0023】メッセージ送出制御130では、プライオ
リティ制御131により各メッセージ受信制御110か
ら読みだされたメッセージ内の受信PE番号401とポ
ート番号レジスタ140内のポート番号とから、そのポ
ートへメッセージを送出するか否かを決定する。このメ
ッセージの送出では、各メッセージ受信制御110から
同時にメッセージが送出された時に各メッセージ受信制
御110間の送出順序をプライオリティ制御131が決
定し、セレクタ135により対応するメッセージを選択
し、送出先のPE内のバッファ(図示せず)にメッセー
ジを書き込む。ここでプライオリティ制御131はこの
バッファ(図示せず)から出力されるFULL信号13
2が0であることを確認して、ライトストローブ133
を送出し、送出先のバッファにメッセージを書き込む。
このFULL信号132は送出先バッファが一杯で1個
のデータも受け取れない時は1で、それ以外は0であ
る。またプライオリティ制御131では一回の送出でメ
ッセージの転送が終わらない場合、送り出すごとに信号
134により対応するバッファ読み出し制御112に対
してバッファ111から次のデータを読みだすことを指
示し、メッセージの転送を行なう。
In the message sending control 130, whether the message is sent to the port from the received PE number 401 in the message read from each message receiving control 110 by the priority control 131 and the port number in the port number register 140. Decide whether or not. In the transmission of this message, when the messages are simultaneously transmitted from the message reception controls 110, the priority control 131 determines the transmission order among the message reception controls 110, the corresponding message is selected by the selector 135, and the PE of the transmission destination is selected. Write the message to the internal buffer (not shown). Here, the priority control 131 is the FULL signal 13 output from this buffer (not shown).
Make sure that 2 is 0, then write strobe 133
To write a message to the destination buffer.
The FULL signal 132 is 1 when the destination buffer is full and cannot receive one data, and is 0 otherwise. Further, in the priority control 131, when the transfer of the message is not completed by sending the message once, each time the message is sent, the corresponding buffer read control 112 is instructed by the signal 134 to read the next data from the buffer 111, and the message is transferred. Do.

【0024】次にネットワークでの誤り制御について説
明する。バッファ読み出し制御112によりバッファ1
11から読みだされたメッセージは、レジスタ113に
保持される。このレジスタ113のデータ信号124の
内容は、パリティチェック116によりパリティがチェ
ックされる。パリティチェック116の結果は、凍結指
示ラッチ117の入力となる。凍結指示ラッチ117で
は、ネットワークでメッセージの経路を決定するのに必
要なメッセージの情報についてだけパリティチェックが
行なえるように、パリティチェックセット条件回路20
1の出力であるチェックラッチセット条件信号235が
セット条件になる。
Next, error control in the network will be described. Buffer 1 by buffer read control 112
The message read from 11 is held in the register 113. The parity of the content of the data signal 124 of the register 113 is checked by the parity check 116. The result of the parity check 116 is input to the freeze instruction latch 117. The freeze instruction latch 117 allows the parity check set condition circuit 20 so that the parity check can be performed only on the message information necessary for determining the message route in the network.
The check latch set condition signal 235 which is the output of 1 becomes the set condition.

【0025】このパリティチェックセット条件回路20
1を図2に示す。パリティチェックセット条件回路20
1は、レジスタ113(図1)に保持されたメッセージ
開始信号122、とセット条件信号114(図1)をデ
ィレイさせて記憶するディレイラッチ115(図1)か
らのビット条件ディレイ信号126を入力とし、カウン
タ回路202と条件生成回路203により構成する。カ
ウンタ回路202は、メッセージ開始信号122でセレ
クタ221により1が選択され、セット条件ディレイ信
号126をセット条件としてレジスタ222が1に初期
化される。それ以降、部分メッセージが順次送られてく
る、即ちレジスタ113にいずれかの部分メッセージが
セットされると、1づつメッセージカウンタ222が増
えていく。条件生成回路203では、ルーティングカウ
ンタ231とメッセージカウンタ222の内容が比較器
232により比較される。ここでルーティングカウンタ
231はネットワークでメッセージの経路を決定するの
に必要なメッセージの情報をデータ信号124にセット
される回数で表わし、メッセージの開始からいくつまで
続くかを示している。このルーティングカウンタ231
は、予めSVP104などによりセットアップされてい
る。比較器232の出力が1である時は、ネットワーク
でメッセージの経路を決定するのに必要なメッセージの
情報であることを示し、セット条件ディレイ信号126
をさらにディレイさせたディレイラッチ233とAND
がとられる。この時チェックラッチセット条件信号23
5が1となり、凍結指示ラッチ117にパリティチェッ
ク116の出力が保持される。比較器232の出力が0
である時はチェックラッチセット条件信号235が0と
なり、凍結指示ラッチ117には保持されない。
This parity check set condition circuit 20
1 is shown in FIG. Parity check set condition circuit 20
1 receives the message start signal 122 held in the register 113 (FIG. 1) and the bit condition delay signal 126 from the delay latch 115 (FIG. 1) that delays and stores the set condition signal 114 (FIG. 1). , A counter circuit 202 and a condition generation circuit 203. In the counter circuit 202, 1 is selected by the selector 221 by the message start signal 122, and the register 222 is initialized to 1 by using the set condition delay signal 126 as a set condition. After that, when partial messages are sequentially sent, that is, when any partial message is set in the register 113, the message counter 222 is incremented by one. In the condition generation circuit 203, the contents of the routing counter 231 and the message counter 222 are compared by the comparator 232. Here, the routing counter 231 represents the information of the message necessary for determining the route of the message in the network by the number of times set in the data signal 124, and indicates how many messages continue from the start. This routing counter 231
Has been set up in advance by the SVP 104 or the like. When the output of the comparator 232 is 1, it indicates that the message information is necessary for determining the route of the message in the network, and the set condition delay signal 126
AND with a delay latch 233 that delays
Is taken. At this time, the check latch set condition signal 23
5 becomes 1 and the output of the parity check 116 is held in the freeze instruction latch 117. The output of the comparator 232 is 0
If it is, the check latch set condition signal 235 becomes 0, and the freeze instruction latch 117 does not hold it.

【0026】メッセージの経路を決定するのに必要なメ
ッセージの情報にパリティエラーが発生すると、凍結指
示ラッチ117が1にセットされる。凍結指示ラッチ1
17の出力はSVPアダプタ150に接続され、SVP
アダプタ150からSVP104に対して故障発生の報
告がされる。また凍結指示ラッチ117が1にセットさ
れると、それに対応するポートのクロック分配回路16
1により、対応するポート内のクロックが停止し、その
ポートだけが凍結する。それ以外のポートは、通常通り
動作可能である。
The freeze indication latch 117 is set to 1 when a parity error occurs in the message information needed to route the message. Freezing instruction latch 1
The output of 17 is connected to the SVP adapter 150,
The adapter 150 reports a failure occurrence to the SVP 104. When the freeze instruction latch 117 is set to 1, the clock distribution circuit 16 of the corresponding port
A 1 stops the clock in the corresponding port and freezes only that port. The other ports can operate normally.

【0027】またパリティチェック116の結果は、故
障箇所ラッチ119の入力条件にもなる。故障箇所ラッ
チ119のセット条件は、メッセージの全てのデータ信
号124のパリティチェックが行なえるように、ディレ
イラッチ115の出力125である。故障箇所ラッチ1
19の入力は、メッセージの全てのデータ信号124の
パリティチェックを行ない、データ誤り信号125とパ
リティチェック116の結果をAND回路128で論理
積をとったものである。ここでAND回路128は、デ
ータ誤り信号128が0、即ち送信側から転送する時に
データ信号124に誤りがなかったことを示していると
きで、かつパリティチェック116でデータ信号124
に誤りが発生したときに1になる。これは送信側で転送
する場合に、既にデータ信号の誤りが検出されていると
きには、受信側で再び、誤りの検出を行なわないように
し、データの誤りを検出した箇所の特定を行なうための
ものである。また、このためにパリティチェック116
の結果127は、メッセージ送出制御130にも出力さ
れ、次の受信側にデータ誤り信号125を転送する。図
1の構成では送信側がPEであるため、送信時にデータ
のチェックを行なわないならば、データ誤り信号125
は常に0として送信してもよい。
The result of the parity check 116 also serves as an input condition for the fault location latch 119. The set condition of the failure point latch 119 is the output 125 of the delay latch 115 so that the parity check of all the data signals 124 of the message can be performed. Failure point latch 1
The input of 19 performs the parity check of all the data signals 124 of the message, and ANDs the results of the data error signal 125 and the parity check 116 by the AND circuit 128. Here, the AND circuit 128 indicates that the data error signal 128 is 0, that is, indicates that the data signal 124 has no error when the data is transferred from the transmitting side, and the parity check 116 performs the data signal 124.
It becomes 1 when an error occurs. This is to prevent the error from being detected again on the receiving side when the error is already detected on the transmitting side when the data is transmitted on the transmitting side, and to identify the location where the data error is detected. Is. Also, for this purpose, a parity check 116
The result 127 is also output to the message sending control 130, and the data error signal 125 is transferred to the next receiving side. In the configuration of FIG. 1, since the transmitting side is the PE, if the data is not checked at the time of transmission, the data error signal 125
May always be sent as 0.

【0028】また、メッセージの経路を決定するのに必
要なメッセージの情報がたとえば図5のように分割され
て送くられてくる場合は、メッセージ送出制御130内
の送出抑止回路136により、その経路情報が全て送く
られてくるまで、送出抑止回路136で保持し、受信側
へ送り出さないようにプライオリティ制御131が制御
する。経路情報が全て送られてきたか否かは、パリティ
チェックセット条件回路201の出力であるチェックラ
ッチセット条件信号235が1になっている間、経路情
報が送られていることを示しており、それにより判別す
ればよい。
When the message information necessary for determining the message route is sent in a divided manner as shown in FIG. 5, the route is controlled by the transmission inhibiting circuit 136 in the message transmission control 130. Until all the information is sent, the sending suppression circuit 136 holds it, and the priority control 131 controls it so as not to send it to the receiving side. Whether all the route information has been sent indicates that the route information is being sent while the check latch set condition signal 235, which is the output of the parity check set condition circuit 201, is 1. It may be determined by.

【0029】図8に、本発明を適用するネットワークの
他の例として2入力−2出力のクロスバスイッチ101
を用いた8入力−8出力のBenes網を示す。ここで
はホスト、SVPは図示していない。8入力−8出力の
Benes網では2入力−2出力のクロスバスイッチ1
01を合計20個用いて構成され、各クロスバスイッチ
101は図1のネットワークと入出力数が異なるだけ
で、それ以外は同じである。このようにパリティチェッ
ク(図ではPC)は各クロスバスイッチ101の入力に
設けられる。
FIG. 8 shows a 2-input-2 output crossbar switch 101 as another example of a network to which the present invention is applied.
8 shows an 8-input-8-output Benes network using the. The host and SVP are not shown here. 2-input-2 output crossbar switch 1 in 8-input-8-output Benes network
The crossbar switch 101 is the same as the network of FIG. 1 except that the number of inputs and outputs is different from that of the network of FIG. In this way, the parity check (PC in the figure) is provided at the input of each crossbar switch 101.

【0030】次に図1又は図8のネットワークとともに
用いるPEの構成を図3に示す。PE102は、ネット
ワーク101にメッセージを送出する送出装置301、
命令などの実行を行なうデータ処理装置302、ネット
ワーク101からメッセージを受信する受信装置30
3、命令やデータを格納するメモリ装置304、SVP
アダプタ305、PE102全体の基本クロックを生成
する基本クロック生成回路160、および各装置対応に
設けられ、基本クロック生成回路160からクロックを
入力し、対応する装置内の回路にクロックを分配するク
ロック分配回路161から構成される。送信装置301
はデータ処理装置302からの指示によりメモリ装置3
04からメッセージを構成するのに必要なデータをDM
A(ダイレクトメモリアクセス)コントローラ311に
より読みだされる。読みだされたデータは送信制御31
0によりメッセージに組み立てられネットワーク101
に送出される。
Next, FIG. 3 shows the structure of a PE used with the network of FIG. 1 or 8. The PE 102 is a transmission device 301 that transmits a message to the network 101.
A data processing device 302 for executing instructions and the like, and a receiving device 30 for receiving messages from the network 101.
3. Memory device 304 for storing instructions and data, SVP
A basic clock generation circuit 160 that generates a basic clock for the adapter 305 and the PE 102, and a clock distribution circuit that is provided for each device and that receives a clock from the basic clock generation circuit 160 and distributes the clock to the circuits in the corresponding device. 161. Transmitting device 301
Is a memory device 3 according to an instruction from the data processing device 302.
DM the data necessary to compose the message from 04
It is read by the A (direct memory access) controller 311. The read data is transmission control 31
Network 101 assembled into messages by 0
Sent to.

【0031】受信装置303はメッセージを一時保持す
るバッファ331、バッファ331に保持されたメッセ
ージを読み出し、それをレジスタ333にセットするバ
ッファ読み出し制御332、レジスタ333にセットす
るセット条件信号334をディレイさせて記憶するディ
レイラッチ335、レジスタ333に保持されたメッセ
ージのパリティをチェックするパリティチェック33
6、およびパリティチェック336の結果を保持するマ
シンチェックラッチ337により構成する。
The receiving device 303 delays the buffer 331 that temporarily holds the message, the buffer read control 332 that reads the message held in the buffer 331 and sets it in the register 333, and the set condition signal 334 that sets it in the register 333. Parity check 33 for checking the parity of the message held in the delay latch 335 and the register 333 to be stored
6 and a machine check latch 337 that holds the result of the parity check 336.

【0032】受信装置303ではバッファ読み出し制御
332が、バッファ331から出力されるEMPTY信
号340が0であることを確認してリードストローブ3
41を送出し、バッファ331に保持されたメッセージ
を読みだす。バッファ331から読みだされたメッセー
ジは、セット条件信号334によりレジスタ333に保
持される。レジスタ333は、メッセージ開始信号34
2、メッセージ終了信号343、データ信号344およ
びデータ誤り信号350に区別して保持する。メッセー
ジがレジスタ333に保持されると、DMAコントロー
ラ338がメッセージの内容に従い、メモリ装置304
に転送データを書き込む。またDMAコントローラ33
8は1回のレジスタ333の読み出しでメッセージ全て
の読み出しが終わらない場合、レジスタ333から読み
出すごとに信号345により対応するバッファ読み出し
制御332に対してバッファ331から次のデータを読
みだすことを指示する。さらにDMAコントローラ33
8は1個のメッセージの転送データをメモリ装置304
に書き終わるとデータ処理装置302にメッセージが届
いたことを知らせるために信号線346により割り込
む。
In the receiving device 303, the buffer read control 332 confirms that the EMPTY signal 340 output from the buffer 331 is 0, and the read strobe 3
41 is sent out, and the message held in the buffer 331 is read out. The message read from the buffer 331 is held in the register 333 by the set condition signal 334. The register 333 has a message start signal 34
2, the message end signal 343, the data signal 344, and the data error signal 350 are stored separately. When the message is held in the register 333, the DMA controller 338 follows the contents of the message and stores the memory device 304.
Write the transfer data to. In addition, the DMA controller 33
When the reading of all the messages is not completed by reading the register 333 once, the reference numeral 8 instructs the corresponding buffer read control 332 by the signal 345 to read the next data from the buffer 331 every time the reading of the message is completed. .. Further, the DMA controller 33
8 stores the transfer data of one message in the memory device 304
When the writing is completed, the data processing device 302 is interrupted by the signal line 346 to notify that the message has arrived.

【0033】次にPEでのメッセージ受信での誤り制御
について説明する。バッファ読み出し制御332により
バッファ331から読みだされたメッセージは、レジス
タ333に保持される。このレジスタ333のデータ信
号344の内容は、パリティチェック336によりパリ
ティがチェックされる。このパリティチェックの結果と
データ誤り信号350がOR回路339により論理和が
とられ、マシンチェックラッチ337の入力となる。こ
のマシンチェックラッチ117のセット条件はセット条
件信号334をディレイさせて記憶するディレイラッチ
335である。これにより、バッファ読み出し制御33
2からレジスタ333に読みだされるごとにメッセージ
のパリティチェックが行なわれる。このときメッセージ
の情報にパリティエラーが発生すると、マシンチェック
ラッチ337が1にセットされる。マシンチェックラッ
チ337の出力はデータ処理装置302に接続され、そ
れが1であるとマシンチェック割込み要因となり、デー
タ処理装置302にマシンチェック割込みが発生する。
データ処理装置302では、このマシンチェック割込み
を受け付け、割込み処理を行なう。この割込み処理によ
りSVPを介してホストに故障が発生したことを報告す
る。ホストでは、その報告に従い、関係するジョブを実
行するPE群に対して実行の停止を通知し、ジョブをキ
ャンセルする。またSVPでは、システムの再構成など
が行なわれる。さらに、このマシンチェックラッチ33
7の出力が1であると受信装置303はクロック分配回
路161によりクロックが停止し、凍結する。ただしバ
ッファ読みだし制御332はメッセージの受信を行なう
ように制御される。このとき、バッファ読みだし制御3
32は、データの誤りが発生したレジスタの内容を壊さ
ないために、バッファ331から読みだしたメッセージ
をレジスタ333にセットしないようにする。
Next, error control when a PE receives a message will be described. The message read from the buffer 331 by the buffer read control 332 is held in the register 333. The parity of the contents of the data signal 344 of the register 333 is checked by the parity check 336. The result of this parity check and the data error signal 350 are logically ORed by the OR circuit 339 and become the input to the machine check latch 337. The set condition of the machine check latch 117 is a delay latch 335 that delays and stores the set condition signal 334. As a result, the buffer read control 33
The parity check of the message is performed every time the data is read from 2 to the register 333. At this time, if a parity error occurs in the message information, the machine check latch 337 is set to 1. The output of the machine check latch 337 is connected to the data processing device 302, and if it is 1, it becomes a machine check interrupt factor and a machine check interrupt is generated in the data processing device 302.
The data processing device 302 accepts this machine check interrupt and performs interrupt processing. This interrupt processing reports that a failure has occurred in the host via the SVP. In accordance with the report, the host notifies the PE group executing the related job of the stop of the execution and cancels the job. In SVP, system reconfiguration is performed. Furthermore, this machine check latch 33
When the output of 7 is 1, the clock of the receiver 303 is stopped by the clock distribution circuit 161 and freezes. However, the buffer read control 332 is controlled to receive a message. At this time, buffer reading control 3
32 does not set the message read from the buffer 331 in the register 333 in order not to destroy the contents of the register in which a data error has occurred.

【0034】図1で説明したようにネットワーク101
には、各メッセージ送出制御130がどのポートに接続
されているかを示すポート番号を保持するポート番号レ
ジスタ140がある。このような構成制御情報は、ネッ
トワークを構成する上で、たとえば同一のLSIなどを
繰返し使用する場合に、それを区別するためなどに使用
され、予めSVPなどによりセットアップされており、
一旦セットされると変更されることは少ない。しかし、
たとえばポート番号レジスタ140のセットが誤ると、
メッセージは正しいのに、全く関係のないPEに転送さ
れ、誤動作を招く。このためPEにメッセージが正しく
届いたかチェックする機能が必要である。図7にその機
能を含んだPEの構成を示す。この機能はメッセージ比
較回路701により実現され、それ以外は図3で説明し
たPEと同じである。
Network 101 as described in FIG.
Has a port number register 140 that holds a port number indicating which port each message sending control 130 is connected to. Such configuration control information is used, for example, to distinguish the same LSI or the like repeatedly when configuring the network, and is set up in advance by SVP or the like.
Once set, it is unlikely to change. But,
For example, if the port number register 140 is set incorrectly,
Although the message is correct, it is transferred to a PE that has nothing to do with it, causing a malfunction. For this reason, it is necessary to have a function of checking whether the message has reached the PE correctly. FIG. 7 shows the configuration of the PE including that function. This function is realized by the message comparison circuit 701 and is otherwise the same as the PE described in FIG.

【0035】メッセージ比較回路701は、PEカウン
タ回路702とPE条件生成回路703により構成す
る。PEカウンタ回路702は、メッセージ開始信号3
42でセレクタ721により1が選択され、ディレイラ
ッチ355の出力をセット条件としてPEメッセージカ
ウンタ722が1に初期化される。それ以降レジスタ3
33にデータ信号344がセットされると、1づつPE
メッセージカウンタ722が増えていく。
The message comparison circuit 701 comprises a PE counter circuit 702 and a PE condition generation circuit 703. The PE counter circuit 702 receives the message start signal 3
At 42, the selector 721 selects 1 and the PE message counter 722 is initialized to 1 by using the output of the delay latch 355 as a set condition. After that register 3
When the data signal 344 is set to 33, PE
The message counter 722 increases.

【0036】PE条件生成回路703では、PEルーテ
ィングカウンタ731とPEメッセージカウンタ722
の内容がカウンタ比較器732により比較される。また
レジスタ333に保持されているデータ信号344と比
較データレジスタ733の内容がメッセージ比較器73
4で比較される。ここでPEルーティングカウンタ73
1は、メッセージ比較器734で比較データレジスタ7
33の内容と転送されてくるメッセージ内のどの情報と
を比較するかを示し、ネットワーク101のルーティン
グカウンタ231と同様に、データ信号344にセット
される回数で表わし、予めデータ処理装置302により
セットアップされている。また比較データレジスタ73
3は、メッセージの内容と比較する情報であり、予めデ
ータ処理装置302によりセットアップされている。メ
ッセージ比較器734は2つの入力が一致する時に1と
なり、その出力が外部割込みラッチ735の入力にな
る。カウンタ比較器732の出力が1、即ちPEルーテ
ィングカウンタ731とPEメッセージカウンタ722
の内容が等しい時は、その出力とセット条件信号334
をディレイさせて記憶するディレイラッチ335とAN
Dがとられ、外部割込みラッチ735のセット条件にな
る。外部割込みラッチ735が1になると、外部割込み
ラッチ735の出力がデータ処理装置302に接続され
ており、外部割込み要因となり、データ処理装置302
に外部割込みが発生する。
In the PE condition generation circuit 703, the PE routing counter 731 and the PE message counter 722 are used.
Are compared by the counter comparator 732. In addition, the contents of the data signal 344 held in the register 333 and the contents of the comparison data register 733 are the message comparator 73.
Compared in 4. PE routing counter 73
1 is the comparison data register 7 in the message comparator 734.
33 shows which information in the message to be transmitted is compared with the content of 33, and is represented by the number of times set in the data signal 344, similarly to the routing counter 231 of the network 101, and is set up in advance by the data processing device 302. ing. In addition, the comparison data register 73
Reference numeral 3 is information to be compared with the content of the message, which is set up in advance by the data processing device 302. The message comparator 734 becomes 1 when the two inputs match, and its output becomes the input of the external interrupt latch 735. The output of the counter comparator 732 is 1, that is, the PE routing counter 731 and the PE message counter 722.
When the contents of are equal, the output and the set condition signal 334
Delay latch 335 and AN for delaying and storing
D is taken and the external interrupt latch 735 is set. When the external interrupt latch 735 becomes 1, the output of the external interrupt latch 735 is connected to the data processing device 302, which causes an external interrupt and causes the data processing device 302 to operate.
An external interrupt occurs.

【0037】ポート番号レジスタ140のセット誤りを
チェックするためには、図4のメッセージフォーマット
の場合、データ処理装置302はPEルーティングカウ
ンタ731に1を、比較データレジスタ733に自PE
番号を設定すればよい。このような構成制御情報の設定
誤りの検出は、並列プロセッサの電源立ち上げ後、1度
だけ行なわれればよい。
In order to check the setting error of the port number register 140, in the case of the message format of FIG. 4, the data processing device 302 sets the PE routing counter 731 to 1 and the comparison data register 733 to its own PE.
Just set the number. Such a setting error in the configuration control information may be detected only once after the parallel processors are powered on.

【0038】さらに、このメッセージ比較回路701を
プログラムのPE間データ転送処理のデバッグにも有効
に使用可能である。これは、データ処理装置302が実
行するプログラムから任意にPEルーティングカウンタ
731、比較データレジスタ733が設定できるように
することにより可能になる。たとえば図4のメッセージ
フォーマットで、ある特定の送信PEからデータが転送
されてくることをチェックする場合、PEルーティング
カウンタ731に3を、比較データレジスタ733に送
信PE番号を設定すればよい。また、ある転送データを
受信する領域が書き込まれたことをチェックする場合、
PEルーティングカウンタ731に4を、比較データレ
ジスタ733に転送データ格納アドレスを設定すればよ
い。
Furthermore, the message comparison circuit 701 can be effectively used for debugging the data transfer processing between PEs of a program. This is possible by allowing the PE routing counter 731 and the comparison data register 733 to be arbitrarily set by the program executed by the data processing device 302. For example, in the message format of FIG. 4, when it is checked that data is transferred from a specific transmission PE, 3 is set in the PE routing counter 731 and the transmission PE number is set in the comparison data register 733. Also, when checking that the area that receives certain transfer data has been written,
4 may be set in the PE routing counter 731, and the transfer data storage address may be set in the comparison data register 733.

【0039】[0039]

【発明の効果】本発明によれば、ネットワークのメッセ
ージ転送中のパリティエラーの検出においてネットワー
クでメッセージの経路を決定するのに必要な情報につい
てだけパリティチェックを行ない、パリティエラーが発
生したとき凍結を行なうことができるので、メッセージ
転送中のパリティエラーによるネットワークの凍結をで
きるだけ少なし、並列プロセッサでの複数のジョブを効
率よく動作させることができる。
According to the present invention, in detecting a parity error during message transfer in a network, a parity check is performed only on information necessary for determining a message route in the network, and when a parity error occurs, it is frozen. Since it can be performed, network freeze due to a parity error during message transfer can be minimized, and a plurality of jobs in parallel processors can be efficiently operated.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による並列プロセッサに用いるネットワ
ークの一例を示す構成図
FIG. 1 is a configuration diagram showing an example of a network used for a parallel processor according to the present invention.

【図2】図1のネットワークに用いるパリティチェック
セット条件回路の一例を示す図
FIG. 2 is a diagram showing an example of a parity check set condition circuit used in the network of FIG.

【図3】図1のネットワークとともに用いるPEの一例
を示す構成図
FIG. 3 is a block diagram showing an example of a PE used with the network of FIG.

【図4】本実施例によるPE間の転送の情報を示す図FIG. 4 is a diagram showing information on transfer between PEs according to this embodiment.

【図5】図1のネットワークに用いる部分メッセージ列
を示す図
5 is a diagram showing a partial message string used in the network of FIG.

【図6】本発明による並列プロセッサの一実施例を示す
FIG. 6 is a diagram showing an embodiment of a parallel processor according to the present invention.

【図7】本発明による並列プロセッサに用いるPEの他
の実施例を示す構成図
FIG. 7 is a configuration diagram showing another embodiment of the PE used in the parallel processor according to the present invention.

【図8】本発明の並列プロセッサに用いる2入力−2出
力クロスバスイッチを用いたBenes網の構成図
FIG. 8 is a configuration diagram of a Benes network using a 2-input-2 output crossbar switch used in the parallel processor of the present invention.

【符号の説明】[Explanation of symbols]

101…ネットワーク、102…プロセッシングエレメ
ント、104…SVP、110…メッセージ受信制御、
117…凍結指示ラッチ、119…故障箇所ラッチ、1
22…メッセージ開始信号、123…メッセージ終了信
号、124…データ信号、125…データ誤り信号、1
30…メッセージ送信制御、140…ポート番号レジス
タ、150…SVPアダプタ、201…パリティチェッ
クセット条件回路、116…パリティチェック、401
…受信PE番号、402…転送制御、403…送信PE
番号、404…転送データ格納アドレス、405…転送
データ長、406…転送データ、235…チェックラッ
チセット条件信号、202…カウンタ回路、222…メ
ッセージカウンタ、203…条件生成回路、231…ル
ーティングカウンタ、232…比較器、337…マシン
チェックラッチ、701…メッセージ比較回路、702
…PEカウンタ回路、703…PE条件生成回路、72
2…PEメッセージカウンタ、731…PEルーティン
グカウンタ、732…カウンタ比較器、734…メッセ
ージ比較器、735…外部割込みラッチ。
101 ... Network, 102 ... Processing element, 104 ... SVP, 110 ... Message reception control,
117 ... Freezing instruction latch, 119 ... Failure point latch, 1
22 ... Message start signal, 123 ... Message end signal, 124 ... Data signal, 125 ... Data error signal, 1
30 ... Message transmission control, 140 ... Port number register, 150 ... SVP adapter, 201 ... Parity check set condition circuit, 116 ... Parity check, 401
... Receiving PE number, 402 ... Transfer control, 403 ... Sending PE
Number, 404 ... Transfer data storage address, 405 ... Transfer data length, 406 ... Transfer data, 235 ... Check latch set condition signal, 202 ... Counter circuit, 222 ... Message counter, 203 ... Condition generating circuit, 231 ... Routing counter, 232 Comparator, 337 Machine check latch, 701 Message comparison circuit, 702
... PE counter circuit, 703 ... PE condition generation circuit, 72
2 ... PE message counter, 731 ... PE routing counter, 732 ... Counter comparator, 734 ... Message comparator, 735 ... External interrupt latch.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 濱中 直樹 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 武内 茂雄 東京都小平市上水本町5丁目20番1号 日 立超エル・エス・アイ・エンジニアリング 株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Naoki Hamanaka 1-280, Higashi Koikekubo, Kokubunji, Tokyo Inside the Central Research Laboratory, Hitachi, Ltd. (72) Inventor Shigeo Takeuchi 5-2-1, Mizumizumotocho, Kodaira-shi, Tokyo Hitate Super LSI Engineering Co., Ltd.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】複数のプロセッサと、該プロセッサを接続
し、送信元のプロセッサから転送されてきたメッセージ
を用いて転送経路を決定し、送信先のプロセッサに該メ
ッセージを転送するデータ通信路からなる並列プロセッ
サにおいて、該データ通信路に、該メッセージ内の少く
とも転送経路決定情報の誤りを判別する手段と、該判別
手段により該メッセージの転送経路決定情報の誤りを検
出したとき該ネットワークを凍結し、該メッセージ内の
該転送経路情報以外の情報の誤りによっては該ネットワ
ークを凍結しない凍結手段を設けたことを特徴とする並
列プロセッサ。
1. A processor comprising a plurality of processors, a data communication path connecting the processors, determining a transfer route using a message transferred from a source processor, and transferring the message to a destination processor. In the parallel processor, a means for discriminating at least an error in transfer path determination information in the message on the data communication path, and freezing the network when the determination means detects an error in the transfer path determination information in the message. A parallel processor characterized by comprising a freezing means for freezing the network due to an error in information other than the transfer route information in the message.
【請求項2】該判別手段は該メッセージの転送経路決定
情報以外の情報の誤りも判別する手段であり、その誤り
を判別した時には、誤りが発生したことを示す信号を該
メッセージとともに送信先のプロセッサに転送する手段
を有することを特徴とする請求項1記載の並列プロセッ
サ。
2. The discriminating means is means for discriminating an error in information other than the transfer route determination information of the message, and when discriminating the error, a signal indicating that an error has occurred is sent to the destination of the message together with the message. The parallel processor according to claim 1, further comprising means for transferring to the processor.
【請求項3】複数のプロセッサと、送信元のプロセッサ
から転送されてきたメッセージを用いて転送経路を決定
し、送信先のプロセッサに該メッセージを転送するデー
タ通信路とからなる並列プロセッサにおいて、該データ
通信路に転送経路を決定するための該メッセージの誤り
を判別する手段と、該判別手段が該メッセージ内の転送
経路決定情報の誤りを判別した時には該メッセージの転
送を中止し該判別手段が該メッセージの転送経路決定情
報以外の誤りを判別した時には誤りが発生したことをメ
ッセージとともに、該第二のプロセッサに転送する手段
を有することを特徴とする並列プロセッサ。
3. A parallel processor comprising a plurality of processors and a data communication path for determining a transfer path using a message transferred from a source processor and transferring the message to a destination processor. A means for discriminating an error in the message for determining the transfer route in the data communication path; and when the discriminating means discriminates an error in the transfer route determining information in the message, the transfer of the message is stopped and the discriminating means A parallel processor characterized in that it has means for transferring to the second processor together with a message that an error has occurred when an error other than the transfer route determination information of the message is determined.
【請求項4】該判断手段により転送制御情報の誤りある
いはそれ以外の情報の誤りを検出したときには、それぞ
れの誤りを区分して、サービスプロセッサに通知する手
段をさらに有する請求項1記載の並列プロセッサ。
4. The parallel processor according to claim 1, further comprising means for classifying each error and notifying the service processor when an error in transfer control information or an error in other information is detected by the judging means. ..
【請求項5】該プロセッサは、該メッセージのデータ誤
りを検出する誤り検出手段と、該誤り検出手段が該メッ
セージの誤りを検出した時には、該プロセッサにデータ
の誤りを知らせる手段を有することを特徴とする請求項
3記載の並列プロセッサ。
5. The processor has error detecting means for detecting a data error in the message, and means for notifying the processor of a data error when the error detecting means detects an error in the message. The parallel processor according to claim 3.
【請求項6】複数のプロセッサと、該プロセッサ間でメ
ッセージの転送を行なうために該プロセッサを接続した
データ通信路からなる並列プロセッサにおいて、各プロ
セッサに、そのプロセッサにより設定した比較用データ
を保持する比較データ保持手段と、該データ通信路から
転送されてきたメッセージと該比較用データとを比較す
る手段と、該比較手段で一致したことを検出している時
は該プロセッサに割込みを起こす割込み手段を設けたこ
とを特徴とする並列プロセッサ。
6. A parallel processor comprising a plurality of processors and a data communication path connecting the processors to transfer messages between the processors, wherein each processor holds comparison data set by the processor. Comparison data holding means, means for comparing the message transferred from the data communication path with the comparison data, and interruption means for interrupting the processor when the comparison means detects a match A parallel processor characterized by being provided with.
【請求項7】該割込み手段は、該プロセッサから設定し
た比較タイミングのデータを保持する手段と、該データ
通信路からそのプロセッサに転送されてきたメッセージ
内の情報の数を数え、それと該比較タイミング保持手段
と比較し、一致した時に該比較手段の結果を該割込み要
因保持手段に保持することを指示する割込み要因セット
手段を有することを請求項6記載の並列プロセッサ。
7. The interrupt means counts the number of pieces of information in a message transferred from the data communication path to the processor by holding the comparison timing data set by the processor, and the comparison timing. 7. The parallel processor according to claim 6, further comprising an interrupt factor setting unit that compares the result of the comparing unit with the holding unit, and instructing to hold the result of the comparing unit in the interrupt factor holding unit.
【請求項8】該比較データ保持手段と該比較タイミング
保持手段は、プログラムから指定できることを特徴とす
る請求項7記載の並列プロセッサ。
8. The parallel processor according to claim 7, wherein the comparison data holding means and the comparison timing holding means can be designated by a program.
【請求項9】複数のプロセッサと、該プロセッサを接続
するデータ通信路からなる並列プロセッサにおいて、該
データ通信路内に、メッセージ内の転送経路決定情報の
誤りを判別する判別手段と、該判別手段により該メッセ
ージの転送経路決定情報の誤りを検出したときに、該デ
ータ通信路の内、そのメッセージの通過に関連する一部
の経路を選択的に凍結することを特徴とする並列プロセ
ッサ。
9. A parallel processor comprising a plurality of processors and a data communication path connecting the processors, a judgment means for judging an error in transfer path determination information in a message in the data communication path, and the judgment means. A parallel processor, characterized in that, when an error in the transfer route determination information of the message is detected by the above, a part of the route related to the passage of the message in the data communication path is selectively frozen.
JP3241095A 1991-09-20 1991-09-20 Parallel processor Withdrawn JPH0581224A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3241095A JPH0581224A (en) 1991-09-20 1991-09-20 Parallel processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3241095A JPH0581224A (en) 1991-09-20 1991-09-20 Parallel processor

Publications (1)

Publication Number Publication Date
JPH0581224A true JPH0581224A (en) 1993-04-02

Family

ID=17069215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3241095A Withdrawn JPH0581224A (en) 1991-09-20 1991-09-20 Parallel processor

Country Status (1)

Country Link
JP (1) JPH0581224A (en)

Similar Documents

Publication Publication Date Title
US5452443A (en) Multi-processor system with fault detection
US6886107B2 (en) Method and system for selecting a master controller in a redundant control plane having plural controllers
US5001712A (en) Diagnostic error injection for a synchronous bus system
US6415344B1 (en) System and method for on-chip communication
US5636341A (en) Fault processing method and information processing system
US4961140A (en) Apparatus and method for extending a parallel synchronous data and message bus
US6389554B1 (en) Concurrent write duplex device
US6038681A (en) Multi-array disk apparatus
JPH07262151A (en) Parallel processor system and packet abandoning method adapted to this system
US6549965B1 (en) Microcomputer with interrupt packets
JPH0581224A (en) Parallel processor
EP0953916A1 (en) Microcomputer chips with interconnected address and data paths
US7336657B2 (en) Inter-nodal data transfer system and data transfer apparatus
US6449670B1 (en) Microcomputer with bit packets for interrupts, control and memory access
US6397325B1 (en) Microcomputer with packet translation for event packets and memory access packets
JPH06325008A (en) Computer system provided with reset function
JPH08227406A (en) Parallel computer
EP0840222B1 (en) Microcomputer with debugging system
JP2001356881A (en) Multiplex storage controller
JPH1027115A (en) Fault information sampling circuit for computer system
JP3273191B2 (en) Data transfer device
EP1380954B1 (en) Computer system and data processing method
EP0959412A1 (en) Interrupt and control packets for a microcomputer
JPH05298193A (en) Memory access fault detecting circuit
KR970009755B1 (en) Frame address detector of high performance inter processor communication network node

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981203