JP5066978B2 - Information processing apparatus fault processing method and information processing apparatus - Google Patents

Information processing apparatus fault processing method and information processing apparatus Download PDF

Info

Publication number
JP5066978B2
JP5066978B2 JP2007092609A JP2007092609A JP5066978B2 JP 5066978 B2 JP5066978 B2 JP 5066978B2 JP 2007092609 A JP2007092609 A JP 2007092609A JP 2007092609 A JP2007092609 A JP 2007092609A JP 5066978 B2 JP5066978 B2 JP 5066978B2
Authority
JP
Japan
Prior art keywords
microprocessor
data
arithmetic processing
switching control
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007092609A
Other languages
Japanese (ja)
Other versions
JP2008250785A (en
Inventor
健一 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007092609A priority Critical patent/JP5066978B2/en
Publication of JP2008250785A publication Critical patent/JP2008250785A/en
Application granted granted Critical
Publication of JP5066978B2 publication Critical patent/JP5066978B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

本発明は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置において一部の演算処理ユニットのマイクロプロセッサに障害が生じた際に当該マイクロプロセッサの配下のメモリを利用するための情報処理装置の障害処理方法および情報処理装置自体の改良に関する。   The present invention relates to an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information and perform parallel arithmetic processing. The present invention relates to a failure processing method for an information processing apparatus and an improvement in the information processing apparatus itself for using a memory under the microprocessor when a failure occurs in a microprocessor of some arithmetic processing units.

マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置が既に公知である。   There is already known an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing. .

従来、この種の情報処理装置では一部の演算処理ユニットのマイクロプロセッサに障害が生じた際に、マイクロプロセッサのみならず、当該マイクロプロセッサの配下にあるメモリも同時に使用不能となる問題があった。 Conventionally, when the microprocessor of the processing unit of some of this kind of information processing apparatus failure occurs, not only the microprocessor, the memory also a problem of unusable simultaneously working under of the microprocessor It was.

メモリはマイクロプロセッサと同様に情報処理装置の価格に占める割合が大きく、実際には異常のないメモリが障害の生じたマイクロプロセッサと共に使用不能になることにはハードウェア資源の有効利用やコストパフォーマンスの観点から問題がある。   As with microprocessors, memory accounts for a large percentage of the price of information processing equipment. In fact, memory that is not abnormal cannot be used together with a failed microprocessor because of the effective use of hardware resources and cost performance. There is a problem from the point of view.

この種の問題に対処する技術としては、特許文献1に開示されるマルチプロセッサシステムのように、マイクロプロセッサとメモリを有する複数のプロセッサカードに対して1枚の予備プロセッサカードを設け、何れかのプロセッサカードに故障が生じた際に当該プロセッサカードの機能を予備プロセッサカードに全面的に引き継がせることで処理要求のコマンドの紛失を防止して処理を継続できるようにしたものが提案されている。
しかしながら、このマルチプロセッサシステムではプロセッサカードの機能を代替できる予備プロセッサカードが一枚だけであるため、複数のプロセッサカードに障害が生じた場合であっても、そのうちの1枚のプロセッサカードの機能を引き継げるに過ぎず、複数のプロセッサカードの障害に同時に対処することはできない。あるいは、複数のプロセッサカードの障害に対処すべく複数の予備プロセッサカードを設けるといったことも考えられるが、そうした場合、通常は使用しない予備プロセッサカードを同一システム上に何枚も配備しなければならず、コスト上の弊害が生じる。
As a technique for dealing with this type of problem, as in the multiprocessor system disclosed in Patent Document 1, one spare processor card is provided for a plurality of processor cards having a microprocessor and a memory. It has been proposed that when a failure occurs in a processor card, the function of the processor card is completely transferred to a spare processor card so that the processing request command can be prevented from being lost and the processing can be continued.
However, in this multiprocessor system, since only one spare processor card can replace the function of the processor card, even if a failure occurs in a plurality of processor cards, the function of one of the processor cards can be changed. It can only be taken over, and it cannot deal with failures of multiple processor cards at the same time. Alternatively, a plurality of spare processor cards may be provided to cope with failures of a plurality of processor cards. In such a case, however, a number of spare processor cards that are not normally used must be arranged on the same system. This causes cost problems.

国際公開W02004/079573号公報International Publication No. W02004 / 0779573

そこで、本発明の課題は、前記従来技術の不都合を改善し、情報処理装置の構造自体に大きな改変を加えることなく、また、格別なプロトコルを利用することなく、情報処理装置における演算処理ユニットの複数のマイクロプロセッサの障害の発生にも対処してマイクロプロセッサの配下のメモリを有効に利用することのできる情報処理装置の障害処理方法および情報処理装置を提供することにある。   Therefore, the problem of the present invention is to improve the inconveniences of the prior art, without greatly modifying the structure of the information processing apparatus itself, and without using a special protocol. An object of the present invention is to provide a failure processing method for an information processing apparatus and an information processing apparatus capable of coping with the occurrence of a failure of a plurality of microprocessors and effectively using a memory under the microprocessor.

本発明における情報処理装置の障害処理方法は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なう情報処理装置のマイクロプロセッサに障害が生じた際に当該マイクロプロセッサの配下のメモリを利用するための情報処理装置の障害処理方法であり、前記課題を達成するため、特に、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続しておき、
何れかのマイクロプロセッサに障害が生じた際に、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサのメモリのデータ転送を代行させ、
各データ切り替え制御部への転送データの入力元に応じ、当該データ切り替え制御部への転送データの入力元がメモリであって該データ切り替え制御部のマイクロプロセッサに障害が生じている場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するようにしたことを特徴とする構成を有する。
In the failure processing method for an information processing apparatus according to the present invention, a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing. A failure processing method for an information processing device for using a memory under the microprocessor when a failure occurs in the microprocessor of the information processing device to be performed.
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected so as to transmit information,
When a failure occurs in any of the microprocessors, the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor is selected to Delegate data transfer of the resulting microprocessor memory,
Depending on the input source of the transfer data to each data switching control unit, the transfer data input source to the data switching control unit is a memory and the microprocessor of the data switching control unit has a failure and the data When the transfer data input source to the switching control unit is a microprocessor and the destination address specification exceeds the normal physical address of the memory in the relevant processing unit, the destination processing unit and the destination type Is attached to the transfer data, while the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit Has a configuration characterized in that the header is deleted from the transfer data.

障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行させる構成、つまり、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。更に、仮想マッピング技術を利用することで、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。
また、マイクロプロセッサに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになるので、各データ切り替え制御部への転送データの入力元に応じ、データ切り替え制御部間でのデータ転送に必要とされる情報、すなわち、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを各データ切り替え制御部の内部処理で転送データに添付したり削除したりすることにより、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。
Acts as a proxy for data transfer to the memory under the failed microprocessor by selecting the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor In other words, among the microprocessors provided in each of the plurality of arithmetic processing units, a microprocessor that does not cause a failure is a configuration that performs data transfer of a memory under the failure of the microprocessor that has failed. Even if a special spare processor card or spare arithmetic processing unit is not redundantly provided, data transfer to the memory under the faulty microprocessor can be realized. Furthermore, by using the virtual mapping technology, a microprocessor without a failure can perform data transfer of the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed, and to transfer the data in the memory under the other microprocessor that has failed, so that there is a failure in two or more microprocessors. Even if it occurs, it is possible to realize data transfer of the memory under each microprocessor in which the failure has occurred.
In addition, when a failure occurs in the microprocessor, data is written to and read from the memory under the microprocessor in which the failure has occurred, and the data of the arithmetic processing unit having the microprocessor in which the failure has occurred is switched. Data switching control is performed according to the input source of the transfer data to each data switching control unit because it is performed via the control unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Information required for data transfer between copies, that is, headers that specify the processing unit of the transfer destination and the type of transfer destination are attached to or deleted from the transfer data by internal processing of each data switching control unit The protocol used to transfer data between the microprocessor and memory is itself Ku without changing, can be addressed to the data transfer memory under microprocessor occurring failures.

本発明における情報処理装置は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置であり、前記と同様の課題を達成するため、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続すると共に、
各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブルと、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶すると共に何れかのマイクロプロセッサに障害が生じた場合においては障害が生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして該マイクロプロセッサと演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブルとを備えたテーブル格納メモリを配備し、
前記各データ切り替え制御部には、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサの障害の有無を記憶する状態記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのメモリのデータ転送を代行すべきマイクロプロセッサを有する演算処理ユニットを記憶する転送代替マイクロプロセッサ記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶する転送代替ドメイン記憶レジスタと、当該データ切り替え制御部への転送データの入力元と前記状態記憶レジスタの状態を判定し、当該データ切り替え制御部への転送データの入力元がメモリであって前記状態記憶レジスタが障害を記憶している場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するデータ変換部とを設け、
何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、前記利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照して障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち前記利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させる一方、前記選択された演算処理ユニットの転送代替ドメイン記憶レジスタに前記障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させると共に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして前記利用済みゲートウェイ記憶テーブルを更新設定し、前記障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる運用状況更新設定手段を併設したことを特徴とする構成を有する。
The information processing apparatus according to the present invention includes a plurality of arithmetic processing units each including a combination of a microprocessor and a memory, and performs parallel arithmetic processing by connecting the microprocessors of the respective arithmetic processing units so that information can be transmitted. In order to achieve the same problem as described above,
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected to transmit information,
Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Stores the correspondence relationship between the gateway storage table, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit. When a failure occurs in one of the microprocessors, the correspondence relationship between the microprocessor and the arithmetic processing unit is assumed that the microprocessor in which the failure has occurred is acting as the data transfer for the memory in all other arithmetic processing units. Used gateway to remember Deploying a table storage memory and a 憶 table,
Each of the data switching control units includes a state storage register for storing the presence or absence of a failure of the microprocessor of the arithmetic processing unit provided with the data switching control unit, and a memory of the arithmetic processing unit provided with the data switching control unit A transfer alternative microprocessor storage register for storing an arithmetic processing unit having a microprocessor that should perform the data transfer of the data, and a microprocessor of the arithmetic processing unit provided with the data switching control unit should perform the data transfer of the memory The transfer alternative domain storage register that stores the arithmetic processing unit, the input source of the transfer data to the data switching control unit and the state of the state storage register are determined, and the input source of the transfer data to the data switching control unit is Memory and the state storage register indicates a fault. And when the transfer data input source to the data switching control unit is a microprocessor and the transfer destination address specification exceeds the normal physical address of the memory in the operation processing unit, While the header specifying the type of processing unit and transfer destination is attached to the transfer data, the input source of the transfer data to the data switching control unit is another data switching control unit, and the transfer destination is the data switching control unit. A data conversion unit that deletes the header from the transfer data when it is in the arithmetic processing unit,
When a failure occurs in the microprocessor of any of the arithmetic processing units, the arithmetic processing unit can refer to the available gateway storage table and the used gateway storage table to perform data transfer in the memory of the failed microprocessor. An arithmetic processing unit having a microprocessor not stored in the used gateway storage table is selected and stored in the transfer alternative microprocessor storage register of the data switching control unit of the failed microprocessor, while the selected The arithmetic processing unit having the failed microprocessor is stored in the transfer substitution domain storage register of the arithmetic processing unit, and the microprocessor of the selected arithmetic processing unit stores the data of the arithmetic processing unit. The data transfer of the memory of the arithmetic processing unit having the faulty microprocessor via the control unit, and the faulty microprocessor transfers the data of the memory in all other arithmetic processing units The used gateway storage table is updated and set as an agent, and operation status update setting means for storing the occurrence of the failure in the state storage register of the data switching control unit of the failed microprocessor is provided. It has the structure characterized by these.

以上の構成において、テーブル格納メモリ内の利用可能ゲートウェイ記憶テーブルに各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶させ、また、テーブル格納メモリ内の利用済みゲートウェイ記憶テーブルには、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶させておく。具体的には、データ切り替え制御部同士が相互に接続された演算処理ユニットのマイクロプロセッサの間でメモリのデータ転送の代行が可能である。データ切り替え制御部同士の接続の有無は情報処理装置の運用の前段階で明らかとなっているから、利用可能ゲートウェイ記憶テーブルの内容は予め設定しておくことができる。また、情報処理装置の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、テーブル格納メモリ内の利用済みゲートウェイ記憶テーブルは、演算処理ユニットのメモリのデータ転送を代行している演算処理ユニットは無いものとして初期設定される。
そして、何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、情報処理装置の運用状況更新設定手段が、テーブル格納メモリ内の利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照し、障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させ、また、選択された側の演算処理ユニットの転送代替ドメイン記憶レジスタには、障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させる。従って、障害を生じているマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部は、この演算処理ユニットのメモリのデータ転送をどの演算処理ユニットのマイクロプロセッサが代替しているかを認識することができ、また、選択された側の演算処理ユニットのデータ切り替え制御部は、この演算処理ユニットのマイクロプロセッサがどの演算処理ユニットのメモリのデータ転送を代替しているかを認識することができる。
情報処理装置の運用状況更新設定手段は、更に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして利用済みゲートウェイ記憶テーブルを更新設定し、障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる。
このようにして利用済みゲートウェイ記憶テーブルが更新設定される結果、その後、新たに別の演算処理ユニットのマイクロプロセッサに障害が生じたとしても、既に他の演算処理ユニットのメモリのデータ転送を代行しているマイクロプロセッサや其れ自体に障害の生じているマイクロプロセッサが障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行する対象として選択されることはなくなる。
一方、各演算処理ユニットのデータ切り替え制御部は、当該データ切り替え制御部への転送データの入力が確認される度に、当該転送データの入力元と状態記憶レジスタの状態を判定する。
そして、データ切り替え制御部への転送データの入力元がメモリであって状態記憶レジスタが障害を記憶している場合には、当該データ切り替え制御部のデータ変換部が、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する。つまり、データ切り替え制御部は各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられているのであるから、転送データの入力元がメモリであるということは配下のメモリから転送データが入力されていることを意味し、この際、当該データ切り替え制御部の状態記憶レジスタが障害の発生を記憶していれば、この演算処理ユニットのマイクロプロセッサに転送データを入力することはできないので、当該データ切り替え制御部のデータ変換部によって、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付した上で、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に転送する。具体的には、転送先の演算処理ユニットとしては当該データ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに其の時点で記憶されている演算処理ユニットを指定し、また、転送先のタイプとしてはマイクロプロセッサを指定することになる。
また、当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合にも、当該データ切り替え制御部のデータ変換部が、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付した上で、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に転送する。前述した通り、データ切り替え制御部は各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられているのであるから、転送データの入力元がマイクロプロセッサであるということは当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていないことを意味し、また、転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えているということは、この演算処理ユニットのマイクロプロセッサが仮想マッピング技術によって他の演算処理ユニットのマイクロプロセッサが行なうべきデータ転送を代替していることを意味するからである。具体的には、転送先の演算処理ユニットとしては当該データ切り替え制御部の転送代替ドメイン記憶レジスタに其の時点で記憶されている演算処理ユニットすなわち現時点で当該演算処理ユニットのマイクロプロセッサがデータ転送を代替しているマイクロプロセッサを有する演算処理ユニットを指定し、また、転送先のタイプとしてはメモリを指定することになる。
一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には、この転送データが最終的には当該演算処理ユニットのマイクロプロセッサもしくはメモリに入力されるものであって、この転送データに添付されたヘッダに記録された転送先のタイプによって其の宛先がマイクロプロセッサであるのかメモリであるのかは明らかであるから、当該データ切り替え制御部のデータ変換部は、転送データからヘッダを削除し、従来と同様にパケット変換を行い、この転送データを当該演算処理ユニットのマイクロプロセッサもしくはメモリに引き渡す。なお、この転送データの転送先が当該データ切り替え制御部の演算処理ユニット内にあるか否かについては、当初のヘッダに記録されている転送先の演算処理ユニットと当該データ切り替え制御部が配置されている演算処理ユニットとの関係に基いて判定可能である。当初のヘッダに記録されている転送先の演算処理ユニットと当該データ切り替え制御部が配置されている演算処理ユニットとが一致しない場合は、このデータ切り替え制御部を介して更に別のデータ切り替え制御部に当該データを転送する必要があることを意味するので、データ切り替え制御部のデータ変換部は、転送データからヘッダを削除する処理は行なわず、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に当該転送データをそのまま転送することになる。
以上に述べた通り、マイクロプロセッサに障害が生じた場合には、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになり、各データ切り替え制御部の間での転送データの受け渡しに際してのみ転送先の演算処理ユニットや転送先のタイプを指定するためのヘッダが利用されるに過ぎないから、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。
しかも、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。仮想マッピング技術を利用することで、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。
In the above configuration, the available gateway storage table in the table storage memory stores the microprocessor data of each arithmetic processing unit and the data in the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit. transfer stores the correspondence between the operation processing unit capable behalf, also, a table stored in the the used gateway storage table in the memory, the data switching control of the microprocessor and the microprocessor the processing unit of each processing unit The correspondence relationship with the arithmetic processing unit acting as a proxy for the data transfer of the memory via the unit is stored. Specifically, the data transfer of the memory can be performed between the microprocessors of the arithmetic processing units in which the data switching control units are mutually connected. Since the presence / absence of connection between the data switching control units has been clarified before the operation of the information processing apparatus, the contents of the usable gateway storage table can be set in advance. In addition, since there is no faulty microprocessor at the start of the operation of the information processing apparatus, the used gateway storage table in the table storage memory is an arithmetic process that performs the data transfer of the arithmetic processing unit memory. The unit is initially set as not present.
When a failure occurs in the microprocessor of any arithmetic processing unit, the operation status update setting unit of the information processing apparatus refers to the available gateway storage table and the used gateway storage table in the table storage memory, and The data switching control unit of the microprocessor in which a failure has occurred by selecting an arithmetic processing unit having a microprocessor that is not stored in the used gateway storage table from among the arithmetic processing units that can perform data transfer of the generated microprocessor memory The processing is stored in the transfer alternative microprocessor storage register, and the processing unit having the failed microprocessor is stored in the transfer replacement domain storage register of the selected processing unit. Therefore, the data switching control unit of the arithmetic processing unit having the failing microprocessor can recognize which arithmetic processing unit's microprocessor substitutes for the data transfer of the memory of this arithmetic processing unit, In addition, the data switching control unit of the selected arithmetic processing unit can recognize which arithmetic processing unit's memory data transfer is replaced by the microprocessor of the arithmetic processing unit.
The operation status update setting means of the information processing apparatus further includes a memory of the arithmetic processing unit in which the microprocessor of the selected arithmetic processing unit has the failed microprocessor via the data switching control unit of the arithmetic processing unit. In addition, the used gateway storage table is updated and set so that the failed microprocessor is acting as the data transfer for the memory in all other arithmetic processing units. The occurrence of the failure is stored in the state storage register of the data switching control unit of the microprocessor.
As a result of the updated setting of the used gateway storage table in this way, even if a failure occurs in the microprocessor of another processing unit after that, the data transfer of the memory of another processing unit is already performed. A microprocessor that has failed or a microprocessor that has failed itself is no longer selected as a proxy for data transfer in the memory of the arithmetic processing unit that has the failed microprocessor.
On the other hand, each time the transfer data input to the data switching control unit is confirmed, the data switching control unit of each arithmetic processing unit determines the input source of the transfer data and the state of the state storage register.
When the input source of the transfer data to the data switching control unit is a memory and the state storage register stores a failure, the data conversion unit of the data switching control unit Attach a header that specifies the type of transfer destination to the transfer data. That is, since the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit, the fact that the input source of the transfer data is the memory means that the transfer data is input from the subordinate memory. At this time, if the state storage register of the data switching control unit stores the occurrence of a failure, transfer data cannot be input to the microprocessor of the arithmetic processing unit. The data conversion unit of the control unit attaches a header specifying the transfer destination arithmetic processing unit and the transfer destination type to the transfer data, and then the data switching control unit of another arithmetic processing unit connected to the data switching control unit Forward to. Specifically, as the processing unit of the transfer destination, the processing unit stored at that time is designated in the transfer alternative microprocessor storage register of the data switching control unit, and the type of transfer destination is the micro processor. A processor will be specified.
In addition, even when the input source of the transfer data to the data switching control unit is a microprocessor and the address designation of the transfer destination exceeds the normal physical address of the memory in the arithmetic processing unit, the data switching control unit The data conversion unit attaches a header that specifies the processing unit of the transfer destination and the type of transfer destination to the transfer data, and then transfers it to the data switching control unit of another processing unit connected to the data switching control unit To do. As described above, since the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit, the fact that the input source of the transfer data is the microprocessor has the data switching control unit. This means that there is no failure in the microprocessor of the arithmetic processing unit, and that the address designation of the transfer destination exceeds the normal physical address of the memory in the arithmetic processing unit. This is because it means that the processor substitutes the data transfer to be performed by the microprocessor of another arithmetic processing unit by the virtual mapping technique. Specifically, as the processing unit of the transfer destination, the processing unit stored at that time in the transfer substitution domain storage register of the data switching control unit, that is, the microprocessor of the processing unit at this time transfers the data. An arithmetic processing unit having an alternative microprocessor is designated, and a memory is designated as the transfer destination type.
On the other hand, if the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit, this transfer data is finally Is input to the microprocessor or memory of the processing unit, and whether the destination is a microprocessor or a memory depending on the type of transfer destination recorded in the header attached to the transfer data. Since it is clear, the data conversion unit of the data switching control unit deletes the header from the transfer data, performs packet conversion in the same manner as before, and transfers the transfer data to the microprocessor or memory of the arithmetic processing unit. Whether or not the transfer destination of the transfer data is in the arithmetic processing unit of the data switching control unit includes the arithmetic processing unit of the transfer destination recorded in the initial header and the data switching control unit. It can be determined based on the relationship with the arithmetic processing unit. If the processing unit of the transfer destination recorded in the original header does not match the processing unit in which the data switching control unit is arranged, another data switching control unit is provided via this data switching control unit. The data conversion unit of the data switching control unit does not perform the process of deleting the header from the transfer data, and the other arithmetic processing unit connected to the data switching control unit. The transfer data is transferred as it is to the data switching control unit.
As described above, when a failure occurs in the microprocessor, the writing of data to the memory under the microprocessor in which the failure has occurred and the reading of data from the memory have the microprocessor in which the failure has occurred. Transfer data transfer between each data switching control unit is performed via the data switching control unit of the arithmetic processing unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Only the header used to specify the processing unit of the transfer destination and the type of the transfer destination is used at the time, so the protocol itself used for data transfer between the microprocessor and the memory is not changed at all. Deal with data transfer in the memory under the failing microprocessor Can.
In addition, among the microprocessors provided in each of the plurality of arithmetic processing units, a microprocessor in which no failure has occurred is configured to perform the data transfer of the memory under the failure of the microprocessor in which the failure has occurred. Even without redundantly arranging a processor card and a spare arithmetic processing unit, it is possible to realize data transfer to a memory under the microprocessor in which a failure has occurred. By using the virtual mapping technology, a microprocessor without a failure can perform data transfer of the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed and substitute the data transfer of the memory under the other microprocessor that has failed, so that two or more microprocessors have failed. Even in this case, it is possible to realize data transfer of the memory under each microprocessor in which the failure occurs.

情報処理装置の運用状況更新設定手段は、前記各演算処理ユニットと独立したマイクロプロセッサによって構成してもよいし、あるいは、情報処理装置のファームウェアによって構成してもよい。   The operation status update setting means of the information processing apparatus may be configured by a microprocessor independent of each arithmetic processing unit, or may be configured by firmware of the information processing apparatus.

本発明における情報処理装置の障害処理方法および情報処理装置は、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行させる構成、つまり、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。   The failure processing method and information processing apparatus of an information processing apparatus according to the present invention selects a microprocessor of an arithmetic processing unit having a data switching control unit connected to a data switching control unit of the arithmetic processing unit having the failed microprocessor. In other words, the configuration is such that the data transfer of the memory under the faulty microprocessor is substituted, that is, among the microprocessors provided in each of the plurality of processing units, the faultless microprocessor is the faulty microprocessor. Data transfer to the memory under the processor, so that data transfer to the memory under the faulty microprocessor can be performed without redundant provision of a special spare processor card or spare arithmetic processing unit. Can be realized.

更に、仮想マッピング技術を利用すれば、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。   Furthermore, if virtual mapping technology is used, a microprocessor in which no failure has occurred can transfer the data in the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed and substitute the data transfer of the memory under the other microprocessor that has failed, so that two or more microprocessors have failed. Even in such a case, it is possible to realize data transfer to the memory under each microprocessor in which a failure has occurred.

また、マイクロプロセッサに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになるので、各データ切り替え制御部への転送データの入力元に応じ、データ切り替え制御部間でのデータ転送に必要とされる情報、すなわち、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを各データ切り替え制御部の内部処理で転送データに添付したり削除したりすることにより、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。   In addition, when a failure occurs in the microprocessor, data is written to and read from the memory under the microprocessor in which the failure has occurred, and the data of the arithmetic processing unit having the microprocessor in which the failure has occurred is switched. Data switching control is performed according to the input source of the transfer data to each data switching control unit because it is performed via the control unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Information required for data transfer between copies, that is, headers that specify the processing unit of the transfer destination and the type of transfer destination are attached to or deleted from the transfer data by internal processing of each data switching control unit The protocol used to transfer data between the microprocessor and memory is itself Ku without changing, can be addressed to the data transfer memory under microprocessor occurring failures.

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。   Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.

図1は本発明の障害処理方法を適用した一実施形態の情報処理装置の構成の概略について示したブロック図である。   FIG. 1 is a block diagram showing an outline of a configuration of an information processing apparatus according to an embodiment to which a failure processing method of the present invention is applied.

情報処理装置1は、マイクロプロセッサとメモリの組み合わせからなる4組の演算処理ユニットを併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なう情報処理装置である。   The information processing apparatus 1 is an information processing apparatus that includes four arithmetic processing units each including a combination of a microprocessor and a memory, and performs parallel arithmetic processing by connecting the microprocessors of the respective arithmetic processing units so that information can be transmitted. is there.

4組の演算処理ユニットの構成は同等であるので、ここでは、1つの演算処理ユニット2aを取り上げて構造を説明する。演算処理ユニット2aは、1つのマイクロプロセッサ3aと4つのメモリ(Dual Inline Memory Module)4a,5a,6a,7aを備え、マイクロプロセッサ3aとメモリ4aとの間に、情報伝達経路を切り替えるためのデータ切り替え制御部8aが設けられている。   Since the four sets of arithmetic processing units have the same configuration, the structure will be described here by taking up one arithmetic processing unit 2a. The arithmetic processing unit 2a includes one microprocessor 3a and four memories (Dual Inline Memory Modules) 4a, 5a, 6a, 7a, and data for switching an information transmission path between the microprocessor 3a and the memory 4a. A switching control unit 8a is provided.

他の3つの演算処理ユニット2b,2c,2dに関しても其の構成は演算処理ユニット2aと同等であり、このうち、演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されている。   The configuration of the other three arithmetic processing units 2b, 2c, and 2d is the same as that of the arithmetic processing unit 2a. Among them, the data switching control unit 8a of the arithmetic processing unit 2a and the data switching control unit of the arithmetic processing unit 2b 8b, and the data switching control unit 8c of the arithmetic processing unit 2c and the data switching control unit 8d of the arithmetic processing unit 2d are connected so as to be able to transmit information.

また、各演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dは、並列的な演算処理を行なう関係上、その全てが情報伝達可能に接続されている。   Further, the microprocessors 3a, 3b, 3c, 3d of the respective arithmetic processing units 2a, 2b, 2c, 2d are all connected so as to be able to transmit information because of the parallel arithmetic processing.

次に、この実施形態に固有の構成要素であるデータ切り替え制御部8a,8b,8c,8dの構成について、データ切り替え制御部8aを例にとって図2の機能ブロック図を参照して説明する。   Next, the configuration of the data switching control units 8a, 8b, 8c, and 8d, which are components unique to this embodiment, will be described with reference to the functional block diagram of FIG. 2 taking the data switching control unit 8a as an example.

データ切り替え制御部8aには、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aの障害の有無を記憶するための状態記憶レジスタ9と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aに障害が生じた際に此の演算処理ユニット2aに設けられているメモリ4a,5a,6a,7aのデータ転送を代行させるべき演算処理ユニットを記憶させるための転送代替マイクロプロセッサ記憶レジスタ10と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶するための転送代替ドメイン記憶レジスタ11と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aの番号をドメイン名として記憶するための自己ドメイン記憶レジスタ12と、当該データ切り替え制御部8aが設けられた演算処理ユニット2a内に実装可能なメモリの最大接続数を記憶するための接続メモリ数記憶レジスタ13と、出力先切り替えスイッチ14と、データ変換部15、更には、ルーティングテーブル22が備えられている。   The data switching control unit 8a is provided with a state storage register 9 for storing the presence or absence of a failure of the microprocessor 3a of the arithmetic processing unit 2a provided with the data switching control unit 8a, and the data switching control unit 8a. When a failure occurs in the microprocessor 3a of the arithmetic processing unit 2a, the arithmetic processing unit for storing the data transfer of the memories 4a, 5a, 6a, 7a provided in the arithmetic processing unit 2a is stored. Transfer alternative domain storage for storing the transfer alternative microprocessor storage register 10 and other arithmetic processing units in which the microprocessor 3a of the arithmetic processing unit 2a provided with the data switching control unit 8a should perform the data transfer of the memory The register 11 and the data switching control unit 8a are provided. In order to store the self-domain storage register 12 for storing the number of the arithmetic processing unit 2a as a domain name and the maximum number of memory connections that can be mounted in the arithmetic processing unit 2a provided with the data switching control unit 8a. Connection memory number storage register 13, output destination changeover switch 14, data converter 15, and routing table 22.

なお、演算処理ユニット2a内にはメモリ4a,5a,6a,7aの4個のメモリが設けられているが、最初のメモリ4aに相当する値を0として規定しているので、接続メモリ数記憶レジスタ13に実際に記憶される最大接続メモリ数の値は「3」である。   The arithmetic processing unit 2a is provided with four memories 4a, 5a, 6a, and 7a. Since the value corresponding to the first memory 4a is defined as 0, the number of connected memories is stored. The value of the maximum number of connected memories actually stored in the register 13 is “3”.

出力先切り替えスイッチ14は、当該データ切り替え制御部8aが設けられた演算処理ユニット2a内においてマイクロプロセッサ3aとメモリ4aとを接続する情報伝達経路と、メモリ4aもしくはマイクロプロセッサ3aの何れか一方と他の演算処理ユニット2bのデータ切り替え制御部8bとを接続する情報伝達経路と、メモリ4aもしくはマイクロプロセッサ3aの何れか一方と更に他の演算処理ユニットのデータ切り替え制御部とを接続する情報伝達経路の中から何れかの情報伝達経路を選択的に閉成するためのスイッチである。   The output destination changeover switch 14 includes an information transmission path for connecting the microprocessor 3a and the memory 4a in the arithmetic processing unit 2a provided with the data changeover control unit 8a, one of the memory 4a and the microprocessor 3a, and the other. An information transmission path for connecting the data switching control unit 8b of the arithmetic processing unit 2b and an information transmission path for connecting either the memory 4a or the microprocessor 3a and a data switching control unit of another arithmetic processing unit. This is a switch for selectively closing one of the information transmission paths from the inside.

また、データ変換部15は、転送データのパケット変換を行うほか、出力先切り替えスイッチ14を介してデータ切り替え制御部8aに入出力される転送データに対して転送先となる演算処理ユニットや転送先のタイプ(メモリもしくはマイクロプロセッサの何れか)を指定するヘッダを添付したり削除したりする機能を備える。
具体的には、当該データ切り替え制御部8aへの転送データの入力元と当該データ切り替え制御部8aの状態記憶レジスタ9の状態を判定し、当該データ切り替え制御部8aへの転送データの入力元がメモリ4a,5a,6a,7aであって状態記憶レジスタ9が障害を記憶している場合と当該データ切り替え制御部8aへの転送データの入力元がマイクロプロセッサ3aであって転送先のアドレス指定が当該演算処理ユニット2aにおけるメモリの正規の物理アドレス(接続メモリ数の値としては3)を超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付して他のデータ切り替え制御部(図1および図2の例ではデータ切り替え制御部8b)に転送する一方、当該データ切り替え制御部8aへの転送データの入力元が他のデータ切り替え制御部(図1および図2の例ではデータ切り替え制御部8b)であって転送先が当該データ切り替え制御部8aの演算処理ユニット2a内にある場合つまりヘッダによる転送先の指定が演算処理ユニット2aである場合に転送データからヘッダを削除し、ヘッダによるタイプの指定に応じて当該転送データをマイクロプロセッサ3aもしくはメモリ4a,5a,6a,7aに引き渡す。
Further, the data conversion unit 15 performs packet conversion of transfer data, and also performs an arithmetic processing unit or transfer destination as a transfer destination for transfer data input / output to / from the data switching control unit 8a via the output destination changeover switch 14. A function for attaching or deleting a header designating the type of memory (either memory or microprocessor) is provided.
Specifically, the input source of the transfer data to the data switching control unit 8a and the state of the state storage register 9 of the data switching control unit 8a are determined, and the input source of the transfer data to the data switching control unit 8a is When the memory 4a, 5a, 6a, 7a and the state storage register 9 stores a failure, the input source of the transfer data to the data switching control unit 8a is the microprocessor 3a, and the transfer destination address is specified. When the normal physical address of the memory in the arithmetic processing unit 2a (the value of the number of connected memories is 3) is exceeded, a header specifying the processing unit of the transfer destination and the type of the transfer destination is attached to the transfer data While transferring to another data switching control unit (data switching control unit 8b in the examples of FIGS. 1 and 2), the data switching control unit 8a When the transfer data input source is another data switching control unit (data switching control unit 8b in the examples of FIGS. 1 and 2) and the transfer destination is in the arithmetic processing unit 2a of the data switching control unit 8a. When the designation of the transfer destination by the header is the arithmetic processing unit 2a, the header is deleted from the transfer data, and the transfer data is transferred to the microprocessor 3a or the memories 4a, 5a, 6a, 7a according to the type designation by the header.

データ変換部15の主要部は、データ切り替え制御部8aに実装された切り替え制御用マイクロプロセッサ23によって構成されており、出力先切り替えスイッチ14は切り替え制御用マイクロプロセッサ23によって駆動制御される。また、切り替え制御用マイクロプロセッサ23は、状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11,自己ドメイン記憶レジスタ12,接続メモリ数記憶レジスタ13,ルーティングテーブル22に対してアクセス可能である。   The main part of the data conversion unit 15 is configured by a switching control microprocessor 23 mounted in the data switching control unit 8a, and the output destination switching switch 14 is driven and controlled by the switching control microprocessor 23. Further, the switching control microprocessor 23 accesses the status storage register 9, the transfer alternative microprocessor storage register 10, the transfer alternative domain storage register 11, the self domain storage register 12, the connected memory number storage register 13, and the routing table 22. Is possible.

転送データに添付されるヘッダの構成の概略を図3の概念図に示す。ヘッダの主要部はデータの転送先となる演算処理ユニット2a,2b,2c,2dの何れかを指定するためのドメイン指定部19と、転送先がマイクロプロセッサであるのかメモリであるのかを指定するタイプ指定部20とで構成される。   An outline of the structure of the header attached to the transfer data is shown in the conceptual diagram of FIG. The main part of the header designates a domain designation unit 19 for designating one of the arithmetic processing units 2a, 2b, 2c, and 2d as a data transfer destination and whether the transfer destination is a microprocessor or a memory. It is comprised with the type designation | designated part 20. FIG.

データ切り替え制御部8aには、データの転送先とデータの転送経路との対応関係を記憶したルーティングテーブル22が配備されているので、切り替え制御用マイクロプロセッサ23は、データの転送先さえ明らかであれば、ルーティングテーブル22からデータの転送先に対応するデータの転送経路を検索して、他のデータ切り替え制御部や他の演算処理ユニットのマイクロプロセッサ等を経由させて目的とする転送先にデータを転送することが可能である。   Since the data switching control unit 8a is provided with a routing table 22 that stores the correspondence between the data transfer destinations and the data transfer paths, the switching control microprocessor 23 is clear even the data transfer destinations. For example, the data transfer path corresponding to the data transfer destination is searched from the routing table 22, and the data is transferred to the target transfer destination via the other data switching control unit or the microprocessor of another arithmetic processing unit. It is possible to transfer.

データ切り替え制御部8b,8c,8dの構成は基本的に前述のデータ切り替え制御部8aの場合と同様であり、各データ切り替え制御部8b,8c,8dにおける出力先切り替えスイッチ14の接続関係のみがデータ切り替え制御部8aの場合と相違する。出力先切り替えスイッチ14の接続関係は図1に示した通りであり、演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されている。   The configuration of the data switching control units 8b, 8c, and 8d is basically the same as that of the above-described data switching control unit 8a, and only the connection relationship of the output destination switching switch 14 in each data switching control unit 8b, 8c, 8d. This is different from the data switching control unit 8a. The connection relationship of the output destination changeover switch 14 is as shown in FIG. 1, and the data switching control unit 8a of the arithmetic processing unit 2a, the data switching control unit 8b of the arithmetic processing unit 2b, and the data switching control of the arithmetic processing unit 2c. The unit 8c and the data switching control unit 8d of the arithmetic processing unit 2d are connected so as to be able to transmit information.

各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブル16と、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブル17は、図1に示されるように、情報処理装置1の内部に設置された不揮発性RAM等からなるテーブル格納メモリ18の内部に設けられている。   Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Use for storing the correspondence relationship between the gateway storage table 16, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit As shown in FIG. 1, the completed gateway storage table 17 is provided in a table storage memory 18 composed of a nonvolatile RAM or the like installed in the information processing apparatus 1.

利用可能ゲートウェイ記憶テーブル16の論理構成を図4の概念図に、また、利用済みゲートウェイ記憶テーブル17の論理構成を図5の概念図に示す。   The logical configuration of the available gateway storage table 16 is shown in the conceptual diagram of FIG. 4, and the logical configuration of the used gateway storage table 17 is shown in the conceptual diagram of FIG.

図4に示した利用可能ゲートウェイ記憶テーブル16の行方向の数字0,1,2,3の各々は演算処理ユニット2a,2b,2c,2dに対応し、また、列方向の数字0,1,2,3の各々はマイクロプロセッサ3a,3b,3c,3dに対応する。図1に示した例では演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されているから、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能なのは演算処理ユニット2bのマイクロプロセッサ3bのみであり、利用可能ゲートウェイ記憶テーブル16の第1行には初期設定時の処理で0,1,0,0が設定されることになる。ここで、〔演算処理ユニット2a,マイクロプロセッサ3b〕に相当する〔1,2〕スポットに設定される値「1」は、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能であることを示す値である。また、演算処理ユニット2bのメモリ4b,5b,6b,7bのデータ転送を代替することが可能なのは演算処理ユニット2aのマイクロプロセッサ3aのみであるから、利用可能ゲートウェイ記憶テーブル16の第2行には初期設定時の処理で1,0,0,0が設定されることになる。前記と同様、〔演算処理ユニット2b,マイクロプロセッサ3a〕に相当する〔2,1〕スポットに設定される値「1」は、演算処理ユニット2aのマイクロプロセッサ3aが演算処理ユニット2bのマイクロプロセッサ3bに替わって演算処理ユニット2bのメモリ4b,5b,6b,7bのデータ転送を代替することが可能であることを示す値である。同様に、演算処理ユニット2cのメモリ4c,5c,6c,7cのデータ転送を代替することが可能なのは演算処理ユニット2dのマイクロプロセッサ3dのみであるから、利用可能ゲートウェイ記憶テーブル16の第3行には初期設定時の処理で0,0,0,1が設定される。〔演算処理ユニット2c,マイクロプロセッサ3d〕に相当する〔3,4〕スポットに設定される値「1」は、演算処理ユニット2dのマイクロプロセッサ3dが演算処理ユニット2cのマイクロプロセッサ3cに替わって演算処理ユニット2cのメモリ4c,5c,6c,7cのデータ転送を代替することが可能であることを示す値である。また、演算処理ユニット2dのメモリ4d,5d,6d,7dのデータ転送を代替することが可能なのは演算処理ユニット2cのマイクロプロセッサ3cのみであるから、利用可能ゲートウェイ記憶テーブル16の第4行には初期設定時の処理で0,0,1,0が設定されることになる。〔演算処理ユニット2d,マイクロプロセッサ3c〕に相当する〔4,3〕スポットに設定される値「1」は、演算処理ユニット2cのマイクロプロセッサ3cが演算処理ユニット2dのマイクロプロセッサ3dに替わって演算処理ユニット2dのメモリ4d,5d,6d,7dのデータ転送を代替することが可能であることを示す値である。   Each of the numbers 0, 1, 2, 3 in the row direction of the available gateway storage table 16 shown in FIG. 4 corresponds to the arithmetic processing units 2a, 2b, 2c, 2d, and the numbers 0, 1, 1, in the column direction. 2 and 3 correspond to the microprocessors 3a, 3b, 3c and 3d, respectively. In the example shown in FIG. 1, the data switching control unit 8a of the arithmetic processing unit 2a and the data switching control unit 8b of the arithmetic processing unit 2b, and the data switching control of the data switching control unit 8c of the arithmetic processing unit 2c and the arithmetic processing unit 2d. Since the unit 8d is connected to be able to transmit information, only the microprocessor 3b of the arithmetic processing unit 2b can replace the data transfer of the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a. The first row of the possible gateway storage table 16 is set to 0, 1, 0, 0 by the process at the time of initial setting. Here, the value “1” set in the [1,2] spot corresponding to the [arithmetic processing unit 2a, microprocessor 3b] indicates that the microprocessor 3b of the arithmetic processing unit 2b gives the microprocessor 3a of the arithmetic processing unit 2a. Instead, the value indicates that the data transfer in the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a can be replaced. Since only the microprocessor 3a of the arithmetic processing unit 2a can replace the data transfer of the memories 4b, 5b, 6b, and 7b of the arithmetic processing unit 2b, the second row of the available gateway storage table 16 includes 1, 0, 0, 0 is set in the process at the time of initial setting. As described above, the value “1” set in the [2,1] spot corresponding to [the arithmetic processing unit 2b, the microprocessor 3a] indicates that the microprocessor 3a of the arithmetic processing unit 2a is the microprocessor 3b of the arithmetic processing unit 2b. Instead of the data transfer in the memories 4b, 5b, 6b, 7b of the arithmetic processing unit 2b. Similarly, only the microprocessor 3d of the arithmetic processing unit 2d can replace the data transfer in the memories 4c, 5c, 6c, and 7c of the arithmetic processing unit 2c. Is set to 0, 0, 0, 1 in the initial setting process. The value “1” set in the [3,4] spot corresponding to the [arithmetic processing unit 2c, microprocessor 3d] is calculated by replacing the microprocessor 3d of the arithmetic processing unit 2d with the microprocessor 3c of the arithmetic processing unit 2c. The value indicates that the data transfer in the memories 4c, 5c, 6c, and 7c of the processing unit 2c can be replaced. Since only the microprocessor 3c of the arithmetic processing unit 2c can replace the data transfer of the memories 4d, 5d, 6d, and 7d of the arithmetic processing unit 2d, the fourth row of the available gateway storage table 16 includes In the initial setting process, 0, 0, 1, 0 are set. The value “1” set in the [4, 3] spot corresponding to [the arithmetic processing unit 2d, the microprocessor 3c] is calculated by the microprocessor 3c of the arithmetic processing unit 2c instead of the microprocessor 3d of the arithmetic processing unit 2d. The value indicates that the data transfer in the memories 4d, 5d, 6d, and 7d of the processing unit 2d can be replaced.

利用済みゲートウェイ記憶テーブル17の論理構成も実質的には利用可能ゲートウェイ記憶テーブル16の論理構成と同等であり、図5に示した利用済みゲートウェイ記憶テーブル17の行方向の数字0,1,2,3の各々が演算処理ユニット2a,2b,2c,2dに対応し、また、列方向の数字0,1,2,3の各々がマイクロプロセッサ3a,3b,3c,3dに対応する。情報処理装置1の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、利用済みゲートウェイ記憶テーブル17には、他の演算処理ユニット2a,2b,2c,2dのメモリのデータ転送を代行しているマイクロプロセッサは存在しないものとして、〔1,1〕スポット〜〔4,4〕スポットの全ての欄に、初期設定時の処理で、メモリのデータ転送を代行していないことを示す値「0」が図7のようにして設定される。具体的には、例えば、図7の利用済みゲートウェイ記憶テーブル17における〔1,2〕スポットの値「0」は、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替していないことを示す値である。もし、仮に、利用済みゲートウェイ記憶テーブル17における〔1,2〕スポットに値「1」が設定されていたとするなら、この値「1」の意味合いは、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替しているというものとなる。   The logical configuration of the used gateway storage table 17 is substantially the same as the logical configuration of the available gateway storage table 16, and the numbers 0, 1, 2, and 2 in the row direction of the used gateway storage table 17 shown in FIG. 3 corresponds to the arithmetic processing units 2a, 2b, 2c, and 2d, and the numbers 0, 1, 2, and 3 in the column direction correspond to the microprocessors 3a, 3b, 3c, and 3d, respectively. Since there is no faulty microprocessor at the start of operation of the information processing apparatus 1, the used gateway storage table 17 is used to transfer the data of the memories of the other arithmetic processing units 2a, 2b, 2c, and 2d. Assuming that no microprocessor is present, all the columns from [1, 1] spot to [4, 4] spot indicate that the memory data transfer is not performed in the initial setting process. “0” is set as shown in FIG. Specifically, for example, the [1,2] spot value “0” in the used gateway storage table 17 of FIG. 7 indicates that the microprocessor 3b of the arithmetic processing unit 2b replaces the microprocessor 3a of the arithmetic processing unit 2a. The value indicates that the data transfer of the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a is not substituted. If the value “1” is set in the [1,2] spot in the used gateway storage table 17, the meaning of the value “1” is calculated by the microprocessor 3b of the arithmetic processing unit 2b. Instead of the microprocessor 3a of the unit 2a, the data transfer of the memories 4a, 5a, 6a and 7a of the arithmetic processing unit 2a is replaced.

この実施形態における運用状況更新設定手段は、図1に示されるように、各演算処理ユニット2a,2b,2c,2dと独立して情報処理装置1内に配備された障害処理用マイクロプロセッサ21によって構成されている。   As shown in FIG. 1, the operation status update setting means in this embodiment is implemented by a failure processing microprocessor 21 provided in the information processing apparatus 1 independently of each arithmetic processing unit 2a, 2b, 2c, 2d. It is configured.

運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、データ切り替え制御部8a,8b,8c,8dの各切り替え制御用マイクロプロセッサ23を介してデータ切り替え制御部8a,8b,8c,8dの各状態記憶レジスタ9と各転送代替マイクロプロセッサ記憶レジスタ10および各転送代替ドメイン記憶レジスタ11と各自己ドメイン記憶レジスタ12ならびに各接続メモリ数記憶レジスタ13に対して初期設定処理やデータの書き換え等の操作が行えるように、データ切り替え制御部8a,8b,8c,8dの全てに対して情報伝達可能に接続され、同時に、マイクロプロセッサ3a,3b,3c,3dに対しても各々のマイクロプロセッサ3a,3b,3c,3dからの障害通知信号等を読み込めるようにして接続され、更に、テーブル格納メモリ18に対しても利用可能ゲートウェイ記憶テーブル16や利用済みゲートウェイ記憶テーブル17に対するデータの初期設定や参照および書き換え処理ができるようにして接続されている。   The failure processing microprocessor 21 functioning as the operation status update setting means has the data switching control units 8a, 8b, 8c, 8d via the switching control microprocessors 23 of the data switching control units 8a, 8b, 8c, 8d. Operations such as initial setting processing and data rewriting for each state storage register 9, each transfer alternative microprocessor storage register 10, each transfer alternative domain storage register 11, each self domain storage register 12, and each connected memory number storage register 13. So that information can be transmitted to all of the data switching control units 8a, 8b, 8c, and 8d. At the same time, the microprocessors 3a, 3b, 3c, and 3d are also connected to the respective microprocessors 3a, 3b. , 3c, 3d so that failure notification signals can be read Connected, further connected available gateway storage table 16 and the used gateway storage initialization data for the table 17 and the reference and the rewrite process can be manner also for the table storing memory 18.

次に、演算処理ユニット2a,2b,2c,2dのデータ切り替え制御部8a,8b,8c,8dにおけるデータ変換部として機能する各切り替え制御用マイクロプロセッサ23によって実行される初期化処理の概略について説明する。   Next, an outline of initialization processing executed by each switching control microprocessor 23 functioning as a data conversion unit in the data switching control units 8a, 8b, 8c, 8d of the arithmetic processing units 2a, 2b, 2c, 2d will be described. To do.

ここではデータ切り替え制御部8aの切り替え制御用マイクロプロセッサ23が実行する初期化処理を例にとって説明するが、データ切り替え制御部8b,8c,8dの各切り替え制御用マイクロプロセッサ23による初期化処理も実質的な内容は同等である。   Here, the initialization process executed by the switching control microprocessor 23 of the data switching control unit 8a will be described as an example. However, the initialization process by each switching control microprocessor 23 of the data switching control units 8b, 8c, and 8d is also substantial. The content is equivalent.

システムの初期化に際し、データ切り替え制御部8aの切り替え制御用マイクロプロセッサ23は、まず、データ切り替え制御部8aが演算処理ユニット2aの配下にあることを示す値「0」をデータ切り替え制御部8aの自己ドメイン記憶レジスタ12に設定する(図8参照)。   Upon initialization of the system, the switching control microprocessor 23 of the data switching control unit 8a first sets a value “0” indicating that the data switching control unit 8a is under the control of the arithmetic processing unit 2a to the data switching control unit 8a. Set in the self-domain storage register 12 (see FIG. 8).

これと同様、データ切り替え制御部8bの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8bが演算処理ユニット2bの配下にあることを示す値「1」をデータ切り替え制御部8bの自己ドメイン記憶レジスタ12に設定し、データ切り替え制御部8cの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8cが演算処理ユニット2cの配下にあることを示す値「2」をデータ切り替え制御部8cの自己ドメイン記憶レジスタ12に設定し、データ切り替え制御部8dの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8dが演算処理ユニット2dの配下にあることを示す値「3」をデータ切り替え制御部8dの自己ドメイン記憶レジスタ12に設定する。   Similarly, the microprocessor 23 for switching control of the data switching control unit 8b sets the value “1” indicating that the data switching control unit 8b is under the arithmetic processing unit 2b to the self-domain storage register 12 of the data switching control unit 8b. The switching control microprocessor 23 of the data switching control unit 8c sets the value “2” indicating that the data switching control unit 8c is under the arithmetic processing unit 2c to the self-domain storage register 12 of the data switching control unit 8c. The switching control microprocessor 23 of the data switching control unit 8d sets the value “3” indicating that the data switching control unit 8d is under the control of the arithmetic processing unit 2d to the self-domain storage register 12 of the data switching control unit 8d. Set to.

次に、情報処理装置1の障害処理用マイクロプロセッサ21によって実行される利用可能ゲートウェイ記憶テーブル16の初期設定処理の概略について図9のフローチャートを参照して説明する。   Next, an outline of the initial setting process of the usable gateway storage table 16 executed by the failure processing microprocessor 21 of the information processing apparatus 1 will be described with reference to the flowchart of FIG.

初期設定処理を開始した障害処理用マイクロプロセッサ21は、まず、演算処理ユニット2aの配下にあるデータ切り替え制御部8aに実装された切り替え制御用マイクロプロセッサ23をポーリングしてデータ切り替え制御部8aの出力先切り替えスイッチ14が他のデータ切り替え制御部の出力先切り替えスイッチに接続されているか否かを確認し(ステップa1)、データ切り替え制御部8aの出力先切り替えスイッチ14に接続されているデータ切り替え制御部を有する演算処理ユニットに対しては当該演算処理ユニットの配下のマイクロプロセッサが演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することができるものと見做して利用可能ゲートウェイ記憶テーブル16の〔演算処理ユニット2a,接続先の演算処理ユニットのマイクロプロセッサ〕スポットの欄に代替可能を示す値「1」を設定する一方(ステップa2)、データ切り替え制御部8aの出力先切り替えスイッチ14に接続されていないデータ切り替え制御部を有する演算処理ユニットに対しては当該演算処理ユニットの配下のマイクロプロセッサは演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することができないものと見做して利用可能ゲートウェイ記憶テーブル16の〔演算処理ユニット2a,接続先されていない演算処理ユニットのマイクロプロセッサ〕スポットの欄に代替不能を示す値「0」を設定する(ステップa3)。   The failure processing microprocessor 21 that has started the initial setting process first polls the switching control microprocessor 23 mounted on the data switching control unit 8a under the arithmetic processing unit 2a to output the data switching control unit 8a. It is confirmed whether or not the destination changeover switch 14 is connected to the output destination changeover switch of another data changeover control unit (step a1), and the data changeover control connected to the output destination changeover switch 14 of the data changeover control unit 8a. It can be used for the arithmetic processing unit having a section, assuming that the microprocessor under the arithmetic processing unit can replace the data transfer of the memories 4a, 5a, 6a and 7a of the arithmetic processing unit 2a. [Operation processing unit 2a, connection of gateway storage table 16] Microprocessor of previous arithmetic processing unit] A value “1” indicating substitution is set in the spot column (step a2), while the data switching control unit not connected to the output destination switching switch 14 of the data switching control unit 8a It is assumed that the microprocessor under the arithmetic processing unit cannot be used as a substitute for the data transfer of the memories 4a, 5a, 6a and 7a of the arithmetic processing unit 2a. A value “0” indicating that substitution is not possible is set in the column of [arithmetic processing unit 2a, microprocessor of arithmetic processing unit not connected to] in the storage table 16 (step a3).

既に述べた通り、図1に示した例では演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8bが情報伝達可能に接続されているから、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能なのは演算処理ユニット2bのマイクロプロセッサ3bのみとなり、利用可能ゲートウェイ記憶テーブル16の第1行には図6に示されるように0,1,0,0が設定されることになる。
なお、〔1,1〕スポットの〔演算処理ユニット2a,演算処理ユニット2aのマイクロプロセッサ3a〕の欄を「1」に設定するのは、マイクロプロセッサ3aに障害が生じた場合にマイクロプロセッサ3aの処理をマイクロプロセッサ3aが代替することができないからである。
As already described, in the example shown in FIG. 1, the data switching control unit 8a of the arithmetic processing unit 2a and the data switching control unit 8b of the arithmetic processing unit 2b are connected so as to be able to transmit information. Only the microprocessor 3b of the arithmetic processing unit 2b can replace the data transfer of 4a, 5a, 6a, and 7a, and the first row of the available gateway storage table 16 has 0, 1 as shown in FIG. , 0, 0 are set.
Note that the [1, 1] spot [operation processing unit 2a, microprocessor 3a of operation processing unit 2a] field is set to “1” because the microprocessor 3a has a failure when the microprocessor 3a fails. This is because the processing cannot be replaced by the microprocessor 3a.

以下、障害処理用マイクロプロセッサ21が、演算処理ユニット2b,2c,2dの配下にあるデータ切り替え制御部8b,8c,8dの替え制御用マイクロプロセッサ23を順にポーリングして前記と同様に図9の初期設定処理を繰り返し実行することで、利用可能ゲートウェイ記憶テーブル16の第2行に1,0,0,0を、利用可能ゲートウェイ記憶テーブル16の第3行に0,0,0,1を、利用可能ゲートウェイ記憶テーブル16の第4行に0,0,1,0を設定する(図6参照)。   Thereafter, the failure processing microprocessor 21 sequentially polls the replacement control microprocessor 23 of the data switching control units 8b, 8c, and 8d under the arithmetic processing units 2b, 2c, and 2d, similarly to the above, as shown in FIG. By repeatedly executing the initial setting process, 1, 0, 0, 0 is stored in the second row of the available gateway storage table 16, and 0, 0, 0, 1 is stored in the third row of the available gateway storage table 16. 0, 0, 1, 0 are set in the fourth row of the available gateway storage table 16 (see FIG. 6).

また、情報処理装置1の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、利用済みゲートウェイ記憶テーブル17には、他の演算処理ユニットのメモリのデータ転送を代行しているマイクロプロセッサは存在しないものとして、〔1,1〕スポット〜〔4,4〕スポットの全ての欄に、メモリのデータ転送を代行していないことを示す値「0」が障害処理用マイクロプロセッサ21により図7のようにして設定され、同様に、各データ切り替え制御部8a,8b,8c,8dの状態記憶レジスタ9の全てには、これらのデータ切り替え制御部8a,8b,8c,8dが属する演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dに障害のないことを示す値「Enable」が、例えば、図8に示されるようにして設定される。   Further, since there is no faulty microprocessor at the start of operation of the information processing apparatus 1, the used gateway storage table 17 has a microprocessor acting as a proxy for data transfer in the memory of another arithmetic processing unit. Is present in all the columns [1, 1] to [4, 4], the value “0” indicating that the data transfer of the memory is not performed by the failure processing microprocessor 21. Similarly, the arithmetic processing to which the data switching control units 8a, 8b, 8c, and 8d belong to all the state storage registers 9 of the data switching control units 8a, 8b, 8c, and 8d. The value “Enable” indicating that there is no failure in the microprocessors 3a, 3b, 3c, 3d of the units 2a, 2b, 2c, 2d is, for example, It is set as shown in 8.

更に、演算処理ユニット2a,2b,2c,2d内には何れも4個のメモリが設けられているので、データ切り替え制御部8a,8b,8c,8dの接続メモリ数記憶レジスタ13には、例えば、データ切り替え制御部8aを例にとって図8に示すように、全て「3」が設定されることになる。前述した通り、最大接続数を「3」とするのは最初のメモリに相当する値を0として規定しているからである。   Furthermore, since all four memories are provided in the arithmetic processing units 2a, 2b, 2c, and 2d, the connection memory number storage register 13 of the data switching control units 8a, 8b, 8c, and 8d includes, for example, Taking the data switching control unit 8a as an example, as shown in FIG. 8, all “3” are set. As described above, the maximum number of connections is set to “3” because the value corresponding to the first memory is defined as 0.

次に、何れかの演算処理ユニットのマイクロプロセッサに障害が生じた場合に運用状況更新設定手段としての障害処理用マイクロプロセッサ21が実行する状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11および利用済みゲートウェイ記憶テーブル17の設定更新処理について図10のフローチャートを参照して説明する。   Next, when a failure occurs in the microprocessor of any of the arithmetic processing units, the status storage register 9, the transfer replacement microprocessor storage register 10, the transfer replacement executed by the failure processing microprocessor 21 as operation status update setting means The setting update processing of the domain storage register 11 and the used gateway storage table 17 will be described with reference to the flowchart of FIG.

ここでは一例として演算処理ユニット2aのマイクロプロセッサ3aに障害が生じた場合について説明するが、他の演算処理ユニット2b,2c,2dのマイクロプロセッサ3b,3c,3dに障害が生じた場合の処理も此れと同様である。   Here, the case where a failure occurs in the microprocessor 3a of the arithmetic processing unit 2a will be described as an example, but the processing in the case where a failure occurs in the microprocessors 3b, 3c, 3d of the other arithmetic processing units 2b, 2c, 2d is also described. It is the same as this.

演算処理ユニット2aのマイクロプロセッサ3aからの障害通知信号が検知されると、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、まず、演算処理ユニット2aに対応する情報を記憶した利用可能ゲートウェイ記憶テーブル16の第1行と、同じく演算処理ユニット2aに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第1行を検索し(ステップb1)、障害の生じたマイクロプロセッサ3aの属する演算処理ユニット2aに設けられているメモリ4a,5a,6a,7aのデータ転送を代行することが可能なマイクロプロセッサが存在するか否かを判定し、存在するとした場合には、更に、そのマイクロプロセッサが他のマイクロプロセッサのデータ転送を代替することが可能な状態にあるか否かを判定する(ステップb2)。
図6の利用可能ゲートウェイ記憶テーブル16の例では演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aの処理を代替でき(図6の〔1,2〕スポット参照)、かつ、図7の利用済みゲートウェイ記憶テーブル17に示されるように、演算処理ユニット2bのマイクロプロセッサ3bは現時点では他の演算処理ユニットのメモリのデータ転送を代行していないから(図7の第2列参照)、新たに障害を生じた演算処理ユニット2aのマイクロプロセッサ3aの配下のメモリ4a,5a,6a,7aのデータ転送を代替するマイクロプロセッサとして、演算処理ユニット2bのマイクロプロセッサ3bが選択されることになる。
When a failure notification signal from the microprocessor 3a of the arithmetic processing unit 2a is detected, the failure processing microprocessor 21 functioning as an operation status update setting unit first stores information corresponding to the arithmetic processing unit 2a. The first row of the gateway storage table 16 and the first row of the used gateway storage table 17 storing information corresponding to the arithmetic processing unit 2a are searched (step b1), and the operation to which the failed microprocessor 3a belongs is searched. It is determined whether there is a microprocessor capable of acting as a proxy for data transfer of the memories 4a, 5a, 6a, 7a provided in the processing unit 2a. Can replace the data transfer of other microprocessors It determines Luke (step b2).
In the example of the usable gateway storage table 16 in FIG. 6, the microprocessor 3b of the arithmetic processing unit 2b can replace the processing of the microprocessor 3a of the arithmetic processing unit 2a (see [1,2] spot in FIG. 6). As shown in the used gateway storage table 17 of FIG. 7, the microprocessor 3b of the arithmetic processing unit 2b does not transfer the data in the memory of other arithmetic processing units at this time (see the second column in FIG. 7). The microprocessor 3b of the arithmetic processing unit 2b is selected as a microprocessor that replaces the data transfer in the memories 4a, 5a, 6a, and 7a under the microprocessor 3a of the arithmetic processing unit 2a that has newly failed. Become.

従って、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、マイクロプロセッサ3bを有する演算処理ユニット2bを表す値「1」を障害の生じたマイクロプロセッサ3aを有する演算処理ユニット2aのデータ切り替え制御部8aにおける転送代替マイクロプロセッサ記憶レジスタ10に設定することにより、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代行させるマイクロプロセッサとしてマイクロプロセッサ3bが選択されたことをデータ切り替え制御部8aに記憶させると共に(ステップb3,図11参照)、マイクロプロセッサ3bを有する演算処理ユニット2bのデータ切り替え制御部8bにおける転送代替ドメイン記憶レジスタ11には、障害を生じたマイクロプロセッサ3aを有する演算処理ユニット2aを表す値「0」を設定することで、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代行するマイクロプロセッサとして自らのマイクロプロセッサ3bが選択されたことをデータ切り替え制御部8bに記憶させる(ステップb4,図12参照)。   Therefore, the failure processing microprocessor 21 functioning as the operation status update setting means sets the value “1” representing the operation processing unit 2b having the microprocessor 3b to the data switching of the operation processing unit 2a having the failed microprocessor 3a. By setting the transfer substitution microprocessor storage register 10 in the control unit 8a, the data switching is performed when the microprocessor 3b is selected as the microprocessor that substitutes the data transfer of the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a. The memory in the control unit 8a (see step b3 and FIG. 11) and the transfer substitution domain storage register 11 in the data switching control unit 8b of the arithmetic processing unit 2b having the microprocessor 3b have a failed microprocessor. By setting the value “0” representing the arithmetic processing unit 2a having “a”, the microprocessor 3b is selected as the microprocessor that performs the data transfer of the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a. This is stored in the data switching control unit 8b (see step b4 and FIG. 12).

次いで、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、障害の生じたマイクロプロセッサ3aに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第1列のスポットの全てに代替不能を示す値「1」を設定することで、障害の生じたマイクロプロセッサ3aが他の如何なるマイクロプロセッサのデータ転送も代替できなくなったことを記憶させると共に、障害の生じたマイクロプロセッサ3aのデータ転送を代替することになったマイクロプロセッサ3bに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第2列のスポットの全てに代替不能を示す値「1」を設定することで、マイクロプロセッサ3aのデータ転送の代替によってマイクロプロセッサ3bの負荷が増大するために該マイクロプロセッサ3bに更に他のマイクロプロセッサのデータ転送を代替する余力がなくなったことを記憶させる(ステップb5,図13参照)。
ここで、利用済みゲートウェイ記憶テーブル17の第1列のスポットの全てに代替不能を示す値「1」を設定する処理は、障害の生じたマイクロプロセッサ3aが他の全ての演算処理ユニット2b,2c,2d内のメモリのデータ転送を代行しているものと見做して利用済みゲートウェイ記憶テーブル17を設定する場合の処理と実質的に同等である。
Next, the failure processing microprocessor 21 functioning as the operation status update setting means sets all the spots in the first row of the used gateway storage table 17 storing the information corresponding to the failed microprocessor 3a to be non-replaceable. By setting the value “1” to be indicated, it is stored that the failed microprocessor 3a cannot replace the data transfer of any other microprocessor, and the data transfer of the failed microprocessor 3a is replaced. By setting a value “1” indicating non-replacement to all the spots in the second row of the used gateway storage table 17 that stores information corresponding to the microprocessor 3b that is supposed to be transferred, the data transfer of the microprocessor 3a The load on the microprocessor 3b increases due to the replacement of Stores further no longer reserve capacity to replace the data transfer other microprocessor on the microprocessor 3b (see step b5, Figure 13).
Here, the process of setting the value “1” indicating non-replacement to all the spots in the first column of the used gateway storage table 17 is performed by the microprocessor 3a in which the failure has occurred in all the other arithmetic processing units 2b and 2c. , 2d is substantially equivalent to the processing for setting the used gateway storage table 17 on the assumption that the data transfer of the memory in 2d is performed.

なお、この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提としているが、マイクロプロセッサの処理能力や仮想マッピングの設定しだいでは、1つのマイクロプロセッサが他の2つ以上のマイクロプロセッサのデータ転送を代替することも可能であり、そのような場合は、障害の生じたマイクロプロセッサ3aのデータ転送を代替することになったマイクロプロセッサ3bに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第2列のスポットの全てに代替不能を示す値「1」を設定する必要は必ずしもなく、利用済みゲートウェイ記憶テーブル17の〔1,2〕スポットのみに代替不適を示す値「1」を設定し、このマイクロプロセッサ3bによって更に他のマイクロプロセッサのデータ転送を代替させる余地を残すようにしてもよい。   In this embodiment, it is assumed that one microprocessor replaces only the data transfer of the other microprocessor. However, depending on the processing capacity of the microprocessor and the setting of the virtual mapping, one microprocessor is the other. It is also possible to replace the data transfer of two or more microprocessors, and in such a case, information corresponding to the microprocessor 3b that has replaced the data transfer of the failed microprocessor 3a is obtained. It is not always necessary to set the value “1” indicating non-replacement to all the spots in the second row of the stored used gateway storage table 17, and it is not appropriate to replace only the [1,2] spots of the used gateway storage table 17. A value “1” indicating “1” is set and the microprocessor 3b further sets another value. It may be leave room for alternative data transfer microprocessor.

次いで、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、障害の生じたマイクロプロセッサ3aを有する演算処理ユニット2aのデータ切り替え制御部8aにおける状態記憶レジスタ9に障害の発生を示す値「Disable」を設定し、このデータ切り替え制御部8aの属する演算処理ユニット2aのマイクロプロセッサ3aに障害が生じたことをデータ切り替え制御部8aに記憶させて(ステップb6,図14参照)、状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11および利用済みゲートウェイ記憶テーブル17の設定更新処理を終える。   Next, the failure processing microprocessor 21 functioning as the operation status update setting means sets a value “indicating the occurrence of the failure in the state storage register 9 in the data switching control unit 8a of the arithmetic processing unit 2a having the failed microprocessor 3a. “Disable” is set, and the fact that a failure has occurred in the microprocessor 3a of the arithmetic processing unit 2a to which the data switching control unit 8a belongs is stored in the data switching control unit 8a (see step b6 and FIG. 14), and the state storage register 9. The setting update processing of the transfer alternative microprocessor storage register 10, the transfer alternative domain storage register 11, and the used gateway storage table 17 is finished.

次に、何れかの演算処理ユニットのマイクロプロセッサに障害が生じた状況下でデータ切り替え制御部8a,8b,8c,8dが実行する処理、特に、各データ切り替え制御部8a,8b,8c,8dにおいてデータ変換部15として機能する切り替え制御用マイクロプロセッサ23の処理動作について図15のフローチャートを参照して説明する。   Next, processing executed by the data switching control units 8a, 8b, 8c, and 8d in a situation where a failure occurs in the microprocessor of any arithmetic processing unit, in particular, the data switching control units 8a, 8b, 8c, and 8d. The processing operation of the switching control microprocessor 23 functioning as the data converter 15 will be described with reference to the flowchart of FIG.

ここでは一例として、演算処理ユニット2aのマイクロプロセッサ3aに障害が生じ、マイクロプロセッサ3aに代わって演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替する場合について説明するが、他の演算処理ユニット2b,2c,2dのマイクロプロセッサ3b,3c,3dに障害が生じた場合の処理も此れと同様である。   Here, as an example, a failure occurs in the microprocessor 3a of the arithmetic processing unit 2a, and the microprocessor 3b of the arithmetic processing unit 2b replaces the microprocessor 3a to transfer data to the memories 4a, 5a, 6a, and 7a of the arithmetic processing unit 2a. Although the case where it substitutes is demonstrated, the process when a failure occurs in the microprocessors 3b, 3c, 3d of the other arithmetic processing units 2b, 2c, 2d is the same as this.

データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、該切り替え制御用マイクロプロセッサ23の設置されたデータ切り替え制御部への転送データの入力を定常的に見張っており、転送データの入力が確認される度に、当該転送データの入力元を判定する(ステップc1)。   The switching control microprocessor 23 functioning as the data conversion unit 15 constantly monitors the input of the transfer data to the data switching control unit in which the switching control microprocessor 23 is installed, and confirms the input of the transfer data. Each time, the input source of the transfer data is determined (step c1).

ここで、データ切り替え制御部への転送データの入力元がメモリであった場合には、データ切り替え制御部が各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられていることから、このデータ切り替え制御部と直接的に接続された同一演算処理ユニット内のメモリからのデータ転送であることが明らかである。   Here, when the input source of the transfer data to the data switching control unit is a memory, the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit. It is clear that the data transfer is from a memory in the same arithmetic processing unit directly connected to the switching control unit.

従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、このデータ切り替え制御部の状態記憶レジスタ9の設定状態が「Enable」となっているのか「Disable」となっているのかを判定する(ステップc6)。   Therefore, the switching control microprocessor 23 functioning as the data conversion unit 15 further determines whether the setting state of the state storage register 9 of the data switching control unit is “Enable” or “Disable”. Determine (step c6).

状態記憶レジスタ9の設定状態が「Enable」となっている場合には当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていないことを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと当該演算処理ユニット内のマイクロプロセッサを接続し、メモリからの転送データを其のまま当該演算処理ユニット内のマイクロプロセッサに引き渡す(ステップc7)。
例えば、演算処理ユニット2b内のメモリ4b,5b,6b,7bからの転送データが演算処理ユニット2b内のデータ切り替え制御部8bに入力された場合では、図12に示されるように、データ切り替え制御部8bの状態記憶レジスタ9の設定状態が「Enable」となっているから、メモリ4b,5b,6b,7bからの転送データがデータ切り替え制御部8bを介して其のまま当該演算処理ユニット2b内のマイクロプロセッサ3bに引き渡されることになる(図16のX1を参照)。
When the setting state of the state storage register 9 is “Enable”, it means that no failure has occurred in the microprocessor of the arithmetic processing unit having the data switching control unit, and thus functions as the data conversion unit 15. The switching control microprocessor 23 controls the output destination changeover switch 14 to connect the memory in the arithmetic processing unit and the microprocessor in the arithmetic processing unit, and transfer data from the memory as it is to the arithmetic processing unit. (Step c7).
For example, when transfer data from the memories 4b, 5b, 6b, and 7b in the arithmetic processing unit 2b is input to the data switching control unit 8b in the arithmetic processing unit 2b, the data switching control is performed as shown in FIG. Since the setting state of the state storage register 9 of the unit 8b is “Enable”, the transfer data from the memories 4b, 5b, 6b, and 7b remains in the arithmetic processing unit 2b as it is via the data switching control unit 8b. To the microprocessor 3b (see X1 in FIG. 16).

一方、ステップc6の判定結果が偽となった場合、つまり、状態記憶レジスタ9の設定状態が「Disable」となっている場合には、当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていることを意味するので、当該演算処理ユニットのマイクロプロセッサに配下のメモリからデータを転送することはできない。従って、この場合、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを当該転送データに添付した上で(ステップc8)、出力先切り替えスイッチ14を制御して当該データ切り替え制御部と接続関係にある他のデータ切り替え制御部に当該演算処理ユニット内のメモリを接続し、転送先に最も近いデータ切り替え制御部に当該メモリからの転送データを送出する(ステップc9)。
例えば、演算処理ユニット2a内のメモリ4a,5a,6a,7aからの転送データが演算処理ユニット2a内のデータ切り替え制御部8aに入力された場合では、図14に示されるように、状態記憶レジスタ9の設定状態が「Disable」となっているから、データ切り替え制御部8aの切り替え制御用マイクロプロセッサ23は、図14に示されるようなデータ切り替え制御部8aの転送代替マイクロプロセッサ記憶レジスタ10を参照して、転送先となる演算処理ユニット2bのマイクロプロセッサ3bを表す値「1」をドメイン指定部19に設定し且つ転送先のタイプであるマイクロプロセッサをタイプ指定部20に設定したヘッダを転送データに添付した上で、出力先切り替えスイッチ14を当該データ切り替え制御部8aと接続関係にあるデータ切り替え制御部8bに接続して、該演算処理ユニット2a内のメモリ4a,5a,6a,7aからの転送データをデータ切り替え制御部8bに送出することになる(図16のX3を参照)。
On the other hand, if the determination result in step c6 is false, that is, if the setting state of the state storage register 9 is “Disable”, the microprocessor of the arithmetic processing unit having the data switching control unit is faulty. Therefore, data cannot be transferred from the subordinate memory to the microprocessor of the arithmetic processing unit. Accordingly, in this case, the switching control microprocessor 23 functioning as the data conversion unit 15 attaches a header specifying the transfer destination arithmetic processing unit and the transfer destination type to the transfer data (step c8), and outputs it. The destination switching switch 14 is controlled to connect the memory in the arithmetic processing unit to another data switching control unit connected to the data switching control unit, and the data switching control unit closest to the transfer destination is connected to the data switching control unit from the memory. The transfer data is sent out (step c9).
For example, when transfer data from the memories 4a, 5a, 6a, and 7a in the arithmetic processing unit 2a is input to the data switching control unit 8a in the arithmetic processing unit 2a, as shown in FIG. 14, the state storage register 9 is “Disable”, the switching control microprocessor 23 of the data switching control unit 8a refers to the transfer alternative microprocessor storage register 10 of the data switching control unit 8a as shown in FIG. Then, a value “1” representing the microprocessor 3b of the arithmetic processing unit 2b serving as the transfer destination is set in the domain specifying unit 19, and a header in which the type of the transfer destination microprocessor is set in the type specifying unit 20 is transferred data. And the output destination changeover switch 14 is connected to the data changeover control unit 8a. Connected to a certain data switching control unit 8b, the transfer data from the memories 4a, 5a, 6a, 7a in the arithmetic processing unit 2a is sent to the data switching control unit 8b (see X3 in FIG. 16). .

また、ステップc1の判定処理においてデータ切り替え制御部への転送データの入力元がマイクロプロセッサであった場合には、データ切り替え制御部が各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられていることから、このデータ切り替え制御部と直接的に接続された同一演算処理ユニット内のマイクロプロセッサからのデータ転送であることが明らかである。   Further, when the transfer data input source to the data switching control unit is a microprocessor in the determination process of step c1, the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit. Therefore, it is clear that the data transfer is from the microprocessor in the same arithmetic processing unit directly connected to the data switching control unit.

従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データの転送先のメモリのアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えているか否か、即ち、アドレス指定が最大接続数「3」の範囲内にあるのか、或いは、最大接続数「3」を超えた仮想マッピングの範囲(この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提としているので仮想マッピングの際のアドレス指定の値は4〜7となる)にあるのかを判定する(ステップc2)。   Therefore, the switching control microprocessor 23 functioning as the data conversion unit 15 further determines whether or not the addressing of the transfer destination memory of the transfer data exceeds the normal physical address of the memory in the arithmetic processing unit. Whether the addressing is within the range of the maximum number of connections “3” or the range of virtual mapping exceeding the maximum number of connections “3” (in this embodiment, one microprocessor transfers data to another microprocessor) Therefore, it is determined whether the address designation value in the virtual mapping is 4-7 (step c2).

アドレス指定が最大接続数「3」の範囲内にあってステップc2の判定結果が真となった場合には、当該演算処理ユニット内のメモリを宛先とした転送データであることを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと当該演算処理ユニット内のマイクロプロセッサを接続し、マイクロプロセッサからの転送データを其のまま当該演算処理ユニット内のメモリに引き渡す(ステップc3)。
例えば、演算処理ユニット2bのマイクロプロセッサ3bから演算処理ユニット2bのメモリ4b,5b,6b,7bにデータが転送される場合では、アドレス指定が最大接続数「3」の範囲内となるので、マイクロプロセッサ3bからの転送データがデータ切り替え制御部8bを介して其のまま当該演算処理ユニット2b内のメモリ4b,5b,6b,7bに引き渡されることになる(図16のX1を参照)。
If the address designation is within the range of the maximum number of connections “3” and the determination result of step c2 is true, it means that the transfer data is destined for the memory in the arithmetic processing unit. The switching control microprocessor 23 that functions as the data conversion unit 15 controls the output destination changeover switch 14 to connect the memory in the arithmetic processing unit and the microprocessor in the arithmetic processing unit to transfer data from the microprocessor. As it is to the memory in the arithmetic processing unit (step c3).
For example, when data is transferred from the microprocessor 3b of the arithmetic processing unit 2b to the memories 4b, 5b, 6b, and 7b of the arithmetic processing unit 2b, the address designation is within the range of the maximum connection number “3”. Transfer data from the processor 3b is transferred to the memories 4b, 5b, 6b, and 7b in the arithmetic processing unit 2b via the data switching control unit 8b (see X1 in FIG. 16).

これに対し、ステップc2の判定結果が偽となった場合、つまり、アドレス指定が最大接続数「3」の範囲を超えていた場合には、この転送データは本来は当該演算処理ユニットのマイクロプロセッサを経由して転送されるべきものではないが、当該演算処理ユニットのマイクロプロセッサが他の演算処理ユニットのマイクロプロセッサのデータ転送を代替しているために転送の必要が生じたデータであるということを意味するから、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを当該転送データに添付した上で(ステップc4)、出力先切り替えスイッチ14を制御して当該データ切り替え制御部と接続関係にある他のデータ切り替え制御部に当該演算処理ユニット内のマイクロプロセッサを接続し、転送先に最も近いデータ切り替え制御部に当該演算処理ユニット内のマイクロプロセッサからの転送データを送出する(ステップc5)。
例えば、演算処理ユニット2bのマイクロプロセッサ3bからの転送データが演算処理ユニット2b内のデータ切り替え制御部8bに入力され、その際にアドレス指定が最大接続数「3」の範囲を超えていたとすれば、この転送データは本来は演算処理ユニット2bのマイクロプロセッサ3bが転送すべきものではないが、マイクロプロセッサ3aに障害が生じているために演算処理ユニット2bのマイクロプロセッサ3bが仮想マッピングのアドレスを利用して当該データ切り替え制御部8bに引き渡したものであると解されるので、データ切り替え制御部8bの切り替え制御用マイクロプロセッサ23は、図12に示されるようなデータ切り替え制御部8bの転送代替ドメイン記憶レジスタ11を参照して、転送先となる演算処理ユニット2aを表す値「0」をドメイン指定部19に設定し且つ転送先のタイプであるメモリをタイプ指定部20に設定したヘッダを転送データに添付した上で、出力先切り替えスイッチ14を当該データ切り替え制御部8bと接続関係にあるデータ切り替え制御部8aに接続して、該演算処理ユニット2b内のマイクロプロセッサ3bからの転送データをデータ切り替え制御部8aに送出することになる(図16のX2を参照)。
On the other hand, if the determination result in step c2 is false, that is, if the address designation exceeds the range of the maximum number of connections “3”, the transfer data is originally stored in the microprocessor of the arithmetic processing unit. Although the data should not be transferred via the microprocessor, it is data that needs to be transferred because the microprocessor of the relevant processing unit replaces the data transfer of the microprocessor of another processing unit. Therefore, the switching control microprocessor 23 functioning as the data conversion unit 15 attaches a header specifying the processing unit of the transfer destination and the type of the transfer destination to the transfer data (step c4), and outputs it. Control the destination switch 14 to another data switching control unit connected to the data switching control unit. Connect the microprocessor in the processing unit, sends data transferred from the microprocessor of the arithmetic processing unit to the nearest data switching control unit to the destination (step c5).
For example, if transfer data from the microprocessor 3b of the arithmetic processing unit 2b is input to the data switching control unit 8b in the arithmetic processing unit 2b, and the address designation exceeds the range of the maximum connection number “3” at that time. The transfer data is not supposed to be transferred by the microprocessor 3b of the arithmetic processing unit 2b, but because the microprocessor 3a has a fault, the microprocessor 3b of the arithmetic processing unit 2b uses the virtual mapping address. Therefore, the switching control microprocessor 23 of the data switching control unit 8b uses the transfer substitution domain storage of the data switching control unit 8b as shown in FIG. Referring to the register 11, the processing unit serving as the transfer destination A value “0” representing 2a is set in the domain specifying unit 19 and a header in which the type of the transfer destination is set in the type specifying unit 20 is attached to the transfer data, and then the output destination changeover switch 14 is switched to the data Connected to the data switching control unit 8a connected to the control unit 8b, the transfer data from the microprocessor 3b in the arithmetic processing unit 2b is sent to the data switching control unit 8a (see X2 in FIG. 16). reference).

また、ステップc1の判定処理においてデータ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であった場合には、別の演算処理ユニット内のマイクロプロセッサもしくはメモリからのデータ転送であることが明らかである。   Further, when the transfer data input source to the data switching control unit is another data switching control unit in the determination process of step c1, the data is transferred from the microprocessor or the memory in another arithmetic processing unit. It is clear.

従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致しているか否かを判定する(ステップc10)。   Therefore, the switching control microprocessor 23 functioning as the data conversion unit 15 further confirms that the transfer destination arithmetic processing unit specified in the transfer data header matches the arithmetic processing unit of the data conversion unit 15. It is determined whether or not (step c10).

転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致している場合には、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データのヘッダで指定されているタイプがマイクロプロセッサであるのかメモリであるのかを判定し(ステップc11)、メモリである場合には、転送先やタイプを指定するヘッダを当該転送データから削除し、従来と同様に転送データのパケット変換を行い(ステップc12)、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと入力元のデータ切り替え制御部を接続し、入力元のデータ切り替え制御部からの転送データを当該演算処理ユニット内のメモリに引き渡す(ステップc13)。
例えば、前述のステップc4,c5の処理で演算処理ユニット2bのマイクロプロセッサ3bが仮想マッピングのアドレスを利用して演算処理ユニット2bのデータ切り替え制御部8bから送出した転送データが演算処理ユニット2aのデータ切り替え制御部8aに入力された場合では、転送先となる演算処理ユニット2aを表す値「0」がドメイン指定部19に設定され且つ転送先のタイプであるメモリがタイプ指定部20に設定されたヘッダを有する転送データが演算処理ユニット2bのデータ切り替え制御部8bから演算処理ユニット2aのデータ切り替え制御部8aに入力されることになるので、転送データのヘッダで指定されている転送先の演算処理ユニットを表す値「0」と図14に示すようなデータ切り替え制御部8aの自己ドメイン記憶レジスタ12の値「0」とが一致し、また、転送データのヘッダで指定されているタイプがメモリであるので、データ切り替え制御部8aのデータ変換部15として機能する切り替え制御用マイクロプロセッサ23は、当該転送データから転送先となる演算処理ユニット2aを表す値「0」(ドメイン指定部19)とメモリを示すタイプ指定(タイプ指定部20)とからなるヘッダを削除した上で、従来と同様に転送データのパケット変換を行い、出力先切り替えスイッチ14を制御して当該演算処理ユニット2a内のメモリ4a,5a,6a,7aと入力元のデータ切り替え制御部8bを接続し、入力元のデータ切り替え制御部8bからの転送データを当該演算処理ユニット2a内のメモリ4a,5a,6a,7aに引き渡すことになる(図16のX2を参照)。
なお、ここでいうパケット変換は、仮想マッピングによるアドレス指定を演算処理ユニット内で利用される本来のアドレス指定に戻すための操作であり、1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提とし、メモリの最大接続数を「3」とした本実施形態においては、仮想マッピングによるアドレス指定から値「4」を減算することで演算処理ユニット内で利用される本来のアドレス指定に戻される。例えば、仮想マッピングによるアドレス指定が「7」〔演算処理ユニット2b上で仮想された7番目(最初のメモリに相当する値を0として規定しているので実際には8番目)のメモリ〕であれば、「3」〔演算処理ユニット2a上で実質的に3番目(最初のメモリに相当する値を0として規定しているので実際には4番目)のメモリ〕に宛て先が変換される。
When the processing unit of the transfer destination specified in the header of the transfer data matches a certain processing unit of the data conversion unit 15, the switching control microprocessor 23 functioning as the data conversion unit 15 Further, it is determined whether the type specified in the header of the transfer data is a microprocessor or a memory (step c11). If it is a memory, a header specifying the transfer destination and type is determined from the transfer data. Delete the packet and perform packet conversion of the transfer data as in the conventional case (step c12), control the output destination changeover switch 14 to connect the memory in the arithmetic processing unit and the input source data switching control unit, and Transfer data from the data switching control unit is delivered to the memory in the arithmetic processing unit (step c13). .
For example, the transfer data sent from the data switching control unit 8b of the arithmetic processing unit 2b using the virtual mapping address by the microprocessor 3b of the arithmetic processing unit 2b in the processing of steps c4 and c5 described above is the data of the arithmetic processing unit 2a. When input to the switching control unit 8a, the value “0” representing the arithmetic processing unit 2a that is the transfer destination is set in the domain specifying unit 19, and the memory that is the type of the transfer destination is set in the type specifying unit 20. Since the transfer data having the header is input from the data switching control unit 8b of the arithmetic processing unit 2b to the data switching control unit 8a of the arithmetic processing unit 2a, the arithmetic processing of the transfer destination specified by the header of the transfer data The value “0” representing the unit and the self of the data switching control unit 8a as shown in FIG. Since the value “0” in the main storage register 12 matches and the type specified in the header of the transfer data is a memory, the switching control microprocessor functions as the data conversion unit 15 of the data switching control unit 8a. 23 deletes a header consisting of a value “0” (domain specifying unit 19) indicating the arithmetic processing unit 2a that is a transfer destination and a type specification (type specifying unit 20) indicating a memory from the transfer data. The packet conversion of the transfer data is performed in the same manner as described above, and the output destination changeover switch 14 is controlled to connect the memories 4a, 5a, 6a and 7a in the arithmetic processing unit 2a to the input source data switching control unit 8b. The transfer data from the data switching control unit 8b is transferred to the memories 4a, 5a, 6a, and 7a in the arithmetic processing unit 2a. Becomes Doo (see X2 in FIG. 16).
Note that the packet conversion here is an operation for returning the addressing by virtual mapping to the original addressing used in the arithmetic processing unit, and only one data transfer of one microprocessor to another microprocessor is performed. In the present embodiment in which the maximum number of connections of the memory is “3”, the value “4” is subtracted from the address designation by the virtual mapping. Return to addressing. For example, the address designation by virtual mapping is “7” (the seventh memory virtualized on the arithmetic processing unit 2b (actually the eighth memory because the value corresponding to the first memory is defined as 0)). For example, the destination is converted to “3” (substantially the fourth memory because the value corresponding to the first memory is defined as 0 on the arithmetic processing unit 2a).

一方、ステップc11の判定結果が偽となった場合、つまり、転送データのヘッダで指定されているタイプがマイクロプロセッサである場合には、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先やタイプを指定するヘッダを当該転送データから削除し、従来と同様に転送データのパケット変換を行い(ステップc14)、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のマイクロプロセッサと入力元のデータ切り替え制御部を接続し、入力元のデータ切り替え制御部からの転送データを当該演算処理ユニット内のマイクロプロセッサに引き渡す(ステップc15)。
例えば、前述のステップc8,c9の処理で演算処理ユニット2a内のメモリ4a,5a,6a,7aの転送データが演算処理ユニット2a内のデータ切り替え制御部8aから送出されて演算処理ユニット2bのデータ切り替え制御部8bに入力された場合においては、転送先となる演算処理ユニット2bを表す値「1」がドメイン指定部19に設定され且つ転送先のタイプであるマイクロプロセッサがタイプ指定部20に設定されたヘッダを有する転送データが演算処理ユニット2aのデータ切り替え制御部8aから演算処理ユニット2bのデータ切り替え制御部8bに入力されることになるので、転送データのヘッダで指定されている転送先の演算処理ユニットを表す値「1」と図12に示すようなデータ切り替え制御部8bの自己ドメイン記憶レジスタ12の値「1」とが一致し、また、転送データのヘッダで指定されているタイプがマイクロプロセッサであるので、データ切り替え制御部8bのデータ変換部15として機能する切り替え制御用マイクロプロセッサ23は、当該転送データから転送先となる演算処理ユニット2bを表す値「1」(ドメイン指定部19)とマイクロプロセッサを示すタイプ指定(タイプ指定部20)とからなるヘッダを削除した上で、従来と同様に転送データのパケット変換を行い、出力先切り替えスイッチ14を制御して当該演算処理ユニット2b内のマイクロプロセッサ3bと入力元のデータ切り替え制御部8aを接続し、入力元のデータ切り替え制御部8aからの転送データを当該演算処理ユニット2b内のマイクロプロセッサ3bに引き渡すことになる(図16のX3を参照)。
なお、ここでいうパケット変換は、演算処理ユニット内で利用されるアドレス指定を仮想マッピングによるアドレス指定に改めるための操作であり、1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提とし、メモリの最大接続数を「3」とした本実施形態においては、演算処理ユニット内で利用されるアドレス指定に値「4」を加算することで仮想マッピング用のアドレスが生成される。例えば、演算処理ユニット内で利用されるアドレス指定が「3」〔演算処理ユニット2a上で実質的に3番目(最初のメモリに相当する値を0として規定しているので実際には4番目)のメモリ〕であれば、「7」〔演算処理ユニット2b上で仮想される7番目(最初のメモリに相当する値を0として規定しているので実際には8番目)のメモリ〕に宛て先が変換される。
On the other hand, if the determination result in step c11 is false, that is, if the type specified in the header of the transfer data is a microprocessor, the switching control microprocessor 23 functioning as the data converter 15 is: The header designating the transfer destination and type is deleted from the transfer data, the transfer data packet conversion is performed in the same manner as in the prior art (step c14), the output destination changeover switch 14 is controlled, and the microprocessor in the arithmetic processing unit The input source data switching control unit is connected, and the transfer data from the input source data switching control unit is delivered to the microprocessor in the arithmetic processing unit (step c15).
For example, the transfer data of the memories 4a, 5a, 6a, and 7a in the arithmetic processing unit 2a is sent from the data switching control unit 8a in the arithmetic processing unit 2a in the above-described steps c8 and c9, and the data of the arithmetic processing unit 2b is transmitted. When input to the switching control unit 8b, the value “1” representing the arithmetic processing unit 2b that is the transfer destination is set in the domain specifying unit 19 and the microprocessor that is the type of the transfer destination is set in the type specifying unit 20. Since the transfer data having the specified header is input from the data switching control unit 8a of the arithmetic processing unit 2a to the data switching control unit 8b of the arithmetic processing unit 2b, the transfer destination specified by the header of the transfer data The value “1” representing the arithmetic processing unit and the self-domain of the data switching control unit 8b as shown in FIG. The value “1” in the data storage register 12 matches, and the type specified in the header of the transfer data is a microprocessor, so that the switching control microprocessor functioning as the data conversion unit 15 of the data switching control unit 8b. The processor 23 deletes the header composed of the value “1” (domain specifying unit 19) indicating the arithmetic processing unit 2b as the transfer destination and the type specification (type specifying unit 20) indicating the microprocessor from the transfer data. The packet conversion of the transfer data is performed as in the conventional case, the output destination changeover switch 14 is controlled, the microprocessor 3b in the arithmetic processing unit 2b is connected to the input source data switching control unit 8a, and the input source data switching is performed. Transfer data from the control unit 8a is sent to the microprocessor 3b in the arithmetic processing unit 2b. It will be passed can (see X3 in Fig. 16).
The packet conversion here is an operation for changing the address specification used in the arithmetic processing unit to the address specification by virtual mapping, and one microprocessor substitutes only for data transfer of one other microprocessor. In this embodiment where the maximum number of memory connections is “3”, a virtual mapping address is generated by adding a value “4” to the address designation used in the arithmetic processing unit. Is done. For example, the address designation used in the arithmetic processing unit is “3” [actually third on the arithmetic processing unit 2a (actually fourth because the value corresponding to the first memory is defined as 0) [7] [7th memory (actually the eighth memory because the value corresponding to the first memory is defined as 0]] on the arithmetic processing unit 2b. Is converted.

また、ステップc10の判定結果が偽となった場合、つまり、転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致していないと判定された場合においては、当該データ切り替え制御部が中継地点に過ぎず、該データ切り替え制御部を介して更に別のデータ切り替え制御部に当該データを転送する必要があることを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送データからヘッダを削除する処理は行なわず、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に当該転送データを其のまま転送することになる(ステップc16)。   If the determination result in step c10 is false, that is, it is determined that the processing unit of the transfer destination specified by the header of the transfer data does not match the processing unit of the data conversion unit 15. In this case, the data switching control unit is merely a relay point, and it is necessary to transfer the data to another data switching control unit via the data switching control unit. The switching control microprocessor 23 functioning as 15 does not perform the process of deleting the header from the transfer data, but directly transfers the transfer data to the data switching control unit of another arithmetic processing unit connected to the data switching control unit. It will be transferred (step c16).

以上に述べた通り、この実施形態では、各演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dの何れかに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しを、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行うようにしており、その際、各データ切り替え制御部の間での転送データの受け渡しに際してのみ転送先の演算処理ユニットや転送先のタイプを指定するためのヘッダを利用するようにしているので、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。   As described above, in this embodiment, when a failure occurs in any of the microprocessors 3a, 3b, 3c, and 3d of the arithmetic processing units 2a, 2b, 2c, and 2d, the subordinates of the failed microprocessors are subordinate. Data switching between the data switching control unit of the arithmetic processing unit having the failed microprocessor and other arithmetic processing units connected to the data switching control unit for writing data into and reading data from the memory. In this case, only when transferring transfer data between each data switching control unit, a transfer destination arithmetic processing unit and a header for designating the transfer destination type are used. The protocol used to transfer data between the microprocessor and memory is itself The data transfer of the memory under the faulty microprocessor can be dealt with without any change.

しかも、複数ある演算処理ユニット2a,2b,2c,2dの各々に設けられたマイクロプロセッサ3a,3b,3c,3dのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。   In addition, among the microprocessors 3a, 3b, 3c, and 3d provided in each of the plurality of arithmetic processing units 2a, 2b, 2c, and 2d, the memory under the failure of the failed microprocessor is the microprocessor that has not failed. Therefore, even if a special spare processor card or spare arithmetic processing unit is not redundantly installed, it is possible to realize data transfer to the memory under the faulty microprocessor. it can.

ここでは障害の生じたマイクロプロセッサの配下の全てのメモリ、たとえば、マイクロプロセッサ3aの配下のメモリ4a,4b,4c,4dを一纏めにしてデータ転送を他の1つのマイクロプロセッサ例えばマイクロプロセッサ3bで代替する例について述べたが、各メモリ毎、例えば、メモリ4a,4b,4c,4d毎に異なるマイクロプロセッサをデータ転送代替用のマイクロプロセッサとして割り付けるといったことも技術的には可能である。   Here, all the memories under the failed microprocessor, for example, the memories 4a, 4b, 4c, and 4d under the microprocessor 3a are grouped together, and the data transfer is replaced with another microprocessor, for example, the microprocessor 3b. However, it is technically possible to assign a different microprocessor as a data transfer substitute microprocessor for each memory, for example, for each of the memories 4a, 4b, 4c, and 4d.

この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提として説明したが、マイクロプロセッサの処理能力や仮想マッピングの設定しだいでは、1つのマイクロプロセッサが他の2つ以上のマイクロプロセッサのデータ転送を代替することも可能であり、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させること、例えば、マイクロプロセッサ3aとマイクロプロセッサ3cに同時に障害が生じた場合にマイクロプロセッサ3bとマイクロプロセッサ3dにマイクロプロセッサ3aとマイクロプロセッサ3cのデータ転送の処理を代替させることもできるので、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を容易に実現することが可能である。   In this embodiment, the description has been made on the assumption that one microprocessor replaces only the data transfer of the other microprocessor. However, depending on the processing capacity of the microprocessor and the setting of the virtual mapping, one microprocessor may It is possible to replace the data transfer of two or more microprocessors, and also select two or more non-failed microprocessors to transfer data in the memory under the other microprocessors that have failed. For example, if a failure occurs in the microprocessor 3a and the microprocessor 3c at the same time, the microprocessor 3b and the microprocessor 3d can replace the data transfer processing of the microprocessor 3a and the microprocessor 3c. 2 or more micropros Even when a failure occurs in the processor, it is possible to easily realize the data transfer of the memory under each microprocessor in which the failure has occurred.

運用状況更新設定手段としては、障害処理用マイクロプロセッサ21のほか、情報処理装置1が他の装置の下位装置として機能するような場合においては上位装置側の制御プログラムを利用することができ、また、情報処理装置1に組み込まれたファームウェアによって実質的な運用状況更新設定手段を構成させることもできる。   As the operation status update setting means, in addition to the failure processing microprocessor 21, when the information processing device 1 functions as a lower device of another device, a control program on the higher device side can be used. The substantial operation status update setting means can be configured by the firmware incorporated in the information processing apparatus 1.

本発明の障害処理方法を適用した一実施形態の情報処理装置の構成の概略について示したブロック図である。It is the block diagram shown about the outline of the structure of the information processing apparatus of one Embodiment to which the failure processing method of this invention was applied. 同実施形態の情報処理装置のデータ切り替え制御部の構成について示した機能ブロック図である。It is the functional block diagram shown about the structure of the data switching control part of the information processing apparatus of the embodiment. 転送データに添付されるヘッダの構成の概略を示した概念図である。It is the conceptual diagram which showed the outline of the structure of the header attached to transfer data. 同実施形態の情報処理装置における利用可能ゲートウェイ記憶テーブルの論理構成を示した概念図である。3 is a conceptual diagram illustrating a logical configuration of an available gateway storage table in the information processing apparatus of the embodiment. FIG. 同実施形態の情報処理装置における利用済みゲートウェイ記憶テーブルの論理構成を示した概念図である。It is the conceptual diagram which showed the logical structure of the used gateway memory table in the information processing apparatus of the embodiment. 同実施形態の情報処理装置における利用可能ゲートウェイ記憶テーブルが初期設定された状態を示した概念図である。It is the conceptual diagram which showed the state by which the usable gateway storage table in the information processing apparatus of the embodiment was initialized. 同実施形態の情報処理装置における利用済みゲートウェイ記憶テーブルが初期設定された状態を示した概念図である。It is the conceptual diagram which showed the state by which the used gateway storage table in the information processing apparatus of the embodiment was initialized. 同実施形態の情報処理装置におけるデータ切り替え制御部の各種レジスタの初期設定状態の一例を示した概念図である。It is the conceptual diagram which showed an example of the initial setting state of the various registers of the data switching control part in the information processing apparatus of the embodiment. 同実施形態の情報処理装置における各演算処理ユニットのデータ切り替え制御部によって実行される利用可能ゲートウェイ記憶テーブルの初期化処理の概略について示したフローチャートである。5 is a flowchart illustrating an outline of an initialization process of an available gateway storage table executed by a data switching control unit of each arithmetic processing unit in the information processing apparatus of the embodiment. 同実施形態の情報処理装置における何れかの演算処理ユニットのマイクロプロセッサに障害が生じた場合に運用状況更新設定手段としての障害処理用マイクロプロセッサが実行する状態記憶レジスタ,転送代替マイクロプロセッサ記憶レジスタ,転送代替ドメイン記憶レジスタおよび利用済みゲートウェイ記憶テーブルの設定更新処理の概略について示したフローチャートである。A status storage register executed by a failure processing microprocessor as an operation status update setting means when a failure occurs in a microprocessor of any of the arithmetic processing units in the information processing apparatus of the embodiment, a transfer alternative microprocessor storage register, It is the flowchart shown about the outline of the setting update process of a transfer alternative domain storage register and a used gateway storage table. 同実施形態の情報処理装置におけるデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタの更新設定の一例を示した概念図である。It is the conceptual diagram which showed an example of the update setting of the transfer alternative microprocessor memory register of the data switching control part in the information processing apparatus of the embodiment. 同実施形態の情報処理装置におけるデータ切り替え制御部の転送代替ドメイン記憶レジスタの更新設定の一例を示した概念図である。It is the conceptual diagram which showed an example of the update setting of the transfer alternative domain storage register of the data switching control part in the information processing apparatus of the embodiment. 同実施形態の情報処理装置における利用済みゲートウェイ記憶テーブルの更新設定の一例を示した概念図である。It is the conceptual diagram which showed an example of the update setting of the used gateway storage table in the information processing apparatus of the embodiment. 同実施形態の情報処理装置におけるデータ切り替え制御部の状態記憶レジスタの更新設定の一例を示した概念図である。It is the conceptual diagram which showed an example of the update setting of the state memory register of the data switching control part in the information processing apparatus of the embodiment. 同実施形態の情報処理装置におけるデータ切り替え制御部が実行する処理、特に、各データ切り替え制御部においてデータ変換部として機能する切り替え制御用マイクロプロセッサの処理動作について示したフローチャートである。5 is a flowchart showing processing executed by a data switching control unit in the information processing apparatus of the embodiment, particularly processing operation of a switching control microprocessor functioning as a data conversion unit in each data switching control unit. 同実施形態の情報処理装置における演算処理ユニットの1つに障害が生じた場合のデータ転送の流れの一例について示した概念図である。It is the conceptual diagram shown about the example of the flow of data transfer when a failure arises in one of the arithmetic processing units in the information processing apparatus of the embodiment.

符号の説明Explanation of symbols

1 情報処理装置
2a,2b,2c,2d 演算処理ユニット
3a,3b,3c,3d マイクロプロセッサ
4a,4b,4c,4d メモリ(Dual Inline Memory Module)
5a,5b,5c,5d メモリ(Dual Inline Memory Module)
6a,6b,6c,6d メモリ(Dual Inline Memory Module)
7a,7b,7c,7d メモリ(Dual Inline Memory Module)
8a,8b,8c,8d データ切り替え制御部
9 状態記憶レジスタ
10 転送代替マイクロプロセッサ記憶レジスタ
11 転送代替ドメイン記憶レジスタ
12 自己ドメイン記憶レジスタ
13 接続メモリ数記憶レジスタ
14 出力先切り替えスイッチ
15 データ変換部
16 利用可能ゲートウェイ記憶テーブル
17 利用済みゲートウェイ記憶テーブル
18 テーブル格納メモリ
19 ドメイン指定部
20 タイプ指定部
21 障害処理用マイクロプロセッサ(運用状況更新設定手段)
22 ルーティングテーブル
23 切り替え制御用マイクロプロセッサ
1 Information processing devices 2a, 2b, 2c, 2d Arithmetic processing units 3a, 3b, 3c, 3d Microprocessors 4a, 4b, 4c, 4d Memory (Dual Inline Memory Module)
5a, 5b, 5c, 5d Memory (Dual Inline Memory Module)
6a, 6b, 6c, 6d Memory (Dual Inline Memory Module)
7a, 7b, 7c, 7d Memory (Dual Inline Memory Module)
8a, 8b, 8c, 8d Data switching control unit 9 State storage register 10 Transfer alternative microprocessor storage register
11 Transfer Alternate Domain Storage Register 12 Self Domain Storage Register 13 Connected Memory Number Storage Register 14 Output Destination Switch 15 Data Conversion Unit 16 Available Gateway Storage Table 17 Used Gateway Storage Table 18 Table Storage Memory 19 Domain Specification Unit 20 Type Specification Unit 21 Fault processing microprocessor (operation status update setting means)
22 Routing table 23 Microprocessor for switching control

Claims (4)

マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なう情報処理装置のマイクロプロセッサに障害が生じた際に当該マイクロプロセッサの配下のメモリを利用するための情報処理装置の障害処理方法であって、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続しておき、
何れかのマイクロプロセッサに障害が生じた際に、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサのメモリのデータ転送を代行させ、
各データ切り替え制御部への転送データの入力元に応じ、当該データ切り替え制御部への転送データの入力元がメモリであって該データ切り替え制御部のマイクロプロセッサに障害が生じている場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するようにしたことを特徴とする情報処理装置の障害処理方法。
A failure occurred in the microprocessor of an information processing apparatus that performs parallel arithmetic processing by connecting a plurality of arithmetic processing units composed of a combination of a microprocessor and a memory and connecting the microprocessors of each arithmetic processing unit so that information can be transmitted. A failure processing method of an information processing device for using a memory under control of the microprocessor,
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected so as to transmit information,
When a failure occurs in any of the microprocessors, the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor is selected to Delegate data transfer of the resulting microprocessor memory,
Depending on the input source of the transfer data to each data switching control unit, the transfer data input source to the data switching control unit is a memory and the microprocessor of the data switching control unit has a failure and the data When the transfer data input source to the switching control unit is a microprocessor and the destination address specification exceeds the normal physical address of the memory in the relevant processing unit, the destination processing unit and the destination type Is attached to the transfer data, while the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit And a failure processing method for an information processing apparatus, wherein the header is deleted from the transfer data.
マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置において、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続すると共に、
各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブルと、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶すると共に何れかのマイクロプロセッサに障害が生じた場合においては障害が生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして該マイクロプロセッサと演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブルとを備えたテーブル格納メモリを配備し、
前記各データ切り替え制御部には、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサの障害の有無を記憶する状態記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのメモリのデータ転送を代行すべきマイクロプロセッサを有する演算処理ユニットを記憶する転送代替マイクロプロセッサ記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶する転送代替ドメイン記憶レジスタと、当該データ切り替え制御部への転送データの入力元と前記状態記憶レジスタの状態を判定し、当該データ切り替え制御部への転送データの入力元がメモリであって前記状態記憶レジスタが障害を記憶している場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するデータ変換部とを設け、
何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、前記利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照して障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち前記利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させる一方、前記選択された演算処理ユニットの転送代替ドメイン記憶レジスタに前記障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させると共に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして前記利用済みゲートウェイ記憶テーブルを更新設定し、前記障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる運用状況更新設定手段を併設したことを特徴とする情報処理装置。
In an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing.
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected to transmit information,
Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Stores the correspondence relationship between the gateway storage table, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit. When a failure occurs in one of the microprocessors, the correspondence relationship between the microprocessor and the arithmetic processing unit is assumed that the microprocessor in which the failure has occurred is acting as the data transfer for the memory in all other arithmetic processing units. Used gateway to remember Deploying a table storage memory and a 憶 table,
Each of the data switching control units includes a state storage register for storing the presence or absence of a failure of the microprocessor of the arithmetic processing unit provided with the data switching control unit, and a memory of the arithmetic processing unit provided with the data switching control unit A transfer alternative microprocessor storage register for storing an arithmetic processing unit having a microprocessor that should perform the data transfer of the data, and a microprocessor of the arithmetic processing unit provided with the data switching control unit should perform the data transfer of the memory The transfer alternative domain storage register that stores the arithmetic processing unit, the input source of the transfer data to the data switching control unit and the state of the state storage register are determined, and the input source of the transfer data to the data switching control unit is Memory and the state storage register indicates a fault. And when the transfer data input source to the data switching control unit is a microprocessor and the transfer destination address specification exceeds the normal physical address of the memory in the operation processing unit, While the header specifying the type of processing unit and transfer destination is attached to the transfer data, the input source of the transfer data to the data switching control unit is another data switching control unit, and the transfer destination is the data switching control unit. A data conversion unit that deletes the header from the transfer data when it is in the arithmetic processing unit,
When a failure occurs in the microprocessor of any of the arithmetic processing units, the arithmetic processing unit can refer to the available gateway storage table and the used gateway storage table to perform data transfer in the memory of the failed microprocessor. An arithmetic processing unit having a microprocessor not stored in the used gateway storage table is selected and stored in the transfer alternative microprocessor storage register of the data switching control unit of the failed microprocessor, while the selected The arithmetic processing unit having the failed microprocessor is stored in the transfer substitution domain storage register of the arithmetic processing unit, and the microprocessor of the selected arithmetic processing unit stores the data of the arithmetic processing unit. The data transfer of the memory of the arithmetic processing unit having the faulty microprocessor via the control unit, and the faulty microprocessor transfers the data of the memory in all other arithmetic processing units The used gateway storage table is updated and set as an agent, and operation status update setting means for storing the occurrence of the failure in the state storage register of the data switching control unit of the failed microprocessor is provided. An information processing apparatus characterized by the above.
前記運用状況更新設定手段が、前記各演算処理ユニットと独立したマイクロプロセッサによって構成されている請求項2記載の情報処理装置。   The information processing apparatus according to claim 2, wherein the operation status update setting unit is configured by a microprocessor independent of each arithmetic processing unit. 前記運用状況更新設定手段が、情報処理装置のファームウェアによって構成されている請求項2記載の情報処理装置。   The information processing apparatus according to claim 2, wherein the operation status update setting unit is configured by firmware of the information processing apparatus.
JP2007092609A 2007-03-30 2007-03-30 Information processing apparatus fault processing method and information processing apparatus Expired - Fee Related JP5066978B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007092609A JP5066978B2 (en) 2007-03-30 2007-03-30 Information processing apparatus fault processing method and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007092609A JP5066978B2 (en) 2007-03-30 2007-03-30 Information processing apparatus fault processing method and information processing apparatus

Publications (2)

Publication Number Publication Date
JP2008250785A JP2008250785A (en) 2008-10-16
JP5066978B2 true JP5066978B2 (en) 2012-11-07

Family

ID=39975630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007092609A Expired - Fee Related JP5066978B2 (en) 2007-03-30 2007-03-30 Information processing apparatus fault processing method and information processing apparatus

Country Status (1)

Country Link
JP (1) JP5066978B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5884368B2 (en) * 2011-09-27 2016-03-15 株式会社リコー Electronics

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0430245A (en) * 1990-05-25 1992-02-03 Oki Electric Ind Co Ltd Multiprocessor control system
JPH05113898A (en) * 1991-04-03 1993-05-07 Mitsubishi Electric Corp Multiplex system computer device
JP4404493B2 (en) * 2001-02-01 2010-01-27 日本電気株式会社 Computer system
JP4653965B2 (en) * 2004-04-08 2011-03-16 株式会社日立製作所 I / O interface module management method
JPWO2006043308A1 (en) * 2004-10-18 2008-05-22 富士通株式会社 Operation management program, operation management method, and operation management apparatus

Also Published As

Publication number Publication date
JP2008250785A (en) 2008-10-16

Similar Documents

Publication Publication Date Title
US6970972B2 (en) High-availability disk control device and failure processing method thereof and high-availability disk subsystem
JP4877482B2 (en) PCI Express link, multi-host computer system, and PCI Express link reconfiguration method
US11429487B2 (en) Control plane method and apparatus for providing erasure code protection across multiple storage devices
CN101471882B (en) Storage subsystem
CN101140497B (en) Storage system and control method for the same
JP5550089B2 (en) Multiprocessor system, node controller, failure recovery method
US20020087751A1 (en) Switch based scalable preformance storage architecture
US20090204743A1 (en) Storage subsystem and control method therefof
US20060150003A1 (en) Fault tolerant computer system
GB2414825A (en) Remote backup using a virtual volume
JP2000209271A (en) Router
JP2008112399A (en) Storage virtualization switch and computer system
US20060136613A1 (en) Duplicate synchronization system and method of operating duplicate synchronization system
KR101337720B1 (en) Video reproducing apparatus and video reproducing method
JP5066978B2 (en) Information processing apparatus fault processing method and information processing apparatus
JP3776438B2 (en) Storage device
JP4985512B2 (en) Distributed shared memory multiprocessor system and load balancing method in multiprocessor system
US7925810B2 (en) Data storage system, method, and recording medium that simultaneously transmits data that was separately generated from pluraity of transfer units to same data location
US7124213B2 (en) Device having spare I/O and method of using a device having spare I/O
JP4123386B2 (en) Communication path redundancy system, communication path redundancy method, and load distribution program
JP6394727B1 (en) Control device, control method, and fault tolerant device
JP4679178B2 (en) Communication device and memory device
JP2001243209A (en) Distributed shared memory system and distributed shared memory system control method
JP2012069119A (en) Distributed memory array supporting random access and file storage operations
JPH11252184A (en) Inter-node connector

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120717

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120730

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees