JP5066978B2 - Information processing apparatus fault processing method and information processing apparatus - Google Patents
Information processing apparatus fault processing method and information processing apparatus Download PDFInfo
- Publication number
- JP5066978B2 JP5066978B2 JP2007092609A JP2007092609A JP5066978B2 JP 5066978 B2 JP5066978 B2 JP 5066978B2 JP 2007092609 A JP2007092609 A JP 2007092609A JP 2007092609 A JP2007092609 A JP 2007092609A JP 5066978 B2 JP5066978 B2 JP 5066978B2
- Authority
- JP
- Japan
- Prior art keywords
- microprocessor
- data
- arithmetic processing
- switching control
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Description
本発明は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置において一部の演算処理ユニットのマイクロプロセッサに障害が生じた際に当該マイクロプロセッサの配下のメモリを利用するための情報処理装置の障害処理方法および情報処理装置自体の改良に関する。 The present invention relates to an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information and perform parallel arithmetic processing. The present invention relates to a failure processing method for an information processing apparatus and an improvement in the information processing apparatus itself for using a memory under the microprocessor when a failure occurs in a microprocessor of some arithmetic processing units.
マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置が既に公知である。 There is already known an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing. .
従来、この種の情報処理装置では一部の演算処理ユニットのマイクロプロセッサに障害が生じた際に、マイクロプロセッサのみならず、当該マイクロプロセッサの配下にあるメモリも同時に使用不能となる問題があった。 Conventionally, when the microprocessor of the processing unit of some of this kind of information processing apparatus failure occurs, not only the microprocessor, the memory also a problem of unusable simultaneously working under of the microprocessor It was.
メモリはマイクロプロセッサと同様に情報処理装置の価格に占める割合が大きく、実際には異常のないメモリが障害の生じたマイクロプロセッサと共に使用不能になることにはハードウェア資源の有効利用やコストパフォーマンスの観点から問題がある。 As with microprocessors, memory accounts for a large percentage of the price of information processing equipment. In fact, memory that is not abnormal cannot be used together with a failed microprocessor because of the effective use of hardware resources and cost performance. There is a problem from the point of view.
この種の問題に対処する技術としては、特許文献1に開示されるマルチプロセッサシステムのように、マイクロプロセッサとメモリを有する複数のプロセッサカードに対して1枚の予備プロセッサカードを設け、何れかのプロセッサカードに故障が生じた際に当該プロセッサカードの機能を予備プロセッサカードに全面的に引き継がせることで処理要求のコマンドの紛失を防止して処理を継続できるようにしたものが提案されている。
しかしながら、このマルチプロセッサシステムではプロセッサカードの機能を代替できる予備プロセッサカードが一枚だけであるため、複数のプロセッサカードに障害が生じた場合であっても、そのうちの1枚のプロセッサカードの機能を引き継げるに過ぎず、複数のプロセッサカードの障害に同時に対処することはできない。あるいは、複数のプロセッサカードの障害に対処すべく複数の予備プロセッサカードを設けるといったことも考えられるが、そうした場合、通常は使用しない予備プロセッサカードを同一システム上に何枚も配備しなければならず、コスト上の弊害が生じる。
As a technique for dealing with this type of problem, as in the multiprocessor system disclosed in
However, in this multiprocessor system, since only one spare processor card can replace the function of the processor card, even if a failure occurs in a plurality of processor cards, the function of one of the processor cards can be changed. It can only be taken over, and it cannot deal with failures of multiple processor cards at the same time. Alternatively, a plurality of spare processor cards may be provided to cope with failures of a plurality of processor cards. In such a case, however, a number of spare processor cards that are not normally used must be arranged on the same system. This causes cost problems.
そこで、本発明の課題は、前記従来技術の不都合を改善し、情報処理装置の構造自体に大きな改変を加えることなく、また、格別なプロトコルを利用することなく、情報処理装置における演算処理ユニットの複数のマイクロプロセッサの障害の発生にも対処してマイクロプロセッサの配下のメモリを有効に利用することのできる情報処理装置の障害処理方法および情報処理装置を提供することにある。 Therefore, the problem of the present invention is to improve the inconveniences of the prior art, without greatly modifying the structure of the information processing apparatus itself, and without using a special protocol. An object of the present invention is to provide a failure processing method for an information processing apparatus and an information processing apparatus capable of coping with the occurrence of a failure of a plurality of microprocessors and effectively using a memory under the microprocessor.
本発明における情報処理装置の障害処理方法は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なう情報処理装置のマイクロプロセッサに障害が生じた際に当該マイクロプロセッサの配下のメモリを利用するための情報処理装置の障害処理方法であり、前記課題を達成するため、特に、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続しておき、
何れかのマイクロプロセッサに障害が生じた際に、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサのメモリのデータ転送を代行させ、
各データ切り替え制御部への転送データの入力元に応じ、当該データ切り替え制御部への転送データの入力元がメモリであって該データ切り替え制御部のマイクロプロセッサに障害が生じている場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するようにしたことを特徴とする構成を有する。
In the failure processing method for an information processing apparatus according to the present invention, a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing. A failure processing method for an information processing device for using a memory under the microprocessor when a failure occurs in the microprocessor of the information processing device to be performed.
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected so as to transmit information,
When a failure occurs in any of the microprocessors, the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor is selected to Delegate data transfer of the resulting microprocessor memory,
Depending on the input source of the transfer data to each data switching control unit, the transfer data input source to the data switching control unit is a memory and the microprocessor of the data switching control unit has a failure and the data When the transfer data input source to the switching control unit is a microprocessor and the destination address specification exceeds the normal physical address of the memory in the relevant processing unit, the destination processing unit and the destination type Is attached to the transfer data, while the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit Has a configuration characterized in that the header is deleted from the transfer data.
障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行させる構成、つまり、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。更に、仮想マッピング技術を利用することで、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。
また、マイクロプロセッサに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになるので、各データ切り替え制御部への転送データの入力元に応じ、データ切り替え制御部間でのデータ転送に必要とされる情報、すなわち、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを各データ切り替え制御部の内部処理で転送データに添付したり削除したりすることにより、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。
Acts as a proxy for data transfer to the memory under the failed microprocessor by selecting the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor In other words, among the microprocessors provided in each of the plurality of arithmetic processing units, a microprocessor that does not cause a failure is a configuration that performs data transfer of a memory under the failure of the microprocessor that has failed. Even if a special spare processor card or spare arithmetic processing unit is not redundantly provided, data transfer to the memory under the faulty microprocessor can be realized. Furthermore, by using the virtual mapping technology, a microprocessor without a failure can perform data transfer of the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed, and to transfer the data in the memory under the other microprocessor that has failed, so that there is a failure in two or more microprocessors. Even if it occurs, it is possible to realize data transfer of the memory under each microprocessor in which the failure has occurred.
In addition, when a failure occurs in the microprocessor, data is written to and read from the memory under the microprocessor in which the failure has occurred, and the data of the arithmetic processing unit having the microprocessor in which the failure has occurred is switched. Data switching control is performed according to the input source of the transfer data to each data switching control unit because it is performed via the control unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Information required for data transfer between copies, that is, headers that specify the processing unit of the transfer destination and the type of transfer destination are attached to or deleted from the transfer data by internal processing of each data switching control unit The protocol used to transfer data between the microprocessor and memory is itself Ku without changing, can be addressed to the data transfer memory under microprocessor occurring failures.
本発明における情報処理装置は、マイクロプロセッサとメモリの組み合わせからなる演算処理ユニットを複数組併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なうようにした情報処理装置であり、前記と同様の課題を達成するため、
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続すると共に、
各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブルと、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶すると共に何れかのマイクロプロセッサに障害が生じた場合においては障害が生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして該マイクロプロセッサと演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブルとを備えたテーブル格納メモリを配備し、
前記各データ切り替え制御部には、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサの障害の有無を記憶する状態記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのメモリのデータ転送を代行すべきマイクロプロセッサを有する演算処理ユニットを記憶する転送代替マイクロプロセッサ記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶する転送代替ドメイン記憶レジスタと、当該データ切り替え制御部への転送データの入力元と前記状態記憶レジスタの状態を判定し、当該データ切り替え制御部への転送データの入力元がメモリであって前記状態記憶レジスタが障害を記憶している場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するデータ変換部とを設け、
何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、前記利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照して障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち前記利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させる一方、前記選択された演算処理ユニットの転送代替ドメイン記憶レジスタに前記障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させると共に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして前記利用済みゲートウェイ記憶テーブルを更新設定し、前記障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる運用状況更新設定手段を併設したことを特徴とする構成を有する。
The information processing apparatus according to the present invention includes a plurality of arithmetic processing units each including a combination of a microprocessor and a memory, and performs parallel arithmetic processing by connecting the microprocessors of the respective arithmetic processing units so that information can be transmitted. In order to achieve the same problem as described above,
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected to transmit information,
Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Stores the correspondence relationship between the gateway storage table, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit. When a failure occurs in one of the microprocessors, the correspondence relationship between the microprocessor and the arithmetic processing unit is assumed that the microprocessor in which the failure has occurred is acting as the data transfer for the memory in all other arithmetic processing units. Used gateway to remember Deploying a table storage memory and a 憶 table,
Each of the data switching control units includes a state storage register for storing the presence or absence of a failure of the microprocessor of the arithmetic processing unit provided with the data switching control unit, and a memory of the arithmetic processing unit provided with the data switching control unit A transfer alternative microprocessor storage register for storing an arithmetic processing unit having a microprocessor that should perform the data transfer of the data, and a microprocessor of the arithmetic processing unit provided with the data switching control unit should perform the data transfer of the memory The transfer alternative domain storage register that stores the arithmetic processing unit, the input source of the transfer data to the data switching control unit and the state of the state storage register are determined, and the input source of the transfer data to the data switching control unit is Memory and the state storage register indicates a fault. And when the transfer data input source to the data switching control unit is a microprocessor and the transfer destination address specification exceeds the normal physical address of the memory in the operation processing unit, While the header specifying the type of processing unit and transfer destination is attached to the transfer data, the input source of the transfer data to the data switching control unit is another data switching control unit, and the transfer destination is the data switching control unit. A data conversion unit that deletes the header from the transfer data when it is in the arithmetic processing unit,
When a failure occurs in the microprocessor of any of the arithmetic processing units, the arithmetic processing unit can refer to the available gateway storage table and the used gateway storage table to perform data transfer in the memory of the failed microprocessor. An arithmetic processing unit having a microprocessor not stored in the used gateway storage table is selected and stored in the transfer alternative microprocessor storage register of the data switching control unit of the failed microprocessor, while the selected The arithmetic processing unit having the failed microprocessor is stored in the transfer substitution domain storage register of the arithmetic processing unit, and the microprocessor of the selected arithmetic processing unit stores the data of the arithmetic processing unit. The data transfer of the memory of the arithmetic processing unit having the faulty microprocessor via the control unit, and the faulty microprocessor transfers the data of the memory in all other arithmetic processing units The used gateway storage table is updated and set as an agent, and operation status update setting means for storing the occurrence of the failure in the state storage register of the data switching control unit of the failed microprocessor is provided. It has the structure characterized by these.
以上の構成において、テーブル格納メモリ内の利用可能ゲートウェイ記憶テーブルに各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶させ、また、テーブル格納メモリ内の利用済みゲートウェイ記憶テーブルには、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶させておく。具体的には、データ切り替え制御部同士が相互に接続された演算処理ユニットのマイクロプロセッサの間でメモリのデータ転送の代行が可能である。データ切り替え制御部同士の接続の有無は情報処理装置の運用の前段階で明らかとなっているから、利用可能ゲートウェイ記憶テーブルの内容は予め設定しておくことができる。また、情報処理装置の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、テーブル格納メモリ内の利用済みゲートウェイ記憶テーブルは、演算処理ユニットのメモリのデータ転送を代行している演算処理ユニットは無いものとして初期設定される。
そして、何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、情報処理装置の運用状況更新設定手段が、テーブル格納メモリ内の利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照し、障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させ、また、選択された側の演算処理ユニットの転送代替ドメイン記憶レジスタには、障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させる。従って、障害を生じているマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部は、この演算処理ユニットのメモリのデータ転送をどの演算処理ユニットのマイクロプロセッサが代替しているかを認識することができ、また、選択された側の演算処理ユニットのデータ切り替え制御部は、この演算処理ユニットのマイクロプロセッサがどの演算処理ユニットのメモリのデータ転送を代替しているかを認識することができる。
情報処理装置の運用状況更新設定手段は、更に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして利用済みゲートウェイ記憶テーブルを更新設定し、障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる。
このようにして利用済みゲートウェイ記憶テーブルが更新設定される結果、その後、新たに別の演算処理ユニットのマイクロプロセッサに障害が生じたとしても、既に他の演算処理ユニットのメモリのデータ転送を代行しているマイクロプロセッサや其れ自体に障害の生じているマイクロプロセッサが障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行する対象として選択されることはなくなる。
一方、各演算処理ユニットのデータ切り替え制御部は、当該データ切り替え制御部への転送データの入力が確認される度に、当該転送データの入力元と状態記憶レジスタの状態を判定する。
そして、データ切り替え制御部への転送データの入力元がメモリであって状態記憶レジスタが障害を記憶している場合には、当該データ切り替え制御部のデータ変換部が、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する。つまり、データ切り替え制御部は各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられているのであるから、転送データの入力元がメモリであるということは配下のメモリから転送データが入力されていることを意味し、この際、当該データ切り替え制御部の状態記憶レジスタが障害の発生を記憶していれば、この演算処理ユニットのマイクロプロセッサに転送データを入力することはできないので、当該データ切り替え制御部のデータ変換部によって、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付した上で、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に転送する。具体的には、転送先の演算処理ユニットとしては当該データ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに其の時点で記憶されている演算処理ユニットを指定し、また、転送先のタイプとしてはマイクロプロセッサを指定することになる。
また、当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合にも、当該データ切り替え制御部のデータ変換部が、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付した上で、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に転送する。前述した通り、データ切り替え制御部は各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられているのであるから、転送データの入力元がマイクロプロセッサであるということは当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていないことを意味し、また、転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えているということは、この演算処理ユニットのマイクロプロセッサが仮想マッピング技術によって他の演算処理ユニットのマイクロプロセッサが行なうべきデータ転送を代替していることを意味するからである。具体的には、転送先の演算処理ユニットとしては当該データ切り替え制御部の転送代替ドメイン記憶レジスタに其の時点で記憶されている演算処理ユニットすなわち現時点で当該演算処理ユニットのマイクロプロセッサがデータ転送を代替しているマイクロプロセッサを有する演算処理ユニットを指定し、また、転送先のタイプとしてはメモリを指定することになる。
一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には、この転送データが最終的には当該演算処理ユニットのマイクロプロセッサもしくはメモリに入力されるものであって、この転送データに添付されたヘッダに記録された転送先のタイプによって其の宛先がマイクロプロセッサであるのかメモリであるのかは明らかであるから、当該データ切り替え制御部のデータ変換部は、転送データからヘッダを削除し、従来と同様にパケット変換を行い、この転送データを当該演算処理ユニットのマイクロプロセッサもしくはメモリに引き渡す。なお、この転送データの転送先が当該データ切り替え制御部の演算処理ユニット内にあるか否かについては、当初のヘッダに記録されている転送先の演算処理ユニットと当該データ切り替え制御部が配置されている演算処理ユニットとの関係に基いて判定可能である。当初のヘッダに記録されている転送先の演算処理ユニットと当該データ切り替え制御部が配置されている演算処理ユニットとが一致しない場合は、このデータ切り替え制御部を介して更に別のデータ切り替え制御部に当該データを転送する必要があることを意味するので、データ切り替え制御部のデータ変換部は、転送データからヘッダを削除する処理は行なわず、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に当該転送データをそのまま転送することになる。
以上に述べた通り、マイクロプロセッサに障害が生じた場合には、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになり、各データ切り替え制御部の間での転送データの受け渡しに際してのみ転送先の演算処理ユニットや転送先のタイプを指定するためのヘッダが利用されるに過ぎないから、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。
しかも、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。仮想マッピング技術を利用することで、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。
In the above configuration, the available gateway storage table in the table storage memory stores the microprocessor data of each arithmetic processing unit and the data in the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit. transfer stores the correspondence between the operation processing unit capable behalf, also, a table stored in the the used gateway storage table in the memory, the data switching control of the microprocessor and the microprocessor the processing unit of each processing unit The correspondence relationship with the arithmetic processing unit acting as a proxy for the data transfer of the memory via the unit is stored. Specifically, the data transfer of the memory can be performed between the microprocessors of the arithmetic processing units in which the data switching control units are mutually connected. Since the presence / absence of connection between the data switching control units has been clarified before the operation of the information processing apparatus, the contents of the usable gateway storage table can be set in advance. In addition, since there is no faulty microprocessor at the start of the operation of the information processing apparatus, the used gateway storage table in the table storage memory is an arithmetic process that performs the data transfer of the arithmetic processing unit memory. The unit is initially set as not present.
When a failure occurs in the microprocessor of any arithmetic processing unit, the operation status update setting unit of the information processing apparatus refers to the available gateway storage table and the used gateway storage table in the table storage memory, and The data switching control unit of the microprocessor in which a failure has occurred by selecting an arithmetic processing unit having a microprocessor that is not stored in the used gateway storage table from among the arithmetic processing units that can perform data transfer of the generated microprocessor memory The processing is stored in the transfer alternative microprocessor storage register, and the processing unit having the failed microprocessor is stored in the transfer replacement domain storage register of the selected processing unit. Therefore, the data switching control unit of the arithmetic processing unit having the failing microprocessor can recognize which arithmetic processing unit's microprocessor substitutes for the data transfer of the memory of this arithmetic processing unit, In addition, the data switching control unit of the selected arithmetic processing unit can recognize which arithmetic processing unit's memory data transfer is replaced by the microprocessor of the arithmetic processing unit.
The operation status update setting means of the information processing apparatus further includes a memory of the arithmetic processing unit in which the microprocessor of the selected arithmetic processing unit has the failed microprocessor via the data switching control unit of the arithmetic processing unit. In addition, the used gateway storage table is updated and set so that the failed microprocessor is acting as the data transfer for the memory in all other arithmetic processing units. The occurrence of the failure is stored in the state storage register of the data switching control unit of the microprocessor.
As a result of the updated setting of the used gateway storage table in this way, even if a failure occurs in the microprocessor of another processing unit after that, the data transfer of the memory of another processing unit is already performed. A microprocessor that has failed or a microprocessor that has failed itself is no longer selected as a proxy for data transfer in the memory of the arithmetic processing unit that has the failed microprocessor.
On the other hand, each time the transfer data input to the data switching control unit is confirmed, the data switching control unit of each arithmetic processing unit determines the input source of the transfer data and the state of the state storage register.
When the input source of the transfer data to the data switching control unit is a memory and the state storage register stores a failure, the data conversion unit of the data switching control unit Attach a header that specifies the type of transfer destination to the transfer data. That is, since the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit, the fact that the input source of the transfer data is the memory means that the transfer data is input from the subordinate memory. At this time, if the state storage register of the data switching control unit stores the occurrence of a failure, transfer data cannot be input to the microprocessor of the arithmetic processing unit. The data conversion unit of the control unit attaches a header specifying the transfer destination arithmetic processing unit and the transfer destination type to the transfer data, and then the data switching control unit of another arithmetic processing unit connected to the data switching control unit Forward to. Specifically, as the processing unit of the transfer destination, the processing unit stored at that time is designated in the transfer alternative microprocessor storage register of the data switching control unit, and the type of transfer destination is the micro processor. A processor will be specified.
In addition, even when the input source of the transfer data to the data switching control unit is a microprocessor and the address designation of the transfer destination exceeds the normal physical address of the memory in the arithmetic processing unit, the data switching control unit The data conversion unit attaches a header that specifies the processing unit of the transfer destination and the type of transfer destination to the transfer data, and then transfers it to the data switching control unit of another processing unit connected to the data switching control unit To do. As described above, since the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit, the fact that the input source of the transfer data is the microprocessor has the data switching control unit. This means that there is no failure in the microprocessor of the arithmetic processing unit, and that the address designation of the transfer destination exceeds the normal physical address of the memory in the arithmetic processing unit. This is because it means that the processor substitutes the data transfer to be performed by the microprocessor of another arithmetic processing unit by the virtual mapping technique. Specifically, as the processing unit of the transfer destination, the processing unit stored at that time in the transfer substitution domain storage register of the data switching control unit, that is, the microprocessor of the processing unit at this time transfers the data. An arithmetic processing unit having an alternative microprocessor is designated, and a memory is designated as the transfer destination type.
On the other hand, if the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit, this transfer data is finally Is input to the microprocessor or memory of the processing unit, and whether the destination is a microprocessor or a memory depending on the type of transfer destination recorded in the header attached to the transfer data. Since it is clear, the data conversion unit of the data switching control unit deletes the header from the transfer data, performs packet conversion in the same manner as before, and transfers the transfer data to the microprocessor or memory of the arithmetic processing unit. Whether or not the transfer destination of the transfer data is in the arithmetic processing unit of the data switching control unit includes the arithmetic processing unit of the transfer destination recorded in the initial header and the data switching control unit. It can be determined based on the relationship with the arithmetic processing unit. If the processing unit of the transfer destination recorded in the original header does not match the processing unit in which the data switching control unit is arranged, another data switching control unit is provided via this data switching control unit. The data conversion unit of the data switching control unit does not perform the process of deleting the header from the transfer data, and the other arithmetic processing unit connected to the data switching control unit. The transfer data is transferred as it is to the data switching control unit.
As described above, when a failure occurs in the microprocessor, the writing of data to the memory under the microprocessor in which the failure has occurred and the reading of data from the memory have the microprocessor in which the failure has occurred. Transfer data transfer between each data switching control unit is performed via the data switching control unit of the arithmetic processing unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Only the header used to specify the processing unit of the transfer destination and the type of the transfer destination is used at the time, so the protocol itself used for data transfer between the microprocessor and the memory is not changed at all. Deal with data transfer in the memory under the failing microprocessor Can.
In addition, among the microprocessors provided in each of the plurality of arithmetic processing units, a microprocessor in which no failure has occurred is configured to perform the data transfer of the memory under the failure of the microprocessor in which the failure has occurred. Even without redundantly arranging a processor card and a spare arithmetic processing unit, it is possible to realize data transfer to a memory under the microprocessor in which a failure has occurred. By using the virtual mapping technology, a microprocessor without a failure can perform data transfer of the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed and substitute the data transfer of the memory under the other microprocessor that has failed, so that two or more microprocessors have failed. Even in this case, it is possible to realize data transfer of the memory under each microprocessor in which the failure occurs.
情報処理装置の運用状況更新設定手段は、前記各演算処理ユニットと独立したマイクロプロセッサによって構成してもよいし、あるいは、情報処理装置のファームウェアによって構成してもよい。 The operation status update setting means of the information processing apparatus may be configured by a microprocessor independent of each arithmetic processing unit, or may be configured by firmware of the information processing apparatus.
本発明における情報処理装置の障害処理方法および情報処理装置は、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行させる構成、つまり、複数ある演算処理ユニットの各々に設けられたマイクロプロセッサのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。 The failure processing method and information processing apparatus of an information processing apparatus according to the present invention selects a microprocessor of an arithmetic processing unit having a data switching control unit connected to a data switching control unit of the arithmetic processing unit having the failed microprocessor. In other words, the configuration is such that the data transfer of the memory under the faulty microprocessor is substituted, that is, among the microprocessors provided in each of the plurality of processing units, the faultless microprocessor is the faulty microprocessor. Data transfer to the memory under the processor, so that data transfer to the memory under the faulty microprocessor can be performed without redundant provision of a special spare processor card or spare arithmetic processing unit. Can be realized.
更に、仮想マッピング技術を利用すれば、障害の生じていないマイクロプロセッサが当該マイクロプロセッサの配下の正規のメモリとは別に2組以上の演算処理ユニットのメモリのデータ転送を代行することができ、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させることも可能であるから、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を実現することが可能である。 Furthermore, if virtual mapping technology is used, a microprocessor in which no failure has occurred can transfer the data in the memory of two or more arithmetic processing units separately from the regular memory under the microprocessor, It is also possible to select two or more microprocessors that have not failed and substitute the data transfer of the memory under the other microprocessor that has failed, so that two or more microprocessors have failed. Even in such a case, it is possible to realize data transfer to the memory under each microprocessor in which a failure has occurred.
また、マイクロプロセッサに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しは、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行われることになるので、各データ切り替え制御部への転送データの入力元に応じ、データ切り替え制御部間でのデータ転送に必要とされる情報、すなわち、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを各データ切り替え制御部の内部処理で転送データに添付したり削除したりすることにより、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。 In addition, when a failure occurs in the microprocessor, data is written to and read from the memory under the microprocessor in which the failure has occurred, and the data of the arithmetic processing unit having the microprocessor in which the failure has occurred is switched. Data switching control is performed according to the input source of the transfer data to each data switching control unit because it is performed via the control unit and the data switching control unit of another arithmetic processing unit connected to the data switching control unit. Information required for data transfer between copies, that is, headers that specify the processing unit of the transfer destination and the type of transfer destination are attached to or deleted from the transfer data by internal processing of each data switching control unit The protocol used to transfer data between the microprocessor and memory is itself Ku without changing, can be addressed to the data transfer memory under microprocessor occurring failures.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
図1は本発明の障害処理方法を適用した一実施形態の情報処理装置の構成の概略について示したブロック図である。 FIG. 1 is a block diagram showing an outline of a configuration of an information processing apparatus according to an embodiment to which a failure processing method of the present invention is applied.
情報処理装置1は、マイクロプロセッサとメモリの組み合わせからなる4組の演算処理ユニットを併設し、各演算処理ユニットのマイクロプロセッサを情報伝達可能に接続して並列的な演算処理を行なう情報処理装置である。
The
4組の演算処理ユニットの構成は同等であるので、ここでは、1つの演算処理ユニット2aを取り上げて構造を説明する。演算処理ユニット2aは、1つのマイクロプロセッサ3aと4つのメモリ(Dual Inline Memory Module)4a,5a,6a,7aを備え、マイクロプロセッサ3aとメモリ4aとの間に、情報伝達経路を切り替えるためのデータ切り替え制御部8aが設けられている。
Since the four sets of arithmetic processing units have the same configuration, the structure will be described here by taking up one
他の3つの演算処理ユニット2b,2c,2dに関しても其の構成は演算処理ユニット2aと同等であり、このうち、演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されている。
The configuration of the other three
また、各演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dは、並列的な演算処理を行なう関係上、その全てが情報伝達可能に接続されている。
Further, the
次に、この実施形態に固有の構成要素であるデータ切り替え制御部8a,8b,8c,8dの構成について、データ切り替え制御部8aを例にとって図2の機能ブロック図を参照して説明する。
Next, the configuration of the data switching
データ切り替え制御部8aには、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aの障害の有無を記憶するための状態記憶レジスタ9と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aに障害が生じた際に此の演算処理ユニット2aに設けられているメモリ4a,5a,6a,7aのデータ転送を代行させるべき演算処理ユニットを記憶させるための転送代替マイクロプロセッサ記憶レジスタ10と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aのマイクロプロセッサ3aがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶するための転送代替ドメイン記憶レジスタ11と、当該データ切り替え制御部8aが設けられた演算処理ユニット2aの番号をドメイン名として記憶するための自己ドメイン記憶レジスタ12と、当該データ切り替え制御部8aが設けられた演算処理ユニット2a内に実装可能なメモリの最大接続数を記憶するための接続メモリ数記憶レジスタ13と、出力先切り替えスイッチ14と、データ変換部15、更には、ルーティングテーブル22が備えられている。
The data switching
なお、演算処理ユニット2a内にはメモリ4a,5a,6a,7aの4個のメモリが設けられているが、最初のメモリ4aに相当する値を0として規定しているので、接続メモリ数記憶レジスタ13に実際に記憶される最大接続メモリ数の値は「3」である。
The
出力先切り替えスイッチ14は、当該データ切り替え制御部8aが設けられた演算処理ユニット2a内においてマイクロプロセッサ3aとメモリ4aとを接続する情報伝達経路と、メモリ4aもしくはマイクロプロセッサ3aの何れか一方と他の演算処理ユニット2bのデータ切り替え制御部8bとを接続する情報伝達経路と、メモリ4aもしくはマイクロプロセッサ3aの何れか一方と更に他の演算処理ユニットのデータ切り替え制御部とを接続する情報伝達経路の中から何れかの情報伝達経路を選択的に閉成するためのスイッチである。
The output
また、データ変換部15は、転送データのパケット変換を行うほか、出力先切り替えスイッチ14を介してデータ切り替え制御部8aに入出力される転送データに対して転送先となる演算処理ユニットや転送先のタイプ(メモリもしくはマイクロプロセッサの何れか)を指定するヘッダを添付したり削除したりする機能を備える。
具体的には、当該データ切り替え制御部8aへの転送データの入力元と当該データ切り替え制御部8aの状態記憶レジスタ9の状態を判定し、当該データ切り替え制御部8aへの転送データの入力元がメモリ4a,5a,6a,7aであって状態記憶レジスタ9が障害を記憶している場合と当該データ切り替え制御部8aへの転送データの入力元がマイクロプロセッサ3aであって転送先のアドレス指定が当該演算処理ユニット2aにおけるメモリの正規の物理アドレス(接続メモリ数の値としては3)を超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付して他のデータ切り替え制御部(図1および図2の例ではデータ切り替え制御部8b)に転送する一方、当該データ切り替え制御部8aへの転送データの入力元が他のデータ切り替え制御部(図1および図2の例ではデータ切り替え制御部8b)であって転送先が当該データ切り替え制御部8aの演算処理ユニット2a内にある場合つまりヘッダによる転送先の指定が演算処理ユニット2aである場合に転送データからヘッダを削除し、ヘッダによるタイプの指定に応じて当該転送データをマイクロプロセッサ3aもしくはメモリ4a,5a,6a,7aに引き渡す。
Further, the
Specifically, the input source of the transfer data to the data switching
データ変換部15の主要部は、データ切り替え制御部8aに実装された切り替え制御用マイクロプロセッサ23によって構成されており、出力先切り替えスイッチ14は切り替え制御用マイクロプロセッサ23によって駆動制御される。また、切り替え制御用マイクロプロセッサ23は、状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11,自己ドメイン記憶レジスタ12,接続メモリ数記憶レジスタ13,ルーティングテーブル22に対してアクセス可能である。
The main part of the
転送データに添付されるヘッダの構成の概略を図3の概念図に示す。ヘッダの主要部はデータの転送先となる演算処理ユニット2a,2b,2c,2dの何れかを指定するためのドメイン指定部19と、転送先がマイクロプロセッサであるのかメモリであるのかを指定するタイプ指定部20とで構成される。
An outline of the structure of the header attached to the transfer data is shown in the conceptual diagram of FIG. The main part of the header designates a
データ切り替え制御部8aには、データの転送先とデータの転送経路との対応関係を記憶したルーティングテーブル22が配備されているので、切り替え制御用マイクロプロセッサ23は、データの転送先さえ明らかであれば、ルーティングテーブル22からデータの転送先に対応するデータの転送経路を検索して、他のデータ切り替え制御部や他の演算処理ユニットのマイクロプロセッサ等を経由させて目的とする転送先にデータを転送することが可能である。
Since the data switching
データ切り替え制御部8b,8c,8dの構成は基本的に前述のデータ切り替え制御部8aの場合と同様であり、各データ切り替え制御部8b,8c,8dにおける出力先切り替えスイッチ14の接続関係のみがデータ切り替え制御部8aの場合と相違する。出力先切り替えスイッチ14の接続関係は図1に示した通りであり、演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されている。
The configuration of the data switching
各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブル16と、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブル17は、図1に示されるように、情報処理装置1の内部に設置された不揮発性RAM等からなるテーブル格納メモリ18の内部に設けられている。
Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Use for storing the correspondence relationship between the gateway storage table 16, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit As shown in FIG. 1, the completed gateway storage table 17 is provided in a
利用可能ゲートウェイ記憶テーブル16の論理構成を図4の概念図に、また、利用済みゲートウェイ記憶テーブル17の論理構成を図5の概念図に示す。 The logical configuration of the available gateway storage table 16 is shown in the conceptual diagram of FIG. 4, and the logical configuration of the used gateway storage table 17 is shown in the conceptual diagram of FIG.
図4に示した利用可能ゲートウェイ記憶テーブル16の行方向の数字0,1,2,3の各々は演算処理ユニット2a,2b,2c,2dに対応し、また、列方向の数字0,1,2,3の各々はマイクロプロセッサ3a,3b,3c,3dに対応する。図1に示した例では演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8b、および、演算処理ユニット2cのデータ切り替え制御部8cと演算処理ユニット2dのデータ切り替え制御部8dとが情報伝達可能に接続されているから、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能なのは演算処理ユニット2bのマイクロプロセッサ3bのみであり、利用可能ゲートウェイ記憶テーブル16の第1行には初期設定時の処理で0,1,0,0が設定されることになる。ここで、〔演算処理ユニット2a,マイクロプロセッサ3b〕に相当する〔1,2〕スポットに設定される値「1」は、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能であることを示す値である。また、演算処理ユニット2bのメモリ4b,5b,6b,7bのデータ転送を代替することが可能なのは演算処理ユニット2aのマイクロプロセッサ3aのみであるから、利用可能ゲートウェイ記憶テーブル16の第2行には初期設定時の処理で1,0,0,0が設定されることになる。前記と同様、〔演算処理ユニット2b,マイクロプロセッサ3a〕に相当する〔2,1〕スポットに設定される値「1」は、演算処理ユニット2aのマイクロプロセッサ3aが演算処理ユニット2bのマイクロプロセッサ3bに替わって演算処理ユニット2bのメモリ4b,5b,6b,7bのデータ転送を代替することが可能であることを示す値である。同様に、演算処理ユニット2cのメモリ4c,5c,6c,7cのデータ転送を代替することが可能なのは演算処理ユニット2dのマイクロプロセッサ3dのみであるから、利用可能ゲートウェイ記憶テーブル16の第3行には初期設定時の処理で0,0,0,1が設定される。〔演算処理ユニット2c,マイクロプロセッサ3d〕に相当する〔3,4〕スポットに設定される値「1」は、演算処理ユニット2dのマイクロプロセッサ3dが演算処理ユニット2cのマイクロプロセッサ3cに替わって演算処理ユニット2cのメモリ4c,5c,6c,7cのデータ転送を代替することが可能であることを示す値である。また、演算処理ユニット2dのメモリ4d,5d,6d,7dのデータ転送を代替することが可能なのは演算処理ユニット2cのマイクロプロセッサ3cのみであるから、利用可能ゲートウェイ記憶テーブル16の第4行には初期設定時の処理で0,0,1,0が設定されることになる。〔演算処理ユニット2d,マイクロプロセッサ3c〕に相当する〔4,3〕スポットに設定される値「1」は、演算処理ユニット2cのマイクロプロセッサ3cが演算処理ユニット2dのマイクロプロセッサ3dに替わって演算処理ユニット2dのメモリ4d,5d,6d,7dのデータ転送を代替することが可能であることを示す値である。
Each of the
利用済みゲートウェイ記憶テーブル17の論理構成も実質的には利用可能ゲートウェイ記憶テーブル16の論理構成と同等であり、図5に示した利用済みゲートウェイ記憶テーブル17の行方向の数字0,1,2,3の各々が演算処理ユニット2a,2b,2c,2dに対応し、また、列方向の数字0,1,2,3の各々がマイクロプロセッサ3a,3b,3c,3dに対応する。情報処理装置1の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、利用済みゲートウェイ記憶テーブル17には、他の演算処理ユニット2a,2b,2c,2dのメモリのデータ転送を代行しているマイクロプロセッサは存在しないものとして、〔1,1〕スポット〜〔4,4〕スポットの全ての欄に、初期設定時の処理で、メモリのデータ転送を代行していないことを示す値「0」が図7のようにして設定される。具体的には、例えば、図7の利用済みゲートウェイ記憶テーブル17における〔1,2〕スポットの値「0」は、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替していないことを示す値である。もし、仮に、利用済みゲートウェイ記憶テーブル17における〔1,2〕スポットに値「1」が設定されていたとするなら、この値「1」の意味合いは、演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aに替わって演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替しているというものとなる。
The logical configuration of the used gateway storage table 17 is substantially the same as the logical configuration of the available gateway storage table 16, and the
この実施形態における運用状況更新設定手段は、図1に示されるように、各演算処理ユニット2a,2b,2c,2dと独立して情報処理装置1内に配備された障害処理用マイクロプロセッサ21によって構成されている。
As shown in FIG. 1, the operation status update setting means in this embodiment is implemented by a
運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、データ切り替え制御部8a,8b,8c,8dの各切り替え制御用マイクロプロセッサ23を介してデータ切り替え制御部8a,8b,8c,8dの各状態記憶レジスタ9と各転送代替マイクロプロセッサ記憶レジスタ10および各転送代替ドメイン記憶レジスタ11と各自己ドメイン記憶レジスタ12ならびに各接続メモリ数記憶レジスタ13に対して初期設定処理やデータの書き換え等の操作が行えるように、データ切り替え制御部8a,8b,8c,8dの全てに対して情報伝達可能に接続され、同時に、マイクロプロセッサ3a,3b,3c,3dに対しても各々のマイクロプロセッサ3a,3b,3c,3dからの障害通知信号等を読み込めるようにして接続され、更に、テーブル格納メモリ18に対しても利用可能ゲートウェイ記憶テーブル16や利用済みゲートウェイ記憶テーブル17に対するデータの初期設定や参照および書き換え処理ができるようにして接続されている。
The
次に、演算処理ユニット2a,2b,2c,2dのデータ切り替え制御部8a,8b,8c,8dにおけるデータ変換部として機能する各切り替え制御用マイクロプロセッサ23によって実行される初期化処理の概略について説明する。
Next, an outline of initialization processing executed by each switching
ここではデータ切り替え制御部8aの切り替え制御用マイクロプロセッサ23が実行する初期化処理を例にとって説明するが、データ切り替え制御部8b,8c,8dの各切り替え制御用マイクロプロセッサ23による初期化処理も実質的な内容は同等である。
Here, the initialization process executed by the switching
システムの初期化に際し、データ切り替え制御部8aの切り替え制御用マイクロプロセッサ23は、まず、データ切り替え制御部8aが演算処理ユニット2aの配下にあることを示す値「0」をデータ切り替え制御部8aの自己ドメイン記憶レジスタ12に設定する(図8参照)。
Upon initialization of the system, the switching
これと同様、データ切り替え制御部8bの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8bが演算処理ユニット2bの配下にあることを示す値「1」をデータ切り替え制御部8bの自己ドメイン記憶レジスタ12に設定し、データ切り替え制御部8cの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8cが演算処理ユニット2cの配下にあることを示す値「2」をデータ切り替え制御部8cの自己ドメイン記憶レジスタ12に設定し、データ切り替え制御部8dの切り替え制御用マイクロプロセッサ23はデータ切り替え制御部8dが演算処理ユニット2dの配下にあることを示す値「3」をデータ切り替え制御部8dの自己ドメイン記憶レジスタ12に設定する。
Similarly, the
次に、情報処理装置1の障害処理用マイクロプロセッサ21によって実行される利用可能ゲートウェイ記憶テーブル16の初期設定処理の概略について図9のフローチャートを参照して説明する。
Next, an outline of the initial setting process of the usable gateway storage table 16 executed by the
初期設定処理を開始した障害処理用マイクロプロセッサ21は、まず、演算処理ユニット2aの配下にあるデータ切り替え制御部8aに実装された切り替え制御用マイクロプロセッサ23をポーリングしてデータ切り替え制御部8aの出力先切り替えスイッチ14が他のデータ切り替え制御部の出力先切り替えスイッチに接続されているか否かを確認し(ステップa1)、データ切り替え制御部8aの出力先切り替えスイッチ14に接続されているデータ切り替え制御部を有する演算処理ユニットに対しては当該演算処理ユニットの配下のマイクロプロセッサが演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することができるものと見做して利用可能ゲートウェイ記憶テーブル16の〔演算処理ユニット2a,接続先の演算処理ユニットのマイクロプロセッサ〕スポットの欄に代替可能を示す値「1」を設定する一方(ステップa2)、データ切り替え制御部8aの出力先切り替えスイッチ14に接続されていないデータ切り替え制御部を有する演算処理ユニットに対しては当該演算処理ユニットの配下のマイクロプロセッサは演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することができないものと見做して利用可能ゲートウェイ記憶テーブル16の〔演算処理ユニット2a,接続先されていない演算処理ユニットのマイクロプロセッサ〕スポットの欄に代替不能を示す値「0」を設定する(ステップa3)。
The
既に述べた通り、図1に示した例では演算処理ユニット2aのデータ切り替え制御部8aと演算処理ユニット2bのデータ切り替え制御部8bが情報伝達可能に接続されているから、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替することが可能なのは演算処理ユニット2bのマイクロプロセッサ3bのみとなり、利用可能ゲートウェイ記憶テーブル16の第1行には図6に示されるように0,1,0,0が設定されることになる。
なお、〔1,1〕スポットの〔演算処理ユニット2a,演算処理ユニット2aのマイクロプロセッサ3a〕の欄を「1」に設定するのは、マイクロプロセッサ3aに障害が生じた場合にマイクロプロセッサ3aの処理をマイクロプロセッサ3aが代替することができないからである。
As already described, in the example shown in FIG. 1, the data switching
Note that the [1, 1] spot [
以下、障害処理用マイクロプロセッサ21が、演算処理ユニット2b,2c,2dの配下にあるデータ切り替え制御部8b,8c,8dの替え制御用マイクロプロセッサ23を順にポーリングして前記と同様に図9の初期設定処理を繰り返し実行することで、利用可能ゲートウェイ記憶テーブル16の第2行に1,0,0,0を、利用可能ゲートウェイ記憶テーブル16の第3行に0,0,0,1を、利用可能ゲートウェイ記憶テーブル16の第4行に0,0,1,0を設定する(図6参照)。
Thereafter, the
また、情報処理装置1の運用の開始時点では障害の生じているマイクロプロセッサは存在しないから、利用済みゲートウェイ記憶テーブル17には、他の演算処理ユニットのメモリのデータ転送を代行しているマイクロプロセッサは存在しないものとして、〔1,1〕スポット〜〔4,4〕スポットの全ての欄に、メモリのデータ転送を代行していないことを示す値「0」が障害処理用マイクロプロセッサ21により図7のようにして設定され、同様に、各データ切り替え制御部8a,8b,8c,8dの状態記憶レジスタ9の全てには、これらのデータ切り替え制御部8a,8b,8c,8dが属する演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dに障害のないことを示す値「Enable」が、例えば、図8に示されるようにして設定される。
Further, since there is no faulty microprocessor at the start of operation of the
更に、演算処理ユニット2a,2b,2c,2d内には何れも4個のメモリが設けられているので、データ切り替え制御部8a,8b,8c,8dの接続メモリ数記憶レジスタ13には、例えば、データ切り替え制御部8aを例にとって図8に示すように、全て「3」が設定されることになる。前述した通り、最大接続数を「3」とするのは最初のメモリに相当する値を0として規定しているからである。
Furthermore, since all four memories are provided in the
次に、何れかの演算処理ユニットのマイクロプロセッサに障害が生じた場合に運用状況更新設定手段としての障害処理用マイクロプロセッサ21が実行する状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11および利用済みゲートウェイ記憶テーブル17の設定更新処理について図10のフローチャートを参照して説明する。
Next, when a failure occurs in the microprocessor of any of the arithmetic processing units, the
ここでは一例として演算処理ユニット2aのマイクロプロセッサ3aに障害が生じた場合について説明するが、他の演算処理ユニット2b,2c,2dのマイクロプロセッサ3b,3c,3dに障害が生じた場合の処理も此れと同様である。
Here, the case where a failure occurs in the
演算処理ユニット2aのマイクロプロセッサ3aからの障害通知信号が検知されると、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、まず、演算処理ユニット2aに対応する情報を記憶した利用可能ゲートウェイ記憶テーブル16の第1行と、同じく演算処理ユニット2aに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第1行を検索し(ステップb1)、障害の生じたマイクロプロセッサ3aの属する演算処理ユニット2aに設けられているメモリ4a,5a,6a,7aのデータ転送を代行することが可能なマイクロプロセッサが存在するか否かを判定し、存在するとした場合には、更に、そのマイクロプロセッサが他のマイクロプロセッサのデータ転送を代替することが可能な状態にあるか否かを判定する(ステップb2)。
図6の利用可能ゲートウェイ記憶テーブル16の例では演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのマイクロプロセッサ3aの処理を代替でき(図6の〔1,2〕スポット参照)、かつ、図7の利用済みゲートウェイ記憶テーブル17に示されるように、演算処理ユニット2bのマイクロプロセッサ3bは現時点では他の演算処理ユニットのメモリのデータ転送を代行していないから(図7の第2列参照)、新たに障害を生じた演算処理ユニット2aのマイクロプロセッサ3aの配下のメモリ4a,5a,6a,7aのデータ転送を代替するマイクロプロセッサとして、演算処理ユニット2bのマイクロプロセッサ3bが選択されることになる。
When a failure notification signal from the
In the example of the usable gateway storage table 16 in FIG. 6, the
従って、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、マイクロプロセッサ3bを有する演算処理ユニット2bを表す値「1」を障害の生じたマイクロプロセッサ3aを有する演算処理ユニット2aのデータ切り替え制御部8aにおける転送代替マイクロプロセッサ記憶レジスタ10に設定することにより、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代行させるマイクロプロセッサとしてマイクロプロセッサ3bが選択されたことをデータ切り替え制御部8aに記憶させると共に(ステップb3,図11参照)、マイクロプロセッサ3bを有する演算処理ユニット2bのデータ切り替え制御部8bにおける転送代替ドメイン記憶レジスタ11には、障害を生じたマイクロプロセッサ3aを有する演算処理ユニット2aを表す値「0」を設定することで、演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代行するマイクロプロセッサとして自らのマイクロプロセッサ3bが選択されたことをデータ切り替え制御部8bに記憶させる(ステップb4,図12参照)。
Therefore, the
次いで、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、障害の生じたマイクロプロセッサ3aに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第1列のスポットの全てに代替不能を示す値「1」を設定することで、障害の生じたマイクロプロセッサ3aが他の如何なるマイクロプロセッサのデータ転送も代替できなくなったことを記憶させると共に、障害の生じたマイクロプロセッサ3aのデータ転送を代替することになったマイクロプロセッサ3bに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第2列のスポットの全てに代替不能を示す値「1」を設定することで、マイクロプロセッサ3aのデータ転送の代替によってマイクロプロセッサ3bの負荷が増大するために該マイクロプロセッサ3bに更に他のマイクロプロセッサのデータ転送を代替する余力がなくなったことを記憶させる(ステップb5,図13参照)。
ここで、利用済みゲートウェイ記憶テーブル17の第1列のスポットの全てに代替不能を示す値「1」を設定する処理は、障害の生じたマイクロプロセッサ3aが他の全ての演算処理ユニット2b,2c,2d内のメモリのデータ転送を代行しているものと見做して利用済みゲートウェイ記憶テーブル17を設定する場合の処理と実質的に同等である。
Next, the
Here, the process of setting the value “1” indicating non-replacement to all the spots in the first column of the used gateway storage table 17 is performed by the
なお、この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提としているが、マイクロプロセッサの処理能力や仮想マッピングの設定しだいでは、1つのマイクロプロセッサが他の2つ以上のマイクロプロセッサのデータ転送を代替することも可能であり、そのような場合は、障害の生じたマイクロプロセッサ3aのデータ転送を代替することになったマイクロプロセッサ3bに対応する情報を記憶した利用済みゲートウェイ記憶テーブル17の第2列のスポットの全てに代替不能を示す値「1」を設定する必要は必ずしもなく、利用済みゲートウェイ記憶テーブル17の〔1,2〕スポットのみに代替不適を示す値「1」を設定し、このマイクロプロセッサ3bによって更に他のマイクロプロセッサのデータ転送を代替させる余地を残すようにしてもよい。
In this embodiment, it is assumed that one microprocessor replaces only the data transfer of the other microprocessor. However, depending on the processing capacity of the microprocessor and the setting of the virtual mapping, one microprocessor is the other. It is also possible to replace the data transfer of two or more microprocessors, and in such a case, information corresponding to the
次いで、運用状況更新設定手段として機能する障害処理用マイクロプロセッサ21は、障害の生じたマイクロプロセッサ3aを有する演算処理ユニット2aのデータ切り替え制御部8aにおける状態記憶レジスタ9に障害の発生を示す値「Disable」を設定し、このデータ切り替え制御部8aの属する演算処理ユニット2aのマイクロプロセッサ3aに障害が生じたことをデータ切り替え制御部8aに記憶させて(ステップb6,図14参照)、状態記憶レジスタ9,転送代替マイクロプロセッサ記憶レジスタ10,転送代替ドメイン記憶レジスタ11および利用済みゲートウェイ記憶テーブル17の設定更新処理を終える。
Next, the
次に、何れかの演算処理ユニットのマイクロプロセッサに障害が生じた状況下でデータ切り替え制御部8a,8b,8c,8dが実行する処理、特に、各データ切り替え制御部8a,8b,8c,8dにおいてデータ変換部15として機能する切り替え制御用マイクロプロセッサ23の処理動作について図15のフローチャートを参照して説明する。
Next, processing executed by the data switching
ここでは一例として、演算処理ユニット2aのマイクロプロセッサ3aに障害が生じ、マイクロプロセッサ3aに代わって演算処理ユニット2bのマイクロプロセッサ3bが演算処理ユニット2aのメモリ4a,5a,6a,7aのデータ転送を代替する場合について説明するが、他の演算処理ユニット2b,2c,2dのマイクロプロセッサ3b,3c,3dに障害が生じた場合の処理も此れと同様である。
Here, as an example, a failure occurs in the
データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、該切り替え制御用マイクロプロセッサ23の設置されたデータ切り替え制御部への転送データの入力を定常的に見張っており、転送データの入力が確認される度に、当該転送データの入力元を判定する(ステップc1)。
The switching
ここで、データ切り替え制御部への転送データの入力元がメモリであった場合には、データ切り替え制御部が各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられていることから、このデータ切り替え制御部と直接的に接続された同一演算処理ユニット内のメモリからのデータ転送であることが明らかである。 Here, when the input source of the transfer data to the data switching control unit is a memory, the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit. It is clear that the data transfer is from a memory in the same arithmetic processing unit directly connected to the switching control unit.
従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、このデータ切り替え制御部の状態記憶レジスタ9の設定状態が「Enable」となっているのか「Disable」となっているのかを判定する(ステップc6)。
Therefore, the switching
状態記憶レジスタ9の設定状態が「Enable」となっている場合には当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていないことを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと当該演算処理ユニット内のマイクロプロセッサを接続し、メモリからの転送データを其のまま当該演算処理ユニット内のマイクロプロセッサに引き渡す(ステップc7)。
例えば、演算処理ユニット2b内のメモリ4b,5b,6b,7bからの転送データが演算処理ユニット2b内のデータ切り替え制御部8bに入力された場合では、図12に示されるように、データ切り替え制御部8bの状態記憶レジスタ9の設定状態が「Enable」となっているから、メモリ4b,5b,6b,7bからの転送データがデータ切り替え制御部8bを介して其のまま当該演算処理ユニット2b内のマイクロプロセッサ3bに引き渡されることになる(図16のX1を参照)。
When the setting state of the
For example, when transfer data from the
一方、ステップc6の判定結果が偽となった場合、つまり、状態記憶レジスタ9の設定状態が「Disable」となっている場合には、当該データ切り替え制御部を有する演算処理ユニットのマイクロプロセッサに障害が生じていることを意味するので、当該演算処理ユニットのマイクロプロセッサに配下のメモリからデータを転送することはできない。従って、この場合、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを当該転送データに添付した上で(ステップc8)、出力先切り替えスイッチ14を制御して当該データ切り替え制御部と接続関係にある他のデータ切り替え制御部に当該演算処理ユニット内のメモリを接続し、転送先に最も近いデータ切り替え制御部に当該メモリからの転送データを送出する(ステップc9)。
例えば、演算処理ユニット2a内のメモリ4a,5a,6a,7aからの転送データが演算処理ユニット2a内のデータ切り替え制御部8aに入力された場合では、図14に示されるように、状態記憶レジスタ9の設定状態が「Disable」となっているから、データ切り替え制御部8aの切り替え制御用マイクロプロセッサ23は、図14に示されるようなデータ切り替え制御部8aの転送代替マイクロプロセッサ記憶レジスタ10を参照して、転送先となる演算処理ユニット2bのマイクロプロセッサ3bを表す値「1」をドメイン指定部19に設定し且つ転送先のタイプであるマイクロプロセッサをタイプ指定部20に設定したヘッダを転送データに添付した上で、出力先切り替えスイッチ14を当該データ切り替え制御部8aと接続関係にあるデータ切り替え制御部8bに接続して、該演算処理ユニット2a内のメモリ4a,5a,6a,7aからの転送データをデータ切り替え制御部8bに送出することになる(図16のX3を参照)。
On the other hand, if the determination result in step c6 is false, that is, if the setting state of the
For example, when transfer data from the
また、ステップc1の判定処理においてデータ切り替え制御部への転送データの入力元がマイクロプロセッサであった場合には、データ切り替え制御部が各演算処理ユニットのマイクロプロセッサとメモリとの間に設けられていることから、このデータ切り替え制御部と直接的に接続された同一演算処理ユニット内のマイクロプロセッサからのデータ転送であることが明らかである。 Further, when the transfer data input source to the data switching control unit is a microprocessor in the determination process of step c1, the data switching control unit is provided between the microprocessor and the memory of each arithmetic processing unit. Therefore, it is clear that the data transfer is from the microprocessor in the same arithmetic processing unit directly connected to the data switching control unit.
従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データの転送先のメモリのアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えているか否か、即ち、アドレス指定が最大接続数「3」の範囲内にあるのか、或いは、最大接続数「3」を超えた仮想マッピングの範囲(この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提としているので仮想マッピングの際のアドレス指定の値は4〜7となる)にあるのかを判定する(ステップc2)。
Therefore, the switching
アドレス指定が最大接続数「3」の範囲内にあってステップc2の判定結果が真となった場合には、当該演算処理ユニット内のメモリを宛先とした転送データであることを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと当該演算処理ユニット内のマイクロプロセッサを接続し、マイクロプロセッサからの転送データを其のまま当該演算処理ユニット内のメモリに引き渡す(ステップc3)。
例えば、演算処理ユニット2bのマイクロプロセッサ3bから演算処理ユニット2bのメモリ4b,5b,6b,7bにデータが転送される場合では、アドレス指定が最大接続数「3」の範囲内となるので、マイクロプロセッサ3bからの転送データがデータ切り替え制御部8bを介して其のまま当該演算処理ユニット2b内のメモリ4b,5b,6b,7bに引き渡されることになる(図16のX1を参照)。
If the address designation is within the range of the maximum number of connections “3” and the determination result of step c2 is true, it means that the transfer data is destined for the memory in the arithmetic processing unit. The switching
For example, when data is transferred from the
これに対し、ステップc2の判定結果が偽となった場合、つまり、アドレス指定が最大接続数「3」の範囲を超えていた場合には、この転送データは本来は当該演算処理ユニットのマイクロプロセッサを経由して転送されるべきものではないが、当該演算処理ユニットのマイクロプロセッサが他の演算処理ユニットのマイクロプロセッサのデータ転送を代替しているために転送の必要が生じたデータであるということを意味するから、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先の演算処理ユニットや転送先のタイプを指定するヘッダを当該転送データに添付した上で(ステップc4)、出力先切り替えスイッチ14を制御して当該データ切り替え制御部と接続関係にある他のデータ切り替え制御部に当該演算処理ユニット内のマイクロプロセッサを接続し、転送先に最も近いデータ切り替え制御部に当該演算処理ユニット内のマイクロプロセッサからの転送データを送出する(ステップc5)。
例えば、演算処理ユニット2bのマイクロプロセッサ3bからの転送データが演算処理ユニット2b内のデータ切り替え制御部8bに入力され、その際にアドレス指定が最大接続数「3」の範囲を超えていたとすれば、この転送データは本来は演算処理ユニット2bのマイクロプロセッサ3bが転送すべきものではないが、マイクロプロセッサ3aに障害が生じているために演算処理ユニット2bのマイクロプロセッサ3bが仮想マッピングのアドレスを利用して当該データ切り替え制御部8bに引き渡したものであると解されるので、データ切り替え制御部8bの切り替え制御用マイクロプロセッサ23は、図12に示されるようなデータ切り替え制御部8bの転送代替ドメイン記憶レジスタ11を参照して、転送先となる演算処理ユニット2aを表す値「0」をドメイン指定部19に設定し且つ転送先のタイプであるメモリをタイプ指定部20に設定したヘッダを転送データに添付した上で、出力先切り替えスイッチ14を当該データ切り替え制御部8bと接続関係にあるデータ切り替え制御部8aに接続して、該演算処理ユニット2b内のマイクロプロセッサ3bからの転送データをデータ切り替え制御部8aに送出することになる(図16のX2を参照)。
On the other hand, if the determination result in step c2 is false, that is, if the address designation exceeds the range of the maximum number of connections “3”, the transfer data is originally stored in the microprocessor of the arithmetic processing unit. Although the data should not be transferred via the microprocessor, it is data that needs to be transferred because the microprocessor of the relevant processing unit replaces the data transfer of the microprocessor of another processing unit. Therefore, the switching
For example, if transfer data from the
また、ステップc1の判定処理においてデータ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であった場合には、別の演算処理ユニット内のマイクロプロセッサもしくはメモリからのデータ転送であることが明らかである。 Further, when the transfer data input source to the data switching control unit is another data switching control unit in the determination process of step c1, the data is transferred from the microprocessor or the memory in another arithmetic processing unit. It is clear.
従って、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致しているか否かを判定する(ステップc10)。
Therefore, the switching
転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致している場合には、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、更に、転送データのヘッダで指定されているタイプがマイクロプロセッサであるのかメモリであるのかを判定し(ステップc11)、メモリである場合には、転送先やタイプを指定するヘッダを当該転送データから削除し、従来と同様に転送データのパケット変換を行い(ステップc12)、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のメモリと入力元のデータ切り替え制御部を接続し、入力元のデータ切り替え制御部からの転送データを当該演算処理ユニット内のメモリに引き渡す(ステップc13)。
例えば、前述のステップc4,c5の処理で演算処理ユニット2bのマイクロプロセッサ3bが仮想マッピングのアドレスを利用して演算処理ユニット2bのデータ切り替え制御部8bから送出した転送データが演算処理ユニット2aのデータ切り替え制御部8aに入力された場合では、転送先となる演算処理ユニット2aを表す値「0」がドメイン指定部19に設定され且つ転送先のタイプであるメモリがタイプ指定部20に設定されたヘッダを有する転送データが演算処理ユニット2bのデータ切り替え制御部8bから演算処理ユニット2aのデータ切り替え制御部8aに入力されることになるので、転送データのヘッダで指定されている転送先の演算処理ユニットを表す値「0」と図14に示すようなデータ切り替え制御部8aの自己ドメイン記憶レジスタ12の値「0」とが一致し、また、転送データのヘッダで指定されているタイプがメモリであるので、データ切り替え制御部8aのデータ変換部15として機能する切り替え制御用マイクロプロセッサ23は、当該転送データから転送先となる演算処理ユニット2aを表す値「0」(ドメイン指定部19)とメモリを示すタイプ指定(タイプ指定部20)とからなるヘッダを削除した上で、従来と同様に転送データのパケット変換を行い、出力先切り替えスイッチ14を制御して当該演算処理ユニット2a内のメモリ4a,5a,6a,7aと入力元のデータ切り替え制御部8bを接続し、入力元のデータ切り替え制御部8bからの転送データを当該演算処理ユニット2a内のメモリ4a,5a,6a,7aに引き渡すことになる(図16のX2を参照)。
なお、ここでいうパケット変換は、仮想マッピングによるアドレス指定を演算処理ユニット内で利用される本来のアドレス指定に戻すための操作であり、1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提とし、メモリの最大接続数を「3」とした本実施形態においては、仮想マッピングによるアドレス指定から値「4」を減算することで演算処理ユニット内で利用される本来のアドレス指定に戻される。例えば、仮想マッピングによるアドレス指定が「7」〔演算処理ユニット2b上で仮想された7番目(最初のメモリに相当する値を0として規定しているので実際には8番目)のメモリ〕であれば、「3」〔演算処理ユニット2a上で実質的に3番目(最初のメモリに相当する値を0として規定しているので実際には4番目)のメモリ〕に宛て先が変換される。
When the processing unit of the transfer destination specified in the header of the transfer data matches a certain processing unit of the
For example, the transfer data sent from the data switching
Note that the packet conversion here is an operation for returning the addressing by virtual mapping to the original addressing used in the arithmetic processing unit, and only one data transfer of one microprocessor to another microprocessor is performed. In the present embodiment in which the maximum number of connections of the memory is “3”, the value “4” is subtracted from the address designation by the virtual mapping. Return to addressing. For example, the address designation by virtual mapping is “7” (the seventh memory virtualized on the
一方、ステップc11の判定結果が偽となった場合、つまり、転送データのヘッダで指定されているタイプがマイクロプロセッサである場合には、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送先やタイプを指定するヘッダを当該転送データから削除し、従来と同様に転送データのパケット変換を行い(ステップc14)、出力先切り替えスイッチ14を制御して当該演算処理ユニット内のマイクロプロセッサと入力元のデータ切り替え制御部を接続し、入力元のデータ切り替え制御部からの転送データを当該演算処理ユニット内のマイクロプロセッサに引き渡す(ステップc15)。
例えば、前述のステップc8,c9の処理で演算処理ユニット2a内のメモリ4a,5a,6a,7aの転送データが演算処理ユニット2a内のデータ切り替え制御部8aから送出されて演算処理ユニット2bのデータ切り替え制御部8bに入力された場合においては、転送先となる演算処理ユニット2bを表す値「1」がドメイン指定部19に設定され且つ転送先のタイプであるマイクロプロセッサがタイプ指定部20に設定されたヘッダを有する転送データが演算処理ユニット2aのデータ切り替え制御部8aから演算処理ユニット2bのデータ切り替え制御部8bに入力されることになるので、転送データのヘッダで指定されている転送先の演算処理ユニットを表す値「1」と図12に示すようなデータ切り替え制御部8bの自己ドメイン記憶レジスタ12の値「1」とが一致し、また、転送データのヘッダで指定されているタイプがマイクロプロセッサであるので、データ切り替え制御部8bのデータ変換部15として機能する切り替え制御用マイクロプロセッサ23は、当該転送データから転送先となる演算処理ユニット2bを表す値「1」(ドメイン指定部19)とマイクロプロセッサを示すタイプ指定(タイプ指定部20)とからなるヘッダを削除した上で、従来と同様に転送データのパケット変換を行い、出力先切り替えスイッチ14を制御して当該演算処理ユニット2b内のマイクロプロセッサ3bと入力元のデータ切り替え制御部8aを接続し、入力元のデータ切り替え制御部8aからの転送データを当該演算処理ユニット2b内のマイクロプロセッサ3bに引き渡すことになる(図16のX3を参照)。
なお、ここでいうパケット変換は、演算処理ユニット内で利用されるアドレス指定を仮想マッピングによるアドレス指定に改めるための操作であり、1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提とし、メモリの最大接続数を「3」とした本実施形態においては、演算処理ユニット内で利用されるアドレス指定に値「4」を加算することで仮想マッピング用のアドレスが生成される。例えば、演算処理ユニット内で利用されるアドレス指定が「3」〔演算処理ユニット2a上で実質的に3番目(最初のメモリに相当する値を0として規定しているので実際には4番目)のメモリ〕であれば、「7」〔演算処理ユニット2b上で仮想される7番目(最初のメモリに相当する値を0として規定しているので実際には8番目)のメモリ〕に宛て先が変換される。
On the other hand, if the determination result in step c11 is false, that is, if the type specified in the header of the transfer data is a microprocessor, the switching
For example, the transfer data of the
The packet conversion here is an operation for changing the address specification used in the arithmetic processing unit to the address specification by virtual mapping, and one microprocessor substitutes only for data transfer of one other microprocessor. In this embodiment where the maximum number of memory connections is “3”, a virtual mapping address is generated by adding a value “4” to the address designation used in the arithmetic processing unit. Is done. For example, the address designation used in the arithmetic processing unit is “3” [actually third on the
また、ステップc10の判定結果が偽となった場合、つまり、転送データのヘッダで指定されている転送先の演算処理ユニットが当該データ変換部15のある演算処理ユニットと一致していないと判定された場合においては、当該データ切り替え制御部が中継地点に過ぎず、該データ切り替え制御部を介して更に別のデータ切り替え制御部に当該データを転送する必要があることを意味するので、データ変換部15として機能する切り替え制御用マイクロプロセッサ23は、転送データからヘッダを削除する処理は行なわず、当該データ切り替え制御部に接続した他の演算処理ユニットのデータ切り替え制御部に当該転送データを其のまま転送することになる(ステップc16)。
If the determination result in step c10 is false, that is, it is determined that the processing unit of the transfer destination specified by the header of the transfer data does not match the processing unit of the
以上に述べた通り、この実施形態では、各演算処理ユニット2a,2b,2c,2dのマイクロプロセッサ3a,3b,3c,3dの何れかに障害が生じた場合、障害の生じたマイクロプロセッサの配下のメモリへのデータの書き込みや同メモリからのデータの読み出しを、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と当該データ切り替え制御部と接続した他の演算処理ユニットのデータ切り替え制御部とを介して行うようにしており、その際、各データ切り替え制御部の間での転送データの受け渡しに際してのみ転送先の演算処理ユニットや転送先のタイプを指定するためのヘッダを利用するようにしているので、マイクロプロセッサとメモリとの間のデータ転送に用いられるプロトコルそれ自体は全く変更することなく、障害の生じているマイクロプロセッサの配下のメモリのデータ転送に対処することができる。
As described above, in this embodiment, when a failure occurs in any of the
しかも、複数ある演算処理ユニット2a,2b,2c,2dの各々に設けられたマイクロプロセッサ3a,3b,3c,3dのうち、障害の生じていないマイクロプロセッサが障害の生じたマイクロプロセッサの配下のメモリのデータ転送を代行する構成であるから、格別な予備プロセッサカードや予備の演算処理ユニットを冗長的に配備しなくても、障害の生じたマイクロプロセッサの配下のメモリのデータ転送を実現することができる。
In addition, among the
ここでは障害の生じたマイクロプロセッサの配下の全てのメモリ、たとえば、マイクロプロセッサ3aの配下のメモリ4a,4b,4c,4dを一纏めにしてデータ転送を他の1つのマイクロプロセッサ例えばマイクロプロセッサ3bで代替する例について述べたが、各メモリ毎、例えば、メモリ4a,4b,4c,4d毎に異なるマイクロプロセッサをデータ転送代替用のマイクロプロセッサとして割り付けるといったことも技術的には可能である。
Here, all the memories under the failed microprocessor, for example, the
この実施形態では1つのマイクロプロセッサが他の1つのマイクロプロセッサのデータ転送のみを代替することを前提として説明したが、マイクロプロセッサの処理能力や仮想マッピングの設定しだいでは、1つのマイクロプロセッサが他の2つ以上のマイクロプロセッサのデータ転送を代替することも可能であり、また、障害の生じていない2以上のマイクロプロセッサを選択して障害の生じている他のマイクロプロセッサの配下のメモリのデータ転送を代行させること、例えば、マイクロプロセッサ3aとマイクロプロセッサ3cに同時に障害が生じた場合にマイクロプロセッサ3bとマイクロプロセッサ3dにマイクロプロセッサ3aとマイクロプロセッサ3cのデータ転送の処理を代替させることもできるので、2以上のマイクロプロセッサに障害が生じた場合でも、障害の生じている各マイクロプロセッサの配下のメモリのデータ転送を容易に実現することが可能である。
In this embodiment, the description has been made on the assumption that one microprocessor replaces only the data transfer of the other microprocessor. However, depending on the processing capacity of the microprocessor and the setting of the virtual mapping, one microprocessor may It is possible to replace the data transfer of two or more microprocessors, and also select two or more non-failed microprocessors to transfer data in the memory under the other microprocessors that have failed. For example, if a failure occurs in the
運用状況更新設定手段としては、障害処理用マイクロプロセッサ21のほか、情報処理装置1が他の装置の下位装置として機能するような場合においては上位装置側の制御プログラムを利用することができ、また、情報処理装置1に組み込まれたファームウェアによって実質的な運用状況更新設定手段を構成させることもできる。
As the operation status update setting means, in addition to the
1 情報処理装置
2a,2b,2c,2d 演算処理ユニット
3a,3b,3c,3d マイクロプロセッサ
4a,4b,4c,4d メモリ(Dual Inline Memory Module)
5a,5b,5c,5d メモリ(Dual Inline Memory Module)
6a,6b,6c,6d メモリ(Dual Inline Memory Module)
7a,7b,7c,7d メモリ(Dual Inline Memory Module)
8a,8b,8c,8d データ切り替え制御部
9 状態記憶レジスタ
10 転送代替マイクロプロセッサ記憶レジスタ
11 転送代替ドメイン記憶レジスタ
12 自己ドメイン記憶レジスタ
13 接続メモリ数記憶レジスタ
14 出力先切り替えスイッチ
15 データ変換部
16 利用可能ゲートウェイ記憶テーブル
17 利用済みゲートウェイ記憶テーブル
18 テーブル格納メモリ
19 ドメイン指定部
20 タイプ指定部
21 障害処理用マイクロプロセッサ(運用状況更新設定手段)
22 ルーティングテーブル
23 切り替え制御用マイクロプロセッサ
1
5a, 5b, 5c, 5d Memory (Dual Inline Memory Module)
6a, 6b, 6c, 6d Memory (Dual Inline Memory Module)
7a, 7b, 7c, 7d Memory (Dual Inline Memory Module)
8a, 8b, 8c, 8d Data switching
11 Transfer Alternate
22 Routing table 23 Microprocessor for switching control
Claims (4)
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続しておき、
何れかのマイクロプロセッサに障害が生じた際に、障害の生じたマイクロプロセッサを有する演算処理ユニットのデータ切り替え制御部と接続したデータ切り替え制御部を有する演算処理ユニットのマイクロプロセッサを選択して障害の生じたマイクロプロセッサのメモリのデータ転送を代行させ、
各データ切り替え制御部への転送データの入力元に応じ、当該データ切り替え制御部への転送データの入力元がメモリであって該データ切り替え制御部のマイクロプロセッサに障害が生じている場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するようにしたことを特徴とする情報処理装置の障害処理方法。 A failure occurred in the microprocessor of an information processing apparatus that performs parallel arithmetic processing by connecting a plurality of arithmetic processing units composed of a combination of a microprocessor and a memory and connecting the microprocessors of each arithmetic processing unit so that information can be transmitted. A failure processing method of an information processing device for using a memory under control of the microprocessor,
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected so as to transmit information,
When a failure occurs in any of the microprocessors, the microprocessor of the arithmetic processing unit having the data switching control unit connected to the data switching control unit of the arithmetic processing unit having the failed microprocessor is selected to Delegate data transfer of the resulting microprocessor memory,
Depending on the input source of the transfer data to each data switching control unit, the transfer data input source to the data switching control unit is a memory and the microprocessor of the data switching control unit has a failure and the data When the transfer data input source to the switching control unit is a microprocessor and the destination address specification exceeds the normal physical address of the memory in the relevant processing unit, the destination processing unit and the destination type Is attached to the transfer data, while the input source of the transfer data to the data switching control unit is another data switching control unit and the transfer destination is in the arithmetic processing unit of the data switching control unit And a failure processing method for an information processing apparatus, wherein the header is deleted from the transfer data.
情報伝達経路を切り替えるためのデータ切り替え制御部を各演算処理ユニット毎にマイクロプロセッサとメモリとの間に設け、少なくとも2以上のデータ切り替え制御部を情報伝達可能に接続すると共に、
各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して他の演算処理ユニット内のメモリのデータ転送を代行できる演算処理ユニットとの対応関係を記憶する利用可能ゲートウェイ記憶テーブルと、各演算処理ユニットのマイクロプロセッサと該マイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介してメモリのデータ転送を代行している演算処理ユニットとの対応関係を記憶すると共に何れかのマイクロプロセッサに障害が生じた場合においては障害が生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして該マイクロプロセッサと演算処理ユニットとの対応関係を記憶する利用済みゲートウェイ記憶テーブルとを備えたテーブル格納メモリを配備し、
前記各データ切り替え制御部には、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサの障害の有無を記憶する状態記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのメモリのデータ転送を代行すべきマイクロプロセッサを有する演算処理ユニットを記憶する転送代替マイクロプロセッサ記憶レジスタと、当該データ切り替え制御部が設けられた演算処理ユニットのマイクロプロセッサがメモリのデータ転送を代行すべき他の演算処理ユニットを記憶する転送代替ドメイン記憶レジスタと、当該データ切り替え制御部への転送データの入力元と前記状態記憶レジスタの状態を判定し、当該データ切り替え制御部への転送データの入力元がメモリであって前記状態記憶レジスタが障害を記憶している場合と当該データ切り替え制御部への転送データの入力元がマイクロプロセッサであって転送先のアドレス指定が当該演算処理ユニットにおけるメモリの正規の物理アドレスを超えている場合に転送先の演算処理ユニットや転送先のタイプを指定するヘッダを転送データに添付する一方、当該データ切り替え制御部への転送データの入力元が他のデータ切り替え制御部であって転送先が当該データ切り替え制御部の演算処理ユニット内にある場合には転送データからヘッダを削除するデータ変換部とを設け、
何れかの演算処理ユニットのマイクロプロセッサに障害が生じると、前記利用可能ゲートウェイ記憶テーブルと利用済みゲートウェイ記憶テーブルを参照して障害の生じたマイクロプロセッサのメモリのデータ転送を代行できる演算処理ユニットのうち前記利用済みゲートウェイ記憶テーブルに記憶されていないマイクロプロセッサを有する演算処理ユニットを選択して障害の生じたマイクロプロセッサのデータ切り替え制御部の転送代替マイクロプロセッサ記憶レジスタに記憶させる一方、前記選択された演算処理ユニットの転送代替ドメイン記憶レジスタに前記障害の生じたマイクロプロセッサを有する演算処理ユニットを記憶させると共に、前記選択された演算処理ユニットのマイクロプロセッサが当該演算処理ユニットのデータ切り替え制御部を介して前記障害の生じたマイクロプロセッサを有する演算処理ユニットのメモリのデータ転送を代行し、且つ、前記障害の生じたマイクロプロセッサが他の全ての演算処理ユニット内のメモリのデータ転送を代行しているものとして前記利用済みゲートウェイ記憶テーブルを更新設定し、前記障害の生じたマイクロプロセッサのデータ切り替え制御部の状態記憶レジスタに障害の発生を記憶させる運用状況更新設定手段を併設したことを特徴とする情報処理装置。 In an information processing apparatus in which a plurality of arithmetic processing units each including a combination of a microprocessor and a memory are provided, and the microprocessors of the respective arithmetic processing units are connected so as to be able to transmit information to perform parallel arithmetic processing.
A data switching control unit for switching the information transmission path is provided between the microprocessor and the memory for each arithmetic processing unit, and at least two or more data switching control units are connected to transmit information,
Usable to store the correspondence relationship between the microprocessor of each arithmetic processing unit and the arithmetic processing unit that can substitute the data transfer of the memory in the other arithmetic processing unit via the data switching control unit of the arithmetic processing unit Stores the correspondence relationship between the gateway storage table, the microprocessor of each arithmetic processing unit, and the arithmetic processing unit in which the microprocessor performs the data transfer of the memory via the data switching control unit of the arithmetic processing unit. When a failure occurs in one of the microprocessors, the correspondence relationship between the microprocessor and the arithmetic processing unit is assumed that the microprocessor in which the failure has occurred is acting as the data transfer for the memory in all other arithmetic processing units. Used gateway to remember Deploying a table storage memory and a 憶 table,
Each of the data switching control units includes a state storage register for storing the presence or absence of a failure of the microprocessor of the arithmetic processing unit provided with the data switching control unit, and a memory of the arithmetic processing unit provided with the data switching control unit A transfer alternative microprocessor storage register for storing an arithmetic processing unit having a microprocessor that should perform the data transfer of the data, and a microprocessor of the arithmetic processing unit provided with the data switching control unit should perform the data transfer of the memory The transfer alternative domain storage register that stores the arithmetic processing unit, the input source of the transfer data to the data switching control unit and the state of the state storage register are determined, and the input source of the transfer data to the data switching control unit is Memory and the state storage register indicates a fault. And when the transfer data input source to the data switching control unit is a microprocessor and the transfer destination address specification exceeds the normal physical address of the memory in the operation processing unit, While the header specifying the type of processing unit and transfer destination is attached to the transfer data, the input source of the transfer data to the data switching control unit is another data switching control unit, and the transfer destination is the data switching control unit. A data conversion unit that deletes the header from the transfer data when it is in the arithmetic processing unit,
When a failure occurs in the microprocessor of any of the arithmetic processing units, the arithmetic processing unit can refer to the available gateway storage table and the used gateway storage table to perform data transfer in the memory of the failed microprocessor. An arithmetic processing unit having a microprocessor not stored in the used gateway storage table is selected and stored in the transfer alternative microprocessor storage register of the data switching control unit of the failed microprocessor, while the selected The arithmetic processing unit having the failed microprocessor is stored in the transfer substitution domain storage register of the arithmetic processing unit, and the microprocessor of the selected arithmetic processing unit stores the data of the arithmetic processing unit. The data transfer of the memory of the arithmetic processing unit having the faulty microprocessor via the control unit, and the faulty microprocessor transfers the data of the memory in all other arithmetic processing units The used gateway storage table is updated and set as an agent, and operation status update setting means for storing the occurrence of the failure in the state storage register of the data switching control unit of the failed microprocessor is provided. An information processing apparatus characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007092609A JP5066978B2 (en) | 2007-03-30 | 2007-03-30 | Information processing apparatus fault processing method and information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007092609A JP5066978B2 (en) | 2007-03-30 | 2007-03-30 | Information processing apparatus fault processing method and information processing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008250785A JP2008250785A (en) | 2008-10-16 |
JP5066978B2 true JP5066978B2 (en) | 2012-11-07 |
Family
ID=39975630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007092609A Expired - Fee Related JP5066978B2 (en) | 2007-03-30 | 2007-03-30 | Information processing apparatus fault processing method and information processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5066978B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5884368B2 (en) * | 2011-09-27 | 2016-03-15 | 株式会社リコー | Electronics |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0430245A (en) * | 1990-05-25 | 1992-02-03 | Oki Electric Ind Co Ltd | Multiprocessor control system |
JPH05113898A (en) * | 1991-04-03 | 1993-05-07 | Mitsubishi Electric Corp | Multiplex system computer device |
JP4404493B2 (en) * | 2001-02-01 | 2010-01-27 | 日本電気株式会社 | Computer system |
JP4653965B2 (en) * | 2004-04-08 | 2011-03-16 | 株式会社日立製作所 | I / O interface module management method |
JPWO2006043308A1 (en) * | 2004-10-18 | 2008-05-22 | 富士通株式会社 | Operation management program, operation management method, and operation management apparatus |
-
2007
- 2007-03-30 JP JP2007092609A patent/JP5066978B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008250785A (en) | 2008-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6970972B2 (en) | High-availability disk control device and failure processing method thereof and high-availability disk subsystem | |
JP4877482B2 (en) | PCI Express link, multi-host computer system, and PCI Express link reconfiguration method | |
US11429487B2 (en) | Control plane method and apparatus for providing erasure code protection across multiple storage devices | |
CN101471882B (en) | Storage subsystem | |
CN101140497B (en) | Storage system and control method for the same | |
JP5550089B2 (en) | Multiprocessor system, node controller, failure recovery method | |
US20020087751A1 (en) | Switch based scalable preformance storage architecture | |
US20090204743A1 (en) | Storage subsystem and control method therefof | |
US20060150003A1 (en) | Fault tolerant computer system | |
GB2414825A (en) | Remote backup using a virtual volume | |
JP2000209271A (en) | Router | |
JP2008112399A (en) | Storage virtualization switch and computer system | |
US20060136613A1 (en) | Duplicate synchronization system and method of operating duplicate synchronization system | |
KR101337720B1 (en) | Video reproducing apparatus and video reproducing method | |
JP5066978B2 (en) | Information processing apparatus fault processing method and information processing apparatus | |
JP3776438B2 (en) | Storage device | |
JP4985512B2 (en) | Distributed shared memory multiprocessor system and load balancing method in multiprocessor system | |
US7925810B2 (en) | Data storage system, method, and recording medium that simultaneously transmits data that was separately generated from pluraity of transfer units to same data location | |
US7124213B2 (en) | Device having spare I/O and method of using a device having spare I/O | |
JP4123386B2 (en) | Communication path redundancy system, communication path redundancy method, and load distribution program | |
JP6394727B1 (en) | Control device, control method, and fault tolerant device | |
JP4679178B2 (en) | Communication device and memory device | |
JP2001243209A (en) | Distributed shared memory system and distributed shared memory system control method | |
JP2012069119A (en) | Distributed memory array supporting random access and file storage operations | |
JPH11252184A (en) | Inter-node connector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120717 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120730 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |