JP4640116B2 - Multi-node computer system, integrated service processor, status management method and program - Google Patents
Multi-node computer system, integrated service processor, status management method and program Download PDFInfo
- Publication number
- JP4640116B2 JP4640116B2 JP2005320441A JP2005320441A JP4640116B2 JP 4640116 B2 JP4640116 B2 JP 4640116B2 JP 2005320441 A JP2005320441 A JP 2005320441A JP 2005320441 A JP2005320441 A JP 2005320441A JP 4640116 B2 JP4640116 B2 JP 4640116B2
- Authority
- JP
- Japan
- Prior art keywords
- status
- node
- change
- crossbar switch
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Bus Control (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
本発明は、複数のノードをノード間クロスバスイッチによって相互に接続したマルチノードコンピュータシステムに関し、特に、ノード間クロスバスイッチを多重化したマルチノードコンピュータシステムにおけるノード間クロスバスイッチのステータス管理技術に関する。 The present invention relates to a multi-node computer system in which a plurality of nodes are connected to each other by an inter-node crossbar switch, and more particularly to a status management technique for an inter-node crossbar switch in a multi-node computer system in which inter-node crossbar switches are multiplexed.
科学技術計算の分野において利用されるスーパーコンピュータ等の高速計算機には高い計算性能が要求される。そこで、このような要求を満たすため、複数のCPU及びそれらによって共有される共有メモリを含んだ高性能のノードを複数個、ノード間クロスバスイッチ(IXSと略す)を介して接続したマルチノードコンピュータシステムが開発された。しかし、このマルチノードコンピュータシステムは、1台のIXSを介して各ノードを相互に接続しているため、IXSに障害が発生すると、ノード間でデータをやり取りすることができなくなり、計算処理が停止してしまう。 High-speed computers such as supercomputers used in the field of scientific and technological computation are required to have high computing performance. Therefore, in order to satisfy such a requirement, a multi-node computer system in which a plurality of high-performance nodes including a plurality of CPUs and a shared memory shared by them are connected via an inter-node crossbar switch (abbreviated as IXS). Was developed. However, since this multi-node computer system connects the nodes to each other via a single IXS, if an IXS failure occurs, data cannot be exchanged between the nodes, and calculation processing stops. Resulting in.
そこで、このような問題を解決するため、IXSを多重化したマルチノードコンピュータシステム、即ち、各ノードを相互に接続するIXSを複数個備えたマルチノードコンピュータシステムが提案された(例えば、特許文献1参照)。 In order to solve such a problem, a multi-node computer system in which IXS is multiplexed, that is, a multi-node computer system including a plurality of IXSs that mutually connect nodes is proposed (for example, Patent Document 1). reference).
上述した特許文献1に記載されているマルチノードコンピュータシステムのようにIXSを多重化しておけば、その内の一部に障害が発生しても、他の正常なIXSを介してデータをやり取りできるため、計算処理が停止してしまうことはない。 If IXS is multiplexed as in the multi-node computer system described in Patent Document 1 described above, data can be exchanged via other normal IXS even if a failure occurs in a part of the IXS. Therefore, the calculation process does not stop.
ところで、IXSが多重化されたマルチノードコンピュータシステムにおいては、各ノードが、多重化されているIXSの中からデータ転送に使用するIXSを決定するために、各IXSのステータスを管理しておくことが必要になる。例えば、或るIXSに障害が発生した場合には、上記IXSをマルチノードコンピュータシステムから切り離すために、各ノードで管理している上記IXSのステータスをノーマル状態(組み込み状態)からデグレード状態(切り離し状態)に変更し、上記IXSが復旧した場合には、上記IXSをマルチノードコンピュータシステムに組み込むために、各ノードで管理している上記IXSのステータスをデグレード状態からノーマル状態に変更する必要がある。 By the way, in a multi-node computer system in which IXS is multiplexed, each node manages the status of each IXS in order to determine the IXS to be used for data transfer from among the multiplexed IXS. Is required. For example, when a failure occurs in a certain IXS, in order to disconnect the IXS from the multi-node computer system, the status of the IXS managed by each node is changed from the normal state (embedded state) to the degraded state (detached state). When the IXS is restored, in order to incorporate the IXS into the multi-node computer system, it is necessary to change the status of the IXS managed by each node from the degraded state to the normal state.
上記したようなステータス管理を行うためには、例えば、次のようにすることが考えられる。 In order to perform the status management as described above, for example, the following may be considered.
障害の発生したIXSのステータスをノーマル状態からデグレード状態に変更するには、各IXSに障害検出器を設け、自IXSの障害を検出した障害検出器が、全ノードに対して障害通知を送り、この障害通知を受けた各ノードが、上記障害の発生したIXSのステータスをノーマル状態からデグレード状態に変更する。また、自IXSの障害を検出した障害検出器は、自IXSで管理している自IXSのステータスをノーマル状態からデグレード状態に変更する。 In order to change the status of a failed IXS from the normal state to the degraded state, a failure detector is provided in each IXS, and the failure detector that detects the failure of its own IXS sends a failure notification to all nodes. Each node that has received this failure notification changes the status of the IXS where the failure has occurred from the normal state to the degraded state. Further, the failure detector that has detected the failure of the own IXS changes the status of the own IXS managed by the own IXS from the normal state to the degraded state.
また、復旧したIXSのステータスをデグレード状態からノーマル状態に変更するには、保守員が手作業で、各ノードで管理されている上記IXSのステータスをデグレード状態からノーマル状態に変更すると共に、復旧したIXSで管理されているステータスをデグレード状態からノーマル状態に変更する。このようなステータスの変更操作は、例えば、IXSを管理している統合サービスプロセッサ(統合SVPと略す)や、ノードを管理しているノードサービスプロセッサ(ノードSVPと略す)を利用して行うことができ、統合SVP,ノードSVPを利用する場合には、それらが管理している復旧したIXS(復旧IXS)のステータスも変更する。 In addition, to change the status of the restored IXS from the degraded state to the normal state, the maintenance personnel manually change the IXS status managed by each node from the degraded state to the normal state, and then recovered. The status managed by IXS is changed from the degraded state to the normal state. Such a status change operation may be performed using, for example, an integrated service processor (abbreviated as an integrated SVP) that manages IXS or a node service processor (abbreviated as a node SVP) that manages nodes. If the integrated SVP and node SVP are used, the status of the recovered IXS (recovered IXS) managed by them is also changed.
しかし、上記した方法は、IXSの復旧時に、保守員が手作業で、復旧したIXS、全ノード、統合SVP及び全ノードSVPで管理されている復旧IXSのステータスを変更する必要があるため、保守員にかかる負担が大きくなるという問題があると共に、誤操作により管理しているステータスが実際のステータスと異なるものになってしまう場合があるという問題がある。 However, the above-described method requires that maintenance personnel manually change the status of the restored IXS, all nodes, the integrated SVP, and the restored IXS managed by all the nodes SVP when IXS is restored. There is a problem that the burden on the worker becomes large, and there is a problem that the status managed by the erroneous operation may be different from the actual status.
また、IXS復旧時の保守員にかかる負担を低減するため、保守員が統合SVPを使用して、統合SVP及び全IXSで管理されている復旧IXSのステータスをデグレード状態からノーマル状態に変更し、更に、統合SVPから各ノードSVPに対してステータスの変更内容を通知し、この通知を受けた各ノードSVPが、自ノードSVP及び各ノードで管理されている復旧IXSのステータスを通知された変更内容に従って変更するという方法が考えられる。この方法によれば、保守員は統合SVPを操作するだけで良いので、保守員にかかる負担は低減する。 In addition, in order to reduce the burden on the maintenance staff at the time of IXS recovery, the maintenance staff uses the integrated SVP to change the status of the recovery IXS managed by the integrated SVP and all IXS from the degraded state to the normal state, Further, the change contents of the status are notified from the integrated SVP to each node SVP, and each node SVP that has received this notification is notified of the status of the recovery IXS managed by the own node SVP and each node. It is conceivable to change according to According to this method, since the maintenance staff only needs to operate the integrated SVP, the burden on the maintenance staff is reduced.
しかし、上記した方法は、ノードSVPに障害が発生している場合や、統合SVPとノードSVP間の通信パスまたはノードSVPとノード間の通信パスに障害が発生している場合は、ステータスの変更が正しく行われないという問題がある。ノードSVPは、通常、障害が発生してもマルチノードコンピュータシステム全体の運用に対して影響を及ぼさないが、上記した方法ではノードSVPが復旧処理の必須装置となり、マルチノードコンピュータシステム全体の可用性を低下させてしまう。 However, the above method changes the status when a failure occurs in the node SVP, or when a failure occurs in the communication path between the integrated SVP and the node SVP or between the node SVP and the node. There is a problem that is not performed correctly. The node SVP usually does not affect the operation of the entire multi-node computer system even if a failure occurs. However, in the above method, the node SVP becomes an essential device for the recovery process, and the availability of the entire multi-node computer system is increased. It will decrease.
〔発明の目的〕
そこで、本発明の目的は、障害から復旧したIXSをマルチノードコンピュータシステムに組み込む際、各ノードで管理されている上記復旧したIXSのステータスを、ノードサービスプロセッサを利用しなくとも、保守員が容易に変更できるようにすることにある。
(Object of invention)
Accordingly, an object of the present invention is to allow maintenance personnel to easily manage the status of the restored IXS managed by each node without using a node service processor when incorporating the IXS recovered from a failure into a multi-node computer system. It is to be able to change to.
本発明にかかる第1のマルチノードコンピュータシステムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムにおいて、
前記統合サービスプロセッサが、
ステータスの変更対象にするノード間クロスバスイッチの識別子および変更後のステータスを含むステータス変更操作要求が入力されたとき、自統合サービスプロセッサで管理している前記ノード間クロスバスイッチのステータスを前記ステータス変更操作要求に従って変更すると共に、前記ノード間クロスバスイッチに対して前記変更後のステータスを通知する構成を有し、
前記各ノード間クロスバスイッチが、それぞれ、
前記統合サービスプロセッサから変更後のステータスが送られてきたとき、自ノード間クロスバスイッチで管理している自ノード間クロスバスイッチのステータスを前記変更後のステータスに変更すると共に、前記各ノードに対して変更後のステータスを通知する構成を有し、
前記各ノードが、それぞれ、
前記ノード間クロスバスイッチから変更後のステータスが送られてきたとき、自ノードで管理している前記ノード間クロスバスイッチのステータスを前記変更後のステータスに変更する構成を有することを特徴とする。
A first multi-node computer system according to the present invention includes:
In a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches that connect the nodes to each other, and an integrated service processor that manages the inter-node crossbar switches,
The integrated service processor comprises:
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input, the status change operation changes the status of the inter-node crossbar switch managed by the own integrated service processor. The configuration changes according to the request, and notifies the status after the change to the inter-node crossbar switch,
The inter-node crossbar switches are respectively
When the changed status is sent from the integrated service processor, the status of the cross-node switch between the own nodes managed by the cross-node switch between the own nodes is changed to the status after the change, and for each node It has a configuration to notify the status after change,
Each of the nodes is
When the changed status is sent from the internode crossbar switch, the status of the internode crossbar switch managed by the own node is changed to the changed status.
本発明にかかる第2のマルチノードコンピュータシステムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムにおいて、
前記統合サービスプロセッサが、
前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部と、
ステータスの変更対象にするノード間クロスバスイッチの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更する第1のステータス変更手段と、
該第1のステータス変更手段によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチに対して、変更後のステータスを含むステータス変更指示を送信する第1のステータス送受信手段とを備え、
前記各ノード間クロスバスイッチが、それぞれ、
自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部と、
該第2のステータス格納部の内容を、前記統合サービスプロセッサから送られてきたステータス変更指示に従って変更する第2のステータス変更手段と、
該第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスが変更されたとき、変更後のステータスを示すステータス通知信号を前記各ノードへ送信するステータス通知信号送信手段とを備え、
前記ノードが、それぞれ、
前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部と、
該第3のステータス格納部の内容を、前記ノード間クロスバスイッチから送られてきたステータス通知信号に従って変更する第3のステータス変更手段とを備えたことを特徴とする。
A second multi-node computer system according to the present invention includes:
In a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches that connect the nodes to each other, and an integrated service processor that manages the inter-node crossbar switches,
The integrated service processor comprises:
A first status storage unit storing the status of the crossbar switch between the nodes;
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input by maintenance personnel, it is stored in the first status storage unit according to the status change operation request. First status changing means for changing the status of the corresponding inter-node crossbar switch;
When the status stored in the first status storage unit is changed by the first status change unit, a status change instruction including the changed status is issued to the inter-node crossbar switch whose status has been changed. First status transmitting / receiving means for transmitting,
The inter-node crossbar switches are respectively
A second status storage unit storing the status of the crossbar switch between the own nodes;
Second status change means for changing the contents of the second status storage unit in accordance with a status change instruction sent from the integrated service processor;
Status notification signal transmission means for transmitting a status notification signal indicating the status after the change to each of the nodes when the status stored in the second status storage section is changed by the second status change means; Prepared,
The nodes are respectively
A third status storage unit storing the status of the crossbar switch between the nodes;
And third status change means for changing the contents of the third status storage unit according to a status notification signal sent from the internode crossbar switch.
本発明にかかる第3のマルチノードコンピュータシステムは、第2のマルチノードコンピュータシステムにおいて、
前記各ノード間クロスバスイッチが、それぞれ、
前記統合サービスプロセッサから送られてきたステータス変更指示が、ノーマル状態への変更を指示するものである場合、自ノード間クロスバスイッチの初期化を行う初期化手を備え、且つ、
前記ステータス通知信号送信手段が、
前記初期化手段による初期化が成功した後、前記ステータス通知信号を前記各ノードへ送信する構成を有することを特徴とする。
A third multi-node computer system according to the present invention is the second multi-node computer system,
The inter-node crossbar switches are respectively
When the status change instruction sent from the integrated service processor is an instruction to change to the normal state, the status change instruction includes an initialization hand for initializing the crossbar switch between the own nodes, and
The status notification signal transmitting means is
After the initialization by the initialization means is successful, the status notification signal is transmitted to each node.
本発明にかかる第4のマルチノードコンピュータシステムは、第3のマルチノードコンピュータシステムにおいて、
前記各ノードが、それぞれ、
前記ノード間クロスバスイッチから送られてきたステータス通知信号が、ノーマル状態を示すものである場合、前記ステータス通知信号の送信元のノード間クロスバスイッチが正常動作可能か否かを診断する診断手段を備え、且つ、
前記第3のステータス変更手段が、
全てのノードの診断手段によって前記ノード間クロスバスイッチが正常動作可能であると判定された後、前記第3のステータス格納部に格納されている、前記ノード間クロスバスイッチのステータスを、ノーマル状態に変更する構成を有することを特徴とする。
A fourth multi-node computer system according to the present invention is the third multi-node computer system,
Each of the nodes is
When the status notification signal sent from the inter-node crossbar switch indicates a normal state, it comprises diagnostic means for diagnosing whether or not the inter-node crossbar switch that is the transmission source of the status notification signal is operable normally ,and,
The third status changing means is
After determining that the inter-node crossbar switch can operate normally by the diagnostic means of all nodes, the status of the inter-node crossbar switch stored in the third status storage unit is changed to a normal state. It has the structure which carries out.
本発明にかかる第5のマルチノードコンピュータシステムは、第4のマルチノードコンピュータシステムにおいて、
前記第2のステータス変更手段が、
前記初期化手段による初期化が失敗した場合、前記第2のステータス格納部に格納されているステータスを、デグレード状態に変更する構成を有し、
前記ステータス通知信号送信手段が、
前記初期化手段による初期化が失敗した場合、前記各ノードに対して、デグレード状態を示すステータス通知信号を送信する構成を有し、
前記第3のステータス変更手段が、
前記ノード間クロスバスイッチから、デグレード状態を示すステータス通知信号が送られてきたとき、前記第3のステータス格納部に格納されているステータスの内の、前記ステータス通知信号の送信元のノード間クロスバスイッチのステータスを、デグレード状態に変更する構成を有することを特徴とする。
A fifth multi-node computer system according to the present invention is the fourth multi-node computer system,
The second status change means is
When initialization by the initialization unit fails, the status stored in the second status storage unit is changed to a degraded state,
The status notification signal transmitting means is
When the initialization by the initialization unit fails, a status notification signal indicating a degraded state is transmitted to each of the nodes,
The third status changing means is
When a status notification signal indicating a degraded state is sent from the internode crossbar switch, among the statuses stored in the third status storage unit, the internode crossbar switch that is the transmission source of the status notification signal The status is changed to a degraded state.
本発明にかかる第6のマルチノードコンピュータシステムは、第5のマルチノードコンピュータシステムにおいて、
前記第2のステータス変更手段が、
前記各ノード内の診断手段の何れかによって正常動作不可能と判定された場合、前記第2のステータス格納部に格納されているステータスをデグレード状態に変更する構成を有し、
前記ステータス通知信号送信手段が、
前記各ノード内の診断手段の何れかによって正常動作不可能と判定された場合、前記各ノードに対してデグレード状態を示すステータス通知信号を送信する構成を有することを特徴とする。
A sixth multi-node computer system according to the present invention is the fifth multi-node computer system,
The second status change means is
When it is determined that normal operation is impossible by any of the diagnostic means in each node, the status stored in the second status storage unit is changed to a degraded state,
The status notification signal transmitting means is
When it is determined that normal operation is impossible by any of the diagnostic means in each node, a status notification signal indicating a degraded state is transmitted to each node.
本発明にかかる第7のマルチノードコンピュータシステムは、第6のマルチノードコンピュータシステムにおいて、
前記各ノードを管理するノードサービスプロセッサを備え、
前記各ノードが、それぞれ、
全てのノードによって前記ノード間クロスバスイッチが正常動作可能であると判定された後、前記ノードサービスプロセッサに対して、前記ノード間クロスバスイッチのステータスをノーマル状態に変更することを指示するステータス変更指示を送信する第3のステータス送受信手段を備え、
前記ノードサービスプロセッサが、
前記各ノードで管理されている前記各ノード間クロスバスイッチのステータスが格納された第4のステータス格納部と、
前記各ノードから送られてきたステータス変更指示に従って前記第4のステータス格納部に格納されている、該当するステータスをノーマル状態に変更する第4のステータス変更手段とを備えたことを特徴とする。
A seventh multi-node computer system according to the present invention is the sixth multi-node computer system,
A node service processor for managing each node;
Each of the nodes is
After determining that the inter-node crossbar switch is normally operable by all nodes, a status change instruction is issued to instruct the node service processor to change the status of the inter-node crossbar switch to a normal state. A third status transmission / reception means for transmitting,
The node service processor is
A fourth status storage unit storing the status of the crossbar switch between the nodes managed by each node;
And a fourth status change means for changing the corresponding status to a normal state, which is stored in the fourth status storage unit in accordance with a status change instruction sent from each node.
本発明にかかる第8のマルチノードコンピュータシステムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムにおいて、
前記統合サービスプロセッサが、
前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部と、
前記ノード間クロスバスイッチから送られてきたステータス変更指示に従って前記第1のステータス格納部の内容を変更する第1のステータス変更手段とを備え、
前記各ノード間クロスバスイッチが、それぞれ、
自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部と、
保守員によって操作される組み込みスイッチと、
該組み込みスイッチが操作されたとき、前記第2のステータス格納部に格納されているステータスをノーマル状態に変更する第2のステータス変更手段と、
該第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスがノーマル状態に変更されたとき、前記統合サービスプロセッサに対して、自ノード間クロスバスイッチのステータスをノーマル状態に変更することを指示するステータス変更指示を送信する第2のステータス送受信手段と、
前記第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスがノーマル状態に変更されたとき、前記各ノードに対して、ノーマル状態を示すステータス通知信号を送信するステータス通知信号送信手段とを備え、
前記ノードが、それぞれ、
前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部と、
前記ノード間クロスバスイッチから送られてきた前記ステータス通知信号に従って前記第3のステータス格納部に格納されている、前記ステータス通知信号の送信元のノード間クロスバスイッチのステータスをノーマル状態に変更する第3のステータス変更手段とを備えたことを特徴とする。
An eighth multi-node computer system according to the present invention includes:
In a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each connecting the nodes to each other, and an integrated service processor that manages the inter-node crossbar switches,
The integrated service processor comprises:
A first status storage unit storing the status of the crossbar switch between the nodes;
First status change means for changing the contents of the first status storage unit according to a status change instruction sent from the internode crossbar switch;
The inter-node crossbar switches are respectively
A second status storage unit storing the status of the crossbar switch between the own nodes;
Built-in switch operated by maintenance personnel,
Second status changing means for changing the status stored in the second status storage section to a normal state when the built-in switch is operated;
When the status stored in the second status storage unit is changed to the normal state by the second status change unit, the status of the crossbar switch between the own nodes is changed to the normal state for the integrated service processor. Second status transmission / reception means for transmitting a status change instruction for instructing to perform,
A status notification signal for transmitting a status notification signal indicating a normal state to each of the nodes when the status stored in the second status storage unit is changed to a normal state by the second status change unit. A transmission means,
The nodes are respectively
A third status storage unit storing the status of the crossbar switch between the nodes;
A third state in which the status of the inter-node crossbar switch that is the transmission source of the status notification signal is stored in the third status storage unit according to the status notification signal sent from the inter-node crossbar switch is changed to a normal state. The status change means is provided.
本発明にかかる第1の統合サービスプロセッサは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となる統合サービスプロセッサであって、
ステータスの変更対象にするノード間クロスバスイッチの識別子および変更後のステータスを含むステータス変更操作要求が入力されたとき、自統合サービスプロセッサで管理している前記ノード間クロスバスイッチのステータスを前記ステータス変更操作要求に従って変更すると共に、前記ノード間クロスバスイッチに対して前記変更後のステータスを通知する構成を有することを特徴とする。
A first integrated service processor according to the present invention includes:
An integrated service as a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor for managing the inter-node crossbar switches A processor,
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input, the status change operation changes the status of the inter-node crossbar switch managed by the own integrated service processor. The configuration is characterized in that the status is changed according to the request and the status after the change is notified to the inter-node crossbar switch.
本発明にかかる第2の統合サービスプロセッサは、第1の統合サービスプロセッサにおいて、
前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部と、
ステータスの変更対象にするノード間クロスバスイッチの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更する第1のステータス変更手段と、
該第1のステータス変更手段によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチに対して、変更後のステータスを含むステータス変更指示を送信する第1のステータス送受信手段とを備えたことを特徴とする。
The second integrated service processor according to the present invention is the first integrated service processor,
A first status storage unit storing the status of the crossbar switch between the nodes;
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input by maintenance personnel, it is stored in the first status storage unit according to the status change operation request. First status changing means for changing the status of the corresponding inter-node crossbar switch;
When the status stored in the first status storage unit is changed by the first status change unit, a status change instruction including the changed status is issued to the inter-node crossbar switch whose status has been changed. And a first status transmission / reception means for transmitting.
本発明にかかる第1のノード間クロスバスイッチは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となるノード間クロスバスイッチであって、
前記統合サービスプロセッサから変更後のステータスが送られてきたとき、自ノード間クロスバスイッチで管理している自ノード間クロスバスイッチのステータスを前記変更後のステータスに変更すると共に、前記各ノードに対して変更後のステータスを通知する構成を有することを特徴とする。
The first inter-node crossbar switch according to the present invention is:
Between nodes constituting a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor that manages the inter-node crossbar switches A crossbar switch,
When the changed status is sent from the integrated service processor, the status of the cross-node switch between the own nodes managed by the cross-node switch between the own nodes is changed to the status after the change, and for each node It has the structure which notifies the status after a change, It is characterized by the above-mentioned.
本発明にかかる第2のノード間クロスバスイッチは、第1のノード間クロスバスイッチにおいて、
自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部と、
該第2のステータス格納部の内容を、前記統合サービスプロセッサから送られてきたステータス変更指示に従って変更する第2のステータス変更手段と、
該第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスが変更されたとき、変更後のステータスを示すステータス通知信号を前記各ノードへ送信するステータス通知信号送信手段とを備えたことを特徴とする。
The second internode crossbar switch according to the present invention is the first internode crossbar switch,
A second status storage unit storing the status of the crossbar switch between the own nodes;
Second status change means for changing the contents of the second status storage unit in accordance with a status change instruction sent from the integrated service processor;
Status notification signal transmission means for transmitting a status notification signal indicating the status after the change to each of the nodes when the status stored in the second status storage section is changed by the second status change means; It is characterized by having.
本発明にかかる第1のノードは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となるノードであって、
前記ノード間クロスバスイッチから変更後のステータスが送られてきたとき、自ノードで管理している前記ノード間クロスバスイッチのステータスを前記変更後のステータスに変更する構成を有することを特徴とする。
The first node according to the present invention is:
A node that is a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor that manages the inter-node crossbar switches. There,
When the changed status is sent from the internode crossbar switch, the status of the internode crossbar switch managed by the own node is changed to the changed status.
本発明にかかる第2のノードは、第1のノードにおいて、
前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部と、
該第3のステータス格納部の内容を、前記ノード間クロスバスイッチから送られてきたステータス通知信号に従って変更する第3のステータス変更手段とを備えたことを特徴とする。
The second node according to the present invention is the following:
A third status storage unit storing the status of the crossbar switch between the nodes;
And third status change means for changing the contents of the third status storage unit according to a status notification signal sent from the internode crossbar switch.
本発明にかかる第1のステータス管理方法は、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムにおけるステータス管理方法であって、
前記統合サービスプロセッサが、
ステータスの変更対象にするノード間クロスバスイッチの識別子および変更後のステータスを含むステータス変更操作要求が入力されたとき、自統合サービスプロセッサで管理している前記ノード間クロスバスイッチのステータスを前記ステータス変更操作要求に従って変更すると共に、前記ノード間クロスバスイッチに対して前記変更後のステータスを通知し、
前記各ノード間クロスバスイッチが、それぞれ、
前記統合サービスプロセッサから変更後のステータスが送られてきたとき、自ノード間クロスバスイッチで管理している自ノード間クロスバスイッチのステータスを前記変更後のステータスに変更すると共に、前記各ノードに対して変更後のステータスを通知し、
前記各ノードが、それぞれ、
前記ノード間クロスバスイッチから変更後のステータスが送られてきたとき、自ノードで管理している前記ノード間クロスバスイッチのステータスを前記変更後のステータスに変更することを特徴とする。
A first status management method according to the present invention includes:
A status management method in a multi-node computer system, comprising: a plurality of nodes; a plurality of inter-node crossbar switches each interconnecting the nodes; and an integrated service processor that manages the inter-node crossbar switches. ,
The integrated service processor comprises:
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input, the status change operation changes the status of the inter-node crossbar switch managed by the own integrated service processor. Change according to the request and notify the status after the change to the crossbar switch between the nodes,
The inter-node crossbar switches are respectively
When the changed status is sent from the integrated service processor, the status of the cross-node switch between the own nodes managed by the cross-node switch between the own nodes is changed to the status after the change, and for each node Notify the changed status,
Each of the nodes is
When the changed status is sent from the inter-node crossbar switch, the status of the inter-node crossbar switch managed by the own node is changed to the changed status.
本発明にかかる第2のステータス管理方法は、第1のステータス管理方法において、
前記統合サービスプロセッサが、
前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部を有し、且つ、
ステータスの変更対象にするノード間クロスバスイッチの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更する処理と、
該処理によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチに対して、変更後のステータスを含むステータス変更指示を送信する処理とを実行し、
前記各ノード間クロスバスイッチが、それぞれ、
自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部を有し、且つ、
該第2のステータス格納部の内容を、前記統合サービスプロセッサから送られてきたステータス変更指示に従って変更する処理と、
該処理によって前記第2のステータス格納部に格納されているステータスが変更されたとき、変更後のステータスを示すステータス通知信号を前記各ノードへ送信する処理とを実行し、
前記ノードが、それぞれ、
前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部を有し、且つ、
該第3のステータス格納部の内容を、前記ノード間クロスバスイッチから送られてきたステータス通知信号に従って変更する処理を実行することを特徴とする。
According to a second status management method of the present invention, in the first status management method,
The integrated service processor comprises:
A first status storage unit storing the status of the crossbar switch between the nodes; and
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input by maintenance personnel, it is stored in the first status storage unit according to the status change operation request. Processing to change the status of the corresponding cross-node switch between nodes,
A process of transmitting a status change instruction including the changed status to the inter-node crossbar switch whose status has been changed when the status stored in the first status storage unit is changed by the process; Run,
The inter-node crossbar switches are respectively
A second status storage unit storing the status of the crossbar switch between the own nodes; and
A process of changing the contents of the second status storage unit according to a status change instruction sent from the integrated service processor;
When the status stored in the second status storage unit is changed by the process, a process of transmitting a status notification signal indicating the status after the change to each node is executed.
The nodes are respectively
A third status storage unit storing the status of the crossbar switch between the nodes; and
The content of the third status storage unit is changed according to a status notification signal sent from the internode crossbar switch.
本発明にかかる第1のプログラムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となる統合サービスプロセッサを、前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部を備えたコンピュータによって実現するためのプログラムであって、
前記コンピュータを、
ステータスの変更対象にするノード間クロスバスイッチの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更する第1のステータス変更手段、
該第1のステータス変更手段によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチに対して、変更後のステータスを含むステータス変更指示を送信する第1のステータス送受信手段として機能させることを特徴とする。
The first program according to the present invention is:
An integrated service as a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor for managing the inter-node crossbar switches A program for realizing a processor by a computer including a first status storage unit in which the status of each internode crossbar switch is stored,
The computer,
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input by maintenance personnel, it is stored in the first status storage unit according to the status change operation request. First status change means for changing the status of the corresponding inter-node crossbar switch;
When the status stored in the first status storage unit is changed by the first status change unit, a status change instruction including the changed status is issued to the inter-node crossbar switch whose status has been changed. It functions as a first status transmission / reception means for transmission.
本発明にかかる第2のプログラムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となるノード間クロスバスイッチを、自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部を有するコンピュータによって実現するためのプログラムであって、
前記コンピュータを、
前記第2のステータス格納部の内容を、前記統合サービスプロセッサから送られてきたステータス変更指示に従って変更する第2のステータス変更手段、
該第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスが変更されたとき、変更後のステータスを示すステータス通知信号を前記各ノードへ送信するステータス通知信号送信手段として機能させることを特徴とする。
The second program according to the present invention is:
Between nodes constituting a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor that manages the inter-node crossbar switches A program for realizing the crossbar switch by a computer having a second status storage unit in which the status of the crossbar switch between the own nodes is stored,
The computer,
Second status change means for changing the contents of the second status storage unit in accordance with a status change instruction sent from the integrated service processor;
When the status stored in the second status storage unit is changed by the second status change unit, the status notification signal transmission unit transmits a status notification signal indicating the changed status to each node. It is characterized by making it.
本発明にかかる第3のプログラムは、
複数のノードと、それぞれが前記各ノードを相互に接続する複数のノード間クロスバスイッチと、該各ノード間クロスバスイッチを管理する統合サービスプロセッサとを備えたマルチノードコンピュータシステムの構成要素となるノードを、前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部を備えたコンピュータによって実現するためのプログラムであって、
前記コンピュータを、
前記第3のステータス格納部の内容を、前記ノード間クロスバスイッチから送られてきたステータス通知信号に従って変更する第3のステータス変更手段として機能させることを特徴とする。
The third program according to the present invention is:
A node that is a component of a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches each interconnecting the nodes, and an integrated service processor that manages the inter-node crossbar switches. , A program to be realized by a computer including a third status storage unit in which the status of each internode crossbar switch is stored,
The computer,
The content of the third status storage unit is made to function as third status change means for changing according to a status notification signal sent from the internode crossbar switch.
〔作用〕
保守員は、障害発生時にマルチノードコンピュータシステムから切り離されたノード間クロスバスイッチ(図17の2−0)を再びマルチノードコンピュータシステムに組み込む際、統合サービスプロセッサ(図17の1)に、上記ノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態にすることを要求するステータス変更操作要求を入力する。
[Action]
When a maintenance engineer installs the inter-node crossbar switch (2-0 in FIG. 17) separated from the multi-node computer system in the event of a failure into the multi-node computer system again, the maintenance staff installs the node A status change operation request for requesting that the status of the crossbar switch (2-0 in FIG. 17) be set to the normal state is input.
ステータス変更操作要求が入力された統合サービスプロセッサ(図17の1)では、第1のステータス変更手段(図17の11)が、上記ステータス変更操作要求に従って、第1のステータス格納部(図17の13)に格納されている上記ノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態に変更し、更に、第1のステータス送受信手段(図17の12)が、上記ノード間クロスバスイッチ(図17の2−0)に対して変更後のステータスを含むステータス変更指示を送信する。 In the integrated service processor (1 in FIG. 17) to which the status change operation request is input, the first status change means (11 in FIG. 17) follows the status change operation request in the first status storage unit (FIG. 17). 13) The status of the internode crossbar switch (2-0 in FIG. 17) stored in 13) is changed to the normal state, and the first status transmission / reception means (12 in FIG. 17) further includes the internode crossbar switch. A status change instruction including the changed status is transmitted to (2-0 in FIG. 17).
統合サービスプロセッサ(図17の1)からのステータス変更指示を受信したノード間クロスバスイッチ(図17の2−0)では、第2のステータス変更手段(図17の24)が、第2のステータス格納部(図17の25)に格納されている自ノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態に変更し、更に、ステータス通知信号送信手段(図17の27)が、変更後のステータスを示すステータス通知信号を各ノード(図17の3−0〜3−m)へ送信する。 In the inter-node crossbar switch (2-0 in FIG. 17) that has received the status change instruction from the integrated service processor (1 in FIG. 17), the second status change means (24 in FIG. 17) stores the second status. The status of the crossbar switch between the nodes (2-0 in FIG. 17) stored in the unit (25 in FIG. 17) is changed to the normal state, and the status notification signal transmission means (27 in FIG. 17) is changed. A status notification signal indicating a later status is transmitted to each node (3-0 to 3-m in FIG. 17).
ノード間クロスバスイッチ(図17の2−0)からノーマル状態を示すステータス通知信号が送られてきたノード(図17の3−0〜3−m)では、第3のステータス変更手段(図17の31)が、第3のステータス格納部(図17の32)に格納されている上記ノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態に変更する。 In the node (3-0 to 3-m in FIG. 17) from which the status notification signal indicating the normal state is sent from the internode crossbar switch (2-0 in FIG. 17), the third status change means (in FIG. 17). 31) changes the status of the inter-node crossbar switch (2-0 in FIG. 17) stored in the third status storage unit (32 in FIG. 17) to the normal state.
以上述べたように、保守員がマルチノードコンピュータシステムに組み込むノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態に変更することを指示するステータス変更操作要求を統合サービスプロセッサ(図17の1)に入力するだけで、統合サービスプロセッサ(図17の1)、該当ノード間クロスバスイッチ(図17の2−0)及び全ノード(図17の3−0〜3−m)で管理している上記該当ノード間クロスバスイッチ(図17の2−0)のステータスをノーマル状態に変更することができるので、保守員にかかる負担を低減させることができる。また、上記した処理では、ノードサービスプロセッサの介在が不要であるため、ノードサービスプロセッサに障害が発生している場合であっても、ノード間クロスバスイッチ(図17の2−0)をマルチノードコンピュータシステムに組み込むことができる。 As described above, a status change operation request for instructing that the maintenance staff change the status of the inter-node crossbar switch (2-0 in FIG. 17) to be incorporated into the multi-node computer system to the normal state is sent to the integrated service processor (FIG. 17). 1), the integrated service processor (1 in FIG. 17), the inter-node crossbar switch (2-0 in FIG. 17) and all nodes (3-0 to 3-m in FIG. 17) Since the status of the corresponding inter-node crossbar switch (2-0 in FIG. 17) can be changed to the normal state, the burden on the maintenance staff can be reduced. In addition, since the above-described processing does not require the node service processor, even if a failure has occurred in the node service processor, the inter-node crossbar switch (2-0 in FIG. 17) is connected to the multi-node computer. Can be incorporated into the system.
本発明によれば、障害から復旧したIXSをマルチノードコンピュータシステムに組み込む際、各ノードで管理されている上記IXSのステータスを、ノードサービスプロセッサを利用しなくとも、保守員が容易に変更することが可能になる。 According to the present invention, when an IXS recovered from a failure is incorporated into a multi-node computer system, maintenance personnel can easily change the status of the IXS managed by each node without using a node service processor. Is possible.
その理由は、統合サービスプロセッサが、保守員によってステータス変更操作要求が入力されたとき、自統合サービスプロセッサで管理している上記ノード間クロスバスイッチのステータスをステータス変更操作要求に従って変更すると共に、上記ノード間クロスバスイッチに対して変更後のステータスを通知する構成を有し、各ノード間クロスバスイッチが、統合サービスプロセッサから変更後のステータスが送られてきたとき、自ノード間クロスバスイッチで管理している自ノード間クロスバスイッチのステータスを上記変更後のステータスに変更すると共に、各ノードに対して変更後のステータスを通知する構成を有し、各ノードが、ノード間クロスバスイッチから変更後のステータスが送られてきたとき、自ノードで管理している上記ノード間クロスバスイッチのステータスを上記変更後のステータスに変更する構成を有しているからである。即ち、保守員が統合サービスプロセッサに対して、マルチノードコンピュータシステムに組み込むノード間クロスバスイッチのステータスをノーマル状態に変更することを要求するステータス変更操作要求を入力するだけで、ノードサービスプロセッサを使用することなく、統合サービスプロセッサ、該当ノード間クロスバスイッチ及び全ノードで管理されている該当ノード間クロスバスイッチのステータスをノーマル状態に変更できるからである。 The reason is that, when the status change operation request is input by the maintenance staff, the integrated service processor changes the status of the inter-node crossbar switch managed by the self-integrated service processor according to the status change operation request, and the node The inter-node crossbar switch is configured to notify the status after the change, and when the status after the change is sent from the integrated service processor, the inter-node crossbar switch is managed by the cross-bar switch between the nodes. In addition to changing the status of the crossbar switch between the nodes to the status after the change, each node is notified of the status after the change, and each node sends the status after the change from the crossbar switch between nodes. Managed by the local node when The status of the crossbar switch between nodes because has a configuration to change the status after the change. That is, the maintenance staff uses the node service processor only by inputting a status change operation request for requesting the integrated service processor to change the status of the inter-node crossbar switch incorporated in the multi-node computer system to the normal state. This is because the status of the integrated service processor, the inter-node crossbar switch, and the inter-node crossbar switch managed by all the nodes can be changed to the normal state.
次に本発明の実施の形態について図面を参照して詳細に説明する。 Next, embodiments of the present invention will be described in detail with reference to the drawings.
〔第1の実施の形態の構成の説明〕
図1は本発明にかかるマルチノードコンピュータシステムの第1の実施の形態の構成例を示すブロック図である。同図を参照すると、本実施の形態のマルチノードコンピュータシステムは、2重化されたノード間クロスバスイッチ(IXS)2−0、2−1と、IXS2−0、2−1を介して相互に接続される複数のノード3−0〜3−mと、IXS2−0、2−1を管理する統合サービスプロセッサ(統合SVP)1と、ノード3−0〜3−j、…、3−(m−j)〜3−mを管理するノードサービスプロセッサ(ノードSVP)4−0、…、4−kとから構成されており、統合SVP1とノードSVP4−0、…、4−kは、LAN5により接続されている。なお、本実施の形態では、IXS2−0、2−1には、それぞれ識別子「IXS#0、IXS#1」が付与され、ノード3−0〜3−mには、それぞれ識別子「ノード#0〜ノード#m」が付与されているとする。
[Description of Configuration of First Embodiment]
FIG. 1 is a block diagram showing a configuration example of a first embodiment of a multi-node computer system according to the present invention. Referring to the figure, the multi-node computer system according to the present embodiment is connected to each other via duplexed inter-node crossbar switches (IXS) 2-0 and 2-1 and IXS 2-0 and 2-1. A plurality of connected nodes 3-0 to 3-m, an integrated service processor (integrated SVP) 1 for managing IXS 2-0 and 2-1, and nodes 3-0 to 3-j, ..., 3- (m -J) to 3-m managing node service processors (node SVP) 4-0, ..., 4-k. The integrated SVP1 and the nodes SVP4-0, ..., 4-k are connected to each other by the
図2は、統合SVP1、IXS2−0、ノード3−0及びノードSVP4−0の構成例を示すブロック図である。 FIG. 2 is a block diagram illustrating a configuration example of the integrated SVP1, IXS 2-0, node 3-0, and node SVP 4-0.
〔統合SVP1の構成〕
図2を参照すると、統合SVP1は、第1のステータス変更手段11と、第1のステータス送受信手段12と、第1のステータス格納部13と、コンソール14とを備えている。
[Configuration of integrated SVP1]
Referring to FIG. 2, the integrated SVP 1 includes a first
第1のステータス格納部13には、各IXS2−0、2−1のステータスがその識別子に対応付けて登録されている。なお、本実施の形態では、ステータスは、IXSが運用系(ACT)なのか待機系(STB)なのかを示す第1のステータスと、IXSがマルチノードコンピュータシステムに組み込まれている組み込み状態(ノーマル状態)なのか、切り離されている切り離し状態(デグレード状態)であるのかを示す第2のステータスとから構成されており、ACT/ノーマル状態、STB/ノーマル状態およびSTB/デグレード状態の3種類の状態をとることができるようになっている。
In the first
コンソール14は、保守員が統合SVP1を操作するための入力装置であり、保守員は、コンソール14を利用してステータス変更操作要求などの各種操作要求を入力することができる。
The
第1のステータス変更手段11は、コンソール14からステータス変更対象にするIXSの識別子および変更後のステータスを含むステータス変更操作要求が入力されたとき、それに従って第1のステータス格納部13に格納されているステータスを変更し、更に、第1のステータス送受信手段12に対してステータス変更対象にするIXSの識別子および変更後のステータスを渡す機能や、第1のステータス送受信手段12を介して変更後のステータス及び送信元IXSの識別子を含むステータス変更指示を受信したとき、それに従って第1のステータス格納部13に格納されているステータスを変更する機能を有する。
When the status change operation request including the identifier of the IXS to be changed and the status after the change is input from the
第1のステータス送受信手段12は、第1のステータス変更手段11からIXSの識別子および変更後のステータスが渡されたとき、上記識別子によって示されるIXSに対して上記変更後のステータスを含んだステータス変更指示を送信する機能や、各IXS2−0、2−1から送られてきたステータス変更指示を第1のステータス変更手段11に渡す機能を有する。
When the IXS identifier and the changed status are passed from the first
このような機能を有する統合SVP1は、コンピュータによって実現可能であり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを統合SVP1として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、第1のステータス変更手段11と、第1のステータス送受信手段12とを実現する。 The integrated SVP 1 having such functions can be realized by a computer, and when realized by a computer, for example, as follows. A disk, a semiconductor memory, and other recording media recording a program for causing the computer to function as the integrated SVP 1 are prepared, and the computer reads the program. The computer realizes the first status change means 11 and the first status transmission / reception means 12 on its own computer by controlling its own operation according to the read program.
〔IXS2−0の構成〕
IXS2−0は、初期化手段21と、障害検出手段22と、第2のステータス送受信手段23と、第2のステータス変更手段24と、第2のステータス格納部25と、診断結果判断手段26と、ステータス通知信号送信手段27とを備えている。なお、図2においては図示を省略したが、IXS2−0の内部には、或るノードから送られてきたデータを、指定された送信先のノードに送信するためのデータスイッチも設けられている。また、他のIXSもIXS2−0と同様の構成を有している。
[Configuration of IXS2-0]
The IXS 2-0 includes an
第2のステータス変更手段24は、次のような機能を有する。
The second
・第2のステータス送受信手段23を介して統合SVP1から送られてきたステータス変更指示を受信したとき、受信したステータス変更指示に従って第2のステータス格納部25に格納されている自IXS2−0のステータスを変更する機能。
・上記ステータス変更指示が、デグレード状態からノーマル状態への変更を指示するものである場合は、初期化手段21を起動する機能。
・初期化手段21による初期化が成功した場合は、ステータス通知信号送信手段27に変更後のステータスを渡し、失敗した場合は、第2のステータス格納部25に格納されている自IXS2−0のステータスを変更前のステータスに戻し、更に、第2のステータス送受信手段23に変更前のステータスを渡す機能。
・診断結果判断手段26が各ノードから送られてきた診断結果の中に異常終了を示すものが存在すると判断した場合、第2のステータス格納部25に格納されている自IXS2−0のステータスを変更前のステータスに戻すと共に、第2のステータス送受信手段23およびステータス通知信号送信手段27に変更前のステータスを通知する機能。
When the status change instruction sent from the integrated SVP 1 is received via the second status transmission / reception means 23, the status of the own IXS 2-0 stored in the second
A function of starting the initialization means 21 when the status change instruction is an instruction to change from the degraded state to the normal state.
When the initialization by the
When the diagnosis result determination means 26 determines that there is an abnormality end indication among the diagnosis results sent from each node, the status of the own IXS 2-0 stored in the second
第2のステータス送受信手段23は、統合SVP1から送られてきたステータス変更指示を第2のステータス変更手段24に渡す機能や、第2のステータス変更手段24から渡されたステータスおよび自IXS2−0の識別子「IXS#0」を含んだステータス変更指示を統合SVP1へ送信する機能を有する。 The second status transmission / reception means 23 has a function of passing the status change instruction sent from the integrated SVP 1 to the second status change means 24, the status passed from the second status change means 24, and the own IXS 2-0. It has a function of transmitting a status change instruction including the identifier “IXS # 0” to the integrated SVP1.
第2のステータス格納部25には、自IXS2−0のステータスのみが格納されている。
Only the status of the own IXS 2-0 is stored in the second
初期化手段21は、第2のステータス変更手段24によって起動されると、自IXS2−0を初期化する機能や、初期化に成功したか否かを第2のステータス変更手段24に通知する機能を有する。
When the
障害検出手段22は、自IXS2−0の障害を検出したとき、次のような処理を行う。 The failure detection means 22 performs the following process when it detects a failure of its own IXS 2-0.
・自IXS2−0内の第2のステータス格納部25に格納されているステータスを「STB/デグレード」に変更する。
・統合SVP1に対して障害発生を通知する。この通知を受けた統合SVP1は、第1のステータス格納部13に格納されているIXS2−0のステータスを「STB/デグレード」に変更する。更に、第1のステータス格納部13に格納されているIXS2−1のステータスが「STB/ノーマル」であれば、「ACT/ノーマル」に変更する。
・2重化されている他方のIXS2−1に対して障害発生を通知する。この通知を受けたIXS2−1は、自IXS2−1内のステータス格納部25に格納されているステータスが「STB/ノーマル」であれば、それを「ACT/ノーマル」に変更し、以後、運用系として動作する。
・各ノード3−0〜3−mに障害発生を通知する。この通知を受けた各ノード3−0〜3−mは、自ノード内の第3のステータス格納部33に格納されているIXS2−0のステータスを「STB/デグレード」に変更する。更に、第3のステータス格納部33に格納されているIXS2−1のステータスが「STB/ノーマル」であれば、それを「ACT/ノーマル」に変更し、以後、IXS2−1を運用系と認識してノード間のデータ転送処理を行う。
・各ノードSVP4−0〜4−kに障害発生を通知する。この通知を受けた各ノードSVP4−0〜4−kは、それぞれ、自ノードSVP内の第4のステータス格納部43に格納されているIXS2−0のステータスを「STB/デグレード」に変更する。更に、IXS2−1のステータスが「STB/ノーマル」であれば、それを「ACT/ノーマル」に変更する。
Change the status stored in the second
Notify the integrated SVP1 of the occurrence of a failure. Upon receiving this notification, the integrated SVP 1 changes the status of the IXS 2-0 stored in the first
-Notify the occurrence of a failure to the other duplexed IXS 2-1. Upon receiving this notification, if the status stored in the
Notify each node 3-0 to 3-m that a failure has occurred. Receiving this notification, each of the nodes 3-0 to 3-m changes the status of the IXS 2-0 stored in the third
Notify each node SVP 4-0 to 4-k that a failure has occurred. Receiving this notification, each of the nodes SVP4-0 to 4-k changes the status of IXS2-0 stored in the fourth
ステータス通知信号送信手段27は、自IXS2−0のステータス(ステータス変更手段24から通知されたステータス)を示すステータス通知信号を、全ノード3−0〜3−mに送信する機能を有する。
The status notification
診断結果判断手段26は、各ノード3−0〜3−mが行う診断処理(ケーブル接続チェック等)の診断結果が全て正常終了を示しているか否かを判定する機能や、各ノード3−0〜3−mの診断結果が全て正常終了を示しているか否かを各ノード3−0〜3−mに通知する機能や、各ノード3−0〜3−mの診断結果の中に1個でも異常終了を示すものが存在する場合は、そのことを第2のステータス変更手段24に通知する機能を有する。
The diagnostic result judging means 26 has a function for judging whether or not all diagnostic results of diagnostic processing (cable connection check etc.) performed by the nodes 3-0 to 3-m indicate normal termination, A function for notifying each of the nodes 3-0 to 3-m whether or not all of the diagnosis results of .about.3-m indicate normal termination, and one in the diagnosis result of each of the nodes 3-0 to 3-m. However, there is a function of notifying the second
このような機能を有するIXS2−0は、コンピュータによって実現可能であり、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータをIXS2−0として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、初期化手段21、障害検出手段22、第2のステータス送受信手段23、第2のステータス変更手段24、診断結果判断手段26及びステータス通知信号送信手段27を実現する。
The IXS 2-0 having such a function can be realized by a computer, and when realized by a computer, for example, as follows. A disk, a semiconductor memory, and other recording media on which a program for causing the computer to function as IXS 2-0 is recorded are prepared, and the computer reads the program. The computer controls its own operation according to the read program, so that the
〔ノード3−0の構成〕
ノード3−0は、第3のステータス変更手段31と、第3のステータス送受信手段32と、第3のステータス格納部33と、診断手段34と、ステータス通知信号受信手段35とを備えている。なお、図2においては図示を省略したが、ノード3−0は、複数のCPUやそれによって共有される共有メモリも備えている。また、他のノードもノード3−0と同様の構成を有している。
[Configuration of node 3-0]
The node 3-0 includes a third
第3のステータス格納部33には、各IXS2−0、2−1のステータスが識別子IXS#0、IXS#1に対応付けて登録されている。
In the third
第3のステータス変更手段31は、第3のステータス送受信手段32を介してステータス変更指示を受信したとき、上記ステータス変更指示に従って第3のステータス格納部33に格納されているステータスを変更する機能や、診断手段34からステータスを変更するIXSの識別子および変更後のステータスが通知されたとき、第3のステータス格納部33に格納されているステータスを変更し、更に、第3のステータス送受信手段32に対して上記IXSの識別子および変更後のステータスを通知する機能を有する。
When the third status change means 31 receives the status change instruction via the third status transmission / reception means 32, the third status change means 31 changes the status stored in the third
第3のステータス送受信手段32は、ノードSVP4−0から送られてきたステータス変更指示を第3のステータス変更手段31に渡す機能や、第3のステータス変更手段31から通知されたIXSの識別子および変更後のステータスを含むステータス変更指示をノードSVP4−0に送信する機能を有する。 The third status transmission / reception means 32 has a function of passing a status change instruction sent from the node SVP4-0 to the third status change means 31, and an IXS identifier and change notified from the third status change means 31. It has a function of transmitting a status change instruction including a later status to the node SVP4-0.
ステータス通知信号受信手段35は、IXS2−0、2−1から送られてきたステータス通知信号を診断手段34に渡す機能を有する。
The status notification
診断手段34は、次のような機能を有する。 The diagnostic means 34 has the following functions.
・ステータス通知信号受信手段35を介して受信したステータス通知信号によって示されるステータスの第1ステータスが「ノーマル」であるか、「デグレード」であるかを判断する機能。
・第1ステータスが「デグレード」の場合は、第3のステータス変更手段31に対して上記ステータス通知信号の送信元のIXSの識別子および上記ステータスを通知する機能。
・第1のステータスが「ノーマル」の場合は、上記ステータス通知信号の送信元のIXSに対する診断処理を実行し、診断結果を上記IXSに送信する機能。
・送信した診断結果に応答して、IXSから全てのノードで診断が正常終了したことが通知された場合、第3のステータス変更手段31に対して上記IXSの識別子およびステータスを通知する機能。
A function for determining whether the first status of the status indicated by the status notification signal received via the status notification signal receiving means 35 is “normal” or “degrade”.
A function of notifying the third status changing means 31 of the IXS identifier of the status notification signal and the status when the first status is “degrade”.
A function of executing diagnostic processing for IXS that is the transmission source of the status notification signal and transmitting a diagnostic result to the IXS when the first status is “normal”.
A function of notifying the third
上記した機能を有するノード3−0は、コンピュータによって実現可能であり、その場合には、例えば、次のようにする。コンピュータをノード3−0として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、第3のステータス変更手段31、第3のステータス送受信手段32、診断手段34およびステータス通知信号受信手段35を実現する。
The node 3-0 having the above function can be realized by a computer. In this case, for example, the following is performed. A disk, a semiconductor memory, and other recording media recording a program for causing the computer to function as the node 3-0 are prepared, and the computer reads the program. The computer controls the operation of the computer according to the read program, thereby realizing the third
〔ノードSVP4−0の構成〕
ノードSVP4−0は、第4のステータス変更手段41と、第4のステータス送受信手段42と、第4のステータス格納部43とを備えている。なお、他のノードSVPもノードSVP4−0と同様の構成を有している。
[Configuration of node SVP4-0]
The node SVP4-0 includes a fourth
第4のステータス格納部43には、各ノード3−0〜3−mの識別子「ノード#0〜ノード#m」に対応付けて、そのノードが保持している各IXSのステータスが格納されている。
The fourth
第4のステータス変更手段41は、ステータス送受信手段42を介してノード3−0〜3−mからのステータス変更指示を受信したとき、それに従って第4のステータス格納部43に格納されているステータスを変更する機能や、LAN5を介して統合SVP1からステータス変更操作要求が送られてきたとき、それに従って第4のステータス格納部43に格納されているステータスを変更し、更に、第4のステータス送受信手段42に対して、ステータスを変更したIXSの識別子および変更後のステータスを渡す機能を有する。
When the fourth
第4のステータス送受信手段42は、各ノード3−0〜3−mから送られてきたステータス変更指示を第4のステータス変更手段41に渡す機能や、第4のステータス変更手段41から渡されたIXSの識別子および変更後のステータスを含むステータス変更指示を各ノード3−0〜3−mに送信する機能を有する。 The fourth status transmission / reception means 42 has a function of passing a status change instruction sent from each of the nodes 3-0 to 3 -m to the fourth status change means 41 and the fourth status change means 41. It has a function of transmitting a status change instruction including an IXS identifier and a changed status to each of the nodes 3-0 to 3-m.
このような機能を有するノードSVP4−0は、コンピュータによって実現可能であり、その場合には、例えば、次のようにする。コンピュータをノードSVP4−0として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、第4のステータス変更手段41、および第4のステータス送受信手段42を実現する。 The node SVP4-0 having such a function can be realized by a computer. In this case, for example, the following is performed. A disk, a semiconductor memory, and other recording media on which a program for causing the computer to function as the node SVP4-0 is recorded are prepared, and the computer reads the program. The computer realizes the fourth status change means 41 and the fourth status transmission / reception means 42 on the own computer by controlling its own operation according to the read program.
〔第1の実施の形態の動作の説明〕
次に、本実施の形態の動作について詳細に説明する。
[Description of Operation of First Embodiment]
Next, the operation of the present embodiment will be described in detail.
今、2重化されたIXS2−0、2−1の内の一方のIXS(例えば、IXS2−0)が運用系として動作しており、他方のIXS2−1が待機系として動作している。即ち、IXS2−0、2−1のステータスがそれぞれ「ACT/ノーマル」、「STB/ノーマル」になっているとする。 Now, one of the duplexed IXS 2-0 and 2-1 (for example, IXS 2-0) is operating as the active system, and the other IXS 2-1 is operating as the standby system. That is, it is assumed that the statuses of IXS 2-0 and 2-1 are “ACT / normal” and “STB / normal”, respectively.
この状態において、運用系として動作しているIXS2−0内の障害検出手段22が、IXS2−0の障害を検出すると、IXS2−0、2−1内のステータス格納部25に格納されているステータスがそれぞれ「STB/デグレード」、「ACT/ノーマル」に変更され、更に、統合サーバ1、各ノード3−0〜3−mおよび各ノードSVP4−0〜4−k内のステータス格納部13、33、43に格納されているIXS2−0、2−1のステータスもそれぞれ「STB/デグレード」、「ACT/ノーマル」に変更される。即ち、待機系であったIXS2−1が運用系に切り替わり、以後、各ノード3−0〜3−mは、IXS2−1を使用してデータ転送を行う。
In this state, when the failure detection means 22 in the IXS 2-0 operating as the active system detects a failure in the IXS 2-0, the status stored in the
その後、「STB/デグレード」となったIXS2−0の修理が完了し、IXS2−0をマルチノードコンピュータシステムに組み込む場合、保守員は、コンソール14から統合SVP1に対して、IXS2−0のステータスを「STB/ノーマル」に変更することを要求するステータス変更操作要求を入力する(図3のステップA1)。このステータス変更操作要求には、IXS2−0の識別子「IXS#0」と変更後のステータス「STB/ノーマル」とが含まれている。
After that, when the repair of IXS 2-0 that has become “STB / Degrade” is completed, and IXS 2-0 is incorporated into the multi-node computer system, the maintenance staff gives the status of IXS 2-0 from the
統合SVP1内のステータス変更手段11は、上記ステータス変更操作要求が入力されると、それに従ってステータス格納部13に格納されているIXS2−0のステータスを「STB/デグレード」から「STB/ノーマル」に変更し(図3のステップA2、図6のステップS61)、更に、ステータス送受信手段12に変更後のステータス「STB/ノーマル」およびステータスを変更したIXS2−0の識別子「IXS#0」を渡す(ステップS62)。これにより、ステータス送受信手段12は、上記識別子「IXS#0」によって特定されるIXS2−0に対して、上記変更後のステータス「STB/ノーマル」を含んだステータス変更指示を送信する(図3のステップA3)。
When the status change operation request is input, the
IXS2−0内のステータス送受信手段23は、統合SVP1からのステータス変更指示を受信すると、それを自IXS2−0内のステータス変更手段24に渡す(図3のステップB1)。 When the status transmission / reception means 23 in the IXS 2-0 receives the status change instruction from the integrated SVP1, it passes it to the status change means 24 in its own IXS 2-0 (step B1 in FIG. 3).
これにより、ステータス変更手段24は、上記ステータス変更指示に従って、ステータス格納部25に格納されている自IXS2−0のステータスを「STB/デグレード」から「STB/ノーマル」に変更する(図3のステップB2、図8のステップS81)。
As a result, the
その後、ステータス変更手段24は、ステップS81で行ったステータスの変更が、その第1ステータスを「デグレード」から「ノーマル」に変更するものであったか否かに基づいて処理を切り分ける(ステップS82)。即ち、今回行ったステータスの変更が、IXSをマルチノードコンピュータシステムに組み込むためのものであったか否かに基づいて処理を切り分ける。
Thereafter, the
この例の場合、ステップS81では、ステータスを「STB/デグレード」から「STB/ノーマル」に変更したので、ステップS82の判断結果がYesとなりステップS83の処理が行われるが、もし、ステップ82の判断結果がNoとなった場合には、ステータス変更手段24は、変更後のステータスをステータス通知信号送信手段27に渡し(ステップS88)、ステータス通知信号送信手段27を利用して各ノード3−0〜3−mに自IXS2−0のステータスが「STB/ノーマル」になったことを通知することになる。
In this example, since the status is changed from “STB / degrade” to “STB / normal” in step S81, the determination result in step S82 is Yes, and the process in step S83 is performed. If the result is No, the
ステップS82の判断結果がYesとなると、ステータス変更手段24は、初期化手段22を起動し、自IXS2−0の初期化を行う(図3のステップB3、図8のステップS83)。そして、初期化が成功したか否かを判断し(図3のステップB4、図8のステップS84)、成功した場合は、ステータス通知信号送信手段27に変更後のステータスを渡し、ステータス通知信号送信手段27から全ノード3−0〜3−mに送信しているステータス通知信号を、「STB/デグレード」を示すものから「STB/ノーマル」を示すものに変更する(図3のステップB5、図8のステップS88)。これに対して、初期化に失敗した場合(図3のステップB4がNo、図8のステップ84がNo)は、ステータス戻し処理を行い(図8のステップS85)、IXS2−0のステータス変更操作を無効にし、図3のステップA1を行う前のステータスにシステム内の全状態を戻す。ステータス戻し処理については後述する。
When the determination result in step S82 is Yes, the
各ノード3−0〜3−m内の診断手段34は、ステータス通知信号受信手段35が受信している、IXS2−0からのステータス通知信号の状態が変化したことを認識すると(図3のステップC1)、図10のフローチャートに示すように、ステータス通知信号の状態が「STB/デグレード」から「STB/ノーマル」に変化したか否かを判断する(ステップS101)。
When the
そして、IXS2−0からのステータス通知信号の状態が「STB/デグレード」から「STB/ノーマル」に変化した場合(ステップ101がYes)は、該当IXS2−0に対する診断処理を行い(図4のステップC2、図10のステップS102)、そうでない場合(ステップ101がNo)は、ステータス変更手段31に変更後のステータス及びIXS2−0の識別子IXS#0を通知する(図10のステップS104)。 When the status of the status notification signal from the IXS 2-0 changes from “STB / degrade” to “STB / normal” (Yes in step 101), the diagnostic processing for the corresponding IXS 2-0 is performed (step of FIG. 4). C2, step S102 in FIG. 10), otherwise (step 101: No), the status change means 31 is notified of the changed status and the identifier IXS # 0 of IXS2-0 (step S104 in FIG. 10).
この例の場合、IXS2−0からのステータス通知信号の状態は、「STB/デグレード」から「STB/ノーマル」に変化したので(ステップ101がYes)、診断手段34は、IXS2−0に対する診断処理を実施する(図4のステップC2、図10のステップ102)。この診断処理において、各ノード3−0〜3−m内の診断手段34は、自ノードとIXS2−0とのケーブル接続が正しく行われているか等を診断し、診断結果をIXS2−0に通知する。その後、各ノード3−0〜3−m内の診断手段34は、IXS2−0から送られてくる通知(各ノードの診断結果が全て正常終了であったか否かを示す通知)を待つ。
In this example, the status of the status notification signal from the IXS 2-0 has changed from “STB / Degrade” to “STB / Normal” (Yes in Step 101), so the
一方、各ノード3−0〜3−m内の診断手段34によって診断処理が行われているIXS2−0は、各ノード3−0〜3−m内の診断手段34から送られてきた診断結果が全て正常終了となっているか否かを調べ、その結果を各ノード3−0〜3−mに通知する(図4のステップB6、B7)。そして、全ての診断結果が正常終了である場合(図4のステップB7がYes)は、その処理を終了する。これに対して、異常終了を示す診断結果が1つでもあれば(図4のステップB7がNo)、ステータスの戻し処理を行い(ステータス戻し処理は後述する)、IXS2−0のステータス変更操作を無効とし、マルチノードコンピュータシステム内の全状態を図3のステップA1を行う前のステータスに戻す。
On the other hand, the IXS 2-0 on which the diagnosis process is performed by the
IXS2−0からの通知を待っている各ノード3−0〜3−m内の診断手段34は、IXS2−0から送られてくる通知に基づいて、IXS2−0をマルチノードコンピュータシステムに組み込むことが可能か否かを判断する(図4のステップC3、図10のステップS103)。即ち、各ノード3−0〜3−m内の診断手段34は、IXS2−0から「各ノードの診断結果が全て正常終了」である旨の通知を受けた場合は、IXS2−0をマルチノードコンピュータシステムに組み込み可能と判断し、「異常終了を示す診断結果が存在」する旨の通知を受けた場合は、組み込み不可能と判断する。 The diagnostic means 34 in each of the nodes 3-0 to 3-m waiting for the notification from the IXS 2-0 incorporates the IXS 2-0 into the multi-node computer system based on the notification sent from the IXS 2-0. Is determined (step C3 in FIG. 4 and step S103 in FIG. 10). In other words, when the diagnosis means 34 in each of the nodes 3-0 to 3-m receives a notification from the IXS 2-0 that “the diagnosis result of each node is all normal completion”, the diagnosis means 34 displays the IXS 2-0 as a multi-node. When it is determined that it can be incorporated into the computer system and a notification that “a diagnosis result indicating abnormal termination exists” is received, it is determined that the computer system cannot be incorporated.
そして、組み込み不可能と判断した場合(図4のステップC3がNo、図10のステップS103がNo)は、各ノード3−0〜3−m内の診断手段34は、その処理を終了する。これに対して、組み込み可能と判断した場合は、各ノード3−0〜3−m内の診断手段34は、自ノード内のステータス変更手段31に、変更後のステータス「STB/ノーマル」及びIXS2−0の識別子IXS#0を渡す(図10のステップS104)。
Then, when it is determined that it cannot be incorporated (No in step C3 in FIG. 4 and No in step S103 in FIG. 10), the diagnostic means 34 in each of the nodes 3-0 to 3-m ends the process. On the other hand, if it is determined that it can be incorporated, the
これにより、各ノード3−0〜3−m内のステータス変更手段31は、自ノード内のステータス格納部33に格納されているIXS2−0のステータスを「STB/ノーマル」に変更し(図4のステップC4、図11のステップS111)、更に、自ノード内のステータス送受信手段32に、変更後のステータス「STB/ノーマル」及びIXS2−0の識別子IXS#0を渡す(図11のステップ112)。これにより、各ノード3−0〜3−m内のステータス送受信手段32は、自ノードを管理しているノードSVPに、変更後のステータス「STB/ノーマル」及びIXS2−0の識別子IXS#0を含むステータス変更指示を送信する(図4のステップC5)。
As a result, the status changing means 31 in each of the nodes 3-0 to 3-m changes the status of the IXS 2-0 stored in the
各ノードSVP4−0〜4−k内のステータス送受信手段42は、自ノードSVPが管理しているノードから、変更後のステータス「STB/ノーマル」及びIXS2−0の識別子IXS#0を含むステータス変更指示が送られてくると、自ノードSVP内のステータス変更手段41に、上記ステータス変更指示を渡す(図4のステップD1)。これにより、各ノードSVP4−0〜4−k内のステータス変更手段41は、ステータス格納部43に格納されているステータスの内の、送信元のノードのノード識別子と対応付けて管理している、IXS2−0のステータスを「STB/ノーマル」に変更する(図4のステップD2、図12のステップS121)。
The status transmission / reception means 42 in each of the nodes SVP4-0 to 4-k changes the status including the changed status “STB / Normal” and the identifier IXS # 0 of IXS2-0 from the node managed by the own node SVP. When the instruction is sent, the status change instruction is transferred to the status change means 41 in the own node SVP (step D1 in FIG. 4). Thereby, the status change means 41 in each node SVP4-0 to 4-k is managed in association with the node identifier of the transmission source node among the statuses stored in the
以上述べたように、統合SVP1上で保守員がIXSのステータス変更操作を行うだけで、マルチノードコンピュータシステム内の全装置(統合SVP1、該当IXS、全ノード、全ノードSVP)に変更されたステータスを反映することができる。 As described above, the status changed to all devices (integrated SVP1, corresponding IXS, all nodes, all nodes SVP) in the multi-node computer system simply by the maintenance personnel performing an IXS status change operation on the integrated SVP1. Can be reflected.
次に、初期化手段21による初期化が失敗した場合(図3のステップB4がNo、図8のステップS84がNo)、診断結果判断手段26が各ノード3−0〜3−mの診断結果の中に異常終了を示す診断結果が存在すると判断した場合(図4のステップB7がNo)に行われるステータス戻し処理について説明する。
Next, when initialization by the
IXS2−0内のステータス変更手段24は、初期化手段21による初期化に失敗した場合(図3のステップB4がNo、図8のステップS84がNo)、ステータス格納部25に格納されている自IXS2−0のステータスを「STB/ノーマル」から「STB/デグレード」に戻す(図5のステップB8、図8のステップS85)。その後、ステータス変更手段24は、ステータス送受信手段23に、戻したステータスを渡し、更に、ステータス通知信号送信手段27に戻したステータスを渡す(図8のステップS86、S87)。
If the initialization by the
また、IXS2−0内のステータス変更手段24は、診断結果判断手段26が、各ノード3−0〜3−mの診断結果の中に異常終了を示す診断結果が存在すると判断した場合(図4のステップB7がNo)、ステータス格納部25に格納されている自IXS2−0のステータスを「STB/ノーマル」から「STB/デグレード」に戻す(図5のステップB8、図9のステップS91)。その後、ステータス変更手段24は、ステータス送受信手段23に、戻したステータスを渡し、更に、ステータス通知信号送信手段27に戻したステータスを渡す(図9のステップS92、S93)。
Further, the
ステータス送受信手段23は、ステータス変更手段24から戻されたステータス「STB/デグレード」が渡されると(図8のステップS86、或いは図9のステップ92)、上記ステータス及び自IXS2−0の識別子IXS#0を含んだステータス変更指示を統合SVP1へ送信する(図5のステップB9)。 When the status “STB / degrade” returned from the status change means 24 is passed to the status transmission / reception means 23 (step S86 in FIG. 8 or step 92 in FIG. 9), the status and the identifier IXS # of its own IXS 2-0 A status change instruction including 0 is transmitted to the integrated SVP 1 (step B9 in FIG. 5).
統合SVP1内のステータス送受信手段12は、IXS2−0からの上記ステータス変更指示を受信すると、それを付加してステータス変更手段11に渡す(図5のステップA4)。これにより、ステータス変更手段11は、ステータス格納部13に格納されているIXS2−0のステータスを「STB/ノーマル」から「STB/デグレード」に戻す(図5のステップA5、図7のステップS71)。
When the status transmission / reception means 12 in the integrated SVP 1 receives the status change instruction from the IXS 2-0, it adds it and passes it to the status change means 11 (
また、IXS2−0内のステータス通知信号送信手段27は、ステータス変更手段24から戻されたステータス「STB/デグレード」が渡されると(図8のステップS87、図9のステップS93)、各ノード3−0〜3−mに対して送信しているステータス通知信号の状態を「STB/ノーマル」から「STB/デグレード」に戻す(図5のステップB10)。
Further, when the status “STB / degrade” returned from the
各ノード3−0〜3−m内の診断手段34は、ステータス通知信号受信手段35が受信している、IXS2−0からのステータス通知信号の状態が変化したことを認識すると(図5のステップC6)、図10のフローチャートに示すように、ステータス通知信号の状態が「STB/デグレード」から「STB/ノーマル」に変化したか否かを判断する(ステップS101)。この例の場合、ステータス通知信号の状態は、「STB/ノーマル」から「STB/デグレード」に変化しているので、ステップS101の判断結果はNoとなる。従って、診断手段34は、自ノード内のステータ変更手段31に、戻されたステータス「STB/デグレード」及びステータス通知信号の送信元の識別子IXS#0を渡す(図10のステップ104)。
When the
これにより、ステータス変更手段31は、自ノード内のステータス格納部33に格納されているIXS2−0のステータスを「STB/ノーマル」から「STB/デグレード」に戻す(図5のステップC7、図11のステップS111)。その後、ステータス変更手段31は、ステータス送受信手段32に、戻したステータス「STB/デグレード」及びIXS2−0の識別子IXSを渡す(図11のステップS112)。
As a result, the
これにより、ステータス変更手段31は、自ノードを管理しているノードSVPに対して、戻されたステータス「STB/デグレード」及びIXS2−0の識別子IXS#0を含んだステータス変更指示を送信する(図5のステップC8)。
As a result, the
各ノードSVP4−0〜4−k内のステータス送受信手段42は、自ノードSVPが管理しているノードから、戻したステータス「STB/デグレード」及びIXS2−0の識別子IXS#0を含むステータス変更指示が送られてくると、自ノードSVP内のステータス変更手段41に、上記ステータス変更指示とその送信元のノードのノード識別子とを渡す(図5のステップD3)。これにより、各ノードSVP4−0〜4−k内のステータス変更手段41は、ステータス格納部43に格納されているステータスの内の、上記送信元のノードのノード識別子と対応付けて管理している、IXS2−0のステータスを「STB/デグレード」に戻す(図5のステップD4、図12のステップS121)。
The status transmission / reception means 42 in each of the nodes SVP4-0 to 4-k receives a status change instruction including the returned status “STB / degrade” and the identifier IXS # 0 of IXS2-0 from the node managed by the own node SVP. Is sent to the status change means 41 in its own node SVP, the status change instruction and the node identifier of the source node (step D3 in FIG. 5). As a result, the status change means 41 in each of the nodes SVP4-0 to 4-k is managed in association with the node identifier of the transmission source node among the statuses stored in the
以上の動作により、保守員が行ったIXS2−0のステータス変更操作を無効とし、マルチノードコンピュータシステムの各装置で管理しているIXS2−0のステータスを、図3のステップA1を行う以前の状態に戻すことができる。 With the above operation, the status change operation of IXS 2-0 performed by maintenance personnel is invalidated, and the status of IXS 2-0 managed by each device of the multi-node computer system is the state before performing step A1 in FIG. Can be returned to.
なお、上述した説明では、IXSの台数を2台としたが、複数台であれば任意の台数で良い。また、IXSの台数を3台以上とした場合は、例えば、その内の1台を現用系として動作させ、残りを待機系として動作させるようにすれば良い。 In the above description, the number of IXSs is two, but any number may be used as long as there are a plurality of IXSs. Further, when the number of IXSs is set to three or more, for example, one of them may be operated as an active system and the rest may be operated as a standby system.
〔第1の実施の形態の効果〕
本実施の形態によれば、障害から復旧したIXSをマルチノードコンピュータシステムに組み込む際、各ノードで管理されている上記復旧したIXSのステータスを、ノードサービスプロセッサを利用しなくとも、保守員が容易に変更することが可能になる。
[Effect of the first embodiment]
According to the present embodiment, when an IXS recovered from a failure is incorporated into a multi-node computer system, the status of the recovered IXS managed by each node can be easily maintained without using a node service processor. It becomes possible to change to.
その理由は、統合SVP1が、保守員が入力するステータス変更操作要求に従って、第1のステータス格納部13に格納されている該当IXS(例えば、IXS2−0)のステータスを変更する第1のステータス変更手段11と、変更後のステータスを含むステータス変更指示を該当IXS2−0に送信する第1のステータス送受信手段12とを備え、各IXS2−0、2−1が、統合SVP1から送られてきたステータス変更指示に従って第2のステータス格納部25に格納されている自IXSのステータスを変更する第2のステータス変更手段24と、変更後のステータスを示すステータス通知信号を各ノードへ送信するステータス通知信号送信手段27とを備え、各ノード3−0〜3−mが、IXSから送られてきたステータス通知信号に従って第3のステータス格納部33に格納されている上記IXSのステータスを変更する第3のステータス変更手段31を備えているからである。即ち、保守員が、統合SVP1に対して、マルチノードコンピュータシステムに組み込むIXSのステータスをノーマル状態にすることを要求するステータス変更操作要求を入力するだけで、ノードSVP4−0〜4−kを使用することなく、統合SVP1、該当IXS及び全ノードで管理されている該当IXSのステータスをノーマル状態に変更することができるからである。
The reason is that the integrated SVP 1 changes the status of the corresponding IXS (for example, IXS 2-0) stored in the first
また、本実施の形態によれば、ステータスをノーマル状態に変更することが要求されたIXSが、正常動作可能な場合のみ、各ノードが管理している上記IXSのステータスをノーマル状態に変更するようにしているので、信頼性を向上させることができる。 Further, according to the present embodiment, the status of the IXS managed by each node is changed to the normal state only when the IXS requested to change the status to the normal state can operate normally. Therefore, reliability can be improved.
その理由は、各ノード3−1〜3−mが、ステータスをノーマル状態に変更するIXS(例えば、IXS2−0)が正常動作可能か否かを診断する診断手段34を備え、全ノード3−1〜3−mの診断手段34によってIXS2−0が正常動作可能と診断された後、自ノード内の第3のステータス格納部33に格納されている上記IXS2−0のステータスをノーマル状態に変更するようにしているからである。
The reason is that each of the nodes 3-1 to 3-m includes diagnostic means 34 for diagnosing whether or not an IXS (for example, IXS 2-0) that changes the status to a normal state can operate normally. After the diagnosis means 34 of 1 to 3 -m diagnoses that the IXS 2-0 can operate normally, the status of the IXS 2-0 stored in the third
〔本発明の第2の実施の形態〕
次に、本発明にかかるマルチノードコンピュータシステムの第2の実施の形態について説明する。前述した第1の実施の形態では、修理後のIXSを再びマルチノードコンピュータシステムに組み込む際、保守員が統合SVP1のコンソール14を用いて行う該当IXSのステータス変更操作を契機にして組み込み処理を開始している。そのため、保守員が統合SVP1上で多くの構成装置の中から当該IXSを選択し、ステータス変更操作を行う必要があり、不慣れな保守員では保守ミスをしてしまう可能性を否定できない。また、第1の実施の形態ではIXSの組み込み操作を統合SVP1から行っているため、統合SVP1に障害が発生し、ダウンしている場合にはIXSの組み込み操作が行えなくなってしまうという問題点がある。本実施の形態は、各IXSに、マルチノードコンピュータシステムへの組み込み時に保守員によって操作される組み込みスイッチを設けることにより、上記した課題に対応できるようにしたことを特徴としている。
[Second Embodiment of the Present Invention]
Next, a second embodiment of the multi-node computer system according to the present invention will be described. In the first embodiment described above, when the repaired IXS is re-installed in the multi-node computer system, the installation process starts when the maintenance staff uses the
〔第2の実施の形態の構成の説明〕
図13は本発明にかかるマルチノードコンピュータシステムの第2の実施の形態の構成例を示すブロック図であり、図1に示した第1の実施の形態との相違点は、IXS2−0、2−1の代わりにIXS2−0a、2−1aを備えている点である。
[Description of Configuration of Second Embodiment]
FIG. 13 is a block diagram showing an example of the configuration of the second embodiment of the multi-node computer system according to the present invention. The difference from the first embodiment shown in FIG. It is a point provided with IXS2-0a and 2-1a instead of -1.
図14は、図13に示した統合SVP1、IXS2−0a、ノード3−0及びノードSVP4−0の構成例を示したブロック図であり、IXS2−0a以外は、図2に示した統合SVP1、ノード3−0及びノードSVP4−0と同様の構成を有しているので、ここでは、IXS2−0aの構成についてのみ説明する。なお、IXS2−1aもIXS2−0aと同様の構成を有している。 FIG. 14 is a block diagram illustrating a configuration example of the integrated SVP1, IXS2-0a, node 3-0, and node SVP4-0 illustrated in FIG. 13, except for the IXS2-0a, the integrated SVP1, Since the configuration is the same as that of the node 3-0 and the node SVP4-0, only the configuration of the IXS 2-0a will be described here. Note that IXS2-1a has the same configuration as IXS2-0a.
本実施の形態で使用する図14に示したIXS2−0aと、第1の実施の形態で使用する図2に示したIXS2−0との相違点は、組み込みスイッチ28が追加されている点、およびステータス変更手段24の代わりにステータス変更手段24aを備えている点である。
The difference between IXS 2-0a shown in FIG. 14 used in this embodiment and IXS 2-0 shown in FIG. 2 used in the first embodiment is that an embedded switch 28 is added, In addition, a
組み込みスイッチ28は、IXS2−0aに備えられた機械的なスイッチであり、障害発生によりマルチノードコンピュータシステムから切り離されたIXS2−0aを、修理完了後に再びマルチノードコンピュータシステムに組み込む際に、保守員によって押下される。この組み込みスイッチ28の押下が契機となって、IXS2−0aをマルチノードコンピュータシステムに組み込むための処理が開始される。 The built-in switch 28 is a mechanical switch provided in the IXS 2-0a. When the IXS 2-0a separated from the multi-node computer system due to the occurrence of a failure is installed again in the multi-node computer system after the repair is completed, Is pressed. When the built-in switch 28 is pressed, processing for incorporating IXS 2-0a into the multi-node computer system is started.
ステータス変更手段24aは、図2に示したステータス変更手段24が備えている機能に加え、組み込みスイッチ28が押下されたとき、自IXS2−0a内のステータス格納部25に格納されている自IXS2−0aのステータスを「STB/ノーマル」に変更し、更に、初期化手段21を起動する機能を有する。
In addition to the functions provided in the
本実施の形態で使用するIXS2−0aもコンピュータによって実現することができ、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータをIXS2−0aとして機能させるプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、初期化手段21、障害検出手段22、ステータス送受信手段23、ステータス変更手段24a、診断結果判断手段26、及びステータス通知信号送信手段27を実現する。
The IXS 2-0a used in the present embodiment can also be realized by a computer, and when realized by a computer, for example, as follows. A disk, a semiconductor memory, and other recording media on which a program for causing the computer to function as IXS 2-0a is recorded are prepared, and the program is read by the computer. The computer controls its own operation according to the read program, so that the
〔第2の実施の形態の動作の説明〕
次に、本実施の形態の動作について説明する。なお、保守員が組み込みスイッチ28を押下した時の動作以外は、第1の実施の形態と同様であるので、ここでは、保守員が組み込みスイッチ28を操作した場合の動作についてのみ説明する。
[Description of Operation of Second Embodiment]
Next, the operation of the present embodiment will be described. Since the operation other than the operation when the maintenance person presses the built-in switch 28 is the same as the first embodiment, only the operation when the maintenance person operates the built-in switch 28 will be described.
今、例えば、障害が発生し、ステータスが「STB/デグレード」となったIXS2−0aの修理が完了し、当該IXS2−0aを再びマルチノードコンピュータシステムに組み込むために、保守員がIXS2−0aの組み込みスイッチ28を押下したとする(図15のステップE1)。 Now, for example, in order to complete the repair of the IXS 2-0a in which a failure has occurred and the status becomes “STB / degrade” and the IXS 2-0a is incorporated into the multi-node computer system again, the maintenance personnel Assume that the built-in switch 28 is pressed (step E1 in FIG. 15).
IXS2−0a内のステータス変更手段24aは、組み込みスイッチ28が押下されると、ステータス格納部25に格納されている自IXS2−0aのステータスを「STB/デグレード」から「STB/ノーマル」に変更する(図15のステップE2、図16のステップS161)。その後、ステータス変更手段24aは、ステータス送受信手段23に、変更後のステータス「STB/ノーマル」を渡す(図16のステップS162)。これにより、ステータス送受信手段23が、変更後のステータス「STB/ノーマル」及び自IXS2−0aの識別子IXS#0を含むステータス変更指示を統合SVP1へ送信する(図15のステップE3)。
When the built-in switch 28 is pressed, the
統合SVP1内のステータス送受信手段12は、IXS2−0aからの上記ステータス変更指示を受信すると、それをステータス変更手段11に渡す(図15のステップE4)。これにより、ステータス変更手段11は、ステータス格納部13に格納されているIXS2−0aのステータスを「STB/デグレード」から「STB/ノーマル」に変更する(図15のステップE5、図7のステップS71)。
When the status transmission / reception means 12 in the integrated SVP 1 receives the status change instruction from the IXS 2-0a, it passes it to the status change means 11 (step E4 in FIG. 15). As a result, the
一方、IXS2−0a内のステータス変更手段24aは、ステップ162の処理が終了すると、初期化手段21を起動し、IXS2−0aの初期化を行う(図15のステップB3、図16のステップS163)。
On the other hand, when the processing in
そして、初期化に成功した場合(図15のステップB4がYes、図16のステップS164がYes)は、前述したステップB5、ステップS88と同様の処理(図15のステップB5、図16のステップS168)が行われる。これにより、各ノード3−0〜3−m及び各ノードSVP4−0〜4−kにもIXS2−0aのステータスが反映される。 If initialization is successful (step B4 in FIG. 15 is Yes and step S164 in FIG. 16 is Yes), the same processing as Step B5 and Step S88 described above (Step B5 in FIG. 15 and Step S168 in FIG. 16). ) Is performed. As a result, the status of IXS 2-0a is also reflected in each of the nodes 3-0 to 3-m and each of the nodes SVP4-0 to 4-k.
これに対して、初期化に失敗した場合は前述したステップB8〜B10、ステップS85〜S87と同様の処理(図5のステップB8〜B10、図16のステップS165〜S167)が行われ、IXS2−0aのステータスが「STB/デグレード」に戻される。 On the other hand, if initialization fails, the same processing as in steps B8 to B10 and steps S85 to S87 described above (steps B8 to B10 in FIG. 5 and steps S165 to S167 in FIG. 16) is performed. The status of 0a is returned to “STB / degrade”.
〔第2の実施の形態の効果〕
本実施の形態によれば、第1の実施の形態が有している効果に加え、保守員が修理を行ったIXSをマルチノードコンピュータシステムに組み込む際に、組み込み操作を誤ったり、忘れたりする操作ミスを防止できるという効果を得ることができる。更に、統合SVP1に障害が発生している場合でも、IXSをマルチノードコンピュータシステムに組み込むことができるという効果を得ることもできる。
[Effects of Second Embodiment]
According to the present embodiment, in addition to the effects of the first embodiment, when an IXS that has been repaired by a maintenance staff is incorporated into a multi-node computer system, the installation operation is mistaken or forgotten. The effect that operation mistakes can be prevented can be obtained. Furthermore, even when a failure occurs in the integrated SVP1, it is possible to obtain an effect that IXS can be incorporated into a multi-node computer system.
その理由は、各IXS2−0、2−1が組み込みスイッチ28を備えており、この組み込みスイッチ28が押下されたことを契機として、IXSをマルチノードコンピュータシステムに組み込むための処理を開始するようにしているからである。 The reason is that each IXS 2-0, 2-1 has a built-in switch 28, and when the built-in switch 28 is pressed, processing for incorporating IXS into the multi-node computer system is started. Because.
本発明は、複数のノードがノード間クロスバスイッチを介して相互に接続されるスパーコンピュータ等に適用できる。 The present invention can be applied to a spar computer or the like in which a plurality of nodes are connected to each other via an inter-node crossbar switch.
1…統合サービスプロセッサ(統合SVP)
11…第1のステータス変更手段
12…第1のステータス送受信手段
13…第1のステータス格納部
14…コンソール
2−0〜2−n、2−0a、2−1a…ノード間クロスバスイッチ(IXS)
21…初期化手段
22…障害検出手段
23…第2のステータス送受信手段
24、24a…第2のステータス変更手段
25…第2のステータス格納部
26…診断結果判断手段
27…ステータス通知信号送信手段
28…組み込みスイッチ
3−0〜3−m…ノード
31…第3のステータス変更手段
32…第3のステータス送受信手段
33…第3のステータス格納部
34…診断手段
35…ステータス通知信号受信手段
4−0〜4−k…ノードサービスプロセッサ(ノードSVP)
41…第4のステータス変更手段
42…第4のステータス送受信手段
43…第4のステータス格納部
5…LAN
1 ... Integrated service processor (integrated SVP)
DESCRIPTION OF
21 ... Initialization means 22 ... Fault detection means 23 ... Second status transmission / reception means 24, 24a ... Second status change means 25 ... Second status storage unit 26 ... Diagnosis result judgment means 27 ... Status notification signal transmission means 28 ... built-in switches 3-0 to 3-m ...
41 ... Fourth status change means 42 ... Fourth status transmission / reception means 43 ...
Claims (5)
前記統合サービスプロセッサが、
前記各ノード間クロスバスイッチのステータスが格納された第1のステータス格納部と、
ステータスの変更対象にするノード間クロスバスイッチの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更する第1のステータス変更手段と、
該第1のステータス変更手段によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチに対して、変更後のステータスを含むステータス変更指示を送信する第1のステータス送受信手段とを備え、
前記各ノード間クロスバスイッチが、それぞれ、
自ノード間クロスバスイッチのステータスが格納された第2のステータス格納部と、
該第2のステータス格納部の内容を、前記統合サービスプロセッサから送られてきたステータス変更指示に従って変更する第2のステータス変更手段と、
該第2のステータス変更手段によって前記第2のステータス格納部に格納されているステータスが変更されたとき、変更後のステータスを示すステータス通知信号を前記各ノードへ送信するステータス通知信号送信手段と、
前記統合サービスプロセッサから送られてきたステータス変更指示が、ノーマル状態への変更を指示するものである場合、自ノード間クロスバスイッチの初期化を行う初期化手段とを備え、
前記ノードが、それぞれ、
前記各ノード間クロスバスイッチのステータスが格納された第3のステータス格納部と、
該第3のステータス格納部の内容を、前記ノード間クロスバスイッチから送られてきたステータス通知信号に従って変更する第3のステータス変更手段と、
前記ノード間クロスバスイッチから送られてきたステータス通知信号が、ノーマル状態を示すものである場合、前記ステータス通知信号の送信元のノード間クロスバスイッチに対する診断処理であって、自ノードとの間の接続チェックを含む診断処理を実施する診断手段とを備え、且つ、
前記ステータス通知信号送信手段が、前記初期化手段による初期化が成功した後、前記ステータス通知信号を前記各ノードへ送信する構成を有し、
前記第3のステータス変更手段が、全てのノードの診断手段の診断結果が正常終了である場合、前記第3のステータス格納部に格納されている、前記ノード間クロスバスイッチのステータスを、ノーマル状態に変更する構成を有することを特徴とするマルチノードコンピュータシステム。 In a multi-node computer system comprising a plurality of nodes, a plurality of inter-node crossbar switches that connect the nodes to each other, and an integrated service processor that manages the inter-node crossbar switches,
The integrated service processor comprises:
A first status storage unit storing the status of the crossbar switch between the nodes;
When a status change operation request including an identifier of an inter-node crossbar switch to be changed in status and a status after change is input by maintenance personnel, it is stored in the first status storage unit according to the status change operation request. First status changing means for changing the status of the corresponding inter-node crossbar switch;
When the status stored in the first status storage unit is changed by the first status change unit, a status change instruction including the changed status is issued to the inter-node crossbar switch whose status has been changed. First status transmitting / receiving means for transmitting,
The inter-node crossbar switches are respectively
A second status storage unit storing the status of the crossbar switch between the own nodes;
Second status change means for changing the contents of the second status storage unit in accordance with a status change instruction sent from the integrated service processor;
Status notification signal transmitting means for transmitting a status notification signal indicating the changed status to each of the nodes when the status stored in the second status storage section is changed by the second status change means;
Status change instruction transmitted from the integrated service processor, when is an indication of the change to the normal state, and a initial catheter stage for initializing the crossbar switch between its own node,
The nodes are respectively
A third status storage unit storing the status of the crossbar switch between the nodes;
Third status change means for changing the contents of the third status storage unit according to a status notification signal sent from the inter-node crossbar switch;
When the status notification signal sent from the inter-node crossbar switch indicates a normal state, it is a diagnostic process for the inter-node crossbar switch that is the transmission source of the status notification signal, and is a connection with the own node A diagnostic means for performing a diagnostic process including a check , and
The status notification signal transmission unit has a configuration for transmitting the status notification signal to each of the nodes after the initialization by the initialization unit is successful.
When the diagnosis result of the diagnosis means of all the nodes is normal completion, the third status change means sets the status of the inter-node crossbar switch stored in the third status storage unit to a normal state. A multi-node computer system having a configuration for changing.
前記第2のステータス変更手段が、
前記初期化手段による初期化が失敗した場合、前記第2のステータス格納部に格納されているステータスを、デグレード状態に変更する構成を有し、
前記ステータス通知信号送信手段が、
前記初期化手段による初期化が失敗した場合、前記各ノードに対して、デグレード状態を示すステータス通知信号を送信する構成を有し、
前記第3のステータス変更手段が、
前記ノード間クロスバスイッチから、デグレード状態を示すステータス通知信号が送られてきたとき、前記第3のステータス格納部に格納されているステータスの内の、前記ステータス通知信号の送信元のノード間クロスバスイッチのステータスを、デグレード状態に変更する構成を有することを特徴とするマルチノードコンピュータシステム。 The multi-node computer system of claim 1 .
The second status change means is
When initialization by the initialization unit fails, the status stored in the second status storage unit is changed to a degraded state,
The status notification signal transmitting means is
When the initialization by the initialization unit fails, a status notification signal indicating a degraded state is transmitted to each of the nodes,
The third status changing means is
When a status notification signal indicating a degraded state is sent from the internode crossbar switch, among the statuses stored in the third status storage unit, the internode crossbar switch that is the transmission source of the status notification signal A multi-node computer system characterized by having a configuration for changing the status of the system to a degraded state.
前記第2のステータス変更手段が、
前記各ノード内の診断手段の何れかによって正常動作不可能と判定された場合、前記第2のステータス格納部に格納されているステータスをデグレード状態に変更する構成を有し、
前記ステータス通知信号送信手段が、
前記各ノード内の診断手段の何れかによって正常動作不可能と判定された場合、前記各ノードに対してデグレード状態を示すステータス通知信号を送信する構成を有することを特徴とするマルチノードコンピュータシステム。 The multi-node computer system according to claim 2 , wherein
The second status change means is
When it is determined that normal operation is impossible by any of the diagnostic means in each node, the status stored in the second status storage unit is changed to a degraded state,
The status notification signal transmitting means is
A multi-node computer system comprising: a status notification signal indicating a degraded state to each node when it is determined that normal operation is impossible by any of the diagnostic means in each node.
前記各ノードを管理するノードサービスプロセッサを備え、
前記各ノードが、それぞれ、
全てのノードによって前記ノード間クロスバスイッチが正常動作可能であると判定された後、前記ノードサービスプロセッサに対して、前記ノード間クロスバスイッチのステータスをノーマル状態に変更することを指示するステータス変更指示を送信する第3のステータス送受信手段を備え、
前記ノードサービスプロセッサが、
前記各ノードで管理されている前記各ノード間クロスバスイッチのステータスが格納された第4のステータス格納部と、
前記各ノードから送られてきたステータス変更指示に従って前記第4のステータス格納部に格納されている、該当するステータスをノーマル状態に変更する第4のステータス変更手段とを備えたことを特徴とするマルチノードコンピュータシステム。 The multi-node computer system according to claim 3 .
A node service processor for managing each node;
Each of the nodes is
After determining that the inter-node crossbar switch is normally operable by all nodes, a status change instruction is issued to instruct the node service processor to change the status of the inter-node crossbar switch to a normal state. A third status transmission / reception means for transmitting,
The node service processor is
A fourth status storage unit storing the status of the crossbar switch between the nodes managed by each node;
And a fourth status change means for changing the corresponding status to a normal state, which is stored in the fourth status storage unit in accordance with a status change instruction sent from each node. Node computer system.
前記各ノード間クロスバスイッチ用コンピュータは、それぞれ前記各ノード用コンピュータを相互に接続し、The inter-node crossbar switch computer connects the node computers to each other,
前記第1のステータス格納部には、前記各ノード間クロスバスイッチ用コンピュータのステータスが格納され、The first status storage unit stores the status of the inter-node crossbar switch computer,
前記各第2のステータス格納部には、それぞれ自ノード間クロスバスイッチ用コンピュータのステータスが格納され、In each of the second status storage units, the status of the computer for crossbar switch between own nodes is stored,
前記各第3のステータス格納部には、それぞれ前記各ノード間クロスバスイッチ用コンピュータのステータスが格納され、In each of the third status storage units, the status of each of the inter-node crossbar switch computers is stored.
前記第1のステータス変更手段が、ステータスの変更対象にするノード間クロスバスイッチ用コンピュータの識別子及び変更後のステータスを含むステータス変更操作要求が保守員によって入力されたとき、該ステータス変更操作要求に従って前記第1のステータス格納部に格納されている該当するノード間クロスバスイッチのステータスを変更し、When a status change operation request including the identifier of the inter-node crossbar switch computer to be changed by the first status change means and the status after the change is input by the maintenance staff, the first status change means performs the change according to the status change operation request. Change the status of the corresponding inter-node crossbar switch stored in the first status storage unit,
前記第1のステータス送受信手段が、前記第1のステータス変更手段によって前記第1のステータス格納部に格納されているステータスが変更されたとき、ステータスが変更されたノード間クロスバスイッチ用コンピュータに対して、変更後のステータスを含むステータス変更指示を送信し、When the status stored in the first status storage unit is changed by the first status change unit by the first status transmission / reception unit, the inter-node crossbar switch computer whose status is changed , Send a status change instruction with the changed status,
前記各ノード間クロスバスイッチ用コンピュータの前記第2のステータス変更手段が、自コンピュータの前記第2のステータス格納部の内容を、前記統合サービスプロセッサ用コンピュータから送られてきたステータス変更指示に従って変更し、The second status change unit of the inter-node crossbar switch computer changes the contents of the second status storage unit of its own computer according to the status change instruction sent from the integrated service processor computer,
前記各ノード間クロスバスイッチ用コンピュータの初期化手段が、前記統合サービスプロセッサ用コンピュータから送られてきたステータス変更指示がノーマル状態への変更を指示するものである場合、自ノード間クロスバスイッチ用コンピュータの初期化を行い、When the status change instruction sent from the integrated service processor computer instructs the initialization means of each inter-node crossbar switch computer to change to the normal state, Perform initialization,
前記各ノード間クロスバスイッチ用コンピュータの前記ステータス通知信号送信手段が、自コンピュータの初期化手段による初期化が成功した後、自コンピュータの前記第2のステータス格納部に格納されているステータスを示すステータス通知信号を前記各ノード用コンピュータへ送信し、Status indicating the status stored in the second status storage unit of the local computer after the status notification signal transmission unit of the crossbar switch computer between the nodes has been successfully initialized by the initialization unit of the local computer Sending a notification signal to the computer for each node;
前記各ノード用コンピュータの前記第3のステータス変更手段が、自コンピュータの前記第3のステータス格納部の内容を、前記ノード間クロスバスイッチ用コンピュータから送られてきたステータス通知信号に従って変更し、The third status change unit of each of the node computers changes the contents of the third status storage unit of its own computer according to a status notification signal sent from the internode crossbar switch computer,
前記各ノード用コンピュータの前記診断手段が、前記ノード間クロスバスイッチ用コンピュータから送られてきたステータス通知信号が、ノーマル状態を示すものである場合、前記ステータス通知信号の送信元のノード間クロスバスイッチ用コンピュータに対する診断処理であって、自コンピュータとの間の接続チェックを含む診断処理を実施し、When the status notification signal sent from the inter-node crossbar switch computer indicates a normal state, the diagnostic means of each node computer is for the inter-node crossbar switch that is the transmission source of the status notification signal A diagnostic process for a computer, including a diagnostic process including a connection check with the own computer,
前記第3のステータス変更手段が、全てのノードの診断手段の診断結果が制御終了である場合、前記第3のステータス格納部に格納されている前記ノード間クロスバスイッチのステータスを、ノーマル状態に変更することを特徴とするステータス管理方法。The third status change unit changes the status of the inter-node crossbar switch stored in the third status storage unit to a normal state when the diagnosis result of the diagnostic unit of all the nodes is the control end. A status management method characterized by:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005320441A JP4640116B2 (en) | 2005-11-04 | 2005-11-04 | Multi-node computer system, integrated service processor, status management method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005320441A JP4640116B2 (en) | 2005-11-04 | 2005-11-04 | Multi-node computer system, integrated service processor, status management method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007128285A JP2007128285A (en) | 2007-05-24 |
JP4640116B2 true JP4640116B2 (en) | 2011-03-02 |
Family
ID=38150895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005320441A Expired - Fee Related JP4640116B2 (en) | 2005-11-04 | 2005-11-04 | Multi-node computer system, integrated service processor, status management method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4640116B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5516402B2 (en) | 2008-08-21 | 2014-06-11 | 富士通株式会社 | Information processing apparatus and information processing apparatus control method |
JP2011076512A (en) * | 2009-10-01 | 2011-04-14 | Hitachi Solutions Ltd | Integrated management system of job management server |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284982A (en) * | 1999-03-30 | 2000-10-13 | Toshiba Corp | Access controller and computer readable storage medium storing program |
JP2000353154A (en) * | 1999-06-10 | 2000-12-19 | Nec Corp | Fault monitoring system |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63196901A (en) * | 1987-02-10 | 1988-08-15 | Mitsubishi Electric Corp | Programmable controller restoration system for multiplexing system |
US5371743A (en) * | 1992-03-06 | 1994-12-06 | Data General Corporation | On-line module replacement in a multiple module data processing system |
JPH07175765A (en) * | 1993-10-25 | 1995-07-14 | Mitsubishi Electric Corp | Fault recovering method of computer |
JP3121487B2 (en) * | 1994-02-23 | 2000-12-25 | 株式会社日立製作所 | Communication system connecting processor modules |
JPH09288655A (en) * | 1996-04-23 | 1997-11-04 | Nec Commun Syst Ltd | Processor extension method |
-
2005
- 2005-11-04 JP JP2005320441A patent/JP4640116B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284982A (en) * | 1999-03-30 | 2000-10-13 | Toshiba Corp | Access controller and computer readable storage medium storing program |
JP2000353154A (en) * | 1999-06-10 | 2000-12-19 | Nec Corp | Fault monitoring system |
Also Published As
Publication number | Publication date |
---|---|
JP2007128285A (en) | 2007-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4529767B2 (en) | Cluster configuration computer system and system reset method thereof | |
EP2518627B1 (en) | Partial fault processing method in computer system | |
JP2004021556A (en) | Memory control device and control process thereof | |
JP4486921B2 (en) | Storage virtualization apparatus and computer system using the same | |
JP5159898B2 (en) | Management apparatus, management method, and program | |
US8806081B2 (en) | Open host issued statesave to attached storage | |
JP2000181501A (en) | Duplex controller | |
JP4640116B2 (en) | Multi-node computer system, integrated service processor, status management method and program | |
US6574753B1 (en) | Peer link fault isolation | |
JP2007299213A (en) | Raid controller and fault monitoring method | |
JP4395766B2 (en) | Fault analysis system, method and program | |
JPH07306794A (en) | Distributed system and enhancing method for reliability | |
JP2001060160A (en) | Cpu duplex system for controller | |
JP6109404B2 (en) | Computer apparatus and computer mechanism | |
JP2014215622A (en) | Plant monitoring system and plant monitoring method | |
JP2009110218A (en) | Virtualization switch and computer system using the same | |
US7836335B2 (en) | Cost-reduced redundant service processor configuration | |
JP4495248B2 (en) | Information processing apparatus and failure processing method | |
JP2006134207A (en) | Storage virtualization device and computer system using the same | |
JP2007334668A (en) | Memory dumping method, cluster system, node constituting the system, and program | |
JP4511455B2 (en) | Fiber channel switch and computer system using the same | |
JP6089766B2 (en) | Information processing system and failure processing method for information processing apparatus | |
US7676682B2 (en) | Lightweight management and high availability controller | |
JP3363579B2 (en) | Monitoring device and monitoring system | |
US20230008667A1 (en) | Controller and controller system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081016 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090721 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100803 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |