JPH11126195A - Distributed system - Google Patents

Distributed system

Info

Publication number
JPH11126195A
JPH11126195A JP9289368A JP28936897A JPH11126195A JP H11126195 A JPH11126195 A JP H11126195A JP 9289368 A JP9289368 A JP 9289368A JP 28936897 A JP28936897 A JP 28936897A JP H11126195 A JPH11126195 A JP H11126195A
Authority
JP
Japan
Prior art keywords
processing
server
external input
processing device
devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9289368A
Other languages
Japanese (ja)
Inventor
Satoshi Kobayashi
智 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP9289368A priority Critical patent/JPH11126195A/en
Publication of JPH11126195A publication Critical patent/JPH11126195A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PROBLEM TO BE SOLVED: To make it possible to constitute a system optimum for the throughput and reliability of each server for performing work processing. SOLUTION: Respective server managing devices 2a-2n perform the operation management/control of respective PC servers 1a-1n, share constitution information expressing the throughput of the latest respective CPU servers 1a-1n, a fault information expressing the reliability and the constitution information of external input/output units 5a-5m by mutually exchanging information through a communication path 3, determine the respective server managing devices 2a-2n to be the suitable connection destination through autonomous judgment while considering the throughput and reliability of the respective PC servers 1a-1n and start the job processing by starting OS 6a-6m while being connected to an external input/output switching mechanism 4.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、異なる業務処理能
力と信頼性を有した複数の処理装置で構成される分散シ
ステム、特にシステム全体を統合的に制御するコンピュ
ータを有しない分散システムにおけるシステム構成制御
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a distributed system comprising a plurality of processing units having different business processing capabilities and reliability, and more particularly to a system configuration in a distributed system having no computer for integrally controlling the entire system. Regarding control.

【0002】[0002]

【従来の技術】複数のPCサーバあるいはそのデータ処
理部を利用した分散システムにおけるシステム構成制御
方式においては、分散システム全体を統合的に管理・制
御する専用のシステム制御装置による方式と、オペレー
ティングシステム(OS)あるいはその拡張機能によ
り、分散システム構成要素間で互いに運転状況を監視す
ることでシステム構成を制御する方式とがある。このう
ち、図14は、分散システム構成要素間で互いに運転状
況を監視する従来の分散システムを示したブロック構成
図である。
2. Description of the Related Art In a system configuration control method in a distributed system using a plurality of PC servers or data processing units thereof, a system using a dedicated system control device for integrally managing and controlling the entire distributed system and an operating system ( There is a method of controlling the system configuration by monitoring the operation status between the distributed system components using the OS (OS) or its extended function. Among them, FIG. 14 is a block diagram showing a conventional distributed system for monitoring the operation status between the distributed system components.

【0003】この分散システムは、業務処理を実行する
複数(n)台のPCサーバ101a〜101n内に設置
され、PCサーバ101a〜101nの個別の運転管理
を行うサーバ管理装置102a〜102n、PCサーバ
101a〜101n上で動作して業務処理を行うオペレ
ーティングシステム(OSと略す)106a〜106
n、業務処理に必要なデータの格納及びシステム間の通
信を行う複数(m)台の外部入出力装置105a〜10
5m、外部入出力装置105a〜105m内で共用デー
タを格納する共有ディスク108a〜108m、外部入
出力装置105a〜105m間及びその他の外部システ
ムとの通信を行う二重化されたLocalArea N
etwork(LANと略す)107a、107b及び
PCサーバ101a〜101nと外部入出力装置105
a〜105m間を接続し、PCサーバ101a〜101
n間でデータ共有を行なえるようにする外部入出力切り
換え機構104からなる。
[0003] This distributed system is installed in a plurality (n) of PC servers 101a to 101n that execute business processes, and server management devices 102a to 102n that individually manage the operation of the PC servers 101a to 101n; Operating systems (abbreviated as OS) 106a to 106 that operate on 101a to 101n and perform business processes
n, a plurality (m) of external input / output devices 105a-10 for storing data necessary for business processing and communicating between systems
5m, shared disks 108a to 108m for storing shared data in the external input / output devices 105a to 105m, and redundant Local Area N for communication between the external input / output devices 105a to 105m and other external systems.
network (abbreviated as LAN) 107a, 107b, PC servers 101a to 101n, and external input / output device 105
a to 105 m, and the PC servers 101 a to 101
and an external input / output switching mechanism 104 for enabling data sharing among the n.

【0004】次に、電源投入によるシステム立上げ時に
PCサーバ101cがハードウェア障害のため動作不能
となった場合の動作について説明する。
Next, an operation when the PC server 101c becomes inoperable due to a hardware failure when the system is started by turning on the power will be described.

【0005】各PCサーバ101a〜101nは、サー
バ管理装置102a〜102nの制御のもと、内部ハー
ドウェアの初期化と自己診断を行ない、OS106a〜
106nを立ちあげる。この間、PCサーバ101c
は、ハードウェア障害によってOS106cの立上げを
完了できないまま、停止状態となる。残りのOS106
a,106b,106d〜106nは正常に立ち上が
り、外部入出力切り換え機構104を経由して対応する
外部入出力装置105a〜105mに接続すると共に、
LAN107a、107bを通じて互いに稼動状況を確
認しあう。この結果、稼動中のOS106a,106
b,106d〜106nは、OS106cが立ち上がっ
ていないことを知り、OS106cが対応する予定の外
部入出力装置105c上の共有ディスク108cへのサ
ービスを、例えば、PCサーバ101bが外部入出力切
り換え機構104を経由してアクセスすることにより肩
代わりする。以降、PCサーバ101a,101b,1
01d〜101nは共有ディスク108a〜108m及
びLAN107a、107bを使用して分散システムと
しての業務処理を開始する。
[0005] Under the control of the server management devices 102a to 102n, each of the PC servers 101a to 101n performs initialization of internal hardware and self-diagnosis, and executes OSs 106a to 106n.
Start up 106n. During this time, the PC server 101c
Is in a stopped state before the startup of the OS 106c can be completed due to a hardware failure. Remaining OS 106
a, 106b, 106d to 106n normally start up and connect to the corresponding external input / output devices 105a to 105m via the external input / output switching mechanism 104;
The operating status is mutually confirmed through the LANs 107a and 107b. As a result, the operating OSs 106a, 106
b, 106d to 106n know that the OS 106c has not been started, and provide a service to the shared disk 108c on the external input / output device 105c to which the OS 106c is to correspond. For example, the PC server 101b sends the external input / output switching mechanism 104 You can take over by accessing via. Hereinafter, the PC servers 101a, 101b, 1
01d to 101n start business processing as a distributed system using the shared disks 108a to 108m and the LANs 107a and 107b.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、従来の
分散システムは、上記のように構成されていたため、サ
ーバ切り換えのための特殊なOS乃至その拡張機能が必
要であり、PCサーバを利用したオープンな製品による
高性能で低価格なシステム構築には適さなかった。
However, since the conventional distributed system is configured as described above, a special OS for server switching or its extended function is required, and an open system using a PC server is required. It was not suitable for building a high-performance, low-cost system using products.

【0007】また、処理能力及び信頼性が急速に向上す
るPCサーバにタイムリに適応すべく、PCサーバの一
部更新、プロセッサ増設等によるPCサーバの部分的な
能力アップを実施し、システム全体の業務処理能力を向
上しようとした場合、OSが個々のPCサーバの処理能
力に応じた適切な業務割り付けができるとはかぎらない
問題点があった。
In order to timely adapt to a PC server whose processing capability and reliability are rapidly improving, the PC server is partially upgraded by adding a processor, etc. to partially improve the capacity of the PC server, and the entire system is improved. When trying to improve the business processing capacity, there is a problem that the OS cannot always allocate an appropriate business according to the processing capacity of each PC server.

【0008】また、PCサーバは、近年マルチプロセッ
サ化が進み、プロセッサ単位の縮退運転が可能となって
いるが、縮退運転を行った場合、縮退による処理能力及
び信頼性の低下については適切に対処することができな
かったため、縮退によるシステム全体の可用性向上が十
分に生かされない問題点があった。
In recent years, the use of multiprocessors has been advanced in PC servers, and it is possible to perform a degenerate operation on a processor basis. However, when the degenerate operation is performed, a decrease in processing performance and reliability due to the degeneration is appropriately dealt with. Therefore, there has been a problem that the improvement in the availability of the entire system due to the degeneration cannot be fully utilized.

【0009】更に、PCサーバが障害によって停止した
場合の他のPCサーバによる代替運転についても、代替
とすべきPCサーバの選択において各PCサーバの処理
能力及び信頼性を適切に考慮できないため、分散システ
ム全体としてバランスの良いシステム構成を必ずしも実
現できるとはかぎらなかった。
[0009] Further, regarding the alternative operation by another PC server when the PC server is stopped due to a failure, the processing capacity and reliability of each PC server cannot be properly considered in selecting the PC server to be replaced. It was not always possible to achieve a well-balanced system configuration as a whole system.

【0010】本発明は以上のような問題を解決するため
になされたものであり、その目的は、特殊なOSの制御
機能やシステム全体を統合するシステム管理機能に依存
することなく、業務処理を行うサーバのそれぞれの処理
能力と信頼性に最適なシステム構成を可能とするととも
に、障害発生時においても残った構成要素によって最適
なシステム構成を可能とする分散システムを提供するこ
とにある。
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and has as its object to perform business processing without depending on a special OS control function or a system management function for integrating the entire system. It is an object of the present invention to provide a distributed system that enables an optimum system configuration for each processing capacity and reliability of a server to be performed, and that enables an optimum system configuration using remaining components even when a failure occurs.

【0011】[0011]

【課題を解決するための手段】以上のような目的を達成
するために、第1の発明に係る分散システムは、複数の
処理装置と、オペレーティングシステム及び業務アプリ
ケーションをそれぞれ格納した複数の外部入出力装置
と、前記処理装置と前記外部入出力装置とを接続する外
部入出力切換え手段とを有し、前記処理装置によって前
記外部入出力切替え手段を介して前記外部入出力装置の
オペレーティングシステムを起動させることにより所定
の業務処理を実行する分散システムにおいて、前記処理
装置それぞれに搭載され、かつ前記処理装置の運転管理
を行う複数の処理装置管理装置と、複数の前記処理装置
管理装置間の通信を行う通信路と、前記処理装置内に設
けられ、かつ前記処理装置管理装置からの指示に従い前
記処理装置と前記外部入出力装置との接続・切離しを行
う装置切換手段とを有し、前記各処理装置管理装置は、
前記通信路を介して前記各処理装置の構成情報及び障害
情報を授受することによって共有し、その共有した構成
情報及び障害情報に基づいて前記外部入出力装置の接続
先を自律判断して決定し、前記装置切換手段は、前記処
理装置管理装置が決定した前記外部入出力装置の接続先
に基づいて前記処理装置と前記外部入出力装置との接続
・切離しを行うものである。
In order to achieve the above object, a distributed system according to a first aspect of the present invention comprises a plurality of processing units and a plurality of external input / outputs each storing an operating system and a business application. Device, and external input / output switching means for connecting the processing device and the external input / output device, wherein the processing device activates an operating system of the external input / output device via the external input / output switching device. Thus, in a distributed system that executes a predetermined business process, a plurality of processing device management devices mounted on each of the processing devices and performing operation management of the processing device, and perform communication between the plurality of processing device management devices A communication path, provided in the processing device, and configured to communicate with the processing device in accordance with an instruction from the processing device management device. And a device switching means for connecting, disconnecting the input-output device, wherein the processing device management apparatus,
The configuration information and the failure information of the respective processing devices are shared by transmitting and receiving via the communication path, and the connection destination of the external input / output device is determined by autonomous determination based on the shared configuration information and the failure information. The device switching means connects and disconnects the processing device and the external input / output device based on the connection destination of the external input / output device determined by the processing device management device.

【0012】第2の発明に係る分散システムは、第1の
発明において、前記各処理装置管理装置は、共有した構
成情報及び障害情報に基づいて処理能力及び信頼性上最
適な前記外部入出力装置の接続先を決定するものであ
る。
In a distributed system according to a second aspect, in the first aspect, each of the processing unit management devices is configured to optimize the external input / output device in terms of processing capability and reliability based on shared configuration information and fault information. Is determined.

【0013】第3の発明に係る分散システムは、第1の
発明において、前記各処理装置管理装置は、前記処理装
置の立上げ時に共有した構成情報及び障害情報を参照し
て初期化処理を行うことによって前記処理装置の構成情
報及び障害情報を自動生成すると共に、その自動生成し
た構成情報及び障害情報を他の前記処理装置管理装置に
通報するものである。
[0013] In a distributed system according to a third aspect of the present invention, in the first aspect, each of the processing unit management devices performs an initialization process with reference to the configuration information and the failure information shared when the processing unit is started up. Thereby, the configuration information and the fault information of the processing device are automatically generated, and the automatically generated configuration information and the fault information are reported to the other processing device management devices.

【0014】第4の発明に係る分散システムは、第1の
発明において、前記外部入出力装置の構成情報には、当
該外部入出力装置に記憶されている業務アプリケーショ
ンが実行される上で必要な前記処理装置の処理能力及び
信頼性を表す指標が含まれているものである。
[0014] In the distributed system according to a fourth aspect, in the first aspect, the configuration information of the external input / output device includes information necessary for executing a business application stored in the external input / output device. An index indicating the processing capability and reliability of the processing device is included.

【0015】第5の発明に係る分散システムは、第1の
発明において、前記処理装置の構成情報には、前記各処
理装置の接続先に関する情報が含まれているものであ
る。
According to a fifth aspect of the present invention, in the distributed system according to the first aspect, the configuration information of the processing device includes information on a connection destination of each of the processing devices.

【0016】第6の発明に係る分散システムは、第1の
発明において、前記各処理装置管理装置は、共有した構
成情報及び障害情報に基づいて前記各処理装置の実効的
な処理能力を表す実効性能点数及び前記各処理装置の信
頼性を表す信頼度点数を算出し、その算出した実効性能
点数、信頼度点数及び前記外部入出力装置の構成情報に
基づいて前記処理装置の接続先となる前記外部入出力装
置を決定するものである。
According to a sixth aspect of the present invention, in the distributed system according to the first aspect, each of the processing device management devices is configured to indicate an effective processing capability of each of the processing devices based on the shared configuration information and fault information. A performance score and a reliability score representing the reliability of each of the processing devices are calculated, and the connection destination of the processing device is calculated based on the calculated effective performance score, the reliability score, and the configuration information of the external input / output device. It determines the external input / output device.

【0017】第7の発明に係る分散システムは、第1の
発明において、前記各処理装置管理装置は、実効性能点
数及び信頼度点数に基づいて前記全処理装置の接続順位
を決定し、また、前記外部入出力装置の構成情報に基づ
いて前記外部入出力装置の接続順位を決定し、前記処理
装置と同じ接続順位となった前記外部入出力装置を接続
先と決定するものである。
According to a seventh aspect of the present invention, in the distributed system according to the first aspect, each of the processing device management devices determines a connection order of all the processing devices based on an effective performance score and a reliability score. The connection order of the external input / output devices is determined based on the configuration information of the external input / output devices, and the external input / output device having the same connection order as the processing device is determined as the connection destination.

【0018】第8の発明に係る分散システムは、第1又
は第3の発明において、前記各処理装置管理装置は、他
の前記処理装置に搭載されている前記処理装置管理装置
からの通報に応じて保有している構成情報又は障害情報
を更新するものである。
According to an eighth aspect of the present invention, in the distributed system according to the first or third aspect, each of the processing device management devices responds to a notification from the processing device management device mounted on another of the processing devices. This is to update the configuration information or the failure information held by the system.

【0019】第9の発明に係る分散システムは、第8の
発明において、前記各処理装置管理装置は、前記各処理
装置と前記各外部入出力装置とを接続した結果、前記処
理装置がいずれの前記外部入出力装置にも接続されなか
ったときには代替処理装置として待機させ、業務処理を
実行していた他の前記処理装置から代替運転の通報を受
けた場合、その通報をした処理装置に代わって当該通報
をした処理装置と接続されていた前記外部入出力装置を
前記処理装置に接続し直して当該通報をした処理装置が
実行していた業務処理を引き継がせるものである。
According to a ninth aspect of the present invention, in the distributed system according to the eighth aspect, each of the processing device management devices connects each of the processing devices and each of the external input / output devices, and as a result, When it is not connected to the external input / output device, it is made to stand by as a substitute processing device, and when a notification of the alternative operation is received from the other processing device that is executing the business process, instead of the processing device that has sent the report. The external input / output device connected to the processing device that has issued the notification is reconnected to the processing device so that the business process that has been executed by the processing device that has issued the notification can be taken over.

【0020】第10の発明に係る分散システムは、第9
の発明において、前記各処理装置管理装置は、前記代替
処理装置が複数存在する場合は、当該通報をした処理装
置の通報時点における処理能力及び信頼性に最も近似し
ている代替処理装置に業務処理を引き継がせるものであ
る。
[0020] A distributed system according to a tenth aspect of the present invention comprises a ninth aspect.
In the invention of the above, when there are a plurality of the alternative processing devices, each of the processing device management devices performs the job processing on the alternative processing device having the closest processing capability and reliability at the time of the notification of the processing device that sent the notification. Is to be taken over.

【0021】第11の発明に係る分散システムは、第9
の発明において、前記各処理装置管理装置は、前記代替
処理装置が複数存在する場合は、当該通報をした処理装
置が本来有している処理能力及び信頼性に最も近似して
いる前記代替処理装置に業務処理を引き継がせるもので
ある。
[0021] The distributed system according to the eleventh aspect of the present invention includes a ninth aspect.
In the invention, the processing device management device, when there are a plurality of the alternative processing devices, the replacement processing device that is closest to the processing capability and reliability originally possessed by the processing device that sent the notification. To take over the business process.

【0022】第12の発明に係る分散システムは、第8
の発明において、前記各処理装置管理装置は、前記各処
理装置と前記各外部入出力装置とを接続した結果、前記
処理装置がいずれの前記外部入出力装置にも接続されな
かったときには代替処理装置として待機させ、複数の前
記代替処理装置が存在する場合は最も接続順位の高い前
記代替処理装置が業務処理中の他の前記処理装置に代わ
って業務処理を引き継ぐものである。
The distributed system according to the twelfth aspect is provided with
In the invention of the first aspect, the processing device management device may connect the processing device and the external input / output device, and as a result, when the processing device is not connected to any of the external input / output devices, When there are a plurality of the alternative processing devices, the alternative processing device having the highest connection order takes over the business process in place of the other processing device that is performing the business process.

【0023】第13の発明に係る分散システムは、第9
乃至第12の発明において、業務処理を引き継がせた前
記処理装置に搭載の前記処理装置管理装置は、その管理
対象処理装置の復旧後に引継先の前記処理装置から再度
その業務処理を引き継ぎ再開させるものである。
A distributed system according to a thirteenth aspect is provided with a ninth aspect.
In the twelfth to twelfth inventions, the processing device management device mounted on the processing device that has taken over the business process restarts the business process from the takeover destination processing device again after the management target processing device is restored. It is.

【0024】第14の発明に係る分散システムは、第1
の発明において、前記各処理装置管理装置は、前記処理
装置及び前記外部入出力装置の構成情報の双方に含まれ
ている前記各処理装置と前記外部入出力装置との接続上
の制約条件に従い、その制約条件を満たす前記処理装置
群及び前記外部入出力装置群単位に前記処理装置の接続
先となる前記外部入出力装置を自律判断して決定するも
のである。
The distributed system according to the fourteenth invention has the first
In the invention, the processing device management device, according to the constraints on the connection between the processing device and the external input / output device included in both the configuration information of the processing device and the external input / output device, The external input / output device to which the processing device is connected is determined by autonomous determination for each of the processing device group and the external input / output device group satisfying the constraint condition.

【0025】第15の発明に係る分散システムは、第1
の発明において、前記処理装置の構成情報には、前記各
処理装置の立上げ時に代替処理装置として待機させるた
めの運転制御情報が含まれており、前記各処理装置管理
装置は、前記処理装置の運転制御情報に待機指示が設定
されている場合は、処理能力及び信頼性の高低にかかわ
らず前記処理装置を立上げ時に代替処理装置として待機
させるものである。
The distributed system according to the fifteenth invention is characterized in that
In the invention, the configuration information of the processing devices includes operation control information for causing the processing devices to be on standby as an alternative processing device when starting up each of the processing devices, and each of the processing device management devices includes When a standby instruction is set in the operation control information, the processing device is made to stand by as an alternative processing device when starting up, regardless of the processing capability and the reliability.

【0026】第16の発明に係る分散システムは、第1
5の発明において、処理能力及び信頼性の高い前記処理
装置の運転制御情報に待機指示を予め設定するものであ
る。
The distributed system according to the sixteenth invention is characterized in that
In the invention of claim 5, a standby instruction is set in advance in the operation control information of the processing device having high processing capability and reliability.

【0027】[0027]

【発明の実施の形態】以下、図面に基づいて、本発明の
好適な実施の形態について説明する。
Preferred embodiments of the present invention will be described below with reference to the drawings.

【0028】実施の形態1.図1は、本発明に係る分散
システムの実施の形態1を示したブロック構成図であ
る。図1には、複数(n)台のPCサーバ1a〜1n、
外部入出力切り換え機構4及び複数(m)台の外部入出
力装置5a〜5mが示されている。外部入出力装置5a
〜5mは、OS及び業務アプリケーションなど業務処理
に必要なデータを格納している。PCサーバ1a〜1n
は、接続されたいずれかの外部入出力装置5a〜5mの
OSを起動することによって所定の業務処理を実行する
処理装置である。外部入出力切り換え機構4は、全ての
PCサーバ1a〜1nと外部入出力装置5a〜5mを接
続する外部入出力切換え手段である。
Embodiment 1 FIG. 1 is a block diagram showing Embodiment 1 of the distributed system according to the present invention. FIG. 1 shows a plurality (n) of PC servers 1a to 1n,
The external input / output switching mechanism 4 and a plurality (m) of external input / output devices 5a to 5m are shown. External input / output device 5a
5 m store data necessary for business processing such as an OS and a business application. PC server 1a-1n
Is a processing device that executes a predetermined business process by activating the OS of any of the connected external input / output devices 5a to 5m. The external input / output switching mechanism 4 is external input / output switching means for connecting all the PC servers 1a to 1n and the external input / output devices 5a to 5m.

【0029】各PCサーバ1a〜1nには、それぞれに
サーバ管理装置2a〜2nが処理装置管理装置として搭
載されている。各サーバ管理装置2a〜2nは、搭載さ
れたPCサーバ1a〜1n(以下、「管理対象サーバ」
ともいう)の運転管理及び制御を個々に行うと共に、通
信路3を介して相互に情報の授受を行う。また、外部入
出力装置5a〜5mは、業務処理を実行するためのオペ
レーティングシステム(OS)6a〜6mを格納し、ま
た、二重化されたLocal Area Networ
k(LAN)7a,7bを介して外部入出力装置5a〜
5m間及びその他の外部システムとの通信を行う。な
お、外部入出力切り換え機構4は、図1においては単一
の切換え装置として表現しているが、大規模な分散シス
テムでは、切り替える入出力範囲の増大及びデータ転送
経路の高性能化や高信頼化に対処することを考慮する
と、複数の小型切換え装置による多段・多重接続によっ
て構成してもよい。
Each of the PC servers 1a to 1n has a server management device 2a to 2n mounted thereon as a processing device management device. Each of the server management devices 2a to 2n includes an installed PC server 1a to 1n (hereinafter, "managed server").
), And mutually exchange information via the communication path 3. In addition, the external input / output devices 5a to 5m store operating systems (OS) 6a to 6m for executing business processes, and have a duplicated Local Area Network.
k (LAN) 7a, 7b, external input / output devices 5a-
Communication is performed for 5 m and with other external systems. Although the external input / output switching mechanism 4 is shown as a single switching device in FIG. 1, in a large-scale distributed system, the input / output switching range is increased, the performance of the data transfer path is improved, and the reliability is improved. In order to cope with this, it may be configured by multi-stage / multi-connection by a plurality of small switching devices.

【0030】PCサーバ1a〜1nは、外部入出力切り
換え機構4を経由して外部入出力装置5a〜5mに接続
し、外部入出力装置5a〜5mに格納されたOS6a〜
6mのいずれかを起動して業務処理を行う。業務処理に
関する処理データは、接続先の外部入出力装置5a〜5
mに格納されており、外部のシステムとの通信も、接続
先の外部入出力装置5a〜5mを使用してLAN7a,
7bにより行う。なお、PCサーバ1a〜1n上で稼動
するOS6a〜6mの起動に際しては、唯一選択された
外部入出力装置5a〜5mへの接続が必要であるが、業
務処理データの共用やデータ格納装置の拡大等の目的
で、一つのPCサーバ1a〜1nから複数の外部入出力
装置5a〜5mに接続したり、一つの外部入出力装置5
a〜5mに複数のPCサーバ1a〜1nを接続してもよ
い。
The PC servers 1a to 1n are connected to the external input / output devices 5a to 5m via the external input / output switching mechanism 4, and the OSs 6a to 5m stored in the external input / output devices 5a to 5m.
6m is activated to perform business processing. Processing data relating to business processing is stored in the external input / output devices 5a to 5
m, and communication with an external system is also performed using the external input / output devices 5a to 5m of the connection destinations.
7b. Note that when the OSs 6a to 6m operating on the PC servers 1a to 1n are started, it is necessary to connect only to the selected external input / output devices 5a to 5m. However, sharing of business process data and expansion of data storage devices are required. For the purpose of, for example, connecting one PC server 1a to 1n to a plurality of external input / output devices 5a to 5m,
A plurality of PC servers 1a to 1n may be connected to a to 5m.

【0031】サーバ管理装置2a〜2nは、PCサーバ
1a〜1nの運転状況を監視・記録すると共に、PCサ
ーバ1a〜1nの電源投入・切断、初期化と自己診断を
含む初期化処理の開始、外部入出力装置5a〜5mとの
接続、業務処理の開始・終了等の運転制御を行う。サー
バ管理装置2a〜2nは、外部入出力装置5a〜5mの
OS6a〜6mの起動に必要なPCサーバ1a〜1nと
外部入出力装置5a〜5mの接続先をシステム起動時に
決定する。サーバ管理装置2a〜2nは、通信路3を介
してPCサーバ1a〜1nの諸元、環境等に基づく構成
情報及び稼動状態に基づく障害情報を授受することによ
って共有し、常に、全てのPCサーバ1a〜1nに関す
る最新の構成情報と障害情報を保持する。また、サーバ
管理装置2a〜2nは、外部入出力装置5a〜5mの諸
元、環境等に基づく構成情報をも保持することによっ
て、自分が管理しているPCサーバ1a〜1nが接続す
べき外部入出力装置5a〜5mを自律判断で決定する。
The server management devices 2a to 2n monitor and record the operating conditions of the PC servers 1a to 1n, start and stop power supply of the PC servers 1a to 1n, start initialization and self-diagnosis. Operation control such as connection with the external input / output devices 5a to 5m and start / end of business processing is performed. The server management devices 2a to 2n determine the connection destinations of the PC servers 1a to 1n and the external input / output devices 5a to 5m required for starting the OSs 6a to 6m of the external input / output devices 5a to 5m at the time of system startup. The server management devices 2a to 2n share by transmitting and receiving configuration information based on the specifications, environment, and the like of the PC servers 1a to 1n and fault information based on the operation state via the communication path 3, and always share all the PC servers. The latest configuration information and fault information regarding 1a to 1n are held. The server management devices 2a to 2n also hold configuration information based on the specifications, environment, and the like of the external input / output devices 5a to 5m, so that the PC servers 1a to 1n managed by the server management devices 2a to 2n can connect to the external devices. The input / output devices 5a to 5m are determined by autonomous judgment.

【0032】図2は、図1の複数のPCサーバ1a〜1
nの一つの構成要素であるPCサーバ1iを示したブロ
ック構成図である。このPCサーバ1iでは、データ処
理を行う複数(n)個のプロセッサ8a〜8nと、処理
データを一時的に貯えるRAM等により形成されるメモ
リ9と、バスブリッジ10をプロセッサバス24で接続
している。バスブリッジ10は、高速に動作するプロセ
ッサバス24と低速な入出力バス23の動作速度の違い
を吸収することによって、両バス23,24に接続され
た任意の装置間でのデータ転送を円滑に行えるようにし
ている。入出力バス23には、外部入出力切り換え機構
4を経由して外部入出力装置5a〜5mとPCサーバ1
iを接続するための外部入出力装置接続装置11と、P
Cサーバ1iの初期化や自己診断を行うためのプログラ
ムを記憶するROM12と、PCサーバ1iと外部との
直接的な入出力を行うためのキーボード14、マウス1
6、ディスプレイ18及びフロッピィディスク装置(F
DD)20の各制御装置13,15,17,19と、P
Cサーバ1iの診断プログラムや一時的なデータの保管
に使用するハードディスク装置(HDD)22の制御装
置21とが接続されている。この入出力バス23は、P
CIバスやEISAバス等の業界標準に基づいたバスで
あり、外部入出力装置接続装置11や制御装置13,1
5,17,19,21は、PCIバス準拠の拡張ボード
等により構成される。また、PCサーバ1iの運転管理
・制御を行うサーバ管理装置2iには、サーバ管理装置
2iの管理情報を記録する不揮発性メモリ25が内蔵さ
れている。なお、不揮発性メモリ25は、サーバ管理装
置2iに内蔵させなくてもサーバ管理装置2i専用のH
DDやメモリカード等の外部記憶装置で構成してもよ
い。
FIG. 2 shows a plurality of PC servers 1a to 1 shown in FIG.
FIG. 3 is a block diagram showing a PC server 1i which is one of n components. In the PC server 1i, a plurality of (n) processors 8a to 8n for performing data processing, a memory 9 formed by a RAM or the like for temporarily storing processing data, and a bus bridge 10 are connected by a processor bus 24. I have. The bus bridge 10 absorbs the difference between the operating speeds of the processor bus 24 operating at a high speed and the operating speed of the input / output bus 23 at a low speed, so that data transfer between any devices connected to the buses 23 and 24 can be performed smoothly. I can do it. The input / output bus 23 is connected to the external input / output devices 5a to 5m and the PC server 1 via the external input / output switching mechanism 4.
i, an external input / output device connecting device 11 for connecting
ROM 12 for storing a program for performing initialization and self-diagnosis of C server 1i, keyboard 14 for directly inputting / outputting between PC server 1i and the outside, mouse 1
6, display 18 and floppy disk drive (F
DD) 20, each of the control devices 13, 15, 17, 19, and P
A control device 21 of a hard disk device (HDD) 22 used for storing a diagnostic program of the C server 1i and temporary data is connected. This input / output bus 23 is
It is a bus based on an industry standard such as a CI bus or an EISA bus, and includes an external input / output device connection device 11 and control devices 13, 1
5, 17, 19, and 21 are configured by a PCI bus-compliant expansion board or the like. The server management device 2i that manages and controls the operation of the PC server 1i has a built-in nonvolatile memory 25 for recording management information of the server management device 2i. Note that the non-volatile memory 25 has a dedicated H for the server management device 2i without being built in the server management device 2i.
An external storage device such as a DD or a memory card may be used.

【0033】外部入出力装置接続装置11は、PCサー
バ1iと外部入出力装置5a〜5mとの接続・切離しを
行う装置切換手段であり、サーバ管理装置2iの指示に
より選択された外部入出力装置5a〜5mを外部入出力
切り換え機構4を経由して入出力バス23に接続するこ
とにより、複数のプロセッサ8a〜8n、メモリ9及び
制御装置13,15,17,19,21と選択された外
部入出力装置5a〜5mの間のデータ転送を行う。ま
た、外部入出力装置接続装置11を外部入出力装置5a
〜5mのOS6a〜6mのロード装置として定義するこ
とによって、PCサーバ1iの初期化処理完了後、サー
バ管理装置2iが接続先を決定して外部入出力装置接続
装置11に接続指示を出すまで、外部入出力装置接続装
置11がロード装置オフラインの状態を維持し、複数の
プロセッサ8a〜8nをシステム立上げ待ちの状態に留
める。
The external input / output device connection device 11 is device switching means for connecting / disconnecting the PC server 1i to / from the external input / output devices 5a to 5m, and the external input / output device selected by the instruction of the server management device 2i. By connecting the 5a to 5m to the input / output bus 23 via the external input / output switching mechanism 4, the plurality of processors 8a to 8n, the memory 9, and the control devices 13, 15, 17, 19, 21 and the selected external device are connected. Data transfer between the input / output devices 5a to 5m is performed. The external input / output device connection device 11 is connected to the external input / output device 5a.
After the initialization process of the PC server 1i is completed, the server management device 2i determines a connection destination and outputs a connection instruction to the external input / output device connection device 11 after the initialization process of the PC server 1i is completed. The external input / output device connection device 11 maintains the load device offline state, and keeps the plurality of processors 8a to 8n waiting for system startup.

【0034】複数のプロセッサ8a〜8nは、PCサー
バ1iの立上げ時に、ROM12に格納されたPCサー
バ1iの初期化及び自己診断プログラムを実行し、メモ
リ9、外部入出力装置接続装置11、キーボード14、
マウス16、ディスプレイ18、FDD20、HDD2
2とそれらの制御装置13,15,17,19,21を
初期化し診断する。初期化及び自己診断完了後、複数の
プロセッサ8a〜8nは、外部入出力装置接続装置11
を経由して外部入出力装置5a〜5mに格納されたOS
6a〜6mをメモリ9に読み出すことによって業務処理
を開始する。操作員は、キーボード14、マウス16、
ディスプレイ18を使用してOS6a〜6mに指示を与
える。また、複数のプロセッサ8a〜8nは、自己診断
によって例えばプロセッサ8cの障害が判明しても、当
該プロセッサ8cを停止させたまま、残りのプロセッサ
8a,8b,8d〜8nによってデータ処理を行う縮退
運転機能を持つ。
The plurality of processors 8a to 8n execute initialization and self-diagnosis programs of the PC server 1i stored in the ROM 12 when the PC server 1i is started up, and store the memory 9, the external input / output device connection device 11, the keyboard 14,
Mouse 16, display 18, FDD 20, HDD2
2 and their control devices 13, 15, 17, 19, 21 are initialized and diagnosed. After completion of the initialization and the self-diagnosis, the plurality of processors 8a to 8n
OS stored in the external input / output devices 5a to 5m via the
The business process is started by reading 6a to 6m into the memory 9. The operator has a keyboard 14, a mouse 16,
The display 18 is used to give instructions to the OSs 6a to 6m. Further, even if a failure of the processor 8c is found by the self-diagnosis, for example, the plurality of processors 8a to 8n perform the degenerate operation in which the remaining processors 8a, 8b, and 8d to 8n perform data processing while the processor 8c is stopped. Has functions.

【0035】サーバ管理装置2iは、PCサーバ1iの
運転管理・制御を行うと共に、通信路3を使用して外部
のサーバ管理装置2a〜2nとの間で、構成情報と障害
情報の授受を行うことにより、全PCサーバ1a〜1n
の最新の構成情報と障害情報を不揮発性メモリ25に記
録する。PCサーバ1iの初期化及び自己診断時におい
て、サーバ管理装置2iは、障害が発生したプロセッサ
8a〜8nを自動的に切り離したり、障害履歴や操作員
の指示等により特定のプロセッサ8a〜8nやメモリ9
の一部を切り離す等の縮退運転を実施する。この場合、
サーバ管理装置2iは、初期化処理完了時点で通信路3
を介して他の全てのサーバ管理装置2a〜2nに当該縮
退情報を通報する。サーバ管理装置2iは、PCサーバ
1iの初期化処理が完了した時点で構成情報と障害情報
に基づいて適切な外部入出力装置5a〜5mを選択し、
外部入出力装置接続装置11に接続先を指示することに
よってPCサーバ1iと選択された外部入出力装置5a
〜5mを接続する。
The server management device 2i manages and controls the operation of the PC server 1i, and exchanges configuration information and fault information with the external server management devices 2a to 2n using the communication path 3. As a result, all the PC servers 1a to 1n
Is recorded in the nonvolatile memory 25. At the time of initialization and self-diagnosis of the PC server 1i, the server management device 2i automatically disconnects the failed processors 8a to 8n, or stores the specific processors 8a to 8n and memory 9
Degenerate operation such as disconnecting a part of in this case,
The server management device 2i sets the communication path 3
To the other server management devices 2a to 2n via the server. When the initialization process of the PC server 1i is completed, the server management device 2i selects an appropriate external input / output device 5a to 5m based on the configuration information and the failure information,
The PC server 1i and the selected external input / output device 5a are designated by instructing the external input / output device connection device 11 to connect.
To 5 m.

【0036】このように、各サーバ管理装置2a〜2n
は、構成情報管理機能、障害情報管理機能及び構成制御
機能を有している。各サーバ管理装置2a〜2nは、構
成情報管理機能を発揮することによって、図示しない通
信手段によって通信路3を介して相互に構成情報を授受
しあうことで、全てのPCサーバ1a〜1nに関する最
新の構成情報を共有する。また、各サーバ管理装置2a
〜2nは、障害情報管理機能を発揮することによって、
全てのPCサーバ1a〜1nに関する障害発生履歴に基
づいて求めた信頼度点数、障害による停止や縮退運転中
等の障害情報を図示しない通信手段によって通信路3を
介して相互に授受しあうことで、全てのPCサーバ1a
〜1nに関する最新の障害情報を共有する。また、管理
対象サーバにおける障害発生を監視し、障害発生を検知
した場合には、他のサーバ管理装置2a〜2nへ障害情
報を通報することによって、他のPCサーバ1a〜1n
が保有する当該管理対象サーバに関する障害情報を更新
する。更に、各サーバ管理装置2a〜2nは、構成制御
機能を発揮することによって、共有している構成情報及
び障害情報に基づいて、最適な外部入出力装置5a〜5
mを自律判断で選択し、外部入出力切り換え機構4によ
って管理対象サーバと選択されたいずれかの外部入出力
装置5a〜5mとを結合させ、当該外部入出力装置5a
〜5mに保持されているOSを起動して、業務処理を開
始させる。
As described above, each of the server management devices 2a to 2n
Has a configuration information management function, a failure information management function, and a configuration control function. Each of the server management devices 2a to 2n performs a configuration information management function, and exchanges configuration information with each other via a communication path 3 by a communication unit (not shown). Share configuration information. Also, each server management device 2a
~ 2n, by exhibiting the fault information management function,
By transmitting and receiving the reliability score obtained based on the failure occurrence histories for all the PC servers 1a to 1n and failure information such as stop due to a failure or degraded operation via the communication path 3 by communication means (not shown), All PC servers 1a
Share the latest fault information about .about.1n. In addition, when a failure has been monitored in the managed server, and the failure has been detected, the failure information is reported to the other server management devices 2a to 2n, whereby the other PC servers 1a to 1n are notified.
Update the failure information of the managed server held by the server. Further, each of the server management devices 2a to 2n exerts a configuration control function, so that the optimum external input / output devices 5a to 5n are determined based on the shared configuration information and fault information.
m is selected by autonomous judgment, the external input / output switching mechanism 4 couples the server to be managed with one of the selected external input / output devices 5a to 5m, and
Activate the OS stored in 5 m to start business processing.

【0037】図3は、図1の複数の外部入出力装置5a
〜5mの構成を示すブロック図である。外部入出力装置
5iは、複数のディスク制御装置26a〜26n、複数
(n)台のディスク制御装置26a〜26nによってデ
ータの記録や読出しをする複数(n)台のディスク装置
27a〜27n,28a〜28n、LAN7との通信制
御を行う複数(n)台の回線制御装置29a〜29n、
外部入出力切り換え機構4を経由してPCサーバ1a〜
1nと接続するサーバ接続装置30を有している。ここ
では、ディスク装置27aに業務処理を実行するための
OS6iが格納されているものとしている。
FIG. 3 shows a plurality of external input / output devices 5a of FIG.
It is a block diagram which shows the structure of ~ 5m. The external input / output device 5i includes a plurality of (n) disk devices 27a to 27n and 28a to record and read data by a plurality of (n) disk controllers 26a to 26n and a plurality (n) of disk controllers 26a to 26n. 28n, a plurality (n) of line controllers 29a to 29n for controlling communication with the LAN 7,
PC server 1a through external input / output switching mechanism 4
1n is connected to the server connection device 30. Here, it is assumed that the OS 6i for executing the business process is stored in the disk device 27a.

【0038】システム立上げ時、外部入出力装置5iの
サーバ接続装置30は、PCサーバ1a〜1nのいずれ
かと接続し、接続先のPCサーバ1iの指示を受けて、
ディスク制御装置26aの制御によりディスク装置27
aに格納されているOSi6iを読み出し、PCサーバ
1iによって業務処理が開始される。業務処理が開始さ
れると、接続先のPCサーバ1iの指示のもと、複数の
ディスク装置27a〜27n,28a〜28nが業務処
理用のデータ保存に利用されると共に、接続先のPCサ
ーバ1iは、回線制御装置29a〜29nを利用してL
AN7により他のPCサーバ1a〜1nや外部システム
とのデータ授受を行う。
When the system is started, the server connection device 30 of the external input / output device 5i connects to any one of the PC servers 1a to 1n, and receives an instruction from the connection destination PC server 1i.
The disk device 27 is controlled by the disk controller 26a.
OSi 6i stored in a is read, and the business process is started by PC server 1i. When the business process is started, a plurality of disk devices 27a to 27n and 28a to 28n are used for storing data for business process under the instruction of the PC server 1i of the connection destination, and the PC server 1i of the connection destination is used. Is L using the line controllers 29a to 29n.
The AN 7 exchanges data with the other PC servers 1a to 1n and external systems.

【0039】PCサーバ1iは、OSi6iをロードす
ることによってOSi6iが格納されている外部入出力
装置5i内のディスク装置27a〜27n,28a〜2
8nと回線制御装置29a〜29nのみで業務処理を開
始できるように設計されている。当該OSi6iが具備
する業務処理に必要な処理能力と信頼性は、全てのPC
サーバ1a〜1n内のサーバ管理装置2a〜2nの不揮
発性メモリ25に外部入出力装置5a〜5mの構成情報
として記憶されており、システム立上げ時においてPC
サーバ1a〜1nが接続先の外部入出力装置5a〜5m
を選択する際の判定基準となる。なお、業務処理開始
後、外部入出力装置5a〜5m内のディスク装置27a
〜27n,28a〜28nを、OS6a〜6mの制御に
よりPCサーバ1a〜1nで共用させることもできる。
The PC server 1i loads the OSi 6i, and the disk devices 27a to 27n and 28a to 2 in the external input / output device 5i in which the OSi 6i is stored.
8n and the line control devices 29a to 29n are designed so that business processing can be started only. The processing power and reliability required for business processing provided by the OSi6i are equivalent to all PCs.
The configuration information of the external input / output devices 5a to 5m is stored in the non-volatile memory 25 of the server management devices 2a to 2n in the servers 1a to 1n.
External input / output devices 5a-5m to which servers 1a-1n are connected
Is a criterion when selecting. After the business process starts, the disk device 27a in the external input / output devices 5a to 5m is set.
To 27n and 28a to 28n can be shared by the PC servers 1a to 1n under the control of the OSs 6a to 6m.

【0040】図4は、サーバ管理装置2a〜2nが不揮
発性メモリ25に記憶しているPCサーバ1a〜1nの
構成情報と障害情報の例を表形式で示した図である。更
に、PCサーバ1a〜1nの初期化処理完了時、サーバ
管理装置2a〜2nが接続先の外部入出力装置5a〜5
mを決定する際に算出するサーバ接続順位も示してい
る。構成情報には、PCサーバ1a〜1nと外部入出力
装置5a〜5mを接続する際の制約条件となるサーバグ
ループ、性能を左右する性能指標となるプロセッサモデ
ル、動作周波数、プロセッサ数、キャッシュ容量、メモ
リ容量、プロセッサモデル等、更にはこれらの構成情報
に基づいて後述する既定の算式によりシステム設計者が
算出する基本性能点数及びその基本性能点数に後述する
縮退条件を加味してサーバ管理装置2a〜2nにより算
出される実効的な処理能力を表す実効性能点数が含まれ
る。障害情報には、処理能力を左右する縮退状況を表す
縮退プロセッサ数、信頼性指標としての障害回数、PC
サーバ1a〜1nの初期化処理の結果を表す稼動状況
等、更にはこれらの障害情報に基づいて後述する既定の
算式によりサーバ管理装置2a〜2nが算出した信頼度
点数が含まれている。
FIG. 4 is a table showing examples of configuration information and failure information of the PC servers 1a to 1n stored in the nonvolatile memory 25 by the server management devices 2a to 2n. Furthermore, when the initialization processing of the PC servers 1a to 1n is completed, the server management devices 2a to 2n connect the external input / output devices 5a to 5
The server connection order calculated when determining m is also shown. The configuration information includes a server group serving as a constraint when connecting the PC servers 1a to 1n and the external input / output devices 5a to 5m, a processor model serving as a performance index that affects performance, an operating frequency, the number of processors, a cache capacity, The server management devices 2a to 2a to 2c include a basic capacity score calculated by a system designer based on the memory capacity, a processor model, and the like, and a predetermined formula described later based on the configuration information and a degeneration condition described later. 2n includes an effective performance score indicating an effective processing capacity calculated by 2n. The failure information includes the number of degraded processors indicating a degraded state that affects processing capacity, the number of failures as a reliability index,
It includes the operating status indicating the result of the initialization processing of the servers 1a to 1n, and further includes the reliability score calculated by the server management devices 2a to 2n based on these failure information by a predetermined formula described later.

【0041】各PCサーバ1a〜1nの構成情報と障害
情報は、システム構築時にシステム設計者が各値を決定
してサーバ管理装置2a〜2nに設定する。但し、ある
サーバ管理装置2iは、自身が管理するPCサーバ1i
に関する詳細な構成情報と障害情報を保持するが、他の
PCサーバ1a〜1nに関する構成情報と障害情報につ
いては、サーバグループ、実効性能点数及び信頼度点数
のみを保持する。例えば、PCサーバ1jの構成変更や
増設時には、PCサーバ1jを管理するサーバ管理装置
2jが、通信路3を介して他の全てのサーバ管理装置2
a〜2nに新たな構成情報と障害情報を通報することに
より全てのサーバ管理装置2a〜2nの構成情報及び障
害情報を更新する。サーバ管理装置2jが通報する新た
な構成情報と障害情報には、サーバグループ、実効性能
点数及び信頼度点数が含まれている。これによって、各
PCサーバ1a〜1nに固有の構成情報や障害情報を個
々のサーバ管理装置2a〜2n内に閉じて管理できると
共に、実効性能点数及び信頼度点数の算式についても各
PCサーバ1a〜1nに固有の算式を設けることができ
る。以下に構成情報及び障害情報を構成する各情報の詳
細について説明する。
The configuration information and the failure information of each of the PC servers 1a to 1n are determined by the system designer at the time of system construction and set in the server management devices 2a to 2n. However, a server management device 2i manages its own PC server 1i.
The configuration information and the failure information regarding the other PC servers 1a to 1n are stored, but only the server group, the effective performance score, and the reliability score are retained. For example, when the configuration of the PC server 1j is changed or added, the server management device 2j that manages the PC server 1j communicates with all other server management devices 2 via the communication path 3.
The configuration information and the failure information of all the server management devices 2a to 2n are updated by reporting the new configuration information and the failure information to a to 2n. The new configuration information and fault information reported by the server management device 2j include a server group, an effective performance score, and a reliability score. Thus, the configuration information and the failure information unique to each of the PC servers 1a to 1n can be closed and managed in each of the server management devices 2a to 2n, and the formulas of the effective performance score and the reliability score can be calculated. 1n can have its own formula. The details of each piece of information constituting the configuration information and the failure information will be described below.

【0042】サーバグループは、各PCサーバ1a〜1
nをいずれかの外部入出力装置5a〜5mへ接続する際
の制約条件の一つであり、ここでは、例としてIによっ
てインテル社のマイクロプロセッサアーキテクチャであ
るx86アーキテクチャを示し、Mによってマルチプロ
セッサ構成であることを、Sによってシングルプロセッ
サ構成であることを示す。この情報によって、x86ア
ーキテクチャのマルチプロセッサシステムとx86アー
キテクチャのシングルプロセッサシステムを異なるサー
バグループとして定義し、外部入出力装置5a〜5mに
格納されたOS6a〜6mの仕様にあったPCサーバ1
a〜1nを選択できるようにしている。すなわち、この
制約条件を満たすPCサーバ1a〜1n及び外部入出力
装置5a〜5m単位でPCサーバ1a〜1nの接続先と
なる外部入出力装置5a〜5mが選択され、決定され
る。なお、ここでは、x86アーキテクチャのみを示し
ているが、他のアーキテクチャのサーバを定義すること
によって、例えば、DEC社のアルファアーキテクチャ
のPCサーバをPCサーバ1a〜1nに混在させても、
対応したOSの格納された外部入出力装置5a〜5mに
接続させることができる。
The server group includes each of the PC servers 1a to 1
n is one of the restrictive conditions when connecting to any of the external input / output devices 5a to 5m. Here, for example, I denotes an x86 architecture which is a microprocessor architecture of Intel Corporation, and M denotes a multiprocessor configuration. Indicates that the configuration is a single processor by S. Based on this information, the x86 architecture multiprocessor system and the x86 architecture single processor system are defined as different server groups, and the PC server 1 that meets the specifications of the OSs 6a to 6m stored in the external input / output devices 5a to 5m.
a to 1n can be selected. That is, the external input / output devices 5a to 5m to which the PC servers 1a to 1n are connected are selected and determined in units of the PC servers 1a to 1n and the external input / output devices 5a to 5m satisfying the constraint condition. Although only the x86 architecture is shown here, by defining a server of another architecture, for example, even if a PC server of an alpha architecture of DEC is mixed with the PC servers 1a to 1n,
It can be connected to the external input / output devices 5a to 5m storing the corresponding OS.

【0043】基本性能点数は、各PCサーバ1a〜1n
が本来有している処理能力を示す点数であり、構成の縮
退がされていない状態における処理能力を示す点数であ
る。基本性能点数は、プロセッサモデル、動作周波数、
プロセッサ数、キャッシュ容量及びメモリ容量等の処理
能力を左右する性能指標に基づいてシステム設計者がシ
ステム構築時に決定される。基本性能点数は、各性能指
標毎に重み付けを行い、例えば、(プロセッサモデル点
数)+(動作周波数×重み値F)+(プロセッサ数×重
み値P)+(キャッシュ容量×重み値C)+(メモリ容
量×重み値M)のような計算式によって算出する。従っ
て、基本性能点数は、値が大きいほど処理能力が高いこ
とを意味している。
The basic performance score is calculated for each of the PC servers 1a to 1n.
Is a score indicating the inherent processing capability, and is a score indicating the processing capability in a state where the configuration is not degenerated. The basic performance score is based on the processor model, operating frequency,
A system designer is determined at the time of system construction based on performance indices that affect processing capabilities such as the number of processors, cache capacity, and memory capacity. The basic performance score is weighted for each performance index. For example, (processor model score) + (operating frequency × weight F) + (number of processors × weight P) + (cache capacity × weight C) + ( It is calculated by a calculation formula such as (memory capacity × weight M). Therefore, the larger the value of the basic performance score, the higher the processing capability.

【0044】実効性能点数は、構成の縮退がされた状態
での運転の結果、処理能力が低下したことにより補正さ
れた処理能力の点数であり、PCサーバ1a〜1nの初
期化処理完了時に、サーバ管理装置2a〜2nが、基本
性能点数と縮退した部位の縮退の形態及び重み値を元に
算出する。例えば、基本性能点数−(縮退プロセッサ数
×重みP)のような計算式によって算出する。図4の例
によると、PCサーバ1bの縮退プロセッサ数は2であ
ることから、重みPを1とするとPCサーバ1bの実効
性能点数は、基本性能点数8に対して(8−2×1=)
6となる。
The effective performance score is a score of the processing capacity corrected due to a reduction in the processing capacity as a result of the operation in the state in which the configuration has been degenerated. When the initialization processing of the PC servers 1a to 1n is completed, The server management devices 2a to 2n calculate based on the basic performance score, the degeneration mode of the degenerated part, and the weight value. For example, it is calculated by a calculation formula such as basic performance score− (number of degenerate processors × weight P). According to the example of FIG. 4, since the number of degenerated processors of the PC server 1 b is 2, if the weight P is 1, the effective performance score of the PC server 1 b is (8−2 × 1 = )
It becomes 6.

【0045】縮退プロセッサ数は、PCサーバ1a〜1
nの初期化処理完了時点で更新される値であり、縮退さ
れているプロセッサ8a〜8nの数を表す。
The number of degenerate processors is the number of PC servers 1a to 1
n is a value updated at the time of completion of the initialization processing, and represents the number of degenerated processors 8a to 8n.

【0046】障害回数は、PCサーバ1a〜1nの初期
化処理や業務処理中に発生したPCサーバ1a〜1nの
障害発生回数を表し、サーバ管理装置2a〜2nがPC
サーバ1a〜1nの信頼性を表す指標の一つとして使用
する。本実施の形態では、システム構築以来の障害発生
回数を累積している。障害発生回数が既定の回数を越え
る毎に信頼度点数に加算することで信頼度の低下を表す
ことができるようにしている。
The number of failures indicates the number of failures of the PC servers 1a to 1n that occurred during the initialization processing of the PC servers 1a to 1n and business processing.
It is used as one of the indexes indicating the reliability of the servers 1a to 1n. In the present embodiment, the number of failure occurrences since the system was constructed is accumulated. Each time the number of failure occurrences exceeds a predetermined number, it is added to the reliability score so that a decrease in reliability can be represented.

【0047】稼動状況は、PCサーバ1a〜1nの初期
化処理完了時点と障害発生により稼動状況が変化した際
に更新される。例えば、初期化処理完了時点の更新の結
果、PCサーバ1iが障害のため停止した場合、稼動状
況を停止とする。このように更新することで、サーバ管
理装置2a〜2nが外部入出力装置5a〜5mの接続先
決定に際し、PCサーバ1iを接続先の候補から外すた
めの制御に使用する。
The operating status is updated when the initialization process of the PC servers 1a to 1n is completed and when the operating status changes due to a failure. For example, if the PC server 1i is stopped due to a failure as a result of the update at the time of completion of the initialization processing, the operation status is set to stop. By updating in this manner, the server management devices 2a to 2n use the PC server 1i for control to remove the PC server 1i from the connection destination candidates when determining the connection destination of the external input / output devices 5a to 5m.

【0048】信頼度点数は、PCサーバ1a〜1nの初
期化処理完了時点に、サーバ管理装置2a〜2nが、縮
退プロセッサ数、障害回数、稼動状況等から既定の算式
によって算出するPCサーバ1a〜1nの信頼性を表す
総合点数である。本実施の形態では、稼動状況が稼動の
場合に障害回数をそのまま信頼度点数としており、稼動
状況が停止の場合には障害回数に更に100を加算して
いる。従って、信頼度点数が高いほど、信頼性が低いこ
とを意味している。なお、稼動状況が停止の場合の加算
値は、1000等のより大きな値を利用してもよい。
The reliability score is calculated by the server management devices 2a to 2n from the number of degraded processors, the number of failures, the operation status, and the like by a predetermined formula when the initialization process of the PC servers 1a to 1n is completed. It is a total score representing the reliability of 1n. In the present embodiment, when the operation status is “operation”, the number of failures is used as it is as the reliability score, and when the operation status is “stop”, 100 is added to the number of failures. Therefore, the higher the reliability score, the lower the reliability. It should be noted that a larger value such as 1000 may be used as the added value when the operation status is stopped.

【0049】サーバ接続順位は、PCサーバ1a〜1n
の初期化処理完了時点に、サーバ管理装置2a〜2n
が、サーバグループ毎に、実効性能点数と信頼度点数に
基づいて算出する順位で、本順位に基づいてサーバ管理
装置2a〜2nがPCサーバ1a〜1nの接続先となる
外部入出力装置5a〜5mを決定する。本実施の形態で
は、実効性能点数で第1次の順序付けを行い、実効性能
点数が同一のものに対しては信頼度点数で第2次の順序
付けを行っている。更に、最終的な順序付けとしては、
PCサーバ1a〜1n固有のサーバ番号の若い順に順序
付けを行なう。なお、順位0は、外部入出力装置5a〜
5mとの接続を行わないことを表す。図4に示した例に
よると、PCサーバ1cは、外部入出力装置5a〜5m
との接続候補外である。また、サーバグループISには
PCサーバ1dのみが存在するので、PCサーバ1dの
サーバ接続順位は1となる。
The server connection order is determined by the PC servers 1a to 1n.
Server management devices 2a to 2n
Is an order calculated based on the effective performance score and the reliability score for each server group. Based on the order, the server management devices 2a to 2n are connected to the PC servers 1a to 1n. Determine 5m. In the present embodiment, the first order is performed based on the effective performance score, and the second order is performed based on the reliability score for those having the same effective performance score. Furthermore, the final ordering is:
The ordering is performed in ascending order of server numbers unique to the PC servers 1a to 1n. In addition, the order 0 is the external input / output devices 5a to 5a.
5m is not connected. According to the example illustrated in FIG. 4, the PC server 1c is configured to use the external input / output devices 5a to 5m.
Is not a candidate for connection. Further, since only the PC server 1d exists in the server group IS, the server connection order of the PC server 1d is 1.

【0050】図5は全てのサーバ管理装置2a〜2nが
不揮発性メモリ25に記憶している外部入出力装置5a
〜5mの構成情報の例を表形式で示した図である。この
構成情報は、外部入出力装置5a〜5mに格納されてい
るOS6a〜6mの種類を表すOS名、搭載されている
OS6a〜6mによる業務処理に必要な処理能力と信頼
性を表す性能指標と信頼度指標、接続元のPCサーバ1
a〜1nに対する制約条件としてのサーバグループ、前
記性能指標と信頼度指標に基づいてサーバグループ単位
で決定され、PCサーバ1a〜1nとの接続順序を表す
装置接続順位を含む。外部入出力装置5a〜5mの構成
情報は、装置接続順位を除き全てシステム設計者によっ
て決定され、システム構築時やシステム構成変更時に、
全てのサーバ管理装置2a〜2nに記録される。装置接
続順位は、PCサーバ1a〜1nの初期化処理完了時点
で、サーバ管理装置2a〜2nが、性能指標と信頼度指
標に基づいて算出する。以下に外部入出力装置5a〜5
mの構成情報を構成する各情報の詳細について説明す
る。
FIG. 5 shows the external input / output device 5a stored in the nonvolatile memory 25 by all the server management devices 2a to 2n.
FIG. 8 is a diagram showing an example of configuration information of up to 5 m in a table format. The configuration information includes an OS name indicating the type of the OSs 6a to 6m stored in the external input / output devices 5a to 5m, a performance index indicating processing capability and reliability required for business processing by the installed OSs 6a to 6m, and Reliability index, connection source PC server 1
A server group as a constraint on a to 1n, and a device connection order, which is determined for each server group based on the performance index and the reliability index, and indicates a connection order with the PC servers 1a to 1n. All the configuration information of the external input / output devices 5a to 5m is determined by the system designer except for the device connection order.
It is recorded in all server management devices 2a to 2n. The device connection order is calculated by the server management devices 2a to 2n based on the performance index and the reliability index when the initialization processing of the PC servers 1a to 1n is completed. The external input / output devices 5a to 5
Details of each piece of information constituting the m configuration information will be described.

【0051】サーバグループは、PCサーバ1a〜1n
の構成情報に含まれるサーバグループと同じ意味を持
ち、同一のサーバグループ間での接続のみを許可するも
のである。ここでは、OS6a〜6mの種類によって、
シングルプロセッサ専用のものやマルチプロセッサに対
応したものによってグループ分けをし、PCサーバ1a
〜1nとの接続時の制限事項としている。
The server groups are the PC servers 1a to 1n
Has the same meaning as the server group included in the configuration information, and permits connection only between the same server groups. Here, depending on the type of OS 6a to 6m,
The PC server 1a is divided into groups according to those dedicated to a single processor or those compatible with a multiprocessor.
1 to 1n.

【0052】性能指標と信頼度指標は、この例では、外
部入出力装置5a〜5mに搭載されたOS6a〜6mに
よる業務処理に必要な処理能力と信頼性を順位として表
した相対的な指標である。サーバグループ毎に性能指標
で第1次の順序付けを行い、同一性能指標の外部入出力
装置5a〜5mを信頼性指標で更に順序付けしている。
例えば、外部入出力装置を新たに追加した場合には、シ
ステム設計者が、まず、性能指標で性能面から既存順位
のいずれかに割り付け、信頼度指標によって同一性能指
標内での順序付けを変更する。この例では、性能指標と
信頼度指標を元に、PCサーバ1a〜1nへの接続順序
を一元的に表した装置接続順位を、サーバ管理装置2a
〜2nがPCサーバ1a〜1nの初期化処理完了時点で
求めている。サーバ管理装置2a〜2nは、装置接続順
位とサーバ接続順位をつき合わせることによって、PC
サーバ1a〜1nと外部入出力装置5a〜5mの接続関
係を決定する。
In this example, the performance index and the reliability index are relative indexes representing, as ranks, the processing performance and reliability required for business processing by the OSs 6a to 6m mounted on the external input / output devices 5a to 5m. is there. The primary ordering is performed by the performance index for each server group, and the external input / output devices 5a to 5m having the same performance index are further ordered by the reliability index.
For example, when an external input / output device is newly added, the system designer first assigns one of the existing ranks in terms of performance using the performance index, and changes the ordering within the same performance index using the reliability index. . In this example, based on the performance index and the reliability index, the device connection order that represents the connection order to the PC servers 1a to 1n in a unified manner is stored in the server management device 2a.
To 2n at the time of completion of the initialization processing of the PC servers 1a to 1n. The server management devices 2a to 2n compare the device connection order with the server connection order, and
The connection relationship between the servers 1a to 1n and the external input / output devices 5a to 5m is determined.

【0053】図6は、PCサーバ1a〜1nと外部入出
力装置5a〜5mの接続先を決定して業務処理のための
システム立上げを開始する迄のサーバ管理装置2a〜2
nの処理手順を示したフローチャートである。以下、図
1〜図6を用いて本実施の形態における動作について説
明する。ここでは、PCサーバ1a〜1n、サーバ管理
装置2a〜2n、外部入出力装置5a〜5m及びOS6
a〜6mのうち、PCサーバ1i、サーバ管理装置2
i、外部入出力装置5i及びOS6iに着目して動作を
説明する。分散システム全体の電源投入時には、他のP
Cサーバ1a〜1n及びサーバ管理装置2a〜2nも同
一の手順によって一斉にシステム立上げが開始され以下
の処理が実行される。
FIG. 6 shows the server management devices 2a-2 until the connection destinations of the PC servers 1a-1n and the external input / output devices 5a-5m are determined and the system startup for business processing is started.
4 is a flowchart showing the processing procedure of n. Hereinafter, the operation in the present embodiment will be described with reference to FIGS. Here, the PC servers 1a to 1n, the server management devices 2a to 2n, the external input / output devices 5a to 5m, and the OS 6
PC server 1i, server management device 2
i, the external input / output device 5i and the OS 6i, the operation will be described. When the entire distributed system is powered on, other P
The C servers 1a to 1n and the server management devices 2a to 2n also simultaneously start up the system by the same procedure, and execute the following processing.

【0054】まず、分散システム全体の電源投入によっ
て、サーバ管理装置2iは、PCサーバ1iの障害情報
のうち、縮退プロセッサ数を0に、稼動状況を初期化状
態に設定する。メモリやキャッシュ等、縮退情報が他に
も存在する場合には、それらも非縮退時の値に設定する
(ステップ100)。
First, when the power of the entire distributed system is turned on, the server management apparatus 2i sets the number of degenerated processors to 0 in the failure information of the PC server 1i, and sets the operation status to the initialized state. If there is other degeneration information such as a memory or a cache, they are also set to the values at the time of non-degeneration (step 100).

【0055】サーバ管理装置2iは、PCサーバ1iの
初期化及び自己診断を開始する(ステップ110)。P
Cサーバ1iのプロセッサ8a〜8nは、電源投入後、
初期化処理開始がサーバ管理装置2iから指示されるま
での間、ハードウェアのリセット状態を維持する等によ
り動作を停止する。サーバ管理装置2iが初期化処理開
始を指示すると、プロセッサ8a〜8nは、ROM12
内の初期化及び自己診断プログラムによって初期化処理
を開始する。これによって、メモリ9、外部入出力装置
接続装置11、制御装置13,15,17,19,2
1、キーボード14、マウス16、ディスプレイ18、
FDD20及びHDD22が初期化及び診断され、稼動
可能な状態になる。なお、外部入出力装置接続装置11
は、サーバ管理装置2iからの接続先指示が出されるま
では、接続先オフラインの状態を維持する。外部入出力
装置接続装置11は、OS6a〜6mのロード装置とし
て定義されていることから、初期化処理完了後、プロセ
ッサ8a〜8nはOS6a〜6mによるシステム立上げ
待ちの状態に留まる。
The server management device 2i starts initialization and self-diagnosis of the PC server 1i (step 110). P
After turning on the power, the processors 8a to 8n of the C server 1i
Until the start of the initialization process is instructed from the server management apparatus 2i, the operation is stopped by, for example, maintaining the reset state of the hardware. When the server management device 2i instructs the start of the initialization process, the processors 8a to 8n
Initialization processing is started by the initialization and self-diagnosis program in the above. Thereby, the memory 9, the external input / output device connection device 11, the control devices 13, 15, 17, 19, 2
1, keyboard 14, mouse 16, display 18,
The FDD 20 and the HDD 22 are initialized and diagnosed, and become operable. The external input / output device connection device 11
Keeps the connection destination offline until the connection destination instruction is issued from the server management device 2i. Since the external input / output device connection device 11 is defined as a load device for the OSs 6a to 6m, the processors 8a to 8n remain in a state of waiting for the system startup by the OSs 6a to 6m after the completion of the initialization process.

【0056】ここで、PCサーバ1iが初期化処理に失
敗して稼動不能であることが確認された場合、サーバ管
理装置2iは、PCサーバ1iが停止状態になった旨の
障害通報を通信路3を介して他の全てのサーバ管理装置
2a〜2nに発信する(ステップ120,130)。こ
の後、サーバ管理装置2iは、PCサーバ1iを停止状
態に保ち、保守要員による復旧を待つ(ステップ14
0)。
Here, when it is confirmed that the PC server 1i has failed in the initialization process and is inoperable, the server management device 2i sends a failure report indicating that the PC server 1i has been stopped to the communication path. 3 to all the other server management devices 2a to 2n (steps 120 and 130). Thereafter, the server management device 2i keeps the PC server 1i in a stopped state and waits for recovery by maintenance personnel (step 14).
0).

【0057】一方、サーバ管理装置2iは、プロセッサ
8a〜8nの初期化処理完了を確認すると、PCサーバ
1iの縮退状況を確認する(ステップ120,15
0)。PCサーバ1iは、例えばプロセッサ8a〜8n
の自己診断の結果、プロセッサ8cに障害を発見した場
合、プロセッサ8cを切り離して初期化処理を完了させ
る。サーバ管理装置2iは、プロセッサ8cの切離しを
認識すると、自身の障害情報にその旨(障害プロセッサ
数)を記録する(ステップ160)。
On the other hand, upon confirming the completion of the initialization processing of the processors 8a to 8n, the server management device 2i confirms the degeneration status of the PC server 1i (steps 120 and 15).
0). The PC server 1i includes, for example, the processors 8a to 8n
As a result of the self-diagnosis, if a failure is found in the processor 8c, the processor 8c is disconnected to complete the initialization processing. When recognizing the disconnection of the processor 8c, the server management device 2i records the fact (the number of failed processors) in its own failure information (step 160).

【0058】サーバ管理装置2iは、更新されたPCサ
ーバ1iに関する構成情報と障害情報に基づき、PCサ
ーバ1iの実効性能点数を計算し、PCサーバ1iの構
成情報に記録する(ステップ170)。図4に示した例
によると、PCサーバ1bについては縮退プロセッサ数
が2、重みが1であることから、実効性能点数を(基本
性能点数−2)として計算している。他のPCサーバに
ついては縮退プロセッサ数が0であることから、基本性
能点数をそのまま実効性能点数としている。
The server management device 2i calculates the effective performance score of the PC server 1i based on the updated configuration information and failure information relating to the PC server 1i, and records it in the configuration information of the PC server 1i (step 170). According to the example shown in FIG. 4, since the number of degenerated processors is 2 and the weight is 1 for the PC server 1b, the calculation is performed with the effective performance score as (basic performance score-2). Since the number of degenerated processors is 0 for other PC servers, the basic performance score is directly used as the effective performance score.

【0059】サーバ管理装置2iは、更新されたPCサ
ーバ1iに関する障害情報に基づき、PCサーバ1iの
信頼度点数を計算し、PCサーバ1iの障害情報に記録
する(ステップ180)。図4に示した例によると、P
Cサーバ1a、PCサーバ1b、PCサーバ1d及びP
Cサーバ1nについては、稼動状況が稼動状態にあるた
め、障害回数をそのまま信頼度点数として記録している
が、PCサーバ1cについては、稼動状況が停止状態に
あるため、信頼度点数を障害回数+100として記録し
ている。
The server management device 2i calculates the reliability score of the PC server 1i based on the updated failure information on the PC server 1i, and records it in the failure information of the PC server 1i (step 180). According to the example shown in FIG.
C server 1a, PC server 1b, PC server 1d and P
Since the operating status of the C server 1n is in the operating state, the number of failures is recorded as it is as the reliability score. However, since the operating status of the PC server 1c is in the stopped state, the reliability score is represented by the number of failures. Recorded as +100.

【0060】サーバ管理装置2iは、このようにしてP
Cサーバ1iの構成情報と障害情報を自動生成すると、
不揮発性メモリ25の内容を更新し、更に当該構成情報
及び障害情報を含んだ初期化完了通報を通信路3を介し
て他の全てのサーバ管理装置2a〜2nに発信する(ス
テップ190)。その一方、他のサーバ管理装置2a〜
2nからの初期化完了通報あるいは障害通報を受信す
る。この段階で、サーバ管理装置2iは、全てのPCサ
ーバ1a〜1nに関する構成情報と障害情報を他のサー
バ管理装置2a〜2nから通信路3を介して取得し、不
揮発性メモリ25に逐次記録する。
The server management device 2i thus sets P
When the configuration information and the failure information of the C server 1i are automatically generated,
The contents of the nonvolatile memory 25 are updated, and an initialization completion report including the configuration information and the failure information is transmitted to all the other server management apparatuses 2a to 2n via the communication path 3 (step 190). On the other hand, the other server management devices 2a to 2a
2n, receives an initialization completion notification or a failure notification. At this stage, the server management device 2i acquires the configuration information and the failure information regarding all the PC servers 1a to 1n from the other server management devices 2a to 2n via the communication path 3 and sequentially records them in the nonvolatile memory 25. .

【0061】サーバ管理装置2iは、全PCサーバ1a
〜1nの構成情報と障害情報及び全外部入出力装置5a
〜5mの構成情報に基づいて全PCサーバ1a〜1nと
全外部入出力装置5a〜5mの接続先を決定する(ステ
ップ200)。この結果、PCサーバ1iの接続先を外
部入出力装置5iに決定したものとする。サーバ管理装
置2iは、この決定結果からPCサーバ1iの外部入出
力装置接続装置11に、PCサーバ1iの接続先となる
外部入出力装置5iを指示して、PCサーバ1iと外部
入出力装置5iを接続する(ステップ210)。なお、
各サーバ管理装置2a〜2nは、個々に同様の処理を行
うことによりそれぞれを搭載したPCサーバ1a〜1n
の接続先を決定した結果、PCサーバ数が外部入出力装
置数以下であれば基本的には全PCサーバ1a〜1nの
接続先が決定されることになる。
The server management device 2i is connected to all PC servers 1a.
To 1n configuration information, fault information, and all external input / output devices 5a
The connection destinations of all the PC servers 1a to 1n and all the external input / output devices 5a to 5m are determined based on the configuration information of the first to fifth meters (step 200). As a result, it is assumed that the connection destination of the PC server 1i is determined to be the external input / output device 5i. The server management device 2i instructs the external input / output device connection device 11 of the PC server 1i to the external input / output device 5i to be connected to the PC server 1i based on the result of the determination, and the PC server 1i and the external input / output device 5i. Are connected (step 210). In addition,
Each of the server management devices 2a to 2n performs the same processing individually, and the PC server 1a to 1n on which each is mounted.
As a result of determining the connection destinations, if the number of PC servers is equal to or less than the number of external input / output devices, the connection destinations of all the PC servers 1a to 1n are basically determined.

【0062】外部入出力装置接続装置11は、サーバ管
理装置2iの指示により選択された外部入出力装置5i
に外部入出力切り換え機構4を経由して接続し、接続先
オンラインの状態とする。これによって、PCサーバ1
iの初期化処理完了後、OS6iのロード装置のオンラ
イン待ち状態にあったプロセッサ8a〜8nは、接続さ
れた外部入出力装置5iに搭載されたOS6iをメモリ
9へロードしてシステム立上げを開始する(ステップ2
20)。
The external input / output device connection device 11 is connected to the external input / output device 5i selected by the instruction of the server management device 2i.
Via the external input / output switching mechanism 4 to bring the connection destination online. Thereby, the PC server 1
After the initialization of i is completed, the processors 8a to 8n in the online waiting state of the OS 6i loading device load the OS 6i mounted on the connected external input / output device 5i into the memory 9 and start system startup. (Step 2
20).

【0063】図7は、図6における初期化完了通報処理
(ステップ190)の詳細手順を示したフローチャート
である。本手順によって、サーバ管理装置2iは、PC
サーバ1iの構成情報と障害情報を他の全てのサーバ管
理装置2a〜2nに通報すると共に、他の全てのサーバ
管理装置2a〜2nの構成情報と障害情報を取得する。
ここでは、既定時間に受信した初期化完了通報及び障害
通報の数によって、全てのPCサーバ1a〜1nの台数
を求めており、電源投入前のシステム構成の変更にも柔
軟に対応することができる。他のサーバ管理装置2a〜
2nも同時に同じ処理を行うことで、全てのサーバ管理
装置2a〜2nは全てのPCサーバ1a〜1nの構成情
報と障害情報を共有する。
FIG. 7 is a flowchart showing a detailed procedure of the initialization completion notification process (step 190) in FIG. By this procedure, the server management device 2i
The configuration information and the failure information of the server 1i are reported to all the other server management apparatuses 2a to 2n, and the configuration information and the failure information of all the other server management apparatuses 2a to 2n are acquired.
Here, the number of all the PC servers 1a to 1n is obtained based on the number of the initialization completion reports and the failure reports received at the predetermined time, and it is possible to flexibly cope with a change in the system configuration before the power is turned on. . Other server management devices 2a to
2n also performs the same processing at the same time, so that all server management apparatuses 2a to 2n share the configuration information and the failure information of all PC servers 1a to 1n.

【0064】サーバ管理装置2iは、PCサーバ1iの
構成情報と障害情報を含んだ初期化完了通報を、他の全
てのサーバ管理装置2a〜2nに発信する(ステップ1
91)。ここで発信される構成情報と障害情報は、サー
バグループ、実効性能点数、信頼度点数等の外部入出力
装置5a〜5mを決定するために最低限必要な情報のみ
である。サーバ管理装置2iは、全てのPCサーバ1a
〜1nの台数を求めるために初期値n=1を設定する
(ステップ192)。なお、自己のPCサーバ1iの分
を考慮してn=1としている。次に、サーバ管理装置2
iは、他のPCサーバ1a〜1nからの初期化処理完了
通報あるいは障害通報待ち時間を設定する(ステップ1
93)。この待ち時間は、全てのPCサーバ1a〜1n
の初期化処理が完了するに十分な値とする。そして、サ
ーバ管理装置2iは、待ち時間が終了するまでの間、以
下の処理を繰り返し行う。
The server management device 2i sends an initialization completion report including the configuration information and the failure information of the PC server 1i to all the other server management devices 2a to 2n (step 1).
91). The configuration information and the failure information transmitted here are only the minimum information necessary for determining the external input / output devices 5a to 5m, such as the server group, the effective performance score, and the reliability score. The server management device 2i includes all the PC servers 1a
An initial value n = 1 is set in order to obtain the number of 11n (step 192). Note that n = 1 is set in consideration of the own PC server 1i. Next, the server management device 2
i sets the initialization processing completion notification or the failure notification waiting time from the other PC servers 1a to 1n (step 1).
93). This waiting time is determined for all PC servers 1a to 1n.
Is a value sufficient to complete the initialization process. Then, the server management device 2i repeatedly performs the following processing until the waiting time ends.

【0065】まず、受信した情報が初期化完了通報の場
合、受信した構成情報と障害情報を不揮発性メモリ25
に記録し(ステップ196)、サーバ台数nに1を加算
する(ステップ197)。一方、受信した情報が障害通
報の場合、受信した障害情報を不揮発性メモリ25に記
録し(ステップ199)、サーバ台数nに1を加算する
(ステップ197)。この処理の結果、各情報を不揮発
性メモリ25に記録しながらPCサーバ1a〜1nの台
数を求めることができる。
First, when the received information is the initialization completion report, the received configuration information and fault information are stored in the nonvolatile memory 25.
(Step 196), and 1 is added to the server number n (step 197). On the other hand, if the received information is a failure report, the received failure information is recorded in the non-volatile memory 25 (step 199), and 1 is added to the server number n (step 197). As a result of this processing, the number of PC servers 1a to 1n can be obtained while recording each information in the nonvolatile memory 25.

【0066】図8は、図6における外部入出力装置接続
先決定(ステップ200)の詳細手順を示したフローチ
ャートである。本実施の形態におけるPCサーバ1a〜
1nの接続先となる外部入出力装置5a〜5mは、全て
のサーバ管理装置2a〜2nが全てのPCサーバ1a〜
1nの構成情報と障害情報及び全ての外部入出力装置5
a〜5mの構成情報を共有することによってそれぞれに
自律判断で決定される。以下、図4、図5及び図8によ
り、接続先の決定手順をPCサーバ1iにおける動作と
して説明する。他のPCサーバ1a〜1nにおいても、
同一の手順によって、接続先を決定することになる。
FIG. 8 is a flowchart showing a detailed procedure of determining the external input / output device connection destination (step 200) in FIG. PC server 1a to 1 in this embodiment
The external input / output devices 5a to 5m to which 1n is connected are all server management devices 2a to 2n, and all the PC servers 1a to
1n configuration information and fault information and all external input / output devices 5
By sharing the configuration information a to 5m, each is determined by autonomous judgment. Hereinafter, the procedure for determining the connection destination will be described as an operation in the PC server 1i with reference to FIG. 4, FIG. 5, and FIG. In other PC servers 1a to 1n,
The connection destination is determined by the same procedure.

【0067】図8の手順開始時点では、全てのPCサー
バ1a〜1nの構成情報と障害情報及び全ての外部入出
力装置5a〜5mの構成情報は、初期化処理完了時点の
状態に更新されており、分散システム全体としては、こ
れらの情報を元に接続先を決定することによって業務処
理が開始できる状態にある。
At the start of the procedure in FIG. 8, the configuration information and fault information of all the PC servers 1a to 1n and the configuration information of all the external input / output devices 5a to 5m are updated to the state at the time of completion of the initialization processing. Thus, the entire distributed system is in a state where business processing can be started by determining a connection destination based on such information.

【0068】サーバ管理装置2iは、図4における実効
性能点数と信頼度点数から、全てのPCサーバ1a〜1
nの接続順位を決定する(ステップ201)。サーバ接
続順位は、まず実効性能点数の高いものから高順位と
し、実効性能点数が同じものについては、信頼度点数の
少ないものを高順位とする。この結果、依然として同一
順位に並ぶものについては、図4においてPCサーバ1
a〜1nのサーバ番号の若いものを高順位とする。図4
に示した例では、サーバグループIMについて実効性能
点数の最も高いPCサーバ1nをサーバ接続順位1と
し、実効性能点数が等しいPCサーバ1a〜1cについ
ては、信頼度点数の小さいものから順に、すなわちPC
サーバ1aをサーバ接続順位2、PCサーバ1bをサー
バ接続順位3としている。PCサーバ1cは、信頼度点
数が100を越えていることから接続不能と判断し、サ
ーバ接続順位0に設定している。
The server management device 2i, based on the effective performance score and the reliability score in FIG.
The connection order of n is determined (step 201). First, the server connection order is determined to be higher in the order of higher effective performance score, and for those having the same effective performance score, the server having the lower reliability score is ranked higher. As a result, the PC servers 1 which are still in the same order are shown in FIG.
The server with the smaller server number from a to 1n is ranked higher. FIG.
In the example shown in (1), the PC server 1n having the highest effective performance score for the server group IM is set to the server connection order 1, and the PC servers 1a to 1c having the same effective performance score are ordered in ascending order of reliability score, that is, PC
The server 1a has the server connection order 2 and the PC server 1b has the server connection order 3. The PC server 1c determines that the connection is impossible because the reliability score exceeds 100, and sets the server connection rank to 0.

【0069】続いて、サーバ管理装置2iは、図5にお
ける外部入出力装置5a〜5mの構成情報から、外部入
出力装置5a〜5mの装置接続順位を決定する(ステッ
プ202)。装置接続順位は、図5に示した性能指標の
順に順位付けを行い、同一順位のものについては、信頼
度指標によって順位付けを行う。性能指標と信頼度指標
は、共にサーバグループ単位に設定した順位を表してお
り、値の小さいものが高順位であり、より高性能で高信
頼度のPCサーバを必要としていることを表す。なお、
本実施の形態においては、性能指標と信頼度指標によっ
て間接的に装置接続順位を表現すると共に、システム立
上げ時に毎回サーバ管理装置2iによって装置接続順位
を算出しなおす手順としているが、システム構築時にシ
ステム設計者によって一意に決定するようにしてもよ
い。
Subsequently, the server management device 2i determines the device connection order of the external input / output devices 5a to 5m from the configuration information of the external input / output devices 5a to 5m in FIG. 5 (step 202). The device connection order is ranked in the order of the performance indices shown in FIG. 5, and those having the same order are ranked by the reliability index. The performance index and the reliability index both indicate the order set for each server group, and a smaller value indicates a higher order, indicating that a PC server with higher performance and higher reliability is required. In addition,
In the present embodiment, the device connection order is indirectly expressed by the performance index and the reliability index, and the server connection order is calculated again by the server management device 2i every time the system is started up. It may be uniquely determined by the system designer.

【0070】サーバ管理装置2iは、自身が管理するP
Cサーバ1iのサーバ接続順位に基づいて外部入出力装
置5a〜5mの構成情報を取得し(ステップ203)、
PCサーバ1iと同一のサーバグループでかつ同じ装置
接続順位の外部入出力装置5iを検索する(ステップ2
04,205)。これを該当する外部入出力装置5iが
見つかるまで繰り返し行い(ステップ206)、該当す
る外部入出力装置5iが見つかれば、それをPCサーバ
1iの接続先とする(ステップ207)。
The server management device 2i manages the P
The configuration information of the external input / output devices 5a to 5m is acquired based on the server connection order of the C server 1i (step 203).
The external input / output device 5i in the same server group as the PC server 1i and in the same device connection order is searched (step 2).
04, 205). This is repeated until the corresponding external input / output device 5i is found (step 206). If the relevant external input / output device 5i is found, it is set as the connection destination of the PC server 1i (step 207).

【0071】一方、上記検索の結果、該当する外部入出
力装置5iがなかった場合には、接続先無しと判断し、
サーバ管理装置2iは、PCサーバ1iの接続待ち状態
を保持することで代替サーバとして待機させる(ステッ
プ208)。業務処理開始後、業務処理実行中のPCサ
ーバ1a〜1nに障害が発生した場合には、待機状態に
あるPCサーバ1iが代替運転を行う。
On the other hand, if there is no corresponding external input / output device 5i as a result of the above search, it is determined that there is no connection destination, and
The server management device 2i holds the connection waiting state of the PC server 1i to make it stand by as a substitute server (step 208). If a failure occurs in the PC servers 1a to 1n that are executing the business process after the start of the business process, the PC server 1i in the standby state performs the alternative operation.

【0072】以上のように、本実施の形態によれば、P
Cサーバ1a〜1nと外部入出力装置5a〜5mとをそ
れぞれに接続順位を決定し、各PCサーバ1a〜1nを
同一のサーバグループでかつ同じ装置接続順位の外部入
出力装置5a〜5mとを接続するようにしたので、各P
Cサーバ1a〜1nにそれぞれの処理能力に応じた適切
な外部入出力装置5a〜5mを接続して業務処理を行わ
せることができる。特に、本実施の形態によれば、基本
性能点数で表したPCサーバ1a〜1nが諸元等による
本来的に持つ処理能力ではなく、プロセッサの縮退等構
成の変更を考慮した現実の構成に基づく実効性能点数を
用いてサーバ接続順位を求めているので、システム立上
げ時点における処理能力に応じて各PCサーバ1a〜1
nを最適な外部入出力装置5a〜5mと接続させること
ができる。
As described above, according to the present embodiment, P
The connection order is determined for each of the C servers 1a to 1n and the external input / output devices 5a to 5m, and each PC server 1a to 1n is connected to the external input / output devices 5a to 5m in the same server group and having the same device connection order. Since each connection was made,
It is possible to connect the C servers 1a to 1n to appropriate external input / output devices 5a to 5m corresponding to the respective processing capacities to perform business processing. In particular, according to the present embodiment, the PC servers 1a to 1n represented by the basic performance score are not based on the inherent processing capability due to the specifications and the like, but are based on the actual configuration in consideration of the change in the configuration such as the degeneration of the processor. Since the server connection order is obtained using the effective performance score, each of the PC servers 1a to 1 is set in accordance with the processing capacity at the time of system startup.
n can be connected to the optimal external input / output devices 5a to 5m.

【0073】次に、待機中のPCサーバ1iが代替運転
を開始する場合の動作を、図9と図10を用いて説明す
る。図9は、システム立上げ時のPCサーバ1a〜1n
と外部入出力装置5a〜5mの接続状況、代替運転開始
後の接続状況、PCサーバ1j復旧後の接続状況及びP
Cサーバ1i再立上げ時の接続状況を表形式で示した図
である。サーバ管理装置2a〜2nが管理する構成情報
と障害情報のうちサーバグループ、サーバ接続順位と稼
動状況を示すとともに、新たに、外部入出力装置接続状
態も示した。外部入出力装置接続状態というのは、各P
Cサーバ1a〜1nの接続先に関する情報であり、いず
れかの外部入出力装置5a〜5mと接続されている場合
にはその外部入出力装置5a〜5mの識別情報が、いず
れの外部入出力装置5a〜5mとも接続されていない場
合にはその旨「なし」が設定される。全PCサーバ1a
〜1nにおけるシステム立上げ時には、各PCサーバ1
a〜1n間で情報の交換を行い、サーバ接続順位と装置
接続順位を一対一に対応させるため、外部入出力装置接
続状態をサーバ接続順位と装置接続順位から直接知るこ
とができる。しかし、稼動中のPCサーバ1a〜1nの
状態をそのままにして代替運転をする場合には、サーバ
接続順位と装置接続順位の対応関係を一部崩すため、外
部入出力装置接続状態をサーバ接続順位と装置接続順位
から直接知ることができなくなる。すなわち、代替運転
をする場合、その代替運転をするPCサーバ1iは、シ
ステム立上げ時に他のPCサーバ1a〜1nに対してサ
ーバグループ等の情報を送出することになるが、稼動中
の各PCサーバ1a〜1nは、PCサーバ1iに対して
接続先に関する情報を送信しないので、対応関係が取れ
なくなるからである。図9(a)では、外部入出力装置
接続状態を直接示すことで、接続状態の遷移状況を表し
た。代替運転を制御するため、サーバ管理装置2a〜2
nは、外部入出力装置接続状態を構成情報の中に記録す
る。
Next, the operation when the standby PC server 1i starts the alternative operation will be described with reference to FIG. 9 and FIG. FIG. 9 shows the PC servers 1a to 1n when the system is started up.
Connection status between the external input / output devices 5a to 5m, the connection status after the start of the alternative operation, the connection status after the PC server 1j is restored, and P
It is the figure which showed the connection status at the time of C server 1i restarting in tabular form. Among the configuration information and the failure information managed by the server management devices 2a to 2n, the server group, the server connection order and the operation status are shown, and the external input / output device connection status is also newly shown. The external I / O device connection state is defined by each P
This is information on the connection destinations of the C servers 1a to 1n. When connected to any one of the external input / output devices 5a to 5m, the identification information of the external input / output devices 5a to 5m indicates any of the external input / output devices. If none of 5a to 5m is connected, "None" is set to that effect. All PC server 1a
1 to 1n, each PC server 1
Since information is exchanged between a to 1n and the server connection order and the device connection order are in one-to-one correspondence, the external input / output device connection state can be directly known from the server connection order and the device connection order. However, when performing the alternative operation while keeping the states of the operating PC servers 1a to 1n as they are, in order to partially break the correspondence between the server connection order and the device connection order, the external input / output device connection state is changed to the server connection order. And the device connection order cannot be directly known. That is, when performing the alternative operation, the PC server 1i performing the alternative operation sends information such as a server group to the other PC servers 1a to 1n when the system is started up. This is because the servers 1a to 1n do not transmit information about the connection destination to the PC server 1i, and thus cannot establish a correspondence. FIG. 9A illustrates a transition state of the connection state by directly indicating the external input / output device connection state. In order to control the alternative operation, the server management devices 2a to 2a
n records the external input / output device connection status in the configuration information.

【0074】図9(b)では、PCサーバ1jが障害を
起こして停止し、待機中のPCサーバ1iがPCサーバ
1jが接続していた外部入出力装置5dに接続し、代替
運転を開始した状況を示している。図9(c)では、P
Cサーバ1jの復旧時にPCサーバ1jの信頼性が向上
したと仮定し、外部入出力装置接続状態はそのままでサ
ーバ接続順位のみが変更された状況を示している。ま
た、図9(d)では、PCサーバ1i再立ち上げ時にサ
ーバ接続順位の見直しによって、再び、PCサーバ1j
が外部入出力装置5aと接続して業務処理を開始した様
子を示している。
In FIG. 9B, the PC server 1j has failed and stopped, and the standby PC server 1i has connected to the external input / output device 5d to which the PC server 1j has been connected, and has started alternative operation. Indicates the situation. In FIG. 9C, P
Assuming that the reliability of the PC server 1j is improved when the C server 1j is restored, only the server connection order is changed without changing the external input / output device connection state. Also, in FIG. 9D, when the PC server 1i is restarted, the server connection order is reviewed, so that the PC server 1j is again activated.
Shows a state in which a business process is started by connecting to the external input / output device 5a.

【0075】図10は、障害を起こしたPCサーバ1j
を管理するサーバ管理装置2jが障害発生を他のサーバ
管理装置2a〜2nへ通報した際の、サーバ管理装置2
a〜2nの動作を示したフローチャートである。以下、
このフローチャートに基づき待機中のPCサーバ1iが
代替運転を開始する動作について説明する。
FIG. 10 shows the failed PC server 1j.
Management device 2j when the server management device 2j that manages the server notifies the other server management devices 2a to 2n that a failure has occurred.
It is a flowchart which showed operation | movement of a-2n. Less than,
The operation in which the standby PC server 1i starts the alternative operation will be described based on this flowchart.

【0076】業務処理開始後、PCサーバ1jに障害が
発生し動作不能になると、PCサーバ1jを管理してい
るサーバ管理装置2jは、外部入出力装置5aとの接続
を切断した上で、他の全てのサーバ管理装置2a〜2n
に障害発生を通信路3を介して通報する。障害発生の通
報を受信した各サーバ管理装置2a〜2nは、PCサー
バ1jの障害情報に稼動状況として停止を記録すると共
に、接続先を外部入出力装置5aから無しに変更する
(ステップ301)。
When the PC server 1j fails and becomes inoperable after the business process starts, the server management device 2j managing the PC server 1j disconnects the connection with the external input / output device 5a, Server management devices 2a to 2n
Is notified via the communication path 3 to the occurrence of a failure. Each of the server management devices 2a to 2n that has received the notification of the occurrence of the failure records the stop as the operating status in the failure information of the PC server 1j and changes the connection destination to none from the external input / output device 5a (step 301).

【0077】各サーバ管理装置2a〜2nは、PCサー
バ1jの障害情報と構成情報を変更した後、障害情報の
稼動状況から待機PCサーバの有無を調べる(ステップ
302)。待機PCサーバがない場合は、サーバ管理装
置2j以外は処理を終了する。サーバ管理装置2jのみ
は、代替運転ができないことから、保守員による復旧作
業が必要なため、PCサーバ1j停止の警報を出す(ス
テップ303)。
After changing the failure information and the configuration information of the PC server 1j, each of the server management devices 2a to 2n checks whether or not there is a standby PC server from the operating status of the failure information (step 302). If there is no standby PC server, the process ends except for the server management device 2j. Since only the server management device 2j cannot perform the alternative operation, the maintenance work is required by the maintenance staff, and thus an alarm is issued to stop the PC server 1j (step 303).

【0078】待機PCサーバが存在する場合、各サーバ
管理装置2a〜2nは、待機PCサーバの中から最もサ
ーバ接続順位の高いPCサーバ1iを代替PCサーバに
決定する(ステップ304)。この結果、サーバ管理装
置2a〜2nは、PCサーバ1iの稼動状況を稼動に変
更すると共に、外部入出力装置接続状況を外部入出力装
置5aとする。
If there is a standby PC server, each of the server management apparatuses 2a to 2n determines the PC server 1i having the highest server connection order among the standby PC servers as the substitute PC server (step 304). As a result, the server management devices 2a to 2n change the operating status of the PC server 1i to active and set the external input / output device connection status to the external input / output device 5a.

【0079】サーバ管理装置2a〜2nは、自己が代替
運転を開始するPCサーバ1iを管理するサーバ管理装
置2iであった場合には、外部入出力装置5aとの接続
を行い(ステップ305,306)、システム立上げを
行って代替運転を開始する(ステップ307)。それ以
外のサーバ管理装置2a〜2nは、障害情報と構成情報
の更新のみで処理を終了する。これによって、全てのサ
ーバ管理装置2a〜2nは、同一の構成情報と障害情報
を共有する。
If the server management devices 2a to 2n are the server management devices 2i that manage the PC server 1i that starts the alternative operation, the server management devices 2a to 2n connect to the external input / output device 5a (steps 305 and 306). ), The system is started, and the alternative operation is started (step 307). The other server management devices 2a to 2n end the processing only by updating the failure information and the configuration information. Thus, all the server management devices 2a to 2n share the same configuration information and fault information.

【0080】なお、障害を起こしたPCサーバ1jは、
外部入出力装置5a〜5mとの接続を全て切断した状態
であるため、他のPCサーバ1a〜1nによる業務処理
を続けたままで、電源の切断、故障箇所の復旧及び診断
等を単独で実行することができる。PCサーバ1jは、
復旧後、待機状態に留めることによって代替PCサーバ
として利用することができる。また、待機PCサーバが
1台だけ存在した場合は、その待機PCサーバが無条件
に代替運転を行うことになるが、この場合も上記処理手
順に従うことで当該待機PCサーバが常に代替PCサー
バとして決定されることになる。
Note that the failed PC server 1j
Since all the connections with the external input / output devices 5a to 5m are disconnected, the power supply is cut off, the fault location is recovered, and the diagnosis is performed independently while the business processes by the other PC servers 1a to 1n are continued. be able to. The PC server 1j
After the recovery, it can be used as an alternative PC server by keeping it in a standby state. When only one standby PC server exists, the standby PC server will perform the alternative operation unconditionally. In this case, too, the standby PC server is always set as the alternative PC server by following the above procedure. Will be determined.

【0081】PCサーバ1iによる代替運転は、PCサ
ーバ1j復旧後におけるシステム全体の再立上げによっ
て解除されるが、システム全体が稼働中であっても、業
務処理の都合でPCサーバ1iによる代替運転を停止す
ることができる場合には、その時点で引継先のPCサー
バ1iから再度その業務処理を引き継ぎ、PCサーバ1
jで再開させることもできる。この場合には、PCサー
バ1iとPCサーバ1jを一旦共に待機状態にし、再
度、サーバ接続順位を元に戻すことでPCサーバ1jが
代替PCサーバとして決定されるようにする。この結
果、PCサーバ1jを本来の業務処理に復帰させること
ができる。
The alternative operation by the PC server 1i is canceled by restarting the entire system after the PC server 1j is restored. However, even if the entire system is in operation, the alternative operation by the PC server 1i for the convenience of business processing is performed. Can be stopped, the business process is taken over again from the takeover destination PC server 1i at that time, and the PC server 1
It can be restarted with j. In this case, both the PC server 1i and the PC server 1j are temporarily put into a standby state, and the server connection order is restored again so that the PC server 1j is determined as the substitute PC server. As a result, the PC server 1j can be returned to the original business process.

【0082】次に、PCサーバ1jの復旧時の動作を、
図6、図7、図9及び図11を用いて説明する。図11
は、PCサーバ1jが復旧する際のPCサーバ1j以外
のPCサーバ1a〜1nの動作を示したフローチャート
である。他のPCサーバ1a〜1nには、業務処理中の
PCサーバと待機中のPCサーバを含む。
Next, the operation at the time of restoration of the PC server 1j will be described.
This will be described with reference to FIGS. 6, 7, 9 and 11. FIG.
Is a flowchart showing the operation of the PC servers 1a to 1n other than the PC server 1j when the PC server 1j recovers. The other PC servers 1a to 1n include a PC server that is performing a business operation and a standby PC server.

【0083】PCサーバ1jは、保守員による復旧作業
の後、電源投入され図6に示した手順に従って初期化処
理を実行する。ここで、システム全体の電源投入時と異
なる点は、既に他のPCサーバ1a〜1nが業務処理を
実行中であるため、他のサーバ管理装置2a〜2nから
の初期化処理完了報告がそのままでは受信できないこと
と、サーバ接続順位決定後、サーバ接続順位と装置接続
順位に従って外部入出力装置5a〜5mを勝手に接続で
きない点である。
After the recovery work by the maintenance staff, the PC server 1j is powered on and executes the initialization processing according to the procedure shown in FIG. Here, the difference from the power-on state of the entire system is that since the other PC servers 1a to 1n are already executing business processes, the initialization processing completion reports from the other server management devices 2a to 2n are not changed. This is that the external input / output devices 5a to 5m cannot be connected without permission according to the server connection order and the device connection order after the server connection order is determined.

【0084】図6において、サーバ管理装置2jは、電
源投入によるPCサーバ1jの初期化処理完了を確認
し、ステップ190で初期化処理完了を通報して、他の
サーバ管理装置2a〜2nからの初期化完了報告を待
つ。これに対応するため、業務処理中のPCサーバ1a
〜1nの各サーバ管理装置2a〜2nは、サーバ管理装
置2jからの初期化処理完了通報を受信すると、図11
に示した処理を行うことによって、サーバ管理装置2j
が他のサーバ管理装置2a〜2nと構成情報及び障害情
報を共有できるようにすると共に、PCサーバ1jが外
部入出力装置5a〜5mとの接続処理を行えるようにす
る。
In FIG. 6, the server management device 2j confirms the completion of the initialization process of the PC server 1j by turning on the power, reports the completion of the initialization process in step 190, and sends the information from the other server management devices 2a to 2n. Wait for the initialization completion report. In order to cope with this, the PC server 1a during the business process
When the server management devices 2a to 2n receive the initialization processing completion notification from the server management device 2j,
The server management device 2j
Can share the configuration information and the failure information with the other server management devices 2a to 2n, and allow the PC server 1j to perform the connection processing with the external input / output devices 5a to 5m.

【0085】すなわち、各サーバ管理装置2a〜2n
は、復旧したPCサーバ1jのサーバ管理装置2jから
初期化完了報告を受信すると(ステップ311)、自P
Cサーバ1a〜1nの構成情報、障害情報及び外部入出
力装置接続状態を初期化処理完了通報としてサーバ管理
装置2jへ発信する(ステップ312)。この障害情報
には縮退情報と稼動状況とが含まれている。
That is, each of the server management devices 2a to 2n
When receiving the initialization completion report from the server management device 2j of the restored PC server 1j (step 311), the P
The configuration information, the failure information, and the external input / output device connection status of the C servers 1a to 1n are transmitted to the server management device 2j as an initialization processing completion notification (step 312). The failure information includes degeneration information and operation status.

【0086】図7において、これらの情報を受信したP
Cサーバ1jのサーバ管理装置2jは、対応するPCサ
ーバ1a〜1nの構成情報、障害情報と外部入出力装置
接続状態をサーバ管理情報として記録する(ステップ1
96)。その後、サーバ管理装置2jは、通報待ち時間
を終了した時点で、図6の外部入出力装置5a〜5mの
接続先決定処理(ステップ210)へ進む。
Referring to FIG. 7, the P
The server management device 2j of the C server 1j records the configuration information, failure information, and external input / output device connection status of the corresponding PC server 1a to 1n as server management information (step 1).
96). Thereafter, the server management device 2j proceeds to the connection destination determination processing (step 210) of the external input / output devices 5a to 5m in FIG.

【0087】図6におけるステップ210の外部入出力
装置5a〜5mの接続先決定処理において、サーバ管理
装置2jは、サーバ接続順位と装置接続順位の対応付け
に際し、他のサーバ管理装置2a〜2nから受信した外
部入出力装置接続状態を優先することによって、業務処
理中のPCサーバ1a〜1nが接続している外部入出力
装置5a〜5mへの接続を避ける。すなわち、サーバ管
理装置2jは、現在メモリ9で保持している外部入出力
装置接続状態を受信した外部入出力装置接続状態で上書
き更新を行う。
In the process of determining the connection destination of the external input / output devices 5a to 5m in step 210 in FIG. 6, the server management device 2j transmits the server connection order to the device connection order from the other server management devices 2a to 2n. By prioritizing the received external input / output device connection status, connection to the external input / output devices 5a to 5m to which the PC servers 1a to 1n that are performing business operations are connected is avoided. That is, the server management device 2j updates the external input / output device connection status currently held in the memory 9 with the received external input / output device connection status.

【0088】一方、図11において、業務処理中のPC
サーバ1a〜1nの各サーバ管理装置2a〜2nは、サ
ーバ管理装置2jから受信した構成情報と障害情報に基
づいてサーバ管理情報を更新し(ステップ313)、そ
の更新結果に基づいてサーバ接続順位を見直す。(ステ
ップ314)。但し、これらのPCサーバ1a〜1nは
業務処理中であるため、サーバ管理装置2a〜2nはそ
のまま処理を終了する(ステップ315)。待機中のP
Cサーバ1kについても、外部入出力装置5a〜5mに
空きが無いことから、待機状態のままとする(ステップ
316)。
On the other hand, in FIG.
Each of the server management devices 2a to 2n of the servers 1a to 1n updates the server management information based on the configuration information and the failure information received from the server management device 2j (step 313), and determines the server connection order based on the update result. Review. (Step 314). However, since these PC servers 1a to 1n are performing business operations, the server management devices 2a to 2n end the processing as they are (step 315). Waiting P
As for the C server 1k, since there is no space in the external input / output devices 5a to 5m, it remains in the standby state (step 316).

【0089】PCサーバ1j故障時を示した図9(b)
では、PCサーバ1iが、PCサーバ1jの代替運転を
行っている様子を示しているが、PCサーバ1jの復旧
時を示した図9(c)では、サーバ接続順位を見直した
結果、信頼性が向上してPCサーバ1jが第4順位から
第3順位になっため、システム構成を再構築する必要が
あることを示している。但し、この時点では、業務処理
が継続中であるため、サーバ接続順位にかかわらず現状
の外部入出力装置接続状態のままとしている。
FIG. 9B showing the time when the PC server 1j fails.
FIG. 9C shows that the PC server 1i is performing an alternative operation of the PC server 1j. In FIG. 9C showing when the PC server 1j is restored, the server connection order is reviewed. Indicates that the PC server 1j is changed from the fourth rank to the third rank, so that the system configuration needs to be reconfigured. However, at this point, since the business process is ongoing, the current external input / output device connection state is maintained regardless of the server connection order.

【0090】PCサーバ1iの再立上げをすることで、
PCサーバ1jを業務処理に復旧させる手順を図6、図
9及び図11を用いて説明する。この処理は、PCサー
バ1iによる業務処理が一旦停止できる状態になること
が前提である。
By restarting the PC server 1i,
The procedure for restoring the PC server 1j to business processing will be described with reference to FIGS. 6, 9, and 11. This process is based on the premise that the business process by the PC server 1i can be temporarily stopped.

【0091】PCサーバ1iは、業務処理停止後、図6
の手順に従って、再度、初期化処理を実行する。処理手
順は、PCサーバ1jの復旧時の手順と同様で、PCサ
ーバ1iのサーバ管理装置2iの初期化処理完了通報
(ステップ190)により、他のサーバ管理装置2a〜
2nから構成情報、障害情報及び外部入出力装置接続状
況が発信され(ステップ311,312)、サーバ管理
装置2iは、外部入出力装置接続先決定の処理(ステッ
プ200)を開始する。この場合、PCサーバ1iの状
態は変更されていないため、サーバ接続順位には変化は
なく、ステップ200及びステップ314でのサーバ接
続順位見直しの結果は、図9のPCサーバ1j復旧時の
状態と同じとなる。但し、PCサーバ1iのサーバ接続
順位は待機中のPCサーバ1jより低いため、外部入出
力装置5aとの接続はできず、PCサーバ1iは待機状
態となる。同時に、全てのサーバ管理装置2a〜2n
は、PCサーバ1iの外部入出力装置接続状況を外部入
出力装置5aからなしに変更する。
After the business processing is stopped, the PC server 1i
The initialization process is executed again according to the procedure described in (1). The processing procedure is the same as the procedure at the time of restoration of the PC server 1j. The server management apparatus 2i of the PC server 1i receives the initialization processing completion notification (step 190), and the other server management apparatuses 2a to 2a.
2n transmits the configuration information, the failure information, and the external input / output device connection status (steps 311 and 312), and the server management device 2i starts the external input / output device connection destination determination process (step 200). In this case, since the state of the PC server 1i has not been changed, there is no change in the server connection order, and the result of the server connection order review in step 200 and step 314 is the same as the state when the PC server 1j in FIG. Will be the same. However, since the server connection order of the PC server 1i is lower than that of the standby PC server 1j, connection with the external input / output device 5a cannot be performed, and the PC server 1i enters a standby state. At the same time, all server management devices 2a to 2n
Changes the external input / output device connection status of the PC server 1i to none from the external input / output device 5a.

【0092】この時、待機中のサーバ管理装置2jも、
サーバ管理装置2iからの初期化処理完了通報を受信
し、図11の手順に従って応答処理を行う。サーバ管理
装置2jは、ステップ314でのサーバ接続順位見直し
の結果、外部入出力装置5aを接続先に決定する。サー
バ管理装置2jは、ステップ315で待機中であること
からステップ316に進み、ステップ314で決定した
外部入出力装置接続状態から、外部入出力装置5aの接
続先が接続可能であると判断し、ステップ317へ進
む。その結果、PCサーバ1jは外部入出力装置5aと
接続し、システム立上げを開始する(ステップ31
8)。
At this time, the standby server management device 2j also
Upon receiving the initialization processing completion notification from the server management device 2i, the server performs response processing according to the procedure shown in FIG. The server management device 2j determines the external input / output device 5a as a connection destination as a result of the review of the server connection order in step 314. The server management device 2j proceeds to step 316 because it is waiting in step 315, and determines from the external input / output device connection state determined in step 314 that the connection destination of the external input / output device 5a is connectable, Proceed to step 317. As a result, the PC server 1j connects to the external input / output device 5a and starts system startup (step 31).
8).

【0093】以上、本実施の形態においては、PCサー
バ1iの初期化処理によって、PCサーバ1jの業務処
理復帰を行っているが、PCサーバ1iでの業務処理停
止を全サーバ管理装置2a〜2nに通報することによっ
て、待機中のPCサーバ1jを外部入出力装置5aに接
続して業務処理を開始させることによっても、同様の効
果が得られる。
As described above, in the present embodiment, the business processing of the PC server 1j is restored by the initialization processing of the PC server 1i. However, the business processing of the PC server 1i is stopped by all the server management apparatuses 2a to 2n. The same effect can be obtained by connecting the standby PC server 1j to the external input / output device 5a to start the business process.

【0094】なお、本実施の形態では、動作不能となっ
たPCサーバの代替運転並びに復旧後における復帰処理
について説明したが、動作不能とまではいかないもの
の、例えばプロセッサの縮退等による処理能力の低下に
伴い他のPCサーバで代替運転をさせたい場合に代替運
転の通報を発信したりする場合にも適用することができ
る。
In the present embodiment, the alternative operation of the PC server that has become inoperable and the return processing after restoration have been described. However, although it is not impossible to operate the PC server, the processing capacity is reduced due to, for example, degeneration of the processor. Accordingly, the present invention can also be applied to a case where a notification of an alternative operation is transmitted when it is desired to perform an alternative operation on another PC server.

【0095】また、本実施の形態においては、各サーバ
管理装置2a〜2nに構成情報及び障害情報に基づいて
最適な外部入出力装置5a〜5mを1台のみ選択させる
ようにしたが、複数台選択させるようにしてもよいし、
例えば最適なものから2番目の外部入出力装置5a〜5
mを1台のみ選択させるようにするなどしてもよい。
In the present embodiment, each server management device 2a-2n is made to select only one optimal external input / output device 5a-5m based on the configuration information and the failure information. You can make it select,
For example, the second best external input / output device 5a-5
Alternatively, only one m may be selected.

【0096】実施の形態2.上記実施の形態1では、原
則として処理能力が高く、かつ信頼性の高いPCサーバ
から順に接続するようにし、残ったサーバ接続順位が低
いPCサーバを待機させ、あるPCサーバが故障したら
待機中のサーバの中から信頼性の高いサーバで代替運転
をさせるようにした。ただ、このように処理能力の低い
PCサーバを待機させて処理能力の高いPCサーバの代
替運転をさせるようにしていると、その代替PCサーバ
がネックになり、システム全体の処理能力が低下してし
まうおそれが生じる。
Embodiment 2 In the first embodiment, in principle, PC servers with higher processing capacity and higher reliability are connected in order, and the remaining PC servers with lower connection order are put on standby. Alternate operation is performed on a highly reliable server from among the servers. However, if a PC server with a low processing capacity is made to stand by and an alternative operation of a PC server with a high processing capacity is performed, the alternative PC server becomes a bottleneck and the processing capacity of the entire system decreases. May occur.

【0097】そこで、本実施の形態では、システム立上
げ時から相対的に高い処理能力と信頼性を有した特定の
PCサーバを代替サーバとして待機させることによって
システム全体の処理能力の低下を防止するようにした。
本実施の形態では、これをPCサーバの構成情報に各サ
ーバの立上げ時に代替サーバとして待機させるための運
転制御情報を追加することによって実現している。以
下、図12に示した構成情報と障害情報の例を用いて本
実施の形態における動作について説明する。
Therefore, in the present embodiment, a specific PC server having relatively high processing capability and reliability is set as a substitute server from the start of the system to prevent a reduction in the processing capability of the entire system. I did it.
In the present embodiment, this is realized by adding operation control information for making the PC server stand by as a substitute server when each server is started up, to the configuration information of the PC server. Hereinafter, the operation in the present embodiment will be described using the example of the configuration information and the failure information shown in FIG.

【0098】図12(a)では、サーバ管理装置2a〜
2nが保持する構成情報と障害情報のうちサーバグルー
プ、実効性能点数、信頼度点数、サーバ接続順位、稼動
状況、外部入出力接続状態を示すと共に、新たに運転制
御を示した。実施の形態1においては、同一サーバグル
ープ単位でサーバ接続順位を決定していたが、ここで
は、同一サーバグループ内であっても、運転制御が待機
と指定されたPCサーバ1c,1eとそれ以外の運転制
御が運転と指定されたPCサーバ1a,1b,1nとで
別々に接続順位を決定している。外部入出力装置5a〜
5mとの接続先は、まず、運転制御が運転と指定された
PCサーバ1a,1b,1nのサーバ接続順位と装置接
続順位の比較を行い、サーバ接続順位が高い順にPCサ
ーバ1n,1a,1bをそれぞれ外部入出力装置5a,
5b,5cに接続する。この結果、サーバグループIM
の全ての外部入出力装置5a,5b,5cが運転制御が
運転と指定されたPCサーバ1n,1a,1bのいずれ
かに接続され、運転制御が待機と指定されたPCサーバ
1c,1eの接続先がなくなり、実効性能点数及び信頼
度点数が最も高いPCサーバ1cが第1位のサーバ接続
順位で待機することになる。このように、処理能力及び
信頼性の高いPCサーバであっても待機指示が設定され
たものは、代替PCサーバとなる。
In FIG. 12A, the server management apparatuses 2a to 2a
2n shows the server group, the effective performance score, the reliability score, the server connection order, the operation status, the external input / output connection status among the configuration information and the fault information held by 2n, and additionally shows the operation control. In the first embodiment, the server connection order is determined in the same server group unit. However, here, even in the same server group, the PC servers 1c and 1e for which the operation control is designated as standby and the other PC servers 1c and 1e. The operation control of the PC servers 1a, 1b, and 1n designated as driving separately determines the connection order. External input / output device 5a-
The connection destination with the PC 5m is first compared with the server connection order and the device connection order of the PC servers 1a, 1b, 1n for which the operation control is designated as operation, and the PC servers 1n, 1a, 1b are ordered in descending order of the server connection order. To the external input / output devices 5a,
5b, 5c. As a result, the server group IM
Are connected to any of the PC servers 1n, 1a, 1b whose operation control is designated as operation, and the connection of the PC servers 1c, 1e whose operation control is designated as standby. The PC server 1c having the highest effective performance score and the highest reliability score stands by in the first server connection order. As described above, even a PC server with a high processing capability and high reliability, for which a standby instruction is set, is a substitute PC server.

【0099】ここまでの段階で、PCサーバ1a,1
b,1nのいずれかが障害を起こして停止した場合に
は、外部入出力装置5a〜5cの接続先決定時に、装置
接続順位の最も低い外部入出力装置5cの接続先が未接
続のままとなる。この結果、待機と指定されているPC
サーバ1c,1eのうち、第1順位のPCサーバ1c
が、外部入出力装置5cに接続し、業務処理を開始す
る。
At this stage, the PC servers 1a, 1
If any one of the external input / output devices 5a to 5c is stopped due to a failure, the external input / output device 5c having the lowest device connection order remains unconnected at the time of connection destination determination. Become. As a result, the PC designated as standby
Among the servers 1c and 1e, the first-ranked PC server 1c
Is connected to the external input / output device 5c and starts business processing.

【0100】また、外部入出力装置5a〜5cの接続先
決定後業務処理中に、例えばPCサーバ1nが障害によ
って停止した場合には、図12(b)に示したように、
同一サーバグループで接続順位が第1位のPCサーバ1
cを代替PCサーバに選び、PCサーバ1nが接続して
いた外部入出力装置5aをPCサーバ1cに接続し直し
て、業務処理を継続する。PCサーバ1cは、実効性能
点数と信頼度点数共にPCサーバ1nより高得点である
ことから、代替運転に際して、業務処理全体としての処
理能力及び信頼性は低下しない。すなわち、より処理能
力等の高いPCサーバ1cの運転制御情報に予め待機指
示を設定しておくことによって当該PCサーバ1cをシ
ステム立上げ時に待機させるようにしたので、相対的に
処理能力等の低いPCサーバ1nに代わってPCサーバ
1cが業務処理を実行したとしても処理能力等は低下し
ない。
Further, if the PC server 1n is stopped due to a failure during the business process after the connection destination of the external input / output devices 5a to 5c is determined, as shown in FIG.
PC server 1 with the highest connection order in the same server group
c is selected as the alternative PC server, the external input / output device 5a connected to the PC server 1n is reconnected to the PC server 1c, and business processing is continued. Since the PC server 1c has higher scores in both the effective performance score and the reliability score than the PC server 1n, the processing performance and reliability of the entire business process do not decrease during the alternative operation. That is, by setting a standby instruction in advance in the operation control information of the PC server 1c having a higher processing capability or the like, the PC server 1c is caused to wait when the system is started up. Even if the PC server 1c executes the business process in place of the PC server 1n, the processing capacity and the like do not decrease.

【0101】PCサーバ1nを復旧させた時点では、図
12(c)に示したように、PCサーバ1cが代替運転
中であり、PCサーバ1nに割り当てるべき外部入出力
装置5a〜5mが存在しないことから、PCサーバ1n
は待機状態となる。
When the PC server 1n is restored, as shown in FIG. 12C, the PC server 1c is in the alternative operation, and there are no external input / output devices 5a to 5m to be assigned to the PC server 1n. Therefore, the PC server 1n
Is in a standby state.

【0102】そして、PCサーバ1cでの業務処理を一
旦停止させ、PCサーバ1cを再度初期化処理して立ち
上げなおすことにより、図12(d)に示したように、
PCサーバ1nを業務処理に復帰させると共に、PCサ
ーバ1cを再び待機状態とする。これは、PCサーバ1
cの初期化処理によって、外部入出力装置5aをPCサ
ーバ1cから切り離すと共に、外部入出力装置5aの接
続先決定を初期化処理が完了したPCサーバ1cと待機
中のPCサーバ1e,1nとの間で運転制御情報を見直
すことにより、運転制御情報に運転が指定してあるPC
サーバ1nを外部入出力装置5aの接続先に決定するこ
とで行われる。
Then, the business process in the PC server 1c is temporarily stopped, and the PC server 1c is initialized and restarted, as shown in FIG.
The PC server 1n is returned to the business process, and the PC server 1c is again put in the standby state. This is PC server 1
c, the external input / output device 5a is disconnected from the PC server 1c, and the connection destination of the external input / output device 5a is determined between the PC server 1c, which has completed the initialization process, and the standby PC servers 1e, 1n. Review the operation control information between the PCs, so that the PCs whose operation is specified in the operation control information
This is performed by determining the server 1n as a connection destination of the external input / output device 5a.

【0103】なお、運転制御を待機と指定したPCサー
バ1cと1eのサーバ接続順位を、運転制御を運転と指
定したPCサーバ1a,1b,1nのサーバ接続順位の
次の順位から続けるようにしても同様の効果を得られ
る。図13にこのサーバ接続順位の設定内容例を示し
た。図13に示した例には、運転制御に運転と指定され
ているPCサーバ1a,1b,1nについてサーバ接続
順位を決定し、次に、運転制御に待機と指定されている
PCサーバ1c,1eについて、サーバ接続順位4から
順位を割り当てた結果が示されている。システム立上げ
時には、このサーバ接続順位に基づいて外部入出力装置
5a〜5cをPCサーバ1n,1a,1bの順に接続す
ることで、PCサーバ1c,1eには接続先がなくな
り、自動的に待機状態となる。
Note that the server connection order of the PC servers 1c and 1e whose operation control is designated as standby is continued from the next order of the server connection order of the PC servers 1a, 1b and 1n whose operation control is designated as operation. Can obtain the same effect. FIG. 13 shows an example of the setting contents of the server connection order. In the example shown in FIG. 13, the server connection order is determined for the PC servers 1a, 1b, and 1n designated as operation in the operation control, and then the PC servers 1c and 1e designated as standby in the operation control. 2 shows the result of assigning the order from the server connection order 4. When the system is started, the external input / output devices 5a to 5c are connected in the order of the PC servers 1n, 1a, and 1b based on the server connection order, so that the PC servers 1c and 1e have no connection destination and are automatically on standby. State.

【0104】ここまでの段階で、PCサーバ1a,1
b,1nのいずれかが障害を起こして停止した場合に
は、外部入出力装置5a〜5cの接続先決定時に、装置
接続順位の最も低い外部入出力装置5cの接続先が未接
続のままとなる。この結果、第4順位のPCサーバ1c
が、外部入出力装置5cに接続し、業務処理を開始す
る。
At this stage, the PC servers 1a, 1
If any one of the external input / output devices 5a to 5c is stopped due to a failure, the external input / output device 5c having the lowest device connection order remains unconnected at the time of connection destination determination. Become. As a result, the fourth-ranked PC server 1c
Is connected to the external input / output device 5c and starts business processing.

【0105】サーバ接続順位が連続的に決定されている
ことから、PCサーバ1a,1b,1nのいずれかが稼
働中に障害を発生して停止した場合の代替運転の手順や
障害からの回復手順については、実施の形態1と同一の
手順となる。例えば、PCサーバ1nが障害によって停
止した場合には、第4順位のPCサーバ1cが待機状態
であることから代替PCサーバとなって業務処理を継続
する。
Since the server connection order is determined continuously, an alternative operation procedure and a recovery procedure from a failure when one of the PC servers 1a, 1b, and 1n is stopped due to a failure during operation. Is the same procedure as in the first embodiment. For example, when the PC server 1n is stopped due to a failure, the fourth-ranked PC server 1c is in a standby state, so that the PC server 1n becomes an alternative PC server and continues business operations.

【0106】本実施の形態によれば、より高い処理能力
と信頼性を有した特定のPCサーバを代替サーバとして
待機させることによってシステム全体の処理能力の低下
を防止することができる。
According to the present embodiment, a specific PC server having higher processing capability and reliability is made to stand by as a substitute server, thereby preventing a reduction in the processing capability of the entire system.

【0107】ところで、上記各実施の形態では、待機P
Cサーバのうちサーバ接続順位の高いPCサーバを代替
PCサーバとして決定しているが、複数台の待機PCサ
ーバの中から代替PCサーバを決定する方法としては、
その他にも様々な方法が考えられる。
Incidentally, in each of the above embodiments, the standby P
Among the C servers, a PC server having a higher server connection order is determined as an alternative PC server. As a method of determining an alternative PC server from a plurality of standby PC servers,
Various other methods are also conceivable.

【0108】例えば、動作不能となりその旨の通報を発
信したPCサーバの処理能力及び信頼性に最も近似して
いる待機PCサーバを代替PCサーバとして決定し、業
務処理を引き継がせるようにしてもよい。これにより、
代替運転前後におけるシステム全体の処理能力をほぼ同
じとすることができる。
For example, the standby PC server that has become inoperable and has the closest processing capability and reliability to the PC server that has transmitted the notification to that effect may be determined as the substitute PC server, and the business process may be taken over. . This allows
The processing capacity of the entire system before and after the alternative operation can be made substantially the same.

【0109】また、プロセッサの縮退等による処理能力
の低下に伴い他のPCサーバで代替運転をさせたい場
合、あるいは動作不能となったPCサーバがプロセッサ
の縮退運転をしていた場合、その通報時点におけるPC
サーバの処理能力及び信頼性に最も近似している待機P
Cサーバを代替PCサーバとして決定し、業務処理を引
き継がせるようにする。これは、結果的に上記と同じこ
とになるため、代替運転前後におけるシステム全体の処
理能力をほぼ同じとすることができる。あるいは、通報
時点ではなくPCサーバが本来有している処理能力及び
信頼性に最も近似している待機PCサーバを代替PCサ
ーバとして決定するようにしてもよい。
If another PC server wants to perform an alternative operation due to a decrease in processing capacity due to processor degeneration or the like, or if an inoperable PC server is performing a processor degeneration operation, the notification time is PC in
Standby P closest to server performance and reliability
The C server is determined as an alternative PC server so that business processing can be taken over. This results in the same as above, so that the processing capacity of the entire system before and after the alternative operation can be made substantially the same. Alternatively, the standby PC server that is closest to the processing capability and reliability originally possessed by the PC server may be determined as the substitute PC server, not at the time of notification.

【0110】実施の形態2では、運転制御情報を設定し
ているので上記各決定方法を容易に採用することができ
るが、実施の形態1では、接続順位の高い順に接続し、
また運転制御情報を用いていないのでシステム立上げ時
点では結局のところ処理能力等の低いPCサーバが代替
されることになる。しかし、長い間システムがダウンせ
ずに運用し続けPCサーバの代替運転が数多く行われた
場合は、処理能力等の高いPCサーバが待機PCサーバ
になっている可能性もあるため上記各決定方法を採用す
ることは効果的となる。
In the second embodiment, since the operation control information is set, each of the above-described determination methods can be easily adopted. In the first embodiment, the connection is performed in the descending order of the connection order.
Further, since the operation control information is not used, a PC server having a low processing capacity or the like is eventually substituted at the time of starting the system. However, when the system continues to operate without being down for a long time and a number of alternative operations of the PC server are performed, it is possible that a PC server having a high processing capacity or the like may be a standby PC server, and thus each of the above-described determination methods is performed. Adopting is effective.

【0111】[0111]

【発明の効果】本発明によれば、各処理装置及び外部入
出力装置の構成情報を各処理装置において共有し、これ
らの情報に基づいて各処理装置に接続する外部入出力装
置を決定するようにしたので、各処理装置の処理能力及
び信頼性に応じた適切な外部入出力装置を各処理装置に
接続することができ、各処理装置の処理能力に応じた適
切な業務処理を割り付けることができる。また、接続先
を決定する際、各処理装置のプロセッサ縮退等の障害情
報をも考慮するようにしたので、構成の縮退による処理
能力及び信頼性の低下についても適切に対処することが
できる。すなわち、処理装置及びOSに関する処理能力
と信頼性に関する最新の情報に基づいてシステム構成が
決定されることから、障害発生による処理装置の一部停
止や機能縮退、処理装置のグレードアップによる処理能
力や信頼性の向上及び処理装置の増設に対応してシステ
ム全体の処理能力と信頼性のバランスを常に最適な状態
に保った経済的で信頼性の高い分散システムを構築する
ことができる。
According to the present invention, the configuration information of each processing device and the external input / output device is shared by each processing device, and the external input / output device to be connected to each processing device is determined based on the information. Therefore, it is possible to connect an appropriate external input / output device to each processing device according to the processing capacity and reliability of each processing device, and to allocate an appropriate business process according to the processing capacity of each processing device. it can. Further, when determining the connection destination, failure information such as processor degeneration of each processing device is also taken into consideration, so that it is possible to appropriately cope with a reduction in processing capability and reliability due to the degeneration of the configuration. That is, since the system configuration is determined based on the latest information on the processing capability and the reliability of the processing device and the OS, the processing capability is partially stopped or the function is degraded due to the occurrence of a failure, and the processing capability or the function is upgraded by upgrading the processing device. It is possible to construct an economical and highly reliable distributed system in which the balance between the processing capacity and the reliability of the entire system is always kept in an optimum state in response to the improvement of the reliability and the addition of the processing device.

【0112】更に、本発明によれば、特殊なOS乃至そ
の拡張機能によらずに処理装置の障害発生時に残った処
理装置の中から最適な処理装置を選択して業務処理を行
うことができるため、オープンな製品による高性能で低
価格なシステム構築を容易に行うことができる。
Further, according to the present invention, it is possible to select the optimum processing device from the remaining processing devices when a failure occurs in the processing device without using a special OS or its extended function, and to perform business processing. Therefore, it is possible to easily construct a high-performance and low-cost system using open products.

【0113】また、各処理装置に分散配置された処理装
置管理装置の連携によって各処理装置が自律判断でシス
テム構成を決定できるため、分散システムの大規模化に
柔軟に対応し得るとともに、一部の処理装置や処理装置
管理装置の故障によっても最適なシステム構成で業務処
理を行うことのできる信頼性の高い分散システムを構築
することができる。
Further, since each processing device can determine the system configuration by autonomous judgment in cooperation with the processing device management devices distributed in each processing device, it is possible to flexibly cope with an increase in the scale of the distributed system, and it is also possible to partially handle the system configuration. It is possible to construct a highly reliable distributed system capable of performing business processing with an optimal system configuration even when a processing device or a processing device management device fails.

【0114】また、業務処理中の処理装置が動作不能に
なった場合でも、処理能力及び信頼性を考慮して待機中
の処理装置の中から最適な代替運転を行う処理装置を選
択し、業務処理を引き継がせるようにしているので、代
替運転後においてもシステム全体の処理能力等の低下を
極力防止することができる。
Even when a processing unit that is performing a business process becomes inoperable, a processing unit that performs an optimal alternative operation is selected from among the standby processing units in consideration of the processing capacity and reliability, and Since the processing can be taken over, it is possible to prevent a decrease in the processing capacity and the like of the entire system as much as possible even after the alternative operation.

【0115】また、動作不能になった処理装置の復旧
後、再度実行していた業務処理を行わせることができる
ので、システム立上げ時の好適な処理能力等を有するシ
ステム環境に戻すことができる。
Further, after the recovery of the inoperable processing device, the business process being executed again can be performed, so that it is possible to return to a system environment having a suitable processing capacity at the time of system startup. .

【0116】また、接続上の制約条件を設けて、その制
約条件を満たす外部入出力装置を接続候補とすることが
できるので、異機種の処理装置や外部入出力装置を混在
させたとしても適切な接続をすることができる。
Further, since external input / output devices satisfying the restriction conditions can be set as connection candidates by providing connection restriction conditions, even if heterogeneous processing devices and external input / output devices are mixed, it is appropriate. Connection can be made.

【0117】また、システム立上げ時において特定の処
理装置を待機用として設定することができるので、細か
なシステム構成の制御を行うことができる。特に、シス
テム立上げ時から相対的に高い処理能力と信頼性を有し
た特定の処理装置を代替用の処理装置として待機させて
おけば、代替運転後におけるシステム全体の処理能力の
低下を防止することができる。
Further, since a specific processing device can be set for standby at the time of starting the system, detailed control of the system configuration can be performed. In particular, if a specific processing unit having relatively high processing capacity and reliability is kept on standby as an alternative processing unit from the start of the system, a reduction in the processing capacity of the entire system after the alternative operation is prevented. be able to.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明に係る分散システムの実施の形態1を
示したブロック構成図である。
FIG. 1 is a block diagram showing Embodiment 1 of a distributed system according to the present invention.

【図2】 実施の形態1におけるPCサーバを示したブ
ロック構成図である。
FIG. 2 is a block diagram showing a PC server according to the first embodiment.

【図3】 実施の形態1における外部入出力装置を示し
たブロック構成図である。
FIG. 3 is a block diagram showing an external input / output device according to the first embodiment.

【図4】 実施の形態1におけるサーバ管理装置が管理
するPCサーバの構成情報と障害情報の内容例を示した
図である。
FIG. 4 is a diagram showing an example of configuration information and failure information of a PC server managed by a server management apparatus according to the first embodiment.

【図5】 実施の形態1におけるサーバ管理装置が管理
する外部入出力装置の構成情報の内容例を示した図であ
る。
FIG. 5 is a diagram illustrating an example of configuration information of an external input / output device managed by a server management device according to the first embodiment;

【図6】 実施の形態1におけるシステムの立上げ手順
を示したフローチャートである。
FIG. 6 is a flowchart showing a procedure for starting up the system according to the first embodiment.

【図7】 実施の形態1における初期化処理完了の通報
と他のサーバ管理装置が管理するサーバ管理情報の入手
手順を示したフローチャートである。
FIG. 7 is a flowchart showing a procedure for notifying completion of initialization processing and obtaining server management information managed by another server management apparatus in the first embodiment.

【図8】 実施の形態1におけるPCサーバと外部入出
力装置の接続先を決定する手順を示したフローチャート
である。
FIG. 8 is a flowchart showing a procedure for determining a connection destination between the PC server and the external input / output device according to the first embodiment.

【図9】 実施の形態1におけるPCサーバの状態と外
部入出力装置の接続状態の変化を示した図である。
FIG. 9 is a diagram showing a change in the state of the PC server and the connection state of the external input / output device according to the first embodiment.

【図10】 実施の形態1におけるPCサーバ障害発生
時における処理を示したフローチャートである。
FIG. 10 is a flowchart showing processing when a PC server failure occurs in the first embodiment.

【図11】 実施の形態1におけるPCサーバ復旧時に
おける処理を示したフローチャートである。
FIG. 11 is a flowchart showing a process when the PC server is restored in the first embodiment.

【図12】 実施の形態2におけるPCサーバの状態と
外部入出力装置の接続状態の変化を示した図である。
FIG. 12 is a diagram illustrating a change in a state of a PC server and a connection state of an external input / output device according to the second embodiment.

【図13】 実施の形態2におけるPCサーバの状態と
外部入出力装置の接続状態の変化を示した図である。
FIG. 13 is a diagram illustrating a change in a state of a PC server and a connection state of an external input / output device according to the second embodiment.

【図14】 従来例の分散システムを示したブロック構
成図である。
FIG. 14 is a block diagram showing a conventional distributed system.

【符号の説明】[Explanation of symbols]

1a〜1n PCサーバ、2a〜2n サーバ管理装
置、3 通信路、4 外部入出力切り換え機構、5a〜
5m 外部入出力装置、6a〜6m オペレーティング
システム(OS)、7,7a,7b Local Ar
ea Network(LAN)、8a〜8n プロセ
ッサ、9 メモリ、10 バスブリッジ、11 外部入
出力装置接続装置、12 ROM、13,15,17,
19,21制御装置、14 キーボード、16 マウ
ス、18 ディスプレイ、20 フロッピィディスク装
置(FDD)、22 HDD、23 入出力バス、24
プロセッサバス、25 不揮発性メモリ、26a〜2
6n ディスク制御装置、27a〜27n,28a〜2
8n ディスク装置、29a〜29n 回線制御装置、
30 サーバ接続装置。
1a-1n PC server, 2a-2n server management device, 3 communication path, 4 external input / output switching mechanism, 5a-
5m External input / output device, 6a-6m Operating system (OS), 7, 7a, 7b Local Ar
ea Network (LAN), 8a to 8n processors, 9 memories, 10 bus bridges, 11 external input / output device connection devices, 12 ROM, 13, 15, 17,
19, 21 control device, 14 keyboard, 16 mouse, 18 display, 20 floppy disk device (FDD), 22 HDD, 23 input / output bus, 24
Processor bus, 25 non-volatile memory, 26a-2
6n disk controller 27a-27n, 28a-2
8n disk device, 29a-29n line controller,
30 Server connection device.

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 複数の処理装置と、 オペレーティングシステム及び業務アプリケーションを
それぞれ格納した複数の外部入出力装置と、 前記処理装置と前記外部入出力装置とを接続する外部入
出力切換え手段と、 を有し、前記処理装置によって前記外部入出力切替え手
段を介して前記外部入出力装置のオペレーティングシス
テムを起動させることにより所定の業務処理を実行する
分散システムにおいて、 前記処理装置それぞれに搭載され、かつ前記処理装置の
運転管理を行う複数の処理装置管理装置と、 複数の前記処理装置管理装置間の通信を行う通信路と、 前記処理装置内に設けられ、かつ前記処理装置管理装置
からの指示に従い前記処理装置と前記外部入出力装置と
の接続・切離しを行う装置切換手段と、 を有し、 前記各処理装置管理装置は、前記通信路を介して前記各
処理装置の構成情報及び障害情報を授受することによっ
て共有し、その共有した構成情報及び障害情報に基づい
て前記外部入出力装置の接続先を自律判断して決定し、 前記装置切換手段は、前記処理装置管理装置が決定した
前記外部入出力装置の接続先に基づいて前記処理装置と
前記外部入出力装置との接続・切離しを行うことを特徴
とする分散システム。
A plurality of processing devices; a plurality of external input / output devices each storing an operating system and a business application; and external input / output switching means for connecting the processing device and the external input / output device. A distributed system that executes a predetermined business process by activating an operating system of the external input / output device via the external input / output switching unit by the processing device; A plurality of processing device management devices for performing operation management of the device; a communication path for performing communication between the plurality of processing device management devices; and a communication channel provided in the processing device and according to an instruction from the processing device management device. Device switching means for connecting / disconnecting a device to / from the external input / output device; The devices share the configuration information and the failure information of the respective processing devices by exchanging them via the communication path, and autonomously determine the connection destination of the external input / output device based on the shared configuration information and the failure information. The device switching means performs connection / disconnection between the processing device and the external input / output device based on the connection destination of the external input / output device determined by the processing device management device. Distributed system.
【請求項2】 前記各処理装置管理装置は、共有した構
成情報及び障害情報に基づいて処理能力及び信頼性上最
適な前記外部入出力装置の接続先を決定することを特徴
とする請求項1記載の分散システム。
2. The apparatus according to claim 1, wherein each of the processing device management devices determines an optimal connection destination of the external input / output device in terms of processing capacity and reliability based on the shared configuration information and fault information. A distributed system as described.
【請求項3】 前記各処理装置管理装置は、前記処理装
置の立上げ時に共有した構成情報及び障害情報を参照し
て初期化処理を行うことによって前記処理装置の構成情
報及び障害情報を自動生成すると共に、その自動生成し
た構成情報及び障害情報を他の前記処理装置管理装置に
通報することを特徴とする請求項1記載の分散システ
ム。
3. The processing apparatus management apparatus automatically generates configuration information and failure information of the processing apparatus by performing initialization processing with reference to configuration information and failure information shared when the processing apparatus is started up. 2. The distributed system according to claim 1, wherein the automatically generated configuration information and fault information are reported to another processing device management device.
【請求項4】 前記外部入出力装置の構成情報には、当
該外部入出力装置に記憶されている業務アプリケーショ
ンが実行される上で必要な前記処理装置の処理能力及び
信頼性を表す指標が含まれていることを特徴とする請求
項1記載の分散システム。
4. The configuration information of the external input / output device includes an index indicating processing capability and reliability of the processing device necessary for executing a business application stored in the external input / output device. The distributed system according to claim 1, wherein:
【請求項5】 前記処理装置の構成情報には、前記各処
理装置の接続先に関する情報が含まれていることを特徴
とする請求項1記載の分散システム。
5. The distributed system according to claim 1, wherein the configuration information of the processing device includes information on a connection destination of each of the processing devices.
【請求項6】 前記各処理装置管理装置は、共有した構
成情報及び障害情報に基づいて前記各処理装置の実効的
な処理能力を表す実効性能点数及び前記各処理装置の信
頼性を表す信頼度点数を算出し、その算出した実効性能
点数、信頼度点数及び前記外部入出力装置の構成情報に
基づいて前記処理装置の接続先となる前記外部入出力装
置を決定することを特徴とする請求項1記載の分散シス
テム。
6. The processing device management device according to claim 1, wherein the processing device management device is configured to determine an effective performance score indicating an effective processing capability of the processing device based on the shared configuration information and the failure information, and a reliability indicating reliability of the processing device. The external input / output device to which the processing device is to be connected is determined based on the calculated effective performance score, reliability score, and configuration information of the external input / output device. 2. The distributed system according to 1.
【請求項7】 前記各処理装置管理装置は、実効性能点
数及び信頼度点数に基づいて前記全処理装置の接続順位
を決定し、また、前記外部入出力装置の構成情報に基づ
いて前記外部入出力装置の接続順位を決定し、前記処理
装置と同じ接続順位となった前記外部入出力装置を接続
先と決定することを特徴とする請求項6記載の分散シス
テム。
7. Each of the processing device management devices determines a connection order of all the processing devices based on an effective performance score and a reliability score, and determines the external input / output device based on configuration information of the external input / output device. 7. The distributed system according to claim 6, wherein a connection order of the output devices is determined, and the external input / output device having the same connection order as the processing device is determined as a connection destination.
【請求項8】 前記各処理装置管理装置は、他の前記処
理装置に搭載されている前記処理装置管理装置からの通
報に応じて保有している構成情報又は障害情報を更新す
ることを特徴とする請求項1又は3いずれかに記載の分
散システム。
8. The processing apparatus management apparatus according to claim 1, wherein said processing apparatus management apparatus updates configuration information or fault information stored therein in response to a report from said processing apparatus management apparatus mounted on another processing apparatus. The distributed system according to claim 1, wherein
【請求項9】 前記各処理装置管理装置は、前記各処理
装置と前記各外部入出力装置とを接続した結果、前記処
理装置がいずれの前記外部入出力装置にも接続されなか
ったときには代替処理装置として待機させ、業務処理を
実行していた他の前記処理装置から代替運転の通報を受
けた場合、その通報をした処理装置に代わって当該通報
をした処理装置と接続されていた前記外部入出力装置を
前記処理装置に接続し直して当該通報をした処理装置が
実行していた業務処理を引き継がせることを特徴とする
請求項8記載の分散システム。
9. The processing device management apparatus according to claim 1, wherein the processing device is connected to each of the external input / output devices, and as a result, when the processing device is not connected to any of the external input / output devices, When receiving a notification of the alternative operation from another processing device that has been in standby as a device and performing business processing, the external input device connected to the processing device that has sent the notification has been replaced with the processing device that has sent the notification. 9. The distributed system according to claim 8, wherein an output device is reconnected to the processing device so as to take over a business process executed by the processing device that has sent the notification.
【請求項10】 前記各処理装置管理装置は、前記代替
処理装置が複数存在する場合は、当該通報をした処理装
置の通報時点における処理能力及び信頼性に最も近似し
ている代替処理装置に業務処理を引き継がせることを特
徴とする請求項9記載の分散システム。
10. When there are a plurality of alternative processing devices, each of the processing device management devices assigns a service to the alternative processing device having the closest processing capability and reliability at the time of the notification of the processing device that sent the notification. The distributed system according to claim 9, wherein the processing is succeeded.
【請求項11】 前記各処理装置管理装置は、前記代替
処理装置が複数存在する場合は、当該通報をした処理装
置が本来有している処理能力及び信頼性に最も近似して
いる前記代替処理装置に業務処理を引き継がせることを
特徴とする請求項9記載の分散システム。
11. When there are a plurality of alternative processing devices, each of the processing device management devices may be configured to execute the alternative processing that is most similar to the processing capability and reliability inherent in the processing device that sent the notification. 10. The distributed system according to claim 9, wherein the apparatus is made to take over business processing.
【請求項12】 前記各処理装置管理装置は、前記各処
理装置と前記各外部入出力装置とを接続した結果、前記
処理装置がいずれの前記外部入出力装置にも接続されな
かったときには代替処理装置として待機させ、複数の前
記代替処理装置が存在する場合は最も接続順位の高い前
記代替処理装置が業務処理中の他の前記処理装置に代わ
って業務処理を引き継ぐことを特徴とする請求項8記載
の分散システム。
12. The processing device management apparatus according to claim 1, wherein, when the processing device is not connected to any of the external input / output devices as a result of connecting the processing device and the external input / output devices, 9. The apparatus according to claim 8, wherein when a plurality of said alternative processing apparatuses are present, said alternative processing apparatus having the highest connection order takes over the business processing in place of said other processing apparatus during business processing. A distributed system as described.
【請求項13】 業務処理を引き継がせた前記処理装置
に搭載の前記処理装置管理装置は、その管理対象処理装
置の復旧後に引継先の前記処理装置から再度その業務処
理を引き継ぎ再開させることを特徴とする請求項9乃至
12のいずれかに記載の分散システム。
13. The processing device management apparatus mounted on the processing device that has taken over the business process, after the management target processing device is restored, resumes the business process from the takeover destination processing device again. The distributed system according to any one of claims 9 to 12, wherein
【請求項14】 前記各処理装置管理装置は、前記処理
装置及び前記外部入出力装置の構成情報の双方に含まれ
ている前記各処理装置と前記外部入出力装置との接続上
の制約条件に従い、その制約条件を満たす前記処理装置
群及び前記外部入出力装置群単位に前記処理装置の接続
先となる前記外部入出力装置を自律判断して決定するこ
とを特徴とする請求項1記載の分散システム。
14. The processing device management apparatus according to claim 1, further comprising: a connection condition between the processing device and the external input / output device included in the configuration information of the processing device and the external input / output device. 2. The distribution according to claim 1, wherein the external input / output device to be connected to the processing device is determined autonomously for each of the processing device group and the external input / output device group satisfying the constraint condition. system.
【請求項15】 前記処理装置の構成情報には、前記各
処理装置の立上げ時に代替処理装置として待機させるた
めの運転制御情報が含まれており、 前記各処理装置管理装置は、前記処理装置の運転制御情
報に待機指示が設定されている場合は、処理能力及び信
頼性の高低にかかわらず前記処理装置を立上げ時に代替
処理装置として待機させることを特徴とする請求項1記
載の分散システム。
15. The processing device configuration information includes operation control information for causing each processing device to stand by as an alternative processing device when starting up each of the processing devices. 2. The distributed system according to claim 1, wherein when a standby instruction is set in the operation control information, the processing apparatus is made to stand by as an alternative processing apparatus when the processing apparatus is started up regardless of the level of processing capacity and reliability. .
【請求項16】 処理能力及び信頼性の高い前記処理装
置の運転制御情報に待機指示を予め設定することを特徴
とする請求項15記載の分散システム。
16. The distributed system according to claim 15, wherein a standby instruction is set in advance in the operation control information of the processing device having high processing capability and high reliability.
JP9289368A 1997-10-22 1997-10-22 Distributed system Pending JPH11126195A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9289368A JPH11126195A (en) 1997-10-22 1997-10-22 Distributed system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9289368A JPH11126195A (en) 1997-10-22 1997-10-22 Distributed system

Publications (1)

Publication Number Publication Date
JPH11126195A true JPH11126195A (en) 1999-05-11

Family

ID=17742310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9289368A Pending JPH11126195A (en) 1997-10-22 1997-10-22 Distributed system

Country Status (1)

Country Link
JP (1) JPH11126195A (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265013A (en) * 2006-03-28 2007-10-11 Fujitsu Ltd Cluster control program, cluster control method and cluster controller
JP2007272846A (en) * 2006-03-31 2007-10-18 Nec Corp Core cell change control method for information processing system and control program for it
WO2008041302A1 (en) * 2006-09-29 2008-04-10 Fujitsu Limited Server disposing program and server disposing method
WO2008044423A1 (en) * 2006-10-13 2008-04-17 Nec Corporation Information processor and its failure cover-up method
JP2009245455A (en) * 2009-07-27 2009-10-22 Hitachi Ltd Failover method through disk takeover
JP2011065672A (en) * 2010-11-19 2011-03-31 Hitachi Ltd Failover method by disk takeover
US8069368B2 (en) 2004-12-09 2011-11-29 Hitachi, Ltd. Failover method through disk takeover and computer system having failover function
WO2012117507A1 (en) * 2011-02-28 2012-09-07 株式会社日立製作所 Administration computer and computer system administration method
JP2012221037A (en) * 2011-04-05 2012-11-12 Toshiba Corp Assignment plan generation device and program
JP2014071668A (en) * 2012-09-28 2014-04-21 Fujitsu Ltd Information processor, start program, and start method
JP5733384B2 (en) * 2011-02-24 2015-06-10 富士通株式会社 Information processing device
CN106068501A (en) * 2014-03-07 2016-11-02 三菱电机株式会社 Computer installation and computer mechanism

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601314B2 (en) 2004-12-09 2013-12-03 Hitachi, Ltd. Failover method through disk take over and computer system having failover function
US8069368B2 (en) 2004-12-09 2011-11-29 Hitachi, Ltd. Failover method through disk takeover and computer system having failover function
US8312319B2 (en) 2004-12-09 2012-11-13 Hitachi, Ltd. Failover method through disk takeover and computer system having failover function
US8281007B2 (en) 2006-03-28 2012-10-02 Fujitsu Limited Cluster control apparatus, cluster control method, and computer product
JP2007265013A (en) * 2006-03-28 2007-10-11 Fujitsu Ltd Cluster control program, cluster control method and cluster controller
JP2007272846A (en) * 2006-03-31 2007-10-18 Nec Corp Core cell change control method for information processing system and control program for it
WO2008041302A1 (en) * 2006-09-29 2008-04-10 Fujitsu Limited Server disposing program and server disposing method
US8661130B2 (en) 2006-09-29 2014-02-25 Fujitsu Limited Program, method, and apparatus for dynamically allocating servers to target system
JPWO2008041302A1 (en) * 2006-09-29 2010-01-28 富士通株式会社 Server deployment program and server deployment method
JP4992905B2 (en) * 2006-09-29 2012-08-08 富士通株式会社 Server deployment program and server deployment method
JP5277961B2 (en) * 2006-10-13 2013-08-28 日本電気株式会社 Information processing apparatus and failure concealing method thereof
US8108719B2 (en) 2006-10-13 2012-01-31 Nec Corporation Information processing device and failure concealing method therefor
WO2008044423A1 (en) * 2006-10-13 2008-04-17 Nec Corporation Information processor and its failure cover-up method
JP2009245455A (en) * 2009-07-27 2009-10-22 Hitachi Ltd Failover method through disk takeover
JP2011065672A (en) * 2010-11-19 2011-03-31 Hitachi Ltd Failover method by disk takeover
JP5733384B2 (en) * 2011-02-24 2015-06-10 富士通株式会社 Information processing device
WO2012117507A1 (en) * 2011-02-28 2012-09-07 株式会社日立製作所 Administration computer and computer system administration method
US8447850B2 (en) 2011-02-28 2013-05-21 Hitachi, Ltd. Management computer and computer system management method
JP5417553B2 (en) * 2011-02-28 2014-02-19 株式会社日立製作所 Management computer and computer system management method
JP2012221037A (en) * 2011-04-05 2012-11-12 Toshiba Corp Assignment plan generation device and program
JP2014071668A (en) * 2012-09-28 2014-04-21 Fujitsu Ltd Information processor, start program, and start method
CN106068501A (en) * 2014-03-07 2016-11-02 三菱电机株式会社 Computer installation and computer mechanism

Similar Documents

Publication Publication Date Title
CN100430914C (en) Storing system having vitual source
CN101776983B (en) The synchronous method of information of double controllers in disk array and disc array system
JP4462024B2 (en) Failover method by disk takeover
JP4497953B2 (en) Information processing system and information processing method
CN110874261B (en) Availability system, method, and storage medium storing program
US8683025B2 (en) Method for managing storage system
JP3937230B2 (en) Process data collection device
JPH11126195A (en) Distributed system
US20030069953A1 (en) Modular server architecture with high-availability management capability
CN106020854A (en) Applying firmware updates in a system with zero downtime
JP2018500648A (en) Smooth controller change in redundant configuration between clusters
JP2003114811A (en) Method and system for automatic failure recovery and apparatus and program therefor
JP2009265805A (en) Failover method, program, failover device and failover system
US8612973B2 (en) Method and system for handling interrupts within computer system during hardware resource migration
JP4653965B2 (en) I / O interface module management method
JP2510696B2 (en) Computer system automatic operation control method
JP2002366398A (en) Cluster constitution storage system
WO2001057685A1 (en) Server determining method and device
JP5282569B2 (en) Management device, management system, management method, and management program
US20050197718A1 (en) High reliability system, redundant construction control method, and program
JP2012014674A (en) Failure recovery method, server, and program in virtual environment
JPH08185330A (en) Method for switching redundant computer system
JP2001027951A (en) File loading device for information processing system of multiprocessor configuration and recording medium
JP6149205B2 (en) Data storage device
US20060224751A1 (en) Storage system, a host adapter, a data storage, a method of controlling a node device, a method of controlling a host adapter, a signal-bearing medium embodying a program causing a host adapter to perform a method of controlling a storage system, and a signal-bearing medium embodying a program causing a digital processing apparatus to perform a method of controlling a host adapter