JPH0926940A - 分散システム構築方式 - Google Patents

分散システム構築方式

Info

Publication number
JPH0926940A
JPH0926940A JP17485095A JP17485095A JPH0926940A JP H0926940 A JPH0926940 A JP H0926940A JP 17485095 A JP17485095 A JP 17485095A JP 17485095 A JP17485095 A JP 17485095A JP H0926940 A JPH0926940 A JP H0926940A
Authority
JP
Japan
Prior art keywords
definition information
system definition
activation
information
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17485095A
Other languages
English (en)
Inventor
Isao Imai
功 今井
Tetsuo Nakakawaji
哲男 中川路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP17485095A priority Critical patent/JPH0926940A/ja
Publication of JPH0926940A publication Critical patent/JPH0926940A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 ネットワーク上に接続された複数のコンピュ
ータ・システム間で実行する分散システムにおいて、シ
ステム生成や障害回復を一貫性を持って行なう方式を提
供する。 【解決手段】 複数のシステム間に於いて定義情報の整
合性の検査を行なう手段107と、複数システムに分散
されたプロセスの起動を一括して行なう起動コマンド列
を生成する手段902と、起動コマンド列に基づいて遠
隔のシステムに対しプロセス起動を指示する手段903
と、各システムのプロセスの動作確認を行なう手段と、
遠隔のシステム上の障害後のプロセス稼働状況を検査す
る手段と、残存プロセスの停止とプロセスの再起動を行
なう回復コマンド列を生成する手段と、コマンド列に基
づいてプロセスの停止と再起動を指示する手段によって
構成される分散システム生成/構成確認方式。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は複数のコンピュータ・
システムからなる分散処理システムの生成、構成、およ
び確認方式に関するものである。
【0002】
【従来の技術】本発明に関する従来方式としては、例え
ば「特開昭62−245468」、「特開平5−204
613」のようなトランザクション処理システムのシス
テム生成変更方式が提案されている。
【0003】図25は、「特開昭62−245468」
の方式を示すもので、端末装置より発行されるトランザ
クション定義および端末定義の追加、変更、削除命令、
そしてテーブルファイルの生成と処理命令を制御するタ
イムシェアリング・システムと、トランザクションを実
行するリアルタイムオンラインプログラムと、端末より
定義したトランザクション定義ファイルおよび端末定義
ファイルからリアルタイムオンラインプログラムが使用
するトランザクション定義テーブルファイルと端末定義
テーブルファイルを生成するテーブルファイル生成処理
手段から成る。この方式によると、端末装置よりトラン
ザクション定義および端末定義の追加、変更、削除等の
操作が行われた場合、テーブルファイル生成処理によっ
てリアルタイムオンラインプログラムのトランザクショ
ン定義テーブルと端末定義テーブルが生成される。リア
ルタイムオンラインプログラムは、新たなトランザクシ
ョンの起動を停止し、稼働中の全てのトランザクション
の実行終了に応答して、前記トランザクション定義テー
ブルと端末定義テーブルを入力し変更を行なう。そして
トランザクションを再開することによって、オンライン
業務を停止することなく、システム生成を行なってい
た。
【0004】また図26は、「特開平5−20461
3」の方式を示すもので、アプリケーションプログラム
を起動するトランザクション処理装置と、システム定義
情報を記憶するカレントシステム定義情報テーブルおよ
び更新後システム定義情報テーブルと、システム定義情
報をトランザクション処理装置に送るシステム定義情報
取込手段と、システム定義情報取り込み手段がシステム
定義情報を選択する手段となるフラグと、要求に応じて
システム定義情報を更新するシステム定義情報更新手段
とを有する。この方式によると、トランザクション処理
装置よりシステム定義情報要求が発生した場合、システ
ム定義情報取込手段によってシステム定義情報がトラン
ザクション処理装置に送られる。システム定義情報取込
手段は、フラグを参照し、オンの場合はカレントシステ
ム定義情報テーブルより、オフの場合は更新後システム
定義情報テーブルよりシステム定義情報を取り込む。シ
ステム定義情報はシステム定義情報更新手段によって更
新され、更新後システム定義情報テーブルに格納されフ
ラグをオフにする。上記の手段によって、システムを停
止することなくトランザクション処理装置は、システム
定義情報を変更することができる。
【0005】しかし、従来の方式は、いずれも単一の処
理システムを対象にしたシステムの生成および変更方式
である。一方、アプリケーションプログラムおよびデー
タベースがネットワークで接続された複数のコンピュー
タ・システム間に存在する分散システムでは、システム
間の生成情報が整合していなければならず、例えばプロ
セス間の起動時に順序関係が存在する、といった条件が
あり、「特開昭62−245468」、「特開平5−2
04613」のような従来方式では対応することができ
ない。
【0006】
【発明が解決しようとする課題】従来のシステム生成方
式は、上記のようにして処理を行っていたので、アプリ
ケーションプログラムやデータベースが複数のコンピュ
ータシステムに分散して配置される分散処理システムに
おいては、システム全体を通して定義情報の整合性を維
持することが難しいという問題点があった。
【0007】また、アプリケーションプログラムやデー
タベースが複数のコンピュータシステムに分散して配置
される分散処理システムにおいては、複数のプロセス間
における起動順序を管理する手段がなかったため、正確
にシステムを起動することができないといった問題点が
あった。
【0008】また、アプリケーションプログラムやデー
タベースが複数のコンピュータシステムに分散して配置
される分散処理システムにおいては、起動後のシステム
状態を確認する手段がないため、システム定義情報の生
成、或は変更に伴って起動された分散処理システムを検
証することができないという問題点があった。
【0009】また、アプリケーションプログラムやデー
タベースが複数のコンピュータシステムに分散して配置
される分散処理システムにおいては、障害発生時にシス
テムの残存プロセスの状況に応じてプロセスの停止およ
び回復処理を行なうための手順を管理する手段がないた
め、障害状況に応じたシステムの回復処理を行なうこと
ができないといった問題点があった。
【0010】本発明は、上記のような問題点を解消する
ためになされたもので、分散処理システムを構成する複
数のコンピュータ間において整合性のあるシステム定義
情報を提供することを目的とする。また、プロセスの起
動順序に応じて分散処理システムを正確に起動可能と
し、またプロセスの稼動状況を把握検証する手段を提供
することを目的とする。加えて、システム障害の発生状
況に応じて残存プロセスを停止し、更に再起動すること
で分散システムを正しい順序で回復できるようにするこ
とを目的とする。
【0011】
【課題を解決するための手段】第1の発明に係わる分散
システム構築方式は、複数のコンピュータ・システム
と、上記コンピュータ・システムを管理するシステム管
理装置がネットワーク上に接続されて構成される分散処
理システムにおいて、システム管理装置に分散処理シス
テムの生成情報であるシステム定義情報を格納するシス
テム定義情報記憶手段と、システム定義情報を整合性規
則に基づいて検査するシステム定義情報整合性検査手段
と、システム定義情報をネットワーク上に接続されたコ
ンピュータ・システムに配布するシステム定義情報配布
手段を備え、コンピュータシステムにシステム定義情報
配布手段から送出されるシステム定義情報を受信するシ
ステム定義情報取り込み手段を備えるようにしたもので
ある。
【0012】第2の発明に係わる分散システム構築方式
は、複数のコンピュータ・システムと、上記コンピュー
タ・システムを管理するシステム管理装置がネットワー
ク上に接続されて構成される分散処理システムにおい
て、システム管理装置に分散処理システムの生成情報で
あるシステム定義情報を格納するシステム定義情報記憶
手段と、システム定義情報を整合性規則に基づいて検査
するシステム定義情報整合性検査手段と、システム定義
情報に基づいてネットワーク上のコンピュータシステム
に分散配置されたプロセスの起動を集中して行なうため
の起動コマンド列を生成する起動コマンド列生成手段
と、起動コマンド列に基づいてネットワーク上のコンピ
ュータシステムの各プロセスに対し起動指示を行なう遠
隔起動指示手段とを備え、コンピュータシステムに遠隔
起動指示手段からの起動命令に基づいて該コンピュータ
システム上のプロセスを起動するプロセス起動実行部を
備えるようにしたものである。
【0013】第3の発明は第2の発明における分散シス
テム構築方式において、システム管理装置に起動プロセ
ス検査手段を備え、該起動プロセス検査手段がシステム
定義情報と、プロセス起動実行部がプロセス起動時に作
成した起動プロセス情報に基づいて各コンピュータシス
テム上のプロセスの動作状況確認を行なうようにしたも
のである。
【0014】第4の発明は第2の発明における分散シス
テム構築方式において、コンピュータシステム上のプロ
セス起動実行部が該コンピュータシステム上のプロセス
の起動、停止及び再起動制御を行ない、上記システム管
理装置は、コンピュータシステム上の障害発生後におけ
るプロセス稼動状況を検査する残存プロセス検査手段を
備え、起動コマンド列生成手段はコンピュータシステム
を回復させるためのコマンド列を生成する再起動コマン
ド列を生成し、遠隔起動指示手段は再起動コマンド列に
基づいてネットワーク上のコンピュータシステムに対し
てプロセスの起動指示を行なうようにしたものである。
【0015】
【作用】この発明による分散システム構築方式は、シス
テム定義情報定義手段とシステム定義情報整合性検査部
とシステム定義情報配布部とシステム定義情報取込手段
とを備えることにより、システム定義情報定義手段で定
義されたシステム定義情報を、システム定義情報整合性
検査部において、予め規則化された整合性規則情報と照
合することによって、複数システム間で整合したシステ
ム定義情報を各システムに提供する。
【0016】またこの発明による分散システム構築方式
は、起動コマンド列生成部と遠隔起動指示部とプロセス
起動実行部とを備え、分散処理システムを起動する場合
に、起動コマンド列生成部により生成された起動コマン
ド列に基づいて、遠隔より一括してプロセス起動指示を
行なう。
【0017】またこの発明による分散システム構築方式
は、起動プロセス検査部を備えることにより、分散処理
システムが起動コマンド列に従って遠隔起動指示部から
起動された場合、システム定義情報で予め定義された通
りに正確にシステムが起動されているかを検証する。
【0018】またこの発明による分散システム構築方式
は、残存プロセス検査部と再起動コマンド列生成部と遠
隔再起動指示部とプロセス再起動実行部とを備え、残存
プロセス検査部によってシステム障害が検知された場合
には、再起動コマンド列生成部により生成された回復コ
マンド列スクリプトに基づいて、遠隔のシステムに対し
て停止、及び再起動指示を行なうことにより、システム
の回復処理手順を誤ることなく正確に行なう。
【0019】
【実施例】
実施例1.本発明の第1の実施例を図1乃至図7につい
て説明する。図1は、本実施例におけるシステムの主要
構成を示したものである。図2は、システムの主要構成
部を成すシステム管理装置における処理動作を示す流れ
図である。図3は、システム定義情報の整合性を検査す
るために使用する整合性規則情報を示した図である。図
4,5は、処理システムの生成情報として用いるシステ
ム定義情報を示した図である。図6は、定義情報検査部
によって検出されたエラー情報を示した図である。図7
は、エラー情報に基づいて修正を行ったシステム定義情
報を示した図である。
【0020】図1において、100は処理システムA,
Bによって構成される分散処理システム、101a,1
01bは処理システム、102a,102bは処理シス
テム内において処理を実行する処理実行部、103a,
103bはシステム定義情報配布部よりシステム定義情
報を取り込むシステム定義情報取込手段である。また、
104は分散処理システム100におけるシステム定義
情報の作成、解析、配布を行なう機能から構成されるシ
ステム管理装置であり、105は処理実行部102a,
102bに対するシステム定義情報を作成するシステム
定義情報定義手段、106はシステム定義情報定義手段
105において作成したシステム定義情報を格納するシ
ステム定義情報テーブル、107はトランザクション処
理システム101a,101bのシステム定義情報の整
合性を検査するシステム定義情報整合性検査部、108
は処理システム101a、101bに対してシステム定
義情報を配布するシステム定義情報配布部、109は伝
送路である。
【0021】本実施例におけるシステム管理装置内の内
部動作を図2を用いて説明する。システム定義情報は、
システム定義情報定義手段105において作成され(ス
テップ201)、システム定義情報テーブル106に登
録される(ステップ202)。システム定義情報を定義
した後、システム定義情報整合性検査部107におい
て、システム定義情報の整合性を検査する(ステップ2
03〜ステップ206)。上記処理の結果、エラーが検
出された場合(ステップ207)は、システム定義情報
定義手段105を呼び出し、エラー情報に従ってシステ
ム定義情報の修正を行い(ステップ208)、エラーが
検出されなかった場合は、システム定義情報配布部10
8によってシステム定義情報を送信する(ステップ20
9)。
【0022】送信されたシステム定義情報は、システム
定義情報取込手段103a〜103bによって処理シス
テム102a,102b内に読み込まれ、システムの初
期化時やプロセスの起動時に使用される。
【0023】次に、本実施例におけるシステム定義情報
整合性検査部107の内部動作を、図3乃至図7を用い
て説明する。システム定義情報整合性検査部107は、
複数システムの定義情報間の整合性規則を定義した整合
性規則情報300を有している。図3は、整合性規則情
報を示した例であり、分散処理システムの構成条件につ
いての設定項目302とそれに対する規則内容303か
ら構成される。
【0024】図4,5は、システム定義情報の実現例で
あり、図4は処理システムA 101aに、また図5は
処理システムB 101bに各々対応するシステム定義
情報400,500を示している。システム定義情報4
00,500は、各々の処理システム上で起動されるプ
ロセス402,502に対して、起動されるプロセス数
情報403,503と、起動時に必要とする引数情報4
04,504、そして起動先システム名405,505
によって構成される。システム定義情報整合性検査部1
07は、整合性規則情報300において、各プロセス対
応に定義された設定項目302で決められた規則内容3
03を整合性条件として検査を行なう。整合性検査方法
は、ある設定項目302に対応するプロセス名402,
502のレコードを各システム定義情報400,500
の中から全て抽出し、起動プロセス数情報403,50
3と起動先の処理システム名405,505の定義内容
が、規則内容303で示されている整合性条件を満足す
るか否か確認する。これを、設定項目で定義されたプロ
セス毎に行なう。検査の結果、エラーが検出された場
合、システム定義情報定義手段105を呼び出し、シス
テム定義情報106の修正を行なう。図6は、整合性検
査の実施によって検出されたエラー情報600である。
本実施例では、処理システムBの定義情報として”時間
サーバ”が未定義である旨のエラーが検出されたことを
示している。図7は、このエラー情報に従って修正を行
った結果のシステム定義情報Bの内容である。
【0025】以上のように、本実施例によれば、システ
ム定義情報整合性検査部の整合性規則情報によってシス
テム定義情報間の整合性を検査するようにしたので、ネ
ットワーク上に唯一しか存在しないプロセスの重複とい
った不整合性の防止、あるいはシステム中に存在すべき
プロセスが未定義であるといった定義情報の不備を防止
することができる。また、システム定義情報配布部によ
って、整合されたシステム定義情報をネットワーク上の
各処理システムに配布提供することができる。
【0026】実施例2.本発明の第2の実施例を図8に
基づいて説明する。本実施例は、分散処理システムを1
つのシステム定義情報で管理するようにしたものであ
る。図8は、分散処理システムを1つの定義情報で管理
する全システム定義情報の実現例である。全システム定
義情報800は、既に実施例1で説明したシステム定義
情報400,500と同様に、分散処理システム上で起
動するプロセス802に対して、起動されるプロセス数
情報803、起動時に必要とする引数情報804につい
て定義する他に、プロセスが起動される先の処理システ
ム名805、および他のプロセスとの依存関係情報80
6によって構成される。システム定義情報整合性検査部
107は、先の実施例1と同様にして、整合性規則情報
300において設定項目毎に決められた規則内容を整合
性条件として検査を実施する。整合性検査方法は、ある
設定項目302に対応するプロセス名802のレコード
を全システム定義情報800の中から全て抽出し、起動
されるプロセス数情報803とプロセスが起動される先
のシステム名805の定義内容が、規則内容303で示
されている整合性条件を満足するか否かを確認する。検
査の結果、上記実施例1と同様にエラーが検出された場
合、システム定義情報定義手段105を呼び出し、シス
テム定義情報の修正を行なう。
【0027】以上のように、本実施例によれば、システ
ム定義情報整合性検査部の整合性規則情報によって全シ
ステム定義情報の整合性を検査するので、システム定義
情報が分散処理システムを通して一箇所にのみ存在して
いる場合においても、プロセス定義内容の不整合性、定
義情報の不備といった問題を防止することができる。
【0028】実施例3.本発明の第3の実施例を図8、
および図9乃至図13に基づいて説明する。図9は、本
実施例におけるシステムの主要構成を示した図である。
図10は、本実施例におけるシステム管理装置の処理動
作を示す流れ図である。図11は、分散処理システム内
におけるプロセスの起動順序を示したプロセス起動順序
リストである。図12は、起動コマンド列を作成する場
合に参照するプロセス起動コマンド・リストである。図
13は、プロセスの起動順序と起動コマンドを示したプ
ロセス起動コマンド列である。
【0029】図9において、901a,901bは処理
実行部102a,102bの起動を制御するプロセス起
動実行部、902は分散処理システムを遠隔から起動す
るためのプロセス起動コマンド列を生成する起動コマン
ド列生成部、903は起動コマンド列に従って各システ
ム101a,101bに対し、プロセス起動命令を発行
する遠隔起動指示部である。
【0030】次に、システム管理装置内の内部動作を図
10を用いて説明する。起動コマンド列生成部902
は、システム定義情報テーブル106より読み込んだシ
ステム定義情報から(ステップ1001)、プロセスの
起動順序を決定し(ステップ1002)、プロセスに対
応する起動コマンドの選択と起動時に必要な引数の設定
を行い(ステップ1003)、起動コマンド列を生成す
る(ステップ1004)。遠隔起動指示部903は、起
動コマンド列に従って処理システム101a,101b
に対し、プロセスの起動命令を発行する(ステップ10
05)。
【0031】プロセス起動実行部901は、遠隔起動指
示部903からの起動命令を受信し、自システム上にプ
ロセスを起動する。
【0032】次に、起動コマンド列生成部の内部動作
を、図8,および図11乃至図13を用いて説明する。
起動コマンド列生成部902は、システム定義情報テー
ブル106より読み込んだ全システム定義情報800中
のプロセス間依存関係情報806に基づいて、プロセス
の起動順序を決定し、プロセス起動順序リスト1100
(図11)を作成する。プロセス起動順序リスト110
0は、起動順序1101、プロセス名1102、起動先
システム名1103から構成される。本実施例では、処
理システムAにおいて時間サーバ、データベース1、セ
ル・マネージャ、ノード・マネージャ、業務サーバ1が
起動され、一方処理システムBにおいて名前サーバ、セ
キュリティサーバ、時間サーバ、データベース2、ノー
ド・マネージャ、業務サーバ2が起動される。次に、プ
ロセス起動コマンド・リスト1200を参照して、プロ
セス起動順序リスト1100に挙げられたプロセスに対
応する起動コマンドを選択し、実行時に必要なパラメー
タをシステム定義情報から抽出して起動コマンド列を生
成する。起動コマンド列は、起動順序1301、起動コ
マンド1302、起動先システム1304から構成され
る。図13はその実現例である。
【0033】以上のように、本実施例によれば、起動コ
マンド列生成部と遠隔起動指示部により、例えプロセス
間に依存関係が存在する場合であっても、起動順序に従
って遠隔から正確にプロセスを起動することができる。
【0034】実施例4.本発明の第4の実施例を、図1
4乃至図16に基づいて説明する。図14は、本実施例
によるシステムの主要構成を示した図である。図15
は、本実施例の処理動作を示す流れ図である。図16
は、処理システム上のプロセスの動作状況を示す図であ
る。
【0035】図14において、1401は各処理システ
ム上で稼働しているプロセスの動作状況を検査する起動
プロセス検査部である。
【0036】本実施例におけるシステム管理装置内の内
部動作について、図4と、図14乃至図16を用いて説
明する。遠隔起動指示部903によって処理システム
A,B 101a,101bにプロセスを起動した後、
起動プロセス検査部1401は、システム定義情報テー
ブル106よりシステム定義情報400(図4)を入力
する(ステップ1501)。続いて、プロセス起動実行
部901aから起動プロセス情報1600を入力し(ス
テップ1502)、前記システム定義情報400のプロ
セス数403で規定された数のプロセス402が、処理
システムA上101aで起動されているかを、前記起動
プロセス情報1600のプロセス名1601およびプロ
セス数情報1602によって確認する。分散処理システ
ムが複数の処理システムから構成されている場合には、
ステップ1501からステップ1503までの処理を処
理システム数分だけ繰り返す。
【0037】次に、プロセス起動実行部901および起
動プロセス検査部1401の内部動作を、図16を用い
て説明する。遠隔起動指示部903によってプロセスの
起動指示を受信したプロセス起動実行部901a,90
1bは、自システム上へプロセスを起動する。遠隔起動
指示部903からの全ての起動命令が実行されると、自
システム上で起動されたプロセスの動作状況を確認し起
動プロセス情報リスト1600を作成する。起動プロセ
ス情報リストは、プロセス名1601とプロセス数16
02から構成される。1600(図16)はシステムA
上における起動プロセス情報の実現例である。プロセス
起動実行部901a,901bより起動プロセス情報1
600を入力した起動プロセス検査部1401は、予め
入力したシステム定義情報400のプロセス名、プロセ
ス数情報、起動先システム名を基に、起動プロセス情報
1600と照合することによって各処理システム上のプ
ロセスの動作状況を確認し、各システム上において、シ
ステム定義情報に定義された通り、正しくプロセスが起
動されているか否かを確認する。
【0038】以上のように、この実施例によれば、複数
のシステム上で起動されたプロセスの動作状況を、遠隔
地から集中的に把握、確認することができる。
【0039】実施例5.本発明の第5の実施例について
図17乃至図24に基づいて説明する。図17は、本実
施例におけるシステムの主要構成を示した図である。図
18は、本実施例の処理動作を示す流れ図である。図1
9は、障害の発生したプロセス情報リストを示す図であ
る。図20は、残存プロセスの中でプロセスの停止順序
を示すプロセス停止順序リストである。図21は、プロ
セスの停止用コマンド・リストを示す図である。図22
は、プロセスの停止コマンドと停止順序を示したプロセ
ス停止コマンド列である。図23は、回復処理として再
起動するプロセスの再起動順序を示すプロセス再起動順
序リストである。図24は、プロセスの再起動コマンド
と再起動順序を示したプロセス再起動コマンド列であ
る。
【0040】図17において、1701a,bは、処理
実行部102a,bの停止および再起動を制御するプロ
セス再起動実行部、1704は、トランザクション処理
システムA,Bで稼働するプロセスの稼働状況を監視す
る残存プロセス検査部、1702は、分散処理システム
A,Bを遠隔から再起動するための再起動コマンド列を
生成する再起動コマンド列生成部、1703は、再起動
コマンド列によって処理実行部101a,bに対しプロ
セスの停止および再起動命令を発行する遠隔再起動指示
部である。
【0041】本実施例のシステム管理装置内の内部動作
を図18を用いて説明する。遠隔起動指示部903によ
って分散処理システム100が起動された後、残存プロ
セス検査部1704においてプロセスの稼働状況を検査
し(ステップ1801)、稼働プロセスに障害が発生し
た場合(ステップ1802)、再起動コマンド列生成部
1702は、残存プロセスの中から停止すべきプロセス
を決定し(ステップ1803)、プロセス停止コマンド
列を作成する(ステップ1804)。続いて、再起動プ
ロセスを決定し(ステップ1805)、プロセス再起動
コマンド列を作成する(ステップ1806)。遠隔再起
動指示部1703は、前記停止コマンド列と前記再起動
コマンド列による回復コマンド列に従い、プロセスの停
止および再起動命令を発行する(ステップ1807)。
【0042】プロセス再起動実行部1701a,170
1bは、遠隔再起動指示部1703からのプロセスの停
止および再起動命令に従い、自システム上へのプロセス
の停止および再起動を実行する。
【0043】次に、残存プロセス検査部1704の内部
動作を、図13,および図19を用いて説明する。残存
プロセス検査部1704は、分散処理システム上に障害
が発生した場合、各システムから現在稼働中のプロセス
状況を取得する。次に、起動コマンド列リスト1300
から各システム上へ起動したプロセスを調査する。調査
の結果と障害後の各システムのプロセス稼働状況と照合
することによって、停止したプロセスを確認し、プロセ
ス障害情報リストを作成する1900(図19)。プロ
セス障害情報リストは、システム名1901とプロセス
名1902から構成され、図19はその実現例である。
本実施例は、システムA上でノード・マネージャが障害
によって停止したことを示している。
【0044】次に、再起動コマンド列生成部1702の
内部動作を、図8,および図20乃至図24に基づいて
説明する。残存プロセス検査部1704からプロセス障
害情報リスト1900を受信した再起動コマンド列生成
部1702は、起動コマンド列リスト1300と全シス
テム定義情報リスト800とを照合し、停止したプロセ
スの後に起動されたプロセスの中で依存関係にあったプ
ロセスを検索し、プロセス停止順序リスト2000を作
成する。プロセス停止順序リストは、停止順序2001
と、プロセス名2002と、プロセスの停止先システム
名2003から構成され、図20はその実現例である。
本実施例では、ノード・マネージャと依存関係のあった
プロセスとして、業務サーバ1が検出されたことを示し
ている。次に、プロセス停止コマンド・リスト2100
を参照して、プロセス停止順序リスト2000のプロセ
ス名に対応する停止コマンドを選択し、実行時に必要な
パラメータをシステム定義情報から検索して停止コマン
ド列2200を生成する。停止コマンド列は、停止順序
2201、起動コマンド2202、プロセス名220
3、停止先システム名2204から構成され、図22は
その実現例である。
【0045】続いて、再起動コマンド列生成部1702
は、プロセス障害情報リスト1900とプロセス停止順
序リスト2000を基に、回復処理として再起動すべき
プロセスを検出し再起動順序を決定することにより、プ
ロセス再起動順序リスト2300を作成する。プロセス
再起動順序リストは、再起動順序2301、プロセス名
2302、再起動先システム名2303から構成され、
図23はその実現例である。本実施例では、ノードマネ
ージャに続いて業務サーバ1を再起動することを示して
いる。プロセス再起動順序リスト作成後、起動スクリプ
ト・リスト1300を参照し、プロセス再起動順序リス
トに示すプロセスと対応するレコードを抽出し、プロセ
ス再起動コマンド列リスト2400を作成する。プロセ
ス再起動コマンド列リストは、再起動順序2401、再
起動コマンド2402、プロセス名2403、再起動先
システム2404から構成され、図24はその実現例で
ある。再起動コマンド列生成部1702は、上記手続き
によって残存プロセスから停止すべきプロセスを洗い出
し、停止順序の決定、停止コマンド列の作成と、続いて
再起動プロセスの洗い出し、再起動順序の決定、再起動
コマンド列の作成を行なう。
【0046】この実施例によれば、再起動コマンド列生
成部と残存プロセス検査部によって、システムの障害時
に残存するプロセスに応じて正確な手順により回復コマ
ンド列を生成することができ、システムの回復処理を遠
隔より実施することができる。
【0047】
【発明の効果】以上のように、この発明によれば、シス
テム定義情報を整合性規則情報に従って検証した後、各
システムに提供するようにしたので、ネットワークシス
テム全体を通して整合性を維持することができるという
効果がある。
【0048】また、この発明によればプロセス起動ある
いは動作手順において、他のプロセスとの依存関係が存
在する場合においても、プロセスの依存関係を考慮して
正確なシーケンスで起動を行なうことできる。また、各
システム上のプロセスを起動するための起動コマンド列
をシステム定義情報をもとに一括して生成し、遠隔から
プロセス起動するようにしたのでシステム全体の起動を
正確に行なうことができるという効果がある。
【0049】またこの発明によれば、複数のシステム上
で各々起動されたプロセスの動作状況を遠隔地から集中
的に把握、確認することができるという効果がある。
【0050】またこの発明によれば、システムの障害発
生時に残存するプロセスの状態に応じて停止コマンド
列、および回復コマンド列を生成して再起動するように
したので、障害の発生状況に依存することなく正確な手
順でシステム回復を図ることができるという効果があ
る。
【図面の簡単な説明】
【図1】 この発明の第1の実施例におけるシステム構
成図である。
【図2】 この発明の第1の実施例における処理動作を
示すフローチャートである。
【図3】 この発明の第1の実施例における整合性規則
情報を示す図である。
【図4】 この発明の実施例におけるシステム定義情報
を示す図である。
【図5】 この発明の第1の実施例におけるシステム定
義情報を示す図である。
【図6】 この発明の第1の実施例において定義情報検
査部によって検出されたエラー情報リストを示す図であ
る。
【図7】 この発明の第1の実施例においてエラー情報
に基づいて修正を行なった結果のシステム定義情報を示
す図である。
【図8】 この発明の実施例における全システム定義情
報を示す図である。
【図9】 この発明の第3の実施例におけるシステム構
成図である。
【図10】 この発明の第3の実施例における処理動作
を示すフローチャートである。
【図11】 この発明の第3の実施例におけるプロセス
起動順序リストである。
【図12】 この発明の第3の実施例におけるプロセス
起動コマンド・リストである。
【図13】 この発明の第3の実施例におけるプロセス
起動コマンドと起動順序を示したコマンド列リストを示
す図である。
【図14】 この発明の第4の実施例におけるシステム
構成図である。
【図15】 この発明の第4の実施例における処理動作
を示すフローチャートである。
【図16】 この発明の第4の実施例における起動プロ
セス情報リストを示す図である。
【図17】 この発明の第5の実施例におけるシステム
構成図である。
【図18】 この発明の第5の実施例における処理動作
を示すフローチャートである。
【図19】 この発明の第5の実施例におけるプロセス
障害情報リストを示す図である。
【図20】 この発明の第5の実施例における残存プロ
セス中のプロセス停止順序リストを示す図である。
【図21】 この発明の第5の実施例におけるプロセス
停止コマンド・リストを示す図である。
【図22】 この発明の第5の実施例におけるプロセス
停止順序と停止コマンド列リストを示す図である。
【図23】 この発明の第5の実施例におけるプロセス
再起動順序リストを示す図である。
【図24】 この発明の第5の実施例におけるプロセス
再起動順序とコマンド列リストを示す図である。
【図25】 従来システムにおけるシステム生成、変更
方式を示す図である。
【図26】 従来システムにおけるシステム生成、変更
方式を示す図である。
【符号の説明】
100 分散処理システム、101 処理システム、1
02 処理実行部、103 システム定義情報取込手
段、104 システム管理装置、105 システム定義
情報定義手段、106 システム定義情報テーブル、1
07 システム定義情報整合性検査部、108 システ
ム定義情報配布部、109 伝送路、300 整合性規
則情報、301 規則番号、302 設定項目、303
規則内容、400 システム定義情報、401 定義
番号、402 プロセス名、403プロセス数、404
引数、405 システム名、500 システム定義情
報、501 定義番号、502 プロセス名、503
プロセス数、504 引数、505 システム名、60
0 エラー情報リスト、601 エラー項目、602
エラー内容、700 システム定義情報、701 定義
番号、702 プロセス名、703 プロセス数、70
4 引数、705 システム名、800 全システム定
義情報、801 定義番号、802 プロセス名、80
3 プロセス数、804 引数、805 起動先システ
ム名、806 依存関係、901 プロセス起動実行
部、902 起動コマンド列生成部、903 遠隔起動
指示部、1100 プロセス起動順序リスト、1101
起動順序、1102 起動プロセス名、1103 起
動先システム名、1200 プロセス起動コマンド・リ
スト、1201 プロセス名、1202 起動コマン
ド、1203 引数、1300 プロセス起動コマンド
列リスト、1301 起動順序、1302 起動コマン
ド、1303 起動プロセス名、1304 起動先シス
テム名、1401 起動プロセス検査部、1600 起
動プロセス情報リスト、1601 プロセス名、160
2 プロセス数、1701 プロセス再起動実行部、1
702 再起動コマンド列生成部、1703 遠隔再起
動指示部、1704 残存プロセス検査部、1900
プロセス障害情報リスト、1901 システム名、19
02 プロセス名、2000 プロセス停止順序リス
ト、2001 停止順序番号、2002 停止プロセス
名、2003 停止先システム名、2100 プロセス
停止コマンド・リスト、2101 プロセス名、210
2 停止コマンド、2103引数、2200 停止コマ
ンド列リスト、2201 停止順序番号、2202停止
コマンド、2203 停止プロセス名、2204 停止
先システム名、2300 プロセス再起動順序リスト、
2301 起動順序番号、2302 起動プロセス名、
2303 再起動先システム名、2400 再起動コマ
ンド列リスト、2401 再起動順序番号、2402
再起動コマンド、2403 再起動プロセス名、240
4 再起動先システム名。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数のコンピュータ・システムと、上記
    コンピュータ・システムを管理するシステム管理装置が
    ネットワーク上に接続されて構成される分散処理システ
    ムにおいて、 上記システム管理装置は、分散処理システムの生成情報
    であるシステム定義情報を格納するシステム定義情報記
    憶手段と、 前記システム定義情報を整合性規則に基づいて検査する
    システム定義情報整合性検査手段と、 前記システム定義情報をネットワーク上に接続されたコ
    ンピュータ・システムに配布するシステム定義情報配布
    手段を備え、 上記コンピュータシステムは、上記システム定義情報配
    布手段から送出されるシステム定義情報を受信するシス
    テム定義情報取り込み手段を備えたことを特徴とする分
    散システム構築方式。
  2. 【請求項2】 複数のコンピュータ・システムと、上記
    コンピュータ・システムを管理するシステム管理装置が
    ネットワーク上に接続されて構成される分散処理システ
    ムにおいて、 上記システム管理装置は、分散処理システムの生成情報
    であるシステム定義情報を格納するシステム定義情報記
    憶手段と、 前記システム定義情報を整合性規則に基づいて検査する
    システム定義情報整合性検査手段と、 上記システム定義情報に基づいてネットワーク上のコン
    ピュータシステムに分散配置されたプロセスの起動を集
    中して行なうための起動コマンド列を生成する起動コマ
    ンド列生成手段と、 前記起動コマンド列に基づいてネットワーク上のコンピ
    ュータシステムの各プロセスに対し起動指示を行なう遠
    隔起動指示手段とを備え、 上記コンピュータシステムは、 上記遠隔起動指示手段からの起動命令に基づいて該コン
    ピュータシステム上のプロセスを起動するプロセス起動
    実行部を備えたことを特徴とする分散システム構築方
    式。
  3. 【請求項3】 上記システム管理装置は起動プロセス検
    査手段を備え、 該起動プロセス検査手段は、上記システム定義情報と、
    上記プロセス起動実行部がプロセス起動時に作成した起
    動プロセス情報に基づいて各コンピュータシステム上の
    プロセスの動作状況確認を行なうようにしたことを特徴
    とする請求項2記載の分散システム構築方式。
  4. 【請求項4】 上記コンピュータシステム上のプロセ
    ス起動実行部は該コンピュータシステム上のプロセスの
    起動、停止及び再起動制御を行ない、 上記システム管理装置は、 コンピュータシステム上の障害発生後におけるプロセス
    稼動状況を検査する残存プロセス検査手段を備え、 上記起動コマンド列生成手段はコンピュータシステムを
    回復させるためのコマンド列を生成する再起動コマンド
    列を生成し、 上記遠隔起動指示手段は上記再起動コマンド列に基づい
    てネットワーク上のコンピュータシステムに対してプロ
    セスの起動指示を行なうことにより、障害発生状況に応
    じたシステム回復処理を可能とするようにしたことを特
    徴とする請求項2記載の分散システム構築方式。
JP17485095A 1995-07-11 1995-07-11 分散システム構築方式 Pending JPH0926940A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17485095A JPH0926940A (ja) 1995-07-11 1995-07-11 分散システム構築方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17485095A JPH0926940A (ja) 1995-07-11 1995-07-11 分散システム構築方式

Publications (1)

Publication Number Publication Date
JPH0926940A true JPH0926940A (ja) 1997-01-28

Family

ID=15985750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17485095A Pending JPH0926940A (ja) 1995-07-11 1995-07-11 分散システム構築方式

Country Status (1)

Country Link
JP (1) JPH0926940A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006302081A (ja) * 2005-04-22 2006-11-02 Ntt Data Corp サービス再開装置およびサービス再開プログラム
JP2013222396A (ja) * 2012-04-18 2013-10-28 Mitsubishi Electric Corp 情報処理装置および情報処理方法およびプログラム
JP6991294B1 (ja) * 2020-10-09 2022-01-12 三菱電機株式会社 制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006302081A (ja) * 2005-04-22 2006-11-02 Ntt Data Corp サービス再開装置およびサービス再開プログラム
JP4717500B2 (ja) * 2005-04-22 2011-07-06 株式会社エヌ・ティ・ティ・データ サービス再開装置およびサービス再開プログラム
JP2013222396A (ja) * 2012-04-18 2013-10-28 Mitsubishi Electric Corp 情報処理装置および情報処理方法およびプログラム
JP6991294B1 (ja) * 2020-10-09 2022-01-12 三菱電機株式会社 制御装置

Similar Documents

Publication Publication Date Title
US11487536B2 (en) System for automating user-defined actions for applications executed using virtual machines in a guest system
US10394550B2 (en) System and method for supporting patching in a multitenant application server environment
KR102018926B1 (ko) 미리 빌트된 환경의 즉각적인 가용성을 제공함으로써 테스팅 환경을 배치하는 기법
US7165189B1 (en) Distributed test framework for clustered systems
US8214686B2 (en) Distributed processing method
CN100461130C (zh) 测试软件应用的方法
US5805897A (en) System and method for remote software configuration and distribution
US8732693B2 (en) Managing continuous software deployment
US7779298B2 (en) Distributed job manager recovery
US7937455B2 (en) Methods and systems for modifying nodes in a cluster environment
US8464246B2 (en) Automation of mainframe software deployment
US20050114854A1 (en) System and method for dynamic cooperative distributed execution of computer tasks without a centralized controller
CN113569987A (zh) 模型训练方法和装置
CN106681956A (zh) 一种大规模计算机集群的操作方法及装置
JPH0934723A (ja) ネットワークでのアプリケーション・プログラムの導入のための導入計画オブジェクトのコミット
CN110727575B (zh) 一种信息处理方法、系统、装置、以及存储介质
US11977449B2 (en) Distributed package management using meta-scheduling
US20060168564A1 (en) Integrated chaining process for continuous software integration and validation
US20200358648A1 (en) Continuous monitoring of network devices during maintenance
US20030103310A1 (en) Apparatus and method for network-based testing of cluster user interface
CN111831567A (zh) 应用的测试环境配置方法、装置、系统和介质
CN113835786B (zh) 一种数据对接系统、方法和计算机可读存储介质
US20080172669A1 (en) System capable of executing workflows on target applications and method thereof
CN115202680A (zh) 在线远程自动升级本地客户端的系统及方法
CN112416394B (zh) 一种服务升级方法、装置、存储介质及电子设备