JP4137004B2 - 分散型計算機システムのプロセス管理方法 - Google Patents

分散型計算機システムのプロセス管理方法 Download PDF

Info

Publication number
JP4137004B2
JP4137004B2 JP2004147833A JP2004147833A JP4137004B2 JP 4137004 B2 JP4137004 B2 JP 4137004B2 JP 2004147833 A JP2004147833 A JP 2004147833A JP 2004147833 A JP2004147833 A JP 2004147833A JP 4137004 B2 JP4137004 B2 JP 4137004B2
Authority
JP
Japan
Prior art keywords
computer
mode
operation mode
notification
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004147833A
Other languages
English (en)
Other versions
JP2005332057A (ja
Inventor
敦彦 廣田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004147833A priority Critical patent/JP4137004B2/ja
Publication of JP2005332057A publication Critical patent/JP2005332057A/ja
Application granted granted Critical
Publication of JP4137004B2 publication Critical patent/JP4137004B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

本発明は、ネットワークによって相互に接続された複数の計算機上で、各々の計算機に実装されるプロセスが相互に連携、協調しながら機能を実現する分散型計算機システムに係わり、特に、電力系統の監視制御機能を実現する分散型電力系統監視制御システムに好適な分散型計算機システムのプロセス管理方法に関する。
最近の計算機システムは、一つの計算機で全ての機能を実現する集中型計算機システムから、ネットワーク技術の進展によって複数の計算機がネットワークを介してデータや起動要求を受け渡し、複数の計算機上に配置された複数のプロセスが連携、協調しながら機能を実現する分散型計算機システムに移行してきている。計算機システムの一つの実現形態である電力監視制御システムに代表される情報制御システムにおいては、集中型計算機システムにおける時代から、システムとしての24時間稼動を保証するために多重系計算機システム構成をとるようになっており、多重化された計算機毎に自計算機がどの運転モードであるかを管理し、運転モードに従って機能の実施可否を決定するのが一般的である。この運転モードは、多重系計算機システムにおいて多重化された計算機システムから同一の監視制御対象機器に対して同時に制御信号を出してはならないという制約から、常用モードで動作する計算機と、常用モードで運転している計算機に障害が発生して停止した場合に常用モードの計算機に変わり、かつデータや機能を引き継いで処理を実施できるようにスタンバイしている待機モードの計算機とを備え、ひとたび常用モードの計算機が停止した場合に、待機モードの計算機が常用モードに自動遷移し引き続き処理を実行してシステムの24時間運転を確保している。
また、システムによっては、監視制御対象設備の変更に伴うシステム上に定義されたデータのメンテナンスを実施した際に、実際に定義したデータで運用に入る前にデータの正しさを検証するため、シミュレーションモードや試験モードといった運転モードを具備しており、このような運転モードをとった計算機では、実際にオンライン監視制御を行うのではなく、オフライン的にシミュレーションを行う機能、あるいは、監視制御対象の一部の機器だけを試験対象として試験運転するなどの機能を実現している。また、これらの試験機能は、多重系のシステム構成によってオンライン機能と並列して動作できるような形態になっており、多重化された計算機のある系列を常用モード、また別系列を試験モードとすることで、一つのシステム内で複数のモードが動作できるようになっていることが一般的である。また、一般的に、シミュレーションモードや試験モードへの遷移については自動遷移ではなく、利用者が手動で運転モードを切り替えることによって運転モードを変更している。また、計算機システム上で実現する機能や動作するプロセスについては、運転モードの違いによって、動作させるプロセスを変えたり、動作時に参照するデータベースを切り替えることによって、モード毎の機能の挙動が変わるように実現している。
一方、待機モードの違いは無論のこと、試験モードやシミュレーションモードについては、常用モードに移行したときに、システムとして正しい動作となることを事前に確認する目的の運転モードであるために、使用するデータの違いはあるものの監視制御の基本的な機能の振る舞いは同一でなくてはならないために、プロセスとしては同一の処理ロジックで実現しておく必要がある。このため、各プロセスの処理ロジックにおいて、計算機の運転モードを参照し、これによって処理を分岐させるような運転モード毎に動作が変わるようなつくりとしていない。このため、運転モードによる使用データの切り替えや起動するプロセスの判定は、運転モードを管理する構成制御ミドルウェアを中心に、そこから提供される運転モード状態判定し、使用データを切り替えるための機能はデータベース管理ミドルウェア内部に、また動作させるプロセスを決定する機能はプロセス管理ミドルウェアあるいは構成制御ミドルウェア内に実装されたプロセス管理機構に実装するといった実装方法により、ミドルウェアの内部機能として実現し、個々のアプリケーションプロセスは、計算機の運転モードを意識せずに実現する形態としている。従って、計算機上で機能を実現するプロセスは、当該計算機の運転モードに従い、当該運転モードにおいて動作可能かどうかを定義したプロセス動作定義情報と、現在の運転モードやモード遷移状態に従ってプロセスを起動停止するプロセス管理機構によって起動停止する形態をとっており、このことで運転モードに従ったシステム挙動の違いが実現できていた。
従来の集中型計算機システムにおいて、プロセスは、単一計算機上で動作することで当該プロセスの持つ機能が発揮されるため、自プロセスが動作する計算機の運転モードに従って、プロセス管理機構がプロセスの起動管理を実施することで、基本的に運転モードの違いによるシステム挙動の違いを実現できており問題はなかった。また、プロセスのつくりとしても、計算機の運転モードを意識する必要はなかった。このような形態を持つシステムを分散型計算機システムに移行した際には、分散配置された多重系計算機間での運転モードの自動遷移やネットワークポートの障害を考慮して、複数の計算機が相互に認識している運転モード状態をマージして自動モード遷移を実現するための運転モード情報の精度を高めた構成制御ミドルウェアの開発やデータベースの分散化に対応した分散データベース管理ミドルウェアの開発、分散配置された計算機間で他の計算機に配置されたプロセスの起動を行うための分散プロセス管理ミドルウェアの仕組みが拡張されてきた。このようにシステムとしては、分散型計算機においてプロセスが相互に協調連係するためのミドルウェア機能の拡張や、ミドルウェア内部で分散配置された計算機相互間の運転モードの認識などの拡張がなされていたが、運転モードに従ってプロセスの起動管理を司るプロセス管理機構としては、分散配置されたおのおのの計算機上で、従来の集中型システムで実現してきたプロセス管理機構を単に計算機毎に個別で管理するための仕組み以上の拡張はなされていない。
しかしながら、分散型計算機システムの場合、ある計算機上で動作するプロセスは、他の計算機上に配置されたプロセスと連係協調を取って一つの機能を実現するケースが多く、また、プロセスが動作するためのデータベースなどの資源も、必ずしもプロセスが動作する計算機上には配置されずに他の計算機上に配置されるケースもあり、単に、プロセスが動作する運転モードに従ってプロセスの起動管理を行ったとしても、他の計算機の運転モードが当該プロセスの機能を実現するために必要な運転モードになっていない場合などには、例え、プロセスが動作した計算機が当該プロセスが動作する運転モードを満たしていたとしても、プロセス群が連係して実施すべき機能をまっとう出来ないケースが出てくる。例えば、他の計算機に配置されたデータベースのアクセスや他計算機上のプロセスの起動は、分散データベース管理ミドルウェアや分散プロセス管理ミドルウェアによって実施され、当該計算機が自計算機の運転モードに合致していたとしてプロセスが動作を開始しても、他の計算機が当該プロセスの機能を実施できるに足る運転モード状態にないと、分散データベース管理ミドルウェアや分散プロセス管理ミドルウェアから相手計算機の運転モードが動作条件を満たしていないといったエラー結果を返すケースがあるため、当該プロセスとしての処理の継続が困難になる。また、一方で、プロセスはプロセス処理内部で自計算機の運転モードを判断して処理を行うようなつくりとはせず、動作可能な運転モードをプロセス管理機構に定義し、プロセス管理ミドルウェアが運転モードを判断して当該プロセスの起動管理を行うようにしていたとしても、そのような管理だけでプロセスが動作できた場合にも、処理の途中で、分散データベース管理ミドルウェアや分散プロセス管理ミドルウェアから計算機の運転モードが合わないというエラーを返された場合には、このエラーに対する対処をプロセス内部の処理として作りこまなくてはならないという問題が発生する。これは間接的に他の計算機の運転モードを意識したプロセスのつくりをしていることになり、プロセスの処理の作りこみが複雑化する。また、データベースの配置や他のプロセスの動作する計算機が自計算機にあるか、他の計算機になるかを暗黙に意識して処理を作成する必要が出てくるために、計算機上の負荷分散などの理由によってプロセスやデータベースの配置を変更した際に、正しく動作しなくなる可能性もある。さらにプロセスは、そのプロセスの有する機能をまっとう出来ない状態においても、自計算機のモード条件だけで起動されることになり、起動されてからエラーが発生するまでに消費する計算機処理時間が無駄になるといった問題もある。さらに、一般的に計算機の運転モードは、計算機の障害などによって自動的に遷移するケースがあり、自動遷移は、障害発生のタイミングによってはプロセスの動作中に行われるケースがある。このため、運転モードの変化中にプロセスが動作すると、データの引継ぎの問題などモード遷移中のタイミングによる処理が複雑化し、機能の不具合の発生要因になるケースもあり、運転モードが遷移した場合には、基本的にプロセスの動作を緊急停止させたり一時的に処理実行を保留したほうが、上述のようなタイミングにかかわる問題を回避できる可能性が高い。
本発明の目的は、プロセス管理機構がプロセスの起動停止を行うための条件を、自計算機の運転モード状態のみならず、当該プロセスが機能を全うするに必要な複数の計算機の運転モード状態を加味した上で、プロセスの起動停止管理が行えるようにした分散型計算機システムのプロセス管理方法を提供することにある。
また、本発明の他の目的は、計算機の運転モードに従ってプロセスが起動できない場合あるいは停止した場合に、その要因を利用者が知ることができるようにした分散型計算機システムのプロセス管理方法を提供することにある。
本発明は、ネットワークを介して少なくとも一部を多重化した複数の計算機を接続した分散型計算機システムの複数プロセス管理方法であって、
各計算機は、
他計算機とネットワークを介してつながり現在の運転モードを互いにやりとりする、自計算機に実装されている各プロセスの管理を行うプロセス管理機構と、自計算機に実装されている各プロセスの実行条件となる、自計算機の必要とする運転モードと他計算機が同時に同一運転モードでなくてはならないことを示す同一モード条件他計算機種別とを格納するプロセスの実行条件テーブルと、自計算機に実装されている各プロセスが現在実行中か非実行中かを示す実行状態を格納するプロセス状態テーブルと、自計算機の現在の運転モード及び上記他計算機から送られてくる現在の他計算機の運転モードとをそれぞれ自他計算機別に対応して格納するモード管理テーブルとを備え、
上記プロセス管理機構は、
起動要求イベントから起動対象プロセス識別子を取り出し、上記実行条件テーブルからこの識別子のプロセスの実行条件である、自計算機の必要とする運転モード並びに同一モード条件他計算機種別の読み出し、並びに上記識別子のプロセスが現在実行中か非実行中かを上記プロセス状態テーブルからの読み出しを行い、
当該プロセスが非実行中であるか実行終了後の非実行中になっているかの条件、及び上記読み出した同一モード条件他計算機種別について上記モード管理テーブルを参照してその計算機種別の現在の運転モードが同一運転モードであることの条件、の成立により当該プロセスを起動させるものとした分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、上記各計算機から送られてくる運転モードに変化が生じた場合のこの変化後の運転モードが、当該計算機上で実行中の各プロセスに対して、実行条件テーブル内の同一モード条件他計算機種別の運転モード条件でないとき、当該プロセスを停止させることを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、上記他計算機の運転モードの遷移が過渡状態にある期間中に、その遷移先モードと遷移元モードに対して、当該計算機上で実行中のプロセスに対して、実行条件テーブル内の同一モード条件他計算機種別の運転モード条件でないとき、運転モードの遷移の過渡状態である期間中に当該プロセスを一時的に動作を中断停止させ、過渡状態から回復したときに再開させることを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、プロセスに対する起動要求があった際に上記条件の不成立により起動不可のときにその旨を、当該計算機システム利用者に通知手段を介して通知を行うようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、上記停止の際にその旨を、当該計算機システム利用者に通知手段を介して通知を行うようにした分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、プロセス毎の上記通知を行うかどうかを予め定めたデータに従って、通知が必要なプロセスに対してのみ上記通知手段を介して通知を行うようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記プロセス管理機構は、予め規定された通知抑止用に設定された計算機の運転モード変更に基づいて、当該運転モードへの変化の際に上記通知を抑止するようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
更に本発明は、上記通知を一時的に抑止したり、再開したりすることを優先的に決定する入力手段を設け、この入力手段により抑止を入力したとき上記通知を抑止するようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法を開示する。
さらに請求項6に記載の本発明は、請求項4または請求項5に記載のものにおいて、予め規定された計算機の運転モード変更を事前に定義させ、当該運転モードへの変化の際に上記通知を抑止するようにしたことを特徴とする。
さらに請求項7に記載の本発明は、請求項4、請求項5および請求項6のいずれか一つに記載のものにおいて、上記通知を一時的に抑止したり、再開したりすることを優先的に決定する入力手段を設け、この入力手段により抑止を入力したとき上記通知を抑止するようにしたことを特徴とする。
本発明による分散型計算機システムのプロセス管理方法によれば、プロセス管理機構がプロセスの起動停止を行うための条件を自計算機の運転モード状態のみならず、当該プロセスが機能を全うするに必要な複数の計算機の運転モード状態を加味した上で、プロセスの起動管理が行え、運転モードに基づいてより効果的なプロセス管理を実現できるようになり、当該プロセスはその機能がまっとうできる計算機モードでのみ動作するため、分散データベースの配置や連係プロセスの配置先が自計算機と異なっても、他の計算機が機能を全うするための操作モードになっていないことによるエラー処理などを考慮した処理プログラミングを行わなくてよくなり、処理ロジックが単純化し、生産性、保守性、信頼性の向上が図れるとともに、分散データベースの配置や連係プロセスの配置先の変更に対しても影響の少ない処理プログラムにすることができ、ソフトウェアとしてのライフサイクルが向上する。
請求項2に記載の本発明による分散型計算機システムのプロセス管理方法によれば、運転モードに変化が生じて、当該条件が満たされなくなった際にプロセスを停止することができるので、運転モードに基づいてより効果的なプロセス管理を実現できるようになる。
請求項3に記載の本発明による分散型計算機システムのプロセス管理方法によれば、実行可能条件に変化がないときに、当該プロセスを運転モード遷移の過渡状態である期間中に当該プロセスを一時的に動作を中断させ、過渡状態から回復したときに再開させるため、より効果的なプロセス管理を実現できるようになる。
また請求項4に記載の本発明による分散型計算機システムのプロセス管理方法によれば、プロセスを停止するときにその旨を通知するため、操作員は自分が操作する操作卓計算機の運転モードを認識しているもののプロセスやデータベースの配置を全て意識していなかったとしても、プロセスを停止するときの通知によって、この状況を直ちに把握することができるようになる。
さらに請求項5に記載の本発明による分散型計算機システムのプロセス管理方法によれば、予め通知を定義し、必要なプロセスに対してのみ通知を行うため、必要な通知を制限して操作員に分かり易い通知を行うことができる。
さらに請求項6に記載の本発明による分散型計算機システムのプロセス管理方法によれば、予め規定された計算機の運転モード変更を事前に定義させ、当該運転モードへの変化の際に上記通知を抑止するようにしたため、通知が行われると頻発して煩わしくなる事態を制限することができ、操作者への負担を軽減しながら事態を掌握することができるようになる。
さらに請求項7に記載の本発明による分散型計算機システムのプロセス管理方法によれば、入力手段により抑止を入力したとき通知を抑止することができるので、通知情報量が非常に多くなり逆に煩わしい通知が増えてしまう状況に対して入力手段から制限して、利用者の真の目的に応じた通知に限定することがきるようになる。
以下に、本発明の実施の形態を図面に基づいて詳細に説明する。
図1は、本発明の一実施の形態による分散型計算機システムとしての電力監視制御システムにおける多重系分散型計算機システムを示す概略構成図である。
分散型計算機システムは、複数種類の計算機、ここでは現地機器との伝送機能を実現する伝送計算機1,2と、現地機器が接続されない状態で計算機機能の確認を行う際に現地機器との伝送の模擬を行う伝送模擬計算機3と、現地からの伝送状態によって現地機器状態の状態変化を監視したり現地機器に対する制御指令を行うための多重化された複数の監視制御計算機4〜6と、現地機器の状態や状態変化の時系列的あるいは発生イベントの記録を行う多重化された複数の記録計算機7〜9と、計算機利用者つまり監視制御システムにおいては運転員に対し監視制御結果や記録結果を表示したり利用者からの指令を計算機システムに入力するための操作端末装置10〜12を備えた多重化された複数の操作卓計算機13〜15と、システム上の各計算機の運転状態や運転モードを監視するとともに利用者が手動モード遷移を行うためのシステム監視端末装置16を備えたシステム監視計算機17とから構成している。また、分散型システムにおいて各計算機はネットワークで結合された構成をとり、ここではマンマシンネットワーク18および伝送ネットワーク19で結合され、各計算機は、これらのネットワーク18,19を介して計算機相互間でデータやイベントの受け渡しが行なわれる。
図2は、上述した多重系分散型計算機システムにおける各計算機のソフトウェア構成を示すブロック構成図であり、多重化された計算機のソフトウェアは基本的に同一構成であるから、ここでは代表的な機能の計算機のみを示している。
各計算機1,4,7,13には、詳細を後述する4種類のソフトウェア、つまり構成制御ミドルウェア21と、分散プロセス管理ミドルウェア22と、分散データベース管理ミドルウェア23と、例えば3つあるものとして示す複数のプロセス24a,24b,24cとがそれぞれ実装されている。
この構成制御ミドルウェア21は、自計算機の運転モードを管理するとともに、自計算機の運転モードを他の計算機に通知する。また、自計算機の障害を検出して自計算機を停止したり、他計算機から送出されてくる運転モードの情報から自計算機が待機モードである場合に同一種類の常用モードである他計算機の停止状態を検出し、自計算機を自動的に常用モードに遷移したり、システム監視端末装置16を通じて行なわれる利用者20からの手動運転モード遷移要求を受け付け、自計算機および他計算機の運転モードを判断し、遷移可能な場合には自計算機の運転モードの遷移処理を実施する機能を有している。
分散プロセス管理ミドルウェア22は、計算機内外からの各種イベント、例えば利用者20による操作端末装置10からの入力操作や通信回線25からのデータ入力などの外部イベントや、計算機内部に実装されるタイマー26からの時間イベントやあるプロセスからの明示的な他プロセスへの起動要求イベントなどの内部イベントを受け、自計算機上のプロセスを起動したり、他計算機上の分散プロセス管理ミドルウェア22と連係を取りながら他計算機上に実装されたプロセス24a〜24cを起動したり、プロセスの起動と同時にプロセス間でのデータの受け渡しを行う機能を有している。
また分散データベース管理ミドルウェア23は、プロセス24a〜24cからの要求に応じて自計算機に配置されたデータベース27の参照や更新を行ったり、他の計算機上に配置されたデータベース27を他の計算機に配置された分散データベース管理ミドルウェア23と協調しながら、リモートでデータベースのアクセス(参照・更新)を行う機能を有している。また分散データベース管理ミドルウェア23は、分散プロセス管理ミドルウェア22あるいは構成制御ミドルウェア21の内部機能として、自計算機の現在の運転モードや運転モードの遷移に伴って、プロセス24a〜24cの起動や停止を司るプロセス管理機構28を実装しており、このプロセス管理機構28が計算機の運転モードに従って起動要求されたプロセスを実行状態にすべきか否か、あるいは、既に実行中のプロセスを停止させるべきか否かを管理する。
さらにプロセス24a〜24cは、各計算機上に実装され、上述した各ミドルウェア21〜23の機能を利用しながらデータベース27のアクセスを行ったり、他のプロセス24a〜24cの起動やデータの受け渡しを行うことにより一連の業務機能を実現する。一般的に、プロセス24a〜24cは、システムの機能に応じて複数作成され、必要な計算機上でのみ実行される。例えば、伝送系計算機1、2のプロセス24a〜24cとしては、現地機器からの伝送を行うものや、現地機器の状態変化に応じて監視制御計算機4〜6の監視プロセスへ状態変化を通知するためのものが実装され、また、記録計算機7には、周期的に現在の状態をデータベースに記録するものなどが実装される。また、操作卓計算機13には、プロセス24a〜24cとして記録するものや、利用者20が現地機器を操作するための入力を行うものなどが実装される。
以上示したような分散型計算機システムで実現される業務機能は、各計算機上に実装された単一のプロセスや単一あるいは複数の計算機上に実装された複数のプロセスの連係によって実現される。また、各プロセス24a〜24cは、分散データベース管理ミドルウェア23によって自計算機あるいは他計算機に配置されたデータベース27を、データベース27の配置計算機を意識せずにアクセスできるよう形態になっているとともに、分散プロセス管理ミドルウェア22によって他のプロセスの配置計算機を意識せずに起動要求を行える形にしていることが一般的である。これは、計算機の処理負荷を分散させたり、処理応答性を確保するために、プロセス24a〜24cの配置計算機やデータベース27の配置計算機を変更した際に、プロセス内部の処理ロジックを変更するのではなく、分散プロセス管理ミドルウェア22や分散データベース管理ミドルウェア23が管理しているプロセス24a〜24cやデータベース27の配置定義情報を変更するだけで実現できたほうが、ソフトウェアの保守性やライフサイクルが向上するという考え方に基づいているためである。
図3は、上述した多重系分散型計算機システムにおける運転モードに基づくプロセス管理を実現するためのソフトウェア構成を示すブロック図である。
運転モードに基づくプロセス管理を実現するための機能としては、分散プロセス管理ミドルウェア22と、構成制御ミドルウェア21と、プロセス管理機構28の三つの構成要素を有している。分散プロセス管理ミドルウェア22は各計算機上に実装され、プロセス24a〜24cに対する起動要求を管理するためのミドルウェアである。分散プロセス管理ミドルウェア22に対しては、利用者20による操作端末装置10からの入力操作によるイベント、通信回線25からのデータ入力イベント、計算機内部に実装されるタイマー26からの時間イベント、あるプロセスからの明示的な他プロセスへの起動要求イベントなどが入力される。これらイベントについては、それが発生した時点で、どのプロセスを起動させるかの情報(起動プロセス識別子)が予め分散プロセス管理ミドルウェア22の内部に定義されている。
分散プロセス管理ミドルウェア22は、発生したイベントに対する起動プロセスが、当該計算機に実装されているプロセスか、他の計算機に実装されているプロセスかを、分散プロセス管理ミドルウェア22の内部に定義されたプロセス配置情報(各プロセス識別子と配置先を管理するテーブル)から判断し、自計算機に実装されているプロセスである場合には、自計算機のプロセス管理機構28に対し、プロセス識別子とともにプロセス起動通知を出力する。一方、他の計算機に実装されているプロセスの場合には、他の計算機に実装された分散プロセス管理ミドルウェア22aに起動要求を通知する。従って、自計算機の分散プロセス管理ミドルウェア22に対しても他計算機の分散プロセスミドルウェア22aからプロセス起動通知を受ける場合もある。なお、プロセスの配置をどのような形で意識して判別するか、例えば、全てのプロセスのプロセス配置情報を持ち、それを用いてプロセスの配置計算機を判別するか、あるいは、他の計算機の分散プロセス管理ミドルウェア22aに問い合わせることによって、プロセスの実装計算機を判別するかについては、公知技術を採用することができるので、その詳細処理方式についての説明を省略する。同様に、他の計算機上の分散プロセス管理ミドルウェア22aとの通信方法の詳細についても説明を省略する。
構成制御ミドルウェア21も各計算機上に実装され、システム監視端末装置16からの手動モード遷移要求によるモード遷移要因、OSやRAS機構29からの自計算機異常検出状態に基づくモード遷移要因、あるいは、他の計算機からのモード遷移要因つまり他計算機の停止に伴う待機モードから常用モードへの自動遷移要因を受けて自計算機の運転モードを変更するとともに、自計算機の運転モード状態をモード管理テーブル30に格納する。モード管理テーブル30は構成制御ミドルウェア21の内部テーブルとして管理するのが一般的であり、このモード管理テーブル30は、図4に示すように計算機種別36、計算機名称37、現在モード38(現在の自計算機の運転モード)、遷移中フラグ39(自計算機の運転モードが遷移中の過渡状態にあることを示すフラグ)、遷移先モード40(遷移中フラグがONの場合に有効な情報で、モード遷移の際に次にどのモードに遷移するかを示す情報)を格納している。なお、後述するプロセス管理機構28は、直接的あるいは間接的に構成制御ミドルウェア21への問い合わせによって当該情報を参照できる。
プロセス管理機構28は、分散プロセス管理ミドルウェア22からのプロセス起動通知を受けて実際のプロセスを起動したり、構成制御ミドルウェア21からのモード遷移通知を受けて実行中のプロセスを停止させたり、あるいは、中断再開させたりする機能である。また、各プロセス24a〜24cは起動後、実行が終了、あるいは何かの要因で実行異常となり強制終了した場合、プロセス管理機構28に通知を行う。プロセス管理機構28とプロセス24a〜24cとの間の起動、停止、中断、再開やプロセスの終了通知は、計算機に実装されたOSのメカニズムを用いて実現させることが一般的であるため、ここでの詳細処理の説明は省略する。
プロセス管理機構28はプロセス実行条件テーブル31を使用し、このプロセス実行条件テーブル31は、プロセス登録者がプロセス登録機能32を用いてシステムに登録するが、一般的にシステム外部から何らかの登録機能によって、システム内部のテーブルに情報が設定できることは公知であり、ここでは詳細な登録機能の内容やその方式についての説明を省略する。このプロセス実行条件テーブル31には、当該計算機に実装されている各プロセス24a〜24cが、どのモードの時に実行してよいかを示しており、図5に示すようにプロセス毎にプロセスを識別するためのプロセス識別子34と、当該運転モードのときに実行可能であることを示す実行可能モード41と、同一モード条件による他計算機種別42とを格納している。この実行可能モード41は、あるプロセスが実行可能な条件として、いくつかの運転モード状態で実行可能であるケースが在るため、複数の運転モードを登録できる。一つの計算機は同時に複数のモードとなることは無いことから、これら複数定義された運転モードがOR条件となる。
また、プロセス管理機構28は、個別のプロセスの実行状態を管理するプロセス状態テーブル33を持っており、このプロセス状態テーブル33は、当該計算機に実装されている各プロセスが、現在どういう状態にあるかを管理するもので、ここではプロセス毎にプロセスを識別するためのプロセス識別子34と、プロセス状態35とを有している。このプロセス状態35として、プロセスが実行されていない場合は「非実行中」、実行されて終了していない状態は「実行中」、プロセスを中断した場合は「中断中」の少なくとも3種類を持ち、これらの状態は、プロセス管理機構28によって参照され更新される。
次に、上述したソフトウェア構成における従来との相違部分について説明する。
先ず、モード管理テーブル30は、自計算機以外の他の計算機のモード状態を管理できるように変更しており、また構成制御ミドルウェア21が、他の計算機の構成制御ミドルウェア21aと協調して、他の計算機のモード状態を全計算機に配信できるようにしている。また、他の計算機のモード遷移要因もプロセス管理機構に通知できるようにしている。このためのモード管理テーブル30は、従来方式では自計算機のみのモード状態を管理していたのに対して、図4に示すように計算機種別36および計算機名称37に示すように自計算機のみならず他の計算機も管理対象に含めるようにし、それぞれの現在モード38(現在の自計算機の運転モード)、遷移中フラグ39(自計算機の運転モードが遷移中の過渡状態にあることを示すフラグ)、遷移先モード40(遷移中フラグがONの場合に有効な情報で、モード遷移の際に次にどのモードに遷移するかを示す情報)を管理している。
図1に示すような計算機が多重系構成である場合、異なる種別の計算機間の通信は、二重系運転におけるバックアップモードである待機モードの場合の特例を除いては、原則として同一の運転モードである計算機との間だけで、分散プロセス管理ミドルウェア22を用いたプロセスの起動や分散データベース管理ミドルウェア23を用いたデータのリモートアクセスは行わないように管理して、複数の運転モード間で互いに独立したモードの系列を組めるようにしている。このため、計算機が多重系を構成する場合においては、いずれか1台の計算機が自計算機のモードと同様であれば、他の計算機上のプロセス起動や他の計算機上のデータベースリモートアクセスが実現できる。従って、これを区別するために、複数の計算機が同一の計算機種別であることを識別できるように、計算機種別36および計算機名称37という項目を新たに加えている。これに伴って構成制御ミドルウェア21は、自計算機および他計算機のモード状態を対応する計算機種別36、計算機名称37に基づいた行へ格納するものとする。上述した待機モードの特例については、本発明を説明する上では必ずしも必要な事項ではないため、ここでの説明は省略する。なお、このような変更は、本発明を実現するために必須な変更ではあるが、他の目的のためにこのような管理を行っている構成制御ミドルウェア21は従来からも存在している。
従来との相違点の二番目として、プロセス実行条件テーブル31に、新たな項目として同一モード条件他計算機種別42を追加したことにある。図5に示すようにプロセス実行条件テーブル31の自計算機実行可能モード41は、自計算機がどのようなモードのときに当該プロセスを動作させてよいかを定義するための情報である。例えば、操作卓計算機上のプロセスで、各画面への遷移を選択するような画面を表示するためのプロセスは、「停止」モード以外のあらゆるモードのときに動作させて問題ないことから、「常用」「SIM」「試験」などのモードを設定することができる。しかし基本的に一つの計算機は同時には一つの運転モードしか採らないため、定義されたモードのOR条件モードであれば動作可能である。
これに対し、同一モード条件他計算機種別42は、当該プロセスを実行させた際に、他の計算機が同時に自計算機と同一モードでなくてはならない場合に定義する定義情報である。例えば、図2に示した操作卓計算機13で、記録計算機7にあるデータベース27をリモートアクセスして記録結果を表示するプロセスである場合には、操作卓計算機13と同一モードをもつ記録計算機が存在しないときにはデータを表示できない。このようなときには、当該プロセスが動作する計算機の他に、記録計算機の種別である多重化されたいずれか一つの計算機が当該計算機と同一モードでないと当該プロセスを動作させて意味の無い結果になる。このような場合に、同一モード条件他計算機種別42として、記録計算機を定義する。ここに定義された計算機種別は、当該計算機と同一のモードにあるのもが存在する場合に当該プロセスが動作可能という条件になる。なお、当該計算機だけで処理が完結するようなプロセスの場合には、同一モード条件他計算機種別42には計算機種別を定義しない。また、複数の種別の他計算機が同一モードを持たなくては処理が完結しないようなプロセスの場合には、関係する複数の計算機種別を定義する。これは、複数定義されたすべての計算機種別において、当該計算機と同一のモードの計算機が存在していることを示す条件つまりAND条件となる。
次に、従来との相違点の三番目として、上述したモード管理テーブル30およびプロセス実行条件テーブル31に合致させて変更したプロセス管理機構28の処理方式について説明する。図6は、分散プロセス管理ミドルウェア22からプロセス起動通知があった際の処理動作を示すフローチャートを示している。
先ず、分散プロセス管理ミドルウェア22からプロセス管理機構28へのプロセス起動通知に対して、ステップS1で起動要求イベントから起動対象プロセス識別子を取り出す。ステップS2で、プロセス実行条件テーブル31およびプロセス状態テーブル33からこの起動対象プロセス識別子34に対応する実行可能モード41と、プロセス状態35とを取り出す。次に、ステップS3で当該プロセスが実行中か否かを判定し、実行中であった場合はステップS4で当該プロセスが非実効状態になるまで待つ。ステップS3での判定で当該プロセスが非実効状態になると、ステップS5でモード管理テーブル30から自計算機の現在モード38を取り出す。その後、ステップS6で遷移中フラグ39がOFF、かつ取り出した現在モード38が自計算機実行可能モード41に含まれるか否かを判定する。
この判定結果、含まれない場合は終了となり、含まれる場合はステップS7で同一モード条件他計算機種別42に定義されている計算機種別について繰り返し処理を判定する。繰り返し処理が完了している場合、ステップS8で当該プロセスを起動し、プロセス状態テーブル33を更新する。ステップS7の判定で繰り返し処理が未完了の場合、ステップS9でモード管理テーブル30から定義された他計算機種別のすべての計算機における現在モード38を取り出す。その後、ステップS10で遷移中フラグ39がOFF、かつ現在モード38が自計算機の現在モード38と同一の計算機が存在しているか否かを判定し、存在しない場合は終了となり、存在している場合は、ステップS7に戻って処理を繰り返し、ステップS10で遷移中フラグ39がOFF、かつ現在モード38が自計算機の現在モード38と同一の計算機全てについて完了するまで行う。
このように他の計算機のデータベースをアクセスするプロセスの起動は、複数の計算機が同時に同一モードであった場合にのみ実行できるようになり、従来方式のように、例えばリモートアクセスする対象の計算機が停止モード状態であった場合に、プロセスを動作させた後にデータベースアクセスが異常になって、結果として当該プロセスの機能が実現できないということがなくなり、プロセスを実行する時点で当該プロセスを実行させないようにできるようになる。
図7は、構成制御ミドルウェア21からプロセス管理機構28へのモード遷移開始の通知があった場合における処理動作を示すフローチャートである。
モード遷移開始の通知があった場合、ステップS11でモード遷移開始要求からモード遷移対象の計算機を取り出し、ステップS12でモード状態テーブル33を全数調査し、プロセス状態35が実行中のプロセス識別子34を全て取り出す。その後、ステップS13で取り出した全てのプロセス識別子について繰り返し、残プロセスがなくなれば終了となり、残プロセスがある場合、ステップS14で遷移対象は自計算機か否かを判定する。この判定結果、自計算機であればステップS15でモード管理テーブル30から自計算機のモード情報として遷移先モード40を取り出す。続いてステップS16で遷移先モード40が当該プロセスの自計算機実行可能モード41に含まれるか否かを判定し、含まれる場合はステップS17で当該プロセスを中断し、プロセス状態テーブル33を更新し、ステップS13に戻る。しかし、ステップS16の判定で含まれない場合は、ステップS21で当該プロセスを停止しプロセス状態テーブルを更新し、ステップS13に戻る。
ステップS14の判定で遷移対象が自計算機でなかった場合は、ステップS18で対象プロセスの同一モード条件他計算機種別42に遷移計算機が含まれているか否かを判定し、含まれている場合はステップS19で遷移中の計算機の現在モード38が自計算機の現在モード38と一致するか否かを判定する。さらに、そうであればステップS20で遷移中の計算機はモード一致と見なさない遷移先モード40へ遷移中か否かを判定する。この判定結果、遷移中であればステップS21で当該プロセスを停止しプロセス状態テーブルを更新し、ステップS13に戻る。
図8は、構成制御ミドルウェア21からプロセス管理機構28へのモード遷移終了の通知があった場合における処理動作を示すフローチャートである。
モード遷移終了の通知があった場合、ステップS22でモード遷移終了通知からモード遷移対象の計算機を取り出し、ステップS23でプロセス状態テーブル37を全数調査し、プロセス状態35が中断中状態のプロセス識別子34を全て取り出す。その後、ステップS24で取り出した全てのプロセス識別子について繰り返し、残プロセスがなくなれば終了となり、残プロセスがある場合、ステップS25で遷移終了対象は自計算機か否かを判定する。この判定結果、自計算機でなければステップS26でモード管理テーブル30の自計算機の遷移中フラグ39がONか否かを判定し、ONであれば終了し、一方、OFFであればあるいはステップS25の判定で自計算機であればステップS27に進む。このステップS27ではプロセス実行条件テーブル31の同一モード条件他計算機種別42に定義されている計算機種別について繰り返す。
ステップS27の判定で繰り返し処理が未完了であれば、ステップS28でモード管理テーブル30から自計算機の現在モード38が一致する計算機が遷移中か否かを判定し、この結果、遷移中であればステップS24に戻り、一方、遷移中でなければステップS27に戻る。ステップS27の判定で繰り返し処理が完了すればステップS29で当該プロセスを再開し、プロセス状態テーブル33を更新する。これらの各処理を繰り返し、ステップS24で全てのプロセス識別子について実施したなら終了となる。
これらの説明からも分かるように、プロセスが複数の計算機にまたがって機能することを前提に作成されていた場合、当該条件が満たされなくなったときにプロセスを停止したり、いずれかの計算機においてモード遷移があったときでも、プロセスの実行を一時的に中断したり再開したりすることができ、運転モードの基づいてより効果的なプロセス管理を実現できるようになる。
図9は、本発明の他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。
図5に示したプロセスBのような定義をしたプロセスを操作卓計算機13がSIMモード、伝送模擬計算機3が停止モードの状態において実行した場合、このプロセスは起動要求があっても実行されないことになる。例えば、このプロセスが伝送模擬を行うための画面表示設定用のプロセスであった場合、操作端末装置10からこのプロセスに対する起動用の外部イベントを操作員が発行しても画面が表示されなくなる。このとき操作員は、システム上の全計算機の運転モードを把握していない場合、この要因が伝送模擬計算機3がSIMモードになっていないことを即座に把握できない場合が多い。特に、操作員にとっては、自分が操作する操作卓計算機の運転モードを認識しているものの、プロセスやデータベースの配置をすべて意識しているわけではないので、ある機能を実現するためにどの計算機上で処理が動いているかを認識できない場合がある。
このような場合に対処するために、運転モード条件が満たされずにプロセスが実行されないとき、通知手段を設けることがシステムの機能として望ましく、これを実現するためのソフトウェア構成のブロック図を図9に示している。同図に示すように利用者20に通知するための機能として利用者通知機能43を追加し、この利用者通知機能43による利用者20への通知はプロセスの起動要求があったもののモード条件により実行できなかった場合と、モード条件が変わり実行中のプロセスを停止させる場合に通知するようにしている。
図10は、利用者通知機能43に対して通知を行う処理を追加したプロセス管理機構のプロセス起動通知時の処理動作を示すフローチャートである。
先ず、分散プロセス管理ミドルウェア22からプロセス管理機構28へのプロセス起動通知に対して、ステップS1で起動要求イベントから起動対象プロセス識別子を取り出す。ステップS2で、プロセス実行条件テーブル31およびプロセス状態テーブル33からこの起動対象プロセス識別子34に対応する実行可能モード41と、プロセス状態35とを取り出す。次に、ステップS3で当該プロセスが実行中か否かを判定し、実行中であった場合はステップS4で当該プロセスが非実効状態になるまで待つ。ステップS3での判定で当該プロセスが非実効状態になると、ステップS5でモード管理テーブル30から自計算機の現在モード38を取り出す。その後、ステップS6で遷移中フラグ39がOFF、かつ取り出した現在モード38が自計算機実行可能モード41に含まれるか否かを判定する。
この判定結果、含まれない場合はステップS30で利用者通知機能43へ非起動を通知し終了となり、一方、ステップS6での判定結果、含まれる場合はステップS7で同一モード条件他計算機種別42に定義されている計算機種別について繰り返し処理を判定する。繰り返し処理が完了している場合、ステップS8で当該プロセスを起動し、プロセス状態テーブル33を更新する。ステップS7の判定で繰り返し処理が未完了の場合、ステップS9でモード管理テーブル30から定義された他計算機種別のすべての計算機における現在モード38を取り出す。その後、ステップS10で遷移中フラグ39がOFF、かつ現在モード38が自計算機の現在モード38と同一の計算機が存在しているか否かを判定し、存在しない場合はステップS31で利用者通知機能43へ非起動を通知し終了となり、一方、ステップS6での判定結果、存在している場合は、ステップS7に戻って処理を繰り返し、ステップS10で遷移中フラグ39がOFF、かつ現在モード38が自計算機の現在モード38と同一の計算機全てについて完了するまで行う。モード遷移時のプロセス停止時のケースについては、利用者通知機能43に対して通知を行う処理を追加するが、その追加箇所はプロセス停止を行うタイミングで明確なため、フローチャートへの記載を省略する。
図11は、本発明のさらに他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。
上述の場合とは逆に一定周期で動作するプロセスが、他の計算機のデータベースをリモートアクセスしているような場合において、他の計算機が実行計算機と同一モードでなくなった際に、この利用者通知機能43による通知が行われると通知が頻発して煩わしくなる。これを改良するために、プロセス毎に通知要否フラグを予め定義させ、この定義に基づいて利用者20へ通知するかどうかを決定できる仕組みを構成すると良い。
そこで、図11に示すようにプロセス毎の利用者通知要否を設定するための利用者通知条件テーブル44を設けている。この利用者通知条件テーブル44は、プロセス識別子34と利用者通知要否45をそれぞれ定義するものであり、プロセス実行条件テーブル31と同様にプロセス登録者がプロセス登録機能32を用いてシステムに登録する。本実施の形態では、プロセス実行条件テーブル31と利用者通知条件テーブル44を別テーブルとしたが、どちらのテーブルもプロセス識別子34毎のテーブルであり、プロセス登録者がプロセス登録機能32を用いてこれらの内容を同時にシステムに登録することが望ましいため、これらテーブル31,44の内容を一つのテーブルの別カラムとして実装することもできる。
プロセス管理機構28の処理動作は、プロセスに対して利用者20への通知の実行が必要になった時点で、利用者通知条件テーブル44の通知条件発生プロセスに対応する利用者通知要否45を判断して、要の場合にのみ利用者通知機能43へ通知を行うことによって容易に実現できる。また、利用者20への通知の実行は、プロセスが起動できない場合と、実行中のプロセスを停止させる場合とがあり、これら二つのケースを区分して通知要否を変えることはできないが、例えば、利用者通知条件テーブル44にそれぞれのケース毎の利用者通知要否情報を定義することにより、二つのケースで通知要否を分けることも容易に実現できる。
図12は、本発明のさらに他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。
利用者通知機能43は、上述のようにプロセス毎にプロセスの特性によって通知要否を決定できるようにしている。しかしながら、例えば、運転モードを手動で明示的に切り替える際においては、複数の実行中のプロセスを停止させるため、大量に利用者通知が行われる可能性がある。一方で、計算機の障害などによって自動的に運転モードが変更された場合などには、即座に利用者に通知しなければならない。これらの要求に対して、運転モード遷移の種別つまり自動か手動かに応じて利用者通知を実施するかどうかを定義させ、その定義に従って利用者通知を行う機能と、利用者が明示的に指示している間は利用者通知を抑止する機能を持たせることができる。
そこで図示のように計算機種別毎に複数定義するようにしたモード遷移通知マトリックス46を追加し、このモード遷移通知マトリックス46への情報設定は、通知マトリックス設定機能47により実施するようにしている。このモード遷移通知マトリックス46は、計算機の運転モード遷移によって遷移する遷移先モード40と、当該モードへの遷移方法すなわち自動モード遷移47か手動モード遷移48かによって、モード遷移によって発生するプロセス停止に伴う利用者通知要否45を定義するようにしている。
プロセス管理機構28の処理動作としては、構成制御ミドルウェア21からのモード遷移開始通知を受けた際に、併せて、モード遷移発生計算機とモード遷移種別とを受け取る。この結果で、モード管理テーブル30を参照して遷移先モード40を求める。これら三つのパラメータを用いてモード遷移通知マトリックス46を参照し、利用者通知の有無を決定する。その結果に基づき、利用者通知が必要なモード遷移の場合、プロセスを停止する際に利用者通知機能43に対して利用者通知を実施する。
さらに、通知抑止フラグ49を設け、このフラグ49は、利用者によって通知抑止・解除機能50を用いて設定するようにしており、利用者が必要に応じて利用者通知機能43を抑止するための情報設定を可能としている。プロセス管理機構28の処理動作としては、モード遷移に伴ってプロセスを停止する際に、通知抑止フラグ49が抑止状態でない場合には利用者通知機能43を用いて利用者に通知し、一方、通知抑止フラグ49が抑止状態の場合には利用者通知機能43を用いての利用者への通知を抑止する。
上述した本発明による多重系分散型計算機システムによれば、当該プロセスは、当該プロセスの機能がまっとうできる計算機モードでのみ動作するため、分散データベースの配置や連係プロセスの配置先が自計算機と異なるケースにおいて、他の計算機が機能を全うするための操作モードになっていないことによるエラー処理などを考慮した処理プログラミングを行わなくてよくなるため、処理ロジックが単純化し、生産性、保守性、信頼性の向上が図れるとともに、分散データベースの配置や連係プロセスの配置先の変更に対しても影響の少ない処理プログラムにすることができ、ソフトウェアとしてのライフサイクルが向上する。また、計算機のモード遷移などによって機能がまっとうできない場合において処理が動作するといった無駄な処理を排除できる。さらに各計算機のモード遷移時に発生するタイミングに起因して発生する各種の動作上の問題も、分散プロセス管理機構28が適切にプロセスを停止/起動管理することによって、排除・回避することが可能になり、結果として、計算機システムのトータルとしての品質や信頼性の向上が図れる。
一方、計算機システムの利用者にとって、計算機に要求した機能が動作しない場合には、何等かの通知が必要になる場合があり、一方で、これをプロセスごとに全て通知すると、利用者からの要求に基づいて動作する機能以外の機能、例えば、周期的にデータを自動収集したりする保存したりする自動機能については、これが通知されると通知情報量が非常に多くなり逆にわずらわしい通知が増えてしまう。しかしながら、上述した多重系分散型計算機システムによれば、プロセスの機能によって通知を決定できる機能、運転モード遷移の種類、あるいは、利用者からの一時的な通知抑止機能が実現され、利用者の真の目的に応じた通知が実現することができる。
本発明は上述した実施の形態における多重系分散型計算機システム以外にも、同一機能を有する計算機が多重系構成をなす分散型計算機システムとなっており、各計算機の運転モードによって、プロセス毎の動作可否や複数プロセス間の連係による機能の実現可否が規定され、またプロセスが、データベース管理システムのリモートアクセス機能を用いて自プロセスの動作する計算機以外の他の計算機システム上に配置されたデータベースをアクセスする形態を有し、データベースが配置された他の計算機の運転モードが自計算機と連係可能な運転モード以外の場合に、データベースのリモートアクセスが抑止される形態を持ち、かつ、当該データベースをアクセスできないときには当該プロセスの機能が実現できなくなる可能性を持つ他の多重系分散型計算機システムにも適用することができる。
本発明の一実施の形態による分散型計算機システムを示す概略構成図である。 図1に示した多重系分散型計算機システムにおける各計算機のソフトウェア構成を示すブロック構成図である。 図1に示した多重系分散型計算機システムの運転モードに基づくプロセス管理を実現するためのソフトウェア構成を示すブロック図である。 図3に示したソフトウェア構成におけるモード管理テーブルを示す説明図である。 図3に示したソフトウェア構成におけるプロセス実行条件テーブルを示す説明図である。 図3に示したソフトウェア構成におけるプロセス起動通知があった際のプロセス管理機構の処理動作を示すフローチャートである。 図3に示したソフトウェア構成におけるモード遷移開始の通知があった場合のプロセス管理機構の処理動作を示すフローチャートである。 図3に示したソフトウェア構成におけるモード遷移終了の通知があった場合のプロセス管理機構の処理動作を示すフローチャートである。 本発明の他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。 図9に示したソフトウェア構成におけるプロセス管理機構のプロセス起動通知時の処理動作を示すフローチャートである。 本発明のさらに他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。 本発明のさらに他の実施の形態による多重系分散型計算機システムのソフトウェア構成を示すブロック構成図である。
符号の説明
21 構成制御ミドルウェア
22 分散プロセス管理ミドルウェア
24 プロセス
28 プロセス管理機構
30 モード管理テーブル
31 プロセス実行条件テーブル
32 プロセス登録機能
33 プロセス状態テーブル
43 利用者通知機能
44 利用者通知条件テーブル
46 モード遷移通知マトリックス
47 通知マトリックス
49 通知抑止フラグ
50 通知抑止・解除機能

Claims (8)

  1. ネットワークを介して少なくとも一部を多重化した複数の計算機を接続した分散型計算機システムの複数プロセス管理方法であって、
    各計算機は、
    他計算機とネットワークを介してつながり現在の運転モードを互いにやりとりする、自計算機に実装されている各プロセスの管理を行うプロセス管理機構と、自計算機に実装されている各プロセスの実行条件となる、自計算機の必要とする運転モードと他計算機が同時に同一運転モードでなくてはならないことを示す同一モード条件他計算機種別とを格納するプロセスの実行条件テーブルと、自計算機に実装されている各プロセスが現在実行中か非実行中かを示す実行状態を格納するプロセス状態テーブルと、自計算機の現在の運転モード及び上記他計算機から送られてくる現在の他計算機の運転モードとをそれぞれ自他計算機別に対応して格納するモード管理テーブルとを備え、
    上記プロセス管理機構は、
    起動要求イベントから起動対象プロセス識別子を取り出し、上記実行条件テーブルからこの識別子のプロセスの実行条件である、自計算機の必要とする運転モード並びに同一モード条件他計算機種別の読み出し、並びに上記識別子のプロセスが現在実行中か非実行中かを上記プロセス状態テーブルからの読み出しを行い、
    当該プロセスが非実行中であるか実行終了後の非実行中になっているかの条件、及び上記読み出した同一モード条件他計算機種別について上記モード管理テーブルを参照してその計算機種別の現在の運転モードが同一運転モードであることの条件、の成立により当該プロセスを起動させるものとした分散型計算機システムの複数プロセス管理方法。
  2. 請求項1記載のものにおいて、上記プロセス管理機構は、上記各計算機から送られてくる運転モードに変化が生じた場合のこの変化後の運転モードが、当該計算機上で実行中の各プロセスに対して、実行条件テーブル内の同一モード条件他計算機種別の運転モード条件でないとき、当該プロセスを停止させることを特徴とする分散型計算機システムの複数プロセス管理方法。
  3. 請求項1記載のものにおいて、上記プロセス管理機構は、上記他計算機の運転モードの遷移が過渡状態にある期間中に、その遷移先モードと遷移元モードに対して、当該計算機上で実行中のプロセスに対して、実行条件テーブル内の同一モード条件他計算機種別の運転モード条件でないとき、運転モードの遷移の過渡状態である期間中に当該プロセスを一時的に動作を中断停止させ、過渡状態から回復したときに再開させることを特徴とする分散型計算機システムの複数プロセス管理方法。
  4. 請求項1に記載のものにおいて、上記プロセス管理機構は、プロセスに対する起動要求があった際に上記条件の不成立により起動不可のときにその旨を、当該計算機システム利用者に通知手段を介して通知を行うようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法。
  5. 請求項2又は3の記載のものにおいて、上記プロセス管理機構は、上記停止の際にその旨を、当該計算機システム利用者に通知手段を介して通知を行うようにした分散型計算機システムの複数プロセス管理方法。
  6. 請求項4又は5記載のものにおいて、上記プロセス管理機構は、プロセス毎の上記通知を行うかどうかを予め定めたデータに従って、通知が必要なプロセスに対してのみ上記通知手段を介して通知を行うようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法。
  7. 請求項5又は請求項6に記載のものにおいて、上記プロセス管理機構は、予め規定された通知抑止用に設定された計算機の運転モード変更に基づいて、当該運転モードへの変化の際に上記通知を抑止するようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法。
  8. 請求項4〜6のいずれか一つに記載のものにおいて、上記通知を一時的に抑止したり、再開したりすることを優先的に決定する入力手段を設け、この入力手段により抑止を入力したとき上記通知を抑止するようにしたことを特徴とする分散型計算機システムの複数プロセス管理方法
JP2004147833A 2004-05-18 2004-05-18 分散型計算機システムのプロセス管理方法 Expired - Fee Related JP4137004B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004147833A JP4137004B2 (ja) 2004-05-18 2004-05-18 分散型計算機システムのプロセス管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004147833A JP4137004B2 (ja) 2004-05-18 2004-05-18 分散型計算機システムのプロセス管理方法

Publications (2)

Publication Number Publication Date
JP2005332057A JP2005332057A (ja) 2005-12-02
JP4137004B2 true JP4137004B2 (ja) 2008-08-20

Family

ID=35486702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004147833A Expired - Fee Related JP4137004B2 (ja) 2004-05-18 2004-05-18 分散型計算機システムのプロセス管理方法

Country Status (1)

Country Link
JP (1) JP4137004B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008026954A (ja) * 2006-07-18 2008-02-07 Mitsubishi Electric Corp 運用管理システム及び運用管理サーバ装置及び運用管理方法及び運用管理プログラム及び管理対象ノード
JP2011054033A (ja) * 2009-09-03 2011-03-17 Toshiba Corp 監視制御装置
WO2013072975A1 (ja) * 2011-11-18 2013-05-23 株式会社日立製作所 計算機システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2005332057A (ja) 2005-12-02

Similar Documents

Publication Publication Date Title
US7062676B2 (en) Method and system for installing program in multiple system
US8245077B2 (en) Failover method and computer system
CN109446169B (zh) 一种双控磁盘阵列共享文件系统
CN110874261B (zh) 可用性系统、方法和存储有程序的存储介质
CN104951308B (zh) Docker Registry的管理优化方式及装置
CN107947976A (zh) 故障节点隔离方法及集群系统
CN109639818B (zh) 一种云环境下的服务发现方法、装置、服务器和存储介质
CN109298962A (zh) 定时任务的监控方法、计算机可读存储介质和终端设备
CN106657167A (zh) 管理服务器、服务器集群、以及管理方法
CN112199240A (zh) 一种节点故障时进行节点切换的方法及相关设备
CN113626280A (zh) 集群状态控制方法、装置、电子设备及可读存储介质
US20050154829A1 (en) Storage system and storage system management method
EP2110748A2 (en) Cluster control apparatus, control system, control method, and control program
JP4137004B2 (ja) 分散型計算機システムのプロセス管理方法
CN115964142A (zh) 应用服务的管理方法、设备及存储介质
JP2001027951A (ja) マルチプロセッサ構成の情報処理システムにおけるファイルロード装置と記録媒体
JPH0683657A (ja) サービスプロセッサの切り換え方式
CN114691304A (zh) 实现集群虚拟机高可用的方法和装置、设备和介质
JP2014215622A (ja) プラント監視システム及びプラント監視方法
Cisco Operational Traps
CN103176909A (zh) 一种业务处理方法及其系统
US9037715B2 (en) Method for semantic resource selection
JPH11242607A (ja) 分散監視制御システムとそのデータベース切替え方法
JP2019032709A (ja) 分散システム
CN110231961B (zh) 一种主控板重启的控制方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080603

R150 Certificate of patent or registration of utility model

Ref document number: 4137004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees