JPH0778037A - Decentralized processing system - Google Patents

Decentralized processing system

Info

Publication number
JPH0778037A
JPH0778037A JP5223652A JP22365293A JPH0778037A JP H0778037 A JPH0778037 A JP H0778037A JP 5223652 A JP5223652 A JP 5223652A JP 22365293 A JP22365293 A JP 22365293A JP H0778037 A JPH0778037 A JP H0778037A
Authority
JP
Japan
Prior art keywords
computer
processing system
scheduled
distributed processing
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5223652A
Other languages
Japanese (ja)
Inventor
Masahiko Saito
雅彦 齊藤
Masaru Shimada
優 島田
Takanori Yokoyama
孝典 横山
Satoru Murata
悟 村田
Tomoaki Nakamura
智明 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5223652A priority Critical patent/JPH0778037A/en
Publication of JPH0778037A publication Critical patent/JPH0778037A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PURPOSE:To exerts influence on none of other computers as much as possible when one computer is stopped and restarted by managing the stop scheduled time and restart scheduled time of the computer. CONSTITUTION:The decentralized processing system wherein plural computers 111-115 are connected to a network 12 has at least one management program 14 which manages the stop scheduled time and restart scheduled time of the respective computers 111-115 in the decentralized processing system. Consequently, when the time from the stop to the restart of a computer is within a relatively short scheduled period, this computer seems not to stop to other computers.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数の計算機がネット
ワークに接続され、複数のプログラムを協調して実行す
る分散処理システムに関連し、特に、分散処理システム
内の計算機の保守・拡張等による停止/再開を管理する
手段を有した分散処理システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a distributed processing system in which a plurality of computers are connected to a network and execute a plurality of programs in a coordinated manner. In particular, the invention relates to maintenance and expansion of computers in the distributed processing system. The present invention relates to a distributed processing system having means for managing stop / resume.

【0002】[0002]

【従来の技術】複数の計算機を有する分散処理システム
においては、各計算機上のプログラムが協調して処理を
実行する。このような分散処理システムにおいては、保
守・拡張等によって個別に計算機の停止/再開が起こる
可能性があり、これが分散処理システム全体に影響を与
えないようにすることが重要である。単に個別に計算機
を停止させるだけでは、例えば、該計算機上で動作して
いたプログラムに対して通信を行っていたプログラムは
その返答を得ることができない。このため、一つの計算
機の停止が分散処理システム内の他の計算機に影響を与
えることになる。
2. Description of the Related Art In a distributed processing system having a plurality of computers, programs on each computer cooperate to execute processing. In such a distributed processing system, there is a possibility that individual computers will be stopped / restarted due to maintenance / expansion, etc. It is important to prevent this from affecting the entire distributed processing system. By simply stopping the computer individually, for example, the program communicating with the program operating on the computer cannot obtain the reply. Therefore, the suspension of one computer affects other computers in the distributed processing system.

【0003】従来、このような分散処理システム内にお
いて、一つの計算機の停止が他に影響を与えないように
するものとして、例えば、特開昭62−292564号
公報がある。これは、従前において、分散処理システム
内のある機器が停止する際に、その停止期間中はシステ
ム内の全機器に対する故障検知機能を停止させていたの
を改善し、その停止時間帯を認識できるようにして、そ
の場所に対する故障検知機能のみを停止させ、他の機器
に対する故障検知機能は働くようにしたものである。
Conventionally, in such a distributed processing system, there is, for example, Japanese Patent Application Laid-Open No. 62-292564 as a device for preventing the stoppage of one computer from affecting the other. This improves the fact that when a certain device in the distributed processing system stopped, the failure detection function for all devices in the system was stopped during the stop period, and the stop time zone can be recognized. In this way, only the failure detection function for that place is stopped, and the failure detection function for other devices is activated.

【0004】[0004]

【発明が解決しようとする課題】しかし、前記従来技術
では、単に保守管理システム(故障検知ハードウエア)
が停止中でない機器に対する故障検知を続けるようにす
ることのみが目的になっている。しかしながら、分散処
理システム内の各計算機の中には、定期保守/バージョ
ンアップ/主電源工事等によって、予め定められた時刻
から時刻までの間計算機を停止することがある。このよ
うな状況において、計算機停止前に予め他計算機に停止
予定と再開予定時刻とを知らせることが必要であるし、
また、計算機の停止から再開までが比較的短期間で済む
場合には、停止しようとする計算機上で動作しているプ
ログラムを一時停止させて計算機再開後に再起動させる
こと等、該計算機があたかも停止していないように他計
算機に見せることが望ましいが、このような状況に対し
て前記従来技術では対処することができない。
However, in the above-mentioned prior art, the maintenance management system (fault detection hardware) is simply used.
Its only purpose is to continue fault detection for equipment that is not down. However, among the computers in the distributed processing system, the computers may be stopped from a predetermined time to the time due to regular maintenance / version upgrade / main power supply work, etc. In such a situation, it is necessary to notify other computers of the scheduled stop and the scheduled restart time in advance before stopping the computer.
If the computer can be stopped and restarted in a relatively short period of time, the program running on the computer to be stopped may be temporarily stopped and restarted after the computer is restarted. It is desirable to make it appear to other computers as if not, but such a situation cannot be dealt with by the conventional technology.

【0005】本発明の目的は、計算機の停止予定時刻/
再開予定時刻を管理して、一つの計算機の停止/再開が
できる限り他計算機に影響を与えないようにすることに
あり、特に、計算機の停止から再開までが比較的短い予
め定められた期間で済む場合においては、該計算機があ
たかも停止していないように他計算機に見せることがで
きるようにすることにある。
An object of the present invention is to estimate a computer's scheduled stop time /
It is to manage the scheduled restart time so that one computer can be stopped / restarted so as not to affect other computers as much as possible, and especially, it is a relatively short predetermined period from the stop to the restart of the computer. In the case where it is completed, the other computer should be able to appear as if the computer is not stopped.

【0006】[0006]

【課題を解決するための手段】前記目的を達成するため
に本発明は、分散処理システム内の各計算機の停止予定
時刻と再開予定時刻とを管理する管理プログラムを有す
る。さらにその管理プログラムは、分散処理システム内
のプログラムの起動の管理、分散処理システム内のプロ
グラムの一時停止/再起動の管理、分散処理システム内
のプログラム間の通信の管理、分散処理システム内の計
算機間で行なわれる処理の管理等の少くとも一つの管理
をする。該管理プログラムは予定管理テーブルを有し、
各計算機の停止予定時刻と再開予定時刻とを記憶する。
In order to achieve the above object, the present invention has a management program for managing scheduled stop times and restart scheduled times of each computer in a distributed processing system. In addition, the management program includes management of program startup in the distributed processing system, management of suspension / restart of programs in the distributed processing system, management of communication between programs in the distributed processing system, computers in the distributed processing system. At least one management such as management of processing performed between the two is performed. The management program has a schedule management table,
The scheduled stop time and the scheduled restart time of each computer are stored.

【0007】また、前記目的を達成するため、本発明
は、別の方法として、分散処理システム内の全計算機上
に各計算機の停止予定時刻と再開予定時刻を管理する計
算機管理プログラムを有する。さらにその計算機管理プ
ログラムは、分散処理システム内のプログラムの起動の
管理、分散処理システム内のプログラムの一時停止/再
起動の管理等の管理をする。該計算機管理プログラムは
予定管理テーブルを有し、各計算機の停止予定時刻と再
開予定時刻とを記憶する。
In order to achieve the above-mentioned object, the present invention has, as another method, a computer management program for managing scheduled stop times and scheduled restart times of each computer on all computers in the distributed processing system. Further, the computer management program manages the start-up of programs in the distributed processing system and the temporary stop / restart of programs in the distributed processing system. The computer management program has a schedule management table and stores the scheduled stop time and the scheduled restart time of each computer.

【0008】[0008]

【作用】前記の本発明によれば、前記管理プログラムが
分散処理システム内のプログラムの起動を管理し、停止
予定時刻が近付いている計算機でのプログラム起動を行
わせないし、また、再開予定時刻が近付いている計算機
で動作可能なプログラムの起動を該再開予定時刻まで遅
延させる。該管理プログラムは、さらにまた、分散処理
システム内のプログラムの一時停止/再起動を管理し、
各計算機で動作しているプログラムを停止予定時刻前に
一時停止させ、再開予定時刻後に該プログラムの再起動
を行う。該管理プログラムは、さらにまた、分散処理シ
ステム内のプログラム間の通信を管理し、停止中の計算
機で動作しているプログラムに対する通信を該計算機の
再開予定時刻後まで遅延させる。該管理プログラムは、
さらにまた、分散処理システム内の計算機間で行なわれ
る処理を管理し、停止中の計算機もしくは該計算機上の
プログラム、オペレーティングシステムに対する処理を
該計算機の再開予定時刻後まで遅延させる。
According to the present invention, the management program manages the start-up of the program in the distributed processing system, does not start the program on the computer whose scheduled stop time is approaching, and the scheduled restart time is The start of the program operable by the approaching computer is delayed until the scheduled restart time. The management program also manages suspension / restart of programs in the distributed processing system,
The program running on each computer is temporarily stopped before the scheduled stop time, and the program is restarted after the scheduled restart time. Furthermore, the management program manages communication between programs in the distributed processing system, and delays communication with a program running on a stopped computer until after the scheduled restart time of the computer. The management program is
Furthermore, the processing performed between the computers in the distributed processing system is managed, and the processing for the stopped computer, the program on the computer, or the operating system is delayed until after the scheduled restart time of the computer.

【0009】また、前記計算機管理プログラムは分散処
理システム内のプログラムの起動を管理し、停止予定時
刻が近付いている計算機でのプログラム起動を行わせな
いし、また、再開予定時刻が近付いている計算機で動作
可能なプログラムの起動を該再開予定時刻まで遅延させ
る。該計算機管理プログラムは、さらにまた、当該計算
機上のプログラムの一時停止/再起動を管理し、該計算
機で動作しているプログラムを停止予定時刻前に一時停
止させ、再開予定時刻後に該プログラムの再起動を行
う。
Further, the computer management program manages the start-up of the program in the distributed processing system, does not start the program on the computer whose scheduled stop time is approaching, and does not start the program on the computer whose scheduled stop time is approaching. The activation of the operable program is delayed until the scheduled restart time. The computer management program also manages suspension / restart of the program on the computer, suspends the program running on the computer before the scheduled stop time, and restarts the program after the scheduled restart time. Start up.

【0010】これらによって、計算機の停止から再開ま
でが比較的短い予め定められた期間で済む場合において
は、該計算機があたかも停止していないように他計算機
に見せることが可能となる。
[0010] With this, when the computer is stopped and restarted in a relatively short predetermined period, the computer can be made to appear to other computers as if they were not stopped.

【0011】[0011]

【実施例】本発明の一実施例を図面を用いて説明する。
図13に本発明の一実施例である分散処理システムの概
略について示す。複数の計算機が通信バス等のネットワ
ークに接続され、各計算機上のプログラムが互いに通信
を行って動作する。111〜115は計算機であり、該
複数の計算機上で複数のプログラムが協調して動作す
る。図中では5台の計算機が接続されたシステム構成と
なっているが、これ以上若しくはこれ以下の計算機数で
システムを構築することは可能である。12は通信バ
ス、光ファイバ、クロスバ通信網等のネットワークであ
る。各計算機上のプログラムはネットワーク12を介し
て互いに通信を行う。131〜137はユーザプログラ
ムであり、単独で若しくは互いに協調して処理を実行す
る。14は管理プログラムであり、本分散処理システム
内の計算機の停止/再開を集中して管理する役割を有す
る。さらに、管理プログラム14は分散処理システム内
のプログラム起動、通信を管理する。このため、各ユー
ザプログラムはプログラム起動、通信等の処理を行いた
いとき、直接処理を行うのではなく、管理プログラムに
処理を依頼するものとする。管理プログラムがこれらの
処理の代行を行う。
An embodiment of the present invention will be described with reference to the drawings.
FIG. 13 shows an outline of a distributed processing system which is an embodiment of the present invention. A plurality of computers are connected to a network such as a communication bus, and programs on each computer communicate with each other to operate. Reference numerals 111 to 115 are computers, and a plurality of programs operate in cooperation on the plurality of computers. Although a system configuration in which five computers are connected is shown in the figure, it is possible to construct a system with more or less computers. Reference numeral 12 is a network such as a communication bus, an optical fiber, and a crossbar communication network. The programs on each computer communicate with each other via the network 12. Reference numerals 131 to 137 are user programs, which execute processing independently or in cooperation with each other. Reference numeral 14 denotes a management program, which has a role of centrally managing stop / restart of computers in the distributed processing system. Further, the management program 14 manages program activation and communication in the distributed processing system. Therefore, when each user program wants to perform processing such as program activation and communication, it does not directly perform the processing but requests the management program for the processing. The management program acts on behalf of these processes.

【0012】図1に、計算機内部を更に詳しく記述した
分散処理システムの構成図を示す。図1中、計算機11
1〜115、ネットワーク12、ユーザプログラム13
1〜137、管理プログラム14は図13と同一であ
る。各計算機は中央処理装置15、主記憶装置16、入
出力制御装置17等から構成され、内部バス18を用い
てデータの授受を行う。入出力制御装置17は、通常、
ディスク等の外部記憶装置171、端末172と接続さ
れ、外部とのデータのやり取りを行う。主記憶装置16
上にはユーザプログラム131〜137、管理プログラ
ム14が存在し、中央処理装置15によって処理される
が、一般には、オペレーティングシステム161が存在
して、計算機上の各プログラムを管理している。
FIG. 1 shows a block diagram of a distributed processing system in which the inside of a computer is described in more detail. In FIG. 1, computer 11
1-115, network 12, user program 13
1 to 137 and the management program 14 are the same as those in FIG. Each computer is composed of a central processing unit 15, a main storage unit 16, an input / output control unit 17, etc., and exchanges data using an internal bus 18. The input / output control device 17 is usually
It is connected to an external storage device 171, such as a disk, and a terminal 172, and exchanges data with the outside. Main memory 16
User programs 131 to 137 and a management program 14 are present on the top and are processed by the central processing unit 15. Generally, an operating system 161 is present to manage each program on the computer.

【0013】分散処理システムを管理する管理プログラ
ム14の行う処理の種類は少なくとも以下の4つを含
む。 (1)各計算機(自己の存在する計算機を含む)の停止
予定時刻/再開予定時刻を管理する:図2に示す予定管
理テーブル21を有して管理する。 (2)各計算機上でのプログラム起動/終了を管理す
る:ユーザまたはプログラムの要求にしたがって各計算
機上でプログラムを起動/終了させる。このとき、停止
予定時刻が近付いている計算機にはプログラムの起動を
行わせない。さらに、再開予定時刻の近付いている計算
機がある場合、該予定時刻の到来を待ってプログラムの
起動を行わせる。 (3)各計算機上でのプログラム一時停止/再起動を管
理する:停止予定の近付いている計算機が存在する場
合、停止予定時刻前に、該計算機上で動作しているプロ
グラムの実行状況を該計算機の外部記憶装置に記憶して
一時停止させ、再開予定時刻後に記憶された実行状況を
用いてプログラムを再起動する。 (4)各計算機上のプログラムへの通信を管理する:停
止中の計算機に存在するプログラムへの通信を該計算機
の再開予定時刻まで遅延させる。
The types of processing performed by the management program 14 that manages the distributed processing system include at least the following four types. (1) Managing scheduled stop time / restart scheduled time of each computer (including the computer in which it exists): It manages by having the schedule management table 21 shown in FIG. (2) Manage program start / end on each computer: Start / end the program on each computer according to the user's or program's request. At this time, the computer whose scheduled stop time is approaching does not start the program. Further, if there is a computer near the scheduled restart time, the program is started after waiting for the scheduled time. (3) Managing program suspension / restart on each computer: When there is a computer that is scheduled to be stopped, the execution status of the program running on that computer is checked before the scheduled stop time. The program is restarted by using the execution status stored after being stored in the external storage device of the computer and temporarily stopped, and after the scheduled restart time. (4) Managing the communication to the program on each computer: Delay the communication to the program existing in the stopped computer until the scheduled restart time of the computer.

【0014】図2に管理プログラム14が分散処理シス
テム内の計算機の停止/再開を管理するためのデータ構
造(予定管理テーブル21)の一実施例を示す。この例
では、保守、バージョンアップ、バックアップ等のよう
に予め定められた時刻に停止/再開を行う場合に、各計
算機の次の停止予定時刻/再開予定時刻を予定管理テー
ブルに記憶する。予定管理テーブル中、欄211は分散
処理システム内に存在する計算機を全て含む。欄21
3、214が各計算機の次の停止予定時刻、再開予定時
刻を示す。全ての計算機について予め停止/再開の時刻
が定められているとは限らず、予定時刻が不確定な場合
には、何も記憶されない。
FIG. 2 shows an embodiment of a data structure (schedule management table 21) for the management program 14 to manage suspension / resumption of computers in the distributed processing system. In this example, when the suspension / restart is performed at a predetermined time such as maintenance, version upgrade, backup, etc., the next scheduled stop time / restart scheduled time of each computer is stored in the schedule management table. In the schedule management table, the column 211 includes all computers existing in the distributed processing system. Column 21
3, 214 indicates the next scheduled stop time and restart scheduled time of each computer. The stop / restart time is not necessarily set in advance for all computers, and if the scheduled time is indeterminate, nothing is stored.

【0015】なお、ここに記憶される予定時刻は正確に
は計算機が停止する時刻/再開する時刻ではない。上述
したように、計算機停止前に該計算機上で動作している
プログラムの一時停止処理を行わなければならない。ま
た、分散処理システム内の計算機間での時刻のずれも考
慮しておく必要がある。一時停止処理に要する時間をT
s、計算機間での時刻のずれの最大見積りをTdとする
と、正確な停止予定時刻Tから算出される以下の値T’
が欄213に記憶される。 T’=T−Ts−Td 再開予定時刻の場合、分散処理システム内の計算機間で
の時刻のずれだけが問題となる。したがって、正確な再
開予定時刻Tに対して、以下の値T’が欄214に記憶
される。 T’=T+Td 予定時刻の設定は、予定時刻の変更が行われる度に、シ
ステム全体の管理者が直接管理プログラム14に入力す
るか、個々の計算機(の管理者)がネットワーク12を
介して管理プログラム14に通知し、管理プログラム1
4が更新するという方式をとるものとする。欄212は
各計算機が停止しているか稼動しているかの状態を示す
データである。計算機の状態が稼動中であれば、該計算
機は次に停止予定時刻欄213に示されている時刻に停
止し、その後、再開予定時刻欄214に示されている時
刻に再開される。計算機の状態が停止中であれば、該計
算機は次に再開予定時刻欄214に示されている時刻に
再開され、その後、停止予定時刻欄213に示されてい
る時刻に停止する。
The scheduled time stored here is not exactly the time when the computer is stopped or the time when the computer is restarted. As described above, before the computer is stopped, the process of suspending the program running on the computer must be performed. In addition, it is necessary to consider the time difference between the computers in the distributed processing system. The time required for the suspension process is T
s, the maximum estimated time difference between computers is Td, the following value T ′ calculated from the accurate scheduled stop time T
Is stored in the column 213. T ′ = T−Ts−Td In the case of the scheduled restart time, only the time difference between the computers in the distributed processing system becomes a problem. Therefore, the following value T ′ is stored in the column 214 with respect to the accurate scheduled restart time T. T ′ = T + Td The scheduled time is set by the administrator of the entire system directly entering the management program 14 each time the scheduled time is changed, or the individual computer (administrator) manages it via the network 12. Notify program 14 and manage program 1
4 is used for updating. The column 212 is data indicating the state of whether each computer is stopped or operating. If the state of the computer is in operation, the computer is next stopped at the time shown in the scheduled stop time column 213 and then restarted at the time shown in the scheduled restart time column 214. If the computer is in the stopped state, the computer is restarted at the next time indicated in the scheduled restart time column 214 and then stopped at the time indicated in the scheduled stop time column 213.

【0016】管理プログラム14は、さらに各計算機上
でのプログラム起動/終了を管理するために、予定管理
テーブル21内にプログラムテーブル22を有する。プ
ログラムテーブル内の各エントリは対応する計算機上で
動作中のプログラムのリスト(計算機別プログラムリス
ト)を持つ。図13に示したプログラム配置の場合、図
2に示す計算機別プログラムリスト構成となる。計算機
別プログラムリストの各エントリはプログラムの名称2
21および状態222から構成される。状態222はそ
れぞれのプログラムが稼動中か一時停止中かのいずれか
を示す。計算機の停止予定時刻が近付いた場合、該計算
機上で動作中のプログラムの実行状況を外部記憶装置に
記憶して一時停止させるので、このとき、対応するエン
トリ内の状態を一時停止状態に変更する。逆に、計算機
が再開された場合、一時停止状態であるプログラムの実
行状況を外部記憶装置から読み出して再起動させる。こ
のとき、対応するエントリ内の状態を稼動状態に変更す
る。
The management program 14 further has a program table 22 in the schedule management table 21 in order to manage the start / end of the program on each computer. Each entry in the program table has a list of programs running on the corresponding computer (computer-specific program list). In the case of the program allocation shown in FIG. 13, the computer-specific program list structure shown in FIG. 2 is obtained. Each entry in the computer program list is the program name 2
21 and state 222. A state 222 indicates whether each program is running or is temporarily stopped. When the scheduled stop time of the computer approaches, the execution status of the program running on the computer is stored in the external storage device and temporarily suspended. At this time, the state in the corresponding entry is changed to the suspended state. . Conversely, when the computer is restarted, the execution status of the program in the suspended state is read from the external storage device and restarted. At this time, the state in the corresponding entry is changed to the operating state.

【0017】管理プログラム14は、さらにまた、停止
予定時刻が近付いている計算機若しくは停止している計
算機上でのプログラムの起動、および、該計算機上のプ
ログラムへの通信を遅延させるために、処理待ち行列2
3を有する。処理待ち行列23は停止予定時刻が近付い
ている計算機若しくは停止している計算機に対する処理
であって、かつ、該計算機の再開予定時刻まで遅延させ
ている処理を待ち行列(計算機別処理待ち行列)として
登録しておくためのリストである。計算機別処理待ち行
列の各エントリ231は、通信の仲介処理とプログラム
の起動処理に分類される。通信の仲介処理の場合(図2
中message)、エントリは通信相手のプログラム
と通信内容を示す。プログラムの起動処理の場合(図2
中exec)、エントリは起動すべきプログラムを示
す。
Furthermore, the management program 14 waits for processing in order to delay the start-up of a program on a computer whose scheduled stop time is approaching or the computer that is stopped and the communication to the program on the computer. Matrix 2
Have three. The process queue 23 is a process for a computer whose scheduled stop time is approaching or for a computer that has stopped, and which is delayed until the scheduled restart time of the computer is a queue (computer-specific process queue). This is a list to register. Each entry 231 of the computer-specific processing queue is classified into a communication mediating process and a program starting process. In case of mediation processing of communication (Fig. 2
In the middle message), the entry indicates the program of the communication partner and the communication content. In the case of program startup processing (Fig. 2
Middle exec), the entry indicates the program to be started.

【0018】24は現時刻を示すデータである。図2で
は現時刻24が管理プログラム14の管理下に置かれて
いるが、これをオペレーティングシステムの管理下に置
き、必要な時点で尋ねる方式でもよい。図2の例では、
現時刻が計算機114の停止予定時刻に近付いており、
かつ、計算機112および計算機114の再開予定時刻
自体も近いので、これらの計算機に対して行われた処
理、すなわち、プログラム132へのverifyメッ
セージ通信、プログラム138の起動、プログラム13
5へのprintメッセージ通信、プログラム139の
起動といった処理を処理待ち行列に記憶し、再開予定時
刻まで遅延させている。
Reference numeral 24 is data indicating the current time. In FIG. 2, the current time 24 is placed under the control of the management program 14, but it may be placed under the control of the operating system and inquired at a necessary time. In the example of FIG.
The current time is close to the scheduled stop time of the computer 114,
Further, the scheduled restart times of the computers 112 and 114 are also close to each other, and therefore the processing performed on these computers, that is, the verify message communication to the program 132, the activation of the program 138, the program 13
Processing such as print message communication to 5 and activation of the program 139 is stored in the processing queue and delayed until the scheduled restart time.

【0019】これらの処理を行うための管理プログラム
14の処理フロー31を図3に示す。ただし、この処理
フローでは管理プログラム自身の動作している計算機の
停止/再開を管理できない。管理プログラムの動作して
いる計算機の停止/再開については、図7及び図8並び
に図9の処理フローで導入する。管理プログラムはイベ
ント(事象)の発生によって待ち状態から解除され(処
理314)、処理終了後、再び待ち状態に移行する(処
理313)という流れを有する。待ち状態を解除するイ
ベントは、(a)他計算機からの予定時刻変更通知、
(b)システム全体の管理者からの予定時刻入力、
(c)予定時刻中で最も近い時刻の到来、(d)ユーザ
プログラムからのメッセージの通知とする。これらは処
理315で判定され、各処理モードに移行する。以下、
これらのイベント処理毎に詳細を図4、図5及び図6に
より説明する。なお、管理プログラムでは時刻を表す変
数Tnを用意する。予定管理テーブル21内の予定時刻
で最も時刻的に早いものを選択し(処理311)、Tn
に選択した予定時刻を代入しておく(処理312)。時
刻Tnの到来が上記(c)のイベントの発生を意味す
る。
A process flow 31 of the management program 14 for performing these processes is shown in FIG. However, this processing flow cannot manage stop / restart of the computer in which the management program itself is operating. The stop / restart of the computer on which the management program is operating will be introduced in the processing flows of FIGS. 7, 8 and 9. The management program has a flow of being released from the waiting state due to the occurrence of an event (process 314) and transitioning to the waiting state again after the process is completed (process 313). The event to release the waiting state is (a) a scheduled time change notification from another computer,
(B) Scheduled time input from the administrator of the entire system,
(C) The arrival of the nearest scheduled time, and (d) notification of a message from the user program. These are determined in processing 315, and the processing mode is entered. Less than,
Details of each of these event processes will be described with reference to FIGS. 4, 5 and 6. Note that the management program prepares a variable Tn representing time. The earliest scheduled time in the schedule management table 21 is selected (process 311), and Tn is selected.
The selected scheduled time is substituted in (step 312). The arrival of time Tn means the occurrence of the event (c).

【0020】(a)他計算機からの予定時刻通知(図
4):通知された予定時刻に従って、該当する計算機の
予定管理テーブル21内でのデータを変更する(処理3
21)。これによって、各計算機の停止/再開予定時刻
中で最も近い時刻が変化する可能性がある。このため、
今まで予定時刻中で最も近い時刻として記憶していた時
刻Tnと、変更された予定時刻とを比較する(処理32
2)。記憶している時刻Tnが変更された予定時刻より
も遅ければ、変更された予定時刻を最も近い時刻Tnと
して新たに記憶する(処理323)。停止予定時刻とし
て現時刻を指定すれば、続いてイベント(c)が発生す
ることになり、計算機が直ちに停止することを通知でき
る。
(A) Scheduled time notification from another computer (FIG. 4): According to the notified scheduled time, the data in the schedule management table 21 of the corresponding computer is changed (process 3).
21). As a result, the closest time among the scheduled stop / restart times of each computer may change. For this reason,
The time Tn stored as the closest time among the scheduled times until now is compared with the changed scheduled time (Process 32).
2). If the stored time Tn is later than the changed scheduled time, the changed scheduled time is newly stored as the closest time Tn (process 323). If the current time is designated as the scheduled stop time, the event (c) will subsequently occur, and it can be notified that the computer will stop immediately.

【0021】(b)システム全体の管理者からの予定時
刻入力(図4):予定管理テーブル21中、要求された
予定時刻を変更する(処理331)。
(B) Scheduled time input from the administrator of the entire system (FIG. 4): The requested scheduled time in the schedule management table 21 is changed (process 331).

【0022】(a)の場合と同様に、これによって、各
計算機の停止/再開予定時刻中で最も近い時刻が変化す
る可能性がある。ただし、複数の予定時刻が変更される
可能性があるので、今まで予定時刻中で最も近い時刻と
して記憶していた時刻Tnと、変更された複数個の予定
時刻の中で現在の時刻から最も近いもの選択する(処理
332)。この予定時刻を最も近い時刻Tnとして新た
に記憶する(処理333)。
As in the case of (a), this may change the closest time among the scheduled stop / restart times of each computer. However, since multiple scheduled times may be changed, the time Tn that has been stored as the closest time among the scheduled times until now, and the latest scheduled time from the current time among the changed multiple scheduled times. A close one is selected (process 332). This scheduled time is newly stored as the closest time Tn (process 333).

【0023】(c)予定時刻中で最も近い時刻の到来
(図5):前述(a)(b)等で記憶しておいた時刻T
nが到来すると、管理プログラムがイベント待ち状態か
ら解除される。第一に、これが計算機の停止予定時刻か
再開予定時刻かを調査する(処理341)。停止予定時
刻ならば、該計算機上で動作しているプログラムの実行
状況を該計算機の外部記憶装置に記憶して(処理34
2)一時停止させ(処理343)、予定管理テーブル2
1に該計算機が停止したことを記す(処理344)。再
開予定時刻ならば、該計算機で一時停止中のプログラム
の実行状況を復帰して(処理345)再起動させ(処理
346)、予定管理テーブルに該計算機が再開したこと
を記す(処理347)。さらに、再開予定時刻まで処理
を遅延させるために使用している処理待ち行列23に登
録されているプログラム起動処理、通信仲介処理を行う
(処理348)。この後、到来した予定時刻Tnを予定
管理テーブルから削除し(処理349)、予定管理テー
ブル中で現在の時刻から最も近い予定時刻を選択する
(処理350)。最後に、選択した時刻をTnに設定し
(処理351)、次のイベント発生時刻を設定する。
(C) Arrival of the closest time among scheduled times (FIG. 5): Time T stored in the above (a) and (b).
When n arrives, the management program is released from the event waiting state. First, it is investigated whether this is the scheduled stop time or the scheduled restart time of the computer (process 341). At the scheduled stop time, the execution status of the program running on the computer is stored in the external storage device of the computer (process 34
2) Pause (process 343) and schedule management table 2
It is noted in 1 that the computer has stopped (process 344). At the scheduled restart time, the execution status of the program suspended in the computer is restored (process 345) and restarted (process 346), and the schedule management table indicates that the computer has restarted (process 347). Further, the program activation process and the communication mediation process registered in the process queue 23 used to delay the process until the scheduled restart time are performed (process 348). Then, the arrived scheduled time Tn is deleted from the schedule management table (process 349), and the scheduled time closest to the current time in the schedule management table is selected (process 350). Finally, the selected time is set to Tn (process 351), and the next event occurrence time is set.

【0024】(d)ユーザプログラムからのメッセージ
の通知(図6):管理プログラムがプログラムの起動/
終了、通信を管理するため、プログラムの起動/終了要
求、他プログラムへの通信要求が管理プログラムに対し
て行われる。これらの要求メッセージが届いた場合、メ
ッセージの種類を判定し、種類に応じて処理を実行する
(処理361)。本実施例では、受け付けるメッセージ
の種類を(α)プログラム起動要求、(β)通信要求、
(γ)その他の3種類とする。以下、これらの処理を説
明する。
(D) Message notification from user program (FIG. 6): management program starts / starts program
In order to manage termination and communication, a program start / termination request and a communication request to another program are issued to the management program. When these request messages arrive, the type of message is determined and the process is executed according to the type (process 361). In this embodiment, the types of messages to be received are (α) program start request, (β) communication request,
(Γ) Other three types. Hereinafter, these processes will be described.

【0025】(α)プログラム起動要求の場合、第一
に、起動すべき計算機が停止中、若しくは、停止予定時
刻が近付いているかを調べる(処理362)。この条件
が成立しない場合、通常通りプログラムを起動してよい
(処理363)。処理362で調べた条件が成立する場
合、再開予定時刻までの時間を調べ(処理364)、こ
れが短いならば、処理待ち行列にプログラム起動要求を
登録して、処理を再開予定時刻まで遅延させる(処理3
65)。再開予定時刻までの時間が長ければ、要求者で
あるユーザまたはプログラムにエラーを返して、再開予
定時刻までプログラムの起動ができないことを通知する
(処理366)。
(Α) In the case of a program activation request, first, it is checked whether the computer to be activated is stopped or the scheduled stop time is approaching (process 362). If this condition is not satisfied, the program may be started as usual (process 363). If the condition checked in the process 362 is satisfied, the time to the scheduled restart time is checked (process 364). If this is short, a program start request is registered in the process queue and the process is delayed until the scheduled restart time ( Process 3
65). If the time up to the scheduled restart time is long, an error is returned to the requester user or the program to notify that the program cannot be started until the scheduled restart time (step 366).

【0026】(β)メッセージが通信要求の場合にも、
同様にして、通信相手の計算機が停止中、若しくは、停
止予定時刻が近付いているかを調べる(処理367)。
この条件が成立しない場合、通常通り通信を仲介する
(処理368)。処理367で調べた条件が成立する場
合、処理待ち行列に通信要求を登録して、処理を再開予
定時刻まで遅延させる(処理369)。なお、この場合
にも、再開予定時刻までの時間の長さを調べ、これを基
にしてエラーを通知する方法を採用してよい。
(Β) Even when the message is a communication request,
Similarly, it is checked whether the communication partner computer is stopped or the scheduled stop time is approaching (process 367).
If this condition is not established, communication is mediated as usual (process 368). When the condition checked in the process 367 is satisfied, the communication request is registered in the process queue and the process is delayed until the scheduled restart time (process 369). Also in this case, a method of checking the length of time until the scheduled restart time and notifying an error based on this may be adopted.

【0027】(γ)メッセージがその他の内容を有する
場合、予定管理テーブル21の状態に関係なく処理を行
う(処理370)。
If the (γ) message has other contents, the process is performed regardless of the state of the schedule management table 21 (process 370).

【0028】次に、図7、図8及び図9を用いて、管理
プログラムの動作している計算機の一時停止/再開を可
能にする方法を述べる。図7及び図8は管理プログラム
の動作している計算機の一時停止/再開を可能にするた
めの管理プログラムの処理フロー31を示す。図7及び
図8中、処理311〜315、処理321〜323、処
理331〜333、処理341〜351、および、処理
361〜370は図3、図4、図5及び図6と同一であ
る。一時停止処理41、終了処理42、再起動処理43
が追加されている。一時停止処理41および終了処理4
2は、予定時刻中で最も近い時刻Tnが到来し、かつ、
その時刻が管理プログラムの動作している計算機の停止
予定時刻であった場合、行われる。この条件判定を処理
411で行っている。
Next, with reference to FIGS. 7, 8 and 9, a method for enabling the suspension / resumption of the computer on which the management program is operating will be described. 7 and 8 show a processing flow 31 of the management program for enabling suspension / resumption of the computer on which the management program is operating. 7 and 8, the processing 311 to 315, the processing 321 to 323, the processing 331 to 333, the processing 341 to 351 and the processing 361 to 370 are the same as those in FIG. 3, FIG. 4, FIG. 5 and FIG. Pause process 41, end process 42, restart process 43
Has been added. Pause process 41 and end process 4
2 is the closest time Tn in the scheduled time, and
If the time is the scheduled stop time of the computer on which the management program is operating, it is performed. This condition determination is performed in process 411.

【0029】このとき、該計算機上で動作しているプロ
グラムの実行状況を該計算機の外部記憶装置に記憶して
(処理412)一時停止させる(処理413)。この
後、到来した予定時刻Tnを予定管理テーブル21から
削除し(処理414)、予定管理テーブル中で現在の時
刻から最も近い予定時刻を選択する(処理415)。次
に、選択された時刻が管理プログラム14の動作してい
る計算機の再開予定時刻か否かを判定する(処理41
6)。この条件が成立するならば、再開予定時刻までの
間、予定管理テーブルを用いて処理する必要がないの
で、管理プログラム自体を一時停止させる。管理プログ
ラムの動作している計算機の一時停止と再開予定時刻を
分散処理システム内の各プログラムに通知した後(処理
417)、管理プログラムの実行状況(予定管理テーブ
ルの内容を含む)を外部記憶装置に記憶し(処理41
8)、自ら一時停止する(処理419)。処理416の
条件が成立しないならば、他の計算機に管理プログラム
の処理を委譲する。第一に、予定管理テーブルに自身が
動作している計算機が停止することを記す(処理42
1)。次に、他の計算機に予定管理テーブルを転送して
管理プログラムを該計算機上で起動させ(処理42
2)、自らを強制的に終了させる(処理423)。
At this time, the execution status of the program operating on the computer is stored in the external storage device of the computer (step 412) and temporarily stopped (step 413). Thereafter, the arrived scheduled time Tn is deleted from the schedule management table 21 (process 414), and the scheduled time closest to the current time in the schedule management table is selected (process 415). Next, it is determined whether or not the selected time is the scheduled restart time of the computer on which the management program 14 is operating (process 41).
6). If this condition is satisfied, there is no need to perform processing using the schedule management table until the scheduled restart time, so the management program itself is suspended. After notifying each program in the distributed processing system of the suspending and resuming scheduled times of the computer on which the management program is operating (process 417), the execution status of the management program (including the contents of the schedule management table) is stored in the external storage device. Stored in (process 41
8), it suspends itself (process 419). If the condition of process 416 is not satisfied, the process of the management program is delegated to another computer. First, it is noted in the schedule management table that the computer on which it is operating is stopped (process 42).
1). Next, the schedule management table is transferred to another computer and the management program is activated on that computer (process 42).
2), forcibly terminates itself (process 423).

【0030】一時停止中の管理プログラム14は計算機
の再開と同時に再起動処理43を行う。これは、外部記
憶装置に記憶している予定管理テーブル21等の実行状
況を復帰し(処理431)、この後、通常の起動処理と
同様の処理に移行するだけでよい(処理311〜31
5)。管理プログラムの一時停止と同時に停止したユー
ザプログラムの再起動は、処理345〜346で行われ
る。
The management program 14 in the suspended state executes the restart process 43 at the same time as the computer is restarted. For this, it is sufficient to restore the execution status of the schedule management table 21 and the like stored in the external storage device (process 431) and thereafter shift to the same process as the normal start-up process (process 311 to 311).
5). The restart of the user program stopped at the same time as the temporary stop of the management program is performed in the processes 345 to 346.

【0031】管理プログラム14の一時停止/再開を可
能にするためには、ユーザプログラムもこれに対応でき
るように変更しておかなければならない、ユーザプログ
ラムは管理プログラムに対してメッセージを通知する場
合、図9に示すような処理フロー51で通知する。第一
に、管理プログラムが動作している計算機が停止中か否
かを調査する(処理511)。これによって、停止中で
あると判断した場合、処理417で通知されている再開
予定時刻まで待ち(処理512)、この後、管理プログ
ラムに対してメッセージを通知する(処理513)。
In order to enable the suspension / resumption of the management program 14, the user program must also be modified so that it can handle this. When the user program notifies the management program of a message, Notification is made in the processing flow 51 as shown in FIG. First, it is investigated whether or not the computer on which the management program is operating is stopped (process 511). When it is determined that the process is stopped, the process waits until the scheduled restart time notified in process 417 (process 512), and then notifies the management program of a message (process 513).

【0032】次に、分散処理システム内の計算機の停止
/再開を分散して管理するための構成図を図14に示
す。図中、計算機111〜115、ネットワーク12、
プログラム131〜137は図13と同一である。各計
算機上には計算機管理プログラム64が存在し、個々の
計算機の停止/再開を管理する。さらにまた、計算機管
理プログラムは互いに通信を行い、協調して分散処理シ
ステム内の各計算機の停止/再開を管理する。さらに、
計算機管理プログラムは分散処理システム内のプログラ
ム起動、通信を管理する。このため、各ユーザプログラ
ムはプログラム起動、通信等の処理を行いたいとき、直
接処理を行うのではなく、同一計算機上の計算機管理プ
ログラムに処理を依頼するものとする。計算機管理プロ
グラムがこれらの処理の代行を行う。各計算機管理プロ
グラムが全体として、管理プログラム14の役割を有す
る。
Next, FIG. 14 shows a block diagram for distributedly managing stop / restart of computers in the distributed processing system. In the figure, computers 111 to 115, a network 12,
The programs 131 to 137 are the same as those in FIG. A computer management program 64 exists on each computer and manages suspension / resumption of individual computers. Furthermore, the computer management programs communicate with each other and cooperate with each other to manage the suspension / resumption of each computer in the distributed processing system. further,
The computer management program manages program activation and communication in the distributed processing system. For this reason, when each user program wants to perform processing such as program startup and communication, it does not directly perform the processing but requests the computer management program on the same computer to perform the processing. The computer management program acts as a proxy for these processes. Each computer management program has the role of the management program 14 as a whole.

【0033】図10に、計算機内部を更に詳しく記述し
た分散処理システムの構成図を示す。図10中、計算機
111〜115、ネットワーク12、ユーザプログラム
131〜137、計算機管理プログラム64は図14と
同一である。中央処理装置15、主記憶装置16、入出
力制御装置17、内部バス18、外部記憶装置171、
端末172、および、オペレーティングシステム161
は図1と同一である。
FIG. 10 shows a block diagram of a distributed processing system in which the inside of the computer is described in more detail. 10, the computers 111 to 115, the network 12, the user programs 131 to 137, and the computer management program 64 are the same as those in FIG. Central processing unit 15, main storage device 16, input / output control device 17, internal bus 18, external storage device 171,
Terminal 172 and operating system 161
Is the same as in FIG.

【0034】次に、各計算機管理プログラム64が計算
機の停止/再開を管理するためのデータ構造(予定管理
テーブル71)の一実現例を図11に示す。図11は計
算機111上の予定管理テーブルを示した。図11中、
計算機名称欄211、状態欄212、停止予定時刻欄2
13、再開予定時刻欄214、処理待ち行列23(エン
トリ231)、現時刻欄24は図2に示した集中管理用
の予定管理テーブル21と同一である。分散して計算機
の停止/再開を管理するための変更点は、全ての計算機
上のプログラムの情報を有するプログラムテーブル22
を、管理する計算機上のプログラムのみの情報を有する
プログラムテーブル72としたことである。計算機11
1にはプログラム131および132が存在しているの
で、プログラムリストは2つのエントリのみから構成さ
れる。また、各エントリ721内にプログラムの稼動/
一時停止を示す状態欄は必要ない。
Next, FIG. 11 shows an example of implementation of a data structure (schedule management table 71) for each computer management program 64 to manage suspension / resumption of computers. FIG. 11 shows a schedule management table on the computer 111. In FIG.
Computer name column 211, status column 212, scheduled stop time column 2
13, the scheduled restart time column 214, the processing queue 23 (entry 231), and the current time column 24 are the same as the schedule management table 21 for centralized management shown in FIG. A change for managing suspension / resumption of computers in a distributed manner is a program table 22 having information on programs on all computers.
Is a program table 72 having information on only the programs on the managed computer. Calculator 11
Since the programs 131 and 132 exist in 1, the program list is composed of only two entries. In addition, the operation of the program in each entry 721 /
The status column indicating suspension is not required.

【0035】計算機管理プログラム64の処理フロー8
1を図12に示す。管理プログラム14と同様に、計算
機管理プログラムはイベントの発生によって待ち状態か
ら解除され(処理812)、処理終了後、再び待ち状態
に移行する(処理811)という流れを有する。なお、
分散して計算機の停止/再開を管理する場合、他の計算
機の停止/再開をイベントとしない。したがって、ある
計算機のイベント発生からイベント発生までの間に他計
算機の停止/再開が発生し得る。このため、イベント発
生時には、現時刻および他計算機それぞれの停止予定時
刻/再開予定時刻から、該計算機の状態を変更する(処
理813)。状態は以下のようにして決定する。
Process flow 8 of computer management program 64
1 is shown in FIG. Similar to the management program 14, the computer management program has a flow of being released from the waiting state due to the occurrence of an event (process 812), and transitioning to the waiting state again after the process is completed (process 811). In addition,
When managing suspension / resumption of computers in a distributed manner, the suspension / resumption of other computers is not an event. Therefore, stop / restart of another computer may occur between the event occurrence of a computer and the event occurrence. Therefore, when an event occurs, the state of the computer is changed from the current time and the scheduled stop time / restart scheduled time of each of the other computers (process 813). The state is determined as follows.

【0036】(1)計算機の状態を稼動中に設定する条
件:現時刻<停止予定時刻<再開予定時刻、再開予定時
刻<現時刻<停止予定時刻、停止予定時刻<再開予定時
刻<現時刻 (2)計算機の状態を停止中に設定する条件:現時刻<
再開予定時刻<停止予定時刻、停止予定時刻<現時刻<
再開予定時刻、再開予定時刻<停止予定時刻<現時刻 なお、停止予定時刻/再開予定時刻が設定されていない
場合、無限時間後の時刻が設定されているとして、上記
の時刻の前後関係を計算する。さらに、現時刻以前の予
定時刻を予定管理テーブル71から削除する。
(1) Conditions for setting the computer status to operating: current time <scheduled stop time <scheduled restart time, scheduled restart time <current time <scheduled stop time, scheduled stop time <scheduled restart time <current time ( 2) Conditions for setting the computer status to stop: current time <
Scheduled restart time <Scheduled stop time, Scheduled stop time <Current time <
Scheduled restart time, Scheduled restart time <Scheduled stop time <Current time If the scheduled stop time / scheduled restart time is not set, it is assumed that the time after an infinite time is set, and the context of the above time is calculated. To do. Further, the scheduled time before the current time is deleted from the schedule management table 71.

【0037】待ち状態を解除するイベントは、(a)他
計算機からの予定時刻変更通知、(b)自己の計算機の
管理者からの予定時刻入力、(c)自己の計算機の停止
時刻の到来、(d)処理待ち行列が空でない計算機の再
開予定時刻の到来、(e)ユーザプログラムからのメッ
セージの通知とする。これらは処理814で判定され、
各処理モードに移行する。以下、これらのイベント処理
毎に図12を説明する。
The event for releasing the waiting state is (a) a notice of change of scheduled time from another computer, (b) input of scheduled time from the administrator of the own computer, (c) arrival of the stop time of the own computer, (D) It is assumed that the computer has a non-empty processing queue, the scheduled restart time has arrived, and (e) a message is notified from the user program. These are determined in process 814,
Shift to each processing mode. Hereinafter, FIG. 12 will be described for each of these event processes.

【0038】(a)他計算機からの予定時刻通知:通知
された予定時刻に従って、該当する計算機の予定管理テ
ーブル71内でのデータを変更する(処理821)。
(A) Notification of scheduled time from another computer: According to the notified scheduled time, the data in the schedule management table 71 of the corresponding computer is changed (process 821).

【0039】(b)自己の計算機の管理者からの予定時
刻入力:予定管理テーブル71中、要求された予定時刻
を変更する(処理831)。また、ネットワーク12を
介してブロードキャストすることにより、変更した予定
時刻を他計算機の計算機管理プログラム64に通知する
(処理832)。
(B) Scheduled time input from the administrator of his computer: The requested scheduled time in the schedule management table 71 is changed (process 831). Further, the changed scheduled time is notified to the computer management program 64 of another computer by broadcasting it via the network 12 (process 832).

【0040】(c)自己の計算機の停止時刻の到来:前
述(b)で記憶しておいた自己の計算機の停止予定時刻
が到来すると、計算機管理プログラム64がイベント待
ち状態から解除される。このとき、計算機管理プログラ
ムの一時停止処理84を行う。第一に、該計算機上で動
作しているプログラムの実行状況を該計算機の外部記憶
装置に記憶して(処理841)一時停止させる(処理8
42)。この後、到来した停止予定時刻を予定管理テー
ブル71から削除する(処理843)。最後に、計算機
管理プログラムの実行状況(予定管理テーブルの内容を
含む)を外部記憶装置に記憶し(処理844)、自ら一
時停止する(処理845)。一時停止中の計算機管理プ
ログラム64は計算機の再開と同時に再起動処理86を
行う。第一に、外部記憶装置に記憶している予定管理テ
ーブル71等の実行状況を復帰し(処理861)、計算
機の再開予定時刻を予定管理テーブルから削除する(処
理862)。この後、計算機管理プログラムの一時停止
と同時に停止したユーザプログラムの実行状況を復帰し
(処理863)、再起動させる(処理864)。この時
点で再起動処理は終了し、次のイベント待ち状態に移行
する(処理811)。
(C) Arrival of stop time of own computer: When the scheduled stop time of the own computer stored in (b) above comes, the computer management program 64 is released from the event waiting state. At this time, the temporary stop processing 84 of the computer management program is performed. First, the execution status of a program running on the computer is stored in an external storage device of the computer (process 841) and temporarily stopped (process 8).
42). Thereafter, the scheduled stop time that has arrived is deleted from the schedule management table 71 (process 843). Finally, the execution status of the computer management program (including the contents of the schedule management table) is stored in the external storage device (process 844), and the computer temporarily stops (process 845). The computer management program 64, which is suspended, performs a restart process 86 at the same time as the computer restarts. First, the execution status of the schedule management table 71 and the like stored in the external storage device is restored (process 861), and the scheduled restart time of the computer is deleted from the schedule management table (process 862). After that, the execution status of the user program stopped at the same time as the temporary stop of the computer management program is restored (process 863) and restarted (process 864). At this point, the restart process ends and the process shifts to the next event waiting state (process 811).

【0041】(d)処理待ち行列が空でない計算機の再
開予定時刻の到来:ある計算機に対する処理待ち行列が
空でない場合、該計算機の再開予定時刻を待っているプ
ログラムが存在することを示す。したがって、このイベ
ントが発生した場合、該計算機に対応する処理待ち行列
に登録されているプログラム起動処理、通信仲介処理を
行う(処理851)。
(D) The processing queue is not empty The arrival of the scheduled restart time of a computer: When the processing queue for a computer is not empty, it means that there is a program waiting for the scheduled restart time of the computer. Therefore, when this event occurs, the program activation process and the communication mediation process registered in the process queue corresponding to the computer are performed (process 851).

【0042】(e)ユーザプログラムからのメッセージ
の通知:集中処理と同一の処理を行う(処理361〜3
70)。
(E) Message notification from user program: The same processing as the centralized processing is performed (processing 361 to 361).
70).

【0043】[0043]

【発明の効果】以上のように本発明よれば、計算機の停
止から再開までが比較的短い予め定められた期間で済む
場合において、該計算機があたかも停止していないよう
に他計算機に見せることができ、一つの計算機の停止/
再開ができる限り他計算機に影響を与えないようにする
ことが可能となる。
As described above, according to the present invention, when a computer is stopped and restarted in a relatively short predetermined period, it is possible to show the computer to another computer as if it was not stopped. Yes, stop one computer /
As long as the restart is possible, it is possible to avoid affecting other computers.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第一の実施例である分散処理システム
の全体構成図である。
FIG. 1 is an overall configuration diagram of a distributed processing system that is a first embodiment of the present invention.

【図2】本発明の第一の実施例に係る予定管理テーブル
の構成を示す図である。
FIG. 2 is a diagram showing a configuration of a schedule management table according to the first embodiment of the present invention.

【図3】本発明の第一の実施例に係る管理プログラムの
処理フローの全体図である。
FIG. 3 is an overall view of a processing flow of a management program according to the first embodiment of the present invention.

【図4】図3の部分詳細図である。FIG. 4 is a partial detailed view of FIG.

【図5】図3の部分詳細図である。5 is a partial detailed view of FIG. 3. FIG.

【図6】図3の部分詳細図である。FIG. 6 is a partial detailed view of FIG.

【図7】一時停止/再起動を含む管理プログラムの処理
フローを表す図である。
FIG. 7 is a diagram showing a processing flow of a management program including temporary stop / restart.

【図8】一時停止/再起動を含む管理プログラムの処理
フローを表す図である。
FIG. 8 is a diagram showing a processing flow of a management program including suspension / restart.

【図9】一時停止/再起動を含む管理プログラムへのメ
ッセージ通知処理フローを表す図である。
FIG. 9 is a diagram showing a message notification processing flow to a management program including temporary stop / restart.

【図10】本発明の第二の実施例である分散処理システ
ムの全体構成図である。
FIG. 10 is an overall configuration diagram of a distributed processing system that is a second embodiment of the present invention.

【図11】本発明の第二の実施例に係る予定管理テーブ
ルの構成を示す図である。
FIG. 11 is a diagram showing a configuration of a schedule management table according to a second embodiment of the present invention.

【図12】本発明の第二の実施例に係る計算機管理プロ
グラムの処理フローの全体である。
FIG. 12 is an overall processing flow of a computer management program according to the second embodiment of the present invention.

【図13】本発明の第一の実施例である分散処理システ
ムの概略図である。
FIG. 13 is a schematic diagram of a distributed processing system that is a first embodiment of the present invention.

【図14】本発明の第二の実施例である分散処理システ
ムの概略図である。
FIG. 14 is a schematic diagram of a distributed processing system that is a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

111〜115…計算機、12…ネットワーク、131
〜137…プログラム、14…管理プログラム、15…
中央処理装置、16…主記憶装置、161…オペレーテ
ィングシステム、17…入出力制御装置、171…外部
記憶装置、172…端末、18…内部バス、21、71
…予定管理テーブル、22、72…プログラムテーブ
ル、23…処理待ち行列、31…管理プログラムの処理
フロー、64…計算機管理プログラム、81…計算機管
理プログラムの処理フロー。
111-115 ... Calculator, 12 ... Network, 131
~ 137 ... Program, 14 ... Management program, 15 ...
Central processing unit, 16 ... Main storage device, 161 ... Operating system, 17 ... Input / output control device, 171 ... External storage device, 172 ... Terminal, 18 ... Internal bus, 21, 71
... schedule management table, 22, 72 ... program table, 23 ... processing queue, 31 ... management program processing flow, 64 ... computer management program, 81 ... computer management program processing flow.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 村田 悟 茨城県日立市大みか町七丁目1番1号 株 式会社日立製作所日立研究所内 (72)発明者 中村 智明 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所大みか工場内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Satoru Murata 7-1-1, Omika-cho, Hitachi-shi, Ibaraki Hitachi Ltd. Hitachi Research Laboratory (72) Inventor Tomoaki Nakamura 5-2, Omika-cho, Hitachi-shi, Ibaraki No. 1 Stock company Hitachi Ltd. Omika factory

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の各
計算機の停止予定時刻と再開予定時刻を管理するもので
あって、かつ分散処理システム内のプログラムの起動を
管理し、停止予定時刻が近付いている計算機でのプログ
ラム起動を行わせない機能、および、再開予定時刻が近
付いている計算機で動作可能なプログラムの起動を該再
開予定時刻まで遅延させる機能のうち、いずれか一つ以
上の機能を有する管理プログラムを少なくとも一つ備え
たことを特徴とする分散処理システム。
1. In a distributed processing system in which a plurality of computers are connected to a network, a scheduled stop time and a scheduled restart time of each computer in the distributed processing system are managed, and a program in the distributed processing system is managed. A function that manages start-up and prevents the program from starting on a computer whose scheduled stop time is approaching, and a function that delays the start of a program that can run on a computer whose scheduled restart time is approaching until the scheduled restart time. Among them, a distributed processing system comprising at least one management program having one or more functions.
【請求項2】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の各
計算機の停止予定時刻と再開予定時刻を管理するもので
あって、かつ分散処理システム内のプログラムの起動を
管理し、前記各計算機が該計算機の停止前に次回の再開
予定時刻を通知し、再開予定時刻が近付いている計算機
で動作可能なプログラムの起動を該再開予定時刻まで遅
延させる機能を有する管理プログラムを少なくとも一つ
備えたことを特徴とする分散処理システム。
2. In a distributed processing system in which a plurality of computers are connected to a network, a scheduled stop time and a scheduled restart time of each computer in the distributed processing system are managed, and a program in the distributed processing system is managed. It has a function of managing the start-up, notifying each computer of the next scheduled restart time before the computer is stopped, and delaying the startup of the program operable on the computer whose scheduled restart time is approaching until the scheduled restart time. A distributed processing system comprising at least one management program.
【請求項3】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の各
計算機の停止予定時刻と再開予定時刻を管理するもので
あって、かつ分散処理システム内のプログラムの一時停
止/再起動を管理し、前記各計算機で動作しているプロ
グラムを停止予定時刻前に一時停止させ、再開予定時刻
後に該プログラムの再起動を行う機能を有する管理プロ
グラムを少なくとも一つ備えたことを特徴とする分散処
理システム。
3. In a distributed processing system in which a plurality of computers are connected to a network, a scheduled stop time and a scheduled restart time of each computer in the distributed processing system are managed, and a program in the distributed processing system is managed. At least one management program having a function of managing suspension / restart, suspending the program running on each computer before the scheduled stop time, and restarting the program after the scheduled restart time is provided. A distributed processing system characterized by the above.
【請求項4】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の各
計算機の停止予定時刻と再開予定時刻を管理するもので
あって、かつ分散処理システム内のプログラムの一時停
止/再起動を管理し、前記各計算機から該計算機の停止
前に次回の再開予定時刻が通知され、計算機の停止が通
知された場合に該計算機で動作しているプログラムを一
時停止させ、再開予定時刻後に該プログラムの再起動を
行う機能を有する管理プログラムを少なくとも一つ備え
たことを特徴とする分散処理システム。
4. In a distributed processing system in which a plurality of computers are connected to a network, a scheduled stop time and a scheduled restart time of each computer in the distributed processing system are managed, and a program in the distributed processing system is managed. Manages suspension / restart, notifies the next resuming scheduled time from each computer before the computer is stopped, and suspends the program running on the computer when the computer is notified of stop, A distributed processing system comprising at least one management program having a function of restarting the program after a scheduled restart time.
【請求項5】 請求項3または請求項4記載の分散処理
システムにおいて、前記管理プログラムは分散処理シス
テム内のプログラム間の通信を管理し、停止中の計算機
で動作しているプログラムに対する通信を該計算機の再
開予定時刻後まで遅延させる機能を有したことを特徴と
する分散処理システム。
5. The distributed processing system according to claim 3 or 4, wherein the management program manages communication between programs in the distributed processing system, and communicates with a program running on a stopped computer. A distributed processing system having a function of delaying until a computer is scheduled to restart.
【請求項6】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の各
計算機の停止予定時刻と再開予定時刻を管理するもので
あって、かつ分散処理システム内の計算機間で行われる
処理を管理し、停止中の計算機もしくは該計算機上のプ
ログラム、オペレーティングシステムに対する処理を該
計算機の再開予定時刻後まで遅延させる機能を有する管
理プログラムを少なくとも一つ備えたことを特徴とする
分散処理システム。
6. In a distributed processing system in which a plurality of computers are connected to a network, a scheduled stop time and a scheduled restart time of each computer in the distributed processing system are managed, and between the computers in the distributed processing system. And a management program having a function of delaying processing of a computer that is stopped or a program on the computer, and processing for the operating system until after the scheduled restart time of the computer. Distributed processing system.
【請求項7】 請求項1、請求項2、請求項3、請求項
4、請求項5または請求項6記載の分散処理システムに
おいて、前記管理プログラムは自分自身の存在している
計算機の停止前に該分散処理システム内の全プログラム
に対して再開予定時刻を通知する機能を有し、該分散処
理システム内の各プログラムは該管理プログラムに対し
て行う処理を再開予定時刻まで遅延させる機能を有した
ことを特徴とする分散処理システム。
7. The distributed processing system according to claim 1, claim 2, claim 3, claim 4, claim 5, or claim 6, wherein the management program is before the stop of a computer in which the management program is present. Has a function of notifying all programs in the distributed processing system of the scheduled restart time, and each program in the distributed processing system has a function of delaying the processing to the management program until the scheduled restart time. A distributed processing system characterized by the above.
【請求項8】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の全
計算機上に、分散処理システム内の各計算機の停止予定
時刻と再開予定時刻を管理するものであって、かつ分散
処理システム内のプログラムの起動を管理し、停止予定
時刻が近付いている計算機でのプログラム起動を行わせ
ない機能、および、再開予定時刻が近付いている計算機
で動作可能なプログラムの起動を該再開予定時刻まで遅
延させる機能のうち、いずれか一つ以上の機能を有する
計算機管理プログラムを備えたことを特徴とする分散処
理システム。
8. In a distributed processing system in which a plurality of computers are connected to a network, scheduled stop times and scheduled restart times of each computer in the distributed processing system are managed on all the computers in the distributed processing system. Function that manages the start of the program in the distributed processing system and does not start the program on the computer whose scheduled stop time is approaching, and the program that can run on the computer whose scheduled restart time is approaching A distributed processing system comprising a computer management program having any one or more of the functions of delaying the execution time to the scheduled restart time.
【請求項9】 ネットワークに複数の計算機が接続され
る分散処理システムにおいて、分散処理システム内の全
計算機上に、分散処理システム内の各計算機の停止予定
時刻と再開予定時刻を管理するものであって、かつ分散
処理システム内で動作しているプログラムの一時停止/
再起動を管理し、前記各計算機で動作しているプログラ
ムを停止予定時刻前に一時停止させ、再開予定時刻後に
該プログラムの再起動を行う機能を有する計算機管理プ
ログラムを備えたことを特徴とする分散処理システム。
9. In a distributed processing system in which a plurality of computers are connected to a network, scheduled stop times and scheduled restart times of each computer in the distributed processing system are managed on all the computers in the distributed processing system. And suspend / run programs running in the distributed processing system.
A computer management program having a function of managing restart, suspending the program running on each computer before the scheduled stop time, and restarting the program after the scheduled restart time is provided. Distributed processing system.
【請求項10】 ネットワークに複数の計算機が接続さ
れる分散処理システムにおいて、分散処理システム内の
全計算機上に、分散処理システム内の各計算機の停止予
定時刻と再開予定時刻を管理するものであって、かつ下
記機能aを有する計算機管理プログラムを備えたことを
特徴とする分散処理システム。 a.前記計算機管理プログラムは自分自身の存在してい
る計算機の停止予定時刻前に該分散処理システム内の他
計算機の計算機管理プログラムに対して再開予定時刻を
通知する機能を有し、該再開予定時刻の通知を受けた計
算機管理プログラムは該再開予定時刻の通知を行った計
算機管理プログラムに対して行う処理を再開予定時刻ま
で遅延させる機能を有する。
10. In a distributed processing system in which a plurality of computers are connected to a network, scheduled stop times and scheduled restart times of each computer in the distributed processing system are managed on all the computers in the distributed processing system. In addition, the distributed processing system is provided with a computer management program having the following function a. a. The computer management program has a function of notifying the computer of the other computer in the distributed processing system of the scheduled restart time before the scheduled stop time of the computer in which the computer itself exists. The computer management program that has received the notification has a function of delaying the processing performed for the computer management program that has notified the scheduled restart time until the scheduled restart time.
JP5223652A 1993-09-08 1993-09-08 Decentralized processing system Pending JPH0778037A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5223652A JPH0778037A (en) 1993-09-08 1993-09-08 Decentralized processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5223652A JPH0778037A (en) 1993-09-08 1993-09-08 Decentralized processing system

Publications (1)

Publication Number Publication Date
JPH0778037A true JPH0778037A (en) 1995-03-20

Family

ID=16801544

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5223652A Pending JPH0778037A (en) 1993-09-08 1993-09-08 Decentralized processing system

Country Status (1)

Country Link
JP (1) JPH0778037A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130648A (en) * 2009-04-23 2014-07-10 Nec Corp Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method
US8789045B2 (en) 2009-04-23 2014-07-22 Nec Corporation Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130648A (en) * 2009-04-23 2014-07-10 Nec Corp Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method
US8789045B2 (en) 2009-04-23 2014-07-22 Nec Corporation Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method
US8984123B2 (en) 2009-04-23 2015-03-17 Nec Corporation Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method

Similar Documents

Publication Publication Date Title
US10628273B2 (en) Node system, server apparatus, scaling control method, and program
EP1099164B1 (en) Method and program for processing administrative requests of a distributed network application executing in a clustered computing environment
US5526492A (en) System having arbitrary master computer for selecting server and switching server to another server when selected processor malfunctions based upon priority order in connection request
US6789101B2 (en) Automation system uses resource manager and resource agents to automatically start and stop programs in a computer network
CA3168286A1 (en) Data flow processing method and system
US20120036383A1 (en) Power supply for networked host computers and control method thereof
JPH113232A (en) Signal generation and distribution for double level multi-thread system
JP2007172334A (en) Method, system and program for securing redundancy of parallel computing system
US5664090A (en) Processor system and method for maintaining internal state consistency between active and stand-by modules
CN114064414A (en) High-availability cluster state monitoring method and system
JPH10207855A (en) Shared disk type multiple system
JPH06243070A (en) Inter-processor communication system
EP2110748B1 (en) Cluster control apparatus, cluster system and control program
US6704766B1 (en) Method and apparatus for dynamically controlling the execution of a request handler on a processor resource
JP2001282558A (en) Multi-operating computer system
JPH0778037A (en) Decentralized processing system
JP2003167746A (en) Software distribution method, execution system for the same and processing program for the same
JP2003345638A (en) Method for controlling storage controller, the storage controller, and program
JP3050322B2 (en) Data equivalent method and computer system
JPH08316957A (en) Dual network management system
JP2001067214A (en) Computer system and program file updating method
JP2000112807A (en) Local data base delay updating system and its method
JPH02139630A (en) Online task exchange device
JPH07121490A (en) Multiple processing system and program execution control method
JPH113230A (en) Job information inquiry/display system