JPH07271611A - Automatic process restarting and processing system - Google Patents

Automatic process restarting and processing system

Info

Publication number
JPH07271611A
JPH07271611A JP6064102A JP6410294A JPH07271611A JP H07271611 A JPH07271611 A JP H07271611A JP 6064102 A JP6064102 A JP 6064102A JP 6410294 A JP6410294 A JP 6410294A JP H07271611 A JPH07271611 A JP H07271611A
Authority
JP
Japan
Prior art keywords
processes
restart
job
abnormality
main process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6064102A
Other languages
Japanese (ja)
Other versions
JP3604171B2 (en
Inventor
Ryuichi Matsushita
隆一 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06410294A priority Critical patent/JP3604171B2/en
Publication of JPH07271611A publication Critical patent/JPH07271611A/en
Application granted granted Critical
Publication of JP3604171B2 publication Critical patent/JP3604171B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)

Abstract

PURPOSE:To prevent mutual interference resulting from the presence of a continued process and restart the processing by forcibly ending also its subordinate process when a main processing constituting a job becomes abnormal. CONSTITUTION:This system has an abnormality detection part 21 which detects abnormality of at least one process, a collecting processing part 101 which forcibly ends remaining normal processes and collects information on the processes, and a restart processing part 16 which restarts at least a process that becomes a main process among the processes newly in a memory space. Consequently, if the main process having subordinate processes becomes abnormal, the subordinate processes which are normal are forcibly ended by the collecting processing part 101, so that only the subordinate processes which are not abnormal, operate to prevent discordance with the main process.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、プロセス制御を行う計
算機システムにおいて、間欠的な障害が発生したときに
自動修復を行うようにしたプロセス自動再起動処理に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a process automatic restart process for automatically repairing a computer system for process control when an intermittent failure occurs.

【0002】[0002]

【従来の技術】計算機システムの重要性は年々増大する
傾向にあり、24時間ノーダウンのシステムが要求され
ている。そのため、オペレーティングシステム(OS)
には、異常発生時におけるリカバリ確認機能が必須とさ
れ、異常が発生してもシステムダウンとならないよう
に、システムのフォルト・トレラント(Fault Toreran
t)化が必要になってきてきる。
2. Description of the Related Art The importance of computer systems tends to increase year by year, and there is a demand for 24-hour no-down systems. Therefore, operating system (OS)
Requires a function to confirm recovery when an error occurs, and to prevent the system from going down even if an error occurs, the system's fault tolerance (Fault Toreran)
t) is becoming necessary.

【0003】このような点に鑑みて、本発明者は特開平
2−158843号公報に示されるように、異常が発生
したプロセスを新しいアドレス空間に自動的に再起動す
ることにより待機プロセスの準備を不要とした技術を提
案している。
In view of such a point, the present inventor prepares a standby process by automatically restarting a process in which an abnormality has occurred into a new address space, as disclosed in Japanese Patent Laid-Open No. 2-158843. We propose a technology that eliminates the need for.

【0004】この従来技術の概略を簡単に説明すると図
9に示す通りである。すなわち、ジョブスケジューラに
おける異常検出部が主プロセスの異常を検出すると、再
起動処理部に対して再起動を指示し、新しく開設したア
ドレス空間でジョブの再起動を実行するようになってい
た。
The outline of this prior art is briefly described as shown in FIG. That is, when the abnormality detecting unit in the job scheduler detects an abnormality in the main process, the restart processing unit is instructed to restart and the job is restarted in the newly established address space.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、前記従
来技術では単一のプロセスで構成されたジョブを対象と
しているため、複数のプロセスで構成されるジョブにお
ける障害発生時には対応できなかった。すなわち、図1
0に示すように、ジョブが主プロセスと複数のプロセス
とで構成されている場合が問題となっていた。
However, in the above-mentioned conventional technique, since a job constituted by a single process is targeted, it is not possible to cope with a failure occurring in a job constituted by a plurality of processes. That is, FIG.
As shown in 0, there is a problem when a job is composed of a main process and a plurality of processes.

【0006】この場合、副プロセスに障害が発生した場
合には、正常に動作している主プロセスを用いて異常の
生じた副プロセスの復旧が可能であるため問題は生じな
いものの、主プロセス自体に異常が発生した場合に、異
常検出部により異常が検出されると副プロセスはそのま
ま作動した状態で主プロセスの再起動が行われることに
なり、再起動された主プロセスと副プロセスとの間で矛
盾を生じる可能性があり、危険であった。
In this case, when a failure occurs in the sub-process, no problem occurs because the sub-process having the abnormality can be recovered by using the normally operating main process, but the main process itself. If an error is detected by the error detection unit, the main process will be restarted while the sub-process is still operating, and the main process and the sub-process will be restarted. It could be inconsistent and dangerous.

【0007】本発明は前記課題に鑑みてなされたもので
あり、その目的は複数のジョブがメモリを共有しない複
数のプロセスで構成されるシステムにおいて、継続して
いるプロセスが存在することにより生じる相互干渉を防
止してプロセスの再起動を可能とするシステムを提案す
ることにある。
The present invention has been made in view of the above problems, and an object of the present invention is to create a mutual process caused by the existence of continuous processes in a system including a plurality of processes in which a plurality of jobs do not share a memory. It is to propose a system capable of preventing interference and restarting a process.

【0008】[0008]

【課題を解決するための手段】本発明の第1の手段は、
原理図である図1に示すように、ジョブが相互にメモリ
を共用しない複数のプロセスからなる計算機システムに
おいて、少なくとも一つのプロセスの異常を検出する異
常検出部(21)と、ジョブを構成するプロセスのう
ち、異常を生じていない残りのプロセスを強制的に終了
させてプロセスの情報を回収する回収処理部(101)
と、前記プロセスのうち少なくとも主プロセスとなるプ
ロセスを新たなメモリ空間上で再起動させる再起動処理
部(16)とを有するプロセス自動再起動処理方式とす
るものである。
The first means of the present invention is to:
As shown in FIG. 1, which is a principle diagram, in a computer system including a plurality of processes in which jobs do not share memory with each other, an abnormality detection unit (21) for detecting an abnormality in at least one process, and a process constituting the job Of these, a recovery processing unit (101) for forcibly ending the remaining process in which no abnormality has occurred and recovering the process information
And a restart processing section (16) for restarting at least a main process among the above processes on a new memory space.

【0009】第2の手段は、図2に示すように、前記再
起動処理部(16)に、前記で再起動されたプロセスを
強制的に打ち切るか否かを判断する再起動判定部(10
2)を備えたものである。
The second means is, as shown in FIG. 2, that the restart processing unit (16) determines whether or not the restarted process is forcibly terminated.
2) is provided.

【0010】[0010]

【作用】本発明の第1の手段によれば、副プロセスを有
する主プロセスに異常が発生した場合、回収処理部によ
り異常を生じていない副プロセスも強制的に終了される
ため、異常の生じていない副プロセスのみが動作して主
プロセスと矛盾を生じることを防止できる。
According to the first means of the present invention, when an abnormality occurs in the main process having the sub-process, the recovery processing unit forcibly terminates the sub-process in which no abnormality has occurred. It is possible to prevent only the sub-process that does not operate and cause a conflict with the main process.

【0011】また、第2の手段によれば、新しいメモリ
空間で主プロセスが再起動された後、ジョブ自身に再起
動の打ち切りを行うことのできる機能を与えることによ
り、障害発生時においてもジョブプログラムによる柔軟
な対応が可能となる。
According to the second means, after the main process is restarted in the new memory space, the job itself is provided with a function capable of aborting the restart, so that the job can be executed even when a failure occurs. Flexible response by the program is possible.

【0012】[0012]

【実施例1】以下、本発明を図に基づいて説明する。 〔本実施例のシステム構成〕図3は、本発明の一実施例
である計算機のシステム構成を示している。
First Embodiment The present invention will be described below with reference to the drawings. [System Configuration of the Present Embodiment] FIG. 3 shows the system configuration of a computer which is an embodiment of the present invention.

【0013】図3において、10はCPUおおびメモリ
等を備えた計算機システム、11および12は計算機資
源を使用する処理単位であるプロセスであり、このうち
子プロセス群は主プロセスと複数の副プロセスとで構成
されている。
In FIG. 3, 10 is a computer system having a CPU and memory, and 11 and 12 are processes which are processing units that use computer resources. Of these, a child process group is a main process and a plurality of sub-processes. It consists of and.

【0014】14はプロセスの起動制御等を行うプロセ
ス制御部、15は回復処理部、16は再起動処理部、1
7はユーザからの処理要求の単位であるセッションを制
御するセッション制御部、18は回復用情報記憶部、1
9は不揮発メモリ、20はOSの核となるカーネル部、
21は異常検出部、22はアドレス空間を管理する空間
管理部、23はアドレス空間の管理情報を記憶する空間
管理テーブル、A0〜A2はそれぞれ個別の仮想記憶空
間であるアドレス空間を表している。また、アドレス空
間A1に生成された101は回収処理部を表している。 〔システムの作動状態の概要〕図3において、セッショ
ン制御部17は、ユーザからの処理要求またはコマンド
列からなるプロシジャによる処理要求に基づいてセッシ
ョンを開設する。このセッションでは、例えばアドレス
空間Aを獲得し、プロセス11を起動する。プロセス1
1は計算機資源を使用する処理単位(ジョブ)であり、
プログラムの実行環境を形成するものである。また、必
要に応じて他のアドレス空間A2〜Anを獲得してその
空間で動作する他のプロセス12,,,(主プロセスと
副プロセスの複数プロセスでも可)を起動することもで
きる。
Reference numeral 14 is a process control unit for controlling process activation, 15 is a recovery processing unit, 16 is a restart processing unit, 1
Reference numeral 7 denotes a session control unit that controls a session, which is a unit of a processing request from a user, 18 denotes a recovery information storage unit, 1
9 is a non-volatile memory, 20 is a kernel part which is the core of the OS,
Reference numeral 21 is an abnormality detection unit, 22 is a space management unit that manages an address space, 23 is a space management table that stores management information of the address space, and A0 to A2 are address spaces that are individual virtual storage spaces. Further, 101 generated in the address space A1 represents a collection processing unit. [Outline of System Operation State] In FIG. 3, the session control unit 17 opens a session based on a processing request from a user or a processing request from a procedure including a command sequence. In this session, for example, the address space A is acquired and the process 11 is activated. Process 1
1 is a processing unit (job) that uses computer resources,
It forms the execution environment of the program. It is also possible to acquire other address spaces A2 to An and start other processes 12, ... (A plurality of main processes and sub-processes are possible) operating in that space, if necessary.

【0015】セッション制御部17が管理する回復用情
報記憶部18は、起動されたプロセス11,12毎に処
理依頼等に用いられるメッセージの宛先情報、システム
内のプロセスを一意に識別するプロセス識別子、アドレ
ス空間を一意に識別するアドレス空間識別子、起動元の
プロセス識別子の情報等を記憶するものである。あるプ
ロセスが他のプロセスを起動したときにセッション制御
部17へこれらの情報が通知され、セッション制御部1
7はこの内容を回復用情報記憶部18に格納し、さらに
これを不揮発メモリ19に待避する機能を有している。
The recovery information storage unit 18 managed by the session control unit 17 has destination information of a message used for a processing request for each of the started processes 11 and 12, a process identifier for uniquely identifying a process in the system, It stores information such as an address space identifier that uniquely identifies the address space, and a process identifier of the starting source. When a process starts another process, the session control unit 17 is notified of these pieces of information, and the session control unit 1
7 has a function of storing this content in the recovery information storage unit 18 and saving it in the non-volatile memory 19.

【0016】不揮発メモリ19はハードウエアの一部で
あり、プロセスやアドレス空間に異常が発生した場合に
も、回復用情報記憶部18の内容を保証するようになっ
ている。
The non-volatile memory 19 is a part of hardware, and guarantees the contents of the recovery information storage unit 18 even when an abnormality occurs in a process or an address space.

【0017】カーネル部20に設けられた異常検出部2
1は、プログラムチェック割り込みやその他のプログラ
ムの異常を検出するものであり、異常を検出した場合、
アドレス空間A1へ異常発生を通知する機能を有してい
る。
Anomaly detection section 2 provided in kernel section 20
1 is for detecting a program check interrupt or other abnormalities of the program, and when an abnormality is detected,
It has a function of notifying the address space A1 of the occurrence of an abnormality.

【0018】プロセスを制御するプロセス制御部14等
は、回復処理部15、再起動処理部16および回収処理
部101を有している。回復処理部15は、異常検出部
21からの異常発生通知があると、関連する回復用情報
記憶部18の内容をセッション制御部17に要求し、自
プロセス11が起動したプロセス12の資源の回収を行
い、アドレス空間A2〜Anを消滅させて実行環境の整
理を行うことにより、システムの状態を矛盾のない状態
に回復する。
The process control section 14 for controlling the process has a recovery processing section 15, a restart processing section 16 and a recovery processing section 101. Upon receiving the abnormality occurrence notification from the abnormality detection unit 21, the recovery processing unit 15 requests the session control unit 17 for the related contents of the recovery information storage unit 18, and collects the resources of the process 12 started by the own process 11. Then, the address spaces A2 to An are extinguished and the execution environment is organized to restore the system state to a consistent state.

【0019】回収処理部101は、異常の発生したプロ
セス(主プロセス)に副プロセスが存在する場合に、こ
れらの副プロセス群を強制的に終了させる機能を有して
いる。
The recovery processing unit 101 has a function of forcibly ending the sub-process group when a sub-process exists in the abnormal process (main process).

【0020】さらに再起動処理部16は、前記主プロセ
スおよび副プロセスが強制的に終了させられた後に、空
間管理部22に新しいアドレス空間の創成を依頼し、そ
のアドレス空間でプロセス12を再起動する機能を有し
ている。 〔システムの正常時の作動状態〕次に図4を用いてまず
システムが正常に起動された場合の作動状態を説明す
る。
Further, the restart processing unit 16 requests the space management unit 22 to create a new address space after the main process and the sub process are forcibly terminated, and restarts the process 12 in the address space. It has a function to do. [Normal Operating State of System] Next, the operating state when the system is normally started will be described with reference to FIG.

【0021】図4および図5において、前記図3と同じ
符号のものは同一機能を有するものとする。なお、符号
30,31はプロセッサ、32,33は図3に示すカー
ネル部20に相当するスーパバイザ、40は再起動され
たプロセス、41はプロセス制御部を表す。
4 and 5, the same reference numerals as those in FIG. 3 have the same functions. Reference numerals 30 and 31 are processors, 32 and 33 are supervisors corresponding to the kernel unit 20 shown in FIG. 3, 40 is a restarted process, and 41 is a process control unit.

【0022】ここで、アドレス空間A1からプロセス1
2を起動するときの処理の流れについて(1)〜(6)(図
では丸付き数字で表示している)にしたがって説明す
る。 (1) アドレス空間A1は、プロセス11を起動すると
き、パラメータで自動再起動を設定してプロセス起動マ
クロ命令を発行する。 (2) このマクロ命令の発行により、プロセス制御部1
3のプロセス起動部では、スーパバイザ32に対しアド
レス空間の創成を依頼する。 (3) スーパバイザ32は、アドレス空間を創成し、新
空間へのメッセージの宛先およびアドレス空間識別子を
要求元へ返却する。 (4) 新しく開設されたアドレス空間Ax内で、プロセ
ス制御部13のプロセス起動部が動作し、スーパバイザ
32に対し、プログラム実行体の創成、すなわちCPU
資源の獲得を依頼する。 (5) プロセス制御部13のプロセス起動部には、スー
パバイザ32から返却された情報(新アドレス空間の宛
先、新アドレス空間識別子)および自分のプロセス識別
子、新プロセス12のプロセス識別子を、セッション制
御部17に通知する。 (6) セッション制御部17は、通知された情報を回復
用情報記憶部18に登録し、自分のアドレス空間A0が
クラッシュしたときに、それらの情報が失われないよう
にするために、それの情報を不揮発メモリ19に退避す
る。
Here, from address space A1 to process 1
The flow of the process when starting 2 will be described according to (1) to (6) (indicated by circled numbers in the figure). (1) When the process 11 is started, the address space A1 issues a process start macro command with automatic restart set by a parameter. (2) By issuing this macro instruction, the process control unit 1
The process starting unit 3 requests the supervisor 32 to create an address space. (3) The supervisor 32 creates an address space, and returns the destination of the message to the new space and the address space identifier to the request source. (4) In the newly opened address space Ax, the process activation unit of the process control unit 13 operates, and the supervisor 32 creates a program execution unit, that is, a CPU.
Request the acquisition of resources. (5) In the process control unit 13, the process control unit 13 receives the information (destination of the new address space, new address space identifier) returned from the supervisor 32, its own process identifier, and the process identifier of the new process 12 in the session control unit. Notify 17. (6) The session control unit 17 registers the notified information in the recovery information storage unit 18 so that when the address space A0 of its own is crashed, the information is not lost. The information is saved in the nonvolatile memory 19.

【0023】なお、セッション制御部17もプロセスの
一種であるが、本実施例では、セッション制御部17に
ついては、待機プロセスを用意することにより、障害発
生に迅速に対応できるようにしている。
Although the session control unit 17 is also a type of process, in the present embodiment, the session control unit 17 is provided with a standby process so that a failure can be quickly dealt with.

【0024】前記図4に示す状態において、アドレス空
間A2に異常が発生したときの処理の流れは、以下の図
5に示すようになる。 〔障害発生時の作動状態〕以下の処理の流れを(1)〜
(8)(図では丸付き数字で表示している)にしたがって
説明する。 (1) 異常がアドレス空間A2におけるプログラムチェ
ック(主プロセス)であったとする。ハードウエアから
プログラムチェック割り込みがあると、スーパバイザは
この異常を検出する。 (2) スーパバイザ32は、空間創成依頼を受けたとき
に、どの空間がどの空間を創成したかという情報を記憶
しているので、クラッシュしたアドレス空間A2の起動
元を調べ、そのに異常発生を通知する。 (2)' 回収処理部101は、スーパバイザ32に対して
副プロセスの空間回収を依頼する。この空間回収は副プ
ロセス毎に行われ、空間が回収される度に回収処理部1
01に対してスーパバイザ32より空間終了通知がなさ
れる。この空間回収処理がアドレス空間A2〜Anに展
開されている副プロセスの数(n個)だけ繰り返され
る。 (3) 起動元であるアドレス空間A1における回復処理
部15は、セッション制御部17に対してプロセス情報
の通知を依頼し、該当する回復用情報記憶部18の内容
を獲得する。 (4) 次に回復処理部15は、獲得した情報により削除
すべきアドレス空間A2〜Anを知り、スーパバイザに
対して削除を依頼して、アドレス空間A2〜Anの回収
を行う。 (5) 再起動処理部16は、プロセス11を新しいプロ
セス40として起動するために、スーパバイザ32にア
ドレス空間A3の創成を依頼する。 (6) スーパバイザ32は前記依頼に対して新アドレス
空間A3を創成し、その宛先とアドレス空間識別子を返
却する。 (7) 再起動処理部16は、返却された新アドレス空間
の宛先とそのアドレス空間識別子、自分のプロセス識別
子、新プロセスの識別子を再度セッション制御部17に
通知する。セッション制御部17は、その情報を回復用
情報記憶部18に登録する。 (8) アドレス空間A3におけるプログラム制御部41
のプロセス起動部は、プロセス実行体の創成(CPUの
獲得)をスーパバイザ32に依頼する。
In the state shown in FIG. 4, the flow of processing when an abnormality occurs in the address space A2 is as shown in FIG. 5 below. [Operating state at the time of failure] Follow the procedure below (1)-
(8) (Indicated by circled numbers in the figure). (1) Assume that the abnormality is a program check (main process) in address space A2. If there is a program check interrupt from the hardware, the supervisor will detect this anomaly. (2) When the supervisor 32 receives a space creation request, it stores information about which space created which space. Therefore, the originator of the crashed address space A2 is checked to see if an error has occurred. Notice. (2) ′ The recovery processing unit 101 requests the supervisor 32 to recover the space of the sub process. This space recovery is performed for each sub-process, and the recovery processing unit 1
A space end notification is issued to 01 from the supervisor 32. This space recovery processing is repeated by the number (n) of sub-processes expanded in the address spaces A2 to An. (3) The recovery processing unit 15 in the activation-source address space A1 requests the session control unit 17 to notify process information, and acquires the contents of the corresponding recovery information storage unit 18. (4) Next, the recovery processing unit 15 knows the address spaces A2 to An to be deleted based on the acquired information, requests the supervisor to delete the addresses, and collects the address spaces A2 to An. (5) The restart processing unit 16 requests the supervisor 32 to create the address space A3 in order to start the process 11 as a new process 40. (6) The supervisor 32 creates a new address space A3 in response to the request, and returns its destination and address space identifier. (7) The restart processing unit 16 again notifies the session control unit 17 of the destination of the returned new address space, its address space identifier, its own process identifier, and the new process identifier. The session control unit 17 registers the information in the recovery information storage unit 18. (8) Program control unit 41 in address space A3
The process activation unit of (1) requests the supervisor 32 to create a process execution body (acquires CPU).

【0025】異常により、プロセス12で行っていた処
理を、新しい空間A3で動作するプロセス40に引き継
ぐことができ、副プロセスも含めて異常発生時の状態に
復帰することができる。
Due to the abnormality, the process performed in the process 12 can be taken over by the process 40 operating in the new space A3, and the state including the sub-process can be restored to the state at the time of the abnormality.

【0026】[0026]

【実施例2】本実施例2の構成を示したものが図6であ
る。同図は図5とほぼ同じであるが、プロセス制御部1
3内に再起動処理部16のほかに再起動判定部102が
設けられている点が異なる。
Second Embodiment FIG. 6 shows the configuration of the second embodiment. The figure is almost the same as FIG.
3 is different in that a restart determination unit 102 is provided in addition to the restart processing unit 16.

【0027】再起動判定部102は、前記実施例1の処
理(8)の後、再起動された主プロセスからの通知に基づ
いて再起動動作を打ち切るか否かを判定する機能を有し
ている。
The restart determination unit 102 has a function of determining whether or not the restart operation is terminated based on the notification from the restarted main process after the process (8) of the first embodiment. There is.

【0028】すなわち、処理(8)において主プロセスが
新メモリ空間A3で再起動された後、主プロセスから再
起動打ち切り宣言が通知されると、これを受け付けて主
プロセスの打ち切り制御を行いこれ以降の再起動動作を
行わない。
That is, in the process (8), after the main process is restarted in the new memory space A3, when the restart abort declaration is notified from the main process, this is accepted and the main process abort control is performed thereafter. Does not restart.

【0029】これを概念的に示したものが図7である。
すなわちジョブスケジューラ701はジョブ702中に
主プロセス703と副プロセス704および705を起
動する。この処理中に主プロセス703より異常が検出
されると、副プロセス704および705を回収処理部
101が回収する。そしてジョブ702全体の終了が認
識されると、新たなメモリ空間(図6のA3)にジョブ
702’を確保して主プロセス703’を再起動する。
そしてこの主プロセス703’からの再起動打ち切り宣
言を再起動判定部102が受け付けると、この主プロセ
ス703’は終了され、これ以降の再起動動作は行われ
ない。
FIG. 7 conceptually shows this.
That is, the job scheduler 701 activates the main process 703 and the sub-processes 704 and 705 in the job 702. If an abnormality is detected by the main process 703 during this process, the recovery process unit 101 recovers the sub processes 704 and 705. When the end of the entire job 702 is recognized, the job 702 ′ is secured in a new memory space (A3 in FIG. 6) and the main process 703 ′ is restarted.
When the restart determination unit 102 receives the restart termination declaration from the main process 703 ', the main process 703' is terminated and the subsequent restart operation is not performed.

【0030】ジョブ(主プロセス)の再起動の処理手順
を示したものが図8である。同図において、ジョブ70
2を構成する主プロセス703の終了が検出されると
(801)、主プロセス703の終了状態が退避される
(802)。次に、ジョブを構成する他の主プロセスが
あるか否かが判断され(803)、存在する場合にはジ
ョブの終了がユーザに通知される(805)。存在しな
い場合には、ジョブを構成する主プロセス703以外の
副プロセス704,705が強制終了される(80
4)。
FIG. 8 shows the processing procedure for restarting the job (main process). In the figure, a job 70
When the end of the main process 703 constituting the second process is detected (801), the end state of the main process 703 is saved (802). Next, it is determined whether or not there is another main process that constitutes the job (803), and if there is, the user is notified of the end of the job (805). If they do not exist, the sub-processes 704 and 705 other than the main process 703 forming the job are forcibly terminated (80
4).

【0031】次に、ジョブから打ち切り指示があったか
否かが判断されるが(806)、これが肯定枝に分岐す
るのは主プロセス703’が再起動された場合となる。
ジョブより打ち切り指示がない場合には、退避していた
主プロセス703の終了状態を起動情報としてジョブを
構成する主プロセス703’を再起動する(807)。
Next, it is judged whether or not there is a termination instruction from the job (806), but this branches to the positive branch when the main process 703 'is restarted.
If there is no termination instruction from the job, the main process 703 'constituting the job is restarted using the saved end status of the main process 703 as the startup information (807).

【0032】以上のように、本実施例2によれば、ジョ
ブ自身に再起動を打ち切る論理を組み込むことにより、
ジョブプログラムによる柔軟な対応が可能となりシステ
ムの自動運転に寄与することができる。
As described above, according to the second embodiment, by incorporating the logic for aborting the restart in the job itself,
The job program can flexibly support the system and contribute to the automatic operation of the system.

【0033】[0033]

【発明の効果】本発明によれば、ジョブを構成する主プ
ロセスに異常が発生した場合に、強制的にその副プロセ
スも終了させるため、異常が発生したプログラムの一部
が動作を継続していることがなくなり、相互干渉による
動作不良が防止できる。
According to the present invention, when an abnormality occurs in the main process that constitutes a job, the sub-process is forcibly terminated, so that a part of the program in which the abnormality occurs continues to operate. It is possible to prevent malfunction due to mutual interference.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の原理図FIG. 1 is a first principle diagram of the present invention.

【図2】本発明の第2の原理図FIG. 2 is a second principle diagram of the present invention.

【図3】本発明の実施例1の計算機のシステム構成を示
す説明図
FIG. 3 is an explanatory diagram showing a system configuration of a computer according to the first embodiment of the present invention.

【図4】実施例1の計算機の動作を示す説明図FIG. 4 is an explanatory diagram showing the operation of the computer according to the first embodiment.

【図5】実施例1の計算機の動作を示す説明図FIG. 5 is an explanatory diagram showing the operation of the computer according to the first embodiment.

【図6】実施例2の計算機の動作を示す説明図FIG. 6 is an explanatory diagram showing the operation of the computer according to the second embodiment.

【図7】実施例2の動作を概念的に示した説明図FIG. 7 is an explanatory diagram conceptually showing the operation of the second embodiment.

【図8】実施例2のジョブの再起動における処理手順を
示すフロー図
FIG. 8 is a flowchart showing a processing procedure in restarting a job according to the second embodiment.

【図9】従来技術の説明図FIG. 9 is an explanatory diagram of a conventional technique.

【図10】従来技術の説明図FIG. 10 is an explanatory diagram of a conventional technique.

【符号の説明】[Explanation of symbols]

10・・計算機システム 11,12・・プロセス 13,14・・プロセス制御部 15・・回復処理部 16・・再起動処理部 17・・セッション制御部 18・・回復用情報記憶部 19・・不揮発メモリ 20・・カーネル部 21・・異常検出部 22・・空間管理部 23・・空間管理テーブル 101・・回収処理部 102・・再起動判定部 701・・ジョブスケジューラ 702・・ジョブ 703・・主プロセス 704,705・・副プロセス 10 ... Computer system 11, 12 ... Process 13, 14 ... Process control unit 15 ... Recovery processing unit 16 ... Reboot processing unit 17 ... Session control unit 18 ... Recovery information storage unit 19 ... Nonvolatile Memory 20 Kernel unit 21 Abnormality detection unit 22 Space management unit 23 Space management table 101 Recovery processing unit 102 Restart determination unit 701 Job scheduler 702 Job 703 Main Process 704, 705 ... Sub process

─────────────────────────────────────────────────────
─────────────────────────────────────────────────── ───

【手続補正書】[Procedure amendment]

【提出日】平成6年4月5日[Submission date] April 5, 1994

【手続補正1】[Procedure Amendment 1]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図3[Name of item to be corrected] Figure 3

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図3】 [Figure 3]

【手続補正2】[Procedure Amendment 2]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図4[Name of item to be corrected] Fig. 4

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図4】 [Figure 4]

【手続補正3】[Procedure 3]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図5[Name of item to be corrected] Figure 5

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図5】 [Figure 5]

【手続補正4】[Procedure amendment 4]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図6[Name of item to be corrected] Figure 6

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図6】 [Figure 6]

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 ジョブが相互にメモリを共用しない複数
のプロセスからなる計算機システムにおいて、 少なくとも一つのプロセスの異常を検出する異常検出部
(21)と、 ジョブを構成するプロセスのうち、異常を生じていない
残りのプロセスを強制的に終了させてプロセスの情報を
回収する回収処理部(101)と、 前記プロセスのうち少なくとも主プロセスとなるプロセ
スを新たなメモリ空間上で再起動させる再起動処理部
(16)とを有するプロセス自動再起動処理方式。
1. A computer system comprising a plurality of processes in which jobs do not share memory with each other. An abnormality detection unit (21) for detecting an abnormality of at least one process, and an abnormality occurs among processes constituting a job. A recovery processing unit (101) for forcibly terminating the remaining unprocessed process and recovering process information, and a restart processing unit for restarting at least the main process of the processes on a new memory space. (16) A process automatic restart processing method including:
【請求項2】 前記再起動処理部(16)には、前記で
再起動されたプロセスを強制的に打ち切るか否かを判断
する再起動判定部(102)を備えていることを特徴と
する請求項1記載のプロセス自動再起動処理方式。
2. The restart processing section (16) is provided with a restart determination section (102) for determining whether or not the process restarted in the above is forcibly terminated. The process automatic restart processing method according to claim 1.
JP06410294A 1994-03-31 1994-03-31 Process automatic restart processing method Expired - Fee Related JP3604171B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06410294A JP3604171B2 (en) 1994-03-31 1994-03-31 Process automatic restart processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06410294A JP3604171B2 (en) 1994-03-31 1994-03-31 Process automatic restart processing method

Publications (2)

Publication Number Publication Date
JPH07271611A true JPH07271611A (en) 1995-10-20
JP3604171B2 JP3604171B2 (en) 2004-12-22

Family

ID=13248385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06410294A Expired - Fee Related JP3604171B2 (en) 1994-03-31 1994-03-31 Process automatic restart processing method

Country Status (1)

Country Link
JP (1) JP3604171B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282192A (en) * 1996-04-15 1997-10-31 Nec Corp Job re-execution system
JP2018018122A (en) * 2016-07-25 2018-02-01 富士通株式会社 Information processing program, information processing apparatus, and information processing method
CN110471784A (en) * 2019-07-29 2019-11-19 阿里巴巴集团控股有限公司 Playback terminal abnormality eliminating method and device based on Electron platform

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59140568A (en) * 1983-01-31 1984-08-11 Fujitsu Ltd Program abnormality processing system
JPS634339A (en) * 1986-06-25 1988-01-09 Hitachi Ltd Task control system
JPH02158843A (en) * 1988-12-12 1990-06-19 Fujitsu Ltd Automatic restart processing system for process
JPH0546423A (en) * 1991-08-09 1993-02-26 Fujitsu Ltd Master/slave relation transfer processing device for process
JPH05165539A (en) * 1991-12-18 1993-07-02 Hitachi Ltd Automatic restart control system for batch program
JPH06332734A (en) * 1993-05-24 1994-12-02 Nec Corp System activation maintaining system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59140568A (en) * 1983-01-31 1984-08-11 Fujitsu Ltd Program abnormality processing system
JPS634339A (en) * 1986-06-25 1988-01-09 Hitachi Ltd Task control system
JPH02158843A (en) * 1988-12-12 1990-06-19 Fujitsu Ltd Automatic restart processing system for process
JPH0546423A (en) * 1991-08-09 1993-02-26 Fujitsu Ltd Master/slave relation transfer processing device for process
JPH05165539A (en) * 1991-12-18 1993-07-02 Hitachi Ltd Automatic restart control system for batch program
JPH06332734A (en) * 1993-05-24 1994-12-02 Nec Corp System activation maintaining system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282192A (en) * 1996-04-15 1997-10-31 Nec Corp Job re-execution system
JP2018018122A (en) * 2016-07-25 2018-02-01 富士通株式会社 Information processing program, information processing apparatus, and information processing method
CN110471784A (en) * 2019-07-29 2019-11-19 阿里巴巴集团控股有限公司 Playback terminal abnormality eliminating method and device based on Electron platform
CN110471784B (en) * 2019-07-29 2023-03-14 创新先进技术有限公司 Play terminal exception handling method and device based on Electron platform

Also Published As

Publication number Publication date
JP3604171B2 (en) 2004-12-22

Similar Documents

Publication Publication Date Title
JP3345626B2 (en) Processor error countermeasure device in multiprocessor system and processor error countermeasure method in multiprocessor system
JP3196004B2 (en) Failure recovery processing method
EP0319034B1 (en) Method of recovering failure of online control program
JPH0820965B2 (en) How to continue running the program
JP4315016B2 (en) System switching method for computer system
JP3481737B2 (en) Dump collection device and dump collection method
JPH07311749A (en) Multiprocessor system and kernel substituting method
JP3551079B2 (en) Recovery method and device after replacement of modified load module
JPH07271611A (en) Automatic process restarting and processing system
JP2011053780A (en) Restoration system, restoration method and backup control system
JP4708088B2 (en) Failure recovery method and microcomputer
JP2002049509A (en) Data processing system
JP3022768B2 (en) Virtual computer system
JPH08329006A (en) Fault information system
JP2785992B2 (en) Server program management processing method
JP2710668B2 (en) Computer system
JP4788516B2 (en) Dynamic replacement system, dynamic replacement method and program
JPS597982B2 (en) Restart method in case of system failure of computer system
JPH08329025A (en) Process migration system
JP3225265B2 (en) Checkpoint recovery method
JP3470454B2 (en) Communication control method for multiprocessor system
JP2785342B2 (en) Processing system
JPH02114364A (en) Abnormality processing system in multiprocessor system
JP3464768B2 (en) Processor device with file load
JP2909128B2 (en) Startup processing takeover processor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040928

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071008

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees