JPH05342023A - リソース獲得時間を用いたシステム管理方法 - Google Patents

リソース獲得時間を用いたシステム管理方法

Info

Publication number
JPH05342023A
JPH05342023A JP4144697A JP14469792A JPH05342023A JP H05342023 A JPH05342023 A JP H05342023A JP 4144697 A JP4144697 A JP 4144697A JP 14469792 A JP14469792 A JP 14469792A JP H05342023 A JPH05342023 A JP H05342023A
Authority
JP
Japan
Prior art keywords
resource
time
program
unit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4144697A
Other languages
English (en)
Inventor
Tomoaki Kaneda
友晃 兼田
Makoto Ueno
真琴 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Communication Systems Ltd
Original Assignee
Fujitsu Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Communication Systems Ltd filed Critical Fujitsu Communication Systems Ltd
Priority to JP4144697A priority Critical patent/JPH05342023A/ja
Publication of JPH05342023A publication Critical patent/JPH05342023A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Stored Programmes (AREA)

Abstract

(57)【要約】 【目的】 複数のリソース管理を行うオペレーティング
・システムに関し、リソースの獲得が長時間に及び保留
状態にあることを検出してシステムリソース管理機能を
向上することを目的とする。 【構成】 複数のアプリケーション・プログラム(A
P)からなるAP部3と、該アプリケーション・プログ
ラムに命令するためのプログラムを実行して該プログラ
ムの実行状態を管理するOS部4とを有し、該プログラ
ムの実行状態を格納(ロギング)するシステム状態の格
納部1において、該OS部4に複数のリソースを管理す
るリソース管理部7とオペレーティング・システムの処
理を実行するOS処理部8とを設け、リソース管理部7
のタイマによりアプリケーション・プログラムが獲得し
たリソース9の使用時間を監視し、該リソースを所有し
ている時間(獲得してから解放するまでの時間)を計測
することにより該システムの異常状態を管理するように
構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はリソース管理を行うオペ
レーティング・システムのシステム管理方法に関する。
リソース(メモリ領域)を有して常時運用する装置とし
ては、自動車電話のターミナル装置や銀行のATM装置
(現金自動支払機)や電話局での接続制御装置等多方面
の装置で使用されているが、これらの装置はシステムと
しての運用上障害管理が常時必要である。
【0002】オペレーティング・システムには、プログ
ラムの実行状態を管理する部分やプログラムを実行させ
る部分から構成されるOS部があり、AP部は種々のア
プリケーション・プログラムから構成され、AP部がプ
ログラムを実行すると、OS部はプログラムの実行領域
を設定し、そのプログラム領域が使用中であることや何
時終了したかを管理し、次のプログラムの実行要求に対
しては別のプログラム使用領域を設定する等のプログラ
ムの実行状態管理を行う。
【0003】上記オペレーティング・システム(OS)
においては、システムの異常検出のためにアプリケーシ
ョン・プログラム(AP)がリソースを所有している時
間に制限を設けてリソース管理を行っている。リソース
管理対象としては、メモリ(記憶領域)やセマフォ(リ
ソース使用状況管理フラグ)やQRB(タスク間通信用
バッファ)等がある。これらのリソースにはプログラム
そのものは含まずリソース管理を行っている。
【0004】
【従来の技術】従来のオペレーティング・システムにお
いては、システム異常検出のための一手段として以下の
方法を用いていた。即ちアプリケーション・プログラム
が獲得できるリソース数に上限を設け、それ以上のリソ
ース獲得が行われた場合にシステム異常状態に陥ったと
認識して、核タスクの処理を中断していた。
【0005】従来の制限値を用いた場合のシステム管理
例を図6に示す。図において、Q1,Q2,Q3,・・・Qn
はリソースの待ち行列(キュー)を示し、点線の状態は
正常に処理が行われたことを示し、実線の状態は処理z
が実行されたがリソースが解放されずにキューが残って
いる状態を示す。処理zには未知のバグが潜在してお
り、それはA日毎に本処理zがコールされる時に発生す
る。そのため、キューの解放処理が正常に動作せずにキ
ューが残留していく。
【0006】最初に正常の処理が行われ、すべての待ち
行列(キュー)が解放された状態から、A日目に処理z
が実行され、1つのキューQ1 が解放されずに残った。
次に(A×2)日目に再び処理zが実行され、1つのキ
ューQ2 が解放されずに残って、総数が2になった。以
上のようにして(A×n)日目に処理zが実行され、キ
ューが解放されずに残り制限値nを越えた時、システム
異常となりデッドロック状態になる。従って(A×n)
日目に制限値n以上になった時点で、初めてシステム異
常状態と判断された。
【0007】
【発明が解決しようとする課題】従って、リソース獲得
数が制限値には至らないが解放されずに保留される状況
が持続した場合には、早急にシステムの異常状態に対し
て検出が行えないなどの問題点が生じていた。
【0008】本発明は、リソースの獲得が長時間におよ
び保留状態にあることに対する早急な検出を可能とする
ことにより、オペレーティング・システムが行うべきシ
ステムリソース管理機能の向上を図ることを目的とす
る。
【0009】
【課題を解決するための手段】本発明の原理構成図を図
1に示す。図において、1はシステム状態の格納部、2
はOSシステム部、3はAP部、4はOS部、5はタイ
ムアウト・ルーチン部、6はQRB部、7はリソース管
理部、8はOS処理部、9はリソースSを示す。システ
ム状態の格納部1はプログラムの実行状態を格納(ロギ
ング)するメモリ部で、OSシステム部2とAP部3と
からなり、OSシステム部2はOS部4とシステム修復
処理を行うタイムアウト・ルーチン部5とタスク間通信
用バッファQRB部6とからなり、AP部3は複数のア
プリケーション・プログラムAP1,AP2,AP3,
・・・からなる。
【0010】OS部4はアプリケーション・プログラム
(AP)に命令するためのプログラムを実行し、プログ
ラムの実行状態を管理するオペレーティング・システム
部であり、リソースを管理するリソース管理部7とオペ
レーティング・システムの処理を行うOS処理部8とか
らなり、リソース管理部7でタイマにより複数のリソー
ス9を管理し、OS処理部8でアプリケーション・プロ
グラム(AP)を実行処理する。
【0011】オペレーティング・システム(OS)は、
アプリケーション・プログラム(AP)がリソースSを
所有している時間(獲得してから解放するまでの時間)
を計測することにより、リソースの管理を行う。なお、
以下リソース管理対象として、メモリ(記憶領域)、セ
マフォ(リソース使用状況管理フラグ)、QRB(タス
ク間通信用バッファ)がある。
【0012】
【作用】オペレーティング・システム(OS)とアプリ
ケーション・プログラム(AP)の動作を図1により説
明する。 AP部3がリソース9を獲得すると、OS部のリソ
ース管理部7はそのリソース9に対する時間計測用のタ
イマをスタートさせる。 監視時間内にリソース9が解放されない場合は、タ
イマがタイムアウトしてOS処理部8に割り込みがかか
り、その時点のシステム情報(例えばスタックにあるリ
ソース情報)をシステム状態格納部1に格納し、該当す
るタイムアウト・ルーチン5が呼出されて、システム異
常状態に対する修復処理が行われる。 なお、このタイムアウト・ルーチンは、ユーザが任
意にその処理内容を設定する。処理内容の例を以下に示
す。リソースの解放を行い、システム再立ち上げ処理を
行う。あるいは、異常の生じたリソースに対しアプリケ
ーション・プログラム(AP)への使用禁止をかけ、異
常の生じたリソースへの要求が発生した場合、他のリソ
ースを提供して処理を続行させるなどのシステム修復処
理が行われる。 監視時間内にリソース9が解放された場合は、AP
部3よりリソース9が開放されると、OS部4のリソー
ス管理部7はタイマを停止し、リソース9に対する処理
を終了する。なお、監視時間は、ユーザがリソース個々
に対して予め監視タイマテーブル(OSのシステム編集
テーブルにある)に設定する。または、リソース要求時
にアプリケーション・プログラムから任意にその監視時
間を設定することができる。
【0013】
【実施例】本発明の実施例として、現用/予備CPU構
成をとったシステムで用いられているリソース管理用O
S「RMTOS」(Resourse Manage Timer's OS) の例
を示す。図2はリソース管理用OSのブロック構成図、
図3はCPU切り替えシーケンス(REMTOS)、図
4はRMTOSのリソース管理方法の概念図を示す。
【0014】図2において、11はOS部、12はAP、13
はリソース管理部、14はモニタ中央制御部、15はメモリ
A、16はセマフォA、17はメモリB、18はタイマを示
す。AP12からのリソース獲得要求をモニタ中央制御部
14で受信し、リソース管理部13はモニタ中央制御部14か
らのリソース所有時間計測要求を受信し、リソース待ち
行列(リソース・Q)15, 16, 17から該当するリソース
のタイムアウトをタイマ18により監視し、タイムアウト
になればモニタ中央制御部14を通してタイムアウト・ル
ーチンを呼出し、全リソース解放や現システム状態の格
納等の処理を行う。
【0015】図3において、タイムアウトになった場合
のCPU切り替え状態を示す。現用のCPU1において
APからOSに対してメモリA獲得要求信号を送出す
る。OSにおいてメモリAを獲得すればOSからAPに
対してメモリA獲得信号を返送する。OSにおいてタイ
マにより時間計測を開始し、タイムアウトになればメモ
リA,セマフォA,メモリBの解放を行い、同時にOS
よりAPに対して異常通知を行う。CPU1のAPより
CPU2のAPに対して現用予備CPU切替要求(NM
I)を送出し、CPU2からCPU1に対して現用予備
CPU切替応答(NMI)を送出してCPUの現用/予
備の切替えを行う。
【0016】図4において、本システムではリソース管
理対象として、メモリ、セマフォ、QRBがあり、メモ
リAに対し監視時間3、セマフォAに対し監視時間9、
メモリBに対し監視時間8がシステム編集テーブルに設
定されているとする。リソース管理部の時間的な動きを
図で説明する。時間tでメモリA用タイマ、セマフォA
用タイマを開始し、時間(t+1)においてメモリB用
タイマの計測を開始する。時間(t+3)においてもメ
モリAが解放されないためシステム異常状態にあるとし
て、RMTOSは現在のシステム状態をロギングした後
に、そのメモリA用のタイムアウトルーチンを呼出し、
そこに記述されている処理、つまりリソース(メモリA
のみでなくセマフォA及びメモリBなどの全リソース)
を解放し、その後CPUの現用/予備の切替えを行いシ
ステム修復を行う。
【0017】なお、この例ではリソース獲得時間を計測
するためにリソース毎にタイマが必要となるが、単純に
リソース一つに対してタイマを1対1で対応づけしてい
ると、膨大なタイマ数が必要となる。そのため、このタ
イマの管理対象はリソース種別及び計測時間とし、差分
法のロジックを用いて時間計測を行う。
【0018】差分法によるタイマ計測方法について図5
に示す。図5において、要因の発生と要因の発生毎
にt5用タイマ1とt3用タイマ2とを1対1で使用す
るとタイマが複数必要となるが、差分法によりリソース
管理タイマを1個にし要因の発生のタイマ計測残り時
間t2を記憶しておき、タイムアウトt5後は引続きそ
の時間t2を計測することができる。
【0019】しかも相対値による方法を採用すると、持
ちキューの管理は容易になる。即ち持ちキューを追加す
る場合1つのキューの計測時間のみ変更すればよく、同
様に削除のときも1つのキューの計測時間のみ変更すれ
ばよい。特にこの点は、管理対象となるリソース数が増
大すればするほど効果が上がる。
【0020】
【発明の効果】以上説明したように、本方法により以下
の成果が挙げられる。 (1) リソース管理をアプリケーション・プログラムがリ
ソースを所有している時間に着目することにより、シス
テム異常状態の検出が早急かつ的確に行える。 (2) 異常状態の情報(スタック情報など)を格納して、
後の保守が可能となる。 (3) タイムアウト・ルーチンに異常時に行う処理をユー
ザが任意に規定することが可能で、核システムに柔軟に
対応できる。 (4) システムジェネレーション・テーブルに監視時間を
設定できるため、アプリケーションからの監視時間を意
識する必要性がない。
【図面の簡単な説明】
【図1】 本発明の原理構成図
【図2】 リソース管理用OSのブロック構成図の実施
【図3】 CPU切替えシーケンスの実施例
【図4】 リソース管理方法の実施例の概念図
【図5】 差分法によるタイマ計測方法の実施例
【図6】 従来のシステム管理例
【符号の説明】
1 システム状態の格納部 2 OSシステム部 3,12 AP部 4,11 OS部 5 タイムアウト・ルーチン部 6 QRB部 7,13 リソース管理部 8 OS処理部 9 リソースS 14 モニタ中央制御部 15 メモリA 16 セマフォA 17 メモリB 18 タイマ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 複数のアプリケーション・プログラム
    (AP)からなるAP部(3)と、該アプリケーション
    ・プログラムに命令するためのプログラムを実行して該
    プログラムの実行状態を管理するOS部(4)と、シス
    テムの修復処理を行うタイムアウト・ルーチン部(5)
    とを有し、該プログラムの実行状態を格納(ロギング)
    するシステム状態の格納部(1)において、 該OS部(4)にリソースを管理するリソース管理部
    (7)とオペレーティング・システムの処理を実行する
    OS処理部(8)とを設け、 該リソース管理部(7)のタイマによりアプリケーショ
    ン・プログラム(AP)が獲得したリソース(9)の所
    有している時間(獲得してから解放するまでの時間)を
    計測することにより、該システムの異常状態を管理し、
    異常検出後リソース解放やアプリケーションへの通知な
    どの修復処理を行うことを特徴とするリソース獲得時間
    を用いたシステム管理方法。
JP4144697A 1992-06-05 1992-06-05 リソース獲得時間を用いたシステム管理方法 Pending JPH05342023A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4144697A JPH05342023A (ja) 1992-06-05 1992-06-05 リソース獲得時間を用いたシステム管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4144697A JPH05342023A (ja) 1992-06-05 1992-06-05 リソース獲得時間を用いたシステム管理方法

Publications (1)

Publication Number Publication Date
JPH05342023A true JPH05342023A (ja) 1993-12-24

Family

ID=15368173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4144697A Pending JPH05342023A (ja) 1992-06-05 1992-06-05 リソース獲得時間を用いたシステム管理方法

Country Status (1)

Country Link
JP (1) JPH05342023A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102311A (ja) * 2005-09-30 2007-04-19 Fujitsu Ltd ワーム感染装置の検出装置
JP2012003611A (ja) * 2010-06-18 2012-01-05 Denso Corp 時間監視装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102311A (ja) * 2005-09-30 2007-04-19 Fujitsu Ltd ワーム感染装置の検出装置
US8015609B2 (en) 2005-09-30 2011-09-06 Fujitsu Limited Worm infection detecting device
JP2012003611A (ja) * 2010-06-18 2012-01-05 Denso Corp 時間監視装置及び方法

Similar Documents

Publication Publication Date Title
KR920003497B1 (ko) 억세스 손실 처리용 시스템 및 그 보호방법
CA1232688A (en) Reconfigurable dual processor system
US4635187A (en) Control for a multiprocessing system program process
Grottke et al. The fundamentals of software aging
US5621663A (en) Method and system for monitoring a computer system
US20180331888A1 (en) Method and apparatus for switching service nodes in a distributed storage system
JPH0298768A (ja) マルチプロセッサ・システムの過剰スピン・ループ退避装置
JP2006011992A (ja) クラスタ構成コンピュータシステムの系切替方法
JPH0799502B2 (ja) コンピュータ・システム
JPH04245751A (ja) イベント処理分散型網監視システム
JPH04230538A (ja) 障害ソフトウエア・コンポーネントの検出方法及び装置
CN111459623B (zh) 应用程序恢复运行的方法、装置及计算机
JP2006277115A (ja) 異常検出プログラムおよび異常検出方法
RU2134446C1 (ru) Способ управления перегрузкой сообщениями элементарной программы в мультипроцессорной управляющей системе (варианты)
WO2002093374A2 (en) Task supervision
US8332069B2 (en) Fault tolerance method and apparatus for robot software component
JP2008003691A (ja) 計算機のプロセス回復方法、チェックポイントリスタートシステム
JPH05342023A (ja) リソース獲得時間を用いたシステム管理方法
JP5435205B2 (ja) マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム
JP3467750B2 (ja) 分散オブジェクト処理システム
TW200416605A (en) Method for meeting SMI duration limits by time slicing SMI handlers
JPH0635758A (ja) プログラム監視制御装置
JP2656643B2 (ja) ログデータ採取方法とその装置
JP2008077388A (ja) マルチプロセッサ制御システム、方法、およびプログラム
JPH10269110A (ja) 計算機システムのハングアップ回避方法並びにこの方法を用いた計算機システム。

Legal Events

Date Code Title Description
A977 Report on retrieval

Effective date: 20041209

Free format text: JAPANESE INTERMEDIATE CODE: A971007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041221

A61 First payment of annual fees (during grant procedure)

Effective date: 20041227

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees