JPH0683650A - System resources monitoring method - Google Patents

System resources monitoring method

Info

Publication number
JPH0683650A
JPH0683650A JP4232335A JP23233592A JPH0683650A JP H0683650 A JPH0683650 A JP H0683650A JP 4232335 A JP4232335 A JP 4232335A JP 23233592 A JP23233592 A JP 23233592A JP H0683650 A JPH0683650 A JP H0683650A
Authority
JP
Japan
Prior art keywords
system resources
application program
load
execution
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4232335A
Other languages
Japanese (ja)
Inventor
Osamu Kusuda
修 楠田
Katsuya Takada
克也 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4232335A priority Critical patent/JPH0683650A/en
Publication of JPH0683650A publication Critical patent/JPH0683650A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To prevent the system down of an information processor by controlling the load in real time to the system resources in regard of the system resources monitoring method for the information processor, etc., constructing an on-line network. CONSTITUTION:An information processor (host computer) 1 contains a software monitor 10 to collect the application information on the system resources and can carry out the application programs A, B and C in parallel to each other. Then the allowance value, i. e., the load set to the system resources is previously defined together with an execution stopping procedure for each of programs A-C. The application program serving as the load exceeding the allowance value to the system resources is detected based on the application information collected by the monitor 10. Then the execution of the detected application program is stopped based on the defined procedure.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、オンラインネットワー
クを構成する情報処理装置などのシステム資源の監視方
法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of monitoring system resources such as an information processing device which constitutes an online network.

【0002】ホストコンピュータに複数の端末がアクセ
スするオンラインネットワークでは、ホストコンピュー
タのシステムダウンを防止してネットワークの信頼性を
高める必要がある。
In an online network in which a plurality of terminals access a host computer, it is necessary to prevent system down of the host computer and improve network reliability.

【0003】[0003]

【従来の技術】一般に、オンラインネットワークのホス
トには、システム資源の使用情報を収集して記憶するソ
ウトウェアモニタ(監視プログラム)が設けられてい
る。使用情報は、適時に表示又はプリントアウトされ、
ネットワーク管理者により、ネットワークの円滑且つ効
率的な運用のための管理情報として利用される。
2. Description of the Related Art Generally, a host of an online network is provided with a software monitor (monitoring program) for collecting and storing usage information of system resources. Usage information is displayed or printed out in a timely manner,
It is used by the network administrator as management information for smooth and efficient operation of the network.

【0004】ところで、オンラインネットワークにおい
て、端末によるアクセスに呼応してホストが各種処理
(例えば情報検索や数値計算など)に対応したアプリケ
ーションプログラムを並行して実行するように構成され
たものがある。
On the other hand, in some online networks, a host is configured to execute application programs corresponding to various processes (for example, information retrieval and numerical calculation) in parallel in response to access by a terminal.

【0005】この種のネットワークでは、ネットワーク
利用者(端末操作者)の要求する処理の内容、つまり検
索範囲や計算式などといったアプリケーションプログラ
ムの実行条件によっては、アプリケーションプログラム
がホストのシステム資源に対して過負荷となり、ホスト
のシステムダウンを誘発することがある。
In this type of network, depending on the content of the processing requested by the network user (terminal operator), that is, the execution conditions of the application program such as the search range and the calculation formula, the application program may make a difference with respect to the host system resources. It may overload and cause the system of the host to go down.

【0006】従来ではシステム資源の使用情報は自動的
に収集されるものの、システム資源に対する負荷の調整
はネットワーク管理者によって人為的に行われていた。
すなわち、通常は、まずネットワーク利用者が応答性
(端末レスポンス)などからネットワークの異常に気づ
き、電話などによって異常をネットワーク管理者に連絡
する(苦情を訴える)。
Conventionally, although the usage information of the system resources is automatically collected, the load on the system resources is manually adjusted by the network administrator.
That is, usually, the network user first notices the abnormality of the network from the responsiveness (terminal response), and informs the network administrator of the abnormality by telephone (complains).

【0007】連絡を受けたネットワーク管理者は、異常
の原因調査を行い、原因がシステム資源の過負荷であれ
ば、異常事態の対処として、高負荷のアプリケーション
プログラムについて、その実行を強制的に停止する制御
コマンドの入力や利用者への警告(停止の要請)などを
行う。
The network administrator who has received the report investigates the cause of the abnormality, and if the cause is an overload of the system resource, the execution of the high-load application program is forcibly stopped as a countermeasure against the abnormal situation. Input a control command to activate or warn the user (request to stop).

【0008】[0008]

【発明が解決しようとする課題】従来では、ネットワー
ク管理者による対処が遅れてシステムダウンに陥ること
があるという問題があった。そして、システムダウンを
避ける上で、ネットワーク管理者が常に使用情報により
システム資源の使用状況を把握し、異常時に俊敏に対処
する必要があるので、ネットワーク管理者の作業負担が
大きい。
Conventionally, there has been a problem that a system administrator may be delayed due to a delay in dealing with a network administrator. In order to avoid a system down, the network administrator must always grasp the usage status of the system resources by using the usage information and promptly deal with the abnormality, so that the network administrator has a heavy work load.

【0009】また、アプリケーションプログラム毎に対
処方法(特に入力すべき制御コマンド)が異なる場合に
おいて、対処の誤りにより他の正常なアプリケーション
プログラムが停止するなど、ネットワーク利用者が過大
の迷惑を被るおそれがあるという問題もあった。
Further, when the coping method (particularly, the control command to be input) differs for each application program, there is a risk that the network user may be overly annoyed, for example, another normal application program may be stopped due to a coping error. There was also the problem of being there.

【0010】本発明は、上述の問題に鑑み、システム資
源に対する負荷の調整をリアルタイムで行うことによ
り、情報処理装置のシステムダウンを防止することを目
的としている。
In view of the above problems, it is an object of the present invention to prevent system down of an information processing apparatus by adjusting the load on system resources in real time.

【0011】[0011]

【課題を解決するための手段】請求項1の発明に係る監
視方法は、上述の課題を解決するため、図1に示すよう
に、システム資源の使用情報を収集するソフトウェアモ
ニタ10を備え、複数のアプリケーションプログラム
A,B,Cを並行して実行可能な情報処理装置1におい
て、予めアプリケーションプログラムA,B,C毎にシ
ステム資源に対する負荷としての許容値と実行停止の手
順とを定義しておき、前記ソフトウェアモニタが収集し
た使用情報に基づいて、システム資源に対して許容値を
越える負荷となるアプリケーションプログラムを検出
し、検出したアプリケーションプログラムの実行を定義
されている手順に従って停止する。
In order to solve the above-mentioned problems, the monitoring method according to the invention of claim 1 comprises a software monitor 10 for collecting system resource usage information, as shown in FIG. In the information processing apparatus 1 capable of executing the application programs A, B, and C in parallel, a permissible value as a load on system resources and a procedure for stopping execution are defined in advance for each of the application programs A, B, and C. Based on the usage information collected by the software monitor, an application program having a load exceeding a permissible value for system resources is detected, and execution of the detected application program is stopped according to a defined procedure.

【0012】請求項2の発明に係る監視方法は、アプリ
ケーションプログラムA,B,C毎にCPU使用量の許
容値を定義しておく。請求項3の発明に係る監視方法
は、前記情報処理装置1をオンラインネットワークのホ
ストコンピュータとする。
In the monitoring method according to the second aspect of the present invention, the allowable value of CPU usage is defined for each of the application programs A, B and C. In the monitoring method according to the invention of claim 3, the information processing device 1 is a host computer of an online network.

【0013】[0013]

【作用】ソフトウェアモニタの収集する使用情報に基づ
いて、複数のアプリケーションプログラム毎に、システ
ム資源の負担の度合いが検知される。
The degree of burden of system resources is detected for each of a plurality of application programs based on the usage information collected by the software monitor.

【0014】アプリケーションプログラムがCPUなど
のシステム資源に対して許容値を越える負荷となったと
きには、そのアプリケーションプログラムは所定手順で
停止され、これによりシステム資源の負担が軽減されて
システムダウンが回避される。
When the load of the application program on the system resources such as the CPU exceeds the allowable value, the application program is stopped in a predetermined procedure, thereby reducing the load on the system resources and avoiding the system down. .

【0015】[0015]

【実施例】図1は本発明の監視方法を適用したホストコ
ンピュータ1が実行する各プログラムの関係を模式的に
示す図、図2は図1の監視情報テーブルTABの内容の
一例を示す図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a diagram schematically showing the relationship between programs executed by a host computer 1 to which the monitoring method of the present invention is applied, and FIG. 2 is a diagram showing an example of the contents of the monitoring information table TAB of FIG. is there.

【0016】ホストコンピュータ1は、図示しない複数
の端末とともにオンラインネットワークを構成する汎用
コンピュータであり、ネットワーク管理者がプログラム
の実行に係る動作環境を任意に定義するための動作環境
定義ファイル30を備えている。
The host computer 1 is a general-purpose computer that constitutes an online network together with a plurality of terminals (not shown), and is provided with an operating environment definition file 30 for the network administrator to arbitrarily define an operating environment for executing the program. There is.

【0017】図1において、ホストコンピュータ1内で
は、図示しないCPU(中央処理装置)によって、端末
によるアクセスに呼応してアプリケーションプログラム
A,B,Cが起動され、それに先立ってネットワーク管
理のためのソフトウェアモニタ10及び負荷調整プログ
ラム20が起動されている。
In FIG. 1, in the host computer 1, application programs A, B and C are activated by a CPU (central processing unit) (not shown) in response to access by a terminal, and prior to that, software for network management. The monitor 10 and the load adjustment program 20 are activated.

【0018】ここで、アプリケーションプログラムA,
B,Cは、ネットワークの構築目的に応じて任意に設け
られた処理プログラムである。すなわち、例えばネット
ワークが企業内情報システムを構成する場合であれば、
アプリケーションプログラムA,B,Cは営業・製造・
開発などの各業務の効率化のための各種プログラム(在
庫管理や情報検索など)とされ、ネットワークが座席予
約システムを構成する場合であれば、アプリケーション
プログラムA,B,Cは新規予約・予約変更・予約取消
などの各処理に対応したプログラムとされる。
Here, the application program A,
B and C are processing programs arbitrarily provided according to the purpose of constructing the network. That is, for example, when the network constitutes an in-house information system,
Application programs A, B and C are for sales, manufacturing,
Various programs (stock management, information retrieval, etc.) for efficiency of each work such as development, and application programs A, B, C are new reservation / reservation change if the network constitutes a seat reservation system.・ It is a program corresponding to each processing such as reservation cancellation.

【0019】一方、ソフトウェアモニタ10は、ネット
ワーク管理者によるトラフィックの解析などのために設
けられた周知の監視プログラムであり、実行中のアプリ
ケーションプログラムA,B,C毎に、一定周期でシス
テム資源の使用情報(CPU使用量及びバッファ使用量
など)を収集する。
On the other hand, the software monitor 10 is a well-known monitoring program provided for the network administrator to analyze the traffic, and the system resources of the running application programs A, B, C are periodically monitored. Usage information (CPU usage, buffer usage, etc.) is collected.

【0020】さて、負荷調整プログラム20は本発明の
特徴となる管理プログラムである。負荷調整プログラム
20は、情報抽出部21、判定部22、及び処置部23
から構成され、これらの各部において適時に監視情報テ
ーブルTABが参照される。
The load adjusting program 20 is a management program which is a feature of the present invention. The load adjustment program 20 includes an information extraction unit 21, a determination unit 22, and a treatment unit 23.
The monitoring information table TAB is referred to in each of these parts at appropriate times.

【0021】監視情報テーブルTABでは、図2に示す
ように、管理対象の各アプリケーションプログラムのそ
れぞれに、システム資源の使用の許容値と実行停止手順
とが対応づけられている。図2の例では、許容値として
CPU使用量及びバッファ使用量が定義されている。ま
た、実行停止手順としては、直ちにプログラムの実行を
自動停止するもの(CANCEL)、データ退避などの
終了処理の後にプログラムの実行を自動停止するもの
(STOP)、及び端末使用者にアクセス中止を要請す
るために警告メッセージを端末に出力するものなどがあ
る。なお、警告メッセージを出力する場合には、端末使
用者を介して間接的にアプリケーションプログラムの実
行が停止されることになる。
In the monitoring information table TAB, as shown in FIG. 2, each application program to be managed is associated with an allowable value of system resource use and an execution stop procedure. In the example of FIG. 2, the CPU usage amount and the buffer usage amount are defined as allowable values. In addition, as an execution stop procedure, a program execution is automatically stopped immediately (CANCEL), a program execution is automatically stopped after end processing such as data saving (STOP), and a terminal user is requested to stop access. For example, it outputs a warning message to the terminal. When outputting the warning message, the execution of the application program is indirectly stopped via the terminal user.

【0022】このような監視情報テーブルTABは、負
荷調整プログラム20の起動時に動作環境定義ファイル
30からCPUのワークエリア(RAM)に取り込まれ
る。以下、負荷調整プログラム20の各部の機能につい
て説明する。
Such a monitoring information table TAB is loaded from the operating environment definition file 30 into the work area (RAM) of the CPU when the load adjusting program 20 is started. Hereinafter, the function of each part of the load adjustment program 20 will be described.

【0023】情報抽出部21は、5〜10分程度の周期
で、ソフトウェアモニタ10の収集した最新の使用情報
を取り込み、管理対象のアプリケーションプログラム
A,B,Cに対応した使用情報を抽出する。
The information extraction unit 21 fetches the latest usage information collected by the software monitor 10 and extracts the usage information corresponding to the application programs A, B, and C to be managed in a cycle of about 5 to 10 minutes.

【0024】判定部22は、情報抽出部21が抽出した
使用情報と監視情報テーブルTABの許容値とをアプリ
ケーションプログラムA,B,C毎に順に比較してシス
テム資源の使用状況を判定し、システム資源(特にCP
U)に対して過負荷となっているアプリケーションプロ
グラム、すなわち許容値として定義された限度を越えて
システム資源を使用しているアプリケーションプログラ
ムを検出する。なお、このとき、アプリケーションプロ
グラムに対して許容値が未定義の場合には、判定部22
は許容値のデフォルト値と使用情報とを比較する。
The determination unit 22 determines the system resource usage status by comparing the usage information extracted by the information extraction unit 21 and the allowable value of the monitoring information table TAB for each application program A, B, C in order. Resources (especially CP
Detecting an application program that is overloaded with respect to U), that is, an application program that uses system resources beyond the limit defined as a tolerance. At this time, if the allowable value is not defined for the application program, the determination unit 22
Compares the default value of the allowed value with the usage information.

【0025】処置部23は、判定部22が過負荷のアプ
リケーションプログラムを検出した場合において、シス
テム資源の負荷を軽減する処置として、監視情報テーブ
ルTABの定義に従って、過負荷のアプリケーションプ
ログラムの実行を停止するための処理を行う。
When the determination unit 22 detects an overloaded application program, the processing unit 23 stops the execution of the overloaded application program according to the definition of the monitoring information table TAB as a measure for reducing the load on the system resources. Perform processing to do so.

【0026】ここでは、例えばアプリケーションプログ
ラムAが過負荷となっているものとする。この場合、処
置部23は図1中に実線で示すようにアプリケーション
プログラムAの実行を直ちに停止(CANCEL)す
る。
Here, for example, it is assumed that the application program A is overloaded. In this case, the processing unit 23 immediately stops (CANCEL) the execution of the application program A as shown by the solid line in FIG.

【0027】以上の実施例によれば、ホストコンピュー
タ1のプログラムライブラリの各アプリケーションプロ
グラムA,B,C毎にそれらの実行停止手順を定義して
おくことにより、実行停止によりアプリケーションプロ
グラムの利用者が被る損失を最小限に抑えることができ
る。
According to the above-described embodiment, by defining the execution stop procedure for each application program A, B, C of the program library of the host computer 1, the user of the application program is stopped by the execution stop. The loss incurred can be minimized.

【0028】上述の実施例においては、オンラインネッ
トワークを構成するホストコンピュータ1を例示した
が、本発明は種々の形態の情報処理装置に適用可能であ
り、アプリケーションプログラムの数も任意である。
In the above-mentioned embodiments, the host computer 1 forming an online network has been illustrated, but the present invention can be applied to various types of information processing apparatuses, and the number of application programs is arbitrary.

【0029】[0029]

【発明の効果】本発明によれば、システム資源に対する
負荷の調整をリアルタイムで行うことができ、情報処理
装置のシステムダウンを防止することができる。
According to the present invention, the load on the system resources can be adjusted in real time, and the system down of the information processing apparatus can be prevented.

【0030】請求項2の発明によれば、より確実に情報
処理装置のシステムダウンを防止することができる。請
求項3の発明によれば、信頼性の高いオンラインネット
ワークを構築することができる。
According to the second aspect of the present invention, the system down of the information processing apparatus can be prevented more reliably. According to the invention of claim 3, a highly reliable online network can be constructed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の監視方法を適用したホストコンピュー
タが実行する各プログラムの関係を模式的に示す図であ
る。
FIG. 1 is a diagram schematically showing a relationship between programs executed by a host computer to which a monitoring method of the present invention is applied.

【図2】図1の監視情報テーブルの内容の一例を示す図
である。
FIG. 2 is a diagram showing an example of contents of a monitoring information table of FIG.

【符号の説明】[Explanation of symbols]

1 ホストコンピュータ(情報処理装置) 10 ソフトウェアモニタ A,B,C アプリケーションプログラム 1 host computer (information processing device) 10 software monitor A, B, C application program

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】システム資源の使用情報を収集するソフト
ウェアモニタ(10)を備え、複数のアプリケーション
プログラム(A)(B)(C)を並行して実行可能な情
報処理装置(1)において、 予めアプリケーションプログラム(A)(B)(C)毎
にシステム資源に対する負荷としての許容値と実行停止
の手順とを定義しておき、前記ソフトウェアモニタ(1
0)が収集した使用情報に基づいて、システム資源に対
して許容値を越える負荷となるアプリケーションプログ
ラムを検出し、検出したアプリケーションプログラムの
実行を定義されている手順に従って停止することを特徴
とするシステム資源の監視方法。
1. An information processing apparatus (1) comprising a software monitor (10) for collecting usage information of system resources and capable of executing a plurality of application programs (A) (B) (C) in parallel, in advance. For each application program (A) (B) (C), an allowable value as a load on system resources and a procedure for stopping execution are defined, and the software monitor (1
0) A system characterized by detecting an application program having a load exceeding a permissible value on system resources based on the usage information collected, and stopping the execution of the detected application program according to a defined procedure. Resource monitoring method.
【請求項2】アプリケーションプログラム(A)(B)
(C)毎にCPU使用量の許容値を定義しておくことを
特徴とする請求項1記載のシステム資源の監視方法。
2. Application program (A) (B)
2. The system resource monitoring method according to claim 1, wherein an allowable value of CPU usage is defined for each (C).
【請求項3】前記情報処理装置(1)がオンラインネッ
トワークのホストコンピュータであることを特徴とする
請求項1又は請求項2記載のシステム資源の監視方法。
3. The system resource monitoring method according to claim 1 or 2, wherein the information processing device (1) is a host computer of an online network.
JP4232335A 1992-08-31 1992-08-31 System resources monitoring method Withdrawn JPH0683650A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4232335A JPH0683650A (en) 1992-08-31 1992-08-31 System resources monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4232335A JPH0683650A (en) 1992-08-31 1992-08-31 System resources monitoring method

Publications (1)

Publication Number Publication Date
JPH0683650A true JPH0683650A (en) 1994-03-25

Family

ID=16937590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4232335A Withdrawn JPH0683650A (en) 1992-08-31 1992-08-31 System resources monitoring method

Country Status (1)

Country Link
JP (1) JPH0683650A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11327917A (en) * 1998-05-08 1999-11-30 Nec Corp Program processor
JP2007199811A (en) * 2006-01-24 2007-08-09 Hitachi Ltd Program control method, computer and program control program
KR100972646B1 (en) * 2007-12-04 2010-07-28 (주)아이피엠에스 Performance management method and system unified by business unit for user centric
JP2010176413A (en) * 2009-01-29 2010-08-12 Fujitsu Ltd Information processing apparatus and method, and computer program
EP3147779A4 (en) * 2014-05-29 2017-05-31 Agoop Corp. Program and information processing device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11327917A (en) * 1998-05-08 1999-11-30 Nec Corp Program processor
JP2007199811A (en) * 2006-01-24 2007-08-09 Hitachi Ltd Program control method, computer and program control program
KR100972646B1 (en) * 2007-12-04 2010-07-28 (주)아이피엠에스 Performance management method and system unified by business unit for user centric
JP2010176413A (en) * 2009-01-29 2010-08-12 Fujitsu Ltd Information processing apparatus and method, and computer program
EP3147779A4 (en) * 2014-05-29 2017-05-31 Agoop Corp. Program and information processing device

Similar Documents

Publication Publication Date Title
JP4945935B2 (en) Autonomous operation management system, autonomous operation management method and program
US20090260051A1 (en) Policy processing system, method, and program
US6557035B1 (en) Rules-based method of and system for optimizing server hardware capacity and performance
EP0591345B1 (en) Method and system for monitoring a computer system
US10545807B2 (en) Method and system for acquiring parameter sets at a preset time interval and matching parameters to obtain a fault scenario type
CN110164101B (en) Alarm information processing method and equipment
JPH08328880A (en) Computer operation management system for operating system capable of simultaneous executing of plural application programs
JP2003022258A (en) Backup system for server
EP3591485B1 (en) Method and device for monitoring for equipment failure
JPH0683650A (en) System resources monitoring method
CN111710403A (en) Medical equipment supervision method, equipment and readable storage medium
CN107612755A (en) The management method and its device of a kind of cloud resource
US7529842B2 (en) Method, system and program product for detecting an operational risk of a node
CN111427704A (en) Remote monitoring method, device and equipment for configuration instruction and storage medium
JP2002259236A (en) Distributed control system and method for collecting data in emergency in this system
CN113342596A (en) Distributed monitoring method, system and device for equipment indexes
JPH0612276A (en) Program control system
JP5821471B2 (en) Information processing apparatus, process monitoring method, process monitoring program, and recording medium
JP2665380B2 (en) System error detection processing method
JPH01156830A (en) Operating system
JPH1188471A (en) Test method and test equipment
JP5364932B2 (en) Timeout monitoring system and timeout monitoring program
CN113213282B (en) Load configuration method and load configuration device of elevator cloud server
JPS62198944A (en) Detecting system for device abnormality
CN116521415A (en) Storage system health optimization method and system, electronic equipment and medium

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991102