JPH1124956A - Patrol diagnosis system - Google Patents

Patrol diagnosis system

Info

Publication number
JPH1124956A
JPH1124956A JP9195046A JP19504697A JPH1124956A JP H1124956 A JPH1124956 A JP H1124956A JP 9195046 A JP9195046 A JP 9195046A JP 19504697 A JP19504697 A JP 19504697A JP H1124956 A JPH1124956 A JP H1124956A
Authority
JP
Japan
Prior art keywords
ratio
patrol diagnosis
access
normal
patrol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9195046A
Other languages
Japanese (ja)
Inventor
Hirobumi Komiyama
博文 小見山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9195046A priority Critical patent/JPH1124956A/en
Publication of JPH1124956A publication Critical patent/JPH1124956A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To perform efficient patrol diagnosis by utilizing monitoring information at the time of normal access and changing dynamically the cycle of a patrol diagnosis according to a normal access ratio. SOLUTION: Monitoring information that is recorded by a monitoring function is read (step 10). A normal access ratio α is calculated by counting the number of accesses to a component that is an object within a fixed time and the number of normal accesses among them based on the monitoring information. The calculated ratio αis compared with a defined value β that is previously defined (step 11). When the ratio α is <= the value β, the cycle of a patrol diagnosis of the component is shortened (step 13). On the contrary, when the ratio αexceeds the value β, the cycle of a patrol diagnosis of the component is made long (step 12).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、コンピュータ等、
情報通信処理装置の、例えば、演算処理装置、主記憶
部、周辺/通信制御部、端末などの、各種構成部品の予
防保守・障害診断方式に関し、特に診断する対象部品の
それまでのアクセス状態をチェックすることにより、診
断を効率化するパトロール診断方式に関する。
[0001] The present invention relates to a computer and the like.
Regarding the preventive maintenance / failure diagnosis method of various components such as an arithmetic processing unit, a main storage unit, a peripheral / communication control unit, and a terminal of an information communication processing device, the access state of a target component to be diagnosed is determined. The present invention relates to a patrol diagnosis method that checks to make diagnosis more efficient.

【0002】[0002]

【従来の技術】従来のコンピュータシステムウの構成部
品の保守・障害診断等のためのパトロール診断方式にお
いは、予め指定された時間間隔で、定期的に、コンピュ
ータシステムの構成部品の全部または一部にパトロール
診断を行い、その診断結果により、当該システム構成部
品が、正常であるか、異常(障害)であるかを判断して
いる。
2. Description of the Related Art In a conventional patrol diagnosis system for maintenance / failure diagnosis of components of a computer system, all or some of the components of the computer system are periodically performed at predetermined time intervals. Then, a patrol diagnosis is performed, and based on the diagnosis result, it is determined whether the system component is normal or abnormal (failure).

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記し
た従来のパトロール診断方式は下記記載の問題点を有し
ている。
However, the above-described conventional patrol diagnosis method has the following problems.

【0004】その問題点とは、従来の方式では、一定時
間毎に、直前までの通常アクセスの状態とは、無関係に
パトロール診断を行っており、結果的に、無駄な診断を
行っていることになるという、ことである。
[0004] The problem is that in the conventional method, patrol diagnosis is performed at regular time intervals irrespective of the state of normal access until immediately before, and as a result, useless diagnosis is performed. It is that.

【0005】その理由は次の通りである。すなわち、直
前までの通常アクセスが正常に行われていれば、次に、
パトロール診断を行っても、正常である確率は高い。直
前まで正常なアクセスを行っている構成部品に対して、
定期的なパトロール診断を行う時刻になったからといっ
て診断を行うことは、無駄であり、このパトロール診断
を行うことによる、コンピュータシステムの演算処理装
置、主記憶部、等の資源を消費し(すなわちシステムの
オーバヘッドが増大する)、システム性能低下を招くこ
とにもなる。
The reason is as follows. That is, if the normal access up to immediately before is normally performed, then
Even if a patrol diagnosis is performed, the probability of normality is high. For components that have been accessed normally until just before,
It is wasteful to perform the diagnosis just because it is time to perform the regular patrol diagnosis, and this patrol diagnosis consumes resources such as an arithmetic processing unit and a main storage unit of the computer system ( That is, the overhead of the system is increased), and the system performance is reduced.

【0006】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、通常のアクセス
時のモニタリング情報を利用することにより、パトロー
ル診断の周期を動的に可変させることにより、効率の良
いパトロール診断を可能とし、システムのオーバヘッド
を低減する、パトロール診断方式を提供することにあ
る。
Accordingly, the present invention has been made in view of the above problems, and an object thereof is to dynamically change the period of patrol diagnosis by using monitoring information at the time of normal access. Accordingly, an object of the present invention is to provide a patrol diagnosis method that enables efficient patrol diagnosis and reduces system overhead.

【0007】[0007]

【課題を解決するための手段】前記目的を達成するた
め、本発明のパトロール診断方式は、コンピュータシス
テムの各システム構成部品に対するアクセスが発生する
度に、その時刻と、該アクセス結果が正常か異常である
かを記録するモニタリング手段と、前記各システム構成
部品に対するパトロール診断手段と、を備え、一定時間
毎に、前記モニタリング手段で収集されたモニタリング
情報を解析して、一定時間以内におけるアクセス回数と
アクセス結果が正常であった回数との割合を正常なアク
セス比率として算出し、前記正常なアクセス比率が予め
設定された規定値を越えた場合には、以降のパトロール
診断の周期を長くすると共に、前記正常なアクセス比率
が予め設定された規定値以下の場合には、以降のパトロ
ール診断の周期を短くするように制御する手段をさらに
備えたことを特徴とする。
In order to achieve the above-mentioned object, a patrol diagnosis system of the present invention provides a patrol diagnosis system that, whenever an access to each system component of a computer system occurs, the time of the access and whether the access result is normal or abnormal. Monitoring means for recording whether or not, and patrol diagnosis means for each of the system components, comprising, at regular intervals, analyzing the monitoring information collected by the monitoring means, the number of accesses within a given time, Calculate the ratio with the number of times the access result was normal as a normal access ratio, and when the normal access ratio exceeds a predetermined value, increase the period of subsequent patrol diagnosis, If the normal access ratio is equal to or less than a predetermined value, the period of the subsequent patrol diagnosis is shortened. Wherein, further comprising means for controlling to.

【0008】[発明の概要]効率の良いパトロール診断
を行うには、直前までの通常アクセスで異常となった比
率の高いものを対象として行うことが望ましい。換言す
れば、正常なアクセスを行っているものに対しては、そ
のパトロール診断の周期を長くして、パトロール診断回
数を減らすことがシステム全体のオーバーヘッドを削減
することになる。
[Summary of the Invention] In order to perform an efficient patrol diagnosis, it is desirable to perform a diagnosis with a high ratio of abnormalities in normal access until immediately before. In other words, for those who are performing normal access, increasing the period of the patrol diagnosis and reducing the number of patrol diagnoses will reduce the overhead of the entire system.

【0009】本発明は、上記知見に基づきなされたもの
であって、コンピュータシステムの構成部品に対するパ
トロール診断を、その直前までの通常のアクセス状態に
もとづき、パトロール診断を行う周期(時間間隔)を調
整することにより、確率論的に無駄なパトロール診断を
省略することがてきる。これにより、システムに与える
パトロール診断のオーバーヘッドを低減することができ
る。
The present invention has been made based on the above findings, and adjusts a cycle (time interval) of performing patrol diagnosis for a component of a computer system based on a normal access state immediately before. By doing so, it is possible to omit stochastic useless patrol diagnosis. Thereby, the overhead of patrol diagnosis given to the system can be reduced.

【0010】その結果、コンピュータシステム全体の高
速化と、効率的な保守が可能となる。
As a result, it is possible to speed up the entire computer system and perform efficient maintenance.

【0011】[0011]

【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明のパトロール診断方式は、その好ま
しい実施の形態において、コンピュータシステムにおけ
る各種構成部品に対する診断手段(図1の3)と、各種
の構成部品に対する通常のアクセス結果を記録して残す
モニタリング手段(図1の4)と、を有する。具体的な
モニタリング情報として、通常のアクセス毎に、時刻情
報と、当該アクセスが正常終了したのか、異常終了した
のかを示すアクセス結果ステータスと、を含む。
Embodiments of the present invention will be described below. In a preferred embodiment of the patrol diagnosis method of the present invention, a diagnosis means for the various components in the computer system (3 in FIG. 1) and a monitoring means for recording and leaving a normal access result to the various components (FIG. 1) 1) and 4). Specific monitoring information includes, for each normal access, time information and an access result status indicating whether the access ended normally or abnormally.

【0012】本発明の実施の形態においては、一定時間
毎に、構成部品のアクセス結果が記録されているモニタ
リング情報を解析して、一定時間以内のアクセス回数に
対する正常アクセス回数の割合を計算し、その割合が予
め設定された規定値を越えた場合には、パトロール診断
を実行する周期を長くし、それ以外の場合には、パトロ
ール診断を実行する周期を短くすることで、パトロール
診断自身のオーバーヘッドを抑え、効率的な診断を行う
ことが可能となる。
In the embodiment of the present invention, the monitoring information in which the access results of the component parts are recorded is analyzed at regular intervals, and the ratio of the normal access count to the access count within the fixed time is calculated. If the ratio exceeds a predetermined value, the period for executing the patrol diagnosis is lengthened, and otherwise, the period for executing the patrol diagnosis is shortened, thereby reducing the overhead of the patrol diagnosis itself. And efficient diagnosis can be performed.

【0013】[0013]

【実施例】上記した本発明の実施の形態について更に詳
細に説明すべく、本発明の一実施形態を示した図面を参
照して説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of the present invention;

【0014】図1は、本発明の一実施例の構成を示すブ
ロック図である。図1を参照すると、本発明の一実施例
において、演算処理装置1上で、パトロール診断機能3
と、モニタリング機能4と、が実行される。これらのパ
トロール診断機能3と、モニタリング機能4がソフトウ
ェア制御で実現されている場合には、そのプログラムは
主記憶部2に展開され、CPUを含む演算処理装置1で
実行される。
FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention. Referring to FIG. 1, in one embodiment of the present invention, a patrol diagnosis function 3
And the monitoring function 4 are executed. When the patrol diagnosis function 3 and the monitoring function 4 are realized by software control, the programs are developed in the main storage unit 2 and executed by the arithmetic processing device 1 including the CPU.

【0015】モニタリング機能4は、パトロール診断機
能3の実行対象となるコンピュータシステムの構成部品
である周辺制御部5、周辺装置6、通信制御部7、通信
端末8などに対する通常アクセスの時刻情報と、そのア
クセス結果、すなわち正常であるか異常であるかの情報
(ステータス情報)とを記録する。なお、パトロール診
断対象の構成部品の中には、演算処理装置1、主記憶部
2も含む場合もある。
The monitoring function 4 includes time information of normal access to the peripheral control unit 5, the peripheral device 6, the communication control unit 7, the communication terminal 8 and the like, which are components of the computer system to be executed by the patrol diagnosis function 3, The result of the access, that is, information (status information) indicating normal or abnormal is recorded. The components to be patrol-diagnosed may include the arithmetic processing unit 1 and the main storage unit 2 in some cases.

【0016】パトロール診断機能3は、その診断対象と
なる構成部品に対して、ある時間間隔で診断を行う。本
実施例においては、そのパトロール診断の実行周期を自
動的にかつ動的に可変させる、ことを特徴とする。
The patrol diagnosis function 3 diagnoses a component to be diagnosed at a certain time interval. The present embodiment is characterized in that the execution cycle of the patrol diagnosis is automatically and dynamically varied.

【0017】図2は、本発明の一実施例の動作を説明す
るためのフローチャートである。図1及び図2を参照し
て、本発明の一実施例の動作について説明する。
FIG. 2 is a flowchart for explaining the operation of one embodiment of the present invention. The operation of one embodiment of the present invention will be described with reference to FIGS.

【0018】まず、モニタリング機能4で記録されたモ
ニタリング情報が読み出される(ステップ10)。この
モニタリング情報には、各構成部品毎にアクセスした時
の時刻情報と、そのアクセスが正常に終了したのか異常
終了したのかを示す結果情報とが記録されている。この
モニタリング情報を基に、対象となる構成部品に対する
一定時間以内のアクセス回数と、その中で正常アクセス
となった回数とをカウントして、正常アクセス比率αを
計算する。そして、求めた正常アクセス比率αと予め指
定された規定値βとを比較する(ステップ11)。
First, the monitoring information recorded by the monitoring function 4 is read (step 10). In this monitoring information, time information at the time of access for each component and result information indicating whether the access ended normally or abnormally are recorded. Based on this monitoring information, the number of accesses to the target component within a certain period of time and the number of times of normal access among them are counted, and the normal access ratio α is calculated. Then, the obtained normal access ratio α is compared with a specified value β specified in advance (step 11).

【0019】この比較処理により、正常アクセス比率α
が規定値β以下であれば、当該構成部品に対するパトロ
ール診断の周期を短くする(ステップ13)。
By this comparison processing, the normal access ratio α
Is less than or equal to the specified value β, the period of the patrol diagnosis for the component is shortened (step 13).

【0020】すなわち、正常アクセス比率の低いもの
は、故障あるいは障害発生頻度の高い構成部品であり、
その構成部品は、きめ細かくパトロール診断を行うこと
により、問題箇所を詳細にチェックする必要がある。
That is, a component having a low normal access ratio is a component having a high frequency of failure or failure.
For the components, it is necessary to check the problem part in detail by performing a detailed patrol diagnosis.

【0021】逆に、正常アクセス比率αが規定値βを越
えた場合には、当該構成部品に対するパトロール診断の
周期を長くする(ステップ12)。これは、問題のない
構成部品であるから、パトロール診断回数も少なくて良
い、ためである。
Conversely, if the normal access ratio α exceeds the specified value β, the period of the patrol diagnosis for the component concerned is lengthened (step 12). This is because it is a component having no problem and the number of patrol diagnoses may be small.

【0022】[0022]

【発明の効果】以上説明したように、本発明によれば、
通常のアクセス時のモニタリング情報を利用し、正常ア
クセス比率によりパトロール診断の周期を動的に変更す
ることにより、効率の良いパトロール診断を行うことが
できる、という効果を奏する。
As described above, according to the present invention,
By using the monitoring information at the time of normal access and dynamically changing the period of the patrol diagnosis according to the normal access ratio, there is an effect that an efficient patrol diagnosis can be performed.

【0023】その理由は次の通りである。パトロール診
断対象の構成部品が、直前まで正常にアクセスできてい
れば、それ以降も正常動作を続ける確率が大きく、パト
ロール診断を行う回数も少なくて良いのに対して、逆
に、異常アクセスの多い構成部品であれば、きめ細かな
パトロール診断を行い、その問題箇所をチェックする必
要がある、からである。
The reason is as follows. If the component to be patrol diagnosed has been normally accessed up to immediately before, the probability of continuing normal operation after that is high, and the number of patrol diagnoses may be small. This is because if the component is a component, it is necessary to perform a detailed patrol diagnosis and check the location of the problem.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【図2】本発明の一実施例の動作を説明するためのフロ
ーチャートである。
FIG. 2 is a flowchart for explaining the operation of one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 演算処理装置 2 主記憶部 3 パトロール診断状態 4 モニタリング機能 5 周辺制御部 6 周辺装置 7 通信制御部 8 通信端末 10 モニタリング情報の読み出し処理 11 アクセス回数と正常アクセス回数との割合のチェ
ック処理 12 パトロール診断周期の増長処理 13 パトロール診断周期の短縮処理
Reference Signs List 1 arithmetic processing unit 2 main storage unit 3 patrol diagnosis state 4 monitoring function 5 peripheral control unit 6 peripheral device 7 communication control unit 8 communication terminal 10 monitoring information read processing 11 check processing of ratio between access count and normal access count 12 patrol Diagnosis cycle extension processing 13 Patrol diagnosis cycle shortening processing

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】コンピュータシステムの構成部品に対して
アクセスした時刻情報と前記アクセス結果情報とを記録
しておき、 一定時間以内におけるアクセス回数とアクセス結果が正
常であった回数との割合である正常なアクセスの比率
(「正常アクセス比率」という)が所定値を超える構成
部品に対してはパトロール診断の周期を長くし、逆に、
前記正常アクセス比率が所定の値以下である構成部品に
対するパトロール診断の周期は短くするように、パトロ
ール診断の周期を可変に設定する手段を備えたことを特
徴とする、パトロール診断方式。
1. A method according to claim 1, wherein time information of access to a component of the computer system and said access result information are recorded, and a normality is a ratio of the number of accesses within a predetermined time to the number of times the access result was normal. For components with a high access ratio (referred to as “normal access ratio”) exceeding a predetermined value, the period of the patrol diagnosis is extended,
A patrol diagnosis method, comprising: means for variably setting the period of the patrol diagnosis so that the period of the patrol diagnosis for components having the normal access ratio equal to or less than a predetermined value is shortened.
【請求項2】コンピュータシステムの各システム構成部
品に対するアクセスが発生する度に、その時刻と、該ア
クセス結果が正常か異常であるかを記録するモニタリン
グ手段と、 前記各システム構成部品に対するパトロール診断手段
と、 を備え、 前記モニタリング手段で記録モニタリング情報を一定時
間毎に解析して、一定時間以内におけるアクセス回数と
アクセス結果が正常であった回数との割合を正常アクセ
ス比率として算出し、前記正常アクセス比率が予め設定
された規定値を越えた場合には、以降のパトロール診断
の周期を長くすると共に、前記正常なアクセス比率が予
め設定された規定値以下の場合には、以降のパトロール
診断の周期を短くするように制御する手段をさらに備え
たことを特徴とするパトロール診断方式。
Each time an access to each system component of the computer system occurs, a monitoring unit that records the time and whether the access result is normal or abnormal; and a patrol diagnosis unit for each of the system components. And wherein the monitoring means analyzes the recorded monitoring information at regular intervals and calculates the ratio of the number of accesses within a given period of time and the number of times the access result was normal as a normal access ratio, and If the ratio exceeds a preset specified value, the period of the subsequent patrol diagnosis is extended, and if the normal access ratio is equal to or less than the preset specified value, the period of the subsequent patrol diagnosis is A patrol diagnosis method, further comprising means for controlling so as to shorten the time.
JP9195046A 1997-07-04 1997-07-04 Patrol diagnosis system Pending JPH1124956A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9195046A JPH1124956A (en) 1997-07-04 1997-07-04 Patrol diagnosis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9195046A JPH1124956A (en) 1997-07-04 1997-07-04 Patrol diagnosis system

Publications (1)

Publication Number Publication Date
JPH1124956A true JPH1124956A (en) 1999-01-29

Family

ID=16334653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9195046A Pending JPH1124956A (en) 1997-07-04 1997-07-04 Patrol diagnosis system

Country Status (1)

Country Link
JP (1) JPH1124956A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010114876A (en) * 2008-10-08 2010-05-20 Fujitsu Ltd Communication relay apparatus, communication relay method and communication relay program
US8788752B2 (en) 2010-02-08 2014-07-22 Fujitsu Limited Storage apparatus, patrolling method and storage system
CN116311579A (en) * 2023-05-18 2023-06-23 华能济南黄台发电有限公司 Method and device for determining inspection period of power plant equipment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010114876A (en) * 2008-10-08 2010-05-20 Fujitsu Ltd Communication relay apparatus, communication relay method and communication relay program
US8788752B2 (en) 2010-02-08 2014-07-22 Fujitsu Limited Storage apparatus, patrolling method and storage system
CN116311579A (en) * 2023-05-18 2023-06-23 华能济南黄台发电有限公司 Method and device for determining inspection period of power plant equipment
CN116311579B (en) * 2023-05-18 2023-10-13 华能济南黄台发电有限公司 Method and device for determining inspection period of power plant equipment

Similar Documents

Publication Publication Date Title
US6405327B1 (en) Apparatus for and method of automatic monitoring of computer performance
CA1281427C (en) Data processor performance advisor
CN114328102B (en) Equipment state monitoring method, equipment state monitoring device, equipment and computer readable storage medium
JPWO2005041038A1 (en) Information system, load control method, load control program, and recording medium
WO2005017736A1 (en) System and program for detecting bottle neck in disc array device
CN111475213B (en) Power consumption reduction method and device for solid state disk with multi-core structure and computer equipment
US20090157923A1 (en) Method and System for Managing Performance Data
CN112749013B (en) Thread load detection method and device, electronic equipment and storage medium
CN106125889A (en) A kind of wake source treating method and apparatus
CN111159009B (en) Pressure testing method and device for log service system
JPH1124956A (en) Patrol diagnosis system
CN114528083B (en) Scheduling processing method of Data Processing Unit (DPU) service data and related product
CN115525392A (en) Container monitoring method and device, electronic equipment and storage medium
CN114268670A (en) Ethernet asynchronous message processing system and method based on time trigger
JP2001273172A (en) Computer operation data recording system and recording medium used for the system
JP2666732B2 (en) Load control method for computer system
CN112559052B (en) Instruction set calling method, device, terminal and storage medium
JP3161444B2 (en) Fault logging system, method, and storage medium storing program
JPH1097489A (en) Method and device for block length conversion of magnetic disk unit
CN109857715B (en) Log recording method and system for strengthening error checking support
CN113778823A (en) WAF equipment running state monitoring method and device and computer storage medium
CN117370105A (en) Call monitoring method, system, equipment and medium based on OKHTTP
CN115842873A (en) Message processing method, network card and server
CN113986697A (en) Communication log loss risk diagnosis method, system and storage medium
CN117873805A (en) Health monitoring method, module and system of multi-core CPU

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000725