JPH07141265A - Error monitoring method for magnetic disk device - Google Patents

Error monitoring method for magnetic disk device

Info

Publication number
JPH07141265A
JPH07141265A JP5286596A JP28659693A JPH07141265A JP H07141265 A JPH07141265 A JP H07141265A JP 5286596 A JP5286596 A JP 5286596A JP 28659693 A JP28659693 A JP 28659693A JP H07141265 A JPH07141265 A JP H07141265A
Authority
JP
Japan
Prior art keywords
error
information
magnetic disk
file
disk device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5286596A
Other languages
Japanese (ja)
Inventor
Takashi Kuramochi
高志 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Information Service Co Ltd
Original Assignee
NEC Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Information Service Co Ltd filed Critical NEC Information Service Co Ltd
Priority to JP5286596A priority Critical patent/JPH07141265A/en
Publication of JPH07141265A publication Critical patent/JPH07141265A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To minimize manual operation in a monitoring process for error information by automating the short-time monitoring and long-period monitoring of the error information. CONSTITUTION:A short-period comparison part 7 inputs an error reference frequency from an error reference frequency parameter file 2 and compares data totalized by a short-period classification totalization part 6, and an error accumulating process part 8 stores the comparison result of the short-period comparison part 7 in a disk system error accumulation file 4. An information selection part 11 inputs conditions for selection from an information selection condition storage file 3 and selects necessary data in the result of totalization by a long-period classification totalization part 10, and a long-period comparison part 12 inputs an error reference frequency from the error reference frequency parameter file 2 and compares it with the data selected by the long-period classification totalization part 11. Then, an alarm output part 13 places an output device 14 according to the decision result of the short-period comparison part 7 or long-period comparison part 13 to generate an alarm.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、電子計算機システムに
おける磁気ディスク装置に関するエラーの発生状況を監
視するためのエラー監視方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an error monitoring method for monitoring the occurrence status of errors relating to a magnetic disk unit in an electronic computer system.

【0002】[0002]

【従来の技術】図4は従来の磁気ディスク装置のエラー
監視方法の一例を示すフローチャートである。
2. Description of the Related Art FIG. 4 is a flow chart showing an example of a conventional error monitoring method for a magnetic disk device.

【0003】電子計算機システムにおける磁気ディスク
装置に関するエラーの発生状況を監視するための従来の
エラー監視方法は、磁気ディスク装置のエラーに関する
エラー情報レポートを出力して保守員(または操作員)
が人手によって判断する方法や、エラーの発生の都度そ
のことを保守員(または操作員)に対して通報するとい
う方法が一般的に採用されている。
A conventional error monitoring method for monitoring the occurrence status of an error relating to a magnetic disk device in an electronic computer system is to output an error information report relating to an error of the magnetic disk device and maintain it (or an operator).
Is generally adopted, or a method of notifying a maintenance person (or an operator) of the occurrence of an error whenever it occurs is generally adopted.

【0004】従って、エラー情報レポートやエラーの通
報によってエラーの発生状況を知らされた保守員(また
は操作員)は、エラーを発生した磁気ディスク装置や、
発生したエラーの種類を分類して集計し、その集計結果
から磁気ディスク装置の媒体障害となる兆候を認識した
とき、該当する磁気ディスク装置に対して障害発生の予
防処置を施している。
Therefore, the maintenance personnel (or the operator) who has been informed of the error occurrence status by the error information report or the error notification notifies the magnetic disk device in which the error has occurred,
When the types of errors that have occurred are categorized and tabulated, and the signs of media failure of the magnetic disk drive are recognized from the results of the tabulation, preventive measures against failure are taken for the corresponding magnetic disk drive.

【0005】図4はこのような従来の磁気ディスク装置
のエラー監視方法の一例を示すフローチャートである。
FIG. 4 is a flow chart showing an example of such a conventional error monitoring method for a magnetic disk device.

【0006】図4において、エラー情報格納ファイル1
は、電子計算機システムの各ハードウエアからオペレー
ティングシステムに対して通知されたエラー情報を格納
している。電子計算機システムは、このエラー情報格納
ファイル1のエラー情報を読出し(ステップ41)、そ
の中の磁気ディスク装置に関する情報のみを抽出し(ス
テップ42)、それを編集して(ステップ43)1日に
1回ずつエラー情報レポートを出力している(ステップ
44)。
In FIG. 4, an error information storage file 1
Stores error information notified from each hardware of the electronic computer system to the operating system. The electronic computer system reads the error information in the error information storage file 1 (step 41), extracts only the information relating to the magnetic disk device therein (step 42), and edits it (step 43) for one day. An error information report is output once (step 44).

【0007】例えば、特定の磁気ディスク装置において
特定の「エラー事象A」が3回発生しているとき、この
「エラー事象A」が5回発生した場合に磁気ディスク装
置に対して障害発生の予防処置を行うと決められている
と、上述のエラー情報レポートからは、「障害発生の予
防処置を行う必要はない」と判断される。
For example, when a particular "error event A" occurs three times in a particular magnetic disk device, and if this "error event A" occurs five times, the failure prevention for the magnetic disk device is prevented. If it is decided to take measures, it is judged from the above-mentioned error information report that "it is not necessary to take preventive measures against the occurrence of failure".

【0008】しかしながら、その前日以前にも「エラー
事象A」が発生しており、その発生回数が基準値5回に
達していない場合は、この磁気ディスク装置において
は、「エラー事象A」による障害発生の可能性が高いに
も拘らず、「障害発生の予防処置を行わない」という結
果となる。
However, if the "error event A" has occurred even before the previous day, and the number of occurrences has not reached the reference value of 5, then this magnetic disk drive has a failure due to the "error event A". Despite the high probability of occurrence, the result is that "no preventive measures against the occurrence of the disorder will be taken."

【0009】このように、前日以前のエラー情報は、当
日の障害発生の予防処置の要否の判断に用いられないた
め、前日以前のエラー情報を障害発生の予防処置の要否
の判断の材料とするためには、保守員(または操作員)
は、一定期間(例えば1週間または1カ月)のエラー情
報を全部見直し、過去のエラー情報の発生履歴を点検し
なければならない。
As described above, since the error information before the previous day is not used for judging the necessity of preventive measures against the occurrence of the failure on the day, the error information before the previous day is used as a material for judging whether the preventive measures against the failure occurs. In order to be
Must review all error information for a certain period (for example, one week or one month) and check the history of occurrence of past error information.

【0010】[0010]

【発明が解決しようとする課題】上述したように、従来
の磁気ディスク装置のエラー監視方法は、前日以前のエ
ラー情報を含んでエラー事象の発生状況を監視するため
には、保守員(または操作員)は、一定期間のエラー情
報を全部見直して過去のエラー情報の発生履歴を点検し
なければならないため、工数面で多大の負担がかかるの
みならず、その作業が目視によって行われるために、保
守員(または操作員)の経験に依存し、時には重要なエ
ラー情報を見落して磁気ディスク装置の障害を発生させ
る危険があるという欠点を有している。
As described above, according to the conventional error monitoring method for the magnetic disk device, in order to monitor the occurrence status of the error event including the error information before the previous day, the maintenance personnel (or the operation person). Member) must review all the error information for a certain period of time and check the history of occurrence of past error information, so not only is it a great burden in terms of man-hours, but the work is performed visually. It has a drawback that it depends on the experience of a maintenance person (or an operator) and sometimes there is a risk of overlooking important error information and causing a failure of the magnetic disk device.

【0011】[0011]

【課題を解決するための手段】本発明の磁気ディスク装
置のエラー監視方法は、電子計算機システムのハードウ
エア全般のエラーに関する情報を格納しているエラー情
報格納ファイルから磁気ディスク装置に関するエラー情
報のみを抽出し、前記エラー情報を磁気ディスク装置の
装置別およびエラーの種類別に分類して集計して短期集
計結果を求め、前記短期集計結果をジョブ投入時にエラ
ーの種類別に上限回数として設定してあるエラー基準回
数と比較し、前記短期集計結果が前記エラー基準回数を
超えたときは警報出力を行い、前記短期集計結果をディ
スク系エラー累積ファイルに累積して格納し、前記ディ
スク系エラー累積ファイルに格納してあるすべての情報
を磁気ディスク装置の装置別およびエラーの種類別に分
類して集計して長期集計結果を求め、前記長期集計結果
の中からあらかじめ設定してある情報選別条件と合致す
る情報のみを選別して情報選別結果を求め、前記情報選
別結果を前記エラー基準回数と比較して前記情報選別結
果が前記エラー基準回数を超えたとき警報出力を行うこ
とを含むものであり、更に、ジョブ自動運転システムに
組込んで一定周期で自動的に動作させるようにし、ま
た、ディスク系エラー累積ファイルを一定期間毎に新し
いものとした複数世代のファイルを有する世代管理フア
イルとし、前記一定期間を任意の長さに設定できるよう
にしたものである。
According to the error monitoring method for a magnetic disk device of the present invention, only the error information about the magnetic disk device is stored in an error information storage file that stores information about errors in the hardware of the computer system. An error that is extracted, the error information is classified by device of the magnetic disk device and classified by error type to obtain a short-term aggregation result, and the short-term aggregation result is set as the upper limit number of times by the error type when the job is submitted. Compared with a reference count, when the short-term count result exceeds the error reference count, an alarm is output, and the short-term count result is accumulated and stored in a disk-based error cumulative file and stored in the disk-based error cumulative file. All the information that is stored is categorized by device of the magnetic disk device and by the type of error and then aggregated and lengthened. Obtaining the aggregation result, selecting only the information that matches the preset information selection condition from the long-term aggregation result to obtain the information selection result, and comparing the information selection result with the error reference count to obtain the information. It includes outputting an alarm when the selection result exceeds the error reference number, and further incorporates it into the job automatic operation system to automatically operate at a constant cycle. Is a generation management file having files of a plurality of generations that are new at regular intervals, and the constant period can be set to an arbitrary length.

【0012】[0012]

【実施例】次に、本発明の実施例について図面を参照し
て説明する。
Embodiments of the present invention will now be described with reference to the drawings.

【0013】図1は本発明の一実施例を示すフローチャ
ート、図2は図1の実施例を機能ブロックとして表現し
たブロック図、図3は図1の実施例の各ファイルの内容
の一例を示すフォーマット図で、(a)はエラー情報格
納ファイル、(b)はエラー基準パラメータファイル、
(c)はディスク系エラー累積ファイル、(d)は情報
選別条件ファイルを示す図である。
FIG. 1 is a flow chart showing an embodiment of the present invention, FIG. 2 is a block diagram expressing the embodiment of FIG. 1 as a functional block, and FIG. 3 shows an example of contents of each file of the embodiment of FIG. In the format diagram, (a) is an error information storage file, (b) is an error reference parameter file,
(C) is a diagram showing a disk-based error accumulation file, and (d) is an information selection condition file.

【0014】本実施例は、図2に示すように、電子計算
機システムのハードウエア全般のエラーに関する情報を
格納しているエラー情報格納ファイル1と、磁気ディス
ク装置のエラーの種類別に、エラーの内容や危険度から
判断して決定した上限回数をそのエラーに関する基準回
数として設定して格納してあるエラー基準回数パラメー
タファイル2と、磁気ディスク装置のエラー情報を累積
して格納するディスク系エラー累積ファイル4と、ディ
スク系エラー累積ファイル4に格納してあるエラー情報
から必要な情報を選別するための条件を格納している情
報選別条件格納ファイル3と、警報を出力する出力装置
14とを使用し、エラー情報入力・抽出部5においてエ
ラー情報格納ファイル1からエラー情報を入力して磁気
ディスク装置に関するエラー情報を抽出し、短期間分類
集計部6において、エラー情報入力・抽出部5で抽出し
たエラー情報を磁気ディスク装置の装置毎にエラーの種
類別に分類して集計し、短期間比較部7において、エラ
ー基準回数パラメータファイル2からエラー基準回数を
入力して短期間分類集計部6で集計したデータの比較
し、エラー累積処理部8において、短期間比較部7で比
較した結果をディスク系エラー累積ファイル4に格納
し、累積エラー入力部9において、ディスク系エラー累
積ファイル4に格納してある情報を入力し、長期間分類
集計部10において、累積エラー入力部9が入力した情
報を磁気ディスク装置の装置毎にエラーの種類別に分類
して集計し、情報選別部11において、情報選別条件格
納ファイル3から選別のための条件を入力してその条件
によって長期間分類集計部10で集計した結果の中から
必要なデータを選別し、長期間比較部12において、エ
ラー基準回数パラメータファイル2からエラー基準回数
を入力して長期間分類集計部11で選別したデータと比
較し、警報出力部13において、短期間比較部7または
長期間比較部12の判定結果によって出力装置14を動
作させて警報を発生させる。
In this embodiment, as shown in FIG. 2, an error information storage file 1 for storing information about errors in the hardware of the electronic computer system and error contents for each type of error in the magnetic disk unit. Error reference count parameter file 2 in which the upper limit count determined from the risk is set as the reference count for the error and stored, and the disk error cumulative file that accumulates and stores the error information of the magnetic disk device 4, an information selection condition storage file 3 that stores conditions for selecting necessary information from the error information stored in the disk-based error accumulation file 4, and an output device 14 that outputs an alarm. The error information input / extraction unit 5 inputs the error information from the error information storage file 1 to input the error information to the magnetic disk device. Error information extracted by the error information input / extraction unit 5 is categorized by the error type for each magnetic disk device and aggregated by the short-term comparison unit 7. In, the error reference number is input from the error reference number parameter file 2, the data aggregated by the short-term classification and aggregation unit 6 is compared, and the error accumulation processing unit 8 compares the result by the short-term comparison unit 7 with the disk error. The information stored in the cumulative file 4 is input to the cumulative error input unit 9, and the information stored in the disk error cumulative file 4 is input to the cumulative error input unit 9. Each device is classified by type of error and totaled, and the information selection unit 11 inputs the conditions for selection from the information selection condition storage file 3. Then, necessary data is selected from the results aggregated by the long-term classification aggregation unit 10 according to the conditions, and the long-term comparison unit 12 inputs the error reference number from the error reference number parameter file 2 to perform long-term classification aggregation. In comparison with the data selected by the unit 11, the alarm output unit 13 operates the output device 14 according to the determination result of the short-term comparison unit 7 or the long-term comparison unit 12 to generate an alarm.

【0015】以下、上述の動作について、図1および図
3を参照して詳細に説明する。
The above operation will be described in detail below with reference to FIGS. 1 and 3.

【0016】磁気ディスク装置を含む電子計算機システ
ムのハードウエアのすべてのエラー情報は、オペレーテ
ィングシステムによってエラー情報格納ファイル1に格
納される。
All the error information of the hardware of the electronic computer system including the magnetic disk device is stored in the error information storage file 1 by the operating system.

【0017】エラー情報格納ファイル1は、図3(a)
に示すように、エラーの発生時刻51と、エラーを発生
した装置名52と、発生したエラーの内容(エラー内
容)53とを一組として記録している。
The error information storage file 1 is shown in FIG.
As shown in FIG. 3, the error occurrence time 51, the device name 52 in which the error occurred, and the content of the error (error content) 53 are recorded as a set.

【0018】図1のステップ21において、エラー情報
格納ファイル1から上記のようなエラー情報を入力し、
ステップ22において、それらの中から磁気ディスク装
置に関するエラー情報のみを抽出する。続いてステップ
23において、ステップ22で抽出した磁気ディスク装
置に関するエラー情報をエラーの種類別に分類し、ステ
ップ24において、その分類したエラー情報を磁気ディ
スク装置毎に集計する。
In step 21 of FIG. 1, the above error information is input from the error information storage file 1,
In step 22, only the error information regarding the magnetic disk device is extracted from them. Subsequently, in step 23, the error information regarding the magnetic disk device extracted in step 22 is classified by the type of error, and in step 24, the classified error information is totaled for each magnetic disk device.

【0019】次にステップ25において、エラー基準回
数パラメータファイル2から、エラーの種類別に設定さ
れているエラー基準回数を入力する。エラー基準回数パ
ラメータファイル2は、図3(b)に示すように、それ
ぞれのエラーを記号で示したエラー種別61と、各エラ
ーのそれぞれに対して設定した基準回数62と、各エラ
ーの内容を説明したエラー種別説明63とを一組として
記録している。
Next, at step 25, the error reference number set for each type of error is input from the error reference number parameter file 2. As shown in FIG. 3B, the error reference number parameter file 2 includes an error type 61 in which each error is indicated by a symbol, a reference number 62 set for each error, and the content of each error. The described error type description 63 is recorded as a set.

【0020】次にステップ26において、ステップ24
で集計した磁気ディスク装置毎のエラー情報の回数と、
それに対応するエラー基準回数パラメータファイル2の
基準回数とを比較し、エラー情報の回数が基準回数を超
える場合は、警報出力部に磁気ディスク装置の装置番号
とエーラー回数とエラー種別とを通知し、警報出力部は
出力装置14にメッセージを出力させる(ステップ3
5)。
Next, in step 26, step 24
The number of error information for each magnetic disk device
The corresponding reference number of the error reference number parameter file 2 is compared, and when the number of error information exceeds the reference number, the alarm output unit is notified of the device number of the magnetic disk device, the error count, and the error type, The alarm output unit causes the output device 14 to output a message (step 3).
5).

【0021】ステップ25におけるエラー情報と基準回
数との比較結果の如何に拘らず、ステップ24における
集計結果は、すべてディスク系エラー累積ファイル4に
格納する(ステップ27)。
Regardless of the comparison result between the error information and the reference number in step 25, the totalized result in step 24 is stored in the disk-based error cumulative file 4 (step 27).

【0022】ディスク系エラー累積ファイル4は、図3
(c)に示すように、磁気ディスク装置の過去に発生し
たすべてのエラーについて、エラーを発生した装置名7
1と、そのエラーの発生時刻72と、そのエラーの種類
を記号で示したエラー種別73と、そのエラーの内容
(エラー内容)74とを一組としてランダムに記録して
いる。
The disk system error cumulative file 4 is shown in FIG.
As shown in (c), for all errors that occurred in the past in the magnetic disk device, the device name 7 in which the error occurred
1, an error occurrence time 72, an error type 73 in which the error type is indicated by a symbol, and an error content (error content) 74 are randomly recorded as one set.

【0023】次に、ステップ28においてディスク系エ
ラー累積ファイル4から累積されたエラー情報を入力
し、ステップ29においてエラーの種類別に分類し、ス
テップ30においてそれらを集計する。
Next, in step 28, the error information accumulated from the disk-type error accumulation file 4 is input, in step 29 the error information is classified according to the type of error, and in step 30, they are totaled.

【0024】ステップ30における集計結果には、既に
処置が完了しているために判定対象から除外すべき不要
なエラーが混在しているため、ステップ31において、
必要なエラーのみを選別するための条件を情報選別条件
格納ファイル3から入力する。
Since the totalized result in step 30 includes unnecessary errors that should be excluded from the judgment target because the treatment has already been completed, in step 31,
The conditions for selecting only necessary errors are input from the information selection condition storage file 3.

【0025】情報選別条件格納ファイル3には、図3
(d)に示すように、装置名81と、その装置に対して
処置を行った日時分を示す選別キー日時82と、その日
時分に行っ処置の内容を示すコメント83とが一組とし
て記録されている。従ってこのこの情報から、次に処理
すべき対象を選別する(ステップ32)。
The information selection condition storage file 3 is shown in FIG.
As shown in (d), the device name 81, the selection key date and time 82 indicating the date and time when the device is treated, and the comment 83 indicating the content of the action performed on the date and time are recorded as a set. Has been done. Therefore, from this information, the next object to be processed is selected (step 32).

【0026】次に、ステップ33においてエラー基準回
数パラメータファイル2からエラー基準回数を入力し、
ステップ34においてステップ30で集計した磁気ディ
スク装置毎のエラー情報の回数とそれに対応するエラー
基準回数とを比較する。エラー情報の回数が基準回数を
超える場合は、警報出力部に磁気ディスク装置の装置番
号とエーラー回数とエラー種別とを通知し、警報出力部
は出力装置14にメッセージを出力させる(ステップ3
5)。エラー情報の回数が基準回数を超えない場合は、
そのまま処理を終了する。
Next, at step 33, the error reference number is input from the error reference number parameter file 2,
In step 34, the number of error information for each magnetic disk device tabulated in step 30 is compared with the corresponding error reference number. If the number of times of error information exceeds the reference number, the alarm output unit is notified of the device number of the magnetic disk device, the error count, and the error type, and the alarm output unit causes the output device 14 to output a message (step 3).
5). If the number of error information does not exceed the reference number,
The process is terminated as it is.

【0027】このように、一定時間毎のエラー情報の監
視に加えて、長期間に亘るエラー情報の発生回数を基準
回数と自動的に比較して監視する処理を一連のショブと
して実行できるようにすることにより、エラー情報の監
視処理に対する人手の介入を最小限に抑制することがで
きる。また、監視精度を向上させることができるため、
磁気ディスク装置の障害の発生を未然に防止することが
可能となる。
Thus, in addition to monitoring the error information at regular intervals, a process of automatically comparing the number of occurrences of error information over a long period of time with a reference number and monitoring it can be executed as a series of shoves. By doing so, human intervention in the error information monitoring process can be suppressed to a minimum. Also, since the monitoring accuracy can be improved,
It is possible to prevent a failure of the magnetic disk device from occurring.

【0028】なお、上述の説明は、1回の処理動作の説
明であるが、この動作をジョブの自動運転システムに組
込むことにより、エラー情報の監視処理を一定の周期で
自動的に実行させることができる。
It should be noted that, although the above description is for one-time processing operation, by incorporating this operation in the job automatic operation system, the error information monitoring processing can be automatically executed at a constant cycle. You can

【0029】また、エラー基準回数パラメータファイル
の内容は、ジョブの投入時に変更することができるた
め、磁気ディスク装置の特性等に応じて警報発生のレベ
ルを任意に設定することができる。
Since the content of the error reference number parameter file can be changed when the job is submitted, the alarm generation level can be arbitrarily set according to the characteristics of the magnetic disk device.

【0030】また、ディスク系エラー累積ファイルを一
定期間毎に新しいものとし、期間の異なる複数のディス
ク系エラー累積ファイルによって世代管理ファイル(例
えば、一つのディスク系エラー累積ファイルの累積期間
を1カ月とし、6カ月分のデータを対象とするときは、
6個のディスク系エラー累積ファイルによって世代管理
ファイルを構成する)とすることにより、累積期間の長
さを任意に設定することが可能となる。
Further, the disk-based error cumulative file is made new at regular intervals, and a generation management file (for example, one disk-based error cumulative file has a cumulative period of one month) by a plurality of disk-based error cumulative files of different periods. , When the data for 6 months is targeted,
It is possible to arbitrarily set the length of the cumulative period by configuring the generation management file by the six disk-type error cumulative files).

【0031】[0031]

【発明の効果】以上説明したように、本発明の磁気ディ
スク装置のエラー監視方法は、磁気ディスク装置におい
て発生したエラー情報を、一定の期間毎に独立に集計し
た結果を監視する短期間監視と、任意の長さに設定した
累積期間に発生したエラー情報を集計した結果を監視す
る長期間監視とを自動的に行うことができるようにする
ことにより、エラー情報の監視処理に対する人手の介入
を最小限に抑制することができるという効果がある。ま
た、監視精度を向上させることができるため、磁気ディ
スク装置の障害の発生を未然に防止することが可能とな
るという効果がある。
As described above, the error monitoring method of the magnetic disk device according to the present invention includes short-term monitoring for monitoring the result of independently collecting error information generated in the magnetic disk device at regular intervals. By automatically enabling long-term monitoring that monitors the result of totaling error information that has occurred in the cumulative period set to an arbitrary length, human intervention for error information monitoring processing can be performed. There is an effect that it can be suppressed to the minimum. Further, since the monitoring accuracy can be improved, it is possible to prevent occurrence of a failure in the magnetic disk device.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示すフローチャートであ
る。
FIG. 1 is a flowchart showing an embodiment of the present invention.

【図2】図1の実施例を機能ブロックとして表現したブ
ロック図である。
FIG. 2 is a block diagram showing the embodiment of FIG. 1 as a functional block.

【図3】図1の実施例の各ファイルの内容の一例を示す
フォーマット図で、(a)はエラー情報格納ファイル、
(b)はエラー基準パラメータファイル、(c)はディ
スク系エラー累積ファイル、(d)は情報選別条件ファ
イルを示す図である。
3 is a format diagram showing an example of the contents of each file of the embodiment of FIG. 1, (a) is an error information storage file,
(B) is a diagram showing an error reference parameter file, (c) is a disk-based error cumulative file, and (d) is an information selection condition file.

【図4】従来の磁気ディスク装置のエラー監視方法の一
例を示すフローチャートである。
FIG. 4 is a flowchart showing an example of a conventional error monitoring method for a magnetic disk device.

【符号の説明】[Explanation of symbols]

1 エラー情報格納ファイル 2 エラー基準回数パラメータファイル 3 情報選別条件格納ファイル 4 ディスク系エラー累積ファイル 5 エラー情報入力・抽出部 6 短期間分類集計部 7 短期間比較部 8 エラー累積処理部 9 累積エラー入力部 10 長期間分類集計部 11 情報選別部 12 長期間比較部 13 警報出力部 14 出力装置 21〜35・41〜43 ステップ 51・72 エラーの発生時刻 52・71・81 装置名 53・74 エラー内容 61・73 エラー種別 62 基準回数 63 エラー種別説明 82 選別キー日時 83 コメント 1 Error information storage file 2 Error reference count parameter file 3 Information selection condition storage file 4 Disk error accumulation file 5 Error information input / extraction unit 6 Short period classification aggregation unit 7 Short period comparison unit 8 Error accumulation processing unit 9 Accumulated error input Part 10 Long-term classification / aggregation part 11 Information selection part 12 Long-term comparison part 13 Alarm output part 14 Output device 21-35.41-43 Step 51.72 Error occurrence time 52.71.81 Device name 53.74 Error content 61/73 Error type 62 Reference count 63 Error type description 82 Selection key date / time 83 Comment

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G11B 20/18 574 E 9074−5D ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI technical display location G11B 20/18 574 E 9074-5D

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 電子計算機システムのハードウエア全般
のエラーに関する情報を格納しているエラー情報格納フ
ァイルから磁気ディスク装置に関するエラー情報のみを
抽出し、前記エラー情報を磁気ディスク装置の装置別お
よびエラーの種類別に分類して集計して短期集計結果を
求め、前記短期集計結果をジョブ投入時にエラーの種類
別に上限回数として設定してあるエラー基準回数と比較
し、前記短期集計結果が前記エラー基準回数を超えたと
きは警報出力を行い、前記短期集計結果をディスク系エ
ラー累積ファイルに累積して格納し、前記ディスク系エ
ラー累積ファイルに格納してあるすべての情報を磁気デ
ィスク装置の装置別およびエラーの種類別に分類して集
計して長期集計結果を求め、前記長期集計結果の中から
あらかじめ設定してある情報選別条件と合致する情報の
みを選別して情報選別結果を求め、前記情報選別結果を
前記エラー基準回数と比較して前記情報選別結果が前記
エラー基準回数を超えたとき警報出力を行うことを含む
ことを特徴とする磁気ディスク装置のエラー監視方法。
1. An error information storage file that stores information related to general hardware errors of an electronic computer system is used to extract only error information related to a magnetic disk device, and the error information is used for each device of the magnetic disk device and the error information. The short-term aggregation result is obtained by classifying and summing up by type, and the short-term aggregation result is compared with the error reference number that is set as the upper limit number for each error type when the job is submitted. When it exceeds the limit, an alarm is output, the short-term totaling result is accumulated and stored in the disk-based error cumulative file, and all the information stored in the disk-based error cumulative file is stored for each device of the magnetic disk device and the error Calculate the long-term aggregation results by classifying by type and set in advance from the long-term aggregation results. To obtain an information selection result by selecting only information that matches a certain information selection condition, compare the information selection result with the error reference number, and issue an alarm when the information selection result exceeds the error reference number. An error monitoring method for a magnetic disk device, comprising:
【請求項2】 ジョブ自動運転システムに組込んで一定
周期で自動的に動作させることを特徴とする請求項1記
載の磁気ディスク装置のエラー監視方法。
2. A method for monitoring an error in a magnetic disk drive according to claim 1, wherein the method is incorporated into an automatic job operation system and automatically operated at a constant cycle.
【請求項3】 ディスク系エラー累積ファイルを一定期
間毎に新しいものとした複数世代のファイルを有する世
代管理フアイルとし、前記一定期間を任意の長さに設定
できるようにしたことを特徴とする請求項1または請求
項2記載の磁気ディスク装置のエラー監視方法。
3. A generation management file having files of a plurality of generations, in which the disk-type error cumulative file is made new every fixed period, and the fixed period can be set to an arbitrary length. An error monitoring method for a magnetic disk device according to claim 1 or 2.
JP5286596A 1993-11-16 1993-11-16 Error monitoring method for magnetic disk device Withdrawn JPH07141265A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5286596A JPH07141265A (en) 1993-11-16 1993-11-16 Error monitoring method for magnetic disk device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5286596A JPH07141265A (en) 1993-11-16 1993-11-16 Error monitoring method for magnetic disk device

Publications (1)

Publication Number Publication Date
JPH07141265A true JPH07141265A (en) 1995-06-02

Family

ID=17706466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5286596A Withdrawn JPH07141265A (en) 1993-11-16 1993-11-16 Error monitoring method for magnetic disk device

Country Status (1)

Country Link
JP (1) JPH07141265A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146849A (en) * 1995-11-21 1997-06-06 Nec Corp Information processing system and its memory reconstituting method
JPH09278284A (en) * 1996-04-19 1997-10-28 Teijin Ltd Abnormality warning device for thread line automatically peeling-off device
GB2367463A (en) * 2000-06-27 2002-04-03 Hewlett Packard Co Comparing short-term and long-term error rates to determine whether tape drive heads require cleaning
JP2005278148A (en) * 2004-02-06 2005-10-06 Microsoft Corp Network dna
JP2011081889A (en) * 2009-10-09 2011-04-21 Toshiba Tec Corp Storage device, information processing device, and storage control program

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146849A (en) * 1995-11-21 1997-06-06 Nec Corp Information processing system and its memory reconstituting method
JPH09278284A (en) * 1996-04-19 1997-10-28 Teijin Ltd Abnormality warning device for thread line automatically peeling-off device
GB2367463A (en) * 2000-06-27 2002-04-03 Hewlett Packard Co Comparing short-term and long-term error rates to determine whether tape drive heads require cleaning
US6624958B1 (en) 2000-06-27 2003-09-23 Hewlett-Packard Development Company, L.P. Debris detection and error recovery method for tape drives
GB2367463B (en) * 2000-06-27 2004-10-13 Hewlett Packard Co Debris detection and error recovery method for tape drives
JP2005278148A (en) * 2004-02-06 2005-10-06 Microsoft Corp Network dna
JP4731935B2 (en) * 2004-02-06 2011-07-27 マイクロソフト コーポレーション Network DNA
US8126999B2 (en) 2004-02-06 2012-02-28 Microsoft Corporation Network DNA
US8676969B2 (en) 2004-02-06 2014-03-18 Microsoft Corporation Network classification
US9374286B2 (en) 2004-02-06 2016-06-21 Microsoft Technology Licensing, Llc Network classification
US9608883B2 (en) 2004-02-06 2017-03-28 Microsoft Technology Licensing, Llc Network classification
JP2011081889A (en) * 2009-10-09 2011-04-21 Toshiba Tec Corp Storage device, information processing device, and storage control program

Similar Documents

Publication Publication Date Title
US9954747B2 (en) Systems and methods of specifying service level criteria
US7107491B2 (en) System, method and computer product for performing automated predictive reliability
CN104285212A (en) Automated analysis system for modeling online business behavior and detecting outliers
JP2007515020A (en) Statistical analysis of automatic monitoring and dynamic process metrics to reveal meaningful variations
CN114201201A (en) Method, device and equipment for detecting abnormity of business system
US9448998B1 (en) Systems and methods for monitoring multiple heterogeneous software applications
US8543552B2 (en) Detecting statistical variation from unclassified process log
US20210203680A1 (en) Web service usage anomaly detection and prevention
JPH07141265A (en) Error monitoring method for magnetic disk device
JP5746565B2 (en) Maintenance management system, work priority calculation method and program
JP2005327201A (en) Maintenance support method, program, and device
US20140208427A1 (en) Apparatus and methods for detecting data access
CN116382952A (en) Exception handling method, device and system
CN112969151B (en) Short message monitoring method, device and equipment
JP3449470B2 (en) How to analyze event records
CN113902345A (en) Monitoring management method, device and system for power dispatching service
CN114154836A (en) Method for monitoring contract execution and triggering early warning and electronic equipment
CN112527611A (en) Product health degree assessment method and system
JPH07281728A (en) Alarm analysis supporting device
CN112306828A (en) Product Crash data monitoring method and system
JP2008181432A (en) Health check device, health check method, and program
CN113849337B (en) System exception handling method and device
CN111143325A (en) Data acquisition monitoring method, monitoring device and readable storage medium
CN110502404B (en) Early warning processing method based on data management platform and related equipment
CN113469584B (en) Risk management method and device for business service operation

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010130