JPH0721059A - Erroneous log information managing method - Google Patents

Erroneous log information managing method

Info

Publication number
JPH0721059A
JPH0721059A JP5164509A JP16450993A JPH0721059A JP H0721059 A JPH0721059 A JP H0721059A JP 5164509 A JP5164509 A JP 5164509A JP 16450993 A JP16450993 A JP 16450993A JP H0721059 A JPH0721059 A JP H0721059A
Authority
JP
Japan
Prior art keywords
error
information
log information
maintenance
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5164509A
Other languages
Japanese (ja)
Inventor
Masamichi Hoshino
正道 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5164509A priority Critical patent/JPH0721059A/en
Publication of JPH0721059A publication Critical patent/JPH0721059A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To effectively use erroneous log information and to apply uniform and efficient countermeasure and preventive maintenance for failure by regulating the format/content of erroneous log information based on object oriented consideration. CONSTITUTION:In a client server system consisting of plural hierarchies, the failure detail information of hardware failure sampled at every unit in a peripheral device and the erroneous log information representing error statistical information in each hierarchy are stored in the specific areas of external memory devices 25, 29. After recorded information is read out periodically and it is sent to a high-order server sequentially and the information is collected comprehensively, a failure occurrence process list and an abnormal value list when the value exceeds the threshold value of the error statistical information are generated, and they are outputted to the output devices 26, 2A of the high- order server. A unification server 27, after transferring collected erroneous log information to a terminal 2B at a maintenance base, edits a list for maintenance, and sends it to the output device 2D of the maintenance terminal 2B, then, it is used by each peripheral device as feedback data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、コンピュ−タおよび周
辺装置のハ−ドウェア障害時に、周辺装置内のユニット
毎に採取される障害詳細情報とエラ−統計情報を示すエ
ラ−ログ情報を管理し、障害対策および予防保守を図る
ための編集リストを出力するようにしたエラ−ログ情報
管理方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention manages error log information indicating detailed error information and error statistical information collected for each unit in a peripheral device when a hardware error occurs in the computer and the peripheral device. In addition, the present invention relates to an error log information management method that outputs an edit list for troubleshooting and preventive maintenance.

【0002】[0002]

【従来の技術】従来より、RAS、つまりReliability
(信頼性)、Availability(有用性)およびServiceability
(保守性)について、ある製品を一定周期毎に収集デ−タ
を採取してメモリに記憶する等、単体の製品に対しては
方法が考えられていたが、製品に対する総合的なRAS
としての考え方は未だ確立されていなかった。すなわ
ち、コンピュ−タ情報処理システムの場合、製品の稼働
から予防保守までを含めたシステムRASの観点に立っ
てエラ−ログ情報の管理方法を考えたものはなく、あっ
ても内容が明確ではなかった。また、ベンダおよび保守
拠点に対して、ハ−ドウェア製品における稼働品質を向
上させるため、エラ−ログ情報をフィ−ドバックデ−タ
として戻すことにより、有効活用を図るという考え方は
なく、またシステム全体に対して、均一で効率的な障害
対策および予防保守を図る一貫したエラ−ログ情報管理
方法は確立されていなかった。なお、従来、装置内で発
生する各種デ−タを収集し、一定期間毎に外部記憶装置
に書き込む方法としては、実開平4−111649号公
報に記載された『デ−タ収集記録装置』がある。
2. Description of the Related Art Conventionally, RAS, that is, reliability
(Reliability), Availability and Serviceability
Regarding (maintenance), a method was considered for a single product, such as collecting data for a certain product at fixed intervals and storing it in memory, but a comprehensive RAS for the product
The idea of as was not established yet. That is, in the case of a computer information processing system, there is no one that has considered a method of managing error log information from the viewpoint of system RAS including the operation of products to preventive maintenance, and the contents are not clear. It was In addition, there is no concept of effective use by returning error log information as feedback data to the vendors and maintenance bases in order to improve the operating quality of hardware products. On the other hand, a consistent error log information management method for uniform and efficient failure countermeasures and preventive maintenance has not been established. Incidentally, as a conventional method for collecting various data generated in the apparatus and writing the same in an external storage device at regular intervals, there is a "data collection recording device" described in Japanese Utility Model Laid-Open No. 4-111649. is there.

【0003】[0003]

【発明が解決しようとする課題】従来では、システム全
体として一元管理/集中管理できるようなエラ−ログ情
報の採取、収集、編集、あるいは転送の各機能を備えた
エラ−ログ情報の管理システムは、未だ確立されていな
い。このように、システムRASの観点に立ったエラ−
ログ情報管理方法が確立されていなかったので、ベンダ
や保守拠点における保守部署に対して、デ−タをフィ−
ドバックさせて、ハ−ドウェア製品の稼働品質向上のた
めに有効活用を図ること、あるいは均一で効率的な障害
対策と予防保守を図ることはできなかった。本発明の目
的は、このような従来の課題を解決し、システム全体と
して一元管理/集中管理することができるようなエラ−
ログ情報の採取、収集、編集、あるいは転送の各機能を
備えたエラ−ログ情報管理方法を提供することにある。
Conventionally, an error log information management system having a function of collecting, collecting, editing, or transferring error log information capable of performing centralized / centralized management of the entire system has been known. , Not yet established. In this way, the error from the viewpoint of system RAS
Since the log information management method was not established, the data was sent to the vendor and the maintenance department at the maintenance base.
However, it was not possible to make effective use to improve the operation quality of hardware products by implementing feedback, or to implement uniform and efficient failure countermeasures and preventive maintenance. An object of the present invention is to solve the above-mentioned conventional problems and to perform an error management such that the system as a whole can be managed centrally / centrally.
An object of the present invention is to provide an error log information management method having each function of collecting, collecting, editing, or transferring log information.

【0004】[0004]

【課題を解決するための手段】上記目的を達成するた
め、本発明のエラ−ログ情報管理方法は、それぞれ外部
記憶装置(22,25,29,2C)、入出力装置(2
1,24,26,28,2A,2D)等の周辺装置を接
続したクライアント(20)、クライアント(20)を
管理する複数の営業店サ−バ(23)および営業店サ−
バ(23)を一元管理する統合サ−バ(27)、ならび
に統合サ−バ(27)に接続された保守拠点(2B)の
複数階層からなるクライアントサ−バシステムにおい
て、各階層の周辺装置内ユニット毎に採取されるハ−ド
ウェア障害の障害詳細情報(51〜5N)およびエラ−
統計情報を示すエラ−ログ情報(61〜6M)を接続さ
れた外部記憶装置(22,25,29)の特定エリアに
記録し、記録された情報を定期的に読み出して、上位の
サ−バに順次送信することにより、上位サ−バに情報を
一括して収集した後、編集を行って見易くし、障害詳細
情報の障害発生推移リスト(図10参照)およびエラ−
統計情報の閾値を超えた時の異常値リスト(図11参
照)を上位のサ−バの出力装置(26,2A)に出力す
るとともに、統合サ−バ(27)に収集されたエラ−ロ
グ情報を保守拠点の端末(2B)に転送した後、編集し
た保守用リストを保守端末(2B)の出力装置(2D)
に出力することにより、保守用リストをフィ−ドバック
デ−タとして各周辺装置に活用することを特徴としてい
る。
In order to achieve the above object, the error log information management method of the present invention comprises an external storage device (22, 25, 29, 2C) and an input / output device (2).
1, 24, 26, 28, 2A, 2D) and the like connected to the client (20), a plurality of sales office servers (23) for managing the clients (20), and sales office server.
In a client server system having a plurality of layers of an integrated server (27) for centrally managing the server (23) and a maintenance base (2B) connected to the integrated server (27), peripheral devices of each layer Fault detail information (51-5N) of hardware faults collected for each internal unit and error
The error log information (61 to 6M) indicating the statistical information is recorded in a specific area of the connected external storage device (22, 25, 29), and the recorded information is periodically read out to obtain a higher rank server. Information is collected in a high-order server all at once, and then edited to make it easier to see, and the failure occurrence transition list (see FIG. 10) and error information in the failure detailed information are displayed.
An abnormal value list (see FIG. 11) when the threshold value of the statistical information is exceeded is output to the output device (26, 2A) of the upper server, and the error log collected in the integrated server (27). After transferring the information to the maintenance base terminal (2B), the edited maintenance list is output to the maintenance terminal (2B) output device (2D).
It is characterized in that the maintenance list is used as feedback data for each peripheral device by outputting to the peripheral device.

【0005】[0005]

【作用】本発明においては、オブジェクト指向の考え方
に基づいて、エラ−ログ情報の形式/内容を規定するこ
とにより、システム全体として一元集中管理できるよう
にする。すなわち、ハ−ドウェア障害時、周辺装置内ユ
ニット毎に採取される障害詳細情報およびエラ−統計情
報を示すエラ−ログ情報の構成要素である項目表現の一
貫性、保守性および拡張性を保つために、種々の特性を
持ったプリミティブ(つまり、性質が全く異なる)な属
性情報として定義し、ソフトウェアやシステムに依存し
ないエラ−ログ情報の形式/内容を規定する。そして、
ハ−ドウェア障害時には、周辺装置内のユニット毎に採
取された障害詳細情報とエラ−統計情報を示すエラ−ロ
グ情報を、外部記憶装置の特定領域に書き込むととも
に、これらを定期的に読み出して、順次、上位システム
に一括して集収する。上位システムおよび保守拠点で
は、一括収集した後、見易いように編集して、障害詳細
情報の障害発生推移リストおよびエラ−統計情報の閾値
を超えた時の異常値リストを出力装置から出力する。ま
た、最上位システム、例えば統合サ−バや営業点サ−バ
から収集ずみのエラ−ログ情報を保守拠点毎に分類し
て、保守拠点に設けられた保守端末に転送することによ
り、その保守端末の出力装置から編集した保守用リスト
を出力する。
In the present invention, the format / content of the error log information is defined based on the object-oriented concept, so that the system as a whole can be centrally managed. That is, in order to maintain consistency, maintainability, and expandability of the item expression, which is a component of error log information indicating detailed error information and error statistical information collected for each unit in a peripheral device when a hardware error occurs. In addition, it is defined as primitive attribute information having various characteristics (that is, completely different properties), and defines the format / content of error log information that does not depend on software or system. And
In the event of a hardware failure, error log information indicating failure detailed information and error statistical information collected for each unit in the peripheral device is written to a specific area of the external storage device, and these are read periodically, Collected sequentially in a higher system. In the host system and the maintenance base, after collectively collecting, it is edited for easy viewing, and the failure occurrence transition list of the failure detailed information and the abnormal value list when the threshold of the error statistical information is exceeded are output from the output device. In addition, the error log information collected from the highest level system, for example, the integrated server or the sales point server, is classified for each maintenance base and transferred to the maintenance terminal provided in the maintenance base for maintenance. Output the edited maintenance list from the terminal output device.

【0006】[0006]

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1および図2は、本発明を適用した階層シ
ステムを示す全体図である。ここでは、クライアント
(顧客)、その上位の営業店サ−バ(供給者)、さらに
上位の統合サ−バから構成されるクライアントサ−バシ
ステムを示している。図2において、20はクライアン
トの処理装置で、各種のデ−タを処理する装置、21は
クライアント処理装置20に接続されたディスプレイ、
ハ−ドディスクおよびプリンタ等の複数個のユニットか
らなる周辺装置、22はハ−ドウェア障害時に、周辺装
置内ユニット毎に採取される障害詳細情報およびエラ−
統計情報を示すエラ−ログ情報を記録する外部記憶装置
である。また、図1において、23は営業点サ−バの処
理装置であって、クライアントから収集したデ−タの処
理を行う装置、24はキ−ボ−ドディスプレイ等の各種
のコマンドを入力する入力装置、25は営業店サ−バで
ハ−ドウェア障害が発生したとき、そのサ−バに接続さ
れた周辺装置内ユニット毎に採取される障害詳細情報、
およびエラ−統計情報を示すエラ−ログ情報、およびそ
のサ−バの下に位置するクライアント20から収集した
エラ−ログ情報を記録するための外部記憶装置、26は
その営業店システム内の各種情報を編集し、リストにし
て出力するプリンタである。
Embodiments of the present invention will now be described in detail with reference to the drawings. 1 and 2 are overall views showing a hierarchical system to which the present invention is applied. Here, a client server system including a client (customer), a sales office server (supplier) above it, and an integrated server above it is shown. In FIG. 2, reference numeral 20 denotes a client processing apparatus, which is an apparatus for processing various data, 21 denotes a display connected to the client processing apparatus 20,
A peripheral device composed of a plurality of units such as a hard disk and a printer. Reference numeral 22 denotes detailed error information and an error collected for each unit in the peripheral device when a hardware error occurs.
The external storage device records error log information indicating statistical information. Further, in FIG. 1, reference numeral 23 is a processing point server processing apparatus for processing data collected from clients, and 24 is an input for inputting various commands such as a keyboard display. When a hardware failure occurs at a sales office server, the device 25 is detailed failure information collected for each unit in the peripheral device connected to the server,
And an external storage device for recording the error log information indicating the error statistical information and the error log information collected from the client 20 located under the server, and 26 is various information in the sales office system. Is a printer that edits and outputs a list.

【0007】また、図1の最上段の27は統合サ−バの
処理装置であって、全営業店システムの一元管理/集中
管理する統合サ−バの処理装置であって、営業店サ−バ
から収集したデ−タの処理を行う装置、28はキ−ボ−
ドディスプレイ等の各種のコマンドを入力する入力装
置、25は営業店サ−バでハ−ドウェア障害が発生した
とき、そのサ−バに接続された周辺装置内ユニット毎に
採取される障害詳細情報とエラ−統計情報を示すエラ−
ログ情報、および統合サ−バの下位の全営業店サ−バ2
3より収集したエラ−ログ情報を記録するための外部記
憶装置、2Aはシステム全体としての各種情報を編集
し、リスト出力するためのプリンタ、2Bは保守拠点に
設けられた保守端末の処理装置であって、統合サ−バ処
理装置27との間は回線により接続される。また、2C
は、統合サ−バで一元管理/集中管理されたエラ−ログ
情報を定期的に受信しながら記録するための外部記録装
置、2Dは保守拠点における各種情報を編集し、リスト
出力するプリンタである。
Further, the uppermost 27 in FIG. 1 is an integrated server processing device, which is an integrated server processing device for centralized / centralized management of all business office systems. A device for processing the data collected from the server, 28 is a keyboard
An input device for inputting various commands such as a hard disk display, and 25 is a detailed information of a failure collected for each unit in the peripheral device connected to the server when a hardware failure occurs in the sales office server. And an error indicating statistical information
Log information and all sales office servers under the integrated server 2
3 is an external storage device for recording the error log information collected from 3, 2A is a printer for editing various information of the entire system, and is a list output, and 2B is a processing device of a maintenance terminal provided at a maintenance base. Therefore, the integrated server processing device 27 is connected by a line. Also, 2C
Is an external recording device for recording while periodically receiving error log information centrally managed / centralized by the integrated server, and 2D is a printer for editing various information at the maintenance base and outputting the list. .

【0008】図3は、本発明におけるエラ−ログ情報の
採取、収集、編集、または転送の各機能の説明図であ
る。図3において、30はクライアント処理装置、31
は営業店サ−バ処理装置、32は統合サ−バ処理装置、
33は保守端末、34,35,36はいずれもエラ−ロ
グ情報ファイル、37,39は編集リスト出力、38は
受信ファイルである。クライアント処理装置30は、ハ
−ドウェア障害を検知すると、障害詳細情報およびエラ
−統計情報を示すエラ−ログ情報をクライアント処理装
置30に接続された外部記憶装置内のエラ−ログ情報フ
ァイル34に採取する。また、営業店サ−バ処理装置3
1は、下位のクライアント30内に採取されたエラ−ロ
グ情報を収集して、営業店サ−バ処理装置31に接続さ
れた外部記憶装置内のエラ−ログ情報ファイル35に書
き込む。また、その営業店サ−バ処理装置31におい
て、ハ−ドウェア障害を検知すると、エラ−ログ情報を
営業店サ−バ31に接続された外部記憶装置内のエラ−
ログ情報ファイル35に採取する。
FIG. 3 is an explanatory diagram of each function of collecting, collecting, editing, or transferring error log information according to the present invention. In FIG. 3, 30 is a client processing device, 31
Is a sales office server processing device, 32 is an integrated server processing device,
33 is a maintenance terminal, 34, 35 and 36 are all error log information files, 37 and 39 are edit list outputs, and 38 is a received file. When the client processing device 30 detects a hardware failure, the client processing device 30 collects error log information indicating detailed error information and error statistical information in an error log information file 34 in an external storage device connected to the client processing device 30. To do. In addition, the server processing device 3
1 collects the error log information collected in the lower level client 30 and writes it in the error log information file 35 in the external storage device connected to the sales office server processing device 31. Further, when the sales office server processing device 31 detects a hardware failure, the error log information is stored in the external storage device connected to the sales office server 31.
Collect in the log information file 35.

【0009】次に、統合サ−バ処理装置32は、下位の
営業店サ−バ処理装置31内に採取されたエラ−ログ情
報を収集し、統合サ−バ処理装置32に接続された外部
記憶装置内の外部記憶装置内のエラ−ログ情報ファイル
36に書き込む。また、統合サ−バ処理装置32は、そ
の処理装置内でハ−ドウェア障害を検知すると、エラ−
ログ情報を統合サ−バ処理装置32に接続された外部記
憶装置内のエラ−ログ情報ファイル36に採取する。統
合サ−バ処理装置32は、収集/採取されたエラ−ログ
情報を編集して、出力装置37にリスト出力する。一
方、保守拠点に設置された保守端末33は、統合サ−バ
処理装置32から回線を介して定期的に転送されたその
保守拠点のエラ−ログ情報を編集して、出力装置39に
リスト出力する。図4は、図1における外部記憶装置に
記録されるエラ−ログ情報ファイルのフォ−マット構成
を示す図である。図4において、40はエラ−ログ情報
ファイル、41はエラ−ログ情報ファイル40内の特定
エリアに記録されている障害詳細情報管理テ−ブル、4
2はエラ−統計情報管理テ−ブルである。以下、図4に
示す障害詳細情報管理テ−ブル41とエラ−統計情報管
理テ−ブル42の形式を、図5および図6に示す。
Next, the integrated server processing device 32 collects the error log information collected in the subordinate office server processing device 31, and the external server connected to the integrated server processing device 32. Write to the error log information file 36 in the external storage device in the storage device. When the integrated server processing device 32 detects a hardware failure in the processing device, the integrated server processing device 32 returns an error.
The log information is collected in the error log information file 36 in the external storage device connected to the integrated server processing device 32. The integrated server processing device 32 edits the collected / collected error log information and outputs it as a list to the output device 37. On the other hand, the maintenance terminal 33 installed in the maintenance base edits the error log information of the maintenance base periodically transferred from the integrated server processing unit 32 via the line and outputs the list to the output unit 39. To do. FIG. 4 is a diagram showing the format structure of the error log information file recorded in the external storage device in FIG. In FIG. 4, 40 is an error log information file, 41 is a detailed error information management table recorded in a specific area in the error log information file 40, 4
Reference numeral 2 is an error statistical information management table. The formats of the fault detailed information management table 41 and the error statistical information management table 42 shown in FIG. 4 are shown below in FIGS. 5 and 6.

【0010】図5において、50はハ−ドウェア障害時
の周辺装置内ユニットに対する障害詳細項目の集合体
(N個存在する)の障害詳細情報管理テ−ブル、51は
その周辺装置内ユニットに対する障害詳細項目1であ
り、同じように52〜5Nはそれぞれ障害詳細項目2〜
Nである。障害詳細項目1には、障害詳細項目51に対
する属性情報テ−ブル510がある。511,512,
・・・51Mは、障害詳細項目51内の属性情報テ−ブ
ル510を構成するM個のプリミティブな属性情報(A
ttribute)である。同じようにして、障害詳細項目5
2,・・・・・5Nに対しても、それぞれM個のプリミ
ティブな属性情報がある。図6において、60はハ−ド
ウェア障害時の周辺装置内ユニットに対するエラ−統計
項目の集合体(N個存在する)のエラ−統計情報管理テ
−ブル、61はその周辺装置内ユニット内に対するエラ
−統計項目1であり、同じように62〜6Nはそれぞれ
エラ−統計項目2〜Nである。エラ−統計項目1には、
エラ−統計項目61内の属性情報テ−ブル610があ
る。611,612,・・・・61Mは、エラ−統計項
目61内の属性情報テ−ブル610を構成するM個のプ
リミティブな属性情報(Attribute)である。同じように
して、エラ−統計項目62,・・・・6Nに対しても、
それぞれM個のプリミティブな属性情報がある。このよ
うに、属性情報で統一化すれば、属性情報に従って編集
すればよいので、編集がやり易くなる。
In FIG. 5, reference numeral 50 is a failure detail information management table of a collection of failure detail items (there are N pieces) of a unit in a peripheral apparatus at the time of a hardware failure, and 51 is a failure in the unit in the peripheral apparatus. It is the detailed item 1, and similarly 52 to 5N are the fault detailed items 2 to 2, respectively.
N. The fault detail item 1 includes an attribute information table 510 for the fault detail item 51. 511, 512,
... 51M is M primitive attribute information (A of the attribute information table 510 in the fault detail item 51).
ttribute). In the same way, detail item 5
There are M pieces of primitive attribute information for 2, ..., 5N, respectively. In FIG. 6, reference numeral 60 is an error statistical information management table of an aggregate of error statistical items (there are N pieces) for the unit in the peripheral device at the time of hardware failure, and 61 is an error for the unit in the peripheral device. -Statistics item 1 and similarly 62 to 6N are error statistics items 2 to N, respectively. Error statistics item 1
There is an attribute information table 610 in the error statistical item 61. 611, 612, ..., 61M are M pieces of primitive attribute information (Attribute) forming the attribute information table 610 in the error statistical item 61. Similarly, for the error statistical items 62, ... 6N,
There are M pieces of primitive attribute information. In this way, if the attribute information is unified, it is sufficient to edit according to the attribute information, which facilitates editing.

【0011】図7は、図5および図6のプリミティブな
属性情報の形式を示す図である。図7において、70は
個々の属性情報に対する属性識別子であり、一意の識別
番号が与えられる。71は属性情報のデ−タ内容72に
対するデ−タ長である。また、72は属性識別子70で
示されるデ−タ内容、つまりデ−タ長71だけの属性情
報の取り得る値である。この方法の考え方としては、個
々の属性情報に対してモジュ−ラ構造的な共通仕様と
し、柔軟性、拡張性、保守性を考えた汎用化、標準化を
図るためのオブジェクト指向に基づいている。図8は、
図5の属性情報テ−ブルをマッピングした場合の障害詳
細項目の形式を示す図である。ここでは、M=7個のプ
リミティブな属性情報により構成されている。図8にお
いて、80は障害詳細項目を示す項目種別、81は周辺
装置が設置されている設置場所、82は周辺装置の装置
名称、83は周辺装置内ユニットで障害が発生した日
付、84は周辺装置内ユニットにおける障害の名称、8
5は障害コ−ド、86は障害発生時の各種レジスタやセ
ンサの情報等を示す障害詳細デ−タである。なお、障害
コ−ド85とは、どのユニットの障害かを表わす障害発
生部位コ−ドであって、どのような現象であるかを示す
障害現象コ−ドとどのような原因であるかを表わす障害
原因コ−ドの分類体系で構成されており、これにより障
害の切り分けができる分解能を示しており、またある選
択された期間で障害が発生した時のその障害コ−ドに対
する障害発生合計件数および障害発生日等の項目からな
る障害発生推移リストを出力するためのキ−項目でもあ
る。
FIG. 7 is a diagram showing a format of the primitive attribute information of FIGS. 5 and 6. In FIG. 7, reference numeral 70 denotes an attribute identifier for each attribute information, which is given a unique identification number. Reference numeral 71 is a data length for the data content 72 of the attribute information. Further, 72 is a data content indicated by the attribute identifier 70, that is, a possible value of the attribute information of only the data length 71. The method is based on an object-oriented approach for generalization and standardization in which each attribute information has a modular structure common specification and flexibility, expandability, and maintainability are considered. Figure 8
It is a figure which shows the format of the failure detailed item at the time of mapping the attribute information table of FIG. Here, it is composed of M = 7 pieces of primitive attribute information. In FIG. 8, 80 is an item type indicating detailed items of failure, 81 is an installation location where the peripheral device is installed, 82 is a device name of the peripheral device, 83 is a date when a failure occurs in a unit in the peripheral device, and 84 is a peripheral device. Name of the fault in the device unit, 8
Reference numeral 5 is a fault code, and 86 is fault detail data indicating information of various registers and sensors when a fault occurs. The fault code 85 is a fault occurrence site code indicating which unit has a fault, and a fault phenomenon code indicating what kind of phenomenon and what cause. It is composed of the classification system of the fault cause code that is shown, which shows the resolution that can isolate the fault, and the total fault occurrence for the fault code when the fault occurs in a certain selected period. It is also a key item for outputting a failure occurrence transition list including items such as the number of cases and the failure occurrence date.

【0012】図9は、図6における属性情報テ−ブルを
マッピングした時のエラ−統計項目の形式を示す図であ
る。ここでは、M=9個のプリミティブな属性情報によ
り構成されている。図9において、90はエラ−統計項
目を示す項目種別、91は周辺装置が設置されている装
置設置場所、92は周辺装置の装置名称、93は周辺装
置内のユニット名称、94は周辺装置内ユニットのエラ
−カウンタの名称、95はエラ−カウンタ、96は周辺
装置内ユニットに入出力起動命令を発行する時の起動回
数、97はエラ−発生件数の閾値、98はエラ−発生率
の閾値を示している。なお、エラ−発生件数閾値97
は、上位システムからの収集コマンドにより、エラ−カ
ウンタ95の値がそのエラ−発生件数閾値97を超えた
エラ−統計項目だけを、上位システムに収集する時に判
断する閾値である。また、エラ−発生率閾値98は、上
位システムからの収集コマンドにより、エラ−カウンタ
95の値を起動回数96で割算した値がエラ−発生率閾
値98を超えたエラ−統計項目だけを、上位システムに
収集する時に判断する閾値である。すなわち、これらの
2つの項目97,98は、上位システムに収集するエラ
−統計項目の情報量を最小限にし、収集時間を短縮する
ために必要な項目となる。なお、これらのエラ−発生件
数閾値97とエラ−発生率閾値98の各値は、統合サ−
バ処理装置27の入力装置28、あるいは営業店サ−バ
処理装置23の入力装置24からコマンド指示が入力さ
れることにより、初期設定あるいは値の更新が行われ
る。
FIG. 9 is a diagram showing the format of error statistical items when the attribute information table in FIG. 6 is mapped. Here, it is composed of M = 9 pieces of primitive attribute information. In FIG. 9, 90 is an item type indicating an error statistical item, 91 is a device installation location in which the peripheral device is installed, 92 is a device name of the peripheral device, 93 is a unit name in the peripheral device, and 94 is in the peripheral device. The name of the error counter of the unit, 95 is an error counter, 96 is the number of times of activation when an input / output activation command is issued to the unit in the peripheral device, 97 is a threshold of the number of error occurrences, 98 is a threshold of the error occurrence rate Is shown. In addition, the error occurrence threshold 97
Is a threshold value which is determined when collecting in the upper system only the error statistical item in which the value of the error counter 95 exceeds the error occurrence number threshold value 97 by the collecting command from the upper system. Further, the error occurrence rate threshold 98 is set only for the error statistical items for which the value obtained by dividing the value of the error counter 95 by the number of activations 96 exceeds the error occurrence rate threshold 98 by the collection command from the upper system. It is a threshold value that is judged when collecting data in the host system. That is, these two items 97 and 98 are necessary items for minimizing the information amount of error statistical items collected in the host system and shortening the collection time. The values of the error occurrence count threshold value 97 and the error occurrence rate threshold value 98 are the same as those of the integrated service.
Initialization or updating of values is performed by inputting a command instruction from the input device 28 of the bar processing device 27 or the input device 24 of the sales office server processing device 23.

【0013】図10は、本発明における障害発生推移リ
ストの出力フォ−マット例を示す図である。図5の障害
詳細情報管理テ−ブルを編集し、これを障害発生推移リ
ストとして営業店サ−バ23あるいは統合サ−バ27内
の出力装置26,2A、または保守端末28内の出力装
置2Dに出力するときには、図10に示すようなリスト
形式となる。リストの項目には、保守拠点名称、装置設
置場所、障害名称、障害コ−ド、発生件数、障害詳細デ
−タ、および障害発生日等が出力され、それらの各項目
に対応して具体的名称と各値が出力される。図11は、
本発明におけるエラ−統計項目の出力フォ−マット例を
示す図である。図6のエラ−統計情報管理テ−ブルを編
集し、これをエラ−統計情報における異常値リストとし
て営業店サ−バ23あるいは統合サ−バ27および保守
端末28に接続された各出力装置26,2A,2Dに出
力するときには、図11に示すようなリスト形式とな
る。リストの項目としては、保守拠点名称、装置設置場
所、装置名称、ユニット名称、エラ−カウンタ名称、エ
ラ−カウンタ値、起動回数、およびエラ−発生率等が出
力され、それらの各項目に対応して具体的名称と各値が
出力される。
FIG. 10 is a diagram showing an example of the output format of the failure occurrence transition list according to the present invention. The detailed fault information management table of FIG. 5 is edited and used as a fault occurrence transition list to output devices 26, 2A in the sales office server 23 or integrated server 27, or an output device 2D in the maintenance terminal 28. When output to, the list format is as shown in FIG. In the items of the list, maintenance site name, equipment installation location, failure name, failure code, number of occurrences, failure detail data, failure occurrence date, etc. are output. The name and each value are output. FIG. 11 shows
It is a figure which shows the output format example of an error statistical item in this invention. The error statistical information management table shown in FIG. 6 is edited, and this is used as an abnormal value list in the error statistical information to output server 26 connected to sales office server 23 or integrated server 27 and maintenance terminal 28. , 2A, 2D, the list format is as shown in FIG. As the list items, maintenance site name, device installation location, device name, unit name, error counter name, error counter value, number of startups, error occurrence rate, etc. are output and correspond to each of these items. The specific name and each value are output.

【0014】図12〜図17は、本発明の一実施例を示
すエラ−ログ情報管理方法の動作フロ−チャ−トであ
る。図12には、クライアント処理装置20、営業店サ
−バ処理装置23、統合サ−バ処理装置27において、
障害詳細情報とエラ−統計情報を示すエラ−ログ情報を
ハ−ドディスク等の外部記憶装置内に採取する場合の各
処理装置20,23,27内のプログラム実行を示すフ
ロ−が示されている。各処理装置20,23,27,お
よび保守拠点2Bには、外部記憶装置22,25,2
9,2Cが接続され、エラ−ログ情報ファイルが記憶さ
れている。図12では、先ずこれらハ−ドディスク等の
外部記憶装置22,25,29,2C内に採取するエラ
−ログ情報ファイル内のエラ−統計情報管理テ−ブル4
2に対して初期設定処理を行う(ステップ100)。初
期設定方法としては、図9のエラ−統計項目内の項目種
別90、装置設置場所91、装置名称92、ユニット名
称93、エラ−カウンタ名称94、エラ−カウンタ値9
5、起動回数96、エラ−発生件数閾値97、およびエ
ラ−発生率閾値98を、該当する周辺装置およびユニッ
トが構成する情報に従って初期設定する。なお、上記各
項目のうち、エラ−発生件数閾値97とエラ−発生率閾
値98は、上位システムからのコマンド指示により初期
設定または変更を行うことができる。
FIGS. 12 to 17 are operation flowcharts of the error log information management method showing an embodiment of the present invention. FIG. 12 shows a client processing device 20, a branch server processing device 23, and an integrated server processing device 27.
A flow chart showing program execution in each processing unit 20, 23, 27 when error log information showing detailed error information and error statistical information is collected in an external storage device such as a hard disk is shown. There is. External storage devices 22, 25, 2 are provided in each of the processing devices 20, 23, 27 and the maintenance base 2B.
9 and 2C are connected and an error log information file is stored. In FIG. 12, first, the error statistical information management table 4 in the error log information file to be collected in the external storage device 22, 25, 29, 2C such as the hard disk.
An initial setting process is performed for 2 (step 100). As the initial setting method, the item type 90, the device installation place 91, the device name 92, the unit name 93, the error counter name 94, and the error counter value 9 in the error statistics item of FIG.
5, the number of activations 96, the error occurrence number threshold 97, and the error occurrence rate threshold 98 are initialized according to the information configured by the corresponding peripheral device and unit. Among the above items, the error occurrence count threshold value 97 and the error occurrence rate threshold value 98 can be initialized or changed by a command from the host system.

【0015】次に、クライアント処理装置20、営業店
サ−バ処理装置23および統合サ−バ処理装置27にお
ける実行が、通常業務処理中であるか否かを判断する
(ステップ101)。通常業務処理中であれば、周辺装
置内ユニットに対して入出力起動命令を発行する毎に、
エラ−統計情報管理テ−ブル60の周辺装置内ユニット
に対応したエラ−統計項目内の起動回数96を更新する
(ステップ102)。次に、周辺装置内ユニットにおい
て障害を検知した時には(ステップ103)、回復可能
な障害であるか否かを判断する(ステップ104)。回
復可能な障害であれば、障害回復処理を実行する(ステ
ップ105)。次に、外部記憶装置内に採取した図4の
エラ−統計情報管理テ−ブル42の該当するエラ−統計
項目内のエラ−カウンタ95の値を1だけ更新する(ス
テップ106)。次に、障害回復処理時には、障害回復
が成功したか否かを判断する(ステップ107)。障害
回復が成功したならば、業務続行処理を行う(ステップ
109)。一方、障害回復が不成功のときには、障害回
復処理の再試行回数が規定回数をオ−バ−したか否かを
判断する(ステップ108)。障害回復処理の再試行回
数がオ−バ−していなければ、ステップ105に戻っ
て、再度、障害回復処理を実行する。
Next, it is judged whether or not the executions in the client processing device 20, the branch server processing device 23, and the integrated server processing device 27 are in the normal business process (step 101). If normal business processing is in progress, each time an I / O start-up command is issued to the peripheral unit,
The number of times of activation 96 in the error statistical item corresponding to the unit in the peripheral device of the error statistical information management table 60 is updated (step 102). Next, when a failure is detected in the peripheral device unit (step 103), it is determined whether or not the failure is a recoverable failure (step 104). If it is a recoverable failure, failure recovery processing is executed (step 105). Next, the value of the error counter 95 in the corresponding error statistical item of the error statistical information management table 42 of FIG. 4 collected in the external storage device is updated by 1 (step 106). Next, during failure recovery processing, it is determined whether failure recovery has succeeded (step 107). If the failure recovery is successful, business continuation processing is performed (step 109). On the other hand, when the failure recovery is unsuccessful, it is determined whether or not the number of retries of the failure recovery processing has exceeded the specified number (step 108). If the number of retries of the failure recovery processing is not over, the process returns to step 105 and the failure recovery processing is executed again.

【0016】障害回復処理の再試行回数が規定回数より
オ−バ−していたときには(ステップ108)、該当す
る周辺装置内ユニットは回復不能障害であるとみなし
て、図8に示す障害詳細項目内に項目種別80、装置設
置場所81、装置名称82、障害発生日付83、障害名
称84、障害コ−ド85、および障害詳細デ−タ86を
設定した後、外部記憶装置内の図5に示す障害詳細情報
管理テ−ブル50の障害詳細項目5Nの後に追加モ−ド
で次の各事項を書き込む。すなわち、障害詳細項目を設
定して外部記憶装置に採取し(ステップ110)、次に
縮退運用が可能であるか否かを判断し(ステップ11
1)、縮退運用が可能であれば、縮退運用に切り替える
処理を行う(ステップ112)。そして、最初の処理ス
テップ101に戻る(A)。また、縮退運用が不可能な
場合には、システムダウンの処理を行う(ステップ11
3)。なお、ステップ104において、当該周辺装置内
ユニットが回復不能障害であれば、直ちに障害詳細項目
を採取する(ステップ110)。
When the number of retries of the failure recovery processing is over the specified number of times (step 108), the relevant peripheral unit is regarded as an unrecoverable failure and the failure detail items shown in FIG. After setting the item type 80, the device installation location 81, the device name 82, the fault occurrence date 83, the fault name 84, the fault code 85, and the fault detailed data 86 in the external storage device, refer to FIG. The following items are written in the additional mode after the fault detail item 5N of the fault detailed information management table 50 shown. That is, the failure detail items are set and collected in the external storage device (step 110), and then it is determined whether or not degenerate operation is possible (step 11).
1) If degenerate operation is possible, a process for switching to degenerate operation is performed (step 112). Then, the process returns to the first processing step 101 (A). If degenerate operation is not possible, system down processing is performed (step 11).
3). In step 104, if the peripheral device unit is an unrecoverable failure, the failure detail item is immediately collected (step 110).

【0017】図13には、該当するクライアント処理装
置20が営業店サ−バ処理装置23から収集コマンドを
受信した後、そのクライアント処理装置20で採取され
た障害詳細情報およびエラ−統計情報を示すエラ−ログ
情報を営業店サ−バ23に送信する場合における処理装
置20内のプログラムの実行処理フロ−が示されてい
る。先ず、該当するクライアント処理装置20が営業店
サ−バ処理装置23から収集コマンドを受信すると(ス
テップ120)、処理装置20は採取された図5に示す
障害詳細情報管理テ−ブル50の中の全ての障害詳細項
目を営業店サ−バ処理装置23に送信する(ステップ1
21)。障害詳細項目の全てが終了した後、障害詳細情
報管理テ−ブル50をクリアする(ステップ122)。
次に、外部記憶装置22内に採取された図6に示すエラ
−統計情報管理テ−ブル60の中で、エラ−カウンタ9
5の値がエラ−発生件数閾値97を超えたエラ−統計項
目、または起動回数96をエラ−カウンタ95の値で割
算した値がエラ−発生率閾値98を超えたエラ−統計項
目だけを営業店サ−バ処理装置23に送信する(ステッ
プ123)。全ての送信を終了した後、エラ−統計情報
管理テ−ブル60をクリアする(ステップ124)。
FIG. 13 shows fault detail information and error statistical information collected by the client processing device 20 after the client processing device 20 receives the collection command from the sales office server processing device 23. The execution processing flow of the program in the processing device 20 when the error log information is transmitted to the sales office server 23 is shown. First, when the corresponding client processing device 20 receives a collection command from the sales office server processing device 23 (step 120), the processing device 20 extracts the failure detailed information management table 50 shown in FIG. All detail items of failure are transmitted to the sales office server processing device 23 (step 1).
21). After all the failure detail items have been completed, the failure detail information management table 50 is cleared (step 122).
Next, in the error statistical information management table 60 shown in FIG. 6 collected in the external storage device 22, the error counter 9
Only the error statistical item whose value of 5 exceeds the error occurrence threshold 97 or the error statistical item whose number of activations 96 divided by the value of the error counter 95 exceeds the error occurrence threshold 98 It is transmitted to the sales office server processing device 23 (step 123). After completing all the transmissions, the error statistical information management table 60 is cleared (step 124).

【0018】図14には、該当する営業店サ−バ処理装
置23が統合サ−バ処理装置27から収集コマンドを受
信した後、その営業店サ−バ処理装置23で採取した障
害詳細情報およびエラ−統計情報を示すエラ−ログ情報
またはその営業店サ−バ処理装置23の下位にあるクラ
イアント処理装置20より収集した障害詳細情報および
エラ−統計情報を示すエラ−ログ情報を統合サ−バ処理
装置27に送信する場合の処理装置23内のプログラム
実行動作フロ−が示されている。先ず、該当する営業店
サ−バ処理装置23は、統合サ−バ処理装置27から収
集コマンドを受信する(ステップ130)。次に、その
営業店サ−バ処理装置23で採取または収集された障害
詳細情報管理テ−ブル50を、統合サ−バ処理装置27
に送信する(ステップ131)。全ての送信を終了した
後、障害詳細情報管理テ−ブル50をクリアする(ステ
ップ132)。さらに、外部記憶装置内に採取または収
集されたエラ−統計情報管理テ−ブル60の中で、エラ
−カウンタ95の値がエラ−発生件数閾値97を超えた
エラ−統計項目、または起動回数96をエラ−カウンタ
95の値で割算した値がエラ−発生率閾値98を超えた
エラ−統計項目だけを、統合サ−バ処理装置27に送信
する(ステップ133)。全ての送信が終了した後、エ
ラ−統計情報管理テ−ブル90をクリアする(ステップ
134)。
FIG. 14 shows detailed fault information collected by the sales office server processing device 23 after the sales office server processing device 23 receives the collection command from the integrated server processing device 27. The error log information indicating the error statistical information or the failure detailed information collected from the client processing device 20 below the branch server processing device 23 and the error log information indicating the error statistical information are integrated into the server. A program execution operation flow in the processing device 23 when transmitting to the processing device 27 is shown. First, the corresponding sales office server processing device 23 receives a collection command from the integrated server processing device 27 (step 130). Next, the failure detailed information management table 50 collected or collected by the sales office server processing device 23 is transferred to the integrated server processing device 27.
(Step 131). After all the transmissions have been completed, the fault detailed information management table 50 is cleared (step 132). Further, in the error statistical information management table 60 collected or collected in the external storage device, the error statistical item in which the value of the error counter 95 exceeds the error occurrence number threshold value 97, or the number of activations 96 Is divided by the value of the error counter 95 and exceeds the error occurrence rate threshold 98, only the error statistical items are transmitted to the integrated server processing device 27 (step 133). After all transmission is completed, the error statistical information management table 90 is cleared (step 134).

【0019】図15には、営業店サ−バ処理装置23か
らの収集コマンドに従い、下位にある全てのクライアン
ト処理装置20に採取されたエラ−ログ情報を受信する
場合における処理装置23内のプログラム実行処理フロ
−が示されている。先ず、営業店サ−バ処理装置23の
入力装置24から収集コマンドが入力されると、処理装
置23は、そのコマンドに従って下位にある全てのクラ
イアント処理装置20に採取された障害詳細情報管理テ
−ブル50およびエラ−統計情報管理テ−ブル60の収
集指示を送信する(ステップ140)。下位にある全て
のクライアント処理装置20から障害詳細情報管理テ−
ブル50およびエラ−統計情報管理テ−ブル60を受信
して、これらを外部記憶装置25に書き込む(ステップ
141)。上記テ−ブル50,60の全ての受信が終了
すると、営業店サ−バ処理装置23は、次に障害詳細情
報管理テ−ブル50およびエラ−統計情報管理テ−ブル
60に設定された属性情報に従って編集を行い、図10
に示す障害発生推移リストおよび図11に示すエラ−統
計情報における異常値リストを作成する(ステップ14
2)。次に、これらのリストを出力装置26に出力する
(ステップ143)。
FIG. 15 shows a program in the processing device 23 when receiving the error log information collected by all the client processing devices 20 in the lower order according to the collection command from the sales office server processing device 23. The execution process flow is shown. First, when a collection command is input from the input device 24 of the branch server processing device 23, the processing device 23 causes the failure detailed information management table collected in all the client processing devices 20 below to follow the command. An instruction to collect the bull 50 and the error statistical information management table 60 is transmitted (step 140). Fault detail information management tables are sent from all the client processing devices 20 in the lower order.
The cable 50 and the error statistical information management table 60 are received and written in the external storage device 25 (step 141). When all of the above-mentioned tables 50 and 60 have been received, the branch server processing device 23 next sets the attributes set in the fault detailed information management table 50 and the error statistical information management table 60. Editing according to the information,
The failure occurrence transition list shown in FIG. 11 and the abnormal value list in the error statistical information shown in FIG. 11 are created (step 14
2). Next, these lists are output to the output device 26 (step 143).

【0020】図16には、統合サ−バ処理装置27から
の収集コマンドに従って、下位にある全ての営業店サ−
バ処理装置23に採取または収集されたエラ−ログ情報
を受信する場合における処理装置27のプログラム実行
処理フロ−が示されている。先ず、統合サ−バ処理装置
27の入力装置28から収集コマンドが入力されると、
処理装置27は、下位にある全ての営業店サ−バ処理装
置23に採取または収集された障害詳細情報管理テ−ブ
ル50およびエラ−統計情報管理テ−ブル60の収集指
示を送信する(ステップ150)。次に、処理装置27
は、下位の全ての営業店サ−バ処理装置23から障害詳
細情報管理テ−ブル50およびエラ−統計情報管理テ−
ブル60を受信して、これらを外部記憶装置29に書き
込む(ステップ151)。全ての受信が終了すると、障
害詳細情報管理テ−ブル50およびエラ−統計情報管理
テ−ブル60に設定された属性情報に従って編集し、図
10に示す障害発生推移リストおよび図11に示すエラ
−統計情報における異常値リストを作成する(ステップ
152)。これらのリストを出力装置2Aに出力する
(ステップ153)。次に、処理装置27は、外部記憶
装置29に書き込まれた障害詳細情報管理テ−ブル50
およびエラ−統計情報管理テ−ブル60を定期的、例え
ば毎日、周毎、月単位に読み出して、保守拠点毎に分類
し、これらを保守端末に転送する(ステップ154)。
In FIG. 16, according to the collection command from the integrated server processing unit 27, all the subordinate sales office servers are displayed.
The program execution processing flow of the processing device 27 when the error log information collected or collected by the processing device 23 is received is shown. First, when a collecting command is input from the input device 28 of the integrated server processing device 27,
The processing device 27 sends a collection instruction of the fault detailed information management table 50 and the error statistical information management table 60 collected or collected to all the branch office server processing devices 23 (step). 150). Next, the processing device 27
Is the fault detailed information management table 50 and the error statistical information management table from all the subordinate server server processing devices 23.
Bull 60 is received and these are written in the external storage device 29 (step 151). When all the reception is completed, it is edited according to the attribute information set in the fault detailed information management table 50 and the error statistical information management table 60, and the fault occurrence transition list shown in FIG. 10 and the error shown in FIG. An abnormal value list in the statistical information is created (step 152). These lists are output to the output device 2A (step 153). Next, the processing device 27 causes the fault detailed information management table 50 written in the external storage device 29.
Also, the error statistical information management table 60 is read out periodically, for example, on a daily, weekly or monthly basis, classified by maintenance base, and transferred to the maintenance terminal (step 154).

【0021】図17には、統合サ−バ処理装置27から
転送された障害詳細情報管理テ−ブル50エラ−統計情
報管理テ−ブル60を編集して、リスト出力する場合の
保守拠点における処理装置2B内のプログラム実行処理
フロ−が示される。処理装置2Bは、統合サ−バ処理装
置27から定期的(毎日、周毎、月単位)に転送された
障害詳細情報管理テ−ブル50およびエラ−統計情報管
理テ−ブル60を受信して、これらを外部記憶装置2C
に書き込む(ステップ160)。全ての受信が終了する
と、障害詳細情報管理テ−ブル50およびエラ−統計情
報管理テ−ブル60に設定された属性情報に従って編集
し、図10に示す障害発生推移リストおよび図11に示
すエラ−統計情報における異常値リストを作成する(ス
テップ161)。それらのリストを出力装置2Dに出力
する(ステップ162)。一定の期間経過の後、外部記
憶装置2Cに書き込まれた障害詳細情報管理テ−ブル5
0およびエラ−統計情報管理テ−ブル60をクリアする
(ステップ163)。
FIG. 17 shows the processing at the maintenance base when the detailed error information management table 50 and the statistical information management table 60 transferred from the integrated server processing device 27 are edited and output as a list. A program execution process flow in the device 2B is shown. The processing unit 2B receives the fault detailed information management table 50 and the error statistical information management table 60 which are periodically (daily, weekly, monthly) transferred from the integrated server processing unit 27. , These are external storage devices 2C
(Step 160). When all the reception is completed, it is edited according to the attribute information set in the fault detailed information management table 50 and the error statistical information management table 60, and the fault occurrence transition list shown in FIG. 10 and the error shown in FIG. An abnormal value list in the statistical information is created (step 161). The list is output to the output device 2D (step 162). After a certain period of time has passed, the detailed fault information management table 5 written in the external storage device 2C is displayed.
0 and the error statistical information management table 60 are cleared (step 163).

【0022】[0022]

【発明の効果】以上説明したように、本発明によれば、
クライアントサ−バシステム等の階層関係にある分散シ
ステムの各種周辺装置に発生したエラ−ログ情報を定量
的に管理することができるので、この情報をフィ−ドバ
ックデ−タとして有効に活用すると同時に、均一で効率
的な障害対策および日常点検、定期点検、異常の事前検
知等の予防保守を行うことが可能となる。
As described above, according to the present invention,
Since it is possible to quantitatively manage error log information generated in various peripheral devices of a distributed system having a hierarchical relationship such as a client server system, at the same time effectively utilizing this information as feedback data, It is possible to carry out uniform and efficient fault countermeasures and preventive maintenance such as daily inspections, periodic inspections, and prior detection of abnormalities.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示すクライアントサ−バシ
ステムの構成の一部を示す図である。
FIG. 1 is a diagram showing a part of a configuration of a client server system showing an embodiment of the present invention.

【図2】同じく、クライアントサ−バシステムの構成の
他の一部を示す図である。
FIG. 2 is a diagram showing another part of the configuration of the client server system.

【図3】図1,図2におけるエラ−ログ情報の採取/収
集/編集/転送の各動作を示す説明図である。
FIG. 3 is an explanatory diagram showing each operation of collecting / collecting / editing / transferring error log information in FIGS. 1 and 2;

【図4】図1,図2,図3における外部記憶装置に記録
されるエラ−ログ情報ファイルの要部フォ−マット図で
ある。
FIG. 4 is a main part format diagram of an error log information file recorded in the external storage device in FIGS. 1, 2 and 3.

【図5】図4における障害詳細情報管理テ−ブルおよび
属性情報テ−ブルのフォ−マット図である。
5 is a format diagram of a fault detailed information management table and an attribute information table in FIG.

【図6】図4におけるエラ−統計情報管理テ−ブルおよ
び属性情報テ−ブルのフォ−マット図である。
6 is a format diagram of an error statistical information management table and an attribute information table in FIG.

【図7】図5,図6におけるプリミティブな属性情報の
形式を示す図である。
FIG. 7 is a diagram showing a format of primitive attribute information in FIGS. 5 and 6;

【図8】図5における属性情報テ−ブルを具体的にマッ
ピングした場合の障害詳細項目のフォ−マット図であ
る。
8 is a format diagram of fault detail items when the attribute information table in FIG. 5 is specifically mapped.

【図9】図6における属性情報テ−ブルを具体的にマッ
ピングした場合のエラ−統計項目のフォ−マット図であ
る。
9 is a format diagram of error statistical items when the attribute information table in FIG. 6 is specifically mapped.

【図10】図3における障害発生推移リストの出力フォ
−マット図である。
10 is an output format diagram of the failure occurrence transition list in FIG.

【図11】図3におけるエラ−統計情報の異常値リスト
の出力フォ−マット図である。
11 is an output format diagram of an abnormal value list of error statistical information in FIG.

【図12】図1,図2における各処理装置のプログラム
実行処理フロ−チャ−トである。
FIG. 12 is a program execution processing flowchart of each processing apparatus in FIGS. 1 and 2;

【図13】図1,図2において、クライアントで採取さ
れた障害詳細情報およびエラ−ログ情報を営業店サ−バ
に送信する場合のクライアント処理装置のプログラム実
行処理フロ−チャ−トである。
FIG. 13 is a program execution processing flowchart of the client processing device in the case of transmitting the fault detail information and the error log information collected by the client in FIGS. 1 and 2 to the sales office server.

【図14】図1,図2において、営業店サ−バで採取ま
たは収集された障害詳細情報およびエラ−ログ情報を統
合サ−バに送信する場合の営業店サ−バ処理装置のプロ
グラム実行処理フロ−チャ−トである。
FIG. 14 is a program execution of the sales office server processing device in the case of transmitting the fault detail information and error log information collected or collected by the sales office server to the integrated server in FIGS. It is a processing flow chart.

【図15】図1,図2において、クライアントに採取さ
れたエラ−ログ情報を受信する場合の営業店サ−バ処理
装置のプログラム実行処理フロ−チャ−トである。
FIG. 15 is a program execution processing flowchart of the sales office server processing apparatus when receiving the error log information collected by the client in FIGS. 1 and 2;

【図16】図1,図2において、営業店サ−バに採取ま
たは収集されたエラ−ログ情報を受信する場合の統合サ
−バ処理装置のプログラム実行処理フロ−チャ−トであ
る。
16 is a program execution processing flowchart of the integrated server processing device when receiving the error log information collected or collected by the sales office server in FIG. 1 and FIG.

【図17】図1,図2において、統合サ−バから転送さ
れた障害詳細情報管理テ−ブルおよびエラ−統計情報管
理テ−ブルを編集し、リスト出力する場合の保守拠点の
処理装置のプログラム実行処理フロ−チャ−トである。
FIG. 17 is a diagram showing a processing unit of a maintenance base in the case of editing the failure detailed information management table and error statistical information management table transferred from the integrated server and outputting the list in FIGS. It is a program execution processing flowchart.

【符号の説明】[Explanation of symbols]

20,30 クライアント処理装置 23,31 営業店サ−バ処理装置 27,32 統合サ−バ処理装置 2B,33 保守端末処理装置 21 周辺装置 22,25,29,2C 外部記憶装置 26,2A,2D 出力装置 24,28 入力装置 40 エラ−ログ情報ファイル 41,50 障害詳細情報管理テ−ブル 42,60 エラ−統計情報管理テ−ブル 51〜5N 障害詳細項目 91〜9N エラ−統計項目 510 属性情報テ−ブル 511〜51M 属性情報 610〜61M 属性情報 70 属性識別子 71 デ−タ長 72 属性情報取り得る値 80 障害詳細項目を表す項目種別 81,91 装置設置場所 82 装置名称 83 障害発生日付 84,92 障害名称 85 障害コ−ド 86 障害詳細デ−タ 90 エラ−統計項目を表す項目種別 93 ユニット名称 94 エラ−カウンタ名称 95 エラ−カウンタ値 96 起動回数 97 エラ−発生件数閾値 98 エラ−発生率閾値 20, 30 Client processing device 23, 31 Sales office server processing device 27, 32 Integrated server processing device 2B, 33 Maintenance terminal processing device 21 Peripheral device 22, 25, 29, 2C External storage device 26, 2A, 2D Output device 24,28 Input device 40 Error log information file 41,50 Fault detailed information management table 42,60 Error statistical information management table 51-5N Fault detailed item 91-9N Error statistical item 510 Attribute information Table 511-51M Attribute information 610-61M Attribute information 70 Attribute identifier 71 Data length 72 Attribute information possible values 80 Item type indicating detailed fault items 81, 91 Device installation location 82 Device name 83 Fault occurrence date 84, 92 Fault name 85 Fault code 86 Fault detailed data 90 Error item type indicating statistical items 93 Unit Name 94 Error counter name 95 Error counter value 96 Number of startups 97 Threshold number of error occurrences 98 Threshold value of error occurrence rate

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 それぞれ外部記憶装置、入出力装置等の
周辺装置を接続したクライアント、該クライアントを管
理する複数の営業店サ−バおよび該営業店サ−バを一元
管理する統合サ−バ、ならびに該統合サ−バに接続され
た保守拠点の複数階層からなるクライアントサ−バシス
テムにおいて、 各階層の周辺装置内ユニット毎に採取されるハ−ドウェ
ア障害の障害詳細情報およびエラ−統計情報を示すエラ
−ログ情報を接続された外部記憶装置の特定エリアに記
録し、記録された情報を定期的に読み出して、上位のサ
−バに順次送信することにより、上位サ−バに情報を一
括して収集した後、編集を行って見易くし、障害詳細情
報の障害発生推移リストおよびエラ−統計情報の閾値を
超えた時の異常値リストを上位のサ−バの出力装置に出
力するとともに、上記統合サ−バに収集されたエラ−ロ
グ情報を保守拠点の端末に転送した後、編集した保守用
リストを保守端末の出力装置に出力することにより、該
保守用リストをフィ−ドバックデ−タとして各周辺装置
に活用することを特徴とするエラ−ログ情報管理方法。
1. A client to which peripheral devices such as an external storage device and an input / output device are respectively connected, a plurality of business office servers that manage the clients, and an integrated server that centrally manages the business office servers, In addition, in the client server system including a plurality of layers of maintenance bases connected to the integrated server, detailed error information and error statistical information of the hardware error collected for each unit in the peripheral device of each layer are displayed. The error log information shown is recorded in a specific area of the connected external storage device, and the recorded information is read out periodically and sequentially transmitted to the upper server, so that the information can be collectively sent to the upper server. After collecting the data, edit it to make it easier to see, and output the failure occurrence transition list of the detailed error information and the abnormal value list when the threshold of the error statistical information is exceeded to the output device of the upper server. At the same time, the error log information collected by the integrated server is transferred to the terminal at the maintenance base, and the edited maintenance list is output to the output device of the maintenance terminal to save the maintenance list. An error log information management method characterized in that it is used as feedback data for each peripheral device.
JP5164509A 1993-07-02 1993-07-02 Erroneous log information managing method Pending JPH0721059A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5164509A JPH0721059A (en) 1993-07-02 1993-07-02 Erroneous log information managing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5164509A JPH0721059A (en) 1993-07-02 1993-07-02 Erroneous log information managing method

Publications (1)

Publication Number Publication Date
JPH0721059A true JPH0721059A (en) 1995-01-24

Family

ID=15794517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5164509A Pending JPH0721059A (en) 1993-07-02 1993-07-02 Erroneous log information managing method

Country Status (1)

Country Link
JP (1) JPH0721059A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058395A (en) * 2001-06-04 2003-02-28 Sony Computer Entertainment Inc Log collecting/analyzing system, log collecting method, log collecting program for making computer perform, log analyzing method, log analyzing program for making computer perform, log collecting device, log analyzing device, log collecting terminal and log server
JP2003131905A (en) * 2001-10-26 2003-05-09 Sitecare Kk Management server system
JP2006318123A (en) * 2005-05-11 2006-11-24 Canon Inc Log information management device, log information generation device, document management system, log information management method, log information transmission method and program
JP2008059413A (en) * 2006-09-01 2008-03-13 Hitachi Electronics Service Co Ltd Failure management support system and its information management method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058395A (en) * 2001-06-04 2003-02-28 Sony Computer Entertainment Inc Log collecting/analyzing system, log collecting method, log collecting program for making computer perform, log analyzing method, log analyzing program for making computer perform, log collecting device, log analyzing device, log collecting terminal and log server
US7558820B2 (en) 2001-06-04 2009-07-07 Sony Computer Entertainment Inc. Log collecting/analyzing system with separated functions of collecting log information and analyzing the same
US8090771B2 (en) 2001-06-04 2012-01-03 Sony Computer Entertainment Inc. Log collecting/analyzing system with separated functions of collecting log information and analyzing the same
JP2003131905A (en) * 2001-10-26 2003-05-09 Sitecare Kk Management server system
JP2006318123A (en) * 2005-05-11 2006-11-24 Canon Inc Log information management device, log information generation device, document management system, log information management method, log information transmission method and program
JP2008059413A (en) * 2006-09-01 2008-03-13 Hitachi Electronics Service Co Ltd Failure management support system and its information management method

Similar Documents

Publication Publication Date Title
US7457872B2 (en) On-line service/application monitoring and reporting system
US7379999B1 (en) On-line service/application monitoring and reporting system
US7536291B1 (en) System and method to support simulated storage operations
US7506195B2 (en) Operation management method and operation management server
CN1983153B (en) Method for carrying long-distance copy in data processing system and method of storing data
US6886020B1 (en) Method and apparatus for storage system metrics management and archive
CN101315558B (en) Apparatus and methods to access information associated with a process control system
US6347335B1 (en) System using a common and local event logs for logging event information generated by plurality of devices for determining problem in storage access operations
US20030195875A1 (en) Information management structure
US9411969B2 (en) System and method of assessing data protection status of data protection resources
CN102473129A (en) Management system for outputting information denoting recovery method corresponding to root cause of failure
JP2003186564A (en) Storage resource measuring system
CN103339612A (en) Dependability maintenance device, dependability maintenance system, malfunction supporting system, method for controlling dependability maintenance device, control program, computer readable recording medium recording control program
US20050166091A1 (en) Transaction processing
US5128885A (en) Method for automatic generation of document history log exception reports in a data processing system
US7594238B2 (en) Apparatus and method for displaying plurality of messages in groups to reduce burden on operators
US20040078376A1 (en) Method for displaying the amount of storage use
US8793371B1 (en) Common configuration warehouse for a storage system
US10169158B2 (en) Apparatus, system and method for data collection, import and modeling
JPH0721059A (en) Erroneous log information managing method
US20220035359A1 (en) System and method for determining manufacturing plant topology and fault propagation information
Dell
JP2018106492A (en) Event information visualization device, program and method
Varga Challenges of Data Management in Always-On Enterprise Information Systems
CN101364224A (en) Information management system and method