JP2003296141A - 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末 - Google Patents

障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末

Info

Publication number
JP2003296141A
JP2003296141A JP2002094090A JP2002094090A JP2003296141A JP 2003296141 A JP2003296141 A JP 2003296141A JP 2002094090 A JP2002094090 A JP 2002094090A JP 2002094090 A JP2002094090 A JP 2002094090A JP 2003296141 A JP2003296141 A JP 2003296141A
Authority
JP
Japan
Prior art keywords
information
preventive maintenance
script
failure
host computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002094090A
Other languages
English (en)
Inventor
Shoji Matsuuchi
将司 松内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002094090A priority Critical patent/JP2003296141A/ja
Publication of JP2003296141A publication Critical patent/JP2003296141A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 多店舗に展開した各店舗における店舗端末
が、近い将来に、危険又は異常状態に陥ることを事前に
防止することを可能とする。 【解決手段】 データベース情報及び発生したエラーの
情報を予防保守情報として記憶し、ホストコンピュータ
からの要求に応じて、この予防保守情報をホストコンピ
ュータに送信するとともに、ホストコンピュータからの
指示に従って対処処理を実行する店舗端末と、店舗端末
から予防保守情報を集信して分析し、この分析結果に対
応するスクリプトを対処スクリプトファイルから抽出し
て、スクリプトにもとづき店舗端末に対処処理を実行さ
せるホストコンピュータと、店舗端末及びホストコンピ
ュータを接続する通信回線とを有する障害事前検知シス
テム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信回線を介し
て、複数の店舗端末の予防保守情報をホストコンピュー
タが集信し、この予防保守情報にもとづいて、店舗端末
に対処処理を実行させる障害事前検知システム、障害事
前検知方法、障害事前検知サーバ及び障害事前検知端末
に関する。
【0002】
【従来の技術】近年、多店舗展開を行う企業などにおい
ては、本部と各店舗をVPN(Virtual Pri
vate Network)やWAN(Wide Ar
eaNetwork)等で接続することにより、各店舗
を管理することが広く行われている。そして、このよう
な多店舗展開システムに関し、従来、各店舗端末を低コ
ストで効率的に管理する方法などが検討されている。
【0003】このような状況において、例えば、特開2
000−242864号公報には、全ての店舗の稼働状
況を記すログデータなどを本部で集信して一元管理する
システム等が開示されている。このシステム等によれ
ば、本部における情報処理装置が、店舗端末の異常を示
すログを集信した場合などに、管理者にそのメッセージ
を通知して、迅速な対処を実現することが可能とされて
いる。さらに、本部から各店舗に配信されたデータが、
どのユーザに視聴されたかを一元管理することも可能と
されている。
【0004】また、特開平5−342126号公報に
は、集中保守センタによって、各店舗におけるコンピュ
ータのハードウェア障害状況、ハードウェア障害予知情
報等を管理するシステム構築方式が開示されている。そ
して、各店舗における上記障害などの情報を担当部門に
通報することにより、上記障害に対処するとされてい
る。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
方式など従来の技術によっては、各店舗におけるハード
ウェアに関する障害のみならず、システムに関する障害
をも含めて、これらを事前に検知し、回避することを十
分に行うことのできるのもではなかった。すなわち、特
にシステムに関する障害については、動作するアプリケ
ーションが既に障害に陥った場合に、これを管理者等に
緊急通知し、対処するものであり、事前に効果的に回避
可能なものではなかった。このため、本来24時間稼働
が望ましい店舗端末について、システム運用停止状態が
生じることがあるとともに、その障害発生後の対処につ
いても、人手を介するものであったため、運用コストが
多くかかるものであった。
【0006】本発明は、上記の事情にかんがみなされた
ものであり、通信回線を介して、複数の店舗端末の予防
保守情報をホストコンピュータが集信し、この予防保守
情報にもとづいて、店舗端末に対処処理を実行させるこ
とのできる障害事前検知システム、障害事前検知方法、
障害事前検知サーバ及び障害事前検知端末の提供を目的
とする。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明の請求項1記載の障害事前検知システムは、
通信回線を介し、複数の店舗端末がそれぞれ有する予防
保守情報に応じた対処処理を、ホストコンピュータが店
舗端末に実行させる障害事前検知システムであって、デ
ータベース情報及び発生したエラーの情報を予防保守情
報として記憶し、ホストコンピュータからの要求に応じ
て、この予防保守情報をホストコンピュータに送信する
とともに、ホストコンピュータからの指示に従って対処
処理を実行する店舗端末と、店舗端末から予防保守情報
を集信して分析し、この分析結果に対応するスクリプト
を対処スクリプトファイルから抽出して、スクリプトに
もとづき店舗端末に対処処理を実行させるホストコンピ
ュータと、店舗端末及びホストコンピュータを接続する
通信回線とを有する構成としてある。
【0008】障害事前検知システムをこのような構成に
すれば、店舗端末の利用者(以下、単に利用者と称す
る。)は、近い将来に、店舗端末が危険状態又は異常状
態に陥ることを事前に防止することが可能となる。すな
わち、店舗端末におけるデータベース等の状態を予防保
守情報として店舗端末が取得し、これをホストコンピュ
ータが集信・分析して、その結果にもとづき店舗端末に
対処を実施させることにより、上記状態の発生原因を取
り除くことが可能となる。
【0009】本発明の請求項2記載の障害事前検知シス
テムは、通信回線を介し、複数の店舗端末においてそれ
ぞれ記憶された対処履歴情報にもとづいて、ホストコン
ピュータが障害未対処通知を管理者端末に送信する障害
事前検知システムであって、データベース情報及び発生
したエラーの情報を予防保守情報として記憶するととも
に分析し、この分析結果に対応するスクリプトを対処ス
クリプトファイルから抽出して、スクリプトにもとづき
対処処理を実行し、かつ、この実行結果及び、対応する
スクリプトが対処スクリプトファイルに存在しない分析
結果を対処履歴情報として記憶する店舗端末と、店舗端
末から対処履歴情報を集信し、この対処履歴情報にもと
づいて、対応するスクリプトが対処スクリプトファイル
に存在しない分析結果についての障害未対処通知を、管
理者端末に送信するホストコンピュータと、店舗端末及
びホストコンピュータを接続する通信回線とを有する構
成としてある。
【0010】障害事前検知システムをこのような構成に
すれば、店舗端末が、そのデータベースやアプリケーシ
ョンの稼働状態を分析し、この分析結果にもとづいてホ
ストコンピュータから対処スクリプトを受信して、自動
対処処理を行うことが可能となる。また、ホストコンピ
ュータは、店舗端末における対処履歴を集信し、対処で
きなかった障害などについては、これを管理者に通知す
ることが可能となる。
【0011】このようにすることによって、対処スクリ
プトファイルに登録されているスクリプトによって、対
処することの可能な障害については、自動的に対処処理
を実行することができ、対処が実行不可能であった場合
にのみ人手を介して処理することが可能となる。
【0012】もちろん、システム運用当初は、その対処
方法についてのノウハウは限られていると考えらるた
め、人手による対処が必要な場合が多く発生することが
予想される。しかし、その対処方法が確立された後は、
その対処方法をスクリプト化し、自動実行可能な形にし
て対処スクリプトに登録しておくことにより、同じケー
スに対して、何度も人手による対処を実行する必要をな
くすことができる。
【0013】なお、「エラー」とは、システムにおいて
設定されているシステムの状況を指摘するものであり、
軽度の操作ミスなどを指摘するものから、直接システム
等の障害につながるものまで、幅広く含むものである。
これに対し、「障害」とは、所定の復旧作業を必要とす
る状態を指すものであり、障害につながる状態を含むも
のとして用いている。また、「障害未対処通知」は、適
切なスクリプトが存在しない場合のみならず、スクリプ
トを実行したが、その対処が成功しなかったものについ
ての情報も含めることができる。
【0014】本発明の請求項3記載の障害事前検知シス
テムは、あらかじめデータベース情報及びエラー情報ご
とに所定の閾値を設定し、予防保守情報の分析の結果、
閾値を超えると判定された予防保守情報について、対処
処理を実行する構成としてある。
【0015】障害事前検知システムをこのような構成に
すれば、近い将来に、店舗端末が危険状態又は異常状態
に陥ることを効果的かつ正確に把握することが可能とな
る。ここで、閾値とは、例えば、所定のエラーコードに
対する所定の発生回数などを意味する。また、数値情報
の返却を伴うエラーコードの場合には、その数値に対す
る所定の値などを意味する。さらに、データベース情報
における残容量やデータ断片化情報などに対して所定の
閾値を設定し、それよりも残容量が少なくなった場合
や、データ断片化が進んだ場合に、データベースの容量
拡張や、マスタの再構築等、適切な処理を実行させるよ
うにすることもできる。
【0016】このような閾値は、障害事前検知をどの程
度の厳しさで実行するかなどの条件に応じて、適宜設定
することができる。そして、その設定された所定の閾値
を超える状況が発生した場合に、店舗端末に対処処理を
実行させることが可能となる。なお、「閾値を超える」
とは、所定の値より大きい値となる場合や、その値以上
となる場合、あるいは、所定の値より小さくなる場合
や、その値以下となる場合のいずれの場合も含むものと
して用いている。
【0017】本発明の請求項4記載の障害事前検知方法
は、通信回線を介し、複数の店舗端末がそれぞれ有する
予防保守情報に応じた対処処理を、ホストコンピュータ
が店舗端末に実行させる障害事前検知方法であって、店
舗端末が、データベース情報及び発生したエラーの情報
を予防保守情報として記憶し、ホストコンピュータが、
店舗端末から予防保守情報を集信して分析し、この分析
結果に対応するスクリプトを対処スクリプトファイルか
ら抽出して、スクリプトにもとづき店舗端末に対処処理
を実行させる方法としてある。
【0018】障害事前検知方法をこのような方法にすれ
ば、店舗端末における予防保守情報にもとづいて、ホス
トコンピュータが障害事前検知のための分析を行い、店
舗端末に障害がある場合(障害が発生するおそれがある
場合を含む。)には、その対処処理を店舗端末に実行さ
せることが可能となる。
【0019】本発明の請求項5記載の障害事前検知方法
は、通信回線を介し、複数の店舗端末においてそれぞれ
記憶された対処履歴情報にもとづいて、ホストコンピュ
ータが障害未対処通知を管理者端末に送信する障害事前
検知方法であって、店舗端末が、データベース情報及び
発生したエラーの情報を予防保守情報として記憶すると
ともに分析し、この分析結果に対応するスクリプトを対
処スクリプトファイルから抽出して、スクリプトにもと
づき対処処理を実行し、かつ、この実行結果及び、対応
するスクリプトが対処スクリプトファイルに存在しない
分析結果を対処履歴情報として記憶し、ホストコンピュ
ータが、店舗端末から対処履歴情報を集信し、この対処
履歴情報にもとづいて、対応するスクリプトが対処スク
リプトファイルに存在しない分析結果についての障害未
対処通知を、管理者端末に送信する方法としてある。
【0020】障害事前検知方法をこのような方法にすれ
ば、店舗端末に障害がある場合(障害が発生するおそれ
がある場合を含む。)に、店舗端末が、ホストコンピュ
ータから適切なスクリプトを受信して、対処処理を実行
することが可能となるとともに、対処することができな
かった障害については、管理者に通知することが可能と
なる。
【0021】本発明の請求項6記載の障害事前検知サー
バは、通信回線を介し、複数の店舗端末から予防保守情
報を集信して、この予防保守情報にもとづき対応する店
舗端末に対処処理を実行させる障害事前検知サーバであ
って、店舗端末においてデータベース情報及び発生した
エラーの情報にもとづき作成された予防保守情報を集信
し、予防保守情報集信ファイルを作成する集信処理部
と、予防保守情報集信ファイルの情報を分析し、分析結
果ファイルを作成する予防保守情報分析処理部と、分析
結果ファイルの情報に対応するスクリプトを対処スクリ
プトファイルから抽出するとともに、スクリプトにもと
づいて、店舗端末に対処処理を実行させる店舗対処処理
部を有する構成としてある。
【0022】障害事前検知サーバをこのような構成にす
れば、複数の店舗端末からエラー情報等を有する予防保
守情報を受信して、これを分析し、適切な対処スクリプ
トを店舗端末に実行させることによって、店舗端末が近
い将来、危険状態などに陥る可能性を事前に排除するこ
とが可能となる。
【0023】本発明の請求項7記載の障害事前検知端末
は、通信回線を介し、ホストコンピュータの要求に応じ
て、予防保守情報を送信し、ホストコンピュータからの
予防保守情報の分析結果にもとづく指示に従って対処処
理を行う障害事前検知端末であって、データベース情報
及び発生したエラーの情報を予防保守情報として記憶す
る予防保守情報取得処理部と、ホストコンピュータから
の指示に従って対処処理を実行する対処処理部を有する
構成としてある。
【0024】障害事前検知端末をこのような構成にすれ
ば、この端末において発生したエラー情報等を予防保守
情報として管理することによって、ホストコンピュータ
からの集信処理を受けるとともに、必要に応じて、対処
処理の実行命令を受け、これを実行することによって、
障害の発生を事前に防止することが可能となる。
【0025】
【発明の実施の形態】以下、本発明の実施形態につき、
図面を参照して説明する。 [第一実施形態]まず、本発明の第一実施形態につい
て、図1及び図2を参照して説明する。図1は、本発明
の第一実施形態の障害事前検知システムの構成を示すブ
ロック図である。また、図2は、この障害事前検知シス
テムにおける店舗端末10及びホストコンピュータ20
の構成を示すブロック図である。
【0026】図1に示すように、障害事前検知システム
は、店舗端末(障害事前検知端末)10(10−1,1
0−2〜10−n)、ホストコンピュータ(障害事前検
知サーバ)20、及び通信回線40を有している。店舗
端末10は、各店舗において使用される端末であり、例
えば、24時間稼働し、重大障害時以外にはその運用を
停止することのできない端末である。
【0027】この店舗端末10としては、ワークステー
ションやサーバ等を用いることができる。また、パーソ
ナルコンピュータ、ノート型パソコン等を用いてもよ
い。また、店舗端末10は、図2に示すようにデータベ
ース操作処理部10a、データベース10b、予防保守
情報取得処理部10c、予防保守情報ファイル10d及
び対処処理部10eを有している。
【0028】データベース操作処理部10aは、データ
ベース10bに対する処理を実行する処理部の総称であ
り、レコードの参照や、挿入、更新、削除等の処理を実
行する。この処理は、日々数百回、数千回発生する場合
もある。データベース10bは、店舗端末10における
各種データベースの総称である。
【0029】予防保守情報取得処理部10cは、データ
ベース情報や、データベース操作処理によって発生した
エラーの情報(以降、エラー情報と称する。また、単に
エラー情報という場合は、データベース操作以外の処理
によって発生したエラーの情報を含むものとする。)を
予防保守情報ファイル10dに保存し、蓄積する。この
データベース情報とは、データベースの全体容量、残容
量、データ断片化情報などのデータベースの状態を示す
情報のことである。
【0030】また、上記のエラー情報とは、エラーコー
ドなどを意味しており、予防保守情報ファイル10dに
は、その発生した回数も把握可能なように記録される。
この予防保守情報取得処理部10cの処理は、所定のタ
イミングで、例えば、毎日一定時刻に起動し、実行する
ことができる。対処処理部10eは、ホストコンピュー
タ20の要求に応じて、発生した障害や、発生するおそ
れがある障害に対する対処処理を実行する。
【0031】ホストコンピュータ20は、各店舗端末1
0の状態を監視し、店舗端末10が危険又は異常状態に
なった場合に、自動的にその復旧を行うものである。す
なわち、ホストコンピュータ20は、各店舗端末10か
ら予防保守情報を集信して分析し、対応する対処処理を
店舗端末10に実行させる。このホストコンピュータ2
0としては、大型汎用機や、ワークステーション、サー
バ等を用いることができる。
【0032】ホストコンピュータ20は、図2に示すよ
うに集信処理部20a、予防保守情報集信ファイル20
b、予防保守情報分析処理部20c、閾値判定テーブル
20d、分析結果ファイル20e、店舗対処処理部20
f及び対処スクリプトファイル20gを有している。
【0033】集信処理部20aは、店舗端末10の予防
保守情報ファイル10dの情報を受信し、これを予防保
守情報集信ファイル20bに記録する。この集信処理部
20aの処理も、所定のタイミングで、例えば、毎日一
定時刻に起動し、実行することができる。
【0034】予防保守情報分析処理部20cは、予防保
守情報集信ファイル20bのデータにもとづいて、対処
処理の実行を行うか否かの判定や、対処処理を実行する
場合には、どの対処スクリプトを用いるかの決定を行
う。このとき、予防保守情報分析処理部20cは、閾値
判定テーブル20dから、その判定に必要な情報を入力
して参照し、判定や決定を行う。
【0035】この閾値判定テーブル20dには、全デー
タベース10bの全体容量、残容量、データ断片化状態
及び一時的障害発生エラーコード別の発生回数について
の閾値情報や、致命的な障害に関する発生エラーコード
別の閾値情報等が記録されている。また、それぞれのエ
ラーコードに対応する対処スクリプト名などの情報も有
している。
【0036】そして、予防保守情報分析処理部20c
は、予防保守情報集信ファイル20bの情報について、
上記閾値と比較を行い、所定の閾値を超える場合など、
対処が必要と判定される場合には、その対処項目名やエ
ラーコード等の情報を分析結果ファイル20eに出力す
る。
【0037】この対処項目とは、例えば、上記の残容量
やデータ断片化状態、一時的障害や致命的障害の具体的
項目とすることができる。予防保守情報分析処理部20
cは、その対処項目名やエラーコード等に対応するスク
リプト名などの情報も併せて、分析結果ファイル20e
に出力する。
【0038】店舗対処処理部20fは、分析結果ファイ
ル20eの情報にもとづいて、対処スクリプトファイル
20gから対処スクリプトを抽出し、これにもとづい
て、店舗端末10に対処処理を実行させる。この対処ス
クリプトは、ホストコンピュータ20からの通信回線を
介した遠隔操作によって、店舗端末10における設定を
自動変更するなどの処理を実行するものであっても、店
舗端末10に送信することによって、店舗端末10にお
いて起動し、実行するものであってもよい。
【0039】通信回線40は、従来公知の任意好適な公
衆回線、商業回線又は専用回線を用いることができる。
また店舗端末10−1〜10−n、ホストコンピュータ
20のそれぞれの間においては、同一又は別個の通信回
線で構成することができる。さらに、通信回線40は、
店舗端末10−1〜10−n、ホストコンピュータ20
のそれぞれの間を、無線あるいは有線で接続可能な回線
であり、例えば、公衆回線網、専用回線網、インターネ
ット回線網及びイントラネット網により構成することが
できる。
【0040】次に、第一実施形態の障害事前検知システ
ムにおける処理手順について、図3を参照して説明す
る。図3は、本実施形態の障害事前検知システムにおけ
る処理手順を示す動作手順図である。
【0041】まず、店舗端末10において、各種データ
ベース操作処理が行われる。このデータベース操作処理
が実行されるに従い、データベースの全体容量、残容
量、データ断片化等の店舗端末10におけるデータベー
ス状態が変化する(ステップ10)。
【0042】例えば、データベースの全体容量が割り当
てた容量を超えて領域を確保しようとすると、店舗端末
10は異常状態となって、運用できなくなる可能性があ
る。また、データの断片化が進行すると、一般的に大規
模なテーブルほど、検索レスポンスが極端に低下する場
合がある。
【0043】さらに、一時的な障害により、データベー
ス操作処理が、実行できない状態が発生する可能性もあ
る。これには、データベースが一時的にビジー状態とな
り、接続が確立できない場合や、他の処理が終了するの
を待っているために時間切れとなり、処理ができない場
合などがある。
【0044】このような一時的な障害の発生エラーコー
ドを店舗端末に蓄積しておく。また、一時的ではない致
命的な障害が発生した場合についても、同様に発生エラ
ーコードを蓄積しておく。この発生エラーコードの蓄積
のために、蓄積用ファイルを店舗端末10に設けること
ができる。
【0045】次に、所定のタイミングで、例えば、毎日
午後8時などに、予防保守情報取得処理を起動する。こ
のとき、予防保守情報取得処理部10cは、その店舗端
末10における全データベース10bの全体容量、残容
量、データ断片化状態等の情報を取得する。
【0046】また、店舗端末10に蓄積されている発生
エラーコードの種類およびその回数などを取得する。こ
の場合、予防保守情報取得処理は日々動作するため、発
生エラーコード回数についてはその度にクリアすること
が好ましい。そして、予防保守情報取得処理部10c
は、上記の情報に、店舗識別ID、情報取得年月日時分
秒など店舗固有の情報を付加して、一つの予防保守情報
ファイルに編集する(ステップ11)。
【0047】次に、ホストコンピュータ20は、所定の
時刻、例えば午後10時に集信処理を実行する(ステッ
プ12)。この処理により、集信処理部20aは、複数
展開されている店舗端末10から地上有線などを経由し
て、各店舗端末10における予防保守情報ファイルの情
報を、一つの予防保守情報集信ファイル20bにまとめ
る。各店舗端末10の予防保守情報ファイル10dに
は、店舗識別IDなどの店舗固有の情報が付加されてい
るため、各レコードが、どの店舗からの情報なのかを特
定することができる。
【0048】次に、予防保守情報分析処理部20cによ
って、予防保守情報分析処理が実行される(ステップ1
3)。このとき、予防保守情報分析処理部20cは、予
防保守情報集信ファイル20b及び閾値判定テーブル2
0dの情報にもとづいて、各対処項目やエラーコードご
とに閾値を超過しているか否かを判定し、閾値を超過し
ている場合には、対応する対処スクリプトを閾値判定テ
ーブル20dにより決定する。そして、このような閾値
を超過している項目については、店舗ごとにその対処項
目名やエラーコード等の情報を、対処スクリプト名など
と共に分析結果ファイル20eに出力する。
【0049】次に、店舗対処処理部20fによって、店
舗対処処理が実行される(ステップ14)。すなわち、
店舗対処処理部20fは、分析結果ファイルの情報をも
とに、対処スクリプトファイル20gから対応する対処
スクリプトを抽出し、これを各店舗に対して自動実行す
る。
【0050】そして、店舗端末10の対処処理部10e
は、その要求に応じて、対処処理を実行する(ステップ
15)。この対処スクリプトは、あらかじめ対処スクリ
プトファイル20gに登録しておく。例えば、データベ
ース全体容量が閾値をオーバーする場合に備え、その容
量超過を事前に防ぐために、データベースの容量拡張を
実施する対処スクリプトを作成しておく。
【0051】また、データ断片化が進行して、閾値をオ
ーバーする場合に備え、マスタの再構築を実行する対処
スクリプトを作成しておく。さらに、致命的障害発生を
想定し、対処可能なものについては、その対処スクリプ
トを作成しておく。もちろん、システム運用当初は、そ
の対処方法についてのノウハウは無いため、人手による
対処を実行する必要がある。しかし、対処方法が確立さ
れた後は、その対処方法をスクリプト化し、自動実行で
きる形にして登録しておくことにより、同じケースに対
して何度も人手による対処を実行しなくても済むことと
なる。
【0052】[第二実施形態]次に、本発明の第二実施
形態につき、図4及び図5を参照して説明する。図4
は、本発明の第二実施形態における障害事前検知システ
ムの構成を示すブロック図である。また、図5は、この
障害事前検知システムにおける店舗端末10及びホスト
コンピュータ20の構成を示すブロック図である。
【0053】本実施形態の障害事前検知システムは、店
舗端末10において、予防保守情報の分析が行われて、
対処処理が実行され、ホストコンピュータ20がその対
処履歴を集信し、障害未対応通知を管理者端末に送信す
る点で、第一実施形態と異なる。
【0054】図4において、本実施形態の障害事前検知
システムは、第一実施形態における構成に加え、管理者
端末30を有している。また、図5に示すように、店舗
端末10は、第一実施形態における構成に加え、データ
ベース操作外処理部10f、予防保守情報分析処理部1
0g、閾値判定テーブル10h、分析結果ファイル10
i及び対処履歴ログ10jを有している。
【0055】データベース操作外処理部10fは、デー
タベース操作処理以外の処理を実行する処理部の総称で
あり、その処理によって、発生したエラーコードやその
発生回数等を蓄積する。この蓄積を行うため、店舗端末
10にデータベース操作外処理用のエラー情報の蓄積用
ファイルを設けることができる。
【0056】そして、予防保守情報取得処理部10cが
起動されると、データベース情報、データベース操作処
理によるエラー情報等とともに、データベース操作外処
理によるエラーについてもそのエラーコードやその発生
回数等を取得して、予防保守情報ファイル10dに記録
する。
【0057】予防保守情報分析処理部10gは、予防保
守情報ファイル10dの情報にもとづいて第一実施形態
におけるホストコンピュータ20の予防保守情報分析処
理部20cと同様に予防保守情報の分析を行う。すなわ
ち、対処項目やエラーに対する閾値の超過判定、対処処
理の実行可否の決定及び対処スクリプトの決定を行っ
て、その分析結果を分析結果ファイル10iに出力す
る。
【0058】対処処理部10eは、この分析結果ファイ
ル10iの情報にもとづいて、対応するスクリプトを、
ホストコンピュータ20における対処スクリプトファイ
ル20gから通信回線を介して読み込み、対処処理を実
行する。そして、その対処履歴を対処履歴ログ10jに
出力する。
【0059】この対処履歴ログ10jには、対処に成功
したものについての情報のみならず、対処が実行不可能
であったエラーについても、障害未対処情報として、そ
の実行不可能であったということを出力する。また、対
処処理部10eは、対処処理を行う必要があるが、対応
するスクリプトが存在しない対処項目を、分析結果ファ
イル10iから抽出し、これを対処履歴ログ10jに出
力する。
【0060】ホストコンピュータ20は、集信処理部2
0a、対処履歴集信ログ20h、障害未対処通知処理部
20i及び対処スクリプトファイル20gを有してい
る。集信処理部20aは、所定のタイミングで、例え
ば、毎日午後10時などに、店舗端末10の対処履歴ロ
グ10jから対処履歴を集信して、これを対処履歴集信
ログ20hに記録する。
【0061】障害未対処通知処理部20iは、対処履歴
集信ログ20hから、対応するスクリプトが存在しなか
ったり、スクリプトの実行が失敗した履歴を抽出して、
これにもとづき障害未対処通知を作成し、これを管理者
端末30に送信して、管理者に通知を行う。対処スクリ
プトファイル20gは、店舗端末10における対処処理
のためのスクリプトを記憶するものである。
【0062】次に、第二実施形態の障害事前検知システ
ムにおける処理手順について、図6を参照して説明す
る。同図は、本発明の第二実施形態における障害事前検
知システムにおける処理手順を示す動作手順図である。
まず、店舗端末10におけるデータベース操作処理部1
0aは、データベース10bに対して、レコード挿入、
更新、削除処理等を実施する(ステップ20)。
【0063】そして、この処理により発生した、一時的
な障害の発生エラーコードを店舗端末に蓄積しておく。
また、致命的な障害が発生した場合についても、同様に
発生エラーコードを蓄積する。この蓄積は、第一実施形
態の場合と同様に、蓄積用ファイルを設けて行うことが
可能である。
【0064】また、データベース操作外処理部10f
は、データベースアクセス以外の操作を実施する処理部
であり、データベース操作処理部10aと同様に、一時
的に発生するシステム障害や、致命的なシステム障害に
ついての発生エラーコードおよびその回数情報等を取得
して蓄積用ファイルに蓄積する(ステップ21)。
【0065】次に、第一実施形態の場合と同様に、所定
のタイミングで、予防保守情報取得処理部10cによっ
て、予防保守情報取得処理を実行する。そして、全デー
タベース10dの全体容量、残容量、データ断片化情報
などの状態情報や、データベース操作処理及びデータベ
ース操作外処理による一時障害発生エラーコード及びそ
の回数等の情報を取得する。また、致命的な障害やシス
テム障害に関しても、同様に発生エラーコードなどを取
得する。そして、これらの情報を予防保守情報ファイル
10dに出力する(ステップ22)。
【0066】なお、データベース操作外処理部10fに
よる発生エラーコード等の蓄積を蓄積用ファイルに行う
のではなく、発生ごとに直接予防保守情報ファイル10
dに書き込むようにすることもできる。また、データベ
ース操作処理部10aの操作により発生したエラーコー
ドについても同様にして、随時予防保守情報ファイル1
0dに書き込むようにすることも可能である。
【0067】次に、予防保守情報分析処理部10gは、
予防保守情報分析処理を実行する(ステップ23)。す
なわち、予防保守情報ファイル10d及び閾値判定テー
ブル10hの情報にもとづいて、店舗端末10自身が、
近い将来、危険もしくは異常状態に陥る可能性のある端
末かどうかを分析する。さらに、既に致命的な障害に陥
っているかどうかについても分析する。この分析は、第
一実施形態のステップ13において、ホストコンピュー
タ20が行う分析と同様の方法を用いて行うことができ
る。そして、この分析結果を分析結果ファイル10iに
出力する。
【0068】対処処理部10eは、この分析結果ファイ
ル10iの情報を入力して、これに応じて対処処理を実
行する(ステップ24)。すなわち、分析結果ファイル
10iの情報にもとづいて、対応するスクリプトをホス
トコンピュータ20の対処スクリプトファイル20gか
ら通信回線を介して受信し、これを実行する。この対処
結果は、対処履歴集信ログ20hに蓄積する。このと
き、対処が実行不可能であったエラーに関しても、その
実行が不可能であったことを対処履歴集信ログ20hに
出力する。
【0069】次に、ホストコンピュータ20の集信処理
部20aによって、所定のタイミングごとに、各店舗端
末10における対処履歴ログ10jの情報の受信が行わ
れ、一つの対処履歴集信ログ20hにまとめて記録され
る(ステップ25)。さらに、障害未対処通知処理部2
0iにより、障害未対処通知処理が実行され、システム
障害などのうち、その対処が実行不可能であった障害に
関しては、その実行不可能であった旨を管理者端末30
に通知する(ステップ26)。
【0070】すなわち、本実施形態によれば、データベ
ース操作処理によるエラーのみならず、データベース操
作外処理にも対応しており、システム障害に対処するこ
とも可能となる。そして、このシステム障害の中でも致
命的なものであって、スクリプトによる自動対処が実行
不可能な場合には、障害未対処通知処理により管理者に
通知することができる。
【0071】また、予防保守情報取得処理(ステップ2
2)、予防保守情報分析処理(ステップ23)、対処処
理(ステップ24)を各店舗端末10上で行うことによ
り、ホストコンピュータ20における対処処理実行時の
負荷の集中を回避することが可能となる。
【0072】さらに、本発明の第一実施形態及び第二実
施形態を必要に応じて組合せて用いることも可能であ
る。すなわち、第一実施形態において、第二実施形態の
データベース操作外処理(ステップ21)や障害未対処
通知処理(ステップ26)を実行可能とすることもでき
る。
【0073】このようにすれば、データベース操作外の
システム障害などに対応することができるとともに、予
防保守情報の分析処理をホストコンピュータ20上で行
って、データベース操作処理による障害及びデータベー
ス操作外処理による障害の双方につき、対処の実行不可
能の場合に、管理者に通知可能とすることもできる。
【0074】なお、本発明は以上の実施形態に限定され
るものではなく、例えば、予防保守情報取得処理部が、
所定のタイミングで全てのデータベースにおける状態情
報やエラー情報を取得するのではなく、データベースご
とに異なる時間に予防保守情報取得処理を実行し、その
処理タイミングを複数回に分散するなど適宜設計変更で
きるものである。
【0075】
【発明の効果】以上のように、本発明によれば、複数に
展開する店舗における店舗端末の状態を予防保守情報と
して取得・分析し、その結果に応じた対処を実行して問
題の発生原因となる要素を除去することができるため、
店舗端末が、近い将来に、危険又は異常状態に陥ること
を事前に防止することが可能となる。
【0076】また、対処スクリプトファイルの情報にも
とづいて、上記対処を自動的に実行することができるた
め、店舗端末及びホストコンピュータにおける運用コス
トを削減することが可能となる。さらに、対処方法を確
立し、対処スクリプトとしてまとめたものについては、
店舗端末の致命的な障害による運用停止などを回避した
り、致命的障害に陥った場合でも復旧できる可能性があ
るため、店舗端末の運用上の信頼性を向上することも可
能となる。
【図面の簡単な説明】
【図1】本発明の第一実施形態の障害事前検知システム
の構成を示すブロック図である。
【図2】本発明の第一実施形態の障害事前検知システム
における店舗端末及びホストコンピュータの構成を示す
ブロック図である。
【図3】本発明の第一実施形態の障害事前検知システム
における処理手順を示す動作手順図である。
【図4】本発明の第二実施形態の障害事前検知システム
の構成を示すブロック図である。
【図5】本発明の第二実施形態の障害事前検知システム
における店舗端末及びホストコンピュータの構成を示す
ブロック図である。
【図6】本発明の第二実施形態の障害事前検知システム
における処理手順を示す動作手順図である。
【符号の説明】
10(10−1,10−2〜10−n) 店舗端末 10a データベース操作処理部 10b データベース 10c 予防保守情報取得処理部 10d 予防保守情報ファイル 10e 対処処理部 10f データベース操作外処理部 10g 予防保守情報分析処理部 10h 閾値判定テーブル 10i 分析結果ファイル 10j 対処履歴ログ 20 ホストコンピュータ 20a 集信処理部 20b 予防保守情報集信ファイル 20c 予防保守情報分析処理部 20d 閾値判定テーブル 20e 分析結果ファイル 20f 店舗対処処理部 20g 対処スクリプトファイル 20h 対処履歴集信ログ 20i 障害未対処通知処理部 30 管理者端末 40 通信回線

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 通信回線を介し、複数の店舗端末がそれ
    ぞれ有する予防保守情報に応じた対処処理を、ホストコ
    ンピュータが前記店舗端末に実行させる障害事前検知シ
    ステムであって、 データベース情報及び発生したエラーの情報を前記予防
    保守情報として記憶し、前記ホストコンピュータからの
    要求に応じて、この予防保守情報を前記ホストコンピュ
    ータに送信するとともに、前記ホストコンピュータから
    の指示に従って対処処理を実行する前記店舗端末と、 前記店舗端末から前記予防保守情報を集信して分析し、
    この分析結果に対応するスクリプトを対処スクリプトフ
    ァイルから抽出して、前記スクリプトにもとづき前記店
    舗端末に対処処理を実行させる前記ホストコンピュータ
    と、 前記店舗端末及び前記ホストコンピュータを接続する通
    信回線とを有することを特徴とする障害事前検知システ
    ム。
  2. 【請求項2】 通信回線を介し、複数の店舗端末におい
    てそれぞれ記憶された対処履歴情報にもとづいて、ホス
    トコンピュータが障害未対処通知を管理者端末に送信す
    る障害事前検知システムであって、 データベース情報及び発生したエラーの情報を予防保守
    情報として記憶するとともに分析し、この分析結果に対
    応するスクリプトを対処スクリプトファイルから抽出し
    て、前記スクリプトにもとづき対処処理を実行し、か
    つ、この実行結果及び、前記対応するスクリプトが前記
    対処スクリプトファイルに存在しない前記分析結果を前
    記対処履歴情報として記憶する前記店舗端末と、 前記店舗端末から前記対処履歴情報を集信し、この対処
    履歴情報にもとづいて作成した前記障害未対処通知を、
    前記管理者端末に送信する前記ホストコンピュータと、 前記店舗端末及び前記ホストコンピュータを接続する通
    信回線とを有することを特徴とする障害事前検知システ
    ム。
  3. 【請求項3】 あらかじめ前記データベース情報及び前
    記エラー情報ごとに所定の閾値を設定し、前記予防保守
    情報の分析の結果、前記閾値を超えると判定された予防
    保守情報について、前記対処処理を実行することを特徴
    とする請求項1又は2記載の障害事前検知システム。
  4. 【請求項4】 通信回線を介し、複数の店舗端末がそれ
    ぞれ有する予防保守情報に応じた対処処理を、ホストコ
    ンピュータが前記店舗端末に実行させる障害事前検知方
    法であって、 前記店舗端末が、データベース情報及び発生したエラー
    の情報を前記予防保守情報として記憶し、 前記ホストコンピュータが、前記店舗端末から前記予防
    保守情報を集信して分析し、この分析結果に対応するス
    クリプトを対処スクリプトファイルから抽出して、前記
    スクリプトにもとづき前記店舗端末に対処処理を実行さ
    せることを特徴とする障害事前検知方法。
  5. 【請求項5】 通信回線を介し、複数の店舗端末におい
    てそれぞれ記憶された対処履歴情報にもとづいて、ホス
    トコンピュータが障害未対処通知を管理者端末に送信す
    る障害事前検知方法であって、 前記店舗端末が、データベース情報及び発生したエラー
    の情報を予防保守情報として記憶するとともに分析し、
    この分析結果に対応するスクリプトを対処スクリプトフ
    ァイルから抽出して、前記スクリプトにもとづき対処処
    理を実行し、かつ、この実行結果及び、前記対応するス
    クリプトが前記対処スクリプトファイルに存在しない前
    記分析結果を前記対処履歴情報として記憶し、 前記ホストコンピュータが、前記店舗端末から前記対処
    履歴情報を集信し、この対処履歴情報における前記対処
    処理が実行できなかった前記実行結果及び前記対応する
    スクリプトが前記対処スクリプトファイルに存在しない
    前記分析結果にもとづいて作成した前記障害未対処通知
    を、前記管理者端末に送信することを特徴とする障害事
    前検知方法。
  6. 【請求項6】 通信回線を介し、複数の店舗端末から予
    防保守情報を集信して、この予防保守情報にもとづき対
    応する店舗端末に対処処理を実行させる障害事前検知サ
    ーバであって、 前記店舗端末においてデータベース情報及び発生したエ
    ラーの情報にもとづき作成された前記予防保守情報を集
    信し、予防保守情報集信ファイルを作成する集信処理部
    と、 前記予防保守情報集信ファイルの情報を分析し、分析結
    果ファイルを作成する予防保守情報分析処理部と、 前記分析結果ファイルの情報に対応するスクリプトを対
    処スクリプトファイルから抽出するとともに、前記スク
    リプトにもとづいて、前記店舗端末に対処処理を実行さ
    せる店舗対処処理部を有することを特徴とする障害事前
    検知サーバ。
  7. 【請求項7】 通信回線を介し、ホストコンピュータの
    要求に応じて、予防保守情報を送信し、前記ホストコン
    ピュータからの前記予防保守情報の分析結果にもとづく
    指示に従って対処処理を行う障害事前検知端末であっ
    て、 データベース情報及び発生したエラーの情報を前記予防
    保守情報として記憶する予防保守情報取得処理部と、 前記ホストコンピュータからの指示に従って対処処理を
    実行する対処処理部を有することを特徴とする障害事前
    検知端末。
JP2002094090A 2002-03-29 2002-03-29 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末 Pending JP2003296141A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002094090A JP2003296141A (ja) 2002-03-29 2002-03-29 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002094090A JP2003296141A (ja) 2002-03-29 2002-03-29 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末

Publications (1)

Publication Number Publication Date
JP2003296141A true JP2003296141A (ja) 2003-10-17

Family

ID=29386900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002094090A Pending JP2003296141A (ja) 2002-03-29 2002-03-29 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末

Country Status (1)

Country Link
JP (1) JP2003296141A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941706B2 (en) 2007-10-29 2011-05-10 International Business Machines Corporation Autonomic resolution of system configuration
JP2014067089A (ja) * 2012-09-24 2014-04-17 Nec Corp 分散システム、サーバ計算機、分散管理サーバ及び障害発生防止方法
JP2016197298A (ja) * 2015-04-02 2016-11-24 東芝テック株式会社 制御装置、情報処理装置、電子回路基板、制御基板及びプログラム
WO2017135226A1 (ja) * 2016-02-05 2017-08-10 コニカミノルタ株式会社 情報処理システム及び情報処理方法
JP2018005352A (ja) * 2016-06-28 2018-01-11 株式会社沖データ 保守管理システム
US10157110B2 (en) 2012-09-24 2018-12-18 Nec Corporation Distributed system, server computer, distributed management server, and failure prevention method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04127247A (ja) * 1990-09-18 1992-04-28 Hitachi Ltd 予防保守支援システム
JP2000047905A (ja) * 1998-07-29 2000-02-18 Fujitsu Ltd 予防保守システム及び予防保守システムに接続された端末装置
JP2000148538A (ja) * 1998-11-09 2000-05-30 Ntt Data Corp コンピュータ障害の対処方法、障害対処システム
JP2001014187A (ja) * 1999-06-29 2001-01-19 Hitachi Ltd 障害診断システム
JP2001142727A (ja) * 1999-11-15 2001-05-25 Matsushita Electronics Industry Corp コンピュータのメンテナンス方法
JP2002074520A (ja) * 2000-08-31 2002-03-15 Toshiba Tec Corp 障害対処方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04127247A (ja) * 1990-09-18 1992-04-28 Hitachi Ltd 予防保守支援システム
JP2000047905A (ja) * 1998-07-29 2000-02-18 Fujitsu Ltd 予防保守システム及び予防保守システムに接続された端末装置
JP2000148538A (ja) * 1998-11-09 2000-05-30 Ntt Data Corp コンピュータ障害の対処方法、障害対処システム
JP2001014187A (ja) * 1999-06-29 2001-01-19 Hitachi Ltd 障害診断システム
JP2001142727A (ja) * 1999-11-15 2001-05-25 Matsushita Electronics Industry Corp コンピュータのメンテナンス方法
JP2002074520A (ja) * 2000-08-31 2002-03-15 Toshiba Tec Corp 障害対処方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941706B2 (en) 2007-10-29 2011-05-10 International Business Machines Corporation Autonomic resolution of system configuration
JP2014067089A (ja) * 2012-09-24 2014-04-17 Nec Corp 分散システム、サーバ計算機、分散管理サーバ及び障害発生防止方法
US10157110B2 (en) 2012-09-24 2018-12-18 Nec Corporation Distributed system, server computer, distributed management server, and failure prevention method
JP2016197298A (ja) * 2015-04-02 2016-11-24 東芝テック株式会社 制御装置、情報処理装置、電子回路基板、制御基板及びプログラム
WO2017135226A1 (ja) * 2016-02-05 2017-08-10 コニカミノルタ株式会社 情報処理システム及び情報処理方法
JPWO2017135226A1 (ja) * 2016-02-05 2018-11-29 コニカミノルタ株式会社 情報処理システム及び情報処理方法
JP2018005352A (ja) * 2016-06-28 2018-01-11 株式会社沖データ 保守管理システム

Similar Documents

Publication Publication Date Title
JP4318643B2 (ja) 運用管理方法、運用管理装置および運用管理プログラム
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
US9262260B2 (en) Information processing apparatus, information processing method, and recording medium
CN101197621B (zh) 一种对网管系统故障进行远程诊断定位的方法及其系统
WO2016188100A1 (zh) 信息系统故障场景信息收集方法及系统
JP2012198796A (ja) ログ収集システム、装置、方法及びプログラム
CN109062723A (zh) 服务器故障的处理方法和装置
JP3916232B2 (ja) ナレッジ型運用管理システム,方法およびプログラム
CN113001590A (zh) 机器人故障恢复方法、装置、设备和计算机可读存储介质
JP2003296141A (ja) 障害事前検知システム、障害事前検知方法、障害事前検知サーバ及び障害事前検知端末
CN102662787A (zh) 一种保护系统盘raid的方法
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
JP5503177B2 (ja) 障害情報収集装置
US11745036B2 (en) Fire protection system
CN115037652A (zh) 一种套保系统后台模块运行监控系统
CN116264541A (zh) 一种基于多维度的数据库容灾方法及装置
JP4575020B2 (ja) 障害解析装置
JP3992029B2 (ja) オブジェクト管理方法
CN115168137A (zh) 针对定时任务的监控方法及系统、计算机设备及存储介质
JPH04257035A (ja) 仮想計算機システム配下における障害情報処理方式
JP3691272B2 (ja) 分散処理システムおよび障害解析情報の保存方法
JP2003085003A (ja) 障害復旧援助方法、及び、障害復旧援助システム
JP6070040B2 (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
JP2001216166A (ja) 情報処理装置の保守管理方法および情報処理装置ならびにソフトウェアの作成方法およびソフトウェア
CN113656358A (zh) 一种数据库日志文件处理方法及系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060228