JP6410705B2 - 障害予兆検出システムおよび障害予兆検出方法 - Google Patents

障害予兆検出システムおよび障害予兆検出方法 Download PDF

Info

Publication number
JP6410705B2
JP6410705B2 JP2015240182A JP2015240182A JP6410705B2 JP 6410705 B2 JP6410705 B2 JP 6410705B2 JP 2015240182 A JP2015240182 A JP 2015240182A JP 2015240182 A JP2015240182 A JP 2015240182A JP 6410705 B2 JP6410705 B2 JP 6410705B2
Authority
JP
Japan
Prior art keywords
log
detection
failure sign
failure
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015240182A
Other languages
English (en)
Other versions
JP2017107372A (ja
Inventor
聖人 細田
聖人 細田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2015240182A priority Critical patent/JP6410705B2/ja
Publication of JP2017107372A publication Critical patent/JP2017107372A/ja
Application granted granted Critical
Publication of JP6410705B2 publication Critical patent/JP6410705B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、ソフトウェアの実行時に出力するシステムログ(以下、単にログという)の特徴から障害の予兆を検出することで、障害発生を未然に防止、もしくは早期発見する障害予兆検出システムおよびその方法に関するものである。
従来、ソフトウェアの障害検出においては、障害と紐づいたエラーログを予め定義し、ソフトウェアが稼働する現場では定義されたエラーログの発生を起因としてエラーと判定する(例えば、下記の特許文献1参照)。
列車の運行管理システムを例にとって説明すると、司令員が入力した列車番号がシステムに存在しないものである場合、システムは定義されたエラーログを出力するので、そのエラーログを確認していくことで障害の特定が行われる。
特開2008−9854号公報
従来のログによる障害検出方式は、このように障害に紐づいたエラーログを発生するので、エラーログが明示的に発生しない障害の場合にはその発見が遅れ、その結果、業務に支障をきたす可能性があるといった問題があった。
この発明は、上記のような課題を解決するためになされたものであり、障害に紐づいたエラーログを明示的に発生する場合だけでなく、これに加えて、エラーログが明示的に発生しない場合でも障害予兆として検出できるようにして、より多くの障害に対して早期対応が可能となる障害予兆検出システムおよび障害予兆検出方法を提供することを目的とする。
この発明に係る障害予兆検出システムは、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するものであって、上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく検出定義作成装置と、上記ソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、上記検出定義作成装置で作成された検出定義に基づいて障害予兆を検出するログ解析装置とを備え、上記ログ解析装置は、プログラムの障害に紐づいたエラーログを検出するとともに、上記検出定義作成装置において予め作成された検出定義に基づき、プログラムの処理監視単位ごとに、本来正常な処理が実行された場合に発生すると予定されている検出ログの発生の有無を解析し、上記検出ログが発生しない場合には、これを障害予兆として検出することを特徴としている。
また、この発明に係る障害予兆検出方法は、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するために、上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく第1のステップと、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、予め作成された上記検出定義に基づいて障害予兆を検出し、障害予兆があればその旨を通知する第2のステップとを備え、上記第2のステップでは、上記ソフトウェアのプログラムの障害に紐づいたエラーログを検出した場合だけでなく、予め作成された上記検出定義に基づき、プログラムの処理監視単位ごとに処理の開始、終了を検出し、かつ本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しない場合には、これを障害予兆として検出することを特徴としている。
この発明によれば、障害に紐づいたエラーログを明示的に発生する場合だけでなく、これに加えて、エラーログが明示的に発生しない場合でも障害予兆として検出できるので、より多くの障害に対して早期対応が可能となる。
この発明の実施の形態1に係る障害予兆検出システムの構成を示すブロック図である。 この発明の実施の形態1に係る障害予兆検出システムの障害予兆の検出処理動作を示すフローチャートである。 この発明の実施の形態1に係る障害予兆検出システムの検出定義作成装置で作成される検出定義テーブルとログ監視状態テーブルの一例を示す説明図である。 この発明の実施の形態2に係る障害予兆検出システムの構成を示すブロック図である。 この発明の実施の形態2に係る障害予兆検出システムの試験情報解析部で予め定義される試験定義テーブルの一例を示す説明図である。 この発明の実施の形態3に係る障害予兆検出システムの構成を示すブロック図である。 この発明の実施の形態3に係る障害予兆検出システムの障害該当判定部で予め設定される障害判定テーブルの一例を示す説明図である。 この発明の実施の形態4に係る障害予兆検出システムの構成を示すブロック図である。 この発明の実施の形態4に係る障害予兆検出システムの試験情報解析部で定義される試験定義テーブルの一例を示す説明図である。 この発明の実施の形態5に係る障害予兆検出システムの構成を示すブロック図である。 この発明の実施の形態5に係る障害予兆検出システムの影響通知部に予め設定登録されるソース参照関連管理テーブルの一例を示す説明図である。
実施の形態1.
図1はこの発明の実施の形態1における障害予兆検出システムの構成を示すブロック図である。
この発明の実施の形態1における障害予兆検出システム1は、検出定義作成装置100と、ログ解析装置200とにより構成される。検出定義作成装置100とログ解析装置200の間は図示しないが、ネットワーク接続もしくはCD等のメディアによりデータを受け渡すことができる。なお、各装置100、200は一般的な計算機によって構成される。
検出定義作成装置100は、障害の解析対象となるソフトウェア900について、そのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するために、プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称や障害予兆の有無の判断に使うログなどを検出定義として予め作成して登録しておくために設けられており、定義入力部11と検出定義作成部12とからなる。
一方、ログ解析装置200は、障害の解析対象となるソフトウェア900において、そのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、検出定義作成装置100で作成された検出定義に基づいて障害予兆を検出し、障害予兆があれば、その旨を通知するものであり、ログ取得部21、ログ解析部22、検出定義管理部23、ログ状態管理部24、および障害予兆通知部25からなる。
次に、各装置100、200の具体的な構成について説明する。
検出定義作成装置100において、定義入力部11は、検出定義を作成するために必要となる情報を入力するインタフェースであり、例えばキーボートやマウス、タブレット端末などで構成される。検出定義作成部12は、定義入力部11から入力された情報を用いて検出定義を作成し、この検出定義の情報を図3(a)に示すような検出定義テーブルとして保持する。
一方、ログ解析装置200において、ログ取得部21は、解析対象のソフトウェア900のプログラム実行時に発生する各種ログを取得する。また、検出定義管理部23は、検出定義作成装置100の検出定義作成部12で作成された検出定義を取得する。ログ解析部22は、ログ取得部21で取得されたログの内容を解析し、障害予兆を検出する。そのログ解析の際、ログ解析部22は、検出定義管理部23が保持する検出定義の情報を使用する。ログ状態管理部24は、ログ解析部22で解析中の状態を管理するためのメモリを備えており、ログ解析部22による解析結果を図3(b)に示すようなログ監視状態テーブルとして保持する。さらに、ログ解析部22は、ログ解析した結果、ログ状態管理部24に登録された情報に基づいて障害予兆の有無を判断し、障害予兆があると判断した場合には、その旨を障害予兆通知部25に通知する。障害予兆通知部25は、ログ解析部22からの障害予兆の通知に応じて、ログ解析装置200が備える図示しないCRTや液晶などの表画面上、あるいは外部の警報装置に対して障害予兆がある旨を通知する。
次に、この障害予兆検出システム1の障害予兆の検出処理動作について、図2に示すフローチャートを参照して説明する。なお、符号Sは各処理ステップを意味する。
この実施の形態1における処理動作は、図2(a)に示すように、検出定義を作成する作成フローS1と、図2(b)に示すように、検出定義と解析対象となるソフトウェアのログとに基づいて障害検出を実施する解析フローS2とに大別される。
まず、作成フローS1については、定義入力部11から検出定義作成部12に対して障害予兆を検出するために必要な検出定義の情報を入力し(S11)、検出定義作成部12にその検出定義の情報を登録する(S12)。これにより、検出定義作成部12には、定義入力部11から入力された情報に基づいて、図3(a)に示すような検出定義テーブルが作成される。そして、検出定義作成部12で作成された図3(a)に示すような検出定義テーブルの情報は、ログ解析装置200の検出定義管理部23に転送されてここに登録される。
図3(a)に示す検出定義テーブルの作成に際しては、障害予兆を検出する解析対象範囲としてプログラムの処理監視単位を設定して登録する。また、ソフトウェアは様々な処理の開始や実行にあたって処理が実行したことを示すトレースログを出力することが一般的である。そこで、このトレースログを利用して、処理監視単位ごとに、障害予兆の有無の判断に使うログを登録する。すなわち、処理監視単位ごとに、障害予兆検出を開始する目印となるログを開始ログ、終了時の目印となるログを終了ログとして登録する。さらに、正常に処理監視単位内のプログラムに基づく処理が正常に実行された場合に終了ログの発生直前に通常発生されるログを検出ログとして登録する。
一方、解析フローS2については、ログ取得部21が実行中のソフトウェアから開始ログを取得する。なお、解析対象となるソフトウェア900は、ここではプログラムの処理監視単位名ごとにマルチタクスで動作しているものとする。
ログ解析部22は、この開始ログが検出定義管理部23に移管されている検出定義テーブル(図3(a))に登録された開始ログに該当した場合、処理監視単位番号をキーとして、ログ状態管理部24が備える図3(b)に示すログ監視状態テーブルに対して、現在の状態を”開始”にセットする(S21)。
また、ログ解析部22は、ログ取得部21が取得する検出ログの発生を監視し、検出ログが発生した場合、ログ状態管理部24に設けられているログ監視状態テーブル(図3(b))に対して、検出ログの発生を”有”にセットする(S22)。
さらに、ログ解析部22は、ログ取得部21が取得する終了ログの発生を監視し、終了ログが発生した場合、ログ状態管理部24が備えるログ監視状態テーブル(図3(b))に対して、現在の状態を”終了”にセットする(S23)。
そして、ログ解析部22は、ログ状態管理部24が備えるログ監視状態テーブル(図3(b))を参照して、ログ解析を行う(S24)。すなわち、終了ログの状態が”終了”になっている処理監視単位につき、検出ログの発生の有無を判断する(S25)。
ログ解析部22は、終了ログが”終了”の状態になっているにもかかわらず、検出ログの発生が”有”でない場合、その処理監視単位のプログラムは、本来正常な処理が実行された場合に発生するはずの検出ログが発生し無かったので、その処理監視単位のプログラムには障害が有るものと判断し、障害予兆通知部25によりその旨をログ解析装置200が備える図示しないCRTや液晶などの表画面上、あるいは外部の警報装置に通知する(S26)。
上記処理の具体例として、図3(b)のログ監視状態テーブルにおいて、処理監視単位名が”10001”のプログラムについては、そのタスクが未だ完了していないので、開始ログの状態は”開始”のままになっていて、終了ログは未だ発生されていない。したがって、検出ログも発生されておらず、障害予兆通知部25からは障害予兆の通知は出力されない。
処理監視単位名が”10002”のプログラムについては、そのタスクが既に完了したので、終了ログが発生し、現在の状態は”終了”となっている。にもかかわらず、検出ログの発生状態は”無”なので、この場合には、処理監視単位名が”10002”のプログラム処理には障害が発生している可能性がある。このため、障害予兆通知部25から障害予兆の通知が出力される。
一方、処理監視単位名が”10003”のプログラムについては、そのタスクが既に完了したので、終了ログが発生して現在の状態は”終了”となっている。また、検出ログが正常に発生されたので、その発生状態が”有”となっている。この場合には、処理監視単位名が”10003”のプログラム処理は正常に実行されたものと判断し、このため、障害予兆通知部25から障害予兆の通知は出力されない。
なお、処理監視単位名が”10011”のプログラムについては、そのタスクの実行完了前にプログラムの明確な障害に紐づいたエラーログが発生されているので、その場合には検出ログの発生の有無にかかわらず、障害予兆通知部25から障害予兆の通知が出力される。
このように、この実施の形態1では、検出定義作成装置100において予め作成した検出定義に基づき、ログ解析装置200によりプログラムの処理監視単位ごとに処理の開始、終了を検出し、本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しないことが分かった場合には、これを障害予兆として検出するようにした。その結果、障害に紐づいたエラーログを検出する場合に加えて、明示的にエラーログが発生しない場合でも、障害予兆を検出することができる。このため、より多くの障害に対して早期対応が可能となるという効果が得られる。
実施の形態2.
図4はこの実施の形態2における障害予兆検出システムの構成を示すブロック図であり、図1に示した実施の形態1の構成と対応する部分には同一の符号を付す。
この実施の形態2の特徴は、上記実施の形態1の構成に対して、試験情報解析装置300を追加し、これによって解析対象となるソフトウェア900の試験実施に伴って、図3(a)に示したような検出定義テーブルが簡便に作成できるようにしていることである。
解析対象となるソフトウェア900がインストールされる製品は、製品の出荷前に当該ソフトウェア900が所定通りに動作するか否かが試験される。その試験に際しては、予め正常な結果が得られることが期待されるデータを入力するだけでなく、間違った結果が得られるデータを故意に入力してエラーを発生させ、ソフトウェア900が正しく動作することを確認する。
そこで、この実施の形態2では、試験情報解析装置300を、試験情報入力部31、試験情報解析部32、および試験情報送信部33で構成している。
ここに、試験情報入力部31は、試験内容を定義するために必要となる試験情報を入力するインタフェースであり、例えばキーボートやマウス、タブレット端末などで構成される。この場合、試験内容を定義するために必要となる試験情報としては、処理監視対象となる個々のプログラムに対応付けた試験番号、処理監視単位名、当該プログラムの試験結果を想定して正常/異常となる情報が入力される。
試験情報解析部32は、試験情報入力部31から入力された試験内容を定義した試験情報を、図5に示すような試験定義テーブルとしてメモリに保持するとともに、この試験定義テーブルに基づいて、ソフトウェア900のプログラムが処理監視単位ごとに所定通りに動作するか否かの試験が実施される際に、そのソフトウェア900の処理監視単位ごとのプログラム実行による試験結果が正常となる際に得られるログ情報を抽出する。
すなわち、試験情報解析部32は、処理監視単位ごとに実行されたプログラムの処理結果が正常となる場合に得られる検出ログを抽出する。そして、試験情報解析部32は、こうして抽出した情報(処理監視単位名と検出ログ)を、試験情報送信部33を介して検出定義作成装置100に検出定義の情報として送信する。
そして、検出定義作成部12において、試験情報解析装置300から送られてくる検出定義の情報に、さらに開始ログと終了ログとを処理監視単位名ごとに人手で別途追加することで、図3(a)に示したような検出定義テーブルが完成される。
これにより、図3(a)に示したような検出定義テーブルをソフトウェア900の試験を実施する際に簡便に作成できるので、障害予兆解析を行う上で必要な検出定義テーブルを検出定義作成装置100で独自に作成する場合に比べて、その手間や準備時間を削減することができるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態1の場合と同様であるから、ここでは詳しい説明は省略する。
実施の形態3.
図6はこの発明の実施の形態3における障害予兆検出システムの構成を示すブロック図であり、図4に示した実施の形態2の構成と対応する部分には同一の符号を付す。
解析対象となるソフトウェア900のプログラム内の一部の処理範囲を実行する場合、その処理内容によっては、エラーログが発生されない限り、検出ログが発生されなくても全体の処理結果に影響を及ぼさない程度のもので、運用上、支障のないプログラムが存在することがある。
そこで、この実施の形態3では、上記実施の形態2の構成に対して、ログ解析装置200内に障害該当判定部26を追加し、この障害該当判定部26には、図7に示すように、検出ログが発生されなくても、障害予兆を殊更通知する必要がないことを定義できる障害判定テーブルを予め設定してメモリに登録している。
例えば、図7に示す障害判定テーブルにおいて、処理監視単位名が”1001”や”1003”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となる場合に検出ログの発生が無ければ、障害予兆があるとして障害予兆通知部25による通知を許容(YES)するように予め設定しておく。
これに対して、処理監視単位名が”1002”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となる場合に検出ログの発生がなくても、障害予兆通知部25による通知は不要(No)と予め設定しておく。
したがって、前述の実施の形態1では、図3(b)に示したように、処理監視単位名が”1002”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となっている場合に検出ログの発生がなければ障害予兆通知部25による通知がなされるのに対して、この実施の形態3では、障害該当判定部26が図7に示した障害判定テーブルを参照することにより、検出ログの発生がない場合でも障害予兆通知部25による通知が抑止される。
このように、この実施の形態3では、障害該当判定部26を設け、プログラム内の一部の処理範囲を実行する際、その処理内容によって全体の処理結果に影響を及ぼさない程度のものである場合には、検出ログの発生がなくても運用上、特に支障はないと判断して障害予兆通知を抑止することが可能になる。これにより、各処理監視単位名のプログラムの全てについて通知の有無を確認する手間を省くことができ、特に確認数が多くなるような障害予兆通知がある場合に確認時間を削減できるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態2の場合と同様であるから、ここでは詳しい説明は省略する。
実施の形態4.
図8はこの発明の実施の形態4における障害予兆検出システムの構成を示すブロック図であり、図6に示した実施の形態3の構成と対応する部分には同一の符号を付す。
この実施の形態4の特徴は、図8に示すように、上記実施の形態3の構成に対して、ログ追加処理部41とログ追加情報送信部42からなるソース管理装置400を追加し、これによって解析対象となるソフトウェア900の試験に伴って図3(a)に示したような検出定義テーブルが自動的に作成できるようにしていることである。
ここに、ログ追加処理部41は、試験番号に対応した処理監視単位ごとのプログラムのソースコードの開始時点を示す開始ログと終了時点を示す終了ログの情報を入力し、ログ追加情報送信部42は、このログ追加処理部41で追加された開始ログと終了ログの情報を試験情報解析装置300に送信する。
このログ追加処理部41から送信された開始ログと終了ログの情報は、試験情報入力部31を介して試験情報解析部32に取り込まれるので、試験情報解析部32が備える試験定義テーブルには、図9に示すように、処理監視対象となる個々のプログラムに対応付けた試験番号、処理監視単位名、当該プログラムの試験結果が正常/異常となる情報(図5参照)だけでなく、さらに、試験番号に対応した処理監視単位ごとのプログラムのソースコード、そのソースコードの開始時点を示す開始ログと終了時点を示す終了ログの情報も併せて登録される。
試験情報解析装置300は、実施の形態2で説明したように、解析対象となるソフトウェア900のプログラムの処理監視単位ごとに所定通りに動作するか否かの試験が実施される際に、そのソフトウェア900の処理監視単位ごとのプログラム実行による試験結果が正常となる際に得られるログ情報を抽出する。この場合に抽出される情報としては、処理監視単位名、検出ログ、開始ログ、終了ログが含まれる。そして、こうして抽出した情報が検出定義作成装置100に対して検出定義として送信されるので、検出定義作成部12は、図3(a)に示したような検出定義テーブルが自動的に作成される。
このように、この実施の形態4では、実施の形態3の構成に対してソース管理装置400を追加し、これによって解析対象となるソフトウェア900の試験に伴って図3(a)に示したような検出定義テーブルが自動的に作成されるため、障害予兆解析のために必要とする検出定義テーブルを検出定義作成装置100で独自に作成する場合に比べて、その手間や準備時間を大幅に削減できるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態3の場合と同様であるから、ここでは詳しい説明は省略する。
実施の形態5.
図10はこの発明の実施の形態5における障害予兆検出システムの構成を示すブロック図であり、図8に示した実施の形態4の構成と対応する部分には同一の符号を付す。
この実施の形態5では、図10に示すように、上記実施の形態4の構成に対して、ソース管理装置400内に、影響通知部43を追加し、この影響通知部43には、図11に示すような、各処理監視単位名に関連するソースコードとその参照元や参照先のプログラムのソースコードとの関連を定義したソース参照関連管理テーブルを予めメモリに登録して保持している。そして、このソース参照関連管理テーブルの情報を障害該当判定部26に通知するようにしている。
これにより、ログ解析部22のログ解析の結果、所定の処理監視単位名をもつプログラムのタスクが既に完了して現在の状態が”終了”となっているにもかかわらず、検出ログの発生がないと解析された場合であって、かつ、障害該当判定部26に予め登録されている図7に示した障害判定テーブルにより、検出ログ未発生時に障害予兆を通知することが許容(YES)されていると判定された場合、障害該当判定部26は、影響通知部43から通知された図11に示すソース参照関連管理テーブルを参照して、当該処理監視単位名をもつプログラムのソースコードとその参照元や参照先のプログラムのソースコードを、障害予兆通知部25を介して例えば図示しないCRTや液晶などの表画面上に通知する。
例えば、処理監視単位名が”10001”をもつプログラムに障害予兆があると判定される場合、図11に示したソース参照関連管理テーブルに基づき、そのソースコード”AAA.c”と、その参照元であるプログラムのソースコード”main.c”や、参照先のプログラムのソースコード”AAA−1.c”や”AAA−2.c”が通知される。
これにより、所定の処理監視単位名をもつプログラムについて、そのソースコードが変更された場合に検出ログが発生しなかった時には、その変更されたソースコードの参照元や参照先のプログラムのソースコードについても障害予兆発生の可能性ありとして、再度確認することができるので、ソースコードの変更に伴って発生する可能性のある周辺処理のプログラムについての障害予兆を漏らさず検出することができる。このため、より多くの障害に対して早期対応が可能となる効果が得られる。
なお、その他の構成および作用効果は、実施の形態4の場合と同様であるから、ここでは詳しい説明は省略する。
この発明は上記の実施の形態1〜5の構成のみに限定されるものではなく、この発明の趣旨を逸脱しない範囲において、各実施の形態1〜5の構成の一部に変形を加えたり、構成の一部を省略することができ、さらに、各実施の形態1〜5の構成を適宜組み合わせることが可能である。
1 障害予兆検出システム、100 検出定義作成装置、11 定義入力部、
12 検出定義作成部、200 ログ解析装置、21 ログ取得部、22 ログ解析部、23 検出定義管理部、24 ログ状態管理部、25 障害予兆通知部、
26 障害該当判定部、300 試験情報解析装置、31 試験情報入力部、
32 試験情報解析部、33 試験情報送信部、400 ソース管理装置、
41 ログ追加処理部、42 ログ追加情報送信部、43 影響通知部。

Claims (6)

  1. 障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出する障害予兆検出システムであって、
    上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく検出定義作成装置と、上記ソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、上記検出定義作成装置で作成された検出定義に基づいて障害予兆を検出するログ解析装置とを備え、
    上記ログ解析装置は、上記プログラムの障害に紐づいたエラーログを検出するとともに、上記検出定義作成装置において予め作成された検出定義に基づき、上記プログラムの処理監視単位ごとに、本来正常な処理が実行された場合に発生すると予定されている検出ログの発生の有無を解析し、上記検出ログが発生しない場合には、これを障害予兆として検出することを特徴とする障害予兆検出システム。
  2. 試験情報解析装置を備え、上記試験情報解析装置は、上記ソフトウェアのプログラムの処理監視単位ごとに試験内容を定義する試験情報を入力する試験情報入力部と、上記試験情報入力部から入力された上記試験情報に基づいて、上記ソフトウェアのプログラムが処理監視単位ごとに所定通りに動作するか否かの試験が実施される際に、その処理監視単位ごとのプログラム実行による試験結果が正常となる場合に得られるログ情報を抽出する試験情報解析部と、上記試験情報解析部で抽出された上記ログ情報を上記検出定義作成装置に対して検出定義の情報として送信する試験情報送信部と、を含むことを特徴とする請求項1に記載の障害予兆検出システム。
  3. 上記試験情報解析装置の試験情報入力部に入力される試験情報に対して、処理監視単位ごとのプログラムのソースコードの開始時点を示す開始ログと終了時点を示す終了ログの情報を追加するログ追加処理部を備えることを特徴とする、請求項2に記載の障害予兆検出システム。
  4. 上記ログ解析装置により検出ログが発生していないと解析された場合でも、システム運用上、障害予兆を敢えて通知する必要がない場合には、その障害予兆がある旨の通知を抑止する障害該当判定部を備える、ことを特徴とする請求項1から請求項3のいずれか1項に記載の障害予兆検出システム。
  5. 特定のソースコードとその参照元や参照先となるソースコードの関係を定義した影響通知部を備え、上記ログ解析装置は、検出ログが発生しない場合にこれを障害予兆として検出する場合に、上記影響通知部の情報に基づいて特定のソースコードの参照元と参照先のソースコードについても障害予兆発生の可能性ありとして通知することを特徴とする請求項1から請求項4のいずれか1項に記載の障害予兆検出システム。
  6. 障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するために、上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく第1のステップと、
    障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、予め作成された上記検出定義に基づいて障害予兆を検出し、障害予兆があればその旨を通知する第2のステップとを備え、
    上記第2のステップでは、上記ソフトウェアのプログラムの障害に紐づいたエラーログを検出した場合だけでなく、予め作成された上記検出定義に基づき、プログラムの処理監視単位ごとに処理の開始、終了を検出し、かつ本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しない場合には、これを障害予兆として検出することを特徴とする障害予兆検出方法。
JP2015240182A 2015-12-09 2015-12-09 障害予兆検出システムおよび障害予兆検出方法 Expired - Fee Related JP6410705B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015240182A JP6410705B2 (ja) 2015-12-09 2015-12-09 障害予兆検出システムおよび障害予兆検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015240182A JP6410705B2 (ja) 2015-12-09 2015-12-09 障害予兆検出システムおよび障害予兆検出方法

Publications (2)

Publication Number Publication Date
JP2017107372A JP2017107372A (ja) 2017-06-15
JP6410705B2 true JP6410705B2 (ja) 2018-10-24

Family

ID=59059682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015240182A Expired - Fee Related JP6410705B2 (ja) 2015-12-09 2015-12-09 障害予兆検出システムおよび障害予兆検出方法

Country Status (1)

Country Link
JP (1) JP6410705B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901295B (zh) * 2021-09-16 2024-02-02 苏州浪潮智能科技有限公司 基于diag系统的故障详情自动抓取方法、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011159011A (ja) * 2010-01-29 2011-08-18 Toshiba It Service Kk ジョブ監視システム及びジョブ監視プログラム
US8868984B2 (en) * 2010-12-07 2014-10-21 International Business Machines Corporation Relevant alert delivery in a distributed processing system with event listeners and alert listeners
JP2012168702A (ja) * 2011-02-14 2012-09-06 Nippon Telegr & Teleph Corp <Ntt> ログ解析装置およびログ解析方法
EP2717162A4 (en) * 2011-05-23 2015-10-28 Fujitsu Ltd MESSAGE DETECTION DEVICE AND MESSAGE MESSAGE PROGRAM
JP5918297B2 (ja) * 2014-05-01 2016-05-18 日本電信電話株式会社 端末ログ管理システム、端末ログ管理装置、端末ログ管理方法、および、端末ログ管理プログラム

Also Published As

Publication number Publication date
JP2017107372A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
US9213625B1 (en) Method and apparatus for performing automated user-interface layout testing
US20130276124A1 (en) Systems, methods, apparatuses and computer program products for providing mobile device protection
EP2073121A2 (en) Analyzer and analyzing system, and computer program product
WO2012046293A1 (ja) 障害監視装置、障害監視方法及びプログラム
WO2019000963A1 (zh) 业务系统预先稽查方法、服务器及计算机可读存储介质
US20160246661A1 (en) Analyzing the availability of a system
GB2440069A (en) Monitoring simulating device, method, and program
JP2008090504A (ja) コンピュータ保守支援システム及び解析サーバ
US20190196897A1 (en) Influence range specifying method, influence range specifying apparatus, and storage medium
JP6238221B2 (ja) ソフトウェアの実行を監視する装置、方法およびプログラム
JP6410705B2 (ja) 障害予兆検出システムおよび障害予兆検出方法
JP2009169724A (ja) 保守支援装置
JP2008123195A (ja) 不具合防止装置及びプログラム
JP6375200B2 (ja) 計算機システムの異常予兆検出装置および方法
TW201435527A (zh) 可程式邏輯控制器、可程式邏輯控制系統及執行錯誤資訊作成方法
JP5613570B2 (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
JP7131486B2 (ja) 制御システム、プログラマブルロジックコントローラおよび情報処理方法
JP2013196219A (ja) 報告書作成装置、報告書作成プログラムおよび報告書作成方法
JP2017207995A (ja) サービス監視装置及びサービス監視方法
JP5224759B2 (ja) 検査式作成支援システム、検査式作成支援方法、および検査式作成支援プログラム
JP2010055305A (ja) 診断項目登録システム、方法及びプログラム
JP2018028798A (ja) 情報処理装置及びプログラム
US10880151B2 (en) Notification control device, notification control system, notification control method, and storage medium
CN114064341A (zh) 基于应急预案的故障处置方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180925

R150 Certificate of patent or registration of utility model

Ref document number: 6410705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees