JP2011209857A - 既知不良予防・回避システム及び方法 - Google Patents
既知不良予防・回避システム及び方法 Download PDFInfo
- Publication number
- JP2011209857A JP2011209857A JP2010075132A JP2010075132A JP2011209857A JP 2011209857 A JP2011209857 A JP 2011209857A JP 2010075132 A JP2010075132 A JP 2010075132A JP 2010075132 A JP2010075132 A JP 2010075132A JP 2011209857 A JP2011209857 A JP 2011209857A
- Authority
- JP
- Japan
- Prior art keywords
- information
- defect
- version
- avoidance
- known defect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】ソフトウェアにおいて修正パッチを適用しなくても既知不良を回避して運用可能にする。
【解決手段】不良情報取得部101は既知不良情報111を取得する。監視対象システム120は、どのバージョンの既知不良情報であるかを示すバージョン情報121と、ログ情報122と、設定情報123を格納している。不良情報取得部101は、バージョン情報121から監視対象システム120のバージョンを取得し、取得したバージョンで発生する既知不良の情報だけを既知不良情報111から取得する。システム情報監視部102は、ログ情報122、設定情報123の変更を監視し、変更があった場合、変更があった情報が既知不良情報111に設定されている条件を満たすか否かを確認し、条件を満たしていれば、不良回避策通知部103に対して、既知不良の情報を通知する。不良回避策通知部103は、既知不良の情報をシステム管理者端末130に通知する。
【選択図】図1
【解決手段】不良情報取得部101は既知不良情報111を取得する。監視対象システム120は、どのバージョンの既知不良情報であるかを示すバージョン情報121と、ログ情報122と、設定情報123を格納している。不良情報取得部101は、バージョン情報121から監視対象システム120のバージョンを取得し、取得したバージョンで発生する既知不良の情報だけを既知不良情報111から取得する。システム情報監視部102は、ログ情報122、設定情報123の変更を監視し、変更があった場合、変更があった情報が既知不良情報111に設定されている条件を満たすか否かを確認し、条件を満たしていれば、不良回避策通知部103に対して、既知不良の情報を通知する。不良回避策通知部103は、既知不良の情報をシステム管理者端末130に通知する。
【選択図】図1
Description
本発明は、既知不良予防・回避システムに関し、特に、ジョブ運用管理システムなどにおいて用いられるソフトウェアにおいて、ログや設定情報などを監視して、既知不良の発生条件に該当する運用をしている場合に、回避策を事前に通知するシステムに関するものである。
ジョブ運用管理システムなどが会社などで広く用いられているが、これらのシステムに用いられるソフトウェアにおいて、障害が発生することがある。このような障害は、より早く、かつ、簡単に回復させることが望ましい。
障害の発生を防止するために、管理者に事前に情報を提供する技術としては、下記特許文献1のようなものがある。特許文献1に記載の技術は、過去に発生した障害をログ情報などとして蓄積し、蓄積したログ情報に基づいて、管理者に対して、今後起こりうる障害を未然に知らせるために、適切な時期に必要な情報を管理者に通知するものである。
システム運用管理システムなどのソフトウェアは、ソフトウェアのベンダーが提供する修正パッチを適用することで、既知不良による障害の発生を未然に防ぐことができることは知られている。
システム運用管理システムなどのソフトウェアは、基幹系のシステムでも使用されることが多く、障害が発生したときの影響が非常に大きいため、修正パッチにより既知不良による障害発生を予防することは重要である。
しかしながら、特定のバージョンのジョブ運用管理システムなどのソフトウェアで既に運用実績がある場合には、修正パッチの適用により動作が変わる可能性があるため、再度システム検証作業が必要であり、この点を考慮すると、実際には修正パッチ適用が困難なことがしばしば存在する。
また、実際に稼働中のシステムであることから、システムの運用を止めることができない環境では修正パッチを適用することができない。また、実際に既知不良が見つかり、情報が展開されてもすぐに修正パッチが発行されないこともある。このような場合に、修正パッチを適用しないでシステムを運用する必要があるが、修正パッチを適用しないでシステムを運用する場合、既知不良により障害が発生する可能性があるため、既知不良の情報を把握し、既知不良が発生しないように運用する必要がある。このような対策を行うためには、ジョブ運用管理システムなどのソフトウェアを操作する担当者全員に既知不良が判明するたびに展開して周知させ、必要であれば運用の際に既知不良が発生しないように手順書などを作成してその手順を確認しながらの作業が必要になり、運用コストがかかるという問題がある。
また、上記のような運用を行っても、運用作業は人が行うため、人的ミスが発生してしまう可能性があり、既知不良の数に比例して工程・手順なども増えていくことによって、同時にリスクも高くなるという問題がある。
さらに、修正パッチが発行されるたびに、既知不良の内容を把握して展開する作業が発生することで運用コストがかかるという問題もある。
本発明の目的は、既知不良に関する最新情報をWebや媒体経由で取得し、取得した既知不良に該当する既知不良の発生を予測し、既知不良が発生しないよう回避策を事前に通知することにより、修正パッチを適用しなくても既知不良を回避して運用を可能にする既知不良予防・回避システムを提供することにある。
上記の課題を解決するため、本発明では、過去に一度も発生していなくても、既知不良であれば、事前に不良発生を予知して通知することで、障害を回避できるようにする。
本発明の一観点によれば、ジョブ運用管理システムなどのソフトウェアを監視して、既知不良を予測し、回避策を通知するシステムであって、システムにおける既知不良情報のバージョンを示すバージョン情報の取得および該当バージョン情報に対応するバージョンで発生しうる既知不良を予め格納されている既知不良情報データベースから取得する不良情報取得部と、監視対象となるシステムで行われたイベント(操作、処理等)の内容と該イベントの発生時間との対応を示すログ情報と、システムにおける設定名と設定値との対応を示す設定情報の変更を常時監視し、変更があった場合に前記不良情報取得部により取得した既知不良情報から検知条件および検知閾値を満たすかどうか確認し、満たしていた場合に不良通知部に通知するシステム情報監視部と、該システム情報監視部により通知された既知不良の回避策をシステム管理者端末に通知する不良回避策通知部と、を備えることを特徴とする既知不良予防・回避システムが提供される。
前記不良情報取得部は、監視対象となるシステムのバージョン情報を取得して、取得したバージョン情報に該当する既知不良を前記既知不良情報から取得する手段を備えることを特徴とする。前記システム情報監視部は、監視対象となるシステムの前記ログ情報、前記設定情報の変更を常時監視し、変更があった際に、前記不良情報取得部で取得した既知不良の情報から検知条件および検知閾値を満たすか否か確認し、前記検知条件および前記検知閾値を満たしていた場合に、前記不良回避策通知部に不良の回避策を通知する手段を備えることを特徴とする。前記不良回避策通知部は、前記システム情報監視部から通知された回避策を前記システム管理者端末に通知する手段を備えることを特徴とする。
本発明の他の観点によれば、コンピュータ上で動作するソフトウェアが、ジョブ運用管理システムなどの他のコンピュータ上で動作するソフトウェアを監視して、既知不良を予測し、回避策を通知する方法であって、システムにおける既知不良情報のバージョンを示すバージョン情報の取得および該当バージョン情報に対応するバージョンで発生しうる既知不良を予め格納されている既知不良情報データベースから取得する不良情報取得ステップと、監視対象となるシステムで行われたイベントの内容と該イベントの発生時間との対応を示すログ情報と、システムにおける設定名と設定値との対応を示す設定情報の変更を常時監視し、変更があった場合に前記不良情報取得部により取得した既知不良情報から検知条件および検知閾値を満たすかどうか確認し、満たしていた場合に不良通知部に通知するシステム情報監視ステップと、該システム情報監視ステップにより通知された既知不良の回避策をシステム管理者端末に通知する不良回避策通知ステップと、を備えることを特徴とする既知不良予防・回避方法が提供される。
本発明は、上記の方法をコンピュータに実行させるためのプログラムでも良く、該プログラムを記録するコンピュータ読みとり可能な記録媒体であっても良い。
本発明によれば、既知不良が増えても、既知不良予防・回避システムにより監視対象となるシステムのバージョンで発生しうる既知不良を検知条件に従って予測し通知する作業を自動化するため、人的ミスが少なくなるという利点がある。
また、従来では、人が監視対象となるシステムの既知不良を把握し、運用していたが、既知不良予防・回避システムが該当する既知不良の把握及び通知を自動で行うことにより、運用コストを削減することができるという利点もある。
また、修正パッチが提供されていない既知不良でも、既知不良予防回避システムにより回避策を通知できるため、修正パッチが適用されていない既知不良による障害も未然に防ぐことができるという利点がある。
以下、本発明の一実施の形態に係る既知不良予防・回避システムについて、図面を参照しながら説明を行う。
図1は、本実施の形態に係る既知不良予防・回避システムの概略構成例を示す機能ブロック図である。
図1に示すように、既知不良予防・回避システム100は、不良情報取得部101と、システム情報監視部102と、不良回避策通知部103と、の各処理部から構成されている。また、不良情報取得部101に必要な情報として、監視対象システム120の開発ベンダーが既に知られている不良情報である既知不良情報を格納する既知不良情報DBを用意しており、その中に格納されている既知不良情報データベース(DB)内に格納される既知不良情報111をWeb経由または媒体経由で取得できるようになっている。ここで、既知不良予防・回避システム100は、1台又は複数台のコンピュータ・サーバ上で動作するものとする。
監視対象システム120は、既知不良予防・回避システム100が監視する対象となるジョブ運用管理システムなどのソフトウェアであり、通常は既知不良予防・回避システム100とは別のコンピュータ上で動作していて、ネットワーク等を介して既知不良予防・回避システム100と接続されている。監視対象システム120は、システムにおいて、どのバージョンの既知不良情報であるか否かを示すバージョン情報121と、ログ情報122と、後述する設定情報123などの監視対象となる情報を格納している。
不良情報取得部101は、バージョン情報121から監視対象システム120のバージョンを取得し、取得したバージョンで発生する既知不良の情報だけを既知不良情報111から取得する。
システム情報監視部102は、ログ情報122、設定情報123の変更を監視する。ログ情報122、設定情報123に変更があった場合、システム情報監視部102は、変更があった情報が、不良情報取得部101が取得した既知不良情報111に設定されている条件を満たすか否かを確認し、この既知不良情報111に設定されている条件を満たしていれば、不良回避策通知部103に対して、この条件を満たした既知不良の情報を通知する。
不良回避策通知部103は、システム情報監視部102から通知された既知不良の情報をシステム管理者端末130に通知する。既知不良の情報通知する方法は、例えば電子メールや、オペレーティングシステム(OS)のログへの出力、専用のGUI画面、ポップアップ画面などを使用するのが好ましい。
尚、既知不良予防・回避システム100には、図示しないがメモリが含まれている。
尚、既知不良予防・回避システム100には、図示しないがメモリが含まれている。
図2は、監視対象システム120のログ情報DBに格納されているログ情報122のログの内容の一例を示す図である。図2に示すように、ログ情報122は、監視対象の種類201、ログ情報の発生の時間202、ログ内容203が例えば時系列的に構成される。
ここで、種類201は、ログの種類を示す。情報、警告、エラーなどの種類を定義する。時間202は、ログ内容203に記載された操作や処理が行われた時間である。ログ内容203は、監視対象システム120で行われた操作や、処理などイベントの内容を示し、例えば「ジョブAを登録」や、「ジョブAが実行開始」などの情報が出力される。このように、ログ情報122は、時々刻々と発生するログに関するログの内容を時系列的に記載していったものであり、時々刻々と変化する場合もありうる。
図3は、監視対象システム120の設定情報DBに格納されている設定情報123の内容の一例を示す図である。図3に示すように、設定名301と設定値302との対から構成される。設定名301は設定情報123の名前であり、設定値302は設定情報の内容(値)である。設定名301、設定値302は、例えば、機能の有効・無効や、ログのサイズの変更などを行うためのものである。この情報は予め設定してあるが、変更は可能である。但し、ログ情報のように時々刻々と変化するようなものではない。
図4は、監視対象システム120の開発ベンダー側で予め見つけておいたりして用意した既知不良情報DB内に格納されている既知不良情報111に格納されている既知不良の情報の一例を示す図である。図4に示すように、既知不良情報111のテーブルデータには、種々の既知不良情報のID401と、ID毎に用意されたバージョン情報402、不良内容403、検知条件404、検知閾値405、検知リセット条件406、回避策407、が設けられている。以下に詳細に説明する。
ID401は、既知不良に一意に設定される番号であり、既知不良を識別するために使用される。
バージョン情報402は、不良が発生するバージョンを示すものであり、監視対象システム120内のバージョン情報121から取得した検知されたバージョンと比較することで、該当バージョンで発生しうるバージョンの不良だけを取得することができる。
不良内容403は、不良により生じる現象などの不良の内容を表し、回避策407をシステム管理者端末130に通知する際に回避策407とともに一緒に通知することで対処すべき不良なのかどうかを判断する材料とすることができる。
検知条件404は、不良を検知して回避策407を通知する際の条件を示すものであり、システム情報監視部102が、監視対象システム120のログ情報122、設定情報123の変更を監視して、図4に示された検知条件404および検知閾値405を満たした場合に回避策をシステム管理者端末に対して通知する。検知条件404には、例えば、「ログ情報122にジョブの実行開始が出力される」や「設定情報123の機能Xが有効になる」などの条件が1つ或いは複数登録されている。
検知閾値405は、検知条件404が複数登録されている場合に、検知条件404を何個満たしたときに回避策を通知するかなどの閾値条件を示すものであり、例えば、「いずれかを満たす」(ID1に例示)、「すべて満たす」(ID2に例示)や、「3個満たす」や「検知条件aを満たしたうえで、検知条件bまたは検知条件cを満たした場合」などの閾値を登録する。
検知リセット条件406は、検知条件404をいくつか満たしていて、検知閾値405を満たしておらず、回避策407を通知していない場合に、満たしている検知条件404をリセットする際の条件である。検知リセット条件406は、例えば、「ログ情報122にシステムの起動が出力される」や、「設定情報123の機能Xが無効になる」などの、図2、図3に示した条件を登録する。
回避策407は、検知条件404および検知閾値405を満たした場合にシステム管理者端末130に通知する既知不良の回避策を示す。例えば、「機能Xを無効にしてください」や、「ジョブを登録解除してください」などの具体的な回避策を予め設定しておく。
図5は、上記システムを構築した後に、システムを稼働させる場合の、不良情報取得部101の処理の流れを示すフローチャート図である。
不良情報取得部101が処理を開始すると、監視対象システム120のバージョン情報121から監視対象システム120のバージョンを取得する(ステップS501)。取得したバージョンで発生しうる既知不良を既知不良情報111から取得する(ステップS502)。既知不良の情報の変更があった場合(ステップS503)、既知不良の情報をメモリやDB(図示せず)などに格納または更新する(ステップS504)。以降は、ステップS501〜ステップS504を繰り返し行う。
図6は、システム情報監視部102の処理の流れを示すフローチャート図である。システム情報監視部102が動作を開始すると、ログ情報122、または、設定情報123から情報を取得する(ステップS601)。ログ情報122または設定情報123の少なくともいずれか一方に変更があった場合であって(ステップS602でYES)、変更があった情報が、不良情報取得部101で取得した既知不良の検知条件および検知閾値を満たしていた場合(ステップS603でYES)、不良回避策通知部103に条件を満たしたことを通知する(ステップS604)。そして、通知した既知不良を再び検知しないように検知条件をリセットする(ステップS606)。ステップS603で検知条件および検知閾値を満たさなかった場合で(S603でNO)、変更があった情報が、不良情報取得部101で取得した既知不良の検知リセット条件を満たす場合(S605でYES)、変更があった既知不良の検知条件をリセットする(ステップS606)。ステップS606以降および、ステップS602またはステップS605で条件が偽だった場合(NO)、ステップS601〜ステップS606を繰り返し行うことで監視を継続する。
図7は不良回避策通知部103における処理の流れを示すフローチャート図である。不良回避策通知部103での動作が開始すると、システム情報監視部102から通知があるかどうか確認し(ステップS701)、通知があった場合(YES)、既知不良の情報の不良内容および回避策をシステム管理者に通知する(ステップS702)。通知がない場合(NO)、通知があるまでシステム情報監視部102からの通知を待ち続ける(ステップS701)。この動作も継続的に実行される。
図8は、不良回避策通知部103からの通知の例であり、専用のGUI画面を用意した場合の一例である。
警告メッセージポップアップ801は、不良内容802、回避策803で構成されるGUI画面である。不良回避策通知部103からシステム管理者130に回避策が通知されると、システム管理者のPC上で、警告メッセージポップアップ801のGUI画面が表示され、システム管理者端末130においては、この情報をもとに既知不良による障害の発生を回避することができる。
本発明によれば、既知不良が増えても、既知不良予防・回避システムにより監視対象となるシステムのバージョンで発生しうる既知不良を検知条件に従って予測し通知する作業を自動化するため、人的ミスが少なくなるという利点がある。
また、従来では、人が監視対象となるシステムの既知不良を把握し、運用していたが、既知不良予防・回避システムが該当する既知不良の把握及び通知を自動で行うことにより、運用コストを削減することができるという利点もある。
また、修正パッチが提供されていない既知不良でも、既知不良予防回避システムにより回避策を通知できるため、修正パッチが適用されていない既知不良による障害も未然に防ぐことができるという利点がある。
尚、本発明は、本実施の形態による方法を、コンピュータに実行させるためのプログラムであっても良く、また、かかるプログラムを記録したコンピュータ読み取り可能な記録媒体であっても良い。
本発明は、ジョブ運用システムにおいて利用可能である。
100…既知不良予防・回避システム、101…不良情報取得部、102…システム情報監視部、103…不良回避策通知部、111…既知不良情報、120…監視対象システム、121…バージョン情報、122…ログ情報、123…設定情報、130…システム管理者端末。
Claims (5)
- ジョブ運用管理システムなどのソフトウェアを監視して、既知不良を予測し、回避策を通知するシステムであって、
システムにおける既知不良情報のバージョンを示すバージョン情報の取得および該当バージョン情報に対応するバージョンで発生しうる既知不良を予め格納されている既知不良情報データベースから取得する不良情報取得部と、
監視対象となるシステムで行われたイベントの内容と該イベントの発生時間との対応を示すログ情報と、システムにおける設定名と設定値との対応を示す設定情報の変更を常時監視し、変更があった場合に前記不良情報取得部により取得した既知不良情報から検知条件および検知閾値を満たすかどうか確認し、満たしていた場合に不良通知部に通知するシステム情報監視部と、
該システム情報監視部により通知された既知不良の回避策をシステム管理者端末に通知する不良回避策通知部と
を備えることを特徴とする既知不良予防・回避システム。 - 前記不良情報取得部は、監視対象となるシステムのバージョン情報を取得して、取得したバージョン情報に該当する既知不良を前記既知不良情報から取得する手段を備えることを特徴とする請求項1に記載の既知不良予防・回避システム。
- 前記システム情報監視部は、監視対象となるシステムの前記ログ情報、前記設定情報の変更を常時監視し、変更があった際に、前記不良情報取得部で取得した既知不良の情報から検知条件および検知閾値を満たすか否か確認し、前記検知条件および前記検知閾値を満たしていた場合に、前記不良回避策通知部に不良の回避策を通知する手段を備えることを特徴とする請求項1又は2に記載の既知不良予防・回避システム。
- 前記不良回避策通知部は、前記システム情報監視部から通知された回避策を前記システム管理者端末に通知する手段を備えることを特徴とする請求項3に記載の既知不良予防・回避システム。
- コンピュータ上で動作するソフトウェアが、ジョブ運用管理システムなどの他のコンピュータ上で動作するソフトウェアを監視して、既知不良を予測し、回避策を通知する方法であって、
システムにおける既知不良情報のバージョンを示すバージョン情報の取得および該当バージョン情報に対応するバージョンで発生しうる既知不良を予め格納されている既知不良情報データベースから取得する不良情報取得ステップと、
監視対象となるシステムで行われたイベントの内容と該イベントの発生時間との対応を示すログ情報と、システムにおける設定名と設定値との対応を示す設定情報の変更を常時監視し、変更があった場合に前記不良情報取得部により取得した既知不良情報から検知条件および検知閾値を満たすかどうか確認し、満たしていた場合に不良通知部に通知するシステム情報監視ステップと、
該システム情報監視ステップにより通知された既知不良の回避策をシステム管理者端末に通知する不良回避策通知ステップと
を備えることを特徴とする既知不良予防・回避方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010075132A JP2011209857A (ja) | 2010-03-29 | 2010-03-29 | 既知不良予防・回避システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010075132A JP2011209857A (ja) | 2010-03-29 | 2010-03-29 | 既知不良予防・回避システム及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011209857A true JP2011209857A (ja) | 2011-10-20 |
Family
ID=44940877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010075132A Pending JP2011209857A (ja) | 2010-03-29 | 2010-03-29 | 既知不良予防・回避システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011209857A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013076798A1 (ja) * | 2011-11-21 | 2013-05-30 | 富士通株式会社 | 障害発生防止装置、障害発生防止方法、障害発生防止プログラム及び媒体 |
-
2010
- 2010-03-29 JP JP2010075132A patent/JP2011209857A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013076798A1 (ja) * | 2011-11-21 | 2013-05-30 | 富士通株式会社 | 障害発生防止装置、障害発生防止方法、障害発生防止プログラム及び媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107660289B (zh) | 自动网络控制 | |
JP6333410B2 (ja) | 障害処理方法、関連装置、およびコンピュータ | |
WO2017063505A1 (zh) | 一种服务器硬件故障检测方法及其装置和服务器 | |
US20110004791A1 (en) | Server apparatus, fault detection method of server apparatus, and fault detection program of server apparatus | |
US11321454B2 (en) | Notice of intrusion into firmware | |
WO2017045436A1 (zh) | 虚拟机故障处理方法和装置 | |
KR20040047209A (ko) | 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템 | |
US20170132102A1 (en) | Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus | |
US7673178B2 (en) | Break and optional hold on failure | |
WO2010113212A1 (ja) | メモリリーク監視装置、及び方法 | |
JP2012003651A (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
CN113806138A (zh) | 数据库的备份恢复检测方法、装置及电子设备、存储介质 | |
JP4867908B2 (ja) | 監視システム、ネットワーク監視装置及びサービス実行環境監視方法 | |
US20210173689A1 (en) | Associating security tags to continuous data protection checkpoints/snapshots/point-in-time images | |
JP2008003691A (ja) | 計算機のプロセス回復方法、チェックポイントリスタートシステム | |
US20080216057A1 (en) | Recording medium storing monitoring program, monitoring method, and monitoring system | |
CN110968456B (zh) | 分布式存储系统中故障磁盘的处理方法及装置 | |
JP2011209857A (ja) | 既知不良予防・回避システム及び方法 | |
JP5613570B2 (ja) | バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム | |
WO2011051999A1 (ja) | 情報処理装置及び情報処理装置の制御方法 | |
JP2010003132A (ja) | 情報処理装置、その入出力装置の故障検出方法及びプログラム | |
US20200167463A1 (en) | Out-of-Band Content Analysis | |
CN112231063A (zh) | 一种故障处理方法及装置 | |
CN111694715A (zh) | 一种异常告警方法、装置、设备及机器可读存储介质 | |
JP2009059204A (ja) | コンピュータリモート制御システム |