JP6816891B2 - Failure content identification device, system, method, and program - Google Patents
Failure content identification device, system, method, and program Download PDFInfo
- Publication number
- JP6816891B2 JP6816891B2 JP2018029954A JP2018029954A JP6816891B2 JP 6816891 B2 JP6816891 B2 JP 6816891B2 JP 2018029954 A JP2018029954 A JP 2018029954A JP 2018029954 A JP2018029954 A JP 2018029954A JP 6816891 B2 JP6816891 B2 JP 6816891B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- information
- database
- message
- log information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、情報処理装置にインストールされたソフトウェアの障害内容を特定する障害内容特定装置、システム、方法、及び、プログラムに関する。 The present invention relates to a failure content identifying device, a system, a method, and a program for identifying a failure content of software installed in an information processing device.
情報処理装置(サーバ等)にインストールされたソフトウェアの障害内容を特定する障害内容特定装置では、通常、ログ情報やメッセージを取得したときに、障害情報を記憶させたデータベースを用いて、取得したログ情報に対応する障害内容を抽出することによって、ソフトウェアの障害内容を特定する。データベースにおいて、取得したログ情報やメッセージに対応する障害内容がない場合でも、システムやコンポーネントの構成に関する情報を用いて、ソフトウェアの障害内容を特定できるようにした技術がある(例えば、特許文献1、2参照)。 Identifying the details of a failure in software installed on an information processing device (server, etc.) Normally, when a log information or message is acquired, the acquired log is used in a database that stores the failure information. Identify the details of the software failure by extracting the details of the failure corresponding to the information. There is a technique that makes it possible to identify software failure details by using information on system and component configurations even if there is no failure content corresponding to the acquired log information or message in the database (for example, Patent Document 1, 2).
以下の分析は、本願発明者により与えられる。 The following analysis is provided by the inventor of the present application.
しかしながら、特許文献1、2に記載の技術では、データベースにおいて、取得したログ情報やメッセージに対応する障害内容がある場合には、一律に障害内容を特定してしまい、正しい障害内容を特定することができない可能性がある。 However, in the techniques described in Patent Documents 1 and 2, when there is a failure content corresponding to the acquired log information or message in the database, the failure content is uniformly specified, and the correct failure content is specified. May not be possible.
本発明の主な課題は、データベースにおいて、取得したログ情報やメッセージに対応する障害内容がある場合でも正しい障害内容を特定することに貢献することができる障害内容特定装置、システム、方法、及び、プログラムを提供することである。 A main subject of the present invention is a failure content identification device, system, method, and a failure content identification device, a system, a method, which can contribute to identifying the correct failure content even if there is a failure content corresponding to the acquired log information or message in the database. To provide a program.
第1の視点に係る障害内容特定装置は、データを記憶する記憶部と、前記記憶部を制御するとともに、所定の情報処理を行う制御部と、を備える。前記記憶部は、情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理した第1データベースと、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理した第2データベースと、を記憶する。前記制御部は、前記第2データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがあり、かつ、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがあり、かつ、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、ときに、ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信する処理と、を行う。 The failure content identifying device according to the first viewpoint includes a storage unit that stores data and a control unit that controls the storage unit and performs predetermined information processing. The storage unit includes a first database acquired from the information processing device, which is organized by associating and organizing the failure occurrence date and time and the information related to the failure occurrence software, the information related to the software, and the name of the log information. Stores the running message and the second database in which the startup completion message is associated and organized. The control unit performs a process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software in the first database from the second database, and the information processing apparatus. In the process of acquiring the log information corresponding to the name of the extracted log information and the acquired log information, there is the same message as the running message of the second database, and the message of the first database is described. The difference between the failure occurrence date and time and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and in the acquired log information, the activation of the second database is performed. There is the same message as the completion message, and the difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the acquired log information is the second predetermined time or more. At times, a process of transmitting a first notification notifying that a software start delay failure has occurred to the information processing apparatus is performed.
第2の視点に係る障害内容特定システムは、前記第1の視点に係る障害内容特定装置と、前記障害内容特定装置と通信可能に接続された情報処理装置と、を備える。 The failure content identification system according to the second viewpoint includes a failure content identification device according to the first viewpoint and an information processing device communicably connected to the failure content identification device.
第3の視点に係る障害内容特定方法は、第2データベースから、第1データベースの障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出するステップと、情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得するステップと、取得した前記ログ情報において、前記第2データベースの起動中のメッセージと同じメッセージがあり、かつ、前記第1データベースの障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、取得した前記ログ情報において、前記第2データベースの起動完了のメッセージと同じメッセージがあり、かつ、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、ときに、ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信するステップと、を含む。各前記ステップは、ハードウェア資源によって行われる。前記第1データベースは、前記情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理したデータベースである。前記第2データベースは、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理したデータベースである。 The method for identifying the failure content according to the third viewpoint includes a step of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software in the first database from the second database and information processing. In the step of acquiring the log information corresponding to the name of the extracted log information from the apparatus and the acquired log information, there is the same message as the message during the startup of the second database, and the first database The difference between the failure occurrence date and time of the above and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and the second database is started in the acquired log information. There is the same message as the completion message, and the difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the acquired log information is the second predetermined time or more. Includes, sometimes, a step of transmitting a first notification to the information processing apparatus notifying that a software startup delay failure has occurred. Each said step is performed by hardware resources. The first database is a database obtained by associating and organizing information on a failure occurrence date and time and failure occurrence software related to the information processing device acquired from the information processing device. The second database is a database in which information related to software, names of log information, messages during startup, and messages of completion of startup are associated and organized.
第4の視点に係るプログラムは、第2データベースから、第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、取得した前記ログ情報において、前記第2データベースの起動中のメッセージと同じメッセージがあり、かつ、前記第1データベースの障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、取得した前記ログ情報において、前記第2データベースの起動完了のメッセージと同じメッセージがあり、かつ、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、ときに、ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信する処理と、をハードウェア資源に実行させる。前記第1データベースは、前記情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理したデータベースである。前記第2データベースは、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理したデータベースである。なお、前記第4の視点に係るプログラムは、非過渡的(non-transient)な記録媒体に記録できる。 The program according to the fourth viewpoint is a process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software in the first database from the second database, and from the information processing apparatus. , The process of acquiring the log information corresponding to the name of the extracted log information, and the acquired log information have the same message as the message during the startup of the second database, and the failure of the first database. The difference between the occurrence date and time and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and in the acquired log information, the startup of the second database is completed. When there is the same message as the message, and the difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the acquired log information is greater than or equal to the second predetermined time. The hardware resource is made to execute the process of transmitting the first notification notifying that the software start delay failure has occurred to the information processing apparatus. The first database is a database obtained by associating and organizing information on a failure occurrence date and time and failure occurrence software related to the information processing device acquired from the information processing device. The second database is a database in which information related to software, names of log information, messages during startup, and messages of completion of startup are associated and organized. The program according to the fourth viewpoint can be recorded on a non-transient recording medium.
前記第1〜第4の視点によれば、正しい障害内容を特定することに貢献することができる。 According to the first to fourth viewpoints, it is possible to contribute to identifying the correct content of the failure.
以下、実施形態について図面を参照しつつ説明する。なお、本出願において図面参照符号を付している場合は、それらは、専ら理解を助けるためのものであり、図示の態様に限定することを意図するものではない。また、下記の実施形態は、あくまで例示であり、本発明を限定するものではない。さらに、以降の説明で参照する図面等のブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号(データ)の流れを模式的に示すものであり、双方向性を排除するものではない。 Hereinafter, embodiments will be described with reference to the drawings. In addition, when the drawing reference reference numerals are attached in this application, they are for the purpose of assisting understanding only, and are not intended to be limited to the illustrated embodiment. Further, the following embodiments are merely examples, and do not limit the present invention. Further, the connecting lines between blocks such as drawings referred to in the following description include both bidirectional and unidirectional. The one-way arrow schematically shows the flow of the main signal (data), and does not exclude interactivity.
[実施形態1]
実施形態1に係る障害内容特定システムについて図面を用いて説明する。図1は、実施形態1に係る障害内容特定システムの構成を模式的に示したブロック図である。図2は、実施形態1に係る障害内容特定システムにおいて用いられる障害状況情報データベースの一例の構成を模式的に示したテーブルである。図3は、実施形態1に係る障害内容特定システムにおいて用いられる障害情報データベースの一例の構成を模式的に示したテーブルである。図4は、実施形態1に係る障害内容特定システムにおいて用いられる起動確認データベースの一例の構成を模式的に示したテーブルである。図5は、実施形態1に係る障害内容特定システムにおいて用いられる障害発生確認データベースの一例の構成を模式的に示したテーブルである。図6は、実施形態1に係る障害内容特定システムにおいて用いられるアップデート確認データベースの一例の構成を模式的に示したテーブルである。図7は、実施形態1に係る障害内容特定システムにおいて用いられる起動中のメッセージの一例である。図8は、実施形態1に係る障害内容特定システムにおいて用いられる起動完了のメッセージの一例である。
[Embodiment 1]
The failure content identification system according to the first embodiment will be described with reference to the drawings. FIG. 1 is a block diagram schematically showing the configuration of the failure content identification system according to the first embodiment. FIG. 2 is a table schematically showing the configuration of an example of the failure status information database used in the failure content identification system according to the first embodiment. FIG. 3 is a table schematically showing the configuration of an example of the failure information database used in the failure content identification system according to the first embodiment. FIG. 4 is a table schematically showing the configuration of an example of the start confirmation database used in the failure content identification system according to the first embodiment. FIG. 5 is a table schematically showing the configuration of an example of the failure occurrence confirmation database used in the failure content identification system according to the first embodiment. FIG. 6 is a table schematically showing the configuration of an example of the update confirmation database used in the failure content identification system according to the first embodiment. FIG. 7 is an example of a message during activation used in the failure content identification system according to the first embodiment. FIG. 8 is an example of a start-up completion message used in the failure content identification system according to the first embodiment.
障害内容特定システム1は、顧客装置100にインストールされたソフトウェアの障害内容を障害内容特定装置300で特定するシステムである(図1参照)。障害内容特定システム1は、顧客装置100と、ネットワーク200と、障害内容特定装置300と、を有する。
The failure content identification system 1 is a system that identifies the failure content of the software installed in the
顧客装置100は、顧客が使用(所有、レンタルでも可)する情報処理装置である。顧客装置100は、装置単体だけでなく、複数の装置が協働するシステムを含む。顧客装置100は、主な構成部として、制御部110と、入力部120と、出力部130と、通信部140と、記憶部150と、を有する。
The
制御部110は、入力部120、出力部130、通信部140、及び、記憶部150を制御する機能部である(図1参照)。制御部110は、入力部120を制御して、入力部120から入力された情報を取り込む。制御部110は、出力部130を制御して、出力部130に情報を出力させる。制御部110は、通信部140を制御して、障害内容特定装置300に対する情報の送受信を行う。制御部110は、記憶部150へのデータの入出力、記憶部150へのデータの書き込みや読み出しを行う。制御部110は、ソフトウェア(オペレーティングシステムソフトウェアを含む)を実行することにより所定の情報処理を行う。
The
制御部110は、ソフトウェアに障害が発生した時に、オペレーティングシステム又は障害を起こしたソフトウェアによって、障害を特定する。制御部110は、オペレーティングシステム又は障害を起こしたソフトウェアによって特定された障害に対応するログ情報151を出力する。制御部110は、出力されたログ情報151を記憶部150に記憶させる。制御部110は、記憶部150に記憶されたログ情報151を、通信部140を通じて障害内容特定装置300に送信させる。制御部110は、顧客装置100のユーザの操作により入力部120から入力された障害状況情報を取得する。制御部110は、取得した障害状況情報を、通信部140を通じて障害内容特定装置300に送信させる。制御部110は、通信部140を通じて障害内容特定装置300からの障害情報を受信した時に、受信した障害情報を出力部130から出力させる。制御部110のその他の詳細については、後述する。
When a software failure occurs, the
ここで、障害状況情報は、障害発生時に、ユーザが入力部120から入力した障害発生日時、障害発生ソフトウェア、障害発生時メッセージ、及び、障害発生直前操作を含む情報である。障害状況情報は、障害発生の判断をするために必要な情報である。障害状況情報は、顧客装置100のユーザによって入力されたものでもよく、制御部110によって生成されたものでもよい。障害状況情報は、予め定めた複数の情報(例えば、文字列)の中から選択(例えば、プルダウンメニューでの選択、ラジオボタンでの選択)して入力できるようにしたものとすることが好ましい。なお、障害状況情報は、全ての項目について入力されている必要はなく、実施する動作を行なうために必要な項目のみ入力されたものでもよい。障害状況情報は、ログ情報151とともに、記憶部150に記憶しておき、必要なときに取得できるようにしておいてもよい。
Here, the failure status information is information including the failure occurrence date and time, the failure occurrence software, the failure occurrence message, and the operation immediately before the failure occurrence, which are input by the user from the
障害発生日時は、オペレーティングシステム又は障害が発生したソフトウェアによって障害発生時メッセージが出力部130から出力(例えば、表示)された日時である。障害発生日時は、顧客装置100のユーザが障害発生時メッセージを認識した日時でもよく、メッセージが出力された瞬間の日時を正確に入力する必要はない。
The failure occurrence date and time is the date and time when the failure occurrence message is output (for example, displayed) from the output unit 130 by the operating system or the failure software. The failure occurrence date and time may be the date and time when the user of the
障害発生ソフトウェアは、顧客装置100のユーザによって障害が発生したと認識されたソフトウェアを特定する情報(例えば、ソフトウェアの名称)である。障害発生ソフトウェアの名称は、障害発生時メッセージに含まれる情報とすることができる。
The failure occurrence software is information (for example, the name of the software) that identifies the software that has been recognized as having a failure by the user of the
障害発生時メッセージは、障害発生時に、オペレーティングシステム又は障害が発生したソフトウェアによって出力部130から出力(例えば、表示)されたメッセージである(以下、同様)。障害発生時メッセージは、顧客装置100のユーザによって読み取られたものとすることができる。障害発生時メッセージには、メッセージを出力したソフトウェアを特定できる情報が含まれている。なお、障害発生時メッセージは、必須情報ではない。
The failure occurrence message is a message output (for example, displayed) from the output unit 130 by the operating system or the failure software at the time of failure occurrence (hereinafter, the same applies). The failure occurrence message can be assumed to have been read by the user of the
障害発生直前操作は、顧客装置100のユーザが障害発生の直前(障害と推定される事象が発生した時点より所定時間遡った時点の間)に行った操作の内容である。障害と推定される事象とは、例えば、障害発生時メッセージが出力されないが、ソフトウェア起動に必要な時間を所定割合越えてから起動した場合、もしくは、起動しなかった場合、等も含む。
The operation immediately before the occurrence of a failure is the content of the operation performed by the user of the
入力部120は、情報を入力するための機能部である(図1参照)。入力部120には、例えば、キーボード、マウス、タッチパネル、マイク、ボタン、その他の入力手段を用いることができ、図示しない通信部を介して通信可能に接続された入力部を有する情報端末等を用いてもよい。
The
出力部130は、情報を出力(表示、音声出力、印刷等)するための機能部である(図1参照)。出力部130として、例えば、表示を行うディスプレイ、印刷を行うプリンタ、その他の出力手段を用いることができ、図示しない通信部を介して通信可能に接続された出力部を有する情報端末等を用いてもよい。また、出力部130を使用する代わりに、通信部140及びネットワーク200を通じて接続された別の情報端末等(図示せず;例えば、ユーザが使用する端末)を使用して情報を出力するようにしてもよい。
The output unit 130 is a functional unit for outputting information (display, audio output, printing, etc.) (see FIG. 1). As the output unit 130, for example, a display for displaying, a printer for printing, or other output means can be used, and an information terminal or the like having an output unit communicably connected via a communication unit (not shown) is used. May be good. Further, instead of using the output unit 130, information is output by using another information terminal or the like (not shown; for example, a terminal used by the user) connected through the
通信部140は、情報を通信(送受信)するための機能部(例えば、インタフェース等)である(図1参照)。通信部140は、ネットワーク200に通信可能に接続されている。
The
記憶部150は、各種データ、プログラム、ファイル等の情報を記憶する機能部である(図1参照)。記憶部150として、例えば、ハードディスク装置でも、外部接続されたRAID(Redundant Arrays of Independent Disks)装置等を用いることができ、どの様な不揮発性記憶装置を用いてもよい。記憶部150は、インストールされたソフトウェアを記憶する。記憶部150は、ログ情報151を記憶する。
The
ここで、ログ情報151は、オペレーティングシステム又は障害が発生したソフトウェアによって出力された、ソフトウェアの障害解析(障害調査)に必要な各種コマンドの実行結果に関する情報である。ログ情報151は、ログ情報の名称(ソフトウェアが使用するファイル名)及びメッセージ(ログ情報中のメッセージ)を含んだものである。ログ情報151にはオペレーティングシステムやソフトウェアの種類の情報、それらのバージョンを示す情報が含まれているので、それらの情報を特定するときにログ情報151を用いることができる。ログ情報151は、オペレーティングシステムが出力するものである場合、所定の処理のみで使用するため、不要な場合がある。ログ情報151は、記憶部150に記憶し、必要なときに取得できるようになっている。
Here, the
ネットワーク200は、顧客装置100と障害内容特定装置300とを有線又は無線により通信可能に接続する情報通信網である(図1参照)。
The
障害内容特定装置300は、顧客装置100にインストールされたソフトウェアの障害内容を特定する情報処理装置(ハードウェア資源)である(図1参照)。障害内容特定装置300は、制御部310と、入力部320と、出力部330と、通信部340と、記憶部350と、を有する。
The failure
制御部310は、入力部320、出力部330、通信部340、及び、記憶部350を制御する機能部である(図1参照)。制御部310は、入力部320を制御して、入力部320から入力された情報を取り込む。制御部310は、出力部330を制御して、出力部330に情報を出力させる。制御部310は、通信部340を制御して、顧客装置100に対する情報の送受信を行う。制御部310は、記憶部350へのデータの入出力、記憶部350内に記憶された各種データベース351〜355へのデータの書き込みや読み出しを行う。制御部310は、ソフトウェアを実行することにより、各種データベース351〜355等を適宜用いて、所定の情報処理を行う。
The
制御部310は、通信部340を通じて顧客装置100からの障害状況情報を受信した時に、受信した障害状況情報を障害状況情報データベース351に登録する。制御部310は、通信部340を通じて顧客装置100からのログ情報151を受信したときに、障害情報データベース352において、受信したログ情報151中のメッセージに対応するメッセージが存在するか否か判断する。制御部310は、対応するメッセージが存在する場合、障害情報データベース352から、対応するメッセージに関連付けられた障害情報を抽出する。制御部310は、抽出された障害情報を、通信部340及びネットワーク200を通じて、顧客装置100に送信する。なお、制御部310のその他の動作の詳細については、後述する。
When the
入力部320は、情報を入力するための機能部である(図1参照)。入力部320には、例えば、キーボード、マウス、タッチパネル、マイク、ボタン、その他の入力手段を用いることができ、図示しない通信部を介して通信可能に接続された入力部を有する情報端末等を用いてもよい。
The
出力部330は、情報を出力(表示、音声出力、印刷等)するための機能部である(図1参照)。出力部330として、例えば、表示を行うディスプレイ、印刷を行うプリンタ、その他の出力手段を用いることができ、図示しない通信部を介して通信可能に接続された出力部を有する情報端末等を用いてもよい。また、出力部330を使用する代わりに、通信部340及びネットワーク200を通じて接続された別の情報端末等(図示せず;例えば、ユーザが使用する端末)を使用して情報を出力するようにしてもよい。
The
通信部340は、情報を通信(送受信)するための機能部(例えば、インタフェース等)である(図1参照)。通信部340は、ネットワーク200に通信可能に接続されている。
The
記憶部350は、各種データ、プログラム、ファイル等の情報を記憶する機能部である(図1参照)。記憶部350として、例えば、ハードディスク装置でも、外部接続されたRAID(Redundant Arrays of Independent Disks)装置等を用いることができ、どの様な不揮発性記憶装置を用いてもよい。記憶部350は、ソフトウェアで発生した障害内容を特定するためのプログラムを記憶する。記憶部350は、障害情報データベース352と、障害状況情報データベース351と、起動確認データベース353と、障害発生確認データベース354と、アップデート確認データベース355と、を記憶する。
The
障害状況情報データベース351は、障害が発生した顧客装置100の過去の障害状況情報を蓄積したデータベース(第1データベース)である(図1参照)。障害状況情報データベース351は、障害状況情報の要素となる障害発生日時、障害発生ソフトウェア、障害発生時メッセージ、及び、障害発生直前操作が整理されて関連付けられている(図2参照)。
The failure
障害情報データベース352は、ソフトウェア毎に予め用意された、過去の障害情報及びその関連情報を蓄積したデータベース(第3データベース)である(図1参照)。障害情報データベース352は、障害情報の要素となるログ情報(ログ情報の名称、ログ情報中のメッセージ)、障害情報、原因及び障害復旧に必要な操作が整理されて関連付けられている(図3参照)。ログ情報の名称は、ファイル名とすることができる(以下、同様)。障害情報は、障害発生の有無のみの場合を含む。原因及び障害復旧に必要な操作は、任意情報であり、障害情報データベース352に含まれていなくてもよい。
The
ここで、ログ情報は、同一のソフトウェアから2つ以上出力される場合がある。ログ情報のファイルは、そのログ情報のファイルを出力したソフトウェアの機能毎に分かれて出力されるため、各ログ情報のファイル名は、ソフトウェアの機能のログ情報であることを示している。例えば、ソフトウェアの機能とは、ソフトウェアが通信機能を有する場合、その通信機能に関するログ情報は、その機能のログ情報を意味するファイル名で出力され、その画面表示機能に関するログ情報は、その機能のログ情報を意味するファイル名で出力される。 Here, two or more log information may be output from the same software. Since the log information file is output separately for each function of the software that output the log information file, the file name of each log information indicates that it is the log information of the software function. For example, when a software function has a communication function, the log information related to the communication function is output with a file name meaning the log information of the function, and the log information related to the screen display function is the log information of the function. It is output with a file name that means log information.
起動確認データベース353は、ソフトウェア毎に予め用意された、起動中及び起動完了を確認するための情報を蓄積したデータベース(第2データベース)である(図1参照)。起動確認データベース353は、ソフトウェア、起動中のメッセージ、起動完了のメッセージ、及び、ログ情報の名称が整理されて関連付けられている(図4参照)。ソフトウェアは、ソフトウェアを識別する情報である(以下、同様)。起動中のメッセージは、起動中にソフトウェア又はオペレーティングシステムから出力されたログ情報中のメッセージ(起動中であることが確認できるメッセージ)である。起動完了のメッセージは、起動完了時にソフトウェア又はオペレーティングシステムから出力されたログ情報中のメッセージ(起動が完了したことが確認できるメッセージ)である。起動中のメッセージは、起動完了のメッセージとは異なる。また、起動中のメッセージ、及び、起動完了のメッセージは、ソフトウェア毎の起動開始時(直近の起動命令時)に出力されるログ情報中のメッセージ(図示せず)とは異なる。なお、ソフトウェア毎の起動開始時に出力されるログ情報中のメッセージは、起動中のメッセージ、及び、起動完了のメッセージとは別に記憶される。ここで、ソフトウェア毎の起動開始時に出力されるログ情報中のメッセージが出力される時刻は、ログ情報中の当該メッセージの箇所に出力されている時刻であり、起動開示時刻となる。
The
(起動中のメッセージの例)
起動指示したソフトウェアの出力するログ情報のファイル名は、「webotx_agent.log」である。当該ファイル名に出力される起動中のメッセージを意味する情報は、図7に示す内容である。図7の起動中のメッセージの例では、起動指示したソフトウェアは、当該ソフトウェアが出力するログ情報のファイル名「webotx_agent.log」である。図7の起動中のメッセージの例では、当該ソフトウェアが起動時に出力される、当該ソフトウェアが起動中であることを意味するログ情報中のメッセージは、「OTX02050031 WEB0302: Webコンテナを起動しています。」である。
(Example of running message)
The file name of the log information output by the software instructed to start is "webotx_agent.log". The information indicating the running message output to the file name is the content shown in FIG. In the example of the message during startup in FIG. 7, the software instructed to start is the file name "webotx_agent.log" of the log information output by the software. In the example of the running message in Fig. 7, the message in the log information that means that the software is running, which is output when the software is started, is "OTX02050031 WEB0302: The web container is started. ".
(起動完了のメッセージの例)
起動指示したソフトウェアの出力するログ情報のファイル名は、「webotx_agent.log」である。当該ファイル名に出力される起動完了のメッセージを意味する情報は、図8に示す内容である。図8の起動完了のメッセージの例では、起動指示したソフトウェアは、当該ソフトウェアが出力するログ情報のファイル名「webotx_agent.log」である。図8の起動完了のメッセージの例では、当該ソフトウェアが起動完了時に出力される、当該ソフトウェアが起動完了であることを意味するログ情報中のメッセージは、「OTX01205135: アプリケーションサーバ [domain1] の起動に成功しました。」である。なお、起動完了のメッセージが出力される時間を起動完了時刻とする。起動中にもログ情報中のメッセージが出力されるため、起動完了時点のメッセージを検出して起動完了時刻とする。
(Example of startup completion message)
The file name of the log information output by the software instructed to start is "webotx_agent.log". The information indicating the start-up completion message output to the file name is the content shown in FIG. In the example of the start completion message of FIG. 8, the software instructed to start is the file name "webotx_agent.log" of the log information output by the software. In the example of the startup completion message in FIG. 8, the message in the log information indicating that the software has been started, which is output when the software has been started, is "OTX01205135: When the application server [domain1] is started. It was successful. " The time when the startup completion message is output is defined as the startup completion time. Since the message in the log information is output even during startup, the message at the time of completion of startup is detected and set as the startup completion time.
障害発生確認データベース354は、ソフトウェア毎の操作による障害発生を確認するための情報を蓄積したデータベース(第4データベース)である(図1参照)。障害発生確認データベース354は、ソフトウェア、障害発生時メッセージ、障害発生直前操作、操作時出力メッセージ、及び、ログ情報の名称が整理されて関連付けられている(図5参照)。操作時出力メッセージは、ユーザが操作を行った時にソフトウェア又はオペレーティングシステムから出力されたメッセージである。
The failure
ここで、障害発生確認データベース354を設定している理由は、以下のとおりである。記憶されている情報を外部記憶装置に記憶する(バックアップする)場合、新品のテープ装置に初期設定を行うと、ソフトウェアの種類(例えば、DELL EMC社製のNetworkerなど)により、I/O(Input/Output)エラーが出力されることがある。当該I/Oエラーは、通常、障害発生を意味するメッセージだが、新品のテープに対し、ソフトウェアで使用するデータ記憶用フォーマットを行い、各データ領域を分離管理するために、各データ領域にラベル情報をフォーマットする際、付加するラベル付操作を行った場合、障害ではなく、初期設定が、正常動作と異なることによって発生するメッセージである。そのため、I/Oエラーは、初期設定が完了すれば、問題はなくなるので、結果、障害発生ではないと判断することができる。ログ情報の出力内容(もしくは、出力メッセージ)が、他の操作内容により障害とはならないか、すなわち、予め登録した複数のログ情報の内容のデータと一致するか判断する。すなわち、予め、ログ情報毎にログ情報の内容の判断が変わる動作と一致する動作の有無と関連付けた障害発生確認データベース354を用意することで、障害発生時に検索し、一致した情報が有る場合、その場合の条件(ログ情報出力回数、ログ発生前の操作内容)を取得し、ログ情報と合わせて取得した操作内容の組合せが、障害を意味しないものである場合、障害発生との判断を行わない。障害発生確認データベース354は、上記を実現するために必要なデータベースである。なお、ログ発生前の操作内容は、ログ情報に基づく正しい障害有無判断のためにログ発生前の操作内容を障害内容特定装置300に登録する必要が有る。
Here, the reason why the failure
アップデート確認データベース355は、ソフトウェア毎のアップデートを確認するための情報を蓄積したデータベース(第5データベース)である(図1参照)。アップデート確認データベース355は、ソフトウェア、及び、アップデートソフトウェア適用確認コマンドが整理されて関連付けられている(図6参照)。アップデートソフトウェア適用確認コマンドは、アップデートされたソフトウェアの適用を確認するためのコマンドである。
The
ここで、アップデートソフトウェアは、一般的に、情報処理装置にインストールされたオペレーティングシステムやアプリケーションソフトウェアに対する動作の影響を予め確認してからアップデートを実行する。そのため、情報処理装置にインストールされたオペレーティングシステムやアプリケーションソフトウェアに対し、自動でアップデートソフトウェアを適用することはない。障害が発生しているソフトウェアにはアップデートソフトウェアが適用されていないため、障害が発生しているか否かを確認するため、ソフトウェア毎に異なるアップデートソフトウェア適用確認コマンドを入力して、最新のアップデートソフトウェアが適用されているか否かの確認を行なう。この確認では、アップデートソフトウェア適用確認コマンドを入力した後に出力されるファイルに適用されている修正ソフトの種類が含まれる。 Here, the update software generally executes the update after confirming in advance the influence of the operation on the operating system and the application software installed in the information processing apparatus. Therefore, the update software is not automatically applied to the operating system and application software installed in the information processing device. Since the update software is not applied to the failed software, enter a different update software application confirmation command for each software to check whether the failure has occurred, and the latest update software will be updated. Check if it is applied. This confirmation includes the type of correction software applied to the file output after entering the update software application confirmation command.
次に、実施形態1に係る障害内容特定システムにおける障害内容特定装置の制御部の動作について図面を用いて説明する。図9〜図17は、実施形態1に係る障害内容特定システムにおける障害内容特定装置の制御部の動作を模式的に示したフローチャートである。 Next, the operation of the control unit of the failure content identification device in the failure content identification system according to the first embodiment will be described with reference to the drawings. 9 to 17 are flowcharts schematically showing the operation of the control unit of the failure content identification device in the failure content identification system according to the first embodiment.
まず、障害内容特定装置300の制御部310は、ソフトウェア起動遅延障害判断を行なうために、顧客装置100からの障害状況情報(障害発生日時、障害発生ソフトウェア、障害発生時メッセージ、及び、障害発生直前操作のいずれかを含む;上述の説明のとおり)を取得する(ステップA1;図9参照)。
First, the
ここで、障害状況情報は、顧客装置100に障害が発生した際、顧客装置100のユーザによって顧客装置100に入力(顧客装置100で自動生成でも可)され、顧客装置100から障害内容特定装置300に送信され、障害内容特定装置300の制御部310で取得される。障害状況情報の詳細は、上記のとおりである。
Here, when a failure occurs in the
次に、制御部310は、ステップA1で取得した障害状況情報を、記憶部350の障害状況情報データベース351に記憶する(ステップA2;図9参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップA3;図9参照)。
Next, the
次に、制御部310は、起動確認データベース353から、ステップA3で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアに関連付けられたログ情報の名称を抽出する(ステップA4;図9参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、ステップA4で抽出したログ情報の名称に対応するログ情報を取得し、一時記憶する(ステップA5;図9参照)。
Next, the
次に、制御部310は、起動確認データベース353から、ステップA3で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアに関連付けられた起動中のメッセージを抽出する(ステップA6;図9参照)。
Next, the
次に、制御部310は、ステップA5で一時記憶したログ情報において、ステップA6で抽出した起動中のメッセージと同じ起動中のメッセージがあるか否かを確認する(ステップA7;図9参照)。同じ起動中のメッセージがない場合(ステップA7のNO)、ソフトウェア起動遅延障害が発生していないと判断し、ハードウェア障害判断を行なうためのステップB1に進む。
Next, the
ここで、ソフトウェア起動遅延障害とは、ソフトウェアの起動に伴う一時ファイルの蓄積に起因するソフトウェアの起動に時間がかかる(遅延が生じる)障害をいう。ソフトウェア起動遅延障害として、例えば、ソフトウェアの起動時に、当該ソフトウェアが一時ファイル(テンポラリファイル)を起動の度に作成しており、かつ、当該ソフトウェア終了時迄、消去されず蓄積してゆく動作が生じ、これらが原因で、ソフトウェアの起動時間が長くなる場合が挙げられる。この一時ファイルが、ソフトウェア起動の度に作成され、結果、蓄積された、大量の一時ファイルの一覧を、オペレーティングシステムソフトウェアが取得する時間が長くなり、その結果、当該ソフトウェアの起動、及び、完了が遅くなる。なお、ソフトウェア起動遅延障害が発生した場合、その障害原因を出力(表示等)してもよい。また、作成される一時ファイルを削除する等の障害復旧のための指示を出力してもよい。 Here, the software startup delay failure refers to a failure in which it takes time (delay) to start the software due to the accumulation of temporary files accompanying the startup of the software. As a software startup delay failure, for example, when the software is started, the software creates a temporary file (temporary file) every time the software is started, and the operation is accumulated without being erased until the software is terminated. Due to these factors, the software startup time may become longer. This temporary file is created each time the software is started, and as a result, it takes a long time for the operating system software to acquire a list of a large number of accumulated temporary files, and as a result, the software is started and completed. Become slow. When a software startup delay failure occurs, the cause of the failure may be output (displayed, etc.). In addition, instructions for failure recovery such as deleting the created temporary file may be output.
同じ起動中のメッセージがある場合(ステップA7のYES)、制御部310は、ステップA5で一時記憶したログ情報から、起動中のメッセージの出力日時を抽出する(ステップA8;図9参照)。
If there is the same active message (YES in step A7), the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報の障害発生日時を抽出する(ステップA9;図10参照)。
Next, the
次に、制御部310は、ステップA8で抽出した起動中のメッセージの出力日時とステップA9で抽出した障害発生日時との差が、予め設定された第1の所定時間(例えば、1時間)以内であるか否かを確認する(ステップA10;図10参照)。起動中のメッセージの出力日時と障害発生日時との差が第1の所定時間以内でない場合(ステップA10のNO)、ソフトウェア起動遅延障害が発生していないと判断し、ハードウェア障害判断を行なうためのステップB1に進む。
Next, the
起動中のメッセージの出力日時と障害発生日時との差が第1の所定時間以内である場合(ステップA10のYES)、制御部310は、起動確認データベース353から、ステップA3で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアに関連付けられた起動完了のメッセージを抽出する(ステップA11;図10参照)。
When the difference between the output date and time of the message being started and the failure occurrence date and time is within the first predetermined time (YES in step A10), the
次に、制御部310は、ステップA5で一時記憶したログ情報において、ステップA11で抽出した起動完了のメッセージと同じ起動完了のメッセージがあるか否かを確認する(ステップA12;図10参照)。同じ起動完了のメッセージがない場合(ステップA12のNO)、ソフトウェア起動遅延障害が発生していないと判断し、ハードウェア障害判断を行なうためのステップB1に進む。
Next, the
同じ起動完了のメッセージがある場合(ステップA12のYES)、制御部310は、ステップA5で一時記憶したログ情報から、起動完了のメッセージの出力日時を抽出する(ステップA13;図10参照)。
When there is the same activation completion message (YES in step A12), the
次に、制御部310は、ステップA8で抽出した起動中のメッセージの出力日時と、ステップA13で抽出した起動完了のメッセージの出力日時と、の時間差が、予め設定された第2の所定時間(例えば、3分)以上であるか否かを確認する(ステップA14;図10参照)。起動中のメッセージの出力日時と起動完了のメッセージの出力日時との時間差が第2の所定時間以上でない場合(ステップA14のNO)、ソフトウェア起動遅延障害が発生していないと判断し、ハードウェア障害判断を行なうためのステップB1に進む。
Next, the
起動中のメッセージの出力日時と起動完了のメッセージの出力日時との時間差が第2の所定時間以上である場合(ステップA14のYES)、制御部310は、ソフトウェア起動遅延障害が発生していると判断し、ソフトウェア起動遅延障害の発生を知らせるソフトウェア起動遅延障害発生通知(第1通知)を顧客装置100に送信する(ステップA15;図10参照)。ステップA15の後、ハードウェア障害判断を行なうためのステップB1に進む。
When the time difference between the output date and time of the message being started and the output date and time of the message of starting completion is equal to or longer than the second predetermined time (YES in step A14), the
ステップA15により、顧客装置100でソフトウェア起動遅延障害発生通知が受信され、顧客装置100でソフトウェア起動遅延障害発生通知が出力(表示等)され、顧客装置100のユーザに顧客装置100でのソフトウェア起動遅延障害の発生を知らせることができる。
In step A15, the
ステップA7のNOの場合、ステップA10のNOの場合、ステップA12のNOの場合、ステップA14のNOの場合、又は、ステップA15の後、制御部310は、ハードウェア障害判断を行なうために、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップB1;図11参照)。
In the case of NO in step A7, in the case of NO in step A10, in the case of NO in step A12, in the case of NO in step A14, or after step A15, the
次に、制御部310は、ステップB1で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアを含む障害情報データベース352を選択する(ステップB2;図11参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生時メッセージを抽出する(ステップB3;図11参照)。
Next, the
次に、制御部310は、ステップB2で選択した障害情報データベース352から、ステップB3で抽出した障害発生時メッセージと同じメッセージを含むログ情報中のメッセージに関連付けられた障害情報を抽出する(ステップB4;図11参照)。
Next, the
次に、制御部310は、ステップB2で選択した障害情報データベース352から、ステップB4で抽出した障害情報に関連付けられたログ情報の名称を抽出する(ステップB5;図11参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、ステップB5で抽出したログ情報の名称に対応するログ情報を取得し、一時記憶する(ステップB6;図11参照)。
Next, the
次に、制御部310は、ステップB6で一時記憶したログ情報からメッセージを抽出する(ステップB7;図11参照)。
Next, the
次に、制御部310は、ステップB2で選択した障害情報データベース352において、ステップB7で抽出したメッセージと同じログ情報中のメッセージに関連付けられた障害情報があるか否かを確認する(ステップB8;図12参照)。障害情報がない場合(ステップB8のNO)、ステップB14に進む。
Next, the
障害情報がある場合(ステップB8のYES)、制御部310は、ステップB4で抽出した障害情報がハードウェアの自動復旧を示す動作となっているか確認する(ステップB9;図12参照)。ハードウェアの自動復旧を示す動作となっていない場合(ステップB9のNO)、障害情報データベース352内の障害情報が改善されていないと判断し、ステップB14に進む。
When there is failure information (YES in step B8), the
ここで、ステップB6で一時記憶したログ情報において、障害情報に対応するログ情報中のメッセージと同じメッセージ(障害が発生していることを表すメッセージ)があるにもかかわらず、直ちに障害発生としないのは、正確な障害の発生を確認するためである。また、障害情報がハードウェアの自動復旧を示す動作であるか否かを確認しているのは、障害が復旧しているのにハードウェアの自動復旧を示す動作が障害情報に含まれているか否かを確認したり、何か他の文言と取り違えているか否かを確認するためである。 Here, in the log information temporarily stored in step B6, even though there is the same message (message indicating that a failure has occurred) in the log information corresponding to the failure information, the failure does not occur immediately. This is to confirm the exact occurrence of the failure. In addition, it is confirmed whether the failure information is an operation indicating automatic hardware recovery because the failure information includes an operation indicating automatic hardware recovery even though the failure has been recovered. This is to confirm whether or not it is, or whether or not it is mistaken for some other wording.
ハードウェアの自動復旧を示す動作となっている場合(ステップB9のYES)、制御部310は、ステップB6で一時記憶したログ情報から、ハードウェア障害発生時メッセージの出力日時、及び、ハードウェア自動復旧時メッセージの出力日時を抽出する(ステップB10;図12参照)。
When the operation indicates automatic hardware recovery (YES in step B9), the
ここで、ハードウェア障害発生時メッセージは、ハードウェアの障害発生時に、オペレーティングシステム又は障害から復旧したソフトウェアによって出力部130から出力(例えば、表示)されたメッセージである。また、ハードウェア自動復旧時メッセージは、ハードウェアの自動復旧(障害復旧)時に、オペレーティングシステム又は障害から復旧したソフトウェアによって出力部130から出力(例えば、表示)されたメッセージである。 Here, the hardware failure occurrence message is a message output (for example, displayed) from the output unit 130 by the operating system or software recovered from the failure when a hardware failure occurs. The hardware automatic recovery message is a message output (for example, displayed) from the output unit 130 by the operating system or software recovered from the failure at the time of automatic hardware recovery (failure recovery).
次に、制御部310は、ステップB10で抽出したハードウェア自動復旧時メッセージの出力日時がステップB10で抽出したハードウェア障害発生時メッセージの出力日時の後であるか否かを確認する(ステップB11;図12参照)。ハードウェア自動復旧時メッセージの出力日時がハードウェア障害発生時メッセージの出力日時の後でない場合(ステップB11のNO)、ハードウェア障害発生時メッセージがハードウェア自動復旧時メッセージの後の時刻に出力されているということになり、ハードウェア障害が継続していると判断し、ステップB14に進む。
Next, the
ここで、ハードウェア自動復旧時メッセージの出力日時がハードウェア障害発生時メッセージの出力日時の後であるか否かを確認しているのは、ハードウェアが正しい順序で自動復旧しているかを確認するためである。 Here, checking whether the output date and time of the hardware automatic recovery message is after the output date and time of the hardware failure message is checking whether the hardware is automatically recovered in the correct order. To do.
ハードウェア自動復旧時メッセージの出力日時がハードウェア障害発生時メッセージの出力日時の後である場合(ステップB11のYES)、制御部310は、ステップB6で一時記憶したログ情報内にハードウェア障害発生時メッセージ、及び、ハードウェア障害復旧時メッセージが所定時間以内に所定回数以上記録されているか否かを確認する(ステップB12;図12参照)。所定回数以上記録されている場合(ステップB12のYES)、ハードウェアの間欠障害と判断し、ステップB14に進む。
If the output date and time of the hardware automatic recovery message is after the output date and time of the hardware failure message (YES in step B11), the
ここで、ハードウェアの間欠障害とは、連続的に発生する障害ではないが、正常であるメッセージと、障害であるメッセージとの出力を繰り返す場合をいい、例えば、ディスク装置の場合、完全には壊れていないが、交換が必要な完全に壊れる前段階に相当する。 Here, the intermittent hardware failure refers to a case where the output of a normal message and a failure message is repeated, although it is not a continuous failure. For example, in the case of a disk device, it is completely complete. It is not broken, but corresponds to the pre-breaking stage that needs to be replaced.
所定回数以上記録されていない場合(ステップB12のNO)、制御部310は、ハードウェア障害(障害情報に対応する障害)が発生していないと判断し、ハードウェア障害が発生していないことを知らせるハードウェア障害未発生通知(第2通知)を顧客装置100に送信する(ステップB13;図12参照)。ステップB13の後、障害発生直前操作による障害判断を行なうためのステップC1に進む。
If it has not been recorded more than a predetermined number of times (NO in step B12), the
ステップB13により、顧客装置100でハードウェア障害未発生通知が受信され、顧客装置100でハードウェア障害未発生通知が出力(表示等)され、顧客装置100のユーザに顧客装置100でハードウェア障害が発生していない旨を知らせることができる。
In step B13, the
障害情報がない場合(ステップB8のNO)、ハードウェアの自動復旧を示す動作となっていない場合(ステップB9のNO)、障害復旧時メッセージの出力日時が障害発生時メッセージの出力日時の後でない場合(ステップB11のNO)、又は、所定回数以上記録されている場合(ステップB12のYES)、制御部310は、障害(障害情報に対応する障害、ハードウェアの障害)が発生していると判断し、ステップB2で選択した障害情報データベース352から、ステップB7で抽出したメッセージと同じログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作に係る情報を抽出する(ステップB14;図12参照)。
If there is no failure information (NO in step B8), or if the operation does not indicate automatic hardware recovery (NO in step B9), the output date and time of the failure recovery message is not after the output date and time of the failure occurrence message. If (NO in step B11) or if it has been recorded more than a predetermined number of times (YES in step B12), the
次に、制御部310は、ステップB4で抽出した障害情報、及び、ステップB14で抽出した原因及び障害復旧に必要な操作に係る情報を顧客装置100に送信する(ステップB15;図12参照)。ステップB15の後、障害発生直前操作による障害判断を行なうためのステップC1に進む。
Next, the
ステップB15により、顧客装置100で障害情報、及び、原因及び障害復旧に必要な操作が受信され、障害情報、及び、原因及び障害復旧に必要な操作が出力(表示等)され、顧客装置100のユーザに顧客装置100での障害情報、及び、原因及び障害復旧に必要な操作を知らせることができる。原因及び障害復旧に必要な操作では、例えば、ハードディスク装置を交換する指示としてもよい。
In step B15, the
ステップB13又はステップB15の後、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップC1;図13参照)。
After step B13 or step B15, the
次に、制御部310は、ステップC1で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアを含む障害発生確認データベース354を選択する(ステップC2;図13参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生時メッセージを抽出する(ステップC3;図13参照)。
Next, the
次に、制御部310は、ステップC2で選択した障害発生確認データベース354から、ステップC3で抽出した障害発生時メッセージと同じ障害発生時メッセージに対応するログ情報の名称を抽出する(ステップC4;図13参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、ステップC4で抽出したログ情報の名称に対応するログ情報を取得し、一時記憶する(ステップC5;図13参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生直前操作に係る情報を抽出する(ステップC6;図13参照)
Next, the
次に、制御部310は、ステップC2で選択した障害発生確認データベース354において、ステップC6で抽出した障害発生直前操作に係る情報と同じ障害発生直前操作に係る情報があるか否かを確認する(ステップC7;図14参照)。同じ障害発生直前操作に係る情報がない場合(ステップC7のNO)、出力された障害発生時メッセージは障害発生だが、この時の操作内容と合わせて、障害発生有無の判断を行う必要はないと判断し、最新のアップデートソフトウェア未適用による障害判断を行うためのステップD1に進む。
Next, the
同じ障害発生直前操作に係る情報がある場合(ステップC7のYES)、制御部310は、ステップC5で一時記憶したログ情報において、ステップC2で選択した障害発生確認データベース354の操作時出力メッセージと同じメッセージがあるか否かを確認する(ステップC8;図14参照)。操作時出力メッセージを含まない場合(ステップC8のNO)、作業者が障害状況情報データベース351に入力した操作は行なわれなかったとみなし、出力されたメッセージ内容は障害発生だが、この時の操作内容と合わせて、障害発生有無の判断を行う必要はないと判断し、最新のアップデートソフトウェア未適用による障害判断を行うためのステップD1に進む。
If there is information related to the same operation immediately before the occurrence of a failure (YES in step C7), the
ここで、障害発生確認データベース354の操作時出力メッセージは、メッセージそのものは障害メッセージだが、初期設定を行なう操作により必ず発生するメッセージであり、この初期設定を行なった場合のみ、仕様上問題のない障害メッセージであり、初期設定が完了すれば、問題はなくなるので、結果、障害発生ではない可能性が有るメッセージである。
Here, the operation output message of the failure
操作時出力メッセージを含む場合(ステップC8のYES)、制御部310は、ステップC5で一時記憶したログ情報から、障害発生時メッセージの出力日時と、操作時出力メッセージの出力日時と、を抽出する(ステップC9;図14参照)。
When the operation output message is included (YES in step C8), the
次に、制御部310は、ステップC9で抽出した障害発生時メッセージの出力日時と、ステップC9で抽出した操作時出力メッセージの出力日時との時間差が、予め設定された第3の所定時間以内であるか否かを確認する(ステップC10;図14参照)。所定時間以内でない場合(ステップC10のNO)、出力されたメッセージ内容は障害発生だが、この時の操作内容と合わせて、障害発生有無の判断を行う必要はないと判断し、最新のアップデートソフトウェア未適用による障害判断を行うためのステップD1に進む。
Next, the
所定時間以内である場合(ステップC10のYES)、制御部310は、操作による障害が発生していないと判断し、操作による障害が発生していないことを知らせる障害未発生通知(第3通知)を顧客装置100に送信する(ステップC11;図14参照)。ステップC11の後、最新のアップデートソフトウェア未適用による障害判断を行うためのステップD1に進む。
If it is within a predetermined time (YES in step C10), the
ステップC11での障害が発生していないとの判断は、障害がソフトウェアで使用するデータ記憶用フォーマットをテープに行い、各データ領域を分離管理するために、各データ領域にラベル情報をフォーマットする際、付加するラベル付け操作を行った場合のI/Oエラーであることを示しており、正常に初期設定が行われたことを示す。 The determination that the failure has not occurred in step C11 is when the failure formats the data storage used by the software on the tape and formats the label information in each data area in order to separate and manage each data area. , Indicates that it is an I / O error when the labeling operation to be added is performed, and indicates that the initial setting has been performed normally.
ステップC11により、顧客装置100で障害未発生通知が受信され、顧客装置100で障害未発生通知が出力(表示等)され、顧客装置100のユーザに顧客装置100で障害が発生していない旨を知らせることができる。
In step C11, the
ステップC7のNOの場合、ステップC8のNOの場合、ステップC10のNOの場合、又は、ステップC11の後、制御部310は、記憶部350の障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップD1;図15参照)。
In the case of NO in step C7, in the case of NO in step C8, in the case of NO in step C10, or after step C11, the
次に、制御部310は、ステップD1で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアを含むアップデート確認データベース355を選択する(ステップD2;図15参照)。
Next, the
次に、制御部310は、ステップD2で選択したアップデート確認データベース355から、ステップD2で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアに関連付けられたアップデートソフトウェア適用確認コマンドを抽出する(ステップD3;図15参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、ステップD3で抽出したアップデートソフトウェア適用確認コマンドを顧客装置100で実行させることによって顧客装置100から実行ログ情報を取得し、一時記憶する(ステップD4;図15参照)。
Next, the
次に、制御部310は、ステップD4で一時記憶した実行ログ情報において、インターネット上に公開されているソフトウェアの最新のアップデートソフトウェアに係る情報の全てが含まれているか否か確認する(ステップD5;図15参照)。最新のアップデートソフトウェアに係る情報の全てが含まれている場合(ステップD5のYES)、通常の障害判断を行なうためのステップE1に進む。
Next, the
ここで、インターネット上に公開されているソフトウェアの最新のアップデートソフトウェアに係る情報は、予め収集しておいてもよく、ステップD5を行う直前に収集してもよい。 Here, the information relating to the latest update software of the software published on the Internet may be collected in advance, or may be collected immediately before the step D5 is performed.
最新のアップデートソフトウェアに係る情報の全てが含まれていない場合(ステップD5のNO)、制御部310は、顧客装置100にリモート接続し、顧客装置100に、最新のアップデートソフトウェア(パッチプログラム、修正プログラムでも可)を全て適用させる(ステップD6;図15参照)。
If all the information related to the latest update software is not included (NO in step D5), the
ステップD6を行なうケースとして、例えば、WEB(World Wide Web)サイト上のPDFファイルを、IE8(Microsoft社製、Internet Explorer 8)又はIE11(Microsoft社製、Internet Explorer 11)で開く場合に、読み込み途中で動作が止まり、表示が行われない場合に、最新のアップデートソフトウェアが適用されていない情報により、顧客装置100にアップデートソフトウェアを適用させる場合が挙げられる。
As a case of performing step D6, for example, when opening a PDF file on a WEB (World Wide Web) site with IE8 (Microsoft, Internet Explorer 8) or IE11 (Microsoft, Internet Explorer 11), it is being read. When the operation is stopped and the display is not performed, the update software may be applied to the
ステップD6を行なうことによって、顧客装置100は、最新のアップデートソフトウェアが全て適用された状態のログ情報を生成し記憶する。
By performing step D6, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、最新のアップデートソフトウェアが全て適用された状態のログ情報を取得し、一時記憶する(ステップD7;図15参照)。
Next, the
次に、制御部310は、ステップD7で一時記憶したログ情報において、ステップD4で取得した実行ログ情報にない新しいメッセージが含まれているか否かを確認する(ステップD8;図15参照)。新しいメッセージが含まれている場合(ステップD8のYES)、アップデートプログラム未適用による障害とは別の障害が発生している(アップデートプログラムを適用しても障害が復旧しない)と判断し、通常の障害判断を行なうためのステップE1に進む。
Next, the
新しいメッセージが含まれていない場合(ステップD8のNO)、制御部310は、顧客装置100への最新のアップデートソフトウェア適用で復旧し、現時点では障害が発生していないと判断し、その旨を知らせるアップデートソフトウェア適用復旧障害未発生通知(第4通知)を顧客装置100に送信する(ステップD9;図15参照)。ステップD9の後、通常の障害判断を行なうためのステップE1に進む。
If no new message is included (NO in step D8), the
ステップD9により、顧客装置100でアップデートソフトウェア適用復旧障害未発生通知が受信され、顧客装置100でアップデートソフトウェア適用復旧障害未発生通知が出力(表示等)され、顧客装置100のユーザに顧客装置100でアップデートソフトウェア適用により復旧し、障害が発生していない旨を知らせることができる。
In step D9, the
ステップD5のYES、ステップD8のYES、又は、ステップD9後、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップE1;図16参照)。
After YES in step D5, YES in step D8, or step D9, the
次に、制御部310は、ステップE1で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアを含む障害情報データベース352を選択する(ステップE2;図16参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生時メッセージを抽出する(ステップE3;図16参照)。
Next, the
次に、制御部310は、ステップE2で選択した障害情報データベース352から、ステップE3で抽出した障害発生時メッセージと同じメッセージを含むログ情報中のメッセージに関連付けられた障害情報を抽出する(ステップE4;図16参照)。
Next, the
次に、制御部310は、ステップE2で選択した障害情報データベース352から、ステップE4で抽出した障害情報に関連付けられたログ情報の名称を抽出する(ステップE5;図16参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、ステップE5で抽出したログ情報の名称に対応するログ情報(障害発生ソフトウェアのログ情報)を取得し、一時記憶する(ステップE6;図16参照)。
Next, the
次に、制御部310は、ステップE2で選択した障害情報データベース352から、ステップE4で抽出した障害情報に関連付けられたログ情報中のメッセージを抽出する(ステップE7;図16参照)。
Next, the
次に、制御部310は、ステップE6で一時記憶したログ情報において、ステップE7で抽出したログ情報中のメッセージと同じメッセージがあるか否かを確認する(ステップE8;図16参照)。同じメッセージがある場合(ステップE8のYES)、通常の障害判断に移っても問題なしとみなし、通常の障害判断を行なうためのステップF1に進む。
Next, the
同じメッセージがない場合(ステップE8のNO)、制御部310は、ソフトウェア起動障害が確認できないとはせず、顧客装置100にリモート接続し、顧客装置100から、オペレーティングシステムが出力したログ情報を取得し、一時記憶する(ステップE9;図16参照)。
If there is no same message (NO in step E8), the
ここで、あるソフトウェアが起動できない場合、起動しない当該ソフトウェアが出力するログ情報には、障害を示すログ情報もしくはメッセージは出力されないが、オペレーティングシステムが出力するログ情報には、当該ソフトウェアに関する障害を示すログ情報がある。オペレーティングシステムが出力するログ情報の内容(当該ソフトウェアに関する障害を示す内容)により、当該ソフトウェアの不具合であると判断することができる。なお、ソフトウェアが出力するログ情報は、通常時でも出力され、ソフトウェアの起動や停止の情報が出力されるログ情報である。 Here, if a certain software cannot be started, the log information output by the software that does not start does not output the log information or the message indicating the failure, but the log information output by the operating system indicates the failure related to the software. There is log information. Based on the content of the log information output by the operating system (content indicating a failure related to the software), it can be determined that the software is defective. The log information output by the software is log information that is output even in a normal state and information on starting and stopping the software is output.
次に、制御部310は、ステップE9で一時記憶したオペレーティングシステムが出力したログ情報において、ステップE7で抽出したログ情報中のメッセージと同じメッセージがあるか否かを確認する(ステップE10;図16参照)。同じメッセージがない場合(ステップE10のNO)、障害とはみなさず、通常の障害判断を行なうためのステップF1に進む。
Next, the
同じメッセージがある場合(ステップE10のYES)、制御部310は、障害が発生しているとみなし、ステップE2で選択した障害情報データベース352から、ステップE7で抽出したログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する(ステップE11;図16参照)。
If there is the same message (YES in step E10), the
次に、制御部310は、ステップE4で抽出した障害情報、及び、ステップE11で抽出した原因及び障害復旧に必要な操作を顧客装置100に送信する(ステップE12;図16参照)。ステップE12の後、ステップF1に進む。
Next, the
ステップE12により、顧客装置100で障害情報、及び、原因及び障害復旧に必要な操作が受信され、障害情報、及び、原因及び障害復旧に必要な操作が出力(表示等)され、顧客装置100のユーザに顧客装置100での障害情報、及び、原因及び障害復旧に必要な操作を知らせることができる。
In step E12, the
ステップE8のYES、ステップE10のNO、又はステップE12の後、制御部310は、顧客装置100に対して障害発生の有無に関する通知(ステップA15のソフトウェア起動遅延障害発生通知、ステップB13の障害未発生通知、ステップC11の障害未発生通知、ステップD9のアップデートソフトウェア適用復旧障害未発生通知)の送信を行なったか否かを確認する(ステップF1;図17参照)。障害発生の有無に関する通知の送信を行なっていない場合(ステップF1のNO)、制御部310は、通常の障害情報では判断できない障害が発生していないとみなし、通常の障害判断を行なうためのステップF3に進む。
After YES in step E8, NO in step E10, or step E12, the
障害発生の有無に関する通知の送信を行なっている場合(ステップF1のYES)、制御部310は、通常の障害情報では判断できない障害が発生していたとみなし、障害発生の有無の調査が完了したことを知らせる調査完了通知を顧客装置100に送信し(ステップF2;図17参照)、その後、終了する。
When the notification regarding the presence / absence of a failure has been transmitted (YES in step F1), the
障害発生の有無に関する通知の送信を行なっていない場合(ステップF1のNO)、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生ソフトウェアに係る情報を抽出する(ステップF3;図17参照)。
When the notification regarding the presence / absence of a failure has not been transmitted (NO in step F1), the
次に、制御部310は、ステップF3で抽出した障害発生ソフトウェアに係る情報に対応するソフトウェアを含む障害情報データベース352を選択する(ステップF4;図17参照)。
Next, the
次に、制御部310は、障害状況情報データベース351から、ステップA1で取得した障害状況情報に対応する障害発生時メッセージを抽出する(ステップF5;図17参照)。
Next, the
次に、制御部310は、ステップF4で選択した障害情報データベース352から、ステップF5で抽出した障害発生時メッセージと同じメッセージを含むログ情報中のメッセージに関連付けられた障害情報を抽出する(ステップF6;図17参照)。
Next, the
次に、制御部310は、ステップF4で選択した障害情報データベース352から、ステップF6で抽出した障害情報に関連付けられたログ情報の名称を抽出する(ステップF7;図17参照)。
Next, the
次に、制御部310は、顧客装置100にリモート接続し、顧客装置100から、ステップF7で抽出したログ情報の名称に対応するログ情報(障害発生ソフトウェアのログ情報)を取得し、一時記憶する(ステップF8;図17参照)。
Next, the
次に、制御部310は、ステップF4で選択した障害情報データベース352から、ステップF6で抽出した障害情報に関連付けられたログ情報中のメッセージを抽出する(ステップF9;図17参照)。
Next, the
次に、制御部310は、ステップF8で一時記憶したログ情報において、ステップF9で抽出したログ情報中のメッセージと同じメッセージがあるか否かを確認する(ステップF10;図17参照)。同じメッセージがない場合(ステップF10のNO)、ステップF13に進む。
Next, the
同じメッセージがある場合(ステップF10のYES)、制御部310は、障害が発生しているとみなし、ステップE2で選択した障害情報データベース352から、ステップF9で抽出したログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する(ステップF11;図17参照)。
If there is the same message (YES in step F10), the
次に、制御部310は、ステップF6で抽出した障害情報、及び、ステップF11で抽出した原因及び障害復旧に必要な操作を顧客装置100に送信し(ステップF12;図17参照)、その後、終了する。
Next, the
ステップF12により、顧客装置100で障害情報、及び、原因及び障害復旧に必要な操作が受信され、障害情報、及び、原因及び障害復旧に必要な操作が出力(表示等)され、顧客装置100のユーザに顧客装置100での障害情報、及び、原因及び障害復旧に必要な操作を知らせることができる。
In step F12, the
同じメッセージがない場合(ステップF10のNO)、制御部310は、障害発生の原因が不明であると判断し、障害発生の原因が不明であることを知らせる原因不明通知(第5通知)を顧客装置100に送信し(ステップF13;図17参照)、その後、終了する。
If there is no same message (NO in step F10), the
ステップF13により、顧客装置100で原因不明通知が受信され、原因不明通知が出力(表示等)され、顧客装置100のユーザに顧客装置100での障害発生の原因が不明であることを知らせることができる。
In step F13, the
障害内容特定装置300の制御部310の動作は以上のとおりであるが、ソフトウェア起動遅延障害判断(ステップA1〜A15)、ハードウェア障害判断(ステップB1〜B15)、障害発生直前操作による障害判断(ステップC1〜C11)、最新のアップデートソフトウェア未適用による障害判断(ステップD1〜D9)、及び、通常の障害判断(ステップE1〜E12)のいずれかの障害判断だけ行なってもよい。
The operation of the
実施形態1によれば、単純なログ情報内のメッセージから一義的に障害と判断するのではなく、ログ情報内のメッセージが障害ではないが、実際は障害を発生している場合でも、正しい障害内容を特定することに貢献することができる。 According to the first embodiment, the message in the log information is not a failure, but the message in the log information is not a failure, but the correct failure content is obtained even if a failure actually occurs. Can contribute to the identification of.
[実施形態2]
実施形態2に係る障害内容特定装置について図面を用いて説明する。図18は、実施形態2に係る障害内容特定システムの構成を模式的に示したブロック図である。
[Embodiment 2]
The fault content identifying device according to the second embodiment will be described with reference to the drawings. FIG. 18 is a block diagram schematically showing the configuration of the failure content identification system according to the second embodiment.
障害内容特定システム1は、情報処理装置100にインストールされたソフトウェアの障害内容を障害内容特定装置300で特定するシステムである。障害内容特定システム1は、情報処理装置100と、障害内容特定装置300と、を有する。
The failure content identification system 1 is a system that identifies the failure content of the software installed in the
情報処理装置100は、障害内容特定装置と通信可能に接続された情報処理を有する装置である。
。
The
..
障害内容特定装置300は、データを記憶する記憶部350と、記憶部350を制御するとともに、所定の情報処理を行う制御部310と、を備える。
The failure
記憶部350は、第1データベース351と、第2データベース353と、を記憶する。第1データベース351は、情報処理装置100から取得した、情報処理装置100に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理したデータベースである。第2データベース353は、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理したデータベースである。
The
制御部310は、第2データベース353から、第1データベース351の障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理を行なう。制御部310は、情報処理装置100から、抽出されたログ情報の名称に対応するログ情報を取得する処理を行なう。制御部310は、取得したログ情報において、第2データベース353の起動中のメッセージと同じメッセージがあることを確認する処理を行う。制御部310は、第1データベース351の障害発生日時と、取得したログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にあることを確認する処理を行う。制御部310は、取得したログ情報において、第2データベース353の起動完了のメッセージと同じメッセージがあることを確認する処理を行う。制御部310は、第1データベース351の障害発生日時と、取得したログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上であることを確認する処理を行う。制御部310は、これらの確認後、ソフトウェア起動遅延障害が発生していることを知らせる第1通知を情報処理装置100に送信する処理を行う。
The
次に、実施形態2に係る障害内容特定システムにおける障害内容特定装置の制御部の動作について図面を用いて説明する。図19は、実施形態2に係る障害内容特定システムにおける障害内容特定装置の制御部の動作を模式的に示したフローチャートである。障害内容特定システムの構成については、図18を参照されたい。 Next, the operation of the control unit of the failure content identification device in the failure content identification system according to the second embodiment will be described with reference to the drawings. FIG. 19 is a flowchart schematically showing the operation of the control unit of the failure content identification device in the failure content identification system according to the second embodiment. See FIG. 18 for the configuration of the failure content identification system.
まず、障害内容特定装置300の制御部310は、第2データベース353から、第1データベース351の障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する(ステップG1)。
First, the
次に、制御部310は、情報処理装置100から、抽出されたログ情報の名称に対応するログ情報を取得する(ステップG2)。
Next, the
次に、制御部310は、取得したログ情報において、第2データベース353の起動中のメッセージと同じメッセージがあることを確認する(ステップG3)。
Next, the
次に、制御部310は、第1データベース351の障害発生日時と、取得したログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であることを確認する(ステップG4)。
Next, the
次に、制御部310は、取得したログ情報において、第2データベース353の起動完了のメッセージと同じメッセージがあることを確認する(ステップG5)。
Next, the
次に、制御部310は、第1データベース351の障害発生日時と、取得したログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上であることを確認する処理を行う(ステップG6)。
Next, the
最後に、制御部310は、ステップG3〜G6の確認後、ソフトウェア起動遅延障害が発生していることを知らせる第1通知を情報処理装置100に送信する処理を行い(ステップG7)、その後、終了する。
Finally, after confirming steps G3 to G6, the
実施形態2によれば、正しい障害内容を特定することに貢献することができる。 According to the second embodiment, it is possible to contribute to the identification of the correct fault content.
上記実施形態の一部または全部は以下の付記のようにも記載され得るが、以下には限られない。 Some or all of the above embodiments may also be described, but not limited to:
(付記)
本発明では、前記第1の視点に係る障害内容特定装置の形態が可能である。
(Additional note)
In the present invention, the form of the failure content specifying device according to the first viewpoint is possible.
前記第1の視点に係る障害内容特定装置において、前記第1データベースは、前記情報処理装置に関する、前記障害発生日時、前記障害発生ソフトウェアに係る情報、及び、障害発生時メッセージが関連付けて整理されており、前記記憶部は、ソフトウェアに係る情報、ログ情報の名称、ログ情報中のメッセージ、及び、障害情報を関連付けて整理した第3データベースをさらに記憶し、前記制御部は、取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、ときに、前記第3データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、取得した前記ログ情報において、前記第3データベースの前記ログ情報中のメッセージと同じメッセージがあり、かつ、前記第3データベースの前記障害情報がハードウェアの自動復旧を示す動作となっており、かつ、取得した前記ログ情報に含まれたハードウェア自動復旧時メッセージの出力日時が、取得した前記ログ情報に含まれたハードウェア障害発生時メッセージの出力日時よりも後であり、かつ、取得した前記ログ情報において、前記ハードウェア自動復旧時メッセージ及び前記ハードウェア障害発生時メッセージが所定時間以内に所定回数以上記録されていない、ときに、ハードウェア障害が発生していないことを知らせる第2通知を前記情報処理装置に送信する処理と、をさらに行う。 In the failure content identification device according to the first viewpoint, the first database is organized by associating the failure occurrence date and time, the information related to the failure occurrence software, and the failure occurrence message regarding the information processing device. The storage unit further stores the information related to the software, the name of the log information, the message in the log information, and the third database organized by associating the failure information, and the control unit further stores the acquired log information. There is no message that is the same as the running message of the second database, or the difference between the failure occurrence date and time of the first database and the output date and time of the running message included in the acquired log information. Is not within the first predetermined time, or in the acquired log information, there is no same message as the message of the completion of the startup of the second database, or the failure occurrence date and time and the log information of the first database. When the difference from the output date and time of the startup completion message included in is not equal to or greater than the second predetermined time, the software corresponding to the information related to the failure occurrence software in the first database from the third database is involved. In the process of extracting the name of the log information associated with the information, the process of acquiring the log information corresponding to the name of the extracted log information from the information processing apparatus, and the acquired log information, the third There is the same message as the message in the log information of the database, the failure information of the third database is an operation indicating automatic recovery of hardware, and the hardware included in the acquired log information. The output date and time of the hardware automatic recovery message is later than the output date and time of the hardware failure occurrence message included in the acquired log information, and in the acquired log information, the hardware automatic recovery message And the process of transmitting the second notification to the information processing apparatus when the message at the time of the occurrence of the hardware failure has not been recorded more than a predetermined number of times within the predetermined time, and when the message indicating that the hardware failure has not occurred. Do more.
前記第1の視点に係る障害内容特定装置において、前記第3データベースは、前記ソフトウェアに係る情報、前記ログ情報の名称、前記ログ情報中のメッセージ、前記障害情報、及び、原因及び障害復旧に必要な操作を関連付けて整理したデータベースであり、前記制御部は、取得した前記ログ情報において、前記第3データベースの前記ログ情報中のメッセージと同じメッセージがない、又は、前記第3データベースの前記障害情報がハードウェアの自動復旧を示す動作となっていない、又は、取得した前記ログ情報に含まれたハードウェア自動復旧時メッセージの出力日時が、取得した前記ログ情報に含まれたハードウェア障害発生時メッセージの出力日時よりも後でない、又は、取得した前記ログ情報において、前記ハードウェア自動復旧時メッセージ及び前記ハードウェア障害発生時メッセージが所定時間以内に所定回数以上記録されている、ときに、前記第3データベースから、前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、をさらに行なう。 In the failure content identification device according to the first viewpoint, the third database is necessary for the information related to the software, the name of the log information, the message in the log information, the failure information, and the cause and failure recovery. It is a database organized by associating various operations, and the control unit does not have the same message as the message in the log information of the third database in the acquired log information, or the failure information of the third database. Does not operate to indicate automatic hardware recovery, or when the output date and time of the hardware automatic recovery message included in the acquired log information is the occurrence of a hardware failure included in the acquired log information. When the message at the time of automatic recovery of hardware and the message at the time of occurrence of a hardware failure are recorded a predetermined number of times or more within a predetermined time in the log information acquired, which is not later than the output date and time of the message, the above. From the third database, the process of extracting the cause associated with the message in the log information and the operation required for failure recovery, and the extracted failure information and the cause and the operation required for failure recovery are transmitted to the information processing apparatus. The process of transmitting is further performed.
前記第1の視点に係る障害内容特定装置において、前記第1データベースは、前記情報処理装置に関する、前記障害発生日時、前記障害発生ソフトウェアに係る情報、及び、障害発生直前操作に係る情報が関連付けて整理されており、前記記憶部は、ソフトウェアに係る情報、障害発生時メッセージ、障害発生直前操作に係る情報、操作時出力メッセージ、及び、ログ情報の名称を関連付けて整理した第4データベースをさらに記憶し、前記制御部は、取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、ときに、前記第4データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、前記第4データベースにおいて、前記第1データベースの前記障害発生直前操作に係る情報と同じ障害発生直前操作に係る情報があり、かつ、取得した前記ログ情報において、前記第4データベースの前記操作時出力メッセージと同じメッセージがあり、かつ、前記ログ情報に含まれた障害発生時メッセージの出力日時と、前記ログ情報に含まれた操作時出力メッセージの出力日時との時間差が第3の所定時間以内にある、ときに、操作による障害が発生していないことを知らせる第3通知を前記情報処理装置に送信する処理と、をさらに行う。 In the failure content identification device according to the first viewpoint, the first database associates the failure occurrence date and time, the information related to the failure occurrence software, and the information related to the operation immediately before the failure occurrence with respect to the information processing device. The storage unit further stores the fourth database organized by associating the names of the information related to the software, the message at the time of failure, the information related to the operation immediately before the failure, the output message at the time of operation, and the log information. Then, the control unit does not have the same message as the running message of the second database in the acquired log information, or includes the failure occurrence date and time of the first database and the acquired log information. The difference from the output date and time of the message being started is not within the first predetermined time, or the acquired log information does not have the same message as the message of the start completion of the second database, or the above. When the difference between the failure occurrence date and time of the first database and the output date and time of the start completion message included in the log information is not equal to or more than the second predetermined time, the fourth database is referred to as the first database. A process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software, and a process of acquiring the log information corresponding to the name of the extracted log information from the information processing apparatus. And, in the fourth database, there is the same information related to the operation immediately before the failure occurrence as the information related to the operation immediately before the failure occurrence of the first database, and in the acquired log information, at the time of the operation of the fourth database. There is the same message as the output message, and the time difference between the output date and time of the failure occurrence message included in the log information and the output date and time of the operation output message included in the log information is within the third predetermined time. Further, a process of transmitting a third notification to the information processing apparatus, which informs that a failure due to the operation has not occurred, is further performed.
前記第1の視点に係る障害内容特定装置において、前記記憶部は、ソフトウェアに係る情報、及び、アップデートソフトウェア適用確認コマンドを関連付けて整理した第5データベースをさらに記憶し、前記制御部は、取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、ときに、前記第5データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたアップデートソフトウェア適用確認コマンドを抽出する処理と、抽出された前記アップデートソフトウェア適用確認コマンドを前記情報処理装置で実行させることによって前記情報処理装置から実行ログ情報を取得する処理と、取得した前記実行ログ情報において、インターネット上に公開されているソフトウェアの最新のアップデートソフトウェアに係る情報の全てが含まれていないときに、最新のアップデートソフトウェアを全て適用させ、前記情報処理装置から、前記最新のアップデートソフトウェアが全て適用された状態のログ情報を取得する処理と、取得した前記ログ情報において、取得した前記実行ログ情報にない新しいメッセージがないときに、前記情報処理装置への前記最新のアップデートソフトウェア適用で復旧し、現時点では障害が発生していないことを知らせる第4通知を前記情報処理装置に送信する処理と、をさらに行う。 In the failure content identification device according to the first viewpoint, the storage unit further stores a fifth database organized by associating information related to software and an update software application confirmation command, and the control unit has acquired the fifth database. In the log information, there is no same message as the running message of the second database, or the failure occurrence date and time of the first database and the output date and time of the starting message included in the acquired log information. There is no difference from the first predetermined time, or the acquired log information does not have the same message as the start completion message of the second database, or the failure occurrence date and time of the first database. When the difference from the output date and time of the startup completion message included in the log information is not equal to or more than the second predetermined time, the information related to the failure-generating software in the first database corresponds to the information from the fifth database. A process of extracting an update software application confirmation command associated with information related to software, and a process of acquiring execution log information from the information processing device by executing the extracted update software application confirmation command in the information processing device. When the acquired execution log information does not include all the information related to the latest update software of the software published on the Internet, all the latest update software is applied and the information processing device is used. , The process of acquiring the log information in the state where all the latest update software is applied, and when there is no new message in the acquired execution log information in the acquired log information, the said to the information processing apparatus. It recovers by applying the latest update software, and further performs a process of transmitting a fourth notification to the information processing apparatus notifying that a failure has not occurred at the present time.
前記第1の視点に係る障害内容特定装置において、前記第1データベースは、前記情報処理装置に関する、前記障害発生日時、前記障害発生ソフトウェアに係る情報、及び、障害発生時メッセージが関連付けて整理されており、前記記憶部は、ソフトウェアに係る情報、ログ情報の名称、ログ情報中のメッセージ、障害情報、及び、原因及び障害復旧に必要な操作を関連付けて整理した第3データベースをさらに記憶し、前記制御部は、取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、ときに、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報の前記第3データベースを選択する処理と、選択した前記第3データベースから、前記第1データベースの前記障害発生時メッセージと同じメッセージが含まれている障害情報を抽出する処理と、選択した前記第3データベースから、抽出した前記障害情報に関連付けられたログ情報の名称を抽出する処理と、前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、選択した前記第3データベースから、前記第1データベースの前記障害発生時メッセージと同じメッセージが含まれている障害情報に関連付けられたログ情報中のメッセージを抽出する処理と、取得した前記ログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがないときに、前記情報処理装置から、オペレーティングシステムが出力したログ情報を取得する処理と、取得した、前記オペレーティングシステムが出力したログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがあるときに、選択した前記第3データベースから、抽出した前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、をさらに行う。 In the failure content identification device according to the first viewpoint, the first database is organized by associating the failure occurrence date and time, the information related to the failure occurrence software, and the failure occurrence message regarding the information processing device. The storage unit further stores a third database that organizes information related to software, names of log information, messages in log information, failure information, and causes and operations necessary for failure recovery. In the acquired log information, the control unit does not have the same message as the active message of the second database, or the failure occurrence date and time of the first database and the activation included in the acquired log information. There is no difference between the output date and time of the message in the message within the first predetermined time, or the acquired log information does not have the same message as the start completion message of the second database, or the first database When the difference between the failure occurrence date and time and the output date and time of the startup completion message included in the log information is not equal to or more than the second predetermined time, it corresponds to the information related to the failure occurrence software in the first database. A process of selecting the third database of information related to software, and a process of extracting failure information containing the same message as the message at the time of failure occurrence of the first database from the selected third database. A process of extracting the name of the log information associated with the extracted failure information from the third database, and a process of acquiring the log information corresponding to the name of the extracted log information from the information processing apparatus. In the process of extracting a message in the log information associated with the failure information including the same message as the failure occurrence message of the first database from the selected third database, and in the acquired log information. , When the same message as the message in the extracted log information does not exist, the process of acquiring the log information output by the operating system from the information processing apparatus and the acquired log information output by the operating system are extracted. When there is the same message as the message in the log information, the process and extraction of the cause associated with the extracted message in the log information and the operation required for failure recovery are extracted from the selected third database. The above-mentioned failure information, the cause, and the operation required for failure recovery are described above. Further, the process of transmitting to the information processing device is performed.
前記第1の視点に係る障害内容特定装置において、前記制御部は、取得した前記ログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがあるときに、選択した前記第3データベースから、抽出した前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、を行い、かつ、取得した、前記オペレーティングシステムが出力したログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがないときに、障害発生の原因が不明であることを知らせる第5通知を前記情報処理装置に送信する処理と、をさらに行う。 In the failure content identification device according to the first viewpoint, when the acquired log information has the same message as the message in the extracted log information, the control unit extracts it from the selected third database. A process of extracting the cause associated with the message in the log information and an operation required for failure recovery, and a process of transmitting the extracted failure information and the cause and an operation required for failure recovery to the information processing apparatus. , And when the acquired log information output by the operating system does not have the same message as the extracted message in the log information, a fifth notification is sent to notify that the cause of the failure is unknown. The process of transmitting to the information processing device is further performed.
本発明では、前記第2の視点に係る障害内容特定システムの形態が可能である。 In the present invention, it is possible to form a failure content identification system according to the second viewpoint.
本発明では、前記第3の視点に係る障害内容特定方法の形態が可能である。 In the present invention, it is possible to form a method for identifying the content of a failure according to the third viewpoint.
本発明では、前記第4の視点に係るプログラムの形態が可能である。 In the present invention, the form of the program according to the fourth viewpoint is possible.
なお、上記の特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(特許請求の範囲及び図面を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせないし選択(必要により不選択)が可能である。すなわち、本発明は、請求の範囲及び図面を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、本願に記載の数値及び数値範囲については、明記がなくともその任意の中間値、下位数値、及び、小範囲が記載されているものとみなされる。 The disclosures of the above patent documents shall be incorporated into this document by citation. Within the framework of the entire disclosure of the present invention (including the scope of claims and drawings), the embodiments or examples can be changed or adjusted based on the basic technical idea thereof. Further, various combinations or selections (necessary) of various disclosure elements (including each element of each claim, each element of each embodiment or embodiment, each element of each drawing, etc.) within the framework of all disclosure of the present invention. (Not selected) is possible. That is, it goes without saying that the present invention includes all disclosures including claims and drawings, and various modifications and modifications that can be made by those skilled in the art in accordance with technical ideas. In addition, regarding the numerical values and numerical ranges described in the present application, it is considered that arbitrary intermediate values, lower numerical values, and small ranges are described even if not specified.
1 障害内容特定システム
100 顧客装置(情報処理装置)
110 制御部
120 入力部
130 出力部
140 通信部
150 記憶部
151 ログ情報
200 ネットワーク
300 障害内容特定装置
310 制御部
320 入力部
330 出力部
340 通信部
350 記憶部
351 障害状況情報データベース(第1データベース)
352 障害情報データベース(第3データベース)
353 起動確認データベース(第2データベース)
354 障害発生確認データベース(第4データベース)
355 アップデート確認データベース(第5データベース)
1 Failure
110
352 Failure information database (third database)
353 Start confirmation database (second database)
354 Failure occurrence confirmation database (4th database)
355 update confirmation database (5th database)
Claims (10)
前記記憶部を制御するとともに、所定の情報処理を行う制御部と、
を備え、
前記記憶部は、
情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理した第1データベースと、
ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理した第2データベースと、
を記憶し、
前記制御部は、
前記第2データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、
前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、
取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがあり、かつ、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、
取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがあり、かつ、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、
ときに、
ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信する処理と、
を行う、
障害内容特定装置。 A storage unit that stores data and
A control unit that controls the storage unit and performs predetermined information processing,
With
The storage unit
The first database acquired from the information processing device and organized by associating the failure occurrence date and time and the information related to the failure occurrence software related to the information processing device.
A second database that organizes software-related information, log information names, startup messages, and startup completion messages in association with each other.
Remember,
The control unit
A process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failed software in the first database from the second database, and
A process of acquiring log information corresponding to the name of the extracted log information from the information processing device, and
In the acquired log information, there is the same message as the running message of the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and
In the acquired log information, there is the same message as the message of the completion of the startup of the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activation completion message included in the acquired log information is equal to or greater than the second predetermined time.
sometimes,
A process of transmitting a first notification notifying that a software start delay failure has occurred to the information processing device, and
I do,
Failure content identification device.
前記記憶部は、ソフトウェアに係る情報、ログ情報の名称、ログ情報中のメッセージ、及び、障害情報を関連付けて整理した第3データベースをさらに記憶し、
前記制御部は、
取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、
取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、
ときに、
前記第3データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、
前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、
前記第3データベースにおいて、取得した前記ログ情報のメッセージと同じログ情報中のメッセージに関連付けられた障害情報があり、かつ、
前記第3データベースの前記障害情報がハードウェアの自動復旧を示す動作となっており、かつ、
取得した前記ログ情報に含まれたハードウェア自動復旧時メッセージの出力日時が、取得した前記ログ情報に含まれたハードウェア障害発生時メッセージの出力日時よりも後であり、かつ、
取得した前記ログ情報において、前記ハードウェア自動復旧時メッセージ及び前記ハードウェア障害発生時メッセージが所定時間以内に所定回数以上記録されていない、
ときに、
ハードウェア障害が発生していないことを知らせる第2通知を前記情報処理装置に送信する処理と、
をさらに行う、
請求項1記載の障害内容特定装置。 The first database is organized by associating the failure occurrence date and time, the information related to the failure occurrence software, and the failure occurrence message regarding the information processing device.
The storage unit further stores a third database in which information related to software, names of log information, messages in log information, and failure information are associated and organized.
The control unit
In the acquired log information, the same message as the running message of the second database does not exist, or
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is not within the first predetermined time, or
In the acquired log information, there is no message that is the same as the message that the startup of the second database is completed, or
The difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the log information is not greater than or equal to the second predetermined time.
sometimes,
A process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failed software in the first database from the third database, and
A process of acquiring log information corresponding to the name of the extracted log information from the information processing device, and
In the third database, there is failure information associated with the message in the same log information as the acquired message of the log information, and
The failure information in the third database is an operation indicating automatic hardware recovery, and
The output date and time of the hardware automatic recovery message included in the acquired log information is later than the output date and time of the hardware failure occurrence message included in the acquired log information, and
In the acquired log information, the hardware automatic recovery message and the hardware failure occurrence message are not recorded more than a predetermined number of times within a predetermined time.
sometimes,
A process of transmitting a second notification to the information processing device notifying that a hardware failure has not occurred, and
Do more,
The device for identifying the content of a failure according to claim 1.
前記制御部は、
前記第3データベースにおいて、取得した前記ログ情報のメッセージと同じログ情報中のメッセージに関連付けられた障害情報がない、又は、
前記第3データベースの前記障害情報がハードウェアの自動復旧を示す動作となっていない、又は、
取得した前記ログ情報に含まれたハードウェア自動復旧時メッセージの出力日時が、取得した前記ログ情報に含まれたハードウェア障害発生時メッセージの出力日時よりも後でない、又は、
取得した前記ログ情報において、前記ハードウェア自動復旧時メッセージ及び前記ハードウェア障害発生時メッセージが所定時間以内に所定回数以上記録されている、
ときに、
前記第3データベースから、前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、
抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、
をさらに行なう、
請求項2記載の障害内容特定装置。 The third database is a database in which information related to the software, names of the log information, messages in the log information, the failure information, and causes and operations necessary for failure recovery are associated and organized.
The control unit
In the third database, there is no failure information associated with the message in the same log information as the acquired message of the log information, or
The failure information in the third database does not indicate the automatic recovery of hardware, or
The output date and time of the hardware automatic recovery message included in the acquired log information is not later than the output date and time of the hardware failure occurrence message included in the acquired log information, or
In the acquired log information, the hardware automatic recovery message and the hardware failure occurrence message are recorded a predetermined number of times or more within a predetermined time.
sometimes,
The process of extracting the cause associated with the message in the log information and the operation required for disaster recovery from the third database, and
A process of transmitting the extracted failure information, the cause, and an operation required for failure recovery to the information processing apparatus, and
To do more,
The device for identifying the content of a failure according to claim 2.
前記記憶部は、ソフトウェアに係る情報、障害発生時メッセージ、障害発生直前操作に係る情報、操作時出力メッセージ、及び、ログ情報の名称を関連付けて整理した第4データベースをさらに記憶し、
前記制御部は、
取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、
取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、
ときに、
前記第4データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたログ情報の名称を抽出する処理と、
前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、
前記第4データベースにおいて、前記第1データベースの前記障害発生直前操作に係る情報と同じ障害発生直前操作に係る情報があり、かつ、
取得した前記ログ情報において、前記第4データベースの前記操作時出力メッセージと同じメッセージがあり、かつ、
前記ログ情報に含まれた障害発生時メッセージの出力日時と、前記ログ情報に含まれた操作時出力メッセージの出力日時との時間差が第3の所定時間以内にある、
ときに、
操作による障害が発生していないことを知らせる第3通知を前記情報処理装置に送信する処理と、
をさらに行う、
請求項1記載の障害内容特定装置。 The first database is organized by associating the information processing apparatus with the date and time when the failure occurred, the information related to the failure occurrence software, and the information related to the operation immediately before the failure occurrence.
The storage unit further stores a fourth database in which information related to software, a message at the time of failure occurrence, information related to an operation immediately before the occurrence of a failure, an output message at the time of operation, and a log information are associated and organized.
The control unit
In the acquired log information, the same message as the running message of the second database does not exist, or
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is not within the first predetermined time, or
In the acquired log information, there is no message that is the same as the message that the startup of the second database is completed, or
The difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the log information is not greater than or equal to the second predetermined time.
sometimes,
A process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure-occurring software in the first database from the fourth database, and
A process of acquiring log information corresponding to the name of the extracted log information from the information processing device, and
In the fourth database, there is information related to the operation immediately before the failure occurrence, which is the same as the information related to the operation immediately before the failure occurrence in the first database, and
In the acquired log information, there is the same message as the operation output message of the fourth database, and
The time difference between the output date and time of the failure occurrence message included in the log information and the output date and time of the operation output message included in the log information is within the third predetermined time.
sometimes,
A process of transmitting a third notification to the information processing device notifying that an operation failure has not occurred, and
Do more,
The device for identifying the content of a failure according to claim 1.
前記制御部は、
取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、
取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、
ときに、
前記第5データベースから、前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報に関連付けられたアップデートソフトウェア適用確認コマンドを抽出する処理と、
抽出された前記アップデートソフトウェア適用確認コマンドを前記情報処理装置で実行させることによって前記情報処理装置から実行ログ情報を取得する処理と、
取得した前記実行ログ情報において、インターネット上に公開されているソフトウェアの最新のアップデートソフトウェアに係る情報の全てが含まれていないときに、最新のアップデートソフトウェアを全て適用させ、前記情報処理装置から、前記最新のアップデートソフトウェアが全て適用された状態のログ情報を取得する処理と、
取得した前記ログ情報において、取得した前記実行ログ情報にない新しいメッセージがないときに、前記情報処理装置への前記最新のアップデートソフトウェア適用で復旧し、現時点では障害が発生していないことを知らせる第4通知を前記情報処理装置に送信する処理と、
をさらに行う、
請求項1記載の障害内容特定装置。 The storage unit further stores the information related to the software and the fifth database organized by associating the update software application confirmation command.
The control unit
In the acquired log information, the same message as the running message of the second database does not exist, or
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is not within the first predetermined time, or
In the acquired log information, there is no message that is the same as the message that the startup of the second database is completed, or
The difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the log information is not greater than or equal to the second predetermined time.
sometimes,
The process of extracting the update software application confirmation command associated with the information related to the software corresponding to the information related to the failed software in the first database from the fifth database, and
A process of acquiring execution log information from the information processing device by executing the extracted update software application confirmation command on the information processing device, and
When the acquired execution log information does not include all the information related to the latest update software of the software published on the Internet, all the latest update software is applied, and the information processing apparatus is used to perform the above. The process of acquiring log information with all the latest update software applied, and
When there is no new message in the acquired log information that is not in the acquired execution log information, the information processing device is restored by applying the latest update software to notify that no failure has occurred at this time. 4 Processing to send the notification to the information processing device and
Do more,
The device for identifying the content of a failure according to claim 1.
前記記憶部は、ソフトウェアに係る情報、ログ情報の名称、ログ情報中のメッセージ、障害情報、及び、原因及び障害復旧に必要な操作を関連付けて整理した第3データベースをさらに記憶し、
前記制御部は、
取得した前記ログ情報において、前記第2データベースの前記起動中のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内にない、又は、
取得した前記ログ情報において、前記第2データベースの前記起動完了のメッセージと同じメッセージがない、又は、
前記第1データベースの前記障害発生日時と前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上でない、
ときに、
前記第1データベースの前記障害発生ソフトウェアに係る情報に対応するソフトウェアに係る情報の前記第3データベースを選択する処理と、
選択した前記第3データベースから、前記第1データベースの前記障害発生時メッセージと同じメッセージが含まれている障害情報を抽出する処理と、
選択した前記第3データベースから、抽出した前記障害情報に関連付けられたログ情報の名称を抽出する処理と、
前記情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、
選択した前記第3データベースから、前記第1データベースの前記障害発生時メッセージと同じメッセージが含まれている障害情報に関連付けられたログ情報中のメッセージを抽出する処理と、
取得した前記ログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがないときに、前記情報処理装置から、オペレーティングシステムが出力したログ情報を取得する処理と、
取得した、前記オペレーティングシステムが出力したログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがあるときに、選択した前記第3データベースから、抽出した前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、
抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、
をさらに行う、
請求項1記載の障害内容特定装置。 The first database is organized by associating the failure occurrence date and time, the information related to the failure occurrence software, and the failure occurrence message regarding the information processing device.
The storage unit further stores a third database in which information related to software, names of log information, messages in log information, failure information, and causes and operations necessary for failure recovery are associated and organized.
The control unit
In the acquired log information, the same message as the running message of the second database does not exist, or
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is not within the first predetermined time, or
In the acquired log information, there is no message that is the same as the message that the startup of the second database is completed, or
The difference between the failure occurrence date and time of the first database and the output date and time of the startup completion message included in the log information is not greater than or equal to the second predetermined time.
sometimes,
The process of selecting the third database of the information related to the software corresponding to the information related to the failed software in the first database, and
A process of extracting failure information containing the same message as the failure occurrence message of the first database from the selected third database, and
A process of extracting the name of the log information associated with the extracted failure information from the selected third database, and
A process of acquiring log information corresponding to the name of the extracted log information from the information processing device, and
From the selected third database, a process of extracting a message in the log information associated with the failure information including the same message as the failure occurrence message of the first database, and
When the acquired log information does not have the same message as the message in the extracted log information, the process of acquiring the log information output by the operating system from the information processing device
When the acquired log information output by the operating system has the same message as the extracted message in the log information, the cause associated with the message in the extracted log information extracted from the selected third database. And the process of extracting the operations required for disaster recovery,
A process of transmitting the extracted failure information, the cause, and an operation required for failure recovery to the information processing apparatus, and
Do more,
The device for identifying the content of a failure according to claim 1.
取得した前記ログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがあるときに、
選択した前記第3データベースから、抽出した前記ログ情報中のメッセージに関連付けられた原因及び障害復旧に必要な操作を抽出する処理と、
抽出した前記障害情報及び前記原因及び障害復旧に必要な操作を前記情報処理装置に送信する処理と、
を行い、かつ、
取得した、前記オペレーティングシステムが出力したログ情報において、抽出した前記ログ情報中のメッセージと同じメッセージがないときに、
障害発生の原因が不明であることを知らせる第5通知を前記情報処理装置に送信する処理と、
をさらに行う、
請求項6記載の障害内容特定装置。 The control unit
When the acquired log information has the same message as the message in the extracted log information,
From the selected third database, the process of extracting the cause associated with the message in the extracted log information and the operation required for failure recovery, and
A process of transmitting the extracted failure information, the cause, and an operation required for failure recovery to the information processing apparatus, and
And
When the acquired log information output by the operating system does not have the same message as the extracted message in the log information.
A process of transmitting a fifth notification to the information processing apparatus notifying that the cause of the failure is unknown, and
Do more,
The device for identifying the content of a failure according to claim 6.
前記障害内容特定装置と通信可能に接続された情報処理装置と、
を備える、
障害内容特定システム。 The fault content identification device according to any one of claims 1 to 7.
An information processing device that is communicatively connected to the failure content identification device,
To prepare
Failure content identification system.
情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得するステップと、
取得した前記ログ情報において、前記第2データベースの起動中のメッセージと同じメッセージがあり、かつ、
前記第1データベースの障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、
取得した前記ログ情報において、前記第2データベースの起動完了のメッセージと同じメッセージがあり、かつ、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、
ときに、
ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信するステップと、
を含み、
各前記ステップは、ハードウェア資源によって行われ、
前記第1データベースは、前記情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理したデータベースであり、
前記第2データベースは、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理したデータベースである、
障害内容特定方法。 A step of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software of the first database from the second database, and
A step of acquiring log information corresponding to the name of the extracted log information from the information processing device, and
In the acquired log information, there is the same message as the message during the startup of the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and
In the acquired log information, there is the same message as the message of the completion of starting the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activation completion message included in the acquired log information is equal to or greater than the second predetermined time.
sometimes,
A step of transmitting a first notification notifying that a software start delay failure has occurred to the information processing apparatus, and
Including
Each of these steps is done by hardware resources
The first database is a database obtained by associating and organizing information on a failure occurrence date and time and failure occurrence software related to the information processing device, which is acquired from the information processing device.
The second database is a database in which information related to software, names of log information, starting messages, and starting completion messages are associated and organized.
How to identify the nature of the failure.
情報処理装置から、抽出された前記ログ情報の名称に対応するログ情報を取得する処理と、
取得した前記ログ情報において、前記第2データベースの起動中のメッセージと同じメッセージがあり、かつ、
前記第1データベースの障害発生日時と、取得した前記ログ情報に含まれた起動中のメッセージの出力日時との差が第1の所定時間以内であり、かつ、
取得した前記ログ情報において、前記第2データベースの起動完了のメッセージと同じメッセージがあり、かつ、
前記第1データベースの前記障害発生日時と、取得した前記ログ情報に含まれた起動完了のメッセージの出力日時との差が第2の所定時間以上である、
ときに、
ソフトウェア起動遅延障害が発生していることを知らせる第1通知を前記情報処理装置に送信する処理と、
をハードウェア資源に実行させ、
前記第1データベースは、前記情報処理装置から取得した、前記情報処理装置に関する、障害発生日時、及び、障害発生ソフトウェアに係る情報を関連付けて整理したデータベースであり、
前記第2データベースは、ソフトウェアに係る情報、ログ情報の名称、起動中のメッセージ、及び、起動完了のメッセージを関連付けて整理したデータベースである、
プログラム。 The process of extracting the name of the log information associated with the information related to the software corresponding to the information related to the failure occurrence software in the first database from the second database, and
Processing to acquire log information corresponding to the name of the extracted log information from the information processing device, and
In the acquired log information, there is the same message as the message during the startup of the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activated message included in the acquired log information is within the first predetermined time, and
In the acquired log information, there is the same message as the message of the completion of starting the second database, and
The difference between the failure occurrence date and time of the first database and the output date and time of the activation completion message included in the acquired log information is equal to or greater than the second predetermined time.
sometimes,
A process of transmitting a first notification notifying that a software start delay failure has occurred to the information processing device, and
Let the hardware resources execute
The first database is a database obtained by associating and organizing information on a failure occurrence date and time and failure occurrence software related to the information processing device, which is acquired from the information processing device.
The second database is a database in which information related to software, names of log information, starting messages, and starting completion messages are associated and organized.
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029954A JP6816891B2 (en) | 2018-02-22 | 2018-02-22 | Failure content identification device, system, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029954A JP6816891B2 (en) | 2018-02-22 | 2018-02-22 | Failure content identification device, system, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019144947A JP2019144947A (en) | 2019-08-29 |
JP6816891B2 true JP6816891B2 (en) | 2021-01-20 |
Family
ID=67772423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018029954A Active JP6816891B2 (en) | 2018-02-22 | 2018-02-22 | Failure content identification device, system, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6816891B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2595733B2 (en) * | 1989-11-30 | 1997-04-02 | 富士通株式会社 | Task error detection method |
US6324546B1 (en) * | 1998-10-12 | 2001-11-27 | Microsoft Corporation | Automatic logging of application program launches |
JP2001325124A (en) * | 2000-05-17 | 2001-11-22 | Fujitsu Ltd | Computer, system management aiding device and management method |
JP6217374B2 (en) * | 2013-12-16 | 2017-10-25 | コニカミノルタ株式会社 | Image processing device, application creation device, management method, creation method, management program, and creation program |
JP2016170621A (en) * | 2015-03-12 | 2016-09-23 | 株式会社リコー | Image processing system, image processing method and program |
-
2018
- 2018-02-22 JP JP2018029954A patent/JP6816891B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019144947A (en) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8782647B2 (en) | Intelligent retry method using remote shell | |
US9256417B2 (en) | Automatic quality assurance for software installers | |
CN101647013B (en) | Bookmark and configuration file for installation sequence | |
US20150067671A1 (en) | Information processing apparatus, control method, and storage medium | |
CN101611375A (en) | Computer system events interface | |
EP3474143B1 (en) | Method and apparatus for incremental recovery of data | |
CN110489161B (en) | Version file management method and related device | |
CN108804257B (en) | Terminal state detection method and device, terminal and storage medium | |
JP6558037B2 (en) | Operation management program, operation management method, and operation management apparatus | |
JP5513926B2 (en) | Maintenance work support system | |
CN114721881A (en) | Database management method, system, electronic device and storage medium | |
JP6816891B2 (en) | Failure content identification device, system, method, and program | |
KR102194974B1 (en) | System for monitoring and controling electric power system for process verification | |
JP2005258501A (en) | Obstacle influence extent analyzing system, obstacle influence extent analyzing method and program | |
JP5544029B1 (en) | Environment building apparatus and environment building program | |
US7788527B2 (en) | Storage system and storage system management method | |
US8423831B2 (en) | System and method for performing auditing and correction | |
JP5380895B2 (en) | Management program, management method and management apparatus | |
CN115794486A (en) | Robot information acquisition method, system, device and readable medium | |
CN111857740A (en) | Software upgrading method and device | |
KR102221593B1 (en) | System for maintaining the installation envoronment of computer terminals | |
CN113577775A (en) | Method and device for checking art resource file, electronic device and storage medium | |
CN113657702A (en) | Automatic operation and maintenance method and device for internet data center and readable storage medium | |
JP6016623B2 (en) | Software execution result deliverable collection apparatus and method | |
JP5618716B2 (en) | FACILITY MANAGEMENT FILE EDITING DEVICE, ITS CONTROL METHOD, AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200728 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6816891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |