JP2017173941A - Incident management system - Google Patents

Incident management system Download PDF

Info

Publication number
JP2017173941A
JP2017173941A JP2016056422A JP2016056422A JP2017173941A JP 2017173941 A JP2017173941 A JP 2017173941A JP 2016056422 A JP2016056422 A JP 2016056422A JP 2016056422 A JP2016056422 A JP 2016056422A JP 2017173941 A JP2017173941 A JP 2017173941A
Authority
JP
Japan
Prior art keywords
incident
classification
identifier
mapping
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016056422A
Other languages
Japanese (ja)
Inventor
寛 本郷
Hiroshi Hongo
寛 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2016056422A priority Critical patent/JP2017173941A/en
Publication of JP2017173941A publication Critical patent/JP2017173941A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To rapidly recognize, when a help desk person receives a telephone communication from an end user, the presence or absence of an incident whose factor overlaps that of the received incident, and timely provide detailed information of the incident to a user.SOLUTION: An incident management system determines an occurrence event classification and possibility index using a system name and a keyword included in the content of an incident on the basis of incident information registered in an incident DB, groups, as an incident due to the same factor, an incident of the same occurrence event classification occurring in the same system using a mapping DB, and displays also another incident in the same group when receiving a display request commanding one incident.SELECTED DRAWING: Figure 1

Description

本発明は、ヘルプデスク担当者(以下、ユーザ)が、インシデント情報を管理する上で、クラウドの種別によることなく、原因が重複しているインシデントを効率的に認識し、エンドユーザへのタイムリーな情報提供を実施するシステムである。   In the present invention, when a help desk person (hereinafter referred to as a user) manages incident information, an incident having a duplicate cause can be efficiently recognized regardless of the type of cloud, and timely delivery to end users can be realized. It is a system that implements information provision.

ヘルプデスクで受付するインシデントの中には、1つの事象に対して複数の問合せが発生(多い場合は50件程度)するものがある。また昨今、プライベートクラウドとパブリッククラウドを組み合わせたハイブリッドクラウドを導入している場合、個々のクラウド環境によって、インシデントの監視アラートからのメッセージ内容等が異なるといったこともあり、情報の管理が複雑化する傾向にある。   Some incidents received at the help desk generate multiple inquiries for one event (about 50 in many cases). In addition, when a hybrid cloud that combines a private cloud and a public cloud has been introduced recently, the content of messages from incident monitoring alerts may differ depending on the individual cloud environment, which tends to complicate information management. It is in.

顧客からの問い合わせ受け付けを行うヘルプデスク担当者は複数名配置されていることもあり、受け付けたインシデントの原因が他のインシデントの原因と重複していた場合でも、問合せ受付時にヘルプデスク担当者が認識することは困難となっている。   There may be multiple help desk personnel who accept inquiries from customers, and even if the cause of the accepted incident overlaps with the cause of other incidents, the help desk personnel will recognize when the inquiry is accepted It has become difficult to do.

場合によっては、受け付けたインシデントの原因が別インシデントの対応によって既に究明されており、原因や対応状況がインシデントDB上に登録されていることがある。その場合であっても、ヘルプデスク担当者が重複インシデントであることを認識できない場合は、新規のインシデントとして一旦は管理し後に連絡する旨をユーザに回答するといった対応となる。すなわち、インシデント対応に関する最新の情報をタイムリーにユーザに提供できていないという問題がある。   In some cases, the cause of the accepted incident has already been investigated by the response of another incident, and the cause and response status may be registered in the incident DB. Even in such a case, if the help desk person cannot recognize that it is a duplicate incident, it is handled as a new incident, which is once managed and the user is informed that it will be contacted later. That is, there is a problem that the latest information on incident response cannot be provided to the user in a timely manner.

特開2013-54530号公報JP 2013-54530 A

特許文献1にはインシデント情報保持部と、抽出条件保持部と、抽出部と、抽出結果保持部を備え、インシデント情報保持部は、情報処理システムにおいて発生した複数のインシデントの情報を保持し、抽出条件保持部は、ユーザへ通知すべきインシデントを抽出するためにユーザが予め定めた抽出条件を保持し、抽出部は、抽出条件にもとづきインシデントを抽出し、その情報をユーザへ通知し、今回抽出した結果と、抽出結果保持部に保持される過去抽出結果とを比較し、片方にだけ含まれるインシデントの情報をユーザへ通知するシステムが開示されている。   Patent Document 1 includes an incident information holding unit, an extraction condition holding unit, an extracting unit, and an extraction result holding unit, and the incident information holding unit holds and extracts information on a plurality of incidents generated in the information processing system. The condition holding unit holds extraction conditions predetermined by the user in order to extract incidents to be notified to the user, and the extraction unit extracts incidents based on the extraction conditions, notifies the user of the information, and extracts this time The system which compares the result of this and the past extraction result hold | maintained at an extraction result holding | maintenance part, and notifies the user of the information of the incident contained only in one side is disclosed.

特許文献1のシステムによりインシデントの追加、削除を自動化することによりインシデントの効率的な管理が行えることが説明されているが、登録されているインシデントに重複が無いように管理することについては配慮されていない。   Although it has been described that incidents can be managed efficiently by automating the addition and deletion of incidents using the system of Patent Document 1, it is considered that there is no duplication in registered incidents. Not.

本発明では、ヘルプデスク担当者がエンドユーザからの電話連絡を受け付けた際に、そのインシデントと原因が重複するインシデントの有無を迅速に認識し、そのインシデントに関してより詳しい情報をタイムリーにユーザに提供することを課題とする。   In the present invention, when a help desk person receives a telephone call from an end user, it quickly recognizes whether there is an incident whose cause is the same as the incident, and provides more detailed information about the incident to the user in a timely manner. The task is to do.

インシデント識別子、インシデント内容及び発生システムの識別子を受付け、インシデントをインシデントDBへ登録するインシデント登録処理部と、受付けたインシデント内容に含まれるキーワードと発生システムの識別子を用いてインシデントを分類するためのルールを格納した選定DBを検索し、得られた分類と分類の確からしさを示す可能性指数を求める分類処理部と、求められた分類とシステムの識別子を基にマッピングDBを検索し、対応する組合せがあればインシデントの識別子と求められた可能性指数をマッピングDBの検索で見つかった組合せに追加するマッピング処理部と、インシデント識別子を指定したインシデント内容の出力要求を受付けたとき、マッピングDBを参照し受付けたインシデント識別子と同じシステムの識別子、同じ分類の他のインシデント識別子を対応付けて出力する出力部を備えるインシデント管理システムにより解決される。   An incident registration processing unit that accepts incident identifiers, incident contents, and occurrence system identifiers, and registers incidents in the incident database, and rules for classifying incidents using keywords and occurrence system identifiers included in the received incident contents Search the stored selection DB, search the mapping DB based on the obtained classification and system identifier, the classification processing unit that calculates the obtained classification and probability index indicating the probability of classification, and the corresponding combination If there is a mapping processing unit that adds the incident identifier and the calculated possibility index to the combination found in the mapping DB search, and an output request for the incident content with the incident identifier specified, the mapping DB is referenced and accepted. The same system identifier as the incident identifier It is solved by an incident management system including an output unit that outputs other incident identifiers in association with each other.

より詳細な構成は実施例の中で明らかにされる。   A more detailed configuration will be clarified in the examples.

インシデントの重複を減らすることにより対応ヘルプデスク担当者のインシデント対応負荷を軽減できる。   Reducing incident duplication can reduce the incident response load of response help desk personnel.

本発明の実施例に係るシステム構成図の例である。It is an example of the system block diagram concerning the Example of this invention. 本発明の実施例に係るインシデント管理サーバの構成図の例である。It is an example of the block diagram of the incident management server which concerns on the Example of this invention. 本発明の実施例に係る、システム・クラウドの構成図の例である。It is an example of the block diagram of a system cloud based on the Example of this invention. 本発明の実施例に係る、対応中インシデントのマッピングデータベースの例である。It is an example of the mapping database of the incident in response based on the Example of this invention. 本発明の実施例に係る、インシデントデータベースの例である。It is an example of the incident database based on the Example of this invention. 本発明の実施例に係る、発生事象分類の選定データベースの例である。It is an example of the selection database of occurrence event classification based on the Example of this invention. 本発明の実施例に係る、発生事象キーワードデータベースの例である。It is an example of the occurrence event keyword database based on the Example of this invention. 本発明の実施例に係る、監視メッセージキーワードデータベースの例である。It is an example of the monitoring message keyword database based on the Example of this invention. 本発明の実施例に係る、インシデント登録処理のフローチャートの例である。It is an example of the flowchart of an incident registration process based on the Example of this invention. 本発明の実施例に係る、重複インシデント通知画面の例である。It is an example of the duplication incident notification screen based on the Example of this invention.

以下、本発明の実施例について図面を参照しつつ説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、システムの構成を示す図の例である。クラウドシステム10は複数のクラウドシステムから構成され、この例ではクラウドA、クラウドB、クラウドCの3つのクラウドで構成されている。クラウドの一つとして、顧客のオンプレミス計算機が含まれていても良い。これらのクラウドはプライベートクラウド、パブリッククラウド等の異なる種類のクラウドを含む。顧客のアプリケーションシステムは少なくとも二つ以上のクラウドシステムやオンプレミスのシステムにより構成されている。   FIG. 1 is an example of a diagram showing a system configuration. The cloud system 10 includes a plurality of cloud systems. In this example, the cloud system 10 includes three clouds, that is, cloud A, cloud B, and cloud C. As one of the clouds, a customer on-premises computer may be included. These clouds include different types of clouds such as private clouds and public clouds. The customer application system is composed of at least two or more cloud systems or on-premises systems.

クラウドシステムは監視ツール20で監視されている。この例では監視ツールA、監視ツールB、監視ツールCの三つの監視ツールで監視されている。監視ツールはクラウドにインストールされたソフトウェアで有っても良いし、外部からクラウドシステムにアクセスして監視するツールで有っても良い。   The cloud system is monitored by the monitoring tool 20. In this example, monitoring is performed by three monitoring tools: monitoring tool A, monitoring tool B, and monitoring tool C. The monitoring tool may be software installed in the cloud, or may be a tool that accesses and monitors the cloud system from the outside.

図2は、インシデント管理サーバの構成図である。監視ツール20とネットワークで接続され、監視ツール20が検知したインシデントを自動登録できる。   FIG. 2 is a configuration diagram of the incident management server. Connected to the monitoring tool 20 via a network, incidents detected by the monitoring tool 20 can be automatically registered.

さらにインシデントサーバ100はネットワーク経由でヘルプデスクオペレータが操作するオペレータ端末200に接続されており、ユーザからヘルプデスクオペレータが受けたインシデントを登録する。   Furthermore, the incident server 100 is connected to the operator terminal 200 operated by the help desk operator via the network, and registers incidents received by the help desk operator from the user.

インシデント管理サーバ100は演算処理を行うCPU110と、処理プログラムや処理データの一時記憶に用いられるメモリ120と、ネットワークと接続するためのI/Oインタフェース130と各種データベースを格納する外部記憶装置191で構成される。   The incident management server 100 includes a CPU 110 that performs arithmetic processing, a memory 120 that is used for temporary storage of processing programs and processing data, an I / O interface 130 that is connected to a network, and an external storage device 191 that stores various databases. Is done.

外部記憶装置191には対応中インシデントのマッピングDB200、インシデントDB300、発生事象分類の選定DB400、発生事象キーワードDB500、監視メッセージキーワードDB600が格納されている。
I/Oインタフェースにはキーボードやマウス等の入力装置、ディスプレイ等の出力装置が接続されていても良い。
The external storage device 191 stores a corresponding incident mapping DB 200, an incident DB 300, an occurrence event classification selection DB 400, an occurrence event keyword DB 500, and a monitoring message keyword DB 600.
An input device such as a keyboard and a mouse and an output device such as a display may be connected to the I / O interface.

メモリ120にはユーザ端末送受信部140、インシデント登録処理実行部150、インシデントマッピング処理実行部160、発生事象分類の選定実行部170、重複インシデント通知画面表示部175、発生事象分類の選定ロジック180、対応中インシデントのマッピングロジック181、インシデントデータ接続インタフェース190がソフトウェアモジュール(以下モジュールと呼ぶ)として格納され、CPU110により実行される。   Memory 120 includes user terminal transmission / reception unit 140, incident registration processing execution unit 150, incident mapping processing execution unit 160, occurrence event category selection execution unit 170, duplicate incident notification screen display unit 175, occurrence event category selection logic 180, and correspondence The middle incident mapping logic 181 and the incident data connection interface 190 are stored as software modules (hereinafter referred to as modules) and executed by the CPU 110.

ユーザ端末送受信部140は、ネットワークを介して接続されているオペレータ端末101との間でデータ送受信を行う。より具体的には、ヘルプデスクオペレータがオペレータ端末101に接続されたキーボード等の入力機器を通じて入力したデータを受信し、他のモジュールへの転送処理などを行うと共に、他のモジュールからの処理結果をユーザ端末101に対し送信する処理を行う。   The user terminal transmission / reception unit 140 performs data transmission / reception with the operator terminal 101 connected via the network. More specifically, the help desk operator receives data input through an input device such as a keyboard connected to the operator terminal 101, performs a transfer process to another module, and the processing result from the other module. Processing to transmit to the user terminal 101 is performed.

インシデント登録処理実行部150、インシデントマッピング処理実行部160、発生事象分類の選定実行部170、重複インシデント通知画面表示部175、インシデントデータ接続インタフェース190は、本システムにおいてインシデント管理を実行するモジュールである。インシデント登録処理実行部150は、上述の処理によってヘルプデスクオペレータ102がオペレータ端末101から入力した情報を、インシデントDB300に格納する。発生事象分類の選定実行部170は、前述の処理によってインシデント管理サーバ100に格納されたインシデントDB300と発生事象分類の選定DB400とを接続し、発生事象の分類を可能とする。インシデントマッピング処理実行部160は、オペレータ端末101からの命令に基づき、インシデントデータ接続インタフェース190を介して対応中インシデントのマッピングDB200に情報を反映させる。重複インシデント通知画面表示部175は、前述の処理によるマッピング結果を踏まえ、重複インシデント通知画面1000をオペレータ端末に表示させる。   The incident registration processing execution unit 150, the incident mapping processing execution unit 160, the occurrence event classification selection execution unit 170, the duplicate incident notification screen display unit 175, and the incident data connection interface 190 are modules that execute incident management in this system. The incident registration process execution unit 150 stores the information input from the operator terminal 101 by the help desk operator 102 through the above-described process in the incident DB 300. The occurrence event category selection execution unit 170 connects the incident DB 300 stored in the incident management server 100 and the occurrence event category selection DB 400 by the above-described processing, and enables the occurrence event category. The incident mapping process execution unit 160 reflects information in the corresponding incident mapping DB 200 via the incident data connection interface 190 based on a command from the operator terminal 101. The duplicate incident notification screen display unit 175 displays the duplicate incident notification screen 1000 on the operator terminal based on the mapping result by the above-described processing.

発生事象分類の選定ロジック180は、ユーザがユーザ端末101を通じて指示した発生事象分類の選定実行部170の状況を監視し、データベースの処理状況を判定するものである。   The occurrence event category selection logic 180 monitors the status of the occurrence event category selection execution unit 170 instructed by the user through the user terminal 101, and determines the processing status of the database.

図3はシステム・クラウドの構成図である。クラウド環境上に複数のサーバが設置されており、そのサーバでアプリケーションが動作している。この例ではアプリケーションBはサーバB1とサーバB2で実行され、サーバB1はクラウドAにあるが、サーバB2はクラウドBにある。このような場合同じアプリケーションBに関連するメッセージであってもサーバB1が停止した場合にはクラウドAから「B1サーバが機能停止」というメッセージが出力され、サーバB2が停止した場合にはクラウドBから「B2サーバダウン」というメッセージが出力され、サーバが停止していることを検知するのが難しい場合がある。   FIG. 3 is a configuration diagram of the system cloud. A plurality of servers are installed on the cloud environment, and applications are operating on the servers. In this example, the application B is executed on the server B1 and the server B2, and the server B1 is in the cloud A, but the server B2 is in the cloud B. In such a case, even if the message is related to the same application B, if the server B1 is stopped, the message “B1 server is out of function” is output from the cloud A, and if the server B2 is stopped, the message is sent from the cloud B. The message “B2 server down” may be output and it may be difficult to detect that the server is down.

図4はマッピングDB200の構成である。オペレータ端末から入力された、または監視システムのメッセージから自動的に登録された対応中のインシデントに関する情報が格納され、インシデントの発生しているクラウドのシステム名201、表示不正、処理遅延、接続不可等の事象の発生事象分類202、インシデントに割り振られたインシデントNo203、発生事象分類202の確からしさを示す可能性指数204が格納される。   FIG. 4 shows the configuration of the mapping DB 200. Stores information related to incidents entered from operator terminals or automatically registered from monitoring system messages, including the cloud system name 201 where the incident occurred, incorrect display, processing delay, connection not possible, etc. Are stored, and an incident number 203 assigned to the incident, and a probability index 204 indicating the probability of the generated event classification 202 are stored.

図5はオペレータが入力したインシデントと監視ツール20のメッセージから抽出したインシデントを格納するインシデントDB300の構成である。   FIG. 5 shows a configuration of an incident DB 300 that stores incidents input by an operator and incidents extracted from messages of the monitoring tool 20.

この例ではインシデントNoのIM00001〜IM0003までがオペレータにより入力されたインシデントであり、インシデントNoのIM00004〜IM00006が監視ツール20のメッセージから抽出したインシデントである。   In this example, incident numbers IM00001 to IM0003 are incidents input by the operator, and incident numbers IM00004 to IM00006 are incidents extracted from the message of the monitoring tool 20.

インシデントDB300には割り振られたインシデントNo301、クラウドのシステム名302、オペレータがユーザから受付けた受付内容(ユーザ問合せ)303、監視ツール20から受け取った監視メッセージ内容304、インシデントに対する処理が完了したかどうかを示すステータス305、ユーザからの問合せなのか、監視ツール20からの報告なのかを示すトリガー306、インシデント管理システムインシデントを受け付けた時刻を示す受付日時307、マッピングDB200上で同件と見なされたインシデントのインシデントNoを格納する関連インシデントNo308等が含まれる。   In the incident DB 300, the assigned incident number 301, the cloud system name 302, the received contents (user inquiry) 303 received from the user by the operator, the monitored message contents 304 received from the monitoring tool 20, and whether or not the processing for the incident has been completed. Status 305 to be displayed, trigger 306 indicating whether the inquiry is from the user or a report from the monitoring tool 20, reception date and time 307 indicating the time when the incident management system incident was received, and incidents that are considered to be the same on the mapping DB 200 The related incident No. 308 for storing the incident No. is included.

図6はインシデントDB300に登録された受付内容(ユーザ問合せ)303、もしくは監視メッセージ内容304を発生事象分類に変換するルールを納めた発生事象分類の選定DBである。   FIG. 6 shows an occurrence event category selection DB that stores a rule for converting received content (user inquiry) 303 or monitoring message content 304 registered in the incident DB 300 into an occurrence event category.

発生事象分類の選定DB400は、各行が一つのルールとなっており、クラウドのシステム名401、オペレータ端末200からインシデントDB300に入力されたインシデント受付内容(ユーザ問合せ)303に含まれているかどうかを確認する発生事象キーワード402、監視ツール20から送られてインシデントDBに登録された監視メッセージに含まれているかどうかを確認する監視メッセージキーワード403、分類された発生事象の種別を示す発生事象分類404、発生事象キーワード402、監視メッセージキーワード403に登録されたキーワードが含まれていた場合に発生事象分類404が正しい確率を示す可能性指数405を含む。   Occurrence event classification selection DB 400 has one rule for each row, and confirms whether it is included in the incident reception contents (user inquiry) 303 entered in the incident DB 300 from the cloud system name 401 and the operator terminal 200 Occurrence event keyword 402, monitoring message keyword 403 to check whether it is included in the monitoring message sent from the monitoring tool 20 and registered in the incident DB, occurrence event classification 404 indicating the type of the occurrence event that has been classified, occurrence When the keyword registered in the event keyword 402 and the monitoring message keyword 403 is included, the generated event classification 404 includes a possibility index 405 indicating a correct probability.

1行目のルールはシステムAでオペレータが入力した内容に「ログイン」と「できない」というキーワードが含まれていた場合100%の可能性指数で「接続不可」と判断するというルールである。   The rule on the first line is a rule that, when the keyword “login” and “impossible” are included in the contents entered by the operator in system A, it is determined that “connection is impossible” with a 100% possibility index.

インシデントDB300に登録されたシステム名302と受付内容(ユーザ問合せ) 303もしくは監視メッセージ内容304を基に、発生事象分類の選定実行部170が発生事象分類404と可能性指数405を選定して登録する。発生事象分類404、及び可能性指数405の算出は過去のインシデント情報を基に分析した相関結果を基に算出し定義している。また、過去のインシデント情報の分析は定期的に行い、発生事象分類404、及び可能性指数405を随時更新していくことで可能性指数の確からしさを向上させていくことができる。   Based on the system name 302 registered in the incident DB 300 and the received content (user inquiry) 303 or the monitoring message content 304, the generated event category selection execution unit 170 selects and registers the generated event category 404 and the possibility index 405. . The occurrence event classification 404 and the possibility index 405 are calculated and defined based on a correlation result analyzed based on past incident information. The past incident information is analyzed periodically, and the probability of the possibility index can be improved by updating the occurrence event classification 404 and the possibility index 405 as needed.

図7はエンドユーザからヘルプデスクオペレータに連絡される問合せ内容の中から予めキーワードを集めて格納した発生事象キーワードDB500の内容である。   FIG. 7 shows the contents of the occurrence event keyword DB 500 in which keywords are collected and stored in advance from the inquiry contents notified from the end user to the help desk operator.

図8は監視ツールから送付されるメッセージ内容の中から予めキーワードを集めて格納した監視メッセージキーワードDB600である。   FIG. 8 shows a monitoring message keyword DB 600 in which keywords are collected and stored in advance from message contents sent from the monitoring tool.

図9はインシデント管理サーバでインシデントの登録処理を行う処理を説明するフローチャートである。   FIG. 9 is a flowchart illustrating a process for performing an incident registration process in the incident management server.

ステップ701:まず、監視ツールからのメッセージ入力、又はオペレータ端末101からのインシデント内容入力によりインシデント登録処理実行部150がインシデント情報をインシデントDB300に格納する。   Step 701: First, the incident registration processing execution unit 150 stores the incident information in the incident DB 300 by inputting a message from the monitoring tool or inputting an incident content from the operator terminal 101.

ステップ702:インシデント登録がオペレータ端末からのインシデント登録かの判定を行う。   Step 702: It is determined whether the incident registration is an incident registration from an operator terminal.

ステップ703:、オペレータ端末からのインシデント登録の場合(702 Yes)、発生事象分類の選定実行部170が発生事象キーワードDB400のキーワードを基に、インシデントDB300の受付内容(ユーザ問合せ)303に含まれるキーワードを抽出する。   Step 703: In the case of incident registration from the operator terminal (702 Yes), the keywords included in the received contents (user inquiry) 303 of the incident DB 300 based on the keywords of the generated event keyword DB 400 by the generated event classification selection execution unit 170 To extract.

ステップ704: 発生事象分類の選定実行部170が、インシデントDB300のシステム名302が発生事象分類の選定DB400のシステム名401と一致し、インシデントDBから抽出したキーワードが発生事象分類の選定DB400の発生事象キーワード402と一致するルールがあるかどうかを調べ、一致するルールがあったときルールの発生事象分類と可能性指数405を選択する。   Step 704: The occurrence event category selection execution unit 170 matches the system name 302 of the incident DB 300 with the system name 401 of the occurrence event category selection DB 400, and the keyword extracted from the incident DB is the occurrence event of the occurrence event category selection DB 400 It is checked whether there is a rule that matches the keyword 402. When there is a rule that matches, the occurrence event classification of the rule and the possibility index 405 are selected.

ステップ705: インシデント登録が監視ツール20からの登録であった場合(702 No)、発生事象分類の選定実行部170が監視メッセージキーワードDB600のキーワードを基に、インシデントDB300の監視メッセージ内容304に含まれるキーワードを抽出する。   Step 705: If the incident registration is registration from the monitoring tool 20 (702 No), the occurrence classification selection execution unit 170 is included in the monitoring message content 304 of the incident DB 300 based on the keyword of the monitoring message keyword DB 600 Extract keywords.

ステップ706: 発生事象分類の選定実行部170が、インシデントDB300のシステム名302が発生事象分類の選定DB400のシステム名401と一致し、インシデントDBから抽出したキーワードが、発生事象分類の選定DB4000の監視メッセージキーワード403と一致するルールがあるかどうかを調べ、一致するルールがあったときルールの発生事象分類と可能性指数405を選択する。   Step 706: The incident event classification selection execution unit 170 monitors the incident event classification selection DB 4000 when the system name 302 of the incident DB 300 matches the system name 401 of the incident event classification selection DB 400 and the keyword extracted from the incident DB is It is checked whether there is a rule that matches the message keyword 403. When there is a rule that matches, the occurrence event classification of the rule and the possibility index 405 are selected.

ステップ707: 発生事象分類の選定DB400のシステム名401と発生事象分類404を基に、マッピングDB200のシステム名201と発生事象分類202をサーチし、システム名と発生事象分類が一致する組合せを調べる。   Step 707: Selection of occurrence event classification Based on the system name 401 and occurrence event classification 404 in the DB 400, the system name 201 and occurrence event classification 202 in the mapping DB 200 are searched to find a combination that matches the system name and occurrence event classification.

ステップ708: マッピングDB200のサーチで見つかったシステム名201と発生事象分類202組合せにインシデントが登録されているかどうかを判定する。   Step 708: It is determined whether or not an incident is registered in the combination of the system name 201 and the occurrence event classification 202 found by the mapping DB 200 search.

ステップ709: インシデントが登録されていなければ、処理中のインシデントNo301と可能性指数405をサーチで見つかったマッピングDB200の組合せに対応するインシデントNo203と可能性指数204に登録する。   Step 709: If no incident is registered, the incident No 301 being processed and the possibility index 405 are registered in the incident No 203 and possibility index 204 corresponding to the combination of the mapping DB 200 found by the search.

ステップ710: サーチで見つかったマッピングDB200の組合せのインシデントNo203に他のインシデントの情報が格納されていた場合(708 No)、他のインシデントNoと可能性指数を残したまま、当該インシデントNo301と可能性指数405を同じセルの中に追記する。   Step 710: When information on other incidents is stored in incident No203 of the combination of mapping DB200 found in the search (708 No), it is possible that the incident No301 remains with other incident numbers and possibility indexes remaining. Add index 405 to the same cell.

ステップ711: オペレータ端末に重複インシデント通知画面1000を表示する。   Step 711: The duplicate incident notification screen 1000 is displayed on the operator terminal.

このようにして同じ原因によるインシデントであることがわかるよう、マッピングDB200を用いてインシデントをグルーピングすることにより、対応しなければならないインシデントがいくつあるのかがわかる。登録されたインシデントと重複する対応中インシデントが存在する場合に、インシデント登録と同時にオペレータ端末に通知がなされることにより、オペレータはそのインシデントのその時点での対応状況を確認することができる。   In this way, it is possible to know how many incidents have to be handled by grouping incidents using the mapping DB 200 so that the incidents are caused by the same cause. When there is a handling incident that overlaps with the registered incident, the operator terminal is notified at the same time as the incident registration, so that the operator can check the response status of the incident at that time.

図10は登録されたインシデントと重複する対応中インシデントが存在する場合に、インシデント登録と同時にオペレータ端末に表示される画面である。ヘルプデスク担当者によるインシデント登録時、マッピングDB200の内容をオペレータ端末へ出力することにより、登録されたインシデントと重複するインシデントの有無を確認することができる。その際に、クラウド環境毎に異なる、監視ツールからの発信情報の違いにより異なる複数のインシデントが発生しているという誤解を与える可能性を軽減できる。   FIG. 10 shows a screen displayed on the operator terminal at the same time as the incident registration when there is a handling incident that overlaps with the registered incident. At the time of incident registration by a help desk person in charge, the contents of the mapping DB 200 are output to the operator terminal, so that it is possible to check whether there is an incident that overlaps with the registered incident. At that time, it is possible to reduce the possibility of giving a misunderstanding that a plurality of different incidents are generated due to differences in transmission information from monitoring tools, which are different for each cloud environment.

また、重複インシデントが存在した場合、ヘルプデスク担当者はその存在を認識することができ、またその時点での対応状況について登録されている情報を基に、ユーザに知らせることができる。   In addition, when there is a duplicate incident, the help desk staff can recognize the presence, and can notify the user based on the registered information about the response status at that time.

100 インシデント管理サーバ、101 オペレータ端末、102 ヘルプデスクオペレータ、110 CPU、120 メモリ、130 I/Oインタフェース、140 ユーザ端末送受信部、150 インシデント登録処理実行部、160 インシデントマッピング処理実行部、170 発生事象分類の選定実行部、175 重複インシデント通知画面、180 発生事象分類の選定ロジック、181 対応中インシデントのマッピングロジック、190 インシデントデータ接続インタフェース、200 マッピングDB、300 インシデントDB、400 発生事象分類の選定DB、500 発生事象キーワードDB、600 監視メッセージキーワードDB、700 インシデント登録処理、1000 重複インシデント通知画面   100 Incident management server, 101 Operator terminal, 102 Help desk operator, 110 CPU, 120 memory, 130 I / O interface, 140 User terminal transmission / reception unit, 150 Incident registration processing execution unit, 160 Incident mapping processing execution unit, 170 Occurrence classification Selection Execution Unit, 175 Duplicate Incident Notification Screen, 180 Occurrence Event Classification Selection Logic, 181 Incident Response Mapping Logic, 190 Incident Data Connection Interface, 200 Mapping DB, 300 Incident DB, 400 Occurrence Event Classification Selection DB, 500 Occurrence event keyword DB, 600 Monitoring message keyword DB, 700 Incident registration processing, 1000 Duplicate incident notification screen

Claims (3)

インシデント識別子、インシデント内容及び発生システムの識別子を受付け、インシデントをインシデントDBへ登録するインシデント登録処理部と、
受付けたインシデント内容に含まれるキーワードと発生システムの識別子を用いてインシデントを分類するためのルールを格納した選定DBを検索し、得られた分類と分類の確からしさを示す可能性指数を求める分類処理部と、
求められた分類とシステムの識別子を基にマッピングDBを検索し、対応する組合せがあればインシデントの識別子と求められた可能性指数をマッピングDBの検索で見つかった組合せに追加するマッピング処理部と、
インシデント識別子を指定したインシデント内容の出力要求を受付けたとき、マッピングDBを参照し受付けたインシデント識別子と同じシステムの識別子、同じ分類の他のインシデント識別子を対応付けて出力する出力部を備えることを特徴とするインシデント管理システム。
An incident registration processing unit that accepts an incident identifier, an incident content, and an identifier of an occurrence system, and registers the incident in the incident DB;
A classification process that searches the selection DB that stores the rules for classifying incidents using the keywords included in the received incident content and the identifier of the system in which the incident occurred, and obtains a probability index indicating the obtained classification and the probability of classification And
A mapping processing unit that searches the mapping DB based on the obtained classification and system identifier, and adds the incident identifier and the obtained possibility index to the combination found by the mapping DB search if there is a corresponding combination;
When an output request for an incident content with an incident identifier specified is received, an output unit is provided that outputs the corresponding system identifier and other incident identifier of the same classification as the received incident identifier by referring to the mapping DB Incident management system.
インシデント登録処理部はインシデント内容としてオペレータから受付けたインシデント内容と監視ツールから受付けたエラーメッセージを登録し、
分類処理部はオペレータから受付けたインシデント内容の分類に使用するキーワードと異なるエラーメッセージの分類に使用するキーワードを使用することを特徴とする請求項1に記載のインシデント管理システム。
The incident registration processing part registers the incident content received from the operator as the incident content and the error message received from the monitoring tool,
2. The incident management system according to claim 1, wherein the classification processing unit uses a keyword used for classification of error messages different from a keyword used for classification of incident contents received from an operator.
インシデント登録処理部がインシデントを登録したときに、マッピング処理部がインシデント情報の重複があるかどうかを判定し、
画面表示部はオペレータ端末に重複インシデント情報を表示することを特徴とする請求項2に記載のインシデント管理システム。
When the incident registration processing unit registers an incident, the mapping processing unit determines whether there is duplication of incident information,
The incident management system according to claim 2, wherein the screen display unit displays duplicate incident information on an operator terminal.
JP2016056422A 2016-03-22 2016-03-22 Incident management system Pending JP2017173941A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016056422A JP2017173941A (en) 2016-03-22 2016-03-22 Incident management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016056422A JP2017173941A (en) 2016-03-22 2016-03-22 Incident management system

Publications (1)

Publication Number Publication Date
JP2017173941A true JP2017173941A (en) 2017-09-28

Family

ID=59971245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016056422A Pending JP2017173941A (en) 2016-03-22 2016-03-22 Incident management system

Country Status (1)

Country Link
JP (1) JP2017173941A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019175168A (en) * 2018-03-28 2019-10-10 株式会社リコー Trouble management system, trouble management device, trouble management method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019175168A (en) * 2018-03-28 2019-10-10 株式会社リコー Trouble management system, trouble management device, trouble management method and program
JP7069955B2 (en) 2018-03-28 2022-05-18 株式会社リコー Fault management system, fault management device, fault management method and program

Similar Documents

Publication Publication Date Title
JP7373611B2 (en) Log auditing methods, equipment, electronic equipment, media and computer programs
CN110908883B (en) User portrait data monitoring method, system, equipment and storage medium
CN112631913B (en) Method, device, equipment and storage medium for monitoring operation faults of application program
US9009850B2 (en) Database management by analyzing usage of database fields
US20200012543A1 (en) Event Monitoring Apparatus and Event Monitoring Method
CN114548706A (en) Early warning method for business risk and related equipment
US20160124957A1 (en) Managing Big Data for Services
CN113672475B (en) Alarm processing method and device, computer equipment and storage medium
CN107885634B (en) Method and device for processing abnormal information in monitoring
CN112052134A (en) Service data monitoring method and device
JP2012094049A (en) Incident management system and incident management program
CN114443437A (en) Alarm root cause output method, apparatus, device, medium, and program product
JP6078485B2 (en) Operation history analysis apparatus, method, and program
CN112182025A (en) Log analysis method, device, equipment and computer readable storage medium
JP2017173941A (en) Incident management system
EP4216076A1 (en) Method and apparatus of processing an observation information, electronic device and storage medium
WO2014196982A1 (en) Identifying log messages
JP2012234496A (en) Information collecting system, method for collecting information, information collecting program
CN115408236A (en) Log data auditing system, method, equipment and medium
CN113094088A (en) Database configuration information acquisition method and device, computer equipment and storage medium
CN114428704A (en) Method and device for full-link distributed monitoring, computer equipment and storage medium
CN116723002B (en) Intelligent encryption method for power report based on situation awareness
US20220414618A1 (en) Management and aggregation of ticket data from multiple sources
WO2017068669A1 (en) Event detection terminal
JP2013164668A (en) Fault monitoring system, incident tabulation method, and program