JP2024015673A - Monitoring support device, monitoring support method, and program - Google Patents
Monitoring support device, monitoring support method, and program Download PDFInfo
- Publication number
- JP2024015673A JP2024015673A JP2022117900A JP2022117900A JP2024015673A JP 2024015673 A JP2024015673 A JP 2024015673A JP 2022117900 A JP2022117900 A JP 2022117900A JP 2022117900 A JP2022117900 A JP 2022117900A JP 2024015673 A JP2024015673 A JP 2024015673A
- Authority
- JP
- Japan
- Prior art keywords
- log
- service
- support device
- monitoring support
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000005856 abnormality Effects 0.000 claims abstract description 61
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000012800 visualization Methods 0.000 claims description 50
- 230000008569 process Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 description 88
- 238000010586 diagram Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本開示は、監視支援装置、監視支援方法及びプログラムに関する。 The present disclosure relates to a monitoring support device, a monitoring support method, and a program.
一般に、アプリケーションは様々なログを出力している。例えば、アプリケーションに対する操作情報、アプリケーションの動作情報(内部動作、外部動作)、エラーや故障等といった異常事象に関する情報等がログとして出力される。これらのログは、アプリケーションに異常が発生した際の異常要因の特定や影響範囲の解析等といった異常発生後の調査作業等に用いられることが多いが(例えば、特許文献1等を参照)、異常兆候の検出等といった異常発生前の監視作業でも活用することができる。 Generally, applications output various logs. For example, operation information for the application, operation information of the application (internal operation, external operation), information regarding abnormal events such as errors and failures, etc. are output as a log. These logs are often used for investigation work after an abnormality occurs, such as identifying the cause of the abnormality and analyzing the range of influence when an abnormality occurs in an application (see, for example, Patent Document 1). It can also be used for monitoring work before an abnormality occurs, such as detecting symptoms.
ここで、複数のアプリケーションが連携して或る特定のサービスを提供しているような場合には、異常発生前の監視作業のために、そのサービスを提供している各アプリケーションのログが必要になることがある。しかしながら、例えば、ログの肥大化を防止するためといった理由等により、各アプリケーションは、一部のログ(例えば、異常発生時のログ等)しか外部に出力していない場合がある。この場合、必要なログが入手できず、異常兆候を検出するための監視作業が困難になる。 If multiple applications are working together to provide a specific service, logs from each application providing that service are required for monitoring before an error occurs. It may happen. However, each application may output only a part of the log (for example, a log when an abnormality occurs) to the outside, for example, to prevent the log from becoming large. In this case, necessary logs cannot be obtained, making monitoring work to detect signs of abnormality difficult.
本開示は、上記の点に鑑みてなされたもので、複数のアプリケーションの連携により実現されるサービスの監視を支援できる技術を提供することを目的とする。 The present disclosure has been made in view of the above points, and aims to provide technology that can support monitoring of services realized by cooperation of multiple applications.
本開示の一態様による監視支援装置は、複数のアプリケーションの連携により実現されるサービスの異常兆候の監視を支援する監視支援装置であって、前記監視の対象となるサービスを表す対象サービスと、前記監視の対象となる期間を表す対象期間とを受け付けるように構成されている受付部と、前記対象サービスを実現する複数のアプリケーションに対して、前記対象期間のログを要求するように構成されている要求部と、前記要求に対する応答として前記複数のアプリケーションから返信されたログを用いて、前記対象期間における前記対象サービスの異常兆候の有無を監視するための情報を可視化するように構成されている可視化部と、を有する。 A monitoring support device according to an aspect of the present disclosure is a monitoring support device that supports monitoring of abnormality signs of a service realized by cooperation of a plurality of applications, and includes a target service representing a service to be monitored; a reception unit configured to receive a target period representing a period to be monitored; and configured to request logs for the target period from a plurality of applications that implement the target service. Visualization configured to visualize information for monitoring the presence or absence of abnormality signs in the target service during the target period using a request unit and logs returned from the plurality of applications in response to the request. It has a section and a.
複数のアプリケーションの連携により実現されるサービスの監視を支援できる技術が提供される。 A technology is provided that can support monitoring of services realized by linking multiple applications.
以下、本発明の一実施形態として第一の実施形態と第二の実施形態について説明する。 Hereinafter, a first embodiment and a second embodiment will be described as one embodiment of the present invention.
[第一の実施形態]
本実施形態では、複数のアプリケーションの連携により実現されるサービスを対象として、それらのサービスを実現する各アプリケーションのログを取得することで、異常兆候を検出するための監視作業を支援することができるログ管理システム1について説明する。なお、異常兆候とは、未だ異常の発生には至ってないが、将来的に異常が発生する蓋然性が高い事象のことである。以下、アプリケーションを「アプリ」とも呼ぶことにする。
[First embodiment]
In this embodiment, by acquiring the logs of each application that implements the services, it is possible to support monitoring work to detect signs of abnormality, targeting services that are realized by linking multiple applications. The
<複数のアプリケーションの連携により実現されるサービス>
複数のアプリケーションの連携により実現されるサービスの一例を図1に示す。図1では、アプリA1とアプリBとアプリCの連携により実現されるサービスXと、アプリA2とアプリBとアプリCの連携により実現されるサービスYとを示している。
<Service realized by linking multiple applications>
FIG. 1 shows an example of a service realized by cooperation of multiple applications. FIG. 1 shows a service X realized by cooperation between application A1, application B, and application C, and service Y realized by cooperation among application A2, application B, and application C.
図1に示すように、サービスXは、アプリA1の処理を行った後、その処理結果を用いてアプリBの処理を行い、更にその処理結果を用いてアプリCの処理を行うことで実現されるサービスである。同様に、サービスYは、アプリA2の処理を行った後、その処理結果を用いてアプリBの処理を行い、更にその処理結果を用いてアプリCの処理を行うことで実現されるサービスである。 As shown in Figure 1, service X is realized by processing application A1, then processing application B using the processing result, and then processing application C using the processing result. This is a service that provides Similarly, service Y is a service that is realized by processing application A2, then processing application B using the processing result, and then processing application C using the processing result. .
サービスXの具体例としては、例えば、デジタル機器の画像をアプリA1で撮像し、その画像をアプリBで画像解析により数値に変換し、その数値データをアプリCでデータベースに保存する、等といったサービスが挙げられる。同様に、サービスYの具体例としては、例えば、アナログ機器の画像をアプリA2で撮像し、その画像をアプリBで画像解析により数値に変換し、その数値データをアプリCでデータベースに保存する、等といったサービスが挙げられる。ただし、これらのサービスの具体例はいずれも一例であって、これに限られるものではない。 A specific example of service can be mentioned. Similarly, as a specific example of service Y, for example, application A2 captures an image of an analog device, application B converts the image into a numerical value through image analysis, and application C stores the numerical data in a database. Services such as: However, these specific examples of services are just examples, and the present invention is not limited thereto.
なお、上記のような複数のアプリケーションの連携によりサービスを実現する手法又はアーキテクチャは「マイクロサービス・アーキテクチャ」とも呼ばれる。一方で、1つのアプリケーションにより1つのサービスを実現する手法又はアーキテクチャは「モノリシック・アーキテクチャ」とも呼ばれる。マイクロサービス・アーキテクチャでは、複数のアプリケーションの各々は小さなサービス(つまり、マイクロサービス)を提供し、これらのマイクロサービスを連携又は組み合わせることで、目的とする様々なサービスが実現される。 Note that the method or architecture for realizing a service by linking multiple applications as described above is also called "microservice architecture." On the other hand, a method or architecture that realizes one service using one application is also called a "monolithic architecture." In a microservice architecture, each of a plurality of applications provides small services (that is, microservices), and various targeted services are realized by linking or combining these microservices.
<ログ管理システム1の全体構成例>
本実施形態に係るログ管理システム1の全体構成例を図2に示す。図2に示すように、本実施形態に係るログ管理システム1には、1以上のアプリケーション処理装置10と、ログ格納装置20と、監視支援装置30とが含まれる。また、これらの各装置は、例えば、LAN(Local Area Network)等の通信ネットワークNを介して通信可能に接続されている。
<Example of overall configuration of
FIG. 2 shows an example of the overall configuration of the
アプリケーション処理装置10は、1以上のアプリケーション100を有し、これらのアプリケーション100の処理を実行する。1以上のアプリケーション処理装置10により複数のアプリケーション100の処理が実行されることで、上記のサービスXやサービスYのようなマイクロサービス・アーキテクチャによるサービスが実現される。ここで、各アプリケーション100は、重要度に応じて段階的にレベル分けされたログ(以下、個別ログという)を出力するものとする。
The
ログ格納装置20は、アプリケーション100の個別ログを格納する。ログ格納装置20は、アプリケーション100から出力された個別ログの中で或るレベル以上の個別ログ(例えば、異常発生を表す個別ログ)が格納される個別ログ記憶部210を有する。
The
監視支援装置30は、監視支援プログラム300を有しており、この監視支援プログラム300により総合ログと呼ぶとログを作成し、それらの総合ログをサービス毎に可視化する。より具体的には、可視化対象となる総合ログの条件(以下、可視化対象条件ともいう。)が与えられたときに、監視支援プログラム300は、その可視化対象条件を満たす個別ログを取得すると共に総合ログを作成し、それらの総合ログをサービス毎に可視化する。この可視化によって、ユーザ(例えば、各サービスを監視するオペレータ等)は、所望のサービスの総合ログを参照し、そのサービスに異常兆候が存在するか否かを確認することが可能となる。
The
なお、図1に示すログ管理システム1の全体構成は一例であって、これに限られるものではなく、他の構成であってもよい。例えば、ログ格納装置20と監視支援装置30とが一体で構成されていてもよい。より具体的には、例えば、監視支援装置30が個別ログ記憶部210を有しており、ログ格納装置20は無くてもよい。
Note that the overall configuration of the
<アプリケーション処理装置10及び監視支援装置30の機能構成例>
本実施形態に係るアプリケーション処理装置10と監視支援装置30の機能構成例について説明する。
<Example of functional configuration of
An example of the functional configuration of the
≪アプリケーション処理装置10≫
本実施形態に係るアプリケーション処理装置10の機能構成例を図3に示す。図3に示すように、本実施形態に係るアプリケーション処理装置10は、アプリケーション処理部101と、個別ログ管理部102と、内部ログ記憶部103とを有する。アプリケーション処理部101と個別ログ管理部102は、例えば、アプリケーション100が、CPU(Central Processing Unit)等の演算装置に実行させる処理により実現される。また、内部ログ記憶部103は、例えば、SSD(Solid State Drive)やHDD(Hard Disk Drive)等の補助記憶装置により実現される。
≪
FIG. 3 shows an example of the functional configuration of the
アプリケーション処理部101は、アプリケーション100の固有の処理を実行する。ここで、アプリケーション100の固有の処理(以下、固有処理ともいう。)とは、そのアプリケーション100のマイクロサービスを提供するための処理のことを意味するものとする。
The
また、アプリケーション処理部101は、個別ログの保存対象となる事象(イベント)が発生した場合にログ保存要求を個別ログ管理部102に送信する。
Further, the
個別ログ管理部102は、アプリケーション処理部101からのログ保存要求に応じて、アプリケーション100の固有処理で発生した事象の個別ログを作成し、内部ログ記憶部103に保存する。ここで、ログ保存要求にはログレベルとサービス種別とメッセージとが少なくとも指定されており、個別ログ管理部102は、ログレベルとサービス種別とメッセージに対して現在日時を付与することで個別ログを作成する。
In response to a log storage request from the
ログレベルとは、個別ログが表す事象(イベント)の重要度に応じて予め決められたレベルのことである。以下、一例として、ログレベルには、定常処理中の事象であることを表す「INFO」、例外処理中の事象であることを表す「NOTICE」、警告すべき事象であることを表す「WARN」、異常事象であることを表す「ERROR」の4つがあるものとする。ただし、これは一例であって、ログレベルは事象の重要度に応じて任意の定義することが可能である。なお、「INFO」、「NOTCE」、「WARN」及び「ERROR」は、例えば、それぞれ「0」、「1」、「2」及び「3」と数値で表現されてもよい。 The log level is a level determined in advance according to the importance of an event represented by an individual log. As an example, the log level includes "INFO" indicating that the event is occurring during normal processing, "NOTICE" indicating that the event is occurring during exception processing, and "WARN" indicating that the event is a warning event. , "ERROR" indicating an abnormal event. However, this is just an example, and the log level can be arbitrarily defined depending on the importance of the event. Note that "INFO", "NOTCE", "WARN", and "ERROR" may be expressed numerically, for example, as "0", "1", "2", and "3", respectively.
定常処理中の事象、例外処理中の事象、警告すべき事象及び異常事象として、それぞれどのような事象が存在するかは、マイクロサービスを提供するアプリケーション100によって異なり得る。定常処理中の事象の一例としては、例えば、ログイン、ログアウト、画面表示、機器の復旧、アラーム抑制・解除等といった事象が挙げられる。例外処理中の事象の一例としては、例えば、目標値の変更操作やシステム停止操作等といった事象が挙げられる。警告すべき事象の一例としては、例えば、データ欠損、軽度又は中程度のエラー、軽度又は中程度の故障、上限値又は下限値の超過等といった事象が挙げられる。異常事象の一例としては、例えば、システム停止やデータ異常につながる重大なエラー、重大な故障等といった事象が挙げられる。
What types of events exist as events during normal processing, events during exception processing, warning events, and abnormal events may differ depending on the
サービス種別とは、アプリケーション100の固有処理で実現されるサービスを識別するための情報である。これにより、例えば、或るアプリケーション100の固有処理で複数のサービスが実現される場合であっても、いずれのサービスの個別ログであるかがサービス種別により識別される。例えば、図1に示す例では、アプリBとアプリCはその固有処理によりサービスXとサービスYの両方を実現することができるため、いずれのサービスの個別ログであるかをサービス種別により識別する。
The service type is information for identifying a service realized by specific processing of the
メッセージとは、個別ログが表す事象を端的に表現する文字列(例えば、当該事象の概要を表す文字列等)のことである。 A message is a string of characters that concisely represents the event represented by the individual log (for example, a string of characters that summarizes the event).
また、個別ログ管理部102は、或るログレベル(以下、これを「設定ログレベル」ともいう)以上の個別ログを個別ログ記憶部210に保存する。ここで、どのログレベルを設定ログレベルとするかは任意に設定することが可能であるが、以下では、一例として、「ERROR」を設定ログレベルとする。これにより、「ERROR」以上の個別ログが個別ログ記憶部210に保存される。
Further, the individual
更に、個別ログ管理部102は、後述する個別ログ取得要求を監視支援装置30から受信すると、この個別ログ取得要求で要求された個別ログを内部ログ記憶部103から取得し、個別ログ取得要求に対する応答として当該監視支援装置30に返信する。
Furthermore, when the individual
内部ログ記憶部103は、例えば、アプリケーション100の名称等が付与されたフォルダ等であり、個別ログ管理部102により作成された個別ログを記憶する。
The internal
なお、1つのアプリケーション処理装置10が複数のアプリケーション100を有している場合には、当該アプリケーション処理装置10は、アプリケーション100毎に、アプリケーション処理部101と個別ログ管理部102と内部ログ記憶部103とを有している。
Note that when one
≪監視支援装置30≫
本実施形態に係る監視支援装置30の機能構成例を図4に示す。図4に示すように、本実施形態に係る監視支援装置30は、条件受付部301と、個別ログ要求部302と、総合ログ管理部303と、ログ可視化部304と、サービス種別テーブル記憶部305と、総合ログ記憶部306とを有する。条件受付部301と個別ログ要求部302と総合ログ管理部303とログ可視化部304は、例えば、監視支援プログラム300が、CPU等の演算装置に実行させる処理により実現される。また、サービス種別テーブル記憶部305と総合ログ記憶部306は、例えば、SSDやHDD等の補助記憶装置により実現される。
≪
FIG. 4 shows an example of the functional configuration of the
条件受付部301は、与えられた可視化対象条件を入力として受け付ける。可視化対象条件には、可視化対象となる総合ログの期間を表す対象期間と、可視化対象となる総合ログのサービスを表す対象サービスとが含まれる。なお、可視化対象条件は、例えば、ユーザ等の入力操作によって与えられてもよいし、他のプログラムから与えられてもよいし、監視支援装置30と通信ネットワークNを介して接続される他の端末又は機器等から与えられてもよい。
The
個別ログ要求部302は、サービス種別テーブル記憶部305に記憶されているサービス種別テーブルを参照して、可視化対象条件に含まれる対象サービスを実現する各アプリケーション100と当該アプリケーション100で対象サービスを識別するサービス種別とを特定する。そして、個別ログ要求部302は、特定したアプリケーション100に対して個別ログ取得要求を送信する。ここで、個別ログ取得要求には、送信先のアプリケーション100が対象サービスを識別するサービス種別と、当該可視化対象条件に含まれる対象期間とが指定される。
The individual
総合ログ管理部303は、個別ログ取得要求に対する応答として各アプリケーション100から返信された個別ログから総合ログを作成した上で、それらの総合ログをサービス毎に日時順に総合ログ記憶部306に格納する。総合ログとは、ログ可視化部304によって可視化対象となるログのことであり、例えば、個別ログそのものを総合ログとしてもよいし、個別ログに対して何等かの情報(例えば、その個別ログを返信したアプリケーション100の名称や識別子等)を付与したものであってもよい。
The comprehensive
ログ可視化部304は、総合ログ記憶部306に記憶されている総合ログをサービス毎に可視化する。
The
サービス種別テーブル記憶部305は、対象サービスからアプリケーション100及びサービス種別を特定するためのサービス種別テーブルを記憶する。ここで、一例として、図1に示すサービスXとサービスYが存在し、図5に示すように、アプリA1はサービス種別「a1」でサービスXを識別し、アプリBはサービス種別「b1」でサービスXを識別し、アプリCはサービス種別「c1」でサービスXを識別しているものとする。同様に、アプリA2はサービス種別「a2」でサービスYを識別し、アプリBはサービス種別「b2」でサービスYを識別し、アプリCはサービス種別「c2」でサービスYを識別しているものとする。このとき、サービス種別テーブルの一例を図6に示す。図6に示すサービス種別テーブルでは、サービスXに対して、アプリケーションA1及びサービス種別a1と、アプリケーションB及びサービス種別b1と、アプリケーションC及びサービス種別c1とが対応付けられている。同様に、サービスYに対して、アプリケーションA2及びサービス種別a2と、アプリケーションB及びサービス種別b2と、アプリケーションC及びサービス種別c2とが対応付けられている。
The service type
このように、サービス種別テーブルでは、サービス毎に、そのサービスを実現するアプリケーション100とそのアプリケーション100で当該サービスを識別するサービス種別とが対応付けられている。これにより、対象サービスを実現するアプリケーション100とそのアプリケーション100で対象サービスを識別するサービス種別とを特定することが可能となる。
In this way, in the service type table, for each service, the
総合ログ記憶部306は、総合ログ管理部303によって格納された総合ログを記憶する。
The comprehensive
<個別ログの作成及び保存処理>
本実施形態に係る個別ログの作成及び保存処理の一例について、図7を参照しながら説明する。以下のステップS101~ステップS105の処理は、各アプリケーション処理装置10において、アプリケーション処理部101からログ保存要求が送信されるたびに繰り返し実行される。
<Creating and saving individual logs>
An example of the individual log creation and storage processing according to this embodiment will be described with reference to FIG. 7. The following steps S101 to S105 are repeatedly executed in each
アプリケーション処理装置10の個別ログ管理部102は、ログレベルとサービス種別とメッセージとが指定されたログ保存要求を受信する(ステップS101)。
The individual
次に、アプリケーション処理装置10の個別ログ管理部102は、上記のステップS101で受信したログ保存要求に指定されているログレベル、サービス種別及びメッセージに対して現在日時を付与して個別ログを作成する(ステップS102)。ここで、個別ログの一例を図8に示す。図8に示すように、個別ログには、日時と、ログレベルと、サービス種別と、メッセージとが含まれる。
Next, the individual
次に、アプリケーション処理装置10の個別ログ管理部102は、上記のステップS102で作成した個別ログを内部ログ記憶部103に保存する(ステップS103)。
Next, the individual
次に、アプリケーション処理装置10の個別ログ管理部102は、上記のステップS102で作成した個別ログのログレベルが設定ログレベル以上であるか否かを判定する(ステップS104)。
Next, the individual
上記のステップS104で個別ログのログレベルが設定ログレベル以上であると判定されなかった場合、アプリケーション処理装置10は、個別ログの作成及び保存処理を終了する。一方で、上記のステップS104で個別ログのログレベルが設定ログレベル以上であると判定された場合、アプリケーション処理装置10の個別ログ管理部102は、上記のステップS102で作成した個別ログを個別ログ記憶部210に保存する(ステップS105)。このように、個別ログ記憶部210には、設定ログレベル以上のログレベルの個別ログのみが格納される。これにより、「ERROR」以上の個別ログのみが個別ログ記憶部210に保存され、ログの肥大化が防止される。
If it is not determined in step S104 that the log level of the individual log is equal to or higher than the set log level, the
<ログ可視化処理>
本実施形態に係るログ可視化処理の一例について、図9を参照しながら説明する。なお、可視化対象条件が監視支援装置30に与えられたときに、以下のステップS201~ステップS207の処理の実行が開始される。
<Log visualization processing>
An example of the log visualization process according to this embodiment will be described with reference to FIG. 9. Note that when the visualization target condition is given to the
監視支援装置30の条件受付部301は、与えられた可視化対象条件を入力として受け付ける(ステップS201)。なお、例えば、対象期間と対象サービスのいずれか一方が可視化対象条件に含まれない場合もあり得る。このため、対象期間が可視化対象条件に含まれない場合、条件受付部301は、例えば、予め決められた期間(例えば、全期間や現時点から過去所定の期間等)を対象期間として受け付ければよい。同様に、対象サービスが可視化対象条件に含まれない場合、条件受付部301は、予め決められたサービス(例えば、全サービスや予め決められた1つ以上の特定のサービス等)を対象サービスとして受け付ければよい。
The
次に、監視支援装置30の個別ログ要求部302は、サービス種別テーブル記憶部305に記憶されているサービス種別テーブルを参照して、上記のステップS201で受け付けた可視化対象条件に含まれる対象サービスを実現するアプリケーション100とそのアプリケーション100で対象サービスを識別するサービス種別とを特定する(ステップS202)。すなわち、個別ログ要求部302は、サービス種別テーブルを参照して、対象サービスに対応付けられているアプリケーション100及びサービス種別を特定する。
Next, the individual
例えば、上記のステップS201で受け付けた可視化対象条件に含まれる対象サービスが「サービスX」及び「サービスY」であり、サービス種別テーブルが図6に示すようなものであるとする。この場合、サービスXに関しては、アプリ「A1」及びサービス種別「a1」と、アプリ「B」及びサービス種別「b1」と、アプリ「C」及びサービス種別「c1」とが特定される。同様に、サービスYに関しては、アプリ「A2」及びサービス種別「a2」と、アプリ「B」及びサービス種別「b2」と、アプリ「C」及びサービス種別「c2」とが特定される。 For example, assume that the target services included in the visualization target conditions accepted in step S201 above are "service X" and "service Y" and that the service type table is as shown in FIG. 6. In this case, regarding service X, application "A1" and service type "a1", application "B" and service type "b1", and application "C" and service type "c1" are specified. Similarly, regarding service Y, application "A2" and service type "a2", application "B" and service type "b2", and application "C" and service type "c2" are specified.
次に、監視支援装置30の個別ログ要求部302は、上記のステップS202で特定された各アプリケーション100(より正確には、そのアプリケーション100を有するアプリケーション処理装置10)に対して、それに対応するサービス種別で、上記のステップS201で受け付けられた可視化対象条件に含まれる対象期間の個別ログ取得要求を送信する(ステップS203)。
Next, the individual
すなわち、個別ログ要求部302は、まず、各サービス種別と対象期間とを指定した個別ログ取得要求を作成する。例えば、上記のステップS202で特定されたアプリケーション100及びサービス種別が、サービスXに関しては、アプリ「A1」及びサービス種別「a1」、アプリ「B」及びサービス種別「b1」、アプリ「C」及びサービス種別「c1」であり、サービスYに関しては、アプリ「A2」及びサービス種別「a2」、アプリ「B」及びサービス種別「b2」、アプリ「C」及びサービス種別「c2」であったものとする。また、対象期間が[t1,t2]であるものとする。この場合、個別ログ要求部302は、(a1,t1,t2)、(b1,t1,t2)、(c1,t1,t2)、(a2,t1,t2)、(b2,t1,t2)、(c2,t1,t2)といった6つの個別ログ取得要求を作成する。そして、個別ログ要求部302は、個別ログ取得要求(a1,t1,t2)と(a2,t1,t2)をアプリ「A1」、個別ログ取得要求(b1,t1,t2)と(b2,t1,t2)をアプリ「B」、個別ログ取得要求(c1,t1,t2)と(c2,t1,t2)をアプリ「C」にそれぞれ送信する。
That is, the individual
アプリケーション処理装置10の個別ログ管理部102は、個別ログ取得要求を監視支援装置30から受信すると、当該個別ログ取得要求に指定されているサービス種別の個別ログであって、かつ、当該個別ログ取得要求に指定されている対象期間内の個別ログを内部ログ記憶部103から取得する(ステップS204)。
When the individual
そして、アプリケーション処理装置10の個別ログ管理部102は、上記のステップS204で取得された個別ログを、個別ログ取得要求に対する応答として監視支援装置30に返信する(ステップS205)。
Then, the individual
監視支援装置30の総合ログ管理部303は、上記のステップS202で特定されたすべてのアプリケーション100からの応答が完了した場合、これらの応答として返信された個別ログから総合ログを作成した上で、サービス毎に日時順に総合ログ記憶部306に格納する(ステップS206)。なお、サービスは、個別ログに含まれるサービス種別とサービス種別テーブルから特定される。
When the responses from all the
これにより、サービス毎に、総合ログが日時順に総合ログ記憶部306に格納される。なお、総合ログは、各アプリケーション100から応答として返信された個別ログそのものであってもよいし、個別ログに対して何等かの情報(例えば、その個別ログを返信したアプリケーション100の名称や識別子等)を付与したものであってもよい。
Thereby, the comprehensive log is stored in the comprehensive
そして、監視支援装置30のログ可視化部304は、総合ログ記憶部306に記憶されている総合ログをサービス毎に可視化する(ステップS207)。なお、ログ可視化部304は、例えば、監視支援装置30が備えるディスプレイ上に総合ログを可視化してもよいし、監視支援装置30と通信ネットワークを介して接続される端末や機器が備えるディスプレイ上に総合ログを可視化してもよい。
Then, the
<ログ可視化例>
以下、図9のステップS207における総合ログの可視化例について説明する。以下では、一例として、サービスXを実現する際にアプリA1は「ログA1-1」と「ログA1-2」を個別ログとして出力し、アプリBは「ログB-1」と「ログB-2」と「ログB-3」を個別ログとして出力し、アプリCは「ログC-1」と「ログC-2」を個別ログとして出力するものとする。同様に、サービスYを実現する際にアプリA2は「ログA2-1」と「ログA2-2」を個別ログとして出力し、アプリBは「ログB-1」と「ログB-2」と「ログB-3」を個別ログとして出力し、アプリCは「ログC-1」と「ログC-2」を個別ログとして出力するものとする。また、簡単のため、総合ログは個別ログそのものであるとする。
<Log visualization example>
An example of visualizing the comprehensive log in step S207 in FIG. 9 will be described below. Below, as an example, when realizing service X, application A1 outputs "log A1-1" and "log A1-2" as individual logs, and application B outputs "log B-1" and "log B-1". It is assumed that application C outputs "log C-1" and "log C-2" as individual logs. Similarly, when realizing service Y, application A2 outputs "log A2-1" and "log A2-2" as individual logs, and application B outputs "log B-1" and "log B-2". It is assumed that "log B-3" is output as an individual log, and application C outputs "log C-1" and "log C-2" as individual logs. Furthermore, for the sake of simplicity, it is assumed that the general log is the individual log itself.
また、図10の上図に示す個別ログが総合ログとして総合ログ記憶部306に格納されているものとする。なお、図10の上図では、縦軸が個別ログの名称、横軸が日時tを表している。
Further, it is assumed that the individual logs shown in the upper diagram of FIG. 10 are stored in the comprehensive
このとき、図9のステップS207における総合ログの可視化例を図10の下図に示す。図10の下図に示すように、サービス毎に総合ログが区分けされて可視化されている。しかも、サービスXでは、ログA1-1とログA1-2、ログA1-2とログB-1、ログB-1とログB-2、ログB-2とログB-3、ログB-3とログC-1、ログC-1とログC-2がそれぞれ線分で接続されている。同様に、サービスYでは、ログA2-1とログA2-2、ログA2-2とログB-1、ログB-1とログB-2、ログB-2とログB-3、ログB-3とログC-1、ログC-1とログC-2がそれぞれ線分で接続されている。すなわち、各サービスにおいて、そのサービスを実現する処理の開始から終了までの間で日時tが隣接する総合ログ同士がそれぞれ線分で接続されている。以下、このように線分で接続された総合ログを「ロググラフ」と呼ぶことにする。なお、ロググラフは、サービス1回あたりの処理で出力された総合ログの集合を表している。 At this time, an example of visualization of the comprehensive log in step S207 of FIG. 9 is shown in the lower diagram of FIG. As shown in the lower part of FIG. 10, the comprehensive log is divided and visualized for each service. Moreover, in service X, log A1-1 and log A1-2, log A1-2 and log B-1, log B-1 and log B-2, log B-2 and log B-3, log B-3 and log C-1, and log C-1 and log C-2 are connected by line segments. Similarly, for service Y, log A2-1 and log A2-2, log A2-2 and log B-1, log B-1 and log B-2, log B-2 and log B-3, log B- 3 and log C-1, and log C-1 and log C-2 are connected by line segments. That is, for each service, integrated logs with adjacent dates and times t from the start to the end of the process for realizing that service are connected by line segments. Hereinafter, a comprehensive log connected by line segments in this manner will be referred to as a "log graph." Note that the log graph represents a set of comprehensive logs output in processing per service.
図10の下図では、サービスXのロググラフとサービスYのロググラフとが区別可能に同一の領域内に可視化されているが、サービスXのロググラフとサービスYのロググラフとが異なる領域内に可視化されていてもよい。例えば、図11に示す例では、サービスXのロググラフ1001~1003と、サービスYのロググラフ2001~2003とが異なる領域内に可視化されている。
In the lower diagram of FIG. 10, the log graph of service X and the log graph of service Y are visualized in the same area so that they can be distinguished, but the log graph of service It may be visualized. For example, in the example shown in FIG. 11, log graphs 1001 to 1003 of service X and log
<異常兆候の検出例>
図10の下図や図11に示すように総合ログを可視化することで、ユーザはこれらの総合ログを参照し、対象サービスに異常兆候が存在するか否かを確認することができる。
<Example of abnormality sign detection>
By visualizing the comprehensive logs as shown in the lower diagram of FIG. 10 and FIG. 11, the user can refer to these comprehensive logs and confirm whether or not there are abnormal signs in the target service.
例えば、サービス1回あたりの処理で出力される各総合ログの時間間隔は、同一サービスであり、かつ、サービスに何等の異常兆候も存在しなければ、通常、大きく異ならないと考えられる。このため、例えば、サービスYに何等の異常兆候も存在しなければ、図12に示すように、ロググラフ2001~ロググラフ2003は互い類似する形状となる。
For example, if the service is the same and there are no signs of abnormality in the service, the time intervals of the comprehensive logs output in one service process are generally not considered to be significantly different. Therefore, for example, if there are no signs of abnormality in service Y, log
また、同様に、ロググラフ内の或る特定のアプリの総合ログのみを取り出しても、その取り出した部分は互いに類似する形状となる。例えば、サービスYに何等の異常兆候も存在しなければ、図13に示すように、ロググラフ2001~ロググラフ2003のアプリBの総合ログを取り出した部分は互いに類似する形状となる。
Similarly, even if only the general log of a certain application in the log graph is extracted, the extracted portions have shapes that are similar to each other. For example, if there are no signs of abnormality in service Y, the portions of
したがって、ユーザは、ロググラフ全体又はその一部の形状が非類似となった場合に、そのロググラフによって表されるサービスの異常兆候を検出することができる。例えば、図14に示すように、サービスYのロググラフ2101~ロググラフ2103が可視化されているものとする。図14に示す例では、ログB-1とログB-2の間の時間(つまり、この間の処理時間)が徐々に長くなっており、ロググラフ2101と比べて、ロググラフ2102~ロググラフ2102全体及びその一部の形状が徐々に非類似になっている。言い換えれば、図14に示す例では、ロググラフ2102~ロググラフ2102の形状が時間経過に伴って変化していると言える。これにより、ユーザは、これらのロググラフ2101~ロググラフ2103によって表されるサービスYの異常兆候を検出することができる。
Therefore, when the shape of the entire log graph or a portion thereof becomes dissimilar, the user can detect an abnormality sign of the service represented by the log graph. For example, as shown in FIG. 14, it is assumed that
このように、ユーザは、対象サービスの総合ログによって表現されるロググラフ(又は、当該ロググラフ内の或る特定のアプリの総合ログが表す部分)の形状に着目し、それらの形状が時間経過に伴って変化する場合、当該対象サービスに異常兆候が存在すると検出する。これにより、ユーザは、実際に異常が発生する前に、その異常の兆候を知ることが可能となり、例えば、異常の発生を防止する様々な対策(例えば、機器や部品の交換等)を行うことが可能となる。 In this way, the user focuses on the shape of the log graph expressed by the comprehensive log of the target service (or the part represented by the comprehensive log of a certain application within the log graph), and changes the shape over time. , it is detected that an abnormality sign exists in the target service. This makes it possible for users to know the signs of an abnormality before it actually occurs, and to take various measures to prevent the abnormality from occurring (for example, replacing equipment or parts). becomes possible.
[第二の実施形態]
次に、第二の実施形態について説明する。第一の実施形態ではロググラフの形状の時間経過に伴う変化からユーザが異常兆候を検出する場合について説明したが、本実施形態では、ロググラフの形状から異常兆候か存在し得るかを表す情報(後述するラベル)を更に可視化する場合について説明する。これにより、ユーザは、対象サービスに異常兆候が存在するか否かをより容易に判断することが可能となる。
[Second embodiment]
Next, a second embodiment will be described. In the first embodiment, the case where the user detects an abnormality sign from the change in the shape of the log graph over time was explained, but in this embodiment, information indicating whether an abnormality sign may exist from the shape of the log graph is explained. A case will be described in which a label (to be described later) is further visualized. This allows the user to more easily determine whether or not there is an abnormality sign in the target service.
なお、本実施形態では、主に、第一の実施形態との相違点について説明し、第一の実施形態と同様の構成要素については同一の符号を付与し、その説明を省略するものとする。 Note that in this embodiment, differences from the first embodiment will be mainly explained, and components similar to those in the first embodiment will be given the same reference numerals and their explanation will be omitted. .
<監視支援装置30の機能構成例>
本実施形態に係る監視支援装置30の機能構成例を図15に示す。図15に示すように、本実施形態に係る監視支援装置30は、指標値算出部307と、標準時間テーブル記憶部308とを更に有する。指標値算出部307は、例えば、監視支援プログラム300が、CPU等の演算装置に実行させる処理により実現される。また、標準時間テーブル記憶部308は、例えば、SSDやHDD等の補助記憶装置により実現される。
<Example of functional configuration of
FIG. 15 shows an example of the functional configuration of the
指標値算出部307は、標準時間テーブル記憶部308に記憶されている標準時間テーブルを参照して、各ロググラフを構成する隣接ログ毎に、対象サービスに異常兆候が存在し得るか否かを判定するための指標値として、その隣接ログ間の処理時間と後述する標準処理時間との差分を算出する。なお、隣接ログとは、対象サービスを実現する処理の開始から終了までの間で日時tが隣接する総合ログのことである。
The index
標準時間テーブル記憶部308は、対象サービスに異常兆候が存在し得るか否かを判定するための指標値の算出とその判定とに用いられる標準時間テーブルを記憶する。ここで、標準時間テーブルの一例を図16に示す。図16に示すように、標準時間テーブルでは、各隣接ログ間に対して、標準的な処理時間を表す標準処理時間と、標準処理時間との差分に関して「正常」であるか否かを判定するための閾値を表す第1の許容時間と、当該差分に関して「警告」又は「異常兆候あり」のいずれであるかを判定するための閾値を表す第2の許容時間とが対応付けられている。ここで、「警告」とは、異常兆候は存在しないが、異常兆候が発生する危険性があることを意味している。なお、第1の許容時間<第2の許容時間である。
The standard time
例えば、図16に示す例では、隣接ログ間「ログB-1からログB-2」に対して、標準処理時間Sm、第1の許容時間αm、第2の許容時間βmが対応付けられている。これは、ログB-1からログB-2の間の処理時間と標準処理時間Smとの差分が第1の許容時間αm未満であれば「正常」、当該差分が第1の許容時間αm以上かつ第2の許容時間βm未満であれば「警告」、当該差分が第2の許容時間βm以上であれば「異常兆候あり」と判定されることを意味している。 For example, in the example shown in FIG. 16, the standard processing time S m , the first allowable time α m , and the second allowable time β m correspond to “log B-1 to log B-2” between adjacent logs. It is attached. This is "normal" if the difference between the processing time from log B-1 to log B-2 and the standard processing time S m is less than the first allowable time α m , and the difference is within the first allowable time α m. This means that if the difference is greater than or equal to α m and less than the second allowable time β m , it is determined as a “warning”, and if the difference is greater than or equal to the second allowable time β m , it is determined that there is an “abnormality sign”.
同様に、例えば、図16に示す例では、隣接ログ間「ログB-2からログB-3」に対して、標準処理時間Sm+1、第1の許容時間αm+1、第2の許容時間βm+1が対応付けられている。これは、ログB-2からログB-3の間の処理時間と標準処理時間Sm+1との差分が第1の許容時間αm+1未満であれば「正常」、当該差分が第1の許容時間αm+1以上かつ第2の許容時間βm+1未満であれば「警告」、当該差分が第2の許容時間βm+1以上であれば「異常兆候あり」と判定されることを意味している。 Similarly, for example, in the example shown in FIG. 16, for "log B-2 to log B-3" between adjacent logs, the standard processing time S m+1 , the first allowable time α m+1 , and the second allowable time β m+1 is associated. This means that if the difference between the processing time from log B-2 to log B-3 and the standard processing time S m+1 is less than the first allowable time α m+1 , it is "normal", and the difference is within the first allowable time. This means that if the difference is greater than or equal to α m+1 and less than the second allowable time β m+1 , it is determined to be a “warning”, and if the difference is greater than or equal to the second allowable time β m+1 , it is determined that there is an “abnormal sign”.
なお、図16に示す例では、隣接ログ間として「ログB-1からログB-2」と「ログB-2からログB-3」とが図示されているが、これは一例であって、標準時間テーブルには、各隣接ログ間に対して標準処理時間と第1の許容時間と第2の許容時間とが対応付けられている。 In the example shown in FIG. 16, "log B-1 to log B-2" and "log B-2 to log B-3" are illustrated as adjacent logs, but this is just an example. In the standard time table, a standard processing time, a first allowable time, and a second allowable time are associated with each other between adjacent logs.
ログ可視化部304は、第一の実施形態と同様にサービス毎に総合ログを可視化することに加えて、指標値算出部307によって算出された指標値から「正常」、「警告」又は「異常兆候あり」を判定し、その判定結果を表すラベルを更に可視化する。
In addition to visualizing the comprehensive log for each service as in the first embodiment, the
<ログ可視化処理>
本実施形態に係るログ可視化処理の一例について、図17を参照しながら説明する。なお、可視化対象条件が監視支援装置30に与えられたときに、以下のステップS201~ステップS207及びステップS301~ステップS302の処理の実行が開始される。ステップS201~ステップS207の処理は第一の実施形態と同様であるため、以下では、ステップS301~ステップS302の処理について説明する。
<Log visualization processing>
An example of the log visualization process according to this embodiment will be described with reference to FIG. 17. Note that when the visualization target condition is given to the
監視支援装置30の指標値算出部307は、標準時間テーブル記憶部308に記憶されている標準時間テーブルを参照して、各ロググラフを構成する隣接ログ毎に、隣接ログ間の処理時間と標準処理時間との差分を指標値として算出する(ステップS301)。
The index
例えば、対象サービスのk番目のロググラフを構成するn番目の総合ログの日時をtn
(k)とした場合、指標値算出部307は、|(tn+1
(k)-tn
(k))-S(k,n)|を指標値として算出する。ただし、S(k,n)はk番目のロググラフを構成するn番目の総合ログからn+1番目の総合ログの間の標準処理時間である。なお、k及びnは1以上の整数である。
For example, if the date and time of the n-th comprehensive log that constitutes the k-th log graph of the target service is t n (k) , the index
そして、監視支援装置30のログ可視化部304は、上記のステップS301で算出された指標値を用いて、その指標値に対応する隣接ログ間が「正常」、「警告」又は「異常兆候あり」のいずれであるかを判定し、その判定結果を表すラベルを更に可視化する(ステップS302)。
Then, using the index value calculated in step S301 above, the
例えば、ログ可視化部304は、|(tn+1
(k)-tn
(k))-S(k,n)|<α(k,n)である場合は「正常」、α(k,n)≦|(tn+1
(k)-tn
(k))-S(k,n)|<β(k,n)である場合は「警告」、|(tn+1
(k)-tn
(k))-S(k,n)|≧β(k,n)である場合は「異常兆候あり」と判定し、その判定結果を表すラベルを更に可視化する。ここで、α(k,n)はk番目のロググラフを構成するn番目の総合ログからn+1番目の総合ログの間の第1の許容時間、β(k,n)はk番目のロググラフを構成するn番目の総合ログからn+1番目の総合ログの間の第2の許容時間である。
For example, the
<ログ可視化例>
以下、図17のステップS302におけるラベルの可視化例について説明する。図14に示す例と同様の状況を想定し、ラベルも可視化した場合を図18に示す。図18に示すように、「正常」を表すラベル2201、「注意」を表すラベル2202、及び「異常兆候あり」を表すラベル2203も可視化されている。これにより、ユーザは、対象サービスに異常兆候が存在するか否かをより容易に判断することが可能となる。
<Log visualization example>
An example of label visualization in step S302 in FIG. 17 will be described below. Assuming a situation similar to the example shown in FIG. 14, FIG. 18 shows a case in which labels are also visualized. As shown in FIG. 18, a
なお、上記のラベルに加えて(又は、ラベルに代えて)、指標値と第1の許容時間又は第2の許容時間との比が更に可視化されてもよい。例えば、「正常」を表すラベルに加えて(又は、「正常」を表すラベルに代えて)、|(tn+1 (k)-tn (k))-S(k,n)|/α(k,n)が可視化されてもよい。同様に、「警告」を表すラベルに加えて(又は、「警告」を表すラベルに代えて)、|(tn+1 (k)-tn (k))-S(k,n)|/α(k,n)若しくは|(tn+1 (k)-tn (k))-S(k,n)|/β(k,n)又はその両方が可視化されてもよい。同様に、「異常兆候あり」を表すラベルに加えて(又は、「異常兆候あり」を表すラベルに代えて)、|(tn+1 (k)-tn (k))-S(k,n)|/β(k,n)が可視化されてもよい。これにより、ユーザは、離散的な意味を持つラベルに加えて(又は、離散的な意味を持つラベルに代えて)、異常兆候が存在するか否かを連続的な数値として把握することが可能となる。 Note that in addition to (or in place of) the above labels, the ratio between the index value and the first allowable time or the second allowable time may be further visualized. For example, in addition to (or in place of) a label representing "normal", |(t n+1 (k) -t n (k) )-S(k,n)|/α( k, n) may be visualized. Similarly, in addition to (or in place of) the label representing "warning", |(t n+1 (k) -t n (k) )-S(k,n)|/α (k, n) or |(t n+1 (k) −t n (k) )−S(k, n)|/β(k, n) or both may be visualized. Similarly, in addition to the label indicating "abnormality signs present" (or instead of the label indicating "abnormality indications present"), |(t n+1 (k) -t n (k) ) - S(k, n )|/β(k,n) may be visualized. This allows the user to understand whether or not an abnormality sign exists as a continuous numerical value in addition to (or instead of) a label with a discrete meaning. becomes.
[ハードウェア構成例]
第一及び第二の実施形態に係るアプリケーション処理装置10、ログ格納装置20、及び監視支援装置30は、例えば、図19に示すコンピュータ500のハードウェア構成により実現される。図19に示すコンピュータ500は、入力装置501と、表示装置502と、外部I/F503と、通信I/F504と、RAM(Random Access Memory)505と、ROM(Read Only Memory)506と、補助記憶装置507と、プロセッサ508とを有する。これらの各ハードウェアは、それぞれがバス509を介して通信可能に接続されている。
[Hardware configuration example]
The
入力装置501は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置502は、例えば、ディスプレイ、表示パネル等である。なお、コンピュータ500は、例えば、入力装置501及び表示装置502のうちの少なくとも一方を有していなくてもよい。
The
外部I/F503は、記録媒体503a等の外部装置とのインタフェースである。コンピュータ500は、外部I/F503を介して、記録媒体503aの読み取りや書き込み等を行うことができる。なお、記録媒体503aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
The external I/
通信I/F504は、コンピュータ500を通信ネットワークに接続するためのインタフェースである。RAM505は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM506は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置507は、HDD、SSD、フラッシュメモリ等のストレージ装置(記憶装置)である。プロセッサ508は、例えば、CPU等の演算装置である。
Communication I/
第一及び第二の実施形態に係るアプリケーション処理装置10、ログ格納装置20、及び監視支援装置30は、例えば、図19に示すコンピュータ500のハードウェア構成を有することにより、上述した各種処理を実現することができる。なお、図19に示すコンピュータ500のハードウェア構成は一例であって、アプリケーション処理装置10、ログ格納装置20、及び監視支援装置30は、その他の様々なハードウェア構成により実現されていてもよい。
The
[まとめ]
以上のように、本実施形態に係る監視支援装置10は、複数のアプリケーションの連携により実現されるサービスを対象として、そのサービスのログを収集及び可視化することで、そのサービスの異常兆候の監視を支援することができる。このため、ユーザは、実際に異常が発生する前に、その異常の兆候を知ることが可能となり、例えば、異常の発生を防止する様々な対策(例えば、機器や部品の交換等)を行うことが可能となる。
[summary]
As described above, the
なお、上記の第一及び第二の実施形態では、実際に運用中のサービスの異常兆候をユーザが監視する場合を想定しているが、これらの実施形態は運用監視以外にも、例えば、或るサービスを実現する複数のアプリケーションのデバッグ等といった場面にも適用することが可能である。 Note that the first and second embodiments above assume a case where the user monitors signs of abnormality in a service that is actually in operation, but these embodiments are also applicable not only to operation monitoring, but also to It can also be applied to situations such as debugging multiple applications that implement a service.
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。 The present invention is not limited to the above-described specifically disclosed embodiments, and various modifications and changes, combinations with known techniques, etc. can be made without departing from the scope of the claims. be.
1 ログ管理システム
10 アプリケーション処理装置
20 ログ格納装置
30 監視支援装置
100 アプリケーション
101 アプリケーション処理部
102 個別ログ管理部
103 内部ログ記憶部
210 個別ログ記憶部
300 監視支援プログラム
301 条件受付部
302 個別ログ要求部
303 総合ログ管理部
304 ログ可視化部
305 サービス種別テーブル記憶部
306 総合ログ記憶部
307 指標値算出部
308 標準時間テーブル記憶部
500 コンピュータ
501 入力装置
502 表示装置
503 外部I/F
503a 記録媒体
504 通信I/F
505 RAM
506 ROM
507 補助記憶装置
508 プロセッサ
509 バス
N 通信ネットワーク
1
503a Recording medium 504 Communication I/F
505 RAM
506 ROM
507
Claims (12)
前記監視の対象となるサービスを表す対象サービスと、前記監視の対象となる期間を表す対象期間とを受け付けるように構成されている受付部と、
前記対象サービスを実現する複数のアプリケーションに対して、前記対象期間のログを要求するように構成されている要求部と、
前記要求に対する応答として前記複数のアプリケーションから返信されたログを用いて、前記対象期間における前記対象サービスの異常兆候の有無を監視するための情報を可視化するように構成されている可視化部と、
を有する監視支援装置。 A monitoring support device that supports monitoring of signs of abnormality in a service realized by linking multiple applications,
a reception unit configured to receive a target service representing a service to be monitored and a target period representing a period to be monitored;
a request unit configured to request logs for the target period from a plurality of applications that implement the target service;
a visualization unit configured to visualize information for monitoring the presence or absence of abnormality signs of the target service during the target period using logs returned from the plurality of applications as a response to the request;
A monitoring support device with
サービスと、該サービスを実現するアプリケーションとが対応付けられたテーブルを参照して、前記対象サービスを実現する複数のアプリケーションを特定し、特定した複数のアプリケーションに対して、前記対象期間のログを要求するように構成されている、請求項1に記載の監視支援装置。 The requesting unit is
Referring to a table in which services and applications that implement the services are associated, multiple applications that implement the target service are identified, and logs for the target period are requested from the identified multiple applications. The monitoring support device according to claim 1, wherein the monitoring support device is configured to.
前記要求部は、
前記テーブルを参照して、前記対象サービスを実現する複数のアプリケーションと、前記複数のアプリケーションの各々で前記対象サービスを識別するサービス種別とを特定し、特定した複数のアプリケーションに対して、前記アプリケーションに対応するサービス種別のログであって、かつ、前記対象期間のログを要求するように構成されている、請求項2に記載の監視支援装置。 The table further associates a service type with which the application identifies the service,
The requesting unit is
With reference to the table, a plurality of applications that realize the target service and a service type that identifies the target service in each of the plurality of applications are identified, and for the identified plurality of applications, The monitoring support device according to claim 2, wherein the monitoring support device is configured to request a log of a corresponding service type and of the target period.
前記要求に対する応答として前記複数のアプリケーションから返信されたログから総合ログを作成し、前記対象期間における前記対象サービスの異常兆候の有無を監視するための情報として前記総合ログを可視化するように構成されている、請求項1乃至3の何れか一項に記載の監視支援装置。 The visualization unit includes:
A comprehensive log is created from logs returned from the plurality of applications in response to the request, and the comprehensive log is visualized as information for monitoring the presence or absence of abnormality signs in the target service during the target period. The monitoring support device according to any one of claims 1 to 3.
1回の前記対象サービスを実現する処理の前記総合ログ毎に、前記総合ログを時系列順に可視化するように構成されている、請求項4に記載の監視支援装置。 The visualization unit includes:
The monitoring support device according to claim 4, wherein the monitoring support device is configured to visualize the comprehensive log in chronological order for each comprehensive log of a process for realizing one target service.
前記要求に対する応答として前記複数のアプリケーションから返信されたログ、又は、前記ログに対して返信元のアプリケーションに関する情報を付与した情報、のいずれかである、請求項5に記載の監視支援装置。 The comprehensive log is
The monitoring support device according to claim 5, wherein the monitoring support device is either a log returned from the plurality of applications as a response to the request, or information obtained by adding information regarding the reply source application to the log.
前記可視化部は、
前記指標値から判定された前記異常兆候の有無を表すラベルを更に可視化するように構成されている、請求項6に記載の監視支援装置。 further comprising an index value calculation unit configured to calculate a predetermined index value from the comprehensive log,
The visualization unit includes:
The monitoring support device according to claim 6, further configured to visualize a label indicating the presence or absence of the abnormality sign determined from the index value.
1回の前記対象サービスを実現する処理において時間的に隣接する総合ログ間の時間幅と、予め設定された前記総合ログ間の標準的な時間幅との差分を前記指標値として算出するように構成されており、
前記可視化部は、
前記差分と、予め設定された許容時間幅との大小関係により前記ラベルの値を判定し、判定した前記値を持つラベルを可視化するように構成されている、請求項7に記載の監視支援装置。 The index value calculation unit includes:
A difference between a time width between temporally adjacent comprehensive logs in a process for realizing one target service and a preset standard time width between the comprehensive logs is calculated as the index value. It is configured,
The visualization unit includes:
The monitoring support device according to claim 7, wherein the monitoring support device is configured to determine the value of the label based on a magnitude relationship between the difference and a preset allowable time width, and to visualize a label having the determined value. .
前記差分と、前記許容時間幅との比を更に可視化するように構成されている、請求項8に記載の監視支援装置。 The visualization unit includes:
The monitoring support device according to claim 8, further configured to visualize a ratio between the difference and the allowable time width.
前記可視化部は、
前記差分が前記第1の許容時間幅未満である場合、前記ラベルの値として前記異常兆候が無いことを表す値を判定し、
前記差分が前記第1の許容時間幅以上かつ前記第2の許容時間幅未満である場合、前記ラベルの値として前記異常兆候が発生する危険性があることを表す値を判定し、
前記差分が前記第2の許容時間幅以上である場合、前記ラベルの値として前記異常兆候があることを表す値を判定する、請求項8に記載の監視支援装置。 The permissible time width includes a first permissible time width and a second permissible time period that is larger than the first permissible time width,
The visualization unit includes:
If the difference is less than the first allowable time width, determine a value indicating that there is no abnormality sign as the value of the label,
If the difference is greater than or equal to the first permissible time range and less than the second permissible time range, determine a value representing that there is a risk that the abnormality sign will occur as the value of the label;
The monitoring support device according to claim 8, wherein when the difference is equal to or larger than the second allowable time width, a value indicating that the abnormality sign exists is determined as the value of the label.
前記監視の対象となるサービスを表す対象サービスと、前記監視の対象となる期間を表す対象期間とを受け付ける受付手順と、
前記対象サービスを実現する複数のアプリケーションに対して、前記対象期間のログを要求する要求手順と、
前記要求に対する応答として前記複数のアプリケーションから返信されたログを用いて、前記対象期間における前記対象サービスの異常兆候の有無を監視するための情報を可視化する可視化手順と、
を実行する監視支援方法。 A monitoring support device that supports monitoring of signs of abnormality in services realized by linking multiple applications.
a reception procedure for receiving a target service representing a service to be monitored and a target period representing a period to be monitored;
a request procedure for requesting logs for the target period from a plurality of applications that implement the target service;
a visualization procedure for visualizing information for monitoring the presence or absence of abnormality signs in the target service during the target period using logs returned from the plurality of applications in response to the request;
Monitoring support method to perform.
前記監視の対象となるサービスを表す対象サービスと、前記監視の対象となる期間を表す対象期間とを受け付ける受付手順と、
前記対象サービスを実現する複数のアプリケーションに対して、前記対象期間のログを要求する要求手順と、
前記要求に対する応答として前記複数のアプリケーションから返信されたログを用いて、前記対象期間における前記対象サービスの異常兆候の有無を監視するための情報を可視化する可視化手順と、
を実行させるプログラム。 A monitoring support device that supports monitoring of signs of abnormality in services realized by linking multiple applications.
a reception procedure for receiving a target service representing a service to be monitored and a target period representing a period to be monitored;
a request procedure for requesting logs for the target period from a plurality of applications that implement the target service;
a visualization procedure for visualizing information for monitoring the presence or absence of abnormality signs in the target service during the target period using logs returned from the plurality of applications in response to the request;
A program to run.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022117900A JP2024015673A (en) | 2022-07-25 | 2022-07-25 | Monitoring support device, monitoring support method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022117900A JP2024015673A (en) | 2022-07-25 | 2022-07-25 | Monitoring support device, monitoring support method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024015673A true JP2024015673A (en) | 2024-02-06 |
Family
ID=89772650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022117900A Pending JP2024015673A (en) | 2022-07-25 | 2022-07-25 | Monitoring support device, monitoring support method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024015673A (en) |
-
2022
- 2022-07-25 JP JP2022117900A patent/JP2024015673A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6394726B2 (en) | Operation management apparatus, operation management method, and program | |
JP5267736B2 (en) | Fault detection apparatus, fault detection method, and program recording medium | |
JP2020027615A (en) | Server hardware fault analysis and recovery | |
JP5874936B2 (en) | Operation management apparatus, operation management method, and program | |
EP3239839A1 (en) | Operation management device, operation management method, and recording medium in which operation management program is recorded | |
US7617086B2 (en) | Monitoring simulating device, method, and program | |
WO2011083687A1 (en) | Operation management device, operation management method, and program storage medium | |
US9524223B2 (en) | Performance metrics of a computer system | |
CN116089482A (en) | Analyzing large-scale data processing jobs | |
JP5007247B2 (en) | Job processing system and job management method | |
US9405657B2 (en) | Application architecture assessment system | |
CN110874311A (en) | Database detection method and device, computer equipment and storage medium | |
US20100251029A1 (en) | Implementing self-optimizing ipl diagnostic mode | |
JP6667664B2 (en) | Plant management apparatus, plant management method, and program | |
JP2024015673A (en) | Monitoring support device, monitoring support method, and program | |
JP2019049802A (en) | Failure analysis supporting device, incident managing system, failure analysis supporting method, and program | |
JP2010015246A (en) | Failure information analysis management system | |
JP6317074B2 (en) | Failure notification device, failure notification program, and failure notification method | |
JP4575020B2 (en) | Failure analysis device | |
EP2495660A1 (en) | Information processing device and method for controlling information processing device | |
JP2016085496A (en) | Abnormality sign detection device and method of computer system | |
KR101757558B1 (en) | IT Service Quality Auto Diagnostic Method and System | |
JP2016042339A (en) | Message display method, message display apparatus, and message display program | |
WO2021187128A1 (en) | Monitoring system, monitoring device, and monitoring method | |
Jagannathan et al. | REFORM: Increase alerts value using data driven approach |