JP6574146B2 - サービス監視装置及びサービス監視方法 - Google Patents

サービス監視装置及びサービス監視方法 Download PDF

Info

Publication number
JP6574146B2
JP6574146B2 JP2016101119A JP2016101119A JP6574146B2 JP 6574146 B2 JP6574146 B2 JP 6574146B2 JP 2016101119 A JP2016101119 A JP 2016101119A JP 2016101119 A JP2016101119 A JP 2016101119A JP 6574146 B2 JP6574146 B2 JP 6574146B2
Authority
JP
Japan
Prior art keywords
service
character string
monitoring
unit
string portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016101119A
Other languages
English (en)
Other versions
JP2017207995A (ja
Inventor
励 野元
励 野元
浩二 徳丸
浩二 徳丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016101119A priority Critical patent/JP6574146B2/ja
Publication of JP2017207995A publication Critical patent/JP2017207995A/ja
Application granted granted Critical
Publication of JP6574146B2 publication Critical patent/JP6574146B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、サービス監視装置及びサービス監視方法に関する。
近年のシステムリソースの仮想化及び動的な構成変更が行われているシステムの運用においては、システム障害によるアプリケーションサービス利用者への影響を迅速に検出する必要がある。このため、従来から行われているハードウェア故障の検知だけでなく、アプリケーションサービスの正常性を監視することが必要とされる。また、アプリケーションサービスでは、アプリケーションごとに、構成や動作が異なるため、標準的な監視方法が確立されておらず、個々に監視方法を作成する必要がある。
従来、アプリケーションサービスの監視方法を自動的に生成するために、記述したフロー図に基づきサービスが生成するログを解析し、解析結果からサービスに対応した監視プログラムを生成、実行するサービス監視方法が提案されている(例えば、特許文献1参照)。
また、APM(Application Performance Management)と呼ばれるアプリケーションの性能測定によりサービスの正常性や改善箇所等を確認してアプリケーションサービスを管理する方法が提案されている(例えば、非特許文献1参照)。
特開2000−47912号公報
"Java(登録商標) run-time monitoring, Part 1: Run-time performance and availability monitoring for Java systems," [平成28年5月10日検索,インターネット<URL:http://www.ibm.com/developerworks/library/j-rtm1/index.html>
しかしながら、従来の方法では、システム運用者の負担が大きく、適用範囲が制限されるという問題や、プログラムの知識や修正が必要となり、アプリケーションサービスの監視作業が煩雑であることが問題であった。
具体的に、特許文献1記載の方法では、サービスごとにログを解析するためのフロー図を作成する必要があり、システム運用者にフロー図作成の負担が必要であった。また、特許文献1記載の方法では、監視対象のアプリケーションサービスが、フロー図から監視方法の生成が可能なログが出力されるサービス内容である必要があり、適用範囲が制限されるという問題があった。
また、非特許文献1記載の方法では、アプリケーションサービスの性能を測定するために、システム運用者に、アプリケーションサービスのプログラムの知識や、アプリケーションサービスの修正能力が必要であるという問題があった。
本発明は、上記に鑑みてなされたものであって、サービスへの適用範囲を制限せず、システム運用者の負荷を低減するとともに、システム運用者のプログラムの知識や修正能力によらず、アプリケーションサービスの監視を可能にするサービス監視装置及びサービス監視方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係るサービス監視装置は、サービスを実行するユーザ操作手順を取得し、サービスを実行するサービス利用実行部と、サービス利用実行部に予め複数回実行させたサービスの実行結果を示すそれぞれの画像から文字列を抽出する判定情報抽出部と、判定情報抽出部が抽出した複数の文字列のうち共通する文字列部分を判別し、少なくとも共通する文字列部分を監視情報として設定する監視情報設定部と、サービス利用実行部に再現させたサービスの実行結果を示す画像から判定対象として抽出した文字列と、監視情報として設定された文字列部分との比較を基に、サービスの実行の障害の有無を判定する障害判定部と、を有することを特徴とする。
本発明によれば、サービスへの適用範囲を制限せず、システム運用者の負荷を低減するとともに、システム運用者のプログラムの知識や修正能力によらず、アプリケーションサービスの監視を可能にする。
図1は、本発明の実施の形態に係るサービス監視システムの構成の一例を説明するための図である。 図2は、判定情報の一例を説明する図である。 図3は、監視情報の一例を説明する図である。 図4は、図1に示す障害判定部の判定処理を説明する図である。 図5は、図1に示す障害判定部の判定処理を説明する図である。 図6は、図1に示すサーバによるサービス監視処理の流れを説明する図である。 図7は、本実施の形態に係るサービス監視処理の処理手順を示すフローチャートである。 図8は、図7に示す事前設定処理の処理手順を示すフローチャートである。 図9は、図7に示す監視処理の処理手順を示すフローチャートである。 図10は、プログラムが実行されることによりサーバが実現されるコンピュータの一例を示す図である。
以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施の形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
[実施の形態]
まず、実施の形態に係るサービス監視装置を有するサービス監視システムについて、サービス監視システムの概略構成及びサービス監視装置における処理の流れ及び具体例を説明する。
[サービス監視システムの構成]
まず、図1を参照して、実施の形態に係るサービス監視システムの構成について説明する。図1は、本発明の実施の形態に係るサービス監視システムの構成の一例を説明するための図である。
図1に示すように、実施の形態1に係るサービス監視システム1は、監視端末10及び
サーバ(サービス管理装置)20を有する。監視端末10及びサーバ20は、例えば、専用回線等で接続される。サーバ20は、例えばLAN等で、アプリケーションサービス(以降、「サービス」とする。)を提供するアプリケーションサーバ30と接続する。アプリケーションサーバ30は、インターネット等のネットワーク40を介して、アプリケーションサーバ30によって提供されたサービスを利用するユーザ端末50と接続する。
監視端末10は、入力デバイスによるサービス利用時のユーザ操作手順を取得するとともに、サーバ20による障害判定結果をディスプレイ等から出力する。
サーバ20は、アプリケーションサーバ30が提供するサービスの実行の障害の有無を判定する。サーバ20は、事前設定処理として、取得したユーザ操作手順を基に予め複数回実行したサービスの実行結果を示すそれぞれの画像から文字列を抽出し、抽出した複数の文字列のうち、少なくとも共通する文字列部分を監視情報として設定する。したがって、サーバ20は、サービスの実行結果を示す画像から、サービス実行の障害の有無の判定の基となる情報(監視情報)を抽出する作業を、自動的に実行する。続いて、サーバ20は、定期的に再現したサービスの実行結果を示す画像から判定対象として抽出した文字列と、監視情報として設定された文字列部分との比較を基に、サービスの実行の障害の有無を判定する監視処理を実行する。
[監視端末の構成]
ここで、監視端末10の構成について説明する。監視端末10は、図1に示すように、入力部11、制御部12、通信部13、記憶部14及び出力部15を有する。
入力部11は、システムの運用者からの各種操作を受け付ける入力インタフェースである。例えば、入力部11は、キーボード、マウス、タッチパネル、音声入力デバイス等の入力デバイスによって構成される。システムの運用者が予めサービスを利用するための操作を実行することによって、入力部11は、サービスを実行するユーザ操作手順を取得する。このユーザ操作手順は、ユーザ操作イベント(マウス操作やキーボード入力)を示す情報である。なお、システムの運用者は、入力部11を介して、実際のサービス利用のユーザと同様の操作手順を行う。
制御部12は、各種の処理手順などを規定したプログラム及び所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部12は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路である。
通信部13は、サーバ20との間で、各種情報を送受信する通信インタフェースである。記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現され、監視端末10を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが記憶される。
出力部15は、例えば、液晶ディスプレイやプリンタ等であって、サービスの実行の管理に関する各種情報を出力する。出力部15は、サーバ20によるサービスの障害の有無に関する判定結果を出力する。
[サーバの構成]
次に、サーバ20の構成について説明する。サーバ20は、通信部21、記憶部22及び制御部23を有する。
通信部21は、監視端末10と、アプリケーションサーバ30との間で、各種情報を送受信する通信インタフェースである。
記憶部22は、RAM、フラッシュメモリ等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現され、サーバ20を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが記憶される。記憶部22は、ユーザ操作記憶部221、判定情報記憶部222及び監視情報記憶部223を有する。
ユーザ操作記憶部221は、サービスを実行するユーザ操作手順を記憶する。このユーザ操作手順は、監視端末10の入力部11が取得したものであり、サーバ20は、通信部13,21を介して、このユーザ操作手順を監視端末10から受信し、ユーザ操作記憶部221に記憶する。ユーザ操作記憶部221は、サービスごとにユーザ操作手順を記憶する。
判定情報記憶部222は、判定情報抽出部232(後述)が、サービス利用実行部231(後述)に予め実行させたサービスの実行結果を示す画像から抽出した文字列を、判定情報として記憶する。判定情報記憶部222は、同一のユーザ操作手順について、複数の判定情報を記憶する。
図2は、判定情報の一例を説明する図である。図2は、事前設定処理(後述)において、予め複数回実行されたサービスAのログイン結果を示すそれぞれの画像から抽出した文字列を含む画像を示す。図2の(a)の上段には、例えば、一度目の実行結果に対応する画像G1を示し、図2の(a)の下段には、二度目の実行結果に対応する画像G2を示す。画像G1の領域R11a,R11b,R12a,R12bには、文字列「サービスAにログイン」,「ログイン時刻:」,「09」,「:」,「11」が含まれる。画像G2のR21a,R21b,R22a,R22bには、文字列「サービスAにログイン」,「ログイン時刻:」,「10」,「:」,「14」が含まれる。なお、図2の(b)には、監視画像Gtも示す。この監視画像Gtについては後述する。
監視情報記憶部223は、監視情報設定部233(後述)によって設定された監視情報を記憶する。監視情報記憶部223は、サービスごとに監視情報を記憶する。監視情報は、判定情報記憶部222が記憶する文字列を基に設定される。ここで、具体的に、図3を参照して、監視情報について説明する。
図3は、監視情報の一例を説明する図である。図3に示す監視画像Gtは、サービスAのログイン結果に対応する監視情報であり、サービスAのログイン結果を示す画像から抽出した文字列を含む画像情報である。図3では、説明のために、監視画像Gtは、領域R1a,R1b,R2a,R2bに区切っている。
領域R1aは、文字列「サービスAにログイン」,「ログイン時刻:」を含む。領域R1bは、文字列「:」を含む。この領域R1a,R1bの文字列は、サービスAに対するログイン操作を行った場合に常に示されるものであり、サービスAのログイン実行結果を示す画像において共通する部分である。このため、この領域R1a,R1bの文字列は、サービスAのログイン実行時には、一致が必要である文字列部分であるとして、監視情報設定部233によって監視情報として設定される。障害判定部234(後述)では、この領域R1a,R1bの文字列部分を判定対象となる文字列と比較することによって、このサービスAの障害の有無が判定される。
一方、領域R2a,R2bは、文字列「hh」,「mm」を含む。この領域R2aの文字列は、サービスAのログイン時刻の時を示す文字列であり、領域R2bの文字列は、サービスAのログイン時刻の分を示す文字列である。したがって、これらの領域R2a,R2bの文字列は、ログインを実行する度に文字列が変化する部分である。このため、領域R2a,R2bの文字列部分は、変化を許容する文字列部分として、監視情報設定部233によって設定される。障害判定部234(後述)は、判定対象となる文字列のうち、この領域R2a,R2bに対応する部分に、時或いは分を示す数字が示されているかについても判断し、サービスAの障害の有無を判定する。
図1に戻り、制御部23について説明する。制御部23は、各種の処理手順などを規定したプログラム及び所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部23は、CPUやMPUなどの電子回路である。制御部23は、サービス利用実行部231、判定情報抽出部232、監視情報設定部233及び障害判定部234を有する。
サービス利用実行部231は、サービスを実行するユーザ操作手順を記憶し、サービスを実行する。言い換えると、サービス利用実行部231は、監視端末10の入力部11から取得したサービス利用時のユーザ操作手順を、ユーザ操作記憶部221に記憶する。そして、サービス利用実行部231は、ユーザ操作記憶部221に記憶するユーザ操作手順を用いて、ユーザ操作イベント(マウス操作やキーボード入力)を再現し、ユーザのサービス利用を実行する。そして、サービス利用実行部231は、実行させたサービスの実行結果を示す画像、すなわち、サービス利用画面のキャプチャ画像を取得する。
例えば、サービス利用実行部231は、監視情報を事前に設定するための事前設定処理では、監視情報の設定対象であるサービスを、予め複数回実行し、このサービスの各実行結果を示すそれぞれの画像を取得する。一方、サービス利用実行部231は、サービスの障害の有無を監視する監視処理では、監視対象であるサービスを定期的に再現し、このサービスの実行結果を示す画像を取得する。サービス利用実行部231は、監視処理では、監視対象であるサービスを、例えば5分に1回、再現する。
判定情報抽出部232は、事前設定処理において、サービス利用実行部231に予め複数回実行させたサービスの実行結果を示すそれぞれの画像から判定情報として文字列を抽出する。言い換えると、判定情報抽出部232は、事前設定対象のサービスに対する同一のユーザ操作について、複数の判定情報を取得する。また、判定情報抽出部232は、監視処理において、サービス利用実行部231が定期的に実行した監視対象のサービスの実行結果を示すそれぞれの画像から判定対象として文字列を抽出する。判定情報抽出部232は、サービス利用実行部231から出力された複数のキャプチャ画像のそれぞれに対し、文字認識(OCR(Optical Character Recognition/Reader))等)により、文字列を抽出する。判定情報抽出部232は、抽出した文字列を判定情報記憶部222に記憶させる。
具体的には、図2を参照して、事前設定処理における判定情報抽出部232による文字列の抽出処理を説明する。まず、画像G1のR11a,R11b,R12a,R12bには、文字列「サービスAにログイン」,「ログイン時刻:」,「09」,「:」,「11」が含まれる。このため、判定情報抽出部232は、R11a,R11b,R12a,R12bから、各文字列「サービスAにログイン」,「ログイン時刻:」,「09」,「:」,「11」を抽出する。一方、画像G2のR21a,R21b,R22a,R22bには、文字列「サービスAにログイン」,「ログイン時刻:」,「10」,「:」,「14」が含まれる。このため、判定情報抽出部232は、R21a,R21b,R22a,R22bから、文字列「サービスAにログイン」,「ログイン時刻:」,「10」,「:」,「11」を抽出する。そして、判定情報抽出部232は、抽出した各文字列を、判定情報として判定情報記憶部222に記憶する。
監視情報設定部233は、判定情報抽出部232が抽出した複数の文字列のうち共通する文字列部分を判別し、少なくとも、この共通する文字列部分を監視情報として設定する。監視情報設定部233は、判定情報記憶部222が記憶した文字列を基に、共通する文字列部分を判別する。
或いは、監視情報設定部233は、判定情報抽出部232が抽出した複数の文字列のうち、共通する文字列部分を、一致が必要である文字列部分として判別し、共通する文字列部分以外の文字列部分を、変化を許容する文字列部分として判別する。そして、監視情報設定部233は、一致が必要である文字列部分と変化を許容する文字列部分との組み合わせを監視情報として設定する。
具体的に、図2に示す画像G1,G2を例として、監視情報設定部233が、サービスAのログイン結果に対応する監視情報(監視画像Gt)を設定する場合について説明する。画像G1,G2に示すように、画像G1,G2に含まれる文字列のうち、各画像G1,G2のR11a,R11b,R21a,R21bにはともに、文字列「サービスAにログイン」,「ログイン時刻:」,「:」が含まれている。言い換えると、画像G1,G2については、文字列「サービスAにログイン」,「ログイン時刻:」,「:」が共通する。このため、サービスAのログイン結果については、監視情報設定部233は、文字列「サービスAにログイン」,「ログイン時刻:」,「:」が共通すると判別する。
言い換えると、画像G1,G2における文字列「サービスAにログイン」,「ログイン時刻:」,「:」は、サービスAに対するログイン操作を行った場合に常に示されるものであり、サービスAのログイン結果を示す画像において共通する部分である。したがって、サービスAのログイン実行時においては、文字列「サービスAにログイン」,「ログイン時刻:」,「:」は、一致が必要である文字列部分であるとして、監視情報設定部233によって設定される。
一方、画像G1,G2の領域R12a,R12b,R22a,R22bには、実際のログイン時刻の時または分を示す文字列「09」,「11」,「10」,「14」が含まれる。画像G1,G2の領域R12a,R12b,R22a,R22bの文字列は、それぞれのログイン操作を実際に実行した時刻に応じて異なるものである。すなわち、画像G1,G2の領域12a,R12b,R22a,R22bのログイン文字列「09」,「11」,「10」,「14」は、サービスAへのログインを実行する度に変化する部分である。このため、領域12a,R12b,R22a,R22bの文字列部分は、変化を許容する文字列部分として、監視情報設定部233によって設定される。
この結果、監視情報設定部233は、図2に示す監視画像Gtを、サービスAのログイン結果に対応する監視情報として設定する。監視画像Gtにおいては、領域R1a,R1bの文字列「サービスAにログイン」,「ログイン時刻:」,「:」は、サービスAのログイン実行時には一致が必要である文字列部分である。
また、監視画像Gtの領域R2a,R2bの文字列「hh」,「mm」は、変化を許容する文字列部分であり、必ずしも一致が必要ではない。監視画像Gtの領域R2aの文字列「hh」には、時を示す「00」〜「23」のいずれかの数字が入り、領域R2bの文字列「mm」には、分を示す「00」〜「59」のいずれかの数字が入る。障害判定部234(後述)では、少なくとも、監視画像Gtの領域R1a,R1bの文字列部分と、判定対象となる文字列とを比較することによって、このサービスAの障害の有無を判定する。また、障害判定部234(後述)では、判定対象となる文字列のうち、この領域R2a,R2bの文字列部分に対応する部分に、時または分を示す数字が示されているかについても判断し、サービスAの障害の有無を判定する。
そこで、次に、障害判定部234について説明する。障害判定部234は、定期的に、サービス利用実行部231に実行させたサービスの実行結果を示す画像から判定対象として抽出した文字列と、監視情報として設定された文字列部分との比較を基に、サービスの実行の障害の有無を判定する。
例えば、障害判定部234は、判定対象として抽出した文字列部分と監視情報として設定された文字列とが一致しない場合には、サービスの実行に障害があることを判定する。
或いは、障害判定部234は、判定対象として抽出した文字列のうち、監視情報の一致が必要である文字列部分に対応する文字列が一致しない場合、或いは、変化を許容する文字列部分に対応する文字列が許容された変化を超えた文字列である場合、サービスの実行に障害があることを判定する。
具体的に、図4及び図5を用いて、障害判定部234の判定処理について説明する。図4及び図5は、障害判定部234の判定処理を説明する図である。まず、図4を参照して説明を行う。
図4に示す画像Ghは、監視処理のあるタイミングでサービス利用実行部231に実行させたサービスAへのログイン結果を示す画像から抽出した文字列を含む画像である。障害判定部234は、監視画像Gtと、判定対象となる画像Ghとを比較することによって、サービスの実行の障害の有無を判定する。画像Ghの領域R1haは、監視画像Gtにおける領域R1aに対応する領域である。画像Ghの領域R1hbは、監視画像Gtにおける領域R1bに対応する領域である。画像Ghの領域R2haは、監視画像Gtにおける領域R2aに対応する領域である。画像Ghの領域R2hbは、監視画像Gtにおける領域R2bに対応する領域である。
そこで、障害判定部234は、この画像Ghの領域R1ha,R1hbの文字列と、監視画像Gtの領域R1a,R1bの文字列とを比較する(図4の(1)参照)。図4の例では、画像Ghの領域R1haの文字列「サービスAにログイン」,「ログイン時刻:」及び領域R1hbの文字列「:」と、監視画像Gtの領域R1aの文字列「サービスAにログイン」,「ログイン時刻:」及び領域R1bの文字列「:」とが一致する(図4の(2)参照)。また、画像Ghの領域R2haには、「12」時を示す数字が示されており、画像Ghの領域R2hbには、「04」分を示す数字が示されている。このため、障害判定部234は、サービスAは正常であると判定する(図4の(3)参照)。
次に、図5を参照して説明を行う。図5に示す画像Giは、監視処理の他のタイミングでサービス利用実行部231に実行させたサービスAへのログイン結果を示す画像から抽出した文字列を含む画像である。画像Giの領域R1iaは、監視画像Gtにおける領域R1aに対応する領域である。画像Giの領域R1ibは、監視画像Gtにおける領域R1bに対応する領域である。画像Giの領域R2iaは、監視画像Gtにおける領域R2aに対応する領域である。画像Giの領域R2ibは、監視画像Gtにおける領域R2bに対応する領域である。
この場合、障害判定部234は、この画像Giの領域R1iaの文字列と、監視画像Gtの領域R1a,R1bの文字列とを比較する(図5の(1)参照)。図5の例では、画像Giの領域R1iaは、文字列「サービスAにログインエラー」を含むものの、監視画像Gtの領域R1aの文字列「ログイン時刻:」及び領域R1bの文字列「:」が示されていない。このため、画像Giの領域R1iaの文字列と、監視画像Gtの領域R1aの文字列とが一致しない(図5の(2)参照)。さらに、画像GiのR2ia,R2ibには、空白であり、時または分を示す数字のいずれもが示されていない。このため、障害判定部234は、サービスAは異常であり、サービスAに障害があると判定する(図5の(3)参照)。
このように、サーバ20は、単に画像の一致判定をするのではなく、複数の判定情報である文字列から、一致が必要である文字列部分と変化を許容する文字列部分とを組み合わせた監視情報(例えば、監視画像Gt)を設定し、日時や時刻が異なる場合等の変化部分を許容する判定を可能としている。したがって、サーバ20では、障害以外の変化による誤検知をなくし、サービスに対して幅広く、かつ、実用的な監視を実行可能とした。
なお、障害判定部234は、サービスの実行に障害があることを判定した場合には、サービスの実行に障害がある旨を示す障害通知を、監視端末10に出力する。これに応じて、監視端末10は、出力部15から、サービスの実行に障害がある旨を出力する。この出力結果を確認することによって、システム運用者は、サービスの実行に障害があることを認識することができる。
[サービス監視処理の流れ]
次に、図6を参照して、サーバ20によるサービス監視処理の流れについて説明する。図6は、サーバ20によるサービス監視処理の流れを説明する図である。前述したように、サーバ20は、事前設定処理と、監視処理とを実行する。図6では、実線の矢印が事前設定処理に対応し、破線の矢印が監視処理に対応するものとして説明する。
まず、事前設定処理について説明する。サーバ20は、事前設定処理を、各サービスの操作手順ごとに実行する。事前設定処理では、まず、システムの運用者が予めサービスを利用するための操作を監視端末10の入力部11で実行する。サーバ20では、サービス利用実行部231が、矢印Y1に示すように、入力部11からサービス実行時のユーザ操作手順を取得する(図6の(1)参照)。
サービス利用実行部231は、矢印Y2のように、このユーザ操作手順をユーザ操作記憶部221に記憶する(図6の(2)参照)。そして、サービス利用実行部231は、ユーザ操作記憶部221に記憶するユーザ操作手順を用いて、ユーザ操作イベント(マウス操作やキーボード入力)を再現し、ユーザのサービス利用を複数回実行する(図6の(2)参照)。そして、サービス利用実行部231は、それぞれ実行したサービスの実行結果を示す画像、すなわち、サービス利用画面のキャプチャ画像を取得し、矢印Y3のように、判定情報抽出部232に出力する(図6の(3)参照)。
判定情報抽出部232は、サービス利用実行部231から出力された複数のキャプチャ画像のそれぞれに対し、文字認識により、文字列を抽出する(図6の(4)参照)。そして、判定情報抽出部232は、矢印Y4のように、各ユーザ操作手順の実行によるサービス実行結果を示す各画像からそれぞれ抽出した文字列を、判定情報記憶部222に出力する(図6の(5)参照)。判定情報記憶部222は、同一のユーザ操作手順に対して複数の文字列を記憶する(図6の(6)参照)。
続いて、監視情報設定部233は、矢印Y5のように、判定情報として、複数の文字列部分を示す画像を読み出す(図6の(7)参照)。監視情報設定部233は、読み出した判定情報から監視情報を生成する(図6の(8)参照)。具体的には、監視情報設定部233は、複数の文字列部分を示す画像間において、共通した文字列部分は、一致が必要である文字列部分であると判別する(図6の(8)の(a)参照)。監視情報設定部233は、複数の文字列部分を示す画像間において、異なった文字列部分は、変化を許容する文字列部分であると判別する(図6の(8)の(b)参照)。
そして、監視情報設定部233は、この結果を基に、矢印Y6のように、監視情報を設定し(図6の(9)参照)、監視情報記憶部223に記憶する。例えば、サービスAのログイン結果に対応する監視情報として、図2に示す監視画像Gtを設定する。
続いて、監視処理について説明する。サーバ20は、監視処理を、各サービスの操作手順ごとに、定期的に実行する。まず、監視処理として、サービス利用実行部231は、ユーザ操作記憶部221に記憶するユーザ操作手順を用いて、定期的に、ユーザ操作イベントを再現し、ユーザのサービス利用を実行する(図6の(11)参照)。そして、サービス利用実行部231は、サービス利用画面のキャプチャ画像を取得し、矢印Y11のように、判定情報抽出部232に出力する(図6の(12)参照)。
そして、判定情報抽出部232は、サービス利用実行部231から出力されたキャプチャ画像から文字列を抽出する(図6の(13)参照)。そして、判定情報抽出部232は、矢印Y12のように、キャプチャ画像から抽出した文字列を、判定対象の文字列として障害判定部234に出力する(図6の(14)参照)。
続いて、障害判定部234は、矢印Y13のように、このユーザ操作手順に対応して監視情報として設定された文字列部分を、監視情報記憶部223から読み出す(図6の(15)参照)。そして、障害判定部234は、読み出した監視情報と、監視時に取得した判定対象とを比較する(図6の(16)参照)。
具体的には、障害判定部234は、監視情報記憶部223から読み出した文字列部分と、判定対象の文字列として障害判定部234に出力された文字列部分とを比較し、監視情報の一致が必要である文字列部分に対応する文字列が一致しない場合、或いは、変化を許容する文字列部分に対応する文字列が許容された変化を超えた文字列である場合、サービスの実行に障害があることを判定する。
これに対し、障害判定部234は、読み出した監視情報と、監視時に取得した判定対象とが一致しない場合には、このユーザ操作手順で実行するサービスに障害があると判定し、矢印Y14のように、障害通知を監視端末10に出力する(図6の(17)参照)。これに応じて、監視端末10では、出力部15から、このユーザ操作手順でのサービスの実行に障害がある旨を出力する。
[サービス監視処理の処理手順]
次に、図7を参照して、サーバ20が実行するサービス監視処理の処理手順について説明する。図7は、本実施の形態に係るサービス監視処理の処理手順を示すフローチャートである。
図7に示すように、サーバ20は、予め実行したサービスの実行結果を示す画像から文字列を抽出し、抽出した文字列のうち共通する文字列部分を監視情報として設定する事前設定処理を行う(ステップS1)。そして、サーバ20は、定期的に実行したサービスの実行結果を示す画像から抽出した文字列と、監視情報として設定された文字列部分との比較を基に、サービスの実行の障害の有無を判定する監視処理を行う(ステップS2)。
[事前設定処理]
図8は、図7に示す事前設定処理(ステップS1)の処理手順を示すフローチャートである。
図8に示すように、まず、サービス利用実行部231は、監視端末10から、事前設定処理対象のユーザ操作手順を取得する(ステップS11)。続いて、サービス利用実行部231は、取得したユーザ操作手順を用いて、ユーザ操作イベントを再現し、ユーザのサービス利用を複数回実行するサービス利用実行処理を行う(ステップS12)。この処理において、サービス利用実行部231は、それぞれ実行したサービスの実行結果を示すキャプチャ画像を取得し、判定情報抽出部232に出力する。
判定情報抽出部232は、サービス利用実行部231から出力された複数のキャプチャ画像のそれぞれに対し、判定情報として、文字列を抽出する判定情報抽出処理を行う(ステップS13)。そして、判定情報抽出部232は、抽出した同一のユーザ操作手順に対する複数の文字列を判定情報記憶部222に記憶させる判定情報記憶処理を行う(ステップS14)。
続いて、監視情報設定部233は、判定情報記憶部222から、判定情報として読み出した複数の文字列部分から、共通する文字列部分を判別し、少なくとも、この共通する文字列部分を監視情報として設定する監視情報設定処理を行う(ステップS15)。また、監視情報設定部233は、判定情報抽出部232が抽出した複数の文字列のうち、共通する文字列部分を、一致が必要である文字列部分として判別し、共通する文字列部分以外の文字列部分を、変化を許容する文字列部分として判別し、一致が必要である文字列部分と変化を許容する文字列部分との組み合わせを監視情報として設定してもよい。監視情報設定部233は、設定した監視情報を監視情報記憶部223に記憶して、このユーザ操作手順に対応する事前設定処理を終了する。
[監視処理]
図9は、図7に示す監視処理(ステップS2)の処理手順を示すフローチャートである。
制御部23は、監視タイミングであるか否かを判断する(ステップS21)。この監視タイミングは、監視対象のそれぞれのユーザ操作手順に対し、定期的に監視処理が実行できるように設定されている。制御部23は、監視対象タイミングでないと判断した場合には(ステップS21:No)、ステップS21に戻り、ステップS21の判断処理を再度実行する。
一方、制御部23は、監視対象タイミングであると判断した場合には(ステップS21:Yes)、サービス利用実行部231は、監視対象のユーザ操作手順をユーザ操作記憶部221から読み出して(ステップS22)、ユーザ操作イベントを再現し、ユーザのサービス利用を実行するサービス利用再現処理を行う(ステップS23)。この場合、サービス利用実行部231は、再現したサービスの実行結果を示すサービス利用画面のキャプチャ画像を取得し、判定情報抽出部232に出力する。
そして、判定情報抽出部232は、サービス利用実行部231から出力されたキャプチャ画像から、判定対象として、文字列を抽出する判定対象抽出処理を行い(ステップS24)、抽出した文字列を障害判定部234に出力する。
続いて、障害判定部234は、このユーザ操作手順に対応して監視情報として設定された文字列部分を、監視情報記憶部223から読み出す(ステップS25)。そして、障害判定部234は、監視情報として読み出した文字列部分と、判定対象の文字列とを比較し、監視情報として読み出した位置が必要である文字列部分と、判定対象の文字列とが一致するか否かを判断する(ステップS26)。なお、障害判定部234は、ステップS26において、監視情報の一致が必要である文字列部分に対応する文字列に対する比較とともに、変化を許容する文字列部分に対応する文字列が許容された変化を超えた文字列であるか否かを判断してもよい。
障害判定部234は、監視情報として読み出した一致が必要である文字列部分と、判定対象の文字列とが一致すると判断した場合(ステップS26:Yes)、このユーザ操作手順で実行するサービスは正常であると判定し(ステップS27)、ステップS21に戻る。或いは、障害判定部234は、判定対象のうち、監視対象における変化を許容する文字列部分に対応する文字列が許容された変化を超えていないことをさらに判断した場合に、このユーザ操作手順で実行するサービスは正常であると判定する。
一方、障害判定部234は、監視情報として読み出した一致が必要である文字列部分と判定対象の文字列とが一致しないと判断した場合(ステップS26:No)、このユーザ操作手順で実行するサービスに障害(異常)があると判定する(ステップS28)。或いは、障害判定部234は、判定対象のうち、監視情報における変化を許容する文字列部分に対応する文字列が許容された変化を超えていることを判断した場合には、このユーザ操作手順で実行するサービスはサービスに障害があると判定する。そして、障害判定部234は、障害通知を監視端末10に出力する(ステップS29)。
[実施の形態の効果]
上記のように、本実施の形態では、事前設定処理時に実行したアプリケーションサービスの実行結果を示す画像から監視情報として抽出した共通する文字列部分と、サービス利用実行部231に再現させたサービスの実行結果を示す画像から判定対象として抽出した文字列との比較を基に、サービスの実行の障害の有無を判定する。このため、本実施の形態によれば、フロー図から監視方法の生成が可能なログが出力されるサービス内容である必要がなく、サービスへの適用範囲を制限することなくサービスの監視が可能である。すなわち、本実施の形態によれば、これまで適用できなかったサービスについても、アプリケーションサービスの正常性の監視が行えるようになることで、アプリケーションサービス利用者への影響をより迅速に検知できるようになる。
また、本実施の形態によれば、システム運用者は、事前設定処理時に、監視対象となるアプリケーションサービスの利用操作を行うだけでよい。言い換えると、本実施の形態によれば、アプリケーションサービスごとにログを解析するためのフロー図の作成やアプリケーションの知識、修正が不要になるため、システム運用者の負荷を低減することができる。
さらに、本実施の形態では、単に画像の一致判定をするのではなく、複数の判定情報である文字列から、一致が必要である文字列部分と変化を許容する文字列部分とを組み合わせた監視情報を設定し、日時が異なる場合等の変化部分を許容する判定を可能としている。この結果、本実施の形態によれば、障害以外の変化による誤検知をなくし、アプリケーションサービスに対して幅広く、かつ、実用的な監視を実行することができる。
したがって、本実施の形態によれば、アプリケーションサービスへの適用範囲を制限せず、システム運用者の負荷を低減するとともに、システム運用者のプログラムの知識や修正能力によらず、アプリケーションサービスの監視を可能にする。
なお、本実施の形態では、サーバ20が監視処理を定期的に実行する例について説明したが、もちろんこれに限らない。例えば、サーバ20は、監視端末10による監視処理実行指示を受けた場合に監視処理を実行してもよい。或いは、サーバ20は、アプリケーションサーバ30によるアプリケーションサービスの改版等があった場合に監視処理を実行してもよい。
また、本実施の形態では、監視情報が、判定情報抽出部232が抽出した複数の文字列を基に、一致が必要である文字列部分と変化を許容する文字列部分との組み合わせである場合について説明したが、もちろん、これに限らない。監視情報は、判定情報抽出部232が抽出した複数の文字列のうち、共通する文字列部分、すなわち、一致が必要である文字列部分だけでもよい。この場合も、判定対象となる文字列との比較が可能であるため、サービスの実行の障害の有無を判定することが可能になる。
[他の実施の形態]
[システム構成等]
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部又は一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
図10は、プログラムが実行されることにより、サーバ20が実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、サーバ20の各処理を規定するプログラムは、コンピュータ1000により実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、サーバ20における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
また、上述した実施の形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN、WAN等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
以上、本発明者によってなされた発明を適用した実施の形態について説明したが、本実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等は全て本発明の範疇に含まれる。
1 サービス監視システム
10 監視端末
11 入力部
12,23 制御部
13,21 通信部
14,22 記憶部
15 出力部
20 サーバ
30 アプリケーションサーバ
40 ネットワーク
50 ユーザ端末
221 ユーザ操作記憶部
222 判定情報記憶部
223 監視情報記憶部
231 サービス利用実行部
232 判定情報抽出部
233 監視情報設定部
234 障害判定部

Claims (6)

  1. サービスを実行するユーザ操作手順を取得し、前記サービスを実行するサービス利用実行部と、
    前記サービス利用実行部に予め複数回実行させた前記サービスの実行結果を示すそれぞれの画像から文字列を抽出する判定情報抽出部と、
    前記判定情報抽出部が抽出した複数の文字列のうち共通する文字列部分を判別し、少なくとも前記共通する文字列部分を監視情報として設定する監視情報設定部と、
    前記サービス利用実行部に再現させた前記サービスの実行結果を示す画像から判定対象として抽出した文字列と、前記監視情報として設定された文字列部分との比較を基に、前記サービスの実行の障害の有無を判定する障害判定部と、
    を有し、
    前記監視情報設定部は、前記判定情報抽出部が抽出した複数の文字列のうち、前記共通する文字列部分を、一致が必要である文字列部分として判別し、前記共通する文字列部分以外の文字列部分を、変化を許容する文字列部分として判別し、前記一致が必要である文字列部分と前記変化を許容する文字列部分との組み合わせを前記監視情報として設定することを特徴とするサービス監視装置。
  2. 前記障害判定部は、前記判定対象として抽出した文字列のうち、前記監視情報の前記一致が必要である文字列部分に対応する文字列が一致しない場合、或いは、前記変化を許容する文字列部分に対応する文字列が許容された変化を超えている場合、前記サービスの実行に障害があることを判定することを特徴とする請求項に記載のサービス監視装置。
  3. 前記障害判定部は、定期的に、前記サービスの実行の障害の有無を判定することを特徴とする請求項1または2に記載のサービス監視装置。
  4. 前記障害判定部は、前記サービスの実行に障害があることを判定した場合には、前記サービスの実行に障害がある旨を示す障害通知を出力することを特徴とする請求項1〜のいずれか一つに記載のサービス監視装置。
  5. 前記判定情報抽出部が抽出した文字列を記憶する判定情報記憶部をさらに有し、
    前記監視情報設定部は、前記判定情報記憶部が記憶した文字列を基に前記共通する文字列部分を判別することを特徴とする請求項1〜のいずれか一つに記載のサービス監視装置。
  6. サービスの実行の障害を管理するサービス管理装置が実行するサービス監視方法であって、
    前記サービス管理装置が、前記サービスを実行するユーザ操作手順を取得し、前記サービスを予め複数回実行する工程と、
    前記サービス管理装置が、前記サービスを実行する工程において予め複数回実行させた前記サービスの実行結果を示すそれぞれの画像から文字列を抽出する工程と、
    前記サービス管理装置が、抽出した複数の文字列のうち共通する文字列部分を判別し、少なくとも前記共通する文字列部分を監視情報として設定する工程と、
    前記サービス管理装置が、前記サービスを再現する工程と、
    前記サービス管理装置が、前記サービスを再現する工程における前記サービスの実行結果を示す画像から判定対象として抽出した文字列と、前記監視情報として設定された文字列部分との比較を基に、前記サービスの実行の障害の有無を判定する工程と、
    を含み、
    前記設定する工程は、前記抽出した複数の文字列のうち、前記共通する文字列部分を、一致が必要である文字列部分として判別し、前記共通する文字列部分以外の文字列部分を、変化を許容する文字列部分として判別し、前記一致が必要である文字列部分と前記変化を許容する文字列部分との組み合わせを前記監視情報として設定することを特徴とするサービス監視方法。
JP2016101119A 2016-05-20 2016-05-20 サービス監視装置及びサービス監視方法 Active JP6574146B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016101119A JP6574146B2 (ja) 2016-05-20 2016-05-20 サービス監視装置及びサービス監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016101119A JP6574146B2 (ja) 2016-05-20 2016-05-20 サービス監視装置及びサービス監視方法

Publications (2)

Publication Number Publication Date
JP2017207995A JP2017207995A (ja) 2017-11-24
JP6574146B2 true JP6574146B2 (ja) 2019-09-11

Family

ID=60415551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016101119A Active JP6574146B2 (ja) 2016-05-20 2016-05-20 サービス監視装置及びサービス監視方法

Country Status (1)

Country Link
JP (1) JP6574146B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7041511B2 (ja) * 2017-12-26 2022-03-24 株式会社日本総合研究所 コンピュータプログラム
KR102335604B1 (ko) * 2020-07-29 2021-12-06 경북대학교 산학협력단 전력 소모량의 비트맵 패턴 형상화를 기반으로 하는 지능적인 시스템 오동작 인식 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105917314B (zh) * 2014-01-14 2019-10-29 Sk科技有限公司 用于云流服务的应用错误检测方法及其设备和系统
JP2015219890A (ja) * 2014-05-21 2015-12-07 キヤノン株式会社 管理装置、その制御方法およびプログラム
JP6455010B2 (ja) * 2014-07-31 2019-01-23 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2017207995A (ja) 2017-11-24

Similar Documents

Publication Publication Date Title
US8024617B2 (en) Method and apparatus for cause analysis involving configuration changes
JP4746455B2 (ja) コンピュータ装置、起動制御方法及び起動制御プログラム
US8683263B2 (en) Cooperative client and server logging
JP2008243034A (ja) ソフトウェア挙動モデル化装置、ソフトウェア挙動モデル化方法、ソフトウェア挙動検証装置及びソフトウェア挙動検証方法
CN110959158A (zh) 信息处理装置、信息处理方法和信息处理程序
JP2008090504A (ja) コンピュータ保守支援システム及び解析サーバ
JP5888239B2 (ja) サービス管理装置、表示方法およびプログラム
US11244266B2 (en) Incident response assisting device
US9430318B2 (en) Health monitoring and recovery for infrastructure devices
JP6574146B2 (ja) サービス監視装置及びサービス監視方法
WO2010097953A1 (ja) 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム
JP2015108898A (ja) 異常検知システム及び異常検知方法
US20160112285A1 (en) Apparatus and method for detecting abnormal connection
JP7294441B2 (ja) 評価装置、評価システム、評価方法及びプログラム
JP5803246B2 (ja) ネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラム
JP2017068691A (ja) 診断プログラム、診断方法および診断装置
US12001271B2 (en) Network monitoring apparatus, method, and program
JP2007025820A (ja) ソフトウェアのリスク診断プログラム
JP2019004284A (ja) 異常検出装置、および、異常検出方法
JP2006201890A (ja) プログラム異常対策装置
JP2018028798A (ja) 情報処理装置及びプログラム
JP2010237744A (ja) 情報処理装置、操作履歴取得方法、コンピュータプログラム
JP7338137B2 (ja) アプリケーション修正システム及び情報処理装置
JP6410705B2 (ja) 障害予兆検出システムおよび障害予兆検出方法
JP5978804B2 (ja) システムを管理するためのプログラム、方法及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190815

R150 Certificate of patent or registration of utility model

Ref document number: 6574146

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150