JP2016122337A - 障害情報提供サーバ、障害情報提供方法 - Google Patents

障害情報提供サーバ、障害情報提供方法 Download PDF

Info

Publication number
JP2016122337A
JP2016122337A JP2014262091A JP2014262091A JP2016122337A JP 2016122337 A JP2016122337 A JP 2016122337A JP 2014262091 A JP2014262091 A JP 2014262091A JP 2014262091 A JP2014262091 A JP 2014262091A JP 2016122337 A JP2016122337 A JP 2016122337A
Authority
JP
Japan
Prior art keywords
service
failure
information providing
management unit
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014262091A
Other languages
English (en)
Other versions
JP6306499B2 (ja
Inventor
祖父江 恒夫
Tsuneo Sofue
恒夫 祖父江
靖 永井
Yasushi Nagai
靖 永井
遠藤 泰義
Yasuyoshi Endo
泰義 遠藤
亨輔 鶴巣
Kyosuke Tsurusu
亨輔 鶴巣
辰昭 長船
Tatsuaki Nagafune
辰昭 長船
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP2014262091A priority Critical patent/JP6306499B2/ja
Priority to CN201580055503.1A priority patent/CN107003926B/zh
Priority to PCT/JP2015/083077 priority patent/WO2016104025A1/ja
Priority to EP15872594.5A priority patent/EP3239840B1/en
Priority to US15/531,743 priority patent/US10437695B2/en
Publication of JP2016122337A publication Critical patent/JP2016122337A/ja
Application granted granted Critical
Publication of JP6306499B2 publication Critical patent/JP6306499B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • G06F11/0739Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0769Readable error formats, e.g. cross-platform generic formats, human understandable formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】サービス利用者に対して、障害発生によるサービスへの影響度を通知する。
【解決手段】障害情報提供サーバ101は、処理サーバ群141の障害発生状況を管理する障害発生・復旧管理部123と、処理サーバ群141の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部137と、障害によるサービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部としての算出ルール管理部134および予測ルール管理部135と、ログ管理部137で管理されているログ情報およびルール管理部で管理されているルールに基づいて、サービス影響度を算出するサービス影響度算出部122と、サービス影響度算出部122により算出されたサービス影響度を利用者へ通知するサービス影響度通知部121と、を備える。
【選択図】図1

Description

本発明は、システム利用者に障害情報を提供する障害情報提供サーバおよび障害情報提供方法に関する。
無線通信ネットワークを介して接続された車載装置などの端末を用いて、システム利用者に様々なサービスを提供するシステムが知られている。こうしたシステムにおいて何らかの障害が発生した場合には、障害発生時の状況を利用者へ通知することが好ましい。特許文献1には、稼働状態にないコンテンツサーバ装置を検出した際に、当該コンテンツサーバ装置がどのような状態にあるかを認識可能なサービスメニューを作成して携帯端末にプッシュ配信する中継装置が開示されている。
特許第3642004号
上記特許文献1に開示された中継装置を用いた場合、システム利用者は、システム障害の発生時に非稼動状態のコンテンツサーバ装置の存在を知ることができるが、提供されるサービスへの影響度を知ることはできない。
本発明による障害情報提供サーバは、複数のサーバで構成される処理サーバ群と接続され、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供するものであって、前記処理サーバ群の障害発生状況を管理する障害発生・復旧管理部と、前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部と、前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部と、前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出するサービス影響度算出部と、前記サービス影響度算出部により算出されたサービス影響度を前記利用者へ通知するサービス影響度通知部と、を備える。
本発明による障害情報提供方法は、複数のサーバで構成される処理サーバ群と接続された障害情報提供サーバを用いて、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供するものであって、前記障害情報提供サーバにより、前記処理サーバ群の障害発生状況を管理し、前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理し、前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理し、前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出し、前記算出したサービス影響度を前記利用者へ通知する。
本発明によれば、サービス利用者は、システム障害の発生時に、提供されるサービスへの影響度を知ることができる。
本発明の一実施形態による障害情報提供サーバの構成を示す図である。 車載端末管理部に格納されているデータのテーブル構成例を示す図である。 通知情報管理部に格納されているデータのテーブル構成例を示す図である。 サービス構成管理部に格納されているデータのテーブル構成例を示す図である。 算出ルール管理部に格納されているデータのテーブル構成例を示す図である。 予測ルール管理部に格納されているデータのテーブル構成例を示す図である。 ログ統計値管理部に格納されているデータのテーブル構成例を示す図である。 ログ管理部に格納されているデータのテーブル構成例を示す図である。 サービス影響度算出部が実行する処理のフローチャートを示す図である。 障害発生・復旧管理部が実行する処理のフローチャートを示す図である。 利用者端末において表示される通知画面例を示す図である。 車載端末において表示される通知画面例を示す図である。
以下に、本発明の一実施形態について、図面を用いて詳細に説明する。
図1は、本発明の一実施形態による障害情報提供サーバの構成を示す図である。障害情報提供サーバ101は、CPU(Central Processing Unit)112、入力部113、出力部114、通信部115、記憶部111を備える。
記憶部111は、半導体メモリやHDD(Hard Disk Drive)等を用いて構成され、各種のプログラムおよびデータを格納する。たとえば、コンピュータ読み取り可能な記憶媒体に格納されたプログラムおよびデータを障害情報提供サーバ101へインストールすることで、これらのプログラムおよびデータを記憶部111に格納することができる。記憶部111は、車載端末管理部131、通知情報管理部132、サービス構成管理部133、算出ルール管理部134、予測ルール管理部135、ログ統計値管理部136、ログ管理部137を機能的に有する。
CPU112は、記憶部111に記憶されているプログラムやデータに基づいて、障害情報提供サーバ101を動作させるための各種の演算処理を実行する。CPU112は、サービス影響度通知部121、サービス影響度算出部122、障害発生・復旧管理部123、ログ統計処理部124を機能的に有する。
入力部113は、オペレータからの操作入力を検出し、CPU112に出力する。入力部113は、たとえばマウスやキーボード等により構成される。
出力部114は、CPU112からの指示に従って画面表示や音声出力を行う。出力部114は、たとえばディスプレイやスピーカ等により構成される。
通信部115は、CPU112からの指示に従って、障害情報提供サーバ101に接続されている処理サーバ群141、利用者端末151および車載端末152との間で通信を行う。障害情報提供サーバ101および処理サーバ群141は、インターネット150を介して、利用者端末151および車載端末152と接続されている。インターネット150は、有線接続でも良いし、無線接続でも良い。
処理サーバ群141は、複数台のサーバから構成されており、利用者端末151および車載端末152に対して各種のサービスを提供する。車載端末152は、システム利用者であるエンドユーザが所持する端末である。たとえば、車両に備え付けられたカーナビゲーションシステムや、エンドユーザが車両に持ち込んだスマートフォンなどを、車載端末152として用いることができる。利用者端末151は、たとえばエンドユーザに車両を販売しているメーカの管理者など、エンドユーザ以外のシステム利用者が所有する端末である。なお、図1では簡略化のために、利用者端末151および車載端末152をそれぞれ1つずつのみ示している。しかし実際には、システム利用者の数に応じて、多数の利用者端末151および車載端末152がインターネット150を介して、処理サーバ群141および障害情報提供サーバ101に接続されている。
次に、記憶部111とCPU112の詳細について説明する。障害情報提供サーバ101は、処理サーバ群141においてシステム障害が発生した場合に、そのシステム障害発生による提供サービスへの影響度を利用者へ通知する。記憶部111とCPU112がそれぞれ有する前述の各部は、このサービス影響度の通知に用いられる。
サービス影響度通知部121は、サービス影響度算出部122により算出されて障害発生・復旧管理部123から出力されたサービス影響度を取得する。取得したサービス影響度に基づいて、サービス影響度通知部121は、処理サーバ群141での障害発生によるサービスへの影響度を表すサービス影響度情報を生成し、通信部115に出力する。サービス影響度通知部121から通信部115に出力されたサービス影響度情報は、通信部115により、インターネット150を介して利用者端末151および車載端末152へ送信される。これにより、サービス影響度通知部121は、利用者へのサービス影響度の通知を行う。
車載端末152へサービス影響度を通知する場合には、サービス影響度通知部121は、車載端末管理部131に問い合わせて通知対象とする車載端末のグループを特定し、そのグループに対して算出されたサービス影響度を通知する。たとえば、通知対象とする車載端末152が「車載端末ID=A12345」の場合、この「A12345」の車載端末IDをキーにして車載端末管理部131を検索し、車載端末グループを特定する。具体的には、図2に示したようなデータ構造で車載端末管理部131に格納されている情報のうち、車載端末ID203の欄に「A12345」を含む情報を検索し、これに対応する車載端末グループ202の欄の内容から「グループ1」を特定する。そして、障害発生・復旧管理部123から受信したサービス影響度の中から、「車載端末グループ=グループ1」のサービス影響度を車載端末152へ通知する。このとき、「車載端末グループ=グループ1」のサービス影響度の全項目を通知しても良いし、その中の一部のみを通知するようにしても良い。車載端末152へサービス影響度を通知するときには、障害発生時刻などの情報も合わせて通知する。
サービス影響度通知部121から利用者端末151および車載端末152へサービス影響度を通知するタイミングは、任意のタイミングとすることができる。たとえば、利用者端末151または車載端末152から障害情報提供サーバ101へのアクセスがあると、このアクセスに応じてサービス影響度通知部121からサービス影響度の通知を行っても良い。また、処理サーバ群141での障害発生時に通知しても良いし、障害発生中に定期的に通知するようにしても良い。さらに、障害発生時と復旧時などの特定のタイミングのみで通知するようにしても良い。
サービス影響度算出部122は、障害発生・復旧管理部123からの要求に基づいて、処理サーバ群141の稼働状態に応じたサービス影響度を算出する。サービス影響度算出部122によるサービス影響度の算出結果は、障害発生・復旧管理部123を介してサービス影響度通知部121に出力される。なお、サービス影響度算出部122の処理内容については、後で図9のフローチャートを参照して詳細に説明する。
障害発生・復旧管理部123は、通信部115を介して、処理サーバ群141から送信されるシステム障害の発生状況および復旧状況に関する情報を受信する。この情報に基づいて、障害発生・復旧管理部123は、処理サーバ群141においてシステム障害が発生したか否かを判断する。システム障害が発生したと判断した場合、障害発生・復旧管理部123は、サービス影響度算出部122に対して、その障害によるサービス影響度の計算を要求する。そして、サービス影響度算出部122からサービス影響度の計算結果を取得し、サービス影響度通知部121へ出力する。このとき、当該障害に関する他の情報、たとえば障害の発生時刻などを合わせて通知してもよい。なお、障害発生・復旧管理部123の処理内容については、後で図10のフローチャートを参照して詳細に説明する。
ログ統計処理部124は、ログ管理部137に格納されている、処理サーバ群141の各サーバによるサービス提供状況に関するログ情報を、ログ管理部137から定期的に取得する。そして、取得したログ情報を統計処理し、その結果をログ統計値管理部136に格納する。
車載端末管理部131には、車載端末152をグループ単位で管理するためのデータが格納されている。車載端末管理部131に格納されているデータに基づいて、サービス影響度通知部121は、処理サーバ群141での障害発生時に、サービス影響度の通知対象とする車載端末152を特定し、通信部115を用いてその車載端末152にサービス影響度情報を送信することができる。
図2は、車載端末管理部131に格納されているデータのテーブル構成例を表している。車載端末管理部131は、たとえば図2に示すようなテーブル構成のデータを用いて、搭載車種、発売年、種類などに応じて複数の車載端末152をグループ分けして管理している。図2のデータテーブルは、メーカ名201、車載端末グループ202、車載端末ID203の各項目から構成される。
メーカ名201は、各車載端末グループに属する車載端末152が取り付けられている車両の製造販売メーカの名称を表している。車載端末グループ202は、各車載端末グループに対して割り当てられたグループ名を表している。車載端末ID203は、各車載端末グループに属する車載端末152を一意に識別するための識別子を表している。
図2のデータテーブルにおいて、一行目には、メーカ名201の欄に「メーカA」、車載端末グループ202の欄に「グループ1」、車載端末ID203の欄に「A12345」、「B56789」とそれぞれ記載されている。これは、A12345、B56789のID番号でそれぞれ特定される車載端末152は、グループ1という車載端末グループに属しており、これらの車載端末152が取り付けられた車両は,メーカAが製造、販売していることを表している。
また、二行目には、メーカ名201の欄に「メーカA」、車載端末グループ202の欄に「グループ2」、車載端末ID203の欄に「C98765」とそれぞれ記載されている。これは、C98765のID番号で特定される車載端末152は、グループ2という車載端末グループに属しており、この車載端末152が取り付けられた車両は,メーカAが製造、販売していることを表している。
通知情報管理部132には、処理サーバ群141から車載端末152への提供サービスおよび処理サーバ群141の障害発生時に障害情報提供サーバ101から通知するサービス影響度の項目に関する通知情報を管理するためのデータが格納されている。通知情報管理部132に格納されているデータに基づいて、サービス影響度通知部121は、処理サーバ群141での障害発生時に、利用者端末151および車載端末152へ通知するサービス影響度の項目を特定することができる。
図3は、通知情報管理部132に格納されているデータのテーブル構成例を表している。通知情報管理部132は、たとえば図3に示すようなテーブル構成のデータを用いて、処理サーバ群141からの提供サービスと、処理サーバ群141の障害発生時に通知するサービス影響度とを、車載端末グループごとに管理している。図3のデータテーブルは、車載端末グループ301、提供サービス302、サービス影響度303の各項目から構成される。
車載端末グループ301は、各車載端末グループに対して割り当てられたグループ名を表しており、図2に示した車載端末管理部131の車載端末グループ202と対応している。提供サービス302は、処理サーバ群141が各車載端末グループに提供しているサービスの種類を表している。サービス影響度303は、処理サーバ群141の障害発生時に障害情報提供サーバ101から利用者端末151および車載端末152に提供するサービス影響度の項目を表している。
図3のデータテーブルにおいて、一行目には、車載端末グループ301の欄に「グループ1」、提供サービス302の欄に「サービス1」、「サービス2」、サービス影響度303の欄に「サービス稼働率」、「レスポンス時間」、「接続端末数」とそれぞれ記載されている。これは、グループ1に属する車載端末152は、サービス1およびサービス2に該当するサービスが処理サーバ群141から提供されており、処理サーバ群141に障害が発生した際には、グループ1の車載端末152および対応する利用者端末151に対して、サービス稼働率、レスポンス時間、接続端末数の情報をサービス影響度として通知することを表している。ここで、グループ1の車載端末152に対応する利用者端末151は、メーカAの利用者端末151であり、これは図2に示した車載端末管理部131の格納データに基づいて特定することができる。
また、二行目には、車載端末グループ301の欄に「グループ2」、提供サービス302の欄に「サービス2」、サービス影響度303の欄に「障害復旧予定時刻」、「利用不可端末数」とそれぞれ記載されている。これは、グループ2に属する車載端末152は、サービス2というサービスが処理サーバ群141から提供されており、処理サーバ群141に障害が発生した際には、グループ2の車載端末152および対応する利用者端末151に対して、障害復旧予定時刻、利用不可端末数の情報をサービス影響度として通知することを表している。
サービス構成管理部133には、処理サーバ群141のサービス構成を管理するためのデータが格納されている。サービス構成管理部133に格納されているデータに基づいて、サービス影響度算出部122は、処理サーバ群141での障害発生時にサービス影響度の算出に用いるログ情報の取得対象とするサーバを特定することができる。
図4は、サービス構成管理部133に格納されているデータのテーブル構成例を表している。サービス構成管理部133は、たとえば図4に示すようなテーブル構成のデータを用いて、処理サーバ群141を構成する各サーバをサービスごとに管理している。図4のデータテーブルは、サービスID401、サーバ種類402、サーバID403の各項目から構成される。
サービスID401は、処理サーバ群141の各サーバによる提供サービスを一意に識別するための識別子を表しており、図3に示した通知情報管理部132の提供サービス302と対応している。サーバ種類402は、各サーバの役割を表している。サーバID403は、各サーバの役割を具体的に実施しているサーバを一意に識別するための識別子を表している。
図4のデータテーブルにおいて、一行目には、サービスID401の欄に「サービス1」、サーバ種類402の欄に「Webサーバ」、サーバID403の欄に「サーバ1」、「サーバ2」とそれぞれ記載されている。また、二行目には、サービスID401の欄に「サービス1」、サーバ種類402の欄に「APサーバ」、サーバID403の欄に「サーバ3」、「サーバ4」とそれぞれ記載されており、三行目には、サービスID401の欄に「サービス1」、サーバ種類402の欄に「DBサーバ」、サーバID403の欄に「サーバ5」、「サーバ6」とそれぞれ記載されている。これは、サービス1は、Webサーバであるサーバ1およびサーバ2と、AP(アプリケーション)サーバであるサーバ3およびサーバ4と、DB(データベース)サーバであるサーバ5およびサーバ6により提供されていることを表している。
算出ルール管理部134には、処理サーバ群141の障害発生時における現時点でのサービスへの影響度を算出するために用いられる算出ルールを管理するためのデータが格納されている。算出ルール管理部134に格納されているデータに基づいて、サービス影響度算出部122は、処理サーバ群141での障害発生時にサービス影響度を算出することができる。
図5は、算出ルール管理部134に格納されているデータのテーブル構成例を表している。算出ルール管理部134は、たとえば図5に示すようなテーブル構成のデータを用いて、ログ管理部137に格納されているログ情報から現時点でのサービス影響度を算出する方法を定義した算出ルールを管理している。図5のデータテーブルは、サービス影響度501、算出ルール502の各項目から構成される。
サービス影響度501は、障害発生時に障害情報提供サーバ101から利用者端末151および車載端末152に提供する情報を表しており、図3に示した通知情報管理部132のサービス影響度303と対応している。なお、サービス影響度501の各項目は、予測ルール管理部135の格納データにおけるサービス影響度(後述の図6に示すサービス影響度601)と重複しないことが好ましい。つまり、算出ルール管理部134と予測ルール管理部135の両方に同じ項目名のサービス影響度が定義されることがないようにする。このようにすれば、サービス影響度の各項目について、算出ルール管理部134で管理されている算出ルールを用いて計算するのか、それとも予測ルール管理部135で管理されている予測ルールを用いて計算するのかを判別できる。算出ルール502は、サービス影響度501の各項目について、その具体的な算出方法を表している。
図5のデータテーブルにおいて、一行目には、サービス影響度501の欄に「サービス稼働率」、算出ルール502の欄に「(全時間−システム停止時間)/全時間」とそれぞれ記載されている。これは、サービス影響度の一つであるサービス稼働率は、「全時間」から「システム停止時間」を引いた値を「全時間」で割ることによって算出できることを表している。なお、「全時間」は、処理サーバ群141においてサービスを提供している全サーバの稼働時間の合計を表しており、「システム停止時間」は、障害によるサーバの停止時間を表している。これらの情報は、ログ管理部137に格納されているログ情報から取得することができる。
また、二行目には、サービス影響度501の欄に「レスポンス時間」、算出ルール502の欄に「“Webサーバでの回答時刻−Webサーバでの要求受付時刻”の平均値」とそれぞれ記載されている。これは、サービス影響度の一つであるレスポンス時間は、処理サーバ群141におけるWebサーバでの要求受付時刻から回答時刻までの時間の平均値として算出できることを表している。なお、Webサーバの具体的なサーバIDは、図4に示したサービス構成管理部133の格納情報に基づいて特定することができる。ここで、ログ管理部137に格納されるログ情報には、各車載端末152からの要求受付とその要求に対する回答とを紐付けできる情報(例:トランザクションIDなど)が含まれているものとする。この情報に基づいて各要求の受付から回答までにかかった時間の平均値を求めることで、レスポンス時間を算出することができる。なお、ここでは要求受付時刻から回答時刻までの時間の平均値としているが、最大値や最小値としてもよい。
また、四行目には、サービス影響度501の欄に「アクセス数」、算出ルール502の欄に「Webサーバで受け付けたリクエスト数」とそれぞれ記載されている。これは、サービス影響度の一つであるアクセス数は、処理サーバ群141のWebサーバで受け付けたリクエスト数として算出できることを表している。リクエスト数は、ログ管理部137に格納されているログ情報から取得することができる。なお、処理サーバ群141においてWebサーバが複数台ある場合は、それぞれのリクエスト数の平均値や合算値をアクセス数として算出すればよい。また、同一の車載端末152からリトライがあった場合には、そのリトライも1回のリクエストと見なしてアクセス数を算出すればよい。あるいは、リトライは省いてアクセス数を算出してもよいし、一定時間以内のリトライのみを省くようにしてもよい。
以上説明したように、算出ルール管理部134には、サービス影響度の各項目について、その値を算出するための算出ルールが格納されている。なお、図5に示した算出ルールはあくまで一例であり、サービス影響度の項目ごとに様々な算出ルールを設定することができる。
予測ルール管理部135には、処理サーバ群141の障害発生時における将来時点でのサービスへの影響度を予測するために用いられる予測ルールを管理するためのデータが格納されている。予測ルール管理部135に格納されているデータに基づいて、サービス影響度算出部122は、処理サーバ群141での障害発生時にサービス影響度を算出することができる。
図6は、予測ルール管理部135に格納されているデータのテーブル構成例を表している。予測ルール管理部135は、たとえば図6に示すようなテーブル構成のデータを用いて、ログ管理部137に格納されているログ情報およびログ統計値管理部136に格納されているログ統計情報から将来時点でのサービス影響度を予測する方法を定義した予測ルールを管理している。図6のデータテーブルは、サービス影響度601、予測ルール602の各項目から構成される。
サービス影響度601は、障害発生時に障害情報提供サーバ101から利用者端末151および車載端末152に提供する情報を表しており、図3に示した通知情報管理部132のサービス影響度303と対応している。なお、前述のように、サービス影響度601の各項目は、図5に示した算出ルール管理部134の格納データにおけるサービス影響度501と重複しないことが好ましい。予測ルール602は、サービス影響度601の各項目について、その具体的な予測方法を表している。
図6のデータテーブルにおいて、一行目には、サービス影響度601の欄に「障害復旧予定時刻」と記載されており、これに対応する予測ルール602の欄には、現在時刻に「復旧に必要な時間」を加算することと、「復旧に必要な時間」の特定方法とが記載されている。これは、サービス影響度の一つである障害からの復旧予定時刻は、復旧に必要な時間を特定し、その値を現在時刻に加算することによって予測できることを表している。ここで、復旧に必要な時間は、ログ管理部137に格納されているログ情報を用いて、予測ルール602で定義された方法に従って求めることができる。具体的には、たとえばログ管理部137に格納されているログ情報のうちWebサーバの直近ログに“AA”という文字列が含まれていた場合には、復旧に必要な時間は5分と求められる。また、APサーバの直近ログに“BB”という文字列が含まれていた場合には、復旧に必要な時間は7分であり、APサーバの直近ログに“CC”という文字列が含まれていた場合には、復旧に必要な時間は8分であると求められる。なお、直近ログの範囲は、たとえば1分間など時間で指定してもよいし、10個などの数で指定してもよい。その結果、たとえば現在時刻が19時22分であり、復旧に必要な時間が5分と求められた場合には、障害復旧予定時刻は、19時22分+5分=19時27分と予測することができる。
また、二行目には、サービス影響度601の欄に「利用不可端末数」と記載されており、これに対応する予測ルール602の欄には、「障害発生時刻」、「障害復旧予定時刻」、「時間帯別の平均接続端末数」から予測することが記載されている。これは、サービス影響度の一つである利用不可端末数、すなわち障害によりサービスの利用を制限される利用者の数は、障害発生時刻、障害復旧予定時刻および時間帯別の平均接続端末数に基づいて予測できることを表している。ここで、障害復旧予定時刻は、前述のようにして求めることができる。また、障害発生時刻は、障害発生・復旧管理部123で取得することができ、時間帯別の平均接続端末数は、ログ統計値管理部136に格納されているログ情報の統計値から取得することができる。その結果、たとえば障害発生時刻が19時17分であり、障害復旧予定時刻が19時27分であり、時間帯別の平均接続端末数として、19時台の平均接続端末数が600(台/時間)であったとする。この場合、障害発生期間が19時17分から19時27分までの10分間であることから、利用不可端末数は、600(台/時間)×10(分)÷60(分)=100台と予測できる。
また、三行目には、サービス影響度601の欄に「接続エラー数」と記載されており、これに対応する予測ルール602の欄には、「障害発生時刻」、「障害復旧予定時刻」、「時間帯別の平均アクセス数」から予測することが記載されている。これは、サービス影響度の一つである接続エラー数、すなわち障害により処理サーバ群141への接続がエラーとなる利用者からのアクセス数は、障害発生時刻、障害復旧予定時刻および時間帯別の平均アクセス数に基づいて予測できることを表している。ここで、障害発生時刻および障害復旧予定時刻は、上記の利用不可端末数を予測する場合と同様にして取得することができる。また、時間帯別の平均アクセス数は、ログ統計値管理部136に格納されているログ情報の統計値から取得することができる。その結果、たとえば障害発生時刻が19時17分であり、障害復旧予定時刻が19時27分であり、時間帯別の平均アクセス数として、19時台の平均アクセス数が1200(アクセス/時間)であったとする。この場合、障害発生期間が19時17分から19時27分までの10分間であることから、接続エラー数は、1200(アクセス/時間)×10(分)÷60(分)=200アクセスと予測できる。
また、四行目には、サービス影響度601の欄に「レスポンス遅延率」と記載されており、これに対応する予測ルール602の欄には、「時間帯別の平均レスポンス時間」、「サーバ低減率」から予測することが記載されている。これは、サービス影響度の一つである障害による処理サーバ群141からのレスポンス遅延率は、時間帯別の平均レスポンス時間およびサーバ低減率に基づいて予測できることを表している。ここで、サーバ低減率は、予測ルール602の欄に記載されているように、サーバ稼働台数をサーバ冗長構成台数で割ることにより算出されるものである。このとき、サーバの種類ごとにサーバ低減率を算出し、その中での最低値を処理サーバ群141のサーバ低減率として採用してもよい。たとえば、処理サーバ群141がWebサーバ、APサーバ、DBサーバの三種類のサーバで構成されており、2台のサーバで冗長構成されたWebサーバのうち1台が障害によりダウンした場合には、Webサーバの低減率は0.5となる。同様に、APサーバやDBサーバについても低減率を求め、その中で最低値を選択することで、処理サーバ群141のサーバ低減率を求めることができる。また、時間帯別の平均レスポンス時間は、ログ統計値管理部136に格納されているログ情報の統計値から取得することができる。その結果、たとえば時間帯別の平均レスポンス時間が1.6秒であり、サーバ低減率が0.5であったとする。この場合、レスポンス遅延時間は、1.6(秒)÷0.5=3.2(秒)と予測できる。
以上説明したように、予測ルール管理部135には、サービス影響度の各項目について、その値を予測するための予測ルールが格納されている。なお、図6に示した予測ルールはあくまで一例であり、サービス影響度の項目ごとに様々な予測ルールを設定することができる。
ログ統計値管理部136には、ログ統計処理部124により作成された処理サーバ群141のログ情報の統計値に関するログ統計情報を管理するためのデータが格納されている。ログ統計値管理部136に格納されているデータに基づいて、サービス影響度算出部122は、処理サーバ群141での障害発生時にサービス影響度を算出することができる。
図7は、ログ統計値管理部136に格納されているデータのテーブル構成を表している。ログ統計値管理部136は、たとえば図7に示すようなテーブル構成のデータを用いて、ログ管理部137で管理されているログ情報の統計値を、処理サーバ群141の各サーバが提供するサービスごとに管理している。図7のデータテーブルは、項目701、サービスID702、統計値703から構成される。
項目701は、各統計値の内容を表している。サービスID702は、処理サーバ群141の各サーバによる提供サービスを一意に識別するための識別子を表しており、図3に示した通知情報管理部132の提供サービス302と、図4に示したサービス構成管理部133のサービスID401とに対応している。統計値703は、項目ごとの統計値を表している。
図7のデータテーブルにおいて、一行目には、項目701の欄に「時間帯別の平均接続端末数」、サービスID702の欄に「サービス1」とそれぞれ記載されており、これに対応する統計値703の欄には、時間帯ごとの数値が記載されている。これは、ログ情報の統計値の一つである時間帯別の平均接続端末数を表している。この統計値は、たとえば、ログ管理部137に格納されているWebサーバのログ情報において、車載端末152からの接続開始ログを特定し、これを時間帯毎に集計することで計算することができる。ここで、ログ管理部137に格納されているログ情報には、Webサーバに接続された車載端末152を特定するための車載端末IDや、車載端末152が利用したサービスを特定するためのサービスIDが含まれるものとする。なお、処理サーバ群141においてWebサーバが複数台ある場合には、各Webサーバの時間帯別の平均接続端末数を求め、その平均値を処理サーバ群141の時間帯別の平均接続端末数としてもよい。または、平均値ではなく最大値や最小値としてもよい。
その他の行に記載された「時間帯別の平均アクセス数」や「時間帯別の平均レスポンス時間」についても、上記と同様の方法により計算することができる。なお、レスポンス時間の具体的な計算方法は、図5で説明したのと同様である。
ログ管理部137には、処理サーバ群141のログ情報を管理するためのデータが格納されている。ログ管理部137に格納されているデータに基づいて、サービス影響度算出部122は、処理サーバ群141での障害発生時にサービス影響度を算出することができる。
ログ管理部137は、通信部115を介して、処理サーバ群141からログ情報を収集する。このとき、処理サーバ群141から障害情報提供サーバ101へログ情報を通知するようにしてもよいし、障害情報提供サーバ101から処理サーバ141に対してログ情報を要求することでログ情報を取得するようにしても良い。また、ログ情報をリアルタイムに収集してもよいし、一定周期で収集するようにしてもよい。
図8は、ログ管理部137に格納されているデータのテーブル構成を表している。ログ管理部137は、たとえば図8に示すようなテーブル構成のデータを用いて、処理サーバ群141の各サーバによるサービス提供状況の履歴に関するログ情報を管理している。図8のデータテーブルは、サーバID801、時刻802、ログ803から構成される。
サーバID801は、各ログが発生したサーバを一意に特定するための識別子を表している。時刻802は、各ログが発生した時刻を表しており、ログ803は、処理サーバ群141の各サーバから出力された具体的なログ情報の内容を表している。
図8のデータテーブルに示すように、ログ803に記録されるログ情報は、提供サービスを特定するためのサービスID、サービスを提供した車載端末152を特定するための車載端末ID、トランザクションを特定するためのトランザクションIDなどの情報を含む。ログ情報としてトランザクションIDを記録することで、図5で説明したように、各車載端末152からの要求受付とその要求に対する回答とを紐付けることが可能となる。
記憶部111の各管理部には、以上説明したようなデータが記録されている。
処理サーバ群141においていずれかのサーバにシステム障害が発生すると、サービス影響度通知部121は、当該サーバが提供するサービスへの影響度を通知するためのサービス影響度情報を、通信部115を介して利用者端末151および車載端末152へ送信する。このとき、サービス影響度通知部121は、サービス影響度に関する情報を障害発生・復旧管理部123から受信する。サービス影響度に関する情報は、図3に示した通知情報管理部132に格納されているデータと同様のデータ構造を有する。すなわち、対象とする車載端末152のグループを示す「車載端末グループ」と、障害の影響を受ける提供サービスの内容を示す「サービスID」と、障害による提供サービスへの影響度を示す「サービス影響度」との組合せで構成される。たとえば、「車載端末グループ=グループ1」、「サービスID=サービス1」、「サービス影響度=障害復旧予定時刻19時27分」というサービス影響度情報が送信されたとする。このサービス影響度情報は、グループ1に属している各車載端末152に提供しているサービス1の障害復旧予定時刻が19時27分であることを意味している。なお、サービス影響度通知部121では、障害発生・復旧管理部123から受信した情報を最新の値のみ管理してもよいし、受信した情報の履歴を管理してもよい。履歴を管理する場合、特定のサービス影響度の項目のみを履歴管理の対象としてもよい。
サービス影響度通知部121は、障害発生・復旧管理部123から受信する情報に基づいて車載端末152のグループを特定し、そのグループに対応する利用者端末151や各車載端末152に対してサービス影響度を通知する。このとき、利用者端末151へサービス影響度を通知する場合は、図2のようなデータ構造で車載端末管理部131に格納されている情報に基づいて、特定された車載端末152のグループがどのメーカのものであるかを特定し、そのメーカの利用者端末151を通知対象とすることが好ましい。たとえば、利用者端末151を利用しているのが「メーカA」の管理者の場合、「メーカA」をキーにして、図2のメーカ名201の記載が「メーカA」である行を抽出し、その行における車載端末グループ202の記載内容から、「グループ1」、「グループ2」を特定する。そして、障害発生・復旧管理部123から受信したサービス影響度の情報において、「車載端末グループ=グループ1」または「車載端末グループ=グループ2」のサービス影響度に関する情報を抽出し、利用者端末151へ通知する。このとき、障害発生時刻や、車載端末グループに属する車載端末の一覧などの情報も合わせて通知することが好ましい。
図9は、障害情報提供サーバ101のサービス影響度算出部122が実行する処理のフローチャートを示す図である。
最初にステップ901において、サービス影響度算出部122は、障害の影響があるサービスを特定する。ここでは、サービス影響度算出部122は、障害発生・復旧管理部123から、障害発生時刻や障害発生サーバに関する情報を受信する。そして、受信した情報が表す障害発生サーバをキーとしてサービス構成管理部133を検索し、障害の影響を受けるサービスのサービスIDを特定する。具体的には、図4に示したようなデータ構造でサービス構成管理部133に格納されている情報の中で、サーバID403の欄に障害発生サーバのID番号が含まれる行を検索し、その行のサービスID401の欄に記録されている内容からサービスIDを特定する。なお、サーバは複数サービスで利用されている場合があるため、サーバIDが一つでも、サービスIDは複数検索される場合がある。
次にステップ902において、サービス影響度算出部122は、通知するサービス影響度の項目を特定する。ここでは、サービス影響度算出部122は、ステップ901で特定したサービスIDをキーとして通知情報管理部132を検索し、サービス影響度の項目を決定する。具体的には、図3に示したようなデータ構造で通知情報管理部132に格納されている情報の中で、提供サービス302の欄にステップ901で特定したサービスIDが含まれる行を検索し、その行のサービス影響度303の欄に記録されている内容からサービス影響度の項目を特定する。このとき、同じ行の車載端末グループ301の欄の記載内容から、通知する車載端末のグループも特定する。
次にステップ903において、サービス影響度算出部122は、ステップ902で特定したサービス影響度の項目が、算出ルール管理部134で管理されている算出ルールに基づいて計算可能であるか否かを判定する。ここでは、サービス影響度算出部122は、ステップ901で特定したサービスIDと、ステップ902で特定した車載端末のグループおよびサービス影響度の項目との組み合わせの中から一つを選択する。そして、選択した組み合わせのサービス影響度の項目をキーとして算出ルール管理部134を検索し、対応するサービス影響度の有無を検索する。具体的には、図5に示したようなデータ構造で算出ルール管理部134に格納されている情報のうち、サービス影響度501の欄に記録されている内容の中で、選択した組み合わせのサービス影響度の項目を検索する。その結果、サービス影響度501の中に当該サービス影響度の項目が存在する場合(Yes)は、算出ルールに基づいて計算可能であると判定してステップ904に進み、存在しない場合(No)は、算出ルールに基づいて計算可能でないと判定してステップ905に進む。たとえば、検索するサービス影響度の項目が「サービス稼働率」である場合、これは図5のテーブルにおいて、サービス影響度501の一行目に存在する。したがって、この場合は算出ルールに基づいて計算可能であると判定し、ステップ904に進む。一方、たとえば検索するサービス影響度の項目が「障害復旧予定時刻」である場合、これは図5のテーブルにおいて存在しない。したがって、この場合は算出ルールに基づいて計算可能でないと判定し、ステップ905に進む。
ステップ903からステップ904に進んだ場合、ステップ904において、サービス影響度算出部122は、ログ情報および算出ルールに基づいてサービス影響度を計算する。ここでは、サービス影響度算出部122は、ステップ903で検索されたサービス影響度の項目に対応する算出ルール502の内容に基づいて、当該サービス影響度の項目を算出するための算出ルールを取得する。次に、ログ管理部137に格納されている障害発生時刻以降のログ情報の中で、取得した算出ルールにおいて必要なログ情報を収集する。そして、収集したログ情報を用いて、算出ルールに従って計算を行うことにより、サービス影響度の値を計算する。
たとえば「障害発生時刻=19時22分」、「サービスID=サービス1」、「サービス影響度=レスポンス時間」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部122は、最初に、図5に示した算出ルール管理部134の格納情報テーブルの二行目を参照することで、レスポンス時間の算出ルールを「“Webサーバでの回答時刻−Webサーバでの要求受付時刻”の平均値」と特定する。次に、サービス1におけるWebサーバをサービス構成管理部133に問い合せることで、図4に示したサービス構成管理部133の格納情報テーブルの中から、「Webサーバ=サーバ1、サーバ2」の情報を取得する。次に、図8に示したログ管理部137の格納情報テーブルから、サーバID801が「サーバ1」または「サーバ2」で、時刻802が「19時22分以降」のログ情報803を取得する。そして、取得したログ情報を用いた算出ルールに基づいて、「“Webサーバでの回答時刻−Webサーバでの要求受付時刻”の平均値」を計算する。
ステップ903からステップ905に進んだ場合、ステップ905において、サービス影響度算出部122は、ログ情報、ログ統計情報および予測ルールに基づいてサービス影響度を計算する。ここでは、サービス影響度算出部122は、ステップ902で特定したサービス影響度の項目をキーとして予測ルール管理部135を検索し、当該サービス影響度の項目を算出するための予測ルールを取得する。次に、ログ管理部137、ログ統計値管理部136にそれぞれ格納されている障害発生時刻以降のログ情報およびログ統計情報の中で、取得した予測ルールにおいて必要なログ情報およびログ統計情報を収集する。そして、収集したログ情報およびログ統計情報を用いて、予測ルールに従って計算を行うことにより、サービス影響度の値を計算する。
たとえば「現在時刻=19時35分」、「障害発生時刻=19時22分」、「サービスID=サービス1」、「サービス影響度=障害復旧予定時刻」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部122は、最初に、図6に示した予測ルール管理部135の格納情報テーブルの一行目を参照することで、障害復旧予定時刻の予測ルールを特定する。次に、特定した予測ルールのサービス1におけるWebサーバ、APサーバをサービス構成管理部133に問い合せることで、図4に示したサービス構成管理部133の格納情報テーブルの中から、「Webサーバ=サーバ1、サーバ2」、「APサーバ=サーバ3、サーバ4」の情報を取得する。次に、図8に示したログ管理部137の格納情報テーブルから、サーバID801が「サーバ1」、「サーバ2」、「サーバ3」または「サーバ4」で、時刻802が「19時32分以降」のログ情報803を取得する。ここでは、直近ログの範囲を3分間として、現在時刻から3分前の19時32分以降のログ情報を取得することとした。そして、取得したログ情報を用いた予測ルールに基づいて、障害復旧予定時刻を計算する。たとえば、復旧に必要な時間が5分である場合、現在時刻の19時35分に、復旧に必要な時間の5分を加えることで、障害復旧予定時刻が19時40分と予測される。
また、たとえば「障害発生時刻=19時22分」、「障害復旧予定時刻=19時40分」、「サービスID=サービス1」、「サービス影響度=利用不可端末数」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部122は、最初に、図6に示した予測ルール管理部135の格納情報テーブルの二行目を参照することで、利用不可端末数の予測ルールを特定する。次に、図7に示したログ統計値管理部136の格納情報テーブルから、項目701が「時間帯別の平均接続端末数」、サービスID702が「サービス1」に対応する統計値703を取得する。そして、取得したログ統計情報を用いた予測ルールに基づいて、利用不可端末数を計算する。たとえば、19時台の平均接続端末数が100(台/時間)、障害発生時間が18分(19時22分〜40分)の場合、利用不可端末数=100(台/時間)×18(分)÷60(分)=30台と予測される。
次にステップ906において、サービス影響度算出部122は、ステップ901で特定したサービスIDと、ステップ902で特定したサービス影響度の項目とに関して、全ての組み合わせに対するサービス影響度を計算したか否かを確認する。全ての組み合わせに対するサービス影響度を計算済みの場合(Yes)は、ステップ907に進み、まだ計算していないサービス影響度がある場合(No)は、ステップ903に戻る。
次にステップ907において、サービス影響度算出部122は、ステップ902で特定した全ての車載端末のグループに関して、全てのグループのサービス影響度を計算したか否かを確認する。全てのグループのサービス影響度を計算済みの場合(Yes)は、図9の処理を終了し、まだ計算していないサービス影響度がある場合(No)は、ステップ903に戻る。
以上説明したような処理により、サービス影響度算出部122は、処理サーバ群141から提供されるサービスのうち障害の影響があるサービスについて、算出すべきサービス影響度の項目を決定することができる。そして、算出ルール管理部134で管理されている算出ルールまたは予測ルール管理部135で管理されている予測ルールに基づいて、障害発生により処理サーバ群141から提供されるサービスに影響を受ける車載端末のグループごとに、サービス影響度を算出することができる。
図10は、障害情報提供サーバ101の障害発生・復旧管理部123が実行する処理のフローを示す図である。
最初にステップ1001において、障害発生・復旧管理部123は、処理サーバ群141から障害発生の通知を受信する。ここでは、障害発生通知として、障害ID、障害発生時刻、障害発生サーバなどの情報を処理サーバ群141から受け取る。ここで、障害IDは発生した障害を一意に特定するための識別子である。処理サーバ群141のリソースを外部サーバで監視して自動的にアラームを障害情報提供サーバ101に通知するようにしても良いし、人手で監視してアラームを通知するようにしても良い。
次にステップ1002では、障害発生・復旧管理部123は、サービス影響度算出部122を用いて、障害発生によるサービス影響度の算出を行う。ここでは、障害発生・復旧管理部123は、サービス影響度算出部122に対して、ステップ1001で受けた障害発生通知における障害発生時刻や障害発生サーバを引数として、サービス影響度の算出を要求する。この要求に応じて、サービス影響度算出部122は、図9のフローチャートで説明した処理を実行した後、障害発生・復旧管理部123へサービス影響度の算出結果を回答する。サービス影響度算出部122から障害発生・復旧管理部123へ送られるサービス影響度の算出結果は、車載端末グループ、サービスID、サービス影響度などの情報から構成される。たとえば、サービス影響度の算出結果として、「車載端末グループ=グループ1」、「サービスID=サービス1」、「障害復旧予定時刻=19時27分」の情報が送られる。これは、処理サーバ群141がグループ1の各車載端末152に提供しているサービス1において障害が発生しており、その障害復旧予定時刻が19時27分であることを表している。
次にステップ1003では、障害発生・復旧管理部123は、ステップ1002で取得したサービス影響度の算出結果をサービス影響度通知部121へ送る。
次にステップ1004では、障害発生・復旧管理部123は、ステップ1001で受信した障害が復旧したか否かを判定する。障害が復旧した場合(Yes)は、図10の処理を終了し、障害が復旧していない場合(No)は、ステップ1002に戻る。この判断は、たとえばステップ1001と同様に、復旧したサービスの障害IDや障害復旧時刻の通知を処理サーバ群141から受信することで行うことができる。
なお、上記の説明では、ステップ1001の処理により、処理サーバ群141での障害発生をトリガとしてサービス影響度を算出するようにしたが、利用者端末151または車載端末152からの要求をトリガとしてサービス影響度を算出するようにしても良い。
また、障害発生・復旧管理部123は、ステップ1001で処理サーバ群141から障害発生の通知を受信すると、ステップ1002〜1004の処理を定期的に行うことが好ましい。このようにすれば、処理サーバ群141で障害が発生してから復旧するまでの間に、サービス影響度算出部122により、サービス影響度の最新値を所定の周期ごとに再計算することができる。そして、サービス影響度通知部121により、サービス影響度算出部122で求められた所定周期ごとのサービス影響度の最新値をサービス利用者へ通知することができる。しかし、このようにはせず、サービス影響度を一定の回数のみ算出するようにしてもよいし、利用者端末151または車載端末152からの停止要求でサービス影響度の算出を停止してもよい。
次に、処理サーバ群141での障害発生によるサービス影響度の通知を障害情報提供サーバ101から受けたときに、利用者端末151および車載端末152においてそれぞれ表示される通知画面の例を説明する。
図11は、利用者端末151において表示される通知画面例を示している。図11に示す画面には、メーカ名1101、障害発生時刻1102、および、メーカAに属する各車載端末グループのサービス影響度の情報が表示されている。この車載端末グループ毎のサービス影響度の情報には、車載端末グループ1103、車載端末一覧ボタン1104、サービス毎のサービス影響度1105、履歴ボタン1106が含まれる。
図11の画面において、利用者端末151の管理者が利用者端末151を操作して車載端末一覧ボタン1104を押下すると、その車載端末一覧ボタン1104に対応する車載端末グループ1103が示す車載端末152のグループ(ここではグループ1)に属する車載端末152の一覧がポップアップ画面で表示される。また、履歴ボタン1106を押下すると、その履歴ボタン1106に対応するサービス影響度の履歴情報がグラフで表示される。たとえば、サービス稼働率の右側にある履歴ボタン1106を押下した場合には、サービス稼働率の履歴グラフがポップアップで表示される。
なお、図11の画面において、障害の影響がないサービスに関しては「正常稼働」という情報が表示される。これにより、利用者端末151を操作するメーカの管理者は、自社で販売している車両に対するサービス提供状態や、障害によるサービス影響度を把握することができる。
図12は、車載端末152において表示される通知画面例を示している。図12に示す画面には、障害発生時刻1201、および、サービス毎のサービス影響度1202が表示されている。
図12の画面においても図11と同様に、障害の影響がないサービスに関しては「正常稼働」という情報が表示される。これにより、車載端末152を操作するエンドユーザは、自分が利用しているサービスの稼働状態を知ることができる。
以上説明した本発明の実施形態によれば、以下の作用効果を奏する。
(1)障害情報提供サーバ101は、複数のサーバで構成される処理サーバ群141と接続され、処理サーバ群141において発生した障害に関する情報を、処理サーバ群141によるサービスの利用者に対して提供する。障害情報提供サーバ101は、処理サーバ群141の障害発生状況を管理する障害発生・復旧管理部123と、処理サーバ群141の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部137と、障害によるサービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部としての算出ルール管理部134および予測ルール管理部135と、ログ管理部137で管理されているログ情報およびルール管理部で管理されているルールに基づいて、サービス影響度を算出するサービス影響度算出部122と、サービス影響度算出部122により算出されたサービス影響度を利用者へ通知するサービス影響度通知部121と、を備える。このようにしたので、サービス利用者は、システム障害の発生時に、提供されるサービスへの影響度を知ることができる。
(2)上記のルール管理部は、障害によるサービスへの現時点での影響度を算出するための算出ルールを管理する算出ルール管理部134を含む。サービス影響度算出部122は、ログ管理部137で管理されているログ情報および算出ルール管理部134で管理されている算出ルールに基づいて、サービス影響度を算出する。このようにしたので、障害によるサービスへの現時点での影響度を確実に算出することができる。
(3)また、障害情報提供サーバ101は、ログ情報の統計値に関するログ統計情報を管理するログ統計値管理部136をさらに備え、上記のルール管理部は、障害によるサービスへの将来時点での影響度を予測するための予測ルールを管理する予測ルール管理部135を含む。サービス影響度算出部122は、ログ管理部137で管理されているログ情報、ログ統計値管理部136で管理されているログ統計情報、および予測ルール管理部135で管理されている予測ルールに基づいて、サービス影響度を算出する。このようにしたので、障害によるサービスへの将来時点での影響度を確実に算出することができる。
(4)予測ルール管理部135は、たとえば、障害からの復旧予定時刻を予測するための予測ルールと、障害によりサービスの利用を制限される利用者の数を予測するための予測ルールと、障害により処理サーバ群141への接続がエラーとなる利用者からのアクセス数を予測するための予測ルールと、障害による処理サーバ群141からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する。このようにしたので、様々なサービス影響度の項目に関する予測ルールを適切に管理し、サービス影響度の算出に用いることができる。
(5)障害情報提供サーバ101は、利用者により所持されてサービスの提供をそれぞれ受ける複数の車載端末152をグループ単位で管理する車載端末管理部131をさらに備える。サービス影響度算出部122は、車載端末管理部131で管理されている車載端末152のグループごとにサービス影響度を算出する。このようにしたので、サービスの提供を受ける車載端末152の数に関わらず、グループ単位でまとめてサービス影響度を算出することができる。
(6)また、障害情報提供サーバ101は、車載端末152のグループごとに設定されたサービス影響度の通知項目に関する通知情報を管理する通知情報管理部132をさらに備える。サービス影響度通知部121は、通知情報管理部132で管理されている通知情報に基づいて、車載端末152のグループごとに異なるサービス影響度を利用者へ通知する。このようにしたので、処理サーバ群141から提供されるサービスが異なる様々な車載端末152のグループについて、それぞれに最適なサービス影響度を通知することができる。
(7)障害発生・復旧管理部123において、図10のステップ1002〜1004の処理を定期的に行うことで、サービス影響度算出部122は、サービス影響度の最新値を所定の周期ごとに再計算し、サービス影響度通知部121は、サービス影響度算出部122により求められた所定の周期ごとのサービス影響度の最新値を利用者へ通知することが好ましい。このようにすれば、処理サーバ群141で障害が発生してから復旧するまでの間に状況が変化した場合にも、サービス影響度を正確に通知することができる。
(8)サービス影響度通知部121は、図11、図12に例示したような画面を利用者端末151、車載端末152にそれぞれ表示するための情報を送信することにより、サービス影響度を利用者へ通知する。これらの画面は、障害の発生時刻を表す障害発生時刻1102、1201と、利用者の属性に応じたサービスごとのサービス影響度を表すサービス影響度1105、1202とを少なくとも含む。このようにしたので、利用者にとって分かりやすい形態でサービス影響度の通知を行うことができる。
なお、以上説明した実施形態や各種の変化例はあくまで一例であり、発明の特徴が損なわれない限り、本発明はこれらの内容に限定されない。本発明は、上述した実施形態や変形例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の変更が可能である。
101:障害情報提供サーバ、111:記憶部、112:CPU、113:入力部、114:出力部、115:通信部、121:サービス影響度通知部、122:サービス影響度算出部、123:障害発生・復旧管理部、124:ログ統計処理部、131:車載端末管理部、132:通知情報管理部、133:サービス構成管理部、134:算出ルール管理部、135:予測ルール管理部、136:ログ統計値管理部、137:ログ管理部、141:処理サーバ群、150:インターネット、151:利用者端末、152:車載端末

Claims (16)

  1. 複数のサーバで構成される処理サーバ群と接続され、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供する障害情報提供サーバであって、
    前記処理サーバ群の障害発生状況を管理する障害発生・復旧管理部と、
    前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部と、
    前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部と、
    前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出するサービス影響度算出部と、
    前記サービス影響度算出部により算出されたサービス影響度を前記利用者へ通知するサービス影響度通知部と、を備える障害情報提供サーバ。
  2. 請求項1に記載の障害情報提供サーバにおいて、
    前記ルール管理部は、前記障害による前記サービスへの現時点での影響度を算出するための算出ルールを管理する算出ルール管理部を含み、
    前記サービス影響度算出部は、前記ログ情報および前記算出ルールに基づいて、前記サービス影響度を算出する障害情報提供サーバ。
  3. 請求項1または2に記載の障害情報提供サーバにおいて、
    前記ログ情報の統計値に関するログ統計情報を管理するログ統計値管理部をさらに備え、
    前記ルール管理部は、前記障害による前記サービスへの将来時点での影響度を予測するための予測ルールを管理する予測ルール管理部を含み、
    前記サービス影響度算出部は、前記ログ情報、前記ログ統計情報および前記予測ルールに基づいて、前記サービス影響度を算出する障害情報提供サーバ。
  4. 請求項3に記載の障害情報提供サーバにおいて、
    前記予測ルール管理部は、前記障害からの復旧予定時刻を予測するための予測ルールと、前記障害により前記サービスの利用を制限される前記利用者の数を予測するための予測ルールと、前記障害により前記処理サーバ群への接続がエラーとなる前記利用者からのアクセス数を予測するための予測ルールと、前記障害による前記処理サーバ群からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する障害情報提供サーバ。
  5. 請求項1乃至4のいずれか一項に記載の障害情報提供サーバにおいて、
    前記利用者により所持されて前記サービスの提供をそれぞれ受ける複数の車載端末をグループ単位で管理する車載端末管理部をさらに備え、
    前記サービス影響度算出部は、前記車載端末のグループごとに前記サービス影響度を算出する障害情報提供サーバ。
  6. 請求項5に記載の障害情報提供サーバにおいて、
    前記車載端末のグループごとに設定された前記サービス影響度の通知項目に関する通知情報を管理する通知情報管理部をさらに備え、
    前記サービス影響度通知部は、前記通知情報に基づいて、前記車載端末のグループごとに異なる前記サービス影響度を前記利用者へ通知する障害情報提供サーバ。
  7. 請求項1乃至6のいずれか一項に記載の障害情報提供サーバにおいて、
    前記サービス影響度算出部は、前記サービス影響度の最新値を所定の周期ごとに再計算し、
    前記サービス影響度通知部は、前記サービス影響度算出部により求められた前記所定の周期ごとのサービス影響度の最新値を前記利用者へ通知する障害情報提供サーバ。
  8. 請求項1乃至7のいずれか一項に記載の障害情報提供サーバにおいて、
    前記サービス影響度通知部は、前記障害の発生時刻と、前記利用者の属性に応じた前記サービスごとの前記サービス影響度と、を少なくとも含む画面を表示するための情報を送信することにより、前記サービス影響度を前記利用者へ通知する障害情報提供サーバ。
  9. 複数のサーバで構成される処理サーバ群と接続された障害情報提供サーバを用いて、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供する障害情報提供方法であって、
    前記障害情報提供サーバにより、
    前記処理サーバ群の障害発生状況を管理し、
    前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理し、
    前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理し、
    前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出し、
    前記算出したサービス影響度を前記利用者へ通知する、障害情報提供方法。
  10. 請求項9に記載の障害情報提供方法において、
    前記ルールの管理では、前記障害による前記サービスへの現時点での影響度を算出するための算出ルールを管理し、
    前記サービス影響度の算出では、前記ログ情報および前記算出ルールに基づいて、前記サービス影響度を算出する障害情報提供方法。
  11. 請求項9または10に記載の障害情報提供方法において、
    さらに前記障害情報提供サーバにより、前記ログ情報の統計値に関するログ統計情報を管理し、
    前記ルールの管理では、前記障害による前記サービスへの将来時点での影響度を予測するための予測ルールを管理し、
    前記サービス影響度の算出では、前記ログ情報、前記ログ統計情報および前記予測ルールに基づいて、前記サービス影響度を算出する障害情報提供方法。
  12. 請求項11に記載の障害情報提供方法において、
    前記予測ルールの管理では、前記障害からの復旧予定時刻を予測するための予測ルールと、前記障害により前記サービスの利用を制限される前記利用者の数を予測するための予測ルールと、前記障害により前記処理サーバ群への接続がエラーとなる前記利用者からのアクセス数を予測するための予測ルールと、前記障害による前記処理サーバ群からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する障害情報提供方法。
  13. 請求項9乃至12のいずれか一項に記載の障害情報提供方法において、
    さらに前記障害情報提供サーバにより、前記利用者により所持されて前記サービスの提供をそれぞれ受ける複数の車載端末をグループ単位で管理し、
    前記サービス影響度の算出では、前記車載端末のグループごとに前記サービス影響度を算出する障害情報提供方法。
  14. 請求項13に記載の障害情報提供方法において、
    さらに前記障害情報提供サーバにより、前記車載端末のグループごとに設定された前記サービス影響度の通知項目に関する通知情報を管理し、
    前記サービス影響度の通知では、前記通知情報に基づいて、前記車載端末のグループごとに異なる前記サービス影響度を前記利用者へ通知する障害情報提供方法。
  15. 請求項9乃至14のいずれか一項に記載の障害情報提供方法において、
    前記サービス影響度の算出では、前記サービス影響度の最新値を所定の周期ごとに再計算し、
    前記サービス影響度の通知では、求められた前記所定の周期ごとのサービス影響度の最新値を前記利用者へ通知する障害情報提供方法。
  16. 請求項9乃至15のいずれか一項に記載の障害情報提供方法において、
    前記サービス影響度の通知では、前記障害の発生時刻と、前記利用者の属性に応じた前記サービスごとの前記サービス影響度と、を少なくとも含む画面を表示するための情報を送信することにより、前記サービス影響度を前記利用者へ通知する障害情報提供方法。
JP2014262091A 2014-12-25 2014-12-25 障害情報提供サーバ、障害情報提供方法 Active JP6306499B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2014262091A JP6306499B2 (ja) 2014-12-25 2014-12-25 障害情報提供サーバ、障害情報提供方法
CN201580055503.1A CN107003926B (zh) 2014-12-25 2015-11-25 故障信息提供服务器、故障信息提供方法
PCT/JP2015/083077 WO2016104025A1 (ja) 2014-12-25 2015-11-25 障害情報提供サーバ、障害情報提供方法
EP15872594.5A EP3239840B1 (en) 2014-12-25 2015-11-25 Fault information provision server and fault information provision method
US15/531,743 US10437695B2 (en) 2014-12-25 2015-11-25 Fault information providing server and fault information providing method for users of in-vehicle terminals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014262091A JP6306499B2 (ja) 2014-12-25 2014-12-25 障害情報提供サーバ、障害情報提供方法

Publications (2)

Publication Number Publication Date
JP2016122337A true JP2016122337A (ja) 2016-07-07
JP6306499B2 JP6306499B2 (ja) 2018-04-04

Family

ID=56150057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014262091A Active JP6306499B2 (ja) 2014-12-25 2014-12-25 障害情報提供サーバ、障害情報提供方法

Country Status (5)

Country Link
US (1) US10437695B2 (ja)
EP (1) EP3239840B1 (ja)
JP (1) JP6306499B2 (ja)
CN (1) CN107003926B (ja)
WO (1) WO2016104025A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020162215A1 (ja) * 2019-02-07 2020-08-13 日本電信電話株式会社 障害情報周知装置及び障害情報周知方法
JP2020129395A (ja) * 2016-08-25 2020-08-27 クラリオン株式会社 ログ解析方法及びログ優先度テーブル管理方法
JP2021010105A (ja) * 2019-07-01 2021-01-28 日本電信電話株式会社 故障影響推定装置、故障影響推定方法、及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10367682B2 (en) * 2017-06-30 2019-07-30 Bank Of American Corporation Node failure recovery tool
US10565021B2 (en) * 2017-11-30 2020-02-18 Microsoft Technology Licensing, Llc Automated capacity management in distributed computing systems
CN108959051A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 服务器系统日志收集方法
CN109639490B (zh) * 2018-12-18 2020-09-18 网宿科技股份有限公司 一种宕机通知方法及装置
JP7134903B2 (ja) * 2019-03-05 2022-09-12 株式会社日立製作所 不具合再現支援システム、不具合再現支援方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002033731A (ja) * 2000-07-17 2002-01-31 Nec Corp 携帯端末を利用した保守情報通知方法及びシステム並びに記録媒体
JP2003259006A (ja) * 2002-02-28 2003-09-12 Ntt Docomo Inc サービス管理装置及びサービス管理装置における異常情報出力方法
JP2009151456A (ja) * 2007-12-19 2009-07-09 Nec Corp 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP5370624B2 (ja) * 2011-09-08 2013-12-18 日本電気株式会社 クラウドサービス復旧時間予測システム、方法およびプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3642004B2 (ja) 2000-05-22 2005-04-27 日本電気株式会社 中継装置、移動体無線通信システム、その障害通知方法、及びその障害通知プログラムを記録した記録媒体
JP2002108728A (ja) * 2000-10-02 2002-04-12 Ntt Docomo Inc 障害情報の掲載方法およびプロバイダ設備
US20040163007A1 (en) * 2003-02-19 2004-08-19 Kazem Mirkhani Determining a quantity of lost units resulting from a downtime of a software application or other computer-implemented system
JP4485763B2 (ja) * 2003-07-10 2010-06-23 株式会社日立製作所 運用管理方法及び装置
US20060072707A1 (en) * 2004-09-30 2006-04-06 International Business Machines Corporation Method and apparatus for determining impact of faults on network service
US7739244B2 (en) * 2004-10-14 2010-06-15 Oracle International Corporation Operating logging for online recovery in shared memory information systems
US20060112317A1 (en) * 2004-11-05 2006-05-25 Claudio Bartolini Method and system for managing information technology systems
US8181071B2 (en) * 2007-06-29 2012-05-15 Microsoft Corporation Automatically managing system downtime in a computer network
US7793141B1 (en) * 2008-05-15 2010-09-07 Bank Of America Corporation eCommerce outage customer notification
US20100157964A1 (en) * 2008-12-18 2010-06-24 Pantech & Curitel Communications, Inc. Server to guide reconnection in mobile internet, method for guiding server reconnection, and server reconnection method
CN102143008A (zh) * 2010-01-29 2011-08-03 国际商业机器公司 用于数据中心的诊断故障事件的方法及装置
US8887006B2 (en) * 2011-04-04 2014-11-11 Microsoft Corporation Proactive failure handling in database services
US9152487B2 (en) * 2011-09-30 2015-10-06 Microsoft Technology Licensing, Llc Service outage details in an error message
US8837302B2 (en) * 2012-04-27 2014-09-16 Motorola Mobility Llc Mapping a network fault
US20160013990A1 (en) * 2014-07-09 2016-01-14 Cisco Technology, Inc. Network traffic management using heat maps with actual and planned /estimated metrics
US20160072688A1 (en) * 2014-09-08 2016-03-10 Mayank DESAI Fault monitoring in multi-domain networks
US9639411B2 (en) * 2015-07-24 2017-05-02 Bank Of America Corporation Impact notification system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002033731A (ja) * 2000-07-17 2002-01-31 Nec Corp 携帯端末を利用した保守情報通知方法及びシステム並びに記録媒体
JP2003259006A (ja) * 2002-02-28 2003-09-12 Ntt Docomo Inc サービス管理装置及びサービス管理装置における異常情報出力方法
JP2009151456A (ja) * 2007-12-19 2009-07-09 Nec Corp 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP5370624B2 (ja) * 2011-09-08 2013-12-18 日本電気株式会社 クラウドサービス復旧時間予測システム、方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高橋利光、木山 昇、祖父江恒夫、柏山正守: "テレマティクスサービス向けクラウド基盤の検討", 電子情報通信学会2014年総合大会講演論文集, JPN6016005581, 4 March 2014 (2014-03-04), JP, pages 230 - 17, ISSN: 0003708304 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020129395A (ja) * 2016-08-25 2020-08-27 クラリオン株式会社 ログ解析方法及びログ優先度テーブル管理方法
WO2020162215A1 (ja) * 2019-02-07 2020-08-13 日本電信電話株式会社 障害情報周知装置及び障害情報周知方法
JP2021010105A (ja) * 2019-07-01 2021-01-28 日本電信電話株式会社 故障影響推定装置、故障影響推定方法、及びプログラム
JP7298343B2 (ja) 2019-07-01 2023-06-27 日本電信電話株式会社 故障影響推定装置、故障影響推定方法、及びプログラム

Also Published As

Publication number Publication date
EP3239840A1 (en) 2017-11-01
EP3239840B1 (en) 2019-09-11
CN107003926B (zh) 2020-04-28
EP3239840A4 (en) 2018-08-29
US20170269986A1 (en) 2017-09-21
WO2016104025A1 (ja) 2016-06-30
US10437695B2 (en) 2019-10-08
CN107003926A (zh) 2017-08-01
JP6306499B2 (ja) 2018-04-04

Similar Documents

Publication Publication Date Title
JP6306499B2 (ja) 障害情報提供サーバ、障害情報提供方法
US9246777B2 (en) Computer program and monitoring apparatus
US20120278663A1 (en) Operation management apparatus, operation management method, and program storage medium
JP6160064B2 (ja) 適用判定プログラム、障害検出装置および適用判定方法
US20190068467A1 (en) Cloud Network Stability
WO2014013603A1 (ja) 監視システム及び監視プログラム
CN102056202A (zh) 移动终端错误处理方法及系统
US9461879B2 (en) Apparatus and method for system error monitoring
JP6413537B2 (ja) 障害予兆通報装置および予兆通報方法、予兆通報プログラム
US10176069B2 (en) Quorum based aggregator detection and repair
JP6015750B2 (ja) ログ収集サーバ、ログ収集システム、ログ収集方法
JP4867908B2 (ja) 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP2014002660A (ja) 保守部品生産管理装置及び保守部品生産管理方法
CN109102083A (zh) 一种维修设备的数量配置方法及相关设备
JP2011028490A (ja) システム監視装置、システム監視方法、及びプログラム
JP2012174079A (ja) 機器管理システム
JP6326383B2 (ja) ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム
JP2014010538A (ja) 運用管理装置、運用管理システム及び運用管理方法
JP7303461B2 (ja) 復旧判定装置、復旧判定方法、および、復旧判定プログラム
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备
JP6901987B2 (ja) 管理装置、管理方法及び管理プログラム
JP2018142225A (ja) 資産管理装置および資産管理方法
JP2009217726A (ja) 情報機器管理方法
JP6674916B2 (ja) 通信障害管理装置、及び通信システム
JP2024521357A (ja) Mlモデルを用いて準リアルタイムデータ/オフラインデータでデータセンタの大規模な故障の検出

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20170315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170517

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180308

R150 Certificate of patent or registration of utility model

Ref document number: 6306499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150