JP2016122337A

JP2016122337A - 障害情報提供サーバ、障害情報提供方法

Info

Publication number: JP2016122337A
Application number: JP2014262091A
Authority: JP
Inventors: 祖父江　恒夫; Tsuneo Sofue; 恒夫祖父江; 靖永井; Yasushi Nagai; 遠藤　泰義; Yasuyoshi Endo; 泰義遠藤; 亨輔鶴巣; Kyosuke Tsurusu; 辰昭長船; Tatsuaki Nagafune
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2014-12-25
Filing date: 2014-12-25
Publication date: 2016-07-07
Anticipated expiration: 2034-12-25
Also published as: US10437695B2; CN107003926B; JP6306499B2; US20170269986A1; CN107003926A; WO2016104025A1; EP3239840A1; EP3239840A4; EP3239840B1

Abstract

【課題】サービス利用者に対して、障害発生によるサービスへの影響度を通知する。
【解決手段】障害情報提供サーバ１０１は、処理サーバ群１４１の障害発生状況を管理する障害発生・復旧管理部１２３と、処理サーバ群１４１の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部１３７と、障害によるサービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部としての算出ルール管理部１３４および予測ルール管理部１３５と、ログ管理部１３７で管理されているログ情報およびルール管理部で管理されているルールに基づいて、サービス影響度を算出するサービス影響度算出部１２２と、サービス影響度算出部１２２により算出されたサービス影響度を利用者へ通知するサービス影響度通知部１２１と、を備える。
【選択図】図１

Description

本発明は、システム利用者に障害情報を提供する障害情報提供サーバおよび障害情報提供方法に関する。

無線通信ネットワークを介して接続された車載装置などの端末を用いて、システム利用者に様々なサービスを提供するシステムが知られている。こうしたシステムにおいて何らかの障害が発生した場合には、障害発生時の状況を利用者へ通知することが好ましい。特許文献１には、稼働状態にないコンテンツサーバ装置を検出した際に、当該コンテンツサーバ装置がどのような状態にあるかを認識可能なサービスメニューを作成して携帯端末にプッシュ配信する中継装置が開示されている。

特許第３６４２００４号

上記特許文献１に開示された中継装置を用いた場合、システム利用者は、システム障害の発生時に非稼動状態のコンテンツサーバ装置の存在を知ることができるが、提供されるサービスへの影響度を知ることはできない。

本発明による障害情報提供サーバは、複数のサーバで構成される処理サーバ群と接続され、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供するものであって、前記処理サーバ群の障害発生状況を管理する障害発生・復旧管理部と、前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部と、前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部と、前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出するサービス影響度算出部と、前記サービス影響度算出部により算出されたサービス影響度を前記利用者へ通知するサービス影響度通知部と、を備える。
本発明による障害情報提供方法は、複数のサーバで構成される処理サーバ群と接続された障害情報提供サーバを用いて、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供するものであって、前記障害情報提供サーバにより、前記処理サーバ群の障害発生状況を管理し、前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理し、前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理し、前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出し、前記算出したサービス影響度を前記利用者へ通知する。

本発明によれば、サービス利用者は、システム障害の発生時に、提供されるサービスへの影響度を知ることができる。

本発明の一実施形態による障害情報提供サーバの構成を示す図である。車載端末管理部に格納されているデータのテーブル構成例を示す図である。通知情報管理部に格納されているデータのテーブル構成例を示す図である。サービス構成管理部に格納されているデータのテーブル構成例を示す図である。算出ルール管理部に格納されているデータのテーブル構成例を示す図である。予測ルール管理部に格納されているデータのテーブル構成例を示す図である。ログ統計値管理部に格納されているデータのテーブル構成例を示す図である。ログ管理部に格納されているデータのテーブル構成例を示す図である。サービス影響度算出部が実行する処理のフローチャートを示す図である。障害発生・復旧管理部が実行する処理のフローチャートを示す図である。利用者端末において表示される通知画面例を示す図である。車載端末において表示される通知画面例を示す図である。

以下に、本発明の一実施形態について、図面を用いて詳細に説明する。

図１は、本発明の一実施形態による障害情報提供サーバの構成を示す図である。障害情報提供サーバ１０１は、ＣＰＵ（Central Processing Unit）１１２、入力部１１３、出力部１１４、通信部１１５、記憶部１１１を備える。

記憶部１１１は、半導体メモリやＨＤＤ（Hard Disk Drive）等を用いて構成され、各種のプログラムおよびデータを格納する。たとえば、コンピュータ読み取り可能な記憶媒体に格納されたプログラムおよびデータを障害情報提供サーバ１０１へインストールすることで、これらのプログラムおよびデータを記憶部１１１に格納することができる。記憶部１１１は、車載端末管理部１３１、通知情報管理部１３２、サービス構成管理部１３３、算出ルール管理部１３４、予測ルール管理部１３５、ログ統計値管理部１３６、ログ管理部１３７を機能的に有する。

ＣＰＵ１１２は、記憶部１１１に記憶されているプログラムやデータに基づいて、障害情報提供サーバ１０１を動作させるための各種の演算処理を実行する。ＣＰＵ１１２は、サービス影響度通知部１２１、サービス影響度算出部１２２、障害発生・復旧管理部１２３、ログ統計処理部１２４を機能的に有する。

入力部１１３は、オペレータからの操作入力を検出し、ＣＰＵ１１２に出力する。入力部１１３は、たとえばマウスやキーボード等により構成される。

出力部１１４は、ＣＰＵ１１２からの指示に従って画面表示や音声出力を行う。出力部１１４は、たとえばディスプレイやスピーカ等により構成される。

通信部１１５は、ＣＰＵ１１２からの指示に従って、障害情報提供サーバ１０１に接続されている処理サーバ群１４１、利用者端末１５１および車載端末１５２との間で通信を行う。障害情報提供サーバ１０１および処理サーバ群１４１は、インターネット１５０を介して、利用者端末１５１および車載端末１５２と接続されている。インターネット１５０は、有線接続でも良いし、無線接続でも良い。

処理サーバ群１４１は、複数台のサーバから構成されており、利用者端末１５１および車載端末１５２に対して各種のサービスを提供する。車載端末１５２は、システム利用者であるエンドユーザが所持する端末である。たとえば、車両に備え付けられたカーナビゲーションシステムや、エンドユーザが車両に持ち込んだスマートフォンなどを、車載端末１５２として用いることができる。利用者端末１５１は、たとえばエンドユーザに車両を販売しているメーカの管理者など、エンドユーザ以外のシステム利用者が所有する端末である。なお、図１では簡略化のために、利用者端末１５１および車載端末１５２をそれぞれ１つずつのみ示している。しかし実際には、システム利用者の数に応じて、多数の利用者端末１５１および車載端末１５２がインターネット１５０を介して、処理サーバ群１４１および障害情報提供サーバ１０１に接続されている。

次に、記憶部１１１とＣＰＵ１１２の詳細について説明する。障害情報提供サーバ１０１は、処理サーバ群１４１においてシステム障害が発生した場合に、そのシステム障害発生による提供サービスへの影響度を利用者へ通知する。記憶部１１１とＣＰＵ１１２がそれぞれ有する前述の各部は、このサービス影響度の通知に用いられる。

サービス影響度通知部１２１は、サービス影響度算出部１２２により算出されて障害発生・復旧管理部１２３から出力されたサービス影響度を取得する。取得したサービス影響度に基づいて、サービス影響度通知部１２１は、処理サーバ群１４１での障害発生によるサービスへの影響度を表すサービス影響度情報を生成し、通信部１１５に出力する。サービス影響度通知部１２１から通信部１１５に出力されたサービス影響度情報は、通信部１１５により、インターネット１５０を介して利用者端末１５１および車載端末１５２へ送信される。これにより、サービス影響度通知部１２１は、利用者へのサービス影響度の通知を行う。

車載端末１５２へサービス影響度を通知する場合には、サービス影響度通知部１２１は、車載端末管理部１３１に問い合わせて通知対象とする車載端末のグループを特定し、そのグループに対して算出されたサービス影響度を通知する。たとえば、通知対象とする車載端末１５２が「車載端末ＩＤ＝Ａ１２３４５」の場合、この「Ａ１２３４５」の車載端末ＩＤをキーにして車載端末管理部１３１を検索し、車載端末グループを特定する。具体的には、図２に示したようなデータ構造で車載端末管理部１３１に格納されている情報のうち、車載端末ＩＤ２０３の欄に「Ａ１２３４５」を含む情報を検索し、これに対応する車載端末グループ２０２の欄の内容から「グループ１」を特定する。そして、障害発生・復旧管理部１２３から受信したサービス影響度の中から、「車載端末グループ＝グループ１」のサービス影響度を車載端末１５２へ通知する。このとき、「車載端末グループ＝グループ１」のサービス影響度の全項目を通知しても良いし、その中の一部のみを通知するようにしても良い。車載端末１５２へサービス影響度を通知するときには、障害発生時刻などの情報も合わせて通知する。

サービス影響度通知部１２１から利用者端末１５１および車載端末１５２へサービス影響度を通知するタイミングは、任意のタイミングとすることができる。たとえば、利用者端末１５１または車載端末１５２から障害情報提供サーバ１０１へのアクセスがあると、このアクセスに応じてサービス影響度通知部１２１からサービス影響度の通知を行っても良い。また、処理サーバ群１４１での障害発生時に通知しても良いし、障害発生中に定期的に通知するようにしても良い。さらに、障害発生時と復旧時などの特定のタイミングのみで通知するようにしても良い。

サービス影響度算出部１２２は、障害発生・復旧管理部１２３からの要求に基づいて、処理サーバ群１４１の稼働状態に応じたサービス影響度を算出する。サービス影響度算出部１２２によるサービス影響度の算出結果は、障害発生・復旧管理部１２３を介してサービス影響度通知部１２１に出力される。なお、サービス影響度算出部１２２の処理内容については、後で図９のフローチャートを参照して詳細に説明する。

障害発生・復旧管理部１２３は、通信部１１５を介して、処理サーバ群１４１から送信されるシステム障害の発生状況および復旧状況に関する情報を受信する。この情報に基づいて、障害発生・復旧管理部１２３は、処理サーバ群１４１においてシステム障害が発生したか否かを判断する。システム障害が発生したと判断した場合、障害発生・復旧管理部１２３は、サービス影響度算出部１２２に対して、その障害によるサービス影響度の計算を要求する。そして、サービス影響度算出部１２２からサービス影響度の計算結果を取得し、サービス影響度通知部１２１へ出力する。このとき、当該障害に関する他の情報、たとえば障害の発生時刻などを合わせて通知してもよい。なお、障害発生・復旧管理部１２３の処理内容については、後で図１０のフローチャートを参照して詳細に説明する。

ログ統計処理部１２４は、ログ管理部１３７に格納されている、処理サーバ群１４１の各サーバによるサービス提供状況に関するログ情報を、ログ管理部１３７から定期的に取得する。そして、取得したログ情報を統計処理し、その結果をログ統計値管理部１３６に格納する。

車載端末管理部１３１には、車載端末１５２をグループ単位で管理するためのデータが格納されている。車載端末管理部１３１に格納されているデータに基づいて、サービス影響度通知部１２１は、処理サーバ群１４１での障害発生時に、サービス影響度の通知対象とする車載端末１５２を特定し、通信部１１５を用いてその車載端末１５２にサービス影響度情報を送信することができる。

図２は、車載端末管理部１３１に格納されているデータのテーブル構成例を表している。車載端末管理部１３１は、たとえば図２に示すようなテーブル構成のデータを用いて、搭載車種、発売年、種類などに応じて複数の車載端末１５２をグループ分けして管理している。図２のデータテーブルは、メーカ名２０１、車載端末グループ２０２、車載端末ＩＤ２０３の各項目から構成される。

メーカ名２０１は、各車載端末グループに属する車載端末１５２が取り付けられている車両の製造販売メーカの名称を表している。車載端末グループ２０２は、各車載端末グループに対して割り当てられたグループ名を表している。車載端末ＩＤ２０３は、各車載端末グループに属する車載端末１５２を一意に識別するための識別子を表している。

図２のデータテーブルにおいて、一行目には、メーカ名２０１の欄に「メーカＡ」、車載端末グループ２０２の欄に「グループ１」、車載端末ＩＤ２０３の欄に「Ａ１２３４５」、「Ｂ５６７８９」とそれぞれ記載されている。これは、Ａ１２３４５、Ｂ５６７８９のＩＤ番号でそれぞれ特定される車載端末１５２は、グループ１という車載端末グループに属しており、これらの車載端末１５２が取り付けられた車両は，メーカＡが製造、販売していることを表している。

また、二行目には、メーカ名２０１の欄に「メーカＡ」、車載端末グループ２０２の欄に「グループ２」、車載端末ＩＤ２０３の欄に「Ｃ９８７６５」とそれぞれ記載されている。これは、Ｃ９８７６５のＩＤ番号で特定される車載端末１５２は、グループ２という車載端末グループに属しており、この車載端末１５２が取り付けられた車両は，メーカＡが製造、販売していることを表している。

通知情報管理部１３２には、処理サーバ群１４１から車載端末１５２への提供サービスおよび処理サーバ群１４１の障害発生時に障害情報提供サーバ１０１から通知するサービス影響度の項目に関する通知情報を管理するためのデータが格納されている。通知情報管理部１３２に格納されているデータに基づいて、サービス影響度通知部１２１は、処理サーバ群１４１での障害発生時に、利用者端末１５１および車載端末１５２へ通知するサービス影響度の項目を特定することができる。

図３は、通知情報管理部１３２に格納されているデータのテーブル構成例を表している。通知情報管理部１３２は、たとえば図３に示すようなテーブル構成のデータを用いて、処理サーバ群１４１からの提供サービスと、処理サーバ群１４１の障害発生時に通知するサービス影響度とを、車載端末グループごとに管理している。図３のデータテーブルは、車載端末グループ３０１、提供サービス３０２、サービス影響度３０３の各項目から構成される。

車載端末グループ３０１は、各車載端末グループに対して割り当てられたグループ名を表しており、図２に示した車載端末管理部１３１の車載端末グループ２０２と対応している。提供サービス３０２は、処理サーバ群１４１が各車載端末グループに提供しているサービスの種類を表している。サービス影響度３０３は、処理サーバ群１４１の障害発生時に障害情報提供サーバ１０１から利用者端末１５１および車載端末１５２に提供するサービス影響度の項目を表している。

図３のデータテーブルにおいて、一行目には、車載端末グループ３０１の欄に「グループ１」、提供サービス３０２の欄に「サービス１」、「サービス２」、サービス影響度３０３の欄に「サービス稼働率」、「レスポンス時間」、「接続端末数」とそれぞれ記載されている。これは、グループ１に属する車載端末１５２は、サービス１およびサービス２に該当するサービスが処理サーバ群１４１から提供されており、処理サーバ群１４１に障害が発生した際には、グループ１の車載端末１５２および対応する利用者端末１５１に対して、サービス稼働率、レスポンス時間、接続端末数の情報をサービス影響度として通知することを表している。ここで、グループ１の車載端末１５２に対応する利用者端末１５１は、メーカＡの利用者端末１５１であり、これは図２に示した車載端末管理部１３１の格納データに基づいて特定することができる。

また、二行目には、車載端末グループ３０１の欄に「グループ２」、提供サービス３０２の欄に「サービス２」、サービス影響度３０３の欄に「障害復旧予定時刻」、「利用不可端末数」とそれぞれ記載されている。これは、グループ２に属する車載端末１５２は、サービス２というサービスが処理サーバ群１４１から提供されており、処理サーバ群１４１に障害が発生した際には、グループ２の車載端末１５２および対応する利用者端末１５１に対して、障害復旧予定時刻、利用不可端末数の情報をサービス影響度として通知することを表している。

サービス構成管理部１３３には、処理サーバ群１４１のサービス構成を管理するためのデータが格納されている。サービス構成管理部１３３に格納されているデータに基づいて、サービス影響度算出部１２２は、処理サーバ群１４１での障害発生時にサービス影響度の算出に用いるログ情報の取得対象とするサーバを特定することができる。

図４は、サービス構成管理部１３３に格納されているデータのテーブル構成例を表している。サービス構成管理部１３３は、たとえば図４に示すようなテーブル構成のデータを用いて、処理サーバ群１４１を構成する各サーバをサービスごとに管理している。図４のデータテーブルは、サービスＩＤ４０１、サーバ種類４０２、サーバＩＤ４０３の各項目から構成される。

サービスＩＤ４０１は、処理サーバ群１４１の各サーバによる提供サービスを一意に識別するための識別子を表しており、図３に示した通知情報管理部１３２の提供サービス３０２と対応している。サーバ種類４０２は、各サーバの役割を表している。サーバＩＤ４０３は、各サーバの役割を具体的に実施しているサーバを一意に識別するための識別子を表している。

図４のデータテーブルにおいて、一行目には、サービスＩＤ４０１の欄に「サービス１」、サーバ種類４０２の欄に「Ｗｅｂサーバ」、サーバＩＤ４０３の欄に「サーバ１」、「サーバ２」とそれぞれ記載されている。また、二行目には、サービスＩＤ４０１の欄に「サービス１」、サーバ種類４０２の欄に「ＡＰサーバ」、サーバＩＤ４０３の欄に「サーバ３」、「サーバ４」とそれぞれ記載されており、三行目には、サービスＩＤ４０１の欄に「サービス１」、サーバ種類４０２の欄に「ＤＢサーバ」、サーバＩＤ４０３の欄に「サーバ５」、「サーバ６」とそれぞれ記載されている。これは、サービス１は、Ｗｅｂサーバであるサーバ１およびサーバ２と、ＡＰ（アプリケーション）サーバであるサーバ３およびサーバ４と、ＤＢ（データベース）サーバであるサーバ５およびサーバ６により提供されていることを表している。

算出ルール管理部１３４には、処理サーバ群１４１の障害発生時における現時点でのサービスへの影響度を算出するために用いられる算出ルールを管理するためのデータが格納されている。算出ルール管理部１３４に格納されているデータに基づいて、サービス影響度算出部１２２は、処理サーバ群１４１での障害発生時にサービス影響度を算出することができる。

図５は、算出ルール管理部１３４に格納されているデータのテーブル構成例を表している。算出ルール管理部１３４は、たとえば図５に示すようなテーブル構成のデータを用いて、ログ管理部１３７に格納されているログ情報から現時点でのサービス影響度を算出する方法を定義した算出ルールを管理している。図５のデータテーブルは、サービス影響度５０１、算出ルール５０２の各項目から構成される。

サービス影響度５０１は、障害発生時に障害情報提供サーバ１０１から利用者端末１５１および車載端末１５２に提供する情報を表しており、図３に示した通知情報管理部１３２のサービス影響度３０３と対応している。なお、サービス影響度５０１の各項目は、予測ルール管理部１３５の格納データにおけるサービス影響度（後述の図６に示すサービス影響度６０１）と重複しないことが好ましい。つまり、算出ルール管理部１３４と予測ルール管理部１３５の両方に同じ項目名のサービス影響度が定義されることがないようにする。このようにすれば、サービス影響度の各項目について、算出ルール管理部１３４で管理されている算出ルールを用いて計算するのか、それとも予測ルール管理部１３５で管理されている予測ルールを用いて計算するのかを判別できる。算出ルール５０２は、サービス影響度５０１の各項目について、その具体的な算出方法を表している。

図５のデータテーブルにおいて、一行目には、サービス影響度５０１の欄に「サービス稼働率」、算出ルール５０２の欄に「（全時間−システム停止時間）／全時間」とそれぞれ記載されている。これは、サービス影響度の一つであるサービス稼働率は、「全時間」から「システム停止時間」を引いた値を「全時間」で割ることによって算出できることを表している。なお、「全時間」は、処理サーバ群１４１においてサービスを提供している全サーバの稼働時間の合計を表しており、「システム停止時間」は、障害によるサーバの停止時間を表している。これらの情報は、ログ管理部１３７に格納されているログ情報から取得することができる。

また、二行目には、サービス影響度５０１の欄に「レスポンス時間」、算出ルール５０２の欄に「“Ｗｅｂサーバでの回答時刻−Ｗｅｂサーバでの要求受付時刻”の平均値」とそれぞれ記載されている。これは、サービス影響度の一つであるレスポンス時間は、処理サーバ群１４１におけるＷｅｂサーバでの要求受付時刻から回答時刻までの時間の平均値として算出できることを表している。なお、Ｗｅｂサーバの具体的なサーバＩＤは、図４に示したサービス構成管理部１３３の格納情報に基づいて特定することができる。ここで、ログ管理部１３７に格納されるログ情報には、各車載端末１５２からの要求受付とその要求に対する回答とを紐付けできる情報（例：トランザクションＩＤなど）が含まれているものとする。この情報に基づいて各要求の受付から回答までにかかった時間の平均値を求めることで、レスポンス時間を算出することができる。なお、ここでは要求受付時刻から回答時刻までの時間の平均値としているが、最大値や最小値としてもよい。

また、四行目には、サービス影響度５０１の欄に「アクセス数」、算出ルール５０２の欄に「Ｗｅｂサーバで受け付けたリクエスト数」とそれぞれ記載されている。これは、サービス影響度の一つであるアクセス数は、処理サーバ群１４１のＷｅｂサーバで受け付けたリクエスト数として算出できることを表している。リクエスト数は、ログ管理部１３７に格納されているログ情報から取得することができる。なお、処理サーバ群１４１においてＷｅｂサーバが複数台ある場合は、それぞれのリクエスト数の平均値や合算値をアクセス数として算出すればよい。また、同一の車載端末１５２からリトライがあった場合には、そのリトライも１回のリクエストと見なしてアクセス数を算出すればよい。あるいは、リトライは省いてアクセス数を算出してもよいし、一定時間以内のリトライのみを省くようにしてもよい。

以上説明したように、算出ルール管理部１３４には、サービス影響度の各項目について、その値を算出するための算出ルールが格納されている。なお、図５に示した算出ルールはあくまで一例であり、サービス影響度の項目ごとに様々な算出ルールを設定することができる。

予測ルール管理部１３５には、処理サーバ群１４１の障害発生時における将来時点でのサービスへの影響度を予測するために用いられる予測ルールを管理するためのデータが格納されている。予測ルール管理部１３５に格納されているデータに基づいて、サービス影響度算出部１２２は、処理サーバ群１４１での障害発生時にサービス影響度を算出することができる。

図６は、予測ルール管理部１３５に格納されているデータのテーブル構成例を表している。予測ルール管理部１３５は、たとえば図６に示すようなテーブル構成のデータを用いて、ログ管理部１３７に格納されているログ情報およびログ統計値管理部１３６に格納されているログ統計情報から将来時点でのサービス影響度を予測する方法を定義した予測ルールを管理している。図６のデータテーブルは、サービス影響度６０１、予測ルール６０２の各項目から構成される。

サービス影響度６０１は、障害発生時に障害情報提供サーバ１０１から利用者端末１５１および車載端末１５２に提供する情報を表しており、図３に示した通知情報管理部１３２のサービス影響度３０３と対応している。なお、前述のように、サービス影響度６０１の各項目は、図５に示した算出ルール管理部１３４の格納データにおけるサービス影響度５０１と重複しないことが好ましい。予測ルール６０２は、サービス影響度６０１の各項目について、その具体的な予測方法を表している。

図６のデータテーブルにおいて、一行目には、サービス影響度６０１の欄に「障害復旧予定時刻」と記載されており、これに対応する予測ルール６０２の欄には、現在時刻に「復旧に必要な時間」を加算することと、「復旧に必要な時間」の特定方法とが記載されている。これは、サービス影響度の一つである障害からの復旧予定時刻は、復旧に必要な時間を特定し、その値を現在時刻に加算することによって予測できることを表している。ここで、復旧に必要な時間は、ログ管理部１３７に格納されているログ情報を用いて、予測ルール６０２で定義された方法に従って求めることができる。具体的には、たとえばログ管理部１３７に格納されているログ情報のうちＷｅｂサーバの直近ログに“ＡＡ”という文字列が含まれていた場合には、復旧に必要な時間は５分と求められる。また、ＡＰサーバの直近ログに“ＢＢ”という文字列が含まれていた場合には、復旧に必要な時間は７分であり、ＡＰサーバの直近ログに“ＣＣ”という文字列が含まれていた場合には、復旧に必要な時間は８分であると求められる。なお、直近ログの範囲は、たとえば１分間など時間で指定してもよいし、１０個などの数で指定してもよい。その結果、たとえば現在時刻が１９時２２分であり、復旧に必要な時間が５分と求められた場合には、障害復旧予定時刻は、１９時２２分＋５分＝１９時２７分と予測することができる。

また、二行目には、サービス影響度６０１の欄に「利用不可端末数」と記載されており、これに対応する予測ルール６０２の欄には、「障害発生時刻」、「障害復旧予定時刻」、「時間帯別の平均接続端末数」から予測することが記載されている。これは、サービス影響度の一つである利用不可端末数、すなわち障害によりサービスの利用を制限される利用者の数は、障害発生時刻、障害復旧予定時刻および時間帯別の平均接続端末数に基づいて予測できることを表している。ここで、障害復旧予定時刻は、前述のようにして求めることができる。また、障害発生時刻は、障害発生・復旧管理部１２３で取得することができ、時間帯別の平均接続端末数は、ログ統計値管理部１３６に格納されているログ情報の統計値から取得することができる。その結果、たとえば障害発生時刻が１９時１７分であり、障害復旧予定時刻が１９時２７分であり、時間帯別の平均接続端末数として、１９時台の平均接続端末数が６００（台／時間）であったとする。この場合、障害発生期間が１９時１７分から１９時２７分までの１０分間であることから、利用不可端末数は、６００（台／時間）×１０（分）÷６０（分）＝１００台と予測できる。

また、三行目には、サービス影響度６０１の欄に「接続エラー数」と記載されており、これに対応する予測ルール６０２の欄には、「障害発生時刻」、「障害復旧予定時刻」、「時間帯別の平均アクセス数」から予測することが記載されている。これは、サービス影響度の一つである接続エラー数、すなわち障害により処理サーバ群１４１への接続がエラーとなる利用者からのアクセス数は、障害発生時刻、障害復旧予定時刻および時間帯別の平均アクセス数に基づいて予測できることを表している。ここで、障害発生時刻および障害復旧予定時刻は、上記の利用不可端末数を予測する場合と同様にして取得することができる。また、時間帯別の平均アクセス数は、ログ統計値管理部１３６に格納されているログ情報の統計値から取得することができる。その結果、たとえば障害発生時刻が１９時１７分であり、障害復旧予定時刻が１９時２７分であり、時間帯別の平均アクセス数として、１９時台の平均アクセス数が１２００（アクセス／時間）であったとする。この場合、障害発生期間が１９時１７分から１９時２７分までの１０分間であることから、接続エラー数は、１２００（アクセス／時間）×１０（分）÷６０（分）＝２００アクセスと予測できる。

また、四行目には、サービス影響度６０１の欄に「レスポンス遅延率」と記載されており、これに対応する予測ルール６０２の欄には、「時間帯別の平均レスポンス時間」、「サーバ低減率」から予測することが記載されている。これは、サービス影響度の一つである障害による処理サーバ群１４１からのレスポンス遅延率は、時間帯別の平均レスポンス時間およびサーバ低減率に基づいて予測できることを表している。ここで、サーバ低減率は、予測ルール６０２の欄に記載されているように、サーバ稼働台数をサーバ冗長構成台数で割ることにより算出されるものである。このとき、サーバの種類ごとにサーバ低減率を算出し、その中での最低値を処理サーバ群１４１のサーバ低減率として採用してもよい。たとえば、処理サーバ群１４１がＷｅｂサーバ、ＡＰサーバ、ＤＢサーバの三種類のサーバで構成されており、２台のサーバで冗長構成されたＷｅｂサーバのうち１台が障害によりダウンした場合には、Ｗｅｂサーバの低減率は０．５となる。同様に、ＡＰサーバやＤＢサーバについても低減率を求め、その中で最低値を選択することで、処理サーバ群１４１のサーバ低減率を求めることができる。また、時間帯別の平均レスポンス時間は、ログ統計値管理部１３６に格納されているログ情報の統計値から取得することができる。その結果、たとえば時間帯別の平均レスポンス時間が１．６秒であり、サーバ低減率が０．５であったとする。この場合、レスポンス遅延時間は、１．６（秒）÷０．５＝３．２（秒）と予測できる。

以上説明したように、予測ルール管理部１３５には、サービス影響度の各項目について、その値を予測するための予測ルールが格納されている。なお、図６に示した予測ルールはあくまで一例であり、サービス影響度の項目ごとに様々な予測ルールを設定することができる。

ログ統計値管理部１３６には、ログ統計処理部１２４により作成された処理サーバ群１４１のログ情報の統計値に関するログ統計情報を管理するためのデータが格納されている。ログ統計値管理部１３６に格納されているデータに基づいて、サービス影響度算出部１２２は、処理サーバ群１４１での障害発生時にサービス影響度を算出することができる。

図７は、ログ統計値管理部１３６に格納されているデータのテーブル構成を表している。ログ統計値管理部１３６は、たとえば図７に示すようなテーブル構成のデータを用いて、ログ管理部１３７で管理されているログ情報の統計値を、処理サーバ群１４１の各サーバが提供するサービスごとに管理している。図７のデータテーブルは、項目７０１、サービスＩＤ７０２、統計値７０３から構成される。

項目７０１は、各統計値の内容を表している。サービスＩＤ７０２は、処理サーバ群１４１の各サーバによる提供サービスを一意に識別するための識別子を表しており、図３に示した通知情報管理部１３２の提供サービス３０２と、図４に示したサービス構成管理部１３３のサービスＩＤ４０１とに対応している。統計値７０３は、項目ごとの統計値を表している。

図７のデータテーブルにおいて、一行目には、項目７０１の欄に「時間帯別の平均接続端末数」、サービスＩＤ７０２の欄に「サービス１」とそれぞれ記載されており、これに対応する統計値７０３の欄には、時間帯ごとの数値が記載されている。これは、ログ情報の統計値の一つである時間帯別の平均接続端末数を表している。この統計値は、たとえば、ログ管理部１３７に格納されているＷｅｂサーバのログ情報において、車載端末１５２からの接続開始ログを特定し、これを時間帯毎に集計することで計算することができる。ここで、ログ管理部１３７に格納されているログ情報には、Ｗｅｂサーバに接続された車載端末１５２を特定するための車載端末ＩＤや、車載端末１５２が利用したサービスを特定するためのサービスＩＤが含まれるものとする。なお、処理サーバ群１４１においてＷｅｂサーバが複数台ある場合には、各Ｗｅｂサーバの時間帯別の平均接続端末数を求め、その平均値を処理サーバ群１４１の時間帯別の平均接続端末数としてもよい。または、平均値ではなく最大値や最小値としてもよい。

その他の行に記載された「時間帯別の平均アクセス数」や「時間帯別の平均レスポンス時間」についても、上記と同様の方法により計算することができる。なお、レスポンス時間の具体的な計算方法は、図５で説明したのと同様である。

ログ管理部１３７には、処理サーバ群１４１のログ情報を管理するためのデータが格納されている。ログ管理部１３７に格納されているデータに基づいて、サービス影響度算出部１２２は、処理サーバ群１４１での障害発生時にサービス影響度を算出することができる。

ログ管理部１３７は、通信部１１５を介して、処理サーバ群１４１からログ情報を収集する。このとき、処理サーバ群１４１から障害情報提供サーバ１０１へログ情報を通知するようにしてもよいし、障害情報提供サーバ１０１から処理サーバ１４１に対してログ情報を要求することでログ情報を取得するようにしても良い。また、ログ情報をリアルタイムに収集してもよいし、一定周期で収集するようにしてもよい。

図８は、ログ管理部１３７に格納されているデータのテーブル構成を表している。ログ管理部１３７は、たとえば図８に示すようなテーブル構成のデータを用いて、処理サーバ群１４１の各サーバによるサービス提供状況の履歴に関するログ情報を管理している。図８のデータテーブルは、サーバＩＤ８０１、時刻８０２、ログ８０３から構成される。

サーバＩＤ８０１は、各ログが発生したサーバを一意に特定するための識別子を表している。時刻８０２は、各ログが発生した時刻を表しており、ログ８０３は、処理サーバ群１４１の各サーバから出力された具体的なログ情報の内容を表している。

図８のデータテーブルに示すように、ログ８０３に記録されるログ情報は、提供サービスを特定するためのサービスＩＤ、サービスを提供した車載端末１５２を特定するための車載端末ＩＤ、トランザクションを特定するためのトランザクションＩＤなどの情報を含む。ログ情報としてトランザクションＩＤを記録することで、図５で説明したように、各車載端末１５２からの要求受付とその要求に対する回答とを紐付けることが可能となる。

記憶部１１１の各管理部には、以上説明したようなデータが記録されている。

処理サーバ群１４１においていずれかのサーバにシステム障害が発生すると、サービス影響度通知部１２１は、当該サーバが提供するサービスへの影響度を通知するためのサービス影響度情報を、通信部１１５を介して利用者端末１５１および車載端末１５２へ送信する。このとき、サービス影響度通知部１２１は、サービス影響度に関する情報を障害発生・復旧管理部１２３から受信する。サービス影響度に関する情報は、図３に示した通知情報管理部１３２に格納されているデータと同様のデータ構造を有する。すなわち、対象とする車載端末１５２のグループを示す「車載端末グループ」と、障害の影響を受ける提供サービスの内容を示す「サービスＩＤ」と、障害による提供サービスへの影響度を示す「サービス影響度」との組合せで構成される。たとえば、「車載端末グループ＝グループ１」、「サービスＩＤ＝サービス１」、「サービス影響度＝障害復旧予定時刻１９時２７分」というサービス影響度情報が送信されたとする。このサービス影響度情報は、グループ１に属している各車載端末１５２に提供しているサービス１の障害復旧予定時刻が１９時２７分であることを意味している。なお、サービス影響度通知部１２１では、障害発生・復旧管理部１２３から受信した情報を最新の値のみ管理してもよいし、受信した情報の履歴を管理してもよい。履歴を管理する場合、特定のサービス影響度の項目のみを履歴管理の対象としてもよい。

サービス影響度通知部１２１は、障害発生・復旧管理部１２３から受信する情報に基づいて車載端末１５２のグループを特定し、そのグループに対応する利用者端末１５１や各車載端末１５２に対してサービス影響度を通知する。このとき、利用者端末１５１へサービス影響度を通知する場合は、図２のようなデータ構造で車載端末管理部１３１に格納されている情報に基づいて、特定された車載端末１５２のグループがどのメーカのものであるかを特定し、そのメーカの利用者端末１５１を通知対象とすることが好ましい。たとえば、利用者端末１５１を利用しているのが「メーカＡ」の管理者の場合、「メーカＡ」をキーにして、図２のメーカ名２０１の記載が「メーカＡ」である行を抽出し、その行における車載端末グループ２０２の記載内容から、「グループ１」、「グループ２」を特定する。そして、障害発生・復旧管理部１２３から受信したサービス影響度の情報において、「車載端末グループ＝グループ１」または「車載端末グループ＝グループ２」のサービス影響度に関する情報を抽出し、利用者端末１５１へ通知する。このとき、障害発生時刻や、車載端末グループに属する車載端末の一覧などの情報も合わせて通知することが好ましい。

図９は、障害情報提供サーバ１０１のサービス影響度算出部１２２が実行する処理のフローチャートを示す図である。

最初にステップ９０１において、サービス影響度算出部１２２は、障害の影響があるサービスを特定する。ここでは、サービス影響度算出部１２２は、障害発生・復旧管理部１２３から、障害発生時刻や障害発生サーバに関する情報を受信する。そして、受信した情報が表す障害発生サーバをキーとしてサービス構成管理部１３３を検索し、障害の影響を受けるサービスのサービスＩＤを特定する。具体的には、図４に示したようなデータ構造でサービス構成管理部１３３に格納されている情報の中で、サーバＩＤ４０３の欄に障害発生サーバのＩＤ番号が含まれる行を検索し、その行のサービスＩＤ４０１の欄に記録されている内容からサービスＩＤを特定する。なお、サーバは複数サービスで利用されている場合があるため、サーバＩＤが一つでも、サービスＩＤは複数検索される場合がある。

次にステップ９０２において、サービス影響度算出部１２２は、通知するサービス影響度の項目を特定する。ここでは、サービス影響度算出部１２２は、ステップ９０１で特定したサービスＩＤをキーとして通知情報管理部１３２を検索し、サービス影響度の項目を決定する。具体的には、図３に示したようなデータ構造で通知情報管理部１３２に格納されている情報の中で、提供サービス３０２の欄にステップ９０１で特定したサービスＩＤが含まれる行を検索し、その行のサービス影響度３０３の欄に記録されている内容からサービス影響度の項目を特定する。このとき、同じ行の車載端末グループ３０１の欄の記載内容から、通知する車載端末のグループも特定する。

次にステップ９０３において、サービス影響度算出部１２２は、ステップ９０２で特定したサービス影響度の項目が、算出ルール管理部１３４で管理されている算出ルールに基づいて計算可能であるか否かを判定する。ここでは、サービス影響度算出部１２２は、ステップ９０１で特定したサービスＩＤと、ステップ９０２で特定した車載端末のグループおよびサービス影響度の項目との組み合わせの中から一つを選択する。そして、選択した組み合わせのサービス影響度の項目をキーとして算出ルール管理部１３４を検索し、対応するサービス影響度の有無を検索する。具体的には、図５に示したようなデータ構造で算出ルール管理部１３４に格納されている情報のうち、サービス影響度５０１の欄に記録されている内容の中で、選択した組み合わせのサービス影響度の項目を検索する。その結果、サービス影響度５０１の中に当該サービス影響度の項目が存在する場合（Ｙｅｓ）は、算出ルールに基づいて計算可能であると判定してステップ９０４に進み、存在しない場合（Ｎｏ）は、算出ルールに基づいて計算可能でないと判定してステップ９０５に進む。たとえば、検索するサービス影響度の項目が「サービス稼働率」である場合、これは図５のテーブルにおいて、サービス影響度５０１の一行目に存在する。したがって、この場合は算出ルールに基づいて計算可能であると判定し、ステップ９０４に進む。一方、たとえば検索するサービス影響度の項目が「障害復旧予定時刻」である場合、これは図５のテーブルにおいて存在しない。したがって、この場合は算出ルールに基づいて計算可能でないと判定し、ステップ９０５に進む。

ステップ９０３からステップ９０４に進んだ場合、ステップ９０４において、サービス影響度算出部１２２は、ログ情報および算出ルールに基づいてサービス影響度を計算する。ここでは、サービス影響度算出部１２２は、ステップ９０３で検索されたサービス影響度の項目に対応する算出ルール５０２の内容に基づいて、当該サービス影響度の項目を算出するための算出ルールを取得する。次に、ログ管理部１３７に格納されている障害発生時刻以降のログ情報の中で、取得した算出ルールにおいて必要なログ情報を収集する。そして、収集したログ情報を用いて、算出ルールに従って計算を行うことにより、サービス影響度の値を計算する。

たとえば「障害発生時刻＝１９時２２分」、「サービスＩＤ＝サービス１」、「サービス影響度＝レスポンス時間」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部１２２は、最初に、図５に示した算出ルール管理部１３４の格納情報テーブルの二行目を参照することで、レスポンス時間の算出ルールを「“Ｗｅｂサーバでの回答時刻−Ｗｅｂサーバでの要求受付時刻”の平均値」と特定する。次に、サービス１におけるＷｅｂサーバをサービス構成管理部１３３に問い合せることで、図４に示したサービス構成管理部１３３の格納情報テーブルの中から、「Ｗｅｂサーバ＝サーバ１、サーバ２」の情報を取得する。次に、図８に示したログ管理部１３７の格納情報テーブルから、サーバＩＤ８０１が「サーバ１」または「サーバ２」で、時刻８０２が「１９時２２分以降」のログ情報８０３を取得する。そして、取得したログ情報を用いた算出ルールに基づいて、「“Ｗｅｂサーバでの回答時刻−Ｗｅｂサーバでの要求受付時刻”の平均値」を計算する。

ステップ９０３からステップ９０５に進んだ場合、ステップ９０５において、サービス影響度算出部１２２は、ログ情報、ログ統計情報および予測ルールに基づいてサービス影響度を計算する。ここでは、サービス影響度算出部１２２は、ステップ９０２で特定したサービス影響度の項目をキーとして予測ルール管理部１３５を検索し、当該サービス影響度の項目を算出するための予測ルールを取得する。次に、ログ管理部１３７、ログ統計値管理部１３６にそれぞれ格納されている障害発生時刻以降のログ情報およびログ統計情報の中で、取得した予測ルールにおいて必要なログ情報およびログ統計情報を収集する。そして、収集したログ情報およびログ統計情報を用いて、予測ルールに従って計算を行うことにより、サービス影響度の値を計算する。

たとえば「現在時刻＝１９時３５分」、「障害発生時刻＝１９時２２分」、「サービスＩＤ＝サービス１」、「サービス影響度＝障害復旧予定時刻」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部１２２は、最初に、図６に示した予測ルール管理部１３５の格納情報テーブルの一行目を参照することで、障害復旧予定時刻の予測ルールを特定する。次に、特定した予測ルールのサービス１におけるＷｅｂサーバ、ＡＰサーバをサービス構成管理部１３３に問い合せることで、図４に示したサービス構成管理部１３３の格納情報テーブルの中から、「Ｗｅｂサーバ＝サーバ１、サーバ２」、「ＡＰサーバ＝サーバ３、サーバ４」の情報を取得する。次に、図８に示したログ管理部１３７の格納情報テーブルから、サーバＩＤ８０１が「サーバ１」、「サーバ２」、「サーバ３」または「サーバ４」で、時刻８０２が「１９時３２分以降」のログ情報８０３を取得する。ここでは、直近ログの範囲を３分間として、現在時刻から３分前の１９時３２分以降のログ情報を取得することとした。そして、取得したログ情報を用いた予測ルールに基づいて、障害復旧予定時刻を計算する。たとえば、復旧に必要な時間が５分である場合、現在時刻の１９時３５分に、復旧に必要な時間の５分を加えることで、障害復旧予定時刻が１９時４０分と予測される。

また、たとえば「障害発生時刻＝１９時２２分」、「障害復旧予定時刻＝１９時４０分」、「サービスＩＤ＝サービス１」、「サービス影響度＝利用不可端末数」の組み合わせについての具体的なサービス影響度の計算方法を以下に説明する。この場合、サービス影響度算出部１２２は、最初に、図６に示した予測ルール管理部１３５の格納情報テーブルの二行目を参照することで、利用不可端末数の予測ルールを特定する。次に、図７に示したログ統計値管理部１３６の格納情報テーブルから、項目７０１が「時間帯別の平均接続端末数」、サービスＩＤ７０２が「サービス１」に対応する統計値７０３を取得する。そして、取得したログ統計情報を用いた予測ルールに基づいて、利用不可端末数を計算する。たとえば、１９時台の平均接続端末数が１００（台／時間）、障害発生時間が１８分（１９時２２分〜４０分）の場合、利用不可端末数＝１００（台／時間）×１８（分）÷６０（分）＝３０台と予測される。

次にステップ９０６において、サービス影響度算出部１２２は、ステップ９０１で特定したサービスＩＤと、ステップ９０２で特定したサービス影響度の項目とに関して、全ての組み合わせに対するサービス影響度を計算したか否かを確認する。全ての組み合わせに対するサービス影響度を計算済みの場合（Ｙｅｓ）は、ステップ９０７に進み、まだ計算していないサービス影響度がある場合（Ｎｏ）は、ステップ９０３に戻る。

次にステップ９０７において、サービス影響度算出部１２２は、ステップ９０２で特定した全ての車載端末のグループに関して、全てのグループのサービス影響度を計算したか否かを確認する。全てのグループのサービス影響度を計算済みの場合（Ｙｅｓ）は、図９の処理を終了し、まだ計算していないサービス影響度がある場合（Ｎｏ）は、ステップ９０３に戻る。

以上説明したような処理により、サービス影響度算出部１２２は、処理サーバ群１４１から提供されるサービスのうち障害の影響があるサービスについて、算出すべきサービス影響度の項目を決定することができる。そして、算出ルール管理部１３４で管理されている算出ルールまたは予測ルール管理部１３５で管理されている予測ルールに基づいて、障害発生により処理サーバ群１４１から提供されるサービスに影響を受ける車載端末のグループごとに、サービス影響度を算出することができる。

図１０は、障害情報提供サーバ１０１の障害発生・復旧管理部１２３が実行する処理のフローを示す図である。

最初にステップ１００１において、障害発生・復旧管理部１２３は、処理サーバ群１４１から障害発生の通知を受信する。ここでは、障害発生通知として、障害ＩＤ、障害発生時刻、障害発生サーバなどの情報を処理サーバ群１４１から受け取る。ここで、障害ＩＤは発生した障害を一意に特定するための識別子である。処理サーバ群１４１のリソースを外部サーバで監視して自動的にアラームを障害情報提供サーバ１０１に通知するようにしても良いし、人手で監視してアラームを通知するようにしても良い。

次にステップ１００２では、障害発生・復旧管理部１２３は、サービス影響度算出部１２２を用いて、障害発生によるサービス影響度の算出を行う。ここでは、障害発生・復旧管理部１２３は、サービス影響度算出部１２２に対して、ステップ１００１で受けた障害発生通知における障害発生時刻や障害発生サーバを引数として、サービス影響度の算出を要求する。この要求に応じて、サービス影響度算出部１２２は、図９のフローチャートで説明した処理を実行した後、障害発生・復旧管理部１２３へサービス影響度の算出結果を回答する。サービス影響度算出部１２２から障害発生・復旧管理部１２３へ送られるサービス影響度の算出結果は、車載端末グループ、サービスＩＤ、サービス影響度などの情報から構成される。たとえば、サービス影響度の算出結果として、「車載端末グループ＝グループ１」、「サービスＩＤ＝サービス１」、「障害復旧予定時刻＝１９時２７分」の情報が送られる。これは、処理サーバ群１４１がグループ１の各車載端末１５２に提供しているサービス１において障害が発生しており、その障害復旧予定時刻が１９時２７分であることを表している。

次にステップ１００３では、障害発生・復旧管理部１２３は、ステップ１００２で取得したサービス影響度の算出結果をサービス影響度通知部１２１へ送る。

次にステップ１００４では、障害発生・復旧管理部１２３は、ステップ１００１で受信した障害が復旧したか否かを判定する。障害が復旧した場合（Ｙｅｓ）は、図１０の処理を終了し、障害が復旧していない場合（Ｎｏ）は、ステップ１００２に戻る。この判断は、たとえばステップ１００１と同様に、復旧したサービスの障害ＩＤや障害復旧時刻の通知を処理サーバ群１４１から受信することで行うことができる。

なお、上記の説明では、ステップ１００１の処理により、処理サーバ群１４１での障害発生をトリガとしてサービス影響度を算出するようにしたが、利用者端末１５１または車載端末１５２からの要求をトリガとしてサービス影響度を算出するようにしても良い。

また、障害発生・復旧管理部１２３は、ステップ１００１で処理サーバ群１４１から障害発生の通知を受信すると、ステップ１００２〜１００４の処理を定期的に行うことが好ましい。このようにすれば、処理サーバ群１４１で障害が発生してから復旧するまでの間に、サービス影響度算出部１２２により、サービス影響度の最新値を所定の周期ごとに再計算することができる。そして、サービス影響度通知部１２１により、サービス影響度算出部１２２で求められた所定周期ごとのサービス影響度の最新値をサービス利用者へ通知することができる。しかし、このようにはせず、サービス影響度を一定の回数のみ算出するようにしてもよいし、利用者端末１５１または車載端末１５２からの停止要求でサービス影響度の算出を停止してもよい。

次に、処理サーバ群１４１での障害発生によるサービス影響度の通知を障害情報提供サーバ１０１から受けたときに、利用者端末１５１および車載端末１５２においてそれぞれ表示される通知画面の例を説明する。

図１１は、利用者端末１５１において表示される通知画面例を示している。図１１に示す画面には、メーカ名１１０１、障害発生時刻１１０２、および、メーカＡに属する各車載端末グループのサービス影響度の情報が表示されている。この車載端末グループ毎のサービス影響度の情報には、車載端末グループ１１０３、車載端末一覧ボタン１１０４、サービス毎のサービス影響度１１０５、履歴ボタン１１０６が含まれる。

図１１の画面において、利用者端末１５１の管理者が利用者端末１５１を操作して車載端末一覧ボタン１１０４を押下すると、その車載端末一覧ボタン１１０４に対応する車載端末グループ１１０３が示す車載端末１５２のグループ（ここではグループ１）に属する車載端末１５２の一覧がポップアップ画面で表示される。また、履歴ボタン１１０６を押下すると、その履歴ボタン１１０６に対応するサービス影響度の履歴情報がグラフで表示される。たとえば、サービス稼働率の右側にある履歴ボタン１１０６を押下した場合には、サービス稼働率の履歴グラフがポップアップで表示される。

なお、図１１の画面において、障害の影響がないサービスに関しては「正常稼働」という情報が表示される。これにより、利用者端末１５１を操作するメーカの管理者は、自社で販売している車両に対するサービス提供状態や、障害によるサービス影響度を把握することができる。

図１２は、車載端末１５２において表示される通知画面例を示している。図１２に示す画面には、障害発生時刻１２０１、および、サービス毎のサービス影響度１２０２が表示されている。

図１２の画面においても図１１と同様に、障害の影響がないサービスに関しては「正常稼働」という情報が表示される。これにより、車載端末１５２を操作するエンドユーザは、自分が利用しているサービスの稼働状態を知ることができる。

以上説明した本発明の実施形態によれば、以下の作用効果を奏する。
（１）障害情報提供サーバ１０１は、複数のサーバで構成される処理サーバ群１４１と接続され、処理サーバ群１４１において発生した障害に関する情報を、処理サーバ群１４１によるサービスの利用者に対して提供する。障害情報提供サーバ１０１は、処理サーバ群１４１の障害発生状況を管理する障害発生・復旧管理部１２３と、処理サーバ群１４１の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部１３７と、障害によるサービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部としての算出ルール管理部１３４および予測ルール管理部１３５と、ログ管理部１３７で管理されているログ情報およびルール管理部で管理されているルールに基づいて、サービス影響度を算出するサービス影響度算出部１２２と、サービス影響度算出部１２２により算出されたサービス影響度を利用者へ通知するサービス影響度通知部１２１と、を備える。このようにしたので、サービス利用者は、システム障害の発生時に、提供されるサービスへの影響度を知ることができる。

（２）上記のルール管理部は、障害によるサービスへの現時点での影響度を算出するための算出ルールを管理する算出ルール管理部１３４を含む。サービス影響度算出部１２２は、ログ管理部１３７で管理されているログ情報および算出ルール管理部１３４で管理されている算出ルールに基づいて、サービス影響度を算出する。このようにしたので、障害によるサービスへの現時点での影響度を確実に算出することができる。

（３）また、障害情報提供サーバ１０１は、ログ情報の統計値に関するログ統計情報を管理するログ統計値管理部１３６をさらに備え、上記のルール管理部は、障害によるサービスへの将来時点での影響度を予測するための予測ルールを管理する予測ルール管理部１３５を含む。サービス影響度算出部１２２は、ログ管理部１３７で管理されているログ情報、ログ統計値管理部１３６で管理されているログ統計情報、および予測ルール管理部１３５で管理されている予測ルールに基づいて、サービス影響度を算出する。このようにしたので、障害によるサービスへの将来時点での影響度を確実に算出することができる。

（４）予測ルール管理部１３５は、たとえば、障害からの復旧予定時刻を予測するための予測ルールと、障害によりサービスの利用を制限される利用者の数を予測するための予測ルールと、障害により処理サーバ群１４１への接続がエラーとなる利用者からのアクセス数を予測するための予測ルールと、障害による処理サーバ群１４１からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する。このようにしたので、様々なサービス影響度の項目に関する予測ルールを適切に管理し、サービス影響度の算出に用いることができる。

（５）障害情報提供サーバ１０１は、利用者により所持されてサービスの提供をそれぞれ受ける複数の車載端末１５２をグループ単位で管理する車載端末管理部１３１をさらに備える。サービス影響度算出部１２２は、車載端末管理部１３１で管理されている車載端末１５２のグループごとにサービス影響度を算出する。このようにしたので、サービスの提供を受ける車載端末１５２の数に関わらず、グループ単位でまとめてサービス影響度を算出することができる。

（６）また、障害情報提供サーバ１０１は、車載端末１５２のグループごとに設定されたサービス影響度の通知項目に関する通知情報を管理する通知情報管理部１３２をさらに備える。サービス影響度通知部１２１は、通知情報管理部１３２で管理されている通知情報に基づいて、車載端末１５２のグループごとに異なるサービス影響度を利用者へ通知する。このようにしたので、処理サーバ群１４１から提供されるサービスが異なる様々な車載端末１５２のグループについて、それぞれに最適なサービス影響度を通知することができる。

（７）障害発生・復旧管理部１２３において、図１０のステップ１００２〜１００４の処理を定期的に行うことで、サービス影響度算出部１２２は、サービス影響度の最新値を所定の周期ごとに再計算し、サービス影響度通知部１２１は、サービス影響度算出部１２２により求められた所定の周期ごとのサービス影響度の最新値を利用者へ通知することが好ましい。このようにすれば、処理サーバ群１４１で障害が発生してから復旧するまでの間に状況が変化した場合にも、サービス影響度を正確に通知することができる。

（８）サービス影響度通知部１２１は、図１１、図１２に例示したような画面を利用者端末１５１、車載端末１５２にそれぞれ表示するための情報を送信することにより、サービス影響度を利用者へ通知する。これらの画面は、障害の発生時刻を表す障害発生時刻１１０２、１２０１と、利用者の属性に応じたサービスごとのサービス影響度を表すサービス影響度１１０５、１２０２とを少なくとも含む。このようにしたので、利用者にとって分かりやすい形態でサービス影響度の通知を行うことができる。

なお、以上説明した実施形態や各種の変化例はあくまで一例であり、発明の特徴が損なわれない限り、本発明はこれらの内容に限定されない。本発明は、上述した実施形態や変形例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の変更が可能である。

１０１：障害情報提供サーバ、１１１：記憶部、１１２：ＣＰＵ、１１３：入力部、１１４：出力部、１１５：通信部、１２１：サービス影響度通知部、１２２：サービス影響度算出部、１２３：障害発生・復旧管理部、１２４：ログ統計処理部、１３１：車載端末管理部、１３２：通知情報管理部、１３３：サービス構成管理部、１３４：算出ルール管理部、１３５：予測ルール管理部、１３６：ログ統計値管理部、１３７：ログ管理部、１４１：処理サーバ群、１５０：インターネット、１５１：利用者端末、１５２：車載端末

Claims

複数のサーバで構成される処理サーバ群と接続され、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供する障害情報提供サーバであって、
前記処理サーバ群の障害発生状況を管理する障害発生・復旧管理部と、
前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理するログ管理部と、
前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理するルール管理部と、
前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出するサービス影響度算出部と、
前記サービス影響度算出部により算出されたサービス影響度を前記利用者へ通知するサービス影響度通知部と、を備える障害情報提供サーバ。
請求項１に記載の障害情報提供サーバにおいて、
前記ルール管理部は、前記障害による前記サービスへの現時点での影響度を算出するための算出ルールを管理する算出ルール管理部を含み、
前記サービス影響度算出部は、前記ログ情報および前記算出ルールに基づいて、前記サービス影響度を算出する障害情報提供サーバ。
請求項１または２に記載の障害情報提供サーバにおいて、
前記ログ情報の統計値に関するログ統計情報を管理するログ統計値管理部をさらに備え、
前記ルール管理部は、前記障害による前記サービスへの将来時点での影響度を予測するための予測ルールを管理する予測ルール管理部を含み、
前記サービス影響度算出部は、前記ログ情報、前記ログ統計情報および前記予測ルールに基づいて、前記サービス影響度を算出する障害情報提供サーバ。
請求項３に記載の障害情報提供サーバにおいて、
前記予測ルール管理部は、前記障害からの復旧予定時刻を予測するための予測ルールと、前記障害により前記サービスの利用を制限される前記利用者の数を予測するための予測ルールと、前記障害により前記処理サーバ群への接続がエラーとなる前記利用者からのアクセス数を予測するための予測ルールと、前記障害による前記処理サーバ群からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する障害情報提供サーバ。
請求項１乃至４のいずれか一項に記載の障害情報提供サーバにおいて、
前記利用者により所持されて前記サービスの提供をそれぞれ受ける複数の車載端末をグループ単位で管理する車載端末管理部をさらに備え、
前記サービス影響度算出部は、前記車載端末のグループごとに前記サービス影響度を算出する障害情報提供サーバ。
請求項５に記載の障害情報提供サーバにおいて、
前記車載端末のグループごとに設定された前記サービス影響度の通知項目に関する通知情報を管理する通知情報管理部をさらに備え、
前記サービス影響度通知部は、前記通知情報に基づいて、前記車載端末のグループごとに異なる前記サービス影響度を前記利用者へ通知する障害情報提供サーバ。
請求項１乃至６のいずれか一項に記載の障害情報提供サーバにおいて、
前記サービス影響度算出部は、前記サービス影響度の最新値を所定の周期ごとに再計算し、
前記サービス影響度通知部は、前記サービス影響度算出部により求められた前記所定の周期ごとのサービス影響度の最新値を前記利用者へ通知する障害情報提供サーバ。
請求項１乃至７のいずれか一項に記載の障害情報提供サーバにおいて、
前記サービス影響度通知部は、前記障害の発生時刻と、前記利用者の属性に応じた前記サービスごとの前記サービス影響度と、を少なくとも含む画面を表示するための情報を送信することにより、前記サービス影響度を前記利用者へ通知する障害情報提供サーバ。
複数のサーバで構成される処理サーバ群と接続された障害情報提供サーバを用いて、前記処理サーバ群において発生した障害に関する情報を、前記処理サーバ群によるサービスの利用者に対して提供する障害情報提供方法であって、
前記障害情報提供サーバにより、
前記処理サーバ群の障害発生状況を管理し、
前記処理サーバ群の各サーバによるサービス提供状況の履歴に関するログ情報を管理し、
前記障害による前記サービスへの影響度を表すサービス影響度に関するルールを管理し、
前記ログ情報および前記ルールに基づいて、前記サービス影響度を算出し、
前記算出したサービス影響度を前記利用者へ通知する、障害情報提供方法。
請求項９に記載の障害情報提供方法において、
前記ルールの管理では、前記障害による前記サービスへの現時点での影響度を算出するための算出ルールを管理し、
前記サービス影響度の算出では、前記ログ情報および前記算出ルールに基づいて、前記サービス影響度を算出する障害情報提供方法。
請求項９または１０に記載の障害情報提供方法において、
さらに前記障害情報提供サーバにより、前記ログ情報の統計値に関するログ統計情報を管理し、
前記ルールの管理では、前記障害による前記サービスへの将来時点での影響度を予測するための予測ルールを管理し、
前記サービス影響度の算出では、前記ログ情報、前記ログ統計情報および前記予測ルールに基づいて、前記サービス影響度を算出する障害情報提供方法。
請求項１１に記載の障害情報提供方法において、
前記予測ルールの管理では、前記障害からの復旧予定時刻を予測するための予測ルールと、前記障害により前記サービスの利用を制限される前記利用者の数を予測するための予測ルールと、前記障害により前記処理サーバ群への接続がエラーとなる前記利用者からのアクセス数を予測するための予測ルールと、前記障害による前記処理サーバ群からのレスポンス遅延率を予測するための予測ルールと、の少なくとも一つを含む予測ルールを管理する障害情報提供方法。
請求項９乃至１２のいずれか一項に記載の障害情報提供方法において、
さらに前記障害情報提供サーバにより、前記利用者により所持されて前記サービスの提供をそれぞれ受ける複数の車載端末をグループ単位で管理し、
前記サービス影響度の算出では、前記車載端末のグループごとに前記サービス影響度を算出する障害情報提供方法。
請求項１３に記載の障害情報提供方法において、
さらに前記障害情報提供サーバにより、前記車載端末のグループごとに設定された前記サービス影響度の通知項目に関する通知情報を管理し、
前記サービス影響度の通知では、前記通知情報に基づいて、前記車載端末のグループごとに異なる前記サービス影響度を前記利用者へ通知する障害情報提供方法。
請求項９乃至１４のいずれか一項に記載の障害情報提供方法において、
前記サービス影響度の算出では、前記サービス影響度の最新値を所定の周期ごとに再計算し、
前記サービス影響度の通知では、求められた前記所定の周期ごとのサービス影響度の最新値を前記利用者へ通知する障害情報提供方法。
請求項９乃至１５のいずれか一項に記載の障害情報提供方法において、
前記サービス影響度の通知では、前記障害の発生時刻と、前記利用者の属性に応じた前記サービスごとの前記サービス影響度と、を少なくとも含む画面を表示するための情報を送信することにより、前記サービス影響度を前記利用者へ通知する障害情報提供方法。