JP2016181021A - 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム - Google Patents

情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム Download PDF

Info

Publication number
JP2016181021A
JP2016181021A JP2015059640A JP2015059640A JP2016181021A JP 2016181021 A JP2016181021 A JP 2016181021A JP 2015059640 A JP2015059640 A JP 2015059640A JP 2015059640 A JP2015059640 A JP 2015059640A JP 2016181021 A JP2016181021 A JP 2016181021A
Authority
JP
Japan
Prior art keywords
information
failure
occurred
data center
handling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2015059640A
Other languages
English (en)
Inventor
将之 脇田
Masayuki Wakita
将之 脇田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015059640A priority Critical patent/JP2016181021A/ja
Priority to US15/001,293 priority patent/US20160285674A1/en
Publication of JP2016181021A publication Critical patent/JP2016181021A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】データセンタにおいて発生した障害への対応を迅速化する。【解決手段】検知部50は、複数の位置に配置され、互いに通信可能とされたデータセンタ11において発生した障害を検知する。抽出部51は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する障害対応情報がある場合、当該対応方法に関する情報を抽出し、当該対応方法に関する情報がない場合、他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を抽出する。選定部53は、抽出部51により抽出される対応方法に関する情報と、記憶部30に記憶された技術者に関する情報とに基づいて、検知部50により検知された障害の対応が可能な技術者を選定する。【選択図】図2

Description

本発明は、情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステムに関する。
従来、コンピュータ等の機器や運用されるシステムを監視し、監視対象になっている機器やシステムに障害が発生した場合に、発生した障害への対応を行う技術が提供されている。また、従来の障害への対応においては、障害を検知した後、障害が発生している機器等のログ情報等の収集・分析し、対応を行う。また、特定の運用担当者(技術者)が対応するシステムもある程度限定されている。
特開平11−346266号公報 特開2002−230672号公報
ところで、複数のデータセンタから構成されるデータセンタシステムにおいて障害が発生した場合、従来の技術では発生した障害への対応方法を適切に提示することが難しい場合がある。例えば、データセンタにおいて未知の障害が発生した場合、発生した未知の障害への対応方法を適切に提示することが難しい。そのため、データセンタにおいて発生した障害への対応に時間を要するという課題がある。
本発明は、一側面では、データセンタにおいて発生した障害への対応を迅速化することができる情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステムを提供することを目的とする。
1つの態様では、情報処理装置は、検知部と、提示部とを有する。検知部は、複数の位置に配置され、互いに通信可能とされたデータセンタにおいて発生した障害を検知する。提示部は、障害が発生したデータセンタにおいて過去に障害が発生した際の対応方法に関する情報がある場合、当該対応方法に関する情報を提示し、当該対応方法に関する情報がない場合、他のデータセンタにおいて過去に障害が発生した際の対応方法に関する情報を提示する。
本発明の一側面によれば、データセンタにおいて発生した障害への対応を迅速化することができる。
図1は、実施例に係るデータセンタシステムのハードウェア構成を示す図である。 図2は、実施例に係るデータセンタの機能構成を示す図である。 図3は、障害対応情報のデータ構成の一例を示す図である。 図4は、障害対応情報のデータ構成の一例を示す図である。 図5は、技術水準情報のデータ構成の一例を示す図である。 図6は、技術水準情報のデータ構成の一例を示す図である。 図7は、技術者情報のデータ構成の一例を示す図である。 図8は、保有スキル情報のデータ構成の一例を示す図である。 図9は、障害対応処理の手順の一例を示すシーケンス図である。 図10は、情報処理プログラムを実行するコンピュータを示す図である。
以下に、本願の開示する情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステムの実施例を図面に基づいて詳細に説明する。本実施例では、仮想マシンを提供する複数のデータセンタを含むデータセンタシステムに適用するものとする。なお、本実施例によりこの発明が限定されるものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
[実施例に係るデータセンタシステムの構成]
図1は、実施例に係るデータセンタシステムのハードウェア構成を示す図である。図1に示すように、データセンタシステム10は、複数のデータセンタ(DC)11を有する。複数のデータセンタ11は、それぞれネットワーク12で接続される。ネットワーク12は、専用回線であっても良いし、専用回線でなくても良い。なお、図1の例では、3つのデータセンタ11(11A、11B、11C)を図示したが、データセンタ11の数は2つ以上であれば任意の数とすることができる。
各データセンタ11は、地理的に離れた位置に配置されている。本実施例では、各データセンタ11は、例えば、異なる国など異なる地域(エリア)に配置されているものとする。以下に示す例においては、1つのエリアに1つのデータセンタ11が配置される。具体的には、以下に示す例においては、データセンタ11AがA国に配置され、データセンタ11BがB国に配置され、データセンタ11CがC国に設置されているものとする。なお、複数のデータセンタ11が、同じ国に2つ以上設置されてもよい。また、以下では、データセンタ11Aにはデータセンタを識別する識別情報としてデータセンタID「DC01」が付与された例を示す。また、以下に示す例においては、データセンタ11BにはデータセンタID「DC02」が付与され、データセンタ11CにはデータセンタID「DC03」が付与される。
[データセンタのハードウェア構成]
次に、データセンタ11の機能構成を、図2を参照して説明する。図2は、実施例に係るデータセンタの機能構成を示す図である。なお、データセンタ11A〜11Cの機能構成は、略同一であるので、以下では、データセンタ11Aの構成を例について説明する。
データセンタ11は、複数のサーバ13と、情報処理装置14とを有する。複数のサーバ13と情報処理装置14は、ネットワーク15で接続され、通信可能とされている。このネットワーク15は、ネットワーク12と通信可能に接続され、ネットワーク12を介して他のデータセンタ11と通信可能とされている。なお、図2の例では、サーバ13を3つ図示したが、サーバ13は任意の台数とすることができる。また、図2の例では、情報処理装置14を1つ図示したが、情報処理装置14が2つ以上であってもよい。
サーバ13は、コンピュータを仮想化した仮想マシンを動作させて、ユーザに対して各種のサービスを提供する物理サーバであり、例えば、サーバコンピュータである。サーバ13は、サーバ仮想化プログラムを実行することによって、ハイパバイザ上で複数の仮想マシンを動作させ、仮想マシン上で顧客に応じたアプリケーションプログラムを動作させることにより、顧客のシステムを動作させる。本実施例では、顧客のシステムとして、各種の企業のシステムが動作している。図2の例では、顧客のシステムとしてA社、B社、C社のシステムが動作している。また、サーバ13は、例えば、仮想マシンを動作させ、仮想マシン上で稼働状況検査システムを動作させる。この稼働状況検査システムは、データセンタ11の稼働状況を検査するための専用のシステムでもよく、データセンタ11を管理する管理システムが兼ねてもよい。
情報処理装置14は、データセンタ11で発生する障害を検知し、発生した障害の対応方法を提示する物理サーバであり、例えば、サーバコンピュータである。例えば、情報処理装置14は、各サーバ13等で発生する障害を検知し、発生した障害の対応方法を提示する。
各データセンタ11の情報処理装置14は、互いに情報の送受信が可能とされており、他のデータセンタ11の情報処理装置14からの情報に基づいて、他のデータセンタ11の状況を把握することが可能とされている。データセンタシステム10では、各データセンタ11の情報処理装置14の何れかをデータセンタシステム10全体を管理する情報処理装置として運用する。他データセンタ11の情報処理装置14は、データセンタシステム10全体を管理する情報処理装置とされた情報処理装置14へデータセンタ11内の状況を通知する。例えば、情報処理装置14は、他のデータセンタ11の情報処理装置14との間で主従関係を有する。情報処理装置間の主従関係は、予め管理者によって設定されてもよく、プログラムが所定の設定手順に沿って設定してもよい。また、所定の期間毎に主の情報処理装置14を変更してもよい。
従の情報処理装置14は、データセンタ11内の状況を主の情報処理装置14へ通知する。例えば、従の情報処理装置14は、従の情報処理装置14が属するデータセンタ11で発生した障害のログ等を主の情報処理装置14へ送信する。主の情報処理装置14は、従の情報処理装置14が属するデータセンタ11で発生した障害のログや障害の対応方法等を含む障害に関する情報を参照できる。なお、主の情報処理装置14が参照可能であれば、従の情報処理装置14が属する他のデータセンタ11で発生した障害のログや障害の対応方法等を含む障害に関する情報は、各従の情報処理装置14に分散されてもよい。
主の情報処理装置14は、他のデータセンタ11の従の情報処理装置14へデータセンタ11の運用に関わる命令を通知する。例えば、主の情報処理装置14は、他のデータセンタ11の従の情報処理装置14へ発生した障害の対応方法を送信する。従の情報処理装置14は、主の情報処理装置14から受信した対応方法を提示する。なお、主従関係の主となる情報処理装置14は、「リード」というものとする。以降、データセンタ11Aの情報処理装置14を「リード」として説明する。
[情報処理装置の構成]
次に、実施例に係る情報処理装置14の構成について説明する。図2に示すように、情報処理装置14は、記憶部30と、制御部31と、入力部32と、出力部33とを有する。なお、情報処理装置14は、図2に示した機能部以外にも既知のコンピュータが有する各種の機能部を有することとしてもかまわない。
入力部32は、例えばキーボードやマウス等であり、ユーザによる各種操作を受け付ける。また、出力部33は、例えば液晶ディスプレイ等の表示デバイスや、音声出力デバイスや、印字デバイスであり、各種情報を出力する。
記憶部30は、各種のデータを記憶する記憶デバイスである。例えば、記憶部30は、ハードディスク、SSD(Solid State Drive)、光ディスクなどの記憶装置である。なお、記憶部30は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)などのデータを書き換え可能な半導体メモリであってもよい。
記憶部30は、制御部31で実行されるOS(Operating System)や各種プログラムを記憶する。例えば、記憶部30は、後述する障害対応処理を実行するプログラムを含む各種のプログラムを記憶する。さらに、記憶部30は、制御部31で実行されるプログラムで用いられる各種データを記憶する。例えば、記憶部30は、障害対応情報40と、技術水準情報41と、技術者情報42と、保有スキル情報43とを記憶する。
障害対応情報40は、データセンタシステム10で発生した障害の対応方法に関する情報を記憶したデータである。例えば、障害対応情報40には、障害ごとに各国における対応方法の情報が記憶される。例えば、図3及び図4に示すように、障害ごとのテーブルに分けて各国における対応方法の情報が記憶される。
図3は、障害対応情報のデータ構成の一例を示す図である。具体的には、図3は、障害が「サーバが急に停止した」である場合の各国における障害対応情報のデータ構成の一例を示す。
図3に示すように、障害対応情報40は、「国」、「原因」、「対応方法」、「対応ID」、「平均所要時間」、「回数」、「回数計」の各項目を有する。国の項目は、データセンタシステム10で障害が発生したデータセンタ11が位置する国の情報を記憶する領域である。図3に示す例では、国の情報として「A国」、「B国」、「C国」と国名を記憶するが、各国に識別情報として付与した国IDを記憶してもよい。
原因の項目は、発生した障害の原因を示す情報が記憶される領域である。図3に示す例においては、原因の項目には、障害「サーバが急に停止した」の原因を示す情報が記憶される。図3に示す例では、原因を示す情報として「サーバのハード故障による電源停止」、「OSの異常動作によるシステム停止」等の原因を記憶する。なお、原因の項目には、各原因に識別情報として付与した原因IDを記憶してもよい。
対応方法の項目は、発生した障害の対応方法を示す情報が記憶される領域である。図3に示す例においては、障害「サーバが急に停止した」が発生した場合の対応方法を示す情報が記憶される。図3に示す例では、対応方法を示す情報として「電源ユニットの交換」、「マザーボードの交換」等の対応方法を記憶する。対応IDの項目は、各対応方法に識別情報として付与した対応IDが記憶される領域である。図3に示す例においては、障害「サーバが急に停止した」が発生した場合の対応方法に付与した対応IDが記憶される。例えば、対応方法「電源ユニットの交換」には、対応ID「D101」が付与される。
平均所要時間の項目は、発生した障害の対応方法を行った際に要した所要時間の平均を示す情報が記憶される領域である。図3に示す例においては、障害「サーバが急に停止した」が発生した場合に各対応方法を行った際の平均所要時間を示す情報が記憶される。回数の項目は、発生した障害の対応方法を行った回数を示す情報が記憶される領域である。図3に示す例においては、障害「サーバが急に停止した」が発生した場合に各対応方法を行った回数を示す情報が記憶される。回数計の項目は、原因ごとに各対応方法を行った回数を合計した情報が記憶される領域である。図3に示す例においては、原因「サーバのハード故障による電源停止」等ごとに各対応方法を行った回数の合計を示す情報が記憶される。
図3の例では、A国において障害「サーバが急に停止した」が発生した場合の原因は、「サーバのハード故障による電源停止」、「OSの異常動作によるシステム停止」、「オペレータが誤って電源プラグを抜いたことによる電源停止」の3つであることを示す。また、A国において原因「サーバのハード故障による電源停止」である場合、D101「電源ユニットの交換」、D102「マザーボードの交換」、D103「その他」の3つを行った経験があることを示す。また、A国においてD101「電源ユニットの交換」を35回行っており、その平均所要時間は5時間であることを示す。また、A国においてD102「マザーボードの交換」を10回行っており、その平均所要時間は8時間であることを示す。また、A国において原因「サーバのハード故障による電源停止」である場合、対応を行った回数の合計が50回であることを示す。
また、図4は、障害対応情報のデータ構成の一例を示す図である。具体的には、図4は、障害が「ネットワーク切断が発生した」である場合の各国における障害対応情報のデータ構成の一例を示す。
図4に示す例では、国の情報として「A国」、「B国」、「C国」と国名を記憶する。また、図4に示す例では、原因を示す情報として「ネットワーク機器のハード故障によるネットワーク切断」、「サーバのハード故障によるネットワーク切断」等の原因を記憶する。図4に示す例では、対応方法を示す情報として「ルータの修理/交換」、「ハブの修理/交換」等の対応方法を記憶する。図4に示す例においては、障害「ネットワーク切断が発生した」が発生した場合の対応方法に付与した対応IDが記憶される。例えば、対応方法「ルータの修理/交換」には、対応ID「D201」が付与される。図4に示す例においては、障害「ネットワーク切断が発生した」が発生した場合に各対応方法を行った際の平均所要時間を示す情報が記憶される。図4に示す例においては、図3に示す例においては、障害「ネットワーク切断が発生した」が発生した場合に各対応方法を行った回数を示す情報が記憶される。原因「ネットワーク機器のハード故障によるネットワーク切断」等ごとに各対応方法を行った回数の合計を示す情報が記憶される。
図4の例では、A国において障害「ネットワーク切断が発生した」が発生した場合の原因は、「ネットワーク機器のハード故障によるネットワーク切断」、「サーバのハード故障によるネットワーク切断」、「回線業者のネットワーク障害」の3つであることを示す。また、A国において原因「ネットワーク機器のハード故障によるネットワーク切断」である場合、D201「ルータの修理/交換」、D202「ハブの修理/交換」、D203「その他」の3つを行った経験があることを示す。また、A国においてD201「ルータの修理/交換」を10回行っており、その平均所要時間は10時間であることを示す。また、A国においてD202「ハブの修理/交換」を7回行っており、その平均所要時間は8時間であることを示す。また、A国において原因「ネットワーク機器のハード故障によるネットワーク切断」である場合、対応を行った回数の合計が20回であることを示す。
なお、障害対応情報40には、データセンタシステム10で発生した個別の障害ごとに障害内容や対応方法を記載したファイルの保管場所、障害の対応状況を示すステータス、対応した技術者等の情報等を各障害や各原因や各対応方法に対応付けて記憶してもよい。また、対応IDは、対応方法が同じであっても国ごとに異なる対応IDを付与してもよい。また、対応IDは、対応方法が類似する場合、類似する対応方法に同じ対応IDを付与してもよい。また、対応方法が類似する場合、類似する対応方法の対応IDを関連付けて記憶してもよい。また、対応IDは、対応方法が同じであれば、複数の障害間や複数の原因間で同じ対応IDを付与してもよい。また、原因ごとに対応方法を行った際の平均所要時間を示す情報を記憶してもよい。また、国ごとに対応方法を行った際の平均所要時間を示す情報を記憶してもよい。
なお、本実施例においては各国に1つのデータセンタ11が配置されるため、図3及び図4に示すように、国ごとに対応方法を記憶する例を示したが、各国に複数のデータセンタ11が配置される場合データセンタ11ごとに対応方法を記憶してもよい。
技術水準情報41は、データセンタシステム10における国ごとの技術者のスキルレベルや環境条件など(以下、「技術水準」と称する)を示す情報を記憶したデータである。例えば、技術水準情報41には、障害ごとに各国における技術水準を示す情報が記憶される。例えば、図5及び図6に示すように、障害ごとのテーブルに分けて各国における技術水準を示す情報が記憶される。
図5は、技術水準情報のデータ構成の一例を示す図である。具体的には、図5は、障害が「サーバが急に停止した」である場合の各国における技術水準情報のデータ構成の一例を示す。
図5に示すように、技術水準情報41は、「種別」、「A国」、「B国」、「C国」の各項目を有する。種別の項目は、データセンタシステム10に含まれる国ごとの技術水準を推定する種別を示す情報が記憶される領域である。図5に示す例では、種別として「オペレータスキル」、「工事業者スキル」、「電源供給安定度」などといった種別が記憶される。例えば、図5に示す例では、「オペレータスキル」、「工事業者スキル」が国ごとの技術者のスキルレベルを示す種別であり、「電源供給安定度」が国ごとの環境を示す種別である。なお、種別は上記の3つの種別に限られず、目的に応じて種々の種別を記憶してもよい。また、種別の項目には、各種別に識別情報として付与した種別IDを記憶してもよい。
A国の項目は、A国における各種別に対する所定の評価値が記憶される領域である。図5に示す例では、所定の評価値として「高」、「中」、「低」の3つの評価値が記憶される。図5に示す例では、A国については、「オペレータスキル」、「工事業者スキル」、「電源供給安定度」の3つ種別全てが「高」であることを示す。
また、B国の項目は、B国における各種別に対する所定の評価値が記憶される領域である。図5に示す例では、B国については、「オペレータスキル」の1つの種別が「中」であり、「工事業者スキル」、「電源供給安定度」の2つの種別が「低」であることを示す。また、C国の項目は、C国における各種別に対する所定の評価値が記憶される領域である。図5に示す例では、C国については、「オペレータスキル」、「工事業者スキル」の2つの種別が「低」であり、「電源供給安定度」の1つの種別が「中」であることを示す。
また、図6は、技術水準情報のデータ構成の一例を示す図である。具体的には、図6は、障害が「ネットワーク切断が発生した」である場合の各国における技術水準情報のデータ構成の一例を示す。
図6に示す例では、種別として「オペレータスキル」、「工事業者スキル」、「ネットワーク品質」などといった種別が記憶される。例えば、図6に示す例では、「オペレータスキル」、「工事業者スキル」が国ごとの技術者のスキルレベルを示す種別であり、「ネットワーク品質」が国ごとの環境を示す種別である。
図6に示す例では、A国については、「オペレータスキル」、「工事業者スキル」、「電源供給安定度」の3つ種別全てが「高」であることを示す。また、図6に示す例では、B国については、「オペレータスキル」、「工事業者スキル」、「電源供給安定度」の3つ種別全てが「低」であることを示す。また、図6に示す例では、C国については、「オペレータスキル」の1つの種別が「中」であり、「工事業者スキル」、「ネットワーク品質」の2つの種別が「低」であることを示す。
なお、本実施例においては各国に1つのデータセンタ11が配置されるため、図5及び図6に示すように、国ごとに技術水準を記憶する例を示したが、各国に複数のデータセンタ11が配置される場合データセンタ11ごとに技術水準を記憶してもよい。
技術者情報42は、データセンタシステム10に登録された技術者に関する情報を記憶したデータである。例えば、技術者情報42は、各データセンタに属する技術者に関する情報を記憶したデータである。また、例えば、技術者情報42には、技術者ID、氏名、技術者の連絡先、技術者の活動時間、技術者の属するデータセンタ、技術者の属する国等の情報が記憶される。
図7は、技術者情報のデータ構成の一例を示す図である。図7に示すように、技術者情報42は、「技術者ID」、「氏名」、「連絡先」、「活動時間」、「所属DC」、「国」の各項目を有する。技術者IDの項目は、データセンタシステム10に登録された技術者を識別する識別情報を記憶する領域である。データセンタシステム10に登録された技術者には、それぞれを識別する識別情報として技術者IDが付与される。技術者IDの項目には、データセンタシステム10に登録された技術者に付与された技術者IDが記憶される。氏名の項目は、技術者IDにより識別される技術者の氏名を記憶する領域である。連絡先の項目は、技術者IDにより識別される技術者の連絡先(例えばメールアドレスや電話番号等)を記憶する領域である。活動時間の項目は、技術者IDにより識別される技術者が業務に従事する時間を記憶する領域である。所属DCの項目は、技術者IDにより識別される技術者が属するデータセンタを識別するデータセンタIDを記憶する領域である。国の項目は、技術者IDにより識別される技術者が属する国を記憶する領域である。なお、技術者情報42は、上記に限らず、例えば技術者の休日に関する情報など様々な情報を含んでもよい。
図7の例では、「T01」により識別される技術者は、氏名が「田中太郎」であり、その連絡先が「tanaka@xx.xx」であり、活動時間が9:00−17:00(JST)であることを示す。また、「T01」により識別される技術者は、属するデータセンタのデータセンタIDが「DC01」であり、属する国が「A国」であることを示す。なお、図7中の「活動時間」の欄の「JST」は日本標準時(Japan Standard Time)を意味し、「IST」はインド標準時(Indian Standard Time)を意味し、「CST」は中国標準時(Chinese Standard Time)を意味する。
保有スキル情報43は、データセンタシステム10に登録された技術者が有するスキルに関する情報を記憶したデータである。例えば、技術水準情報41には、障害ごとに各種OSに関するスキルを有するか否か、各種サービスに関するスキルを有するか否か、各種ネットワークに関するスキルを有するか否か等の情報が記憶される。
図8は、保有スキル情報のデータ構成の一例を示す図である。図8に示すように、保有スキル情報43は、技術者ごとの対応方法に関するスキル及び経験の有無を示す。図8に示す例では、保有スキル情報43は、「技術者ID」、「D101」、「D102」、「D103」、「D104」、「D105」等の各項目を有する。図8の最も左側の項目である技術者IDの項目は、データセンタシステム10に登録された技術者に付与された技術者IDを記憶する領域である。D101の項目は、技術者IDにより識別される技術者がD101により識別される対応方法に関するスキル等を有するか否かを記憶する領域である。D102の項目は、技術者IDにより識別される技術者がD102により識別される対応方法に関するスキル等を有するか否かを記憶する領域である。D103の項目は、技術者IDにより識別される技術者がD103により識別される対応方法に関するスキル等を有するか否かを記憶する領域である。D104の項目は、技術者IDにより識別される技術者がD104により識別される対応方法に関するスキル等を有するか否かを記憶する領域である。D105の項目は、技術者IDにより識別される技術者がD105により識別される対応方法に関するスキル等を有するか否かを記憶する領域である。
図8の例では、T01により識別される技術者は、D101により識別される対応方法に関するスキル及び経験を有し、D102により識別される対応方法に関するスキル及び経験を有していないことを示す。具体的には、T01により識別される技術者は、D101により識別される対応方法「電源ユニットの交換」に関するスキル及び経験を有する。また、T01により識別される技術者は、D102により識別される対応方法「マザーボードの交換」に関するスキル及び経験を有しない。また、T01により識別される技術者は、D103〜D105に関するスキル及び経験を有していることを示す。具体的には、T01により識別される技術者は、D103〜D105の各々に識別される対応方法「その他」、「サーバ再起動」、「OSの修復」に関するスキル及び経験を有していることを示す。
図2に戻り、制御部31は、情報処理装置14を制御するデバイスである。制御部31としては、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等の電子回路や、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積回路を採用できる。制御部31は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。制御部31は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部31は、検知部50と、抽出部51と、提示部52と、選定部53とを有する。
検知部50は、データセンタ11で発生する障害の検知を行う。例えば、検知部50は、データセンタ11の稼働状況を検出する。例えば、検知部50は、データセンタ11の稼働状況として、データセンタ11の稼働する稼働状況検査システムでの障害の発生状況を検出する。例えば、検知部50は、稼働状況検査システムが動作するサーバ13のBIOS(Basic Input Output System)のログやサーマルエラー、仮想マシンのOSのイベントログ、監視ALARMメッセージなどにより、障害が発生しているか否かを検知する。また、検知部50は、発生した障害がハードウェアに関する障害か、ソフトウェアに関する障害かを判定する。例えば、検知部50は、上述したBIOSのログや仮想マシンのOSのイベントログに基づいて、発生した障害がサーバ13の停止か、ネットワーク切断か等を判定してもよい。なお、上述した検知部50による発生した障害の判定は、例示であり、検知部50は、種々の技術に基づいて、発生した障害がどのような内容の障害かを判定してもよい。
また、リードの情報処理装置14では、他の各データセンタ11の情報処理装置14から発生した障害に関する情報を取得する。例えば、データセンタ11Aの情報処理装置14の検知部50は、他の各データセンタ11の情報処理装置14から発生した障害に関する情報を取得する。この発生した障害に関する情報は、他のデータセンタ11の情報処理装置14が、当該データセンタ11において障害が発生した場合や障害の対応が完了した場合に随時送信してもよい。
抽出部51は、発生した障害の対応方法に関する情報を抽出する。抽出部51は、例えば、検知部50による障害の判定に基づいて、記憶部30の障害対応情報40から発生した障害の対応方法に関する情報を抽出する。例えば、抽出部51は、A国のデータセンタ11(以下、単に「A国」と称する)で発生した障害がサーバ13の停止である場合、記憶部30の障害対応情報40のうちサーバ13の停止に関するテーブルから、A国に対応する情報を抽出する。図3に示す例においては、抽出部51は、国の項目が「A国」である情報を抽出する。具体的には、図3に示す例において、抽出部51は、A国で行われたD101〜D107の7つの対応方法に関する情報を抽出する。また、図3に示す例において、抽出部51は、B国で発生した障害がサーバ13の停止である場合、B国で行われたD101〜D104,D107〜D108の6つの対応方法に関する情報を抽出する。また、図3に示す例において、抽出部51は、C国で発生した障害がサーバ13の停止である場合、C国で行われたD101,D102,D104の3つの対応方法に関する情報を抽出する。
なお、抽出部51は、検知部50により障害の原因まで判定される場合、検知部50により判定された障害の原因に対応する情報を抽出してもよい。例えば、抽出部51は、A国で発生した障害がサーバ13の停止であり、原因がサーバ13のハード故障による電源停止である場合、記憶部30の障害対応情報40のうちサーバ13の停止に関するテーブルから、A国における原因に対応する情報を抽出する。図3に示す例において、抽出部51は、原因「サーバのハード故障による電源停止」に対応するA国で行われたD101〜D103の3つの対応方法に関する情報を抽出する。以下、抽出部51により抽出された対応方法に関する情報を対応候補情報と称する場合がある。
提示部52は、抽出部51により抽出された対応候補情報に基づいて、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がある場合、そのデータセンタ11の対応方法に関する情報を提示する。例えば、提示部52は、障害が発生したデータセンタ11の属する国において過去に障害が発生した際の対応方法に関する情報がある場合、そのデータセンタ11の属する国の対応方法に関する情報を提示する。なお、ここで言う、過去に障害が発生した際の対応方法に関する情報があるとは、1以上の対応方法に関する情報が含まれる場合であってもよく、所定の閾値以上の対応方法に関する情報が含まれる場合であってもよい。ここでいう、1以上の対応方法に関する情報が含まれる場合とは、対応する障害のテーブルにおいてその国の対応方法における回数計の合計が1回以上である場合をいう。以下、所定の閾値が10(回)である場合を説明する。
例えば、提示部52は、対応候補情報に含まれる対応方法の回数計の合計が所定の閾値以上の場合、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法を提示する。図3に示す例では、A国で発生した障害がサーバ13の停止である場合、対抗候補情報に含まれる対応方法の回数計の合計は、(50+35+2=)87(回)であるため、所定の閾値である10(回)以上となる。そのため、提示部52は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がある場合として、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法を提示する。
ここで、提示部52は、対応候補情報に含まれる対応方法の全てを提示してもよい。例えば、提示部52は、対応候補情報に含まれる対応方法の全てを出力部33に出力させることにより、提示してもよい。また、提示部52は、対応候補情報に含まれる対応方法のうち、回数が所定の回数以上の対応方法を提示してもよい。図3に示す例では、A国で発生した障害がサーバ13の停止であって、所定の回数を20(回)とした場合、提示部52は、D101の対応方法とD104の対応方法とを提示する。具体的には、提示部52は、対応方法「電源ユニットの交換」と対応方法「サーバ再起動」とを提示する。また、提示部52は、対応候補情報に含まれる対応方法のうち、最も回数が多い対応方法を提示してもよい。図3に示す例では、A国で発生した障害がサーバ13の停止である場合、提示部52は、D101の対応方法を提示する。具体的には、提示部52は、対応方法「電源ユニットの交換」を提示する。
提示部52は、抽出部51により抽出された対応候補情報に基づき、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がない場合、他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を提示する。例えば、提示部52は、障害が発生したデータセンタ11の属する国において過去に障害が発生した際の対応方法に関する情報がない場合、他のデータセンタ11の属する国の対応方法に関する情報を提示する。なお、ここで言う、過去に障害が発生した際の対応方法に関する情報がないとは、対応方法に関する情報が含まれない場合であってもよく、所定の閾値未満の対応方法に関する情報が含まれる場合であってもよい。
例えば、提示部52は、対応候補情報に含まれる対応方法の回数計の合計が所定の閾値未満の場合、他のデータセンタ11において過去に障害が発生した際の対応方法を提示する。図3に示す例では、C国で発生した障害がサーバ13の停止である場合、対抗候補情報に含まれる対応方法の回数計の合計は、(2+1=)3(回)であるため、所定の閾値である10(回)未満となる。そのため、提示部52は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がない場合として、他のデータセンタ11において過去に障害が発生した際の対応方法を提示する。
提示部52は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がない場合、データセンタ11が属する国(エリア)の技術水準に類似する技術水準を有する国に含まれる他のデータセンタ11の情報を提示する。具体亭には、提示部52は、障害が発生したデータセンタ11が属する国の技術水準に類似する技術水準を有する国に含まれる他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を提示する。例えば、C国で発生した障害がサーバ13の停止である場合、提示部52は、C国の技術水準に類似する技術水準を有する国を判定する。このとき、提示部52は、複数の障害の各々に対応する複数の技術水準のうち、障害に対応する技術水準に基づいて、障害が発生した国の技術水準に類似する技術水準を有する国を判定する。例えば、図5及び図6に示す技術水準情報41のうち、図5に示す障害「サーバの停止」に関する技術水準情報41に基づいて判定する。
ここで、図5に示す例において、C国と類似する国の判定について説明する。図5においては、「高」、「中」、「低」の3つの評価値が記憶される。そこで、提示部52は、各種別の評価値が近似する国を類似する国として判定する。以下では、各種別の比較値を、同じ評価値の場合は「0」、一方が「高」で他方が「中」または一方が「中」で他方が「低」の場合は「1」、一方が「高」で他方が「低」の場合は「2」とする。この場合、提示部52は、各種別の比較値の合計が少ない国同士が類似していると判定する。図5に示す例では、C国とA国との類似度は、各種別「オペレータスキル」が「1」、「工事業者スキル」が「2」、「電源供給安定度」が「2」であるため、「5」となる。一方、C国とB国との類似度は、各種別「オペレータスキル」が「1」、「工事業者スキル」が「0」、「電源供給安定度」が「0」であるため、「1」となる。すなわち、C国とA国との類似度「5」に比べて、C国とB国との類似度「1」は小さいため、C国はB国と類似すると判定される。なお、提示部52は、所定の類似度未満の国同士を類似する国としてもよい。
そこで、提示部52は、B国で発生した障害がサーバ13の停止である場合の対応方法を対抗候補情報として抽出するように抽出部51に指示する。そして、提示部52は、B国で発生した障害がサーバ13の停止である場合の対抗候補情報に基づいて対応方法を提示する。提示部52は、対応候補情報に含まれる対応方法の全てを提示してもよい。また、提示部52は、対応候補情報に含まれる対応方法のうち、回数が所定の回数以上の対応方法を提示してもよい。また、提示部52は、対応候補情報に含まれる対応方法のうち、最も回数が多い対応方法を提示してもよい。図3に示す例では、提示部52は、B国で発生した障害がサーバ13の停止である場合のD101の対応方法を提示する。具体的には、提示部52は、対応方法「電源ユニットの交換」を提示する。
本実施例においては、提示部52により対応方法の提示がされた後、情報処理装置14が障害の対応を行う技術者の選定を行う。例えば、出力部33である液晶ディスプレイに表示された対応方法を確認したオペレータが、入力部32により技術者の自動選定を行う指示に応じて、報処理装置14が障害の対応を行う技術者の選定を行ってもよい。この点について、以下説明する。
選定部53は、提示部52により対応方法の提示がされた後、発生した障害の対応が可能な技術者を抽出する。選定部53は、例えば、記憶部30の保有スキル情報43に記憶された技術者のスキルに基づいて、障害の対応が可能である技術者を抽出する。例えば、抽出部51は、提示部52により提示された対応方法に関する経験を有する技術者を障害の対応が可能な技術者として選定する。以下、A国で12:00(JST)に発生した障害がサーバ13の停止であって、提示部52がD101の対応方法「電源ユニットの交換」を提示した場合を例に説明する。
まず、選定部53は、記憶部30の技術者情報42からA国の技術者を選定する。例えば、図7に示す例では、技術者IDがT01により識別される技術者(以下、T01の技術者と称する)とT03により識別される技術者(以下、T03の技術者と称する)とが選定される。このとき、選定部53は、障害の発生時間、対応方法の平均所要時間、及び各技術者の活動時間に基づいて対応可能な技術者のみを抽出してもよい。上記のように、12:00(JST)で障害が発生した場合、選定部53は、T01の技術者及びT03の技術者の2名とも活動時間内であり対応可能であると判定する。また、図3に示すように、A国でのD101対応方法の平均所要時間は5時間であるため、選定部53は、T01の技術者及びT03の技術者の2名とも活動時間内に障害の対応可能であると判定する。選定部53は、対応不可能と判定した技術者を除がしてもよい。なお、上記は時間に基づく技術者の選定の一例であって、選定部53は、活動時間外の技術者を選定してもよい。
次に、選定部53は、T01の技術者及びT03の技術者の2名のいずれかを障害の対応が可能な技術者として選定する。上記例では、提示部52が提示した対応方法がD101の対応方法「電源ユニットの交換」であるため、選定部53は、D101の対応方法の経験がある技術者を選定する。ここで、図7に示すように、D101の対応方法の経験については、T01の技術者については経験を有するが、T03の技術者については経験を有さない。そのため、選定部53は、T01の技術者をA国で12:00(JST)に発生した障害がサーバ13の停止の障害に対応可能な技術者として選定する。なお、選定部53は、提示部52が提示した対応方法の経験を有する技術者がいない場合、提示部52が提示した対応方法のスキルのみを有する技術者を選定してもよい。例えば、選定部53は、T01の技術者がいない場合、D101の対応方法のスキルを有するT03の技術者を選定してもよい。
なお、選定部53は、提示部52が提示した対応方法が複数ある場合、複数の対応方法のうち所定数以上の経験を有する技術者を抽出してもよい。例えば、提示部52が提示した対応方法が5個である場合、その5個の対応方法のうち3個以上の対応方法の経験を有する技術者を抽出してもよい。また、選定部53は、提示部52が提示した対応方法のそれぞれに重み値を割り当て、技術者が経験を有する対応方法の重み値の合計が閾値を超える技術者を抽出してもよい。例えば、選定部53は、回数の多い対応方法ほど、より大きな重み値を割り当ててもよい。また、選定部53は、提示部52が提示した対応方法を、経験が必須の対応方法と任意の対応方法に分別し、必須の対応方法の経験を有する技術者を抽出してもよい。なお、上述した選定部53による障害の対応を行う技術者の選定は、例示であり、選定部53は、発生した障害や対応の目的に応じて、様々な基準に基づいて技術者を選定してもよい。
また、選定部53は、選定した技術者が複数存在する場合、抽出した複数の技術者に対して優先順位付けを行ってもよい。この場合、選定部53は、障害が発生した時刻から活動時間が長い技術者ほど、優先順位を高くしてもよい。例えば、13時(JST)に障害が発生し、技術者としてT01の技術者とT03の技術者とが抽出された場合、13時(JST)からの活動時間がより長いT03の技術者の優先順位を1位としてもよい。また、選定部53は、提示部52が提示した対応方法が複数ある場合、提示した対応方法の経験をより多く有する技術者ほど、優先順位を高くしてもよい。また、選定部53は、技術者経験を有する対応方法の重み値の合計が大きい技術者ほど、優先順位を高くしてもよい。なお、上述した選定部53による障害の対応を行う技術者の優先順位付けは、例示であり、選定部53は、発生した障害や対応の目的に応じて、様々な基準に基づいて技術者を優先順位付けしてもよい。
なお、選定部53は、ある国で障害が発生し、提示部52により他の国の対応候補情報に含まれる対応方法が提示された場合、障害が発生した国に属する技術者の中から対応可能な技術者を選定する。例えば、C国で発生した障害がサーバ13の停止であって、提示部52がB国でサーバ13が停止した場合の対応方法を提示した場合、提示された対応方法に基づいてC国に属する技術者の中から対応可能な技術者を選定する。
[処理の流れ]
次に、実施例に係るデータセンタシステム10において障害が発生した場合の情報処理装置14による障害対応処理の流れについて説明する。図9は、障害対応処理の手順の一例を示すシーケンス図である。この障害対応処理は、データセンタシステム10において障害が発生した場合に実行される。
図9に示すように、情報処理装置14の検知部50は、データセンタ11における障害の発生を検知する(ステップS101)。データセンタ11における障害の発生を検知した検知部50は、発生した障害のログを収集し、分析を行う(ステップS102)。その後、検知部50により推定された障害に基づいて、抽出部51は、障害が発生した国の障害対応情報を参照する(ステップS103)。例えば、抽出部51は、発生した障害に対応する障害対応情報から障害が発生した国の対応方法を抽出する。
次に、提示部52は、障害が発生した国(以下、「自国」とする)での対応方法がある場合(ステップS104:Yes)、自国での対応方法の候補を提示する(ステップS105)。その後、情報処理装置14のオペレータは、提示部52により提示された対応方法の候補に基づいて、提示された対応方法により、対応を実施する(ステップS106)。例えば、情報処理装置14のオペレータは、提示された対応方法を実施する技術者を選定し、選定した技術者に対応を実施させる。なお、ステップS106での対応方法を実施する技術者を選定は、情報処理装置14が行ってもよい。ステップS106での対応の実施により障害が復旧した場合(ステップS107:Yes)、対応完了として処理を終了する(ステップS116)。
また、自国での対応方法がない場合(ステップS104:No)提示部52は、スキルレベルや環境、すなわち技術水準が類似する国があるかどうかを判定する(ステップS108)。また、ステップS106での対応の実施により障害が復旧しなかった場合(ステップS107:No)、提示部52は、スキルレベルや環境、すなわち技術水準が類似する国があるかどうかを判定する(ステップS108)。スキルレベルや環境が類似する国がある場合(ステップS108:Yes)、スキルレベル/環境が類似する国の障害対応情報を参照する(ステップS109)。例えば、提示部52は、抽出部51に発生した障害に対応する障害対応情報からスキルレベル/環境が類似する国の対応方法を抽出するように指示する。
提示部52は、スキルレベル/環境が類似する国で類似する対応方法がある場合(ステップS110:Yes)、スキルレベル/環境が類似する国での対応方法の候補を提示する(ステップS111)。なお、ここでいう類似する対応方法には、同じ対応方法や作業の内容に類似性がある対応方法が含まれる。例えば、図4に示す例において、D201「ルータの修理/交換」とD202「ハブの修理/交換」とは類似する対応方法であるとしてもよい。その後、情報処理装置14のオペレータは、提示部52により提示された対応方法の候補に基づいて、提示された対応方法により、対応を実施する(ステップS112)。例えば、情報処理装置14のオペレータは、提示された対応方法を実施する技術者を選定し、選定した技術者に対応を実施させる。なお、ステップS112での対応方法を実施する技術者を選定は、情報処理装置14が行ってもよい。ステップS112での対応の実施により障害が復旧した場合(ステップS113:Yes)、情報処理装置14のオペレータは、データセンタシステム10に対応通知を行い(ステップS116)、対応完了として障害対応処理を終了する。
スキルレベル/環境が類似する国がない場合(ステップS108:No)や、スキルレベル/環境が類似する国での類似する対応方法がない場合(ステップS110:No)、提示部52は、スキルレベルの高い要員に対応を指示する(ステップS114)。例えば、提示部52は、データセンタシステム10において複数の対応方法の経験やスキルを有する技術者をスキルレベルが高い技術者として提示する。また、ステップS112での対応の実施により障害が復旧しなかった場合(ステップS113:No)も、提示部52は、スキルレベルの高い要員に対応を指示する(ステップS114)。
ステップS114でスキルレベルの高い要員に対応を指示されたオペレータは、提示部52により提示されたスキルレベルの高い要員が対応を実施するように指示する(ステップS115)。例えば、情報処理装置14のオペレータは、提示部52により提示されたスキルレベルの高い要員を対応を実施する技術者として選定し、選定した技術者に対応を実施させる。なお、ステップS115での対応方法を実施する技術者を選定は、情報処理装置14が行ってもよい。その後、情報処理装置14のオペレータは、データセンタシステム10に対応通知を行い(ステップS116)、対応完了として障害対応処理を終了する。
なお、データセンタシステム10においてS101の障害の検知以外は、リードの情報処理装置14が行う場合、S101で障害を検知した他の情報処理装置14はリードの情報処理装置14に障害のログ情報等の障害に関する情報を送信する。この場合、障害のログ情報等の障害に関する情報を受信したリードの情報処理装置14がS102以降の処理を行ってもよい。
[効果]
上述してきたように、本実施例に係る情報処理装置14は、複数の位置に配置され、互いに通信可能とされたデータセンタ11において発生した障害を検知する。情報処理装置14は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がある場合、当該対応方法に関する情報を提示し、当該対応方法に関する情報がない場合、他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を提示する。これにより、情報処理装置14は、データセンタ11において発生した障害への対応を迅速化することができる。
また、本実施例に係る情報処理装置14は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がない場合、障害が発生したデータセンタ11が含まれるエリアの技術水準に類似する技術水準を有するエリアに含まれる他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を提示する。これにより、情報処理装置14は、技術水準が類似するエリアに含まれる他のデータセンタ11において過去に障害が発生した際の対応方法を提示することにより、データセンタ11において発生した障害への対応を迅速化することができる。
また、本実施例に係る情報処理装置14は、障害が発生したデータセンタ11において過去に障害が発生した際の対応方法に関する情報がない場合、複数の障害の各々に対応する複数の技術水準のうち、障害に対応する技術水準に基づいて、障害が発生したデータセンタ11が含まれるエリアの技術水準に類似する技術水準を有するエリアに含まれる他のデータセンタ11において過去に障害が発生した際の対応方法に関する情報を提示する。これにより、情報処理装置14は、発生した障害に関する技術水準が類似するエリアに含まれる他のデータセンタ11において過去に障害が発生した際の対応方法を提示することにより、データセンタ11において発生した障害への対応を迅速化することができる。
また、本実施例に係る情報処理装置14は、提示部52により提示される対応方法に関する情報と、記憶部30に記憶された技術者に関する情報とに基づいて、検知部50により検知された障害の対応が可能な技術者を選定する。これにより、情報処理装置14は、データセンタ11において発生した障害への対応を迅速化することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的状態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、検知部50、抽出部51、提示部52、及び選定部53の各処理部が適宜統合されてもよい。また、各処理部の処理が適宜複数の処理部の処理に分離されてもよい。さらに、各処理部にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
[情報処理プログラム]
また、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムの一例を説明する。図10は、情報処理プログラムを実行するコンピュータを示す図である。
図10に示すように、コンピュータ300は、CPU(Central Processing Unit)310、HDD(Hard Disk Drive)320、RAM(Random Access Memory)340を有する。これらCPU310、HDD320、RAM340の各部は、バス400を介して接続される。
HDD320には上記の検知部50、抽出部51、提示部52、及び選定部53と同様の機能を発揮する情報処理プログラム320aが予め記憶される。なお、情報処理プログラム320aについては、適宜分離しても良い。
また、HDD320は、各種情報を記憶する。例えば、HDD320は、OSや生産計画に用いる各種データを記憶する。
そして、CPU310が、情報処理プログラム320aをHDD320から読み出して実行することで、実施例の各処理部と同様の動作を実行する。すなわち、情報処理プログラム320aは、検知部50、抽出部51、提示部52、および選定部53と同様の動作を実行する。
なお、上記した情報処理プログラム320aについては、必ずしも最初からHDD320に記憶させることを要しない。
例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」にプログラムを記憶させておく。そして、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。
さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ300に接続される「他のコンピュータ(またはサーバ)」などにプログラムを記憶させておく。そして、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。
10 データセンタシステム
11、11A〜11C データセンタ
13 サーバ
14 情報処理装置
30 記憶部
31 制御部
40 障害対応情報
41 技術水準情報
42 技術者情報
43 保有スキル情報
50 検知部
51 抽出部
52 提示部
53 選定部

Claims (7)

  1. 複数の位置に配置され、互いに通信可能とされたデータセンタにおいて発生した障害を検知する検知部と、
    過去に発生した障害の対応方法に関する障害対応情報を蓄積する記憶部と、
    前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報が前記障害対応情報にある場合、当該対応方法に関する情報を抽出し、当該対応方法に関する情報がない場合、他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報を抽出する抽出部と、
    を有することを特徴とする情報処理装置。
  2. 前記抽出部は、
    前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報がない場合、前記障害が発生したデータセンタが含まれるエリアの技術水準に類似する技術水準を有するエリアに含まれる他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する障害対応情報を抽出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記抽出部は、
    前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報が前記障害対応情報にない場合、複数の障害の各々に対応する複数の技術水準のうち、前記障害に対応する技術水準に基づいて、前記障害が発生したデータセンタが含まれるエリアの技術水準に類似する技術水準を有するエリアに含まれる他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する障害対応情報を抽出する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記抽出部により抽出される前記対応方法に関する障害対応情報と、前記記憶部に記憶された技術者に関する情報とに基づいて、前記検知部により検知された障害の対応が可能な技術者を選定する選定部、
    をさらに有することを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  5. コンピュータに、
    複数の位置に配置され、互いに通信可能とされたデータセンタにおいて発生した障害を検知し、
    記憶部に蓄積された、過去に発生した障害の対応方法に関する障害対応情報に、前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報がある場合、当該対応方法に関する情報を抽出し、当該対応方法に関する情報がない場合、他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報を抽出する、
    処理を実行させることを特徴とする情報処理プログラム。
  6. コンピュータが、
    複数の位置に配置され、互いに通信可能とされたデータセンタにおいて発生した障害を検知し、
    過去に発生した障害の対応方法に関する障害対応情報を蓄積した記憶部に、前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報がある場合、当該対応方法に関する情報を抽出し、当該対応方法に関する情報がない場合、他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報を抽出する、
    処理を実行することを特徴とする情報処理方法。
  7. 複数の位置に配置され、互いに通信可能とされたデータセンタと、
    前記データセンタで運用されるシステムにおいて発生した障害を検知する検知部と、
    過去に発生した障害の対応方法に関する障害対応情報を蓄積する記憶部と、
    前記障害が発生したデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報が前記記憶部にある場合、当該対応方法に関する情報を抽出し、当該対応方法に関する情報がない場合、他のデータセンタにおいて過去に前記障害が発生した際の対応方法に関する情報を抽出する抽出部と、を有する情報処理装置と、
    を備えたことを特徴とするデータセンタシステム。
JP2015059640A 2015-03-23 2015-03-23 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム Withdrawn JP2016181021A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015059640A JP2016181021A (ja) 2015-03-23 2015-03-23 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム
US15/001,293 US20160285674A1 (en) 2015-03-23 2016-01-20 Information processing apparatus, information processing method, and data center system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015059640A JP2016181021A (ja) 2015-03-23 2015-03-23 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム

Publications (1)

Publication Number Publication Date
JP2016181021A true JP2016181021A (ja) 2016-10-13

Family

ID=56976032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015059640A Withdrawn JP2016181021A (ja) 2015-03-23 2015-03-23 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム

Country Status (2)

Country Link
US (1) US20160285674A1 (ja)
JP (1) JP2016181021A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181022A (ja) * 2015-03-23 2016-10-13 富士通株式会社 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム
CN106294066B (zh) * 2016-08-01 2019-01-15 北京百度网讯科技有限公司 报警数据处理方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1215845A1 (en) * 2000-12-14 2002-06-19 BRITISH TELECOMMUNICATIONS public limited company System and method for accessing an application server
US8135836B2 (en) * 2005-11-30 2012-03-13 Alcatel Lucent Tie resolution in application load level balancing
US8819220B2 (en) * 2010-09-09 2014-08-26 Hitachi, Ltd. Management method of computer system and management system

Also Published As

Publication number Publication date
US20160285674A1 (en) 2016-09-29

Similar Documents

Publication Publication Date Title
JP6421600B2 (ja) 障害監視装置、障害監視プログラム、障害監視方法
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
US9619314B2 (en) Management system and management program
US10462027B2 (en) Cloud network stability
EP2523115B1 (en) Operation management device, operation management method, and program storage medium
KR101971013B1 (ko) 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법
WO2020029407A1 (zh) 告警数据的管理方法、装置、计算机设备及存储介质
JP5477602B2 (ja) サーバの信頼性可視化方法、計算機システム及び管理サーバ
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
JP4598065B2 (ja) 監視シミュレーション装置,方法およびそのプログラム
JP6009089B2 (ja) 計算機システムを管理する管理システム及びその管理方法
JP6482984B2 (ja) クラウド管理方法及びクラウド管理システム
US9021078B2 (en) Management method and management system
JP2016181021A (ja) 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム
JP2016181022A (ja) 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム
JP2017211806A (ja) 通信の監視方法、セキュリティ管理システム及びプログラム
JP6060123B2 (ja) 影響範囲特定装置、影響範囲特定方法、及びプログラム
JP6972735B2 (ja) 表示制御プログラム、表示制御方法及び表示制御装置
JP6636656B2 (ja) 管理システム、管理装置、および管理方法
US20140032159A1 (en) Causation isolation using a configuration item metric identified based on event classification
JP5311027B2 (ja) 障害診断装置および障害診断プログラム
JP2013073389A (ja) 障害分析装置、障害分析方法、およびプログラム
CN116501460A (zh) 一种云主机动态迁移监测预警方法
JP2011159234A (ja) 障害対応システム及び障害対応方法
CN112272126A (zh) 业务应用的失效监测方法、计算机设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20181122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181130