JPWO2014103071A1 - 対処方法作成プログラム、対処方法作成方法、及び情報処理装置 - Google Patents

対処方法作成プログラム、対処方法作成方法、及び情報処理装置 Download PDF

Info

Publication number
JPWO2014103071A1
JPWO2014103071A1 JP2014554046A JP2014554046A JPWO2014103071A1 JP WO2014103071 A1 JPWO2014103071 A1 JP WO2014103071A1 JP 2014554046 A JP2014554046 A JP 2014554046A JP 2014554046 A JP2014554046 A JP 2014554046A JP WO2014103071 A1 JPWO2014103071 A1 JP WO2014103071A1
Authority
JP
Japan
Prior art keywords
coping method
coping
usefulness
new
tenant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014554046A
Other languages
English (en)
Other versions
JP6119767B2 (ja
Inventor
裕司 溝渕
裕司 溝渕
松本 安英
安英 松本
小高 敏裕
敏裕 小高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2014103071A1 publication Critical patent/JPWO2014103071A1/ja
Application granted granted Critical
Publication of JP6119767B2 publication Critical patent/JP6119767B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0859Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

対処方法作成プログラムにおいて、1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、前記新システムと所定の類似度を持つ1以上の既存システムを抽出し、抽出した前記既存システムに対応する所定のイベントに対する対処方法を用いて前記新システムについてのイベント対処方法の候補を作成する、処理をコンピュータに実行させる。

Description

本願は、システム運用等に対する対処方法を作成する対処方法作成プログラム、対処方法作成方法、及び情報処理装置に関する。
従来では、マシンリソースを必要な時に必要なだけ調達することができるクラウドコンピューティングが知られている。クラウドコンピューティングは、リソースを複数人で共有することによる低コスト化を実現できるため、多様なユーザによる利用が促進されることが予想される。
また、クラウドコンピューティングが主流となれば、クラウドの自動運用により、テナント(例えば、クラウドユーザ毎等に設けられるシステム)毎に個別に運用を行う形態が広まることが予想される。クラウドの自動運用化については、予め各種の対処方法を作成し、作成した対処方法を用いて自動運用化が行われる。ここで、対処方法とは、例えば自動運用するための各種のルール等であり、どのような障害や問題事項等(イベント)に対して、どのように対処を行うか等を記述したものである。
対処方法を用いた自動運用の例としては、予め運用に必要となる運用方法の一式を纏めた対処方法を用意する方法や、対処グラフを用いた運用方法が存在する。対処グラフを用いた運用方式とは、システムで起きるイベントの因果関係を対処グラフとして可視化し、そのグラフを利用して実際のシステムで観測されたイベントに応じて対処を行う方式である。
対処グラフの作成は、例えば過去の対処履歴と、イベントとの因果関係を所定の手法で紐づけるものであり、例えば人が因果関係を判定する方法や統計的に因果関係を推定する方法が存在する。また、近年では、システム運用方式に影響する構成変更や新規配備を行うテナントに対し、即座に対処方法を作成して自動運用を行うために、対処グラフの因果関係のペアを分割して管理する手法が知られている。具体的な対処方法としては、例えば対処要素図を作成したり、新規アプリケーション(以下、「アプリケーション」を「アプリ」を略称する)用の対処グラフを作成している。対処要素図は、クラウド上の全てのアプリの対処案グラフを一組の因果関係毎に分割し、各因果関係を要素(対処グラフ要素)とするアプリ特性毎の集合を管理するものである。また、新規アプリ用の対処グラフは、新規アプリの特性に対応する対処グラフ要素の集合を取得し、因果関係を接続するものである。
なお、情報システムにおいて、過去に発生した障害の対処事例を知識化し、知識化によって得られた障害対処知識を用いて、障害発生時に、その障害の症状に基づいて対処方法を推薦する手法が知られている。また、過去の業務遂行事例を業務手順に沿ってノウハウとして分類蓄積し、新たな業務を効率的に遂行するために、障害が発生した場合の障害対策を蓄積した過去の業務遂行事例を用いて支援する手法が知られている(例えば、特許文献1及び2参照)。
特開2010−72834号公報 特開平8−314751号公報
しかしながら、従来手法では、過去に起きた障害や問題事項等(イベント)に対する対処の全てを対処方法に含めるため、不必要な対処方法まで含まれてしまい、適切な対処方法を選択するのに時間がかかっていた。
そこで、1つの側面では、上記の問題点に鑑みてなされたものであり、システム運用等に対する適切な対処方法を作成することを目的とする。
一態様における対処方法作成プログラムは、1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、前記新システムと所定の類似度を持つ1以上の既存システムを抽出し、
抽出した前記既存システムに対応する所定のイベントに対する対処方法を用いて前記新システムについてのイベント対処方法の候補を作成する、処理をコンピュータに実行させる。
運用等に対する適切な対処方法を作成することができる。
本実施形態における運用対処方法作成システムの一例を示す図である。 情報処理装置の機能構成の一例を示す図である。 情報処理装置のハードウェア構成の一例を示す図である。 本実施形態における運用対処方法作成処理の一例を示すフローチャートである。 各対処方法の有用度算出処理の一例を示すフローチャートである。 対処方法決定処理の一例を示すフローチャートである。 運用対処方法作成の具体例を説明するための図である。 システム構成情報の一例を示す図である。 対処方法一覧の作成の様子を説明するための図である。 対処履歴DBの具体例を示す図である。 タイミングを評価する様子を説明するための図である。
以下、図面に基づいて実施形態を説明する。なお、以下の説明では、一例として、新規に作成したり、構成変更した新システムに対して、運用上で生じる障害や問題事項(イベント)等に対する対処方法を作成する例について説明する。
<運用対処方法作成システム例>
図1は、本実施形態における運用対処方法作成システムの一例を示す図である。図1に示す運用対処方法作成システム10は、情報処理装置11と、対処履歴データベース(以下、「データベース」を「DB」という)12と、管理者端末13と、クラウドシステム14とを有する。なお、情報処理装置11と、対処履歴DB12と、管理者端末13と、クラウドシステム14とは、例えばインターネット等に代表される通信ネットワーク15によりデータの送受信が可能な状態で接続されている。
情報処理装置11は、例えば新規作成やシステム運用方式に影響する構成変更等を行う新テナント(新システム)に対して、迅速かつ適切な対処方法を作成し、作成した対処方法を用いてテナントを自動運用させる。なお、テナントとは、例えばクラウドシステム14を利用するユーザ毎の運用形態(例えば、店情報(サーバの種類や数、各機器の配列情報、アクセスパターン、使用するアプリケーション等のうち、少なくとも1つを含む))等である。
例えば、情報処理装置11は、1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、新システムと所定の類似度を持つ1以上の既存システムを抽出する。また、情報処理装置11は、抽出した既存システムに対応する所定のイベントに対する対処方法を用いて新システムについてのイベント対処方法の候補を作成する。既存システムとは、例えばクラウドシステム14に含まれるクラウドコンピューティングにより実現されたシステムであってもよく、通信ネットワーク15により接続されるその他のシステムであってもよい。
情報処理装置11は、1又は複数の既存システムで過去に実施された対処方法(対処実績)等の履歴情報に基づいて、各対処方法の有用度を求める。有用度とは、例えば既存システムで利用している対処方法が新システムで利用できるか否かを示す指標となるものである。
また、情報処理装置11は、既存システムで利用している有用度が高い(例えば、所定の閾値以上)対処方法を新システムの対処方法に採用し、新システムに対応する対処方法(例えば、対処グラフ等)を作成する。情報処理装置11は、有用度を用いて対処方法の評価を行うことで、新システムのリリース直後から効果的な対処を過不足なく対処方法に盛り込むことができ、効率の良い適切な運用が可能になる。
情報処理装置11は、例えば汎用のPersonal Computer(PC)やサーバ等を用いることができるが、これに限定されるものではなく、例えばタブレット端末やスマートフォン等の情報通信端末であってもよい。
対処履歴DB12は、過去の運用における対処履歴情報が記憶されている。なお、対処履歴DB12は、多種の情報の集合物であり、記憶された各種情報を、例えばキーワード等を用いて検索し、抽出することができるように体系的に構成されている。また、新システムに対する対処方法が決定された場合には、その情報によって対処履歴DB12が更新される。
対処履歴DB12は、図1に示すように通信ネットワーク15を介して接続可能な状態で設けられていてもよく、情報処理装置11の内部に設けられていてもよい。
管理者端末13は、運用対処方法作成システム10全体又は各テナント等を管理する管理者等が使用する端末である。管理者端末13は、例えばブラウザ機能やコマンドライン等を用いて、情報処理装置11やクラウドシステム14等に新システムの構成情報等を送信し、新システム等に対する運用対処方法の作成等を行わせる。管理者端末13としては、例えばPCやサーバ、タブレット端末、スマートフォン等の情報通信端末等があるが、これに限定されるものではない。
クラウドシステム14は、例えば通信ネットワーク15に含まれるインターネット等をベースとしたコンピュータの利用形態であり、クラウドコンピューティング等を実現するためのクラウド環境である。クラウドシステム14は、例えば1又は複数のユーザが運用する既存システムを管理するデータセンタとしての機能等を含む。クラウドシステム14は、利用するユーザ毎のテナント情報等も管理することができる。ユーザは、クラウドシステム14によって、目的とする運用上のコンピュータ処理を、通信ネットワーク15を介してサービスとして利用することができる。
ここで、図1に示すクラウドシステム14では、一例としてテナント用運用管理サーバ21やアプリサーバ22、DBサーバ23等を有しているが、数や種類等についてはこれに限定されるものではない。
テナント用運用管理サーバ21は、例えばクラウドシステム14を利用するユーザ毎の既存システムの運用形態(テナント情報)、運用状況、運用履歴等を管理する。テナント用運用管理サーバ21は、管理者端末13等から新システムの配備依頼を受け取ると新システムの構成等を決定することもできる。
アプリサーバ22は、例えば情報処理装置11や管理者端末13等から要求のあったサービスやシステム等に応じて所定のアプリ(例えば、ウェブアプリ等)を用いて対応する処理を実行する。DBサーバ23は、クラウドシステム14上で実行された実行履歴や入力データ、処理実行結果等の各種データを記憶する。
クラウドシステム14は、情報処理装置11や管理者端末13等からのサービス要求を受け、受け付けた要求内容に対応する所定の処理(業務、運用)等を行うことができる。
例えば、本実施形態では、クラウドシステム14内に新システムを配備したいテナント管理者が、管理者端末13から新システムの構成の配備依頼を行う。この依頼内容は、テナント用運用管理サーバ21で受け付けられ、テナント用運用管理サーバ21から新システム用の対処方法の作成依頼が情報処理装置11に送信される。なお、管理者端末13からの配備依頼が、直接情報処理装置11に送信されてもよい。
情報処理装置11は、クラウドシステム14に配備された既存のテナントから標本とするテナントを抽出し、抽出されたテナントから集約された対処履歴から同一の対処方法毎に纏め、各対処種別の有用度を算出する。また、情報処理装置11は、算出された有用度に基づいて、新システムに採用する対処方法を作成する。これにより、作成した対処方法が、新システムの以後の運用に用いられる。
<情報処理装置11の機能構成例>
次に、情報処理装置11の機能構成例について図を用いて説明する。図2は、情報処理装置の機能構成の一例を示す図である。図2に示す情報処理装置11は、入力手段31と、出力手段32と、記憶手段33と、標本抽出手段(抽出手段)34と、有用度算出手段35と、対処方法作成手段36と、画面生成手段37と、送受信手段38と、制御手段39とを有する。
入力手段31は、情報処理装置11を使用するユーザ等からの運用対処方法作成処理に関する各種指示の開始や終了等の入力や、設定情報等の入力等を受け付ける。入力手段31は、例えばキーボードやマウス等である。また、入力手段31は、音声等による入力であってもよく、その場合には、マイク等の音声入力手段等を有する。
出力手段32は、入力手段31により入力された内容や、入力内容に基づいて実行された内容等の出力を行う。出力手段32は、例えば画面表示により出力するのであればディスプレイ等の表示手段を有し、音声により出力するのであれば、スピーカ等の音声出力手段を有する。
記憶手段33は、本実施形態において必要となる各種情報を記憶する。記憶手段33は、例えば本実施形態を実行するための各種設定情報等を記憶することができる。記憶手段33は、記憶された各種情報を必要に応じて所定のタイミングで読み出したり、運用対処方法作成処理に関する実行結果等を書き込んだりすることができる。
記憶手段33は、例えばキーワード等を用いて検索することで、記憶された情報の中からキーワードに対応する情報を抽出することができるように体系的に構成されているデータベースとしての機能も有していてもよい。その場合、記憶手段33は、上述した対処履歴DB12等を記憶してもよい。
標本抽出手段34は、クラウドシステム14上で管理されている既存のテナント(既存システム)のうち、全テナント又は所定の条件により選択された所定数のテナントに関するシステム構成情報を抽出する。
所定の条件としては、例えばクラウドシステム14に管理されている全テナントのシステム構成と、新システム(新テナント)のシステム構成とが、所定の類似度を持つ1以上のテナントとしてもよい。この場合、例えば新システムとの類似度が高い1以上のテナントが選択される。また、所定の条件としては、例えばクラウドシステム14に管理されている全テナントのうち、ランダムに抽出された所定数のテナントとしてもよい。また、所定の条件としては、所定期間内に新規に追加されたり、構成が変更されたテナントとしてもよい。
システム構成情報とは、例えばテナント(店)に対するサーバの種類や数、機器の配列情報、アクセスパターン、使用するアプリケーション等のうち、少なくとも1つを含むが、これに限定されるものではない。標本抽出手段34は、抽出したテナント毎に、過去に実施した対処方法の一覧を作成したり、対処履歴DB12に記憶された対処履歴等を抽出する。
有用度算出手段35は、標本抽出手段34で抽出されたシステム構成情報や対処履歴から各対処方法の有用度を算出する。また、有用度算出手段35は、算出された有用度により各対処方法を評価し、新システムに採用する対処方法を決定する。有用度は、例えば所定の評価関数を用いて算出することができるが、これに限定されるものではない。
対処方法作成手段36は、有用度算出手段35により新システムに採用すると決定された対処方法に基づいて、新システム用の対処方法を作成する。例えば、対処方法作成手段36は、有用度算出手段35により得られる対処方法の情報から、所定条件に基づくイベントの因果関係のペアを繋げる。また、対処方法作成手段36は、因果関係と対処とを繋げて、対象システムの運用等で生じる障害等の各イベントに対する対処グラフの候補を作成する。なお、対処方法作成手段36により作成される内容は、対処グラフに限定されるものではない。
画面生成手段37は、本実施形態における運用対処方法を作成するための開発環境(エディタ)画面や各種設定情報等の入力画面、運用対処方法作成後の内容等を表示するための画面を生成する。画面生成手段37で生成された画面は、出力手段32のディスプレイ等に出力される。
送受信手段38は、本実施形態で実行される各処理に必要な情報や、運用等に対する適切な対処方法作成処理を実現するための実行プログラム(例えば、対処方法作成プログラム)等を送受信することが可能な通信インターフェースである。送受信手段38は、通信ネットワーク15を介して、クラウドシステム14にサービス要求を行ったり、クラウドシステム14から各種情報を取得することができる。また、送受信手段38は、通信ネットワーク15を介して、対処履歴DB12や管理者端末13、その他の外部装置等に対して各種情報を送受信することができる。
制御手段39は、情報処理装置11の各構成全体の制御を行う。例えば、制御手段39は、標本抽出や対処有用度決定、対処方法作成、画面生成、送受信等における処理等のうち、少なくとも1つを制御する。
なお、情報処理装置11は、例えば上述した各機能のうち、少なくとも1つを有する複数の装置に分かれて構成されていてもよい。その場合には、例えば上述した標本抽出手段34、有用度算出手段35、又は対処方法作成手段36における機能を有する別装置として構成することができるが、これに限定されるものではない。
<情報処理装置11:ハードウェア構成例>
次に、情報処理装置11のハードウェア構成例について図を用いて説明する。図3は、情報処理装置のハードウェア構成の一例を示す図である。図3に示すハードウェア構成例は、入力装置41と、出力装置42と、ドライブ装置43と、補助記憶装置44と、主記憶装置45と、各種制御を行うCentral Processing Unit(CPU)46と、ネットワーク接続装置47とを有し、これらはシステムバスBで相互に接続されている。
入力装置41は、例えば情報処理装置11のユーザ等が操作するキーボードやマウス等のポインティングデバイス等を有しており、例えばユーザ等からのプログラムの実行等、各種指示信号等を入力する。
出力装置42は、本実施形態における処理を行うコンピュータ本体を操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、CPU46が実行する制御プログラムの実行経過や結果等を表示する。
ここで、情報処理装置11のコンピュータ本体にインストールされる実行プログラム(対処方法作成プログラム)は、例えば記録媒体48等により提供される。ドライブ装置43は、記録媒体48に記録された実行プログラム等の各種データを読み込む。つまり、記録媒体48は、ドライブ装置43にセット可能であり、記録媒体48に含まれる実行プログラムが、記録媒体48からドライブ装置43を介して補助記憶装置44にインストールされる。ドライブ装置43は、セットされた記録媒体48が書き込み可能である場合に、例えばプログラムを実行することで得られた実行結果等のデータを書き込むこともできる。
補助記憶装置44は、ハードディスクドライブやSolid State Drive(SSD)等のストレージ手段であり、本実施形態における実行プログラムや制御プログラム等を記憶し、必要に応じて入出力を行う。
主記憶装置45は、CPU46により補助記憶装置44から読み出された実行プログラム等を格納する。主記憶装置45は、例えばRead Only Memory(ROM)やRandom Access Memory(RAM)等であるが、これに限定されるものではない。
CPU46は、Operating System(OS)等の制御プログラム、及び主記憶装置45に格納されている実行プログラム等に基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御する。これにより、本実施形態では、対処方法作成における各処理を実現する。なお、プログラム実行中に必要な各種情報等は、CPU46により補助記憶装置44等から取得される。また、実行結果等は、CPU46により補助記憶装置44等に格納される。
ネットワーク接続装置47は、通信ネットワーク15を介して、対処履歴DB12、管理者端末13、クラウドシステム14、その他の外部装置等とデータの送受信を可能とする通信インターフェースである。ネットワーク接続装置47は、実行プログラムや各種データを取得したり、プログラムを実行することで得られた実行結果又は本実施形態に対応する実行プログラム自体を外部装置等に提供することができる。
記録媒体48は、上述したように実行プログラム等を格納するコンピュータで読み取り可能な記録媒体である。記録媒体48は、例えばUniversal Serial Bus(USB)メモリやCD−ROM、DVDディスク等の可搬型記録媒体であってもよく、フラッシュメモリ等の半導体メモリであってもよい。なお、図3に示すハードウェア構成は、管理者端末13におけるハードウェア構成として適用することもできる。
<運用対処方法作成処理例>
ここで、本実施形態における運用対処方法作成処理例について、フローチャートを用いて説明する。図4は、本実施形態における運用対処方法作成処理の一例を示すフローチャートである。
図4の例において、運用対処方法作成処理は、例えば情報処理装置11や管理者端末13のユーザ(例えば、管理者)等からの実行指示により、運用対処方法を作成する新システムの構成情報等を受け付ける(S01)。
次に、運用対処方法作成処理は、標本とするテナントを抽出する(S02)。抽出されるテナントは、例えばクラウドシステム14で管理されている既存テナント(既存システム)のうち、全てのテナントでもよく、所定の条件に当てはまるテナントでもよい。なお、所定の条件としては、例えばクラウドシステム14に管理されている全テナントのうち、新システム(新テナント)とシステム構成の類似するテナントとしてもよく、ランダムに抽出された所定数のテナントとしてもよい。また、所定の条件としては、所定期間内に新規に追加されたり、構成が変更されたテナントとしてもよい。S02の処理では、標本として選択されたテナントのシステム構成情報等を抽出する。
運用対処方法作成処理は、抽出した各テナントで、過去に実施した対処履歴(対処実績)等を抽出し(S03)、抽出された対処履歴と、S02の処理で得られたシステム構成情報等を用いて、各対処方法の有用度を算出する処理を行う(S04)。
また、運用対処方法作成処理は、S04の処理で得られる有用度を用いて各対処方法を評価し、新システムに採用する対処方法を決定する処理を行い(S05)、決定された結果に基づいて、新システムの運用上で生じる障害等の各イベントに対する対処方法を作成する(S06)。
<S04:各対処方法の有用度算出処理>
ここで、上述したS04の処理における各対処方法の有用度算出処理の一例について、フローチャートを用いて説明する。図5は、各対処方法の有用度算出処理の一例を示すフローチャートである。
図5の例において、有用度算出処理は、対処方法が実施されたテナントと新システムとの類似度を算出する(S11)。また、有用度算出処理は、対処方法が実施されたタイミングを評価し(S12)、対処方法による効果の有無を算出する(S13)。
また、有用度算出処理は、上述した各処理の結果を掛け合わせて算出している対処方法の有用度へ加算する(S14)。ここで、有用度算出処理は、未算出の対処履歴が存在するか否かを判断し(S15)、未算出の対処履歴が存在する場合(S15において、YES)、S21の処理に戻り、他の対処履歴について同様の処理を行う。また、有用度算出処理は、未算出の対処処理が存在しない場合(S15において、NO)、処理を終了する。
<S05:対処方法決定処理>
次に、上述したS05の処理における対処方法決定処理の一例について、フローチャートを用いて説明する。図6は、対処方法決定処理の一例を示すフローチャートである。図6の例において、対処方法決定処理は、新システムへの採用の可否を決めるための閾値を設定する(S21)。
なお、閾値は、例えば管理者等により予め設定された値でもよく、例えば有用度算出処理で算出された全有用度の平均値でもよいが、これに限定されるものではない。例えば、閾値は、上述した平均値に対して任意倍数による分散を加えて得られた値としてもよい。また、閾値は、前回使用した閾値をそのまま用いてもよく、例えば対象の新システムの種類や分野、運用形態等に応じて任意に変更することができる。
また、対処方法決定処理は、上述した有用度算出処理により得られる有用度と、S21の処理により設定された閾値とを比較して各対処方法の採用の可否を決定する(S22)。S22の処理により、例えば1又は複数の対処方法の候補が作成される。
<有用度について>
次に、上述した有用度算出手段35における有用度について具体的に説明する。
まず従来手法において、対処方法を作成する場合には、例えば過去に起きた問題に対する対処方法を全て含める。そのため、従来手法では、不必要な対処方法まで含めてしまい、適切な対処を選択するのに時間がかかってしまう。例えば、従来手法では、より効果の高い新しい対処方法が存在するにも関わらず過去に多く利用していた対処方法が含まれてしまう可能性があった。
そこで、本実施形態では、例えば直近に実施された対処方法ほど適切な対処であると判断し、有用度が高くなるように設定する。なお、直近に実施された対処方法とは、例えば対処方法作成指示があった時間を基準にして対処履歴DB12を参照した場合に、実際に対処した時間が、対処方法作成指示時間に最も近い又は最も近いものから所定数の対処方法を示す。
これにより、以後同様の問題が発生した場合には、直近に実施された対処方法が利用されるようになる。例えば、レスポンス悪化という障害(イベント)の発生に対して直近の対処方法でスケールアウト等が実施された場合には、その対処方法の有用度が高くなるように設定する。したがって、本実施形態では、より効果の高い新しい対処方法を新システムの対処方法に採用することができる。
また、本実施形態では、システムリリース直後に起きた問題は無視できない。これは、システムリリース直後の一定期間は、故障率が高いためである。したがって、本実施形態では、直近にリリースされたテナントで実施された対処ほど有用度が高くなるように設定する。
また、従来手法では、対象システムと、その他のシステムとの運用形態(例えば、サーバの種類や数、機器の配列情報、アクセスパターン等)の類似性が加味されていないため、構成の差異が起因する流用不可能な対処方法まで候補に入れてしまっていた。
そこで、本実施形態では、例えば新規作成又は構成変更された新システムに類似する既存システムで実施された対処ほど有用度が高くなるように設定する。つまり、本実施形態では、上述した観点等から、例えば新システム等で必要となる対処の有用度を所定の評価関数を用いて求め、その評価結果から有用度が高いものを新システムに対する対処方法の候補に加える。ここで、上述した内容等を含めた有用度(Usefulness)の一例は、例えば以下に示す評価関数式((1)式)で表すことができる。
Figure 2014103071
上述した(1)式の例では、抽象した標本対象となるテナント数をNとした場合のテナントの類似度(Similarity(S,S))と、対処が行われたタイミングの評価式(Timing(t))と、対処の結果(Result)とを掛け合わせることによって有用度を算出することができる。
テナントの類似度とは、例えば新テナント(新システム)と、標本となるテナントとの類似度を示す。また、対処が行われたタイミングの評価式とは、例えば対処が行われたタイミングから、その対処の有用度を評価する式を示し、評価対象OがテナントCで実施され、対処された時間をtとしたものを意味する。
また、対処の結果とは、例えば対処の結果として効果があったものは"1"、効果がなかったものは"0"として評価する。なお、効果の有無は、ユーザにより設定されてもよく、対処方法の実行前と実行後との結果を比較し、目的とした効果が得られていた場合に、効果があったと判断してもよい。対処の結果については、"1"、"0"だけに限定されず、例えば効果のレベルに応じて"1"、"0.5"、"0.2"、"0"等の重み付けがされていてもよい。
ここで、本実施形態において、システム構成を決定する因子例としては、例えばシステムのマシン構成、各マシンのソフトウェアスタック(ミドルウェア、アプリ)、システムの使用状況(平均的なアクセス量、最大アクセス値、最小アクセス値、アクセス分布)、システム構成の変更履歴や周期的なアクセスパターン、Service Level Agreement(SLA)等があるが、これに限定されるものではない。
また、上述した類似度(Similarity)の算出には、例えばコサイン関数ベース(Cosine−based similarity)、相関関係ベース(Correlation−based similarity)、調整コサインベース(Adjusted cosine−based similarity)等を用いることができるが、これに限定されるものではない。
タイミングの評価式(Timing(t))は、例えば以下に示す(2)式のように表すことができる。
Figure 2014103071
上述した(2)式において、tは対処したときの時間を示し、tは評価対象システム(具体的には、評価対象となっている既存システム)のリリースからの経過時間を示している。
つまり、(2)式では、直近の対処と、システムのリリース直後の対処ほど、重要であると評価されることになる。上述した(2)式において、tのスケールは、例えば1か月や1日等、任意に設定することができるが、これに限定されるものではない。
なお、tは、値が大きくなるほど、対処方法が実施されたシステムの成熟度が大きいことを意味する。本実施形態では、成熟度が大きいほど、リリース直後と直近の対処が際立って重要と評価される。
一方、未熟なシステムでは、成熟なシステムほど重みづけに差がない。本実施形態では、未熟なシステムでの対処ほど、全体を通じて評価が高くなるようになっている。これは、直近にリリースされた未成熟なシステムは、それが最近であればあるほど、そこで起きた対処を無視できないことを意味する。
また、本実施形態では、上述した(1)式に示すように、例えばあるシステムの運用方式を新規に作成する場合に、別のシステムにおいて実施実績のある対処の有用度を所定の評価方式の積に基づいて評価する。
つまり、本実施形態における評価の一例としては、例えば対処が実施されたその当時のシステムが新規に運用方式を作成するシステムに類似するほど有用度を高くする。また、評価の一例としては、例えば対処が実施されたタイミングが直近又はリリース直後ほど有用度を高くしてもよい。上述した評価方式は、例えば実施されたシステムの稼働期間に応じて、直近とリリース直後がより強く評価される。更に、評価の一例としては、例えば実際にその対処方法を実施して、その効果があった数が多いほど有用度を高くしてもよい。
このように、本実施形態では、有用度を用いた評価を行うことで、リリース直後から効果的な対処が過不足なく対処方法に盛り込むことができ、適切な対処方法を作成することができる。また、本実施形態では、作成した対処方法を用いて効率の良い運用が可能になる。
<運用対処方法作成の具体例>
次に、上述した本実施形態を適用した運用対処方法作成の具体例について説明する。図7は、運用対処方法作成の具体例を説明するための図である。図7の例では、運用対処方法作成システム50において、例えば情報処理装置11が管理者端末13等からの指示により新テナント51をクラウドシステムに配備する場合に、新テナント51の運用対処方法を作成する例を示している。
図7に示すような新テナント51は、ロードバランスサーバ(以下、「LB」という)と、並列に接続された2台のアプリサーバ(以下、「AP」という)と、DBサーバ(以下、「DB」という)を有する。また、新テナント51は、LBと、APと、DBとがそれぞれ階層を構成している。つまり、新テナント51は、キャッシュなしウェブ3階層アプリシステムの例を示している。
ここで、図7に示すような新テナント51を作成する場合には、対応する新しい運用等の対処方法が必要になる。そのため、本実施形態では、上述したクラウドシステム14を参照し、クラウドシステム14に含まれる複数のテナントを利用して、新テナント51のシステムに対応する対処方法を作成する。図7の例では、テナント1〜3の各機器構成が示されているが、テナント数や機器構成等については、これに限定されるものではない。また、各テナントに関する情報は、例えばDBサーバ23等に記憶され、テナント用運用管理サーバ21等により管理される。
<各テナントのシステム構成情報>
ここで、クラウドシステム14が管理するシステム構成情報の一例について、図を用いて説明する。図8は、システム構成情報の一例を示す図である。図8(A)は、上述した図7に示すクラウドシステム14に含まれる各テナントの一例を示し、図8(B)は、クラウドシステム14に含まれる各テナントに対するシステム構成情報の一例を示している。
図8(A)には、一例として、既存のテナント1〜3のシステム構成が示されている。テナント1には、LBと、APと、DBとが直列で接続されている。テナント2には、新テナント51と同様の構成が接続されている。テナント3には、テナント2の構成に、更にキャッシュサーバ(以下、「Cache」という)が接続されている。つまり、テナント3のシステム構成は、キャッシュありウェブ3階層アプリシステムである。
図8(B)に示すシステム構成情報の項目は、例えば「テナントID」、「システム作成日時」、「システム構成」、「アクセスパターン(平均リクエスト数)」、「アクセスパターン(リクエスト数の分散)」等であるが、これに限定されるものではない。また、図8(B)の例では、テナント1〜6と新テナントに対するデータが格納されているが、テナント数等についてはこれに限定されるものではない。
「テナントID」は、クラウドシステム14における管理対象のテナントを識別するための識別情報を示している。図8(B)の例では、説明の便宜上、上述した新テナント51に対応するテナントIDを"新テナント"として示している。
「システム作成日時」は、テナントを新しく作成した日時が格納される。また、「システム作成日時」は、既存のシステム構成を変更して更新した場合にも、その更新日時が格納される。なお、図8(B)の例では、日にちのみを示しているが、時間情報も含めて格納することができる。
「システム構成」は、実際にテナントで使用している機器の種類と数とを格納する。なお、初期値には、"0"がセットされているものとする。
例えば、図8(B)の例において、テナント1では、図8(A)に示すシステム構成に対応させて「LB」、「AP1」、及び「DB」の項目に"1"がセットされる。また、テナント2では、図8(A)に示すシステム構成に対応させて「LB」、「AP1」、「AP2」、及び「DB」に"1"がセットされる。また、テナント3では、図8(A)に示すシステム構成に対応させて「LB」、「AP1」、「AP2」、「DB」、及び「Cache」に"1"がセットされる。
なお、図8(B)の例では、APについて「AP1」、「AP2」、「AP3」と個別の項目を設けたが、これに限定されるものではなく、例えばテナント2の場合には、「AP」の項目を1つ設けて、その項目に"2"等をセットしてもよい。
「アクセスパターン(平均リクエスト数)」は、そのテナントへの所定時間間隔におけるアクセスリクエスト数から平均リクエスト数を算出し、算出結果に基づいて予め設定された分類のうち、該当するものに"1"をセットする。図8(B)の例では、「小 0〜149」、「中 150〜300」、「大 301〜」が示されているが、分類や数値等についてはこれに限定されるものではない。
「アクセスパターン(リクエスト数の分散)」は、そのテナントへの所定期間におけるユーザからのアクセスリクエスト数の分散値に基づいて、予め設定された分類「小」、「中」、「大」のうち、該当するものに"1"をセットする。分類については、これに限定されるものではない。
なお、新テナントについては、実際に運用される前であればアクセスパターンは算出できないため、推定される1又は複数のアクセスパターンに"1"をセットする。また、新システムにおけるアクセスパターンは、例えば管理者等が指定したSLAを基に設定されてもよく、所定のポリシー(例えば、最小構成)等に基づいて設定されてもよい。
本実施形態では、上述したシステム構成、平均リクエスト数、リクエスト数の分散を用いて、システム構成の特徴をベクトル化し、ベクトル化した値を用いて有用度を算出する。
<標本抽出手法>
次に、上述した標本抽出手段34による標本抽出手法について説明する。本実施形態における標本抽出手法としては、例えばシステム構成情報等を用いて各既存システムと新システムとの類似度(Similarity)が所定の閾値を超えている場合に、その既存システムの情報を抽出する(抽出手法1)。
また、標本の抽出方式としては、例えば上述した抽出手法1に加えて、構成変更の変遷(例えば、システム構成が時系列にどのような変更がされたか)が似ている場合に、類似度が高いものとして、対象の既存システムを抽出する(抽出手法2)。なお、抽出手法については、これに限定されるものではない。
本実施形態では、上述した抽出手法等を用いて標本抽出手段34により抽出された標本となる各テナントのシステム構成情報や、過去に実施した対処方法の一覧等を作成する。
図9は、対処方法一覧の作成の様子を説明するための図である。図9(A)は、対処グラフの一例を示し、図9(B)は、図9(A)に対応する対処方法一覧を示している。
図9(B)に示す対処方法一覧の項目としては、例えば「対処ID」、「対処内容」、1又は複数の「監視項目」等を含むが、これに限定されるものではない。
「対処ID」は、異なる複数の対処方法を識別するための情報である。図9(A)に示すように、1つの対処グラフに対して複数の対処方法が含まれている場合には、複数の対処IDにより管理される。
「対処内容」は、例えば「対処ID」毎の具体的な対処内容である。「監視項目」は、「対処内容」に格納された対処を行う迄の運用時に生じたイベント等の段階的な監視項目である。
例えば、図9(B)の例において、「対処ID」が"OP1"では、「監視項目」が段階的に"レスポンス悪化"→"クエリの実行に時間がかかる"→"DBへのリクエスト数が膨大"→"他のテナントからのDB問い合わせが増大"となった場合には、「対処内容」として"管理者への問い合わせ"が行われる。また、図9(B)の例において、「対処ID」が"OP2"では、「監視項目」が段階的に"レスポンス悪化"→"クエリの実行に時間がかかる"→"DBへのリクエスト数が膨大"→"参照リクエストが増加"となった場合には、「対処内容」として"Cache化"が行われる。
上述した図9(B)に示すような対処方法一覧の作成は、例えば標本抽出手段34等により作成される。対処方法一覧は、記憶手段33に記憶させておき、必要に応じて読み出すことができる。
<対処履歴DB12の具体例>
次に、上述した対処履歴DB12の具体例について、図を用いて説明する。図10は、対処履歴DBの具体例を示す図である。図10に示す対処履歴DB12は、テナント毎に過去に実施された対処履歴を示している。対処履歴DB12の項目としては、例えば「テナントID」、「対処実績」、「行った対処」、「対処日」、「対処結果」等を含むが、これに限定されるものではない。
「テナントID」は、クラウドシステム14に存在する各テナントを識別するための情報である。「対処実績」は、例えばテナント毎に生じた障害等のイベントの発生に対応して生成されるレコード情報である。
「行った対処」は、対処実績に対応して実施された対処内容を格納する。例えば、1つの対処実績に対して複数の対処を行った場合には、その複数の対処を格納する。
「対処日」は、対処を行った日を格納する。「対処日」には、例えば時間情報等を含めてもよい。「対処結果」は、対処の結果として効果があった場合と、効果がなかった場合とを区別するための情報を格納する。図10の例では、「対処結果」として効果があった場合に"○"をセットし、効果がなかった場合に"×"をセットしているが、セットされる情報については、これに限定されるものではない。例えば、「対処結果」には、"1"と"0"、"有"と"無"、"OK"と"NG"等のような区別情報を用いて格納してもよい。
図10の示す対処履歴DB12には、「テナントID」が"テナント1"の場合に、Tenatn1_Record1〜3の3つの対処実績が格納されている。"Tenatn1_Record1"では、"OP1"の対処を、"2011/10/01"に行い、その結果として効果が得られなかったことを示している(「対処結果」が"×")。
また、"Tenatn1_Record2"では、"OP2"の対処を"2011/11/01"に行い、その結果として効果が得られたことを示している(「対処結果」が"○")。また、"Tenatn1_Record3"では、"OP3"の対処を"2011/12/01"に行い、その結果として効果が得られたことを示している(「対処結果」が"○")。
<各対処方法について有用度の算出例>
本実施形態では、上述した各情報を用いて各対処方法に対する有用度を算出する。以下の例では、対処方法"OP1"における有用度を算出する。
図10に示す対処履歴DB12において、対処方法"OP1"が実施された履歴(対処実績)は、"Tenant1_Record1","Tenant2_Record1","Tenant3_Record1","Tenant4_Record1","Tenant5_Record1"になる。したがって、本実施形態では、上述した対処履歴情報と、上述した(1)式とを用いて有用度を求める。以下の例では、"Tenant2_Record1"の場合について説明する。
<類似度算出の具体例>
まず、本実施形態では、既存のテナント(ここでは、"テナント2")と新テナントとの類似度を求める。具体的には、例えば図8(B)に示すシステム構成情報に含まれるテナント2の情報を以下に示す(3)式に代入して、テナント2と新テナントとの類似度を算出する。類似度の算出は、例えばコサインベースの関数で求めることができるが、これに限定されるものではない。
Figure 2014103071
なお、上述した(3)式の算出結果により、テナント2と新テナントとの類似度Similarity(テナント2,新テナント)=3/4であることが分かる。
<相関関係ベースでの類似度算出>
また、類似度算出の他の例として、例えば相関関係ベースで類似度を算出することができる。この場合には、例えば以下に示す定義式((4)式)を用いてAとBとの類似度を算出することができる。
Figure 2014103071
なお、上述した(4)式の変数iは、例えば図8(B)に示す所定の項目数に対応する。
したがって、上述した(4)式の相関関係ベースの類似度算出式を用いて、テナント2と新テナントとの類似度を算出した結果、以下に示す(5)式のようになる。
Figure 2014103071
例えば、上述した(5)式では、テナント2及び新テナントは、共に図8(B)に示すシステム構成、アクセスパターン(平均リクエスト数)、アクセスパターン(リクエスト数の分散)の全項目12個のうち、8個に"1"がセットされている。したがって、それぞれのベクトル値は、8/12=2/3となる。
また同様に、図8(B)に示すシステム構成情報等を用いて、テナント2と新テナントとの相関関係ベースの類似度(Similarity_Corr(テナント2,新テナント))を求めることができる。
<調整コサインベースでの類似度算出>
また、類似度算出の他の例としては、例えば調整コサインベースで求めることができる。この場合には、例えば以下に示す定義式((6)式)を用いてAとBとの類似度を算出することができる。
Figure 2014103071
なお、上述した(6)式の変数iは、例えば図8(B)に示す所定の項目数に対応し、変数cは、各項目に対する評価平均に対応する。
したがって、上述した(6)式の調整コサインベースの類似度算出式を用いて、テナント2と新テナントとの類似度を算出した結果、以下に示す(7)式のようになる。
Figure 2014103071
例えば、上述した(7)式では、図8(B)に示すシステム構成の項目「LB」について、テナント1〜6と新テナントの7個のテナントの全てに"1"がセットされているため、ALB,BLBの評価平均のベクトル値は、7/7=1となる。また、システム構成の項目「AP2」については、テナント1及びテナント4以外の5つのテナントに"1"がセットされている。そのため、AAP3,BAP3の評価平均のベクトル値は、5/7となる。そのようにして、所定の項目に対して評価平均ベクトルを算出することができる。
上述した(7)式におけるAVG_Small(Middle,Large)は、図8(B)におけるアクセスパターン(平均リクエスト数)の小(中,大)に対応している。また、上述した(7)式におけるPATTERN_Small(Middle,Large)は、図8(B)におけるアクセスパターン(リクエスト数の分散)の小(中,大)に相当する。
これにより、テナント2と新テナントとの調整コサインベースの(類似度Similarity_Adjusted_Cos(テナント2,新テナント))を求めることができる。
<タイミング評価の具体例>
次に、本実施形態では、"Tenant2_Record1"が実施されたタイミング(Timing(t))を評価する。
図11は、タイミングを評価する様子を説明するための図である。図11には、上述した図10に示す対処履歴DB12と、図8(B)に示すシステム構成情報とが示されている。上述した情報に対して、所定の尺度を用いてタイミングを評価する。所定の尺度としては、例えば1か月を1として計算することができるが、これに限定されるものではない。
図10の対処履歴DB12及び図8(B)に示すシステム構成情報のデータによれば、"Tenant2_Record1"の場合、テナント2の開始日(システム作成日時"2010/12/01")から対処を実施した日"2011/10/01"まで10か月である(t=10)。
そこで、t(評価対象システムのリリース(システム作成日時"2010/12/01")から新テナントのシステム作成日時"2012/02/01"の経過時間)=14と、t(対処した時点)=10として、タイミングの評価値を図11に示す式により求めると、Timing(t)=(3/14)となる。
<対処結果の具体例>
次に、本実施形態では、"Tenant2_Record1"の対処結果を求める。対処結果として効果があった場合は、"1"とし、効果がなかった場合は"0"とすると、図10の対処履歴DB12によれば、"Tenant2_Record1"の場合に効果があったので"1"となる。
本実施形態では、上述した"Tenant2_Record1"に対する評価の算出例と同様の処理を、対処実績(Record)毎に行う。また、本実施形態では、対処実績毎に得られる類似度、タイミング評価、及び対処結果の値を乗算して、対処実績毎に有用度の算出(評価)を行う。更に、本実施形態では、各対処実績の評価結果を対処方法(OP1、OP2、OP3)毎に加算して、各対処方法の有用度を求める。その結果、OP1、OP2、OP3のそれぞれの有用度(Usefulness)は、以下に示す(8)〜(10)式のようになる。
Figure 2014103071
次に、本実施形態では、上述した各対処に対する有用度に基づいて新システムに採用する対処方法を決定する。本実施形態では、例えば全対処方法に対する有用度の平均値を閾値とし、各対処方法の有用度が閾値以上であれば、新システムに採用する対処方法とする。平均値は、以下に示す(11)式のように算出され、その結果は、0.048となる。
Figure 2014103071
また、上述した(8)〜(10)式に示すようにOP1〜OP3のそれぞれの有用度(Usefulness)は、0.034、0.056,0.053である。
したがって、OP2,OP3は、新システムの対処方法に採用し、OP2,OP3に基づいて新システムの対処方法が作成されることになる。
なお、その他の採用判定方式としては、例えば過去の実施履歴から得られる評価値と、有効に使われた対処方法の件数の統計値とを求め、ある一定以上の対処領域をカバーする評価値を閾値とし、その閾値を用いて採用する対処方法を決定してもよい。
上述したように、本実施形態によれば、1又は複数の既存システムと、新システムとの類似度に基づいて、類似性の高い既存システムを抽出し、抽出した既存システムに対する対処方法を用いて、新システムに対する対処方法の候補を作成することでシステム運用等に対する適切な対処方法を作成することができる。
また、本実施形態によれば、有用度を用いて既存システムにおける過去の対処方法の評価を行うことで、新システムのリリース直後から効果的な対処が過不足なく対処方法に盛り込むことができ、適切な対処方法を作成することができる。また、本実施形態により作成された対処方法を用いることで、効率の良い運用が可能になる。
また、本実施形態によれば、例えば既存の対処グラフから各オペレーション(操作)に対する有用度を算出し、算出された有用度に応じて採用する対処グラフを決定することができる。したがって、本実施形態では、新システム等のように過去の実績がなくても対処グラフを作成でき、障害等のイベントに応じた迅速な対処が可能となる。なお、本実施形態は、上述したクラウドシステムに限定されず、例えば1又は複数のコンピュータ及び1又は複数の中継装置等を備える分散処理システムの運用等にも広く適用することができる。
以上、実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、上述した実施例の構成要素を全部又は複数を組み合わせることも可能である。
10 運用対処方法作成システム
11 情報処理装置
12 対処履歴データベース
13 管理者端末
14 クラウドシステム
15 通信ネットワーク
21 テナント用運用管理サーバ
22 アプリケーションサーバ
23 DBサーバ
31 入力手段
32 出力手段
33 記憶手段
34 標本抽出手段(抽出手段)
35 有用度算出手段
36 対処方法作成手段
37 画面生成手段
38 送受信手段
39 制御手段
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 主記憶装置
46 CPU
47 ネットワーク接続装置
48 記録媒体

Claims (8)

  1. 1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、前記新システムと所定の類似度を持つ1以上の既存システムを抽出し、
    抽出した前記既存システムに対応する所定のイベントに対する対処方法を用いて前記新システムについてのイベント対処方法の候補を作成する、処理をコンピュータに実行させる対処方法作成プログラム。
  2. 抽出した前記既存システムに対応する前記対処方法について、前記新システムに採用する指標を表す有用度を算出し、
    算出した前記有用度に基づいて、新規作成又は構成変更された新システムに採用する対処方法を決定し、
    決定した対処方法を用いて前記新システムに対応する対処方法を作成することを特徴とする請求項1に記載の対処方法作成プログラム。
  3. 前記既存システムと前記新システムとのシステム構成情報の類似性、前記既存システムで過去に実施された対処方法を対応したタイミング、及び、前記対処方法における効果の有無のうち、少なくとも1つに基づいて前記有用度を算出することを特徴とする請求項2に記載の対処方法作成プログラム。
  4. 前記有用度は、
    所定の評価関数を用いて算出することを特徴とする請求項2又は3の何れか1項に記載の対処方法作成プログラム。
  5. 各対処方法に対して算出された有用度が予め設定された閾値以上である場合に、前記新システムに採用する対処方法として決定し、
    前記閾値は、算出された全対処方法に対する有用度の平均値であることを特徴とする請求項2乃至4の何れか1項に記載の対処方法作成プログラム。
  6. 前記1又は複数の既存システムは、クラウドコンピューティングにより実現されたシステムを含むことを特徴とする請求項1乃至5の何れか1項に記載の対処方法作成プログラム。
  7. 1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、前記新システムと所定の類似度を持つ1以上の既存システムを抽出する抽出ステップと、
    前記抽出ステップにより抽出した前記既存システムに対応する所定のイベントに対する対処方法を用いて前記新システムについてのイベント対処方法の候補を作成する対処方法作成ステップと、を有することを特徴とする対処方法作成方法。
  8. 1又は複数の既存システムのシステム構成と、新規作成又は構成変更された新システムのシステム構成との類似度に基づいて、前記新システムと所定の類似度を持つ1以上の既存システムを抽出する抽出手段と、
    前記抽出手段により抽出した前記既存システムに対応する所定のイベントに対する対処方法を用いて前記新システムについてのイベント対処方法の候補を作成する対処方法作成手段と、を有することを特徴とする情報処理装置。
JP2014554046A 2012-12-28 2012-12-28 対処方法作成プログラム、対処方法作成方法、及び情報処理装置 Active JP6119767B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/084222 WO2014103071A1 (ja) 2012-12-28 2012-12-28 対処方法作成プログラム、対処方法作成方法、及び情報処理装置

Publications (2)

Publication Number Publication Date
JPWO2014103071A1 true JPWO2014103071A1 (ja) 2017-01-12
JP6119767B2 JP6119767B2 (ja) 2017-04-26

Family

ID=51020216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014554046A Active JP6119767B2 (ja) 2012-12-28 2012-12-28 対処方法作成プログラム、対処方法作成方法、及び情報処理装置

Country Status (4)

Country Link
US (1) US9866440B2 (ja)
EP (1) EP2940585A4 (ja)
JP (1) JP6119767B2 (ja)
WO (1) WO2014103071A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6387777B2 (ja) 2014-06-13 2018-09-12 富士通株式会社 評価プログラム、評価方法、および評価装置
US9900211B1 (en) * 2014-10-01 2018-02-20 Crimson Corporation Systems and methods for network management
JP6579995B2 (ja) * 2016-04-26 2019-09-25 三菱電機株式会社 静観候補特定装置、静観候補特定方法及び静観候補特定プログラム
JP7339298B2 (ja) * 2021-05-27 2023-09-05 株式会社日立製作所 情報処理システム及び方法並びに装置
JP7165840B1 (ja) * 2021-08-31 2022-11-04 楽天グループ株式会社 不正検知システム、不正検知方法、及びプログラム
JP7457743B2 (ja) 2022-03-22 2024-03-28 Necパーソナルコンピュータ株式会社 情報処理方法、情報処理装置、プログラム及び記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053728A (ja) * 2004-08-11 2006-02-23 Nec Corp 障害対処ルール伝播方法、障害復旧装置およびプログラム
WO2009122525A1 (ja) * 2008-03-31 2009-10-08 富士通株式会社 トラブル対処システム、方法およびそのためのプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3291642B2 (ja) 1995-05-18 2002-06-10 株式会社日立製作所 障害対策支援方法
WO2005029334A2 (en) * 2003-09-19 2005-03-31 Hewlett-Packard Development Company, L.P. Method of designing storage system
JP2005301859A (ja) * 2004-04-15 2005-10-27 Fujitsu Ltd コード検索プログラム及びコード検索装置
JP4944391B2 (ja) * 2005-05-11 2012-05-30 富士通株式会社 メッセージ異常自動判別装置、方法、及びプログラム
WO2007087136A2 (en) * 2006-01-13 2007-08-02 Velocity11 System and method for error recovery
US20080059120A1 (en) * 2006-08-30 2008-03-06 Fei Xiao Using fault history to predict replacement parts
JP5439775B2 (ja) 2008-09-17 2014-03-12 富士通株式会社 障害対応プログラム、障害対応装置、及び障害対応システム
JP5428934B2 (ja) * 2010-02-22 2014-02-26 富士通株式会社 障害パターン生成プログラムおよび障害パターン生成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053728A (ja) * 2004-08-11 2006-02-23 Nec Corp 障害対処ルール伝播方法、障害復旧装置およびプログラム
WO2009122525A1 (ja) * 2008-03-31 2009-10-08 富士通株式会社 トラブル対処システム、方法およびそのためのプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大野 允裕: "自律運用管理に向けた障害対処ポリシの運用制御/流用手法", 電子情報通信学会技術研究報告, vol. 第105巻,第227号, JPN6016026358, 29 July 2005 (2005-07-29), JP, pages 13 - 18, ISSN: 0003355429 *

Also Published As

Publication number Publication date
EP2940585A4 (en) 2016-01-06
US20150288568A1 (en) 2015-10-08
US9866440B2 (en) 2018-01-09
JP6119767B2 (ja) 2017-04-26
EP2940585A1 (en) 2015-11-04
WO2014103071A1 (ja) 2014-07-03

Similar Documents

Publication Publication Date Title
JP6119767B2 (ja) 対処方法作成プログラム、対処方法作成方法、及び情報処理装置
EP3874372B1 (en) Automatically performing and evaluating pilot testing of software
JP5984149B2 (ja) ソフトウェアを更新する装置及び方法
US10303539B2 (en) Automatic troubleshooting from computer system monitoring data based on analyzing sequences of changes
US11138058B2 (en) Hierarchical fault determination in an application performance management system
US20170109657A1 (en) Machine Learning-Based Model for Identifying Executions of a Business Process
US20170109668A1 (en) Model for Linking Between Nonconsecutively Performed Steps in a Business Process
US20170109667A1 (en) Automaton-Based Identification of Executions of a Business Process
US20170109639A1 (en) General Model for Linking Between Nonconsecutively Performed Steps in Business Processes
US11138060B2 (en) Application performance management system with dynamic discovery and extension
US10942801B2 (en) Application performance management system with collective learning
JP6457777B2 (ja) ルールの自動化された生成および動的な更新
JP2016100005A (ja) リコンサイル方法、プロセッサ及び記憶媒体
US20170109640A1 (en) Generation of Candidate Sequences Using Crowd-Based Seeds of Commonly-Performed Steps of a Business Process
JP2016192185A (ja) なりすまし検出システムおよびなりすまし検出方法
US11153183B2 (en) Compacted messaging for application performance management system
US11416801B2 (en) Analyzing value-related data to identify an error in the value-related data and/or a source of the error
US10848371B2 (en) User interface for an application performance management system
WO2014188638A1 (ja) 共有リスクグループ管理システム、共有リスクグループ管理方法および共有リスクグループ管理プログラム
US20170109670A1 (en) Crowd-Based Patterns for Identifying Executions of Business Processes
US11341166B2 (en) Method and system for attributing metrics in a CRM system
US10817396B2 (en) Recognition of operational elements by fingerprint in an application performance management system
US10904113B2 (en) Insight ranking based on detected time-series changes
JPWO2014054233A1 (ja) 情報システムの性能評価装置、方法およびプログラム
US9607051B2 (en) Effect analysis method, and management device

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170313

R150 Certificate of patent or registration of utility model

Ref document number: 6119767

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150