JP5657475B2 - 運用管理装置、及び方法 - Google Patents

運用管理装置、及び方法 Download PDF

Info

Publication number
JP5657475B2
JP5657475B2 JP2011128042A JP2011128042A JP5657475B2 JP 5657475 B2 JP5657475 B2 JP 5657475B2 JP 2011128042 A JP2011128042 A JP 2011128042A JP 2011128042 A JP2011128042 A JP 2011128042A JP 5657475 B2 JP5657475 B2 JP 5657475B2
Authority
JP
Japan
Prior art keywords
state
operation management
operations
target device
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011128042A
Other languages
English (en)
Other versions
JP2012256148A (ja
Inventor
裕明 鹿野
裕明 鹿野
淳二 山本
淳二 山本
達也 齊藤
達也 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011128042A priority Critical patent/JP5657475B2/ja
Priority to US13/487,720 priority patent/US8990372B2/en
Publication of JP2012256148A publication Critical patent/JP2012256148A/ja
Application granted granted Critical
Publication of JP5657475B2 publication Critical patent/JP5657475B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/10Program control for peripheral devices

Description

データセンタにおけるサーバ等の機器に対する運用管理オペレーション検証を最適化し、運用管理を効率化する技術に関する。
通信ネットワークの発達と普及が急速に進み、ネットワークを介した情報システム利用を実現するクラウドコンピューティングが急速に普及しつつある。その結果、情報システムを格納するデータセンタの規模拡大やグローバルな拠点展開等により、その運用管理面でのコストが大きな問題となりつつある。例えば、データセンタの運用管理においては、膨大な数のサーバやネットワーク機器に対する、機器の動作状態の確認、再起動、バッチ処理やディスクのバックアップ、異常時の対応、またそれらのオペレーションに対する顧客報告等、オペレーションの内容は幅広く、またさらにサーバ等のIT(Information Technlogy)機器だけでなく空調や電源の管理、セキュリティ監視や入退出管理までをも含み、これらのオペレーション効率化は必須の状況となっている。そこで、現在運用管理ストの低減を目指した、運用管理ミドルウェアによるシステム運用管理の一元化や、ITIL(Information Technology Infrastructure Library)による運用管理プロセスの標準化、ランブック自動化(Run Book Automation)による運用業務手順の自動化、といった運用管理効率化の取組みがなされている。
しかしながら、これらの取組みは、例えば定期的な業務アプリケーションによる処理やディスクのバックアップのといったレベルの自動化であり、個々の機器に対する例えば再起動や設定等のシステムメンテナンス等のコマンドレベルの自動化にまでは至っておらず、人手によるオペレーションが中心となっている。しかしながら、人手による管理では、ヒューマンエラーに起因するオペレーションの誤りが発生することは避けられず、誤り発生時の対応にさらに工数が必要になるという問題も生じている。また、前述の通りサーバやネットワーク等の情報システムだけではなく、空調や電源の管理、セキュリティ監視や入退出管理まで、業務の幅は広くオペレーションも異種となり、それぞれを連動させた管理は誤り発生の可能性を高めている。また、複数の管理者が運用管理に携わる際に、互いの意思疎通に齟齬が発生し、誤りの発生を招く原因にもなっている。またさらに、誤りが発生したとしても、どの操作が原因であるかを追究するには、過去の操作を各機器が持つログを解析しながら辿る必要があるなど、非常に困難である。
これまで、障害発生防止のためのコマンドを自動実行する手法が提案されている。例えば、特許文献1では、手順作成の作業者に依存することなく、未然に不正手順の作り込みを防止するための運用手順作成時の不正手順チェックアウト方法を開示している。サーバの構成や顧客情報を構成情報として、実施時間帯による手順実施可否をポリシとして登録し、不正手順の作りこみを防止する。また、特許文献2では、コマンド実行判定手段を持ち、運用ルール定義による実行条件と管理対象のリソース情報により、実行の可否を判定する方法を開示している。
特開2008−117029号公報 特開2007−26391号公報
上述した先行技術を踏まえ、現在のデータセンタ運用管理においては、従来の運用管理対象機器に対するオペレーション業務をより一層効率化することが課題となっている。まず機器を操作する際に、例えば操作の前提条件を確認せずに作業を進めてしまい、操作自体を間違える、または操作に関わるパラメータに誤りが生じるという問題がある。次に、複数の運用管理者が機器のオペレーションに携わるとき、機器に対する複数の操作間に例えば実行順序の依存関係があることを運用管理者間で情報共有できずに誤りが発生するという問題がある。また、同一の運用管理者が複数の機器に対し同時にオペレーションを行うときに、同様に複数の操作間に例えば実行順序の依存関係があり、それを見落としてしまって誤りが生じるという問題がある。また、操作に対する結果の確認を行うタイミング、つまり操作が終了するタイミングがわからず、オペレーションに必要以上の時間が掛かってしまうという問題がある。また、操作に対する結果の確認において、機器の稼動状況から適切な検証項目を抽出し、操作の正しさを確認することは手間が掛かるという問題がある。
本発明の目的は、上述の課題を解決し、複数の運用管理対象機器に対する複数の運用管理操作に対し、実行前に操作の検証と操作順の最適化を行うことで、機器の運用管理を効率化することが可能な運用管理装置、及び方法を提供することにある。
上記の目的を達成するため、本発明においては、複数の運用管理対象機器に対し操作を行う運用管理部を備える運用管理装置であって、運用管理部は、記憶部と処理部とを備え、記憶部に、操作により変化が伴う運用管理対象機器の状態と、操作毎の処理時間と、操作に必要な状態条件を記憶し、処理部は、複数の操作が入力されたとき、記憶した運用管理対象機器の状態と処理時間と状態条件に応じて複数の操作の操作順を決定する運用管理装置を提供する。
また、上記の目的を達成するため、複数の運用管理対象機器に対し操作を行う運用管理機器による運用管理方法であって、操作により変化が伴う運用管理対象機器の状態と、操作毎の処理時間と、操作に必要な状態条件を記憶し、複数の操作が入力されたとき、当該複数の操作を、記憶した運用管理対象機器の状態と処理時間と状態条件に応じて操作順を決定する運用管理方法を提供する。
運用管理対象機器の状態と操作をモデル化し、操作に必要なリソース、操作条件と操作時間を記憶させることで、複数の操作が入力された際の操作の正しさを実行前に検証できる。また、当該複数の操作の実行が最短となるよう実行順を最適化できる。また個々の操作に対し、実行の終了タイミングと運用管理対象機器の稼動状況から確認すべき項目を出力することで、当該操作の正しさ確認が容易化できる。以上より、データセンタの運用管理業務を効率化できる。
第1の実施例の、データセンタにおけるオペレーション検証・最適化システムの全体構成を示した図である。 第1の実施例に係る、各種サーバの代表的な構成例を説明する図である。 第1の実施例に係る、機器種別テーブルを説明する図である。 第1の実施例に係る、状態テーブルを説明する図である。 第1の実施例に係る、状態ルールテーブルを説明する図である。 第1の実施例に係る、機器定義テーブルを説明する図である。 第1の実施例に係る、依存テーブルを説明する図である。 第1の実施例に係る、操作テーブルを説明する図である。 第1の実施例に係る、操作時刻予測テーブルを説明する図である。 操作コ 第1の実施例に係る、マンド変換テーブルを説明する図である。 第1の実施例に係る、状態記録テーブルを説明する図である。 第1の実施例に係る、操作記録テーブルを説明する図である。 第1の実施例に係る、オペレーション検証及び最適化の処理フローを示した図である。 第1の実施例に係る、オペレーション実施時以外の稼動状況及び機器状態チェックの処理フローを示した図である。 第1の実施例に係る、ログからの稼働状況の取得と状態更新の詳細フローを説明する図である。 第1の実施例に係る、オペレーションの実例を説明する図である。 第1の実施例に係る、操作依存グラフを説明する図である。 第1の実施例に係る、操作スケジューリング結果を説明する図である。 第1の実施例に係る、物理サーバのログ出力の例を説明する図である。 第1の実施例に係る、オペレーション入力画面を説明する図である。 第1の実施例に係る、オペレーション確認画面を説明する図である。 第1の実施例に係る、オペレーション実行前に検出されたエラーを表示する画面を説明する図である。 ステップ実行時のオペレーション確認画面を説明する図である。 第1の実施例に係る、期待状態と一致している場合の状態確認画面を説明する図である。 第1の実施例に係る、期待状態と一致していない場合の状態確認画面を説明する図である。 第1の実施例に係る、全オペレーションの実行状況を表示する画面を説明する図である。
以下、本発明の各種の実施形態を図面に従い説明する。以下の説明においては、本発明の対象となるITシステムとしてデータセンタを例示するが、本発明はその他のITシステムにも適用できるものである。
第1の実施例として、データセンタに適用したオペレーション検証最適化システムを説明する。
<全体の構成>
図1は実施例1のデータセンタにおけるオペレーション検証システム構成の一例を示す図である。データセンタにおいては、本検証システムの運用管理対象となる装置、すなわち運用管理対象機器として、データセンタの運用設備系機器と、サーバ装置等のIT機器がある。このデータセンタの運用設備系機器としては、図1の右上に示したような、空調機器104、無停電電源装置・電源安定化装置等を含む電源装置105、監視カメラ・人感センサ等を含む監視装置106、入出力ゲート等を含むセキュリティ装置107等がある。また、データセンタのIT機器には、同図の右下に示すように、サーバ装置108、ディスク装置109、ルータ110等が上げられる。データセンタ内において、これらのIT機器と運用設備系機器は互いに強調して動作することで、省エネや運用管理省力化の点で効果を得ることができる。
さらに本検証システムは、これらの運用管理対象機器に対して、遠隔でコマンド発行や実行状況の確認を行うことができるよう、ユーザが通常IT機器へのアクセスで使用する場内ネットワーク114と分離された、管理ネットワーク113を敷設し、各機器・装置に接続する。管理ネットワーク113には、各機器を管理する運用管理サーバ100、各機器に対するオペレーションの有効性を検証し最適化する処理を実施するオペレーション検証サーバ101、機器の運用管理とオペレーション検証及び最適化に必要な各種情報を格納・管理する運用モデル管理サーバ102を接続する。本明細書において、運用管理サーバ100、オペレーション検証サーバ101、及び運用モデル管理サーバ102を纏めて、運用管理機器、或いは運用管理部と呼ぶ場合がある。この運用管理機器、あるいは運用管理部は、本実施例の検証システムの運用管理機能、すなわち運用管理対象機器の運用管理と、オペレーション検証及び最適化の機能を備えている。
運用管理サーバ100には、運用管理者がオペレーションを実施する端末103が接続される。なお、運用管理部の各種サーバ100〜102はすべて、またはその一部を1台のサーバ装置上で実行する構成としても良い。例えば、運用管理サーバ100とオペレーション検証サーバ101を一台のサーバ装置とする、運用管理サーバ100、オペレーション検証サーバ101、及び運用モデル管理サーバ102を一台のサーバ装置としても良い。または管理対象とする機器の規模に応じて、当該各種サーバを機能の細分化や処理の並列化により、さらに複数台に分散させる構成としても良い。
図2に本実施例のオペレーション検証最適化システムにおける各種サーバの代表的な構成例を示す。サーバ100、101、102は、処理部として演算処理を実行する中央演算装置(Central Processing Unit:CPU)151、記憶部として一時的にプログラム・データを記憶するメモリ152、各種インタフェースに対する制御を行うコントローラ153、記憶部として各種データ・プログラムを保持するハードディスクドライブ(Hard Disk Drive:HDD)などの記憶装置154、外部ネットワークと接続するネットワークインタフェース155、ディスプレイやキーボード等の周辺装置を接続する周辺装置インタフェース156から構成される。
また、図1の管理ネットワーク113は、ファイアウォール/VPN(Virtual Private Network)装置111を介して、場外ネットワーク115に接続される。従って、上記で述べた管理対象とする各種機器104〜110、または管理を行う各種サーバ100〜102の一部、もしくはすべてが場外ネットワーク115を介して別のデータセンタ等に設置されていても良い。すなわち、遠隔で他のデータセンタに存在する各種機器を、当該のデータセンタで管理する構成でも良く、また管理に必要な一部のサーバ、またはすべてのサーバが遠隔のデータセンタに設置されて当該データセンタの各種機器を管理する構成としても良い。また、場内ネットワーク114も同じくファイアウォール/VPN装置112を解して場外ネットワーク115に接続される。
運用管理サーバ100は、運用管理者に対する対象機器のオペレーションを実施するためのインタフェースを提供する。つまり、接続された端末103を介して、運用管理者に対してオペレーションの入力手段、及び当該機器の稼動状況やオペレーション実行状況を表示する手段を提供する。また、オペレーション検証や最適化を行うための、運用管理対象機器の構成、状態、操作、操作記録、状態記録を作成し、運用モデル管理サーバ102の記憶部である記憶装置154上に格納される各種モデルテーブル120〜129を作成・更新する。オペレーション検証サーバ101におけるオペレーション検証及び最適化の手順詳細については、後述する。
<モデルテーブルについて>
次に、運用モデル管理サーバ102上で管理される各種モデルテーブル120〜129に関して説明する。運用管理対象機器の構成や状態をモデル化してテーブルで表現することにより、運用管理者が入力するオペレーションの有効性を検証したり、オペレーションを最適化したりすることを可能とする。つまり、各テーブルの構成要素は、例えば検証対象とするオペレーションの種類によって変わるため、目的とする検証や最適化機能に合わせて、それぞれのテーブルの構成要素を定義する必要がある。なお、これらの各種モデルテーブル120〜129は、上述した運用モデル管理サーバ102の記憶部に蓄積される。
<機器種別テーブル>
まず、図3を用いて、機器種別テーブル120の構成を説明する。当該テーブル120は、運用管理対象とする機器の種別を定義する。また、このとき各機器が取り得る状態、即ち機器種別毎にモデル化すべき状態も合わせて定義する。なお、状態の種類に関しては、図4に示す状態テーブル121で定義する。機器種別テーブル120は、機器種別を表す列項目200、当該機器種別に対し取り得る状態を定義する列項目201で構成される。
図3では、各行で定義した機器の種別を説明する列項目202を付している。例えば、機器種別名pserverは物理サーバを意味し、取り得る状態として、電源状態を表すpower、ネットワークアドレスを表すnw_adrs、温度を表すtemp、ユーザプロセス数を表すuser_processである。また、機器種別名vserverは仮想サーバを意味し、取り得る状態として、電源状態を表すpower、ネットワークアドレスを表すnw_adrs、ユーザプロセス数を表すuser_process、ホストサーバ名を表すhost_srvである。以下、同様にルータrouter、空調機aircond、電源装置ups、ディスク装置storage、監視カメラcamera、セキュリティゲートsgateが定義されている。
<状態テーブル>
次に、図4を用いて、状態テーブル121の構成を説明する。当該テーブル121は、各運用管理対象機器の状態と、それに対応して取り得る値や、実システムの状態を更新する、標準の更新頻度を定義する。状態テーブル121は、状態名を表す列項目210、状態に対応する値の種類や範囲を表す列項目211、当該状態名に対しさらに細分化した状態であるサブ状態を定義する列項目212、細分化した状態に対応する値の種類や範囲を表す列項目213、各状態の実機上での状況をテーブル上の状態に反映させるための更新頻度を表す列項目214で構成されている。なお図4では、各行で定義した状態を説明する列項目215を付している。例えば、状態名powerは電源状態を表しており、取り得る値は“on”または“off”の何れかである。更新頻度214は1msとなっており、別途指定が無い限り1ミリ秒毎に実機の電源状態を確認し当該テーブルに反映させる。また状態名tempは温度を表しており、対応する値の取り得る範囲は-30〜60であり、更新頻度は10秒毎となっている。
また、例えば状態名nw_adrsは細分化したサブ状態212を持ち、IPアドレスip、サブネットマスクsubnet、ゲートウェイアドレスgwを定義する。それぞれの状態の取り得る値は、IPv4のアドレス範囲0〜2^32の整数となる。なお、更新頻度はOPとあるが、これはネットワークアドレスに関わるオペレーションが発生した都度、実機のネットワーク状態を確認し当該テーブルに反映させる。なお、本例で示した数値範囲等の表現は一例であり、当該項目を定義するための必要な表現を適宜実装することになる。
<状態ルールテーブル>
次に、図5を用いて、状態ルールテーブル122の構成を説明する。当該テーブル122は、各運用管理対象機器における状態間の定常的な関係を定義する。オペレーション毎や状態の更新毎に、本テーブルで定義された状態間の関係性をチェックすることで、システム状態の正しさを確認できる。状態ルールテーブル122は、状態ルール名を表す列項目220、基準状態を表す列項目221、当該基準項目に対し関係する状態条件を表す列項目222で構成される。なお図5では、各行で定義した状態ルールを説明する項目223を付している。例えば、状態ルール名rl_psrv_powerは、基準状態をpserver.power=on、つまり物理サーバの電源がON状態としている。このときの状態条件はpserver#ups.power=on&pserver#aircond.power=on、つまり当該物理サーバが依存する(接続される)電源装置の電源がONである、かつ当該物理サーバが依存する(冷却される)空調機器の電源がonであるべきことを示している。
また、例えば状態ルール名rl_psrv_ip_adrsは、基準状態をpserver.ip_adrs=*、つまり物理サーバのIPアドレス(値は任意)としている。このときの状態条件はpserver.ip_adrs=[10.0.10.1−9]、つまり当該物理サーバのIPアドレスが10.0.10.1〜9の範囲に設定されるべきことを示している。なお、以上で示した数値範囲や、機器や状態の関連性を表す方法は一例であり、当該項目を定義するための必要な表現を適宜実装することになる。
<機器定義テーブル>
次に、図6を用いて、機器定義テーブル123の構成を説明する。当該テーブル123は、運用管理対象とする実機器を定義するものであり、初期状態を併せて定義可能である。機器定義テーブルは、機器名を表す列項目230、機器種別テーブル120で定義した機器種別を表す列項目231、各機器上の状態を表す列項目232で構成される。例えば、機器名ps1は機器種別がpserver、つまり物理サーバであり、その状態はpower=off(電源OFF)、user_process=0(ユーザプロセスは無し)、nw_adrs[0]−>IP=10.0.10.10(ポート0番のIPアドレスは10.0.10.10)となっている。同様に、本例では物理サーバps2、ps3、仮想サーバvm1、電源装置ups1、ルータrouter1、空調機器airc1、ディスク装置str1、str2、監視カメラcam1、セキュリティゲートsgate1を定義している。
<依存テーブル>
次に、図7を用いて依存テーブル124の構成を説明する。当該テーブル124は、機器間の論理的または物理的な、依存関係であるトポロジまたは接続関係を定義する。例えば、主従関係を持つサーバ間や、サーバとそれに接続される周辺機器、等の依存関係を定義する。依存テーブルは、依存元の機器名を表す列項目240、依存先の機器名を表す列項目241、依存関係の種類を表す列項目242で構成される。
図7の例では、機器名が物理サーバps1、ps2、ps3及びディスク装置str1、str2に対し、依存先が電源装置ups1となっており、また種別が物理的に接続されていることを表すPHYSICALLY_CONNECTEDとなっている。これは、当該物理サーバ及び当該ディスク装置が、当該電源装置ups1に接続され、依存していることを表す。また、機器名がディスク装置str1、str2に対し、依存先が物理サーバps1、ps2、ps3、仮想サーバvm1、vm2となっており、また種別が論理的に接続されていることを示すLOGICALLY_CONNECTEDとなっている。これは、当該ディスク装置が当該物理サーバまたは当該仮想サーバに論理的に接続され、依存していることを示す。また、機器名が仮想サーバvm1、vm2に対し、依存先が物理サーバps1、ps2、ps3となっており、また種別が当該仮想サーバをホストする物理サーバであることを示すHOSTEDとなっている。これは、当該仮想サーバが当該物理サーバ上で動作することを示す。
<操作テーブル>
次に、図8を用いて操作テーブル125の構成を説明する。当該テーブル125は、運用管理者による対象機器のオペレーションであるコマンド操作を定義する。コマンド操作は、対応する機器状態を変更することを意味し、コマンド操作をモデル上での状態変更と対応付けることで、オペレーション検証を可能とする。操作テーブルは操作名を表す列項目250、操作対象の機器種別を表す列項目251、操作におけるパラメータ等の変数を表す列項目252、操作時の状態条件を表す列項目253、操作による変更後の状態を表す列項目254、操作に掛かる時間を表す列項目255で構成される。
なお図8では、各行で定義した操作の内容を説明する列項目256を付している。例えば物理サーバの電源をONにする操作power_onについて説明する。操作対象とする機器種別はpserverであり物理サーバを示す。操作パラメータはSERV:pserverであり、SERVが指定される物理サーバ名となる。次に、操作条件SERV.power=offより、当該操作を行うための状態条件として、当該サーバの電源がOFFであることを定義している。次に操作後の状態SERV.power=onより、当該操作により当該サーバの電源状態をONに変更することを定義している。次に、操作時間の定義がREF(参照)となっているが、これは操作時間予測テーブル126を参照し操作時間を算出することを示している。
次のファイルのコピー/バックアップを行う操作copy_fileについて説明する。捜査対象とする機器種別はstorageでありディスク装置を示す。操作パラメータはFROM:storage,TO:storage,FILE:LISTであり、FROMがコピー元のディスク装置、TOがコピー先のディスク装置、FILEがリスト表現によるファイル名となる。次に、操作条件Exist(FILE,FROM.file)より、当該操作を行うための状態条件として、ディスク装置FROMにファイルFILEが存在することを定義している。なお、Existは、リスト操作(存在確認)を行う関数を意味している。次に捜査後の状態をAppend(FILE,TO.file),TO.vol_used+=FROM.file[FILE]−>sizeより、ファイルFILEのディスク装置TOのファイルリストへの追加、及びディスク装置TOの使用容量の対象ファイルサイズ分の増加を定義している。次に、操作時間の定義がREFとなっているが、これは操作時間予測テーブル126を参照し操作時間を算出することを示している。
同様に、図8では例として物理サーバの電源OFF(power_off)、仮想サーバの割り当て(assign_vm)、仮想サーバの起動(power_on)、アプリケーションの起動(start_appli)、アプリケーションの停止(stop_appli)、バッチの実行(exec_batch)を定義している。なお、以上で示した操作条件の表現、各種関数は一例であり、当該項目を定義するための必要な表現・関数を適宜実装することになる。
<操作時間予測テーブル>
次に、図9を用いて、操作時間予測テーブル126の構成を説明する。当該テーブル126は、操作テーブル125で定義した操作に対し、操作時間の計算式、または操作時間そのものを定義し、種類として予測型と実測型がある。操作時間予測テーブルは、識別名を表す列項目260、時刻予測対象とする操作を表す列項目261、操作時間の表現が算出式か時間かを表す列項目262、算出式または操作時間を表す列項目263で構成される。例えば識別名time_file_copyは、ファイルコピーに掛かる時間を表し、操作対象は操作テーブル125で定義されているcopy_fileとなる。種類はEstimatedEQであり、これは予測算出式で表現されることを表す。本例では、算出式はSum(FILE.file_size)/Min(FROM.troughput,TO.throughput)と定義されており、コピー対象のすべてのファイルFILEのサイズ合計値を、ディスク装置FROMまたはTOのスループット(バイト/秒)のうち小さい方のスループットで割った値を、操作時間としている。なお、Sumは合計値を求める関数、Minは最小値を求める関数である。また、スループットは装置の仕様値を用いるか、または当該操作時に測定することで求める。
次に、例えば識別名time_start_appliは、アプリケーション起動に掛かる時間を表し、操作対象は操作テーブル125で定義されているstart_appliとなる。種類はMeasuredVLであり、これは実測による操作時間で表現されることを表す。本例では、(SERV==vm1&&APP=appli1):25s、(SERV==ps1&&APP==appli2):20sと定義され、実行サーバSERVが仮想サーバVM1でかつ実行対象のアプリケーションAPPがappli1であるとき操作時間は25秒、実行サーバSERVが物理サーバps1でかつ実行対象のアプリケーションAPPがappli2であるとき操作時間は20秒となる。
同様に図9では他の例として、電源ON(time_power_on)、電源オフ(time_power_off)、バッチ実行(time_batch_exec)、アプリケーション停止(time_stop_appli)の各操作時間を定義している。
次に操作コマンド変換テーブル127の構成を、図10を用いて説明する。当該テーブル127は、操作テーブル125で定義した操作に対応した、実機上でのコマンドを定義する。操作コマンド変換テーブル127は、操作テーブル125で定義した対応操作名を表す列項目270、対象となる機器を表す列項目271、及び生成コマンドを定義する列項目272で構成される。例えば、電源ON操作power_onは、対象機器が物理サーバps1であり、そのとき生成するコマンドはps1を制御するサービスプロセッサに対する遠隔電源ONを意味する/sbin/poweron {PSERV.nw_adrs[0].ip} nowを定義している。同様に、図10の例ではファイルコピー(copy_file)、電源OFF(power_off)、仮想サーバの割り当て(assign_vm)の生成コマンドを定義している。なお、以上で示した算出式や操作時間の表現、各種関数は一例であり、当該項目を定義するための必要な表現・関数を適宜実装することになる。
<状態記録テーブル>
次に、図11を用いて状態記録テーブル128を説明する。当該テーブルは、運用管理対象機器の各状態を保存し、機器状態の更新を記録する。状態記録テーブル128は、機器定義テーブル123と同じく、機器名を表す列項目280、機器の種別を表す列項目281、記録時の状態を表す列項目282と、さらに記録時の通し番号である状態番号と記録時間を表すヘッダ情報283で構成される。記録状態282における状態項目は機器定義テーブル123における初期状態232で定義した状態項目そのものである。このように、例えば一定時間毎、または状態変化時、またはオペレーションの前後のタイミングにおいて、各状態を記録しておくことで、エラーや不具合等の原因追及やオペレーションの検証に役立てることができる。
<操作記録テーブル>
次に、図12を用いて、操作記録テーブル129を説明する。当該テーブルはオペレーション(操作)の履歴を記録する。操作記録テーブル129は、時間を表す列項目290、操作テーブル125で定義された操作名を表す列項目291、操作パラメータを表す列項目292、操作前後の状態を記録した状態記録テーブル128の状態番号283を表す列項目293で構成される。このように、操作の履歴を記録しておくことで、操作に起因した不具合の原因追及に役立てることができる。
<オペレーション検証・最適化の処理フロー>
図13を用いて、運用管理サーバ100、オペレーション検証サーバ101、及び運用モデル管理サーバ102における、運用管理者が入力したオペレーションの検証・最適化の処理フローを説明する。この処理フローは、運用管理部を構成する、運用管理サーバ100、オペレーション検証サーバ101、及び運用モデル管理サーバ102内のCPUのプログラム処理等で実現されるものであり、運用管理部の運用管理サーバ100、またはオペレーション検証サーバ101、または運用モデル管理サーバ101のいずれかで実行、または個々の処理で各サーバに分散して実行されるものである。
まず、運用管理者は運用管理対象機器に対するオペレーション(操作)を、運用管理サーバ100に接続されたオペレーション端末103上で入力する(301)。なおオペレーションは、事前に操作テーブル125にて定義した操作を選択的に入力することで、行う。このとき、複数の管理者が同一または相違の機器を対象としたオペレーションを同じタイミングで行ったり、一人の管理者が複数のオペレーションを同時に行ったりすることが考えられる。そこで、オペレーションをある時間やオペレーションの種類、または対象機器に応じてグループ化し、グループ単位で検証・最適化を行う。
オペレーション入力後、まず操作対象機器の最新の状態を取得し、モデル上の状態を更新する(302)。具体的には、機器定義テーブル123の状態定義232にて定義された各種状態値を更新する。なお、稼動状況の取得方法としては、対象機器に保持される各種ログを解析する、または各種機器上でエージェントプログラム等を実行させることで取得する方法が考えられる。次に入力、グループ化された複数オペレーションは、オペレーション検証サーバ101により、まずオペレーション間の依存解析を行う(303)。オペレーションは、操作テーブル125で定義された各操作と対応付けられ、操作単位での依存解析を行うことになる。オペレーション検証サーバ101における依存解析は、操作テーブル125における操作条件253と依存テーブル124の依存関係を用いて、操作を行う際の前提条件を満たしているか、また操作後の状態に対して状態ルールテーブル122を用いて操作後状態条件を満たしているかを確認することで、操作間の実行順序や並列実行可能性を決定するための操作依存グラフを作成する(304)。次に、オペレーション検証サーバ101上で、各操作に対する実行時間予測を行う(305)。実行時間予測は、操作時間予測テーブル126を用いて決定する。実行時間は、当該テーブル上の算出式または過去の実測による時間情報を用いて決定する。
次に、オペレーション検証サーバ101は、操作依存グラフと、操作時間予測から、操作の実行順序とタイミングを決定する操作スケジューリングを行う(306)。操作スケジューリングにより、各操作の実行順序、実行タイミング、及び各操作の実行終了タイミングを求めることができる。次に、オペレーション検証サーバ101は、オペレーション実行後の状態として、操作による状態変更に基づき、最終的な状態を予測する(307)。次に、オペレーション検証サーバ101は、当該状態が当該オペレーションに対する期待状態となっているか、また状態ルールテーブル122または依存テーブル124を用いて状態間の定常条件を満たしているかをモデルチェックすることで確認する(308)。
その結果、当該操作による変更後状態が期待通りとならない場合(309)は、運用管理サーバ100は、運用管理者へその旨通知し、入力した操作に誤りが無いかを確認するよう促す(316)。また、モデルチェック308の結果、当該操作による変更後状態が期待通りとなる場合(309)は、運用管理サーバ100は、操作スケジューリング306の結果から得られた各操作の終了予測タイミングと、操作テーブル125の操作後状態254から得られる、各操作においてその実行が正しく行われたかを検証するために確認すべき状態項目を、運用管理者に通知する(310)。これによって、これらの操作を実機上で実行する際、運用管理者は実行状況を逐次確認するためのタイミングと、確認すべき状態項目を知ることが可能となる。
その後、例えば運用管理サーバ100から、操作スケジューリング306のタイミングで、各機器に対する操作が発行され、それぞれの操作が実行される(311)。1個の操作が終了した段階で、操作対象機器の最新の状態を取得し、モデル上の状態を更新する(312)。そして、オペレーション検証サーバ101は、モデルチェックにより、実機上で行われた操作による変更後状態が期待通りとなるかを確認する(313)。もし期待状態となっていなければ(309)は、操作を中断し、その旨を運用管理サーバ100を介して運用管理者へ通知し、また入力した操作に誤りが無いかを確認するよう促す(316)。当該操作による変更後状態が期待通りとなる場合(309)は、処理312で取得した機器の状態及び操作を、運用モデル管理サーバ102の状態記録テーブル128、及び操作記録テーブル129にそれぞれ記録させる(315)。
その後、すべての操作がまだ終了していなければ(317)、次の操作実行を繰り返し(311〜315)、すべての操作が終了していれば(317)、運用管理サーバ100は、正常終了を運用管理者へ通知し(316)、オペレーション入力待ち状態に戻る。なお、ここでは操作毎に逐次、操作対象機器の最新状態の取得と、操作による変更後状態のモデルチェックを繰り返す処理フローとしているが、複数の操作群を実行後に一括して、当該操作群による変更後状態のモデルチェックを行う処理フローとしても良い。
<オペレーション実施時以外の処理フロー>
次に、図14を用いて、運用管理対象機器に対するオペレーション実施時以外の、定常時における機器状態検証処理フローを説明する。本処理フローは、運用管理部を構成する、運用管理サーバ100、またはオペレーション検証サーバ101、または運用モデル管理サーバ101いずれかで実行、または個々の処理で各サーバに分散して実行される。
まず、状態テーブル121及び機器定義テーブル123で定義された状態に対応する、運用管理対象機器の実機状況を監視する(321)。監視の方法は、当該機器が保持するログを解析することで対象の状態変化を検出する、または当該機器上でエージェントプログラム等を実行させ対象の状態変化を検出する、等の方法が考えられる。また、状態監視以外に、定期的に状態チェック及び更新を行っても良い(321)。この場合は、状態テーブル121で定義された更新頻度214の時間毎に機器の稼動状況をチェックするか、または当該更新頻度で次の処理ステップ322に移行しても良い。
監視対象の状態が変化後、または更新頻度時間が到来後、当該対象機器の稼動状況の取得と機器定義テーブル123の状態定義232に対応する仮の機器定義テーブルへ状態更新を行う(322)。その後、当該状態をあるべき定常状態を定義する機器定義テーブル123の状態定義232と比較し一致しているか、また状態ルールテーブル122または依存テーブル124を用いて状態間の定常条件を満たしているかをモデルチェックする。その結果、不一致や違反が無ければ、再度状態変化の検知またはチェックタイミングの監視(321)を繰り返す。もし、不一致や違反があれば、前記仮の機器定義テーブルにおける状態定義を、状態記録テーブル128として記録し(325)、運用管理サーバ100を介して、運用管理者へ通知する(326)。
<ログ解析による状態取得のフロー>
次に、図15を用いて、図13、図14における、稼働状況の取得と状態更新302、312、322の詳細フローを説明する。前述の通り、本処理では操作対象機器の最新の状態を取得し、機器定義テーブル123の状態定義232にて定義された各種状態値を更新する。図15は運用管理対象機器104〜110に保持されるログを解析することで状態を取得・更新するフローである。以下の説明において、本フローはオペレーション検証サーバ101が実行するとするが、運用管理サーバ100または運用モデル管理サーバ102で実行しても良い。また、一部の処理を、ログを保持する操作対象機器側で分担して実行する構成としても良い。
まず、図15において、管理ネットワーク113を介して運用管理対象機器に保持されているログを取得する(331)。なお取得するログは、前回取得時からの差分とすることで、取得にかかる時間を抑えることができる。次に、取得したログを解析する(332)。ログの解析は、予め取得対象となる状態情報に対応したキーワードを入力しておき、ログの内容をキーワードと照らし合わせることで、ログの意味づけと対応するパラメータの抽出を行う。なお、前述したとおりステップ331及び332を、ログを保持する運用管理対象機器側で実行しても良い。これにより、管理ネットワーク113を流通する情報量を小さくできるため、遠隔管理においては有利であるが、当該対象機器の演算リソースを一部占有してしまうという欠点もある。次に、ログの意味とパラメータ抽出の結果から、状態テーブル121を検索し、当該テーブル上で登録された状態を検索する(333)。その結果、もし登録済みの状態と抽出された状態に差分がある場合は、差分があったことを記録し(334)、当該テーブル121上の状態を更新する(335)。
<オペレーション最適化の具体例>
次に、図16を用いて、本実施例にける、オペレーション最適化の具体例として、3種類の運用管理業務を実施する例を説明する。図16のテーブル400において、401〜403はそれぞれ3種類の運用管理業務A、B、Cを示している。なお、当該の3業務を3人の運用管理者が同時に行う、または当該の業務を1人の管理者が同時に行うことを想定する。業務A(401)はサーバ再起動及び仮想サーバを起動する。業務Aで実施する操作は、まず業務Aでは物理サーバps1を対象とし電源OFFの操作410、次にps1に対する電源ONの操作411、仮想サーバvm1に対するホストサーバ指定の操作412と、以下当該テーブル400のオペレーションリストに示す通り定義されている。なお、本例ではオペレーションリストにおける操作は、掲載されている順に操作されるとする。つまり、業務内の操作では、同時に実行可能な操作は含まない。ただし、同時に実行可能な操作を含めることもできる。その場合には、オペレーション入力時に同時実行可能な操作群として定義する必要がある。また業務B(402)は定時バッチ処理を、業務C(403)は定時バックアップ処理を行う。各業務には、優先度を設定でき、操作スケジューリング306の際、複数の操作が可能な条件において、当該操作の実行順を決定するために用いられる。本例では、優先度を1〜10で表し、数字が大きいほど優先度が高い。
<操作依存グラフの例>
次に、図13で説明した処理フローに基づき、テーブル400で示す種類の運用業務の操作を最適化する。当該操作間の依存解析を行い(303)、操作間の依存関係を表す操作依存グラフの例を図17に示す。
図17の操作依存グラフは、図8で示した操作テーブル125から作成される。円が操作を表し、矢印が依存関係を表す。また、円の右下に示す数値は、操作時間を表す。例えば、業務A(401)の操作411(物理サーバps1の電源ON)は操作410(ps1の電源OFF)に依存し、操作410の後に有効となる。同様に、例えば業務B(402)の操作416(ps1上でのアプリ2起動)は、ps1が起動状態である必要から、業務Aの操作411(ps1の電源ON)に依存し、操作411後に有効となる。また、業務C(403)の操作415(ディスク装置str1のバックアップ)は、依存する操作が無いため、例えば業務A(401)の操作410と同時に実行することが可能である。このように、すべての操作間での依存関係をグラフ化することで、実行順の決定や、並列に実行可能な操作の抽出ができる。なお、もし性能上の理由等で同時に実行させない場合は、操作テーブル125の操作条件253に対応する条件を明記する必要がある。
<操作スケジューリング結果の例>
図12の操作スケジューリング306では、図17の操作依存グラフと、各操作の操作時間から、最終的な各操作の発行のタイミングを決定する。スケジューリングの結果例を図18に示す。
図18において、横軸は時間で、長方形が1つの操作を表す。また、Cの文字が書かれた長方形は、直前の操作結果を確認するタイミングを表す。スケジューリングは、操作依存グラフの上部から順に割り当てる。ただし、同一の機器に対する別業務の複数操作が同時に発行可能となる場合には、前述の通り業務別の優先度を利用して、割り当てを決定する。
図17の操作依存グラフより、まず操作410(物理サーバps1の電源OFF)と操作415(ディスク装置str1のバックアップ)がまず実行可能であり、操作を割り当てる。操作410の操作時間は図17より30秒であり、また操作415は155秒である。従って、30秒後には操作410の実行確認が可能となり、その後に操作411(ps1の電源ON)を割り当てることができる。続いて操作411の操作時間は45秒であり、当該時間後に操作411の確認が可能となる。
その後、操作412(仮想サーバvm1のps1割り当て)と操作416(ps1上でのアプリ2起動)を割り当てることができる。操作412と操作416は同時に実行可能であるため、同時に操作を割り当てる。操作412の操作時間は10秒、操作416の操作時間は20秒であり、操作412終了後、操作413(vm1の起動)が割り当てられる。以上、同様に操作416終了後に操作417(ps1上でバッチ1実行)、操作413終了後、操作414(vm1上でアプリ1起動)が割り当てられる。また、操作417終了後、操作418(ps1上でのアプリ2停止)が割り当てられる。
業務Cの操作419は、依存先の操作415が終了した時点でもう一方の依存先の操作411が終了しているため、操作依存グラフ上では操作415の終了直後に割り当てが可能となっている。しかしながら、操作テーブル125のバッチ実行操作exec_batchにおける操作条件253にて定義されているSERV.user_process<=2より、ps1では既に仮想サーバvm1及びアプリ2の計2プロセスが稼動状態のため、操作415終了直後の割り当てはできない。従って、操作418のアプリ2停止後に、操作419が割り当てられる。
<運用管理対象機器上のログの例>
図19に、図18で示したスケジューリング結果に基づきオペレーションを実施した際の、物理サーバps1上で取得されたログの例(450)である。図中、最左の数字は行番号を表している。ログは、日時、時間、機器名、サービス名、メッセージで構成される。たとえは、2行目は5月2日10時10分02秒において、物理サーバps1上で実行されるカーネルサービスのメッセージとして、システムシャットダウンが開始されたことを示している。
<オペレーション入力確認画面>
次に、運用管理者によるオペレーションの入力、及びオペレーション検証結果の確認方法を、オペレーション端末103上での画面構成例を示して説明する。図20はオペレーション入力画面500の一例を示す図である。本画面を運用管理者毎、または運用管理業務毎に表示して、各操作を入力する。本例では、運用管理者別の画面として構成している。
運用管理者は、まず操作対象機器の選択501で機器の選択を行う。操作対象機器を選択すると、当該機器に対し実施可能な操作の一覧がオペレーションの選択502に表示される。従って、当該機器上で実施する操作を選択する。選択を行うと、操作に必要なパラメータ項目がパラメータ入力503に表示される。パラメータを選択すると、運用管理者に対し対応するパラメータを入力するよう促す画面が別途表示される。
また、操作対象機器の選択501で選択された機器の、現在の状態を取得し参照することもできる。状態情報504に表示された状態項目を選択し、状態確認ボタン517を押すことで、当該機器の当該状態が別画面で表示される。1操作の入力が完了した後、追加ボタン511を押すことで、オペレーションリストに登録が可能である。以上を繰り返すことにより、複数の操作群からなるオペレーションの入力を行う。なお、オペレーションリスト中の操作の修正・削除は、対象となる操作を選択した上でそれぞれ修正ボタン512、削除ボタン513を押すことで行う。
すべてのオペレーションの入力が終了後、連続実行ボタン514またはステップ実行ボタン515を押すことでオペレーション検証、最適化、及び実機上での実行を開始する。なお、連続実行514では、オペレーションリスト中の操作群に対し検証・最適化が行われた後、問題が無ければ一括して操作が発行され、実行状況を表す画面520が表示される。すべての操作の実行が終了後、結果を確認する画面が表示される。またステップ実行515では、当該操作群に対し検証・最適化が行われた後、問題が無ければ実行状況を表す画面520が表示され、1操作ずつ順に実行を指示する。さらに当該操作実行の都度、結果を確認する画面530が表示される。また、操作実行前のオペレーション検証段階でエラーが検出された場合は、オペレーションエラー通知画面550を表示する。
次に、図21を用いて、オペレーションの状況を表示する画面520について説明する。運用管理者または運用管理業務別に発行したオペレーションに対し、オペレーション発行状況521と確認タイミング及び状態期待値522を示す。オペレーション発行状況521では、各操作の発行時刻と対象機器及び操作内容のリストが表示される。現在実行中の操作は、ハイライトされて示される。確認タイミングと状態期待値522では、各操作の結果を確認するための時刻と確認すべき状態、及びその期待値が表示される。例えば、リスト522最上段は確認時刻が10:00:30、対象機器は物理サーバps1、確認すべき状態項目はpower、状態期待値はoffとなる。なお、実行途中でオペレーションを中止する場合は、中止ボタン526を押す。また、オペレーション入力画面500にてステップ実行515を選択した場合は、各操作の発行終了毎に待ち状態となり、実行ボタン525が有効になる。オペレーション確認画面530で確認後、次の操作を実行する際は、当該実行ボタン525を押す。なお、オペレーション入力画面500にて連続実行514を選択した場合は、実行ボタン525は有効にならない。
次に、図22を用いて、オペレーション実行前にエラーが検出された時の確認画面540について説明する。オペレーションエラー表示画面540では、図20に示す通りオペレーション検証段階にて検出されたエラーを表示する。エラーが発生した操作を示す画面541と、エラー内容を示す画面542で構成される。本例のエラー内容542では、物理サーバps1の電源OFF操作に対して、ps1の電源状態がonとなっていないことを示している。エラーを受けて、オペレーションを中止する場合には、確認(中止)ボタン545を押し、エラーを無視する場合は無視ボタン546を押す。
図23に示す通り、ステップ実行時のオペレーション結果の確認画面530では、確認すべき操作を表示する画面531と、確認すべき状態情報を示す画面532が表示される。また、状態を確認する画面533も表示される。確認すべき状態情報に基づき、対象状態が画面533に表示され、状態確認ボタン535を押すと、当該状態が取得され別画面でその内容が表示される。別の状態、または別の機器の状態を確認したい場合は、「他の状態を取得する」を選択し、状態確認ボタン535を押すことで、別途状態を確認する画面が表示される。その結果、問題なければ確認ボタン536を押すことで、当該操作の実行確認が終了し、次の操作の実行へ移る。もし、期待状態と相違がある等問題があれば中止ボタン537を押すことで、オペレーションを中止できる。
次に、図24により、状態確認ボタン535を押すと表示される画面について説明する。図24は確認すべき状態が、実際の機器状態と一致している場合(つまりオペレーションエラーがない場合)の状態確認画面560を示す。期待状態を表す画面561と、取得した運用管理対象機器の状態を表す画面562、また当該取得状態の根拠となる、当該運用管理対象機器上で出力されたログの対応部分を表す画面563が表示される。本例は、物理サーバps1の電源が投入され、正常にブートされていることを示している。これにより、実行後の結果が正しいことを運用管理者が逐次確認できる。なお、確認ボタン564を押すことで、状態確認画面は終了する。
また、図25は確認すべき状態が、実際の機器状態と一致していない場合(つまりオペレーションエラーがある場合)の状態確認画面570を示す。同じく期待状態を表す画面561と、取得した運用管理対象機器の状態を表す画面562、また当該取得状態の根拠となる、当該運用管理対象機器上で出力されたログの対応部分を表す画面563が表示される。本例では、物理サーバps1上でのバッチbatch1の実行が最後まで正しく実行されず、期待状態と一致していないため、エラーが出力されている。これにより、実行結果に以上があることを運用管理者が逐次確認できる。なお、確認ボタン574を押すことで、状態確認画面は終了する。
図26に示す通り、全オペレーション状況表示画面550では、複数の運用管理者によるオペレーションが入力されているときに、すべての操作とその実行状況を表示する。本画面は、運用管理者により、任意のタイミングで呼び出すことができる。操作はリストとして、実行時刻、発行者、対象機器、操作内容、実行状況の項目を表示する。本例では、ハイライトされている部分が、既に実行を終了している操作となる。これらの操作を実行途中で止めたい場合は、中止ボタン555を押す。
以上、本発明の一実施例のオペレーション検証システムを詳述したが、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されものではない。上述の実施例中にも説明したように、本システム中の運用制御部は、複数のサーバ装置で構成しても良いし、一個のサーバ装置で構成しても良いことは言うまでもない。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、それぞれの機能を実現するプログラムをCPUが実行することによりソフトウェアで実現する例を主体に説明したが、各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク装置のみならず、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体におくことができるし、必要に応じてネットワーク等を介してダウンロード、インストロールすることも可能である。
100・・・運用管理サーバ
101・・・オペレーション検証サーバ
102・・・運用モデル管理サーバ
103・・・オペレーション端末
104・・・空調機器
105・・・電源装置
106・・・監視装置
107・・・セキュリティ装置
108・・・サーバ装置
109・・・ディスク装置
110・・・ルータ
111〜112・・・ファイアウォール/VPN装置
113・・・管理ネットワーク
114・・・場内ネットワーク
115・・・場外ネットワーク
120・・・機器種別テーブル
121・・・状態テーブル
122・・・状態ルールテーブル
123・・・機器定義テーブル
124・・・依存テーブル
125・・・操作テーブル
126・・・操作時刻予測テーブル
127・・・操作コマンド変換テーブル
128・・・状態記録テーブル
129・・・操作記録テーブ
400・・・運用管理業務の例と対応する操作を示すテーブル
500・・・オペレーション入力画面
520・・・オペレーション状況表示画面
530・・・ステップ実行時オペレーション確認画面
540・・・オペレーションエラー表示画面
550・・・全オペレーション状況表示画面
560・・・状態確認画面(期待状態と取得状態が一致)
570・・・状態確認画面(期待状態と取得状態が不一致)

Claims (15)

  1. 複数の運用管理対象機器に対し操作を行う運用管理部を備える運用管理装置であって、
    前記運用管理部は、記憶部と処理部とを備え、
    前記記憶部は、前記操作により変化が伴う前記運用管理対象機器の状態と、前記操作毎の操作時間と、前記操作に必要な状態条件を記憶し、
    前記処理部は、複数の前記操作が入力されたとき、前記記憶部に記憶された、前記運用管理対象機器の前記状態と前記操作時間と前記状態条件に応じて入力された複数の前記操作の操作順を決定する、ことを特徴とする運用管理装置。
  2. 請求項1に記載の運用管理装置であって、
    前記処理部は、複数の前記操作の操作順を決定する際に、前記状態条件を満たさない操作を検出することで、入力された前記操作に誤りがあることを検知する、ことを特徴とする運用管理装置。
  3. 請求項1に記載の運用管理装置であって、
    前記処理部は、複数の前記操作各々の操作の終了時間を出力することにより、前記操作各々の操作を確認するタイミングを提示する、ことを特徴とする運用管理装置。
  4. 請求項3に記載の運用管理装置であって、
    表示部を更に備え、
    前記表示部は、前記処理部からの複数の前記操作各々の終了時間に基づく確認タイミングと、当該確認タイミング時の状態期待値を表示する、ことを特徴とする運用管理装置。
  5. 請求項1に記載の運用管理装置であって、
    前記処理部は、前記運用管理対象機器の稼動状況を監視し、前記運用管理対象機器の前記状態が変更されたことを検知した時点で、前記記憶部に記憶する前記状態を更新する、ことを特徴とする運用管理装置。
  6. 請求項5に記載の運用管理装置であって、
    前記処理部は、前記運用管理対象機器に保持されたログの解析結果に基づき、前記状態が変更されたことを検知する、ことを特徴とする運用管理装置。
  7. 請求項1に記載の運用管理装置であって、
    前記記憶部に記憶される前記運用管理対象機器の前記状態は、当該状態に対応する値の種類、或いは範囲を含む、ことを特徴とする運用管理装置。
  8. 請求項7に記載の運用管理装置であって、
    前記記憶部に記憶される前記運用管理対象機器の前記状態は、当該状態の更新頻度を更に含み、
    前記処理部は、前記更新頻度に基づいて、前記状態条件の判定に必要な前記運用管理対象機器の前記状態を取得する、ことを特徴とする運用管理装置。
  9. 請求項1に記載の運用管理装置であって、
    前記記憶部に記憶される前記状態条件は、当該状態条件の基準状態を含む、ことを特徴とする運用管理装置。
  10. 請求項1に記載の運用管理装置であって、
    前記記憶部に記憶される前記操作時間は、時刻予想対象とする操作名と対応づけて記憶される、ことを特徴とする運用管理装置。
  11. 複数の運用管理対象機器に対し操作を行う運用管理機器による運用管理方法であって、
    前記操作により変化が伴う前記運用管理対象機器の状態と、前記操作毎の処理時間と、前記操作に必要な状態条件を記憶し、
    複数の前記操作が入力されたとき、前記運用管理対象機器の前記状態と前記処理時間と前記状態条件に応じて、前記複数の操作の操作順を決定する、ことを特徴とする運用管理方法。
  12. 請求項11に記載の運用管理方法であって、
    前記操作順を決定する際に、前記状態条件を満たさない操作を検出することで、前記操作に誤りがあることを検知する、ことを特徴とする運用管理方法。
  13. 請求項11に記載の運用管理方法であって、
    前記複数の操作における個々の操作の終了時間を出力することで、前記個々の操作を確認するタイミングを提示する、ことを特徴とする運用管理方法。
  14. 請求項11に記載の運用管理方法であって、
    前記状態条件の判定に必要な前記運用管理対象機器の前記状態を取得するために、前記運用管理機器が記憶する状態更新頻度に基づいて、前記運用管理対象機器の稼動状況から、前記運用管理対象機器の前記状態を更新する、ことを特徴とする運用管理方法。
  15. 請求項11に記載の運用管理方法であって、
    前記状態条件の判定に必要な前記運用管理対象機器の前記状態を取得するために、前記運用管理対象機器の稼動状況を監視し、前記運用管理対象機器の前記状態に対応する前記稼動状況が変更されたことを検知した時点で、前記運用管理対象機器の前記状態を更新する、ことを特徴とする運用管理方法。
JP2011128042A 2011-06-08 2011-06-08 運用管理装置、及び方法 Expired - Fee Related JP5657475B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011128042A JP5657475B2 (ja) 2011-06-08 2011-06-08 運用管理装置、及び方法
US13/487,720 US8990372B2 (en) 2011-06-08 2012-06-04 Operation managing device and operation management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011128042A JP5657475B2 (ja) 2011-06-08 2011-06-08 運用管理装置、及び方法

Publications (2)

Publication Number Publication Date
JP2012256148A JP2012256148A (ja) 2012-12-27
JP5657475B2 true JP5657475B2 (ja) 2015-01-21

Family

ID=47294099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011128042A Expired - Fee Related JP5657475B2 (ja) 2011-06-08 2011-06-08 運用管理装置、及び方法

Country Status (2)

Country Link
US (1) US8990372B2 (ja)
JP (1) JP5657475B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9342981B1 (en) * 2012-10-16 2016-05-17 Google Inc. Instantiating an application based on connection with a device via a universal serial bus
US9092296B1 (en) * 2012-10-16 2015-07-28 Google Inc. Selectively updating firmware for multiple connected devices
CN104052889B (zh) * 2013-03-12 2016-09-07 京瓷办公信息系统株式会社 电子设备及设备管理系统
JP6081282B2 (ja) * 2013-04-23 2017-02-15 京セラドキュメントソリューションズ株式会社 動作条件説明書自動生成装置
US9819547B2 (en) * 2013-12-31 2017-11-14 Bmc Software, Inc. Server provisioning based on job history analysis
US9395713B2 (en) * 2014-05-05 2016-07-19 IP Research LLC Method and system of protection of technological equipment
JP6574558B2 (ja) * 2014-10-14 2019-09-11 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2017187813A (ja) * 2015-02-24 2017-10-12 株式会社野村総合研究所 稼働状況表示システム
JP6575099B2 (ja) 2015-03-24 2019-09-18 富士通株式会社 運用操作管理プログラム、運用操作管理装置および運用操作管理方法
US10592492B2 (en) * 2016-06-24 2020-03-17 International Business Machines Corporation Automatic updating of operational tables
US10740088B2 (en) * 2016-11-14 2020-08-11 Hitachi, Ltd. Countermeasure verification assistance system and method
CN111639779B (zh) * 2019-03-01 2023-08-29 北京国双科技有限公司 一种信息处理方法及相关设备
KR102325272B1 (ko) * 2019-04-24 2021-11-11 한국원자력연구원 수행시간 기반의 원전 운전원 신뢰도 평가 장치 및 그 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4345313B2 (ja) * 2003-01-24 2009-10-14 株式会社日立製作所 ポリシーに基づいたストレージシステムの運用管理方法
JP5076290B2 (ja) 2005-07-21 2012-11-21 日本電気株式会社 運用管理ルール流用装置、運用管理ルール流用方法およびプログラム
JP2007330016A (ja) * 2006-06-07 2007-12-20 Nec Corp 電源装置、情報処理システム、電源装置制御方法及びプログラム
JP2008046669A (ja) * 2006-08-10 2008-02-28 Hitachi Ltd 稼動管理プログラム、稼動管理方法、この方法を実行する装置
JP4592022B2 (ja) 2006-11-01 2010-12-01 株式会社日立情報システムズ 自動実行コマンド生成システムと方法およびプログラム
JP4313823B2 (ja) * 2007-02-26 2009-08-12 株式会社日立情報システムズ 障害対応システム及び障害対応方法

Also Published As

Publication number Publication date
US20120317259A1 (en) 2012-12-13
JP2012256148A (ja) 2012-12-27
US8990372B2 (en) 2015-03-24

Similar Documents

Publication Publication Date Title
JP5657475B2 (ja) 運用管理装置、及び方法
US9386079B2 (en) Method and system of virtual desktop infrastructure deployment studio
US7574627B2 (en) Memory dump method, memory dump program and computer system
JP6788178B2 (ja) 設定支援プログラム、設定支援方法及び設定支援装置
US11086662B2 (en) Method and system of migrating applications to a cloud-computing environment
US9912535B2 (en) System and method of performing high availability configuration and validation of virtual desktop infrastructure (VDI)
US9075994B2 (en) Processing attestation data associated with a plurality of data processing systems
EP2545446A2 (en) Effectively managing configuration drift
JPWO2013046287A1 (ja) 根本原因を解析する管理計算機及び方法
JP6009089B2 (ja) 計算機システムを管理する管理システム及びその管理方法
JP4918668B2 (ja) 仮想化環境運用支援システム及び仮想化環境運用支援プログラム
JP6028657B2 (ja) 検証プログラム、検証方法および検証装置
WO2014049854A1 (ja) 計算機システム、及びプログラム
US10922305B2 (en) Maintaining storage profile consistency in a cluster having local and shared storage
US8527747B2 (en) Future system that can participate in systems management activities until an actual system is on-line
KR20150124653A (ko) 프로세스 검증 기능이 구비된 전력 계통 감시 및 제어 시스템
US11818000B2 (en) Continuous delivery of management configurations
US11165655B1 (en) System for optimizing enterprise network relations
US20230097733A1 (en) Methods and systems to automatically deploy vulnerability fixes for software and firmware components
US20230021715A1 (en) Simulated Data Center
CN116490830A (zh) 控制系统以及控制方法
JP6818654B2 (ja) 試験自動化装置、試験方法、及びプログラム
US11755443B2 (en) System for performing an autonomous widget operation
US11509541B1 (en) System for performing a data asset virtual reality mapping session
JP7103804B2 (ja) ユーザインタフェース制御装置、ユーザインタフェース制御方法、及び、ユーザインタフェース制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140123

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141126

R150 Certificate of patent or registration of utility model

Ref document number: 5657475

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees