JP2012164260A - コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム - Google Patents

コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム Download PDF

Info

Publication number
JP2012164260A
JP2012164260A JP2011025796A JP2011025796A JP2012164260A JP 2012164260 A JP2012164260 A JP 2012164260A JP 2011025796 A JP2011025796 A JP 2011025796A JP 2011025796 A JP2011025796 A JP 2011025796A JP 2012164260 A JP2012164260 A JP 2012164260A
Authority
JP
Japan
Prior art keywords
resource usage
usage information
computer
operation management
information collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011025796A
Other languages
English (en)
Inventor
Teruyuki Nakajima
晃之 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011025796A priority Critical patent/JP2012164260A/ja
Publication of JP2012164260A publication Critical patent/JP2012164260A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】システムの負荷状況に即したシステム拡張を自動化することができるコンピュータ運用管理システムを提供する。
【解決手段】コンピュータ運用管理システムは、データベース104に蓄積されたリソースの利用実績値がある一定期間継続して所定の閾値を超えたかどうかを演算する閾値超過算定手段205と、閾値超過算定手段205による演算結果に基づいて、コンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させる処理を含む拡張対象の拡張処理を実行するか否かを判定する拡張処理自律実行判定手段209とを備える。
【選択図】図1

Description

本発明は、コンピュータの運用管理に用いられるコンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラムに関する。
コンピュータ運用管理システムの一例が、特許文献1に記載されている。特許文献1に記載されているコンピュータ運用管理システムは、特許文献1の図1に示すように、システム監視装置部、情報収集部、情報を格納するためのデータベース、監視項目が閾値から逸脱していないかを判定する演算処理部、及び、監視情報を出力する情報出力部から構成されている。このような構成を有する運用管理システムは、次のように動作する。すなわち、システムごとに設置されたシステム監視装置から収集された障害情報及び性能情報が含まれる出力信号が、予めナレッジデータベースに蓄積された過去の障害履歴に基づくサブシステム間の障害連係情報及び既製運用監視ソフトウェアの性能情報と比較されて、再定義される。その後、再定義された障害情報及び性能情報が標準的なシステム管理情報として情報出力部へとメッセージ配信され、配信された情報を用いてシステム全体が標準的な監視レベルで監視される。
特許文献1に記載されているコンピュータ運用管理システムは、障害監視・性能劣化監視といった一般的に言われる障害事象の監視をターゲットとするものである。
一方、特許文献2には、リソースの使用率や物理サーバのキャパシティといったシステムの性能や能力に係る情報に基づきコンピュータの運用管理を行うコンピュータ運用管理システムの一例が記載されている。特許文献2に記載されているコンピュータ運用管理システムは、特許文献2の図1に示すように、リソース情報収集部、情報を格納するためのデータベース、監視項目が閾値から逸脱していないかを判定する閾値判断部、負荷を平準化するための最適解を算出するための評価値計算部、及び、その最適解を元に仮想サーバの移動を命令する仮想サーバ移動部から構成されている。このような構成を有する運用管理システムは、次のように動作する。すなわち、物理サーバ及び仮想サーバのリソース情報並びに物理サーバのキャパシティ情報を用いて、リソースの使用率が高負荷閾値を超えている物理サーバ又は低負荷閾値より低い物理サーバが抽出される。次に、該抽出された物理サーバで稼動している複数の仮想サーバと該仮想サーバの移動先となる物理サーバとの全ての組み合わせから成る移動候補について、仮想サーバ移動後の各物理サーバのリソースの使用率を平準化するための指標である評価値が求められる。そして、該評価値を基に移動される仮想サーバ及びその移動先又は移動元の物理サーバが決定され、決定された仮想サーバが移動先の物理サーバへと移動される。
また、特許文献3には、所定の閾値を超えた場合に追加のリソース増強要求を保留し、リソースが動的に空くことを待つという技術が記載されている。特許文献3に記載されているコンピュータ運用管理システムは、優先順位に応じてリソースの割り当てを行うことで、システム全体のリソースを有効に活用しようというものである。特許文献3に記載されているコンピュータ運用管理システムでは、優先順位の低い要求に対してリソースの割り当てを保留することにより、システム全体に対してのリソース不足に対応する。
他方、特許文献4に記載されているコンピュータ運用管理システムでは、拡張対象コンピュータのリソース不足の際に、そのモニタリングをしているサーバから拡張対象コンピュータに対して拡張対象コンピュータ自身のリソースを拡張するよう命令が出力されるようになっている。この特許文献4に記載されているコンピュータ管理システムでは、利用可能なハードウェアスペックに上限制限を設けることができるコンピュータを用いてシステムを構成し、リソース不足の場合に上限制限が変更されるようになっている。
特開2008−234351号公報 特表2008−102739号公報 特開2010−176637号公報 特開2002−63133号公報
特許文献1に記載されているコンピュータ運用管理システムは、障害監視・性能劣化監視といった一般的に言われる障害事象の監視をターゲットとするものであるため、システム環境の負荷状況といったシステムの性能や能力に係る情報をもとに、必要とされる性能や能力が不足するような場合に、柔軟なシステム拡張に向けた情報を提供するような機構は提供されていない。
一方、特許文献2に記載されているコンピュータ運用管理システムでは、各物理サーバで複数の仮想サーバを稼働させる場合に、システム内のあるコンポーネントにおいて必要とされるリソースが増加したとき、他のコンポーネントにおける空きリソースが割り当てられることになる。そのため、特許文献2に記載されている運用管理の手法は、システム全体に対する負荷がシステム全体で所有するリソースの範囲内である場合に有効に機能する。しかしながら、システム全体のリソースが不足している場合には効果が望めない。
また、特許文献3に記載されているコンピュータ運用管理システムでは、例えば全体の利用リソースが閾値近傍で推移しているような場合には、システムへのリソース割り当てや保留が頻発され、システム全体の運用が不安定になるおそれがある。
他方、特許文献4に記載されているコンピュータ運用管理システムでは、上限制限を変更することで各コンピュータの性能が向上させられるようになっている。すなわち、各コンピュータの性能や能力を増強することでシステム全体の性能や能力を向上させる、いわゆるスケールアップの手法を自動化しようとするものである。
このように、上述した特許文献1から3に記載されているコンピュータ運用管理システムでは、負荷状況によって各コンピュータの性能や能力が不足することがあった。また、特許文献4に記載されているコンピュータ運用管理システムのようにスケールアップの手法を用いた場合でも、各コンピュータの性能や能力の増強には限界があるため、負荷状況によって各コンピュータの性能や能力が不足することがあった。
本発明は、システムの負荷状況に即したシステム拡張を自動化することができるコンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラムを提供することを目的とする。
上記課題を解決するため、本発明は、複数のコンピュータからなるコンピュータ群をリソース利用情報収集対象として指定するリソース利用情報収集対象登録手段と、前記リソース利用情報収集対象登録手段によって指定された前記コンピュータ群からリソース利用情報を収集するリソース利用情報収集手段と、前記リソース利用情報収集手段によって前記コンピュータ群から収集された前記リソース利用情報を所定のデータベースに蓄積するリソース利用情報蓄積手段と、前記データベースに蓄積された前記リソース利用情報を数値化した値であるリソース利用実績値が所定期間継続して所定の閾値を超えたか否かを演算する閾値超過算定手段と、前記閾値超過算定手段による演算結果に基づいて、前記コンピュータ群内で稼働状態となるコンピュータを少なくとも1台増加させる処理を含む拡張処理を実行させるか否かを判定する拡張処理自律実行判定手段と、を備えることを特徴とするコンピュータ運用管理システムである。
本発明によれば、閾値超過算定手段によって、所定のデータベースに蓄積されたリソース利用情報を数値化した値であるリソース利用実績値が所定期間継続して所定の閾値を超えたかどうかが演算される。そして、拡張処理自律実行判定手段によって、前記データベースに蓄積されたリソース利用情報と、閾値超過算定手段による演算結果とに基づいて、コンピュータ群内で稼働状態となるコンピュータを少なくとも1台増加させる処理を含む拡張処理を実行させるか否かを判定する。よって、本発明によれば、システムの負荷状況に即したシステム拡張を自動化することができる。
本発明によるコンピュータ運用管理システムの一実施形態の構成を示すブロック図である。 図1のコンピュータ運用管理システムにおける「拡張推奨対象の提示」処理の流れを示すフローチャートである。 図1のコンピュータ運用管理システムにおける「拡張推奨対象のコンポーネントの展開」処理の流れを示すフローチャートである。
次に、発明を実施するための形態について図面を参照して詳細に説明する。図1を参照すると、本発明のコンピュータ運用管理システムの一実施の形態は、それぞれプログラム制御によって動作するコンピュータである、リソース利用情報収集サーバ100、拡張対象選定サーバ101及び拡張業務支援サーバ102、コンピュータ群103、性能情報蓄積データベース(データベース)104、並びに、モニタなどの出力手段であるインターフェース105から構成されている。
コンピュータ群103は、本システムにおいて、リソース利用情報が収集されるコンピュータの一群であり、複数のコンピュータ1−1、1−2、…、1−n(nは自然数)からなるコンピュータ群103−1と、複数のコンピュータ2−1、…、2−m(mは自然数)からなるコンピュータ群103−2とを含んで構成されている。コンピュータ1−1、1−2、…、1−n、及び、2−1、…、2−mは、それぞれ、CPU(Central Processing Unit)、主記憶装置、補助記憶装置、通信装置などを備えて構成されている物理サーバである。また、コンピュータ1−1、1−2、…、1−n、及び、2−1、…、2−mの各補助記憶装置には、OS(Operating System)、ミドルウェア、アプリケーションソフトウェアなどのプログラムが使用可能な状態で格納されている。また、また、コンピュータ1−1、1−2、…、1−n、及び、2−1、…、2−mは、固有の物理アドレスであるMACアドレス(Media Access Control address)が割り当てられた通信装置を介して、LAN(Local Area Network)などのネットワークに接続されている。さらに、コンピュータ1−1、1−2、…、1−n、及び、2−1、…、2−mは、MACアドレスなどを指定してネットワーク上で所定の呼び出しを受けることで、非稼働中の状態から稼働中の状態へと動作状態を変更する機能を有している。
また、コンピュータ群103−1は稼働中のコンピュータの集まりであり、コンピュータ群103−2は非稼働中のコンピュータの集まりである。なお、本実施形態において、稼働中とは、CPU及び主記憶装置に電源やクロックが供給されている状態を意味するものとする。
リソース利用情報収集サーバ100は、本システムにおいて、リソース利用情報収集対象コンピュータ群103上のリソース利用量を監視し収集する機能を有するコンピュータである。リソース利用情報収集サーバ100は、それぞれ所定のプログラムを実行することで実現される各機能に対応する手段である、リソース利用情報収集対象登録手段201、リソース利用情報収集手段202、リソース利用情報蓄積手段203、及び、リソース利用情報定義編集手段204を有している。
リソース利用情報収集対象登録手段201は、コンピュータ群103をリソース利用情報収集対象として指定する機能を有している。リソース利用情報収集手段202は、コンピュータ群103から任意の時間帯(予め設定された所定の時間帯や時間間隔または、操作者が任意に設定した所定の時間帯や時間間隔)でリソース利用情報を収集する機能を有している。リソース利用情報蓄積手段203は、コンピュータ群103から収集したリソース利用情報を性能情報蓄積データベース104に登録する機能を有している。そして、リソース利用情報定義編集手段204は、コンピュータ群103から収集する項目や時間帯を編集する機能を有している。
拡張対象選定サーバ101は、本システムにおいて、拡張推奨コンポーネントを選定し提示する機能を有するコンピュータである。ここで、本実施形態におけるコンポーネントとは、コンピュータ群103内のコンピュータ1−1、1−2、…、1−n、及び、2−1、…、2−mの中の1台と、そのコンピュータで(あるいはそのコンピュータ上で稼働する1又は複数の仮想サーバ上で)実行される1又は複数のプログラムとを一体としたシステムの構成要素を意味するものとする。また、コンポーネント展開とは、非稼働状態のコンピュータを稼働状態にするとともに、そのコンピュータ上で所定のプログラムを実行したり、又は所定の設定を実行したりすることで、所望の機能(サービス)を提供可能な状態に設定することを意味するものとする。ただし、稼働及び非稼働状態に動作状態を変更可能な装置(あるいは部品)であれば、拡張の単位(すなわち最小の拡張リソース量)を、1台のコンピュータとするのに限らず、複数のコンピュータとしたり、1台のコンピュータ内あるいは外に設けられた周辺装置や部品としたりすることができる。
拡張対象選定サーバ101は、それぞれ所定のプログラムを実行することで実現される各機能に対応する手段である、閾値超過算定手段205、閾値超過対象表示手段(表示手段)206、リソース空き状況判定手段207、拡張処理実行命令手段208、及び、拡張処理自律実行判定手段209を有している。
閾値超過算定手段205は、性能情報蓄積データベース104に蓄積されたソース利用情報を数値化した値であるリソース利用実績値がある一定期間継続して閾値を超えたか否かを演算する機能を有している。閾値超過対象表示手段206は、リソース利用実績値が閾値を超えている拡張対象をインターフェース105上に表示する機能を有している。リソース空き状況判定手段207は、リソース利用実績値が閾値を超えている拡張対象を拡張する場合のリソースが現行リソース(コンピュータ群103内のハードウェア及びソフトウェア資源内のリソース)の中に残っているか否かを判定する機能を有している。拡張処理実行命令手段208は、コンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させる処理を含む拡張対象の拡張処理を実行する命令を拡張業務支援サーバ102に発行する機能を有している。そして、拡張処理自律実行判定手段209は、拡張対象の拡張処理を自律実行とするか手動実行とするかを、性能情報蓄積データベース104に格納された情報と閾値超過算定手段205による演算結果とに基づいて判断する機能を有している。例えば、性能情報蓄積データベース104には拡張処理実行手段210による拡張処理を自律実行とするか否かを指示する情報(例えば、自律実行とするか否か、または、手動実行とするか等)が登録されている。拡張処理自律実行判定手段209は、性能情報蓄積データベース104に格納された情報と閾値超過算定手段205による演算結果とに基づいて、コンピュータ群103内でリソース利用実績値が閾値を超えている拡張対象(コンピュータ)に対して、拡張処理実行手段210に拡張処理を実行させるか否か(自律実行とするか否か)を判定する。
拡張業務支援サーバ102は、本システムにおいて、拡張対象の拡張処理業務の支援を担当するコンピュータである。拡張業務支援サーバ102は、それぞれ所定のプログラムを実行することで実現される各機能に対応する手段である、拡張処理実行手段210及び拡張処理情報管理手段211を有している。また、拡張業務支援サーバ102には、拡張対象を拡張する際に用いられるパターンである雛形(あるいはテンプレート)を記憶する記憶装置212を備えている。ここで本実施形態における雛形、すなわち拡張する際に用いられるパターンとは、拡張処理において追加されるコンピュータやコンピュータで実行されるプログラムの仕様の定型を表す情報である。記憶装置212には、コンピュータ群103内の各コンピュータを用いて提供される種々のサービスに対応させて、複数種類の雛形があらかじめ格納されている。
拡張処理実行手段210は、拡張処理実行命令手段208からの命令に基づき、コンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させる処理を含む拡張処理をその拡張対象の雛形を利用してコンポーネント展開することで実行し、システム拡張する機能を有している。例えば、拡張処理実行手段210は、拡張処理実行命令手段208からの命令に基づき、コンピュータ群103内でリソース利用実績値が閾値を超えている拡張対象(コンピュータ)に対して、拡張処理を実行する。拡張処理情報管理手段211は、拡張対象を拡張するための雛形を管理する機能を有している。
性能情報蓄積データベース104は、コンピュータ群103から収集したリソース利用情報、及びリソース利用情報収集対象に関する定義情報を保持する。
図1に示す各手段201〜211は、それぞれ概略次のように動作する。
リソース利用情報収集対象登録手段201は、コンピュータ群103においてリソース利用情報収集対象として定義したコンピュータにおいて、情報収集のためのモジュール機能を適用する(すなわち、コンピュータ群103のコンピュータで情報収集用の所定のプログラムモジュールを利用可能な状態に設定する)。リソース利用情報収集対象登録手段201は、また、性能情報蓄積データベース104にリソース利用情報収集対象についてのレコードを作成し、リソース利用情報収集手段202による情報収集のための初期設定処理を行う。初期設定処理では、リソース利用情報を収集するコンピュータごとに、収集する項目、その閾値、収集する時間帯、閾値をどれだけの期間超過した場合に拡張対象とするか、拡張対象となった場合の拡張方針(自律実行とするか手動実行とするか、最大で何台までのコンピュータの拡張を容認するか)などの設定情報が定義される。例えば、収集する項目は、コンピュータを構成するCPU、主記憶装置、補助記憶装置、通信装置の使用率や使用量であり、各項目の閾値は、拡張対象と判定する場合の使用率や使用量の基準値である。
リソース利用情報収集手段202は、リソース利用情報定義編集手段204で指定された収集項目をリソース利用情報定義編集手段204で指定された時間帯(所定の収集時間帯)において、コンピュータ群103内に含まれるリソース利用情報収集対象であるコンピュータに適用されたモジュール機能を利用して、リソース利用情報収集サーバ100内の所定の記憶装置にリソース利用情報を収集する。
リソース利用情報蓄積手段203は、リソース利用情報収集手段202においてリソース利用情報収集サーバ100内の所定の記憶装置に収集されているコンピュータ群103のリソース利用情報を性能情報蓄積データベース104に登録する。
リソース利用情報定義編集手段204は、リソース利用情報が収集されるコンピュータごとに、収集する項目とその閾値、収集する時間帯、閾値をどれだけの期間超過した場合に拡張対象とするか、拡張対象となった場合の拡張方針(自律実行とするか手動実行とするか、最大で何台までの拡張を容認するか)についての定義情報を編集する機能を提供する。リソース利用情報定義編集手段204を用いて編集された定義情報の編集内容は性能情報蓄積データベース104に反映される。ここで、自律実行とは、コンピュータ運用管理システムが、所定の雛形に基づき自動でコンピュータ群103−2内のコンピュータを稼働状態に設定するとともに、所定のプログラムを実行することで所定の機能(あるいはサービス)を提供可能な状態に設定することを意味する。また、自律実行によりシステム拡張する拡張処理を、自律拡張とも記述する。一方、手動実行とは、自律実行と同様の処理において、一部が(あるいは主要な処理の一部が)操作者によって設定された指示や設定値を用いた処理となっているものを意味している。また、拡張を容認する台数は、図1の例では、最大で、コンピュータ群103−2内のコンピュータ台数であるm台となる。
閾値超過算定手段205は、性能情報蓄積データベース104に蓄積されているリソース利用情報の利用実績値を参照し、その利用実績値が、その利用実績値に対して設定されている閾値をある一定期間超過しているかどうか演算する。
閾値超過対象表示手段206は、閾値超過算定手段205で利用実績値が閾値を一定期間超えていると算定された対象を拡張推奨対象として、インターフェース105上に表示する。
リソース空き状況判定手段207は、閾値超過算定手段205で閾値を一定期間超えていると算定された拡張推奨対象を拡張した場合に必要なリソース量が現行リソース(コンピュータ群103内のハードウェア及びソフトウェア資源内のリソース)の中に残っているか否かを判断する。
拡張処理実行命令手段208は、コンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させて拡張推奨対象の拡張を実行するように拡張業務支援サーバ102に命令を発行する。
拡張処理自律実行判定手段209は、閾値超過算定手段205で閾値を一定期間超えていると算定された拡張推奨対象の拡張方針を性能情報蓄積データベース104から参照し、次の3条件を満たした場合には自律拡張を選択する。この場合の3条件とは、自律拡張実行が指定されていること、拡張台数が所定の設定数以内(拡張最大指定数より小さい)であること、及び現行リソースに余裕がないことである。拡張処理自律実行判定手段209は、これらの3条件が満たされていた場合には自律拡張を選択し、それ以外の場合は閾値超過対象表示手段206によってインターフェース105への推奨表示を実行する。
拡張処理実行手段210は、拡張処理実行命令手段208からの命令に基づき、拡張処理情報管理手段211によって記憶装置212内に登録されている拡張対象の雛形を利用してコンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させ、コンポーネント展開を実行する。
拡張処理情報管理手段211は、リソース利用情報収集対象ごとにシステム拡張を行なうための拡張対象の雛形を記憶装置212内に登録し、管理する。
次に、図2を参照して、本実施の形態で特徴的な「拡張推奨対象の提示」処理の流れについて詳細に説明する。
まず、リソース利用情報収集対象登録手段201は、リソース利用情報を収集するコンピュータを選定し、情報収集を実施するためのモジュール機能を適用する(ステップS11)。次に、リソース利用情報収集対象登録手段201は、モジュール機能を適用したリソース利用情報収集対象に関する情報を性能情報蓄積データベース104に登録する(ステップS12)。登録する情報は、コンピュータの基本情報、監視情報、拡張方針情報の3種類である。ここで、コンピュータの基本情報とは、例えば、名称、単独判別可能な識別子(ホスト名、IP(Internet Protocol)アドレスや、MACアドレスを表す情報である。監視情報とは、例えば、情報収集する項目、その閾値、収集する時間帯や、閾値を連続超過した場合に拡張すると判定するための期間を表す情報である。そして、拡張方針情報とは、例えば、自律実行を基本とするか又は手動実行を基本とするかということを表す情報や、最大で何台まで同時稼動を許容するか(あるいは最大何台まで拡張を許容するか)ということを表す情報である。
次に、リソース利用情報収集手段202は、登録されたコンピュータの監視情報に基づき、リソース利用情報収集対象のコンピュータ上のモジュール機能を用いて、リソース利用情報を収集する(ステップS13)。
次に、リソース利用情報蓄積手段203は、収集したリソース利用情報を性能情報蓄積データベース104に蓄積する(ステップS14)。
次に、閾値超過算定手段205は、ある一定のタイミングにおいて、リソース利用情報収集対象のコンピュータごとに閾値超過有無の算定処理を実行する(ステップS15)。また、閾値超過算定手段205は、性能情報蓄積データベース104から監視情報とリソース利用情報を参照し、あるコンピュータにおいて情報収集項目のいずれかが、閾値をある一定期間連続して超過しているか否かを演算によって算定する(ステップS16)。
次に、閾値超過対象表示手段206は、閾値をある一定期間超過していると算定されたコンピュータを表す情報を、閾値を超過している旨を表す情報とともにインターフェース105上に表示させる(ステップS17)。
次に、図3を参照して、本実施の形態で特徴的な「拡張推奨対象のコンポーネントの展開」処理の流れについて詳細に説明する。図3に示す処理は、拡張推奨対象としてインターフェース105上に表示されたコンピュータがある場合に実行される。
まず、リソース空き状況判定手段207は、拡張推奨対象のコンポーネントを展開した場合を想定し、現行リソースの空きを算出する(ステップS21)。
次に、拡張処理自律実行判定手段209は、現行リソースに空きがあるか否かを判定する(ステップS22)。リソースに空きがない場合(ステップS22で「NO」の場合)には、拡張処理自律実行判定手段209は、自律拡張を実行させないと判定して処理を終了する。一方、リソースに空きがある場合(ステップS22で「YES」の場合)には、拡張処理自律実行判定手段209は、拡張推奨対象の拡張方針情報を性能情報蓄積データベース104から参照し、自律拡張実行が指定されているか否かを判定する(ステップS23)。自律拡張実行が指定されている場合(ステップS23で「YES」の場合)には、拡張処理自律実行判定手段209は、拡張数が拡張最大指定数よりも少ないか否かを判定する(ステップS24)。
拡張数が拡張最大指定数よりも少ない場合(ステップS24で「YES」の場合)には、拡張処理自律実行判定手段209は、自律拡張を実行させると判定する。一方、手動拡張実行が指定されている(ステップS23で「NO」の場合)、もしくは、現行の拡張数が拡張最大指定数に達している場合(ステップS24で「NO」の場合)には、拡張処理自律実行判定手段209は、自律拡張を実行させないと判定して処理を終了する。
拡張処理自律実行判定手段209によって自律拡張を実行させると判断された場合(ステップS24で「YES」の場合)には、拡張処理実行命令手段208は、コンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させる処理を含む拡張推奨対象のコンポーネント展開命令を発行する(ステップS25)。
次に拡張処理実行手段210は、拡張処理実行命令手段208からの命令に基づき、コンポーネント展開命令が発行された拡張対象に対して登録されている雛形を記憶装置212から検索し、その雛形を利用してコンピュータ群103内で稼働状態のコンピュータを少なくとも1台増加させる処理を含むコンポーネント展開を実行する(ステップS26)。
次に、本実施の形態の効果について説明する。本実施の形態では、リソース利用情報を収集し閾値監視を行なうだけでなく、その閾値をある一定期間超えた場合にリソース増強の必要があると判定し自律的にそのリソース増強を実行する仕組みが提供される。そのため、システムの負荷状況に即したリソース量を保持したシステムを動的に提供することが可能となる。
すなわち、本実施形態のコンピュータ運用管理システムでは、システム内の各処理コンポーネント(すなわちコンピュータ群103内のコンピュータ及びプログラム)の負荷状況を監視する手段と、リソース拡張対象を算出する手段と、その拡張対象を自律拡張する手段を備え、リソース拡張対象を算定した上で手動もしくは自動的に拡張するよう動作する。このような構成を採用し、自律拡張手段において任意の時間帯、期間である条件を満たした場合に発動させるものとし拡張数の上限を設定しておくことで、システムの各コンポーネントの負荷状況に応じたシステム拡張を支援及び自動化することができる。したがって、本実施形態は次のような効果を奏する。
第1の効果は、システムのリソース利用量が増加する中で、どのコンポーネントを拡張(増強)すればシステム全体のレスポンスを向上することができるのか判定できることである。その理由は、各処理コンポーネントの特性に応じた監視項目を任意の所定の時間帯で監視する仕組み、及びその監視項目の実績値がある一定期間継続して閾値を超えるかどうか監視する仕組みの組合せによって、拡張推奨コンポーネントが本発明によって提示可能となるためである。
第2の効果は、システム全体に対する負荷がシステム全体で所有するリソースの範囲以上である場合においても、リソースを追加する必要があることを判断ができることにある。その理由は、第1の効果の理由で述べた拡張推奨コンポーネントが提示される仕組み、及び拡張を推奨されたコンポーネントを展開するだけの空きリソースがない場合においては自動的に拡張処理を実行しない仕組みが、本発明によって提供されるためである。
第3の効果は、コンポーネント拡張時に自動的に拡張処理を実行できることにある。その理由は、拡張を推奨されたコンポーネントを上限数の範囲内で自動的に拡張するか手動で拡張するか選択する仕組み、及び各コンポーネントの展開元となる雛形を用意しシステム的に展開する仕組みが、本発明によって提供されるためである。
このように、本実施形態のコンピュータ運用管理システムでは、コンピュータの数を増加させることでシステム全体の性能や能力を向上させる手法であるスケールアウトの手法によるシステム拡張を、システムの負荷状況に即して自動化することができる。
また、本発明は、クラウド環境を提供するプラットフォーム環境において、システムの負荷状況に即した自律的なリソース増強機能を提供する用途に適用できる。
なお、本発明の実施の形態は図1に示す構成に限定されず、サーバやデータベースを統合したり、分散させたりする変更などを適宜行うことができる。また、本発明のコンピュータ運用管理システムは、1又は複数のコンピュータと、1又は複数のプログラムとを用いて構成することができ、そのプログラムの全部又は一部を、コンピュータ読み取り可能な記録媒体又は通信回線を介して提供することが可能である。
100 リソース利用情報収集サーバ(コンピュータ)
101 拡張対象選定サーバ(コンピュータ)
102 拡張業務支援サーバ(コンピュータ)
103 コンピュータ群(リソース利用情報収集対象)
103−1 コンピュータ群(稼働状態)
103−2 コンピュータ群(非稼働状態)
1−1、1−2、…、1−n コンピュータ(稼働状態)
2−1、…、2−m コンピュータ(非稼働状態)
104 性能情報蓄積データベース
201 リソース利用情報収集対象登録手段
202 リソース利用情報収集手段
203 リソース利用情報蓄積手段
204 リソース利用情報定義編集手段
205 閾値超過算定手段
206 閾値超過対象表示手段
207 リソース空き状況判定手段
208 拡張処理実行命令手段
209 拡張処理自律実行判定手段
210 拡張処理実行手段
211 拡張処理情報管理手段

Claims (10)

  1. 複数のコンピュータからなるコンピュータ群をリソース利用情報収集対象として指定するリソース利用情報収集対象登録手段と、
    前記リソース利用情報収集対象登録手段によって指定された前記コンピュータ群からリソース利用情報を収集するリソース利用情報収集手段と、
    前記リソース利用情報収集手段によって前記コンピュータ群から収集された前記リソース利用情報を所定のデータベースに蓄積するリソース利用情報蓄積手段と、
    前記データベースに蓄積された前記リソース利用情報を数値化した値であるリソース利用実績値が所定期間継続して所定の閾値を超えたか否かを演算する閾値超過算定手段と、
    前記閾値超過算定手段による演算結果に基づいて、前記コンピュータ群内で稼働状態となるコンピュータを少なくとも1台増加させる処理を含む拡張処理を実行させるか否かを判定する拡張処理自律実行判定手段と、
    を備えることを特徴とするコンピュータ運用管理システム。
  2. 前記拡張処理自律実行判定手段により判定された結果に基づいて、前記拡張処理を実行する拡張処理実行手段、
    を備えることを特徴とする請求項1に記載のコンピュータ運用管理システム。
  3. 前記拡張処理自律実行判定手段は、
    前記閾値超過算定手段による演算結果に基づいて、前記コンピュータ群の内、前記リソース利用実績値が所定期間継続して所定の閾値を超えたコンピュータに対して、前記拡張処理実行手段による前記拡張処理を実行させると判定する
    ことを特徴とする請求項2に記載のコンピュータ運用管理システム。
  4. 前記データベースには、前記拡張処理実行手段による前記拡張処理を自律実行とするか否かを指示する情報が登録されており、
    前記拡張処理自律実行判定手段は、
    前記データベースに登録されている前記自律実行とするか否かを指示する情報に基づいて、前記拡張処理実行手段による前記拡張処理を実行させるか否かを判定する
    ことを特徴とする請求項2または請求項3に記載のコンピュータ運用管理システム。
  5. 前記拡張処理自律実行判定手段は、
    前記拡張処理における前記コンピュータの拡張台数が所定の設定数以内である場合に、前記拡張処理実行手段による前記拡張処理を実行させると判定する
    ことを特徴とする請求項2から請求項4のいずれか1項に記載のコンピュータ運用管理システム。
  6. 前記リソース利用実績値が前記所定の閾値を超えている場合、その旨を表示する表示手段、
    をさらに備えることを特徴とする請求項1から請求項5のいずれか1項に記載のコンピュータ運用管理システム。
  7. 前記リソース利用情報収集手段は、
    所定の収集時間帯に前記コンピュータ群から前記リソース利用情報を収集し、
    前記リソース利用情報収集手段により前記リソース利用情報を収集する際の、前記所定の収集時間帯の設定、または前記リソース利用情報として収集する項目の設定を編集するリソース利用情報定義編集手段、
    をさらに備えることを特徴とする請求項1から請求項6のいずれか1項にコンピュータ運用管理システム。
  8. 前記拡張対象を拡張する場合のリソースが前記コンピュータ群内のリソースの中に残っているか否かを判定するリソース空き状況判定手段、
    をさらに備えることを特徴とする請求項1から請求項7のいずれか1項にコンピュータ運用管理システム。
  9. 複数のコンピュータからなるコンピュータ群をリソース利用情報収集対象として指定するリソース利用情報収集対象登録過程と、
    前記リソース利用情報収集対象登録過程で指定された前記コンピュータ群からリソース利用情報を収集するリソース利用情報収集過程と、
    前記リソース利用情報収集過程で前記コンピュータ群から収集された前記リソース利用情報を所定のデータベースに蓄積するリソース利用情報蓄積過程と、
    前記データベースに蓄積された前記リソース利用情報を数値化した値であるリソース利用実績値が所定期間継続して所定の閾値を超えたか否かを演算する閾値超過算定過程と、
    前記閾値超過算定過程による演算結果に基づいて、前記コンピュータ群内で稼働状態となるコンピュータを少なくとも1台増加させる処理を含む拡張処理を実行するか否かを判定する拡張処理自律実行過程と、
    を含むことを特徴とするコンピュータ運用管理方法。
  10. 複数のコンピュータからなるコンピュータ群をリソース利用情報収集対象として指定するリソース利用情報収集対象登録過程と、
    前記リソース利用情報収集対象登録過程で指定された前記コンピュータ群からリソース利用情報を収集するリソース利用情報収集過程と、
    前記リソース利用情報収集過程で前記コンピュータ群から収集された前記リソース利用情報を所定のデータベースに蓄積するリソース利用情報蓄積過程と、
    前記データベースに蓄積された前記リソース利用情報を数値化した値であるリソース利用実績値が所定期間継続して所定の閾値を超えたか否かを演算する閾値超過算定過程と、
    前記閾値超過算定過程による演算結果に基づいて、前記コンピュータ群内で稼働状態となるコンピュータを少なくとも1台増加させる処理を含む拡張処理を実行するか否かを判定する拡張処理自律実行過程と、
    をコンピュータによって実行させることを特徴とするコンピュータ運用管理プログラム。
JP2011025796A 2011-02-09 2011-02-09 コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム Pending JP2012164260A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011025796A JP2012164260A (ja) 2011-02-09 2011-02-09 コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011025796A JP2012164260A (ja) 2011-02-09 2011-02-09 コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム

Publications (1)

Publication Number Publication Date
JP2012164260A true JP2012164260A (ja) 2012-08-30

Family

ID=46843567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011025796A Pending JP2012164260A (ja) 2011-02-09 2011-02-09 コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム

Country Status (1)

Country Link
JP (1) JP2012164260A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049129A (ja) * 2012-08-31 2014-03-17 Hon Hai Precision Industry Co Ltd 仮想マシンの負荷管理システム及びその方法
WO2016075771A1 (ja) * 2014-11-12 2016-05-19 株式会社日立製作所 計算機システムおよび計算機システムにおけるオートスケール方法
JP2018106517A (ja) * 2016-12-27 2018-07-05 富士通株式会社 情報処理装置、フェールオーバ時間測定方法及びフェールオーバ時間測定プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231180A (ja) * 1995-12-22 1997-09-05 Hitachi Ltd サーバ分割方法
JP2004110791A (ja) * 2002-09-16 2004-04-08 Hewlett-Packard Development Co Lp ブレードアーキテクチャのための動的適応サーバプロビジョニング
JP2005339528A (ja) * 2004-04-30 2005-12-08 Hitachi Ltd 計算機システム、管理サーバ、ブレード割り当て方法、ブレード割り当てプログラム、サーバシステム及びサーバの配置方法
JP2006302249A (ja) * 2005-03-23 2006-11-02 Hitachi Ltd 管理コンピュータの制御方法、及びサーバの制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231180A (ja) * 1995-12-22 1997-09-05 Hitachi Ltd サーバ分割方法
JP2004110791A (ja) * 2002-09-16 2004-04-08 Hewlett-Packard Development Co Lp ブレードアーキテクチャのための動的適応サーバプロビジョニング
JP2005339528A (ja) * 2004-04-30 2005-12-08 Hitachi Ltd 計算機システム、管理サーバ、ブレード割り当て方法、ブレード割り当てプログラム、サーバシステム及びサーバの配置方法
JP2006302249A (ja) * 2005-03-23 2006-11-02 Hitachi Ltd 管理コンピュータの制御方法、及びサーバの制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049129A (ja) * 2012-08-31 2014-03-17 Hon Hai Precision Industry Co Ltd 仮想マシンの負荷管理システム及びその方法
WO2016075771A1 (ja) * 2014-11-12 2016-05-19 株式会社日立製作所 計算機システムおよび計算機システムにおけるオートスケール方法
JP2018106517A (ja) * 2016-12-27 2018-07-05 富士通株式会社 情報処理装置、フェールオーバ時間測定方法及びフェールオーバ時間測定プログラム

Similar Documents

Publication Publication Date Title
US8219997B2 (en) Execution the job that is divided into job tasks based on the estimated completion time
JP6092718B2 (ja) 運用計画立案支援システム及び方法
US10275286B2 (en) Management systems of cloud resources and management methods thereof
EP3180695B1 (en) Systems and methods for auto-scaling a big data system
KR100998391B1 (ko) 데이터 처리 시스템을 관리하는 규정 설정 방법, 컴퓨터 판독 가능한 저장 매체 및 시스템
JP5577412B2 (ja) 計算機システム、マイグレーション方法及び管理サーバ
US9396026B2 (en) Allocating a task to a computer based on determined resources
JP5664098B2 (ja) 複合イベント分散装置、複合イベント分散方法および複合イベント分散プログラム
JP5684629B2 (ja) ジョブ管理システム及びジョブ管理方法
US20080295095A1 (en) Method of monitoring performance of virtual computer and apparatus using the method
CN107431696A (zh) 用于应用自动化部署的方法和云管理节点
US20160156568A1 (en) Computer system and computer resource allocation management method
CN103430150A (zh) 在云计算系统中创建资源的技术
JP2017107274A (ja) 仮想マシン増設方法、情報処理装置および仮想マシン増設システム
KR101770191B1 (ko) 자원 할당 방법 및 그 장치
CN113032102A (zh) 资源重调度方法、装置、设备和介质
JPH09218858A (ja) 分散型データベース管理システム
JP2013210833A (ja) ジョブ管理装置、ジョブ管理方法、及びプログラム
JP2012164260A (ja) コンピュータ運用管理システム、コンピュータ運用管理方法及びコンピュータ運用管理プログラム
JP2011192049A (ja) 仮想マシンシステム、自動マイグレーション方法および自動マイグレーションプログラム
US9467336B2 (en) Information processing system and management method thereof
CN115061811A (zh) 一种资源调度方法、装置、设备及存储介质
US10992534B2 (en) Forming groups of nodes for assignment to a system management server
JPH08152903A (ja) マルチプロセッサシステム
CN105718297A (zh) 虚拟机建立系统以及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140909

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150127