JP5951111B2 - 管理計算機、計算機システム、及びインスタンス管理方法 - Google Patents

管理計算機、計算機システム、及びインスタンス管理方法 Download PDF

Info

Publication number
JP5951111B2
JP5951111B2 JP2015507279A JP2015507279A JP5951111B2 JP 5951111 B2 JP5951111 B2 JP 5951111B2 JP 2015507279 A JP2015507279 A JP 2015507279A JP 2015507279 A JP2015507279 A JP 2015507279A JP 5951111 B2 JP5951111 B2 JP 5951111B2
Authority
JP
Japan
Prior art keywords
instance
migration
candidate
physical server
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015507279A
Other languages
English (en)
Other versions
JP2015524581A (ja
Inventor
充実 寺山
充実 寺山
永見 明久
明久 永見
法子 中嶋
法子 中嶋
俊雄 大谷
俊雄 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2015524581A publication Critical patent/JP2015524581A/ja
Application granted granted Critical
Publication of JP5951111B2 publication Critical patent/JP5951111B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/76Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions
    • H04L47/762Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions triggered by the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0866Checking the configuration
    • H04L41/0873Checking configuration conflicts between network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices

Description

本発明は、管理計算機、計算機システム、及びインスタンス管理方法に関し、例えば、仮想サーバおよび物理サーバが混在する計算機システムにおいて、リソースの割り当てを管理するための技術に関する。
サーバ仮想化技術が普及し、企業情報システムを構築するための複数の仮想サーバを単一のハードウェア上に統合することが一般的となった。仮想サーバは、単一の物理サーバ(仮想サーバホスト)が提供するリソースを共有しているため、同じ仮想サーバホスト上の他の仮想サーバから性能上の影響を受ける。性能上の影響(例えば、処理負荷の増減)は、処理の目的や種類を把握できなければ予測が困難である。例えば、処理負荷の増減の場合、例えば一方の仮想サーバの処理負荷が高まるにつれ、他方の仮想サーバでは処理リソースが奪われ、性能劣化を招く可能性がある。この点、1つの仮想サーバホスト上に1つの仮想サーバのみを稼働させることにより、この性能影響を排除することができる。ところが、サーバ仮想化機能を実装しているハイパバイザの処理がオーバヘッドとなり、物理サーバの全てのリソースを活用することができない。特に、科学技術計算やビジネスインテリジェンスなど運用管理の容易性よりも計算性能を優先する分野では、処理のオーバヘッドが許されない。その他、一般の仮想サーバ環境には、ハイパバイザという抽象化層を設ける分だけ構造の複雑性が増し、管理の負担が増大したり、ハイパバイザ自体の導入費用も必要であったり、さらには1つのハイパバイザや仮想サーバホストの障害が複数のシステムに波及する恐れがあるという短所がある。
そこで、仮想サーバが存在する環境であっても、ハイパバイザを有さない物理サーバをそのまま処理環境として利用する運用方法が考えられる。そのような物理サーバはベアメタルサーバと呼ばれ、1つのハードウェア装置が持つ処理性能を全て活用することができ、さらに他のサーバから影響を受けることなく安定稼働させることができる。また、ベアメタルサーバは、従来主流であった運用方法であり、管理ソフトウェアなど充分に信頼性の高い既存技術および資産を活用することもできる。
一方、サーバ上にあってアプリケーションに提供するためのリソースを制御するOperatingSystem(OS)は、ハードウェア抽象化層と呼ばれる内部構造を持ち、ある程度の互換性を満たせば、別の物理ハードウェア上で稼働させることができる。そのため、例えば仮想サーバ内に稼働していたアプリケーションおよびそのデータを、互換性を満たす場合に限り、OSごとベアメタルサーバへ移行できる。同様にしてベアメタルサーバから仮想サーバへの移行も可能であり、一般にP2V(Physical to Virtual)/V2P(Virtual to Physical)と呼ばれるそれら移行機能を実装したソフトウェアが提供されている。
以上のサーバ仮想化技術、ベアメタルサーバ運用管理技術、および移行技術の組み合わせにより、仮想サーバ、ベアメタルサーバが任意に混在する環境で業務システムを運用できる可能性が示唆される。そのような環境では、リソース利用効率を重視する場合は仮想サーバで、処理性能や稼働の安定性を重視する場合はベアメタルサーバで、という業務システムの要件に合わせて好適な処理基盤を使い分ける運用が実現できる。特許文献1では、そのような運用を実現する技術の1つとしてシステムを仮想サーバからベアメタルサーバへ移行する方法が開示されている。
一方で、近年の傾向として、クラウドコンピューティングの隆盛がある。クラウドでは多数のサーバを仮想化によりプラットフォームに集約、統合管理することで運用管理コストを削減し、情報システムへの依存度の高まりに応えている。そのようなクラウドの特長の1つとして、ユーザのセルフサービスを強化している点が挙げられ、クラウド運用管理における標準と認知されている。
特にIaaS(Infrastructure as a Service)クラウドにおいては、情報システムを構築するユーザ自身により、サーバインスタンス(以下単にインスタンス)と呼ばれる処理環境の作成、および構成変更が行われる。インスタンスは一般的には1つの仮想サーバにあたり、ユーザはそこにOSとアプリケーションを導入し、所望のシステムを構築する。すなわち、従来はユーザから要件を聞き出して管理者が行っていた作業をユーザへ委譲し、ユーザ自身のセルフサービスによる環境構築が実現されるようになったと言える。これにより、管理者の作業負担が軽減され、またユーザは所望の環境を迅速に構築することができる。
このセルフサービスを実現するにあたって重要な仕組みの1つがサーバのマシン構成を記述したカタログである。ユーザは、自身の構築したいシステムの要件について、アプリケーションの視点では知識を持っているものの、どのようなマシン構成が適切か、さらにそれらを稼働させる装置全体の構成については、管轄外であるためよく知らない場合が多い。そこで、管理者は、仮想サーバの用途や物理リソースのサイジングなどの要因を考慮し、サーバの典型的な構成をカタログとして複数パターン作成し、ユーザに提示する。一方、ユーザはそれらカタログを基にインスタンスを作成する。カタログが厳密にはユーザのシステムに対し最適な構成でなくとも、ユーザは実際の運用を始めてから、必要に応じてインスタンスをカスタマイズし、その時の処理負荷に見合ったマシン構成へ調整することができる。これにより、ユーザは自身の導入するアプリケーションに向く構成を独自に判断して選択できるようになり、管理者にとっても仮想サーバを作成する度にユーザに要件を確認する作業が不要となるため管理を省力化できる。さらに、特に仮想サーバについては動的なリソース追加や仮想サーバホストの変更が比較的容易に行えるため、物理装置の処理負荷に応じて自動的に構成を変更する技術により、ユーザに意識させることなくシステムのリソース利用効率を高めることができる。特許文献2は、このような自動構成変更の技術について開示している。
また、カタログは、IaaSクラウドを利用するユーザと、インスタンスをサービスとして提供するプロバイダ(管理者含む)の間にあって、インスタンスに対するユーザ側の要件と、プロバイダがインスタンスを提供する上での条件を明確化する仕組みであるとも言える。カタログに記載する事項は、ユーザとプロバイダとの関係によって異なるものの、多くの場合、インスタンスの構成(インスタンスに割り当てられるリソース)と利用可能な管理機能の記述が含まれる。それらの記述は、クラウド基盤となるハードウェアおよびソフトウェアの構成および機能に依存するため、全くの任意というよりは、インスタンスの用途や基盤の構成に基づいて数段階の水準が設けられる場合が多い。本明細書では、この割り当てられるリソースの種類・量、および管理機能について設定されるインスタンスの水準を、サービスレベルと呼ぶこととする。
そして、前述のベアメタルサーバをクラウド環境で提供すれば、仮想サーバの場合と同じくユーザのセルフサービスにより高性能・高品質のサーバインスタンスを提供できると考えられる。
特開2009−145931号広報 特開2011−118525号広報
しかしながら、ベアメタルサーバをサーバインスタンス(ベアインスタンス、物理インスタンスとも言う)として提供する場合、仮想サーバとの属性の違いから、カタログには仮想サーバとは異なる項目が記述されたり、割り当てられるリソース量や適用可能な管理機能が異なったり、といった差異が生じる。これらの差異は、一方では多様なサービスレベルを提供できるという利点と捉えられるが、他方ではベアメタルサーバの運用管理について専門的な知識を持たないユーザを困惑させるものになる恐れがある。ユーザは、サーバ構成を拡張したい場合、仮想インスタンスであれば設定ファイルの書き換え等により簡単に拡張できるが、ベアインスタンスの場合、ダイナミックな変更が簡単にできないからである。
したがって、処理需要に対する性能が満たされていない、あるいは処理需要に対して性能が余剰であると感じても、どの種類のリソースをどれだけ増減させればよいか判断することがユーザにとって困難である。例えば、仮想サーバにおいて同じアプリケーションを利用し、同じような処理をさせているのにも拘わらず、時期によって所要時間が変動する場合、ベアメタルサーバに移行するのがよいのか、仮想リソースの追加で充分であるかは、ユーザには判断できない。これは、カタログなどの抽象化構造によって、サーバインスタンスと物理装置の対応関係が隠蔽化されたために生じる。より具体的には、ユーザは自身が利用している仮想サーバがどの仮想サーバホスト上で稼働し、他にどのような負荷傾向を持つ仮想サーバとリソースを共有しているのかを知らされていないためである。
ユーザによるセルフサービス(例えば、アプリケーションを使いたいユーザが自らインスタンスのスペックを決めて展開させたり、アプリケーションの処理負荷に応じてサーバの構成の変更をユーザが決定したりすること)を実現するためには、ユーザ自身が、所望のアプリケーションに見合った構成を選べるように、適切なサービスレベルを、それを運用するために必要なコストと合わせて提示するシステムが必要となる。ここでいうコストとは、インスタンスの運用管理に必要となる作業に対して、ユーザが支払う対価のことを指す。このように、多くのクラウド環境では、利用可能なリソースや機能に対する上限値や価格が設定されている。そのため、ユーザは所望のアプリケーションを稼働させるために十分な性能を持つインスタンスを利用したいと考える反面、余剰のリソース利用を削減してコストを効率化したいという欲求を抱えている。
本発明はこのような状況に鑑みてなされたものであり、サーバリソースの利用効率の向上とコスト削減とのバランスを考慮したサーバインスタンスの設定・変更を可能にする技術を提供するものである。
上記課題を解決するために、本発明では、管理サーバ(管理計算機)は、ユーザの構成変更要求や、性能劣化或いは性能余剰の検出結果に基づく構成変更要求に応じて、性能影響の要因を判定し、性能影響を解消し得る適切な移行先候補を算出する。ここで、管理サーバは、各サーバ装置、ネットワーク装置、ストレージ装置の性能情報を取得し、履歴として保持している。また、管理サーバは、取得した性能情報をもとに、性能が低下している要因や部位を特定する。さらに、管理サーバは、性能低下を緩和する方策を算出し、インスタンスの構成変更の候補となる装置の情報を取得し、装置互換性(デバイスドライバの有無など)を確認した上で移行先候補を決定する。
つまり、本発明は、複数の物理サーバと、少なくとも1つのストレージ装置と、それらを管理する管理計算機と、を有する計算機システムに関する。管理計算機は、物理サーバ上のインスタンスの構成情報と、物理サーバ及びストレージ装置の性能情報と、をメモリ上に保持している。そして、管理計算機は、インスタンスの構成変更の要求に応答して、性能情報を参照し、構成変更対象のインスタンスが設定されている対象物理サーバにおいて、当該構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合しているか判定する性能競合判定処理と、当該性能競合判定処理の結果に基づいて、構成変更の対象のインスタンスの構成変更方法の候補を生成する候補生成処理と、生成された構成変更方法の候補をユーザ(クライアント計算機)に提供する候補提供処理と、を実行する。
ここで、少なくとも1つの物理サーバは、仮想化機構を有し、当該物理サーバのリソースを分割してインスタンスに割り当て、仮想インスタンスとして機能させる、第1種サーバである。また、第1種物理サーバ以外の少なくとも1つの物理サーバは、当該物理サーバのリソースの全てをインスタンスに割り当て、物理インスタンスとして機能させる、第2種サーバとなっている。そして、管理計算機は、構成変更方法の候補として、仮想インスタンス、及び/又は物理インスタンスの構成を提示する。
本発明によれば、サーバリソースの利用効率の向上とコスト削減とのバランスを考慮して、サーバインスタンスの設定・変更が可能となる。
本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。
本発明の第1の実施形態による計算機システムの物理構成を示す図である。 本発明の実施形態による物理的なシステムユニット構成の一例を示す図である。 本発明の実施形態による計算機システムの論理構成を示す図である。 本発明の第1の実施形態1によって実現される機能の概念を示す図である。 本発明の実施形態による改善方策リストの構成例を示す図である。 本発明の実施形態による管理プログラムを構成する要素を示す図である。 本発明の実施形態におけるインスタンス管理テーブルの構成例を示す図である。 本発明の実施形態例における移行条件管理テーブルの構成例を示す図である。 本発明の実施形態におけるデバイス管理テーブルの構成例を示す図である。 本発明の第1の実施形態における移行方策算出処理を説明するためのフローチャート(1)である。 本発明の第1の実施形態における移行方策算出処理を説明するためのフローチャート(2)である。 本発明の第2の実施形態におけるカタログ検索方法の概念を説明するための図である。 本発明の第3の実施形態における移行条件管理テーブルの構成例、及び移行管理部の構成例を示す図である。
以下、添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。
本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。また、実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
以後の説明では「aaaテーブル」、「aaaリスト」等の表現にて本発明の情報を説明するが、これら情報はテーブル、リスト、DB、キュー等のデータ構造以外で表現されていてもよい。そのため、データ構造に依存しないことを示すために「aaaテーブル」、「aaaリスト」等について「aaa情報」と呼ぶことがある。
また、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いるが、これらについては互いに置換が可能である。
以後の説明では、サービスレベル判定部や移行管理部等の「各処理部」を主語として説明を行う場合があるが、各処理部の実行内容はプログラムの一部或いは全部としてプロセッサによって実行されるため、プロセッサを主語とした説明としてもよい。また、各処理部(プログラム)の一部または全ては専用ハードウェアによって実現されてもよい。
以後、計算機システムを管理し、本発明の表示用情報を表示する1つ以上の計算機の集合を管理システムと呼ぶことがある。管理コンピュータが表示用情報を表示する場合は管理コンピュータが管理システムである。また、管理コンピュータと表示用計算機の組み合わせも管理システムである。また、管理処理の高速化や高信頼化のために複数の計算機で管理コンピュータと同等の処理を実現してもよく、この場合は当該複数の計算機(表示を表示用計算機が行う場合は表示用計算機も含め)が管理システムである。
(1)第1の実施形態
第1の実施形態は、ユーザの要求に応じて性能影響の要因を特定し、その結果に応じて適切な移行方策の候補を提示するシステムに関する。
<計算機システムの構成>
図1は、本発明の第1の実施形態例による計算機システムの物理的概略構成を示す図である。本計算機システムは、それぞれ少なくとも1つの、第1の物理サーバ10と、第2の物理サーバ20と、ストレージ装置100と、クライアントコンピュータ510と、管理サーバ(管理コンピュータ)500と、を備え、さらにそれらを相互に接続するネットワーク51およびネットワーク61を備えている。
第1の物理サーバ10は、CPU11と、メモリ12と、ファイバチャネルインタフェース(FC IF)15と、およびイーサネット(以下、登録商標)インタフェース(Ether IF)16と、を備える。メモリ12には少なくともOS13aが格納され、CPU11の演算処理によって物理サーバ10で稼働するアプリケーション13bに対し処理リソースを提供する機能を実現する。以降、特に仮想化プログラムが稼働せず、OS13aが物理サーバ10上で直接的に稼働するという意味で、物理サーバ10をベアメタルサーバと呼ぶこともある。FC IF15は、ネットワーク51を介して他の装置と通信を行うためのものであり、主にストレージ資源を接続する目的で使用される。同じ目的を達成する相互接続の手段である限りにおいてファイバチャネル以外の通信規格を使用してもよく、また、用途によって複数あってもよい。Ether IF16は、ネットワーク60を介して他の装置と通信を行うためのものであり、他の物理サーバ10及び20、クライアントコンピュータ510や管理コンピュータ500と接続する目的で使用される。同じ目的を達成する相互接続の手段である限りにおいてイーサネット以外の通信規格に準拠するものであってもよく。また、用途によって複数あってもよい。
第2の物理サーバ20は、CPU21と、メモリ22と、FC IF25と、Ether IF26と、を備える。メモリ22には少なくともOS23aおよび仮想化プログラム23bが格納され、CPU21の演算処理によって物理サーバ20を1つ以上のリソース領域に分割してその他のOSまたはアプリケーション23cへ提供する機能を実現する。仮想化プログラム23bは必ずしもOS23aと分離される必要はなく、物理サーバ20を1つ以上のリソース領域に分割する機能を備える限りにおいて、OS23a内部の1つのモジュールとして実装されてもよいし、またはOS23aそのものとして実装されてもよい。以降、仮想化プログラム23bの機能を実装したものをハイパバイザと呼ぶことがある。また、仮想化プログラム23bの機能により、物理サーバ20のハードウェアの一部が、閉じたリソース領域として切り出される。このリソース領域は仮想マシンと呼ばれる1つの論理的なサーバのハードウェアを構成しており、第2の物理サーバ20を仮想マシンホストと呼ぶこともある。FC IF25、及びEther IF26についての詳細は、第1の物理サーバの場合と同様である。
ネットワーク51は、1つ以上の物理サーバ10及び20と、1つ以上のストレージ装置100を相互に接続するためのものである。これにより、物理サーバ10、20がストレージ装置100と通信し、アプリケーション13b、23cなどが稼働する際に必要なストレージ資源を利用可能とする。ネットワーク51上には1つ以上のファイバチャネルスイッチ(FC SW)50が介在してもよい。FC SW50の構成は、Ether IF56が接続されたネットワーク61を介して、管理コンピュータ500により設定される。
ネットワーク61は、主に以下の3つの目的のために使用される。第1の目的は、クライアントコンピュータ510と物理サーバ10および20との間のサービス通信を提供することである。例えば、物理サーバ10はクライアントコンピュータ510から処理要求や処理対象のデータを受信し、アプリケーション13bにより加工または生成されたデータを再度クライアントコンピュータ510に向け送信する。第2の目的は、サービス通信に関わる物理サーバ10および20の構成変更を行うことである。例えば、物理サーバ20上に新たなアプリケーション23cを導入したり、仮想化プログラム23b上に仮想サーバと呼ばれるリソース領域を作成したりといったことが行われる。第3の目的は、物理サーバ10、20とストレージ装置100との間のデータネットワーク51について構成を変更することである。例えば、ストレージ装置100のストレージ制御部150を通じて、ボリュームと呼ばれるストレージ資源の単位を作成し、物理サーバとの論理的な通信路を設定することで、ストレージ資源を利用可能とする。
ストレージ装置100は、複数の物理ストレージデバイス101を集積したものであり、装置を集中的に制御するストレージ制御部150を備えており、物理サーバ10及び20など他の装置に対してデータ格納用のストレージ資源を提供する。図1に示すように、物理ストレージデバイス101は、例えばハードディスクドライブ(HDD)であり、他にもソリッドステートドライブと呼ばれる不揮発性の記憶デバイスが用いられる。ストレージ制御部150は、CPU151と、メモリ152と、キャッシュ154と、FC IF155と、Ether IF156と、Serial Advanced Technology Attachmentインタフェース(SATA IF)157と、を備える。メモリ152には、少なくとも読み書き要求に応答する応答プログラム153a、及び装置の論理構成を制御するストレージ制御プログラム153bを含む、プログラムが格納されている。これらのプログラムがCPU151によって演算処理されることによりストレージ装置100の機能が実現される。キャッシュ154は、主に物理サーバの読み書き要求に対するストレージ資源の応答性能を向上させるために用いられる。FC IFはネットワーク51を介して他の装置と通信を行うためのものであり、主に物理サーバ10、20と接続する目的で使用される。同じ目的を達成する相互接続の手段である限りにおいてファイバチャネル以外の通信規格を使用してもよく、また、物理サーバの台数などによって複数あってもよい。Ether IF16は、ネットワーク60を介して他の装置と通信を行うためのものであり、主に管理コンピュータ500と接続する目的で使用される。
管理コンピュータ500は、CPU501と、メモリ502と、Ether IF506と、を備え、主に他の装置の構成を変更する機能を有する。メモリ502には、少なくとも管理コンピュータのハードウェアを制御するOS503a、および管理プログラム503bが格納される。これらOSやプログラムがCPU501によって演算処理されることにより管理コンピュータ500の機能が実現される。管理プログラム503bは、管理コンピュータ500が許容する処理能力を超えない限り、用途に応じて複数稼働してもよい。管理プログラム503bの詳細については後述する。Ether IF506は、ネットワーク60を介して他の装置と通信を行うためのものである。
クライアントコンピュータ510は、物理サーバ10及び20上のアプリケーションプログラムが提供するサービスを享受するためのものであり、ユーザによって操作される。クライアントコンピュータ510は、CPU511と、メモリ512と、Ether IF516と、を備える。メモリ512には、少なくともクライアントコンピュータのハードウェアを制御するOS513a、およびクライアントプログラム513bが格納される。これらOSやプログラムがCPU511によって演算処理されることによりクライアントコンピュータ510の機能が実現される。クライアントプログラム513bは、物理サーバ上のアプリケーションプログラムと通信して、サービス処理の要求、処理結果の表示を行ったり、あるいは管理コンピュータ500上の管理プログラム503bと通信して、ユーザが許可された範囲でのシステムの構成変更を行ったり、といったユーザインタフェースの機能を提供する。なお、クライアントプログラム513bは、上記機能を実現するものである限り、他のプログラムと連携するための特別な実装であってもよいし、適切な通信プロトコルが使用されていればWebブラウザのように汎用的なプログラムであってもよい。
<計算機システムの物理的配置例>
上述の通り、図1は本発明の実施形態による計算機システムの一般的な物理構成を示すが、物理装置の配置について、より具体的には例えば図2のようになる。図2は、図1に示す計算機システムを構成する各装置をラックに搭載した物理的配置、及びそれらのネットワーク結線を示す図であり、全体で1つのシステムユニットを構成する。システムユニットは運用管理の基本的な単位であり、必要に応じて複数のシステムユニットを組み合わせることでデータセンタを構築できる。データセンタ内に多数の装置が設置されている昨今、システムユニットは装置を秩序立てて配置・接続し、管理する重要な概念である。本実施形態におけるシステムユニットは、計算ラック650、及びストレージラック651から構成される。それら計算ラック650やストレージラック651は、図2のように1つずつであるとは限らず、必要なリソース量に応じて複数あってもよい。ただし、計算ラック650内に搭載される管理サーバ653は、1つのシステムユニット全体を管理対象とするよう構成されなければならない。
計算ラック650は、主にインスタンスを稼働させるためのサーバ装置(サーバシャーシ652)と、各装置を制御する管理装置(管理サーバ653)を搭載する。図2の例では、ブレード型のサーバ装置を搭載しており、サーバシャーシ652に搭載したサーバブレード652a上でインスタンスを稼働させる。これらサーバ装置は同一の構成を持つものに限定せず、システムユニット内で複数種類のものが存在してもよい。サーバシャーシ652には、イーサネットスイッチモジュール652bやファイバチャネルスイッチ652cなど、各装置がモジュール化されて搭載される。また、計算ラック650には、システムユニットに含まれる各装置を管理する管理サーバ653と、ストレージ装置を集中的に制御するストレージ制御ユニット654が搭載される。さらに、各装置を相互に接続するためのイーサネットスイッチを集めたイーサスイッチユニット656、及びファイバチャネルスイッチを集めたファイバチャネルスイッチユニット657が搭載される。その他には、ラック内の各装置に電源を供給するための電力供給ユニット655が搭載される。
一方、ストレージラック651には、主に物理ストレージデバイス(例えばHDD101)を集積したストレージディスクユニット658が搭載される。ストレージディスクユニット658は、ストレージ制御ユニット654と合わせてストレージ資源を提供する機能を実現している。ストレージディスクユニット658とストレージ制御ユニット654は、図2のように搭載されるラックが別であってもよく、また必要とされる容量や性能に応じて複数のストレージラックにまたがって設置されてもよい。ストレージラック651にもイーサスイッチユニット656、及びファイバチャネルスイッチユニット657が搭載され、ラック内にある装置を接続する役割と、他のラックと接続する役割を担う。その他には、ラック内の各装置に電源を供給するための電力供給ユニット655が搭載される。
上述の各物理装置は、システムユニット内で固定であるよう構成される一方、各装置を相互に接続するネットワーク配線もシステムユニット内部で閉じており、原則的には変更されない。ただし、他のシステムユニットへインスタンスを移行するなど、複数のシステムユニットが連携する必要が生じる場合に備え、ネットワークスイッチ間にシステムユニット間通信路が設置される。しかし、基本的に、あるシステムユニット内の装置を直接的に他のシステムユニットの装置と接続したり、あるいは他のシステムユニットの管理サーバ653から管理させることはない。例えば物理故障の場合に装置を交換する際、あるいは装置更改に伴う移行作業の際という例外があるものの、通常はシステムユニット内で閉じた運用管理が行われる。
管理サーバ653は、単一のシステムユニット全体について、物理的な構成情報を保持している。これは、物理的な経路情報を保持していることに等しい。例えば、サーバブレード652aの計算ラック番号が分かれば、同じシステムユニット内のストレージラック番号を調べることで、接続先のストレージディスクユニット658が容易に特定できる。また、同じシャーシ番号やラック番号を有するサーバ同士は、互いの位置が物理的に近く、レイテンシ(遅延)が小さいと言える。前述のとおり、原則的にシステムユニットにおける物理構成は固定的であるため、初期導入時や装置更改の際に装置構成を調査していれば、接続構成を永続的に把握できる。例えば、ハイパバイザやOSに構成管理エージェントを導入し定期的に構成情報を収集する、などの特別な解析手段を用いる必要はない。
<計算機システムの論理的構成、及びインスタンスの作成手順>
(i)論理的構成
図3は、本発明の実施形態による計算機システムの論理構成を示す図である。図3は、システム運用中にユーザがサーバを新たに作成する場面を想定している。
図3において、ユーザが利用するアプリケーション13b及び23cは、ネットワーク61を介してクライアントコンピュータ510上のクライアントプログラム513bと通信し、業務サービスを提供する。アプリケーションは、ベアメタルサーバ10であれば直接的にハードウェアで稼働するOS13a上にあり、仮想マシンホスト20であればハイパバイザ23b上で稼働する仮想マシンのさらに内部で稼働するOS23d上にある。以下、論理的なサーバの単位であり、アプリケーションおよびOSを導入可能なリソース領域をインスタンスと呼ぶこととする。特に、ベアメタルサーバ上にあれば物理インスタンス、仮想マシンホスト20上にある仮想マシンであれば仮想インスタンスと呼ぶ。本実施形態において、ユーザは、所望のインスタンスを作成および構成変更し、所望のOSやアプリケーションを導入して、目的の業務システムを構築する。
各インスタンスが使用するストレージ資源は、ストレージ装置100により提供される。図3に示すように、物理インスタンスの場合はストレージ装置100内にあるボリューム160と呼ばれる単位で提供される。物理インスタンス14のOS13aからはボリューム160が1つの物理ディスクドライブとして認識される。また、仮想インスタンスの場合、ハイパバイザ23bが接続したボリューム160内でファイル形式の仮想ディスク161を作成し、仮想インスタンスに接続する。さらに、ハイパバイザ23bは仮想ディスク161内に仮想的なボリューム162を定義しており、仮想インスタンス24のOS23dからは仮想的なボリューム162が物理ディスクドライブとして認識される。また、仮想インスタンスにはオーナが設定されていて、オーナさえ同一であればどのクライアントコンピュータからでも該当する仮想インスタンスを用いることができるようになっている。
物理インスタンス14とボリューム160の接続経路、あるいはハイパバイザ23bとボリューム160の接続経路は、OS13aやハイパバイザ23bによって設定される。ただし、それらの接続経路の設定は、ネットワーク51の物理的な結線、及び論理的な接続により通信経路が構成された範囲内でのみ可能である。物理的な結線は、ネットワークに参加する装置に備えられたFCIF上のポート52を、ファイバチャネルケーブルにより接続することで実施される。論理的な接続は、FC SW50において設定するものと、ストレージ装置100において設定するものの2つがある。FC SW50ではゾーニングと呼ばれる技術が用いられ、通信可能なスイッチ上のポートの組を設定する方法、およびポート52の識別子(WWN)により通信可能なノードを設定する方法が提供されている。一方、ストレージ装置100においては、ボリューム160にアクセス可能なストレージ制御部150上のポートを設定する方法、および当該ストレージ側ポートと通信可能な物理サーバのWWNを設定する方法が提供されている。これらFC SW50の設定およびストレージ装置100の構成は、後述する各装置管理部により管理・制御される。
また、図3は管理コンピュータ500で稼働する管理プログラム503b(図1参照)の詳細を示す。本実施形態において、管理プログラム503bの種類は次に挙げるものである。すなわち、管理コンピュータ500は、クライアントコンピュータ510から要求を受け付けるサービス管理部504aと、サービスレベルの維持・変更に関する機能を備える統合サービスレベル管理部504bと、統合サービスレベル管理部504bのもとで各装置の管理を行うサーバ管理部504cと、ネットワーク管理部504dと、ストレージ管理部504eと、を備える。これら各管理部504a乃至eは、プログラムによって構成される。サービス管理部504aは、クライアントコンピュータからユーザの要求を受信し、インスタンスの作成や構成変更を行う。統合サービスレベル管理部504bは、サービス管理部504aより受けた要求に従って、インスタンスに割り当てられたリソースの性能や品質の水準を維持する役割(性能が下がったときにはリソースの拡張やサーバの移行を実行し、負荷が下がって利用効率が下がったときには利用効率の低いインスタンスの構成を縮小する)を担う。実際に装置と物理サーバやストレージ装置と直接的に接続して、個々の構成変更を行う処理は、サーバ管理部504c、ネットワーク管理部504d、ストレージ管理部504eによる。便宜上、これらを総称して装置管理部と呼ぶことにする。これらの装置管理部は、装置の論理的な構成情報を取得および変更することで、管理対象の装置を制御する。本実施形態においては、これらの装置管理部が互いに通信して異なる装置の構成を把握することはできず、異種装置間の連携は各装置管理部の上位に位置する統合サービスレベル管理部504bによってのみ実現される。なお、本実施形態では、ユーザの指示によってインスタンスの構成変更(拡張、移行、縮小)を実行するようにしているが、インスタンスに割当てられたリソースの性能品質が所定の閾値を超えた場合にインスタンスを自動的に構成変更して性能や品質の水準を維持するようにしても良い。
(ii)セルフサービスによるインスタンス作成
上述の各構成の機能を説明する具体例として、本実施形態による構成において(仮想)インスタンスを作成する手順を述べる。なお、ここで説明するインスタンス作成の手順および技術は既知のものである。
ユーザは、クライアントコンピュータ510上のクライアントプログラム513bを操作し、管理コンピュータ500にアクセスする。管理コンピュータ500上のサービス管理部504aは、ユーザ名とパスワードなどの識別情報を用いて、当該ユーザにインスタンスの作成権限があることを認証する。一般に、ユーザは所属する組織のグループアカウントと関連付けられており、グループごとに作成可能なインスタンスの数や、割り当て可能なリソースの量や物理装置が事前に決定されている。
ユーザの権限が認証されると、サービス管理部504aはインスタンスの雛形となる1つ以上のカタログをユーザに対して提示する。カタログには、CPU、RAM、ネットワークアダプタ、ディスク容量、OSなどの構成や、高可用性オプションなど適用される管理機能についての詳細が記述されている。ユーザは提示されたカタログの中から所望のものを選択し、選択したカタログからインスタンスを作成するようサービス管理部504aに対して要求する。必要であれば、サービス管理部504aが許容するサービスレベルの範囲で、カタログに記載されたものから構成を一部変更(カスタマイズ)して要求する。
サービス管理部504aは、ユーザからクライアントプログラム513bを経由してインスタンスの作成要求を受けると、インスタンスの作成処理を行う。インスタンスの作成処理は、配置先物理サーバ/ボリュームの決定や、仮想リソースの作成、OSイメージのコピーといった手順を含む。このうち、配置先物理サーバ/ボリュームの決定は、配置先のリソース空き容量や、他の構成変更タスクとの兼ね合いを考慮して行われる。また、物理的な結線や物理ボリューム160のマウントなど、複数種類の装置を跨る構成変更は事前に行われており、インスタンスを作成するときには、たかだか構成管理ファイルの作成や仮想ディスクファイルの作成など、ハイパバイザ23bが有する構成変更機能のみが使用される。また、インスタンスが利用する仮想ディスクのうち、特にOS領域については、再利用可能なOSセットアップ済み仮想ディスク(OSイメージ)を用意しておき、インスタンスの作成時にはそのOSイメージの論理コピーすることで、OSのインストールを不要化する技術もある。
インスタンスの作成が完了すると、サービス管理部504aは、当該インスタンスが利用可能状態となったことをユーザに通知する。その後、ユーザは所望のアプリケーションのインストーラ(ISOディスクイメージなど)をインスタンスに転送し、業務システムの構築を行うことができる。
<サービスレベルの変更>
本発明は、特にインスタンスに割り当てるリソースの管理において、サービスレベルの変更に着目してなされたものである。本実施形態により、ユーザの構成変更要求に対して、適切な移行方策の候補を提示するシステムが提供される。
図4は、本発明の実施形態において提供される機能の概念を示す図である。例えば、仮想インスタンス707を使用しており、同インスタンスの性能が低下している場合を考える。仮想マシンホストおよびベアメタルサーバが混在する環境において、仮想インスタンス707の処理性能を改善する方策は、主に以下の3通りの方策が考えられる。
第1の方策は、同じ仮想マシンホスト20上でリソース割り当て量を増やすスケールアップ704であり、仮想マシンホスト20に空きリソースがある場合は比較的容易に実行できる。しかし、同じ仮想マシンホスト上の他の仮想インスタンスから性能影響を受けていた場合、性能を改善することができない。
第2の方策は、当該仮想インスタンス707を他の仮想マシンホストへ移行するV2V移行705であり、移行元の仮想マシンホストにおいて他の仮想サーバから計算リソースに対する性能影響を受けていた場合に有効である。ディスクIOに対する性能影響を受けていた場合は、仮想ディスク711をボリューム713へ変換することにより、性能が改善する可能性がある。しかしながら、移行先の仮想マシンホストにおいて、負荷傾向が同じような仮想インスタンスが他に存在した場合には、V2V移行705を実施しても性能が改善しない恐れがある。また、ディスクIOに対する性能影響が、実態として重大でなかった場合、仮想ディスク711をボリューム713へ変換しても、性能低下が解消されない。
第3の方策は、仮想インスタンス707をベアメタルサーバ10上に移行し、物理インスタンス710に変換するV2P移行706である。このV2P移行706によれば、他のインスタンスの性能影響を排除し、インスタンスの安定稼働を実現できる。しかしながら、一般にV2P移行は、所要時間が長時間であったり、OSのシャットダウンが必要であったりという短所を伴う。
ユーザは、当該仮想インスタンスの物理配置や、他の仮想インスタンスの処理負荷傾向を把握できないため、性能低下の要因を把握することができない。また、ユーザはそれぞれ管理コンピュータ500にアクセスしてセルフサービスでインスタンスの作成/構成変更が可能であり、それらは他ユーザや管理者側の操作とは非同期に行われる。そのため、あるユーザが性能改善のために構成変更をする場合であって、さらに他のインスタンスへ影響するような操作を行うには、他ユーザや管理者との緊密な調整が必要であり、即座に実行できない。システムの論理構成に対する変更が頻繁に行われれば、性能改善の要求が生じた時から移行が行われるまでに構成が変化してしまっており、移行が失敗する恐れがある。その上、上述のように各移行方策にはトレードオフがあり、ユーザが誤って性能低下を解消できない方策を選択してしまうばかりか、無駄なコストを支払わなければならない恐れがある。
本発明によれば、ユーザが知りえない性能影響の要因を適切に判定し、その解消に適した移行方策を提示するシステムが提供される。すなわち、本計算機システムは、図4において、ユーザが管理コンピュータ500に対してインスタンスの性能改善要求701を発行すると、装置の構成と性能履歴を参照して適切な移行方策(以下、改善方策とも言う)702を算出し、ユーザに提示することを特徴とする統合サービスレベル管理部504bを提供する。
<移行方策リスト>
図5は、本実施形態において移行方策702を提示するための具体的な形式である、移行方策リスト(以下、改善方策リストとも言う)703を示す図である。移行方策リスト703において、1つの行は1つの移行方策を表している。
移行方策リスト703は、移行方策703aごとに、性能安定性703bと、所要時間703cと、所要コスト703dと、停止時間703eについて値を保持する。本実施形態においては、ユーザが所望の移行方策703aを選択することを想定しており、必ずしも各移行方策703aの優劣を示す必要はない。したがって、同移行方策703aは、単純に後述する処理フローにおいて検出された順に移行方策リスト703へ格納されてもよい。他方で、ユーザにとって有益である場合、またはユーザが重要であると定めた移行ポリシの下、自動的に移行方策を一定数に絞り込む場合には、移行方策703aの優劣をリスト703への格納順序で示してもよい。そのような順序の決定方法としては、例えば、後述する移行方策の推奨度の高いものから並べられてもよいし、移行ポリシを満足する項目の多いものから並べられてもよい。
移行安定性703bは、例えば、計算リソース、ネットワークリソース、及びストレージリソースの3項目で評価され、他のインスタンスから性能影響を受けないことが保証される場合に「Yes」が記載される。ここでいう他のインスタンスから性能影響を受けないとは、対象のインスタンスが1つの装置上の物理的な構成要素(例えば1つのプロセッサやポート、記憶領域)を占有し、他のインスタンスと共有していない状態のことを指す。計算リソースの安定とはリソースを十分に確保できることを意味する。ネットワークの安定とはボトルネックが発生しないことを意味する。ストレージの安定とはIOPSが所定値以下であること(良好)であることを意味する。以下では、便宜上それら装置上の物理的な構成要素のことを、単に装置と呼ぶ。移行することにより他のインスタンスと装置を共有する、あるいは移行前の時点で性能影響が生じていなかった項目については、移行直後には問題でないが、移行後性能が不安定になる可能性があるため性能安定とみなさず、何も記載しない。したがって、「Yes(安定)」と記載のない項目は、移行による効果が「Yes(安定)」となっている場合よりも低いことを表す。「Yes]となっていなくてもユーザが要求するスペックを満たさないということではなく、安定が保証されていない(他のインスタンスの影響を受ける可能性がある)だけであり、現状のスペックよりは高くなっている。
所要時間703cは、当該移行方策の実施に必要な時間を保持する。
所要コスト703dは、移行作業自体にかかるコスト、および移行後の通常運用コストを保持する。所要コストは、課金システムが実現する計算式に合わせて算出されなければならない。停止時間703eには、当該移行方法においてインスタンス上のOSをシャットダウンする必要があるか否かを保持する。ユーザはインスタンス上のアプリケーションを利用しており、移行に際してOSのシャットダウンが必要になる場合、そのアプリケーションによる作業の中断や、データの保存が必要となるため、本項目をユーザに提示することが重要である。
図5からすると、移行方策#1を選択することが安定性を考慮すると一番良いことになる。移行方策#1では移行の所要時間が長くなるため、移行のための時間が十分ある場合には移行方策#1を選択することができる。しかし、例えば、ユーザが対象の仮想サーバを長時間停止できないときには、計算リソース等が多少足りず、安定性を保証しない場合であっても移行方策#2を選ぶことがある。つまり、ユーザは、リストで提示された移行方策の中から運用状況に応じて適宜最適な方策を選択できるようになっている。
<管理プログラムの機能構成>
図6は、管理コンピュータ500上で動作し、本発明の特徴的な機能を提供する管理プログラム群503bの詳細を示す図である。管理コンピュータ500は、管理プログラムとして、サービス管理部504aと、統合サービスレベル管理部504bと、サーバ管理部504cと、ネットワーク管理部504dと、ストレージ管理部504eと、を有している。以下に各部の構成及び機能について説明する。
(i)サービス管理部504aは、少なくともカタログテンプレートリスト600aと、インスタンス構成管理部600bと、サービスレベル定義部600cと、を有する。
カタログテンプレートリスト600aは、インスタンスを作成する際に雛形として参照できるようカタログの一覧を保持する。カタログに含まれる構成情報の項目は、後述のインスタンス管理テーブル601に保持される項目から選ばれる。したがって、インスタンス管理テーブル601に保持される項目以外のものはカタログには含まれず、多くとも同テーブルと同一である。カタログはさらに、構成情報の項目ごとに利用コストを保持している。それら利用コストの値は、割り当てられるリソース量や管理機能の有無にのみ基づき、サービス管理部504aにより算出される。
インスタンス構成管理部600bは、カタログに記載された事項やユーザのカスタマイズ要求に従って、インスタンス構成を作成し、適用する。インスタンスの構成情報は、後述のインスタンス管理テーブル601に保持される。例えば、インスタンス構成管理部600bは、現在使用しているインスタンスの構成についての問い合せがあった場合には、後述のインスタンス管理テーブル601から該当する情報を取得してユーザに知らせる。
サービスレベル定義部600cは、カスタマイズが可能な範囲やカスタマイズが可能な項目を保持する。より具体的には、選択肢の中で最も読み書き性能の高いストレージ階層における、SSDメディアとSASHDDメディアの割り当て比率を定めるなどの機能を提供する。例えば、ゴールド、シルバー、ブロンズのように3階層のサービスレベルを定義してニーズや状況に応じて使い分けができる。
(ii)統合サービスレベル管理部504bは、インスタンス管理テーブル601と、サービスレベル判定部602と、移行条件管理テーブル603と、性能履歴格納部604と、デバイス管理テーブル605と、移行管理部606と、を有する。このうち、性能履歴格納部604、デバイス管理テーブル605、及び移行管理部606は、装置管理部(サーバ管理部504c、ネットワーク管理部504d、及びストレージ管理部504e)を参照、または装置構成を設定することができる。
インスタンス管理テーブル601の詳細を図7に示す。インスタンス管理テーブル601は、各インスタンス(稼働中のインスタンス)について、基本属性601aと、割り当てられる計算リソース601bと、ネットワークリソース601cと、ストレージリソース601dの各設定値と、管理機能601eの設定値と、を保持する。同図では、インスタンス管理テーブル601が、インスタンス601−1から601−3の3つのインスタンスについて情報を保持していることを示す。インスタンスは一意な識別子により重複なく識別される。基本属性601aには、インスタンスの名称、作成元となったカタログ、インスタンスの使用者など、インスタンスごとに付与される管理情報が記載される。インスタンスの名称は使用者にとって理解しやすい文字列であればよいが、少なくとも同一使用者のインスタンスにおいて一意であるとする。他に必要であればインスタンスの用途を示すタグ、作成日時などの情報を含んでもよい。計算リソース601bには、CPUやRAMなど、計算性能に関するリソースの属性、およびその割り当て量が記載される。同様に、ネットワークリソース601cにはイーサネットワークおよびファイバチャネルネットワークについての、ストレージリソース601dにはディスクに関する属性、およびその割り当て量が記載される。
さらに、インスタンス管理テーブル601は、リソースごとに安定性を示す項目(図7中下線部)を有しており、これは本発明においてサービスレベルを決定づける重要な設定値である。安定性の項目において、「No」となっている場合には他のインスタンスとの競合によりパフォーマンス低下の可能性があるため、移行した方が良いことを示している。
また、管理機能601eは、インスタンスごとに有効化されている項目や、その種類が記載されている。管理機能601eとして記載されうる項目は、サービスレベル定義部600cにより定義されており、統合サービスレベル管理部504bの制御化にある装置管理部、および各装置が有する機能に基づく。なお、図7中「Cold」はインスタンスを停止する必要性があることを示している。
図6に戻り、サービスレベル判定部602は、ユーザからの構成変更要求を受け取り、どのインスタンスが性能の影響を受けていてどのインスタンスが性能の影響を受けていないか判断する。そして、サービスレベル判定部602は、適切な移行先候補の装置を選ぶための移行方策およびインスタンス候補602aを算出する。サービスレベル判定部602に含まれるインスタンス候補602aは、移行方策を検証するため仮に想定した移行後のインスタンス構成であり、インスタンス管理テーブル601と同様の項目により表現される。また、移行方策を検討する基となる性能情報は、性能履歴格納部604から提供される。さらに、性能影響の要因が特定され、算出された移行方策を移行管理部606に対して指定する。
移行条件管理テーブル603の詳細を図8に示す。移行条件管理テーブル603は、ある構成要素の移行に関する条件を列挙したものであり、各インスタンス候補について、移行管理部606によって全ての条件が評価される。図8に示される移行条件管理テーブル603は、仮想インスタンスから仮想インスタンスへの移行、仮想インスタンスから物理インスタンスへの移行、物理インスタンスから仮想インスタンスへの移行、物理インスタンスから物理インスタンスへの移行の全ての場合に参照される。ここで、構成要素の移行に関する条件とは、インスタンスを構成するソフトウェアコンポーネントや、ハードウェア装置に対して課される条件であり、移行の可否を判断する基準や、移行に必要な手順(移行方法)を論理化したものである。具体的には、“モデルAのベアメタルサーバ上で稼働していた物理インスタンスをモデルBのベアメタルサーバに移行するには、デバイスCのドライバ導入が必要であること”、あるいは“ゲストOSの種類がDである仮想インスタンスは、ハイパバイザEには移行不可能であること”といったものを指す。これらの条件は、計算機システムの管理ポリシや、利用される移行ツールの動作要件により決定される。ただし、それらの条件は、必ず管理コンピュータ500が観測可能な値によって表現され、かつ一致/不一致や値の大小、範囲など論理的に評価することが可能なものに限られる。
移行条件管理テーブル603は、移行条件ID603aと、条件603dに合致した場合の出力値を示すタイプ603bと、移行方法603fを決定づけるパラメータ603cと、パラメータ603cが適用される条件式603dと、条件式603dが真であるときの属性(タイプ)603bと、当該移行方法の実行にかかる所要時間603eと、当該移行方法を実行した場合に掛かるコスト603gと、を構成項目として保持する。
移行元および移行先として指定される構成の組には、条件式603dが真である際に移行可能であるもの(Accepted)と、移行不可能であるもの(Refused)があり、属性(タイプ)603bはその可否を示す。移行方策について、1つでも移行不可能(Refused)と判定されるパラメータを含む場合、属性(タイプ)603bが移行不可能である条件式603dが成立し、当該移行方策は棄却される。ただし、Acceptedの条件に合致しない場合でも対象の移行方策が即座に棄却されることはない。Acceptedの属性(タイプ)の場合に、パラメータ603cが条件603dに合致するときは、方策603fが実行されることになるだけである。例えば、ID603a=#2005の場合、処理対象のインスタンス候補のゲストOS名がX、VMホスト(物理サーバ)名がYのときを考える。このときこれらのパラメータを該当する条件に合致するか判断される。この例の場合、ゲストOS(X)がPlatform_Aで、かつVMホスト(Y)がHosetList_Aであったとき、属性(タイプ)が”Accepted”となり、移行方法603fで示される作業が実行されることになる。
また、移行条件管理テーブル603は、条件式603dの評価方法とその結果に対する挙動を記述することができれば、テーブル形式に限らずシェルスクリプトやプログラムの集合として実現されてもよい。移行管理部606は、移行元構成と、移行方策から算出される移行先候補の構成を、移行条件管理テーブル603により評価し、当該移行方策が実施可能であるか否かを判定する。移行方策が実施可能である場合、同じ移行条件管理テーブル603を評価することにより、さらに移行にかかる所要時間およびコストが算出される。
図6に戻り、性能履歴格納部604は、サーバ管理部504c、ネットワーク管理部504d、及びストレージ管理部504eから、各装置のリソースに関する性能履歴を取得し、図示しないメモリに蓄積する。性能履歴格納部604が保持する性能情報は、概ね各リソース(CPU、RAM、ネットワークアダプタ、ディスクデバイス)における利用率(利用時間の比率や、全リソース量に対する稼働数、あるいはバス帯域の使用率)、待ちジョブ長さ(キュー全長に対する平均待ちジョブ数や、平均バッファ使用量)、単位時間あたりのコマンド処理量(IOPSや、TPS:Transaction Per Second)、や平均応答時間などである。なお、複数のインスタンスに由来する処理負荷が生じている場合は、各インスタンス上のOSおよびハイパバイザから取得できる情報に限り、インスタンスごとの負荷に分解できるものとする。ただし、サービスレベル判定部602の判定アルゴリズムにより、性能履歴格納部604が取得する項目の詳細、および蓄積する履歴の対象期間は異なっていても良い。
デバイス管理テーブル605の詳細を図9に示す。デバイス管理テーブル605は、インスタンスごとに識別子605aと、稼働する物理サーバ605bと、ハイパバイザ605c(仮想インスタンスの場合)と、同物理サーバが搭載されているサーバシャーシ605dと、ネットワークインタフェース605eと、システムユニットの接続構成から求められる接続先のイーサスイッチ605fと、ファイバチャネル605gと、ストレージ制御部605hについての構成情報と、を管理項目として保持する。これらの構成情報は、性能履歴格納部604の場合と同様に、各装置管理部から取得できる。
例えば、インスタンスA001とA002は、サーバシャーシを共有している。インスタンスA002とB330では、ディスクコントローラを共有しており、ここで競合が発生する可能性があると分かる。
以上のように、デバイス管理テーブル605を参照することにより、インスタンス間で共有している機器をチェックすることができる。
<移行方策を算出する処理>
以下にインスタンスの性能劣化、および性能余剰を改善する方策を算出する処理について述べる。図10Aおよび図10Bは、仮想インスタンスおよび物理インスタンスの性能劣化を改善する移行方策を算出する際の処理の詳細を説明するためのフローチャートである。本処理においては、特に統合サービスレベル管理部504bが重要な役割を担っており、移行方策702を移行方策リスト703の形式で算出する。統合サービスレベル管理部504bは、内部的に移行方策の推奨度を有し、前述の通り、移行方策リスト703に格納される各移行方策703aの優劣を示す際に用いられてもよい。
ステップ750において、ユーザは、クライアントコンピュータ510上のクライアントプログラム513bを使用し、管理コンピュータ500上のサービス管理部504aに対して、インスタンス24の構成変更を要求する。このとき、ユーザからの要求を受けて、クライアントプログラム513bは、当該仮想インスタンスの名称(図7中の601a参照)をサービス管理部504aに通知する。その背景には、ユーザが当該仮想インスタンス24上のアプリケーション23cにおける性能低下を感じたことが契機となっている。しかしながら、ユーザ自身は性能低下の主要因が何であるかを判別していない。
ステップ751において、サービス管理部504aは、ユーザのアクセス権限に基づいて構成変更要求を承認し、統合サービスレベル管理部504bに対してユーザが指定したインスタンスの名称を伝える。統合サービスレベル管理部504bは、サービスレベル判定部602にて受信したインスタンスの名称を使用して、インスタンス管理テーブル601に記載された当該インスタンスの識別子を特定する。同じインスタンスの名称が複数存在する場合には、ユーザ(インスタンスの使用者)名を用いて特定するなど他の情報と組み合わせて識別子を特定する。
ステップ752において、サービスレベル判定部602は、ステップ751において特定したインスタンスの識別子を用いてデバイス管理テーブル605を検索し、当該インスタンスが使用している装置(サーバ装置、ネットワーク装置、ストレージ装置)を特定する。
ステップ753において、サービスレベル判定部602は、ステップ752において特定した全ての装置について、性能履歴格納部604より性能情報の履歴(例えば、1日の履歴、1週間の履歴等、様々な種類の履歴がある)を取得する。これにより、当該インスタンスに対して性能影響を及ぼしうる他のインスタンス、および装置が判明する。
ステップ754において、サービスレベル判定部602は、ユーザが当該インスタンス(当該ユーザが使用中のインスタンス)に対して行った改善要求、またはインスタンスの性能履歴の推移に応じて、性能劣化を改善する処理(ステップ755a)及び性能余剰を改善する処理(ステップ755b)のいずれかに処理を分岐させる。ここでは、例えば、ユーザがステップ750において性能劣化を改善する方策を要求している場合や、性能情報履歴から当該インスタンスの処理負荷が高まっていることが検出された場合には、性能劣化を改善する方策を導出する処理755aに進む。一方、ユーザがステップ750において性能余剰のインスタンスの構成を縮小させる方策を要求している場合や、性能情報履歴から当該インスタンスの処理負荷が割当てられたリソースに比べて低いことが検出された場合には、性能余剰を改善する方策を導出する処理755bに進む。処理755a及び755bの詳細について以下順次説明するが、同処理により改善方策702a及びbを算出することができる。
(i)性能劣化改善方策導出処理
性能劣化を改善する方策を導出する処理755aの詳細を、図10Bを用いて説明する。
前述の分岐ステップ754において、性能劣化が生じていると判断された場合、ステップ760に進む。
ステップ760において、サービスレベル判定部602は、当該インスタンスの各装置について、他のインスタンスから性能影響を受けているか否かを判別する。より具体的には、例えば同じ仮想マシンホストを利用している他の仮想サーバから与えられる計算リソースに対する性能影響の有無、あるいは、同じネットワークポートを共有する他の物理サーバから与えられるネットワークリソースに対する性能影響の有無を調査し、判定を行う。性能影響の有無を判定した結果は、計算リソース、ネットワークリソース、ストレージリソースにおいて評価され、インスタンス管理テーブル601に保持される。本ステップにおいて他のインスタンスの性能影響が要因でないと判定された場合には、処理はステップ761に進む。他のインスタンスが性能影響を及ぼしていると判定された場合には、構成の拡張(リソース追加)が不要であるため、移行後のインスタンス構成を表すインスタンス候補602aに移行対象インスタンスと同じ構成を設定し、処理はステップ763に進む。
ステップ761において、サービスレベル判定部602は、性能履歴格納部604から、同一装置における空きリソース量を取得し、適したリソースがあるか(十分に空きリソースがあるか)判断する。ここで、空きリソース量とは、各装置管理部が公開している場合は利用可能なリソース量のことであり、公開していない場合は全リソース量から、利用されているリソース総量を差し引いたもののことである。また、サービスレベル判定部602は、拡張するリソース量を決定し、インスタンス候補602aを設定する。拡張するリソース量の算出方法としては、事前に決定された比率を一律に用いる(例えば既存リソース量を25%増加させるなど)、現在の利用率を以前一定期間の利用率まで低下させる量を追加する、あるいはユーザに問い合わせるなどの方法がある。さらに、サービスレベル判定部602は、空きリソース量と拡張するリソース量とを比較し、構成拡張が可能であるか否かを判別する。装置の構成によって、1つのインスタンスに割り当て可能なリソース量の上限値が設定されている場合は、その上限値との比較も行い、可否を判断する。十分な空きリソースがあると判定された場合には、処理はステップ762へ進む。空きリソースが不足と判定された場合は、たとえ他のインスタンスから性能影響を受けていない場合であっても別の装置への移行が必要と判定し、処理はステップ763へ進む。また、当該インスタンスが各装置を占有している場合、例えば1つのベアメタルサーバを占有する物理インスタンスである場合、ステップ760では他のインスタンスから性能影響を受けていないと判定される可能性が高い。その場合、処理はステップ761に進むものの、ステップ761において空きリソースがないと判断されて、ステップ763に進むことになる。
ステップ762において、サービスレベル判定部602は、同一装置における構成拡張を改善方策リスト703に追加し、それを移行管理部606に通知する。特に、例えば仮想インスタンスが計算リソースの不足により性能劣化を生じていた場合、同一仮想マシンホストにおける仮想インスタンスの構成変更が行われるのみであり、移行管理部606により移行の実施可能性が否定されることはない。したがって、移行管理部606は、移行条件管理テーブル603により移行にかかる所要時間およびコストを算出するためにのみ利用される。また、各リソースについて性能安定となる個数の積算として、推奨度が算出される。当該インスタンスの性能改善を要求しているユーザの承認が得られるまでの期間、他のユーザや管理者により移行先リソースが消費されてしまう恐れがある場合には、それら対象移行先リソースを予約する手順をさらに行ってもよい。
ステップ763以後は、別装置への移行を検討するフローである。ステップ763において、サービスレベル判定部602は、移行管理部606に対し、当該仮想インスタンスが現在稼働しているものとは別の装置へ移行するよう要求する。このとき移行管理部606は、移行元が仮想インスタンスであっても、仮想マシンホストのみならずベアメタルサーバについても移行先として検討する。
ステップ764において、移行管理部606は、物理的に近傍に配置された装置、すなわち同じラックに搭載されている装置を優先的に検出して移行先の候補とする。近傍であればあるほど構成変更のために掛かる時間は少なくて済む。ただし、別のシステムユニットにある装置を移行先の候補とすることはしない。
移行管理部606は、移行先装置の候補と、それら候補に対する検証の済・未済を保持し、順次移行先に適した装置であるかを判定するステップ765から771を実行する。同じシステムユニット内に適切な装置が見つからない場合、システムユニットを跨って移行先装置を検索する必要がある。システムユニットを跨る移行を実施する際には構成を管理する管理コンピュータ500が異なるため、単に装置の構成変更だけでなく、管理情報を含めて移行しなければならない。
ステップ765において、移行管理部606は、デバイス管理テーブル605を参照して、移行条件管理テーブル603に記載された条件を評価する。このとき、少なくとも1つの移行の実行可能性が否定された場合、すなわち属性(タイプ)603bにより移行不可能であることを示す条件式が成立した場合(Refusedとなった場合)、処理はステップ763に進む。また、性能履歴格納部604が保持する性能情報から、移行先装置に十分な空きリソースが無いことが検出された場合でも、移行管理部606は、即座に移行先として不適であるとみなし、処理をステップ769に進ませる。一方、移行の実行可能性が否定されておらず、空きリソースが十分である場合は、処理はステップ766へ進む。
ステップ766において、移行管理部606は、移行先装置が他のインスタンスと共有されているか、もしくは移行すれば占有可能であるかを調べる。ただし、移行先装置が他のインスタンスにより使用されておらず、占有が許される場合には、当該移行方策が適合するとして処理はステップ770に進む。移行先装置において他のインスタンスから受ける可能性がある場合は、処理はステップ767に進む。
ステップ767において、移行管理部606は、当該移行方策の推奨度を下げる。本ステップにおいて推奨度を下げるのは、移行方策を棄却する判断はできないものの、性能影響を受ける可能性が残るために、装置を占有させる方策がより安定稼働を実現できる点で優位であることに基づく。
ステップ768において、検証対象の装置上で稼働するその他のインスタンスが、移行対象のインスタンスと同じ処理負荷傾向を示す場合には、性能影響を受ける可能性が示唆されるため、移行管理部606は、当該装置を移行先として適さないと判定し、処理をステップ769に進ませる。移行対象のインスタンスの負荷傾向が他のインスタンスの負荷傾向と競合しない場合、適切な移行先装置の候補であると判断してステップ770へ進む。
ステップ769では、移行先装置として適切でないことがステップ768において判定されているため、移行管理部606は、当該装置を移行先候補から棄却し、以降の検証候補から除外する。
ステップ770において、移行管理部606は、移行条件管理テーブル603を参照して移行にかかる所要時間およびコストを評価したものと合わせて、当該移行方法を改善方策リスト703に追記する。また、ステップ762と同様に、推奨度が算出されるが、ステップ767を経由した場合には、当該リソースについて推奨度は一段階下げたものが反映される。さらに、当該インスタンスの性能改善を要求しているユーザの承認が得られるまでの期間、他のユーザや管理者により対象装置の移行先リソースが消費されてしまう恐れがある場合には、それら対象移行先リソースを予約する手順を追加して行ってもよい。さらに、当該装置を以降の検証候補から除外する。
ステップ771では、移行管理部606は、検証候補として保持したもののなかで、未検証のものがあるかを判定する。未検証のものがあれば、そのうち1つを選択して再度検証処理を適用するべく、処理はステップ759へ戻り、未検証のものがなければ(残った検証候補が空ならば)本処理は終了する。本処理フローを経ることで、改善方策リスト703には、性能低下を解消する方策が格納される。
(ii)性能余剰改善方策導出処理
以上の説明は、インスタンスの性能劣化を改善する方策の算出について述べたものであるが、インスタンスの性能余剰を改善する方策の算出についても同様に図10Aおよび図10Bに示す処理フローを用いて説明する。性能余剰が起こりやすい状況としては、例えば、物理ネットワークポートなどの装置コンポーネントを占有している場合や、1つの物理サーバを占有している場合である。特に物理インスタンスはベアメタルサーバであり、物理サーバの豊富な処理リソースを独占的に割り当てられており、インスタンス上のアプリケーションへの処理需要が減少した場合には、リソース利用効率が低下してしまう可能性がある。本構成において、ユーザがそれらの性能余剰を感じ、このまま当該インスタンスを使用し続けるとコストが高くなってしまうと判断した場合、クライアントプログラム513bを用いて管理コンピュータ500に対して、管理リソース利用効率を高めたいという要求が出される。その要求に対して、管理プログラムの各コンポーネントは、インスタンスに割り当てられたリソース量を縮小するか、あるいはよりリソース量の少ない別の装置へと移行することにより、リソース利用効率を改善する。仮想サーバである仮想インスタンスの場合など、ユーザが性能影響を許容して他のインスタンスと同じ物理装置を共有している場合の性能余剰においても、単にリソース割り当て量を縮小するのではなく、性能安定を維持しつつ移行する。このとき、性能の影響を加味して、装置を共有させるか、あるいはよりリソース容量の小さい装置を占有させるか、という判定を行う必要がある。特に物理インスタンス(物理サーバ)の場合には、仮想サーバのようにリソース割当て変更による構成縮小が簡単にできないため、移行を前提とした改善方策の算出処理となる。そして、物理インスタンスの場合、構成を縮小できる移行先として物理インスタンス或いは仮想インスタンスが選択されるが、そもそも物理インスタスを用いていたということはサーバの安定性を重視していたということであるから、構成の縮小が可能で、かつ動作の安定性を保証する移行先(物理インスタンスから仮想インスタンスに変更する場合でも)を選択する必要があることになる。
上述の性能余剰を改善する処理においては、図10Aにおいてステップ750からステップ754を適用し、ステップ754の分岐において性能余剰を改善する方策を導出処理755bへ進む。処理755bの詳細は以下に述べるが、同処理により改善方策702bが算出される。
性能余剰を改善する方策を導出する処理755bの詳細についても、処理755aと同様に図10Bを用いて説明する。
ステップ754において、性能余剰が生じていると判断された場合、処理はステップ760に進む。
ステップ760において、サービスレベル判定部602は、当該インスタンスの各装置について、他のインスタンスから性能影響を受けているか否かを判別する。前述の性能劣化の場合と比較して、性能余剰が生じている場合には、他のインスタンスからの性能影響が当該インスタンスの性能上限を左右する可能性は低く、ステップ760は負荷傾向の相関を調べるために行われる。当該ステップにおいて、他のインスタンスの負荷傾向と競合していないと判定された場合には、処理はステップ761に進む。他のインスタンスの負荷傾向と競合していると判定された場合には、より要求性能に適した別の装置を求めて、処理はステップ763に進む。
ステップ761において、サービスレベル判定部602は、性能履歴格納部604から、同一装置におけるリソース量を取得する。また、サービスレベル判定部602は、縮小するリソース量を決定し、インスタンス候補602aを設定する。インスタンス候補602aの構成は、処理需要に応じて設定され、例えば、事前に決定された比率を一律に用いる(例えば既存リソース量を25%削減させるなど)、現在の利用率を以前一定期間の利用率まで向上させるリソース量を削減する、あるいはユーザに問い合わせるなどがある。さらに、サービスレベル判定部602は、取得した同一装置のリソース量とインスタンス候補602aのリソース量を比較し、移行の可否を判断する。特に仮想インスタンスの計算リソースにおける性能余剰の場合、多くの場合問題なく構成を縮小できるが、物理インスタンスの場合はCPUの数など物理的に構成変更できない場合が多い。また、装置の構成によって、1つのインスタンスに割り当て可能なリソース量の下限値が設定されている場合は、その下限値との比較を行い、可否を判断する。移行が可能であると判定された場合には、処理はステップ762へ進む。移行が不可能であると判定された場合には別の装置への移行が必要と判定し、処理はステップ763へ進む。
ステップ762において、サービスレベル判定部602は同一装置における構成縮小を改善方策リスト703に追加し、それを移行管理部606に通知する。
ステップ763以後は、別装置へのインスタンスの移行を検討する処理である。
ステップ763において、サービスレベル判定部602は、移行管理部606に対し、当該仮想インスタンスが現在稼働しているものとは別の装置へ移行するよう要求する。
ステップ764において、移行管理部606は、サービスレベル判定部602からの要求(指示)に応答して、物理的に近傍に配置された装置、すなわち同じラックに搭載されている装置を優先的に検出して移行先の候補とする。同じラックに搭載されている装置を優先する理由は上述の通りである。
ステップ765において、移行管理部606は、デバイス管理テーブル605を参照して、移行条件管理テーブル603に記載された条件を評価する。このとき、少なくとも1つの移行の実行可能性が否定された場合、すなわち属性(タイプ)603bにより移行不可能であることを示す条件式が成立した場合(1つでもRefusedが成立した場合)、処理はステップ763に進む。また、性能履歴格納部604が保持する性能情報から、移行先装置に十分な空きリソースが無いことが検出された場合でも、移行管理部606は、当該装置が移行先として不適であると即座にみなし、処理をステップ769へ進ませる。移行の実行可能性が否定されておらず、空きリソースが十分である場合は、処理はステップ766へ進む。
ステップ760において、移行管理部606は、移行先装置が他のインスタンスと共有されているか、もしくは移行すれば占有可能であるかを調べる。ただし、移行先装置が他のインスタンスにより使用されておらず、占有が許される場合には、当該移行方策が適合するとして、処理はステップ770に進む。移行先装置において他のインスタンスから受ける可能性がある場合は、処理はステップ767に進む。
ステップ767において、移行管理部606は、当該移行方策の推奨度を下げる。
ステップ768において、検証対象の装置上で稼働するその他のインスタンスが、移行対象のインスタンスと同じ処理負荷傾向を示す場合には、性能影響を受ける可能性が示唆されるため、移行管理部606は、当該装置は移行先として適さないと判定し、処理をステップ769に進ませる。移行対象のインスタンスの負荷傾向が他のインスタンスの負荷傾向と競合しない場合、移行管理部606は、当該装置は適切な移行先装置の候補であると判断して、処理をステップ770へ進ませる。
ステップ769では、当該装置が移行先装置として適切でないとステップ768で判定されているため、移行管理部606は、当該装置を移行先候補から棄却し、以降の検証候補から除外する。
ステップ770において、移行管理部606は、移行条件管理テーブル603を参照して移行にかかる所要時間およびコストを評価したものと合わせて、当該移行方法を改善方策リスト703に追記する。また、ステップ762と同様に、推奨度が算出されるが、ステップ767を経由した場合には、当該リソースについて推奨度は一段階下げたものが反映される。さらに、当該インスタンスの性能改善を要求しているユーザの承認が得られるまでの期間、他のユーザや管理者により対象装置の移行先リソースが消費されてしまう恐れがある場合には、それら対象移行先リソースを予約する手順を追加して行ってもよい。さらに、当該装置を以降の検証候補から除外する。
ステップ771では、移行管理部606は、検証候補として保持したもののなかで、未検証のものがあるかを判定する。未検証のものがあれば、そのうち1つを選択して再度検証処理を適用するべく処理はステップ759へ戻り、未検証のものがなければ(残った検証候補が空ならば)、処理は終了する。
以上のようにして、改善方策リスト703には、性能余剰を解消する方策が格納される。
<性能影響要因の特定方法>
前述の通り、インスタンスの性能劣化が起こる要因として、単にリソースの割り当て量が不足している場合と、他のインスタンスと共有しているリソースについて処理需要が競合している場合がある。また、逆に性能余剰の場合でも、処理需要が競合しないインスタンスにより同一装置を共有させるよう移行することで、全体的なリソース利用率の向上が見込める。ここでは、適切な移行方策を選択するために必須となる、影響要因を判別する方法について述べる。これは、より具体的には、本実施形態における処理フロー(図10A及びB参照)のうち、ステップ760およびステップ768において必要となる処理である。
改善対象のインスタンスの性能に対して他のインスタンスが影響を及ぼしているか否かを判定するには、まず、どの装置を他のインスタンスと共有しているかを調べる必要がある。これは、デバイス管理テーブル605(図9参照)を参照することにより調べることができ、改善対象が使用している各装置について、同じ装置を含むレコードを検索すればよい。例えば、識別子「A002」のインスタンスは、インスタンスB330と、ファイバチャネルスイッチFS20のポート#05およびストレージコントローラのポート#A1を共有していることがわかる。
次に、共有されている装置について、インスタンス同士が互いに影響し合っているかを調べる。そのための方法として、少なくとも以下の3つの方法が挙げられる。
第1の方法として、性能履歴格納部604から当該装置の性能履歴を参照し、改善対象のインスタンスに由来する負荷の推移傾向と、その他のインスタンスに由来する負荷の推移傾向の相関を評価するやり方がある。改善対象のインスタンスとその他のインスタンスとで、推移傾向が逆となっていれば性能影響を受けている可能性が高く、相関が無ければ性能影響の可能性が低い。例えば、改善対象のインスタンスの性能が劣化しているのに対し、他のインスタンスの性能が向上している場合は、他のインスタンスにより処理性能が奪われていると判定できる。一方で、他のインスタンスの性能に変化がない場合に、改善対象のインスタンスの性能が劣化している場合は、単にインスタンス内の処理需要の増加に対してリソース供給が不足していると判定できる。
第2の方法として、性能履歴格納部604から当該装置の性能履歴を参照し、改善対象のインスタンスおよびその他のインスタンスに由来する負荷について、最近の履歴と過去の履歴とを比較するやり方がある。過去の一定期間の性能履歴と比較して、改善対象の性能が定常的に低下しており、他が定常的に上昇していることで性能影響を検出できる。当該装置において、ディスクIOや、ネットワークスイッチにおける優先度制御を利用している場合、制御ポリシの設定を変更することで、結果的に優先度の低いものの性能が長期的に低下する場合がある。それらの制御ポリシは、通信の用途(例えば、データの送受信を要求するアプリケーションの別や、データ転送/制御情報/プログラムコードのロードの別など)に対して定められることもあり、インスタンスごとに設定されない可能性もある。そのような場合には、より長期的な負荷傾向を調べることで性能影響を検出することができる。
第3の方法として、性能履歴格納部604から性能履歴を参照し、当該装置の性能容量が限界値に達していることを検出するやり方がある。複数のインスタンスにより装置が共有されている場合、それぞれの負荷の総和によりリソースが逼迫する可能性があり、これは当該装置全体の負荷を把握しなければ検出することができない。さらにこの方法では、例えばメモリ領域のスワップや、ネットワークアダプタにおける転送データのバッファリング、CPUコアの動的割り当てなど、装置内でリソースを融通する既存技術の効果により、複数インスタンス間の負荷傾向に顕著な相関が生じない場合であっても、相互の性能影響を検出できる。
以上の方法のいずれにしても、同一装置を共有しているインスタンスを特定し、さらにそれらの処理負荷における傾向を調べることで、複数インスタンス間で性能影響が生じているか否かを判定する点が共通している。これらの判定方法はサービスレベル判定部602により実現され、装置ごとの性能履歴については性能履歴格納部604から取得可能である。ただし、性能履歴格納部604が保持できる性能履歴は、各装置管理部から取得できる項目に限られるため、サービスレベル判定部602は取得可能な性能項目に基づいて利用可能な判定方法を選択する機能を有する。
<第1の実施形態についての小括>
以上のようにすることにより、インスタンス上のアプリケーションの性能劣化や性能余剰を動機としてインスタンスの構成変更が要求された際に、性能を改善するのに適した移行方策を提示するシステムが提供される。第1の実施形態によれば、インスタンスが配置されている装置構成や接続構成を、インスタンスの利用者が知りえない場合においても、適切な移行方策が提示される。また、提示される移行方策には性能が改善されるリソースの種別に加え、所要時間および当該方策により生じるコストや、移行後のインスタンスの運用にかかるコストの予測値が含まれる。これにより、複数提示される移行方策の長所および短所を定量的に把握し、利用者が単独で移行方策を選択する、あるいは利用者が設定するポリシに基づき自動的に移行方策を決定することが可能となる。
(2)第2の実施形態
第2の実施形態は、ユーザの構成変更に対して移行方策を生成するという機能を有する点ではおいては第1の実施形態と同じであるが、移行方策として近似のカタログを推奨する点において異なる。
前述の通り、カタログとは、インスタンスの用途や物理リソースのサイジングなどの要因を考慮し設計される、サーバの典型的な構成である。したがって、カタログの構成から極端に逸脱する構成変更を行った場合には、リソース利用効率が低下したり、インスタンス上で稼働するアプリケーションのソフトウェア要件を満たさなくなったりする恐れがある。
より具体的には、例えば、仮想インスタンスのメモリリソースが不足した際に、性能改善のためメモリの追加のみを行った場合を考える。このとき、CPUやNICなど他のリソースの利用率は低いまま、当該仮想インスタンスが物理サーバのメモリリソースの大半を消費するために他の仮想インスタンスを同物理サーバ上に作成できないという可能性が生じる。また、メモリリソース容量に対して、相応のネットワーク帯域を追加しなければならないというサイジング要件を有するアプリケーションであった場合には、その後ネットワーク通信がボトルネックとなり処理性能が低下する可能性がある。このとき、大容量のメモリを搭載する物理サーバ用に設計されたカタログや、特定アプリケーション向けに大容量メモリとネットワークをサイジングしたカタログを提示することにより、よりインスタンスの用途、およびシステム全体に対して適切なインスタンス構成へと誘導できる。
さらに、このようなカタログ提案の結果、カタログが選択された頻度の統計により、人気の高いカタログを把握することができるという効果もある。これは、カタログを設計する管理者や、物理装置を増設する管理者にとってサイジングの根拠を得られるという有用な効果である。
第2の実施形態では、第1の実施形態と比較して、移行先構成の候補を算出する処理を含む、ステップ761、およびステップ765が変更される。同ステップにおいて、特にインスタンス候補602aとして設定され得るカタログを検索する処理が追加される。さらに、ユーザに提示される移行方策702は、図5に示す改善方策リスト703に代わり、カタログのリストとなる。その他の物理構成および論理構成は第1の実施形態と同一である。
ステップ761においては、同一装置における移行後のインスタンス構成を仮に保持するインスタンス候補602aが設定される。このとき近似のカタログを検索し、同カタログに記載の設定値によりインスタンス候補602aを更新する。このようなカタログを以後、推奨カタログと呼ぶことにする。
本実施形態において、仮想インスタンス用のカタログと、物理インスタンス用のカタログは、主にサーバ装置の構成に合わせてそれらカタログが別々に作成される。したがって、ステップ764において、ストレージ装置やネットワーク装置ではなく、未検証のサーバ装置が選ばれた場合には、サーバ装置の構成に適したカタログを推奨カタログとして再度選び直す。より具体的には、ステップ765において、特に仮想インスタンスから物理インスタンスへの変更(V2P移行)、または物理インスタンスから仮想インスタンスへの変更(P2V移行)が必要と判定された場合には、再度推奨カタログの検索を行い、インスタンス候補602aを更新して再度ステップ765の判定処理を行う。
<近似カタログの検索処理の概念>
図11は、本実施形態による、あるインスタンスに対して、近似のカタログを検索する処理の概念を説明するための図である。ここでは、例として、評価対象のインスタンス構成800を考える。ここで、推奨カタログを検索する処理としては、次の2通りの方法が考えられる。
(i)第1の方法
第1の方法は、リソースの量に基づくものである。この方法は、主に移行前のインスタンス候補602aに対して構成の変更が必要であると判定されたときに用いられる。
サービスレベル判定部602は、インスタンス候補602aに対してリソースの追加量(または削減量)を決定し、評価対象のインスタンス構成とし、変更が必要な項目を保持しておく。
次に、サービスレベル判定部602は、カタログテンプレートリスト600aから順次候補カタログ801を取得し、変更が必要な項目について比較することで、差分量を計算する。さらに、その差分量が所望の変更量を満たすようなものを推奨カタログとする。例えば、メモリを最低でも4GB追加する必要がある場合には、最低でも4GB以上増加するカタログを候補として選出する。
このようなカタログが複数選出される場合、サービスレベル判定部602は、他の各リソース量および管理機能の有無について差分(差分情報802a−802d)を計算し、差分量が最小となるものを選ぶことにより候補を絞ってもよい。
そして、サービスレベル判定部602は、推奨カタログによりインスタンス候補602aを更新し、推奨カタログの識別子を保持する。
(ii)第2の方法
第2の方法は、リソースの性能安定性に基づくものである。この方法は、主に移行前のインスタンス候補602aに対して他のインスタンスにより性能影響が生じていると判定されたときに用いられる。
サービスレベル判定部602は、インスタンス候補602aに対して、性能影響を解消すべきリソースを特定し、保持しておく。
次に、サービスレベル判定部602は、カタログテンプレートリスト600aから順次候補カタログ801を取得し、安定化が必要な項目について比較することで、差分量を計算する。例えば、図11のように、例えば計算リソースとストレージリソースの安定化が必要であると算出された場合、計算リソースとストレージリソースの両方が安定になるカタログを推奨カタログとする。
このようなカタログが複数選出される場合、サービスレベル判定部602は、他の各リソース量および管理機能の有無について差分を計算し、差分量が最小となるものを選ぶことにより候補を絞ってもよい。
そして、サービスレベル判定部602は、推奨カタログによりインスタンス候補602aを更新し、推奨カタログの識別子を保持する。
(iii)改善方策の提示
移行方策を算出する処理(上記(i)或いは(ii))が完了した後、サービス管理部504aは、サービスレベル判定部602により保持された推奨カタログの識別子に基づき、当該推奨カタログの情報をカタログテンプレートリスト600aから取得し、改善方策702として提示する。
<第2の実施形態の小括>
以上の構成により、インスタンス上のアプリケーションの性能低下を動機としてインスタンスの構成変更が要求された際に、性能を改善するのに適した変更先カタログを提示するシステムが提供される。本実施形態によれば、利用者はインスタンスの物理的な配置や、他のインスタンスとの兼ね合いを意識することなく、所望の計算機環境を構築できる。さらに、管理者により設計されたカタログを移行に採用することで、カスタマイズについてのノウハウを考慮せずとも、アプリケーションに適したサイジングが行える。
(3)第3の実施形態
第3の実施形態では、インスタンスの性能劣化を動機としてユーザが構成変更を要求した際に、性能劣化を解消する移行方策を算出した後、移行を自動的に実施するシステムが提供される。本実施例においては、移行方策を算出する機能性については前の実施例までと共通であるが、さらに算出された移行方策702または推奨カタログへの移行を、自動実行する機能を備える点において異なる。
<移行方策の自動実行>
本実施形態は以下のように実現される。つまり、本実施形態例では、第1の実施形態または第2の実施形態において、図12に示す構成(実行条件603h)が、移行条件管理テーブル603に追加される。そして、移行管理部606はこの実行条件に603hに従って、条件に合致した移行方法を実行する。
移行条件管理テーブル603に関して、第1の実施形態または第2の実施形態においては、単に移行にかかる所要時間とコストを積算すればよかった。
しかし、本実施形態においては、各条件603dに応じて決まる移行方法603fを実行する順序を保持する必要がある。具体例として、仮想インスタンスから物理インスタンスへ移行し、記憶域の形式を仮想ディスクからボリュームへと変更する場合を考える。この場合、例えば移行元の仮想ディスクが保持していたデータを移行先のボリュームへコピーする手順の前に、移行先ボリュームを作成する手順を行っておく必要がある。また、ベアメタルサーバ用のデバイスドライバをOSにインストールする手順は、移行対象データを移行先ボリュームへコピーする手順の後に行わなければならない。
このような移行方法603fの順序付けを、本実施形態では、移行方法に対する実行条件603hのように表現する。図12は、例えば、識別子「#1203」の移行条件が成立した際に実行される移行方法Aは、該当する実行条件603hに従って移行条件「#8012」または「#5964」を評価した後に行う必要があることを示している。
一方、移行管理部606は、本実施形態において新たに実行キュー606aを有し、実行予定の移行方法603fの実行順序を保持する。移行管理部606は、移行条件管理テーブル603を評価する手順において、実行条件603hを参照し、実行キュー606aに移行方法603fを設定する。ユーザにより当該移行方策の実施が承認された場合、移行方法603fが当該実行キュー606aに設定された順序で自動的に実施される。
以上のように、本実施形態では、例えば、図5の移行方策の1つが選択されると、合致する条件が図12から抽出される。抽出された条件に対応する移行方法603fの実行順序が実行条件603hによって自動的に決定されることになる。
なお、複数のインスタンスについて移行要求が行われており、同一装置に対して排他的に移行作業を行う必要があるときなどのスケジューリングを行うために、他の移行作業との進捗を取得したり、実行を待ち合わせるチェックポイントを設けてもよい。ただし、それらチェックポイントは、ユーザや管理者が定義するものや、管理サーバにより機械的に評価可能なものに限られる。
<第3の実施形態の小括>
第3の実施形態によれば、性能劣化や性能の余剰を動機としてユーザがインスタンスの構成改善を要求した際に、当該インスタンスを自動的に適切な構成へと移行するシステムが実現される。これにより、各ユーザは自身が利用しているインスタンスの性能に対して不適合であることを察知したときに、システムに対し構成変更を要求するという切っ掛けを与えるのみでよく、どのリソースや管理機能をどの程度変更するのかを管理者とともに逐一検討する負担が生じない。さらに、必ず性能影響の要因を特定して移行方策を提案することで、多くのインスタンスが稼働するクラウド環境全体のリソース効率を高めると同時に、個々のユーザが利用するアプリケーションに適した構成をとることができる。これらの効果は、単にユーザや管理者が普段行うような構成変更作業の自動化では実現できない。
(4)まとめ
(i)本発明の第1の実施形態では、物理サーバ上で稼働中のインスタンス(仮想インスタンス及び物理インスタンス)の性能が劣化或いは性能が過剰とユーザが判断した場合、或いは各インスタンスの構成と各装置(サーバ、ストレージ)の性能情報から性能劣化・過剰と判断された場合(何れの場合にも管理サーバにはインスタンスの構成変更の要求が出されることになる)に、インスタンスの構成の変更案(移行方策)をユーザ(クライアント端末)に対して提供する。より具体的には、管理サーバは、上記要求を受信すると、処理対象の現行インスタンスが設定されている物理サーバにおいて、現行インスタンスが他のインスタンスとの間で処理需要が競合しているか、デバイス管理情報(図9)を参照して判断する。競合していなければ、その物理サーバ上で構成を拡張することが可能であれば、インスタンス(この場合、対象のインスタンスは仮想インスタンスとなる)の構成変更案(リソースの拡張案)を生成してユーザに提示する(図5参照)。競合している場合には、他の物理サーバへの移行を検証して、構成変更案を生成して提示する。このようにすることにより、ユーザは、サーバの物理的な配置や他者のサーバとの競合を気に掛けることなく、所望の処理性能を享受できるようになる。
現行のインスタンスが物理インスタンスの場合には、物理インスタンスのままで、稼働中の物理サーバ上で構成を拡張・縮小することはできない。この場合には、移行先の物理サーバを探して構成変更するか、物理サーバ上の仮想インスタンスに構成変更する。
以上のようにすることにより、多数の業務システムに対するその時々の処理要求に応じて、性能要求の低い処理を仮想化により少数の物理装置に集約したり、性能要求が高い処理をベアメタルサーバで安定的に稼働させたりするといった使い分けが可能となる。
また、他の物理サーバを移行先として検証する場合、管理サーバは、インスタンスの移行先として不適切である示す移行不適合条件(移行条件管理情報:図8参照)を参照して、移行先候補の物理サーバが移行不適合条件に合致せず(図8でRefusedとならない)、かつインスタンスを生成する十分なリソースを有するか否かを判定する。移行先候補の物理サーバが移行不適合条件に合致する場合(Refusedとなる場合)には、当該移行先候補の物理サーバは、移行先の候補から外される。このように、移行先として不適合な条件を予め定めておくことにより、移行先の物理サーバとして適当か否かを容易に判断できるようになる。
一方、移行先候補の物理サーバが移行不適合条件に合致せず(Refusedとならない場合)、かつ十分なリソースを有すると判定された場合、さらに、移行先候補の物理サーバに他のインスタンスが既に設定されているか否か判定する。既存のインスタンスが移行先に設定されていない場合には、その移行先候補の物理サーバにインスタンスを移行する構成変更案が生成される。既存のインスタンスが移行先に設定されている場合(ただし、この場合には、構成変更案が生成されても推奨度は低くなる)には、既存インスタンスと現行のインスタンスの負荷傾向が競合するか判定する。負荷傾向が競合しなければ、その移行先候補の物理サーバ上でのインスタンスの構成変更案が生成される。負荷傾向が競合する場合(インスタンスの稼働時間に重複があり、両者が同時に稼働できない場合)には、その物理サーバは移行先としては不適と判断され、移行先の候補から外される。このようにすることにより、インスタンスを移行した場合に、その移行先におけるインスタンスの稼働に影響を与えず、より安定的な動作を保証することができるようになる。
(ii)第2の実施形態では、予め推奨される複数のインスタンス構成を含むカタログが用意されている。この場合、管理サーバは、上記生成された構成変更案に近似するインスタンス構成をカタログ情報から抽出し、上記生成された構成変更案と置き換え、近似のインスタンス構成をユーザに提供する。このようにすることにより、カタログからインスタンス構成が選択されるため、構成変更のための処理が予測可能になり、イレギュラーなインスタンスの構成を実現する必要性がなくなる。よって、インスタンス移行(拡張・縮小)処理を効率的に実行することができる。
(iii)第3の実施形態では、予め、所定のパラメータと、そのパラメータが所定の条件を満足する場合に実行される移行方法と、当該移行方法の実行条件とによって構成される、移行実行情報(図12)を用意する。構成変更案(移行方策:図5参照)の1つがユーザによって選択されると、その構成変更案のAcceptedとなっている条件に対応する移行方法が抽出され、その移行方法が対応する実行条件に従って自動的に実行され、構成変更案に従ったインスタンスが設定される。このようにすることにより、自動的にインスタンス移行が実行されるので、ユーザにとってインスタンス変更を実現するための負担がなくなるというメリットがある。
(iv)本発明は、上述のように、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
さらに、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できることを理解する必要がある。更に、汎用目的の多様なタイプのデバイスがここで記述した教授に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益であることが判るかもしれない。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある者には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。
加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになる。記述された実施形態の多様な態様及び/又はコンポーネントは、データを管理する機能を有するコンピュータ化ストレージシステムに於いて、単独又は如何なる組み合わせでも使用することが出来る。明細書と具体例は典型的なものに過ぎず、本発明の範囲と精神は後続する請求範囲で示される。
10・・・第1の物理サーバ
11・・・CPU
12・・・メモリ
13a・・・オペレーティングシステム
13b・・・アプリケーションプログラム
15・・・ファイバチャネルインタフェース
16・・・イーサネットインタフェース
20・・・第2の物理サーバ
23b・・・仮想化プログラム
50・・・ファイバチャネルスイッチ
51・・・ストレージエリアネットワーク
60・・・イーサネットスイッチ
61・・・イーサネットワーク
100・・・第1のストレージ装置
150・・・第1のストレージコントローラ
153a・・・応答プログラム
153b・・・ストレージ制御プログラム
500・・・管理コンピュータ
503b・・・管理プログラム
504a・・・サービス管理部
504b・・・統合サービスレベル管理部
504c・・・サーバ装置管理部
504d・・・ネットワーク装置管理部
504e・・・ストレージ装置管理部
510・・・クライアントコンピュータ
513b・・・クライアントプログラム
601・・・インスタンス管理テーブル
602・・・サービスレベル判定部
603・・・移行条件管理テーブル
604・・・性能履歴格納部
605・・・デバイス管理テーブル
606・・・移行管理部
606a・・・実行キュー
703・・・移行方策リスト(改善方策リスト)
801・・・推奨カタログ

Claims (12)

  1. 複数の物理サーバと、少なくとも1つのストレージ装置と、を管理する管理計算機であって、
    前記物理サーバ上のインスタンスの構成情報と、前記物理サーバ及び前記ストレージ装置の性能情報と、を格納する記憶デバイスと、
    前記物理サーバ上のインスタンスの構成変更の要求に応答して、構成変更方法の候補を生成してユーザに提供するプロセッサと、を有し、
    少なくとも1つの物理サーバは、仮想化機構を有し、当該物理サーバのリソースを分割してインスタンスに割り当て、仮想インスタンスとして機能させる、第1種サーバであり、
    前記第1種物理サーバ以外の少なくとも1つの物理サーバは、当該物理サーバのリソースの全てをインスタンスに割り当て、物理インスタンスとして機能させる、第2種サーバであり、
    前記記憶デバイスは、推奨される複数のインスタンス構成を含むカタログ情報を含み、
    前記プロセッサは、
    前記インスタンスの構成変更の要求に応答して、前記記憶デバイスに格納されている前記性能情報を参照し、構成変更対象のインスタンスが設定されている対象物理サーバにおいて、当該構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合しているか判定する性能競合判定処理と、
    前記性能競合判定処理の結果に基づいて、前記構成変更の対象のインスタンスの構成変更方法の候補を生成する候補生成処理と、
    前記生成された構成変更方法の候補として、仮想インスタンス、及び/又は物理インスタンスの構成を前記ユーザに提供する候補提供処理と、
    を実行し、
    前記候補生成処理において、前記プロセッサは、前記生成された構成変更方法の候補に近似のインスタンス構成を前記カタログ情報から抽出し、前記生成された構成変更方法の候補と置き換え、前記近似のインスタンス構成をユーザに提供することを特徴とする管理計算機。
  2. 請求項において、
    前記性能競合判定処理の結果、前記構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合していると判定された場合、前記候補生成処理において、前記プロセッサは、前記対象物理サーバとは異なる物理サーバへの移行を移行先候補として検討し、移行先の物理サーバにおけるインスタンスを前記構成変更方法として生成することを特徴とする管理計算機。
  3. 請求項において、
    前記記憶デバイスは、インスタンスの移行先として不適切である示す移行不適合条件を格納し、
    前記候補生成処理において、前記プロセッサは、前記移行先候補の物理サーバが前記移行不適合条件に合致せず、かつインスタンスを生成する十分なリソースを有するか否かを判定する移行条件照会処理を実行し、前記移行先候補の物理サーバが前記移行不適合条件に合致する場合には、当該移行先候補の物理サーバを候補から外すことを特徴とする管理計算機。
  4. 請求項において、
    前記移行条件照会処理の結果、前記移行先候補の物理サーバが前記移行不適合条件に合致せず、かつ十分なリソースを有すると判定された場合、前記プロセッサは、さらに、
    前記移行先候補の物理サーバに他のインスタンスが既に設定されているか否か判定する既存インスタンス判定処理と、
    既存インスタンスが前記移行候補の物理サーバにあると判定された場合に、当該既存インスタンスと前記構成変更対象のインスタンスの負荷傾向が競合するか判定する負荷傾向判定処理と、
    を実行し、前記移行先候補を生成することを特徴とする管理計算機。
  5. 請求項において、
    前記既存インスタンス判定処理の結果、前記既存インスタンスが前記移行先候補の物理サーバにないと判定された場合、或いは、前記負荷傾向判定処理の結果、前記既存インスタンスと前記構成変更対象のインスタンスとの負荷傾向が競合しないと判定された場合、前記プロセッサは、当該移行先候補の物理サーバへの移行を前記構成変更方法の候補とすることを特徴とする管理計算機。
  6. 請求項において、
    前記構成変更対象のインスタンスは、仮想インスタンスであり、
    前記性能競合判定処理の結果、前記構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合していないと判定された場合、前記プロセッサは、さらに、前記対象物理サーバにおいて、前記インスタンスの構成変更が可能か否か判定する構成変更判定処理を実行し、
    前記プロセッサは、前記構成変更判定処理の結果、構成変更が可能であると判定された場合、前記候補生成処理において、前記対象物理サーバ上で構成変更して得られるインスタンスの構成変更方法を候補として生成することを特徴とする管理計算機。
  7. 請求項において、
    前記記憶デバイスは、所定のパラメータが所定の条件を満足する場合に実行される移行方法と当該移行方法の実行条件とによって構成される、複数セットの移行実行情報を格納し、
    前記プロセッサは、さらに、前記ユーザによって前記生成された構成変更方法の候補が選択されると、前記複数セットの移行実行情報から、前記選択された候補のパラメータが満足する前記移行方法、及び当該移行方法の実行条件を抽出し、前記抽出された移行方法を前記抽出された実行条件に従って実行することを特徴とする管理計算機。
  8. 複数の物理サーバと、少なくとも1つのストレージ装置と、少なくとも1つのクライアント計算機と、請求項の管理計算機と、を有し、
    前記管理計算機は、前記生成された構成変更方法の候補の情報を前記クライアント計算機に送信し、
    前記クライアント計算機は、前記構成変更方法の候補を表示装置に表示することを特徴とする計算機システム。
  9. 請求項において、
    前記クライアント計算機で表示される構成変更方法の候補の情報は、仮想インスタンスから物理インスタンスへの変更、同一物理サーバにおける仮想リソースの構成変更、及び他の物理サーバへの仮想インスタンスの移行の何れの変更形態であるかを示すインスタンスの変更種別情報と、リソースの安定性を示す情報と、変更に要する時間の情報と、変更に要するコストの情報と、を含むことを特徴とする計算機システム。
  10. 複数の物理サーバと、少なくとも1つのストレージ装置と、それらを管理する管理計算機と、を有する計算機システムにおいて、前記物理サーバ上に設定されたインスタンスを管理するインスタンス管理方法であって、
    少なくとも1つの物理サーバは、仮想化機構を有し、当該物理サーバのリソースを分割してインスタンスに割り当て、仮想インスタンスとして機能させる、第1種サーバであり、
    前記第1種物理サーバ以外の少なくとも1つの物理サーバは、当該物理サーバのリソースの全てをインスタンスに割り当て、物理インスタンスとして機能させる、第2種サーバであり、
    前記管理計算機は、推奨される複数のインスタンス構成を含むカタログ情報を保持し、
    前記管理計算機が、前記物理サーバ及び前記ストレージ装置の性能情報と、前記物理サーバ上のインスタンスの構成情報と、を取得し、メモリに格納するステップと、
    前記管理計算機が、インスタンスの構成変更の要求を受信し、当該要求に応答して、前記メモリに格納されている前記性能情報を参照し、構成変更対象のインスタンスが設定されている対象物理サーバにおいて、当該構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合しているか判定する性能競合判定ステップと、
    前記管理計算機が、前記性能競合判定ステップの実行結果に基づいて、前記構成変更の対象のインスタンスの構成変更方法の候補を生成する候補生成ステップと、
    前記管理計算機が、前記生成された構成変更方法の候補として、仮想インスタンス、及び/又は物理インスタンスの構成をクライアント計算機に提供する候補提供ステップと、
    含み、
    前記候補生成ステップにおいて、前記管理計算機は、前記生成された構成変更方法の候補に近似のインスタンス構成を前記カタログ情報から抽出し、前記生成された構成変更方法の候補と置き換え、前記近似のインスタンス構成をユーザに提供することを特徴とするインスタンス管理方法。
  11. 請求項1において、
    前記性能競合判定ステップによる処理の結果、前記構成変更対象のインスタンスが他のインスタンスとの間で処理需要が競合していると判定された場合、前記候補生成ステップにおいて、前記管理計算機は、前記対象物理サーバとは異なる物理サーバへの移行を移行先候補として検討し、移行先の物理サーバにおけるインスタンスを前記構成変更方法として生成することを特徴とするインスタンス管理方法。
  12. 請求項1において、
    前記管理計算機は、インスタンスの移行先として不適切である示す移行不適合条件の情報を保持し、
    前記候補生成ステップにおいて、前記管理計算機は、前記移行先候補の物理サーバが前記移行不適合条件に合致せず、かつインスタンスを生成する十分なリソースを有するか否かを判定する移行条件照会処理を実行し、前記移行先候補の物理サーバが前記移行不適合条件に合致する場合には、当該移行先候補の物理サーバを候補から外すことを特徴とするインスタンス管理方法。
JP2015507279A 2012-11-09 2012-11-09 管理計算機、計算機システム、及びインスタンス管理方法 Expired - Fee Related JP5951111B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/007203 WO2014073024A1 (en) 2012-11-09 2012-11-09 Management computer, computer system, and instance management method

Publications (2)

Publication Number Publication Date
JP2015524581A JP2015524581A (ja) 2015-08-24
JP5951111B2 true JP5951111B2 (ja) 2016-07-13

Family

ID=47295107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015507279A Expired - Fee Related JP5951111B2 (ja) 2012-11-09 2012-11-09 管理計算機、計算機システム、及びインスタンス管理方法

Country Status (3)

Country Link
US (1) US20150236977A1 (ja)
JP (1) JP5951111B2 (ja)
WO (1) WO2014073024A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9960983B2 (en) * 2013-05-27 2018-05-01 Hitachi, Ltd. Monitoring item selection method and device, and storage medium
US9929918B2 (en) * 2013-07-29 2018-03-27 Alcatel Lucent Profile-based SLA guarantees under workload migration in a distributed cloud
US9503387B2 (en) * 2013-08-21 2016-11-22 Cisco Technology, Inc. Instantiating incompatible virtual compute requests in a heterogeneous cloud environment
US10649796B2 (en) * 2014-06-27 2020-05-12 Amazon Technologies, Inc. Rolling resource credits for scheduling of virtual computer resources
JP6293683B2 (ja) * 2015-01-27 2018-03-14 株式会社日立製作所 計算機システム及び計算機システムの性能障害の対処方法
US10715460B2 (en) * 2015-03-09 2020-07-14 Amazon Technologies, Inc. Opportunistic resource migration to optimize resource placement
US10721181B1 (en) * 2015-03-10 2020-07-21 Amazon Technologies, Inc. Network locality-based throttling for automated resource migration
US11336519B1 (en) * 2015-03-10 2022-05-17 Amazon Technologies, Inc. Evaluating placement configurations for distributed resource placement
US10616134B1 (en) 2015-03-18 2020-04-07 Amazon Technologies, Inc. Prioritizing resource hosts for resource placement
US9658785B2 (en) * 2015-03-25 2017-05-23 Amazon Technologies, Inc. Dynamic configuration of data volumes
US9740413B1 (en) * 2015-03-30 2017-08-22 EMC IP Holding Company LLC Migrating data using multiple assets
JP6438144B2 (ja) * 2015-08-18 2018-12-12 日本電信電話株式会社 リソース構成システム、リソース構成方法及びリソース構成プログラム
US10447757B2 (en) 2015-08-20 2019-10-15 International Business Machines Corporation Self-service server change management
US10511489B2 (en) * 2015-09-30 2019-12-17 Hitachi, Ltd. Storage operational management service providing apparatus, storage operational management service providing method, and storage operational management system
US9984031B2 (en) 2015-10-26 2018-05-29 International Business Machines Corporation Adapter selection based on a queue time factor
WO2017109890A1 (ja) * 2015-12-24 2017-06-29 株式会社日立製作所 管理計算機及びバッチ処理の実行方法
US10812408B1 (en) * 2016-03-25 2020-10-20 Amazon Technologies, Inc. Preventing concentrated selection of resource hosts for placing resources
US10742498B2 (en) 2016-06-22 2020-08-11 Amazon Technologies, Inc. Application migration system
WO2018029767A1 (ja) * 2016-08-09 2018-02-15 株式会社日立製作所 管理方法および管理計算機
CN106878389B (zh) * 2017-01-04 2020-02-07 北京百度网讯科技有限公司 用于在云系统中进行资源调度的方法和装置
JP7221585B2 (ja) * 2017-07-20 2023-02-14 富士通株式会社 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
US10496429B2 (en) 2017-07-20 2019-12-03 Vmware, Inc. Managing virtual computing instances and physical servers
WO2019031783A1 (en) 2017-08-09 2019-02-14 Samsung Electronics Co., Ltd. ON-DEMAND FUNCTION SUPPLY SYSTEM (FAAS), AND METHOD OF OPERATING THE SYSTEM
KR102120868B1 (ko) * 2017-08-09 2020-06-09 삼성전자주식회사 서비스형 함수(FaaS)를 제공하는 시스템 및 그 동작방법
US10776173B1 (en) 2018-04-30 2020-09-15 Amazon Technologies, Inc. Local placement of resource instances in a distributed system
US11121981B1 (en) 2018-06-29 2021-09-14 Amazon Technologies, Inc. Optimistically granting permission to host computing resources
JP7290997B2 (ja) * 2019-05-30 2023-06-14 株式会社日立製作所 クラウド利用支援装置、及びクラウド利用支援方法
CN110351335B (zh) * 2019-06-06 2021-11-16 国网浙江省电力有限公司衢州供电公司 一种云计算用通信效率与服务平衡方法
US11474827B1 (en) * 2019-08-20 2022-10-18 Amazon Technologies, Inc. Reboot migration between bare-metal servers
JP7304239B2 (ja) * 2019-08-27 2023-07-06 株式会社日立製作所 リソース構成変更計画立案システムおよびリソース構成変更計画立案方法
JP6960491B2 (ja) * 2020-03-04 2021-11-05 株式会社日立製作所 管理システム及び基盤システムの管理方法
JP2021193504A (ja) * 2020-06-08 2021-12-23 富士通株式会社 リソース管理装置およびリソース管理プログラム
JP7126534B2 (ja) * 2020-09-29 2022-08-26 株式会社日立製作所 計算機システム、リソース再割当方法
US20220138008A1 (en) * 2020-11-04 2022-05-05 Vmware, Inc. Methods and apparatus to manage resources in a hybrid workload domain
US20230153007A1 (en) 2021-11-15 2023-05-18 Hitachi, Ltd. Information processing system and method
CN114615340B (zh) * 2022-03-08 2023-10-20 抖音视界有限公司 一种请求处理方法、装置、计算机设备和存储装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3265540B2 (ja) * 1994-04-05 2002-03-11 株式会社日立製作所 電子計算機システムの運転制御方式
US7769720B2 (en) * 2004-06-16 2010-08-03 Hewlett-Packard Development Company, L.P. Systems and methods for migrating a server from one physical platform to a different physical platform
US20060143617A1 (en) * 2004-12-29 2006-06-29 Knauerhase Robert C Method, apparatus and system for dynamic allocation of virtual platform resources
US7725893B2 (en) * 2005-04-28 2010-05-25 Sap Aktiengesellschaft Platform independent replication
JP4609380B2 (ja) * 2006-05-31 2011-01-12 日本電気株式会社 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置
US7487383B2 (en) * 2006-06-29 2009-02-03 Dssdr, Llc Data transfer and recovery process
US8707383B2 (en) * 2006-08-16 2014-04-22 International Business Machines Corporation Computer workload management with security policy enforcement
JP4438807B2 (ja) * 2007-03-02 2010-03-24 日本電気株式会社 仮想マシンシステム、管理サーバ、仮想マシン移行方法及びプログラム
JP5229590B2 (ja) * 2007-09-18 2013-07-03 日本電気株式会社 サーバ組替支援システム、サーバ組替支援方法
JP2009145931A (ja) 2007-12-11 2009-07-02 Hitachi Ltd 仮想計算機と物理計算機との間のマイグレーション方法及びその計算機システム
JP2009252204A (ja) * 2008-04-11 2009-10-29 Hitachi Ltd 計算機の運用管理システム及び運用管理方法
JP2010113677A (ja) * 2008-11-10 2010-05-20 Hitachi Ltd サービス管理装置、サービス管理方法およびサービス管理システム
JP2011118525A (ja) 2009-12-01 2011-06-16 Hitachi Ltd サーバ管理装置とサーバ管理方法およびサーバ管理プログラム
US9311163B2 (en) * 2010-01-08 2016-04-12 Nec Corporation Configuration data management system, and configuration data management method
US9612855B2 (en) * 2011-01-10 2017-04-04 International Business Machines Corporation Virtual machine migration based on the consent by the second virtual machine running of the target host
JP5767480B2 (ja) * 2011-01-31 2015-08-19 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理システム、配置構成決定方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2015524581A (ja) 2015-08-24
WO2014073024A1 (en) 2014-05-15
US20150236977A1 (en) 2015-08-20

Similar Documents

Publication Publication Date Title
JP5951111B2 (ja) 管理計算機、計算機システム、及びインスタンス管理方法
JP5400482B2 (ja) 管理計算機、リソース管理方法、リソース管理プログラム、記録媒体および情報処理システム
US9304803B2 (en) Cooperative application workload scheduling for a consolidated virtual environment
US9432256B2 (en) Resource management method and resource management system
US9495195B2 (en) Resource migration between virtual containers based on utilization rate and performance degradation
JP4377369B2 (ja) リソース割当調停装置およびリソース割当調停方法
US8266254B2 (en) Allocating resources in a distributed computing environment
US9183016B2 (en) Adaptive task scheduling of Hadoop in a virtualized environment
US11200526B2 (en) Methods and systems to optimize server utilization for a virtual data center
US8140817B2 (en) Dynamic logical partition management for NUMA machines and clusters
US9396026B2 (en) Allocating a task to a computer based on determined resources
US9104453B2 (en) Determining placement fitness for partitions under a hypervisor
US20180189109A1 (en) Management system and management method for computer system
EP3425883A1 (en) Load balancing of resources
US20120047346A1 (en) Tiered storage pool management and control for loosely coupled multiple storage environment
US20070016907A1 (en) Method, system and computer program for automatic provisioning of resources to scheduled jobs
US10248460B2 (en) Storage management computer
CN109684074A (zh) 物理机资源分配方法及终端设备
JP2021026659A (ja) ストレージシステム及びリソース割当て制御方法
US9940073B1 (en) Method and apparatus for automated selection of a storage group for storage tiering
CN104054060A (zh) 存储供给协商
KR20140118030A (ko) 클라우드 컴퓨팅 환경의 계층형 부하분산 구조에서 자원 거래 관리 장치 및 방법
US11016816B1 (en) Compute capacity allocation based on multi-factor analysis
Saif et al. CSO-ILB: chicken swarm optimized inter-cloud load balancer for elastic containerized multi-cloud environment
JP7304239B2 (ja) リソース構成変更計画立案システムおよびリソース構成変更計画立案方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160607

R151 Written notification of patent or utility model registration

Ref document number: 5951111

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees