JP5732893B2 - リソース管理装置 - Google Patents

リソース管理装置 Download PDF

Info

Publication number
JP5732893B2
JP5732893B2 JP2011031746A JP2011031746A JP5732893B2 JP 5732893 B2 JP5732893 B2 JP 5732893B2 JP 2011031746 A JP2011031746 A JP 2011031746A JP 2011031746 A JP2011031746 A JP 2011031746A JP 5732893 B2 JP5732893 B2 JP 5732893B2
Authority
JP
Japan
Prior art keywords
resource
server
resources
configuration
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011031746A
Other languages
English (en)
Other versions
JP2012173751A (ja
Inventor
靖司 小林
靖司 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011031746A priority Critical patent/JP5732893B2/ja
Publication of JP2012173751A publication Critical patent/JP2012173751A/ja
Application granted granted Critical
Publication of JP5732893B2 publication Critical patent/JP5732893B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、リソース管理装置に関する。
近年、大規模な情報処理システムとして、顧客のサーバ装置等を管理する大規模なデータセンタ(リソース共用管理センタシステム)等においては、データセンタ側のサーバ装置を含む様々な種類のデータセンタ側のリソースを一括集中管理させ、顧客側のサーバ装置等で構成される複数のシステムに対しては、これらのデータセンタ側のリソースを共有リソースとして共用させるリソース共有型情報処理システムが普及しつつある。
ここで、データセンタ側のリソースとは、データセンタ側のサーバ装置を構成するCPU機器、メモリ機器、ディスク機器、及びネットワーク機器(インタフェースを含む)等のことであるが、これらの機器群で構成されるデータセンタ側のサーバ機器自体も該リソースの範疇に含まれるものとする。
従って、顧客側のサーバ装置等を管理する大規模なデータセンタ等では、これら複数のリソースを有しており、これにより、顧客側のサーバ装置等を含めて構成される複数のシステムを運行していることになる。
なお、これらの複数のシステムを構成するデータセンタ側のサーバ群の中には、可用性の技術を応用してシステムの継続使用可能なクラスタ構成(可用性の用語としてホットスタンバイ、コールドスタンバイ)を備えたものも開発されている。この場合、該クラスタを構成するサーバ装置の一部のリソースが故障すると、該故障したリソースを構成するサーバ装置をシステムから切り離して修理することが必要な場合も生じるので、この解決も本発明に際しての課題の1つであった。
また、このように、データセンタ側では、システムから切り離されたサーバ装置等を手動で管理する必要も生じるので、この解決も本発明に際しての課題の1つであった。
また、データセンタ側で稼働中のサーバ装置等に代わるリソースを、代替サーバ装置等としてデータセンタ側で予めプーリングしておき、障害発生時には該稼働中のサーバ装置等をシステムから切り離すと共に、この代替サーバ装置等をリアルタイムで補充して稼働させる必要が生じる。従って、このような技術を提供することも本発明に際しての課題の1つであった。
さらに、データセンタ管理者から、新しいサーバ装置等の構成要求が出された際に備えて、該新しいサーバ装置等の構成要件に対応できるリソースを一括管理の下で予めプーリングしておき、新しいサーバ装置等の構成要求が出された際には、該構成要件にあったサーバ装置等を結線まで含めて自動で実装することも、本発明に際しての課題の1つであった。
この分野の公知技術として、例えば、特許文献1には、高可用性クラスタ・ネットワーク構成中の資源グループを定義する「自動」機構を提供する技術が開示されている。具体的には、管理者は、所与のアプリケーションをその時に実行しているコンピュータで故障が発生した場合に、単に、そのアプリケーションと並置しなければならない資源のセットを識別するだけで良い。この場合、資源グループが、1組のコロケーション「制約」または規則を使用して自動的に生成する。第1のコロケーション制約は、所与のアプリケーションについて任意のユーザ定義コロケーションを実施することが好ましいとしており、第2の制約は、同一の物理ディスク上に常駐するディスク区画資源を並置するものとしている。
また、例えば、特許文献2には、管理者が、ノード毎のリソース使用状況を把握して管理することを可能とし、クラスタ構成の記憶システムの管理コストの削減を図る技術を開示している。具体的には、管理サーバは、各ノードのデータ物理位置情報を統合して有し、クラスタ構成記憶システムの構成及び各ノードの構成と関連付けて提示する手段を備える。ノードは、処理に際し使用するリソースの量や負荷を取得する手段を備え、管理サーバは、各リソースの使用状況を各サーバから収集して集計する手段と、リソース使用状況と前記データ情報と前記構成情報とを関連付けて、階層を設けて提示する手段を備える。さらに、論理ボリュームをノード間においてホストコンピュータには透過に移動する手段を備える。管理サーバは、情報表示により移動元データと移動先物理位置との選択を支援する手段と、前記移動の指示を受領し、前記クラスタ構成記憶システムに移動を指示する手段を備えるものとしている。
また、例えば、特許文献3には、ネットワークにより接続されたサーバ、ストレージ及びネットワーク装置から構成される自律制御システムで、制御要件(ポリシー)に応じて柔軟な自律制御を行う技術を開示している。具体的には、ポリシーDBなどに各種ポリシーを記憶し、システムを構成する各ノードが他のノードと連携すると共に、ポリシーに基づいて自律制御を行う。また、予備のリソースを共有プール、ベアメタルプール及びスタンバイプールを用いて管理し、障害時や性能劣化時にワークグループシステムリソースマネジャがスタンバイプール、ベアメタルプールの順に予備のリソースを選択するものとしている。
また、例えば、特許文献4には、既に他の情報処理システムが稼動中である場合にも影響を与えないリソースを求め、業務サービスの継続的な実行と共有リソースを有効活用できる手段を開示している。具体的には、業務アプリケーション毎に、各業務アプリケーションを実行するコンピュータシステムを識別する情報、及び各コンピュータシステムを構成するリソースの利用率を含むリソース利用率情報を格納した記憶部と、業務アプリケーションが、新たにコンピュータシステムのリソースの使用を要求する場合に、リソース利用率情報を用いて、変更後の当該コンピュータシステムを構成する各リソースの利用率を集計して出力する影響範囲調査部と、を備えるリソース管理システムである。
さらに、例えば、特許文献5には、ソフトウェア・リソースを動的に提供する技術を開示している。具体的には、オペレーティング・システム、アプリケーション・プログラム、及びソフトウェア・ドライバといったソフトウェア・リソースを動的に提供する技術である。
特開2001−109639号公報 特開2003−296039号公報 特開2005−346204号公報 特開2008−033852号公報 特表2008−502967号公報
ところで、上記背景技術で述べた従来の共用リソース管理システムにおいては、前述のとおり、顧客のサーバ等を含めて構築される複数のシステムを管理する大規模なデータセンタ等に前記の複数のリソースを備えて管理する構成をとっている。また、各システムを構成するデータセンタ側のサーバ群の中には、可用性の技術を応用したクラスタ構成を有するものも存在する。
また、前述のとおり、このクラスタ構成を成すサーバの一部のリソースが故障した際には、故障したリソースで構成されるサーバをシステムから切り離して手動で管理し、場合によっては修理する必要も有るが、従来のリソース共有型情報処理システムステムでは、このような管理や修理の実施に対応できていないという問題点が有る。
また、データセンタ側では、稼働中のサーバ装置等に代わるリソースを、代替サーバ装置等として予めプーリングしておき、障害発生時等には該稼働中のサーバ装置等をシステムから切り離すと共に、この代替サーバ装置等をリアルタイムで補充して稼働させる必要が生じる。しかしながら、従来のリソース共有型情報処理システムでは、このような代替サーバ装置を事前にプーリングしておいて、該装置を障害発生時等に補充することまでは考慮されていないという問題点が有る。
さらに、従来のリソース共有型情報処理システムステムでは、一括管理の下で予めプーリングしていたリソースの内から、データセンタの管理者が具体的に要求する新しいシステム(サーバ装置等)の構成要件に合致したリソースを摘出すると共に、該リソースを障害発生時等に補充することまでは考慮されていないという問題点が有る。
よって、本発明に際しては、システムを構成するリソースに障害が発生した場合にも、サービスの提供を中止しなくても済むシステム(即ち、より可用性が重視されたシステム)を構築することが重点的な課題であった。
ちなみに、近年、仮想環境等を実現する技術は、物理機器の保守費や運用費の削減する必要や、技術的な観点により、急速に進展しており、このため、機器等の物理的なリソースを有効利用することや、オペレータの作業を簡易化すること等により、システム管理費用の削減や運用費の削減を図ることが重要課題となってきている。
また、仮想技術に対する技術の複雑化を緩和するための可視化技術を取り入れることにより、システム環境のリソース全体の稼働率を高めることや、センタ運用管理者の作業軽減を提供することも重要課題となってきている。
なお、特許文献1に記載の技術は、所与のアプリケーションを実行するコンピュータに故障が発生した場合に、該アプリケーションと並置すべきリソースのセットを管理者が識別するだけで、後は、資源グループが、1組のコロケーション「制約」または規則を使用して自動的に生成するものであり、本発明のように、障害情報まで収集して、障害が発生したリソースの機能を他のリソースに割り振って代替させたり、障害が発生したリソースであっても、該リソースを構成する機器の内、他のシステムの構成が可能な機器については、できるだけ該機器を活用しようとするものではない。
また、特許文献2に記載の技術は、クラスタ構成の記憶システムの管理コストの削減を図ることに限定されており、よって、リソースとしては記憶システムだけが意識されており、本発明のように、サーバや、該サーバを構成するCPU装置、メモリ装置、ディスク装置、ネットワーク機器(インターフェースを含む)までをリソースとして見なして扱うものではない。
また、特許文献3に記載の技術は、Front 層、Web 層、AP層、DB層といった層により、サービスのポリシーを定義し、各層での障害時の層毎のポリシーによってサーバ群の増設や切換えを実施するものである。しかし、本発明では、 Web層、AP層等の上位のサーバがそこで何を動かしているかを意識しない。即ち、本発明では、層を意識していないため、層のサービスといったものではなく、ハードウェアレベルのリソース(例えば、CPU装置、メモリ装置、ディスク装置、ネットワーク機器(インターフェースを含む))をシステムの構成要素としている。
また、特許文献4に記載の技術は、業務アプリケーションを業務構成オブジェクトとする定義を行っているが、本発明では、業務構成オブジェクトとリソースのプーリングとは結び付けていない。さらに、本発明では、障害発生時の迅速な代替リソースの提供を特徴としているが、構成要件の障害対策・復旧機能は、各サブシステムに任せ、管理サーバは各サブシステムの構成及びプーリングされたリソースの管理とを分けて管理している。
さらに、特許文献5に記載の技術は、主としてソフトウェア面での対策であり、特に、オペレーティング・システム、アプリケーション・プログラム、及びソフトウェア・ドライバの動的な提供をするものである。従って、本発明の課題であったハードリソースを柔軟に動的に構成変更して提供するという課題を解決するものではない。
即ち、本発明は、他のシステム群とでリソースを共有し、障害時等の場合に自動的にリソースを変更する手段において、集中管理センタ(管理サーバ)が障害の起きたリソースの状態情報を収集し、顧客(センタ管理者)が要求する他のシステムの業務カタログ(構成カタログ、要件)に対し、予め統合的に管理されているリソースの蓄積(プーリング)情報と照合し、代替が可能なリソースが有る場合は、該リソースを組み込んで前記顧客が要求する他のシステムを構築することを骨子としている。
本発明の目的は、上述した課題を解決するリソース管理装置を提供することにある。
上記課題を解決するために、本発明の第1の形態と、リソース管理装置であって、複数のリソースの状態情報及び障害情報を収集する収集部と、収集部が収集した状態情報及び障害情報を格納する第1格納部と、要求されるシステムのリソースの構成要件が記載されたカタログ情報を格納する第2格納部と、リソースの組み替え処理及び実装処理を行う処理部とを備え、複数のリソースのうちのクラスタ構成にある現用系の第1リソースに障害が発生したときには、当該第1リソースにて実現されていた第1機能を、複数のリソースのうちのクラスタ構成にない第2リソースに移管してもよいことが、第2格納部に格納されているカタログ情報に記載されている場合、処理部は、第1格納部に格納されている情報を参照して、第2リソースが動作可能であるか否かを検証し、第2リソースが動作可能であれば、第1機能を第2リソースに移管すべく、各リソースの組み替え処理及び実装処理を行う
以上説明したように、本発明によれば、リソースを予め統合的に管理・蓄積(プーリング)しておき、ネットワークを介して構成される複数のシステムに共有されるリソースの一部に障害が発生した場合に、システム管理者によって要求される新しいサーバ要件と、該管理・蓄積情報とを照合し、代替が可能なリソースが有る場合は、該リソースを使用してシステムを再構成すると共に、該システムに対応するサーバ装置等のハードウェアを、配線まで含めて実装することができるので、共用リソースを配備する情報処理センタの可用性を向上させることができる。
本発明の実施形態に係る共用リソース管理システムの全体構成を示す構成図である。 本発明の実施形態の共用リソース管理システムで、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生したことを示す説明図である。 サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合の動作例を示す説明図である。 サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合の、他の動作例を示す説明図である。 本発明の実施形態に係る共用リソース管理システムの動作順序の1例を示すシーケンス図である。
本発明の共用リソース管理システムは、顧客側のサーバ装置等を管理する大規模なデータセンタ等において、前記顧客側のサーバ装置等を含めて構成される複数のシステムに対して、該システムを構成するデータセンタ側配備のリソースの状態を管理して共用できるようにすることを特徴とする。
ここで、データセンタ側配備のリソースとは、システムを構築するために充当されるハードウェア資源のことであり、例えば、データセンタ側のサーバ装置を構成するCPU機器、メモリ機器、ディスク機器、及びネットワーク機器(ネットワークとのインタフェース機能を担う)のことである。但し、本発明では、前記の機器群で構成されるサーバ装置自体も前記リソースの範疇に入るものと見なしている。
また、本発明は、現在使用されていないリソースも含めてプーリングしておき、一括管理することを特徴とする。
ここで、プーリングとは、リソースの一定数を保持することを意味するものとする。
さらに、本発明は、前記プーリングされたリソースを使用して、データセンタの管理者が要求する新しいサーバ装置等の構成要件に合致したシステムを構成し、該システムの構成を自動で構築する(結線等を含めてハードウェアとして実装する)機能を具備することを特徴とする。
本発明では、様々なリソースを使用して、所与のシステム構成を有するシステムのハードウェアを構築するが、該リソースの中には運用上の都合や、構成上の都合、または障害発生に起因して、使用されずに置き去りにされるリソースも存在していて良い。
本発明の共用リソース管理システムは、このようなリソースも含めて、全てのリソースの状態を管理し、プーリングされているリソースの内から、センタ管理者によって指定された新しいサーバ要件に適合するリソースを摘出し、該リソースが有効(動作可能か否かの検証も含む)と判断できれば、該リソースを使用するシステムを構成すると共に、該システムに対応するサーバ装置等のハードウェアを構築(即ち、結線まで含めて実装)することを特徴とする。
以下、本発明のリソース共用管理センタシステム及びリソース管理サーバ装置の実施形態について、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係る共用リソース管理システムの全体構成を示す構成図である。
同図において、本実施形態の共用リソース管理システムは、複数のリソースを管理するサーバ装置であるリソース管理サーバ100(本発明の実施形態に係るリソース管理サーバ装置)と、リソースとして提供されてプログラムを実行するサーバ装置であるサーバ1000〜5000と、を備える。
なお、サーバ5000は、現在、実際には稼動していないサーバ装置(計画段階のサーバ装置)であるものとする。
リソース管理サーバ100は、データを格納するデータベース110と、後述するリソース(ハードウェア資源)の状態情報及び障害情報を収集する機能を有する機能モジュール120と、リソースの組み替え及び実装を担う機能モジュール130と、センタ管理者が要求するシステムの構成要件をサーバ装置等の具体的なリソースを含めて記載した構成カタログ140と、を備える。
サーバ(1000〜5000)は、リソースの状態情報及び障害情報をリソース管理サーバ100に送出する機能を有する機能モジュール150を共通に備えるが、この他に、ネットワークとのインタフェース機能を担うネットワークI/F(1100〜5100)及びネットワークI/F(1200,3100,3200)と、ディスク記憶装置(符号は省略)等のリソースを備える。
なお、ここでは、リソース管理サーバ100にはネットワークI/Fを配備していないが、本発明では、一般に、リソース管理サーバ100にも、ネットワークI/Fを備えることが可能である。
一般に、サーバ(1000〜5000)は、ネットワークI/F(1100〜5100)や、ネットワークI/F(1200〜3200)が備える通信プロトコルにより、ネットワーク(インターネット網等)を介して、ユーザの情報処理装置と接続されている。
ここで、上記のリソースとは、システムを構築するのに必要なハードウェア資源一般を示すものであり、例えば、CPU装置、メモリ装置、内蔵ディスク装置、及びネットワークI/Fなどが範疇に含まれるものとする。
以下、図1を参照して、本実施形態の共用リソース管理システムの機能について説明する。
本発明に係る共用リソース管理システム(図1)は、顧客のサーバ等を管理する大規模なデータセンタ等に存在する複数のリソースを、1つのサーバで管理し、複数のシステム間で共用できるようにする。
即ち、クラスタ構成を有するサーバ装置のリソースの内、障害になった一部のサーバのリソースの状態情報、及び単一のサーバ装置で発生したリソースの障害状況を示す障害情報も、リアルタイムにリソースを管理するリソース管理サーバ100に通知する。
また、センタ管理者が要求するシステムの新しい構成要件に対し、統合的に管理されているリソースのプーリング情報を照合して該新しいシステムを構成すると共に、該システムを構成するハードウェアとしての実装を行う。
図1において、リソース管理サーバ100は、サーバ(1000〜5000)を含む前述の各リソースを管理し、該管理しているリソースを用いて構築されているシステムの構成を変更する機能を有するサーバ装置である。
このソースを管理するリソース管理サーバ100は、前述のとおり、データを格納するデータベース110と、リソースの状態情報及び障害情報を収集する機能を有する機能モジュール120と、リソースの組み替え及び実装を担う機能モジュール130と、から構成される。
ここでは、データベース110が格納するデータを、前記リソースの状態情報及び障害情報と、センタ管理者が要求するシステムの構成要件をサーバ装置等のリソースでもって記載した構成カタログ140との2種類としている。しかし、本発明では、一般に、前記リソースの状態情報及び障害情報と、構成カタログ140とは、それぞれ異なるデータベースに格納することも可能である。
なお、構成カタログ140とは、各システムが必要とするリソース(即ち、システムの構築に必要なリソースの名称及び結線)が掲載されている構成カタログのことであり、センタ管理者は、適当な入力手段により、その内容を更新することができる。
機能モジュール150は、リソース管理サーバ100の管理下の各サーバを構成している各リソースの状態情報及び障害情報を機能モジュール120に通知する。
機能モジュール150は、この状態情報及び障害情報を、リソース管理サーバ100の管理下の各サーバ(即ち、サーバ(1000〜5000))を構成している各リソースから得る。
機能モジュール120は、機能モジュール150から通知された状態情報及び障害情報を収集し、データベース110に保存する。
機能モジュール130は、前記状態情報及び障害情報を参照しながら、リソース管理サーバ100の管理下の各サーバ装置、及び該各サーバ装置を構成しているリソースを組み替えて、構成カタログ140に要求されたシステムを構築するための計算を行うと共に、結線も含めて該システムを構成するハードウェアの実装を行う。
より具体的には、該システムを構成するサーバ装置、及び該サーバ装置を構成するために必要なリソース(例えば、CPU装置、メモリ装置、内蔵ディスク装置、及びネットワークI/F)を組み立てると共に、適切なドメインにネットワークケーブルの結線を行うものである。
また、内蔵ディスク装置等のディスク機器に対しては、必要とする機器類(例えば、コントローラ、エンクロージャ、キャッシュメモリ、ディスク等)と、管理ケーブル(ネットワーク)及びコントローラケーブル(Fibre Channel)との間の結線を行う。
さらに、ネットワーク機器に対しては、IP設定、ポート設定、及びVLAN設定を行うと共に、適切なドメインにネットワークケーブルの結線(接続)を行う。
以下、本実施形態の共用リソース管理システムの動作をケース毎に説明する。
図2は、本発明の実施形態の共用リソース管理システムで、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生したことを示す説明図である。
図2において、サーバ1000、サーバ2000、及びサーバ3000は、クラスタ構成であり、ネットワークI/F3100に障害が発生したことを示している。
この場合、サーバ3000上でのプログラムが動作不可能であるとクラスタが判断し、プログラムの実行をサーバ1000へ切換えることになる。
図3は、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合の動作例を示す説明図である。
ネットワークI/F3100に障害が発生した(図2)ので、サーバ1000、サーバ2000、及びサーバ3000のクラスタ構成から、サーバ3000が外され、単体のサーバ3000として起動する。
この状態と、ネットワークI/F3100の障害情報とを、機能モジュール150が収集し、状態・障害情報を収集する機能モジュール120に該情報を送出し、機能モジュール120は、データベース110に該情報を格納する。
他方、一般ユーザの要求に基づいてセンタ管理者が、新しいシステムを構成するために必要な構成要件(一般にはサーバ装置を含む)を作成し、データベース110の構成カタログ140に新規登録する。
機能モジュール130は、データベース110に格納されている構成カタログ140が更新されたことにより、新しいシステムを構成するために、自己が管理しているリソースを再計算する。
より具体的には、データベース110が格納する状態・障害情報を参照しながら、構成カタログ140に記載された新しいシステムを構成する複数のリソース(サーバ装置を含む)の各々について、現在、障害を持たずに動作可能であるか否かを再検証する。
図3に示すケースでは、前記新しいシステムの構成要求を満たすリソースが、構成カタログ140の内で、サーバ1000として存在している。
よって、機能モジュール130は、サーバ1000でもって、前記新しいシステムを構成し、結線まで含めたハードウェアの実装を行う。
図4は、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合の、他の動作例を示す説明図である。このケースでも、図3のケースと同様に、ネットワークI/F3100に障害が発生しているケースであるが、機能モジュール130は、ネットワークI/F3200を介して実現されていたシステム機能については、サーバ000に移管せずに、カタログ構成要件に合致したサーバ5000に移すものである。これにより、システム機能が分散できるので、負荷の集中が緩和される効果が得られる。
この場合、機能モジュール130は、サーバ3000が担っていたシステム機能の内、ネットワークI/F3100を介して実現されていたシステム機能のみをサーバ000に担わせるように結線まで含めたハードウェアの実装を行うと共に、ネットワークI/F3200を介して実現されていたシステム機能については、新たにサーバ5000を充当して該機能を担わせるシステムを構成し、同じく結線まで含めたハードウェアの実装を行う。この新しく構築されたサーバ5000のリソースの状況情報についても、機能モジュール150から機能モジュール120に通知され、機能モジュール120は、該情報をリソースデータベース110に登録する。
図5は、本発明の実施形態に係る共用リソース管理システムの動作順序の1例を示すシーケンス図である。
同図において、サーバ1000、サーバ2000、及びサーバ3000は、クラスタ構成を成すサーバ装置群であるものとする。但し、サーバ1000は待機系のサーバ装置であり、サーバ2000及びサーバ3000は、現用系のサーバ装置とする。
また、サーバ5000は、シングルサーバ装置であるものとする。
機能モジュール120は、リソース管理サーバ100の制御下において、前記サーバ装置群を構成する各サーバ、及び該サーバを構成しているリソースから、機能モジュール150を介して通知される状態情報及び障害情報を収集し、データベース110に該情報を保存する。
ここでは、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合を説明する。
サーバ1000、サーバ2000、及びサーバ3000はクラスタ構成を成すサーバ装置群であるので、ネットワークI/F3100が障害になったことで、サーバ3000上でのプログラムが実行不可能になったとクラスタが判断し、サーバ1000へのプログラムの実行の切換えを行うことになる。
まず、タイミングT1で、ネットワークI/F3100に障害が発生したので、サーバ1000、サーバ2000、及びサーバ3000のクラスタ構成から、サーバ3000が外され、単体のサーバ装置であるサーバ3000として起動する。この状態を示す情報と、ネットワークI/F3100の障害情報とを、機能モジュール150が収集する。
タイミングT2で、機能モジュール150は、機能モジュール120に対して該状態・障害情報を送出する。
タイミングT3で、機能モジュール120は、該状態・障害情報をデータベース110に格納する。
その後、タイミングT4で、センタ管理者が、一般ユーザのシステム要求を継続するには新しいリソース(一般にはサーバ装置を含む)が必要となるため、該構成を示す新しい構成カタログをデータベース110に登録する(即ち構成カタログ140を更新する)。
タイミングT5では、データベース110の(構成カタログ140)の内容が更新されたので、機能モジュール130(リソース配備を計算する機能モジュール)が、データベース110の障害情報等を参照しながら、構成カタログ140に示されているリソースの内、動作可能で構成可能なリソースが有るか否かを検証する。
ここでは、構成カタログ140に掲載されたリソースの内、要求された新しいシステムを構成するためには、ネットワークI/F3100が使用不可能であるが、ネットワークI/F3200は使用可能であり、かつネットワークI/F3200を介して実現されていたシステム機能に対応するシステム構成は、障害発生前に、サーバ3000を含む構成においてプログラムの実行を可能にしていた構成カタログの条件とも一致するので、該カタログ構成の要件に合ったサーバ5000を実装可能なリソースと判断する。
この判断は、構成カタログに記載のリソースと、サーバ装置を含めて要求される新しいリソースの構成要件(CPU装置、メモリ装置、内蔵ディスク装置、及びネットワークI/F)を照合することで行われる。
CPU装置の場合、上記の実装可能か否かの判断要素となるのは、動作周波数と、コア数(リソース要求を満たすか否か)である。
また、メモリ装置の場合は、上記の実装可能か否かを判断する判断基準は、メモリ容量がリソース要件を満たすか否かである。
また、内蔵ディスク装置の場合は、上記の実装可能か否かを判断する判断要素は、ディスク容量と、RAID構成(リソース要件を満たすか否か)である。
さらに、ネットワークI/Fの場合は、上記の実装可能か否かを判断する判断要素は、転送レートと、ネットワークI/Fの数(リソース要件を満たすか否か)である。
なお、ネットワークケーブルの結線は手作業では行う必要がない。最初からネットワークI/Fに全て差し込まれており、データリンク層以上の接続で、 Switch のポートVLANと, タグ VLAN とを使用して行う。適切なドメインに接続を行えるか否かの判断は、リソース要件を満たすか否かによるものとする。
タイミングT6で、機能モジュール130は、サーバ5000を実装可能と判断し、構成カタログ140の新たな構成情報を基にして、前述の新たなリソースを構成し、サーバ5000を実装する。
ここで、「実装する」とは、実際にサーバに必要なCPU装置、メモリ装置、内蔵ディスク装置、ネットワークI/F等のリソースを物理的に動かすことなく、要求された新しいシステムに対応するハードウェアを、リソース間の結線の変更だけで再構成することであるものとする。
タイミングT7では、機能モジュール120が、新しく構築されたサーバ5000のリソース状態についても、機能モジュール150を介してリソース管理サーバ100に通知する。
タイミングT8では、機能モジュール120が、新しく構築されたサーバ5000のリソース状態についても、リソースデータベース110に登録する。
本発明の実施形態に係る共用リソース管理システムによれば、障害が起きたリソースの状態を収集し、リソースデータベース110にリソースの状態情報を蓄積するので、他のシステムの業務カタログで動作可能な業務が無いか否かをシステムで検証し、確認することができる効果が有る。
また、障害が起きたリソースが存在する場合は、予備等の他のシステムの一部のリソースに切り替えることで、該障害が起きたリソースで構成されるシステムの機能の一部を、該他のシステムの一部に自動で切り替えることができる効果が有る。
また、特に、複数のサーバ装置が現用で1つのサーバ装置が待機用であるクラスタ構成の場合には、システム切換えの条件として、本発明を適用することができる効果が有る。
また、PaaS(Platform as a Service)のように、ソフトウェアを構築し、かつ稼動させるための土台となるプラットフォームにも応用して、システム間でリソースを他のシステムと共有できる効果が得られる。
また、クラウド・コンピューティングシステムを運営する集中管理センタ(コンピュータやスイッチを設置するための専用のセンタ) においても、この発明を採用することにより、システム間でリソースを他のシステムと共有できる効果が有る。
さらに、グリッド・コンピューティングシステム(インターネットなどの広域のネットワーク上にある複数の計算資源(CPU装置などの計算機能や、ハードディスク装置などの情報格納領域)を結び付け、1つの複合したコンピュータシステムとしてのサービスを提供するシステム) においても、本発明を適用することにより、複数のコンピュータの計算モジュール間で、個々のリソースを共有できる効果が有る。
100 リソース管理サーバ(管理用)
110 データベース
120,130,150 機能モジュール
140 構成カタログ
1000〜5000 サーバ(リソース用)
1100〜5100 ネットワークI/F(インタフェース)
3100,3200 ネットワークI/F

Claims (2)

  1. 複数のリソースの状態情報及び障害情報を収集する収集部と、
    前記収集部が収集した状態情報及び障害情報を格納する第1格納部と、
    要求されるシステムのリソースの構成要件が記載されたカタログ情報を格納する第2格納部と、
    前記リソースの組み替え処理及び実装処理を行う処理部
    備え、
    前記複数のリソースのうちのクラスタ構成にある現用系の第1リソースに障害が発生したときには、当該第1リソースにて実現されていた第1機能を、前記複数のリソースのうちの前記クラスタ構成にない第2リソースに移管してもよいことが、前記第2格納部に格納されているカタログ情報に記載されている場合、前記処理部は、前記第1格納部に格納されている情報を参照して、前記第2リソースが動作可能であるか否かを検証し、前記第2リソースが動作可能であれば、前記第1機能を前記第2リソースに移管すべく、各リソースの組み替え処理及び実装処理を行う
    ことを特徴とするリソース管理装置
  2. 前記複数のリソースのうちのクラスタ構成にある現用系の第1リソースに障害が発生したときには、当該第1リソースにて実現されていた第1機能を、前記複数のリソースのうちの前記クラスタ構成にない第2リソースに移管してもよいことが、前記第2格納部に格納されているカタログ情報に記載されている場合、前記処理部は、前記第1格納部に格納されている情報を参照して、前記第2リソースが動作可能であるか否かを検証し、前記第2リソースが動作可能であれば、前記第1機能を前記第2リソースに移管すると共に、前記第1リソースにて実現されていた前記第1機能以外の機能を、前記複数のリソースのうちの前記クラスタ構成にある待機系の第3リソースに移管すべく、各リソースの組み替え処理及び実装処理を行う
    ことを特徴とする請求項1に記載のリソース管理装置。
JP2011031746A 2011-02-17 2011-02-17 リソース管理装置 Expired - Fee Related JP5732893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011031746A JP5732893B2 (ja) 2011-02-17 2011-02-17 リソース管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011031746A JP5732893B2 (ja) 2011-02-17 2011-02-17 リソース管理装置

Publications (2)

Publication Number Publication Date
JP2012173751A JP2012173751A (ja) 2012-09-10
JP5732893B2 true JP5732893B2 (ja) 2015-06-10

Family

ID=46976640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011031746A Expired - Fee Related JP5732893B2 (ja) 2011-02-17 2011-02-17 リソース管理装置

Country Status (1)

Country Link
JP (1) JP5732893B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016013199A1 (ja) * 2014-07-22 2016-01-28 日本電気株式会社 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラムが記録された記録媒体
JP6950437B2 (ja) 2017-10-10 2021-10-13 富士通株式会社 情報処理システム、情報処理装置及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5011073B2 (ja) * 2007-11-22 2012-08-29 株式会社日立製作所 サーバ切り替え方法、およびサーバシステム

Also Published As

Publication number Publication date
JP2012173751A (ja) 2012-09-10

Similar Documents

Publication Publication Date Title
US9999030B2 (en) Resource provisioning method
US8856319B1 (en) Event and state management in a scalable cloud computing environment
US8843624B2 (en) Computer cluster and method for providing a disaster recovery functionality for a computer cluster
Appleby et al. Oceano-SLA based management of a computing utility
US9059933B2 (en) Provisioning virtual private data centers
US8386610B2 (en) System and method for automatic storage load balancing in virtual server environments
KR101159377B1 (ko) 고성능 컴퓨팅 시스템 및 방법
JP5860320B2 (ja) 仮想マシン環境のためのクラスタシステム提供の方法及び装置
Moreno-Vozmediano et al. Orchestrating the deployment of high availability services on multi-zone and multi-cloud scenarios
US7971089B2 (en) Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool
US9053000B1 (en) Method and apparatus for event correlation based on causality equivalence
US20100115070A1 (en) Method for generating manipulation requests of an initialization and administration database of server cluster, data medium and corresponding a server cluster, data medium and corresponding service cluster
US20120117571A1 (en) Load balancer and firewall self-provisioning system
KR20150011250A (ko) 클라우드 센터 관리 방법 및 그 시스템
WO2014036717A1 (zh) 虚拟资源对象组件
US20030212898A1 (en) System and method for remotely monitoring and deploying virtual support services across multiple virtual lans (VLANS) within a data center
KR20070006906A (ko) Hpc 환경에서의 토폴로지-인식 작업 스케쥴링 및백필링을 위한 시스템 및 방법
CN103368768A (zh) 混合云环境中具有启发式监视的自动缩放网络覆盖
WO2015042185A1 (en) Fabric attached storage
US20140025909A1 (en) Large scale storage system
CN103475722A (zh) 一种业务协同平台实现系统
US8935570B2 (en) Automating infrastructure workflows as atomic transactions
JP5732893B2 (ja) リソース管理装置
WO2016151584A2 (en) Distributed large scale storage system
JP2019139533A (ja) 配置構成装置、および、配置構成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150330

R150 Certificate of patent or registration of utility model

Ref document number: 5732893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees