JP5732893B2 - リソース管理装置 - Google Patents
リソース管理装置 Download PDFInfo
- Publication number
- JP5732893B2 JP5732893B2 JP2011031746A JP2011031746A JP5732893B2 JP 5732893 B2 JP5732893 B2 JP 5732893B2 JP 2011031746 A JP2011031746 A JP 2011031746A JP 2011031746 A JP2011031746 A JP 2011031746A JP 5732893 B2 JP5732893 B2 JP 5732893B2
- Authority
- JP
- Japan
- Prior art keywords
- resource
- server
- resources
- configuration
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
ここで、データセンタ側のリソースとは、データセンタ側のサーバ装置を構成するCPU機器、メモリ機器、ディスク機器、及びネットワーク機器(インタフェースを含む)等のことであるが、これらの機器群で構成されるデータセンタ側のサーバ機器自体も該リソースの範疇に含まれるものとする。
なお、これらの複数のシステムを構成するデータセンタ側のサーバ群の中には、可用性の技術を応用してシステムの継続使用可能なクラスタ構成(可用性の用語としてホットスタンバイ、コールドスタンバイ)を備えたものも開発されている。この場合、該クラスタを構成するサーバ装置の一部のリソースが故障すると、該故障したリソースを構成するサーバ装置をシステムから切り離して修理することが必要な場合も生じるので、この解決も本発明に際しての課題の1つであった。
また、データセンタ側で稼働中のサーバ装置等に代わるリソースを、代替サーバ装置等としてデータセンタ側で予めプーリングしておき、障害発生時には該稼働中のサーバ装置等をシステムから切り離すと共に、この代替サーバ装置等をリアルタイムで補充して稼働させる必要が生じる。従って、このような技術を提供することも本発明に際しての課題の1つであった。
また、前述のとおり、このクラスタ構成を成すサーバの一部のリソースが故障した際には、故障したリソースで構成されるサーバをシステムから切り離して手動で管理し、場合によっては修理する必要も有るが、従来のリソース共有型情報処理システムステムでは、このような管理や修理の実施に対応できていないという問題点が有る。
よって、本発明に際しては、システムを構成するリソースに障害が発生した場合にも、サービスの提供を中止しなくても済むシステム(即ち、より可用性が重視されたシステム)を構築することが重点的な課題であった。
また、仮想技術に対する技術の複雑化を緩和するための可視化技術を取り入れることにより、システム環境のリソース全体の稼働率を高めることや、センタ運用管理者の作業軽減を提供することも重要課題となってきている。
ここで、データセンタ側配備のリソースとは、システムを構築するために充当されるハードウェア資源のことであり、例えば、データセンタ側のサーバ装置を構成するCPU機器、メモリ機器、ディスク機器、及びネットワーク機器(ネットワークとのインタフェース機能を担う)のことである。但し、本発明では、前記の機器群で構成されるサーバ装置自体も前記リソースの範疇に入るものと見なしている。
ここで、プーリングとは、リソースの一定数を保持することを意味するものとする。
さらに、本発明は、前記プーリングされたリソースを使用して、データセンタの管理者が要求する新しいサーバ装置等の構成要件に合致したシステムを構成し、該システムの構成を自動で構築する(結線等を含めてハードウェアとして実装する)機能を具備することを特徴とする。
本発明の共用リソース管理システムは、このようなリソースも含めて、全てのリソースの状態を管理し、プーリングされているリソースの内から、センタ管理者によって指定された新しいサーバ要件に適合するリソースを摘出し、該リソースが有効(動作可能か否かの検証も含む)と判断できれば、該リソースを使用するシステムを構成すると共に、該システムに対応するサーバ装置等のハードウェアを構築(即ち、結線まで含めて実装)することを特徴とする。
図1は、本発明の実施形態に係る共用リソース管理システムの全体構成を示す構成図である。
同図において、本実施形態の共用リソース管理システムは、複数のリソースを管理するサーバ装置であるリソース管理サーバ100(本発明の実施形態に係るリソース管理サーバ装置)と、リソースとして提供されてプログラムを実行するサーバ装置であるサーバ1000〜5000と、を備える。
なお、サーバ5000は、現在、実際には稼動していないサーバ装置(計画段階のサーバ装置)であるものとする。
一般に、サーバ(1000〜5000)は、ネットワークI/F(1100〜5100)や、ネットワークI/F(1200〜3200)が備える通信プロトコルにより、ネットワーク(インターネット網等)を介して、ユーザの情報処理装置と接続されている。
ここで、上記のリソースとは、システムを構築するのに必要なハードウェア資源一般を示すものであり、例えば、CPU装置、メモリ装置、内蔵ディスク装置、及びネットワークI/Fなどが範疇に含まれるものとする。
本発明に係る共用リソース管理システム(図1)は、顧客のサーバ等を管理する大規模なデータセンタ等に存在する複数のリソースを、1つのサーバで管理し、複数のシステム間で共用できるようにする。
即ち、クラスタ構成を有するサーバ装置のリソースの内、障害になった一部のサーバのリソースの状態情報、及び単一のサーバ装置で発生したリソースの障害状況を示す障害情報も、リアルタイムにリソースを管理するリソース管理サーバ100に通知する。
また、センタ管理者が要求するシステムの新しい構成要件に対し、統合的に管理されているリソースのプーリング情報を照合して該新しいシステムを構成すると共に、該システムを構成するハードウェアとしての実装を行う。
このソースを管理するリソース管理サーバ100は、前述のとおり、データを格納するデータベース110と、リソースの状態情報及び障害情報を収集する機能を有する機能モジュール120と、リソースの組み替え及び実装を担う機能モジュール130と、から構成される。
なお、構成カタログ140とは、各システムが必要とするリソース(即ち、システムの構築に必要なリソースの名称及び結線)が掲載されている構成カタログのことであり、センタ管理者は、適当な入力手段により、その内容を更新することができる。
機能モジュール150は、この状態情報及び障害情報を、リソース管理サーバ100の管理下の各サーバ(即ち、サーバ(1000〜5000))を構成している各リソースから得る。
機能モジュール120は、機能モジュール150から通知された状態情報及び障害情報を収集し、データベース110に保存する。
機能モジュール130は、前記状態情報及び障害情報を参照しながら、リソース管理サーバ100の管理下の各サーバ装置、及び該各サーバ装置を構成しているリソースを組み替えて、構成カタログ140に要求されたシステムを構築するための計算を行うと共に、結線も含めて該システムを構成するハードウェアの実装を行う。
また、内蔵ディスク装置等のディスク機器に対しては、必要とする機器類(例えば、コントローラ、エンクロージャ、キャッシュメモリ、ディスク等)と、管理ケーブル(ネットワーク)及びコントローラケーブル(Fibre Channel)との間の結線を行う。
さらに、ネットワーク機器に対しては、IP設定、ポート設定、及びVLAN設定を行うと共に、適切なドメインにネットワークケーブルの結線(接続)を行う。
図2は、本発明の実施形態の共用リソース管理システムで、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生したことを示す説明図である。
図2において、サーバ1000、サーバ2000、及びサーバ3000は、クラスタ構成であり、ネットワークI/F3100に障害が発生したことを示している。
この場合、サーバ3000上でのプログラムが動作不可能であるとクラスタが判断し、プログラムの実行をサーバ1000へ切換えることになる。
ネットワークI/F3100に障害が発生した(図2)ので、サーバ1000、サーバ2000、及びサーバ3000のクラスタ構成から、サーバ3000が外され、単体のサーバ3000として起動する。
この状態と、ネットワークI/F3100の障害情報とを、機能モジュール150が収集し、状態・障害情報を収集する機能モジュール120に該情報を送出し、機能モジュール120は、データベース110に該情報を格納する。
機能モジュール130は、データベース110に格納されている構成カタログ140が更新されたことにより、新しいシステムを構成するために、自己が管理しているリソースを再計算する。
より具体的には、データベース110が格納する状態・障害情報を参照しながら、構成カタログ140に記載された新しいシステムを構成する複数のリソース(サーバ装置を含む)の各々について、現在、障害を持たずに動作可能であるか否かを再検証する。
よって、機能モジュール130は、サーバ1000でもって、前記新しいシステムを構成し、結線まで含めたハードウェアの実装を行う。
同図において、サーバ1000、サーバ2000、及びサーバ3000は、クラスタ構成を成すサーバ装置群であるものとする。但し、サーバ1000は待機系のサーバ装置であり、サーバ2000及びサーバ3000は、現用系のサーバ装置とする。
また、サーバ5000は、シングルサーバ装置であるものとする。
ここでは、サーバ3000のリソースの一部であるネットワークI/F3100に障害が発生した場合を説明する。
サーバ1000、サーバ2000、及びサーバ3000はクラスタ構成を成すサーバ装置群であるので、ネットワークI/F3100が障害になったことで、サーバ3000上でのプログラムが実行不可能になったとクラスタが判断し、サーバ1000へのプログラムの実行の切換えを行うことになる。
タイミングT2で、機能モジュール150は、機能モジュール120に対して該状態・障害情報を送出する。
タイミングT3で、機能モジュール120は、該状態・障害情報をデータベース110に格納する。
タイミングT5では、データベース110の(構成カタログ140)の内容が更新されたので、機能モジュール130(リソース配備を計算する機能モジュール)が、データベース110の障害情報等を参照しながら、構成カタログ140に示されているリソースの内、動作可能で構成可能なリソースが有るか否かを検証する。
この判断は、構成カタログに記載のリソースと、サーバ装置を含めて要求される新しいリソースの構成要件(CPU装置、メモリ装置、内蔵ディスク装置、及びネットワークI/F)を照合することで行われる。
また、メモリ装置の場合は、上記の実装可能か否かを判断する判断基準は、メモリ容量がリソース要件を満たすか否かである。
また、内蔵ディスク装置の場合は、上記の実装可能か否かを判断する判断要素は、ディスク容量と、RAID構成(リソース要件を満たすか否か)である。
なお、ネットワークケーブルの結線は手作業では行う必要がない。最初からネットワークI/Fに全て差し込まれており、データリンク層以上の接続で、 Switch のポートVLANと, タグ VLAN とを使用して行う。適切なドメインに接続を行えるか否かの判断は、リソース要件を満たすか否かによるものとする。
ここで、「実装する」とは、実際にサーバに必要なCPU装置、メモリ装置、内蔵ディスク装置、ネットワークI/F等のリソースを物理的に動かすことなく、要求された新しいシステムに対応するハードウェアを、リソース間の結線の変更だけで再構成することであるものとする。
タイミングT8では、機能モジュール120が、新しく構築されたサーバ5000のリソース状態についても、リソースデータベース110に登録する。
また、障害が起きたリソースが存在する場合は、予備等の他のシステムの一部のリソースに切り替えることで、該障害が起きたリソースで構成されるシステムの機能の一部を、該他のシステムの一部に自動で切り替えることができる効果が有る。
また、特に、複数のサーバ装置が現用で1つのサーバ装置が待機用であるクラスタ構成の場合には、システム切換えの条件として、本発明を適用することができる効果が有る。
また、クラウド・コンピューティングシステムを運営する集中管理センタ(コンピュータやスイッチを設置するための専用のセンタ) においても、この発明を採用することにより、システム間でリソースを他のシステムと共有できる効果が有る。
110 データベース
120,130,150 機能モジュール
140 構成カタログ
1000〜5000 サーバ(リソース用)
1100〜5100 ネットワークI/F(インタフェース)
3100,3200 ネットワークI/F
Claims (2)
- 複数のリソースの状態情報及び障害情報を収集する収集部と、
前記収集部が収集した状態情報及び障害情報を格納する第1格納部と、
要求されるシステムのリソースの構成要件が記載されたカタログ情報を格納する第2格納部と、
前記リソースの組み替え処理及び実装処理を行う処理部と
を備え、
前記複数のリソースのうちのクラスタ構成にある現用系の第1リソースに障害が発生したときには、当該第1リソースにて実現されていた第1機能を、前記複数のリソースのうちの前記クラスタ構成にない第2リソースに移管してもよいことが、前記第2格納部に格納されているカタログ情報に記載されている場合、前記処理部は、前記第1格納部に格納されている情報を参照して、前記第2リソースが動作可能であるか否かを検証し、前記第2リソースが動作可能であれば、前記第1機能を前記第2リソースに移管すべく、各リソースの組み替え処理及び実装処理を行う
ことを特徴とするリソース管理装置。 - 前記複数のリソースのうちのクラスタ構成にある現用系の第1リソースに障害が発生したときには、当該第1リソースにて実現されていた第1機能を、前記複数のリソースのうちの前記クラスタ構成にない第2リソースに移管してもよいことが、前記第2格納部に格納されているカタログ情報に記載されている場合、前記処理部は、前記第1格納部に格納されている情報を参照して、前記第2リソースが動作可能であるか否かを検証し、前記第2リソースが動作可能であれば、前記第1機能を前記第2リソースに移管すると共に、前記第1リソースにて実現されていた前記第1機能以外の機能を、前記複数のリソースのうちの前記クラスタ構成にある待機系の第3リソースに移管すべく、各リソースの組み替え処理及び実装処理を行う
ことを特徴とする請求項1に記載のリソース管理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031746A JP5732893B2 (ja) | 2011-02-17 | 2011-02-17 | リソース管理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031746A JP5732893B2 (ja) | 2011-02-17 | 2011-02-17 | リソース管理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012173751A JP2012173751A (ja) | 2012-09-10 |
JP5732893B2 true JP5732893B2 (ja) | 2015-06-10 |
Family
ID=46976640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011031746A Expired - Fee Related JP5732893B2 (ja) | 2011-02-17 | 2011-02-17 | リソース管理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5732893B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016013199A1 (ja) * | 2014-07-22 | 2016-01-28 | 日本電気株式会社 | 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラムが記録された記録媒体 |
JP6950437B2 (ja) | 2017-10-10 | 2021-10-13 | 富士通株式会社 | 情報処理システム、情報処理装置及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5011073B2 (ja) * | 2007-11-22 | 2012-08-29 | 株式会社日立製作所 | サーバ切り替え方法、およびサーバシステム |
-
2011
- 2011-02-17 JP JP2011031746A patent/JP5732893B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012173751A (ja) | 2012-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9999030B2 (en) | Resource provisioning method | |
US8856319B1 (en) | Event and state management in a scalable cloud computing environment | |
US8843624B2 (en) | Computer cluster and method for providing a disaster recovery functionality for a computer cluster | |
Appleby et al. | Oceano-SLA based management of a computing utility | |
US9059933B2 (en) | Provisioning virtual private data centers | |
US8386610B2 (en) | System and method for automatic storage load balancing in virtual server environments | |
KR101159377B1 (ko) | 고성능 컴퓨팅 시스템 및 방법 | |
JP5860320B2 (ja) | 仮想マシン環境のためのクラスタシステム提供の方法及び装置 | |
Moreno-Vozmediano et al. | Orchestrating the deployment of high availability services on multi-zone and multi-cloud scenarios | |
US7971089B2 (en) | Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool | |
US9053000B1 (en) | Method and apparatus for event correlation based on causality equivalence | |
US20100115070A1 (en) | Method for generating manipulation requests of an initialization and administration database of server cluster, data medium and corresponding a server cluster, data medium and corresponding service cluster | |
US20120117571A1 (en) | Load balancer and firewall self-provisioning system | |
KR20150011250A (ko) | 클라우드 센터 관리 방법 및 그 시스템 | |
WO2014036717A1 (zh) | 虚拟资源对象组件 | |
US20030212898A1 (en) | System and method for remotely monitoring and deploying virtual support services across multiple virtual lans (VLANS) within a data center | |
KR20070006906A (ko) | Hpc 환경에서의 토폴로지-인식 작업 스케쥴링 및백필링을 위한 시스템 및 방법 | |
CN103368768A (zh) | 混合云环境中具有启发式监视的自动缩放网络覆盖 | |
WO2015042185A1 (en) | Fabric attached storage | |
US20140025909A1 (en) | Large scale storage system | |
CN103475722A (zh) | 一种业务协同平台实现系统 | |
US8935570B2 (en) | Automating infrastructure workflows as atomic transactions | |
JP5732893B2 (ja) | リソース管理装置 | |
WO2016151584A2 (en) | Distributed large scale storage system | |
JP2019139533A (ja) | 配置構成装置、および、配置構成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5732893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |