JP2012043445A - Operation handover method, computer system, and management server - Google Patents
Operation handover method, computer system, and management server Download PDFInfo
- Publication number
- JP2012043445A JP2012043445A JP2011202562A JP2011202562A JP2012043445A JP 2012043445 A JP2012043445 A JP 2012043445A JP 2011202562 A JP2011202562 A JP 2011202562A JP 2011202562 A JP2011202562 A JP 2011202562A JP 2012043445 A JP2012043445 A JP 2012043445A
- Authority
- JP
- Japan
- Prior art keywords
- server
- servers
- search
- active
- external disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、外部ディスク装置からブートするサーバから成る計算機システムにおけるフ
ェイルオーバ方法に関する。
The present invention relates to a failover method in a computer system including a server booted from an external disk device.
一般に、サーバは内蔵のディスク装置にインストールされたOSをブートする。この構成では、故障したサーバの業務を引き継ぐ場合、従来の方法として、サーバに内蔵するディスク装置に同じOSや業務アプリケーションを複数のサーバのディスクにインストールする冗長化構成を取っていた。この方法では、業務を実行中のサーバ(現用サーバ)が故障した場合、同じOSや業務アプリケーションがインストールされた別のサーバ(予備サーバ)が起動することで業務を引き継ぐことができる。しかし、この方法では、1台の現用サーバに対して、ペアとなる予備サーバが必要となるため、初期導入コストや初期構築工数が増大する。 In general, the server boots an OS installed in a built-in disk device. In this configuration, when taking over the business of a failed server, a redundant configuration is adopted in which the same OS and business application are installed on the disk of a plurality of servers as a conventional method. In this method, when a server that is executing a business (active server) fails, the business can be taken over by starting another server (spare server) in which the same OS or business application is installed. However, this method requires a pair of spare servers for one active server, which increases initial installation cost and initial construction man-hours.
上記に対して、サーバがディスク装置として外部のディスクアレイ装置を利用してブー
トする形態がある。この場合、ディスクアレイ装置は、ファイバチャネルやファイバチャ
ネルスイッチを介して複数のサーバと接続することができため、ディスクアレイ装置に接
続されたあるサーバのブートディスクは、別のサーバから参照可能である。この構成では
、業務を実行中の現用サーバで障害が発生した場合、そのサーバのブートディスクを利用
して予備サーバが起動することで業務を引き継ぐことができる。この方法では、ブートデ
ィスクの内容はそのまま予備サーバに引き継ぐため、OSや業務アプリケーションをそのまま引き継ぐことができる。さらに、現用サーバに対してペアとなる予備サーバを準備する必要が無いため、任意の現用サーバから任意の予備サーバへの業務引き継ぎが可能である。しかし、現用サーバと予備サーバとでハードウェア構成が異なる場合、ブートディスク内のOSや業務アプリケーションが正常に動作できない場合がある。
In contrast to the above, there is a form in which the server boots using an external disk array device as a disk device. In this case, since the disk array device can be connected to a plurality of servers via a fiber channel or a fiber channel switch, the boot disk of a server connected to the disk array device can be referenced from another server. . In this configuration, if a failure occurs on the active server that is executing a job, the job can be taken over by starting the spare server using the boot disk of that server. In this method, the contents of the boot disk are transferred to the spare server as they are, so that the OS and business applications can be transferred as they are. Furthermore, since it is not necessary to prepare a spare server to be paired with the active server, it is possible to take over business from any active server to any spare server. However, if the hardware configuration differs between the active server and the spare server, the OS or business application in the boot disk may not operate normally.
この課題に対して、従来の方法では、均質なハードウェア構成をもつシステムを想定し
、ユーザはあるハードウェア構成の現用サーバに対して、同じハードウェア構成の予備サ
ーバを設定する方法を取っていた。しかしこの方法では、ユーザの初期構築工数が増大し
てしまう。さらに、CPUの速度やメモリ容量など、ハードウェア構成が多少異なっても業
務の引き継ぎが可能な場合があるため、必ずしも同じハードウェア構成のサーバを準備す
る必要は無い場合がある。
To deal with this problem, the conventional method assumes a system having a homogeneous hardware configuration, and the user takes a method of setting a spare server having the same hardware configuration for an active server having a certain hardware configuration. It was. However, this method increases the user's initial construction man-hours. Furthermore, there is a case where it is not always necessary to prepare servers having the same hardware configuration because the business can be taken over even if the hardware configuration such as CPU speed and memory capacity is slightly different.
さらに、複数のサーバを仮想的に1台の論理サーバを構成するパーティション機能を利
用している場合、現用の論理サーバと、予備の論理サーバのパーティション構成を一致さ
せる必要がある。しかし、ある現用の論理サーバに対して、予備の論理サーバのパーティ
ション構成を一致させておくと、その予備の論理サーバは構成が一致していない他の現用
の論理サーバからの業務は引き継ぐことは出来ない。このため、現用の論理サーバに対し
て必ずペアとなる予備の論理サーバを準備しておく必要があるため、初期導入コストと初
期構築コストが増大してしまう。
Furthermore, when the partition function for virtually configuring a plurality of servers as one logical server is used, it is necessary to match the partition configurations of the current logical server and the spare logical server. However, if the partition configuration of a spare logical server is matched to a certain active logical server, the spare logical server will not take over operations from other active logical servers that do not match the configuration. I can't. For this reason, since it is necessary to prepare a spare logical server that is paired with the current logical server, the initial installation cost and the initial construction cost increase.
本発明が解決しようとする課題は、外部のディスク装置を利用してブートするサーバに
おいて障害が発生した場合に、ブートディスクの引き継ぎによる業務引き継ぎを実現する
方法において、不均質なハードウェア構成を持つシステムの中から業務の引き継ぎ先とな
るサーバの選択作業やパーティション構成作業を不要とすることで、システムの初期構築
の工数と導入コストとを削減することである。
The problem to be solved by the present invention is to have a heterogeneous hardware configuration in a method for realizing business takeover by taking over a boot disk when a failure occurs in a server that boots using an external disk device. By eliminating the need to select a server that will take over work from the system and partition configuration work from the system, it is possible to reduce the man-hours and installation costs for initial system construction.
予備サーバの設定作業を人手により行う場合、ハードウェア構成が均質なシステムの場
合はどのサーバを予備サーバとして設定しても問題はない。しかし、不均質なハードウェ
ア構成をもつシステムの場合、予備サーバとして設定する際に、ユーザは現用サーバのハ
ードウェア構成情報を調べ、さらに予備サーバの候補となるサーバのハードウェア構成を
調べて、一致するサーバを選択しなければならないため、手間がかかる。
When the spare server is set manually, there is no problem even if any server is set as the spare server in a system having a homogeneous hardware configuration. However, in the case of a system with a heterogeneous hardware configuration, when setting as a spare server, the user checks the hardware configuration information of the active server, and further checks the hardware configuration of the server that is a candidate for the spare server, Since it is necessary to select a matching server, it is troublesome.
また、一般に業務引き継ぎでは、複数の現用サーバに対して1台の予備サーバを設定す
る。このため、パーティション機能を利用している場合、予備の論理サーバの構成は、現
用の論理サーバで障害が発生した時点で決定する。このため、ユーザが障害発生を監視し
、発生時に人手によるパーティション構成作業を実施しなければならず、運用コストが大
幅に増大してしまう。さらに、予備サーバの台数が不足するなど、予備サーバ群の構成に
よっては、現用の論理サーバと同じ構成を持つ予備の論理サーバを構成できない場合があ
る。
In general, one spare server is set for a plurality of active servers in business takeover. Therefore, when the partition function is used, the configuration of the spare logical server is determined when a failure occurs in the active logical server. For this reason, the user must monitor the occurrence of a failure and manually perform partition configuration work when the failure occurs, resulting in a significant increase in operating costs. Furthermore, depending on the configuration of the spare server group, such as a shortage of spare servers, a spare logical server having the same configuration as the current logical server may not be configured.
複数のサーバがネットワーク上の外部ディスク装置に接続され、サーバは外部ディスク
装置からオペレーションシステムをブートする計算機システムにおいて、業務を稼動であ
る現用サーバの障害発生時に、計算機システム内の業務を稼動中でないサーバへと業務処
理を引き継ぐ際に、現用サーバの障害発生を検知し、計算機システム内において現用サー
バと同じハードウェア構成を持つ業務を稼動中でないサーバを検索し、検索の結果発見し
たサーバから外部ディスク装置へのアクセスを可能として、そのサーバを外部ディスク装
置からブートすることで業務の引き継ぎを行う。
In a computer system in which multiple servers are connected to an external disk device on the network, and the server boots the operation system from the external disk device, when a failure occurs in the active server that is operating the business, the business in the computer system is not active When taking over business processing to the server, it detects the failure of the active server, searches the computer system for a server that is not running a job that has the same hardware configuration as the active server, and externally searches the server that is found as a result of the search. Access to the disk device is made possible, and the server takes over by booting the server from the external disk device.
本発明は外部のディスク装置を利用してブートするサーバにおいて障害が発生した場合
に、ブートディスクの引き継ぎによる業務引き継ぎを実現する方法において、不均質なハ
ードウェア構成を持つシステムの中から業務の引き継ぎ先となるサーバの選択作業やパー
ティション構成作業を不要とすることで、システムの初期構築の工数と導入コストの削減
を可能とするフェイルオーバ方法を実現する。
The present invention provides a method for realizing business takeover by taking over a boot disk when a failure occurs in a server that boots using an external disk device, and takes over business from a system having a heterogeneous hardware configuration. By eliminating the need for server selection and partition configuration work, a failover method that can reduce the man-hours and initial costs for initial system construction is realized.
図1は、本発明における実施例の全体図を示している。本実施例のシステムは
複数のサーバ102を備える。各サーバは、ネットワークインターフェースカード(NI
C)121を介してネットワークスイッチ(NW SW)105に接続され、ファイバチ
ャネルのホストバスアダプタ(HBA)120を介してファイバチャネルスイッチ104に
接続されている。また、ファイバチャネルスイッチ104はディスクアレイ装置103に
も接続され、サーバ102からアクセスできる。ネットワークスイッチ105は、システ
ムを管理する管理サーバ101にも接続されている。また、サーバ102の各々にはBM
C(Baseboard Management Controller)122が内蔵されておいる。BCM122はネ
ットワークを介して管理サーバ101に接続される。これにより各サーバのハードウェア
の状態監視や、電源制御が可能となる。さらにサーバ102にはパーティション機構14
0が設けられている。図示した実施例ではパーティション機構140は2台のサーバを1
つの論理サーバとするか、それぞれ個別の論理サーバとするかの切り換えを行う。具体的
には、前者の場合には同一パーティション内の各々のサーバは互いに他のサーバが搭載す
るメモリを自身が搭載するメモリと同様にアクセス可能とする。
FIG. 1 shows an overall view of an embodiment of the present invention. The system of this embodiment includes a plurality of
C) connected to a network switch (NW SW) 105 via 121 and connected to a
A C (Baseboard Management Controller) 122 is incorporated. The
0 is provided. In the illustrated embodiment, the
Switch between one logical server and each logical server. Specifically, in the former case, each server in the same partition can access each other's memory mounted on other servers in the same manner as the memory mounted on itself.
なお、同一パーティションにまとめられるサーバの最大数を、2台でなくより多数にす
ると、論理サーバ構成のより多彩な切り換えが可能となる。管理サーバ101は、サーバ
102,ディスクアレイ装置103、ネットワークスイッチ104,ファイバチャネルス
イッチ105に対し、ネットワークを経由して状態の監視や必要に応じて制御を行う。管
理サーバ101にはフェイルオーバ機構110が設けられている。フェイルオーバ機構1
10は、サーバの障害発生時にBMC122からの障害通知の受信やBMC122への電源制御、ディスクアレイ装置103のディスクマッピング機構130の制御などを行う機構であり、本発明の特徴の一つである。ディスクアレイ装置103内のディスクマッピング機構130は、サーバ102に搭載のHBA120とディスク131との関係づけを行う。具体的にはディスク131にアクセス可能なサーバを制限することによりセキュリティ機能を実現する。本実施例1では、サーバ102はブートディスクとしてディスクアレイ装置103内のディスク131を利用し、ディスク131にはOSおよび業務アプリケーションが格納されている。
If the maximum number of servers grouped in the same partition is set to a larger number instead of two, it becomes possible to switch the logical server configuration in more various ways. The
図2は、本実施例におけるサーバ102の詳細な構成を示している。サーバ102には
プログラムやデータを格納するメモリ201と、メモリ内のプログラムを実行するCPU2
02と、HBA120と、NIC121と、BMC122から構成されている。HBA120にはファイバチャネル通信において通信相手を特定するために必要となるWWN(World Wide Name)204と呼ばれるユニークなデバイス識別子がメモリに格納されている。BMC122は、主にサーバ102のハードウェアの監視や制御を行う。サーバ102のハードウェアに異常が発生した場合は障害検出機構205が検知して外部に通知可能である。また、BMC122を通じて遠隔からサーバ102の電源のON/OFFが可能である。
FIG. 2 shows a detailed configuration of the
02,
図3はフェイルオーバ機構110のプログラムモジュール構成を示している。フェイル
オーバ機構110は、サーバのハードウェアやパーティションの構成状況およびサーバの
利用状態を格納するサーバ管理テーブル301と、サーバの状態監視を行って障害発生時
のフェイルオーバ動作の起動やサーバの電源制御を行うサーバ管理モジュールと、フェイ
ルオーバ時に業務の引き継ぎ先となる予備サーバを検索するサーバ検索機能と、フェイル
オーバ時に現用サーバから予備サーバへディスクマッピングを変更するディスクマッピン
グ変更モジュールから構成される。
FIG. 3 shows a program module configuration of the
図4は、図3におけるサーバ管理テーブル301の詳細を示している。サーバ管理テー
ブル301は、フェイルオーバ機構110が管理対象としているサーバの一覧と、各サー
バの構成情報および状態が格納されている。テーブルのカラム401は、サーバの識別子
が格納されている。サーバ識別子401は、サーバが特定できる情報であれば良い。サー
バのシリアル番号や、ブレードサーバであれば、ブレード番号などである。カラム402
は、カラム402はサーバのCPU種別を示している。製品名が同じCPUであっても、ステッピングなどが異なれば区別可能な情報を含んでいる。カラム403はサーバのCPU周波数を示している。カラム404はサーバが搭載しているメモリ容量を示している。カラム405はサーバのパーティション構成を示している。カラムの数字はそのサーバが属するパーティションを構成するサーバ数を示しており、括弧内はそのサーバが属すパーティションの識別子を示す。パーティション識別子は論理サーバに対応して付与される。
FIG. 4 shows details of the server management table 301 in FIG. The server management table 301 stores a list of servers managed by the
たとえば、サーバ識別子S2とS3のサーバが1つの論理サーバを構成しているのであれば、S2とS3は共にパーティション構成サーバ数は2となり、同じパーティション識別子であるP2に所属していることになる。また、サーバ1台のみで論理サーバが構成されている場合もある。この場合は、パーティション機能を持たないサーバと同等である。本実施例では、現用サーバや予備サーバは全て論理サーバとして示している。ただし、パーティション機能を持たないシステムでは、物理サーバが現用サーバや予備サーバであっても良い。
カラム406はサーバの状態を示している。使用中の場合は業務を実行中である。未使用
の場合は直ぐに別の業務に利用可能である。また、障害が発生して利用できない場合は障
害発生中であることを示す情報が格納される。
For example, if the servers with server identifiers S2 and S3 constitute one logical server, both S2 and S3 have two partition configuration servers and belong to the same partition identifier P2. . In some cases, a logical server is configured by only one server. In this case, it is equivalent to a server having no partition function. In this embodiment, all active servers and spare servers are shown as logical servers. However, in a system that does not have a partition function, the physical server may be an active server or a spare server.
A
図5は、図3におけるサーバ管理モジュール302の詳細を示している。サーバ管理モ
ジュールは、サーバの状態監視を行い、サーバの稼動状況や障害監視、および電源の制御
を行う。サーバの障害発生時、図1に示すBMC122や、サーバ上で稼動するエージェントプログラムなどがサーバの障害を検出すると、サーバ管理モジュール302へ障害の発生を通知される。このとき通知される障害情報には障害の種類が含まれている。この障害の種類によってフェイルオーバ実行の是非を判断するため、サーバ管理モジュール302は障害動作テーブルを持つ。カラム501は発生した障害の種類を示し、カラム502はその障害発生時のフェイルオーバ実行の是非を示す。障害動作テーブルの格納情報は、システムのユーザが任意に設定可能とすることも出来る。
FIG. 5 shows details of the
図6は、図3におけるディスクマッピング変更モジュール304の詳細を示している。
ディスクマッピング変更モジュール304は、障害が発生した現用サーバのマッピングさ
れているディスクを全てマッピング解除して、業務引き継ぎ先となる予備サーバへそのデ
ィスクをマッピングするように要求する。このディスクマッピングの変更は、図1に示す
ディスクアレイ装置103内のディスクマッピング機構130に対して要求する。ディス
クマッピング機構130は、サーバ搭載のHBAの識別子であるWWNに対してディスクを割り当てる。このため、ディスクマッピング変更には、現用サーバのWWNとマッピングされているディスクの情報、予備サーバのWWNが必要となる。これらの情報をディスクマッピング変更モジュール304はサーバディスクマッピングテーブルに格納する。カラム601はサーバの識別子を示す。カラム602はサーバ搭載のHBAのWWNを示している。カラム603はWWNに割り当てられているディスクの仮想ディスク番号を示す。カラム604はそのディスクの物理ディスク番号を示している。仮想ディスク番号は、サーバに見せる仮想的なディスク番号であり、物理ディスク番号に関わらず設定することが出来る。また、サーバディスクマッピングテーブルはディスクがマッピングされていないサーバの情報も記録する。この場合、カラム603およびカラム604の情報は空白となる。
FIG. 6 shows details of the disk
The disk
図7は、図1におけるディスクアレイ装置103内のディスクマッピング機構130の
詳細を示している。ディスクマッピング機構130はディスクアレイ装置内103のディ
スク131と、ディスクアレイ装置103にファイバチャネル経由で接続されているサー
バ搭載のHBA120のWWNとのマッピングを実施する。このマッピング関係にないWWNを持つサーバからはディスクを参照できない。これにより、あるディスクをあるサーバからのみアクセス可能とするセキュリティ設定が可能である。このセキュリティ設定のため、本実施例ではディスクマッピング機構130は図7に示すディスクマッピングテーブルを持つ。カラム701はサーバ搭載のHBAのWWNを示す。カラム702はWWNにマッピングされた仮想ディスク番号を示す。カラム703はWWNにマッピングされた論理ディスク番号を示す。
FIG. 7 shows details of the
図8は、本実施例におけるディスクマッピング変更例を示している。現用サーバ801
に搭載のHBA810はWWN1(811)を持ち、予備サーバ802に搭載のHBA820はWWN2(821)を持つ。これらはファイバチャネルスイッチ104を経由してディスクアレイ装置103に接続されている。ディスクのマッピングはディスクマッピング機構130によって制御されており、仮想ディスク831、832,833を含む仮想ディスクのグループ803が現用サーバ801のWWN1(811)にマッピングされている。仮想ディスク831、832、833の実体は論理ディスク804、805、806であり、OSや業務アプリケーションがインストールされているブートディスクを含んでいる。現用サーバ801で障害が発生した場合は、予備サーバ802へとディスクマッピングを変更する。このとき、現用サーバ801のWWN1(811)と仮想ディスクのグループ803とのマッピングを解除し、予備サーバ802のWWN2(821)へマッピングする。これにより、予備サーバ802は現用サーバ801が利用していたOSや業務アプリケーションを含むディスクを引き継ぐことができる。この状態で予備サーバ802を起動することで、現用サーバ801からの業務のフェイルオーバを実現する。
FIG. 8 shows a disk mapping change example in the present embodiment.
The
図9は、本実施例のフェイルオーバ動作のシーケンス図である。図示するシーケンス図
は、現用サーバ801、管理サーバ101のフェイルオーバ機構110、ディスクマッピ
ング機構130、及び予備サーバ802の連携動作を示す。ステップ910は現用サーバ
での障害発生を示す。現用サーバ801に搭載のBMCや現用サーバ上で稼動中のエージェントプログラムが障害の発生を検出し、フェイルオーバ機構110に通知する。ステップ920でフェイルオーバ機構110は通知された障害を検知する。するとフェイルオーバ機構110はステップ921で現用サーバのハードウェア構成やパーティション構成などの情報を取得する。この情報は図4に示したサーバ管理テーブルから取得する。ステップ922では、現用サーバをシャットダウンする。もし現用サーバが稼動したままであれば、OSや業務アプリケーションが不安定な状態で稼動している場合があり、これらが不正なI/Oを発行する場合がある。
FIG. 9 is a sequence diagram of the failover operation of this embodiment. The sequence diagram shown shows the cooperative operation of the
さらに、予備サーバが業務を引き継いだ時点で現用サーバが未だ稼動中であれば、同じ
IPアドレスを持つサーバが並存することになる。これを防ぐため、現用サーバのシャット
ダウンが必要である。ただし、現用サーバがダンプ処理中である場合は、ダンプ処理が終
了までシャットダウンを実行しない。また、フェイルオーバ機構110が現用サーバ80
1にダンプ処理の起動を要求する場合もある。ステップ911では、現用サーバ801が
シャットダウンの要求を受けてシャットダウン処理を実行する。もしシャットダウン処理
が不可能な場合は、フェイルオーバ機構110が現用サーバ801の強制電源OFFを実行
する。強制電源OFFはサーバ搭載のBMCに対して指示することで実行する。フェイルオーバ機構110はステップ923では、ステップ921で取得した現用サーバの情報をもとに、業務引き継ぎが可能な予備サーバを検索する。この検索は図4に示したサーバ管理テーブルの情報が現用サーバと一致するサーバを検索することで実行する。検索の結果、発見したサーバを予備サーバ904とする。ステップ924では現用サーバ901にマッピングされたディスクのマッピングを解除して、予備サーバ802にマッピングするためのディスクマッピング変更要求をディスクマッピング機構130に要求する。ステップ930では、ディスクアレイ装置のディスクマッピング機構130が要求されたディスクマッピング変更を実行する。ステップ925では予備サーバ802の起動を要求する。ステップ940では予備サーバ802が起動する。これによりOSや業務アプリケーションが起動するため、ステップ941で業務が再開される。
Furthermore, if the active server is still in operation when the spare server takes over the business, the same
Servers with IP addresses will coexist. To prevent this, the active server must be shut down. However, if the active server is in the dump process, the shutdown is not executed until the dump process is completed. Further, the
1 may be requested to start dump processing. In
以下では、図9におけるシーケンスをより詳細に説明する。図10は、サーバ管理モジ
ュール302の動作フローを示している。ステップ1001では、障害が発生したサーバ
から障害情報を受信する。ステップ1002では、受信した障害の情報から障害の種類を
特定する。ステップ1003では、障害動作テーブルを参照し、該当する障害の種類に対
してフェイルオーバ動作の実行の是非となる情報を参照する。ステップ1004は、障害
動作テーブルの内容より、フェイルオーバの実行の是非を判定する。フェイルオーバ動作
が必要であればステップ1005に移り、不要であれば何もせずに終了する。ステップ1
005では、現用サーバのシャットダウンを実行する。ステップ1006では、サーバ検
索モジュール303を起動する。サーバ検索モジュールの動作が終了するとステップ10
07に移る。ステップ1007では予備サーバを起動する。
Hereinafter, the sequence in FIG. 9 will be described in more detail. FIG. 10 shows an operation flow of the
In 005, the active server is shut down. In
Move to 07. In step 1007, the spare server is activated.
図11はサーバ検索モジュール303の処理フローを示している。ステップ1101で
は、サーバ管理テーブルから現用サーバの情報を取得する。このとき、現用サーバのサー
バ識別子と、そのサーバか属するパーティション識別子を元に情報を取り出す。ステップ
1102では、サーバ管理テーブルから、取り出した現用サーバの情報とハードウェア構
成が同じであり、かつ同じパーティション構成を持つ未使用状態のサーバを検索する。こ
こでハードウェア構成とは、図4に示すサーバ管理テーブルのCPU種別(カラム402)
とCPU周波数(カラム403)とメモリ容量(カラム404)のことである。また、パー
ティション構成はカラム405であるが、ここではパーティションを構成するサーバ数の
みを条件として参照し、どのパーティションに所属するかは関係ない。ステップ1103
では、検索の結果、サーバが発見できたかどうかを判定する。発見したならば次のステッ
プ1104に進む。発見できなかった場合は終了する。ただし、一般的にサーバが発見で
きなかった場合には、その旨を示す情報をユーザに通知するため、メッセージの表示やロ
グへの出力を行う。ステップ1104では発見したサーバを予備サーバに指定する。ステ
ップ1105ではディスクマッピング変更モジュールを起動する。
FIG. 11 shows a processing flow of the
CPU frequency (column 403) and memory capacity (column 404). The partition configuration is the
Then, it is determined whether the server has been found as a result of the search. If found, go to the
図12はディスクマッピング変更モジュール303およびディスクアレイ装置のディス
クマッピング機構130103の詳細シーケンスを示す。ステップ1201、1202、
1203、1205はディスクマッピング変更モジュール303の処理フロー、ステップ
1204、1206はディスクマッピング機構130103の処理フローである。ステッ
プ1201では、サーバマッピングテーブルを参照して、現用サーバ搭載のWWNと、そこへマッピングされているディスクの状態を取得する。ステップ1202では、サーバディスクマッピングテーブルを参照して予備サーバ搭載のWWNを取得する。これらの情報はディスクマッピング機構130へマッピング変更要求を指示する際に引数として必要となる。ステップ1203で、現用サーバのWWNにマッピングされているディスクのマッピングを解除するように、ディスクマッピング機構130に要求を出す。ステップ1204では、現用サーバのWWNに対するディスクのマッピングを全て解除する。ステップ1205では、ディスクマッピング機構130に対して、現用サーバにマッピングされていたディスクを、予備サーバのWWNにディスクにマッピングするように要求する。ステップ1206では、予備サーバのWWNに対して要求されたディスクマッピングを実施する。
FIG. 12 shows a detailed sequence of the disk
1203 and 1205 are the processing flow of the disk
図13は、本発明における実施例2の全体図を示している。実施例2では、現用の論理
サーバのパーティション構成に合わせて、予備の論理サーバを構成する実施例を示す。実
施例1と異なるのは、管理サーバ101′にパーティション管理機構111が追加された
ことと、フェイルオーバ機構の構造である。パーティション管理機構111は、論理サー
バの作成、構成変更、および削除といったパーティションの制御を行う機構である。フェ
イルオーバ機構110′は、パーティション管理機構111と連携して、予備の論理サー
バのパーティションを自動構成する機能を実現する。
FIG. 13 shows an overall view of the second embodiment of the present invention. The second embodiment shows an embodiment in which a spare logical server is configured in accordance with the partition configuration of the current logical server. The difference from the first embodiment is the addition of the partition management mechanism 111 to the
図14は、実施例2の管理サーバ101′の構成を示している。実施例1の管理サーバ
101に加えて、パーティション管理機構111が追加される。フェイルオーバ機構11
0′の構造は、実施例1のフェイルオーバ機構110に加えて、パーティション構成変更
モジュール305と、パーティション構成可能テーブル306が追加される。パーティシ
ョン構成変更モジュール305は、現用の論理サーバと予備の論理サーバのパーティショ
ン構成が一致するように、パーティション管理機構111に対して、予備となる論理サー
バの構成変更を要求する機能モジュールである。ここでパーティション構成を一致させる
とは、現用の論理サーバを構成するサーバ台数と、予備の論理サーバを構成するサーバ台
数を一致させることである。たとえば、現用サーバがサーバ2台で構成される論理サーバ
であった場合、予備サーバも同様にサーバ2台で構成される論理サーバとする。パーティ
ション構成可能テーブル306は、システムで論理サーバが構成できるサーバの組み合わ
せを列挙するテーブルである。パーティション構成変更モジュール305は、パーティシ
ョン構成可能テーブル306を参照して、現用の論理サーバと同じパーティション構成と
なる論理サーバを構成できるサーバの組み合わせを検索する。パーティション管理機構1
11はパーティション管理テーブル311を含んでいる。パーティション管理機構111
は、パーティション管理テーブル311を参照して、現在のパーティション構成を管理し
ている。
FIG. 14 shows the configuration of the
In the structure of 0 ′, a partition
11 includes a partition management table 311. Partition management mechanism 111
Manages the current partition configuration with reference to the partition management table 311.
図15は、図14のパーティション構成可能テーブル306の詳細を示している。カラ
ム1501は論理サーバを構成するサーバの台数を示す。カラム1502は、論理サーバ
を構成することが可能なサーバの組み合わせを示す。図15に示す例では、サーバ2台で
構成する論理サーバは、S2とS3の組み合わせ、S6とS7の組み合わせ、S11とS12の組み合わせで可能ということである。また、本実施例では、サーバ1台で構成する論理サーバのサーバ識別子は記述していないが、本テーブルに含まれていても問題ない。
FIG. 15 shows details of the partition configurable table 306 of FIG. A
図16は、図14のパーティション管理テーブル311の詳細を示している。カラム1
601はパーティション識別子を示している。この識別子は論理サーバに対応して付与さ
れる。カラム1602は論理サーバを構成するサーバを示す。
FIG. 16 shows details of the partition management table 311 of FIG.
Reference numeral 601 denotes a partition identifier. This identifier is given corresponding to the logical server. A
図17は、実施例2のフェイルオーバ動作のシーケンス図である。図示するシーケンス
図は、現用サーバ、フェイルオーバ機構110′、パーティション管理機構111、ディ
スクマッピング機構130、及び予備サーバの連携動作を示す。実施例1と異なるのは、
ステップ1724のパーティション構成要求と、ステップ1730のパーティション構成
変更が追加されたことである。また、ステップ1723の予備サーバの検索における詳細
も異なる。ステップ1723では、まず現用の論理サーバのパーティション構成と同じパ
ーティション構成を持つ未使用のサーバの組を検索する。見つかった場合は現用サーバへ
のディスクのマッピングを解除し、見つかった未使用サーバにそのディスクをマッピング
することを要求するステップ1725に進む。一方、現用の論理サーバのパーティション
構成と同じパーティション構成を持つ未使用のサーバの組が見つからない場合は、現用の
論理サーバと同じパーティション構成の論理サーバを構成可能なサーバの組み合わせを検
索する。たとえば、現用サーバが2台のサーバから構成される論理サーバであった場合、
その2台と同じハードウェア構成を持つサーバであり、かつ論理サーバが構成可能なサー
バ2台を検索する。これが見つかれば、ステップ1724に進み、発見したサーバを利用
して、論理サーバを構成するようにパーティション管理機構1703に要求する。ステッ
プ1730は、パーティション管理機構1703がステップ1724の要求を受けて、パ
ーティションの構成変更を実施する。
FIG. 17 is a sequence diagram of the failover operation according to the second embodiment. The sequence diagram shown shows the cooperative operation of the active server, failover mechanism 110 ', partition management mechanism 111,
This is that the partition configuration request in
Two servers that have the same hardware configuration as the two units and that can be configured as a logical server are searched. If this is found, the process proceeds to step 1724, and the partition management mechanism 1703 is requested to configure a logical server using the found server. In
図18は、実施例2におけるサーバ検索機能303の処理フローを示している。ステッ
プ1801では、サーバ管理テーブルから現用サーバの情報を取得する。このとき、現用
サーバのサーバ識別子と、そのサーバか属するパーティション識別子を元に情報を取り出
す。ステップ1802では、サーバ管理テーブルから、現用サーバを構成するサーバとハ
ードウェア構成が同じで、かつパーティション構成も同じである未使用サーバの組み合わ
せ(予備の論理サーバ)を検索する。もしそのサーバの組が無ければ、次にステップ18
03に進む。ステップ1803では現用サーバを構成するサーバとハードウェア構成が同
じサーバであり、論理サーバを構成可能なサーバの組み合わせを検索する。たとえば、現
用サーバがサーバ2台で構成される論理サーバである場合、まずそれぞれのサーバと同じ
ハードウェア構成を持つサーバをサーバ管理テーブル301を利用して検索し、次にそれ
らのサーバの中から2台で論理サーバが構成できるサーバの組みをパーティション構成可
能テーブル306を利用して検索する。発見したならば次のステップ1804に進み、パ
ーティション構成変更モジュールを起動する。次にステップ1805でディスクマッピン
グ変更のためにディスクマッピング機構を起動する。先のステップ1802で予備の論理
サーバをお発見できた場合は、ステップ1804のパーティション構成変更モジュールの
起動を行わずにステップ1805に進む。
FIG. 18 shows a processing flow of the
Proceed to 03. In
ここでステップ1802でもステップ1803でも該当するサーバの組を発見できなか
った場合はフェイルオーバの動作を終了する。ただし、一般的にサーバが発見できなかっ
た場合には、その旨を示す情報をユーザに通知するため、メッセージの表示やログへの出
力を行う。
Here, if neither the
図19は、パーティション構成変更モジュール305およびパーティション管理機構1
11の詳細シーケンスを示す。ステップ1901、1903はパーティション構成変更モ
ジュール305の処理フロー、ステップ1902はパーティション管理機構111の処理
フローである。ステップ1901でパーティション構成変更モジュール305は、サーバ
の組みを利用して、現用の論理サーバと同じパーティション構成を持つ論理サーバの構成
をパーティション管理機構111に要求する。ステップ1902では、パーティション管
理機構111が論理サーバの構成を実施する。ステップ1903では、パーティション構
成変更モジュール305は構成した論理サーバを予備サーバとして設定する。
FIG. 19 shows the partition
11 detailed sequences are shown.
本発明における実施例3では、予備サーバの検索の際に、検索ポリシーを用いる例を示
している。検索ポリシーによって、現用サーバと必ずしも予備サーバのハードウェア構成
やパーティション構成が完全一致しない場合であっても業務の引き継ぎが可能な場合に対
処できる。たとえば、CPU周波数やメモリ容量などは、多少の変化があってもソフトウェ
アは対応可能であるため、一致しなくても業務の引き継ぎは可能である。
The third embodiment of the present invention shows an example in which a search policy is used when searching for a spare server. Depending on the search policy, it is possible to cope with the case where work can be taken over even when the hardware configuration and partition configuration of the active server and the spare server do not necessarily match completely. For example, the software can handle the CPU frequency and memory capacity even if there are some changes, so it is possible to take over the business even if they do not match.
図20は、本発明における実施例3のサーバ検索モジュール303′を示す。実施例1
および実施例2におけるサーバ検索モジュール303に対して、実施例3のサーバ検索モ
ジュール303′は検索ポリシーテーブルを追加している。検索ポリシーテーブルは現用
サーバに対して、予備サーバとして満たすべきポリシーが列挙される。このポリシーを満
たすサーバであれば、現用サーバ対してハードウェア構成やパーティション構成が完全一
致しない場合であっても、予備サーバとして利用することができる。カラム2001は現
用サーバのサーバ識別子を示している。カラム2002は検索のポリシーを示している。
ポリシーとしては、図20に示すように、CPU周波数やメモリがある一定値以上である条
件や、パーティション構成が不一致の場合でも業務に引き継ぎが可能とするなどの条件を
設定可能である。サーバ検索モジュール303′では、予備サーバとするサーバの検索の
際に、この検索ポリシーテーブルを参照する。検索ポリシーテーブルは、ユーザによって
書き換えを可能とする。たとえば、GUIやコマンド、設定ファイルを提供し、検索ポリシ
ーの指定を可能とする。
FIG. 20 shows a
The
As the policy, as shown in FIG. 20, a condition that the CPU frequency and the memory are equal to or higher than a certain value, and a condition that it is possible to take over the business even when the partition configurations do not match can be set. The
図21は、本発明における実施例3のサーバ検索モジュール303′の処理フローを示
す。実施例1および実施例2と異なるのは、ステップ2102において検索ポリシーを利
用することである。ステップ2102では、サーバ検索モジュール303′は検索ポリシ
ーテーブルの該当する現用サーバのポリシーを参照し、予備サーバの候補となるサーバを
サーバ管理テーブル301から検索する。
FIG. 21 shows a processing flow of the
本発明における実施例4では、システムに未使用のサーバが存在しない場合であっても
、障害が発生した業務よりも優先度の低い業務から、サーバを融通することで業務を引き
継ぐ方法を示す。
図22は、本発明における実施例4のサーバ管理テーブルである。他の実施例と異なるの
は、カラム407とカラム408である。カラム407では、サーバが稼動する業務の種
類を示している。この例以外にも、業務の種類を示すものとして業務IDを利用しても良い
。カラム408はカラム407の業務の優先度を示す。ここでは例として、高、中、低と
なっている。高であれば業務の優先度は高く、低であれば業務の優先度が低いことを示す
。業務の優先度はユーザが指定する。指定方法としては、ユーザへのGUIやコマンドの提
供や、設定ファイルなどである。
In the fourth embodiment of the present invention, even when there is no unused server in the system, a method of taking over a business by accommodating a server from a business having a lower priority than a business in which a failure has occurred will be described.
FIG. 22 is a server management table according to the fourth embodiment of the present invention. The difference from the other embodiments is a
図23は、本発明における実施例4のサーバ検索モジュールの処理フローである。他の
実施例と異なるのは、ステップ2302である。ステップ2302では、未使用のサーバ
だけでなく、現用サーバが稼動していた業務より低い優先度の業務が稼動するサーバを含
めて検索する。他の業務が稼動するサーバを予備サーバとする場合は、該当する業務から
サーバを融通する。たとえば、図23の例では、サーバ識別子S5で障害が発生した場合、
S5の業務より優先度が低いS4のサーバを融通する。また、サーバを融通する業務が他のサーバを利用している場合は、その業務に対するスケールインまたはスケールダウンを実行しても良い。さらに、サーバが不足して予備の論理サーバが構成できない場合にも、他の業務から融通したサーバを利用して、論理サーバを構成可能である。また、サーバを融通する前に、融通するサーバで稼動していた業務を他のサーバへと引き継ぐ方法もある。たとえば、図23においてS5の予備サーバをS4とする場合、先にS4の業務を未使用のS12に引き継ぎ、その後S5の業務をS4へと引き継ぐ。ここで、S4とS12はハードウェア構成が異なるが、実施例3で示した検索ポリシーによって業務の引き継ぎが可能であるものとしている。この動作は、本発明で記述しているフェイルオーバ処理を2回行ったことに等しい。
FIG. 23 is a processing flow of the server search module according to the fourth embodiment of the present invention.
Accommodate S4 servers that have lower priority than S5 operations. In addition, when a business that accommodates a server uses another server, scale-in or scale-down may be executed for the business. Furthermore, even when a server is insufficient and a spare logical server cannot be configured, it is possible to configure a logical server by using a server that is versatile from other businesses. There is also a method of taking over the work that was running on the server to which the server is accommodated, to another server before accommodating the server. For example, in FIG. 23, when the spare server of S5 is S4, the business of S4 is first handed over to unused S12, and then the business of S5 is handed over to S4. Here, although the hardware configurations of S4 and S12 are different, it is assumed that the business can be taken over by the search policy shown in the third embodiment. This operation is equivalent to performing the failover processing described in the present invention twice.
本発明における実施例5の全体図を図24に示す。実施例1と異なるのは、FCSW1
04にFCSW管理機構140とNWSW105にNWSW管理機構150が追加されて
いることである。FCSW管理機構140は、FCSWの接続ポートごとやサーバ搭載の
HBAのWWNごとにゾーンを分けることで、あるゾーンの属するサーバからは別のゾーンのディスクにアクセスできないようにするセキュリティ機能を制御する。NWSW管理機構150は、NWSWの接続ポートやサーバ搭載のNICごとにVLAN IDを付与し、VLAN IDごとにネットワークを分離するセキュリティ機能を制御する。実施例5では、現用サーバと接続先のNWSW104やディスクアレイ装置103が異なる場合や、サーバ間でFCSW104のゾーンやNWSW105のVLAN IDが異なる場合を考慮して、予備サーバの検索を可能とする。
FIG. 24 shows an overall view of the fifth embodiment of the present invention. The difference from Example 1 is FCSW1
The
By dividing the zone for each WWN of the HBA, the security function is controlled so that a server in another zone cannot access a disk in another zone. The
図25は、本発明における実施例5の管理サーバ101″の構成を示している。他の実
施例と異なるのは、管理サーバ101″のフェイルオーバ機構110″にはFCSW設定
変更モジュール307とNWSW設定変更モジュール308が追加されていることである
。FCSW設定変更モジュール307は、予備サーバが現用サーバとゾーンが異なる場合
に、ゾーンが一致するようにFCSW管理機構140に対して設定変更を要求する機能モ
ジュールである。NWSW設定変更モジュール308は、予備サーバが現用サーバとVLAN IDが異なる場合に、VLAN IDが一致するようにNWSW管理機構150に対して設定変更を要求する機能モジュールである。FCSW設定変更モジュール307およびNWSW設定変更モジュール308の動作タイミングは、サーバ検索モジュール303が予備サーバを発見した時点である。
FIG. 25 shows the configuration of the
図26は、本発明における実施例5のサーバ管理テーブル301である。カラム409
はサーバのチップセットの種類を示す。チップセットが一意に決まるのであれば、サーバ
のモデル名でも良い。現用サーバと予備サーバでチップセットが一致しない場合、業務の
引き継ぎができない可能性があるため、このカラムによりチップセットの種類が一致する
サーバを検索する。カラム409はサーバ搭載NICのポート数を示す。カラム410は
サーバ搭載のHBAポート数を示す。カラム409およびカラム410は、現用サーバと
予備サーバでI/Oポート数が一致しなければ業務の引き継ぎができない場合があるため、
予備サーバの検索に利用する。カラム412はサーバが属するVLAN IDである。現
用サーバと予備サーバでVLAN IDが一致しない場合であっても、予備サーバのVL
AN IDをNWSW設定変更モジュール308によって現用サーバと一致させることで
、業務に引き継ぎが可能である。カラム413はサーバが属するゾーンの識別子である。
現用サーバと予備サーバでゾーンが異なる場合であっても、予備サーバのゾーンをFCS
W設定変更モジュール307によって現用サーバと一致させることで、業務に引き継ぎが
可能である。カラム414はサーバの接続先NWSWを示す。現用サーバと予備サーバで
接続先NWSWが異なる場合は、業務の引き継ぎができない場合があるため、予備サーバ
の検索に本カラムを利用する。カラム415はサーバの接続先ディスクアレイ装置を示す
。現用サーバと予備サーバで接続先ディスクアレイ装置が異なる場合は、現用サーバのブ
ートディスクが予備サーバからアクセスできないため、業務の引き継ぎができない。そこ
で、本カラムを予備サーバの検索に利用する。他にもサーバとディスクアレイ装置の接続
先ポートの情報や、のディスクアレイ装置の接続先コントローラの情報をサーバ管理テー
ブル301に追加しても良い。
FIG. 26 shows the server management table 301 according to the fifth embodiment of the present invention.
Indicates the type of server chipset. If the chipset is uniquely determined, the server model name may be used. If the chipset does not match between the active server and the spare server, there is a possibility that the business cannot be taken over, so a server with the same chipset type is searched by this column. A
Used to search for spare servers. A
By matching the AN ID with the active server by the NWSW setting
Even if the active server and spare server have different zones, the spare server zone is
By matching with the active server by the W setting
本特許のサーバ検索方法は、フェイルオーバだけでなく、負荷分散システムにおける業
務のスケールアウトやスケールアップの対象とするサーバの検索にも適用できる。
The server search method of this patent can be applied not only to failover, but also to search for servers to be scaled out or scaled up in a load balancing system.
101 管理サーバ
102 サーバ
103 ディスクアレイ装置
104 FCSW
105 NWSW
110 フェイルオーバ機構
120 HBA
121 NIC
122 BMC
130 ディスクマッピング機構
131 ディスク
140 パーティション機構。
101
105 NWSW
110
121 NIC
122 BMC
130
Claims (12)
外部ディスク装置からオペレーションシステムをブートすることで起動可能となる計算機
システムにおいて、業務を稼動している現用サーバの障害発生時に、該計算機システム内
の他のサーバへと業務処理を引き継ぐフェイルオーバ方法であって、
前記現用サーバの障害発生を検知するステップと、前記計算機システム内のサーバの中か
ら、業務を稼動中でなく且つ前記現用サーバと同じハードウェア構成を持つことを検索条
件に前記現用サーバを引き継ぐべきサーバを検索する検索ステップと、前記検索の結果発
見したサーバから該外部ディスク装置へのアクセスを可能とするステップと、前記発見し
たサーバを該外部ディスク装置からブートするステップを有することを特徴とするフェイ
ルオーバ方法。 Multiple servers are connected to an external disk device via a network, and each of the servers can be started up by booting the operation system from the external disk device. A failover method that takes over business processing to another server in the computer system when it occurs,
The step of detecting the failure of the active server and the server in the computer system should take over the active server using the search condition that the business is not in operation and has the same hardware configuration as the active server A search step of searching for a server, a step of enabling access to the external disk device from a server found as a result of the search, and a step of booting the found server from the external disk device. Failover method.
索ポリシーに従って前記現用サーバを引き継ぐべきサーバを検索することを特徴とする請
求項1のフェイルオーバ方式。 2. The failover method according to claim 1, wherein, in the search step, a table indicating a server search policy is referred to, and a server that should take over the active server is searched according to the search policy of the table.
器が同じことを条件に計算機システム内のサーバの中からサーバ検索することを特徴とす
る請求項1のフェイルオーバ方法。 2. The failover method according to claim 1, wherein, in the search step, a server search is performed from among servers in the computer system on condition that the active server and a network connection device are the same in addition to the search condition.
レーションシステムをブートすることで起動可能となる複数のサーバと、該複数のサーバ
の各々を、それぞれが1台のサーバか、もしくはそれ以上数のサーバ群で構成される複数
の論理パーティションのいずれかに属するようにし、かつ該一つの論理パーティションに
属するサーバは一つの論理サーバとして機能するように管理するパーティション管理機構
を備えた管理サーバとを有する計算機システムにおいて、ある業務を稼動している現用サ
ーバの障害発生時に他のサーバに業務処理を引き継ぐフェイルオーバ方法であって、
前記現用サーバの障害発生を検知するステップと、前記計算機システム内のサーバの中か
ら、業務を稼動中でなく、且つ前記現用サーバが属す論理パーティションと同じ構成の論
理パーティションを現に構成しているサーバの組を検索する第1の検索ステップと、前記
第1の検索の結果発見したサーバの組から構成される予備の論理パーティションを構成す
るステップと、前記検索の結果発見したサーバの組の各サーバから前記外部ディスク装置
へのアクセスを可能にするステップと、前記発見したサーバの組の各サーバを前記外部デ
ィスク装置からブートするステップを有することを特徴とするフェイルオーバ方法。 A plurality of servers connected to an external disk device via a network, each of which can be started by booting an operation system from the external disk device, and each of the plurality of servers is a single server, Or, it has a partition management mechanism that belongs to one of a plurality of logical partitions composed of a larger number of server groups, and that the servers that belong to the one logical partition function as one logical server. In a computer system having a management server, a failover method that takes over business processing to another server when a failure occurs on an active server that is operating a certain business,
A step of detecting the occurrence of a failure in the active server, and a server that is not in operation and that currently constitutes a logical partition having the same configuration as the logical partition to which the active server belongs, among the servers in the computer system A first search step for searching a set of servers, a step of configuring a spare logical partition composed of a set of servers found as a result of the first search, and each server of the set of servers found as a result of the search A failover method comprising: enabling access to the external disk device from the server; and booting each server of the discovered server set from the external disk device.
なく、且つ前記現用サーバが属す論理パーティションと同じ構成の論理パーティションを
構成可能なサーバの組を検索する第2の検索ステップ、前記第2の検索ステップで発見さ
れたサーバの組を一つの論理パーティションとするステップをさらに有する請求項4のフ
ェイルオーバ方法。 If a corresponding server set is not found in the first search step, a server set that is not in operation and can configure a logical partition having the same configuration as the logical partition to which the active server belongs is searched. The failover method according to claim 4, further comprising: a second search step, and a step of setting a set of servers found in the second search step as one logical partition.
外部ディスク装置からオペレーションシステムをブートすることで起動可能となる計算機
システムにおいて、ある業務を稼動している現用サーバの障害発生時に、該計算機システ
ム内の業務を他のサーバへと業務処理を引き継ぐフェイルオーバ方法であって、
前記複数のサーバそれぞれにて稼動する業務の優先度を管理テーブルに登録するステップ
と、前記現用サーバの障害発生を検知した場合に、前記管理テーブルを参照して、前記現
用サーバが稼動していた業務より優先度の低い優先度の業務を稼動しているサーバを検索
する検索ステップと、前記検索の結果発見したサーバへ前記現用サーバが稼動していた業
務を引き継ぐステップを有することを特徴とするフェイルオーバ方法。 A plurality of servers are connected to an external disk device via a network, and each of the servers is a computer system that can be started by booting an operation system from the external disk device. When a failure occurs, a failover method that takes over the business processing in the computer system to another server,
The step of registering the priority of the operation that operates on each of the plurality of servers in the management table, and when the failure of the active server is detected, the active server is operating with reference to the management table A search step for searching for a server operating a job having a priority lower than that of the job; and a step of taking over the job in which the active server is operating to the server found as a result of the search. Failover method.
置に接続され、該サーバの各々は該外部ディスク装置からオペレーションシステムをブー
トすることで起動可能となる計算機システムにおいて、業務を稼動している現用サーバの
障害発生時に、該計算機システム内の他のサーバへと業務処理を引き継ぐフェイルオーバ
方法であって、前記現用サーバの障害発生を検知するステップと、前記計算機システム内
のサーバの中から、業務を稼動中しておらず、且つ前記現用サーバと同じハードウェア構
成を持つことを検索条件に前記現用サーバを引き継ぐべきサーバを検索する検索ステップ
と、前記検索の結果発見したサーバを前記現用サーバと同じ仮想ネットワークに属するよ
うに前記スイッチの設定を変更するステップとを有することを特徴とするフェイルオーバ
方法。 In a computer system in which a plurality of servers are connected to an external disk device via a switch capable of constructing a plurality of virtual networks, and each of the servers can be started by booting an operation system from the external disk device. A failover method for taking over business processing to another server in the computer system when a failure occurs in the active server, and detecting a failure in the active server; and a server in the computer system A search step for searching for a server that should take over the active server on the basis of a search condition that the business is not operating and has the same hardware configuration as the active server, and a server found as a result of the search Change the switch settings so that they belong to the same virtual network as the active server. Failover method characterized by a step of.
レーションシステムをブートすることで起動可能になる複数のサーバと、
該複数のサーバを管理する管理サーバとを有し、
前記管理サーバには、
前記複数のサーバのハードウエア構成を記録するサーバ管理テーブル、
ある業務を稼動している前記複数のサーバの内の現用サーバの障害発生の検出を契機に、
業務を稼動しておらず、かつ前記現用サーバと同一のハードウエア構成を持つことを検索
条件に前記現用サーバを引き継ぐべきサーバを検索するサーバ検索手段、および
前記サーバ検索手段の検索したサーバに前記現用サーバが利用していた外部ディスクをマ
ッピングするよう前記外部ディスク装置に要求するマッピング変更手段、
を備えるフェイルオーバ機構を有する計算機システム。 A plurality of servers connected to an external disk device via a network, each of which can be started by booting an operation system from the external disk device;
A management server for managing the plurality of servers,
In the management server,
A server management table for recording hardware configurations of the plurality of servers,
Triggered by the failure detection of the active server among the plurality of servers that are operating a certain business,
Server search means for searching for a server that should take over the active server on the basis of a search condition that the business server is not operating and has the same hardware configuration as the active server, and the server searched for by the server search means Mapping changing means for requesting the external disk device to map the external disk used by the active server;
A computer system having a failover mechanism.
リシーテーブルの検索ポリシーに従って前記現用サーバを引き継ぐべきサーバを検索する
ことを特徴とする請求項8の計算機システム。 9. The computer system according to claim 8, wherein the server search unit has a policy table indicating a search policy of a server, and searches for a server that should take over the active server according to the search policy of the search policy table.
器が同じことを条件に前記現用サーバを引き継ぐべきサーバ検索する特徴とする請求項8
の計算機システム。 9. The server search unit according to claim 8, wherein, in addition to the search condition, the server search means searches for a server to take over the active server on condition that the active server and a connected device on the network are the same.
Computer system.
レーションシステムをブートすることで起動可能になる複数のサーバと、
前記複数のサーバの各々を、それぞれが1台のサーバか、もしくはそれ以上数のサーバ群
で構成される複数の論理パーティションのいずれかに属するようにし、一つの論理パーテ
ィションに属するサーバを一つの論理サーバとして機能させる論理パーティション機構と
、
該複数のサーバを管理する管理サーバとを有し、
前記管理サーバには、
前記複数のサーバのハードウエア構成を記録するサーバ管理テーブル、
前記複数のサーバの内のある業務を稼動してい現用サーバの障害発生の検出を契機に、業
務を稼動しておらず、かつ前記現用サーバと同一のパーティション構成を持つことを検索
条件に前記現用サーバを引き継ぐべきサーバを検索するサーバ検索手段、および
前記サーバ検索手段の検索したサーバに前記現用サーバが利用していた外部ディスクをマ
ッピングするよう前記外部ディスク装置に要求するマッピング変更手段、
を備えるフェイルオーバ機構を有する計算機システム。 A plurality of servers connected to an external disk device via a network, each of which can be started by booting an operation system from the external disk device;
Each of the plurality of servers belongs to either one server or a plurality of logical partitions composed of a larger number of servers, and servers belonging to one logical partition belong to one logical partition. A logical partition mechanism that functions as a server;
A management server for managing the plurality of servers,
In the management server,
A server management table for recording hardware configurations of the plurality of servers,
The active server is used as a search condition when a business operation of the plurality of servers is in operation and a failure is detected in the active server, and the business is not operating and has the same partition configuration as the active server. Server search means for searching for a server to take over the server, and mapping change means for requesting the external disk device to map the external disk used by the active server to the server searched by the server search means;
A computer system having a failover mechanism.
示すテーブルと、業務を稼動しておらず、かつ前記現用サーバと同一のパーティション構
成を現に持つサーバの組が発見できない時には前記テーブルを参照して、業務を稼動して
おらず、かつ前記現用サーバが属する論理パーティションと同じ構成の論理パーティショ
ンを構成可能なサーバの組を検索する手段と、検索の結果見つかったサーバの組で論理パ
ーティションを構成するように前記論理パーティション機構にパーティション構成の変更
を要求する手段を更に有することを特徴とする請求項11の計算機システム。 The management server includes a table showing combinations of servers that can form a logical partition, and when a set of servers that are not in operation and that currently have the same partition configuration as the active server cannot be found. Means for searching for a set of servers that can configure a logical partition having the same configuration as the logical partition to which the active server belongs, with reference to the table, and a set of servers found as a result of the search; The computer system according to claim 11, further comprising means for requesting the logical partition mechanism to change a partition configuration so as to configure a logical partition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202562A JP5316616B2 (en) | 2011-09-16 | 2011-09-16 | Business takeover method, computer system, and management server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202562A JP5316616B2 (en) | 2011-09-16 | 2011-09-16 | Business takeover method, computer system, and management server |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009173842A Division JP4877368B2 (en) | 2009-07-27 | 2009-07-27 | Failover method by disk takeover |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012043445A true JP2012043445A (en) | 2012-03-01 |
JP5316616B2 JP5316616B2 (en) | 2013-10-16 |
Family
ID=45899584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011202562A Expired - Fee Related JP5316616B2 (en) | 2011-09-16 | 2011-09-16 | Business takeover method, computer system, and management server |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5316616B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014080492A1 (en) * | 2012-11-22 | 2014-05-30 | 株式会社日立製作所 | Computer system, cluster management method, and management computer |
JP2016522919A (en) * | 2013-04-10 | 2016-08-04 | イルミオ, インコーポレイテッドIllumio,Inc. | Distributed network management using a logical multidimensional label-based policy model |
JP2017513119A (en) * | 2014-12-29 | 2017-05-25 | 同方威視技▲術▼股▲分▼有限公司 | Automatic switching method and system |
US9882919B2 (en) | 2013-04-10 | 2018-01-30 | Illumio, Inc. | Distributed network security using a logical multi-dimensional label-based policy model |
US10027650B2 (en) | 2011-08-09 | 2018-07-17 | CloudPassage, Inc. | Systems and methods for implementing security |
US10153906B2 (en) | 2011-08-09 | 2018-12-11 | CloudPassage, Inc. | Systems and methods for implementing computer security |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259355A (en) * | 2001-02-28 | 2002-09-13 | Hitachi Ltd | Multiplex system |
WO2002086712A1 (en) * | 2001-04-20 | 2002-10-31 | Egenera, Inc. | Virtual networking system and method in a processing system |
WO2003010678A1 (en) * | 2001-07-23 | 2003-02-06 | Network Appliance, Inc. | High-availability cluster virtual server system |
JP2003203018A (en) * | 2002-01-07 | 2003-07-18 | Mitsubishi Electric Corp | Pseudo cluster system using san |
JP2004508616A (en) * | 2000-06-20 | 2004-03-18 | テラスプリング・インコーポレーテッド | Method and apparatus for controlling an extensible computing system |
WO2004102535A2 (en) * | 2003-05-07 | 2004-11-25 | Egenera, Inc. | Disaster recovery for processing resources using configurable deployment platform |
-
2011
- 2011-09-16 JP JP2011202562A patent/JP5316616B2/en not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004508616A (en) * | 2000-06-20 | 2004-03-18 | テラスプリング・インコーポレーテッド | Method and apparatus for controlling an extensible computing system |
JP2002259355A (en) * | 2001-02-28 | 2002-09-13 | Hitachi Ltd | Multiplex system |
WO2002086712A1 (en) * | 2001-04-20 | 2002-10-31 | Egenera, Inc. | Virtual networking system and method in a processing system |
JP2005506726A (en) * | 2001-04-20 | 2005-03-03 | イジェネラ,インク. | Virtual network system and method in processing system |
WO2003010678A1 (en) * | 2001-07-23 | 2003-02-06 | Network Appliance, Inc. | High-availability cluster virtual server system |
JP2004537126A (en) * | 2001-07-23 | 2004-12-09 | ネットワーク アプライアンス, インコーポレイテッド | High availability cluster virtual server system |
JP2003203018A (en) * | 2002-01-07 | 2003-07-18 | Mitsubishi Electric Corp | Pseudo cluster system using san |
WO2004102535A2 (en) * | 2003-05-07 | 2004-11-25 | Egenera, Inc. | Disaster recovery for processing resources using configurable deployment platform |
JP2007502479A (en) * | 2003-05-07 | 2007-02-08 | エゲネラ,インク. | Disaster recovery of processing resources using a reconfigurable deployment platform |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10027650B2 (en) | 2011-08-09 | 2018-07-17 | CloudPassage, Inc. | Systems and methods for implementing security |
US10601807B2 (en) | 2011-08-09 | 2020-03-24 | CloudPassage, Inc. | Systems and methods for providing container security |
US10454916B2 (en) | 2011-08-09 | 2019-10-22 | CloudPassage, Inc. | Systems and methods for implementing security |
US10153906B2 (en) | 2011-08-09 | 2018-12-11 | CloudPassage, Inc. | Systems and methods for implementing computer security |
US9201740B2 (en) | 2012-11-22 | 2015-12-01 | Hitachi, Ltd. | Computer system, cluster management method, and management computer |
WO2014080492A1 (en) * | 2012-11-22 | 2014-05-30 | 株式会社日立製作所 | Computer system, cluster management method, and management computer |
US9882919B2 (en) | 2013-04-10 | 2018-01-30 | Illumio, Inc. | Distributed network security using a logical multi-dimensional label-based policy model |
US9942102B2 (en) | 2013-04-10 | 2018-04-10 | Illumio, Inc. | Handling changes in a distributed network management system that uses a logical multi-dimensional label-based policy model |
US9882783B2 (en) | 2013-04-10 | 2018-01-30 | Illumio, Inc. | Distributed network management using a logical multi-dimensional label-based policy model |
JP2016522919A (en) * | 2013-04-10 | 2016-08-04 | イルミオ, インコーポレイテッドIllumio,Inc. | Distributed network management using a logical multidimensional label-based policy model |
US10701090B2 (en) | 2013-04-10 | 2020-06-30 | Illumio, Inc. | Distributed network security using a logical multi-dimensional label-based policy model |
US10897403B2 (en) | 2013-04-10 | 2021-01-19 | Illumio, Inc. | Distributed network management using a logical multi-dimensional label-based policy model |
US10917309B2 (en) | 2013-04-10 | 2021-02-09 | Illumio, Inc. | Distributed network management using a logical multi-dimensional label-based policy model |
US10924355B2 (en) | 2013-04-10 | 2021-02-16 | Illumio, Inc. | Handling changes in a distributed network management system that uses a logical multi-dimensional label-based policy model |
US11503042B2 (en) | 2013-04-10 | 2022-11-15 | Illumio, Inc. | Distributed network security using a logical multi-dimensional label-based policy model |
US10379976B2 (en) | 2014-12-29 | 2019-08-13 | Nuctech Company Limited | Automatic switching method and automatic switching system |
JP2017513119A (en) * | 2014-12-29 | 2017-05-25 | 同方威視技▲術▼股▲分▼有限公司 | Automatic switching method and system |
Also Published As
Publication number | Publication date |
---|---|
JP5316616B2 (en) | 2013-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4462024B2 (en) | Failover method by disk takeover | |
US7802127B2 (en) | Method and computer system for failover | |
US8996477B2 (en) | Multiple node/virtual input/output (I/O) server (VIOS) failure recovery in clustered partition mobility | |
JP4701929B2 (en) | Boot configuration change method, management server, and computer system | |
JP4572250B2 (en) | Computer switching method, computer switching program, and computer system | |
JP2008097276A (en) | Fault recovery method, computing machine system, and management server | |
JP5316616B2 (en) | Business takeover method, computer system, and management server | |
WO2012004902A1 (en) | Computer system and system switch control method for computer system | |
JP2011191854A (en) | Computer system, control method of computer system, and program | |
JP5267544B2 (en) | Failover method by disk takeover | |
US11755438B2 (en) | Automatic failover of a software-defined storage controller to handle input-output operations to and from an assigned namespace on a non-volatile memory device | |
JP5131336B2 (en) | How to change the boot configuration | |
JP5266347B2 (en) | Takeover method, computer system and management server | |
JP4877368B2 (en) | Failover method by disk takeover | |
JP2012064244A (en) | Network boot computer system, management computer and control method for computer system | |
US9143410B1 (en) | Techniques for monitoring guest domains configured with alternate I/O domains | |
JP5321658B2 (en) | Failover method and its computer system. | |
JP5423855B2 (en) | How to change the boot configuration | |
JP2014116035A (en) | Server switching method, server system, and management computer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130624 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5316616 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |