JP2002014938A - クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体 - Google Patents

クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2002014938A
JP2002014938A JP2000199845A JP2000199845A JP2002014938A JP 2002014938 A JP2002014938 A JP 2002014938A JP 2000199845 A JP2000199845 A JP 2000199845A JP 2000199845 A JP2000199845 A JP 2000199845A JP 2002014938 A JP2002014938 A JP 2002014938A
Authority
JP
Japan
Prior art keywords
service
service group
group
node
cluster software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000199845A
Other languages
English (en)
Inventor
Akifumi Murata
明文 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000199845A priority Critical patent/JP2002014938A/ja
Publication of JP2002014938A publication Critical patent/JP2002014938A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】クラスタソフトウェア搭載システムにおける動
作の効率化を図る。 【解決手段】本発明は、少なくとも一つのアプリケーシ
ョンの動作する環境をサービス11a〜11cとし、サ
ービス11a〜11cをクラスタソフトウェア12で制
御するクラスタソフトウェア搭載システム10に関す
る。このクラスタソフトウェア搭載システム10は、複
数のサービス11a〜11cを含むサービスグループ1
1Gの状態を格納するサービスグループ状態管理テーブ
ル14と、サービスグループ11Gの起動手順を示すサ
ービスグループ起動手順情報13とを備える。そして、
制御手段15が、サービスグループ起動手順情報13の
示す起動手順に基づくサービスグループ11Gの制御を
行い、サービスグループ11Gの状態をサービスグルー
プ状態管理テーブル14で管理する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のノード(計
算機、コンピュータなど)が結合された環境における各
ノードの動作を監視するクラスタソフトウェアを搭載し
たシステム及びプログラムを記憶したコンピュータ読み
取り可能な記憶媒体に関する。
【0002】
【従来の技術】クラスタソフトウェアは、分散ノードコ
ンピューティング環境に対して利用される。
【0003】図4は、従来のクラスタソフトウェア搭載
システムを例示するブロック図である。なお、この図4
では、ノード数が2、サービス数が2の場合を例示して
いるが、これに限定されるものではなくいくつでもよ
い。また、サービスの種別もどのようなものであっても
よい。
【0004】この従来のクラスタソフトウェア搭載シス
テム1では、複数のノード2a、2bがネットワーク3
を介して接続されており、それぞれのノード2a、2b
上のクラスタソフトウェア4によって複数のサービス5
a、5bが制御されている。
【0005】ノード2aでサービス5a、5bが運用状
態にあり、ノード2bでサービス5a、5bが待機状態
にある。
【0006】クラスタソフトウェア4は、各サービス5
a、5bをそれぞれ別個に制御する。制御の内容には、
起動、停止、フェールオーバがある。なお、フェールオ
ーバとは、ノードやサービスの障害発生時に待機側でサ
ービスを継続し動作することをいう。
【0007】各ノード2a、2bのクラスタソフトウェ
ア4は、互いにハートビートを定期的(例えば1秒毎)
に出し合うことにより互いの存在を認識し、ハートビー
トが一定期間(例えば10秒)届かなくなると相手ノー
ドの障害を検出し、サービスを引き継ぐ。
【0008】サービスとは、少なくとも一つのアプリケ
ーションの動作する環境である。サービス5aは、IP
通信プログラム61、Webサーバ62、データベース
管理システム(以下、「DBMS」という)63を含
み、Webサービスを提供する。サービス5bは、メー
ル配信ソフトウェア71、ウイルスチェックプログラム
72を含み、メールサービスを提供する。
【0009】クラスタソフトウェア4は、各サービス5
a、5bの状態を管理するサービス状態管理テーブル8
を備えている。このサービス状態管理テーブル8は、各
サービス5a、5bについての待機/起動/運用/停止
などの状態と、どのノードにおける状態なのかを管理す
る。
【0010】また、クラスタソフトウェア4は、各サー
ビス5a、5bについての起動作業の手順を示すサービ
ス起動手順情報9を参照する。
【0011】ここでは、サービス起動手順情報9に、サ
ービス5aについての起動作業の手順「コンテンツを記
憶するディスク64確保→データベース65確保→We
bサーバ62起動→DBMS63起動→IP通信プログ
ラム61起動」が含まれている。また、同様にサービス
5bについての起動作業の手順も含まれている。
【0012】さらに、クラスタソフトウェア4は、サー
ビス優先順位情報22を備える。このサービス優先順位
情報22は、各サービスを優先的に起動すべきノードを
指定する情報である。
【0013】例えば、サービス5aは優先的にノード2
aで起動し、サービス5bは優先的にノード2bで起動
する旨をこのサービス優先順位情報22に記述したとす
る。
【0014】すると、クラスタソフトウェア4はその内
容にしたがって、サービス5aを優先的にノード2aで
起動し、サービス5bは優先的にノード2bで起動し、
障害が発生した場合にノード2a、2b間で各サービス
5a、5bをバックアップしあう。
【0015】
【発明が解決しようとする課題】上記図4に例示されて
いる従来のクラスタソフトウェア搭載システム1におい
て、例えばデータベース65のバックアップを行う場合
には、バックアップ作業中にデータベース65がアクセ
スされないようにDBMS63を停止する必要がある。
【0016】しかしながら、従来のクラスタソフトウェ
ア搭載システム1においては、サービス単位で起動、停
止等の制御が行われるため、DBMS63を停止するた
めにはサービス5a全体を停止する必要がある。
【0017】すると、サービス5aのうち、データベー
ス65のバックアップに直接関係のないWebサーバ6
2やIP通信プログラム61まで利用できないことにな
る。このようにサービスのうちの一要素の停止・再起動
のためにサービス全体を停止・再起動するのは効率的で
はない。
【0018】本発明は、以上のような実情に鑑みてなさ
れたもので、保守や運用を効率化するクラスタソフトウ
ェア搭載システム及びプログラムを記憶したコンピュー
タ読み取り可能な記憶媒体を提供することを目的とす
る。
【0019】
【課題を解決するための手段】本発明の骨子は、複数の
サービスをグループ化して連係動作させ、このグループ
化した状態を全ノード共通で管理する点にある。
【0020】以下、本発明を実現するにあたって講じた
具体的手段について説明する。
【0021】第1の発明は、少なくとも一つのアプリケ
ーションの動作する環境をサービスとし、サービスをク
ラスタソフトウェアで制御するクラスタソフトウェア搭
載システムに関する。この第1の発明は、複数のサービ
スを含むサービスグループの状態を格納するサービスグ
ループ状態管理テーブルと、サービスグループの起動手
順を示すサービスグループ起動手順情報とを具備する。
そして、制御手段が、サービスグループ起動手順情報の
示す起動手順に基づくサービスグループの制御を行い、
サービスグループの状態をサービスグループ状態管理テ
ーブルで管理する。
【0022】なお、サービスグループの制御の内容とし
ては、起動、停止、フェールオーバなどがある。例え
ば、サービスは、単体としても利用したい範囲で設定
し、サービスグループは、一体として起動、停止、フェ
ールオーバさせたい範囲で設定する。制御手段は、クラ
スタソフトウェアに含まれてもよい。
【0023】この第1の発明においては、運用状態のサ
ービスグループに含まれるいずれかのサービスを停止す
る場合に、この停止対象のサービスのみが停止状態とさ
れるがこのサービスグループ全体とこのサービスグルー
プに含まれる他のサービスについては運用状態のままと
される。
【0024】したがって、停止対象のサービスについて
は利用できないが、このサービスグループのうち停止対
象のサービスに直接関係のない他のサービスについては
利用でき、サービスの保守作業や運用を効率化できる。
【0025】また、この第1の発明においては、グルー
プ化した単位での起動が可能なため、ノード障害時のフ
ェールオーバ条件をグループ化した状態で判断できる。
【0026】第2の発明は、第1の発明と同様のクラス
タソフトウェア搭載システムである。この第2の発明
は、サービスグループに含まれているサービス毎に、そ
のサービスを配置するノードを指定するサービス配置情
報を付加する。そして、制御手段が、サービスグループ
を起動する場合にサービス配置情報とサービスグループ
起動手順情報とにしたがってサービスグループに含まれ
ているサービスを起動する。
【0027】例えば、あるノード群にサービスグループ
を配置する場合に、このサービスグループに含まれてい
る各サービスをどのノードに配置するかをサービス配置
ノード情報で指定する。同様に、他のノード群にサービ
スグループを配置する場合に、このサービスグループに
含まれている各サービスをどのノードに配置するかをサ
ービス起動ノード情報として指定する。
【0028】この第2の発明においては、上記第1の発
明と同様の作用効果に加えて、サービスグループに含ま
れている各サービスを複数のノードに分散して配置でき
るため、負荷を分散させることができる。
【0029】第3の発明は、クラスタソフトウェア搭載
システムに関する発明であり、複数のサービス間の優先
関係を示すサービス間優先情報と、サービス間優先情報
を参照し、起動対象のサービスよりも優先度が高く停止
状態のサービスを起動する制御手段を具備する。
【0030】この第3の発明においては、あるサービス
に必要な他のサービスの優先度を高く設定することによ
り、起動対象のサービスに加えてこの起動対象のサービ
スに必要な他のサービスも起動させることができる。し
たがって、サービスを正常に動作させることができる。
【0031】なお、制御手段は、サービス間優先情報を
参照し、停止対象のサービスよりも優先度が低く運用状
態のサービスを停止するとしてもよい。これにより、停
止対象のサービスが停止しても、そのまま運用を維持し
たいサービスの優先度を高く設定することで、このサー
ビスの運用状態を維持できる。
【0032】第4の発明は、コンピュータに、サービス
グループの状態を管理するサービスグループ状態管理テ
ーブルを参照する機能と、サービスグループに含まれて
いるサービスの起動手順を示すサービスグループ起動手
順情報を参照する機能と、サービスグループ起動手順情
報の示す手順に基づくサービスグループの制御を行い、
サービスグループの状態をサービスグループ状態管理テ
ーブルで管理する制御機能とを実現させるためのプログ
ラムを記憶したコンピュータ読み取り可能な記憶媒体で
ある。
【0033】第5の発明は、コンピュータに、サービス
グループの状態を管理するサービスグループ状態管理テ
ーブルを参照する機能と、サービスグループに含まれて
いるサービスの起動手順を示すサービスグループ起動手
順情報を参照する機能と、サービスグループに含まれて
いるサービス毎に、そのサービスを配置するノードを指
定するサービス配置情報を参照する機能と、サービスグ
ループを起動する場合にサービス配置ノード情報とサー
ビスグループ起動手順情報とにしたがってサービスグル
ープに含まれているサービスを起動し、サービスグルー
プの状態をサービスグループ状態管理テーブルで管理す
る制御機能とを実現させるためのプログラムを記憶した
コンピュータ読み取り可能な記憶媒体である。
【0034】第6の発明は、コンピュータに、複数のサ
ービス間の優先関係を示すサービス間優先情報を参照
し、起動対象のサービスよりも優先度が高く停止状態の
サービスを起動する制御機能を実現させるためのプログ
ラムを記憶したコンピュータ読み取り可能な記憶媒体で
ある。
【0035】上記第4から第6までの発明をクラスタソ
フトウェアの機能として、あるいはクラスタソフトウェ
アとともに適用することにより、それぞれ第1から第3
までの発明で説明したクラスタソフトウェア搭載システ
ムの機能をコンピュータに実現させることができる。
【0036】すなわち、このようなプログラムを記憶し
た記憶媒体を用いることによって、上述した機能を有し
ていないクラスタソフトウェアに対しても、簡単に上述
した機能を付加することができ、第1から第3までの発
明と同様の作用効果が得られる。
【0037】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態について説明する。
【0038】(第1の実施の形態)本実施の形態におい
ては、複数のサービスをグループ化したサービスグルー
プの状態を管理し、サービスグループを起動させる場合
にはそのサービスグループに含まれている複数のサービ
スを所定の起動手順にしたがって起動させるクラスタソ
フトウェア搭載システムについて説明する。
【0039】図1は、本実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図であ
り、先の図4と同一の部分には同一の符号を付してその
説明を省略し、ここでは異なる部分についてのみ詳しく
説明する。
【0040】なお、この図1においては、サービスグル
ープ数が1、その中のサービス数が3、ノード数が2の
場合を例示しているが、これに限定されるものではなく
サービスグループ数、ノード数、サービス数は自由に設
定可能である。また、サービスの種類やサービスグルー
プの起動手順、サービスの起動手順も自由に設定可能で
ある。
【0041】クラスタソフトウェア搭載システム10
は、複数のサービス11a〜11cをグループ化してサ
ービスグループ11Gとしている。
【0042】クラスタソフトウェア12は、先に述べた
従来のクラスタソフトウェア4と同様にノード2a、2
bで動作し、サービス状態管理テーブル8を備え、サー
ビス起動手順情報9を参照する。
【0043】なお、サービス起動手順情報9には、各サ
ービス11a〜11cの起動手順が指定されている。
【0044】加えて、このクラスタソフトウェア12
は、サービスグループ起動手順情報13を参照し、サー
ビスグループ状態管理テーブル14と制御部15を備
え、ハートビートやサービスの状態、サービスグループ
の状態を互いに通知する。
【0045】サービスグループ起動手順情報13は、サ
ービスグループの起動作業の手順が指定されている。こ
こでは、サービスグループ11Gの起動手順が「サービ
ス11b→サービス11c→サービス11a」である場
合が例示されている。
【0046】サービスグループ状態管理テーブル14
は、サービスグループについての待機/起動/運用/停
止などの状態と、そのサービスグループの状態がどのノ
ードにおける状態なのかを管理する。
【0047】制御部15は、サービスグループ状態管理
テーブルを用いてサービスグループの状態を管理し、サ
ービスグループの制御(起動、停止、フェールオーバな
ど)を行う。この制御部15による制御によってサービ
スグループが起動される場合には、サービスグループ起
動手順情報13の示す手順にしたがう。
【0048】クラスタソフトウェア12は、制御部15
を備えることにより、障害発生前後でサービスグループ
11Gの状態と、そのサービスグループ11Gに含まれ
るサービス11a〜11cの状態とが整合するように制
御を行う。
【0049】例えば、ノード2a上でサービスグループ
11Gが運転状態であり、このサービスグループ11G
に含まれている各サービス11a〜11cも運転状態で
あるとする。ここで、データベース65のバックアップ
作業を開始するために、サービス11cが停止されたと
する。この場合、サービス11cが停止されても、サー
ビスグループ11Gは運転状態であり、サービス11
a、11bも運転状態であるため、サービス11a、1
1bは引き続き利用可能である。
【0050】この状態においてノード2aに障害が発生
したとする。すると、ノード2b上のクラスタソフトウ
ェア12によってノード2b上で待機状態であったサー
ビスグループ11Gが起動される。しかしながら、障害
発生前のノード2aではサービス11cが停止状態であ
ったため、障害発生後にノード2bでサービスグループ
11Gを引き継ぐ場合には、サービスグループ11Gと
サービス11a、11bを運転状態とし、サービス11
cを停止状態とする。
【0051】また、例えば、ノード2a上でサービスグ
ループ11G及びこのサービスグループ11Gに含まれ
る全てのサービス11a〜11cが運転状態の場合に、
ノード2aに障害が発生したとする。すると、ノード2
b上のクラスタソフトウェア12によってノード2b上
で待機状態であったサービスグループ11Gが起動さ
れ、サービスグループ11Gとサービス11a〜11c
が運転状態となる。
【0052】上記のような構成を持つクラスタソフトウ
ェア搭載システム10の動作について以下に説明する。
【0053】第1の動作例として、サービスグループ1
1Gのフェールオーバについて説明する。
【0054】サービスグループ11Gがノード2aで起
動される場合、ノード2a上のクラスタソフトウェア1
2は、サービスグループ11Gの状態を「ノード2aで
自動で起動状態」としてノード2bに通知する。このサ
ービスグループ11Gの状態は、サービスグループ状態
管理テーブル14に記憶される。
【0055】次に、ノード2a上のクラスタソフトウェ
ア12は、サービスグループ起動手順情報13の示す手
順にしたがって、サービスグループ11Gに含まれる各
サービスの起動を以下のように実施する。
【0056】まず、サービス11bの状態を「ノード2
aで起動状態」に変更してノード2bに通知し、サービ
ス起動手順情報9にしたがってサービス11bを起動
し、サービス11bの状態を「ノード2aで運用状態」
に変更し、ノード2bに通知する。
【0057】その後、同様にサービス11c、11aに
対して起動を行う。
【0058】ここで、サービスグループ11Gの起動完
了後、あるいはサービスグループ11Gが起動状態の場
合にノード2aに障害が発生すると、ノード2bは障害
発生後一定の期間ノード2aからハートビートを受信し
ないことによりノード2aの障害を検出する。
【0059】ノード2bは、ノード2aの障害を検出す
ると、サービスグループ11Gの状態をサービスグルー
プ状態管理テーブル14でチェックし、サービスグルー
プ11Gのうち「ノード2aで起動状態」もしくは「ノ
ード2aで運用状態」であったサービス全てを引き継
ぐ。
【0060】なお、「ノード2aで自動で起動状態」だ
ったサービスグループ11Gをノード2bが引き継ぐ場
合の起動手順は、上記ノード2aの場合の起動手順と同
様である。一方、「ノード2aで運用状態」だったサー
ビスグループ11Gをノード2bが引き継ぐ場合の起動
手順は、サービスグループ起動手順情報13の示す手順
にしたがって「ノード2aで運用状態」であったサービ
スのみが起動される。
【0061】次に、第2の動作例として、サービスグル
ープ11Gに含まれる任意のサービスを停止する場合に
ついて、サービス11cを停止する場合を例として説明
する。
【0062】まず、サービスグループ11Gの状態を
「ノード2aで運用状態」から「ノード2aで手動で運
用状態」に変更する。
【0063】そして、停止対象のサービス11cを停止
し、このサービス11cの状態を「ノード2aで運用状
態」から「ノード2aで待機状態」に変更し、最後にサ
ービスグループ11G全体の状態を「ノード2aで運用
状態」に戻す。
【0064】これにより、サービスグループ11Gを
「ノード2aで運用状態」としたままで、任意のサービ
ス11cが停止される。
【0065】さらに、第3の動作例として、ノード2a
でサービスグループ11Gを手動で起動するについて説
明する。
【0066】ノード2aでサービスグループ11Gを手
動で起動する場合には、まずサービスグループ11Gの
状態を「ノード2aで手動で起動」とし、このサービス
グループ11Gに含まれている各サービス11b、11
c、11aを順次起動し、起動が完了したらサービスグ
ループ11G全体を「ノード2aで運用状態」とする。
【0067】以上説明したように、本実施の形態に係る
クラスタソフトウェア搭載システム10においては、複
数のサービス11a〜11cを含むサービスグループ1
1G単位で起動、停止、フェールオーバなどの制御が行
われる。
【0068】これにより、複数のサービスをまとまりと
して管理し、障害が発生してもクラスタソフトウェア1
2により動作を継続できる。
【0069】また、サービスグループ11Gに含まれて
いるいくつかのサービスを停止しても、このサービスグ
ループ11Gに含まれている停止されていないサービス
を継続して利用でき、停止したサービスを再起動させる
場合にはそのサービスのみを再起動させればよい。
【0070】したがって、サービスについての保守や運
用を効率化できる。
【0071】ここで、本実施の形態によるクラスタ制御
の効果と従来のクラスタ制御との第1の比較例を以下に
説明する。
【0072】例えば、従来において、共有ディスク上の
データベースを利用するデータベースサービスがあり、
このサービスの起動手順として「共有ディスクの確保→
DBMSの起動」が定義されているとする。
【0073】この場合、データベースのバックアップを
行うにはDBMSを停止しなければならず、そのために
データベースサービス全体を停止することになる。デー
タベースサービス全体を停止すると、共有ディスクの解
放も行われてしまう。
【0074】したがって、従来においては、データベー
スサービス停止後にクラスタ制御外で手動により共有デ
ィスクを確保してバックアップを行っており、バックア
ップ作業に手間がかかる。
【0075】これに対し、本実施の形態によるクラスタ
制御においては、共有ディスク確保サービスとDBMS
サービスとを1つのサービスグループとして定義するこ
とで、バックアップのための共有メモリの確保をクラス
タ制御内で行うことができる。
【0076】例えば、本実施の形態において、サービス
グループ起動手順を「共有ディスク確保サービス→DB
MSサービス」とし、共有ディスク確保サービスのサー
ビス起動手順を「共有ディスク確保」とし、DBMSサ
ービスのサービス起動手順を「DBMS起動」とする。
【0077】このサービスグループが運用状態(共有デ
ィスク確保サービスの運用状態、DBMSサービスの運
用状態)のままでバックアップ作業を行う場合、サービ
スグループ全体を手動で運用状態とし、DBMSサービ
スを停止してから、サービスグループ全体を自動で運用
状態に戻せばよい。これにより、DBMSサービスのみ
を停止し、共有ディスクは確保されたままとなるため、
バックアップ作業の労力を軽減できる。
【0078】また、本実施の形態によるクラスタ制御の
効果と従来のクラスタ制御との第2の比較例を以下に説
明する。
【0079】例えば、従来においては、共有ディスク・
DBMS・TPモニタからなるサービスがあり、このサ
ービスの起動が失敗し、起動失敗原因を調査する場合、
クラスタ制御外で手動で、共有ディスク確保、DBMS
起動などのこのサービスの起動手順を順次実施し、調査
を行う必要があり、起動失敗原因の調査に手間がかか
る。
【0080】これに対し、本実施の形態によるクラスタ
制御においては、DBMSサービス・共有ディスク確保
サービス・TPモニタサービスを1つのサービスグルー
プとして定義することで、起動失敗原因の調査労力を軽
減できる。
【0081】例えば、起動時の障害が発生すると、サー
ビスグループ全体の状態を手動で起動状態とし、サービ
スグループ起動手順「共有ディスク確保サービス→DB
MSサービス→TPモニタサービス」にしたがってクラ
スタ制御上から起動を行い、調査できる。
【0082】なお、本実施の形態に係るクラスタソフト
ウェア搭載システム10は、同様の作用・機能を実現可
能であれば各構成要素の配置を変更させてもよく、また
各構成要素を自由に組み合わせてもよい。
【0083】例えば、サービス起動手順情報9やサービ
スグループ起動手順情報13の少なくとも一方をクラス
タソフトウェア12に含めてもよい。また、サービス状
態管理テーブル8、サービスグループ状態管理テーブル
14、制御部15の少なくとも一つをクラスタソフトウ
ェア15から分離してもよい。
【0084】(第2の実施の形態)本実施の形態におい
ては、サービスグループに含まれている各サービスの配
置位置が設定されているクラスタソフトウェア搭載シス
テムについて説明する。
【0085】特に、本実施の形態においては、サービス
グループが配置される位置に応じて、このサービスグル
ープに含まれている各サービスの配置位置が設定されて
いる場合を説明する。
【0086】図2は、本実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図であ
り、図1と同一の部分には同一の符号を付してその説明
を省略し、ここでは異なる部分についてのみ詳しく説明
する。
【0087】このクラスタソフトウェア搭載システム1
6は、ノード17a〜17dがネットワーク3を介して
接続されて構成され、上記第1の実施の形態に係るクラ
スタソフトウェア搭載システムと同様の機能を備えてい
る。なお、ノードの数は複数であればいくつでもよい。
また、ここではサービス18a、18bを含むサービス
グループ18Gが制御される場合を例示しているが、サ
ービスグループ数やその内容の自由に設定できる。
【0088】加えて、クラスタソフトウェア搭載システ
ム16は、サービス配置情報19aを付加したサービス
グループ起動手順情報19を備え、クラスタソフトウェ
ア20の制御部21がこのサービス配置情報19aに基
づく制御を行う。
【0089】サービス配置情報19aは、サービスグル
ープを起動するノードの組み合わせ毎に、そのサービス
グループに含まれるサービスを起動するノードを指定す
る情報である。
【0090】ここでは、サービスグループ18Gをノー
ド17a、17bで起動する場合には、サービス18a
をノード17aで起動し、サービス18bをノード17
bで起動する旨がサービス配置情報19aで指定されて
いる。一方、サービスグループ18Gをノード17c、
17dで起動する場合には、サービス18aをノード1
7cで起動し、サービス18bをノード17dで起動す
る旨がサービス配置情報19aで指定されている。
【0091】制御部21を備えるクラスタソフトウェア
20は、上記第1の実施の形態で述べたクラスタソフト
ウェア12と同様の機能に加えて、サービス配置情報1
9aにしたがってサービスグループ18Gの起動、停
止、フェールオーバなどの制御を行う。
【0092】上記のような構成を持つクラスタソフトウ
ェア搭載システム16の動作について以下に説明する。
【0093】サービスグループ18Gがノード17a、
17bで起動される場合、サービス配置情報19aを含
むサービスグループ起動手順情報19、サービス起動手
順情報9にしたがって、サービス18aがノード17a
で起動され、サービス18bがノード17bで起動され
る。また、サービスグループ18G及びサービス18
a、18bの状態が全てのノード17a〜17dに通知
される。
【0094】ノード17a又は17bに障害が発生した
場合には、障害の発生していない側のノードで運用され
ていたサービスが停止され、ノード17c、17dでサ
ービスグループ18Gが起動される。
【0095】以上説明したように、本実施の形態に係る
クラスタソフトウェア搭載システム16においては、上
記第1の実施の形態と同様の効果に加えて、サービスグ
ループ18Gに含まれるサービス18a、18bをノー
ド間にまたがって配置できるため、負荷を分散できる。
【0096】なお、本実施の形態に係るクラスタソフト
ウェア搭載システム16は、同様の作用・機能を実現可
能であれば各構成要素の配置を変更させてもよく、また
各構成要素を自由に組み合わせてもよい。
【0097】例えば、サービスグループ起動手順情報1
9とサービス配置情報19aが分離していてもよく、こ
のサービスグループ起動手順情報19とサービス配置情
報19aの少なくとも一方をクラスタソフトウェア12
に備えてもよい。その他、上記第1の実施の形態で述べ
た変形と同様の変形を行ってもよい。
【0098】(第3の実施の形態)本実施の形態におい
ては、サービス間の優先度にしたがってサービスの制御
を行うクラスタソフトウェア搭載システムについて説明
する。
【0099】図3は、本実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図であ
り、先の図4と同一の部分には同一の符号を付してその
説明を省略し、ここでは異なる部分についてのみ詳しく
説明する。
【0100】このクラスタソフトウェア搭載システム2
3は、ノード24a、24bがネットワーク3を介して
接続されて構成され、上記図4に示すクラスタソフトウ
ェア搭載システム1と同様の機能を備えている。なお、
ノードの数は複数であればいくつでもよい。また、ここ
ではサービス25a、25bが制御される場合を例示し
ているが、サービス数は複数であればよく、サービスの
内容は自由に設定できる。
【0101】サービス25bは、ウイルスチェックプロ
グラム72を含み、ウイルスチェックサービスを提供す
る。
【0102】サービス25aは、メール配信ソフトウェ
ア71を含み、メールサービスを提供する。このメール
サービスは、ウイルスチェック後にメールを配信するサ
ービスである。
【0103】すなわち、サービス25aは、サービス2
5bのウイルスチェックプログラム72を利用してウイ
ルスチェックを行った後に、メール配信ソフトウェア7
1でメールを配信する。
【0104】したがって、サービス25aは、サービス
25bが運用状態の場合にのみ利用でき、サービス25
bが停止状態の場合には正常に動作しないことになる。
【0105】サービス間優先情報26は、サービス間の
優先順位を指定する情報であり、ここでは、サービス2
5aよりもサービス25bの優先度が高く設定されてい
る。
【0106】ノード24a、24bのクラスタソフトウ
ェア27は、制御部28を備えている。この制御部28
は、サービスを起動する場合に、サービス間優先情報2
6を参照し、起動対象のサービスよりも優先度の高いサ
ービスが起動されていれば、この起動対象のサービスを
起動する制御を行う。
【0107】また、制御部28は、サービスを停止する
場合にもサービス間優先情報26を参照し、あるサービ
スを起動する場合に、この停止対象のサービスよりも優
先度の低いサービス及び起動対象のサービスを停止する
制御を行う 上記のような構成を持つクラスタソフトウェア搭載シス
テム23の動作について以下に説明する。
【0108】いずれのサービス25a、25bも運用さ
れていない状態からサービス25aが起動される場合、
サービス間優先情報26の内容がチェックされ、サービ
ス25aの優先度がサービス25bの優先度よりも小さ
いと認識される。
【0109】これにより、サービス25aが起動される
にはサービス25bが運用状態でなければならないと認
識され、サービス25bが運用状態か否かが判定され
る。
【0110】判定の結果、サービス25bは運用状態に
ないため、サービス25bがサービス優先順位情報22
で優先度の高く設定されているノードで起動される。
【0111】そして、サービス25bの起動が完了する
と、サービス25aがサービス優先順位情報22で優先
度の高く設定されているノードで起動される。
【0112】また、サービス25a、25bの運転状態
からサービス25bを停止する場合、サービス間優先情
報26が参照され、まず停止対象のサービス25bより
も優先度の低いサービス25aが停止され、その後停止
対象のサービス25bが停止される。
【0113】以上説明したように、本実施の形態に係る
クラスタソフトウェア搭載システム23においては、あ
るサービスを起動するには他のサービスが運用状態でな
ければならないという条件が存在する場合であっても動
作を正常に保つことができる。
【0114】ここで、本実施の形態によるクラスタ制御
の効果と従来のクラスタ制御との比較例を以下に説明す
る。
【0115】例えば、あるアプリケーションとDBMS
がそれぞれ別のサービスとしてノード間で分散されて運
用される場合であって、このアプリケーションはDBM
Sが起動されていないと完全に運用できないとする。
【0116】この場合、従来のクラスタ制御では、DB
MSによるサービスのみが停止されるとアプリケーショ
ンによるサービスにまで影響が生じることがある。
【0117】また、双方のサービスとも停止されている
状態から、アプリケーションによるサービスのみが起動
されても正常に動作しないことがある。
【0118】これに対し、本実施の形態によるクラスタ
制御においては、先に起動すべきサービスの優先度を後
から起動すべきサービスよりも高く設定され、このサー
ビス間の優先度がチェックされる。そして、アプリケー
ションによるサービスのみの起動が要求されても、必要
とされるDBMSによるサービスが起動されてからアプ
リケーションによるサービスが起動されるため、正常な
動作が確保できる。
【0119】なお、本実施の形態に係るクラスタソフト
ウェア搭載システム23は、同様の作用・機能を実現可
能であれば各構成要素の配置を変更させてもよく、また
各構成要素を自由に組み合わせてもよい。
【0120】例えば、サービス間優先情報26をクラス
タソフトウェア12に備えてもよい。また、サービス状
態管理テーブル8、サービス優先順位情報22、制御部
28のうちの少なくとも一つをクラスタソフトウェア2
7から分離してもよい。
【0121】また、上記第1乃至第3の実施の形態に係
るクラスタソフトウェア搭載システム10、16、23
における制御部15、21、28やクラスタソフトウェ
ア12、20、27は、コンピュータに実行させること
のできるプログラムとして、例えば磁気ディスク(フロ
ッピー(登録商標)ディスク、ハードディスク等)、光
ディスク(CD−ROM、DVD等)、半導体メモリな
どの記憶媒体に書き込んで適用したり、通信媒体により
伝送してコンピュータに適用することも可能である。上
記機能を実現するコンピュータは、記憶媒体に記憶され
たプログラムを読み込み、プログラムによって動作が制
御されることにより、上述した処理を実行する。
【0122】
【発明の効果】以上詳記したように本発明においては、
複数のサービスを含むサービスグループについてクラス
タ制御が行われ、あるサービスが停止されても他のサー
ビスの運用状態が維持される。これにより、サービスの
運用、保守を効率的に行うことができる。
【0123】また、本発明においては、サービスグルー
プに含まれる複数のサービスがそれぞれ指定されたノー
ドに配置されるため、負荷を分散できる。
【0124】また、本発明においては、起動対象のサー
ビスより優先度の高いサービスも起動させるため、この
起動対象のサービスにとって必要な他のサービスを起動
させることができ、正常な動作を実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図。
【図2】本発明の第2の実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図。
【図3】本発明の第3の実施の形態に係るクラスタソフ
トウェア搭載システムの構成例を示すブロック図。
【図4】従来のクラスタソフトウェア搭載システムを例
示するブロック図。
【符号の説明】
1、10、16、23…クラスタソフトウェア搭載シス
テム 2a、2b、17a〜17d、24a、24b…ノード 3…ネットワーク 4、12、20、27…クラスタソフトウェア 5a、5b、11a〜11c、18a、18b、25
a、25b…サービス 8…サービス状態管理テーブル 9…サービス起動手順情報 11G、18G…サービスグループ 13、19…サービスグループ起動手順情報 19a…サービス配置情報 14…サービスグループ状態管理テーブル 15、21、28…制御部 22…サービス優先順位情報 26…サービス間優先情報

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも一つのアプリケーションの動
    作する環境をサービスとし、サービスをクラスタソフト
    ウェアで制御するクラスタソフトウェア搭載システムに
    おいて、 複数のサービスを含むサービスグループの状態を格納す
    るサービスグループ状態管理テーブルと、 前記サービスグループの起動手順を示すサービスグルー
    プ起動手順情報と、 前記サービスグループ起動手順情報の示す起動手順に基
    づく前記サービスグループの制御を行い、前記サービス
    グループの状態を前記サービスグループ状態管理テーブ
    ルで管理する制御手段とを具備したことを特徴とするク
    ラスタソフトウェア搭載システム。
  2. 【請求項2】 請求項1記載のクラスタソフトウェア搭
    載システムにおいて、 前記サービスグループに含まれているサービス毎に、そ
    のサービスを配置するノードを指定するサービス配置情
    報を付加し、 前記制御手段は、前記サービスグループを起動する場合
    に前記サービス配置情報と前記サービスグループ起動手
    順情報とにしたがって前記サービスグループに含まれて
    いるサービスを起動することを特徴とするクラスタソフ
    トウェア搭載システム。
  3. 【請求項3】 少なくとも一つのアプリケーションの動
    作する環境をサービスとし、サービスをクラスタソフト
    ウェアで制御するクラスタソフトウェア搭載システムに
    おいて、 複数のサービス間の優先関係を示すサービス間優先情報
    と、 前記サービス間優先情報を参照し、起動対象のサービス
    よりも優先度が高く停止状態のサービスを起動する制御
    手段とを具備したことを特徴とするクラスタソフトウェ
    ア搭載システム。
  4. 【請求項4】 コンピュータに、 少なくとも一つのアプリケーションの動作する環境をサ
    ービスとし、複数のサービスを含むサービスグループの
    状態を管理するサービスグループ状態管理テーブルを参
    照する機能と、 前記サービスグループに含まれているサービスの起動手
    順を示すサービスグループ起動手順情報を参照する機能
    と、 前記サービスグループ起動手順情報の示す手順に基づく
    前記サービスグループの制御を行い、前記サービスグル
    ープの状態を前記サービスグループ状態管理テーブルで
    管理する制御機能とを実現させるためのプログラムを記
    憶したコンピュータ読み取り可能な記憶媒体。
  5. 【請求項5】 コンピュータに、 少なくとも一つのアプリケーションの動作する環境をサ
    ービスとし、複数のサービスを含むサービスグループの
    状態を管理するサービスグループ状態管理テーブルを参
    照する機能と、 前記サービスグループに含まれているサービスの起動手
    順を示すサービスグループ起動手順情報を参照する機能
    と、 前記サービスグループに含まれているサービス毎に、そ
    のサービスを配置するノードを指定するサービス配置情
    報を参照する機能と、 前記サービスグループを起動する場合に前記サービス配
    置ノード情報と前記サービスグループ起動手順情報とに
    したがって前記サービスグループに含まれているサービ
    スを起動し、前記サービスグループの状態を前記サービ
    スグループ状態管理テーブルで管理する制御機能とを実
    現させるためのプログラムを記憶したコンピュータ読み
    取り可能な記憶媒体。
  6. 【請求項6】 コンピュータに、 複数のサービス間の優先関係を示すサービス間優先情報
    を参照し、起動対象のサービスよりも優先度が高く停止
    状態のサービスを起動する制御機能を実現させるための
    プログラムを記憶したコンピュータ読み取り可能な記憶
    媒体。
JP2000199845A 2000-06-30 2000-06-30 クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体 Pending JP2002014938A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000199845A JP2002014938A (ja) 2000-06-30 2000-06-30 クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000199845A JP2002014938A (ja) 2000-06-30 2000-06-30 クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2002014938A true JP2002014938A (ja) 2002-01-18

Family

ID=18697794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000199845A Pending JP2002014938A (ja) 2000-06-30 2000-06-30 クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2002014938A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006043321A1 (ja) * 2004-10-20 2008-05-22 富士通株式会社 アプリケーション管理プログラム、アプリケーション管理方法、およびアプリケーション管理装置
JP2009098715A (ja) * 2007-10-12 2009-05-07 Nec Corp 冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラム
JP2010055485A (ja) * 2008-08-29 2010-03-11 Fujitsu Ltd ストレージ装置の制御部及び制御方法
JP2013522716A (ja) * 2010-03-12 2013-06-13 シマンテック コーポレーション 高可用性障害回復環境において複合サービスグループを定義し、視覚化し、管理するためのシステムおよび方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006043321A1 (ja) * 2004-10-20 2008-05-22 富士通株式会社 アプリケーション管理プログラム、アプリケーション管理方法、およびアプリケーション管理装置
JP4558740B2 (ja) * 2004-10-20 2010-10-06 富士通株式会社 アプリケーション管理プログラム、アプリケーション管理方法、およびアプリケーション管理装置
US7975038B2 (en) 2004-10-20 2011-07-05 Fujitsu Limited Application management program, application management method, and application management apparatus
JP2009098715A (ja) * 2007-10-12 2009-05-07 Nec Corp 冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラム
JP2010055485A (ja) * 2008-08-29 2010-03-11 Fujitsu Ltd ストレージ装置の制御部及び制御方法
JP2013522716A (ja) * 2010-03-12 2013-06-13 シマンテック コーポレーション 高可用性障害回復環境において複合サービスグループを定義し、視覚化し、管理するためのシステムおよび方法

Similar Documents

Publication Publication Date Title
US8464092B1 (en) System and method for monitoring an application or service group within a cluster as a resource of another cluster
US6859889B2 (en) Backup system and method for distributed systems
US6178529B1 (en) Method and system for resource monitoring of disparate resources in a server cluster
US6986076B1 (en) Proactive method for ensuring availability in a clustered system
CA3168286A1 (en) Data flow processing method and system
US7543174B1 (en) Providing high availability for an application by rapidly provisioning a node and failing over to the node
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US7146532B2 (en) Persistent session and data in transparently distributed objects
US7895468B2 (en) Autonomous takeover destination changing method in a failover
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US8112518B2 (en) Redundant systems management frameworks for network environments
KR20030067712A (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
US7516181B1 (en) Technique for project partitioning in a cluster of servers
US20210406127A1 (en) Method to orchestrate a container-based application on a terminal device
US10331472B2 (en) Virtual machine service availability
CN111459639B (zh) 一种支持全球多机房部署的分布式任务管理平台及方法
CN114064414A (zh) 一种高可用的集群状态监控方法及系统
EP3087483A1 (en) System and method for supporting asynchronous invocation in a distributed data grid
CN107508700B (zh) 容灾方法、装置、设备及存储介质
CN113946408A (zh) 云原生边缘容器控制方法、系统及存储介质
CN113766004A (zh) 一种基于多云平台的灾备系统、方法及存储介质
JP2001022709A (ja) クラスタシステム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2002014938A (ja) クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
US9973569B2 (en) System, method and computing apparatus to manage process in cloud infrastructure

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090317