JP2005258983A - 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法 - Google Patents

複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法 Download PDF

Info

Publication number
JP2005258983A
JP2005258983A JP2004072077A JP2004072077A JP2005258983A JP 2005258983 A JP2005258983 A JP 2005258983A JP 2004072077 A JP2004072077 A JP 2004072077A JP 2004072077 A JP2004072077 A JP 2004072077A JP 2005258983 A JP2005258983 A JP 2005258983A
Authority
JP
Japan
Prior art keywords
computer
standby
active
processing
cluster systems
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004072077A
Other languages
English (en)
Inventor
Kazuo Okubo
和生 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004072077A priority Critical patent/JP2005258983A/ja
Publication of JP2005258983A publication Critical patent/JP2005258983A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】複数のクラスタシステムを有するコンピュータシステムにおいて、複数のクラスタシステムの現用系計算機に対して、費用対効果に見合った待機系計算機を用意し、かつ、システム全体としても信頼性を確保することにある。
【解決手段】複数のクラスタシステムにネットワークを介して接続され、複数のクラスタシステムの現用計算機に対する待機系計算機を設置する。そして、複数のクラスタシステムおよび待機系計算機にネットワークを介して接続される処理引継ぎ判定装置と待機計算機割当て装置を設け、処理引継ぎ判定装置に、複数のクラスタシステムの各現用系計算機が正常に動作しているかを否かを判定させ、待機計算機割当て装置に、正常に動作していないと判定された現用系計算機の処理を引き継ぐ待機系計算機を割当てさせる。
【選択図】 図1

Description

本発明は、複数のクラスタシステムを有するコンピュータシステムに係り、特に、ネットワークシステムを介して接続された待機系計算機を各クラスタシステムで共有し、信頼性を高めるコンピュータシステムに関する。
コンピュータシステムの稼働率を向上させるための方法の一つに、複数の計算機をネットワークで接続し、クラスタシステムを構築する方法がある。クラスタシステムを構成する計算機は、平常時にプログラムを実行する現用系計算機と、現用系計算機が何らかの理由で処理を実行することが不可能となった場合に、現用系計算機と同じ処理を現用系計算機の代わりに実行する待機系計算機に分類される。クラスタシステムでは、一般に、現用系の計算機が常時処理を実行し、待機系計算機は、現用系計算機の処理を引継ぐために待機状態を維持し、処理を実行しない。そして、待機系計算機は現用系計算機が何らかの理由で停止した場合、現用系計算機の処理を現用系計算機から引継いで処理する。これにより、処理の実行は中断されることなく、運用をおこなうことができる。
一般には、クラスタシステムで複数台の現用系計算機が存在する場合には、待機系計算機の台数は一台以上であり、かつ、現用系計算機の台数以下を設置することが多い。ところが、処理を引継いだ待機系計算機が現用系計算機と同じ処理性能を確保するためには、現用系計算機と同じ台数の待機系計算機を設置しなければならない。逆に、処理性能を確保しない場合やクラスタシステムの構築費用を削減したい場合は、一台の待機系計算機を複数の現用系計算機で共有し、待機系計算機の数を現用系計算機の数より少なく設置する。
従来のクラスタシステムでは、一つの処理をおこなう現用系計算機と待機系計算機の組合せは固定されているという問題がある。この問題を解決するために、以下の特許文献1では、待機系計算機を動的に変更し、待機系計算機をネットワーク上の任意の計算機に割当てることができる。さらに、任意の待機系計算機に、現用系計算機の処理を引継ぐことができる。
特開平7−287662号公報
クラスタシステムでは、待機系計算機は、現用系計算機が停止した場合、現用系計算機から処理を引継いで稼動する。従って、現用系計算機の稼働率が高いほど、待機系計算機は待機状態を維持し稼働率は低くなる。クラスタシステムでは、システム全体の稼働率を高くするために、稼動率の低い待機系計算機を設置しなければならず、待機系計算機の設置が、クラスタシステム構築の費用を高くするという問題がある。
また、クラスタシステムでは、信頼性を高くするため、または計算機の処理能力を保証するために、現用系計算機と同じ台数の待機系計算機を設置することが望ましい。しかし、上記の問題から、待機系計算機の台数を、現用系の計算機の台数より少なく設置する場合もある。待機系計算機の台数を少なくすることで、クラスタシステム構築の費用は低くなるが、クラスタシステムの信頼性が低下するという問題がある。
上記特許文献1では、動的に待機系計算機を選択することができるが、現用系計算機から待機系計算機に処理を引継ぐ前に、現用系計算機と待機系計算機の組合せが決定されている。例えば、複数の現用系計算機と一台の待機系計算機の組合せが決定されていた場合、待機系計算機が複数の現用系計算機の一台から処理を引継ぐと、他の現用系計算機は、別の待機系計算機との組合せを決定しなければならない。このような事態を回避するためには、現用系計算機と同じ台数の待機系計算機を準備する必要がある。
さらに、複数のクラスタシステムがあるシステムでは、待機系計算機の設置について問題がある。従来のクラスタシステムにおける現用系計算機と待機系計算機の関係は、図18(a)に示されるように、現用系計算機と待機系計算機が一対一に対応している場合や図18(b)に示されるように、現用系計算機が一台の待機系計算機を共用している場合が考えられるが、クラスタシステム間をまたがって待機系計算機を共用することはできなかった。この図18の場合では、待機系計算機W2は、クラスタシステム1では使用することができないし、待機系計算機W11,W12は、クラスタシステム2では使用することができない。
本発明は、上記問題点を解決するためになされたもので、その目的は、複数のクラスタシステムを有するコンピュータシステムにおいて、複数のクラスタシステムの現用系計算機に対して、費用対効果に見合った待機系計算機を用意し、かつ、システム全体としても信頼性を確保することにある。
本発明は、上記の目的を達成するために、以下のように構成したことを特徴とする。
複数のクラスタシステムを有するコンピュータシステムにおいて、複数のクラスタシステムを構成する現用系計算機の待機系計算機が、一つ以上、複数のクラスタシステムにネットワークを介して接続されする。そして、待機系計算機を、記複数のクラスタシステムを構成する現用系計算機から共有しておき、クラスタシステムの各現用系計算機が正常に動作しているかを否かを判定する処理引継ぎ判定装置と、前記処理引継ぎ判定装置の判定により、正常に動作していないと判定された現用系計算機の処理を引き継いで、その代わりに稼動する待機系計算機を割当てる待機計算機割当て装置とを備えることにより、現用系計算機が正常に稼動しないときには、共用された待機系計算機に、その現用系計算機の代わりに処理をおこなわせる。
このような構成により、複数のクラスタシステムで待機系計算機を共有し、共有する待機系計算機の台数を、各クラスタシステムが単独で待機系計算機を設置し、全クラスタシステムの待機系計算機の台数を合計した台数よりも少なくすることで、各クラスタシステムが単独で待機系計算機を設置する場合よりクラスタシステムの構築費用を抑えることができる。
また、複数のクラスタシステムで待機系計算機を共有し、各クラスタシステムが単独で設置する待機系計算機の台数よりも多くの待機系計算機を利用可能とすることで、各クラスタシステム単独で待機系計算機を設置するよりも信頼性の高いクラスタシステムを構築することができる。
本発明によれば、複数のクラスタシステムを有するコンピュータシステムにおいて、複数のクラスタシステムの現用系計算機に対して、費用対効果に見合った待機系計算機を用意し、かつ、システム全体としても信頼性を確保したコンピュータシステムと、複数のクラスタシステムの制御方法を提供することができる。
以下、本発明に係る一実施形態を、図1ないし図17を用いて説明する。
先ず、図1を用いて本発明に係る複数クラスタシステムを有するコンピュータシステムの構成について説明する。
図1は、発明に係る複数クラスタシステムを有するコンピュータシステムの構成図である。
ネットワーク1には、複数のクラスタシステム10、20、30、…、n0(nは整数、以下同様)が接続されている。
ネットワーク1に接続されているクラスタシステム10、20、30、…、n0は、各々プログラムを実行する現用系計算機11(11a、11b、11c、…)、21(21a、21b、21c、…)、31(31a、31b、33c、…)、n1(n1a、n1b、n1c、…)に、プログラムとデータが格納されたディスク装置12、22、32、…、n2と、ディスク装置13、23、33…、n3が接続されている。一つのクラスタシステムの中には、図に示されるように、通常複数の現用系計算機が含まれている。
ここで、ディスク装置13、23、33…、n3は、ディスク装置12、22、32、…、n2と同じプログラム、データが格納されており、ディスク装置n2に格納されるデータは、同時にディスク装置n3にも格納されている。ディスク装置n3は、RAID装置を用いることができる。
また、ディスク装置13、23、33、…、n3は、ネットワーク4で接続されていてもよい。ネットワーク4は、ストレージ装置専用のネットワークであるSAN(Storage Area Network)を用いることができる。
ネットワーク2には、待機系計算機41、42、43、…、4m(mは整数、以下同様)があり、ネットワーク1に接続されているクラスタシステム10、20、30、…、n0の現用系計算機11、21、31、n1の実行動作に異常があったときには、その処理を引き継いで処理をおこなうようになっている。
そして、待機系計算機41、42、43、…、4mは、ネットワーク2を介して接続されており、クラスタシステム10、20、…、n0のネットワーク1とは、ネットワーク3を介して接続されている。待機系計算機41、42、43、…、4mは、ネットワーク4により、ディスク装置13、23、33、…、n3にアクセスできるようになっている。
また、ネットワーク2には、処理引継ぎ判定装置15と待機系計算機割当て装置16が接続されている。
処理引継ぎ判定装置15は、クラスタシステム10、20、…、n0の現用系計算機11、12、…、n1の稼動状況を見て、待機系計算機41、42、43、…、4mに処理を引継ぐか否かを判定し、待機系計算機割当て装置16に通知する。待機系計算機割当て装置16は、引き継いだ現用系計算機のディスク情報を渡して、待機系計算機41、42、43、…、4mに処理を割り当てる。
次に、図2および図3を用いて、現用系計算機から待機系計算機に処理を引継ぐ処理を説明する。
図2は、現用系計算機から待機系計算機に処理を引継ぐときのメッセージシークエンス図である。
図3は、現用系計算機から待機系計算機に処理を引継ぐときの処理を示すフローチャートである。
以下では、n番目のクラスタシステムとm番目の待機系計算機を例にとって、その処理を説明する。
処理引継ぎ判定装置15は、ネットワーク1に接続されている1台の現用系計算機n1に、稼動情報送信要求M1を送信する(ステップ101)。稼動情報送信要求M1は、一定の間隔で常に現用系計算機n1に送信されている。
現用系計算機n1は、稼動情報送信要求M1を受信すると、現用系計算機n1の稼動情報通知M2を作成し、処理引継ぎ判定装置15に送信する。処理引継ぎ判定装置15は、稼動情報通知M2を受信するまで、一定時間待機する(ステップ102)。そして、稼動情報通知M2を受信した、稼動情報通知M2の稼動情報59から現用系計算機n1が正常に稼動しているか否かを判定する(ステップ103)。
現用系計算機n1が正常に稼動していないと判定した場合は、待機系計算機割当て装置16に、待機系計算機割当て要求M3を送信する(ステップ104)。なお、処理引継ぎ判定装置15が、稼動情報通知M2を一定時間内に受信できなかった場合も、現用系計算機n1が正常に稼動していないと判定する。
待機系計算機割当て装置16は、待機系計算機割当て要求M3を受信すると、処理を引継ぐ待機系計算機4mを決定し、該当する待機系計算機4mに現用系計算機の処理開始要求M4を送信する(ステップ105)。
次に、図4ないし図7を用いて現用系計算機から待機系計算機に処理を引継ぐときに用いられるメッセージの形式について説明する。
図4は、稼動情報送信要求M1の形式を示す図である。
図5は、稼動情報通知M2の形式を示す図である。
図6は、待機系計算機割当て要求M3形式を示す図である。
図7は、処理開始要求M4の形式を示す図である。
稼動情報送信要求M1は、処理引継ぎ判定装置15から現用系計算機n1に送られるメッセージであり、図4に示されるように送信元計算機識別子50と、送信先計算機識別子51と、送信先計算機に対する要求52と、認証情報53から構成される。
送信元計算機識別子50は、稼動情報送信要求M1の送信元の計算機を表す識別子である。送信先計算機識別子51は、稼動情報送信要求M1の送信先の計算機を表す識別子である。送信先計算機に対する要求52は、「稼動情報送信」を表すコードが格納されている。認証情報53は、稼動情報送信要求M1が正規の送信元から送信されたことを確認するための情報である。
稼動情報通知M2は、現用系計算機n1から処理引継ぎ判定装置15に送られるメッセージであり、図5に示されるように送信元計算機識別子55と、送信先計算機識別子56と、送信先計算機に対する応答57と、認証情報58と、稼動情報59とから構成される。
送信元計算機識別子55は、稼動情報通知M2の送信元の計算機を表す識別子である。送信先計算機識別子56は、稼動情報の送信先の計算機を表す識別子である。送信先計算機に対する応答57は、「正常」また「異常」を表すコードが格納される。認証情報58は、稼動情報通知M2が正規の送信元から送信されたことを確認するための情報である。
待機系計算機割当て要求M3は、処理引継ぎ判定装置15から待機系計算機割当て装置16に送られるメッセージであり、図6に示されるように送信元計算機識別子60と、送信先計算機識別子61と、送信先計算機に対する要求62と、認証情報63と、現用系計算機識別子64とから構成される。
送信元計算機識別子60は、待機系計算機割当て要求M3の送信元の計算機を表す識別子である。送信先計算機識別子61は、待機系計算機割当て要求M3の送信先の計算機を表す識別子である。送信先計算機に対する要求62は、「割当て」を表すコードが格納される。認証情報58は、待機系計算機割当て要求M3が正規の送信元から送信されたことを確認するための情報である。現用系計算機識別子64は、図3のステップ103で正常に稼動していないと判定された現用系計算機を表す識別子である。
処理開始要求M4は、待機系計算機割当て装置16から待機系計算機4mに送信されるメッセージであり、図7に示されるように送信元計算機識別子65と、送信先計算機識別子66と、待機系計算機に対する要求67と、認証情報68と、ディスク装置識別子69から構成される。
送信元計算機識別子65は、処理開始要求M4の送信元の計算機を表す識別子である。送信先計算機識別子66は、処理開始要求M4の送信先の計算機を表す識別子である。待機系計算機に対する要求67は、「割当て」を表すコードが格納される。認証情報68と、認証情報58は、処理開始要求M4が正規の送信元から送信されたことを確認するための情報である。ディスク装置識別子69現用系計算機から処理を引継ぐために必要となるプログラムやデータが格納されているディスク装置を表す識別子である。
なお、図4ないし図7のメッセージにおいて、送信元計算機識別子50,55,60,65には、ネットワーク1〜3において送信元計算機を一意に特定することができる情報(例えば、IPアドレスやホスト名など)が記載される。同様に、送信先計算機識別子51,56,61,66は、ネットワーク1〜3において送信先計算機を一意に特定することができる情報が記載される。また、認証情報53,58,63,68は、送信先計算機識別子に記された計算機が、受信した稼動情報送信要求M1、稼動情報通知M2、待機系計算機割当て要求M3、または、処理開始要求M4が正当な手段で送信されているかを判定するための情報が記載される。
次に、図8を用いて、処理引継ぎ判定装置15において現用系計算機n1の処理を引き継ぐために稼動状況を判定する処理について説明する。
図8は、処理引継ぎ判定装置15において現用系計算機n1の処理を引き継ぐために稼動状況を判定する処理を示すフローチャートである。
先ず、稼動情報送信要求M1を作成するために、送信先計算機に対する要求53に稼動情報を送信する要求を格納し、送信元計算機識別子51、送信先計算機識別子52、認証情報54にそれぞれ必要な情報を格納する(ステップ201)。
処理引継ぎ判定装置15は、現用系計算機n1に、作成した稼動情報送信要求M1を送信する(ステップ202)。処理引継ぎ判定装置15は、現用系計算機n1から稼動情報通知M2を受信するまで、一定時間待機する(ステップ203)。
そして、一定時間待機後、稼動情報通知M2を受信できたか判定する(ステップ204)。一定時間内に稼動情報通知M2を受信した場合には、稼動情報通知M2から現用系計算機n1の稼動情報59を読み取り(ステップ205)、現用系計算機n1の稼動状況を判断する(ステップ206)。現用系計算機n1の稼動情報59が正常と判断された場合、処理を終了する(ステップ207)。
一定時間内に稼動情報通知M2を受信できなかった場合、または、稼動情報59現用系計算機n1の稼動状況が正常でないと判断した場合には、処理引継ぎ判定装置15は、待機系計算機割当て要求M3を作成し(ステップ208)、待機系計算機割当て装置16に送信する(ステップ209)。
次に、図9を用いて、待機系計算機割当て装置16において現用系計算機n1の処理を引継ぐ待機系計算機4mを割当てる処理を説明する。
図9は、待機系計算機割当て装置16において現用系計算機n1の処理を引継ぐ待機系計算機4mを割当てる処理を示すフローチャートである。
引継ぐ待機系計算機4mを割当てるときには、先ず、待機系計算機割当て装置16は、処理判定引継ぎ装置15から、待機系計算機割当て要求M3を受信する(ステップ301)。
待機系計算機割当て装置16は、待機系計算機割当て要求M3から、送信先計算機に対する要求63と現用系計算機識別子64を読み取る(ステップ302)。次に、送信先計算機に対する要求63の内容を判別し、待機系計算機に対する要求63が「割当て」の場合(ステップ303)、待機系計算機管理テーブル90(後に、図10を用いて説明する)から、現用系計算機n1の処理を割当てることができる待機系計算機4mを検索する(ステップ304)。
現用系計算機n1の処理を割当てることができる待機系計算機が存在した場合には、待機系計算機管理テーブル90の待機系計算機識別子91から待機系計算機識別子を取得し、待機系計算機割当て要求M3の現用系計算機識別子64を、待機系計算機管理テーブル90の中の引継元現用系計算機識別子93に登録し、使用状態92を、未使用から使用中に変更する(ステップ305)。
次に、現用系計算機のディスク装置接続情報テーブル95(後に、図11を用いて説明する)から、現用系計算機識別子64が接続されているディスク装置識別子を検索する(ステップ306)
そして、ステップ306で得たディスク装置識別子を元に、処理開始要求M4を作成し(ステップ307)、待機系計算機4mに送信する(ステップ308)。
なお、ステップ305では、待機系計算機4mの台数は、現用系計算機の稼働率などを元に計算された必要な台数が設置されており、現用系計算機n1の処理を割当てる待機系計算機が無くなることはないものとする。
次に、図10を用いて待機系計算機管理テーブルについて説明する。
図10は、待機系計算機管理テーブルを表す図である。
待機系計算機管理テーブル90は、待機系計算機の使用状況と処理を引継いだ現用系計算機識別子の情報を記録するためのテーブルである。
待機系計算機管理テーブル90は、待機系計算機識別子91と、稼動状況92と、引継ぎ元現用系計算機識別子93の各フィールドから構成される。
待機系計算機識別子91は、ネットワーク2に接続されている待機系計算機を表す識別子を格納するためのフィールドである。待機系計算機の稼動状況92は、待機系計算機識別子91の識別子の値を持つ待機系計算機が、稼動中または稼動中でないかを示す情報を格納するためのフィールドである。引継ぎ元現用系計算機識別子93は、クラスタシステムの処理を引継いだ現用系計算機の識別子を表すフィールドである。
次に、図11を用いて、現用系計算機1nのディスク装置接続情報テーブル95について説明する。
図11は、現用系計算機1nのディスク装置接続情報テーブル95を表す図である。
現用系計算機のディスク装置接続情報テーブル95は、現用系計算機n1と現用系計算機n1が接続されているディスク装置の接続に関する情報を記録したテーブルである。現用系計算機のディスク装置接続情報テーブル95は、現用系計算機識別子96と、ディスク装置識別子97の各フィールドとから構成される。
現用系計算機識別子96は、クラスタシステム内の現用系計算機を表す識別子である。ディスク装置識別子97は、現用系計算機識別子96の識別子の値で示される現用系計算機に接続されているディスク装置の識別子である。
次に、図12を用いて待機系計算機4mへの引継ぎ処理について説明する。
図12は、待機系計算機4mへの引継ぎ処理を示すフローチャートである。
待機系計算機4mが現用系計算機n1から処理を引継ぐ場合には、先ず、待機系計算機4mは、処理開始要求M4を受信する(ステップ401)。
そして、処理開始要求M4から、送信先計算機に対する要求67と、ディスク装置識別子69の値を取得する(ステップ402)。待機系計算機4mは、送信先計算機に対する要求67が「処理開始」であるか確認する(ステップ403)。送信先計算機に対する要求67が「処理開始」である場合、待機系計算機4mは、取得したディスク装置識別子のディスク装置を待機系計算機4mに接続し(ステップ404)、現用系計算機n1での処理を待機系計算機4mで開始する(ステップ405)。
次に、図13ないし図17を用いて、現用系計算機に異常があり、待機系計算機4mに処理が引継がれた後に待機系計算機4mから現用系計算機n1に処理を戻す場合の方法について説明する。
先ず、図13および図14を用いて、待機系計算機4mから現用系計算機n1に処理を戻す処理を説明する。
図13は、待機系計算機から現用系計算機に処理を引戻すときのメッセージシークエンス図である。
図14は、待機系計算機から現用系計算機に処理を引戻すときの処理を示すフローチャートである。
図14に示されるステップ101、ステップ102、ステップ103は、図3の同じ番号のステップと本質的に同じ処理をおこなう。
稼動情報59が「正常」であると判断した場合には(ステップ103)、処理引継ぎ判定装置15は、待機系計算機割当て装置16に、待機系計算機割当て解除要求M31を送信する(ステップ1041)。待機系計算機割当て解除要求M31は、送信先計算機に対する要求62に「割当て解除」と記載されている以外は、待機系計算機割当て要求M3と同じ形式である。
待機系計算機割当て解除要求M31を受信した待機系計算機割当て装置16は、待機系計算機4mに、現用系計算機の処理終了要求M41を送信する(ステップ1051)。処理終了要求M41は、送信先計算機に対する要求67に「停止」と記載されている以外は、処理開始要求M4と同じ形式である。処理終了要求M41を受信した待機系計算機4mは、現用系計算機n1から引継いだ処理を全て終了し、待機系計算機の処理停止通知M5を待機系計算機割当て装置16に送信する(ステップ106)。待機系計算機割当て装置16は、処理停止通知M5を、現用系計算機n1に送信する(ステップ107)。処理停止通知M5を受信した現用系計算機n1は、待機系計算機4mに引継がれていた処理を続きから再開する(ステップ108)。
次に、図15を用いて、処理引継ぎ判定装置15において待機系計算機4mから現用系計算機n1に処理を引戻すために稼動状況を判定する処理について説明する。
図15は、処理引継ぎ判定装置15において待機系計算機4mから現用系計算機n1に処理を引戻すために稼動状況を判定する処理を示すフローチャートである。
図15に示されるステップ201、ステップ202、ステップ203、ステップ205は、図8の同じ番号のステップと本質的に同じ処理である。
図15では、稼動情報通知M2を受信しなかった場合には(ステップ2041)、処理は終了する(ステップ207)。また、稼動情報59を読み取り(ステップ205)が、「正常」のときには(ステップ2061)、待機系計算機割当て解除要求M31を作成し(ステップ2081)、待機系計算機割当て装置16に送信する(ステップ2091)。
次に、図16を用いて待機系計算機割当て装置16において待機系計算機4mの割当てを解除する処理について説明する。
図16は、待機系計算機割当て装置16において待機系計算機4mの割当てを解除する処理を示すフローチャートである。
待機系計算機割当て装置16は、処理引継ぎ判定装置15から待機系計算機割当て解除要求M31を受信し(ステップ501)、待機系計算機割当て解除要求M31から、送信先計算機に対する要求62と現用系計算機識別子64を取得する(ステップ502)。送信先計算機に対する要求62が「割当て解除」であるか否かを判定する(ステップ503)。そして、送信先計算機に対する要求62が「割当て解除」であるときには、取得した現用系計算機識別子64を用い、待機系計算機管理テーブル90から、処理を割当てた待機系計算機識別子を特定し(ステップ504)、受信した待機系計算機割当て解除要求M31の現用系計算機識別子64を引継元現用系計算機識別子93から削除する(ステップ505)。
次に、現用系計算機n1のディスク装置接続情報95から、待機系計算機4mがマウントしているディスク装置識別子を特定する(ステップ506)。特定したディスク装置識別子を現用系計算機の処理停止要求M41のディスク装置識別子69に設定して処理停止要求M41を作成し(ステップ507)、待機系計算機に現用系計算機の引き継いでいる処理の処理停止要求M41を送信する(ステップ508)。
次に、図17を用いて、待機系計算機4mが引継いだ処理を停止する処理を説明する。
図17は、待機系計算機4mが引継いだ処理を停止する処理を示すフローチャートである。
待機系計算機4mは、待機系計算機割当て装置16から、現用系計算機の処理停止要求M41を受信し(ステップ601)、処理停止要求M41から送信先計算機に対する要求67とディスク装置識別子69の値を取得する(ステップ602)。
送信先計算機に対する要求67が「停止」の場合(ステップ603)、取得したディスク装置識別子69のディスク装置n3を切り離し、処理を停止する(ステップ604)。最後に、待機系計算機4mが現用系計算機n1の処理を全て停止したことを示す待機系計算機処理停止通知M5を待機系計算機割当て装置16に送信する(ステップ605)。
発明に係る複数クラスタシステムを有するコンピュータシステムの構成図である。 現用系計算機から待機系計算機に処理を引継ぐときのメッセージシークエンス図である。 現用系計算機から待機系計算機に処理を引継ぐときの処理を示すフローチャートである。 稼動情報送信要求M1の形式を示す図である。 稼動情報通知M2の形式を示す図である。 待機系計算機割当て要求M3形式を示す図である。 処理開始要求M4の形式を示す図である。 処理引継ぎ判定装置15において現用系計算機n1の処理を引き継ぐために稼動状況を判定する処理を示すフローチャートである。 待機系計算機割当て装置16において現用系計算機n1の処理を引継ぐ待機系計算機4mを割当てる処理を示すフローチャートである。 待機系計算機管理テーブルを表す図である。 現用系計算機n1のディスク装置接続情報テーブル95を表す図である。 待機系計算機4mへの引継ぎ処理を示すフローチャートである。 待機系計算機から現用系計算機に処理を引戻すときのメッセージシークエンス図である。 待機系計算機から現用系計算機に処理を引戻すときの処理を示すフローチャートである。 処理引継ぎ判定装置15において待機系計算機4mから現用系計算機n1に処理を引戻すために稼動状況を判定する処理を示すフローチャートである。 待機系計算機割当て装置16において待機系計算機4mの割当てを解除する処理を示すフローチャートである。 待機系計算機4mが引継いだ処理を停止する処理を示すフローチャートである。 従来技術に係るクラスタシステムの構成図である。
符号の説明
1〜4 ネットワーク
10,20,…,n0 クラスタシステム
11,21,…,n1 現用系計算機
12,22,…,n2 ディスク装置
13,23,…,n3 ディスク装置
41,42,…,4m 待機系計算機
15 処理引継ぎ判定装置
16 待機系計算機割当て装置。

Claims (8)

  1. 現用系計算機を有する複数のクラスタシステムと、
    前記複数のクラスタシステムに第一のネットワークを介して接続され、前記複数のクラスタシステムの現用計算機に対する一つ以上の待機系計算機と、
    前記複数のクラスタシステム、および、待機系計算機に第二のネットワークを介して接続され、前記複数のクラスタシステムの各現用系計算機が正常に動作しているかを否かを判定する処理引継ぎ判定装置と、
    前記第二のネットワークを介して接続され、前記処理引継ぎ判定装置の判定により、正常に動作していないと判定された現用系計算機の処理を引き継ぐ待機系計算機を割当てる待機計算機割当て装置とを備えることを特徴とする複数のクラスタシステムを有するコンピュータシステム。
  2. 前記待機系計算機は、前記現用系計算機がアクセスしていたディスク装置情報を受け取って、そのディスク装置に関する処理を引き継いで実行をおこなうことを特徴とする請求項1記載の複数のクラスタシステムを有するコンピュータシステム。
  3. 前記待機計算機割当て装置は、処理を引き継いだ現用系計算機が接続されているディスク装置情報を格納するテーブルを有することを特徴とする請求項2記載の複数のクラスタシステムを有するコンピュータシステム。
  4. 前記処理引継ぎ判定装置は、待機系計算機の稼動状況と、処理を引き継いだ現用系計算機に関する情報を格納するテーブルを有することを特徴とする請求項1記載の複数のクラスタシステムを有するコンピュータシステム。
  5. 複数のクラスタシステムを有し、
    前記複数のクラスタシステムの現用系計算機に対する一つ以上の待機計算機が、ネットワークを介して接続されるコンピュータシステムにおいて、
    前記各現用系計算機が正常に動作しているかを否かを判定するステップと、
    前記判定するステップにより、正常に動作していないと判定された現用系計算機の処理を引き継ぐ待機計算機を割当てるステップとを有することを特徴とする複数のクラスタシステムの制御方法。
  6. 複数のクラスタシステムを有し、
    前記複数のクラスタシステムに第一のネットワークを介して接続され、前記複数のクラスタシステムの現用系計算機に対する一つ以上の待機計算機と、
    前記複数のクラスタシステム、および、前記待機計算機に第二のネットワークを介して接続され、前記各現用系計算機が正常に動作しているかを否かを判定する処理引継ぎ判定装置と、
    前記第二のネットワークを介して接続され、正常に動作していないと判定された現用系計算機の処理を引き継ぐ待機計算機を割当てる待機計算機割当て装置とを備えるコンピュータシステムの制御方法において、
    前記処理引継ぎ装置が、前記現用計算機に正常に運転しているか否かを判定するメッセージを送信するステップと、
    前記現用系計算機が、前記処理引継ぎ装置に稼動情報を通知するステップと、
    前記処理引継ぎ装置が、前記現用計算機からの稼動情報の通知に従い、前記待機計算機割当て装置に、処理の引継ぎを要求するメッセージを送信するステップとを有することを特徴とするコンピュータシステムの制御方法。
  7. さらに、
    前記処理引継ぎ装置が、前記現用計算機に正常に運転できる状態であるか否かを判定するメッセージを送信するステップと、
    前記現用計算機が、前記処理引継ぎ装置に状態情報を通知するステップと、
    前記処理引継ぎ装置が、前記現用計算機からの状態情報の通知に従い、前記待機計算機割当て装置に、割当ての解除要求のメッセージを送信するステップと、
    前記待機計算機割当て装置が、前記待機系計算機に、割当ての解除要求のメッセージを送信するステップと、
    前記待機系計算機が、前記待機計算機割当て装置に、前記待機系計算機の処理の停止を通知をするステップと、
    前記待機計算機割当て装置が、前記現用系計算機に前記待機系計算機が処理を停止することを通知し、前記現用系計算機の処理を開始させるステップとを有することを特徴とする複数のクラスタシステムの制御方法。
  8. 複数のクラスタシステムと、前記複数のクラスタシステムにネットワークを介して接続され、前記複数のクラスタシステムの現用系計算機に対する一つ以上の待機計算機とを有するコンピュータシステムを制御するプログラムにおいて、
    前記複数のクラスタシステムの各現用系計算機が正常に動作しているかを否かを判定する処理と、
    前記現用系計算機が正常に動作しているかを否かを判定する処理に従い、正常に動作していないと判定された現用系計算機の処理を引き継ぐ待機計算機を割当てる処理とを、コンピュータ上で実行することを特徴とするコンピュータシステムを制御するプログラム。
JP2004072077A 2004-03-15 2004-03-15 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法 Pending JP2005258983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004072077A JP2005258983A (ja) 2004-03-15 2004-03-15 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004072077A JP2005258983A (ja) 2004-03-15 2004-03-15 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法

Publications (1)

Publication Number Publication Date
JP2005258983A true JP2005258983A (ja) 2005-09-22

Family

ID=35084607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004072077A Pending JP2005258983A (ja) 2004-03-15 2004-03-15 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法

Country Status (1)

Country Link
JP (1) JP2005258983A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2008165781A (ja) * 2006-12-27 2008-07-17 Internatl Business Mach Corp <Ibm> ストレージ・エリア・ネットワーク(san)のストレージ・ボリュームに割り当てられたコンピュータ・デバイスをフェイルオーバするための方法、システムおよびプログラム
JP2009237758A (ja) * 2008-03-26 2009-10-15 Nec Corp サーバシステム、サーバ管理方法、およびそのプログラム
JP2012043230A (ja) * 2010-08-19 2012-03-01 Toshiba Corp 冗長化制御システム、及びその演算データの伝送方法
JPWO2012004872A1 (ja) * 2010-07-07 2013-09-02 富士通株式会社 管理装置、管理プログラムおよび管理方法
WO2016046951A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 計算機システム及びそのファイル管理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2008165781A (ja) * 2006-12-27 2008-07-17 Internatl Business Mach Corp <Ibm> ストレージ・エリア・ネットワーク(san)のストレージ・ボリュームに割り当てられたコンピュータ・デバイスをフェイルオーバするための方法、システムおよびプログラム
JP2009237758A (ja) * 2008-03-26 2009-10-15 Nec Corp サーバシステム、サーバ管理方法、およびそのプログラム
JPWO2012004872A1 (ja) * 2010-07-07 2013-09-02 富士通株式会社 管理装置、管理プログラムおよび管理方法
JP2012043230A (ja) * 2010-08-19 2012-03-01 Toshiba Corp 冗長化制御システム、及びその演算データの伝送方法
WO2016046951A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 計算機システム及びそのファイル管理方法

Similar Documents

Publication Publication Date Title
EP3468151B1 (en) Acceleration resource processing method and apparatus
JP5328177B2 (ja) 情報処理装置、情報処理装置のデータ処理方法、記憶媒体及びプログラム
US8185905B2 (en) Resource allocation in computing systems according to permissible flexibilities in the recommended resource requirements
US20050283673A1 (en) Information processing apparatus, information processing method, and program
JP5131239B2 (ja) Ipアドレス割当制御プログラム、ipアドレス割当制御装置およびipアドレス割当制御方法
WO2018002991A1 (ja) 制御装置、vnf配置先選択方法及びプログラム
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
WO2013132910A1 (ja) ホスト提供システム及びホスト提供方法
US8584810B2 (en) Building specification data for elevator system, elevator control device and destination floor reception terminal device
JP2002108839A (ja) 通信ネットワークシステム、ジョブ割当方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2013067893A1 (zh) 集群系统的从节点维护方法和业务处理方法以及主节点
JP2011165223A (ja) コンピュータ・ベース・システムにおける資源割当て方法
JP2005258983A (ja) 複数のクラスタシステムを有するコンピュータシステム、および、コンピュータシステムの制御方法
EP2110748A2 (en) Cluster control apparatus, control system, control method, and control program
JP2013105237A (ja) ジョブ処理システム、ジョブ処理装置、負荷分散装置、ジョブ処理プログラムおよび負荷分散プログラム
JP2013054514A (ja) 仲介装置、機器管理システムおよびプログラム
JP6304153B2 (ja) ライセンス管理システムおよびライセンス管理方法
CN113687915B (zh) 容器运行方法、装置、设备及存储介质
JP2006085209A (ja) 計算機システムのデプロイメント方式
CN114513547B (zh) 模块的节点调度方法、装置、电子设备及存储介质
US20240061698A1 (en) Managing the assignment of virtual machines to non-uniform memory access nodes
JP2008046889A (ja) プロセス管理方法
WO2016067339A1 (ja) ストレージシステム、及び、記憶制御方法
JP6701846B2 (ja) 管理装置、バックアップシステム、バックアップ管理方法、プログラム
JP2011191844A (ja) 自律型サーバ管理システム、及び自律型サーバ管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070131

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090526