JP2005092874A - 複数の制御ノードからキャプテン制御ノードを選択する装置および方法 - Google Patents

複数の制御ノードからキャプテン制御ノードを選択する装置および方法 Download PDF

Info

Publication number
JP2005092874A
JP2005092874A JP2004235031A JP2004235031A JP2005092874A JP 2005092874 A JP2005092874 A JP 2005092874A JP 2004235031 A JP2004235031 A JP 2004235031A JP 2004235031 A JP2004235031 A JP 2004235031A JP 2005092874 A JP2005092874 A JP 2005092874A
Authority
JP
Japan
Prior art keywords
control node
response time
captain
total response
control nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004235031A
Other languages
English (en)
Other versions
JP4047840B2 (ja
Inventor
Kenneth W Boyd
ケネス・ダブリュー・ボイド
Kenneth F Day
ケネス・エフ・デイ
Philip M Doatmas
フィリップ・エム・ドートマス
John J Wolfgang
ジョン・ジェイ・ウォルフガング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005092874A publication Critical patent/JP2005092874A/ja
Application granted granted Critical
Publication of JP4047840B2 publication Critical patent/JP4047840B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】
複数の相互接続された制御ノードからキャプテン制御ノードを選択するための方法を提供する。
【解決手段】
本方法は、複数の制御ノードの各々により他の制御ノードの各々に第1信号を供給し、次に、複数の制御ノードの各々により他の制御ノードの各々から応答信号を受け取る。次に、本方法は、複数の制御ノードの各々により他の制御ノードの各々に対する個々の応答時間を計算し、各制御ノード毎にその総応答時間を決定する。次に、本方法は、総応答時間を使用してキャプテン制御ノードを選択すべきかどうかを決定する。総応答時間を使用してキャプテン制御ノードが選択される場合、本方法は、最小の総応答時間を決定し、その最小の総応答時間を有する制御ノードをキャプテン制御ノードに指定する。
【選択図】 図5

Description

本発明は、複数の相互接続された制御ノードから、パフォーマンスに基づいて、キャプテン制御ノード(captain control node)を選択するための装置及び方法に関するものである。別の実施例では、本発明は、複数のホスト・コンピュータからキャプテン制御ノードを選択することに関する。更に別の実施例では、本発明は、複数のデータ・ストレージ及び検索システムに配置された複数のコントローラからキャプテン制御ノードを選択することに関する。更に別のなる実施例では、本発明は、複数の一次バックアップ装置(appliance)に配置された複数のコントローラからキャプテン制御ノードを選択することに関する。
データを効率的にアクセスし、修正し、及び再記憶する場合に使用するための多くのデータ処理システムは大量のデータ・ストレージを必要とする。データ・ストレージは、一般に、幾つかの異なるレベルに区分けされ、各レベルは、異なるデータ・アクセス・タイムまたはデータ・ストレージ・コストを表す。第1レベル又は最高レベルのデータ・ストレージは、電子メモリ、通常は、動的または静的ランダム・アクセス・メモリ(DRAMまたはSRAM)を含む。電子メモリは、半導体集積回路の形態を取り、各回路には数百万バイトのデータが記憶可能であり、そのようなデータ・バイトに対するアクセスは数ナノ秒の速度である。電子メモリは、アクセスが全体的に電子的であるので、データに対して最速のアクセスを行う。
或るデータ処理アプリケーションでは、「ホスト・コンピュータ」とも呼ばれる複数の相互接続されたコンピュータ・システムが複数のデータ・ストレージ及び検索システムに情報を提供する。それらのホスト・コンピュータのオペレーションを調整するためには、それらのホスト・コンピュータの中からキャプテン制御ノードを選択することが望ましいであろう。
第2レベルのデータ・ストレージは、通常、ダイレクト・アクセス・ストレージ・デバイス(DASD)を含む。DASDストレージは、例えば、磁気ディスクおよび/または光ディスクを含む。データ・ビットは、そのデータ・ビットの2進値を構成する「1」及び「0」を表すマイクロメータ・サイズの磁気的または光学的に変更されたスポット(spot)としてディスク表面に記憶される。磁気DASDは、残留磁性材料で被覆された1つまたは複数のディスクを含む。ディスクは、保護された環境内に回転可能に装着される。各ディスクは、多数の同心トラックつまり近接間隔の輪(circle)に分けられる。データは、各トラックに沿ってビット毎に連続的に記憶(store)される。
別のデータ処理アプリケーションでは、複数のホスト・コンピュータが複数の相互接続されたデータ・ストレージ及び検索システムに情報を提供する。それらの複数のデータ・ストレージ及び検索システムの中からパフォーマンスに基づいてキャプテン制御ノードを選択し、それらのシステムのオペレーションを調整させることは望ましいことである。
データ喪失が破滅的なことになる多くのビジネスにとって、バックアップ・データ・コピーを持つことは必須である。更に、システム全体つまり設置場所(site;サイト)が地震、火災、爆発、台風などのような災害によって破壊される場合、データを回復させるための保護が必要である。
災害からの復旧は、一次データから遠隔のロケーションに、データの二次コピーをストアしておくことが望ましい。その二次サイトは、一次サイトから十分に遠隔でなければならないのみならず、一次データをリアル・タイムでバックアップできなければならない。二次サイトは、一次データが更新されるときに、最少の遅れで一次データをバックアップする必要がある。二次サイトが必要とする難しいタスクは、二次データが「一致した順序(order consistent)」でなければならないこと、即ち、実質的なシステム考察(system consideration)を必要とする、一次データと同じ連続的順序(連続的整合性)で二次データがコピーされなければならないということである。連続的整合性(sequentialconsistency)は、各々がデータ処理システムにおいて多数のDASDを制御する多重ストレージ・コントローラの存在によって複雑にされる。連続的整合性がない場合、その結果として、一次データと一致しない二次データが生じ、従って、災害復旧を損なうことになる。
更に別のデータ処理アプリケーションでは、複数の相互接続されたデータ・ストレージ及び検索システムが複数の相互接続された一次バックアップ装置にデータを提供する。一次バックアップ装置は、整合した(一貫性のある)トランザクション・セットをバックアップ・ストレージのための遠隔サイトに定期的に供給する。それらのバックアップ装置のオペレーションを調整するために、複数のバックアップ装置からキャプテン制御ノードをパフォーマンスに基づいて選択することが望ましい。
本発明の目的は、複数の相互接続された制御ノードからキャプテン制御ノードを選択するための装置及び方法を提供することにある。
本発明の方法は、複数の制御ノードの各々によって他の制御ノードの各々に第1信号を供給し、次に、複数の制御ノードの各々によって他の制御ノードの各々からの応答信号を受信する。本方法では、更に、複数の制御ノードの各々によって他の制御ノードの各々に対する個々の応答時間を計算し、各制御ノード毎に総応答時間(aggregate response time)を決定する。
次に、本方法では、総応答時間を使用してキャプテン制御ノードを選択すべきかどうかを決定する。総応答時間を使用してキャプテン制御ノードが選択される場合、本方法では、最小の総応答時間を決定し、最小の総応答時間を有する制御ノードをキャプテン制御ノードに指定する。
以下の説明では、図面を参照して本発明を好適な実施例によって説明する。なお、図面では、同じ参照番号は同じまたは同様の要素(element)を表す。本発明は、複数のホスト・コンピュータ、複数の一次データ・ストレージ及び検索システム、複数の二次データ・ストレージ及び検索システム、並びにそれら一次及び二次データ・ストレージ及び検索システムを相互接続する複数のバックアップ装置を含むデータ処理システムにおいて具体化されるものとして説明される。しかし、複数の制御ノードから1つのキャプテン制御ノードを選択するための本発明に関する以下の説明は、本発明が、一般的には、複数のコンピュータのオペレーションを監視および/または調整することに適用可能であるけれども、本発明をデータ処理アプリケーションに限定することを意味しない。
図4は、本願のデータ処理システムのコンポーネントを示す。そこで、図4を参照すると、ホスト・コンピュータ480、485、及び490が通信リンク401を介して相互接続され、相互に通信(communicate)を行う。ホスト・コンピュータ480、485、及び490は、通信リンク401を介して一次データ・ストレージ及び検索システム410、430、及び450に相互接続され、これらと通信を行う。別の実施例では、通信リンク401は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI(smallcomputer system interface)相互接続、ファイバ・チャネル相互接続、ESCON(Enterprise Systems Connection)相互接続、FICON(FiberConnection)相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
ホスト・コンピュータ480、485、及び490は、それぞれ、Windows、AIX、Unix、MVS、LINUX等のようなオペレーティング・システムを含むメインフレーム、パーソナル・コンピュータ、ワークステーション等のようなコンピュータ・システムを含む。(なお、Windowsはマイクロソフト社の商標であり、AIX及びMVSはIBM社の商標であり、UNIXは The Open Group を通して排他的にライセンスされた米国及び他の国における商標である)。
コンピュータ480は、プロセッサ、即ち、制御ノード481のような制御ノードを含む。コンピュータ485は、プロセッサ、即ち、制御ノード486のような制御ノードを含む。コンピュータ490は、プロセッサ、即ち、制御ノード491のような制御ノードを含む。図4に示された実施例では、制御ノード481、486、及び491は通信リンク401を使用して相互に通信を行う。
或る実施例では、ホスト・コンピュータ480、485、及び490は、それぞれ、ストレージ管理プログラム482、487、及び492を含む。ストレージ管理プログラム482、487、及び492は、IBM MVSオペレーティング・システムに実装されたIBM DFSMSのようなデータ・ストレージ及び検索システムへのデータの転送を管理する、その分野では知られたストレージ管理タイプ・プログラムの機能を含んでもよい。
一次データ・ストレージ及び検索システム410は、一次情報ストレージ・メディア412から二次情報ストレージ・メディア427にコピーするための情報を、一次バックアップ装置415及び二次バックアップ装置420を介して二次データ・ストレージ及び検索システム425に供給する。データ・ストレージ及び検索システム410は、更に、プロセッサ、即ち、制御ノード411を含む。データ・ストレージ及び検索システム425は、更に、プロセッサ、即ち、制御ノード426を含む。
或る実施例では、情報ストレージ・メディア412はDASDを含む。別の実施例では、情報ストレージ・メディア412は1つ以上のRAID(redundant arrays of independent disks)アレイを含む。更に別の実施例では、情報ストレージ・メディア412は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、情報ストレージ・メディア427はDASDを含む。別の実施例では、情報ストレージ・メディア427は1つ以上のRAIDアレイを含む。更に別の実施例では、情報ストレージ・メディア427は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、一次バックアップ装置415は、一次データ・ストレージ及び検索システム410と一体化している。図4に示された実施例では、一次バックアップ装置415は、一次データ・ストレージ及び検索システム410にとっては外部にあり、通信リンク403を介して一次データ・ストレージ及び検索システム410と通信を行う。別の実施例では、通信リンク403は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
或る実施例では、二次バックアップ装置420は、二次データ・ストレージ及び検索システム425と一体化している。図4に示された実施例では、二次バックアップ装置420は、二次データ・ストレージ及び検索システム425にとっては外部にあり、通信リンク406を介して二次データ・ストレージ及び検索システム425と通信を行う。別の実施例では、通信リンク406は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
一次データ・ストレージ及び検索システム430は、一次情報ストレージ・メディア432から二次情報ストレージ・メディア447にコピーするための情報を、一次バックアップ装置435及び二次バックアップ装置440を介して二次データ・ストレージ及び検索システム445に供給する。情報ストレージ及び検索システム430は、更に、制御ノード431を含む。情報ストレージ及び検索システム445は、更に、制御ノード446を含む。
或る実施例では、情報ストレージ・メディア432はDASDを含む。別の実施例では、情報ストレージ・メディア432は1つ以上のRAIDアレイを含む。更に別の実施例では、情報ストレージ・メディア432は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、情報ストレージ・メディア447はDASDを含む。別の実施例では、情報ストレージ・メディア447は1つ以上のRAIDアレイを含む。更に別の実施例では、情報ストレージ・メディア447は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、一次バックアップ装置435は、一次データ・ストレージ及び検索システム430と一体化している。図4に示された実施例では、一次バックアップ装置435は、一次データ・ストレージ及び検索システム430にとっては外部にあり、通信リンク404を介して一次データ・ストレージ及び検索システム430と通信を行う。別の実施例では、通信リンク404は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
或る実施例では、二次バックアップ装置440は、二次データ・ストレージ及び検索システム445と一体化している。図4に示された実施例では、二次バックアップ装置440は、二次データ・ストレージ及び検索システム445にとっては外部にあり、通信リンク407を介して二次データ・ストレージ及び検索システム445と通信を行う。別の実施例では、通信リンク407は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
一次データ・ストレージ及び検索システム450は、一次情報ストレージ・メディア452から二次情報ストレージ・メディア467にコピーするための情報を、一次バックアップ装置445及び二次バックアップ装置460を介して二次データ・ストレージ及び検索システム465に供給する。情報ストレージ及び検索システム450は、更に、制御ノード451を含む。情報ストレージ及び検索システム465は、更に、制御ノード466を含む。
或る実施例では、情報ストレージ・メディア452はDASDを含む。別の実施例では、情報ストレージ・メディア452は1つ以上のRAIDアレイを含む。更に別の実施例では、情報ストレージ・メディア452は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、情報ストレージ・メディア467はDASDを含む。別の実施例では、情報ストレージ・メディア467は1つ以上のRAIDアレイを含む。更に別の実施例では、情報ストレージ・メディア467は、例えば、テープ・カートリッジのような携帯用コンテナ内に個々に配置された複数の磁気テープを含む複数の携帯用情報ストレージ・メディアを含む。
或る実施例では、一次バックアップ装置455は、一次データ・ストレージ及び検索システム450と一体化している。図4に示された実施例では、一次バックアップ装置455は、一次データ・ストレージ及び検索システム450にとっては外部にあり、通信リンク405を介して一次データ・ストレージ及び検索システム450と通信を行う。別の実施例では、通信リンク405は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
或る実施例では、二次バックアップ装置460は、二次データ・ストレージ及び検索システム465と一体化している。図4に示された実施例では、二次バックアップ装置460は、二次データ・ストレージ及び検索システム465にとっては外部にあり、通信リンク408を介して二次データ・ストレージ及び検索システム465と通信を行う。別の実施例では、通信リンク408は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
一次バックアップ装置415、435、及び455は、それぞれ、一次データ・ストレージ及び検索システム410、430、及び450から情報を受け取る。一次バックアップ装置415、435、及び455は、周期的に、整合したトランザクション・セットを形成する。「整合したトランザクション・セット」は、本願では、そのセットにおけるすべてのトランザクションが二次データ・ストレージ及び検索システム・コントローラで使用されるとき、そのセットが作成された時点ではその二次データ・ストレージが一次データ・ストレージと同一に見えるトランザクションのセットを意味する。
或る実施例では、1つまたは複数のデータ・ストレージ及び検索システム410、425、430、445、450、および/または465はデータ・ストレージ及び検索システム100(図1)を含む。次に図1を参照すると、本願の情報ストレージ及び検索システム100は、第1クラスタ(cluster)101A及び第2クラスタ101Bを含む。各クラスタは、プロセッサ部分130/140及び入出力部分160/170を含む。各クラスタにおける内部PCIバスは、それぞれ、プロセッサ部分130/140及び入出力部分160/170の間のリモートI/Oブリッジ(bridge)155/165を介して接続される。
情報ストレージ及び検索システム100は、更に、4つのホスト・ベイ(bay)101、106、111、及び116に配置された複数のホスト・アダプタ102−105、107−110、112−115、及び117−120を含む。各ホスト・アダプタは、1つのファイバ・チャネル・ポート、1つのFICONポート、2つのESCONポート、又は2つのSCSIポートを含んでもよい。各ホスト・アダプタは、各クラスタが任意のホスト・アダプタからの入出力を処理できるように1つ以上の共通プラットフォーム相互接続バス121及び150を介して両クラスタに接続される。
プロセッサ部分130は、プロセッサ132及びキャッシュ134を含む。或る実施例では、プロセッサ132は、64ビットRISCベースの同期マルチプロセッサを含む。別の実施例では、プロセッサ132は、組込みフォールト及びエラー訂正機能を含む。キャッシュ134は、接続されたホスト・システムに対するパフォーマンスを改良するために読み取りデータ及び書き込みデータの両方をストアするために使用される。或る実施例では、キャッシュ134は約4ギガ・バイトを含む。別の実施例では、キャッシュ134は約8ギガ・バイトを含む。更に別の実施例では、キャッシュ134は約12ギガ・バイトを含む。更に別の実施例では、キャッシュ134は約16ギガ・バイトを含む。更に別の実施例では、キャッシュ134は約32ギガ・バイトを含む。
プロセッサ部分140は、プロセッサ142及びキャッシュ144を含む。或る実施例では、プロセッサ142は、64ビットRISCベースの対称(symmetric)マルチプロセッサを含む。別の実施例では、プロセッサ142は、組込みフォールト及びエラー訂正機能を含む。キャッシュ144は、接続されたホスト・システムに対するパフォーマンスを改良するために読み取りデータ及び書き込みデータの両方をストアするために使用される。或る実施例では、キャッシュ144は約4ギガ・バイトを含む。別の実施例では、キャッシュ144は約8ギガ・バイトを含む。更に別の実施例では、キャッシュ144は約12ギガ・バイトを含む。更に別の実施例では、キャッシュ144は約16ギガ・バイトを含む。更に別の実施例では、キャッシュ144は約32ギガ・バイトを含む。
入出力(I/O)部分160は、不揮発性ストレージ(non-volatilestorage ; NVS)162及びNVSバッテリ164を含む。NVS162は、クラスタ障害の電源障害があり、そのデータのキャッシュ・コピーが喪失する場合、データの保全性を保証するように書き込みデータの第2コピーをストアするために使用される。NVS162は、クラスタ101Bに供給された書き込みデータをストアする。或る実施例では、NVS162は、約1ギガ・バイトのストレージを含む。別の実施例では、NVS162は、4つの個別のメモリ・カードを含む。更に別の実施例では、NVSカードの各ペアがバッテリ装備の充電システムを有し、電力が失われた場合でも、72時間までシステム全体におけるデータを保護する。
I/O部分170は、NVS172及びNVSバッテリ174を含む。NVS172は、クラスタ101Aに供給された書き込みデータをストアする。或る実施例では、NVS172は、約1ギガ・バイトのストレージを含む。別の実施例では、NVS172は、4つの個別のメモリ・カードを含む。更に別の実施例では、NVSカードの各ペアがバッテリ装備の充電システムを有し、電力が失われた場合でも、72時間までシステム全体におけるデータを保護する。
クラスタ101Bの障害の場合には、その障害を生じたクラスタに対する書き込みデータが、残りのクラスタ101Aに配置されたNVS162に存在するであろう。そこで、この書き込みデータは、高い優先順位でRAIDランクにデステージ(destage)される。同時に、生き残ったクラスタ101Aは、それ自身の書き込みデータのためにNVS162の使用を開始し、それによって、書き込みデータの2つのコピーがそれまでどおり維持されることを保証するであろう。
I/O部分160は、更に、デバイス・アダプタ165、166、167、及び168のような複数のデバイス・アダプタ、及び2つのRAIDランク、即ち、RAIDランク「A」及びRAIDランク「B」に編成された16個のディスク・ドライブ180及び190(即ち、181−188及び191−198)を含む。或る実施例では、RAIDランク「A」及び「B」は、RAID5プロトコルを使用する。別の実施例では、RAIDランク「A」及び「B」は、RAID10プロトコルを使用する。
或る実施例では、1つ以上のデータ・ストレージ及び検索システム410、425、430、445、450、および/または465(図4)がデータ・ストレージ及び検索システム200(図2)を含む。図2は、システム200の一実施例を示す。
システム200は、ホスト・コンピュータ390(図4)のような1つ又は複数のホスト・システムからのコマンドに応答して携帯用データ・ストレージ・メディアをアクセスするように構成される。システム200は、データ・ストレージ・メディアを含む携帯用データ記憶カートリッジを格納するための複数のストレージ・シェルフ260を前面壁270及び後面壁290に含む。システム200は、更に、データ・ストレージ・メディアに関してデータを読み取るためのおよび/またはデータを書きこむための少なくとも1つのデータ・ストレージ・ドライブ250、及び複数のストレージ・シェルフ260とデータ・ストレージ・ドライブ250との間でデータ・ストレージ・メディアを搬送するための少なくとも1つのアクセサ210を含む。システム200は、ユーザがライブラリと対話することを可能にするウェブ・ベースのインターフェースのようなオペレータ・パネル230又は他のユーザ・インターフェースを任意選択的に含んでもよい。システム200は、データ・ストレージ・メディアがライブラリに挿入されることおよび/またはライブラリ・オペレーションを妨害することなくライブラリから除去されることを可能にする上部インポート/エクスポート・ステーション240および/または下部インポート/エクスポート・ステーション245を任意選択的に含んでもよい。
アクセサ(accessor)210は、Z軸に沿った双方向運動を可能にするサーボ・セクション212を昇降させることを含む。アクセサ210は、更に、1つ以上のデータ・ストレージ・メディアをつかむための少なくとも1つのグリッパ・アセンブリ216を含む。図2に示された実施例では、アクセサ210は、更に、データ・ストレージ・メディアに関する識別情報を読み取るために、スマート・カード読取装置又は同様のシステムのようなバーコード・スキャナ214又は他の読み取りシステムを含む。図2に示された実施例では、アクセサ210は、更に、昇降するサーボ・セクション212に配置された第2グリッパ機構218を含む。
或る実施例では、システム200は、各々がアクセサ210によってアクセス可能なストレージ・シェルフ260を有する1つ以上のストレージ・フレームを含む。アクセサ210は、レール205上をX軸に沿って双方向に移動する。多数のフレームを含むライブラリ100の実施例では、それら個々のフレームの各々におけるレール205は、連続レール・システムに沿ってライブラリの一端から反対端まで移動することが可能である。
或る実施例では、1つ以上のデータ・ストレージ及び検索システム410、425、430、445、450、および/または465は、データ・ストレージ及び検索システム300(図3)を含む。次に図3を参照すると、仮想テープ・サーバ(virtual tape server ; VTS)300がデーモン370、372、及び374を介して1つ以上のホスト及び1つ以上の仮想テープ・サーバと通信を行う。図3に示された実施例では、デーモン(daemon)370は、通信リンク380を介して第1ホストと通信を行う。デーモン372は、通信リンク382を介して第2ホストと通信を行う。デーモン374は、通信リンク384を介して、例えば、装置415のような一次バックアップ装置と通信を行う。
VTS300は、ダイレクト・アクセス・ストレージ・ドライブ(DASD)310、及び複数のデータ・ストレージ・デバイス330及び340とも通信を行う。或る実施例では、データ・ストレージ・デバイス330及び340は、1つ以上のデータ・ストレージ及び検索システム内に配置される。別の実施例では、DASD310は、ホスト110(図1)と一体化している。更に別の或る実施例では、DASD310は、VTS300と一体化している。更に別の実施例では、DASD310は、データ・ストレージ及び検索システムと一体化している。更に別の実施例では、DASD310は、ホスト110、VTS300,及びVTS300と通信を行うデータ・ストレージ及び検索システムに対して外部にある。
VTS300は、更に、IBM Adstar(商標)分散ストレージ・マネージャ(ADSM)のようなストレージ・マネージャ320を含む。ストレージ・マネージャ320は、DASD310から、データ・ストレージ・デバイス330及び340に装着された情報ストレージ・メディアへのデータの移動を制御する。或る実施例では、ストレージ・マネージャ320は、ADSMサーバ322及びADSM階層ストレージ・マネージャ・クライアント324を含む。それとは別に、サーバ322及びクライアント324は、それぞれ、ADSMシステムを含むことも可能である。DASD310からの情報は、ADSMサーバ322及びSCSIアダプタ385を介してデータ・ストレージ・デバイス330及び340に供給される。
VTS300は、更に、オートノミック・コントローラ(autonomiccontroller)350を含む。オートノミック・コントローラ350は、階層ストレージ・マネージャ(HSM)324を介してDASD310のオペレーションを制御し、DASD310とデータ・ストレージ・デバイス330及び340との間のデータの転送を制御する。
図4を再び参照すると、各ホスト・コンピュータは、1つ以上の一次データ・ストレージ及び検索システムに情報を供給する。通信リンク401の帯域幅を最大限に利用するために、ホスト・コンピュータ480、485、及び490はその帯域幅を割り振るよう相互作用(対話)する。本発明の方法の或る実施例では、制御ノード481、486、及び491がパフォーマンスに基づいてキャプテン制御ノードを選択するように相互作用する。そのキャプテン・ホスト制御ノードは、ホスト・コンピュータ480、485、及び490の各々によって整合したトランザクション・セットを形成するというような或る機能を調整する。「整合したコピーを作成するための方法、システム、及び製造物(Method, System, and Article of Manufacture for Creating a ConsistentCopy)」と題した米国特許出願10/339,957は、整合したトランザクション・セットを形成するための方法を開示している。
図4を再び参照すると、各一次データ・ストレージ及び検索システム410、430、及び450は、種々のホスト・コンピュータから種々の情報量を種々のデータ転送速度で受け取る。各一次データ・ストレージ及び検索システム410、430、及び450は、1つ以上の一次バックアップ装置415、435、及び455に種々の情報量を種々のデータ転送速度で供給する。本発明の方法の或る実施例では、制御ノード411、431、及び451は、パフォーマンスに基づいてキャプテン・ホスト制御ノードを選択するように相互作用する。そのキャプテン・ホスト制御ノードは、一次データ・ストレージ及び検索システム410、430、及び450の各々により整合したトランザクションを形成するような或る機能を調整する。
図4を再び参照すると、各一次バックアップ装置が異なる一次ストレージの制御ノードから、他の一次バックアップ装置とは異なる速度でデータを受け取る。本発明の方法の或る実施例では、制御ノード417、437、及び457がパフォーマンスに基づいてキャプテン制御ノードを選択するように相互作用する。そのキャプテン・バックアップ装置の制御ノードは、一次バックアップ装置415、435、及び455の各々によって整合したトランザクション・セットを形成するように機能する。
装置415、435、及び455のような一次バックアップ装置は、通信リンク409のような共通通信リンクを介して、それぞれ、装置420、440、及び460のようなそれらの対応する二次バックアップ装置に整合したトランザクション・セットを供給する。別の実施例では、通信リンク409は、RS−232ケーブルまたはRS−432ケーブルのようなシリアル相互接続、イーサネット相互接続、SCSI相互接続、ファイバ・チャネル相互接続、ESCON相互接続、FICON相互接続、ローカル・エリア・ネットワーク(LAN)、私設広域ネットワーク(WAN)、公衆広域ネットワーク、ストレージ・エリア・ネットワーク(SAN)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)、インターネット、及びそれらの組み合わせから成るグループから選択される。
一般的なこととして、本発明は、複数の相互接続された制御ノードが実際のパフォーマンス基準に基づいてキャプテン制御ノードを選択するための方法を含む。図5は、本発明の方法の或るステップを要約したものである。図5を参照すると、ステップ505において、本方法は、複数の、即ち、合計(N)個の相互接続された制御ノードを提供する。なお、(N)は2よりも大きいか又は2に等しい。或る実施例では、(N)個の相互接続された制御ノードの各々が(N)個のホスト・コンピュータの異なる1つに配置される。別の実施例では、(N)個の相互接続された制御ノードの各々が(N)個のデータ・ストレージ及び検索システムの異なる1つに配置される。更に別の実施例では、(N)個の相互接続された制御ノードの各々が(N)個のバックアップ装置の異なる1つに配置される。
ステップ510において、各制御ノードが、第1の時間に、他の(N−1)個の相互接続された制御ノードに第1信号を供給する。本発明の方法では、ステップ510からステップ515に移り、第1制御信号を受け取ったとき(N)個の制御ノードの各々が応答信号を供給する。従って、ステップ515では、(N)個の制御ノードの各々による(N−1)個の応答信号の供給を含む。
本発明の方法は、ステップ515からステップ520に移り、(N−1)個の第2の時間に、各制御ノードが他の(N−1)個の制御ノードから応答信号を受け取る。本発明の方法では、ステップ520からステップ525に移り、各制御ノードがそれのハートビート信号に対する(N−1)個の個々の応答時間、即ち、他の(N−1)個の制御ノードに対する応答時間を計算する。当業者には明らかなように、制御ノードは、ステップ510の第1の時間からステップ520のi番目の第2の時間を減じることによってi番目の他の制御ノードに対する応答時間を計算する。
本発明の方法では、ステップ525からステップ530に移り、各制御ノードがそれの総応答時間を決定する。第1制御ノードに対する総応答時間は、第1制御ノードのハートビート信号に応答するために、他の制御ノードに対して合計(N−1)個の応答時間を含む。別の実施例では、ステップ530は、更に、各制御ノードによって、他の制御ノードの各々にそれの総応答時間をレポートすることを含む。このレポーティングは、当業者に知られている任意の信号方法を含む。例えば、各制御ノードは、それの総応答時間を含むメッセージを他の(N−1)個の制御ノードの各々に送ってもよい。別の実施例では、各制御ノードは、他の(N−1)個の制御ノードをポーリングしてそれら他の制御ノードから総応答時間を得る。或る実施例では、本発明の方法は、ステップ530からステップ540に移る。
或る実施例において、本発明の方法は、ステップ530からステップ535に移り、各制御ノードがそれの総応答時間を含む(N−1)個の個々の応答時間に対する標準偏差を計算する。当業者には明らかなように、標準偏差は、すべてのデータ・ポイントの分布が平均(mean)の付近にクラスタ化される。データが密に束ねられるとき、即ち、ベル型の曲線が急勾配であるとき、標準偏差は小さい。データが散らばっていてベル型曲線が比較的平坦であるとき、標準偏差は大きい。
或る実施例では、ステップ535は、更に、各制御ノードによって、それの標準偏差を他の接続された各制御ノードにレポートすることを含む。このレポーティングは、当業者にとっては既知の任意の信号方法を含む。例えば、各制御ノードは、ステップ530の標準偏差を含むメッセージを他の(N−1)個の制御ノードに送ることが可能である。別の実施例では、各制御ノードが、ステップ535において、他の(N−1)個の制御ノードをポーリングしてそれらの他の制御ノードから標準偏差を得る。
本発明の方法は、ステップ535からステップ540に移り、本方法は、(N)個の総応答時間を一次決定要素(primary determinant)として使用してキャプテン制御ノードを選択すべきかどうかを決定する。本発明の方法が、ステップ540において、(N)個の総応答時間を一次決定要素として使用して、キャプテン制御ノードを選択することを選ぶ場合、本方法は、ステップ540からステップ545に移り、(N)個の制御ノードの各々が最小の総応答時間を独立して識別する。
本発明の方法は、ステップ545からステップ550に移り、各制御ノードは、2つ以上の制御ノードが最小の総応答時間を有するかどうかを決定する。ステップ550において、2つ以上の制御ノードが最小の総応答時間を有することを本発明の方法が決定する場合、本方法は、ステップ550からステップ610(図6)に移る。2つ以上の制御ノードが最小の総応答時間を持たないことを本発明の方法が決定する場合、本方法は、ステップ550からステップ555に移る。ステップ555において、本方法は、最小の総応答時間を有する制御ノードをキャプテン制御ノードとして指定する。
本発明の方法は、ステップ555からステップ570に移り、本方法は、それが新たなキャプテン制御ノードを選択すべき時であるかどうかを決定する。ステップ570において、それが新たなキャプテン制御ノードを選択すべき時でないことを本発明の方法が決定する場合、本方法はステップ570に周期的に戻る。ステップ570において、それが新たなキャプテン制御ノードを選択すべき時であることを本発明の方法が決定する場合、本方法は、ステップ570からステップ510に移り、続行する。
本発明の方法が、ステップ540において、(N)個の総応答時間を一次決定要素として使用してキャプテン制御ノードを選択しないことを選ぶ場合、本方法は、ステップ540からステップ560に移り、本発明の方法は、キャプテン制御ノード選択機能を提供する。別の実施例では、ステップ560のキャプテン制御ノード選択機能が、ホスト・コンピュータに配置されたファームウェア(firmware)481(図4)、486(図4)、491(図4)のようなファームウェアにセットされる。更に別の実施例では、ステップ560のキャプテン制御ノード選択機能が、データ・ストレージ及び検索システムに配置されたファームウェア412(図4)、432(図4)、452(図4)のようなファームウェアにセットされる。更に別の実施例では、ステップ560のキャプテン制御ノード選択機能が、バックアップ装置に配置されたファームウェア416(図4)、436(図4)、456(図4)のようなファームウェアにセットされる。
ステップ560は、更に、キャプテン制御ノード選択機能を使用して、相互接続された制御ノードの各々に対するパフォーマンス・スコアを決定することを含む。別の実施例では、各制御ノードは、(N)個の制御ノードの各々に対して、ステップ530の総応答時間及びステップ535の標準偏差の両方に基づいてパフォーマンス・スコアを計算する。更に別の実施例では、ステップ560は、下式(1)を使用して、各制御ノードに対するパフォーマンス・スコアを決定することを含む:
[数1]
パフォーマンス・スコア=a(総応答時間)+b(標準偏差) (1)
なお、式(1)における a、b、c、及び d は正の定数である。低いパフォーマンス・スコアは良好なパフォーマンス、即ち、小さい総応答時間及び小さい標準偏差を構成する。
本発明の方法は、ステップ560からステップ565に移り、本方法は、ステップ560の最小のパフォーマンス・スコアを有する制御ノードをキャプテン制御ノードとして指定する。別の実施例では、最小のパフォーマンス・スコアを有する制御ノードをキャプテン制御ノードに指定するために、全ての制御ノードが独立してステップ560及び565を実施する。本発明の方法は、ステップ565からステップ570に移る。
ステップ550において2つ以上の制御ノードが最小の総応答時間を有するということを本発明の方法が決定する場合、本方法は、ステップ610(図6)に移る。ステップ610において、その方法は、図5のステップを反復すべきかどうかを決定する。別の実施例では、2つ以上の制御ノードが最小の総応答時間を有する場合に図5のステップを反復すべきかどうかがホスト・コンピュータに配置されたファームウェア481(図4)、486(図4)、491(図4)のようなファームウェアにセットされる。更に別の実施例では、2つ以上の制御ノードが最小の総応答時間を有する場合に図5のステップを反復すべきかどうかが、バックアップ装置に配置されたファームウェア416(図4)、436(図4)、456(図4)のようなファームウェアにセットされる。
図5のステップを反復することを本発明の方法が選んだ場合、その方法は、ステップ610からステップ510に移り、そして続行する。図5のステップを反復しないことを本発明の方法が選んだ場合、その方法は、ステップ610からステップ620に移り、最小の総応答時間を有する制御ノードが、最小の総応答時間を有する他のいずれの制御ノードよりも低い標準偏差を有するかどうかを決定する。最小の総応答時間を有する制御ノードが、最小の総応答時間を有する他のいずれの制御ノードよりも低い標準偏差を有するということを本発明の方法が決定する場合、その方法はステップ620からステップ630に移り、各制御ノードは、最小の総応答時間及びより低い標準偏差を有する制御ノードをキャプテン制御ノードとして指定する。本発明の方法はステップ630からステップ570に移り、そして続行する。
ステップ620において、最小の総応答時間を有する他のいずれの制御ノードよりも低い標準偏差を持った最小の総応答時間を有する制御ノードがないということを本発明の方法が決定する場合、その方法はステップ620からステップ640に移り、最小の総応答時間を有する制御ノードの1つをキャプテン制御ノードとして指定する。本発明の方法は、ステップ640からステップ670に移り、そして続行する。
別の実施例では、図5および/または図6に示された個々のステップは、結合(combine)されるか、又は除去(eliminate)されるか、又は再順序付け(reorder)されることが可能である。
本発明は、更に、図5および/または図6に示されたステップを使用してキャプテン制御ノードを選択するために、例えば、コンピュータ可読プログラム・コードを配置されたコンピュータ使用可能メディア413、418、433、438、453、458、483、488、および/または493のようなコンピュータ使用可能メディアを含んだシステムを含む。
本発明は、更に、図5および/または図6に示されたステップを使用してキャプテン制御ノードを選択するために、例えば、コンピュータ可読プログラム・コードを有するプログラマブル・コンピュータ・プロセッサと共に使用可能なコンピュータ・プログラム記録媒体414、419、434、439、454、459、484、489、および/または494のようなコンピュータ・プログラム記録媒体を含む。
本発明の好適な実施例を詳細に示したが、「特許請求の範囲」に示された本発明の範囲を逸脱することなく、それらの実施例に対する修正及び改変が当業者にとって生じ得ることは明らかであろう。
本発明のデータ・ストレージ及び検索システムの1つの実施例におけるコンポーネントを示すブロック図である。 本発明のデータ・ストレージ及び検索システムの第2の実施例におけるコンポーネントを示す図である。 本発明のデータ・ストレージ及び検索システムの第3の実施例におけるコンポーネントを示すブロック図である。 本発明のピア・ツー・ピア・リモート・コピーのデータ・ストレージ及び検索システムにおけるコンポーネントを示すブロック図である。 本発明の方法における初期ステップを要約したフローチャートを示す図である。 本発明の方法における追加のステップを要約したフローチャートを示す図である。

Claims (24)

  1. 複数の相互接続された制御ノードからキャプテン制御ノードを選択するための方法であって、
    (a)前記複数の制御ノードの各々によって他の制御ノードの各々に第1信号を供給するステップと、
    (b)前記複数の制御ノードの各々によって他の制御ノードの各々から応答信号を受け取るステップと、
    (c)前記複数の制御ノードの各々によって他の制御ノードの各々に対する個々の応答時間を計算するステップと、
    (d)前記複数の相互接続された制御ノードに対する総応答時間を決定するステップと、
    (e)前記総応答時間を使用してキャプテン制御ノードを選択すべきかどうかを決定するステップと、
    (f)前記総応答時間を使用してキャプテン制御ノードが選択される場合、最小の総応答時間を決定し、前記最小の総応答時間を有する制御ノードをキャプテン制御ノードとして指定するように動作するステップと
    を含む、方法。
  2. 2つ以上の制御ノードの各々が前記最小の総応答時間を有するかどうかを決定するステップと、
    2つ以上の制御ノードの各々が前記最小の総応答時間を有する場合、前記ステップ(a)乃至(f)を繰り返すように動作するステップと
    を更に含む、請求項1に記載の方法。
  3. 前記複数の制御ノードの各々によって当該制御ノードの総応答時間に対する標準偏差を計算するステップと、
    各制御ノードによって残りの相互接続された制御ノードの各々に前記標準偏差を供給するステップと
    を更に含む、請求項1に記載の方法。
  4. 2つ以上の制御ノードの各々が最小の総応答時間を有する場合、前記2つ以上の制御ノードのどれが最低の標準偏差を有するかを決定するように動作するステップと、
    前記最小の総応答時間及び前記最低の標準偏差を有する制御ノードを前記キャプテン制御ノードとして指定するステップと
    を更に含む、請求項3に記載の方法。
  5. 前記総応答時間を使用してキャプテン制御ノードが選択される場合、キャプテン制御ノード選択機能を提供するように動作するステップと、
    前記キャプテン制御ノード選択機能を使用して前記複数の相互接続された制御ノードの各々に対するパフォーマンス・スコアを決定するステップと、
    最小のパフォーマンス・スコアを有する制御ノードをキャプテン制御ノードとして指定するステップと
    を更に含む、請求項3に記載の方法。
  6. 前記キャプテン制御ノード選択機能は下式を含む、請求項5に記載の方法。
    パフォーマンス・スコア=a(総応答時間)+b(標準偏差)
    なお、a、b、c、及び d は正の定数である。
  7. 複数のホスト・コンピュータを提供するステップを更に含み、
    前記複数の制御ノードの各々は前記複数のホスト・コンピュータの異なる1つに配置され、
    前記複数のホスト・コンピュータの各々は1つ以上のデータ・ストレージ及び検索システムと通信を行うことができる
    請求項1に記載の方法。
  8. 複数のデータ・ストレージ及び検索システムを提供するステップを更に含み、
    前記複数の制御ノードの各々は、前記複数のデータ・ストレージ及び検索システムの異なる1つに配置され、
    前記複数のデータ・ストレージ及び検索システムの各々は、1つ以上のホスト・コンピュータと通信を行うことができる
    請求項1に記載の方法。
  9. 複数の一次バックアップ装置を提供するステップを更に含み、
    前記複数の制御ノードの各々は、前記複数の一次バックアップ装置の異なる1つに配置され、
    前記複数の一次バックアップ装置の各々は、1つ以上のデータ・ストレージ及び検索システム及び1つ以上の二次バックアップ装置と通信を行うことができる
    請求項1に記載の方法。
  10. 制御ノードを含み、複数の相互接続された制御ノードからキャプテン制御ノードを選択するためにコンピュータ可読プログラム・コードを配置されたコンピュータ使用可能媒体を更に含むシステムであって、前記コンピュータ可読プログラム・コードは、
    (a)他の制御ノードの各々に第1信号を供給することと、
    (b)他の制御ノードの各々から応答信号を受け取ることと、
    (c)他の制御ノードの各々に対する個々の応答時間を計算することと、
    (d)前記システムに対する総応答時間を決定することと、
    (e)他の制御ノードの各々から総応答時間を受け取ることと、
    (f)前記総応答時間を使用してキャプテン制御ノードを選択すべきかどうかを決定することと、
    (g)前記総応答時間を使用してキャプテン制御ノードが選択される場合に動作可能で、最小の総応答時間を決定することと、
    (h)前記総応答時間を使用してキャプテン制御ノードが選択される場合に動作可能で、最小の総応答時間を有する制御ノードをキャプテン制御ノードに指定することとを
    達成するための一連のコンピュータ可読プログラム・ステップを含む、システム。
  11. 前記コンピュータ可読プログラム・コードは、
    2つ以上の制御ノードの各々が前記最小の総応答時間を有するかどうか決定することと、
    2つ以上の制御ノードの各々が前記最小の総応答時間を有する場合に動作可能で、前記(a)乃至(h)を繰り返すこととを
    達成するための一連のコンピュータ可読プログラム・ステップを含む、請求項10に記載のシステム。
  12. 前記コンピュータ可読プログラム・コードは、
    前記システムに対する前記総応答時間に関する標準偏差を計算することと、
    残りの制御ノードの各々から標準偏差を受け取ることとを
    達成するための一連のコンピュータ可読プログラム・ステップを更に含む、請求項10に記載のシステム。
  13. 前記コンピュータ可読プログラム・コードは、
    2つ以上の制御ノードの各々が前記最小の総応答時間を有する場合に動作可能で、前記2つ以上の制御ノードのうちのどれが最低の標準偏差を有するかを決定することと、
    前記最小の総応答時間及び最低の標準偏差を有する制御ノードをキャプテン制御ノードとして指定することとを
    達成するための一連のコンピュータ可読プログラム・ステップを更に含む、請求項12に記載のシステム。
  14. 前記コンピュータ可読プログラム・コードは、
    前記総応答時間を使用してキャプテン制御ノードが選択されない場合に動作可能で、キャプテン制御ノード選択機能を検索することと、
    前記キャプテン制御ノード選択機能を使用して前記複数の相互接続された制御ノードの各々に対するパフォーマンス・スコアを決定することと、
    最小のパフォーマンス・スコアを有する制御ノードをキャプテン制御ノードして指定することとを
    達成するための一連のコンピュータ可読プログラム・ステップを更に含む、請求項12に記載のシステム。
  15. 前記キャプテン制御ノード選択機能は下式を含む、請求項14に記載のシステム。
    パフォーマンス・スコア=a(総応答時間)+b(標準偏差)
    なお、a、b、c、及び d は正の定数である。
  16. 前記システムは複数のホスト・コンピュータの1つを含み、前記複数のホスト・コンピュータの各々は1つ以上のデータ・ストレージ及び検索システムと通信を行うことができる、請求項10に記載のシステム。
  17. 前記システムは複数のデータ・ストレージ及び検索システムの1つを含み、前記複数のデータ・ストレージ及び検索システムの各々は1つ以上のホスト・コンピュータと通信を行うことができる、請求項10に記載のシステム。
  18. 前記システムは複数の一次バックアップ装置の1つを含み、前記複数の一次バックアップ装置の各々は1つ以上のデータ・ストレージ及び検索システム及び1つ以上の二次バックアップ装置と通信を行うことができる、請求項10に記載のシステム。
  19. 複数の相互接続された制御ノードからキャプテン制御ノードを選択するように具体化されたコンピュータ可読プログラム・コードを有するプログラマブル・コンピュータ・プロセッサと共に使用可能なコンピュータ・プログラム記録媒体であって、前記コンピュータ・プログラム記録媒体は第1制御ノードに配置され、
    (a)前記プログラマブル・コンピュータ・プロセッサに、第1信号を他の制御ノードの各々へ供給させるコンピュータ可読プログラム・コードと、
    (b)前記プログラマブル・コンピュータ・プロセッサに、他の制御ノードの各々からの応答信号を受け取らせるコンピュータ可読プログラム・コードと、
    (c)前記プログラマブル・コンピュータ・プロセッサに、他の制御ノードの各々に対する個々の応答時間を計算させるコンピュータ可読プログラム・コードと、
    (d)前記プログラマブル・コンピュータ・プロセッサに、前記第1制御ノードに対する総応答時間を決定させるコンピュータ可読プログラム・コードと、
    (e)前記プログラマブル・コンピュータ・プロセッサに、残りの制御ノードの各々からの総応答時間を受け取らせるコンピュータ可読プログラム・コードと、
    (f)前記プログラマブル・コンピュータ・プロセッサに、前記総応答時間を使用してキャプテン制御ノードを選択すべきどうかを決定させるコンピュータ可読プログラム・コードと、
    (g)前記総応答時間を使用して前記キャプテン制御ノードが選択される場合、前記プログラマブル・コンピュータ・プロセッサに、最小の総応答時間を決定させるコンピュータ可読プログラム・コードと、
    (h)前記総応答時間を使用して前記キャプテン制御ノードが選択される場合、前記プログラマブル・コンピュータ・プロセッサに、最小の総応答時間を有する制御ノードをキャプテン制御ノードとして指定させるコンピュータ可読プログラム・コードと
    を有するコンピュータ・プログラム記録媒体。
  20. 前記プログラマブル・コンピュータ・プロセッサに、2つ以上の制御ノードの各々が最小の総応答時間を有するかどうかを決定させるコンピュータ可読プログラム・コードと、
    2つ以上の制御ノードの各々が最小の総応答時間を有する場合、前記プログラマブル・コンピュータ・プロセッサに、請求項19の前記(a)乃至(h)の動作を繰り返させるコンピュータ可読プログラム・コードと
    を更に含む、請求項19に記載のコンピュータ・プログラム記録媒体。
  21. 前記プログラマブル・コンピュータ・プロセッサに、前記第1制御ノードに対する前記総応答時間の標準偏差を計算させるコンピュータ可読プログラム・コードと、
    前記プログラマブル・コンピュータ・プロセッサに、残りの制御ノードの各々から標準偏差を受け取らせるコンピュータ可読プログラム・コードと
    を更に含む、請求項19に記載のコンピュータ・プログラム記録媒体。
  22. 2つ以上の制御ノードの各々が最小の総応答時間を有する場合、前記プログラマブル・コンピュータ・プロセッサに、前記2つ以上の制御ノードのどれが最低の標準偏差を有するかを決定させるコンピュータ可読プログラム・コードと、
    前記プログラマブル・コンピュータ・プロセッサに、前記最小の総応答時間及び前記最低の標準偏差を有する制御ノードをキャプテン制御ノードとして指定させるコンピュータ可読プログラム・コードと
    を更に含む、請求項21に記載のコンピュータ・プログラム記録媒体。
  23. 前記総応答時間を使用してキャプテン制御ノードが選択されない場合、前記プログラマブル・コンピュータ・プロセッサに、所定のキャプテン制御ノード選択機能を検索させるコンピュータ可読プログラム・コードと、
    前記プログラマブル・コンピュータ・プロセッサに、前記キャプテン制御ノード選択機能を使用して前記複数の相互接続された制御ノードの各々に対するパフォーマンス・スコアを決定させるコンピュータ可読プログラム・コードと、
    前記プログラマブル・コンピュータ・プロセッサに、最小のパフォーマンス・スコアを有する制御ノードをキャプテン制御ノードとして指定させるコンピュータ可読プログラム・コードと
    を更に含む、請求項19に記載のコンピュータ・プログラム記録媒体。
  24. 前記キャプテン制御ノード選択機能は下式を含む、請求項23に記載のコンピュータ・プログラム記録媒体。
    パフォーマンス・スコア=a(総応答時間)+b(標準偏差)
    なお、a、b、c、及び d は正の定数である。
JP2004235031A 2003-08-29 2004-08-12 複数の制御ノードからキャプテン制御ノードを選択する装置および方法 Expired - Fee Related JP4047840B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/652,144 US7512679B2 (en) 2003-08-29 2003-08-29 Apparatus and method to select a captain from a plurality of control nodes

Publications (2)

Publication Number Publication Date
JP2005092874A true JP2005092874A (ja) 2005-04-07
JP4047840B2 JP4047840B2 (ja) 2008-02-13

Family

ID=34217568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004235031A Expired - Fee Related JP4047840B2 (ja) 2003-08-29 2004-08-12 複数の制御ノードからキャプテン制御ノードを選択する装置および方法

Country Status (3)

Country Link
US (1) US7512679B2 (ja)
JP (1) JP4047840B2 (ja)
CN (1) CN1294507C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477422B2 (en) 2009-10-07 2016-10-25 International Business Machines Corporation Selecting a virtual tape server in a storage system to provide data copy while minimizing system job load
KR101963512B1 (ko) * 2017-09-29 2019-07-31 포항공과대학교 산학협력단 분산형 소프트웨어 정의 네트워킹 컨트롤러의 배치 방법 및 장치

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2435655A1 (en) * 2003-07-21 2005-01-21 Symbium Corporation Embedded system administration
CA2504333A1 (en) * 2005-04-15 2006-10-15 Symbium Corporation Programming and development infrastructure for an autonomic element
CN101374143B (zh) * 2007-08-21 2011-11-02 华为技术有限公司 对象状态发布的方法、系统及装置
EP2073120B1 (en) * 2007-12-18 2017-09-27 Sound View Innovations, LLC Reliable storage of data in a distributed storage system
US8375134B2 (en) * 2009-06-08 2013-02-12 Microsoft Corporation Determining an efficient keep-alive interval for a network connection
CN102270105B (zh) * 2011-08-08 2013-11-20 东软集团股份有限公司 独立磁盘阵列、网络采集数据处理方法及系统
US8806250B2 (en) 2011-09-09 2014-08-12 Microsoft Corporation Operating system management of network interface devices
US8892710B2 (en) 2011-09-09 2014-11-18 Microsoft Corporation Keep alive management
US9049660B2 (en) 2011-09-09 2015-06-02 Microsoft Technology Licensing, Llc Wake pattern management
US9432257B2 (en) 2013-12-27 2016-08-30 Huawei Technologies Co., Ltd. Traffic behavior driven dynamic zoning for distributed traffic engineering in SDN
US9397917B2 (en) * 2014-01-10 2016-07-19 Huawei Technologies Co., Ltd. System and method for zoning in software defined networks
CN105335101B (zh) * 2015-09-29 2018-11-20 浪潮(北京)电子信息产业有限公司 一种数据处理方法和系统
TWI620074B (zh) * 2016-07-12 2018-04-01 緯創資通股份有限公司 伺服器系統及儲存單元的控制方法
CN107104831B (zh) * 2017-04-18 2020-05-29 广东浪潮大数据研究有限公司 一种多服务器切换方法及系统
CN106992889B (zh) * 2017-04-18 2020-05-29 广东浪潮大数据研究有限公司 一种多服务器切换方法及系统
CN106992890B (zh) * 2017-04-18 2020-09-04 广东浪潮大数据研究有限公司 一种多服务器切换方法及系统
US11921605B2 (en) * 2021-10-21 2024-03-05 Hewlett Packard Enterprise Development Lp Managing applications in a cluster

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778785B2 (ja) 1986-03-29 1995-08-23 株式会社東芝 プロセッサ選択方法
GB8613152D0 (en) 1986-05-30 1986-07-02 Int Computers Ltd Computer network system
JPH07219913A (ja) 1994-01-28 1995-08-18 Fujitsu Ltd マルチプロセッサシステムの制御方法及び装置
JP3441264B2 (ja) 1995-09-26 2003-08-25 三菱電機株式会社 多重系システム
US6047309A (en) * 1995-10-02 2000-04-04 International Business Machines Corporation Recording observed and reported response characteristics at server and/or client nodes in a replicated data environment, and selecting a server to provide data based on the observed and/or reported response characteristics
US6317775B1 (en) * 1995-11-03 2001-11-13 Cisco Technology, Inc. System for distributing load over multiple servers at an internet site
US6112239A (en) * 1997-06-18 2000-08-29 Intervu, Inc System and method for server-side optimization of data delivery on a distributed computer network
US6178445B1 (en) 1998-03-31 2001-01-23 International Business Machines Corporation System and method for determining which processor is the master processor in a symmetric multi-processor environment
US6115752A (en) * 1998-05-21 2000-09-05 Sun Microsystems, Inc. System and method for server selection for mirrored sites
US6446121B1 (en) * 1998-05-26 2002-09-03 Cisco Technology, Inc. System and method for measuring round trip times in a network using a TCP packet
US6304913B1 (en) * 1998-11-09 2001-10-16 Telefonaktiebolaget L M Ericsson (Publ) Internet system and method for selecting a closest server from a plurality of alternative servers
US6505249B1 (en) * 1999-12-28 2003-01-07 Bellsouth Intellectual Property Corporation Method for optimizing end-to-end processing performance by selecting optimal values after running benchmarks repeatedly with different values
US6606643B1 (en) * 2000-01-04 2003-08-12 International Business Machines Corporation Method of automatically selecting a mirror server for web-based client-host interaction
US6748437B1 (en) * 2000-01-10 2004-06-08 Sun Microsystems, Inc. Method for creating forwarding lists for cluster networking
CN1115839C (zh) * 2000-01-28 2003-07-23 国际商业机器公司 均衡镜象服务器负载的方法及装置
FR2806498B1 (fr) 2000-03-17 2002-06-14 Lipha Systeme informatique de calcul et procede de calcul mis en oeuvre au moyen d'un tel systeme
KR100620289B1 (ko) 2000-07-25 2006-09-07 삼성전자주식회사 마스터 이탈시 사설 간이 네트워크 운영 방법
US6751673B2 (en) * 2001-01-03 2004-06-15 Akamai Technologies, Inc. Streaming media subscription mechanism for a content delivery network
US20020156878A1 (en) * 2001-04-24 2002-10-24 Conrad Jeffrey Richard Method and system for monitoring node response time
JP2003006087A (ja) * 2001-06-19 2003-01-10 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
WO2003023607A1 (en) * 2001-09-10 2003-03-20 Cenus Technologies, Inc. System and method for information object routing in computer networks

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477422B2 (en) 2009-10-07 2016-10-25 International Business Machines Corporation Selecting a virtual tape server in a storage system to provide data copy while minimizing system job load
US9886211B2 (en) 2009-10-07 2018-02-06 International Business Machines Corporation Selecting a virtual tape server in a storage system to provide data copy while minimizing system job load
US10162564B2 (en) 2009-10-07 2018-12-25 International Business Machines Corporation Selecting a virtual tape server in a storage system to provide data copy while minimizing system job load
KR101963512B1 (ko) * 2017-09-29 2019-07-31 포항공과대학교 산학협력단 분산형 소프트웨어 정의 네트워킹 컨트롤러의 배치 방법 및 장치

Also Published As

Publication number Publication date
US20050050197A1 (en) 2005-03-03
US7512679B2 (en) 2009-03-31
CN1294507C (zh) 2007-01-10
JP4047840B2 (ja) 2008-02-13
CN1607515A (zh) 2005-04-20

Similar Documents

Publication Publication Date Title
US7526624B2 (en) Apparatus and method to adjust data transfer rate
JP4047840B2 (ja) 複数の制御ノードからキャプテン制御ノードを選択する装置および方法
US7793148B2 (en) Using virtual copies in a failover and failback environment
US7673173B2 (en) System and program for transmitting input/output requests from a first controller to a second controller
JP3316500B2 (ja) 移動されたデータの完全性を維持しながらraidセットにおけるドライブ数の拡張
US6047294A (en) Logical restore from a physical backup in a computer storage system
US6397308B1 (en) Apparatus and method for differential backup and restoration of data in a computer storage system
US7107395B1 (en) Apparatus and methods for operating a computer storage system
US6487561B1 (en) Apparatus and methods for copying, backing up, and restoring data using a backup segment size larger than the storage block size
US6920537B2 (en) Apparatus and methods for copying, backing up and restoring logical objects in a computer storage system by transferring blocks out of order or in parallel
JP3149325B2 (ja) 災害復旧機能を提供するために整合性グループを形成する方法および関連するシステム
US7475208B2 (en) Method for consistent copying of storage volumes
JPH08305500A (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
JPH08509565A (ja) 遠隔データのミラー化
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
US6931499B2 (en) Method and apparatus for copying data between storage volumes of storage systems
US7240080B2 (en) Method and apparatus for determining using least recently used protocol if one or more computer files should be written to one or more information storage media and synchronously providing one or more computer files between first and storage devices
US20060294332A1 (en) Method to write data to an information storage and retrieval system
US20050114465A1 (en) Apparatus and method to control access to logical volumes using one or more copy services
US7080223B2 (en) Apparatus and method to manage and copy computer files
US20050071380A1 (en) Apparatus and method to coordinate multiple data storage and retrieval systems
US7747586B2 (en) Apparatus and method to map and copy computer files

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees