JP2004252938A - 広域ストレージのローカライズ化システム - Google Patents

広域ストレージのローカライズ化システム Download PDF

Info

Publication number
JP2004252938A
JP2004252938A JP2003186095A JP2003186095A JP2004252938A JP 2004252938 A JP2004252938 A JP 2004252938A JP 2003186095 A JP2003186095 A JP 2003186095A JP 2003186095 A JP2003186095 A JP 2003186095A JP 2004252938 A JP2004252938 A JP 2004252938A
Authority
JP
Japan
Prior art keywords
data
location
remote
proxy
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003186095A
Other languages
English (en)
Other versions
JP2004252938A5 (ja
Inventor
Yuichi Taguchi
雄一 田口
Akira Yamamoto
山本  彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2004252938A publication Critical patent/JP2004252938A/ja
Publication of JP2004252938A5 publication Critical patent/JP2004252938A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/564Enhancement of application control based on intercepted application data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/566Grouping or aggregating service requests, e.g. for unified processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】データ構成を合わせる必要がなく、又、繰り返して行われる長距離に渉る問い合わせにより引き起こされる遅延に煩わされることなく、遠隔地データを共有できるシステムを提供する。
【解決手段】ミラーリング又は他のデータ複製作成ソフトウエアを用いて、多様なサイトからセカンダリサイトへ情報を好適に抽出する為のシステムが開示されている。本セカンダリサイトでは、オペレータはプロキシシステムを用いて、該セカンダリサイトにミラーされたデータを抽出することが出来る。本システムは特に、遠隔地に存在する異種のタイプのデータベースに特に有効に適用することが出来る。
【選択図】 図1

Description

【発明の属する技術分野】
[04] 本発明はデータストレージシステムに関連し、特に、データベース情報を抽出するシステムに関連する。
【従来の技術】
[05] ハードウエア及びソフトウエアベンダは、世界中の企業及び組織と相協力して、各企業の従業員が別のオフィスにいても、従業員間で情報を共有できるイントラネットシステムを開発してきた。このようなシステムでは、各ブランチでサーバを設置して、当該オフィスの従業員に対して情報を配布している。各クライアント端末は、他のオフィスから目的の情報を得るために、他のサーバを検索することが必要である。このようなクライアント−サーバモデルでは、クライアントがリモート情報を必要とする度に、リモートサーバへのアクセスが必要になる。このことは、トランザクション発生の度に、リモートサイトからの応答を得る為にネットワーク遅延を蒙らなければならないことを意味する。リモートサイト間にしばしば見られる距離とバンド幅限界によるネットワーク遅延により、イントラネットシステムを全世界ベースで展開することが困難になっている。
[06] データと知識を共有する為の異なったもう一つのアプローチは、XML技術を使用することである。XML技術は、例え、様々なデータストレージがそれぞれ別々に異なった組織やドメインで管理されていても、各種のデータストレージを統合することを原理的には可能にしている。しかしながら、これも表面上だけのことで、本レベルでデータが統合できる為には、全てのストレージを静的なDTD(Document Type Definition)でフォーマットしなければならなく、柔軟性を欠いてしまっている。ストレージを構築する各サイトのオペレータは、DTDに従わなければならないため、各サイト特有のニーズに合わせてデータ構造の拡張を行うことができず、このため柔軟性を失っている。同様のアプローチはデータベースをデータレベルで統合することである。しかしながら、この方法も同様な理由で困難である事が判る。データベースが統合されるためには、互いに整合性を有する共通のテーブルスペ―スを持つことが必要である。
[07] もう一つのOTG(Oracle Transparent Gateway)として知られるアプローチでは、異なった場所にあるデータベースが統合されるが、これは仮想的なものである。データベースは各サイトから実際に統合されるわけでなく、データベースへのクライアントからの要求は、分割され、複数のデータベースサーバに固有のメッセージフォーマットで転送される。この方法は、クライアントが複数サーバにあるデータを恰も一つのデータベースにアクセスしている様に見せかけることができる。しかしながら、各データベースは遠隔地にあり、これまで述べてきた遅延の問題を免れることは出来ない。このような従来技術のアプローチについては、(1)“Enterprise Information Integration”MetaMatrix社刊,(2001);(2)“Hitachi Data Systems 9900 and 7700E−Guideline for Oracle Database for Backup and Recovery”(株)日立製作所刊(Jan. 2001);(3)“Guidelines for Using Snapshot Storage Systemsfor Oracle Databases”Nabil Osorio,et al. Oracle社刊 (Aug. 2000);及び(4)“Microsoft SQL Server on Windows NT Administrator’s Guide”Oracle社刊(Apr. 2000)を参照すること。
【発明が解決しようとする課題】
[08] 従って、データ構成を合わせる必要がなく、又、繰り返して行われる長距離に渉る問い合わせにより引き起こされる遅延に煩わされることなく、遠隔地データを共有できるシステムが必要である。
【課題を解決するための手段】
[09] 本発明により、ストレージを指向したデータベ―スローカライズ化システムが可能になる。本システムは、各サイトが独自のローカルデータベースを持つ複数のリモートサイトで構成される環境を前提としている。本発明の好適な実施例では、システムは、各リモートサイトからセンタサイトにデータのすべて、又はその一部を取り込む。既に述べた従来技術とは異なり、本システムは、データベ―スをデータレベルで統合することは行わず、保存したデータ自身をリモートサイトからセンタサイトに複製し、各リモートサイトからのデータベースのコピーは常にセンタサイトに存在するようにする。この方式により、データ統合が柔軟に出来るようになり、上記の説明で触れたシステム間の遅延の問題も解決される。
[10] センタサイトでは、データベースプロキシサーバが、複数の複製の各々に対してゲートウエイの役割を果たす。センタサイトのオペレータより発せられたデータアクセス要求は、このプロキシにより、分割され、複数の複製要求が生成され、各遠隔データベースのコピー(本コピーはこのセンタサイトにも存在する)に対して送信される。各複製からの返答は、本プロキシサーバによりマージされオペレータに対して返答される。本機能により、多重記憶されたデータベースに対して柔軟性と高速性がもたらされる。
[11] 本発明は、今やストレージシステム間で、広く普及してきた複製技術に依存している。ストレージ装置は今や、サーバCPUのコントロール無しで、遠隔サイト間のミラーデータの作成を行えるのが普通である。ミラー機能を使用する事により、世界規模レベルでのデータのミラー化が可能になる。本ミラー機能を装備したストレージ装置はプライマリとセカンダリサイト間での交信で、書き込み順序を保証することを可能にし、長距離間で継続的ミラーを作成することも可能にしている。
[12] 本発明のもう一つの機能はスナップショット制御である。スナップショットコントローラは、他サイトからミラーデータを受け取るサイトの書き込みプロセスをコントロールする。本スナップショットコントローラは、キャッシュデータが到着する度に、キャッシュデータを監視して、正しい順序で来ているかを確認する。本書き込み順序が確認できたデータは、キャッシュからデイスクスペースへの書き込みが許可される。本メカニズムにより、データ再生システムに影響を与えることなく、継続的なデータ転送が可能になり、転送遅延を最小にすることが出来る。二つのサイト間のデータ転送には、同期型、非同期型、又は両者の組み合わせを用いることが可能である。
[13] 本発明の好ましい実施例に於いて、第一のシステムが第一のデータを第一のロケーションに記憶し、第二のシステムが第二のデータを第二のロケーションに記憶する、データの再生を容易にするシステムは幾つかの特徴を有している。この特徴の中には、第一のシステムからデータを受け取るために接続された端末と、第二のシステムから第一のシステムにデータをコピーする複製作成ソフトウエアプログラムが含まれる。第一のロケーションで稼動するプロキシシステムにより、第二のシステムから第一のシステムへコピーされたデータを用いて、端末のユーザが第二のシステムからデータを抽出することが出来るようになる。
【発明の実施の形態】
[30] 図1に広域ストレージのローカライズ化システムの全体像を説明する。図1には、105A、106B及び107Cの三つのプライマリサイトと一つのセカンダリサイト100が描かれている。典型的には、サイトA,B,Cは、互いに又セカンダリサイト100からも離れて設置されている。各プライマリサイトではデータはオペレータによりローカルに管理されている。本発明では、各プライマリサイトに保存されているデータはセカンダリサイト100にも複製されている。典型的には、本データの複製はネットワークを通して行われ、各サイト105A、106B及び107Cとの間で独立に行われる。
[31] セカンダリサイト100は、データ103に見られるようにプライマリサイトのデータの全部又は一部を集め保存する。データベース(DB)プロキシ101は、データ103へのアクセスを可能にする。オペレータ102よりのデ―タアクセス要求は、プロキシ101により分割され、ローカル複製データ103を管理するローカルデータベースサーバ104に転送される。DBプロキシ101は、複数サーバからの応答をマージしてオペレータへ返答する。これにより、オペレータは複数データベースへのデータアクセスを単一の要求を用いて行うことが可能になる。
[32] プライマリサイトとセカンダリサイト間のデータ複製プロセスは、ボリュームミラーリングと通称される、慣用的なデータ複製技術により好適に実行することが出来る。本ミラーリング技術はセカンダリサイトの複製を常に保持する為には理想的技術であるが、週1回実施される“ftp”によるデータ転送もセカンダリサイトのオペレータの助けになる。このミラーリング技術は公知のものであり、ここでも既に言及されている。例えば既出の、“Hitachi Data Systems 9900 and 7700E−Guideline for Oracle Database for Backup and Recovery”(株)日立製作所刊(2001.1月)を参照すること。データベースプロキシサーバ104も公知であり、例えば既出の、“Microsoft SQLServer on Windows NT Administrator’s Guide” Oracle社刊(2000.4月).に記述されている。
[33] 図2はストレージシステムのハードウエア構成を示すブロックダイアグラムである。図2に描かれているストレージシステムは図1の各プライマリ及びセカンダリサイトでデータ蓄積用として使用でき、又他の公知のシステムを用いることも可能である。図2に示す通り、本ストレージシステムのハードウエア構成では、例えば、デイスクドライブのアレイ又は他の公知メデイアを有するストレージスペース205を含む。本ストレージスペースは、CPU202、キャッシュメモリ203及びネットワーク接続用のネットワークインタフェース204を接続するバスに接続される。本システムは更に、入出力デバイス206及び207を含む。デイスクインタフェースチップ(又はシステム)201はストレージスペース205との間の入出力を制御する。図2に描かれているストレージシステムは殆んど最小のものであり、より大型化又は詳細化することが出来る。
[34] 図3はストレージシステムのアーキテクチュアのより詳細な構成図を示す。図3の左側には、例えば図1のストレージシステム105のサイトAに相当するプライマリストレージシステム301が、右側には、例えば図1のシステム100に相当するセカンダリストレージシステム302が示されている。この二つのシステムは、セカンダリストレージシステム302がスナップショットコントローラ303(後に説明される)を含むことを除いて、殆ど同一の要素を含んでいる。各ストレージシステムは、デイスクアダプタ305でアクセス制御されるデイスクスペース205を含む。本デイスクアダプタはI/Oコントローラ304及びミラーマネージャ306のコントロールの下で動作する。本デイスクアダプタはキャッシュメモリ203よりデータを受け取る。デイスクステータス初期化プログラム309及びステータス情報308も又ミラーマネージャ306に結合している。ミラーマネージャ306は、リンクアダプタ307を通して稼動して、例えば図3に記される他システムのリンクアダプタ307との間でデータ交換の為に交信する。ストレージシステムの制御と稼動に必要なプログラムは稼動中を通して、メモリスペース203にロードされている。デイスクスペース205はデイスクボリュームとして構成される。
[35] ホスト310は、I/Oコントローラ304を通してストレージシステムを操作する。本I/Oコントローラ304は、ホストI/Oプログラム311より読み取り要求を受け取ると、デイスクアダプタ305に対して読み取り要求を発行する。本コントローラ304はまた、ホストI/Oプログラム311より書き込み要求を受け取ると、書き込み用データをキャッシュメモリ203に格納し、デイスクアダプタ305に対して書き込み要求を発行する。
[36] デイスクアダプタ305とそれのソフトウエアは、デイスクボリューム205からの読み出しデータ及びデイスクボリューム205への書き込みデータを管理する。デイスクアダプタ305が、読み取り要求に応じてデイスクスペース205からデータを読み出したら、当該データをキャッシュメモリ203に保存する。もし、デイスクミラーリングが各サイトで設定されている場合には、デイスクアダプタ305はミラーマネージャ306から許可を得た後に、デイスクボリューム205への書き込みを開始する。
[37] ミラーマネージャプログラム306Aは、プライマリとセカンダリサイト間のデータ複製処理を管理する。プライマリサイト301のミラーマネージャ306A中のソフトウエアは、ローカルデイスクスペース205Aに書き込むデータを、セカンダリストレージシステム302にリンクアダプタ307Aを経由して送信する。この転送されたデータはセカンダリストレージシステム302のリンクアダプタ307Bで受け取られ、キャッシュメモリ203Bに格納される。セカンダリストレージシステム302のミラーマネージャプログラム306Bは、キャッシュされたデータを受け取り、スナップショットコントローラプログラム303にデータの整合性チェックを行うことを指示する。整合性があるとの前提で、セカンダリストレージシステム302のミラーマネージャプログラム306Bはデイスクアダプタ305Bに書き込みプロセスを開始させる。
[38] リンクアダプタプログラム307A及び307Bは、プライマリとセカンダリシステム間の交信を管理する。本ソフトウエアは、ネットワークインタフェースデバイスドライバや典型的な公知のプロトコルプログラムを有していることが好ましい。リンクアダプタプログラム307は、プライマリサイトのキャッシュメモリ203Aよりデータをロードし、セカンダリサイトで当該データを受け取った時には、キャッシュメモリ203Bに格納する。ミラー動作のステータスはステータス情報308に格納されプログラム309により初期化される。
[39] 図4はプライマリサイトでのデイスクミラーのステータス情報308Aの一例を示し、図5はセカンダリサイトでのデイスクミラーのステータス情報308Bの一例を示す。この例では、全ての複製作業はストレージスペースの単位としてデイスクボリュームベースで行われているものとする。図4及び5のテーブルは、各行単位にデイスクボリューム情報をリストしている。図4のテーブル308Aはプライマリシステムの情報を示している。各ボリュームに対して、本テーブルは、ローデバイスアドレス401、マウントポイント402、ボリュームサイズ403、同期モード404及びリモートリンクアドレス405を定義している。デバイスアドレス、マウントポイント及びボリュームサイズはオペレーテイングシステムによる指定に従って、ボリューム識別情報を定義する。これらはUNIXベースのシステムに従い、“/etc/fstab”ファイル内に典型的に定義される。同期モードは複製モードに従い“同期”又は“非同期”が定義される。リモートリンクアドレス405はセカンダリサイトの対象アドレスを示す。
[40] 図5のテーブル308Bは、セカンダリサイトでのデイスクミラーのステータス情報の同一パラメータを示す。但し、本図ではリモートマウントポイントを有している。リモートマウントポイントはプライマリ及びセカンダリ間のペアボリュームを定義する。
[41] 図6はプライマリストレージシステム301からセカンダリストレージシステム302への転送データの一例を示す。正確なメカニズムは上記で述べたストレージシステムの機能に依存するが、図6では最小限の仕様を示す。図6では、非同期転送モードを例にしており、送信元603及び送信先604アドレスとして、IPアドレスを使用している。このアドレス方式は通信方式に依存し、他のアドレス方式を使用しても良い。例えばファイバチャネル通信の場合はWWN(Worldwide Name)が使用される。図6のデイスクスペース情報601は対象とするファイル名を指定する。書き込み順序情報602はデータ書き込みの順序番号を示す。書き込み順序情報は、転送データは殆ど常に、転送時に複数の部分に分割されるので必要となる。長距離通信が介在している場合には、後から送信された部分が先に送信された部分を追い越してしまうことがある。図6に示されるように、データペイロード(転送対象のデータ)が、デイスクスペース601、書き込み順序602、送受信アドレス603、604に対応するデータとして付加される。図3に関連して説明したように、データは、プライマリ及びセカンダリストレージシステムのリンクアダプタを経由して転送される。
[42] 図7はデイスクペアを初期化する為のフローチャートを示す。本動作はミラーマネージャ306により実行される(図3を参照)。本動作に於いては、プライマリシステム301及びセカンダリシステム302の双方のミラーマネージャ306が、初期化を達成する為にリンクアダプタ307を通して情報交換を行う。最初に、ステップ701及び704により、これらのシステム301及び302は各ローカルリンクアドレスを設定する。例えば、システムマネージャは、各ネットワークインターフェースデバイスに固有のIPアドレスを割り当てる。この後、プライマリサイト301では、ミラー又はペア対象のデイスクスペース構成を決める(ステップ702)。次に、プライマリシステム301は、自分のミラーデイスクのステータスをセカンダリシステムに通知し(ステップ703)、セカンダリシステムでは、これを受信する(ステップ705)。セカンダリシステムが本情報を受け取ると(ステップ705)、セカンダリシステムは自分のデイスクスペースを設定する(ステップ706)。次に、セカンダリシステムは、ローカルデイスクステータスをプライマリシステムに送信し(ステップ707)、プライマリシステムでは、本情報を受け取る(ステップ708)。プライマリシステムが本情報を受け取ると、図6で述べた様に、各デイスクスペース205に対して同期モードを設定する(ステップ709)。次いで、当該システムは設定された同期モード構成情報をセカンダリシステムに送信し(ステップ710)、セカンダリシステムはこれを受け取る(ステップ711)。セカンダリシステムはこの時点で自分のミラーデイスクステータス情報を更新する。これらのステップを通して、プライマリ及びセカンダリの双方のストレージシステムは一貫性のあるミラーデイスクステータスを確定することが出来る。
[43] 図8はプライマリストレージシステムが、ホストより命令を受け取ったときの動作を説明するフローチャートである。ホストとプライマリストレージシステムとの関係は図3に説明してある。プライマリストレージシステムは、図7の初期化プロセスに続いて図8に示されるように、ホストからの入力情報の受信を開始する(ステップ801)。ストレージシステムは、I/Oコントローラ304A経由で入力情報を受け取り、キャッシュメモリ203Aに格納する(図3を参照)。次にデイスクアダプタ305Aに知らされる。デイスクアダプタはミラーマネージャ306Aからの許可を待って、ローカルデイスクドライブへの書き込みに進む。次に、ミラーマネージャ306Aは、複製用データをセカンダリシステム302に転送する(ステップ802)。
[44] 次に、同期モードを判定する(ステップ803)。同期モードの判定は、ミラーデイスクステータス情報308Aによる(図3を参照)。同期モードが“非同期”なら制御は直ちにステップ805に進む。一方、同期モードが“同期”なら、システムはセカンダリシステムより当該システムでの複製完了の報告がプライマリシステムに通知されるのを待つ(ステップ804)。いずれのモードでも、ステップ805に示される通り、最終的には完了報告がホストに返され、データが成功裏に受信できたことが知らされる。
[45] プライマリシステムでのストレージボリュームへの実際の情報書き込み処理は、例えば、“Hitachi Data Systems 9900 and 7700E−Guideline for Oracle Database for Backup and Recovery”(株)日立製作所刊(2001.1月)、等に記される公知の技術を用いて行われる。この公知技術には、キャッシュ中のデータを所定のデイスクスペースに適切なタイミングで書き込む為の方法が含まれる。
[46] 図9は、図8のステップ802で実行される、プライマリからセカンダリシステムへのデータ転送を示すフローチャートである。図9の最初のステップ901にて、ミラーbマネージャ306A(図3を参照)がリンクアダプタ307Aにデータ送信を指令する。次いで、ミラーマネージャ306Aは、ミラーデイスクステータス情報308Aに存在する対象アドレス604とデイスクスペース601を通知する。リンクアダプタ307Aは次いで、キャッシュメモリ203Aよりデータをロードする(ステップ902)。更にリンクアダプタ307Aは、データを図6に関連して説明したフォーマット内の対象アドレスに送信する(ステップ903)。リンクアダプタ307Bはプライマリリンクアダプタ307Aより送られたデータを受信し(ステップ904)、次いで、本受信情報をキャッシュメモリに格納する(ステップ905)。
[47] 図10はセカンダリサイトでのローカルデイスクスペースへのデータ書き込みのフローチャートを示す。本プロセスはステップ1001に始まり、スナップショットコントローラ303が、キャッシュメモリ203Bに蓄積されたデータのスキャンを開始する。スナップショットコントローラ303は、データの整合性を保証する為、書き込み順序番号を監視する。ステップ1002に示される如く書き込み順序番号が正しい、即ち今書きみ対象になっているデータが直前に書き込まれたデータの次の番号を持っている場合は、スナップショットコントローラはミラーマネージャ306Bにこのことを通知する(ステップ1003)。ミラーマネージャ306Bは、これに応答して、デイスクアダプタ305Bにコマンドを発行して(ステップ1004)、デイスクアダプタ305Bが該当デイスクスペースへの書き込み処理に入る(ステップ1005)。これに応答して、ミラーマネージャはデータの複製が成功裏に終了したことを示す応答を返す(ステップ1006)。
[48] 既に述べたように、本発明の一つのメリットは、オペレータに特定のサイトに複製されている複数データベースへのアクセスを提供できる事にある。本アクセスを提供するDBプロキシハードウエアサーバは、図11にブロック形式で示される。図11に示される通り、本ハードウエアはデイスク、入出力デバイス、CPU,キャッシュメモリ及びネットワークインタフェースを含む。本発明の幾つかの実装では、DBプロキシハードウエアは汎用PCで構成される。
[49] 図12はDBプロキシのアーキテクチュアの例を示す。図12は図1で示されるダイアグラム100の一部をより詳細化したものである。三つのストレージシステム103A、103B及び103Cが図12に示されている。各システムはそれぞれサーバ104A,104B及び104Cに結合するI/Oコントローラを有する。図12に示されるストレージシステムはリモートストレージシステム105A〜107C(図1を参照)のミラーシステムである。サーバホスト104は、I/Oコマンドを受け取るホストである。クライアントホスト1201は、セカンダリサイト100のオペレータ102に対してインタフェースを提供する。データベースプロキシ101は、複数サーバホスト104A,104B及び104Cに跨る検索機能を提供する。図12に示す通り、各サーバホスト104は、ホストI/Oプログラム311及びデータマネージメントプログラム1203を有する。本ホストI/Oプログラム311は、図3で述べたものと同じである。データマネージメントプログラム1203は、外部ホストより検索要求を受付これらの要求に応じてデータ検索を実行する。
[50] クライアントホスト1201はWWWクライアント1202を有し、本クライアントは、http要求を発行し、httpメッセージ中のHTMLコンテンツを受信する汎用WEBブラウザにより動作している。図12では、本クライアントはhttpで要求するように示されているが、本発明では、多数の他のタイプのクライアントが採用されても良い。例えば典型的なSQLクライアントは、SQLクライアントが使用されていれば、データ検索要求をSQLメッセージにてプロキシサーバ101に要求することが出来る。この場合は、サーバ1204はWWWサーバインタフェースに替えて、SQLメッセージインタフェースになる。本実施例では、プロキシサーバ101は、慣用的なWEBサーバプログラムを有し、外部ホストからhttp要求を受け取り、httpメッセージにてコンテンツを返す。このサーバプログラム1204はホストに対してインタフェースを提供する為に使用される。
[51] プロキシサーバ101中のクライアントI/Oプログラム1205は、プロキシサーバとクライアントホスト1201との間の交信をコントロールするプログラムである。本I/Oプログラム1205は、WWWサーバ1204のバックエンド部分に典型的なCGIとして実装可能である。データベース検索プログラム1206はクライアントホスト1201からの要求により、データベースよりデータの抽出を行うプログラムである。プログラム1206は、図12に示す通り、クライアントからの要求を分割しそれらを複数サーバホスト104に転送する公知のデータベースソフトウエアでよい。これらの要求は各種のサーバホストにサーバI/Oプログラム1207により転送される。
[52] 図13はデータベースプロキシ101の動作フローチャートを示す。最初に、DBプロキシオペレータは、データベースアクセス情報1208(図14を参照)を設定して、プロキシ設定を初期化する(ステップ1301)。本DBプロキシ101は、ホスト1201よりデータ検索要求を受信する(ステップ1302)。本要求のメッセージフォーマットは、SQL,http、LDAP等如何なるものでもかまわない。DBプロキシ101は、要求を図15に関連して説明されるように複数のサーバホストに転送する(ステップ1303)。DBプロキシ101は、検索結果を複数のサーバより受信してこれらをクライアントホストに返送する(ステップ1304)。
[53] 図14はデータベースアクセス情報を示す。これは、図13に関連して、データベースアクセス情報1208として既に触れたものである。本データベースアクセス情報は、サーバ名1401、サーバアドレス1402、ポート番号1403及び源データロケーション1404を有している。サーバ名欄1401には、DBプロキシ101がデータ検索要求を送信する為のターゲットとして使用するサーバ名が示されている。サーバアドレス1402は、各サーバに割り当てられたIPアドレスである。一方において、ポート番号は、サーバホストで採用されているデータ検索サービスのタイプ、例えば、LDAP,SQL等を区別する。源データロケーションは、例えば図1の通り、プライマリサイトのロケーションを意味する。
[54] 図15は上述したデータベースプロキシアーキテクチャによる複数データベースの検索のフローチャートである。本図では、DBプロキシの動作を左側に、サーバホストの動作を右側に記す。最初に、DBプロキシ101内のデータベース検索プログラム1206(図12を参照)が、クライアントの要求をデータベースアクセス情報内のポート番号1403(図14を参照)で定義されるメッセージタイプに変換する。例えば、クライアント1201からのhttp要求は、各実行サーバが理解できる様に、LDAPサーバに対してはLDAP要求フォーマットに、SQLサーバに対してはSQL要求フォーマットに変換しなければならない。この変換は、ステップ1501に示されており、公知のソフトウエアにより実行される。DBプロキシ101は、変換された要求をデータベースアクセス情報1208内のサーバアドレスコラム1402で指定されたサーバに発行する(ステップ1502)。図15の右側に示される通り、サーバホスト104は、DBプロキシ101からの要求を自らに適合するメッセージフォーマットにて受け取る(ステップ1503)。各サーバホスト104内のデータマネージメントプログラム1203は、次に、ホストI/Oプログラム311を用いて、自らのストレージシステムに保存されている情報より要求データの検索を開始する(ステップ1504)。
[55] 次に、サーバホスト104は、検索結果をDBプロキシ101に返し(ステップ1505)、この結果をDBプロキシ101が受け取る(ステップ1506)。本DBプロキシ101は、全てのサーバ104からの応答を待ち(ステップ1507)、全結果の受領が完了したことを確かめる。全ての結果の受信が完了すると本DBプロキシ101は、クライアントI/Oプログラム1205(図12を参照)を用いて、受信結果を単一のメッセージに統合する(ステップ1508)。
[56] 図16で一つの検索要求をサンプルとして本システムの全体的動作を説明する。本サンプルでは、クライアントがDBプロキシ101に、ファーストネームは“Mchael”で“Sales Department”で働く人全てを、全ての“Office”から検索することを要求したとする。DBプロキシ101は、本要求を分割して三つの適切にフォーマットされた問い合わせ系列に変換して、本情報が保存されていると考えられる三つのミラーサイトにアクセスする。サーバ104AにはLDAPフォーseマットで、サーバ104BにはSQLフォーマットで、及びサーバ104Cにはhttpフォーマットでアドレスする。各サーバは各問い合わせに対応するデータマネージメントプログラムを用いて、関連データベースに問い合わせを行い、結果をDBプロキシ101に返送する。図に示されるように、サーバAは二人の従業員名を返答し、サーバB,Cは各々一人の従業員名を返答している。DBプロキシ101は、表1601に示すように、本結果を纏めてクライアント1201に返答する。テーブル1601には、各従業員のファーストネーム、ラストネーム、部署及びE−Mailアドレスが記されている。加えて、各情報が得られた源ロケーション名が記されている。
[57] 本発明の好適な実施例に付いて述べてきた。ここで述べられた技術に対しては、幾多の応用がある事は容易に理解されるところである。例えば、本発明は、互いに離れて遠隔地に存在し、各個別のストレージシステムを持ち、個別にデータを管理する、多数のブランチを持つ大企業に付いても適用可能である。ここでは、メインオフィスが分散するデータを集めて単一つの巨大ストレージシステムに纏めることが可能である。これにより、一オフィスの従業員はシステム全てのデータにアクセス可能である。
[58] 他の例では、一つの中央気象庁は世界中に存在する何千と言う観測所から気象情報を集めて、各サイトの気象状態に関連する情報を適切に問い合わせて、適切に取得して管理することが出来る。他の例としては、本システムはデータの冗長配置を可能にして、各サイトでのシステムクラッシュ、自然災害、その他に対してデータを保護することが出来る。このような応用では、従来技術を用いた不均一システムでも、オペレータには意識させない運用が可能である。
[59] 本発明の範囲に付いては、後続する請求項で定義される。
【図面の簡単な説明】
【図1】図1は広域ストレージのローカライズ化システムの全体像を説明する。
【図2】図2はストレージシステムのハードウエア構成のブロックダイアグラムである。
【図3】図3はストレージシステムのアーキテクチュアのより詳細な一例を示す。
【図4】図4はプライマリサイトでのデイスクミラーのステータス情報の一例を示す
【図5】図5はセカンダリサイトでのデイスクミラーのステータス情報の一例を示す。
【図6】図6はプライマリからセカンダリシステムへのデータ転送の状況を示す。
【図7】図7はデイスクペアを初期化する為のフローチャートを示す。
【図8】図8はプライマリストレージシステムでのデータ入力の為のフローチャートを示す。
【図9】図9はミラーデータ転送の為のフローチャートを示す。
【図10】図10はセカンダリサイトでのローカルデイスクへのデータ書き込みの為のフローチャートを示す。
【図11】図11はデータベースプロキシのハードウエア構成を示す。
【図12】図12はデータベースプロキシのアーキテクチュアのより詳細な一例を示す。
【図13】図13はデータベースプロキシ動作のフローチャートを示す。
【図14】図14はデータベースアクセス履歴情報を示す。
【図15】図15はデータベースプロキシサーバによる複数データベース検索の為のフローチャートを示す
【図16】図16は抽出された複数データがデータベースプロキシサーバにより如何にマージされるかを示す。
【符号の説明】
105,106,107・・・プライマリサイトA,B,C、オペレータ、データ、複製、100・・・セカンダリサイト、101・・・DB(データベース)プロキシ、検索、検索結果、102・・・オペレータ、103・・・データ、104・・・サーバ、200・・・ストレージシステム、201・・・デイスクI/F(インタフェース)チップ、202・・・CPU、203・・・キャッシュメモリ、204・・・ネットワークインタフェース、205・・・デイスクスペース、206・・・入力装置、207・・・出力装置、310A,B・・・ホストA,B、311A,B・・・ホストI/Oプログラム、301・・・プライマリシステム、302・・・セカンダリシステム、303・・・スナップショットコントローラ、304A,B・・・I/Oコントローラ、305A,B・・・デイスクアダプタ、306A,B・・・ミラーマネージャ

Claims (8)

  1. 情報抽出を好適に行うシステムであって、第一のシステムが第一のデータを第一のロケーションに記憶し、第二のシステムが第二のデータを第二のロケーションに記憶し、前記第一のシステムと前記第二のシステムはネットワークを介して互いに結合されているシステムにおいて、
    前記第一のシステムからデータを抽出すべく接続された端末;
    前記第二のシステムから前記第一のシステムへデータのコピーを行う少なくとも一つの複製作成ソフトウエアプログラム;及び
    前記端末のユーザが前記第二のシステムからデータを抽出するのに、前記第二のシステムから前記第一のシステムへコピーされたデータを用いることを可能にする前記第一のロケーションで稼動するプロキシシステム、
    を有することを特徴とするシステム。
  2. 複製作成ソフトウエアプログラムがミラーリングプログラムを含む請求項1に記載のシステム。
  3. データはデータベースからのデータを含んでいる請求項2に記載のシステム。
  4. 情報を好適に抽出する為のシステムであって、
    第一のデータを第一のロケーションに記憶する第一のシステム;
    第二のデータを第二のロケーションに記憶する第二のシステム;
    前記第一と第二のロケーションからは遠隔地に存在し、前記第一と第二のシステムとネットワークで結合され、オペレータが情報を抽出する第三のシステム;
    前記第一のシステムから前記第三のシステムへ、及び前記第二のシステムから前記第三のシステムへ前記ネットワークを介してデータをコピーする少なくとも一つの複製作成ソフトウエアプログラム;及び
    前記第三のシステムのユーザが前記第三のシステムからデータを抽出するのに、前記第一及び第二のシステムから前記第三のシステムへコピーされたデータを用いることを可能にする前記第三のロケーションで稼動するプロキシシステム、
    を有することを特徴とするシステム。
  5. 第一及び第二のデータはデータベースに記憶されたデータを含む請求項4に記載のシステム。
  6. 異なったロケーションに存在するデータベース内のデータを好適に抽出するシステムであって、
    第一のロケーションにて第一のデータベース情報を記憶し、ネットワークに接続され、前記ネットワークを通して、遠隔地に存在するリモートシステムに自らのデータをコピーする為のミラーリングソフトウエアを有する第一のシステム;
    第二のロケーションにて第二のデータベース情報を記憶し、前記ネットワークに接続され、前記ネットワークを通して、前記リモートシステムに自らのデータをコピーする為のミラーリングソフトウエアを有する第二のシステム;及び、
    前記リモートシステムで稼動し、前記リモートシステムのユーザが前記第一及び第二のシステムからのコピーされたデータの抽出を可能にするためのプロキシシステム、
    を有することを特徴とするシステム。
  7. 複数の異なったリモートロケーションに記憶され、前記リモートロケーションからローカルサイトにコピーされた情報を好適に抽出する為のシステムであって、
    ローカルサイトでストレージにアクセスする為に結合した端末;及び
    リモートロケーションからローカルサイトにコピーされた情報にアクセスするローカルサイトのプロキシサーバ、
    を有することを特徴とするシステム。
  8. 複数の異なったロケーションに記憶された情報を好適に抽出する為の方法であって、
    前記複数の各ロケーションに於いて、ロケーションのデータをネットワークを介して、第一のロケーションにコピーしてデータのバックアップ動作を実行し;
    前記第一のロケーションでのユーザに、前記ロケーションにバックアップされたデータをアクセス可能にさせるプロキシサーバを用意し;
    前記第一のロケーションで及び前記プロキシサーバを用いて、前記第一のロケーションに記憶されたデータにアクセスする、
    ことを有することを特徴とする方法。
JP2003186095A 2002-08-01 2003-06-30 広域ストレージのローカライズ化システム Pending JP2004252938A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/211,428 US20040024808A1 (en) 2002-08-01 2002-08-01 Wide area storage localization system

Publications (2)

Publication Number Publication Date
JP2004252938A true JP2004252938A (ja) 2004-09-09
JP2004252938A5 JP2004252938A5 (ja) 2006-08-17

Family

ID=31187572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003186095A Pending JP2004252938A (ja) 2002-08-01 2003-06-30 広域ストレージのローカライズ化システム

Country Status (2)

Country Link
US (1) US20040024808A1 (ja)
JP (1) JP2004252938A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236084A (ja) * 2005-02-25 2006-09-07 Ricoh Co Ltd データベース装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309550A (ja) * 2004-04-19 2005-11-04 Hitachi Ltd リモートコピー方法及びリモートコピーシステム
US20050068975A1 (en) * 2003-09-30 2005-03-31 Pierre Colin Computer data transport system and method
US20060123210A1 (en) * 2004-12-06 2006-06-08 St. Bernard Software, Inc. Method for logically consistent backup of open computer files
US8412750B2 (en) * 2005-09-26 2013-04-02 Research In Motion Limited LDAP to SQL database proxy system and method
CN101379842B (zh) * 2005-12-09 2013-07-10 吉格索技术有限公司 计算机化矿井生产系统
US7464238B1 (en) * 2006-04-28 2008-12-09 Network Appliance, Inc. System and method for verifying the consistency of mirrored data sets
JP2008108145A (ja) * 2006-10-26 2008-05-08 Hitachi Ltd 計算機システム及びこれを用いたデータの管理方法
US8812579B2 (en) * 2006-12-21 2014-08-19 Verizon Patent And Licensing Inc. Apparatus for transferring data via a proxy server and an associated method and computer program product
JP2008158711A (ja) * 2006-12-22 2008-07-10 Fujitsu Ltd ファイル配信プログラム、ファイル配信装置および分散ファイルシステム
US7873805B2 (en) * 2007-02-23 2011-01-18 Lewis, Rice & Fingersh, L.C. Data recovery systems and methods
CN101369031A (zh) * 2007-08-13 2009-02-18 鸿富锦精密工业(深圳)有限公司 棱镜片及采用该棱镜片的液晶显示装置
US8768349B1 (en) * 2008-04-24 2014-07-01 Sprint Communications Company L.P. Real-time subscriber profile consolidation system
US20130332417A1 (en) * 2012-06-08 2013-12-12 In Koo Kim Hybrid Client-Server Data Proxy Controller For Software Application Interactions With Data Storage Areas And Method Of Using Same
US10169348B2 (en) * 2012-08-23 2019-01-01 Red Hat, Inc. Using a file path to determine file locality for applications
WO2015033451A1 (ja) 2013-09-06 2015-03-12 株式会社日立製作所 分散ストレージシステム及びそのデータアクセス方法
US10019249B1 (en) * 2014-12-18 2018-07-10 Amazon Technologies, Inc. Techniques for minimally invasive application updates and data transfer
US10757064B2 (en) * 2015-11-04 2020-08-25 Oracle International Corporation Communication interface for handling multiple operations
US10521344B1 (en) * 2017-03-10 2019-12-31 Pure Storage, Inc. Servicing input/output (‘I/O’) operations directed to a dataset that is synchronized across a plurality of storage systems
CN107181572B (zh) * 2017-07-03 2020-02-14 中国南方电网有限责任公司 一种电网异构数据整合及一致性监控方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
US5900020A (en) * 1996-06-27 1999-05-04 Sequent Computer Systems, Inc. Method and apparatus for maintaining an order of write operations by processors in a multiprocessor computer to maintain memory consistency
US5991306A (en) * 1996-08-26 1999-11-23 Microsoft Corporation Pull based, intelligent caching system and method for delivering data over a network
SE507138C2 (sv) * 1996-10-14 1998-04-06 Mirror Image Internet Ab Förfarande och anordning för informationsöverföring på Internet
US5924116A (en) * 1997-04-02 1999-07-13 International Business Machines Corporation Collaborative caching of a requested object by a lower level node as a function of the caching status of the object at a higher level node
US6374300B2 (en) * 1999-07-15 2002-04-16 F5 Networks, Inc. Method and system for storing load balancing information with an HTTP cookie
US7162539B2 (en) * 2000-03-16 2007-01-09 Adara Networks, Inc. System and method for discovering information objects and information object repositories in computer networks
US6854018B1 (en) * 2000-03-20 2005-02-08 Nec Corporation System and method for intelligent web content fetch and delivery of any whole and partial undelivered objects in ascending order of object size
AU2001257058A1 (en) * 2000-04-17 2001-10-30 Circadence Corporation System and method for on-network storage services
US6772214B1 (en) * 2000-04-27 2004-08-03 Novell, Inc. System and method for filtering of web-based content stored on a proxy cache server
US6925495B2 (en) * 2000-07-13 2005-08-02 Vendaria Media, Inc. Method and system for delivering and monitoring an on-demand playlist over a network using a template
US6567893B1 (en) * 2000-11-17 2003-05-20 International Business Machines Corporation System and method for distributed caching of objects using a publish and subscribe paradigm
US7360075B2 (en) * 2001-02-12 2008-04-15 Aventail Corporation, A Wholly Owned Subsidiary Of Sonicwall, Inc. Method and apparatus for providing secure streaming data transmission facilities using unreliable protocols
US6959333B2 (en) * 2001-05-08 2005-10-25 Lucent Technologies Inc. Technique for content delivery over the internet

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236084A (ja) * 2005-02-25 2006-09-07 Ricoh Co Ltd データベース装置

Also Published As

Publication number Publication date
US20040024808A1 (en) 2004-02-05

Similar Documents

Publication Publication Date Title
JP2004252938A (ja) 広域ストレージのローカライズ化システム
US7716319B2 (en) Computer system and method for managing log information
US7383463B2 (en) Internet protocol based disaster recovery of a server
US7065589B2 (en) Three data center remote copy system with journaling
US8161133B2 (en) Network storage system with a clustered configuration sharing a namespace, and control method therefor
US7526668B2 (en) Failover method of remotely-mirrored clustered file servers
US6748502B2 (en) Virtual volume storage
US7120654B2 (en) System and method for network-free file replication in a storage area network
US20050114285A1 (en) Data replication system and method
US7200726B1 (en) Method and apparatus for reducing network traffic during mass storage synchronization phase of synchronous data mirroring
US8225002B2 (en) Data storage and data sharing in a network of heterogeneous computers
US20020091710A1 (en) Method for backup and restore of a multi-lingual network file server
US20060020636A1 (en) Network storage system and handover method between plurality of network storage devices
JPH07262074A (ja) キャッシュ管理方法、コンピュータ・ファイル・システム及びキャッシュ装置
JP2005502096A (ja) ファイルスイッチ及び交換ファイルシステム
WO2001027804A2 (en) Continuous availability updating of multiple memories
EP1382176A2 (en) System and method for accessing a storage area network as network attached storage
JP4278452B2 (ja) 計算機システム
EP1388085B1 (en) Remote online information back-up system
US20030154305A1 (en) High availability lightweight directory access protocol service
US6549988B1 (en) Data storage system comprising a network of PCs and method using same
EP1265141A2 (en) System, method and computer program for data-management
JP2004252934A (ja) 複製ボリュームを管理するための方法と装置法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060628

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060628

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060628

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071012

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090527

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090910