JP4744955B2 - データ管理システム - Google Patents

データ管理システム Download PDF

Info

Publication number
JP4744955B2
JP4744955B2 JP2005194782A JP2005194782A JP4744955B2 JP 4744955 B2 JP4744955 B2 JP 4744955B2 JP 2005194782 A JP2005194782 A JP 2005194782A JP 2005194782 A JP2005194782 A JP 2005194782A JP 4744955 B2 JP4744955 B2 JP 4744955B2
Authority
JP
Japan
Prior art keywords
file
data
stored
ldev
storage system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005194782A
Other languages
English (en)
Other versions
JP2006031695A (ja
Inventor
昇司 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2006031695A publication Critical patent/JP2006031695A/ja
Application granted granted Critical
Publication of JP4744955B2 publication Critical patent/JP4744955B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データを記憶するシステムに係わり、さらに詳細には多数のハードディスクドライブあるいは他のストレージメディアにデータを分散させるストレージシステムに係わる。
一般のデータストレージネットワークでは、多くの異なったアプリケーションからのデータが記憶され検索され、記憶された全てのデータについてその関係を追跡することは困難である。たとえば、電子メールシステムでは、電子メールサーバがオリジナルデータを生成し、それをストレージシステムへ提供する。アーカイブサーバはデータの一部をストレージシステムの異なった箇所に、あるいは異なったストレージシステムにアーカイブする。同時に、レプリケーションサーバはオリジナルデータを異なったストレージにレプリケーションし、そのデータはバックアップサーバにより更なるストレージにバックアップされることもある。これらのデータ処理プロセスのおのおのが適切な手法の処理により関連するデータについて処理を行う一方で、アーカイブサーバとレプリケーションサーバとバックアップサーバはそれぞれ独自に処理を行う。それぞれが、どのようにデータを記憶し検索するかを管理する独自のカタログあるいは他のメカニズムを持っている。システムの分散化される性質や確立されたカタログが無いことにより、ストレージシステムのユーザは一般にそのストレージシステムのどこにデータがあるのかということを十分な信頼性の基に理解することはできない。
さらに、ストレージシステムの複雑さが間違いの可能性を増やす。今説明した例において、オリジナルデータの一部はオリジナルのストレージには記憶されず、代わりにアーカイブストレージに記憶されている。その結果、オリジナルデータのレプリケーションはアーカイブデータを含まない。このように、バックアップデータもまたアーカイブデータを含まない。したがって、ユーザがバックアップからデータを復元させる時には、バックアップデータがオリジナルデータの完全なバックアップでないため、全てのオリジナルデータを復元することにならない。この複雑さにより、データを一貫した方法で管理することが困難になり、かつ間違いを起こしやすくなる。
ストレージシステムにおいてデータの管理を支援するいくつかのツールがある。しかしながら、これらのツールは上記の問題の解決の役には立たない。データストレージシステムの管理に用いられる市販のツールはVeritas(TM)により提供され、「SANPoint Control」と呼ばれている。このシステムはストレージエリアネットワークにおいてハードウエアデバイスとそれらの関係の追跡を連続して行うことを可能にしている。もう一つの市販のツールは「AppIQ」により提供され、ストレージオーソリティースイートとして知られている。このシステムはホストやバスアダプターやスイッチやディスクサブシステムなどを含むストレージシステムにおけるハードウエアに関する情報を提供する。たとえば「Oracle」のデータベースやファイルサーバなどのストレージシステム上で実行される特定のアプリケーションを管理する能力も提供している。
ストレージシステムに用いられるもう一つの市販のツールは「Aptare StorageConsole」である。このアプリケーションソフトウエアはストレージシステムにおいてバックアップと復元処理の信頼性を向上させる。Nirvanaの提供する「Storage Resource Broker」はシステムのユーザが様々な場所に記憶されているファイルを共有し管理することを可能にするソフトウエアである。それにより、大きなデータストレージユニットの様々な場所に記憶されている特定のファイルや情報をユーザが見つけることができるように探索や提示の機能を提供している。
したがって、エラーの可能性を減らしデータ管理の能率を向上するために、システムのユーザが、データ処理プロセスと、データ管理のプロセスの間の関連を完全に観察ができるようにするシステムが求められている。
本発明によるシステムは、異なった形式のデータアプリケーションからデータとデータ処理プロセスについての情報を集める方法を提供するものである。本発明はシステムのユーザがデータ間の関係を識別することを可能にするものである。これによりデータはシステムビューの中で表示され、グラフィカルユーザインタフェースを用いてシステムの中に記憶されているデータ間の関係を説明することができる。情報を記憶するための一連のストレージデバイスを持つストレージシステムにおいて、本発明によるデータマネージャがそこに記憶されたデータやファイルの間の関係について情報を収集するものであり、そのことをユーザに提示しようとするものである。
本発明の好適な一実施例においては、グラフィカルユーザインタフェースは、データ処理プロセスの3種類の異なった表示から選択をするオプションをユーザに提供するものである。これらは、たとえば、特定のファイルがどこにアーカイブされ、レプリケーションされ、あるいはバックアップされているかを表示することにより、どのようにデータが相互に関連しているかを説明するデータビューを含んである。システムはまた、たとえばストレージシステムのどのボリュームがオリジナルデータやアーカイブされたデータやレプリケーションされたデータやバックアップされたデータを持っているかを表示して、どのようにデータボリュームが関連しているかを説明するストレージビューを提供するものである。
ストレージシステムにおける情報の第3のビューはパスビューと呼ばれるものである。パスビューは、たとえばどのポートやスイッチやストレージが特定のファイルや他のデータを扱っているかを表示することなどの様々なデータ処理プロセスによりどのようにしてデータがシステムを通して転送されるかを説明している。さらに、本発明によるシステムはバックアップデータの量をオリジナルデータの量と比較することによりバックアップデータの構成の誤りを検出する方法を提供する。
一実施例では、レプリケーションサーバとバックアップサーバとアーカイブサーバを持つストレージシステムはさらに3種類のアプローチのうち、少なくとも2種類において記憶されたデータを追跡するデータマネージャを含んでいる。ひとつのアプローチにおいては、記憶されたデータのレプリケートされた、バックアップされた、あるいはアーカイブされたコピーのなかでのファイル名の関係を提示することで、記憶されたデータを追跡する。第2のアプローチにおいては、たとえばボリュームという単位で、ストレージシステム内の物理的な位置が提示される。第3のアプローチでは、ストレージ位置にデータを到着させる処理について述べたパス情報が記憶されたデータのレプリケートされた、あるいはバックアップされた、あるいはアーカイブされたコピーについて提供される。
図1は複雑なコンピュータ環境において見られるであろう仮想した一般のストレージシステムを説明するブロックダイアグラムである。図1に示すシステムのコンポーネントの大部分はよく知られているものであり、したがってここでは簡単な説明とする。しかしながら、データマネージャ111はよく知られてはいないので、以下詳細に説明する。
図1に示すシステムは2台のアプリケーションサーバ101と102を含んでいる。これらのサーバはシステム全体のユーザにコンピューティング資源を提供するためにコンピュータプログラム101aと102aを実行する。記憶されたプログラムを実行することで、アプリケーション101aと102aは図1に示すシステムに記憶されるデータを生成する。
レプリケーションサーバ103はよく知られたミラーリング機能を提供するためにストレージシステム内で異なるストレージシステムあるいはボリュームにデータをレプリケーションする。レプリケーションサーバは以下に論じるように、レプリケーションカタログ106を保持する。同様に、バックアップサーバ104は、後のデータにハードウエア、ソフトウエアあるいは設備不良が万一発生した場合に備え、データの復元を可能にするためのデータバックアップ機能を提供する。以下同様に論じるように、バックアップカタログ107はバックアップ動作の記録を保持する。
多くの大型のストレージシステムはまた階層的なストレージマネージャあるいはアーカイブサーバ105を含んでいる。サーバ105は、システムの性能を向上し、低コストのメディア上にデータを保持してコストを低減するために、小さな使用済みのデータをプライマリストレージエリアからセカンダリストレージエリアにアーカイブする。他のサーバと同様に、アーカイブサーバ105は、以下でさらに説明するように、アーカイブカタログ108を保持する。サーバ101から105はそれぞれがあたかも独立したハードウエア設備であるかのように論じてきたが、これは必要ではない。サーバは単一の大規模コンピュータ上で実行される別個のプロセスとして実行するか、あるいは接続されたコンピュータのアレイ内の別個のプロセッサー上で実行される別個のプロセスとして実行される。
図1に示されるシステムはストレージエリアマネージャ109も含む。ストレージエリアマネージャは、好適には、サーバとストレージシステム115と116と117を含む、図1に示された全ネットワークを管理する管理サーバである。ストレージエリアマネージャは以下でも論じるデバイスカタログ110を保持する。要は、ストレージエリアマネージャは、スイッチ114やサーバ101−105やアプリケーション101aと102aから情報を検索することができる。図1に示したようなストレージエリアマネージャはしばしば「DMTF」の「CIM」のような標準的なプロトコルを用いて運用される。ストレージエリアマネージャを運用するもう一つの方法は、エージェントをサーバ上に設定し、そのエージェントにサーバの局所についての情報を集めさせ、それをストレージエリアマネージャに提供するものである。
図1に示すように、システムを相互接続するために一般に用いられる技術は種々あるが、スイッチ114がますます一般的な接続技術になってきている。これらのスイッチは一般的にはファイバチャネル(Fibre Channel)やイーサネット(登録商標)(Ethernet(登録商標))あるいはブロードバンド技術を基本にしたスイッチである。
システムのサーバ動作の結果システムが受け取ったあるいは生成したデータはストレージシステム115や116や117のようなストレージシステムに記憶される。このようなストレージシステムのそれぞれには、ディスクコントローラ118と119と120がデータを記憶するハードディスクドライブ118a−120bと同様にそれぞれ含まれている。簡単にするため、図1ではストレージシステム当たりに2台のディスクドライブのみが示されている。しかしながら従来の運用では、ストレージシステムにおいては数百台のディスクドライブが使用されているかもしれない。ディスクコントローラ118と119と120は、データをハードディスクドライブに記憶し、またそこから検索するためにサーバから発行される入出力リクエストを制御する。
説明のために、図1には3種類の異なった形式のストレージシステムが示されている。ストレージシステム115はエンタプライズ・ファイバチャネル・ストレージシステムである。このようなシステムは一般的にサーバとストレージシステムとの間のデータプロトコルとしてSCSIをサポートする。ニアラインPC(NearlinePC)ストレージシステム116は、しかしながら、ATAフォーマットのハードディスクドライブを用いて同様に動作する。最後に、ネットワーク結合ストレージ(Network Attached Storage)システム117はファイルプロトコルとして「NFS」と「CIFS」をサポートする。このように、図1で示したように、本発明のシステムはいかなる形式のストレージシステムにも適用可能である。
図1に示すコンポーネントとシステムは二つの技術を用いて相互に接続されている。ネットワーク100は、たとえばTCP/IP/イーサネット(登録商標)に基づいて「バンド外の」通信を行うために提供される。しかしながら、ストレージシステムに関する主たるデータ処理については、特定の動作を実行するために必要となる所望のコンポーネント間の相互接続を可能にするスイッチ114により提供される。
本発明のシステムは、図1のシステム全体に対して、ここではデータマネージャと呼ばれる追加のコンポーネントを加えている。このデータマネージャはローカルエリアネットワーク100とスイッチ114を経由して他のコンポーネントと交信する。データマネージャはアプリケーションとデータアプリケーションからデータ処理プロセス情報を取得し、その結果をユーザに提供するように機能する。一般的には、結果はコンソール113上で稼働中のグラフィカルユーザインタフェースを通して提供される。データマネージャはデータカタログを保持する。データカタログにより、データマネージャはストレージシステムの各種の「ビュー」をユーザに提供することができる。たとえば、データマネージャ111とデータカタログの双方により、ユーザが、各種のファイルが記憶されている物理的位置や情報が記憶されるパスやストレージシステム115、116および117に記憶されているデータ間の他の関係についての情報を見ることができる。データマネージャ111はデータ記述子や、関係記述子やディスカバリーデータテーブル(下記で論じる)やディスカバリー関係テーブル(これも下記で論じる)を生成し管理する。一般的にこれらのテーブルは、データマネージャに接続されたローカルストレージあるいはネットワークストレージに記憶される。データマネージャは下記に論じるディスカバリー構成テーブルも使用する。データマネージャ自身はコンソール113により構成されることもできる。データマネージャは図1に示されるシステムを通して生成され保存されたカタログに依存する。これらのカタログは次に論じる。
図2はアーカイブプロファイルに対するアーカイブカタログを説明する図である。このカタログは図1に示すカタログ108内に含まれている。図2に示すカタログ200は、どのデータを、何時、どのストレージにアーカイブするかを説明している。図2に示す例では、データはもし30日以内にアクセスされない場合は、アーカイブされる。アーカイブ予定のデータは「Folder」として記述され、それをアーカイブするメディアは「Archive Media」としてリストされる。
図3はメディア情報に関するアーカイブカタログを説明する。このカタログはまた図1に示すカタログ108内に含まれる。図3の例においては、「Archive Media」は実際には特定のサーバに関連した特定のアドレスを持つ「Archive Folder」であることを説明する。図3はまた「Folder」がそこに示されたような最大容量を持つことを説明する。
図4はアーカイブデータに対するアーカイブカタログを説明する図である。このカタログは図1に示すカタログ108内に含まれている。図4の例においては、示された「Source Data」は、図4に示す「Archive Time」において「Archive Stream」として指定されたメディアにアーカイブされているとして表示されている。
図5から図7は、図1のカタログ107として記憶されているバックアップカタログを説明する。図5においては、バックアッププロファイルに対するバックアップカタログの例が示されている。このカタログはデータがどのようにして、何時バックアップされるべきかを説明している。説明された例においては、「Source」により指定されたフォルダーにあるファイルは決められた「Backup Time」において「Backup Media」にバックアップされることになる。「Backup Type」は全てのファイルがバックアップされることを示し、一方「Next Backup Time」は次のバックアップ動作の日時を示す。
図6はメディア情報に関するバックアップカタログを説明する図である。図3と同様な方法で、指定された特定のメディアの物理位置を容量と併せて説明している。
図7はバックアップデータに関するバックアップカタログを説明している。このカタログはデータがどのようにして、何時バックアップされるべきかを説明している。示されている例では、「Data Source」により指定された2個のファイルが示された時刻に「Backup Media」にバックアップされている。
図8はストレージシステムにおいて2台の装置の間のレプリケーション関係を説明する図であって、レプリケーションカタログと呼ばれている。この図は図1のレプリケーションカタログ106に関して追加の情報を提供する。レプリケーションカタログは、ストレージシステムにおいて一般に「LDEV」として知られる2個のデータストレージ位置の間の関係を説明している。図8に示すように、プライマリストレージのデータはセカンダリストレージ位置へレプリケートされる。「Mode」はバックアップが同期方式か非同期方式かを表示する。
図9はボリュームに関するデバイスカタログを説明する図であって、図10から図13は他のデバイスカタログを説明し、これら全ては図1のカタログ110に収容されている。図9に示すボリュームカタログ207はボリュームのID、名称、アドレス、ポート、論理ユニットナンバーなどを含んでいる。
図10はストレージに関するデバイスカタログ208を説明する。このカタログはストレージシステムに関する情報を提供する。図に示されているように、カタログはIDや名称やアドレスや容量やストレージに結合しているポートに関する情報などを含んでいる。
図11はファイルシステムに関するカタログ220を説明している。そこに示されているように、カタログはIDや物理ボリューム位置やファイルシステムの形式や空き領域などについての情報を含んでいる。同様に図12はパス221についてのデバイスカタログを説明している。このカタログはID情報とワールドワイドの名称IDを含んでいる。
図13はアプリケーションについてのデバイスカタログ222である。図13に示すように、カタログはIDとアプリケーション形式とホスト名と関連したデータファイルを含んでいる。
図14と15はメッセージベースのアーカイブについてのアーカイブカタログを説明している。(図2から図4はファイルベースのアーカイブについてのアーカイブカタログを説明している。)メッセージベースのアーカイブにおいて、アーカイブはアプリケーションレベルで実行される。たとえば、電子メールサーバはメッセージをデータファイルに記憶し、つぎにアーカイブサーバは電子メールサーバと交信し、データファイルの代わりにメッセージ自身をアーカイブする。これらの環境においては、アーカイブプロファイルはまたサーバの名称とアプリケーションの名称を示す。
図14は今説明したケースについてアーカイブプロファイルに関するアーカイブカタログ223を説明している。示されているように、アプリケーションはAとしてメディア名MNやメディアとタイミング情報とともに示される。メディア情報自身は図3に関連して説明されたのと同じ方法でアーカイブされる。
図15はアーカイブデータに関するアーカイブカタログ224を説明している。上述のように、「Source Data」はファイルに代わる特定のメッセージを指定する。「Server Name」とメディア、データ、時刻についての情報もまた提供される。
図16は、説明を明確にするための例としてこのアプリケーションの残りにおいて用いられているシステム構成の例を説明している。図16に示すように、いくつかのサーバ230は図の上部の横方向で表され、アプリケーションサーバとアーカイブサーバとバックアップサーバとレプリケーションサーバを含んでいる。サーバの2台はイーサネット(登録商標)リンクで接続されている。図の中央部では、2台のスイッチ231は各種のサーバを各種のストレージシステム232に結合する。レプリケーションサーバは「Enterprise Storage A」に結合して、そのストレージシステムでレプリケーションを可能にしている。アプリケーションサーバ230はデータをLDEV1に記憶し、一方アーカイブサーバはデータのいくつかをLDEV2にアーカイブする。レプリケーションサーバはストレージユニットAにLDEV1からLDEV3にレプリケーションをするように要求し、それに応じて処理が行われる。バックアップサーバはデータをLDEV3からLDEV4にバックアップする。
図1に関連して説明したデータマネージャを持たない従来システムでは、上記に説明した各種カタログは全て別々であり、ユーザはストレージシステムにより管理されているデータとファイルの全体的な関係を見ることができない。しかしながら、データマネージャを付加することにより、たとえばスクリプトや他のよく知られたインタフェースを用いることで各種サーバとデータマネージャ間の交信ができるようになる。データマネージャと各種サーバとの間の交信により、次に論じるように、これらの関係が見つかりユーザに提供される。
図17はデータ記述子テーブル240の例を説明している。このテーブルはデータマネージャ111(図1参照)がストレージシステムとサーバにより処理されているデータについて集めた情報を説明している。図17に示すように、データ記述子テーブルはディスカバードデータの特定のユニットについての重要な情報を含んでいる。それは、たとえばそのデータに関連するホスト名やパス名やデータの「オーナ」やデータへのアクセスや書き換えに関する何らかの制約や大きさや生成時刻や修正時刻や最後のアクセスの時刻やアクセスの回数などを含む、データについての論理情報も含んでいる。データ記述子はまたマウントポイント(データが位置している)やデータに関連したファイルシステムの形式やそのファイルシステムの最大の大きさについての情報を含んでいる。最後に、データ記述子は、ストレージシステムのブランド名(Lightning 9900)やそのIPアドレスやそのLDEVなどを含むデータについての物理情報を含んでいる。物理情報はまた、最大ボリュームの大きさやRAIDプロテクションのレベルなどを含むことができる。
一般的に言えば、論理情報は、どのサーバがデータを持っており、そのサーバ内における論理位置とアクセスコントロール情報を、大きさや記憶されたデータについての他のパラメータと同様に含んでいる。また一般的には、ファイルシステム情報はデータが記憶されているファイルシステムの形式を記述する。物理情報は、特定のファイルシステムが生成されているストレージシステムとLDEVについて記述する。
図18から図22はストレージシステムに記憶されたデータ間の関係を設定することに役立つ関係記述子テーブルを説明している。図18はアーカイブに関する関係記述子テーブル241の例である。テーブルは記述子のIDやそのオリジナルデータとの関係やオリジナルデータ記述子やアーカイブデータ記述子やアーカイブ時刻や保存期間などについての情報を含んでいる。関係記述子はディスカバードデータがどのように関係しているかを示し、固有のID(RID)を割り当てる。
図19はそこに示されたように、バックアップのための関係記述子を提供している。テーブル242は特定のアドレスのオリジナルデータがそのアドレスにおいて指定されたデータとしてバックアップされていることを説明している。バックアップの日付、時刻、速度やその他のパラメータもまた保持される。
図20はレプリケーションに対する関係記述子テーブル243である。このテーブルは、提供されている他の情報に追加して、それらの世界的なIDに基づいてオリジナルデータとレプリケーションされたデータの間の関係を保持している。
図21はアプリケーションに対する関係記述子テーブル244である。このテーブルに示すように、Trinityサーバの電子メールサーバは指定された世界的なIDナンバーにより特定されたデータソースを持っている。
図22のテーブル245に示すように、メッセージベースシステムにはアーカイブに対する関係記述子がある。各メッセージについてデータ記述子と関係記述子を生成すると資源を消費してしまうので、メッセージベースのアーカイビングではオリジナルデータとアーカイブされたデータとの間の関係のみが識別される。もちろん、必要であれば、データ記述子は生成可能である。
データマネージャ111はまたサーバとの相互作用に基づいて、いくつかのテーブルを生成する。これらのテーブルはここでは図23に示すディスカバリー構成テーブル280や、図24に示すディスカバードデータテーブル420や図25に示すディスカバード関係テーブル430を指すものである。これらのテーブルは次に議論される。
図23に示すディスカバード構成テーブル280はデータマネージャがどのアプリケーションとデータアプリケーションから情報を集めたかを示している。テーブルの行で構成されている各エントリーは、ディスカバードデータの形式や、情報の収集元のサーバや、アプリケーションあるいはデータアプリケーションの名称や、必要に応じてアクセスを行うためのIDとパスワード情報を指定する。たとえば、テーブル280の第1行では、アプリケーションプログラムはアプリケーション「SAMSoft」を使用してサーバEから情報を集め、これには行の末尾に示されたIDとパスワード用いてアクセスすることができる。
図24はディスカバードデータテーブル420を説明する。このテーブルはディスカバードデータについての管理情報を提供する。このテーブルで示すように、データはストレージシステムとLDEVと相対パス名の組み合わせで個別に識別される。ストレージシステムに記憶されるファイルはファイルシステムを用いて記憶されている。ファイルシステムがサーバのフォルダー上にマウントされているときは、相対パス名としては、パス名の代わりにファイルシステム内のパス名を提供する。たとえば、LDEV1がサーバの\folder1にマウントされていると仮定する。また、\folder2\fileAというパス名のファイルがあると仮定する。このようにして、相対パス名はFileAとなる。
図25はディスカバード関係テーブル430を説明している。このテーブルはディスカバード関係の識別について管理をする。説明された例では、「RID 0002」により識別された関係はバックアップ関係であり、列の「Source」に表示されているGIDを持つファイルは「Destination」の列により識別されるデータとしてバックアップされている。バックアップやアーカイブやレプリケーション動作が2カ所の位置のデータに係わるのに対し、アプリケーション自身はソースデータを持つのみである。したがって、「Destination」は適用できない。
上記で論じたテーブルの全てと生成された各種の関係を用いて、下記で詳細に論じる方法においては、システムは関連したストレージシステムに記憶されたデータ間の関係に関する総合的な展望を提供することができる。ストレージシステムのユーザにこれらの関係を提示するためのグラフィカルユーザインタフェースの例が図26、27および28に示されている。ストレージシステムにおけるデータをよりよく理解できるように他のグラフィカルユーザインタフェース(GUI)を生成してユーザに提示できることは当然理解されることである。これらのインタフェースは、一般的にはデータ管理システムの管理者にとって、最も役に立つものである。一般的には、これらのインタフェースは図1に示すコンソール113上に提示されるものである。一般的なGUIは次で論じる。
図26は「データビュー」GUI250を説明している。このGUIの例では、データマネージャはデータ自身に関連したビューを提示している。説明した実施例では、GUIは図の左側のデータ指定パネルと右側の情報パネルの2個のパーツを持っている。データ指定パネルはこれのアプリケーションで使用されているシステムの全てのアプリケーションと全てのデータを示している。たとえば、図26においては、指定パネルは電子メールアプリケーションとこれらのアプリケーションの中の電子メールサーバをリストする。その電子メールサーバは、この例では、A、BおよびCとして示されているいくつかのファイルを持っている。ユーザはファイルAを選択する。それに応じて、GUIは図26に示す右側のパネルにあるそのファイルについての情報を説明する。パネルはファイルAに関連したデータについて関係情報を説明する。パネルの最上部に示すように、サーバとファイルの位置は、アーカイブされ、レプリケートされ、バックアップされたそのファイルの全てのコピーと同様に示される。説明されたように、ファイルAは指示された位置でサーバBによりアーカイブされ、指示された位置でサーバCによりレプリケーションされ、指示された位置でサーバDによりバックアップされる。「Details」の指示をクリックして、ユーザはシステムにそのデータについて「より深い」情報、たとえばその大きさや、イベントの時刻や、上記で論じた記述子テーブルの中で提供されている他の情報などを検索させ、そのデータはGUI上で提供される。
図27はデータの「storage view」についてGUIを説明している。図27に示す左側のパネルは、図26で論じたものに対応し、ユーザが特定のファイルを選択できるようにしている。そこで説明されたのと同じ方法で、ユーザはファイルAを選択し、ストレージビュー260の右側のパネルはファイルAに関する情報を説明する。このパネルはオリジナルデータが記憶されているLDEVとストレージシステムと、オリジナルデータに関係するデータの全てと、これらの位置の間の関係を示す。たとえば、右側のパネルの上側部分に示したように、レプリカやアーカイブやバックアップ関係が説明されている。
図28は第3のGUIであってこれによりユーザはストレージシステムにおける各種のデータの位置とデータが処理されるパスをより容易に理解することができる。図28は「パスビュー」GUIを説明している。上記図26と27において、GUI270の左側によりユーザは特定のファイルを選択することができ、右手側はオリジナルデータおよびオリジナルデータに関連したデータに対するサーバやスイッチやストレージシステムやLDEVのトポロジーマップを説明する。この図はまたトポロジーにおいてデータがどのように転送されるかを説明している。図を簡略化するために、図28の右側のパネルの上側部分の横方向は「ボタン」の連続である。これらのボタンの1個をクリックすると、画面は指定された関係によりデータが転送されるパスを示す。
先の議論ではデータマネージャ111により生成され使用される各種のテーブルとシステムのユーザにそのデータを提示するグラフィカルユーザインタフェースについて論じた。この明細書の残りの部分は、システムがこれらのテーブルを設定するために作動し、グラフィカルユーザインタフェースを提示する手法について論じる。
図29は図1に示すデータデータマネージャによるデータディスカバリープロセスの実施例を説明するフローチャートである。プロセスは図1に示すコンソール113でユーザにより開始される。最初のステップ290で、データマネージャは、もしエントリーがレプリケーションエントリーでなければ、図23に示すディスカバリー構成テーブルからエントリーを検索する。もし非レプリケーションエントリーがある場合は、フローは図29に示すように直ちに下方に向かう。一方では、新しいエントリーが無い場合は、データディスカバリープロセスは、ステップ296に示すように、レプリケーションエントリーをディスカバリー構成テーブルから検索する。新しいエントリーがあるとした場合に、データマネージャはサーバの形式をチェックし、図29のループが示すように、サーバの形式によって三つの手順のうちの一つを実行する。そのエントリーが検索されると、プロセスはステップ290に戻り、サーバの全てからエントリーの全てを検索するために必要な回数だけ繰り返される。特定の「get data」手順293、294あるいは295の詳細は以下で論じられる。一旦これらの手順が完了すると、システムは元に戻り、ステップ296で示されるレプリケーションエントリーをチェックする。レプリケーションエントリーがあると想定した場合は、手順はのちに下記で論じるステップ298に移行する。ステップ297に示すように一旦全てのエントリーが検索されると、データディスカバリープロセスは完了する。
図30は図29のブロック293により示されるアプリケーションからデータを取得するプロセスフローをより詳細に説明している。データマネージャはネットワークを経由して、まずSAMサーバに接続する。これはコネクション300についてディスカバリー構成テーブルのIDとパスワードを用いる。つぎにそれはSAMサーバ301からアプリケーションのリストを検索し、各アプリケーションについてはステップ302に示すようにそのサーバからデータファイルのリストを検索する。ステップ303に示すように、そのリスト上の各データファイルについて、データマネージャは、そのSAMサーバにデータファイルが記憶されているファイルシステム名を取得する。つぎに図304で示すように、各ファイルシステムに関して、ストレージ名とファイルシステムが生成されているLDEVもまたSAMサーバから検索される。つぎに、各個別のセット(ストレージシステムの名称、LDEV、データファイル相対パス名)に関連して、データマネージャはディスカバードデータテーブルに新しいエントリーを生成し、そのセットにまだエントリーが無かった場合には、それに新しい世界的なIDを割り当てる。ステップ306に示すように、このようなGIDのそれぞれにはデータ記述子が生成される。つぎに、ステップ307に示すように、各データ記述子について、データマネージャは論理情報やファイルシステム情報や物理情報をSAMサーバから検索し、その情報をデータ記述子テーブルにファイルする。つぎに、ステップ308に示すように、各アプリケーションについて、ディスカバード関係テーブルの新しいエントリーが生成され、そのアプリケーションにエントリーが無い場合は、新しいR_IDが与えられる。最後に、ステップ309に示すように、各RIDについて、アプリケーションの関係記述子とファイル情報が続いて生成される。一旦これらのステップが完了すると、プロセスフローは図29に示す図に戻る。
図31は、ステップ294として図29で説明されるように、バックアップサーバからデータを検索するプロセスを説明している。一旦このプロセスが呼び出されると、動作は図30で説明されるものと同様になる。特に、データマネージャはネットワークを経由してまずバックアップサーバに接続する。それは、ステップ320に示すように、接続のためにディスカバリー構成テーブルからのIDとパスワード情報を使用する。ステップ321に示すように、それはまた同じ方法でSAMサーバに接続する。ステップ322では、データマネージャはバックアップサーバからバックアッププロファイルのリストを検索する。ステップ323で示されるように、そのような各バックアッププロファイルについて、データマネージャはバックアップサーバからバックアップデータのリストを取得する。つぎに、ステップ324では、各バックアップデータについて、データマネージャはバックアップストリームが記憶されているファイルシステムをバックアップサーバから検索する。つぎにステップ325で示すように、各個別のファイルシステムに関して、ストレージ名とファイルシステムが生成されているLDEVが、SAMサーバから検索される。つぎに、ステップ326では、各個別のセット(名称とLDEVとバックアップストリーム相対パス名)について、そのセットにまだエントリーが無い場合には、ディスカバードデータテーブルに新しいエントリーが生成され、新しいGIDが割り当てられる。つぎに、セット327では、各GIDについて、データ記述子が生成される。つぎに、ステップ328に示すように、各データ記述子論理情報について、ファイルシステム情報とSAMサーバからの物理情報が検索され、データ記述子テーブルへ渡される。
図32はステップ328に続くプロセスを説明している。図32に示すように、各バックアップデータについて、データマネージャはステップ329でバックアップサーバからデータソースのリストを取得する。つぎに、各個別のデータソースについて、データソースが記憶されているファイルシステムがステップ330でバックアップサーバから検索される。ステップ331では、各個別のファイルシステムについて、データマネージャはストレージ名とファイルシステムが生成されているLDEVを同じサーバから検索する。つぎに、ステップ332では、各ストレージ名とLDEVとデータソース相対パス名の個別のセットについて、そのセットにまだエントリーが無い場合には、ディスカバードデータテーブルに新しいエントリーが生成され、新しいGIDが割り当てられる。つぎに、ステップ333では、各GIDについて、データ記述子が生成される。ステップ334では、各データ記述子について、論理情報とファイルシステム情報と物理情報が同じサーバから検索されデータ記述子テーブルに記載される。つぎに、ステップ336では、各バックアップデータについて、もしそのバックアップデータにまだエントリーがない場合は、ディスカバード関係テーブルに新しいエントリーが生成され、新しいRIDが割り当てられる。最後に、各RIDに対するステップ337では、バックアップ情報に対する関係記述子が生成され、これがディスカバードデータテーブルへ記載される。そのステップは図29のステップ294で概要を説明した、バックアップからデータを取得するステップについての動作を締めくくるものである。
図33は、図29のステップ295で代表される、アーカイブからデータを取得するステップの背後の詳細を説明している。上記で説明したように、これらの動作は前述のいくつかの図で論じた他のデータ取得の動作と同様である。プロセスはデータマネージャがIDとパスワード情報を使用してアーカイブサーバに接続するステップ340で開始される。それはまたステップ341に示されるIDとパスワード情報を用いて同じサーバに接続する。ステップ343ではアーカイブプロファイルのリストを取得し、ステップ344では各アーカイブプロファイルについてアーカイブデータを取得する。ステップ345では、それは、各アーカイブデータついて、アーカイブストリームが記憶されているファイルシステムをアーカイブサーバから検索する。つぎに、ストレージ名とLDEVとアーカイブストリーム相対パス名の各個別のセットについて、そのセットにまだエントリーが無い場合には、ディスカバードデータテーブルに新しいエントリーが生成され、新しいGIDが割り当てられる。つぎに、ステップ348では、各GIDについて、データ記述子が生成され、最後にステップ349では、このような各データ記述子について、ファイルシステム情報からの論理情報とSAMサーバからの物理情報がデータ記述子テーブルに記載される。つぎに、プロセスは図34により継続する。
ステップ350に示すように、各アーカイブされたデータについて、アーカイブサーバからデータソースのリストが検索される。つぎに、個別のデータソースについて、そのデータソースに対するファイルシステムがステップ351に示すようにアーカイブサーバから検索される。つぎに、各個別のファイルシステムについて、ストレージ名とファイルシステムが生成されているLDEVがSAMサーバから検索される。つぎに、ステップ353では、ストレージ名とLDEVとデータソース相対パス名の個別のセットについて、そのセットにまだエントリーが無い場合には、ディスカバードデータテーブルに新しいエントリーが生成され、新しいGIDが割り当てられる。つぎに、各GIDについて、新しいデータ記述子が生成され、このような各データ記述子について、SAMサーバから論理情報とファイルシステム情報と物理情報が検索され、ステップ355に示すようにデータ記述子テーブルに記載される。つぎに、各アーカイブされたデータについて、そのデータにエントリーがまだ無い場合は、新しいエントリーがディスカバード関係テーブルに生成され、新しいRIDが割り当てられる。最後に、関係記述子がそのRIDについて生成され、データディスカバリーテーブルに記載される。
レプリケーションサーバからデータを取得するプロセスは上述のものと同様である。そのことは図35に説明されている。プロセスはレプリケーションサーバにIDとパスワードにより接続すること360、SAMサーバに接続すること361、およびレプリケーションサーバからレプリケーションプロファイルのリストを取得すること362のフローを実行する。つぎに、各レプリケーションプロファイルについて、選択された情報がステップ363で検索され、このようなレプリケーションセットの各々について、ステップ364ではこれらのボリュームに記憶されているデータの位置が確認される。つぎに、見つかったデータセットの各々について、ディスカバード関係テーブルに新しいエントリーが生成され、情報はステップ366でテーブルに記載される。これで最初に図29で示したプロセスの説明が完了する。つぎは、各種データやストレージやパスビューを示す技術である。データビューを示すステップは、図36のフローチャートで説明される。データビューを示すには、データマネージャは、ステップ370で示すように、GUIからサーバ名とアプリケーション名とデータファイルを受け取る。上記で論じたように、この選択は一般にユーザがGUIの左側のパネルの適切なエントリーを選ぶことにより行われる。つぎに、ステップ371で説明するように、特定のデータについてのGIDがディスカバードデータテーブルから検索され、ステップ372では、GIDを含む全てのRIDについてディスカバード関係テーブルからリストが検索される。何もない場合は、ステップ376で示すように、見つかったGIDが表示される。もし、RIDがある場合は、つぎはこのようなRIDの各々について、ステップ374に示すように、ディスカバード関係テーブルからGIDとディスティネーションが検索される。一旦これが完了すると、ステップ376に示すように、ディスプレイが表れる。
図37はGUIでストレージビューを見せるためのステップを説明している。図36で説明したものと同様の方法で、ユーザはステップ380で示したように各種の情報を選択し、指定されたデータについてのGIDがディスカバードデータテーブルから検索される。ステップ382、383、384および385の動作のフローは図36のそれと一致している。つぎに、ステップ386では、見つかったGIDの各々について、データマネージャはGIDで指定されたデータが記憶されているストレージシステムとLDEVを見つけ、ストレージは画面上でストレージアイコンとして、LDEVは画面上でLDEVアイコンとして表示する。つぎに、ステップ387で説明するように、LDEVアイコンは、発見されたRIDの各々について、関係インディケータにより相互に接続されている。
図38はパスビューGUIが生成される方法を説明するフローチャートである。ステップ390から395はデータとストレージビューについて上記で説明したものと同じである。ステップ396では、発見されたGIDやRIDの全てについて、関係サーバは、発見されたGIDやRIDにより指定されたデータあるいはデータアプリケーションに関連したスイッチやストレージシステムやLDEVを探索する。このステップに続いて、発見されたハードウエアコンポーネントの全てについての物理トポロジーマップがステップ397で表示され、関係ボタンがステップ398で追加される。ステップ399では、もしボタンが押されると、システムは、指定されたデータが転送され、SAMサーバによって情報が提供されるデータパスを示す。
図39は本発明のシステムにより提供される他の機能について説明をするフローチャートである。図39はバックアップデータの大きさをオリジナルデータの大きさと比較してデータバックアップの誤構成を検出する技術を提供している。図39に示すプロセスは、図1に示すストレージコンソール113を通してユーザにより起動される。起動すると、システムはステップ400に示すように、GUIからサーバ名とアプリケーションとデータファイルを受け取る。つぎに、指定されたデータに関するGIDがディスカバードデータテーブルから検索され、そのGIDを含むRIDのリストがディスカバード関係テーブルから検索される。このプロセスはステップ403から405で示すように全てのRIDとGIDが検索されるまで繰り返される。ステップ406では、バックアップストリームの大きさを決めるために、全バックアップをしながら各GIDについて計算が実施される。そのアプリケーションについてデータファイルの大きさがステップ407で計算される。ステップ408では、大きさが一致すれば、「無事終了」のメッセージがステップ409で表示され、大きさが一致しない場合はステップ410でエラーが表示される。エラーを受け取ると、ユーザはエラー調査のバックアップを再実行し、他の方法でそれを解決する。
説明された技術には多くのアプリケーションがある。これらのアプリケーションはバックアップやアーカイブやレプリケーション等に限定されるものではない。本発明はデータを解析し関係を決定する他のアプリケーションや特注のアプリケーションに適用が可能である。本発明はまたローカルファイルシステムあるいはローカルサーバのファイルに限定されるものではない。むしろ、本発明はストレージシステムにおけるボリュームとオブジェクトベースストレージデバイスにおけるオブジェクトあるいはネットワーク結合ストレージシステムにおけるファイルに適用が可能である。それはボリュームに、および自身でボリュームをレプリケーションするストレージシステムに適用が可能である。このようなアプリケーションにおけるデータマネージャは、ストレージシステムあるいはレプリケーションサーバから、どのようにボリュームをレプリケーションするかを決定し、パス情報なしに各ボリュームについてデータ記述子を生成し、さらにレプリケーション関係を用いて関係記述子を生成することができる。ネットワーク結合ストレージの場合では、データは個別にIPアドレスやエクスポートされたファイルシステムや相対パス名によって識別される。
ここにおいてはLDEVがデータの独自性を識別するユーザであるが、他のアプローチが使用されることもある。データマネージャは各データについてハッシュ値を計算をする。つぎに、データマネージャはこのようなデータの論理位置と物理位置をSAMサーバから検索できる。もしデータが異なった位置に関係しているならば、データマネージャはこれらのデータについてデータが同じ(二重のハッシュ値の場合)であると表示する関係記述子を生成できる。これによりユーザはストレージシステム上にどれくらい多くのデータのレプリケーションが存在するかを知り、どのデータを削除できるかを決めることができる。
このデータプロセシングによりデータ間の関係の階層とパフォーマンス情報をチェックすることで、データマネージャはさらに階層のどの位置にパフォーマンスのボトルネックが存在するかを検出することができる。このような場合には、データマネージャは各関係においてパフォーマンス情報を検索し、これらの数値が物理資源で制約されているのか、あるいは他のデータプロセシングあるいはアプリケーションソフトウエアに起因するのかを判定する。データマネージャはまた、ユーザにデータのある部分を指定することによりデータとデータ間の関係を検索する手段を提供する。もしデータマネージャがこのような要求を受け取ると、たとえばグラフィカルユーザインタフェースで説明されているように、データマネージャは指定された情報を含むデータ記述子と関係記述子を見つけ、それを提供できる。
本発明の好適な一実施例に関連して上記に詳細に説明されているが、添付の特許請求の範囲により示されるその範囲を外れることなく発明の実施に際して変形や修正を行うことが可能であることは認められるべきものである。
図1は本発明によるデータマネージャを含む一般的なストレージエリアネットワークについてのシステム構成を説明するブロックダイアグラムである。 図2はアーカイブプロファイルに関するアーカイブカタログを説明する。 図3はメディア情報に関するアーカイブカタログを説明する。 図4はアーカイブされたデータに関するアーカイブカタログを説明する。 図5はバックアッププロファイルに関するバックアップカタログを説明する。 図6はメディア情報に関するバックアップカタログを説明する。 図7はバックアップデータに関するバックアップカタログを説明する。 図8はレプリケーションカタログを説明する。 図9はボリュームに関するデバイスカタログを説明する。 図10はストレージに関するデバイスカタログを説明する。 図11はファイルシステムに関するデバイスカタログを説明する。 図12はパスに関するデバイスカタログを説明する。 図13はアプリケーションに関するデバイスカタログを説明する。 図14はアーカイブプロファイルに関するアーカイブカタログを説明する。 図15はアーカイブされたデータに関するアーカイブカタログを説明する。 図16はストレージシステムにおける相互接続の一例を示すブロックダイアグラムである。 図17はデータ記述子を説明する。 図18はアーカイブされたデータに関する関係記述子を説明する。 図19はバックアップデータに関する関係記述子を説明する。 図20はレプリケーションデータに関する関係記述子を説明する。 図21はアプリケーションデータ関する関係記述子を説明する。 図22はアーカイブされたデータに関するもう一つの関係記述子を説明する。 図23はディスカバード構成テーブルを説明する。 図24はディスカバードデータテーブルの例である。 図25はディスカバード関係テーブルの例である。 図26はデータのビューに関するGUIの例である。 図27はストレージシステムのビューに関するGUIの説明である。 図28はパス情報のビューに関するGUIの例である。 図29はデータディスカバリーに関する処理の説明である。 図30は図29に示された「Get Data From App」処理の詳細を説明する。 図31は図29に示された「Get Data From Backup」処理の詳細を説明する。 図32は図29に示された「Get Data From Backup」処理のさらに詳細な説明をする。 図33は図29に示された「Get Data From Archive」処理の詳細を説明する。 図34は図29に示された「Get Data From Archive」処理のさらに詳細な説明をする。 図35は図29に示された「Get Data From Replica」処理の詳細を説明する。 図36はデータビューを示すためのステップを説明するフローチャートである。 図37はストレージビューを示すためのステップを説明するフローチャートである。 図38はパスビューを説明するためのステップを説明するフローチャートである。 図39はバックアップ動作をチェックするためのステップを説明するフローチャートである。
符号の説明
100……ネットワーク、103……レプリケーションサーバ、104……バックアップサーバ、105……アーカイブサーバ、106,206……レプリケーションカタログ、107,203〜205……バックアップカタログ、108,200〜202,223,224……アーカイブカタログ、109……ストレージエリアマネージャ、110……デバイスカタログ、111……データマネージャ、112……データカタログ、113……コンソール、115,116,117……ストレージシステム、118a,118b,119a,119b,120a,120b……ハードディスクドライブ、207,208,220〜222……デバイスカタログ,240……データ記述子、241〜245……関係記述子、250……データビューGUI、260……ストレージビュー、270……パスビューGUI、280……ディスクカバード構成テーブル、420……ディスクカバードデータテーブル、430……ディスクカバード関係テーブル。

Claims (8)

  1. アプリケーションが実装されたアプリケーションサーバと、
    論理的な記憶領域であるLDEVを有し、前記アプリケーションサーバの前記アプリケーションが生成したファイルを前記LDEV内に記憶するストレージシステムと、
    前記ストレージシステムに記憶された前記ファイルのLDEV単位でのレプリケーションを前記ストレージシステム内に生成するレプリケーションサーバと、
    前記ストレージシステムに記憶された前記ファイルを前記ストレージシステムにファイル単位でバックアップするバックアップサーバと、
    前記ストレージシステムに記憶された前記ファイルを前記ストレージシステムにファイル単位でアーカイブするアーカイブサーバと、
    前記アプリケーションサーバ、前記アーカイブサーバ及び前記バックアップサーバの各々からファイル処理プロセスに関する情報を含むファイル処理プロセス情報を収集し、前記レプリケーションサーバからLDEV処理プロセスに関する情報を含むLDEV処理プロセス情報を収集するデータマネージャと、
    所定のグラフィカルユーザインタフェースを表示するコンソールと
    を備え、
    前記データマネージャは、
    前記アーカイブサーバ、前記バックアップサーバのいずれかから前記ファイル処理プロセス情報を収集する場合、
    収集した前記ファイル処理プロセス情報に基づいて、前記ストレージシステムに記憶されているファイルごとに、当該ファイルが記憶されている前記ストレージシステムの名称と、当該ファイルが記憶されているLDEV名称と、相対パス名との組み合わせに対して第1の識別子を割り当て、
    バックアップ元又はアーカイブ元のファイルと、バックアップ先又はアーカイブ先のファイルとの間の関係を表す関係情報に対して固有の第2の識別子を割り当てることによってファイルを管理し、
    前記レプリケーションサーバから前記LDEV処理プロセス情報を収集する場合、
    レプリケーション元と、レプリケーション先とを取得し、
    レプリケーション元のLDEVに格納されたファイルと、レプリケーション先のLDEVに格納されたファイルとを取得し、
    当該取得したファイル間の関係を表す前記関係情報に対して固有の前記第2の識別子を割り当てることによってファイルを管理し、
    ユーザによってファイルの開示が指示された場合、
    指定されたファイルに付与された前記第1の識別子を含む前記関係情報に割当てられた前記第2の識別子を取り出し、
    該取り出した第2の識別子に基づいて、当該指定されたファイルと関係する他のファイルの前記第1の識別子を取得し、
    前記指定されたファイル、前記他のファイル、及び第2の識別子で表される前記指定されたファイルと前記他のファイルとの前記関係情報を、前記グラフィカルユーザインタフェースを介してユーザに提示する
    ことを特徴とするシステム。
  2. 前記ファイル処理プロセス情報及びLDEV処理プロセス情報は、前記ストレージシステムにおいてファイルが記憶されている位置を示す位置情報を含む
    ことを特徴とする請求項1に記載のシステム。
  3. 前記位置情報は、
    前記ファイルについてのレプリケーション位置とアーカイブ位置とバックアップ位置の少なくとも一つの位置を示す情報を含む
    ことを特徴とする請求項2に記載のシステム
  4. 前記ファイル処理プロセス情報及びLDEV処理プロセス情報は、
    前記ファイルが格納されている前記LDEVへのパスを識別するパス情報を含み、
    前記パス情報は、
    前記ファイルを見つけるためのポートとスイッチ情報を含む
    ことを特徴とする請求項1に記載のシステム。
  5. 前記データマネージャは、
    前記ファイルの大きさを前記ファイルのバックアップファイルの大きさと比較して前記関係情報に格納されているファイルの間の関係の誤構成を検出する
    ことを特徴とする請求項1に記載のシステム。
  6. 前記コンソールは、前記グラフィカルユーザインタフェースとして、
    前記ストレージシステム内の前記ファイルが記憶されている位置と、前記ファイルが処理されるパスとを提示するパスビューを表示する
    ことを特徴とする請求項1に記載のシステム。
  7. 前記コンソールは、前記グラフィカルユーザインタフェースとして、
    前記パスビューの他に前記ファイルについての前記関係情報を提示するデータビューと、前記ファイルが記憶されている前記ストレージシステム及び当該ストレージシステム内の前記LDEVと、前記ファイルに関係する他のファイルと、これらのファイルが記憶されている位置の間の関係を提示するストレージビューとを表示でき、前記パスビュー、前記データビュー及び前記ストレージビューのうちのユーザによって選択された前記パスビュー、前記データビュー又は前記ストレージビューを表示する
    ことを特徴とする請求項6に記載のシステム。
  8. アプリケーションが実装されたアプリケーションサーバと、
    論理的な記憶領域であるLDEVを有し、前記アプリケーションサーバの前記アプリケーションが生成したファイルを前記LDEV内に記憶するストレージシステムと、
    前記ストレージシステムに記憶された前記ファイルのLDEV単位でのレプリケーションを前記ストレージシステム内に生成するレプリケーションサーバと、
    前記ストレージシステムに記憶された前記ファイルを前記ストレージシステム内にバックアップするバックアップサーバと、
    前記ストレージシステムに記憶された前記ファイルを前記ストレージシステムにファイル単位でアーカイブするアーカイブサーバと、
    前記アプリケーションサーバ、前記アーカイブサーバ及び前記バックアップサーバの各々からファイル処理プロセスに関する情報でなるファイル処理プロセス情報を収集し、前記バックアップサーバからLDEV処理プロセスに関する情報でなるLDEV処理プロセス情報を収集するデータマネージャと、
    所定のグラフィカルユーザインタフェースを表示するコンソールと
    を備え、
    前記データマネージャが、
    前記ファイルがバックアップされたときの前記ストレージシステムにおいてファイルが記憶された位置、前記ファイルがアーカイブされたときの前記ストレージシステムにおいてファイルが記憶された位置のいずれか一つの位置を記憶し、指定のファイルががバックアップされたときの前記ストレージシステムに記憶されたファイルへのパス、また、指定のファイルがアーカイブされたときの前記ストレージシステムに記憶されたファイルへのパスのいずれかひとつのパスを記録し、指定のファイルがバックアップされたときの前記ファイルとバックアップされ前記ストレージシステムに記憶されたファイルとのファイルの関係を、また、指定のファイルがアーカイブされたときの前記ファイルとアーカイブされ前記ストレージシステムに記憶されたファイルとのファイルの関係を記録する第1のステップと、
    指定のLDEVがレプリケーションされたときの前記ストレージシステムにおいてLDEVが記憶された位置及び当該指定されたLDEV内に格納された前記ファイルを記憶し、指定のLDEVがレプリケーションされたときの前記ストレージシステムに記憶されたLDEV内に格納された前記ファイルへのパスを記録し、指定のLDEVがレプリケーションされたときの前記LDEV内に格納された前記ファイルとレプリケーションされ前記ストレージシステムに記憶されたLDEV内に格納された前記ファイルとのファイルの関係を記録する第2のステップと、
    前記アーカイブサーバ、前記バックアップサーバのいずれかから前記ファイル処理プロセス情報を収集する場合、第1のステップにおいて記録されたファイルの情報を収集し、収集した前記ファイルに基づいて、前記ストレージシステムに記憶されているファイルごとに、当該ファイルが記憶されている前記ストレージシステムの名称及びLDEVの名称と、相対パス名との組み合わせに対して第1の識別子を割り当て、さらに、前記第1の識別子に基づいて、前記ファイルがバックアップ又はアーカイブされたファイルのときは、バックアップ元又はアーカイブ元のファイルと、バックアップ先又はアーカイブ先のファイルとの間の関係を表す関係情報に対して固有の第2の識別子を割り当てることによってファイルを管理する第3のステップと、
    前記レプリケーションサーバから前記LDEV処理プロセス情報を収集する場合、第2のステップにおいて記録されたLDEV及び当該LDEVに格納されたファイルの情報を収集し、前記第1の識別子に基づいて、レプリケーション元の前記LDEVに格納されたファイルと、レプリケーション先の前記LDEVに格納されたファイルとの間の関係を表す関係情報に対して固有の前記第2の識別子を割り当てることによってファイルを管理する第4のステップと、
    ユーザによってファイルの開示が指示された場合、
    指定されたファイルに付与された前記第1の識別子を含む前記関係情報に割当てられた前記第2の識別子を取り出し、
    当該取り出した第2の識別子に基づいて、当該指定されたファイルと関係する他のファイルの前記第1の識別子を取得し、
    前記指定されたファイル、前記他のファイル、及び第2の識別子で表される前記指定されたファイルと前記他のファイルとの前記関係情報を前記グラフィカルユーザインタフェースを介してユーザに提示する第5のステップと
    を備えることを特徴とするシステム
JP2005194782A 2004-07-13 2005-07-04 データ管理システム Expired - Fee Related JP4744955B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/890,652 US7206790B2 (en) 2004-07-13 2004-07-13 Data management system
US10/890,652 2004-07-13

Publications (2)

Publication Number Publication Date
JP2006031695A JP2006031695A (ja) 2006-02-02
JP4744955B2 true JP4744955B2 (ja) 2011-08-10

Family

ID=35600711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005194782A Expired - Fee Related JP4744955B2 (ja) 2004-07-13 2005-07-04 データ管理システム

Country Status (2)

Country Link
US (2) US7206790B2 (ja)
JP (1) JP4744955B2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7571387B1 (en) * 2005-09-21 2009-08-04 Emc Corporation Methods and apparatus facilitating management of a SAN
US7613742B2 (en) * 2006-05-02 2009-11-03 Mypoints.Com Inc. System and method for providing three-way failover for a transactional database
US8903883B2 (en) * 2006-05-24 2014-12-02 International Business Machines Corporation Apparatus, system, and method for pattern-based archiving of business events
US8112396B2 (en) * 2006-06-07 2012-02-07 Emc Corporation Backup and recovery of integrated linked databases
US8266105B2 (en) * 2006-10-31 2012-09-11 Rebit, Inc. System for automatically replicating a customer's personalized computer system image on a new computer system
US20080104146A1 (en) * 2006-10-31 2008-05-01 Rebit, Inc. System for automatically shadowing encrypted data and file directory structures for a plurality of network-connected computers using a network-attached memory with single instance storage
WO2008055214A2 (en) * 2006-10-31 2008-05-08 Rebit, Inc. System for automatically shadowing data and file directory structures that are recorded on a computer memory
JP5073348B2 (ja) * 2007-04-04 2012-11-14 株式会社日立製作所 アプリケーション管理支援システム、管理計算機、ホスト計算機、及びアプリケーション管理支援方法
US8296414B1 (en) * 2007-09-28 2012-10-23 Emc Corporation Techniques for automated application discovery
US8819205B2 (en) * 2007-10-19 2014-08-26 Hitachi, Ltd. Content transfer system, content transfer method and home server
JP5005527B2 (ja) * 2007-12-27 2012-08-22 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ管理方法
US8209443B2 (en) * 2008-01-31 2012-06-26 Hewlett-Packard Development Company, L.P. System and method for identifying lost/stale hardware in a computing system
US20090204648A1 (en) * 2008-02-11 2009-08-13 Steven Francie Best Tracking metadata for files to automate selective backup of applications and their associated data
US7882246B2 (en) * 2008-04-07 2011-02-01 Lg Electronics Inc. Method for updating connection profile in content delivery service
AU2009330073B2 (en) 2008-12-22 2012-11-15 Google Llc Asynchronous distributed de-duplication for replicated content addressable storage clusters
US9329951B2 (en) * 2009-07-31 2016-05-03 Paypal, Inc. System and method to uniformly manage operational life cycles and service levels
JP5357068B2 (ja) * 2010-01-20 2013-12-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、情報処理システム、データ・アーカイブ方法およびデータ削除方法
US8935612B2 (en) * 2010-04-07 2015-01-13 Sybase, Inc. Data replication tracing
US8527431B2 (en) 2010-11-18 2013-09-03 Gaurab Bhattacharjee Management of data via cooperative method and system
CN103092718A (zh) * 2011-10-27 2013-05-08 鸿富锦精密工业(深圳)有限公司 测试数据备份系统及方法
US9514143B2 (en) * 2011-12-07 2016-12-06 Hitachi Data Systems Corporation Data management system with console module
US20130262374A1 (en) * 2012-03-28 2013-10-03 Fabrice Helliker Method Of Managing Data With Console Module
JP2014031458A (ja) * 2012-08-06 2014-02-20 Nsk Ltd 潤滑剤組成物、及びハードディスクドライブスイングアーム用軸受ユニット
US10664356B1 (en) * 2013-05-30 2020-05-26 EMC IP Holding Company LLC Method and system for enabling separation of database administrator and backup administrator roles
WO2015126971A1 (en) * 2014-02-18 2015-08-27 Cobalt Iron, Inc. Techniques for presenting views of a backup environment for an organization on a sub-organizational basis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207264A (ja) * 1999-01-19 2000-07-28 Canon Inc バックアップ方法およびリストア方法
JP2004139494A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd ストレージ使用容量表示方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5065347A (en) * 1988-08-11 1991-11-12 Xerox Corporation Hierarchical folders display
US5388196A (en) * 1990-09-07 1995-02-07 Xerox Corporation Hierarchical shared books with database
US5495607A (en) * 1993-11-15 1996-02-27 Conner Peripherals, Inc. Network management system having virtual catalog overview of files distributively stored across network domain
US5890165A (en) * 1996-03-29 1999-03-30 Emc Corporation Method and apparatus for automatic discovery of databases
US5953525A (en) * 1997-03-31 1999-09-14 International Business Machines Corporation Multi-tier view project window
US6173293B1 (en) * 1998-03-13 2001-01-09 Digital Equipment Corporation Scalable distributed file system
US6282602B1 (en) * 1998-06-30 2001-08-28 Emc Corporation Method and apparatus for manipulating logical objects in a data storage system
US6329985B1 (en) * 1998-06-30 2001-12-11 Emc Corporation Method and apparatus for graphically displaying mapping of a logical object
WO2000004483A2 (en) * 1998-07-15 2000-01-27 Imation Corp. Hierarchical data storage management
US6952823B2 (en) * 1998-09-01 2005-10-04 Pkware, Inc. Software patch generator using compression techniques
US6380957B1 (en) * 1998-12-15 2002-04-30 International Business Machines Corporation Method of controlling view of large expansion tree
US7054892B1 (en) * 1999-12-23 2006-05-30 Emc Corporation Method and apparatus for managing information related to storage activities of data storage systems
US6950871B1 (en) * 2000-06-29 2005-09-27 Hitachi, Ltd. Computer system having a storage area network and method of handling data in the computer system
EP1325408A2 (en) * 2000-10-06 2003-07-09 Ampex Corporation System and method for transferring data between recording devices
US6912543B2 (en) * 2000-11-14 2005-06-28 International Business Machines Corporation Object-oriented method and system for transferring a file system
US6976060B2 (en) * 2000-12-05 2005-12-13 Agami Sytems, Inc. Symmetric shared file storage system
US6636878B1 (en) * 2001-01-16 2003-10-21 Sun Microsystems, Inc. Mechanism for replicating and maintaining files in a spaced-efficient manner
WO2002073504A1 (en) * 2001-03-14 2002-09-19 Gene Logic, Inc. A system and method for retrieving and using gene expression data from multiple sources
US6854035B2 (en) * 2001-10-05 2005-02-08 International Business Machines Corporation Storage area network methods and apparatus for display and management of a hierarchical file system extension policy
US7024427B2 (en) * 2001-12-19 2006-04-04 Emc Corporation Virtual file system
JP2003296290A (ja) * 2002-04-02 2003-10-17 Hitachi Ltd 記憶装置システム及びデータ転送方法
US7844577B2 (en) * 2002-07-15 2010-11-30 Symantec Corporation System and method for maintaining a backup storage system for a computer system
US7478096B2 (en) * 2003-02-26 2009-01-13 Burnside Acquisition, Llc History preservation in a computer storage system
US20050049998A1 (en) * 2003-08-28 2005-03-03 International Business Machines Corporation Mechanism for deploying enterprise information system resources
US7287048B2 (en) * 2004-01-07 2007-10-23 International Business Machines Corporation Transparent archiving
US20050267918A1 (en) * 2004-05-28 2005-12-01 Gatev Andrei A System and method for bundling deployment descriptor files within an enterprise archive for fast reliable resource setup at deployment time

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207264A (ja) * 1999-01-19 2000-07-28 Canon Inc バックアップ方法およびリストア方法
JP2004139494A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd ストレージ使用容量表示方法

Also Published As

Publication number Publication date
JP2006031695A (ja) 2006-02-02
US20070198690A1 (en) 2007-08-23
US7206790B2 (en) 2007-04-17
US20060015544A1 (en) 2006-01-19

Similar Documents

Publication Publication Date Title
JP4744955B2 (ja) データ管理システム
JP4705649B2 (ja) 動的なデータバックアップのためのシステムおよび方法
US8032491B1 (en) Encapsulating information in a storage format suitable for backup and restore
US9740700B1 (en) Snapshot map
US7406473B1 (en) Distributed file system using disk servers, lock servers and file servers
EP1851630B1 (en) Systems and methods for restoring data
EP1522926B1 (en) Systems and methods for backing up data files
US7634511B1 (en) User interface for viewing logical representation of a database backed up by a database recovery manager
US7523254B2 (en) Method for analyzing performance information
US8438136B2 (en) Backup catalog recovery from replicated data
US8375002B2 (en) Storage system, NAS server and snapshot acquisition method
US20060230243A1 (en) Cascaded snapshots
US8832498B1 (en) Scalable codebook correlation for cloud scale topology
US8332442B1 (en) Automated restoration of links when restoring individual directory service objects
US20100223428A1 (en) Snapshot reset method and apparatus
JP2010049488A (ja) ストレージシステム及びデータ管理方法
US9690791B1 (en) Snapshot history map
KR101693683B1 (ko) 가상 데이터베이스 되감기
JP2007219611A (ja) バックアップ装置及びバックアップ方法
US8285835B1 (en) Graphical analysis of states in a computing system
US9165003B1 (en) Technique for permitting multiple virtual file systems having the same identifier to be served by a single storage system
US7685460B1 (en) Multiple concurrent restore using same user interface
US7587565B1 (en) Generating automated and scheduled SAN copy sessions for ISB protocol systems
US20040024887A1 (en) Method, system, and program for generating information on components within a network
US7613720B2 (en) Selectively removing entities from a user interface displaying network entities

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080509

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees