JP4648723B2 - データ価値に基づく階層型ストレージ管理の為の方法と装置 - Google Patents

データ価値に基づく階層型ストレージ管理の為の方法と装置 Download PDF

Info

Publication number
JP4648723B2
JP4648723B2 JP2005037054A JP2005037054A JP4648723B2 JP 4648723 B2 JP4648723 B2 JP 4648723B2 JP 2005037054 A JP2005037054 A JP 2005037054A JP 2005037054 A JP2005037054 A JP 2005037054A JP 4648723 B2 JP4648723 B2 JP 4648723B2
Authority
JP
Japan
Prior art keywords
storage
data
value
hierarchical
data object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005037054A
Other languages
English (en)
Other versions
JP2006031668A (ja
JP2006031668A5 (ja
Inventor
雄一 矢川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2006031668A publication Critical patent/JP2006031668A/ja
Publication of JP2006031668A5 publication Critical patent/JP2006031668A5/ja
Application granted granted Critical
Publication of JP4648723B2 publication Critical patent/JP4648723B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

0001 本発明はデータストレージ及び管理方法とその為のシステムに関連する。より具体的には、本発明は、事前に選択された具体的なパラメータのセットに従いデータを管理しストレージ資源内に配置する、階層型ストレージ管理の為の方法とシステムに関連する。
0002 ビジネスがデータ量とその多様性を拡大していくに従い、データストレージの物理的な量の拡大、情報への広範なアクセス要求、ストレージ環境の複雑さの拡大、及び新たに出現する技術の採用等に対して組織は対応しなければならなくなった。これらの問題に対して、際限なく資源と時間を割ける会社は極めて少ない。今日では、会社は高性能化、インテリジェントシステム、及び稼動時間を最大にし、データストレージコストを低減しながら、現存データと現存ネットワークを管理する複雑なソフトウェアに基づいた新たなストレージ管理戦略を考慮しなければならない。
0003 階層型ストレージ管理は大量のデータを管理する一つの方法である。ファイル又はデータは、如何に頻繁に又は如何にすみやかに必要とするかに基づいて、各種のストレージ媒体に割り当てられる。データの主要な性質はストレージシステムで評価される。データは使用間隔、頻度又は価値の如き一つ以上の性質に基づいて管理される。ユーザの利益も同じ主要な性質に基づいて評価される。データは、データの生涯に亘るユーザ利益に基づいて管理される。データは又、ストレージコストに基づいて、適切なストレージ資源に配置され得る。
0004 データをその生涯に亘って管理することは挑戦的なタスクである。この主要な挑戦事項は、定常的に増大する大量のデータを如何に管理し、同時にTCO(Total Cost of Ownership)を極めて小さく維持すべく、データ管理コストを如何にコントロールするかに関っている。
0005 現在可能なテクノロジーによって、望まれる予算の範囲内で大量データを保存し管理するのに成功するストレージシシテム管理の基本的要求は、完全に拡張可能なアーキテクチュアによりデータ管理を最少コストで提供することである。完全に拡張可能なアーキテクチュアは、ストレージシステムの容量を制限することはなく、又ハードウェアアーキテクチュアで実装されるSAN(Storage Area Network)に関るデータ管理ソフトウェアの管理範囲を制限することもない。最少のTCOは最少の管理タスクで実現される。
0006 OSD(Object based Storage Devices)とRAIN(Reliable Array of Independent Nodes)は完全に拡張可能なデータ管理を目指すストレージシステムアーキテクチュアの例である。
0007 慣用的方法では、最少のTCOはデータストレージをHSM(Hierarchical Storage Management:階層型ストレージ管理)システムで管理することにより達成できた。HSMでは、データファイルを多様なデータストレージ媒体の間で管理することができる。HSMシステムが遭遇する課題は、使用するストレージ媒体がアクセスタイム、容量、及びコストで相違し、統合管理が大変困難なことである。例えば、RAID(Redundant Array of Independent Disks)に組み入れられた磁気ディスクの様な短期ストレージ媒体は、分離して管理しなければならないほどに、ネットワーク中の他のコンポーネントとは異なったパラメータを持っている。HSMはストレージに対して、自動的に性能チューニングを提供し、性能ボトルネックを解消する当座のソリューションである。現状では、HSMの背後にある技術は、各データボリュームに対するアクセス頻度を保存し、そのアクセスパターンを解析することである。HSMは更に、ストレージ内に論理ボリュームを持ち込み、ストレージサブシステムに対するアクセス率を正規化している。現状のHSMシステムの一例は、Hitachi Lightning 9900TMV製品シリーズに含まれるCruiseControl(R)であり、今日広範に使用可能である。
0008 OSDとRAINアーキテクチュアは完全に拡張可能なアーキテクチュアの例ではあるが、管理データのTCOを最少にして維持する為には、階層型ストレージデータ管理に加えて追加の技術が必要である。もし会社がストレージ容量を拡張する為に、データ量の増大に伴って同一のストレージシステム(例えばオンラインストレージデバイス)を定期的に追加していくなら、ストレージ容量の定期的な追加により、高コストが余儀なくされる。ストレージ容量は容易に限界に達して、会社はTCOを最小にできなくなる。
0009 もう一つ考慮しなければならない側面は、データには生涯に亘って変動するデータ固有の価値が有ることである。異なったタイプのストレージデバイスと媒体を使用して、データをその価値に従い生涯に亘って管理するアーキテクチュアが必要である。データはその価値に従って適切な場所に保存される。データ価値とストレージコストの双方を考慮して、適切な保存場所を自動的に定めるシステムを提供することが重要である。
0010 慣用的なHSM技術は、データ価値の生涯に亘る変動を考慮していない。現状では、ユーザによるデータの生涯管理はアーカイブの前に静的に定義され、データは事前設定されたパラメータに従い、異なったタイプのストレージ媒体に保存される。例えば、RAIDシステム中のデータが事前設定した寿命に達すれば、システムは単純に当該データをテープにアーカイブするのみである。しかしながら、その生涯に亘って変動するデータの価値は、時時変動するユーザの利益にも依存している。もしユーザが、生涯中にデータ価値の変更を希望すれば、これを人手で行う必要があり、新たな管理コストが発生する。
0011 データの生涯に亘って、ユーザの利益に基づきデータの価値を考慮し、データをデータの価値とストレージコストに基づいて、適切なストレージ資源に配置する階層型ストレージ管理の為の方法とシステムが必要である。
0012 更に又、データをその生涯に亘ってTCOを最少にするために、OSDやRAINのような完全に拡張可能なアーキテクチュアを可能にする階層型ストレージ管理の為の方法とシステムが必要である。
0013 本発明の実施例は、データの生涯に亘ってユーザ利益に基づいてデータ価値を考慮した階層型データストレージ管理を提供することで、これらのニーズに取り組むものである。データは、算定された価値とストレージコストに基づいて、適切なストレージ資源に配置される。本発明により、データボリュームを最少コストで管理する拡張可能なネットワークアーキテクチュアが可能になる。
本発明による階層型ストレージデータ管理システムは、複数のアプリケーションサーバと、LAN(ローカルエリアネットワーク)を通して前記複数のアプリケーションサーバに結合するメタデータサーバと、複数のデータフローパスにより結合され、それぞれ前記アプリケーションサーバからの要求に応じてデータオブジェクトを記憶する複数のストレージデバイスと、前記複数のストレージデバイスを前記複数のアプリケーションサーバと前記メタサーバに結合するストレージネットワークと、を備える階層型ストレージデータ管理システムであって、前記メタデータサーバは、前記ストレージデバイスに格納された各前記データオブジェクトの格納位置を管理するメタデータ管理要素と、前記ストレージデバイスに格納された各前記データオブジェクトに価値を割り当てるデータ価値管理要素と、階層型ストレージ管理要素と、を有し、前記データ価値管理要素は、前記メタデータ管理要素から前記データオブジェクトに対する複数のユーザ利益表示を受信する手段と、前記複数のユーザ利益表示を解析する手段と、各データオブジェクトのユーザ利益レベルを決定する手段と、前記ユーザ利益レベルに対応して前記各データオブジェクトにデータ価値を割り当てる手段と、を備え、前記ユーザ利益表示は、前記データオブジェクトから抽出したインデックス、書誌情報、及び用語の少なくとも一つと、前記データオブジェクトが保存されてから削除されるまでの寿命に関して該データオブジェクトに割り当てられた寿命値でなるデータ価値と、を含み、前記階層型ストレージ管理要素は、前記メタデータ管理要素から複数のストレージ領域に対する複数のストレージコスト表示を受信する手段と、前記複数のストレージコスト表示を解析する手段と、前記ストレージ領域に対してストレージコストレベルを決定する手段と、前記ストレージコストレベルに対応して前記ストレージ領域にストレージコスト値を割り当てる手段と、を備え、前記ストレージコスト表示は、前記ストレージ領域の平均性能と信頼性とを含み、前記メタデータサーバは、前記データ価値の区分を前記ストレージコスト値の区分と同一に設定することによって、前記データ価値管理要素で計算された複数のデータオブジェクトのデータ価値と、前記階層型ストレージ管理要素により割り当てられた前記ストレージデバイス内の複数のストレージ領域のストレージコスト値を正規化すると共に、正規化済データ価値を正規化済ストレージコスト値と比較して、前記データオブジェクトを別のストレージ領域に再配置するかどうかを決定し、データオブジェクトを、該データオブジェクトのデータ価値と等しいストレージコスト値を持つストレージ領域に再配置することを特徴とする。
また本発明による階層型ストレージデータ管理方法は、複数のアプリケーションサーバと、LAN(ローカルエリアネットワーク)を通して前記複数のアプリケーションサーバに結合するメタデータサーバと、複数のデータフローパスにより結合され、それぞれ前記アプリケーションサーバからの要求に応じてデータオブジェクトを記憶する複数のストレージデバイスと、前記複数のストレージデバイスを前記複数のアプリケーションサーバと前記メタサーバに結合するストレージネットワークと、を備える階層型ストレージデータ管理システムによるストレージデータ管理方法であって、複数のデータオブジェクトとストレージネットワークで結合したストレージデバイス内の複数のストレージ領域をユーザに提示する第1のステップと、前記各データオブジェクトから抽出したインデックス、書誌情報、及び用語の少なくとも一つと前記データオブジェクトが保存されてから削除されるまでの寿命に関して該データオブジェクトに割り当てられた寿命値とを含み複数のユーザ利益表示を収集する収集ステップ、前記複数のユーザ利益表示を解析する解析ステップ、前記データオブジェクトに対してユーザ利益レベルを決定する決定ステップ、及び前記ユーザ利益レベルに対応して前記各データオブジェクトにデータ価値を割り当てる割当てステップを有し、各前記データオブジェクトに対してデータ価値を計算する第2のステップと、各ストレージ領域の平均性能と信頼性のデータを収集して複数のストレージコスト表示するステップ、前記複数のストレージコスト表示を解析するステップ、前記各ストレージ領域のストレージコストレベルを決定するステップ、及び前記ストレージコストレベルに対応させて事前指定の期間内でのアクセス回数又は前記各データオブジェクトが保存されてから削除されるまでの寿命を加算して前記各ストレージ領域にストレージコスト値を割り当てる第3のステップと、計算されたデータ価値と割り当てられたストレージコスト値を同一の値区分を持つように正規化する第4のステップと、正規化済データ価値を正規化済ストレージコスト値と比較して、前記データオブジェクトを別のストレージ領域に再配置すべきかどうかを決定する第5のステップと、データオブジェクトを、該データオブジェクトのデータ価値と等しいストレージコスト値を持つストレージ領域に再配置する第6のステップと、を備えることを特徴とする。
0015 本発明の多様な実施例の構成や動作に加えて、本発明の更なる機能と便益が添付した図面を参照しながら以下に詳細に説明される。本発明はここに記された具体的実施例に限られるものではないことに注意が必要である。このような実施例は単に説明の為のみに展開する。ここに展開する開示に基づき、追加の実施例が当業者には明白であろう。
本発明の実施例は、データの生涯に亘ってユーザ利益に基づいてデータ価値を考慮した階層型データストレージ管理を提供することで、これらのニーズに取り組むものである。データは、算定された価値とストレージコストに基づいて、適切なストレージ資源に配置される。本発明により、データボリュームを最少コストで管理する拡張可能なネットワークアーキテクチュアが可能になる。
0016 本発明を、以下の添付図面を参照して説明する。
0031 好適な実施例についての以降の説明では、本発明の一部である添付図面が参照され、本図面により、本発明が適用される具体的実施例が説明の目的で示される。他の実施例も可能であり、本発明の範囲を離れることなく構造的変更も可能であることを理解する必要がある。
0032 図1はDLCM(Data Life Cycle Management)情報より成るグラフである。オブジェクトは(データと方法を組み入れた)データ構造であり、他のオブジェクトとは“交信”可能であるものの、そのインスタンスはユニークであり、他のオブジェクトとは区別される。オブジェクト指向プログラミングでのオブジェクトの寿命(又は生涯)は、オブジェクトの生成(インスタント生成とか構築とも言われる)からもはや使用されなくて解放される迄の時間である。オブジェクト指向プログラミングでの各オブジェクトの寿命は、慣用形プログラミングの場合よりも広範に変動する傾向がある。
0033 グラフ100は、管理対象データの保存時間を表示するX軸11、管理対象データのタイプを表示するY軸10、及び採用されるデータ管理技術を表示するZ軸12とから成るDLCM情報で構成される。管理対象データの保存期間は日又は年で計測される。データの可能なタイプの例はトランザクションデータ、データベース/データウェアハウス(DB/DWH)データ、E−メールドキュメント、ディジタルコンテンツデータ等である。採用される管理技術の例はブロック管理、ファイル管理、オブジェクト管理等である。グラフ100には二つの大きな傾向が見られる。即ち、管理対象データのタイプは構造型から準構造型と非構造型に変化し、データ保存時間も増大する。
0034 構造型データの例にはトランザクションデータとDB/DWHが存在する。準構造型データの例はE−メールで、これには構造型部分(ヘッダ部)と非構造型部分(メールの本体)が存在する。非構造型データの例はディジタルコンテンツで、このデータ構造はユニークでなく予想し難いものである。現存のストレージシステムは、準構造型と非構造型データに比べて構造型データを最もよく管理することができ、準構造型と非構造型データについても管理効率の向上を目指している。
0035 管理対象データの保存時間を増大させる幾つかの他の要因が存在する。即ち、政府規制が会社に対してそのビジネス活動を監査する為にデータの長期保存を要求し、データマイニング、ビジネスインテリジェンス等でのデータの再利用も要因である。従って、データ管理のより良いソリューションが望まれる。
0036 図1の実線の矢印13はマーケットの傾向を示しており、会社では管理対象データ量の増大が問題となり、結果として、エンタプライズデータのTCO(Total Cost of Ownership)(TCO−D)について心配している状態を示している。従って、データをその生涯を通して管理することは会社にとって大変緊急な課題になってきた。ストレージサービスベンダーの観点からは、ブロックベースのSAN(Storage Area Network)やファイルベースのNAS(Network Attached Storage)と共にOSD(Object based Storage Devices)の如き適切な技術を提供し操作できれば、マーケットを拡大し利益を得ることができる。このマーケット傾向は、図1の点線の矢印14で示す。
0037 既に述べたように、データをその生涯に亘って管理することは、挑戦的な課題である。この為の主要な課題は、定常的に増大する大量のデータを如何に管理し、同時に非常に低いTCOを維持する為に関連コストを如何に抑えるか、である。
0038 大量データを望まれるコストパラメータ範囲内で管理するマネージメントとストレージシステムに対する基本的要求は、完全に拡張可能なアーキテクチュアにより、データ管理サービスを最少コストで提供することである。この完全に拡張可能なアーキテクチュアの要求は、ストレージシステムの容量が無制限であることを意味する。同時に、ストレージシステムに関するデータ管理ソフトウェアが実行する管理範囲についても無制限であることも必要である。最少TCOは最少管理タスクで達成される。
0039 OSD(Object based Storage Devices)とRAIN(Reliable Array of Independent Nodes)は現在完全に拡張可能なデータ管理を狙えるストレージシステムアーキテクチュアである。
0040 図2はOSDアーキテクチュアの一般的事例を示す。アーキテクチュア200は、複数のアプリケーションサーバ202、メタデータサーバ204、複数のストレージデバイス206、SAN(Storage Area Network)208、及びLAN(Local Area Network)210より成り立つ。各アプリケーションサーバ202は、アプリケーションプログラム要素212とデータアクセスクライアント要素214で成り立つ。メタデータサーバ204はメタデータ管理要素216を有する。アプリケーションサーバ202はLAN210を通して互いに結合される。アプリケーションサーバ202は、SAN208を通してストレージデバイス206にアクセスする。SAN208と各ストレージデバイス206との間には、論理的又は物理的リンク218が確立している。アーキテクチュア200内で結合するアプリケーションサーバとストレージデバイスの数には制限がない。
0041 メタデータサーバ204に属するメタデータ管理要素216は、データロケーションとそのセキュリティー(メタデータ)を単一のポイント−ポイントフローの形で、制御する。メタデータ管理要素216は更にデバイス管理に責任を持つ。複数のアプリケーションサーバ202が所定のデータのロケーションに関する情報を受信した後、これらサーバはストレージデバイス206に直接アクセスする。アクセスシーケンスの一例を以下に示す。
0042 アプリケーションプログラム要素212は、データアクセスクライアント要素214にデータ入出力処理(1)REQを要求する。
0043 データアクセスクライアント要素214は、コマンド(2)REQとデータオブジェクトIDをメタデータ管理要素216に要求する。
0044 メタデータ管理要素216は、コマンド(2)REQ要求を調べて、データアクセスクライアント要素214に応答(3)ACKを返す。応答(3)ACKは、要求されたデータオブジェクトIDのデータが存在するアドレスを含む。
0045 データアクセスクライアント要素214は、このアドレスに基づいてデータを読み出し、提供されたアドレスが指示するストレージデバイス206にコマンド(4)REQを送る。
0046 ストレージデバイス206はコマンドを実行しデータを読み出し、完了応答(5)ACKをデータアクセスクライアント要素214に返す。
0047 データアクセスクライアント要素214は、アプリケーションプログラム要素212に応答(6)ACKを返す。
0048 OSDは完全に拡張可能である。追加のストレージデバイス又は能力をアーキテクチュア200に付加することができる。
0049 RAINシステムは独立した分散ストレージデバイス(ノード)より成る。各ノードは自ノード内のみのメタデータを管理し他のノ−ドへのアクセス方法を知っている為、RAINシステムは通常は、共通デイレクトリ又はメタデータサーバを持っていない。ノード間の関係の一例は親子関係で、親ノードは子ノードへのアクセス方法を知っている。一つのノードがノード内のクライアントから要求された或るデータ項目を自ノード内で検出できない場合には、データが存在するかもしれない他のノードにアクセスする。データ項目は、独立に又有意味に処理されるデータの最小の論理的ユニットとして定義される関連した文字列である。このネットワークの容量は新ノードを追加することにより自動的に拡張することができる。
0050 OSDとRAINに共通する基本技術の一つは、複数のアプリケーションから複数のストレージシステムへのアクセスを排他的に管理することである。本発明はこの技術に焦点を当てることなく、現行技術を使用して既に述べた挑戦的課題に向けて焦点を当てる。
環境例:
0051 本発明は階層型データストレージ管理方法及び装置に向けられ、ここではデータの生涯を通して、ユーザ利益に基づき、各データ項目に対して価値を割り当てる。データは、ストレージコストを考慮して適切なストレージ資源に配置される。
0052 図3は本発明の第一の実施例に従うOSD(Object based Storage Device)アーキテクチュアの一例を示す。
0053 アーキテクチュア300は複数のアプリケーションサーバ302、メタデータサーバ304、オンラインストレージデバイス324、ニアラインストレージデバイス326、オフラインストレージデバイス328等の複数のストレージデバイス、SAN(Storage Area Network)308、及びLAN(Local Area Network)310より成り立つ。各アプリケーションサーバ302は、アプリケーションプログラム要素312及びデータアクセスクライアント要素314を有する。メタデータサーバ304は、メタデータ管理要素316、データ価値管理要素320、及び階層形ストレージ管理要素322を有する。LAN310を通して、アプリケーションサーバ302は互いに結合され又メタデータサーバ304と結合する。SAN308と複数のリンク318を通して、アプリケーションサーバ302はストレージデバイス324,326、328にアクセスする。アーキテクチュア300内のアプリケーションサーバとストレージデバイスの数には制限がない。
0054 メタデータサーバ304に属するメタデータ管理要素316は、データロケーションとセキュリティー(メタデータ)に対して単一のポイント−ポイントのフローコントロールを提供する。メタデータ管理要素316は更にデバイス管理に責任を持つ。アプリケーションサーバ302は、所定のデータ項目のロケーションに関する情報を入手後は、ストレージデバイスの一つに保存されているデータ項目に直接アクセスする。
0055 図2と図3に各々示すアーキテクチュア200と300の相違点を、以下に要約する。
0056 アーキテクチュア200は、全てが同一タイプの複数のストレージデバイスを有する。
0057 アーキテクチュア300は異なったタイプのストレージデバイスを有する。図3に示す環境例では三タイプのストレージデバイスを示す。アーキテクチュア300で示す例では、ストレージデバイスの数とタイプについては制限がない。アーキテクチュア300では、オンラインストレージデバイス324、ニアラインストレージデバイス326、オフラインストレージデバイス328を有する。オンラインストレージデバイス324はこの三種の中では最も高価であるが最高の性能を発揮する。オンラインストレージデバイス324の例は、SCSIディスク又はファイバチャネルディスクを使用するRAIDシステムである。ニアラインストレージデバイス326はオンラインストレージデバイスよりは安価で中庸の性能を示す。ニアラインストレージデバイスの例は、SATAディスクを使用するRAIDである。オフラインストレージデバイス328は通常最も安価であるが、その性能は良くない。異なったタイプのストレージ媒体を使用することによって、アーキテクチュア300は柔軟でコスト耐力のあるアーキテクチュアを提供する。
0058 トランザクションデータのデータ量が増大するに従い、ユーザはオンラインストレージデバイス324を準備し追加することができる。アーカイブ予定であり将来限定された時点でのみアクセスされるデータに対しては、当該データが最高の性能を要求しない限り、オンラインストレージデバイス324に代わって、ニアラインストレージデバイス326を準備し増設することができる。アクセス予定がなく、ともかくアーカイブするデータには、ユーザはオフラインストレージデバイス328を準備し増設することができる。
0059 メタデータサーバ304は、アーキテクチュア200のメタデータサーバに加えて、データ価値管理要素320と階層型ストレージ管理要素322を備える。
0060 データ価値管理要素320はユーザの利益レベルに基づいて、データに価値を割り当てる。データ価値管理要素320は、メタデータ管理要素316から、ユーザの最新利益を示すデータアクセスレコード(7)ACSを受信し、このアクセスレコードを解析し、アクセス頻度、ストレージ内での寿命、インデックス、データオブジェクトの書誌的情報、又はデータオブジェクトから抽出した用語等のパラメータに基づいて、ある時点のユーザ利益を決定し、データ価値(8)VALを割り当てる。
0061 階層型ストレージ管理要素322は、割り当てられた価値(8)VALとストレージ特性に基づいてデータを再配置する。各ストレージ特性はコスト、性能実績等のストレージに関る特徴等より成る。例えば階層型ストレージ管理要素322は、データ価値とストレージコストを比較し、当該データを適切なストレージロケーションに再配置する。この詳細なデータフローについては図4に関連して説明する。総称的には、データフローは図3に於ける矢印(1)から(8)で示す。
0062 図4は、本発明に従う階層型データ管理フローの詳細ブロックダイアグラムを示す。
0063 アプリケーションサーバ302内のデータアクセスクライアント要素314は、メタデータ管理要素316にデータアクセスコマンド(9)COMを送信する。これに応答して、メタデータ管理要素316から三つのコンポーネントに一組の結果が返送される。データアクセスコマンド(9)COMは、アクセス対象のデータオブジェクトの識別情報を含んでいる。
0064 メタデータサーバ304内のメタデータ管理要素316は、データアクセスクライアント要素314からコマンド(9)COMを受信して、これを解析し、コマンド実行要素402と共にコマンド(9)COMを実行する。次いで、メタデータ管理要素316は、データアクセスクライアント要素314に応答(10)ACKを返送する。アーキテクチュア300にユニークな機能は、データ価値管理要素320にデータアクセスレコード(7)ACSを送信することである。データアクセスレコード(7)ACSはデータフロー408として送信される。
0065 メタデータサーバ304内のデータ価値管理要素320は、メタデータ管理要素316からデータアクセスレコード(7)ACSを受信して、このレコードとユーザ利益に基づいて、各データ項目に対して価値を計算し、その結果を保持する。アーキテクチュア300のもう一つの特徴は、データ価値計算モジュール410がデータオブジェクトを個々の特性に分割して、各特性値を計算して、個々の値をデータ価値(8)VALに合成することである。各個別の特性に対する価値(8)VALのセットは、ある特定時点でのユーザ利益を反映している。要求が有れば、データ価値管理要素320は、階層型ストレージ管理要素322に対してデータ価値(8)VALのセットを送信する。このことはデータフロー414を通して実現される。
0066 メタデータサーバ304内の階層型ストレージ管理要素322は、データ価値(8)VALのセットを受信し、データ価値とユーザによって事前設定された個々のストレージ特性(例:ストレージコスト)とのバランスをとるべく、メタデータの調整を計画し実行する。ユーザは、計画されたメタデータ調整を直接確認し修正し、メタデータ調整の実行を指示することが出来る。メタデータ調整計画モジュール416とメタデータ調整実行モジュール418はアーキテクチュア300の特徴的なコンポーネントである。
0067 階層型ストレージ管理要素322は、ユーザ利益に基づいてデータ価値を計算し、ストレージコストに基づいて適切なストレージ資源にデータを再配置する。
0068 階層型ストレージ管理要素322は、更に、他の追加的機能、即ちストレージ特性テーブル420の管理、を実行する。ストレージ特性テーブル420は、ストレージ特性、コスト等の情報を管理する。慣例的には、これら特性はユーザインターフェース(図示していない)を通してユーザにより定義される。このインターフェースにより、ユーザは対応するストレージ特性を入力することが出来る。
0069 メタデータ調整を実行する為に、階層型ストレージ管理要素322は、フロー424を通して、メタデータ管理要素316に対して、データアクセスコマンド(11)COMを送信する。メタデータ管理要素316は、階層型ストレージ管理要素322に対して、受領応答(12)ACKを発行する。続いて、階層型ストレージ管理要素322は対応するストレージデバイスにアクセスして、コマンド(12)COMの実行を依頼する。データフロー422はこの動作ステップを示す。可能性のあるコマンド例は、データの再配置要求である。
0070 セキュリティーの観点から、メタデータサーバ304が管理する全てのテーブルは、認可されたユーザのみがアクセスできる特定のストレージ領域に保存される。
0071 図5は図4で参照したメタデータテーブル406の一例を示す。メタデータテーブル406は、以下のデータタイプを示す欄を有する。即ち、データオブジェクトID551、データオブジェクト名552、ストレージID553、ストレージ内アドレス554、フラグ555、及び他の機能556である。
0072 欄551は各データオブジェクトに対するデータオブジェクトID、例えば、“2”を示す。このデータオブジェクトID(DOID)は、アーキテクチュア300を配備したシステムでは固有である。データアクセスクライアント要素314はDOIDによってアクセス対象のデータを識別する。ヘテロな環境下で、本パラメータを固有に保つ技術には、指紋技術やハッシングがある。この技術については、Arturo Crespo, Hector Garcia-Molina.による、“Awareness Services for Digital Libraries”, Research and Advanced Technology for Digital Libraries: First European Conference; proceedings/ECDL '97, Pisa, Italy, September 1-3, 1997、に記されている。上記ドキュメントの内容は参照により本発明の開示に含まれる。
0073 欄52は各データオブジェクトのデータオブジェクト名を示す。ここでの例では、“Yyy”。
0074 欄553はDOIDで定義したデータを保存する固有なストレージIDを示す。ここでの例では、“T3”。
0075 欄554はDOIDで定義したデータを保存するロケーションを識別するためのストレージ内での固有なアドレスを示す。ここでの例では、“1000”。欄553と554を併せて全システム内での固有なストレージロケーションを指定する。
0076 欄555はデータオブジェクトの現在の状態を表すフラグ、即ち“READ”、“WRITE”、“OPEN”等を示す。“READ”はデータアクセスクライアントが当該データオブジェクトを読み取り中で、“WRITE”はデータアクセスクライアントが当該データオブジェクトを書き込み中で、更に“OPEN”は当該データオブジェクトに対してアクセス中ではないことを示す。“WRITE”の場合には、メタデータ管理要素316は、排他書き込みアクセスを保障する為に、他ユーザからの当該データオブジェクトに対する付随アクセスを拒絶する。
0077 欄556はデータオブジェクトのサイズ、アクセスコントロールリスト(ACL)情報、データオブジェクト自身を記述するデータ特性等の、メタデータを記述する為に用いられるその他の特徴を表示する。
0078 メタデータテーブル406の行561から563はメタデータエントリの例であり、上記で記述したパラメータで識別される。
0079 READコマンドの場合は、メタデータ管理要素316は、READコマンドを受信し、このコマンドに付随するDOIDを用いてメタデータテーブル406のエントリを検索する。高速検索を達成するのに、幾つかのインデックス技術が存在する。メタデータ管理要素316は、欄555にREADフラグをセットして、欄553のストレージIDと欄554のストレージ内アドレスをデータアクセスクライアント要素314に返送する。
0080 WRITEコマンドの場合は、メタデータ管理要素316は、存在するデータに関するWRITEコマンドを受信し、このコマンドに付随するDOIDを用いてメタデータテーブル406のエントリを検索する。WRITEフラグが欄555にセットされる。欄553のストレージIDと欄554のストレージ内アドレスをデータアクセスクライアント要素314に返送する。メタデータ管理要素316が新規データに対するWRITEコマンドを受信すると、メタデータテーブル406に新規エントリを生成し、新規DOIDと新規ロケーションを当該新規データに割り当てる。新規DOIDを割り当てる為に、ディジタル認証又は指紋技術が使用される。
0081 メタデータ管理要素316は、システム全体に亘って、不使用ストレージスペースを管理し新規ストレージロケーションを割り当てる。主として階層型ストレージ管理要素322からの要求に従い、WRITEコマンドがパラメータとして候補ストレージロケーションを指定できることはアーキテクチュア300の特徴的な点である。
0082 図4に戻って、データ価値計算モジュール410は、データ価値をデータ価値テーブル412に格納する。図6はデータ価値テーブル412の一例である。
0083 データ価値テーブル412はデータオブジェクトID欄651、データオブジェクト特性欄652、アクセスレコード欄653、及びデータ価値欄654を持つ。
0084 欄651は、各データオブジェクトに対して、データオブジェクトを表す数値によりデータオブジェクトIDを指定する。例えば、“2”。
0085 欄652はデータオブジェクト自身の特徴を記述するデータオブジェクト特性を指定する。例えば、“G,I,K,L,N,P,Q”。データオブジェクト特性の例は、インデックス(構造化データ)、著者、題目、キーワード、製作日等の書誌情報(準構造化データ)、又はデータから抽出した全ての用語(非構造化データ)である。非構造型データから用語を抽出するには、インターネットの検索エンジンに類似したインデックス化技術が採用される。
0086 欄653はメタデータ管理要素316から受信したデータアクセスレコード(7)ACSを特徴付ける。アーキテクチュア300では、欄653内の数値はデータがアクセスされた回数を示す。本発明のもう一つの可能性ある実施例では、欄653内のアクセスレコードは、コマンドタイプの幾つかのサブクラスを表示する。この具体例では又、メタデータ管理要素316はアクセスレコードをコマンドタイプでクラス分けする。
0087 欄654はデータ価値計算モジュール410によって算出されたデータ価値を示す。データ価値を計算する最も簡単な方法は、欄653のアクセスレコードを欄654のデータ価値とすることである。然しながら、本発明のもう一つの実施例では、ユーザ利益を反映する為に、データのより小さな粒度(即ち、データ特性)例えば、データオブジェクトの寿命(後述する)を考慮して計算する。
0088 データ価値テーブル412の行661から664はデータ価値エントリの例である。
0089 本発明の一実施例では、システムはデータ価値テーブル412をユーザに提示し、ユーザがこのテーブルにエントリを作成したり、修正できるようにする。
0090 本発明のもう一つの実施例では、データ価値テーブル412は、データオブジェクトが新規にシステムに保存された時点を示すデータ生成時刻に関するエントリを設ける。このエントリを使用して、データ価値管理要素320はデータオブジェクトの寿命を考慮し、これをデータ価値に割り当てる。例えば、データの寿命が或る期間内、例えば30年、ならば、データ価値管理要素320はこのデータオブジェクトの価値は極めて高く、欄653の対応アクセスレコードの値の如何に関らず、欄654の値を“25”にセットする。データ価値管理要素320はデータオブジェクトの寿命を欄653でのアクセスレコードに基づいて計算し、欄654のデータ価値に持ち込む。
0091 図4で参照するユーザ利益テーブル270は、各特性パラメータに対する合計のアクセスを記録する。図7はユーザ利益テーブル270の一例を示す。
0092 ユーザ利益テーブル270は、特性パラメータ771、データオブジェクトへのインデックス772、及び評価点773の各欄を有する。
0093 欄771は各ユーザ特性パラメータ評価点エントリ用の特性パラメータを示す。図6のデータ価値テーブル412の欄652のデータオブジェクト特性の行661で“B”で示すように、各ユーザ特性パラメータは、図7の行782の“B”で示すように、ユーザ利益テーブル270のエントリに対応する。
0094 欄772は欄771の特性パラメータを持つデータオブジェクトへのインデックスを示す。このインデックスはデータオブジェクトID(DOID)である。パラメータ“A”及び“B”は図6の行661内のDOID“1”で定義されるデータオブジェクトに含まれ、パラメータ“L”は図6の行662,663、664内のDOID“2”、“3”、“n”で定義されるデータオブジェクトに含まれ、更にパラメータ“M”は、図6の行663内のDOID“3”で定義されるデータオブジェクトに含まれる。
0095 欄773は、各特性パラメータに対する合計アクセスレコードに相当する評価点を示す。例えば、パラメータ“A”と“B”はDOID“1”で定義されるデータオブジェクトにのみ含まれ、これらの評価点は同じで、図6の欄653内のアクセスレコードの4である。一方、パラメータ“L”はDOID“2”、“3”、“n”で定義されるデータオブジェクトに含まれ、これの評価点は図6の欄653のDOID“2”、“3”、“n”のデータオブジェクトのアクセスレコードの合計値、26(=0+16+10)になる。
0096 ユーザ利益テーブル270の行781から784は、特性パラメータ評価点エントリの例である。
0097 ユーザの最近の実アクセスレコードに基づいて、ユーザ利益テーブル270は、ユーザの現状の利益を反映している。本発明のもう一つの実施例では、システムはユーザ利益テーブル270をユーザに提示して、ユーザが修正できるようにする。
0098 図10は、データ価値管理要素320が、データ価値テーブル412に新規エントリを追加する為の処理フローを示す。処理フローは下記のステップを実行する。
0099 ステップ1011にて、データ価値管理要素320は新規DOIDとその特性を取得する。データ価値管理要素320がメタデータ管理要素316から受信したデータアクセスレコードに新規DOIDを検出したら、データ価値管理要素320は、メタデータ管理要素316にその特性を送信するように依頼する。メタデータ管理要素316に新規データオブジェクトに関する情報をオンデマンドで送付依頼する代わりに、データ価値管理要素320はデータオブジェクトに直接アクセスして、自らデータ特性を生成しても良い。
0100 ステップ1012にて、データ価値テーブル412にエントリが作り込まれる。データ価値管理要素320は、データ価値テーブル412に受信したデータオブジェクトに関するエントリを作成して、図6の欄651にデータオブジェクトIDを、欄652にデータオブジェクト特性をセットする。欄653と654の対応フィールドはデータ価値計算モジュール410が稼動する迄は空白のままである。
0101 ステップ1013にて、図7のユーザ利益テーブル270に、各新規特性パラメータに対するエントリが作成される。データ価値管理要素320は、ステップ1011で受信した新規特性パラメータを、図7のユーザ利益テーブル270に挿入する。更にデータ価値管理要素320は、図7の欄772に当該新規データオブジェクトへのインデックスを挿入する。欄773の対応フィールドはデータ価値計算モジュール410が稼動する迄は空白のままである。
0102 もしメタデータテーブル406の幾つかのエントリが削除されたら、データ価値管理要素320は、メタデータテーブル406から全てのDOIDに対して、データ価値テーブル412と比較し、削除されたDOIDに対応するエントリを検出し削除して、メタデータテーブル406とデータ価値テーブル412間の整合性を保持する。ユーザ利益テーブル270に関しては、削除されたデータのみに含まれる特性パラメータをそこから削除するか否かは、各実装次第である。本発明のこの実施例は主として、アーカイビングに使用される為に、データオブジェクトの削除は稀にしか発生しない。
0103 一般的に、データ価値計算モジュール410は、性能への影響を考慮して事前設定計画に従って、図6で示すデータ価値テーブル412の欄654を埋める為に稼動する。図11はデータ価値計算の処理シーケンスを示す。処理は、ステップ1111と、ステップ1113から1117で成るステップ1112で構成される。
0104 ステップ1111にて、データアクセスレコード(7)ACSのセットを取得する。データ価値管理要素320内のデータ価値計算モジュール410は、メタデータ管理要素316からデータアクセスレコード(7)ACSのセットを受信する。メタデータ管理要素316がデータ価値管理要素320からの要求に応答するインターフェース(プロトコル又はコマンド)を持っていることは、本実施例のユニークな点である。
0105 ステップ1112にて、データ価値テーブル内の全対象データオブジェクトのデータ価値は加算される。各データオブジェクトに対して、データ価値計算モジュール410はステップ1113から1117のシーケンスを実行する。ステップ1113にて、データ価値計算モジュール410は、データ価値テーブル412の欄653の対応するアクセスレコードを、アクセスレコードの値で加算する。引き続くステップ1114にて、図6のデータオブジェクト特性欄652記載のデータオブジェクトの各特性パラメータに対して、データ価値計算モジュール410はステップ1115から1117を実行する。ステップ1115にて、データ価値計算モジュール410は、図7のユーザ利益テーブル270の欄773の各評価点を、データアクセスレコード(7)ACSのセットのアクセスレコードの値で、加算する。ステップ1116にて、データ価値計算モジュール410は、特性パラメータが参照した各データに対して、データ価値テーブル412の欄654のデータ価値をデータアクセスレコード(7)ACSのセットのアクセスレコードの値で加算する。かくして、アクセスレコードはユーザ利益テーブル270とデータ価値テーブル412に組み入れられる。アクセスレコードの値は、最近の一か月に10回アクセスされたデータオブジェクトと最近の一週間で10回アクセスされた別のデータオブジェクトのユーザ利益を区別する為に、データオブジェクトのアクセス頻度で重み付けしてもよい。
0106 本発明のもう一つの実施例では、データ価値計算モジュール410は、データオブジェクトの寿命を計算し、この計算された寿命に従ってデータ価値に対して追加の値を加えても良い。例えば、データ価値計算モジュール410は、短い寿命のデータオブジェクトは、長い寿命のデータオブジェクトより大きな価値を持つとしても良い。
0107 図8は図4で参照したストレージ特性テーブル420の一例を示す。
0108 ストレージ特性テーブル420はストレージID851、アドレス領域852、ストレージ領域コスト853、及びその他854のデータタイプの欄を有する。
0109 欄851は全システム内でストレージをユニークに識別するストレージIDを示す。例えば、T1は図4で示すオンラインストレージデバイス324を、T2はニアラインストレージデバイス326を、T3はオフラインストレージデバイス328を示す。
0110 欄852は、アドレス領域の範囲を示し、この中では全てのストレージアドレスが等しいコストを持つ。行861に示す例では、ストレージT1のアドレス領域1〜100は、全て10のコスト値を持っている。欄853はストレージのコスト値を示す。ストレージのコスト値はストレージ特性の一つである。
0111 欄854はストレージ特性を表すその他の特徴を示す。このような特徴には平均性能情報、信頼性情報等が該当する。本発明の実施例では、この情報はストレージコストを定義する為に使用される。本発明の他の実施例では、この情報はストレージコストの代わりにストレージ特性の粒度を拡張する為に使用される。
0112 行861から866で表示する情報はストレージ特性の例である。オンラインストレージデバイスT1のコストは最大であり、ニアラインストレージデバイスT2は中庸であり、オフラインストレージデバイスT3は最も安価である。一つのストレージデバイスの中でも、ストレージ領域によって異なったストレージコストを持ち得る事に注意する必要がある。
0113 データ価値とストレージコストを正規化し比較する為に、データ価値テーブル412とストレージ特性テーブル420を結合テーブル150に統合する。図9は結合テーブル150の一例を示す。
0114 結合テーブル150は、データオブジェクトID981、データ価値982、正規化済データ価値983、ストレージID984、ストレージ内アドレス985、ストレージ領域コスト値986、適正ストレージコスト987、及び再配置要求988のデータタイプ欄より成り立つ。
0115 欄981は、各データオブジェクトに対するデータオブジェクトIDを示す。データオブジェクトIDはテーブル406と412を連結し、ストレージIDはテーブル406と420を連結する。欄982はデータ価値を示す。この情報はデータ価値テーブル412で説明済である。
0116 欄983は正規化済データ価値を示す。欄983での情報は新たに計算されたもので、ストレージ領域コスト986と比較される。データ価値を正規化する最も簡単な方法は最大のデータ価値を用いることである。然しながら、データ価値にストレージコスト値の区分と同一になるように区分を設けることは、両者を比較する為に重要なことである。
0117 欄984と985は各々ストレージIDとアドレスを示す。メタデータテーブル406の欄553のストレージID情報はストレージ特性テーブル420の欄851に対応する。この情報は、ストレージ特性テーブル420とメタデータテーブル406を結合することを可能にする。同様に、メタデータテーブル406の欄554のストレージアドレスはストレージ特性テーブル420の欄852のアドレス領域に含まれ、更に結合テーブル150の欄985のアドレスに対応する。この情報はストレージ領域コスト986を記入することを可能にする。テーブル406(図5)の各エントリに対して、同じストレージIDがテーブル420(図8)に見つかり、対応するストレージ領域が同様に見つかる。例えば、テーブル406(図5)の行561は、ストレージIDのT2とアドレス300を持ち、これらはテーブル420(図8)の行864に該当する。
0118 欄986はストレージコスト値を示す。この情報はストレージ特性テーブル420に特有のものである。もし他のストレージ特性をデータ価値との比較の為に使用するなら、それらの特性は、同様に、ストレージ特性テーブル420から選択する。
0119 欄987は各データオブジェクトのデータ価値に見合う適正なストレージコストを示す。このコストは通常、正規化済データ価値983により定義され、本事例ではこれらは同一である。
0120 欄988は、正規化の結果として、データオブジェクトを再配置すべきか否かを表示する。“YES”は、データの価値と現在のストレージロケーションのコストとのバランスの結果として、このデータは再配置すべきであることを示す。“NO”は、バランスが示す通り、現データは適正なロケーションに保存されており再配置が不要であることを示す。欄986でのストレージ領域コストと欄987の適正なストレージコストの値が不一致なら、プログラムはデータが適正な領域に配置されていないことを確認し、再配置要求988が“YES”にセットされ、他の場合(ストレージ領域コスト値986と適正ストレージコスト値987が一致)には、“NO”がセットされる。例えば、行991のデータは、コストが“2”のストレージ領域に保存されるべきところ、現在は“6”の領域に保存されており、再配置が必要である。
0121 本発明の他の実施例として、欄986と欄987の正確な一致に代わって、両者の相違が適正範囲内ならバランスしていると判断しても良い。更に他の本発明の実施例として、ストレージ領域コスト986と適正なストレージコスト987は、ランクによって正規化し、この値で互いに比較しても良い。もしランクが異なれば、再配置要求988が“YES”になる。
0122 メタデータ調整計画モジュール416の目的は、欄987と988に情報を埋め込むことである。メタデータ調整実行モジュール418も、これらの欄に基づいてデータの再配置を実行する。もし欄988が“YES”なら、データオブジェクトは欄987と同じ値を持つストレージ領域に再配置される。
0123 行991から993までの情報は結合テーブル150のエントリの例である。
0124 図12は、メタデータ調整計画モジュール416が実行する、メタデータ調整を計画する処理フロー1200を示す。既に述べた通り、メタデータ調整計画モジュール416が、性能へのボトルネックを避ける為、事前設定計画に従って走行することは、必須ではないが望ましいことである。
0125 処理フロー1200はステップ1211から1214で成り、ステップ1211でデータ価値テーブルを受信し、ステップ1212でメタデータテーブルを受信し、ステップ1213でデータ価値テーブルとストレージ特性テーブルを結合テーブルに統合し、ステップ1214でデータ価値とストレージコスト(ストレージ特性)を正規化する。
0126 ステップ1211で、メタデータ調整計画モジュール416は、データ価値管理要素320からデータ価値テーブル412を受信する。
0127 ステップ1212で、メタデータ調整計画モジュール416は、更にメタデータ管理要素316からメタデータテーブル406を受信する。
0128 ステップ1213で、データ価値テーブル412とストレージ特性テーブル420は結合テーブル150に統合される。メタデータ調整計画モジュール416は、データ価値テーブル412とストレージ特性テーブル420を図9で示す結合テーブル150に統合する。
0129 ステップ1214でデータ価値とストレージコスト(ストレージ特性)を正規化する。メタデータ調整計画モジュール416は、図9のテーブル150の欄987と欄988の為の値を編集する。データ価値983は、ストレージコスト値の区分に適合すべく正規化済の為に、メタデータ調整計画モジュール416はこれらを欄987の適正なストレージコストフィールドにコピーする。欄987の適正なストレージコストと欄986の現ストレージコストが不一致なら、メタデータ調整計画モジュール416は欄988の再配置要求フィールドに“YES”をセットする。そうでなければ、当該フィールドに“NO”をセットする。
0130 欄987に値をセットするのに幾通りかの方法が可能である。一つの方法は、最初に図9に示す結合テーブル150の全エントリを欄983の正規化済データ価値でソートし、その後に、事前設定された順序通りに欄987に適正なストレージコストを割り当てることである。
0131 階層型ストレージ管理要素322が、メタデータ調整実行モジュール418による実行を開始するに先立って、ユーザはこの再配置計画を確認し修正したいと思うかも知れない。ユーザからの要求に従って、メタデータ調整計画モジュール416は図9に示す結合テーブルをユーザに示して、再配置計画の確認と編集が出来るようにする。これら機能を実行する為のインターフェースについては詳細は議論しないが、これらは当業者には明らかなことであろう。
0132 メタデータ調整の処理フロー1400は、メタデータ調整実行モジュール418が実行する。一般的に、メタデータ調整実行モジュール418は、性能へのボトルネックを避けるため事前設定計画に従って実行する。
0133 ステップ1411〜1418の間に、メタデータ調整実行モジュール418は、図9の欄988に“YES”がセットされている各エントリに対して以下のステップを実行する。
0134 ステップ1411にて、メタデータ調整実行モジュール418はメタデータ管理要素316に対してデータオブジェクトIDを用いて“READ”コマンドを送信し、ストレージIDとストレージアドレスの応答を受信する。ストレージIDとストレージアドレスは図9のテーブルに既に示されているにも拘わらず、モジュール418が敢えてこれらを求めるのは、このモジュールが実行している間に、何かのクライアントがデータロケーションを更新する可能性がある為である。
0135 ステップ1412にて、メタデータ調整実行モジュール418は、受信したストレージIDとストレージアドレスを図9のテーブルのものと比較する。もしこれらが異なっていても受信したストレージIDとストレージアドレスのストレージコストが結合テーブル150の欄987での適正ストレージコストと同じ場合には、メタデータ調整実行モジュール418はステップ1411に戻り、次のエントリに進む。異なっている場合は、このモジュール418は次のステップ1413に進む。他の実施例として、もし受信アドレスが異なっていたら、このモジュール418は、データオブジェクトはクライアントにより移動されており再配置は適当でない、と認識し、次のエントリに進んでも良い。
0136 ステップ1413にて、メタデータ調整実行モジュール418は、受信したストレージIDとストレージアドレスに基づいて、データオブジェクトを読み込みこれをバッファーに一時的に保存する。
0137 ステップ1414にて、メタデータ調整実行モジュール418は、図8に示すストレージ特性テーブル420を使用して、ストレージコストが欄987(図9)の適正なストレージコストと等しいストレージIDとアドレス領域を識別する。
0138 ステップ1415にて、メタデータ調整実行モジュール418は、ステップ1414で識別されたストレージIDとアドレス領域内で不使用スペースを見つける為に、メタデータ管理要素316に対して“WRITE”コマンドを送信する。この場合、メタデータ管理要素316は、図5で示したメタデータテーブル406の新規エントリに現エントリからの全ての追加メタデータをコピーする。
0139 ステップ1416にて、メタデータ調整実行モジュール418が失敗の応答を受信したら、このモジュールはステップ1414で識別した領域の隣接領域に対して、“WRITE”コマンドを送信する。隣接領域のストレージコストは欄987での適切なストレージコストと同じか、又は同じコストの不使用スペースが存在しなければ近い値のコストのスペースを求める。成功応答を受信する迄本操作を繰り返す。
0140 ステップ1417にて、メタデータ調整実行モジュール418はバッファー内のデータを読み出し、成功応答で受信したストレージIDとアドレスに書き込む。
0141 ステップ1418にて、メタデータ調整実行モジュール418は、メタデータ管理要素316に“RELEASE”コマンドを送信して、図5のメタデータテーブル406で解放されたエントリを不使用スペースにセットして他のデータオブジェクトに使用できるようにする。
0142 本発明の異なった実施例として、ステップ1415と1416を実行する代わりに、メタデータ調整実行モジュール418は特別な“WRITE”コマンドを発行して、メタデータ管理要素316が識別領域の隣接領域も含めてスペースを検出するように依頼することも出来る。このことは、メタデータ管理要素316が、必ずしも正確なストレージコストでなくとも、欄987での適正なストレージコストに対して適切な範囲にあるスペースを検出することを意味する。
0143 更に他の実施例として、現ストレージIDとステップ1412で比較した新ストレージIDが等しい場合には、メタデータ調整実行モジュール418は、バッファーに読み込む代わりに、当該ストレージデバイスに対して、単にデータオブジェクトを当該ストレージデバイス内の適切なアドレスに移動するように要求しても良い。
0144 本発明の方法は、RAINアーキテクチュアの如き、異なった階層型ストレージ管理装置の実施例を用いて実行することが出来る。
0145 図13は本発明の第二実施例に従う、階層型データ管理装置のブロックダイアグラムを示す。
0146 図13に示す階層型データ管理装置1300は、複数のアプリケーションサーバ1302、ネットワーク1308、及びネットワークとデータフロー1310にて互いに結合した複数のストレージシステムより成る。
0147 ネットワーク内の複数のアプリケーションサーバ1302は、アプリケーションプログラム要素1304とデータアクセスクライアント要素1306を有する。複数のストレージシステムは、オンラインストレージシステム1312、ニアラインストレージシステム1322、及びオフラインストレージシステム1332等の異なったタイプのストレージシステムから成る。オンラインストレージシステム1312は、メタデータ管理ユニット1314、データ価値管理ユニット1316、階層型ストレージ管理ユニット1318、及びオンラインストレージデバイス1320を有する。ニアラインストレージシステム1322は、メタデータ管理ユニット1324、データ価値管理ユニット1326、階層型ストレージ管理ユニット1328、及びニアラインストレージデバイス1330を有する。オフラインストレージシステム1332は、メタデータ管理ユニット1334、データ価値管理ユニット1336、階層型ストレージ管理ユニット1338、及びオフラインストレージデバイス1340を有する。複数のアプリケーションサーバ1302と複数のストレージデバイスは、ネットワーク1308にコマンドフロー線を使用して結合する。これらの線は、ストレージデバイス間の概念的データフロ−を表す図13のデータフロー線1310にて示す。実際のデータフローはネットワーク1308を通して実行される。
0148 図3で示した階層型ストレージ管理装置と図13での装置の間の主要な相違は、図13の場合、オンライン、ニアライン又はオフラインの各ストレージシステムは、メタデータ管理ユニット、データ価値管理ユニット、階層型ストレージ管理ユニットを内部的に持ち、図3のようなSAN(Storage Area Network)又はNAS(Network Attached Storage)を通して、分離したメタデータサーバ304と外部的にデータ交信を行う必要がないことである。
0149 メタデータ管理ユニット(1314、1324、1334)は自らのストレージシステム内のデータのメタデータを管理する。ストレージシステム内のメタデータ管理ユニットがユーザ/クライアントから要求されたデータオブジェクトを自システム内で検出できない場合には、この要求をこのデータオブジェクトを持ち得る他のストレージシステムに転送する。
0150 データ価値管理ユニット(1316、1326、1336)は、自システム内に含まれるデータオブジェクトのデータ価値を管理する。データ価値の計算方法は、本発明の第一実施例と同様でデータアクセスレコードをベースとする。
0151 階層型ストレージ管理ユニット(1318、1328、1338)は、各データ価値を正規化し、本発明の第一実施例で使用したのと同じ方法を用いて、適正なストレージコストを割り当てる。階層型ストレージ管理ユニットは、各ストレージデバイス内で管理すべきストレージコストの範囲を知っている。もし適正なストレージコストが自システム内に入っておれば、階層型ストレージ管理ユニットは、第一実施例で述べたのと同様な方法を用いて、メタデータを調整する。そうでなければ、階層型ストレージ管理ユニットは、ストレージコストをカバーし得る他のストレージシステムにこのデータオブジェクトを移動し、保存するように依頼する。
0152 本発明の第二実施例のユニークな特徴は、メタデータ管理ユニットがどのデータオブジェクト(DOID)を各子ノードが持っているかを問い合わせるのみならず、各子ノードがどのストレージコストをカバーするかを問い合わせることである。
0153 本発明はストレージネットワークの範囲に限定されるものでない。当業者なら、ここでの記述に基づき本発明は他の環境でも実施できることを悟るであろう。
0154 更に、本発明の多様な実施例を記述したが、それらの記述は例示として提示したもので、これに限定するのではないことを理解願いたい。当業者には、様式や詳細に亘る多様な変更が、本発明の精神や範囲を逸脱することなく適用可能なことは明らかであろう。
0155 加えて、本発明は機能的ブロックや互いの関係を用いて記述してきた。これら機能的構成ブロックの境界や方法ステップは記述の便宜により、任意に定義してきた。指定された機能や互いの関係が適切に維持される限り、境界を変えることは可能である。そのような如何なる境界の変更も本発明でクレームされる範囲と精神に含まれる。当業者は、これらの機能ブロックは、図12と図13に関連して説明したように、ディスクリートコンポーネント、アプリケーションに指向した集積回路(ASIC)、適切なソフトウェアを実行するプロセッサ等、又はこれらの組み合わせで実現できることを認識するであろう。かくして、本発明の生命と範囲は、これまで事例的に述べたことに制限されることなく、後続する請求項及びそれと均等のものに従ってのみ定義されなければならない。
図1はDLCM(Data Life Cycle Management)情報で構成されるグラフを示す。 図2はOSD(Object based Storage Device)アーキテクチュアの一般的事例を示す。 図3は本発明の第一実施例に従う、OSDアーキテクチュアの一例を示す。 図4は図3で示した本発明の実施例に従う階層型データ管理フローの為の詳細ブロックダイアグラムを示す。 図5はメタデータテーブルの一例を示す。 図6はデータ価値テーブルの一例を示す。 図7はユーザ利益テーブルの一例を示す。 図8はストレージ特性テーブルの一例を示す。 図9は結合テーブルの一例を示す。 図10は図3でのデータ価値管理要素がデータ価値テーブルに新エントリを追加する為のフローチャートを示す。 図11はデータ価値計算の為のフローチャートを示す。 図12は図4での階層型ストレージ管理要素が実行するメタデータ調整計画の処理を示す。 図13は本発明の第二実施例に従う、階層型データ管理装置のブロックダイアグラムを示す。 図14はメタデータ調整の為のフローチャートを示す。
符号の説明
10 タイプ
11 時間
12 技術
202 アプリケーションサーバ
204 メタデータサーバ
206 ストレージデバイス
208 SAN
210 LAN
212 アプリケーションプログラム
214 データアクセスクライアント
216 メタデータ管理

Claims (20)

  1. 複数のアプリケーションサーバと、
    LAN(ローカルエリアネットワーク)を通して前記複数のアプリケーションサーバに結合するメタデータサーバと、
    複数のデータフローパスにより結合され、それぞれ前記アプリケーションサーバからの要求に応じてデータオブジェクトを記憶する複数のストレージデバイスと、
    前記複数のストレージデバイスを前記複数のアプリケーションサーバと前記メタサーバに結合するストレージネットワークと、
    備える階層型ストレージデータ管理システムであって、
    前記メタデータサーバは、
    前記ストレージデバイスに格納された各前記データオブジェクトの格納位置を管理するメタデータ管理要素と、前記ストレージデバイスに格納された各前記データオブジェクトに価値を割り当てるデータ価値管理要素と、階層型ストレージ管理要素と、を有し、
    前記データ価値管理要素は、
    前記メタデータ管理要素から前記データオブジェクトに対する複数のユーザ利益表示を受信する手段と、前記複数のユーザ利益表示を解析する手段と、各データオブジェクトのユーザ利益レベルを決定する手段と、前記ユーザ利益レベルに対応して前記各データオブジェクトにデータ価値を割り当てる手段と、を備え、
    前記ユーザ利益表示は、
    前記データオブジェクトから抽出したインデックス、書誌情報、及び用語の少なくとも一つと、前記データオブジェクトが保存されてから削除されるまでの寿命に関して該データオブジェクトに割り当てられた寿命値でなるデータ価値と、を含み、
    前記階層型ストレージ管理要素は、
    前記メタデータ管理要素から複数のストレージ領域に対する複数のストレージコスト表示を受信する手段と、前記複数のストレージコスト表示を解析する手段と、前記ストレージ領域に対してストレージコストレベルを決定する手段と、前記ストレージコストレベルに対応して前記ストレージ領域にストレージコスト値を割り当てる手段と、を備え、
    前記ストレージコスト表示は、前記ストレージ領域の平均性能と信頼性とを含み、
    前記メタデータサーバは、
    前記データ価値の区分を前記ストレージコスト値の区分と同一に設定することによって、前記データ価値管理要素で計算された複数のデータオブジェクトのデータ価値と、前記階層型ストレージ管理要素により割り当てられた前記ストレージデバイス内の複数のストレージ領域のストレージコスト値を正規化すると共に、正規化済データ価値を正規化済ストレージコスト値と比較して、前記データオブジェクトを別のストレージ領域に再配置するかどうかを決定し、データオブジェクトを、該データオブジェクトのデータ価値と等しいストレージコスト値を持つストレージ領域に再配置する
    ことを特徴とする階層型ストレージデータ管理システム。
  2. 前記複数のストレージデバイスは、
    複数のオンラインストレージデバテイスと、
    前記オンラインストレージデバイスよりも性能が低い複数のニアラインストレージデバイスと、
    前記ニアラインストレージデバイスよりも性能が低い複数のオフラインストレージデバイスと、
    の少なくとも一つからなる
    ことを特徴とする請求項1の階層型ストレージデータ管理システム。
  3. 前記アプリケーションサーバは、
    前記LANを通して相互結合し、前記ストレージネットワークを通して前記ストレージデバイスにアクセスし、
    前記ストレージネットワークと前記ストレージデバイスの各々との間にリンクが形成された
    ことを特徴とする請求項1の階層型ストレージデータ管理システム。
  4. 前記各ストレージデバイスは、
    他のストレージデバイスに直接アクセスするリンクを有し、自らのメタデータを管理し、更に要求されたデータオブジェクトが自らのシステムに不在の場合には他のストレージデバイスに要求を転送する
    ことを特徴とする請求項1の階層型ストレージデータ管理システム。
  5. 前記ユーザ利益表示は、
    前記データオブジェクトへのユーザのアクセスレコードでなる
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  6. 前記ユーザのアクセスレコードは、
    事前指定の期間内でのアクセス回数、又は前記データオブジェクトが保存されてから削除されるまでの寿命である
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  7. 前記ユーザのアクセスレコードは、複数のコマンドタイプで分類され、
    前記データ価値は、前記コマンドタイプの幾つか又は全ての前記ユーザのアクセスレコードの合計である
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  8. 前記アクセス回数は、アクセス頻度で重み付けする
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  9. 前記書誌情報は、
    著者、題目、キーワード、及び製作日を含む
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  10. 前記メタデータ管理要素は、
    前記データ価値管理要素からの前記データアクセスレコードに対する要求に答える為のインターフェースを持つ
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  11. 前記ストレージコスト値は、
    前記ストレージ領域がオンラインストレージデバイス、ニアラインストレージデバイス、オフラインストレージデバイスの何れに存在するかに従って、高から低まで変化する
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  12. 前記メタデータサーバは、
    前記データ価値の最大値を前記ストレージコスト値の最大値として使用し、これに従って他のストレージコスト値を調整する
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  13. 前記メタデータサーバは、
    前記ストレージコスト値の最大値をデータ価値の最大値として使用し、これに従って他のデータ価値を調整する
    ことを特徴とする請求項の階層型ストレージデータ管理システム。
  14. 複数のアプリケーションサーバと、
    LAN(ローカルエリアネットワーク)を通して前記複数のアプリケーションサーバに結合するメタデータサーバと、
    複数のデータフローパスにより結合され、それぞれ前記アプリケーションサーバからの要求に応じてデータオブジェクトを記憶する複数のストレージデバイスと、
    前記複数のストレージデバイスを前記複数のアプリケーションサーバと前記メタサーバに結合するストレージネットワークと、
    を備える階層型ストレージデータ管理システムによるストレージデータ管理方法であって、
    複数のデータオブジェクトとストレージネットワークで結合したストレージデバイス内の複数のストレージ領域をユーザに提示する第1のステップと、
    前記各データオブジェクトから抽出したインデックス、書誌情報、及び用語の少なくとも一つと前記データオブジェクトが保存されてから削除されるまでの寿命に関して該データオブジェクトに割り当てられた寿命値とを含み複数のユーザ利益表示を収集する収集ステップ、前記複数のユーザ利益表示を解析する解析ステップ、前記データオブジェクトに対してユーザ利益レベルを決定する決定ステップ、及び前記ユーザ利益レベルに対応して前記各データオブジェクトにデータ価値を割り当てる割当てステップを有し、各前記データオブジェクトに対してデータ価値を計算する第2のステップと、
    各ストレージ領域の平均性能と信頼性のデータを収集して複数のストレージコスト表示するステップ、前記複数のストレージコスト表示を解析するステップ、前記各ストレージ領域のストレージコストレベルを決定するステップ、及び前記ストレージコストレベルに対応させて事前指定の期間内でのアクセス回数又は前記各データオブジェクトが保存されてから削除されるまでの寿命を加算して前記各ストレージ領域にストレージコスト値を割り当てる第3のステップと、
    計算されたデータ価値と割り当てられたストレージコスト値を同一の値区分を持つように正規化する第4のステップと、
    正規化済データ価値を正規化済ストレージコスト値と比較して、前記データオブジェクトを別のストレージ領域に再配置すべきかどうかを決定する第5のステップと、
    データオブジェクトを、該データオブジェクトのデータ価値と等しいストレージコスト値を持つストレージ領域に再配置する第6のステップと、
    を備えることを特徴とする階層型ストレージデータ管理方法。
  15. 前記各データオブジェクトに対するアクセスは、複数のアクセス用コマンドタイプよりなり、
    前記各データ価値は、前記コマンドタイプの幾つか又は全ての前記アクセス回数の合計である
    ことを特徴とする請求項14の階層型ストレージデータ管理方法。
  16. 前記アクセス回数をアクセス頻度で重み付けする
    ことを特徴とする請求項15の階層型ストレージデータ管理方法。
  17. 前記書誌情報は、
    著者、題目、キーワード、及び製作日でなる
    ことを特徴とする請求項14の階層型ストレージデータ管理方法。
  18. 前記割当てステップは、
    前記各ストレージ領域がオンラインストレージデバイス、ニアラインストレージデバイス、オフラインストレージデバイスの何れに存在するかに従って、ストレージコスト値を高から低に変化させる
    ことを特徴とする請求項14の階層型ストレージデータ管理方法。
  19. 前記第4のステップは、
    前記データ価値の最大値を前記ストレージコスト値の最大値として使用し、これに従って他のストレージコスト値を調整するステップでなる
    ことを特徴とする請求項14の階層型ストレージデータ管理方法。
  20. 前記第4のステップは、
    前記ストレージコストの最大値を前記データ価値の最大値として使用し、これに従って他のデータ価値を調整するステップでなる
    ことを特徴とする請求項14の階層型ストレージデータ管理方法。
JP2005037054A 2004-07-15 2005-02-15 データ価値に基づく階層型ストレージ管理の為の方法と装置 Expired - Fee Related JP4648723B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/891,511 US7177883B2 (en) 2004-07-15 2004-07-15 Method and apparatus for hierarchical storage management based on data value and user interest

Publications (3)

Publication Number Publication Date
JP2006031668A JP2006031668A (ja) 2006-02-02
JP2006031668A5 JP2006031668A5 (ja) 2008-02-14
JP4648723B2 true JP4648723B2 (ja) 2011-03-09

Family

ID=35600700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005037054A Expired - Fee Related JP4648723B2 (ja) 2004-07-15 2005-02-15 データ価値に基づく階層型ストレージ管理の為の方法と装置

Country Status (2)

Country Link
US (2) US7177883B2 (ja)
JP (1) JP4648723B2 (ja)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885974B2 (en) * 2002-11-18 2011-02-08 Aol Inc. Method and apparatus providing omnibus view of online and offline content of various file types and sources
JP4179262B2 (ja) * 2004-10-06 2008-11-12 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7853562B2 (en) * 2004-11-02 2010-12-14 Sap Ag System and method for obtaining information from a data management system
US20060100982A1 (en) * 2004-11-08 2006-05-11 International Business Machines Corporation Storage configuration loader with automatic error recovery
US20060206507A1 (en) * 2005-02-16 2006-09-14 Dahbour Ziyad M Hierarchal data management
JP4688556B2 (ja) * 2005-04-22 2011-05-25 株式会社日立製作所 ボリュームマイグレーションシステム、ボリューム再配置方法及びプログラム
JP4554441B2 (ja) * 2005-06-06 2010-09-29 富士通株式会社 磁気ディスク装置、その予防保守検出方法及び予防保守検出プログラム
GB0514529D0 (en) * 2005-07-15 2005-08-24 Ibm Virtualisation engine and method, system, and computer program product for managing the storage of data
US8799293B2 (en) * 2005-10-13 2014-08-05 Sap Aktiengeselleschaft System and method for efficient storage destination determination in a storage facility
US20070136423A1 (en) * 2005-11-23 2007-06-14 Gilmore Alan R Methods, systems, and media for managing a collaboration space
US7752437B1 (en) 2006-01-19 2010-07-06 Sprint Communications Company L.P. Classification of data in data flows in a data storage infrastructure for a communication network
US7895295B1 (en) 2006-01-19 2011-02-22 Sprint Communications Company L.P. Scoring data flow characteristics to assign data flows to storage systems in a data storage infrastructure for a communication network
US7788302B1 (en) 2006-01-19 2010-08-31 Sprint Communications Company L.P. Interactive display of a data storage infrastructure for a communication network
US7801973B1 (en) 2006-01-19 2010-09-21 Sprint Communications Company L.P. Classification of information in data flows in a data storage infrastructure for a communication network
US7480734B1 (en) * 2006-01-19 2009-01-20 Sprint Communications Company L.P. Class of service analysis for data flows in a data storage infrastructure for a communication network
US7797395B1 (en) 2006-01-19 2010-09-14 Sprint Communications Company L.P. Assignment of data flows to storage systems in a data storage infrastructure for a communication network
US8510429B1 (en) 2006-01-19 2013-08-13 Sprint Communications Company L.P. Inventory modeling in a data storage infrastructure for a communication network
US8229897B2 (en) * 2006-02-03 2012-07-24 International Business Machines Corporation Restoring a file to its proper storage tier in an information lifecycle management environment
JP4856467B2 (ja) 2006-05-01 2012-01-18 株式会社日立製作所 ストレージ資源管理システム、ストレージ資源管理方法および管理計算機
US7870102B2 (en) * 2006-07-12 2011-01-11 International Business Machines Corporation Apparatus and method to store and manage information and meta data
US7710884B2 (en) * 2006-09-01 2010-05-04 International Business Machines Corporation Methods and system for dynamic reallocation of data processing resources for efficient processing of sensor data in a distributed network
JP2008112291A (ja) * 2006-10-30 2008-05-15 Hitachi Ltd 記憶制御装置及び記憶制御装置のデータ移動方法
US20080313364A1 (en) 2006-12-06 2008-12-18 David Flynn Apparatus, system, and method for remote direct memory access to a solid-state storage device
US7552131B2 (en) * 2007-03-05 2009-06-23 International Business Machines Corporation Autonomic retention classes
EP1988473B1 (en) * 2007-05-04 2012-02-08 Helge Hofmeister A server with a core using a virtual file system and a method for securely redirecting a persistent storage device operation to a middleware infrastructure
WO2009045218A1 (en) 2007-10-04 2009-04-09 Donovan John J A video surveillance, storage, and alerting system having network management, hierarchical data storage, video tip processing, and vehicle plate analysis
FR2931968B1 (fr) * 2008-06-02 2012-11-30 Alcatel Lucent Procede et equipement de stockage de donnees en ligne
US8046385B2 (en) * 2008-06-20 2011-10-25 Ab Initio Technology Llc Data quality tracking
WO2010065623A1 (en) 2008-12-02 2010-06-10 Ab Initio Software Llc Visualizing relationships between data elements and graphical representations of data element attributes
US20100217977A1 (en) * 2009-02-23 2010-08-26 William Preston Goodwill Systems and methods of security for an object based storage device
US8874628B1 (en) * 2009-10-15 2014-10-28 Symantec Corporation Systems and methods for projecting hierarchical storage management functions
US8566290B2 (en) * 2009-10-30 2013-10-22 Hitachi Data Systems Corporation Fixed content storage within a partitioned content platform using namespaces, with versioning
CN102053982B (zh) * 2009-11-02 2017-03-01 阿里巴巴集团控股有限公司 一种数据库信息管理方法和设备
US8938479B1 (en) * 2010-04-01 2015-01-20 Symantec Corporation Systems and methods for dynamically selecting a logical location for an index
US9235588B1 (en) * 2010-12-29 2016-01-12 Symantec Corporation Systems and methods for protecting deduplicated data
US9767098B2 (en) 2012-08-08 2017-09-19 Amazon Technologies, Inc. Archival data storage system
US9563681B1 (en) 2012-08-08 2017-02-07 Amazon Technologies, Inc. Archival data flow management
CN103299265B (zh) * 2011-03-25 2016-05-18 株式会社日立制作所 存储系统和存储区域分配方法
US8589336B1 (en) * 2011-04-25 2013-11-19 Netapp, Inc. Framework for automated storage processes and flexible workflow
US9396290B2 (en) * 2011-06-09 2016-07-19 Cloudian Holdings, Inc. Hybrid data management system and method for managing large, varying datasets
CN103890763B (zh) * 2011-10-26 2017-09-12 国际商业机器公司 信息处理装置、数据存取方法以及计算机可读存储介质
CN103548004B (zh) * 2011-12-28 2016-03-30 华为技术有限公司 在文件系统中实现多级存储的方法和装置
US8930375B2 (en) * 2012-03-02 2015-01-06 Cleversafe, Inc. Splitting an index node of a hierarchical dispersed storage index
US9652487B1 (en) 2012-08-08 2017-05-16 Amazon Technologies, Inc. Programmable checksum calculations on data storage devices
US10120579B1 (en) 2012-08-08 2018-11-06 Amazon Technologies, Inc. Data storage management for sequentially written media
US8805793B2 (en) 2012-08-08 2014-08-12 Amazon Technologies, Inc. Data storage integrity validation
US9904788B2 (en) 2012-08-08 2018-02-27 Amazon Technologies, Inc. Redundant key management
US9830111B1 (en) 2012-08-08 2017-11-28 Amazon Technologies, Inc. Data storage space management
US8959067B1 (en) 2012-08-08 2015-02-17 Amazon Technologies, Inc. Data storage inventory indexing
US9225675B2 (en) 2012-08-08 2015-12-29 Amazon Technologies, Inc. Data storage application programming interface
US9779035B1 (en) 2012-08-08 2017-10-03 Amazon Technologies, Inc. Log-based data storage on sequentially written media
US8903784B2 (en) * 2012-08-24 2014-12-02 The Boeing Company Data retention management
US9559862B1 (en) * 2012-09-07 2017-01-31 Veritas Technologies Llc Determining connectivity of various elements of distributed storage systems
CN102929798B (zh) * 2012-09-21 2016-07-13 曙光信息产业(北京)有限公司 存储介质的层次组织结构
US9852153B2 (en) 2012-09-28 2017-12-26 Ab Initio Technology Llc Graphically representing programming attributes
WO2014087518A1 (ja) * 2012-12-06 2014-06-12 株式会社 日立製作所 ネットワークシステム及びその運用方法
US9116603B2 (en) 2012-12-26 2015-08-25 Ab Initio Technology Llc Managing interactions with data having membership in multiple groupings
US20140229654A1 (en) * 2013-02-08 2014-08-14 Seagate Technology Llc Garbage Collection with Demotion of Valid Data to a Lower Memory Tier
US10558581B1 (en) * 2013-02-19 2020-02-11 Amazon Technologies, Inc. Systems and techniques for data recovery in a keymapless data storage system
CN103218404B (zh) * 2013-03-20 2015-11-18 华中科技大学 一种基于关联特性的多维元数据管理方法和系统
US9971796B2 (en) 2013-04-25 2018-05-15 Amazon Technologies, Inc. Object storage using multiple dimensions of object information
US10078683B2 (en) 2013-07-02 2018-09-18 Jpmorgan Chase Bank, N.A. Big data centralized intelligence system
CN103369308B (zh) * 2013-07-10 2017-04-19 浙江宇视科技有限公司 一种osd叠加管理、执行方法及装置
US20150032839A1 (en) * 2013-07-26 2015-01-29 Netapp, Inc. Systems and methods for managing storage network devices
US9471250B2 (en) 2013-09-04 2016-10-18 International Business Machines Corporation Intermittent sampling of storage access frequency
US9336294B2 (en) * 2013-09-04 2016-05-10 International Business Machines Corporation Autonomically defining hot storage and heavy workloads
US9589024B2 (en) * 2013-09-27 2017-03-07 Intel Corporation Mechanism for facilitating dynamic and proactive data management for computing devices
JP6291937B2 (ja) * 2014-03-19 2018-03-14 日本電気株式会社 ブロックストレージ、ストレージシステム、コンピュータシステム、ブロックストレージ制御方法、ストレージシステム制御方法およびプログラム
US9870382B2 (en) * 2014-03-25 2018-01-16 Sap Se Data encoding and corresponding data structure
GB2527296A (en) 2014-06-16 2015-12-23 Ibm A method for restoring data in a HSM system
US9509773B2 (en) * 2014-09-10 2016-11-29 Futurewei Technologies, Inc. Array-based computations on a storage device
US9672248B2 (en) 2014-10-08 2017-06-06 International Business Machines Corporation Embracing and exploiting data skew during a join or groupby
US9922064B2 (en) 2015-03-20 2018-03-20 International Business Machines Corporation Parallel build of non-partitioned join hash tables and non-enforced N:1 join hash tables
US10650011B2 (en) * 2015-03-20 2020-05-12 International Business Machines Corporation Efficient performance of insert and point query operations in a column store
US10303791B2 (en) 2015-03-20 2019-05-28 International Business Machines Corporation Efficient join on dynamically compressed inner for improved fit into cache hierarchy
US10108653B2 (en) 2015-03-27 2018-10-23 International Business Machines Corporation Concurrent reads and inserts into a data structure without latching or waiting by readers
US10831736B2 (en) 2015-03-27 2020-11-10 International Business Machines Corporation Fast multi-tier indexing supporting dynamic update
US20170024140A1 (en) * 2015-07-20 2017-01-26 Samsung Electronics Co., Ltd. Storage system and method for metadata management in non-volatile memory
JP6582721B2 (ja) 2015-08-19 2019-10-02 富士通株式会社 制御装置、ストレージシステム、及び制御プログラム
US11386060B1 (en) 2015-09-23 2022-07-12 Amazon Technologies, Inc. Techniques for verifiably processing data in distributed computing systems
CN105653591B (zh) * 2015-12-22 2019-02-05 浙江中控研究院有限公司 一种工业实时数据分级存储及迁移方法
CN110023925A (zh) 2016-12-01 2019-07-16 起元技术有限责任公司 生成、访问和显示沿袭元数据
CN106709045B (zh) * 2016-12-29 2020-09-15 北京同有飞骥科技股份有限公司 分布式文件系统中节点选择方法及装置
CN108347466A (zh) * 2017-01-24 2018-07-31 全球能源互联网研究院 一种云存储系统的数据存储方法和装置
CN106940725B (zh) * 2017-03-21 2019-12-27 深圳微众税银信息服务有限公司 一种征信数据存储调度方法及系统
WO2018218672A1 (zh) * 2017-06-02 2018-12-06 深圳齐心集团股份有限公司 一种文具大数据分布式存储系统
US10705767B2 (en) * 2017-07-20 2020-07-07 International Business Machines Corporation Optimizing user satisfaction when training a cognitive hierarchical storage-management system
CN108052655B (zh) * 2017-12-28 2020-11-10 新华三技术有限公司 数据写入及读取方法
US10908940B1 (en) 2018-02-26 2021-02-02 Amazon Technologies, Inc. Dynamically managed virtual server system
KR102549346B1 (ko) * 2018-07-24 2023-06-28 삼성전자주식회사 솔리드 스테이트 드라이브 및 그의 메타 데이터 액세스 방법
CN112506435B (zh) * 2020-12-12 2024-04-02 南京地铁建设有限责任公司 一种应用于自动扶梯的数据分级存储方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01177673A (ja) * 1988-01-08 1989-07-13 Nec Corp 文書ファイル方式
JPH09297699A (ja) * 1996-04-30 1997-11-18 Hitachi Ltd 階層記憶装置および階層記憶ファイル管理方法
JP2000112938A (ja) * 1998-10-08 2000-04-21 Canon Inc 自然言語処理装置及びその方法、及び自然言語認識装置
WO2003021441A1 (en) * 2001-08-31 2003-03-13 Arkivio, Inc. Techniques for storing data based upon storage policies
JP2003316774A (ja) * 2002-04-19 2003-11-07 Ricoh Co Ltd 文書管理システム、文書蓄積方法及びこの方法を実行するプログラム
JP2003345631A (ja) * 2002-05-28 2003-12-05 Hitachi Ltd 計算機システム及び記憶領域の割当方法
JP2004514968A (ja) * 2000-11-06 2004-05-20 アヴァマー テクノロジーズ インコーポレイテッド 共通デジタルシーケンスを識別するシステム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4430701A (en) * 1981-08-03 1984-02-07 International Business Machines Corporation Method and apparatus for a hierarchical paging storage system
US5537585A (en) 1994-02-25 1996-07-16 Avail Systems Corporation Data storage management for network interconnected processors
KR100380878B1 (ko) * 1994-04-25 2003-08-02 소니 가부시끼 가이샤 데이터저장처리장치
US5557790A (en) * 1994-06-21 1996-09-17 International Business Machines Corp. Facility for the generic storage and management of multimedia objects
US6080150A (en) * 1995-08-15 2000-06-27 Rita Medical Systems, Inc. Cell necrosis apparatus
US6181336B1 (en) * 1996-05-31 2001-01-30 Silicon Graphics, Inc. Database-independent, scalable, object-oriented architecture and API for managing digital multimedia assets
US5881311A (en) * 1996-06-05 1999-03-09 Fastor Technologies, Inc. Data storage subsystem with block based data management
JP3592842B2 (ja) * 1996-07-08 2004-11-24 帝人ファイバー株式会社 ポリエステル系弾性繊維及びそれからなる伸縮性湿式不織布
US5847708A (en) * 1996-09-25 1998-12-08 Ricoh Corporation Method and apparatus for sorting information
US6032224A (en) * 1996-12-03 2000-02-29 Emc Corporation Hierarchical performance system for managing a plurality of storage units with different access speeds
US6311252B1 (en) * 1997-06-30 2001-10-30 Emc Corporation Method and apparatus for moving data between storage levels of a hierarchically arranged data storage system
WO2000004483A2 (en) * 1998-07-15 2000-01-27 Imation Corp. Hierarchical data storage management
EP1238335A1 (en) * 1999-12-07 2002-09-11 Data Foundation, Inc. Scalable storage architecture
US6804719B1 (en) * 2000-08-24 2004-10-12 Microsoft Corporation Method and system for relocating files that are partially stored in remote storage
US20020065910A1 (en) * 2000-11-30 2002-05-30 Rabindranath Dutta Method, system, and program for providing access time information when displaying network addresses
US6976060B2 (en) * 2000-12-05 2005-12-13 Agami Sytems, Inc. Symmetric shared file storage system
DE60128200T2 (de) * 2000-12-15 2008-01-24 International Business Machines Corp. Methode und System für skalierbare, hochperformante hierarchische Speicherverwaltung
US7165096B2 (en) * 2000-12-22 2007-01-16 Data Plow, Inc. Storage area network file system
US6925515B2 (en) * 2001-05-07 2005-08-02 International Business Machines Corporation Producer/consumer locking system for efficient replication of file data
US6832248B1 (en) * 2001-05-10 2004-12-14 Agami Systems, Inc. System and method for managing usage quotas
US6950833B2 (en) * 2001-06-05 2005-09-27 Silicon Graphics, Inc. Clustered filesystem
US20040039891A1 (en) 2001-08-31 2004-02-26 Arkivio, Inc. Optimizing storage capacity utilization based upon data storage costs
JP2003162439A (ja) 2001-11-22 2003-06-06 Hitachi Ltd ストレージシステム及びその制御方法
JP2003216460A (ja) 2002-01-21 2003-07-31 Hitachi Ltd 階層ストレージ装置及びその制御装置
US7007191B2 (en) * 2002-08-23 2006-02-28 Lsi Logic Corporation Method and apparatus for identifying one or more devices having faults in a communication loop
EP1560968A4 (en) * 2002-10-22 2008-12-03 Polymer Group Inc NONWOVENS AS CARPET BACK
US7412433B2 (en) 2002-11-19 2008-08-12 International Business Machines Corporation Hierarchical storage management using dynamic tables of contents and sets of tables of contents

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01177673A (ja) * 1988-01-08 1989-07-13 Nec Corp 文書ファイル方式
JPH09297699A (ja) * 1996-04-30 1997-11-18 Hitachi Ltd 階層記憶装置および階層記憶ファイル管理方法
JP2000112938A (ja) * 1998-10-08 2000-04-21 Canon Inc 自然言語処理装置及びその方法、及び自然言語認識装置
JP2004514968A (ja) * 2000-11-06 2004-05-20 アヴァマー テクノロジーズ インコーポレイテッド 共通デジタルシーケンスを識別するシステム
WO2003021441A1 (en) * 2001-08-31 2003-03-13 Arkivio, Inc. Techniques for storing data based upon storage policies
JP2005502121A (ja) * 2001-08-31 2005-01-20 アルキヴィオ・インコーポレーテッド 記憶ポリシに基づいてデータを記憶する技法
JP2003316774A (ja) * 2002-04-19 2003-11-07 Ricoh Co Ltd 文書管理システム、文書蓄積方法及びこの方法を実行するプログラム
JP2003345631A (ja) * 2002-05-28 2003-12-05 Hitachi Ltd 計算機システム及び記憶領域の割当方法

Also Published As

Publication number Publication date
JP2006031668A (ja) 2006-02-02
US20070112875A1 (en) 2007-05-17
US7177883B2 (en) 2007-02-13
US20060015529A1 (en) 2006-01-19

Similar Documents

Publication Publication Date Title
JP4648723B2 (ja) データ価値に基づく階層型ストレージ管理の為の方法と装置
KR100974149B1 (ko) 네임스페이스에 대한 정보 유지 방법, 시스템 및 컴퓨터 판독가능 저장 매체
US11132336B2 (en) Filesystem hierarchical capacity quantity and aggregate metrics
US8095558B2 (en) System for logging and reporting access to content using unique content identifiers
CN101103355B (zh) 管理数据删除的方法和装置
US7899793B2 (en) Management of quality of services in storage systems
US7631151B2 (en) Systems and methods for classifying and transferring information in a storage network
US7685165B2 (en) Policy based resource management for legacy data
US7636736B1 (en) Method and apparatus for creating and using a policy-based access/change log
US20050246386A1 (en) Hierarchical storage management
US20060294164A1 (en) Methods and apparatus for managing the storage of content in a file system
JP2005267600A (ja) 長期データ保護システム及び方法
JP2016522484A (ja) オブジェクト情報の複数の次元を用いたオブジェクトストレージ
CN101443761A (zh) 对文件系统的支持qos的生命周期管理
CN102667772A (zh) 文件级分级存储管理系统、方法和设备
US20060294163A1 (en) Methods and apparatus for accessing content stored in a file system
CN111209259B (zh) Nas分布式文件系统及数据处理方法
US20060294115A1 (en) Methods and apparatus for storing content in a file system
JP5241298B2 (ja) 履歴上のファイル名およびロケーションをインデックス付きにすることによりファイル・サーチおよびファイル操作を支援するためのシステムおよび方法
US7660790B1 (en) Method and apparatus for utilizing a file change log
US20100023713A1 (en) Archive system and contents management method
US9135253B2 (en) Simulating accesses for archived content
KR20010039297A (ko) 그룹핑을 이용한 파일시스템에서의 데이터 저장방법
EP1894127B1 (en) Methods and apparatus for managing the storage of content in a file system
CN115718571B (zh) 一种基于多维度特征的数据管理方法和装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071227

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080131

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees