JP2005115438A - データ管理装置 - Google Patents

データ管理装置 Download PDF

Info

Publication number
JP2005115438A
JP2005115438A JP2003345324A JP2003345324A JP2005115438A JP 2005115438 A JP2005115438 A JP 2005115438A JP 2003345324 A JP2003345324 A JP 2003345324A JP 2003345324 A JP2003345324 A JP 2003345324A JP 2005115438 A JP2005115438 A JP 2005115438A
Authority
JP
Japan
Prior art keywords
data
directory information
directory
storage device
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003345324A
Other languages
English (en)
Inventor
Yohei Matsuura
陽平 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2003345324A priority Critical patent/JP2005115438A/ja
Priority to US10/910,304 priority patent/US20050080810A1/en
Publication of JP2005115438A publication Critical patent/JP2005115438A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms

Abstract

【課題】 分散ファイルシステム環境において、性能、信頼性、および可用性を向上させる。
【解決手段】 分散ファイルシステム管理サーバ2の負荷監視部21が、各ディスク4a〜4mの負荷状況を監視し、特定のディスクの負荷が所定レベルを超えた場合に、データ制御部23が、当該ディスクに記憶されているデータを他のディスクに移動させ、このデータ移動を反映させて、ディレクトリ情報データベース221のディレクトリ情報を更新し、いずれかのクライアントからディレクトリ情報の問い合わせがあった場合には、ディレクトリ通知部22が更新後のディレクトリ情報を当該クライアントに送信し、クライアント側のディレクトリ情報データベースのキャッシュ321を更新させる。
【選択図】 図1

Description

この発明は、ストレージネットワークに接続されているディスクにデータを分散させる、分散ファイルシステムに関するものである。
図30は例えば、特開2000―207370に示された従来の分散ファイルシステム管理装置及び分散ファイル管理システムであり、図において、102は計算機サイトA、103は計算機サイトBであり、それぞれネットワーク101に接続されている。各サイトにはサーバ計算機A105およびサーバ計算機B106があり、サブネットワーク131および、サブネットワーク132を介してネットワーク101に接続されている。サーバ計算機は、部分ファイル126aを記録する記憶装置115および部分ファイル126bを記録する記憶装置120と、ネットワークインターフェース113およびネットワークインターフェース118、部分ファイルの書き込みや読み出しを制御する部分ファイル管理部111および部分ファイル管理部116、分散ファイル管理部112および分散ファイル管理部117、状態管理部114および状態管理部119で構成されている。
次に動作について説明する。状態管理部114および119は各サイトのサーバ計算機の負荷を監視しており、それらの負荷情報に基づいて部分ファイルをどのサーバに配置するか決定する。この決定に従って、部分ファイル管理部と分散ファイル管理部はファイルを管理し、クライアント群からのアクセス負荷の集中を回避する。
特開2000−207370号公報
上記システムでは、部分ファイルと管理部が同一サーバ上に存在し、サーバに障害が発生した場合、そのサーバが保持していた部分ファイルに対し、クライアントからアクセスできないという問題点があった。
この発明は上記のような問題点を解決するためになされたもので、管理サーバとディスクを分離し、ストレージネットワークで接続することにより、性能向上、信頼性向上、および可用性向上を目的とする。
本発明に係るデータ管理装置は、
データを記憶する複数のデータ記憶装置と、いずれかのデータ記憶装置にアクセスしてデータの取得が可能な複数のデータ取得装置とに接続されたデータ管理装置であって、
いずれのデータがいずれのデータ記憶装置に記憶されているかを示すディレクトリ情報を格納するディレクトリ情報データベースと、
前記複数のデータ記憶装置の負荷状況を監視する負荷監視部と、
前記負荷監視部の監視結果を解析し、特定のデータ記憶装置の負荷状況が所定の条件に合致する場合に、当該データ記憶装置に記憶されているデータの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うデータ制御部と、
前記データ制御部によりデータ移動が行われたデータに関して特定のデータ取得装置からディレクトリ情報の問合せがあった場合に、更新後のディレクトリ情報のうち少なくとも当該データに関するディレクトリ情報を前記特定のデータ取得装置に対して送信するディレクトリ通知部とを有することを特徴とする。
以上のように、本発明は、データ管理装置が各データ記憶装置の負荷状況を監視し、特定のデータ記憶装置の負荷状況が所定の条件に合致する場合に、当該データ記憶装置のデータを適切な場所に移動させるとともに、データ移動を反映させてディレクトリ情報を更新し、また、所定の場合に更新後のディレクトリ情報をデータ取得装置に通知する。これにより、データ管理装置が障害で停止した場合も、データ取得装置は適切なデータ記憶装置にアクセスすることでき、所望のデータを取得することができ、信頼性、可用性等を向上させることができる。
実施の形態1.
図1は実施の形態1における分散ファイルシステムの構成図である。図において、1はストレージネットワーク、2は分散ファイルシステム管理サーバ、3a〜3nはクライアント群、4a〜4mはディスク群であり、ストレージネットワークに接続されている。ここで、分散ファイルシステム管理サーバ2はデータ管理装置の例に相当し、クライアント3a〜3nはデータ取得装置の例に相当し、ディスク4a〜mはデータ記憶装置の例に相当する。
また、分散ファイルシステム管理サーバ内には、ストレージネットワークの回線負荷、ディスクのアクセス負荷を監視する負荷監視部21、負荷の情報を格納する負荷情報データベース211、どのデータがどのディスクに格納されているかを示すディレクトリ情報を保存するディレクトリ情報データベース221、クライアントからデータの問い合わせがあったときに、データの場所を通知するディレクトリ通知部22、ディスク上のデータを移動するデータ制御部23がある。クライアントはディレクトリ情報データベース221のキャッシュ321a〜321nを持つ。
なお、分散ファイルシステム管理サーバ2は、図示していないが、例えばマイクロプロセッサ等のCPU、半導体メモリ等や磁気ディスク等の記録手段、及び通信手段を有する計算機により実現することができる。記録手段には、分散ファイルシステム管理サーバ2に含まれる各構成要素の機能を実現するプログラムが記録されており、CPUがこれらのプログラムを読み込むことにより分散ファイルシステム管理サーバ2の動作を制御し、各構成要素の機能を実現することができる。
次に動作について説明する。
まず負荷監視部21によりストレージネットワーク1、ディスク群4a〜4mの負荷状態がポーリングされ、定期的に負荷情報が負荷情報データベース211に蓄積される。データ制御部23は任意のディスクがある一定の負荷を超過した場合、ディスク上のデータを負荷の低い他のディスクに移動し、このデータ移動を反映させてディレクトリ情報データベース221のディレクトリ情報を更新する。他のディスクに移動させるデータは、負荷が超過しているディスクの全てのデータでもよいし、一部のデータでもよい。また、移動先のディスクも一つでもよいし、複数でもよい。
クライアント3a〜3nはキャッシュされたディレクトリ情報データベース321a〜321nを利用しデータへのアクセスを行うが、データ制御部により移動されたデータに関しては、分散ファイルシステム管理サーバ2内のディレクトリ情報データベースとクライアント内のディレクトリ情報データベース間で不整合が発生しており、正常にアクセスすることができない。この場合クライアントはディレクトリ通知部に問い合わせを行い、ディレクトリ通知部は更新後のディレクトリ情報のうち少なくとも問い合わせがあったデータに関するディレクトリ情報をクライアントに送信し、クライアントは更新後のディレクトリ情報を取得する。
以上のように、本実施の形態では、分散ファイルシステム管理サーバが各ディスクの負荷状況を監視し、特定のディスクの負荷が所定レベル以上の場合に、当該ディスクのデータを適切な場所に移動させるとともに、データ移動を反映させてディレクトリ情報を更新し、また、所定の場合に更新後のディレクトリ情報をクライアントに通知してクライアントのキャッシュを更新する。これにより、分散ファイルシステム管理サーバが障害で停止した場合も、クライアントは適切なディスクにアクセスすることでき、所望のデータを取得することができ、信頼性を向上させることができる。
実施の形態2.
以上の実施の形態1では、任意のディスク上のデータを移動することによって、負荷を分散させるようにしたものであるが、次にデータを分割し移動することによって、可用性を向上させる場合の実施の形態を示す。図2は、このような場合のデータ分割例である。システム構成は図1と同様である。
次に動作について説明する。図3は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部23は負荷情報データベース211を定期的に監視する(s1)。ここで、負荷監視部21は、各ディスクについて各ディスクに記憶されているデータごとに負荷状況を監視する。このため、データ制御部23は、任意のデータがある一定の負荷を超過した場合(s2)に、ディスク上のデータを事前に指定された個数に分割する(s3)(図2参照)。分割したデータを負荷の低い他のディスクに移動(s4)し、当該データ移動を反映させてディレクトリ情報データベース221のディレクトリ情報を更新する(s5)。ここで、分割された分割データのすべてを他のディスクに移動させてもよいし、一部の分割データを元のディスクに残し他の分割データを他のディスクに移動させてもよい。また、複数の分割データを同一のディスクに移動させてもよいし、複数の分割データをそれぞれ異なるディスクに移動させてもよい。
その後、実施の形態1と同様に、クライアントからディレクトリ情報の問い合わせがあった場合には、ディレクトリ通知部22が分割データに関するディレクトリ情報を通知してクライアント側のキャッシュを更新させる。
以上により、一つのデータに集中していたアクセス負荷を分散させることが可能となり、可用性を向上させることができる。
実施の形態3.
以上の実施の形態2では、データを事前の指定された個数に基づき分割したものであるが、次にデータ領域ごとのアクセス負荷に基づいてデータを分割し移動することによって、可用性を向上させる場合の実施の形態を示す。システム構成、およびフローチャートは図1および図3と同様である。
次に動作について説明する。図3のs3において、データを分割する際に、データ内のアクセス負荷が集中しているデータ領域を中心に分割を行う。つまり、本実施の形態においては、負荷監視部21は各ディスクについて各ディスクに記憶されているデータのデータ領域ごとに負荷状況を監視しており、このためデータ制御部23は特定のデータ領域に対する負荷が所定レベル以上の場合には、当該データ領域を任意数に分割する。ステップs4以降は、実施の形態2と同様なので説明を省略する。
以上により、一つのデータに集中していたアクセス負荷を柔軟に分散させることが可能となり、可用性を向上させることができる。
実施の形態4.
以上の実施の形態2、3では、データの分割に関するものであるが、次にデータのアクセス負荷が低下した場合に、連続したデータを結合することによって、可用性を向上させる場合の実施の形態を示す。
図4は、このような場合のデータ結合例である。システム構成は図1と同様である。
次に動作について説明する。図5は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部は負荷情報データベース211を定期的に監視しており(s6)、任意の連続した複数のデータに対する負荷が一定レベルに満たない場合(s7)、分散されたディスク上の連続したデータを結合する(s8)。結合したデータを負荷の低い他のディスクに移動(s9)し、当該結合データの移動を反映させてディレクトリ情報データベース221のディレクトリ情報を更新する(s10)。
以上により、負荷の低いデータを柔軟に結合させることが可能となり、可用性を向上させることができる。
実施の形態5.
以上の実施の形態では、分割または移動するデータを負荷の低いディスクに配置したものであるが、次にデータにサービスレベルを持たせ、このサービスレベルに基づいてデータを配置することによって、可用性を向上させる場合の実施の形態を示す。
データごとにサービスレベルを持たせたディレクトリ情報データベースの構成を図6に示す。図において、221a〜221pはディレクトリ情報に付加されたサービスレベル情報である。図7に各サービスレベル情報の例を示す。ここで、データのサービスレベルとは、データをクライアントにサービスする上で最低限遵守すべき規約をいう。たとえば、「データの信頼性は99.999%以上であること」といったものである。
次に動作について説明する。図8は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部は負荷情報データベース211を定期的に監視しており(s11)、任意のデータがある一定の負荷を超過した場合(s12)、データを実施の形態2または実施の形態3に示した手順にて分割する(s13)。ここで、本実施の形態では、一定の負荷レベルを超えるデータが複数あり、これら複数のデータのそれぞれが分割された場合を想定する。その後、複数のデータについてデータ移動を行う順序を決定するためにディレクトリ情報データベースに記述されたサービスレベル情報を参照し、複数のデータのそれぞれのサービスレベルに従ってデータ移動を行う順序を決定し、決定した順序に従ってそれぞれのデータの移動先のディスクを決定する(s14)。そして、決定した順序に従って、分割されたデータを決定したディスクに移動(s15)し、それぞれのデータの移動を反映させてディレクトリ情報データベース221のディレクトリ情報を更新する(s16)。
以上により、サービスレベルに基づきアクセスを柔軟に分散させることが可能となり、可用性を向上させることができる。
実施の形態6.
以上の実施の形態1〜3では、特定のディスクに負荷が集中している場合に、より負荷の少ない他のディスクにデータを移動させたが、本実施の形態では負荷以外の要素、具体的にはディスクの特性に基づいてデータを移動させる場合について説明する。図9は、本実施の形態に係る分散ファイルシステム管理サーバ2を示す。図において、データ制御部23はディスク性能データベース231を持つ。そして、ディスク性能データベース231は、各ディスクの性能(特性)を示すディスク性能情報が格納されている。図9の例では、各ディスクの性能としてアクセス速度が示されている。
次に動作について説明する。図10は本実施の形態に係る分散ファイルシステム管理サーバのうち、データ制御部23に関するフローチャートである。データ制御部は負荷情報データベース211を定期的に監視しており(s17)、任意のデータがある一定の負荷を超過した場合(s18)、データを実施の形態2または実施の形態3に示した手順にて分割する(s19)。その後、ディスク性能データベース231を参照し、各ディスクの性能に基づいてデータの移動先のディスクを決定する(s20)。例えば、アクセス速度が最もはやいディスクを移動先として決定する。その後、分割したデータを決定したディスクに移動(s21)し、当該データ移動を反映させて、ディレクトリ情報データベース221のディレクトリ情報を更新する(s22)。
以上により、ディスクの性能に基づき、アクセス負荷を柔軟に分散させることが可能となり、可用性を向上させることができる。
実施の形態7.
以上の実施の形態6では、ディスクの性能に基づいてデータの移動先となるディスクを決定していたが、次にディスクの残り容量に基づいてデータの移動先のディスクを決定することによって、可用性を向上させる場合の実施の形態を示す。
図11は、本実施の形態に係る分散ファイルシステム管理サーバ2を示す。図において、データ制御部23はディスク容量データベース232を持つ。ディスク容量データベース232には、各ディスクの空き容量を示すディスク容量情報が格納されている。
次に動作について説明する。なお、データ制御部23の動作は、ステップs20を除き図10のフローチャートと同様である。実施の形態6ではディスク性能データベースを参照してディスクの性能に基づき、データを配置するディスクを決定していたが(s20)、本実施の形態では、ディスク容量データベースを参照してディスクの空き容量に基づき、データを配置するディスクを決定する。例えば、空き容量が最も大きなディスクを移動先のディスクとして決定する。
以上により、ディスクの容量を考慮し、データを分散させることが可能となり、可用性を向上させることができる。
実施の形態8.
本実施の形態では、クライアントごとにサービスレベルを持たせ、このサービスレベルに基づいてデータを配置することによって、可用性を向上させる場合を説明する。ここで、クライアントごとのサービスレベルとは、該当するデータに対してクライアントが最低限実現しなければならない性能(例えば、データAに対して、クライアントaは1秒以内に読み込みが完了しなければならない等)である。
クライアントごとにサービスレベルを持たせたディレクトリ情報データベース構成を図12に示す。図において、222a〜222pはディレクトリ情報に付加されたサービスレベル情報である。図13に各サービスレベル情報の例を示す。図において、各サービスレベル情報は、クライアントごとのサービスレベルを保持する。
次に動作について説明する。なお、データ制御部23に関するフローチャートは図8と同様である。データ制御部は負荷情報データベース211を定期的に監視しており(s11)、任意のデータがある一定の負荷を超過した場合(s12)、データを実施の形態2または実施の形態3に示した手順にて分割する(s13)。その後、ディレクトリ情報データベースに記述されたサービスレベル情報を参照し、特定のクライアントのサービスレベルに基づき、データの移動先とするディスクとして、当該クライアントからネットワーク的に最適な場所のディスクを決定する(s14)。分割したデータを決定したディスクに移動(s15)し、ディレクトリ情報データベース221を更新する(s16)。
以上のデータ制御部23の動作の具体例として、例えば、ディレクトリ情報データベースに記述されたサービスレベル情報にクライアントからのネットワーク距離情報が格納されており、この情報を元にデータをディスクに配置する場合がある。例えば、“クライアントaに対してデータAはメトリック=2以内の場所におく必要がある”というサービスレベルが設定されている場合、データ制御部は図8のフローチャートのs14において、クライアントaからメトリック=2以内のディスクを探し、その中の任意の一つを決定する。実施の形態1〜3に示すようにより負荷が少ないディスクにデータを移動させる場合には、特定のクライアントから遠く離れたディスクに自動的に配置される場合が生じるが、本実施の形態では、クライアントのサービスレベルを考慮してデータの移動先となるディスクを決定するため、このような問題を防止することができる。
以上により、クライアントごとに最適な場所にデータを配置することが可能となり、可用性を向上させることができる。
実施の形態9.
以上の実施の形態6ではディスクの性能に基づいてデータの移動先のディスクを決定する場合について説明し、実施の形態7ではディスクの空き容量に基づいてデータの移動先のディスクを決定する場合について説明したが、本実施の形態では、これらを組み合わせることにより、データを配置するディスクを決定し、可用性を向上させる場合を説明する。
図14は、本実施の形態に係る分散ファイルシステム管理サーバ2を示す。図において、データ制御部23はディスク性能・容量データベース233を持つ。ディスク性能・容量データベース233にはディスクの性能(図ではアクセス速度)及びディスクの空き容量を示すディスク性能・容量情報が格納される。
次に動作について説明する。なお、データ制御部23の動作は、ステップs20を除き図10のフローチャートと同様である。データ制御部は負荷情報データベース211を定期的に監視しており(s17)、任意のデータがある一定の負荷を超過した場合(s18)、データを実施の形態2または実施の形態3に示す手順にて分割する(s19)。その後、ディスク性能・容量データベースを参照して、データを配置するディスクを決定する(s20)。分割したデータを決定したディスクに移動(s21)し、当該データ移動を反映させて、ディレクトリ情報データベース221のディレクトリ情報を更新する(s22)。
ここで、ステップs20の配置ディスクの決定処理の詳細を図15を参照して説明する。まず、ディスク性能(例えば、アクセス速度)が最も高いディスクを選出し(s201)、選出したディスクが配置するデータを容量的に十分格納可能かどうか確認する(s202)。格納可能であれば、このディスクをデータの移動先として確定する。格納不可能であればs201において選出したディスクを候補から除外し(s203)、再度s201の処理に戻る。このようにして、移動の対象となるデータを格納可能であって性能が最も高いディスクが移動先として選択される。
以上により、移動の対象となるデータを格納可能であって性能が最も高いディスクにデータを配置することが可能となり、可用性を向上させることができる。
実施の形態10.
以上の実施の形態5では、データのサービスレベルに基づきディスクを決定していたが、次にデータのサービスレベルに基づき、データのコピーを作成し、複数のディスクに分散させることで、信頼性を向上させる場合の実施の形態を示す。
図16はこのような場合のディレクトリ情報データベースの例である。ディレクトリツリー中で信頼性が必要とされるデータ部分は冗長化される。
次に動作について説明する。図17は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部はディレクトリ情報データベース221のサービスレベル情報を定期的に監視しており(s23)、任意のデータがある一定のサービスレベルを満たさなくなった場合(s24)、データのコピーを作成する(s25)。その後、コピーデータのサービスレベルが所定レベル以上となるディスクを決定し(s26)、決定したディスクにコピーデータを移動(s27)し、当該データ移動を反映させて、ディレクトリ情報データベース221のディレクトリ情報を更新する(s28)。
以上により、一定のサービスレベルを満たさなくなったデータを冗長化させることが可能となり、信頼性を向上させることができる。
実施の形態11.
以上の実施の形態10では、データのコピーを作成し、複数のディスクに冗長化して配置していたが、次に、クライアントからのアクセス要求に対し、データのサービスレベルに従って、ディレクトリ情報を通知することで、可用性を向上させる場合の実施の形態を示す。
次に動作について説明するが、本実施の形態では、クライアントがアクセスしようとするデータが元のディスクから他のディスクに移動しており、このため、クライアントは自己のディレクトリ情報のキャッシュを参照してデータにアクセスしようとしてもアクセスできず分散ファイルシステム管理サーバ2へのディレクトリ情報の問合せが必要な場合を前提としている。また、本実施の形態では、クライアントがアクセスしようとするデータのコピーが作成されコピーデータがいずれかのディスクに配置されているものとする。従って、分散ファイルシステム管理サーバ2は、クライアントからディレクトリ情報の問合せがあった場合には、複数のディスクの中からいずれかを選択し、選択したディスクが含まれるディレクトリ情報をクライアントに通知する。
図18は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、ディレクトリ通知部22に関するフローチャートである。まず、ディレクトリ通知部はクライアントからのアクセス要求(ディレクトリ情報の問い合わせ)を待つ(s29)。ここで、クライアントからのアクセス要求にはクライアントが要求するデータのサービスレベルの通知が含まれているものとする。次に、クライアントからアクセス要求があった場合(s30)、クライアントが要求するデータのサービスレベルを確認し(s31)、クライアントに通知する最適なディスクを決定する(s32)。具体的には、コピーデータを含む複数の同一のデータのうちクライアントが要求するサービスレベルに合致するデータを選択し、選択したデータを記憶しているディスクをクライアントに通知するディスクとして決定する。その後、決定したディスクが含まれるディレクトリ情報をクライアントに対して通知する(s33)。
以上により、クライアントに対し最適なディレクトリ情報を通知することが可能となり、可用性を向上させることができる。
実施の形態12.
以上の実施の形態10では、データのサービスレベルを利用しデータを冗長化していたが、次に、クライアントのサービスレベルに従って、冗長化するディスクを選択することで、可用性を向上させる場合の実施の形態を示す。
つまり、実施の形態10では、データのサービスレベル(例えば、信頼性を向上させるためにデータは二重化すること等)を遵守するようにデータをコピーしていたが、これだけでは、二重化したデータの片方が、あるクライアントからネットワーク的に離れた場所、あるいはアクセスできない場所に再配置される可能性がある。そのため、本実施の形態に係るデータ制御部は、クライアントのサービスレベル(例えば、クライアントaに対してデータAはメトリック=2以内の場所におく必要がある等)を考慮し、データを配置する。
次に動作について説明する。図19は本実施に係るデータ制御部23の動作を示すフローチャートである。フローチャートにおいて、データ制御部23がクライアントからサービスレベル規約違反の通知を受けた場合(s241)、例えば、データ制御部によって分割再配置されたデータのクライアントからのネットワーク距離がサービスレベルによって規定された値をオーバーしていたためにクライアントからサービスレベル規約違反の通知を受けた場合に、該当するデータのコピーを作成し(s251)、該当クライアントのサービスレベルを遵守可能なディスクを選出する(s261)。そして、コピーデータを、選出したディスク上に移動し(s271)、当該コピーデータの移動を反映させて、ディレクトリ情報データベースのディレクトリ情報を更新する(s281)。
以上により、クライアントに対し最適なディスクを選択することが可能となり、可用性を向上させることができる。
実施の形態13.
以上の実施の形態11では、クライアントからのアクセス要求に対し、データのサービスレベルに従って、ディレクトリ情報を通知していたが、次に、クライアントのサービスレベルに従ってディレクトリ情報を通知することで、可用性を向上させる場合の実施の形態を示す。
次に動作について説明する。実施の形態11では図18のフローチャートにおいて、データのサービスレベルによって通知するディスクを決定し(s32)、クライアントにディレクトリ情報を通知(s33)していた。本実施の形態では、実施の形態12で示したように、クライアントからサービスレベル規約違反の通知を受けた場合に、クライアントのサービスレベルを確認し、コピーデータを生成して冗長化を行い、冗長化されたデータが含まれるディスクのうち、クライアントが要求するサービスレベルの条件を満たすディスクを決定する。その後、クライアントに対して決定したディスクに対するディレクトリ情報を通知する。
以上により、クライアントに対し最適なディレクトリ情報を通知することが可能となり、可用性を向上させることができる。
実施の形態14.
以上の実施の形態6では、ディスクの性能に基づいてデータの移動、分割を行っていたが、次に、ディスクの信頼性低下を伴うデータ移動の場合は、自動的にデータを冗長化させることで、信頼性を確保する場合の実施の形態を示す。
本実施の形態では、ディスク性能・容量データベース233に図21に示すディスク性能・容量情報が格納されている。本実施の形態では、ディスク性能・容量情報は、ディスクの性能(図21ではアクセス速度)、ディスクの空き容量とともに、ディスクの信頼性を示す。
次に動作について説明する。図20は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部は負荷情報データベース211を定期的に監視しており(s34)、任意のデータがある一定の負荷を超過した場合(s35)、データを実施の形態2または実施の形態3に示す手順にて分割する(s36)。その後、ディスク性能データベースに基づき、データの移動先のディスクを決定し(s37)、データを移動させる(s38)。その際に、信頼性が元のディスクより低下した場合(s39)、すなわち、分割データの移動先のディスクの信頼性が分割元のデータを記憶していたディスクの信頼性を下回った場合、分割データのコピーを作成し(s40)、他のディスクに配置する(s37、s38)。更に、コピーデータの移動先のディスクの信頼性が元のディスク(コピー元の分割データを記憶しているディスク)の信頼性を下回った場合は同様にして更なるコピーデータを生成した他のディスクに移動させる。一方で、ステップs39で信頼性が元のディスクより低下していない場合は、ディレクトリ情報データベースを更新する(s41)。
以上により、データの信頼性を確保しつつ負荷を分散させることが可能となる。
実施の形態15.
以上の実施の形態14では、ディスクの信頼性低下を防ぐためにデータを自動的に冗長化したが、次に、ディスクの信頼性向上を伴うデータ移動の場合は、自動的にデータの冗長化を解除することで、信頼性を確保する場合の実施の形態を示す。
次に動作について説明する。図22は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。データ制御部は負荷情報データベース211を定期的に監視しており(s42)、任意のデータがある一定の負荷を超過した場合(s43)、データを実施の形態2または実施の形態3に示す手順にて分割する(s44)。その後、ディスク性能データベースに基づき、データを配置するディスクを決定し(s45)、データを配置する(s46)。その際に、信頼性が元のディスクより向上した場合(s47)、すなわち、分割データの移動先のディスクの信頼性が分割元のデータを記憶していたディスクの信頼性を上回った場合であって、その分割データのコピーデータが他のディスクにある場合(s48)、データの冗長化を解除(他のディスクのコピーデータを削除)する(s49)。信頼性が元のディスクより向上していない場合は、ディレクトリ情報データベースを更新する(s50)。
以上により、データの信頼性を確保しつつ負荷を分散させることが可能となる。
実施の形態16.
以上の実施の形態では、1つの分散ファイルシステム管理サーバによって負荷情報やディレクトリ情報が管理されていたが、次に、複数の分散ファイルシステム管理サーバを配置することで信頼性を向上させる場合の実施の形態を示す。
図23は実施の形態16における分散ファイルシステムの構成図である。図において、2a〜2rは分散ファイルシステム管理サーバ群であり、ストレージネットワーク1に接続されている。なお、各分散ファイルシステム管理サーバは同様の内部構成となっているものとする。
次に動作について説明する。負荷監視部21、ディレクトリ通知部22、データ制御部23は負荷情報データベース211、ディレクトリ情報データベース221、ディスク性能・容量データベース233を更新する際に、別の分散ファイルシステム管理サーバのデータベースに対しても更新を行う。更新中は各データベースはロックされ、他の管理サーバのディレクトリ通知部、データ制御部、負荷監視部からデータベースを更新することはできない。クライアント3a〜3nは分散ファイルシステム管理サーバ群に問い合わせを行い、最初に返ってきたディレクトリ情報に基づいてディスクアクセスを行う。
以上により、複数の分散ファイルシステム管理サーバを配置することが可能となり、信頼性および性能を向上させることが可能となる。
実施の形態17.
以上の実施の形態16では、分散ファイルシステム管理サーバごとに負荷情報データベース211、ディレクトリ情報データベース221、ディスク性能・容量データベース233を持っていたが、次に、ストレージネットワーク上のディスクに各データベースを配置することで性能を向上させる場合の実施の形態を示す。
図24は実施の形態17における分散ファイルシステムの構成図である。図において、2111は負荷情報データベース、2211はディレクトリ情報データベース、2331はディスク性能・容量データベースであり、ストレージネットワーク1に接続されている。つまり、各分散ファイルシステム管理サーバは、負荷情報データベース、ディレクトリ情報データベース、ディスク性能・容量データベースを内部に保有せずに、共用するネットワークであるストレージネットワーク上に配置された負荷情報データベース2111、ディレクトリ情報データベース2211、ディスク性能・容量データベース2331を共用している。なお、各分散ファイルシステム管理サーバは同様の内部構成となっているものとする。
次に動作について説明する。各分散ファイルシステム管理サーバ2の負荷監視部21、ディレクトリ通知部22、データ制御部23は、更新が必要になった場合に、ストレージネットワーク1に接続された負荷情報データベース2111、ディレクトリ情報データベース2211、ディスク性能・容量データベース2331を更新する。更新中は各データベースはロックされ、他の管理サーバのディレクトリ通知部、データ制御部、負荷監視部からデータベースを更新することはできない。クライアント3a〜3nは分散ファイルシステム管理サーバ群に問い合わせを行い、最初に返ってきたディレクトリ情報に基づいてディスクアクセスを行う。
以上により、分散ファイルシステム管理サーバ間でデータベースの連携を取る必要がなくなり、性能を向上させることが可能となる。
実施の形態18.
以上の実施の形態では、データ制御部はすべてのディレクトリ情報を管理していが、次に、各分散ファイルシステム管理サーバのデータ制御部がディレクトリ情報を補完しあって管理する場合の実施の形態を示す。
図25は実施の形態18における分散ファイルシステム管理サーバおよびディレクトリ情報データベースの図である。図において、2a〜2rは分散ファイルシステム管理サーバ、221はディレクトリ情報データベース、2211a〜2211oは各データ制御部が管理するディレクトリ部分木情報である。
次に動作について説明する。クライアントからディレクトリ情報の問い合わせを受けた分散ファイルシステム管理サーバは、ディレクトリ情報データベースを検索するが、ここで自分が管理しているディレクトリ部分木情報内に通知するデータが存在しない場合、ターゲットとなるディレクトリ情報を管理する分散ファイルシステム管理サーバに、クライアントからの問い合わせを転送する。そして、転送されたクライアントからの問合せを受信した分散ファイルシステム管理サーバが、自己が管理しているディレクトリ部分木情報に基づきクライアントにディレクトリ情報を送信する。
以上により、クライアントからのディレクトリ情報の問い合わせを分散させ、可用性を向上させることが可能となる。
実施の形態19.
以上の実施の形態では、各分散ファイルシステム管理サーバがマスターとなるディレクトリ情報データベースを管理していたが、次に、アクセス頻度の高いクライアントに対しては、ディレクトリ部分木情報の管理を委譲する場合の実施の形態を示す。
図26は実施の形態19おける分散ファイルシステム管理サーバおよびディレクトリ情報データベースの図である。図において、2a〜2rは分散ファイルシステム管理サーバ、3nはクライアント、321nはクライアントによってキャッシュされたディレクトリ情報データベース、221はディレクトリ情報データベース、2211a〜2211oは各データ制御部およびクライアントが管理するディレクトリ部分木情報である。
次に動作について説明する。クライアントからのアクセス頻度が高いディレクトリ部分木情報を持つ分散ファイルシステム管理サーバは、クライアントのディレクトリ情報データベースにディレクトリ部分木情報を移動する。
クライアントがデータにアクセスする際は、まず自分のディレクトリ情報データベース内のディレクトリ部分木を検索するが、ここで自分が管理しているディレクトリ部分木情報内に、該当するデータに関する情報が存在しない場合、ターゲットとなるディレクトリ情報を管理する分散ファイルシステム管理サーバに、ディレクトリ情報の問い合わせを送信し、ディレクトリ情報データベースのキャッシュを更新し、更新後のディレクトリ情報に従ってデータアクセスを行う。
以上により、クライアントからのディレクトリ情報の問い合わせ負荷を低減させ、可用性を向上させることが可能となる。
実施の形態20.
以上の実施の形態19では、分散ファイルシステム管理サーバがクライアントに、ディレクトリ部分木情報の管理を委譲していたが、次に、クライアントが保持しているディレクトリ部分木情報のアクセス頻度が低下したときに、ディレクトリ部分木情報を分散ファイルシステム管理サーバに返還する場合の実施の形態を示す。
次に動作について説明する。図27は本実施の形態に係る分散ファイルシステム管理サーバ2のうち、データ制御部23に関するフローチャートである。クライアントは自分が保持してディレクトリ部分木情報に対するアクセス頻度を監視し(s42)、アクセス頻度が低下した場合(s43)、分散ファイルシステム管理サーバに対してディレクトリ部分木情報を返還する旨、ディレクトリ通知部に通知する(s44)。分散ファイルシステム管理サーバ群のディレクトリ通知部は、自分が保持するディレクトリ部分木情報にクライアントに委譲していたディレクトリ部分木情報へのリンクがある場合、クライアントに対してディレクトリ部分木情報の返還要求を出す。返還要求を受けたクライアントは、返還要求を出した分散ファイルシステム管理サーバに対してディレクトリ部分木情報を送信する。これにより、分散ファイルシステム管理サーバは、クライアントに管理させていたディレクトリ部分木情報を再度管理することになる。
以上により、ディレクトリ部分木情報を柔軟に移動することが可能となり、可用性を向上させることが可能となる。
実施の形態21.
以上の実施の形態では、クライアントと分散ファイルシステム管理サーバ間、クライアントとディスク間、分散ファイルシステム管理サーバとディスク間の情報授受、および分散ファイルシステム管理サーバからのディスク負荷監視にストレージネットワークを使用していたが、クライアントと分散ファイルシステム管理サーバ間に別のネットワークを使用する場合の実施の形態を示す。
図28は実施の形態21おける分散ファイルシステムの構成図であり、6はクライアントと分散ファイルシステム管理サーバ間用の通信用ネットワークである。
次に動作について説明する。クライアントから分散ファイルシステム管理サーバへの問い合わせ、およびディレクトリ部分木情報の授受、更には、分散ファイルシステムからクライアントへのディレクトリ情報の通知の際に、クライアント及び分散ファイルシステム管理サーバはストレージネットワークを使用せず通信用ネットワーク6を使用する。
以上により、ネットワークの負荷を分散させることが可能となり、性能を向上させることが可能となる。
実施の形態22.
以上の実施の形態21では、クライアントとディスク間、分散ファイルシステム管理サーバとディスク間の情報授受、および分散ファイルシステム管理サーバからのディスク負荷監視にストレージネットワークを使用していたが、分散ファイルシステム管理サーバからのディスク負荷監視に別のネットワークを使用する場合の実施の形態を示す。
図29は実施の形態22おける分散ファイルシステムの構成図であり、7は分散ファイルシステム管理サーバからのディスク負荷監視用のネットワークである。
次に動作について説明する。分散ファイルシステム管理サーバは、ディスク負荷の監視を行う際に、ストレージネットワークを使用せず負荷監視用ネットワーク7を使用する。
以上により、ネットワークの負荷を分散させることが可能となり、性能を向上させることが可能となる。
ここで、以上の実施の形態1〜22で説明した分散ファイルシステムの特徴を以下に示す。
実施の形態1で説明した分散ファイルシステムは、ストレージネットワークと、分散ファイルシステム管理サーバ、クライアント群、ディスク群から構成されるシステムであり、分散ファイルシステム管理サーバはストレージネットワークの負荷を監視し、負荷に応じてディスク上のデータを移動させ、ディレクトリ情報を更新し、任意のデータにアクセス要求をしてきたクライアントに対し、対象となるデータが含まれるディレクトリ情報を通知することを特徴とする。
実施の形態2で説明した分散ファイルシステムでは、任意のデータにある一定の負荷が集中した場合、分散ファイルシステム管理サーバが、対象となるデータを複数のデータに分割し、任意の複数のディスクに分割させることを特徴とする。
実施の形態3で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、データへのアクセス負荷に従って、分割量を変更することを特徴とする。
実施の形態4で説明した分散ファイルシステムでは、分散している連続データの負荷がある一定の負荷に満たない場合、分散ファイルシステム管理サーバが、連続データを一つのデータに結合し、任意のディスクに格納することを特徴とする。
実施の形態5で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ内のディレクトリ情報に、データのサービスレベルが記録されており、その情報に基づいてデータを移動、分割、結合することを特徴とする。
実施の形態6で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ内には、ディスクの性能が記録されており、その情報に基づいてデータを移動、分割、結合することを特徴とする。
実施の形態7で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ内に、ディスクの容量が記録されており、その情報に基づいてデータを移動、分割、結合することを特徴とする。
実施の形態8で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ内のディレクトリ情報に、各クライアントのサービスレベルが記録されており、その情報に基づいてデータを移動、分割、結合することを特徴とする。
実施の形態9で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ内のディレクトリ情報に、データ、およびクライアントのサービスレベルと、ディスクの性能が記録されており、それらの情報に基づいてデータを移動、分割、結合することを特徴とする。
実施の形態10で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、データのサービスレベルに従ってデータを冗長化することを特徴とする。
実施の形態11で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、クライアントからのアクセス要求に対し、データのサービスレベルに従って、ディレクトリ情報を通知することを特徴とする。
実施の形態12で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、クライアントのサービスレベルに従ってデータを冗長化することを特徴とする。
実施の形態13で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、クライアントからのアクセス要求に対し、およびクライアントのサービスレベルに従って、ディレクトリ情報を通知することを特徴とする。
実施の形態14で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、ディスクの性能に基づいて、信頼性低下を伴うデータの移動の場合は、自動的にデータを冗長化することを特徴とする。
実施の形態15で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、ディスクの性能に基づいて、信頼性向上を伴うデータの移動の場合は、自動的にデータの冗長化を解除することを特徴とする。
実施の形態16で説明した分散ファイルシステムでは、複数の分散ファイルシステム管理サーバを備え、いずれかの分散ファイルシステム管理サーバでディレクトリ情報の更新を行う場合には、他の分散ファイルシステム管理サーバでも同様の更新を行うことを特徴とする。
実施の形態17で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバ上のデータベースをストレージネットワーク上に配置し、分散ファイルシステム管理サーバ間で共有することにより、データベースへのアクセス性能を向上させることを特徴とする。
実施の形態18で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバをディレクトリ情報の部分木ごとに複数配置することで、クライアントからのディレクトリ情報の問い合わせを分散させ、可用性を向上させることを特徴とする。
実施の形態19で説明した分散ファイルシステムでは、分散ファイルシステム管理サーバが、任意のデータへのアクセス頻度が高いクライアントに対し、対象となるデータのディレクトリ部分木情報を委譲することを特徴とする。
実施の形態20で説明した分散ファイルシステムでは、クライアントは、委譲されたディレクトリ部分木情報のアクセス頻度が低下した場合、ディレクトリ部分木情報を分散ファイルシステム管理サーバ返還することを特徴とする。
実施の形態21で説明した分散ファイルシステムは、ストレージネットワークをディスクアクセス用ネットワークと、分散ファイルシステム管理サーバとクライアント間用ネットワークに分割したことを特徴とする。
実施の形態22で説明した分散ファイルシステムは、ストレージネットワークをディスクアクセス用ネットワークと、負荷監視用ネットワーク、および前記分散ファイルシステム管理サーバと前記クライアント間用ネットワークに分割したことを特徴とする。
実施の形態1における分散ファイルシステムの構成を示す図。 データ分割例を示す図。 実施の形態2におけるデータ制御部に関するフローチャート。 実施の形態4におけるデータ結合例を示す図。 実施の形態4におけるデータ制御部に関するフローチャート。 実施の形態5におけるディレクトリ情報データベースを示す図。 実施の形態5におけるサービスレベル情報例を示す図。 実施の形態5におけるデータ制御部に関するフローチャート。 実施の形態6における分散ファイルシステム管理サーバを示す図。 実施の形態6におけるデータ制御部に関するフローチャート。 実施の形態7における分散ファイルシステム管理サーバを示す図。 実施の形態8におけるディレクトリ情報データベースを示す図。 実施の形態8におけるサービスレベル情報例を示す図。 実施の形態9における分散ファイルシステム管理サーバを示す図。 配置ディスクの決定処理の詳細を示すフローチャート。 実施の形態10におけるディレクトリ情報データベースを示す図。 実施の形態10におけるデータ制御部に関するフローチャート。 実施の形態11におけるディレクトリ通知部に関するフローチャート。 実施の形態12におけるデータ制御部に関するフローチャート。 実施の形態14におけるデータ制御部に関するフローチャート。 実施の形態14におけるディスク性能・容量データベースを示す図。 実施の形態15におけるデータ制御部に関するフローチャート。 実施の形態16における分散ファイルシステムの構成を示す図。 実施の形態17における分散ファイルシステムの構成を示す図。 実施の形態18における分散ファイルシステム管理サーバおよびディレクトリ情報データベースを示す図。 実施の形態19における分散ファイルシステム管理サーバおよびディレクトリ情報データベースを示す図。 実施の形態20におけるクライアントに関するフローチャート。 実施の形態21における分散ファイルシステムの構成を示す図。 実施の形態22における分散ファイルシステムの構成を示す図。 従来の分散ファイルシステムを示す図。
符号の説明
1 ストレージネットワーク、2 分散ファイルシステム管理サーバ、3 クライアント群、4 ディスク、6 通信用ネットワーク、7 負荷監視用ネットワーク、21 負荷監視部、22 ディレクトリ通知部、23 データ制御部、101 ネットワーク、102 計算機サイトA、103 計算機サイトB、105 サーバ計算機A、106 サーバ計算機B、108 クライアント計算機群、109 クライアント計算機群、111 部分ファイル管理部、112 分散ファイル管理部、113 ネットワークインターフェース、114 状態管理部、115 記憶装置、116 部分ファイル管理部、117 分散ファイル管理部、118 ネットワークインターフェース、119 状態管理部、120 記憶装置、126 部分ファイル、131 サブネットワーク、132 サブネットワーク、211 負荷情報データベース、221 ディレクトリ情報データベース、222 サービスレベル情報、231 ディスク性能データベース、232 ディスク容量データベース、233 ディスク性能・容量データベース、321 キャッシュされたディレクトリ情報データベース、2111 負荷情報データベース、2211 ディレクトリ情報データベース、2331 ディスク性能・容量データベース。

Claims (27)

  1. データを記憶する複数のデータ記憶装置と、いずれかのデータ記憶装置にアクセスしてデータの取得が可能な複数のデータ取得装置とに接続されたデータ管理装置であって、
    いずれのデータがいずれのデータ記憶装置に記憶されているかを示すディレクトリ情報を格納するディレクトリ情報データベースと、
    前記複数のデータ記憶装置の負荷状況を監視する負荷監視部と、
    前記負荷監視部の監視結果を解析し、特定のデータ記憶装置の負荷状況が所定の条件に合致する場合に、当該データ記憶装置に記憶されているデータの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うデータ制御部と、
    前記データ制御部によりデータ移動が行われたデータに関して特定のデータ取得装置からディレクトリ情報の問合せがあった場合に、更新後のディレクトリ情報のうち少なくとも当該データに関するディレクトリ情報を前記特定のデータ取得装置に対して送信するディレクトリ通知部とを有することを特徴とするデータ管理装置。
  2. 前記データ管理装置は、
    ディレクトリ情報のキャッシュを保有する複数のデータ取得装置と接続されており、
    前記ディレクトリ通知部は、
    前記データ制御部によりデータ移動が行われたデータに関して特定のデータ取得装置からディレクトリ情報の問合せがあった場合に、前記特定のデータ取得装置が保有するディレクトリ情報のキャッシュを更新させるために更新後のディレクトリ情報のうち少なくとも当該データに関するディレクトリ情報を前記特定のデータ取得装置に対して送信することを特徴とする請求項1に記載のデータ管理装置。
  3. 前記データ制御部は、
    前記負荷監視部の監視結果を解析し、特定のデータ記憶装置に対する負荷が所定レベル以上の場合に、当該データ記憶装置に記憶されているデータの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  4. 前記負荷監視部は、
    各データ記憶装置について、各データ記憶装置に記憶されているデータごとに負荷状況を監視し、
    前記データ制御部は、
    前記負荷監視部の監視結果を解析し、特定のデータに対する負荷が所定レベル以上の場合に、当該データを任意数に分割し、当該データから分割された分割データの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  5. 前記負荷監視部は、
    各データ記憶装置について、各データ記憶装置に記憶されているデータのデータ領域ごとに負荷状況を監視し、
    前記データ制御部は、
    前記負荷監視部の監視結果を解析し、特定のデータ領域に対する負荷が所定レベル以上の場合に、当該データ領域を任意数に分割し、当該データ領域から分割された分割データの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  6. 前記負荷監視部は、
    各データ記憶装置について、各データ記憶装置に記憶されているデータごとに負荷状況を監視し、
    前記データ制御部は、
    前記負荷監視部の監視結果を解析し、相互に連続した関係にある複数のデータに対する負荷が所定レベル以下の場合に、当該複数のデータを結合して結合データとし、結合データに対していずれかのデータ記憶装置へのデータ移動を行うとともに、当該データ移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  7. 前記ディレクトリ情報データベースは、
    各データ記憶装置に記憶されているデータごとに各データのサービスレベルを示すデータ別サービスレベル情報を格納しており、
    前記データ制御部は、
    負荷が所定レベル以上のデータが複数存在する場合に、当該複数のデータをそれぞれ任意数に分割するとともに、前記ディレクトリ情報データベースに格納されているデータ別サービスレベル情報を参照し、当該複数のデータについてデータ移動を行う順序をそれぞれのデータのサービスレベルに基づいて決定し、決定した順序に従って、データごとに分割データのデータ移動を行うとともに、それぞれのデータ移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項4に記載のデータ管理装置。
  8. 前記データ制御部は、
    それぞれのデータ記憶装置の特性に基づき、複数のデータ記憶装置の中からデータの移動先とするデータ記憶装置を選択し、選択したデータ記憶装置へデータ移動を行うことを特徴とする請求項1に記載のデータ管理装置。
  9. 前記データ制御部は、
    それぞれのデータ記憶装置の空き記憶容量に基づき、複数のデータ記憶装置の中からデータの移動先とするデータ記憶装置を選択し、選択したデータ記憶装置へデータ移動を行うことを特徴とする請求項1に記載のデータ管理装置。
  10. 前記ディレクトリ情報データベースは、
    各データ取得装置に設定されているサービスレベルを示す取得装置別サービスレベル情報を格納しており、
    前記データ制御部は、
    前記ディレクトリ情報データベースに格納されている取得装置別サービスレベル情報を参照し、特定のデータ取得装置に設定されているサービスレベルに基づき、複数のデータ記憶装置の中からデータの移動先とするデータ記憶装置を選択し、選択したデータ記憶装置へデータ移動を行うことを特徴とする請求項1に記載のデータ管理装置。
  11. 前記データ制御部は、
    それぞれのデータ記憶装置の特性及び空き記憶容量に基づき、複数のデータ記憶装置の中からデータの移動先とするデータ記憶装置を選択し、選択したデータ記憶装置へデータ移動を行うことを特徴とする請求項1に記載のデータ管理装置。
  12. 前記データ制御部は、
    特定のデータのサービスレベルが所定レベル以下である場合に、当該データのコピーデータを生成し、生成したコピーデータのサービスレベルが所定レベル以上となるデータ記憶装置へコピーデータを移動させるとともに、当該コピーデータの移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  13. 前記データ制御部は、
    特定のデータについて複数のコピーデータを生成し、生成した複数のコピーデータをそれぞれ異なるデータ記憶装置へ移動させて、複数のコピーデータのそれぞれのサービスレベルを相違させる場合があり、
    前記ディレクトリ通知部は、
    特定のデータ取得装置から前記特定のデータ取得装置が要求するサービスレベルの通知とともにコピー元のデータに関するディレクトリ情報の問合せがあった場合に、前記複数のコピーデータの中から前記特定のデータ取得装置が要求するサービスレベルに合致するコピーデータを選択し、少なくとも選択したコピーデータに関するディレクトリ情報を前記特定のデータ取得装置に対して送信することを特徴とする請求項1に記載のデータ管理装置。
  14. 前記データ制御部は、
    特定のデータ取得装置から特定のデータのサービスレベルが前記特定のデータ取得装置が要求するサービスレベルに合致していない旨の通知を受けた場合に、当該データのコピーデータを生成し、生成したコピーデータを前記特定のデータ取得装置が要求するサービスレベルを得られるデータ記憶装置に移動させさせるとともに、当該コピーデータの移動を反映させてディレクトリ情報の更新を行うことを特徴とする請求項1に記載のデータ管理装置。
  15. 前記データ制御部は、
    特定のデータについて複数のコピーデータを生成し、生成した複数のコピーデータをそれぞれ異なるデータ記憶装置へ移動させて、複数のコピーデータのそれぞれのサービスレベルを相違させる場合があり、
    前記ディレクトリ通知部は、
    前記データ制御部により前記複数のコピーデータの移動が行われディレクトリ情報の更新が行われた後に、前記複数のコピーデータの中から前記特定のデータ取得装置が要求するサービスレベルに合致するコピーデータを選択し、少なくとも選択したコピーデータに関するディレクトリ情報を前記特定のデータ取得装置に対して送信することを特徴とする請求項1に記載のデータ管理装置。
  16. 前記負荷監視部は、
    各データ記憶装置について、各データ記憶装置に記憶されているデータごとに負荷状況を監視し、
    前記データ制御部は、
    前記負荷監視部の監視結果を解析し、特定のデータに対する負荷が所定レベル以上の場合に、当該データの少なくとも一部を任意数に分割し、当該データから分割された分割データの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行い、分割データを移動させた結果、分割データの移動先のデータ記憶装置の信頼性が分割元のデータを記憶していたデータ記憶装置の信頼性を下回った場合に、移動させた分割データのコピーデータを生成し、生成したコピーデータを他のデータ記憶装置へ移動させることを特徴とする請求項1に記載のデータ管理装置。
  17. 前記データ制御部は、
    コピーデータを移動させた結果、コピーデータの移動先のデータ記憶装置の信頼性がコピー元の分割データを記憶しているデータ記憶装置の信頼性を下回った場合に、移動させたコピーデータをコピーして新たなコピーデータを生成し、生成した新たなコピーデータを更に他のデータ記憶装置へ移動させることを特徴とする請求項16に記載のデータ管理装置。
  18. 前記負荷監視部は、
    各データ記憶装置について、各データ記憶装置に記憶されているデータごとに負荷状況を監視し、
    前記データ制御部は、
    前記負荷監視部の監視結果を解析し、特定のデータに対する負荷が所定レベル以上の場合に、当該データの少なくとも一部を任意数に分割し、当該データから分割された分割データの少なくとも一部に対していずれかのデータ記憶装置へのデータ移動を行い、分割データを移動させた結果、分割データの移動先のデータ記憶装置の信頼性が分割元のデータを記憶していたデータ記憶装置の信頼性を上回わり、更に、移動させた分割データのコピーデータが他のデータ記憶装置に記憶されている場合に、他のデータ記憶装置に記憶されているコピーデータの消去を行うことを特徴とする請求項1に記載のデータ管理装置。
  19. 前記データ管理装置は、
    ディレクトリ情報を保有する他のデータ管理装置と通信可能であり、
    前記データ制御部は、
    自装置のディレクトリ情報を更新した場合に、同様の更新を他のデータ管理装置のディレクトリ情報に対しても行うことを特徴とする請求項1に記載のデータ管理装置。
  20. 前記負荷監視部は、
    各データ記憶装置の負荷状況の監視結果を前記他のデータ管理装置に通知することを特徴とする請求項19に記載のデータ管理装置。
  21. 前記データ管理装置は、
    他のデータ管理装置と共用可能な共用ディレクトリ情報データベースを前記他のデータ管理装置と共用するネットワーク上に備え、
    前記データ制御部は、
    いずれかのデータに対するデータ移動を行った場合に、前記共用ディレクトリ情報データベースに格納されている共用ディレクトリ情報を更新することを特徴とする請求項1に記載のデータ管理装置。
  22. 前記データ管理装置は、
    前記共用ディレクトリ情報に含まれるディレクトリ部分木情報のうち特定のディレクトリ部分木情報を自装置の管理対象とし、
    特定のデータに関して特定のデータ取得装置からディレクトリ情報の問合せがあった場合に、問合せのあった特定のデータが自装置の管理対象であるディレクトリ部分木情報に含まれていない場合に、前記特定のデータ取得装置からの問合せを他のデータ管理装置に転送し、問合せのあったデータに関するディレクトリ情報を他のデータ管理装置から前記特定のデータ取得装置に送信させることを特徴とする請求項21に記載のデータ管理装置。
  23. 前記データ管理装置は、
    自装置の管理対象であるディレクトリ部分木情報の少なくとも一部をいずれかのデータ取得装置に送信し、自装置の管理対象であるディレクトリ部分木情報の少なくとも一部を当該データ取得装置に管理させることを特徴とする請求項22に記載のデータ管理装置。
  24. 前記データ管理装置は、
    自装置の管理対象であるディレクトリ部分木情報の少なくとも一部をいずれかのデータ取得装置に管理させている場合に、当該データ取得装置が管理しているディレクトリ部分木情報の返還が必要になった場合に、当該データ取得装置が管理していたディレクトリ部分木情報を当該データ取得装置から受信し、受信したディレクトリ部分木情報を再度管理することを特徴とする請求項23に記載のデータ管理装置。
  25. 前記データ管理装置は、
    前記複数のデータ記憶装置及び前記複数のデータ取得装置を接続するストレージネットワークに接続され、
    前記ストレージネットワークを介して前記複数のデータ記憶装置及び前記複数のデータ取得装置と通信を行うことを特徴とする請求項1に記載のデータ管理装置。
  26. 前記データ管理装置は、
    前記複数のデータ記憶装置及び前記複数のデータ取得装置を接続するストレージネットワーク以外の他のネットワークを介して前記複数のデータ取得装置と接続され、
    前記他のネットワークを介して前記複数のデータ取得装置と通信を行うことを特徴とする請求項1に記載のデータ管理装置。
  27. 前記データ管理装置は、
    前記複数のデータ記憶装置及び前記複数のデータ取得装置を接続するストレージネットワーク以外の他のネットワークを介して前記複数のデータ記憶装置と接続され、
    前記他のネットワークを介して前記複数のデータ記憶装置の負荷状況を監視することを特徴とする請求項1に記載のデータ管理装置。
JP2003345324A 2003-10-03 2003-10-03 データ管理装置 Pending JP2005115438A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003345324A JP2005115438A (ja) 2003-10-03 2003-10-03 データ管理装置
US10/910,304 US20050080810A1 (en) 2003-10-03 2004-08-04 Data management apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003345324A JP2005115438A (ja) 2003-10-03 2003-10-03 データ管理装置

Publications (1)

Publication Number Publication Date
JP2005115438A true JP2005115438A (ja) 2005-04-28

Family

ID=34419448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003345324A Pending JP2005115438A (ja) 2003-10-03 2003-10-03 データ管理装置

Country Status (2)

Country Link
US (1) US20050080810A1 (ja)
JP (1) JP2005115438A (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1785835A2 (en) 2005-11-04 2007-05-16 Hitachi, Ltd. Storage control method for managing access environment enabling host to access data
JP2008191915A (ja) * 2007-02-05 2008-08-21 Hitachi Ltd ファイル格納方法及び計算機システム
JP2008225615A (ja) * 2007-03-09 2008-09-25 Hitachi Ltd ファイル管理方法及び計算機システム
JP2008541213A (ja) * 2005-05-05 2008-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション ストレージ仮想化インフラストラクチャの可用性を向上させる自律型ストレージ・プロビジョニング[i1]
JP2009500705A (ja) * 2005-07-05 2009-01-08 インターナショナル・ビジネス・マシーンズ・コーポレーション メモリ・マイグレーションのシステムおよび方法
EP2187332A1 (en) 2008-11-06 2010-05-19 Hitachi Ltd. Storage area allocation method and a management server
US7941625B2 (en) 2006-09-29 2011-05-10 Hitachi, Ltd. Volume selection method and information processing system
JP2011165164A (ja) * 2010-02-05 2011-08-25 Lsi Corp サービス品質に基づくストレージ階層化及び移動技法のためのシステム及び方法
KR20120005261A (ko) * 2010-07-08 2012-01-16 삼성전자주식회사 파일 백업 장치 및 방법
JP5104855B2 (ja) * 2007-03-23 2012-12-19 富士通株式会社 負荷分散プログラム、負荷分散方法、及びストレージ管理装置
WO2013172405A1 (ja) * 2012-05-17 2013-11-21 日本電気株式会社 ストレージシステムおよびデータアクセス方法
JP2014112428A (ja) * 2014-02-28 2014-06-19 Biglobe Inc 管理装置、アクセス制御装置、管理方法、アクセス方法およびプログラム
JP2014219868A (ja) * 2013-05-09 2014-11-20 西日本電信電話株式会社 データベースの移行方法
JP2015114913A (ja) * 2013-12-12 2015-06-22 富士通株式会社 ストレージ装置、ストレージシステム及びデータ管理プログラム
JP2015166988A (ja) * 2014-03-04 2015-09-24 日本電気株式会社 データ管理装置およびデータ管理方法
JP2016511862A (ja) * 2013-01-08 2016-04-21 リブ マインズ インコーポレーテッド 記憶ネットワークデータ割り当て
JP2018165861A (ja) * 2017-03-28 2018-10-25 日本電気株式会社 記憶装置、記憶装置の制御方法、プログラム
US11687255B2 (en) 2021-01-08 2023-06-27 Fujitsu Limited Information processing system and information processing method

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831561B2 (en) * 2004-05-18 2010-11-09 Oracle International Corporation Automated disk-oriented backups
US7096338B2 (en) * 2004-08-30 2006-08-22 Hitachi, Ltd. Storage system and data relocation control device
US7395396B2 (en) * 2004-08-30 2008-07-01 Hitachi, Ltd. Storage system and data relocation control device
US9191437B2 (en) * 2009-12-09 2015-11-17 International Business Machines Corporation Optimizing data storage among a plurality of data storage repositories
US8448080B2 (en) * 2009-12-31 2013-05-21 International Business Machines Corporation Target server identification in a virtualized data center
US8396828B2 (en) * 2010-09-14 2013-03-12 Microsoft Corporation Providing lightweight multidimensional online data storage for web service usage reporting
US10642849B2 (en) * 2010-10-25 2020-05-05 Schneider Electric It Corporation Methods and systems for providing improved access to data and measurements in a management system
US9762578B2 (en) 2010-10-25 2017-09-12 Schneider Electric It Corporation Methods and systems for establishing secure authenticated bidirectional server communication using automated credential reservation
WO2012147135A1 (en) 2011-04-28 2012-11-01 Hitachi, Ltd. Data storage system and management method therefor
US8886781B2 (en) 2011-12-13 2014-11-11 Microsoft Corporation Load balancing in cluster storage systems
JP6209863B2 (ja) * 2013-05-27 2017-10-11 富士通株式会社 ストレージ制御装置、ストレージ制御方法およびストレージ制御プログラム
CN103577122B (zh) * 2013-11-06 2016-08-17 杭州华为数字技术有限公司 分布式应用系统在平台间迁移的实现方法及装置
US9735967B2 (en) * 2014-04-30 2017-08-15 International Business Machines Corporation Self-validating request message structure and operation
US10394476B2 (en) 2014-04-30 2019-08-27 Pure Storage, Inc. Multi-level stage locality selection on a large system
US10802732B2 (en) 2014-04-30 2020-10-13 Pure Storage, Inc. Multi-level stage locality selection on a large system
US11470131B2 (en) * 2017-07-07 2022-10-11 Box, Inc. User device processing of information from a network-accessible collaboration system
US10795598B1 (en) * 2017-12-07 2020-10-06 Pure Storage, Inc. Volume migration for storage systems synchronously replicating a dataset
CN116974454A (zh) * 2022-04-21 2023-10-31 戴尔产品有限公司 用于数据处理的方法、电子设备和计算机程序产品

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148377A (en) * 1996-11-22 2000-11-14 Mangosoft Corporation Shared memory computer networks
US7353299B2 (en) * 2003-05-29 2008-04-01 International Business Machines Corporation Method and apparatus for managing autonomous third party data transfers

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008541213A (ja) * 2005-05-05 2008-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション ストレージ仮想化インフラストラクチャの可用性を向上させる自律型ストレージ・プロビジョニング[i1]
JP2009500705A (ja) * 2005-07-05 2009-01-08 インターナショナル・ビジネス・マシーンズ・コーポレーション メモリ・マイグレーションのシステムおよび方法
EP1785835A2 (en) 2005-11-04 2007-05-16 Hitachi, Ltd. Storage control method for managing access environment enabling host to access data
US8117405B2 (en) 2005-11-04 2012-02-14 Hitachi, Ltd. Storage control method for managing access environment enabling host to access data
US7941625B2 (en) 2006-09-29 2011-05-10 Hitachi, Ltd. Volume selection method and information processing system
US8566548B2 (en) 2006-09-29 2013-10-22 Hitachi, Ltd. Volume selection method and information processing system
JP2008191915A (ja) * 2007-02-05 2008-08-21 Hitachi Ltd ファイル格納方法及び計算機システム
JP2008225615A (ja) * 2007-03-09 2008-09-25 Hitachi Ltd ファイル管理方法及び計算機システム
JP5104855B2 (ja) * 2007-03-23 2012-12-19 富士通株式会社 負荷分散プログラム、負荷分散方法、及びストレージ管理装置
US8516070B2 (en) 2007-03-23 2013-08-20 Fujitsu Limited Computer program and method for balancing processing load in storage system, and apparatus for managing storage devices
EP2187332A1 (en) 2008-11-06 2010-05-19 Hitachi Ltd. Storage area allocation method and a management server
JP2011165164A (ja) * 2010-02-05 2011-08-25 Lsi Corp サービス品質に基づくストレージ階層化及び移動技法のためのシステム及び方法
KR20120005261A (ko) * 2010-07-08 2012-01-16 삼성전자주식회사 파일 백업 장치 및 방법
KR101753313B1 (ko) * 2010-07-08 2017-07-19 삼성전자주식회사 파일 백업 장치 및 방법
WO2013172405A1 (ja) * 2012-05-17 2013-11-21 日本電気株式会社 ストレージシステムおよびデータアクセス方法
JP2016511862A (ja) * 2013-01-08 2016-04-21 リブ マインズ インコーポレーテッド 記憶ネットワークデータ割り当て
JP2014219868A (ja) * 2013-05-09 2014-11-20 西日本電信電話株式会社 データベースの移行方法
JP2015114913A (ja) * 2013-12-12 2015-06-22 富士通株式会社 ストレージ装置、ストレージシステム及びデータ管理プログラム
US9886217B2 (en) 2013-12-12 2018-02-06 Fujitsu Limited Storage system using a distributed partial hierarchical mapping
JP2014112428A (ja) * 2014-02-28 2014-06-19 Biglobe Inc 管理装置、アクセス制御装置、管理方法、アクセス方法およびプログラム
JP2015166988A (ja) * 2014-03-04 2015-09-24 日本電気株式会社 データ管理装置およびデータ管理方法
JP2018165861A (ja) * 2017-03-28 2018-10-25 日本電気株式会社 記憶装置、記憶装置の制御方法、プログラム
US11687255B2 (en) 2021-01-08 2023-06-27 Fujitsu Limited Information processing system and information processing method

Also Published As

Publication number Publication date
US20050080810A1 (en) 2005-04-14

Similar Documents

Publication Publication Date Title
JP2005115438A (ja) データ管理装置
US7107323B2 (en) System and method of file distribution for a computer system in which partial files are arranged according to various allocation rules
KR100450724B1 (ko) 하나 이상의 저장 장치에 공간을 할당하기 위해서 가중할당을 사용하는 복수 개의 파일 시스템
CN103067433B (zh) 一种分布式存储系统的数据迁移方法、设备和系统
CN102591970B (zh) 一种分布式键-值查询方法和查询引擎系统
US8281376B2 (en) Authentication system and authentication method
US8818942B2 (en) Database system with multiple layer distribution
US7529972B2 (en) Methods and apparatus for reconfiguring a storage system
WO2014007249A1 (ja) I/oノード及び複数の計算ノードに備えられたキャッシュメモリの制御方法
WO2013073020A1 (ja) 計算機システム、データ管理方法及びプログラム
US20070157002A1 (en) Methods and apparatus for configuring a storage system
JP2011521356A (ja) ストレージ性能の最適化
US20110040788A1 (en) Coherent File State System Distributed Among Workspace Clients
CN100437524C (zh) 用于将文件的数据存储在存储块中的高速缓存方法及系统
KR101236477B1 (ko) 비대칭 클러스터 파일 시스템의 데이터 처리 방법
US7539838B1 (en) Methods and apparatus for increasing the storage capacity of a storage system
CN1829974B (zh) 借助于非失败节点的并行恢复
EP2695362B1 (en) Multi-user cache system
US7536422B2 (en) Method for process substitution on a database management system
JP2004118482A (ja) 記憶装置、および、キャッシュ方法
CN114238518A (zh) 数据处理方法、装置、设备及存储介质
EP1350190A2 (en) Method and apparatus for distributing and reusing object identifiers
KR100507781B1 (ko) 공유 디스크 기반 다중 데이터베이스 관리시스템에서 검출및 회피 기반 일관성 유지 정책을 동시에 지원하는 버퍼장착방법
CN114579514B (zh) 一种基于多计算节点的文件处理方法、装置及设备
US20230205776A1 (en) Distributed datastores with state-based data location