JP2010507876A - ネットワークデータストレージシステムおよびそのデータアクセス方法 - Google Patents

ネットワークデータストレージシステムおよびそのデータアクセス方法 Download PDF

Info

Publication number
JP2010507876A
JP2010507876A JP2009534958A JP2009534958A JP2010507876A JP 2010507876 A JP2010507876 A JP 2010507876A JP 2009534958 A JP2009534958 A JP 2009534958A JP 2009534958 A JP2009534958 A JP 2009534958A JP 2010507876 A JP2010507876 A JP 2010507876A
Authority
JP
Japan
Prior art keywords
data
node
data unit
identifier
management node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009534958A
Other languages
English (en)
Other versions
JP5567342B2 (ja
Inventor
ジンシェン ヤン
チェンロン タン
レイ パン
Original Assignee
アリババ グループ ホールディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホールディング リミテッド filed Critical アリババ グループ ホールディング リミテッド
Publication of JP2010507876A publication Critical patent/JP2010507876A/ja
Application granted granted Critical
Publication of JP5567342B2 publication Critical patent/JP5567342B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

ネットワークデータを格納するシステムおよびネットワークデータアクセス方法を提供する。前記ネットワークデータを格納するシステムは、データユニットを格納するデータノードと、経路情報を格納、及び管理し、クライアントのデータ処理要求に基づき、前記クライアントに前記経路情報を提供するメタデータノードと、前記クライアントからのデータアクセス要求に基づき、前記データノードにおける要求されたデータユニットを処理するデータ管理ノードとを備える。

Description

本出願は、2006年10月26日、中国特許局に出願された出願番号200610150325.3号、発明の名称を「ネットワークデータストレージシステムおよびそのデータアクセス方法」とする中国特許出願の優先権を主張し、その全ての内容は、引用により本出願に取込んでいる。
本開示は、データストレージと管理の分野に関し、特にネットワークデータを格納するシステム、およびネットワークデータにアクセスする方法に関する。
IT技術の発展の歴史は、コンピュータ技術を中心とするプロセッサの発展を原動力として進歩する段階から、伝送技術を中心とする段階への移行を経験した。この移行は、コンピュータネットワークの発展と普及を促進する。ますます多くの企業活動の情報が、デジタル化され、デジタル化された情報の爆発的な増加、およびIT技術のストレージ技術への増大する要求を誘発している。データストレージアプリケーションには、以下で述べるような新しい特徴が見られる。
(1)データが最も貴重な財産となる。データの紛失は、企業に計り知れない損失および壊滅的な損失さえもたらす。
(2)データの総量が爆発的に増えている。
(3)24時間対応のサービスが大勢を占めている。電子商取引および大部分のネットワークサービスアプリケーションにおいて、365×24時間のサービスが標準となり、優れたハイアベイラビリティが現在のデジタルストレージシステムに求められている。
(4)ストレージの管理と保守には集中化、自動化、インテリジェント化が要求されている。
(5)ストレージ技術はプラットフォーム独立である必要がある。
従来のストレージシステムは、DAS(Direct Attached Storage,ダイレクトアタッチドストレージ)、すなわち直接接続を介して格納することを利用した。これは、SAS(Server−Attached Storage,サーバアタッチドストレージ)とも呼ばれる。この方式において、記憶装置は、ケーブル(通常はSCSI接続ケーブル)を介してサーバに直接接続される。I/O(入力/出力)要求は、記憶装置に直接送信される。こうしたストレージ方式はサーバに依存し、記憶装置はハードウェアを積み重ねたものでしかなく、いかなるストレージ操作システムも付帯していない。サーバのバス技術に対する制限のせいで、DASを使用するシステムは弱い拡張性を有する。ユーザ接続数が増えると、サーバは、下記の理由により全システムの性能のボトルネックとなる可能性がある。
(1)コンピュータの帯域幅の制限:コンピュータ技術の発展は、コンピュータのバス帯域幅の増加を誘引しているが、今日のストレージアプリケーションの帯域幅の要求には追いつかない。
(2)ホストのメモリ容量の制限:コンピュータのメモリ容量は限られており、大量のデータアクセス要求が連続した場合、コンピュータのメモリ容量がすぐに飽和になり、残されたデータ転送要求を処理できなくなる。
(3)ファイルシステムの管理へのオーバーヘッドもデータアクセス時間を増加させる可能性がある。
多くの既存の企業アプリケーションは、データベース技術に強く依存し、集中型データストレージのため集中型データベースサーバを用いる。これらのアプリケーションは、一般的に関連システムのシングルポイントおよび性能のボトルネックである。加えて、コストも高く、拡張することが難しい。これらの企業アプリケーションはまた、オンラインで大量のデータを同時処理することにおいて特別な困難を有する。そのため、集中型のデータストレージ・管理を使用した従来の方式は、急速に増え続ける要求をもはや満足させることができない。
本開示は、既存のネットワークデータストレージシステムに特有の、乏しい拡張性、高い拡張コスト、および貧弱なデータアクセス性能の課題を解決するためのネットワークデータを格納するシステムを提供する。
同一の技術的概念基づき、本開示は、ネットワークデータにアクセスする方法をさらに提供する。
本開示は、ネットワークデータを格納するシステムを提供する。前記システムは、データユニットを格納するために用いられるデータノードと、経路情報を格納、および管理するために用いられ、クライアントのデータ処理要求に従って前記経路情報を提供するメタデータノードと、クライアントのデータアクセス要求に従って前記データノードにおける前記要求されたデータユニットを処理するために用いられるデータ管理ノードとを含む。
前記メタデータノード、前記データ管理ノードおよび前記データノードは、ツリー構造内で互いに接続される。前記メタデータノードは、前記ツリー構造のルートノードである。前記ルートノードは、その下に接続された1つまたは複数のデータ管理ノードを有する。各データ管理ノードは、下で1つまたは複数のデータノードと接続する。
上記システムにおいて、前記メタデータノードに格納された前記経路情報は、前記メタデータノードから前記データ管理ノードまでの経路情報と、前記データ管理ノードから前記データノードまでの経路情報とを含む。
前記メタデータノードは、前記データユニットの経路演算方法をさらに格納する。前記経路演算方法は、前記データユニットを格納する前記データノードの識別子および前記データユニットの前記データノードにおける位置情報を計算するためのものである。
上記システムにおいて、前記データ管理ノードは、データアクセスサービスおよび/またはその中に配置された冗長性ストラテジーを有することができる。
本明細書では、前記データノードに格納されたデータユニットは、アプリケーション向けの最小データセットである。
前記データユニット内部は、複数のファイルおよび/またはディレクトリである。前記データユニット内部のファイルは、データファイルおよび/またはインデックスファイルを含むことができる。
上記システムは、ログ管理ノードをさらに含み、これは、ログファイルを格納するために用いられ、ログ管理サービスを提供する。
上記システムは、ロックノードをさらに含み、これは、ロックファイルを格納するために用いられ、ロック管理サービスを提供する。
本開示はまた、ネットワークデータにアクセスする方法も提供する。前記方法は、クライアント内で、データユニットへのアクセスの要求をメタデータノードに送信し、前記メタデータノードからデータ管理ノードの経路情報を受信するステップと、前記クライアント内で、前記データ管理ノードの前記経路情報に従って、前記データユニットへのアクセスの要求を前記データ管理ノードに送信するステップと、前記データ管理ノード内で、前記要求を受信した後、前記データユニットを格納するデータノードの経路情報を前記メタデータノードから取得し、前記データノードの前記経路情報およびクライアントにより要求された操作に従い、前記データノードにおける前記データユニットを処理するステップとを含む。
上記方法において、前記クライアントからの前記データユニットへのアクセスの要求を前記メタデータノードが受信した後、前記メタデータノードは、前記データ管理ノードの経路情報を下記のステップを有する過程を用いて前記クライアントに送信する。すなわち、前記メタデータノード内で、前記データユニットへアクセスする要求から前記データユニットの情報を取得し、前記データユニットの情報と前記データユニットの識別子との間の関係をマッピングすることに基づき、前記データユニットの識別子を取得するステップと、前記データユニットの経路演算方法に基づき、前記データユニットの識別子から前記データユニットを格納する前記データノードの識別子を計算するステップと、前記データノードの識別子と前記データ管理ノード識別子との間の関係をマッピングすることに基づき、前記データ管理ノードの識別子を取得し、前記クライアントに前記データ管理ノードの識別子を提供するステップとである。
上記方法において、前記メタデータノードは、前記データ管理ノードに前記データノードの経路情報を下記のステップを有する手段を用いて提供する。すなわち、前記データ管理ノードから送信された要求から前記データユニットの識別子を取得するステップと、前記データユニットの経路演算方法に従い前記データユニット識別子に基づいて前記データユニットを格納する前記データノードの識別子と前記データユニットの前記データノードにおける位置情報とを計算するステップと、前記データノードの識別子と前記データ管理ノードへの位置情報とを提供するステップとである。
上記方法において、前記データ管理ノードは、格納操作を計算操作から分離する。
前記格納操作は、格納タスクキューに対応するスレッドプールを用いて実行され、前記計算操作は、計算タスクキューに対応するスレッドプールを用いて実行される。
上記方法は、前記データ管理ノードからデータ操作コマンドを受けた後、前記データノードが前記操作コマンドに従って前記データノードのローカルのファイルシステムにより前記データユニットを処理するステップをさらに含む。
上記方法において、前記データユニットは一意識別子を有する。前記データユニットの識別子は、前記データユニットを格納する前記データノードの識別子および前記データユニットの前記データノードにおける位置情報を用いて、マッピングを介して計算される。
上記方法において、前記データノードにおける前記データユニットを処理するステップは、書き込み用のブロックのコピーをログファイルに提示するステップと、前記ログファイルに前記書き込み用のブロックのコピーを成功して提示した後、前記データノードのローカルのファイルシステムに前記書き込み用のブロックを提示するステップと、前記ファイルシステムへの前記書き込み用のブロックを成功して提示した場合、前記ログファイルから前記ブロックのコピーを消去するか、または反対に前記ブロックのコピーを保持するステップとをさらに含む。
前記システムが異常状態から正常状態に復帰したときに、前記ログファイルに記録されたブロックのコピーに従いデータ復旧が実行される。
上記方法は、前記データノードのファイルロックおよび/または前記ネットワークファイルシステムのファイルロックを使用し、前記データユニットへのアクセスをロック保護するステップをさらに含む。
本発明は下記の利益を有することができる。
(1)ネットワークデータを格納する本開示のシステムは、データを分散型の方法で三層構造のネットワークノードに格納し、統一されたアクセス管理とルーティングを提供することによって、リニアな拡張およびアップグレードをサポートする。従って、既存技術と比較すると、本開示のシステムは、より良い拡張性とより低い拡張コストとを有する。
(2)本開示のネットワークデータにアクセスするメカニズムは、上記分散型データ格納システムに基づき、二段階の経路演算方法を採用する。これにより、データファイルの位置をクライアントに対して透明化することができる。三層構造の分散型設計は、中間層のデータ管理ノードがデータアクセスに対する処理操作を共有することを可能にするので、巧みに三層構造を構成することにより、ネットワークデータのアクセス性能を改善することができる。
(3)本開示は、ジャーナリング技術をさらに採用して、トランザクション処理をサポートし、ネットワークデータアクセスの一貫性および完全性を改善する。
(4)本開示は、ロック管理機能をさらに採用して、ネットワークファイルシステム内のファイルロック失敗の問題を解決する。
本開示による典型的なネットワークデータを格納するシステムの概略構造図を示す図である。 本開示による典型的なネットワークデータを格納するシステムのツリー構造を説明する概略図を示す図である。 本開示による典型的なネットワークデータにアクセスするプロセスを説明する概略図を示す図である。
例示的な実施形態および図面を用いて、本発明を詳細に説明する。
図1は、本開示によるネットワークデータを格納する例示的なシステムの概略構造図である。このデータを格納するシステムは、下記を含む。
データノード:データノードは、ネットワーク内のノードであり、生データおよびインデックスを格納するために用いられる。この生データは、データユニットの形式でデータノードに格納される。
管理ノード:データ管理ノードは、ネットワーク内のノードであり、中間層として振る舞い、索引付け、冗長性ストラテジーなどのお決まりのサービスを提供するために用いられる。管理ノードは、1つのグループの関連するデータノードを管理する。
メタノード:データノードの名称、空間および関係性マッピングを管理するメタデータノードは、ネットワーク内のノードであり、基礎的な経路情報を提供するために用いられる。メタノードによって主に保持される2つの経路の関係は、メタノードから管理ノードまでの経路(一次経路)および管理ノードからデータノードまでの経路(二次経路)である。
トランザクションログ:ジャーナリング技術に基づくトランザクション管理ノードであり、一般的には、管理ノードに配置され、ログファイルを格納し、トランザクションデータ保護を実現するために用いられる。
ロックノード:グローバルネットワークノードであり、ファイルの形式でデータロックを格納し、データアクセスのロック管理を実現するために用いられる。
図1のネットワークデータストレージシステムのアーキテクチャは、図2に示すようにツリー構造に組織化される。
図2は、本開示による格納するネットワークデータのための例示的なシステムのツリー構造を示す概略図である。
図に示すように、ネットワークデータストレージシステムにおけるノードは論理的に三層に分けられる。最下層から最上層までは、データノード、管理ノード、およびメタノードである。メタノードはルートノードとして振る舞い、複数のリーフノードとして管理ノードを有し、さらに、各管理ノードは、リーフノードとして複数のデータノードを順に有する。
前記の例示的な実施例のネットワークデータストレージシステムを、下記の手段を用いて構成することができる。
ステップ1:データユニットを判定し、IDをデータユニットに割り当て、データノードの中にデータユニットを分散して格納する。
この例示的な実施形態におけるデータユニットは、ファイルシステムの層を超える抽象的なデータセットのことをいう。業務の特徴および業務の必要性に基づき、単独で管理することができる最小データセットとしてデータユニットを定義することができる。企業データの大部分の要求および処理は、明確な局所性の特徴を有する。例えば、電子メールシステムにおいて、電子メールを分類すること、索引作成すること、受信することおよび送信することは、1つの電子メールアカウントのような固定名称の空間内で実現される。この場合では、電子メールアカウントをデータユニットとして取り扱うことができる。
データユニットは、例えば、データファイル、インデックスファイル、およびファイルディレクトリなど、複数のファイルまたはディレクトリをその中に含むことができる。これらのファイルおよびディレクトリは、データユニットを格納するデータノード内のローカルのファイルシステムにより管理される。
データユニットのIDは、データユニットを一意的に識別する。データユニットのIDは、2個の情報を含む。すなわち、データユニットを格納するデータノードのID、およびデータユニットのデータノードにおける具体的な位置情報である。これらの2個の情報を、データユニットの経路演算方法を用いてデータユニットのIDから計算することができる。従って、データユニットのIDは、データユニットとデータユニットを格納するデータノードとの間の対応関係を暗に含む。
ステップ2:経路演算方法と経路情報を判定し、メタノードに情報を格納する。
メタノードによって保持される経路情報は、以下を含む。すなわち、メタノードから管理ノードまでの経路の情報(すなわち、一次経路情報)、および管理ノードからデータノードまでの経路の情報(すなわち、二次経路情報)である。これらの2種類の経路情報は、下記のマッピング関係およびマッピング演算方法を用いて実装される。
データユニット情報(例えば、データユニットの名称)と関連したデータユニットのIDとの間のマッピング関係テーブル、およびデータノードIDと管理ノードIDとの間のマッピング関係テーブルを確立し、経路演算方法を用いてデータユニットを格納するデータノードのIDとこのデータユニットのデータノードにおける具体的な位置情報とをデータユニットのIDから取得することができるように、データユニットの経路演算方法を設定する。
一次経路を実装するプロセスは、下記を含むことができる。すなわち、データユニット情報とデータユニットのIDとの間のマッピング関係テーブル、データユニットの経路演算方法、およびデータノードIDと管理ノードIDとの間のマッピング関係テーブルを順に適用することにより、メタノードから管理ノードまでの経路を取得する。
二次経路を実装するプロセスは、下記を含む。すなわち、管理ノードからメタノードに要求を送信し、管理ノードからメタデータによるデータユニットの経路演算方法に従い要求されたデータユニットを格納するデータノードまでの経路を取得する。
ステップ3:管理ノードを下記のように配置する。
管理データアクセスサービス(例えば、インデックスサービス)に配置し、場合によっては冗長性ストラテジーも配置する。そして、
管理ノード内部で、格納(入出力制約タスク)と計算(CPU制約タスク)を分離する技術を採用し、タスクを2つのキューに分ける。すなわち、計算タスクキューと格納タスクキューは、2つの分かれたスレッドプールにより同時に完了し、CPUおよびI/Oリソースを充分に利用する。
前述の例示的な実施形態におけるネットワークデータストレージシステムに基づき、ネットワークデータにアクセスする過程が、図3に示される。
図3は、本開示によるネットワークデータにアクセスする例示的な過程を説明する概略図を示す。本プロセスは下記のステップを含む。
S301で、クライアントは、メタノードへデータにアクセスする要求を送信し、アクセスを要求されているデータユニットの記述的情報(例えば、データユニットの名称)を提供する。
S302で、メタノードは、クライアントに一次経路情報を返し、データユニットを管理する責任がある管理ノードの位置情報を提供する。
メタノードは、クライアントの要求からデータユニットの記述的情報を取得し、データユニットの記述的情報とデータユニットIDとの間のマッピング関係テーブルに基づき、クライアントによって要求されたデータユニットのIDを取得する。データユニットの経路演算方法に基づき、データユニットを格納するデータノードのIDを、データユニットのIDから計算する。データノードIDと管理ノードIDとの間のマッピング関係テーブルを用いて、データノードを管理する管理ノードのIDを続けて取得する。獲得した管理ノードのIDは次いで、メタノードによりクライアントに送られる。
S303で、クライアントは、一次経路情報を用いて管理ノードを探し出した後、データにアクセスする要求を管理ノードに送信する。
S304で、管理ノードは、クライアントの識別および要求内のデータユニットの情報に従って、データユニットのネットワークにおける位置をメタノードに要求する。
上記S302において、メタノードがクライアントに一次経路情報を返す場合に、メタノードはクライアントが要求したデータユニットのIDも同時に返すことができる。この場合、S303でデータにアクセスするクライアントの要求は、アクセスを要求されているデータユニットのIDを含み、ステップS304における管理ノードからメタノードへの要求もデータユニットのIDを含む。
S305で、メタノードは、管理ノードに二次経路情報を返し、データユニットのネットワークにおける位置を知らせる。
管理ノードにより送信された要求から、メタノードはデータユニットのIDを取得し、データユニットの経路演算方法を用いてデータユニットのIDから、データノードIDおよびデータノード内のデータユニットの具体的な位置を計算し、この情報を管理ノードに返す。
S306で、管理ノードは、位置情報に基づき、データユニットを格納するデータノードおよびデータユニットのデータノードにおける位置を探し出し、クライアントの要求に従って、データユニット中のデータを処理する。
データノードは、管理ノードの操作コマンドに従いローカルファイルシステムを介してデータユニットを処理する。
S307で、管理ノードは、必要に応じて、データ処理結果をクライアントに返す。
データにアクセスする上記過程において、管理ノードは格納(入出力制約タスク)と計算(CPU制約タスク)を内部で分離する技術を採用し、タスクを2つのキューに分け、計算タスクキューおよび格納タスクキューは、それぞれ2つの分かれたスレッドにより同時に完了する。
データにアクセスする上記の過程は、また、本発明の例示的な実施形態の中でジャーナリングメカニズムおよびロック技術を含むトランザクション処理メカニズムを利用して、ネットワークデータアクセスの信頼性を保証している。
多くのファイル操作は、非アトミックアクティビィティ(non-atomic activities)である。特に複数のファイルまたは複数のノードに渡る過程において、データの一貫性および完全性は損傷する傾向があり、異常なシステムのシャットダウンなど、異常な状態を誘引する。データベースおよびオペレーティングシステムのファイルシステムによって提供されるログ保護メカニズムの着想を取り入れて、本発明は、本発明の実施形態におけるような非データベース構造を有するデータにアクセスするためトランザクション保護メカニズムを提供する。
本開示の例示的な実施形態におけるデータユニットがアクセスされる場合(例えば、アクセスまたは格納操作)、書き込み用ブロックのコピーがログファイルに書き込まれる。ログファイルに送られた関連した入出力データが完全に転送されたとき(すなわち、データはログファイルへ成功して提示された)、データノードのローカルのファイルシステムにブロックが書き込まれる。ファイルシステムへ送られている入出力データが完全に送信された場合(すなわち、ファイルシステムへデータが成功して提示された場合)、ログファイルからブロックのコピーが除去される。ファイルシステムへの入出力データの送信が失敗した場合、ログファイルはこのブロックのコピーを残す。
システムがクラッシュした場合、または必要に応じてシステムを再起動する場合、システムは先ずログファイルを読み取り、ログファイル中に記録されたブロックのコピーに従い復旧を行い、例外の発生前の正常な状態にシステムは復旧することができる。
トランザクションの分離性を強化するため、本発明の例示的な実施形態はさらに、ロックメカニズムを備える。トランザクションの分離性は、一般的には、トランザクションによってアクセスされているリソースをロックすることにより保証される。さらに、ロッキング技術は、ファイルトランザクションの特性、並行処理および高信頼性を保証するため、非常に有用なツールである。
本発明の例示的な実施形態は、ローカルのハードディスク内で広く用いられるシングルノードのファイルロックであるDotlockおよびネットワークファイルシステムにより採用されているBSDベースのシステムのPOSIX−compliant Flock()またはFcntl()の組み合わせを使用する。具体的な実装は、下記のとおりである。
先ず、DotLockを取得する。このステップで、複数のノードによる取得は、可能性がある。成功した取得の後で、Flock()またはFcntl()の取得を試みる。これらのロックは、ファイルの形式で、グローバルノード内に保存される。復旧の間、システムは、任意のサスペンデッドロックをチェックし、解放する。ロック粒度は、1つのデータブロック、1つのファイル、1つのディレクトリ、または1つのデータノードに対してさえ、1つのロックであってよい。
下記では、説明のため、大容量の電子メールシステムにストレージ機能を追加した例を使用する。
ステップ1:データプランを行い、システムによって管理される最小のデータユニットを判定する。
電子メールアドレス(電子メールアカウント)は、一般的に、ユーザ名とドメイン名、それらの間の記号@から構成される。電子メールアカウントを最小のデータユニットとしてカウントすることや、ドメイン名をデータユニットとして取り扱うことができる。例示的な本実施形態は、電子メールアカウントをデータユニットとなるように選択する。
ステップ2:経路演算方法およびルーティングテーブルを判定する。
経路演算方法をプラニングする目的は、ユーザにより提供される電子メールアカウントに基づき、メールボックスの内容の格納場所をいかにして探し出すかという問題を解決することである。常時拡張するシステムの要領をサポートするため、例示的な実施形態は、ルーティングのために32ビットのアドレス空間を使用する。従って、最大1G(すなわち、約10億)のユーザをサポートすることができる。この32ビットのアドレス空間は、RID(Route ID)と呼ばれ、電子メールアカウントを一意的に識別することのために用いられる。例示的な本実施形態は、1つのデータノードは1M(220=1,048,576)のユーザまでをサポートすることができると仮定する。従って、データノードに対するアドレス空間のサイズは1Mであり、具体的なアドレスを、一般的にローカルのファイルシステムのディレクトリにより表すことができる。例示的な本実施形態は、具体的なディレクトリをマッピングすることのために下位20ビットを使用し、データノード内の内部アドレスデータIDと呼ばれる。各データノードは、一意の連続する番号NSN(Node Sequence Number)を有し、32ビットのRIDの上位12ビットにより、表される。具体的には、RID>>20=NSN、すなわち、RIDを20ビット右シフトするとNSNが得られる。
メタノードに格納されたルーティングテーブルの例が、表1および表2に示される。
Figure 2010507876
Figure 2010507876
表2は、各々の管理ノードが3つのノードを管理することを示す。アドレスxxx@yyy.comからの要求は、識別子worker−1を有する管理ノードによって処理される。
ステップ3:データプランとルーティングストラテジーの制定後、容量プランを行う。
ユーザが少ないときは、1台の管理ノードと1つのデータノード(0の連続番号を持ち、0−1Mのユーザを管理することに対して責任がある)を配置することができる。ユーザの数が増加するにつれて、1つのデータノードではもはや格納の要求を満足することができない場合に、新しいデータノードが追加される。新しいデータノードの連続番号を1、すなわち、関連したRIDの上位12ビットが000000000001と仮定する。この新しいデータノードは、RIDの下位20ビットの1Mと2Mとの間のユーザを管理することに対し責任がある。上記のように、業務が拡張し続けるにつれて、システムは直線的に拡張し続けることができるので、大量のデータの格納を実現することができる。
ステップ4:メタノードを配置する。
表1および表2のような経路情報テーブルを、メタノードのデータベースに格納することができ、または、ファイルの形式で格納することができる。経路情報テーブルはサイズにおいて大きくないため、サーバが起動した後、ルーティングテーブル全体を内部メモリに置くことができる。これは、クライアントの要求に対し迅速な応答を可能にする。異なるアプリケーションに対し、異なるストラテジーを採用することができる。例えば、良く組織化されたデータ規則を持つ簡単なアプリケーションに対しては、メタノードを、アプリケーションによって提供される一意のデータIDを用いて実装される2段階のハッシュアルゴリズムまで単純化することができる。
ステップ5:管理ノードのサービスを配置し、インデックスを制定するように設定を指定する。
格納する必要があるデータに索引付けをするために、管理ノードにデータ検索機能を追加する。関係のあるデータノードにインデックスファイルおよびデータファイルが格納される。業務に関係のあるデータ処理が要求された場合、サービス機能を果たす関係のある論理ジョブを、関連したサーバ内に配置する。管理ノードは、格納と計算とを分離する技術を使用して、システムの性能を充分に調査する。
今後の業務の発展に伴い、システムは、要求されたように連続してその容量を拡張することができる。ユーザの数が増加するにつれて、データノードを連続的に追加することができる。3つのデータノードが追加される毎に、1つの新しい管理ノードを配置することができる。メタノードに関しては、一般的には、1台のサーバしか必要としない。代替的に、システムのシングルポイントとならないようにするため、バックアップメカニズムを採用し、バックアップ用の追加のメタノードサーバを追加することができる。
前記の好ましい実施形態は、比較的簡単な電子メールシステムに照準をあてている。しかしながら、例示的な実施形態により示されるような本発明のネットワークデータストレージシステムのアプリケーションシナリオは、この特定の種類のアプリケーションに限られない。本開示の例示的な実施形態により示されるネットワークデータストレージシステムは、B2B電子商取引のプラットフォームおよびソフトウェアに特に適している。この種のアプリケーションは、一般的に、企業およびユーザが中心であり、大量のオンライントランザクション処理を有する。従って、1ユーザまたは1企業を、1つのデータユニットの集合として扱うことができる。データは、主に内部で所有されるため、他のユーザは、このデータにアクセスすることを許されない。管理のためにこのデータを1つのデータユニットの集合として取り扱うことは、企業データが物理的に独立し分離性することを保証し、他のユーザのデータと混ざることがなくなる。このことは、また、オンライン検索および業務処理を同時にサポートする。
データベースと比較すると、この方法は明らかな利点を有する。データベースは、各企業ユーザに対し一組のデータベースを生成することができず、一般的には、同じ種類の全ての企業のアプリケーションのデータを、安全な分離は物理的に実装されていない1つのテーブルに置かなければならない。このため、不正アクセスなどの問題を処理する関連したアプリケーションを必要とする。多くの数のユーザがあるとき、このデータベースの方法は、深刻な性能の問題を引き起こす可能性がある。
明らかに、当業者は、本発明の趣旨および範囲を逸脱せずに、多くの異なる方法で本発明に変更および修正を行うことができる。従って、本発明は、本発明の特許請求の範囲およびその均等の範囲に含まれる全ての変更および変形を網羅することが意図される。

Claims (21)

  1. データユニットを格納するために用いられるデータノードと、
    経路情報を格納、管理するために用いられ、クライアントのデータ処理要求に従って、経路情報を提供するメタデータノードと、
    前記クライアントのデータアクセス要求に従って、前記データノードにおける要求されたデータユニットを処理するために用いられるデータ管理ノードと
    を備えることを特徴とするネットワークデータを格納するシステム。
  2. 前記メタデータノード、前記データ管理ノード、および前記データノードは、互いにツリー構造内で接続され、
    前記メタデータノードは、前記ツリー構造のルートノードであり、前記ルートノードは、下で1つまたは複数のデータ管理ノードと接続しており、
    各データ管理ノードは、下で1つまたは複数のデータノードと接続することを特徴とする請求項1に記載のシステム。
  3. 前記メタデータノードに格納された前記経路情報は、
    前記メタデータノードから前記データ管理ノードまでの経路に関する経路情報と、
    前記データ管理ノードから前記データノードまでの経路に関する経路情報と
    を備えることを特徴とする請求項1に記載のシステム。
  4. 前記メタデータノードは、前記データユニットの経路演算方法をさらに格納し、前記経路演算方法は、前記データユニットを格納する前記データノードの識別子および前記データユニットの前記データノードにおける位置情報を計算するためのものであることを特徴とする請求項3に記載のシステム。
  5. 前記データ管理ノードは、データアクセスサービスおよび/またはその中に配置された冗長性ストラテジーを有することを特徴とする請求項1に記載のシステム。
  6. 前記データノードに格納された前記データユニットは、業務アプリケーション向けの最小データセットであることを特徴とする請求項1に記載のシステム。
  7. 前記データユニットは、内部に複数のファイルおよび/またはディレクトリを含むことを特徴とする請求項6に記載のシステム。
  8. 前記データユニット内のファイルは、データファイルおよび/またはインデックスファイルを含むことを特徴とする請求項7に記載のシステム。
  9. 前記システムは、ログファイルを格納するために用いられ、ログ管理サービスを提供するログ管理ノードをさらに備えることを特徴とする請求項1に記載のシステム。
  10. 前記システムは、ロックファイルを格納するために用いられ、ロック管理サービスを提供するロックノードをさらに備えることを特徴とする請求項1または9に記載のシステム。
  11. クライアント内で、データユニットへのアクセスの要求をメタデータノードに送信し、前記メタデータノードからデータ管理ノードの経路情報を受信するステップと、
    前記クライアント内で、前記データ管理ノードの前記経路情報に従って、前記データユニットへのアクセスの要求を前記データ管理ノードに送信するステップと、
    前記データ管理ノード内で、前記要求を受信した後、前記データユニットを格納するデータノードの経路情報を前記メタデータノードから取得し、前記データノードの前記経路情報および前記クライアントにより要求された操作に従って、前記データノードにおける前記データユニットを処理するステップと
    を備えることを特徴とするネットワークデータにアクセスする方法。
  12. 前記クライアントから前記データユニットへのアクセスの要求を受信した後、前記メタデータノードは、前記データ管理ノードの経路情報を前記クライアントに、
    前記メタデータノード内で、前記データユニットへのアクセス要求から前記データユニットの情報を取得し、前記データユニットの情報および前記データユニットの識別子との間のマッピング関係に基づき、前記データユニットの識別子を取得するステップと、
    前記データユニットの経路演算方法に基づき、前記データユニットの識別子から前記データユニットを格納する前記データノードの識別子を計算するステップと、
    前記データノードの識別子と前記データ管理ノードの識別子との間のマッピング関係に基づき、前記データ管理ノードの識別子を取得し、前記クライアントに前記データ管理ノードの識別子を提供するステップと
    を備える過程を用いて、送信することを特徴とする請求項11に記載の方法。
  13. 前記メタデータノードは、前記データノードの前記経路情報を前記データ管理ノードに、
    前記管理ノードから送信された要求から前記データユニットの識別子を取得するステップと、
    前記データユニットの経路演算方法に従い、前記データユニットの前記識別子に基づいて、前記データユニットを格納する前記データノードの識別子および前記データユニットの前記データノードにおける位置情報を計算するステップと、
    前記データノードの前期識別子および前記位置情報を前記データ管理ノードに提供するステップと
    を備える手順を用いて提供することを特徴とする請求項11に記載の方法。
  14. 前記データ管理ノードは、格納操作を計算操作から分離することを特徴とする請求項11に記載の方法。
  15. 前記格納操作は、格納ジョブキューに対応するスレッドプールを使用して実行され、前記計算操作は、計算ジョブキューに対応するスレッドプールを使用して実行されることを特徴とする請求項14に記載の方法。
  16. 前記方法は、前記データ管理ノードからデータ操作コマンドを受けた後、前記操作コマンドに従い、前記データノードのローカルのファイルシステムを利用して、前記データノードで前記データユニットを処理するステップをさらに備えることを特徴とする請求項11に記載の方法。
  17. 前記データユニットは一意識別子を有することを特徴とする請求項11乃至16のいずれかに記載の方法。
  18. 前記データユニットの識別子は、前記データユニットを格納する前記データノードの識別子および前記データユニットの前記データノードにおける位置情報を用いて、マッピングを介して計算されることを特徴とする請求項17に記載の方法。
  19. 前記データノードにおける前記データユニットを処理するステップは、
    書き込み用ブロックのコピーをログファイルに提示するステップと、
    前記書き込み用ブロックのコピーを前記ログファイルに成功して提示した後、前記データノードにおける前記ローカルのファイルシステムに前記書き込み用ブロックを提示するステップと、
    前記書き込み用ブロックを前記ファイルシステムへ成功して提示した場合、前記ログファイルから前記ブロックのコピーを消去するか、さもなければ前記コピーを保持するステップと
    をさらに備えることを特徴とする請求項11に記載の方法。
  20. 前記方法は、前記システムが異常状態から正常状態に復帰したときに、前記ログファイルに記録された前記ブロックのコピーに従い、データ復旧を実行することを特徴とする請求項19に記載の方法。
  21. 前記方法は、前記データノードのファイルロックおよび/または前記ネットワークファイルシステムのファイルロックを利用して、前記データユニットへのアクセスをロック保護するステップをさらに備えることを特徴とする請求項11または19に記載の方法。
JP2009534958A 2006-10-26 2007-08-27 ネットワークデータストレージシステムおよびそのデータアクセス方法 Active JP5567342B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200610150325.3 2006-10-26
CN2006101503253A CN101170416B (zh) 2006-10-26 2006-10-26 网络数据存储系统及其数据访问方法
PCT/CN2007/070564 WO2008049353A1 (fr) 2006-10-26 2007-08-27 Système de mise en mémoire de données de réseau et procédé pour y accéder

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012243816A Division JP5730271B2 (ja) 2006-10-26 2012-11-05 ネットワークデータストレージシステムおよびそのデータアクセス方法

Publications (2)

Publication Number Publication Date
JP2010507876A true JP2010507876A (ja) 2010-03-11
JP5567342B2 JP5567342B2 (ja) 2014-08-06

Family

ID=39324142

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009534958A Active JP5567342B2 (ja) 2006-10-26 2007-08-27 ネットワークデータストレージシステムおよびそのデータアクセス方法
JP2012243816A Active JP5730271B2 (ja) 2006-10-26 2012-11-05 ネットワークデータストレージシステムおよびそのデータアクセス方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012243816A Active JP5730271B2 (ja) 2006-10-26 2012-11-05 ネットワークデータストレージシステムおよびそのデータアクセス方法

Country Status (6)

Country Link
US (1) US8953602B2 (ja)
EP (1) EP2081329B1 (ja)
JP (2) JP5567342B2 (ja)
CN (1) CN101170416B (ja)
HK (1) HK1114487A1 (ja)
WO (1) WO2008049353A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916275B (zh) * 2010-08-13 2012-07-25 中国石油天然气集团公司 一种多数据源测井数据访问方法及系统
CN101980203A (zh) * 2010-10-29 2011-02-23 中国科学院声学研究所 一种用于高清媒体的嵌入式文件系统
CN102122306A (zh) * 2011-03-28 2011-07-13 中国人民解放军国防科学技术大学 一种数据处理方法及应用该方法的分布式文件系统
CN102521297B (zh) * 2011-11-30 2015-09-09 北京人大金仓信息技术股份有限公司 无共享数据库集群中实现系统动态扩展的方法
CN102591970B (zh) * 2011-12-31 2014-07-30 北京奇虎科技有限公司 一种分布式键-值查询方法和查询引擎系统
CN104050249B (zh) * 2011-12-31 2018-03-30 北京奇虎科技有限公司 分布式查询引擎系统和方法及元数据服务器
CN104050250B (zh) * 2011-12-31 2018-06-05 北京奇虎科技有限公司 一种分布式键-值查询方法和查询引擎系统
CN103678333B (zh) * 2012-09-03 2018-12-25 北京千橡网景科技发展有限公司 用于提高统一资源定位符提取准确率的方法和设备
CN104955581B (zh) 2012-11-02 2017-11-17 脉动灌溉产品股份有限公司 具有两个预设的压力响应常闭阀的脉动装置
CN102981933B (zh) * 2012-12-18 2015-05-13 武汉邮电科学研究院 物联网感知层的数据增量备份方法及系统
CN103064635B (zh) * 2012-12-19 2016-08-24 华为技术有限公司 分布式存储方法和分布式存储装置
US9201837B2 (en) 2013-03-13 2015-12-01 Futurewei Technologies, Inc. Disaggregated server architecture for data centers
CN103235765B (zh) * 2013-05-06 2015-11-25 杭州和利时自动化有限公司 一种智能仪表设备管理方法、系统及装置
CN103268460B (zh) * 2013-06-20 2016-02-10 北京航空航天大学 一种云存储数据完整性验证方法
CN103338269B (zh) * 2013-07-19 2016-12-28 中国人民解放军信息工程大学 一种数据传输方法及装置
CN104378396B (zh) * 2013-08-15 2018-05-15 上海七牛信息技术有限公司 数据管理装置及方法
KR102104882B1 (ko) * 2013-12-03 2020-04-27 에스케이 텔레콤주식회사 M2m 클라우드 스토리지 서비스 제공방법 및 장치
CN104932986A (zh) * 2014-03-19 2015-09-23 中国移动通信集团公司 一种数据重分布方法及装置
CN104021139B (zh) * 2014-04-29 2017-11-24 深圳英飞拓科技股份有限公司 一种视频数据存取方法及装置
CN104268013B (zh) * 2014-10-17 2017-05-17 中国人民解放军国防科学技术大学 一种快速的全系统模拟器确定性回放方法
CN104408056B (zh) * 2014-10-29 2020-09-15 中国建设银行股份有限公司 一种数据处理方法和装置
CN104331460A (zh) * 2014-10-31 2015-02-04 北京思特奇信息技术股份有限公司 一种基于Hbase的数据读写操作方法及系统
CN105205156A (zh) * 2015-09-25 2015-12-30 浪潮(北京)电子信息产业有限公司 一种数据管理方法、装置及系统
CN105868253A (zh) * 2015-12-23 2016-08-17 乐视网信息技术(北京)股份有限公司 数据导入、查询方法及装置
CN106170012A (zh) * 2016-06-29 2016-11-30 上海上大海润信息系统有限公司 一种面向云渲染的分布式文件系统及构建和访问方法
US10455045B2 (en) 2016-09-06 2019-10-22 Samsung Electronics Co., Ltd. Automatic data replica manager in distributed caching and data processing systems
US10467195B2 (en) 2016-09-06 2019-11-05 Samsung Electronics Co., Ltd. Adaptive caching replacement manager with dynamic updating granulates and partitions for shared flash-based storage system
CN106817402B (zh) * 2016-11-29 2018-02-27 上海壹账通金融科技有限公司 缓存数据的处理方法及装置
CN106874468B (zh) * 2017-02-15 2021-02-19 北京亚信数据有限公司 一种影像文件管理的方法及系统
KR102503177B1 (ko) * 2018-03-05 2023-02-24 에스케이하이닉스 주식회사 메모리 시스템 및 그것의 동작 방법
CN108710621A (zh) * 2018-03-12 2018-10-26 广东睿江云计算股份有限公司 一种基于ceph实现MySQL数据库水平扩展的方法
CN110727738B (zh) * 2019-12-19 2020-08-07 北京江融信科技有限公司 基于数据分片的全局路由系统、电子设备及存储介质
CN111444046B (zh) * 2020-06-16 2021-01-22 北京金山云科技有限公司 一种数据恢复方法及分布式数据恢复系统
CN112667577A (zh) * 2020-12-25 2021-04-16 浙江大华技术股份有限公司 一种元数据管理方法、元数据管理系统及存储介质
CN114827145B (zh) * 2022-04-24 2024-01-05 阿里巴巴(中国)有限公司 服务器集群系统、元数据的访问方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266600A (ja) * 1993-03-12 1994-09-22 Hitachi Ltd 分散ファイルシステム
JPH06332782A (ja) * 1993-03-22 1994-12-02 Hitachi Ltd ファイルサーバシステム及びそのファイルアクセス制御方法
JP2003248611A (ja) * 2002-02-26 2003-09-05 Hitachi Ltd 記憶管理統合システム、および、その記憶管理制御方法
JP2003296167A (ja) * 2002-03-29 2003-10-17 Fujitsu Social Science Laboratory Ltd ファイル管理システムおよびファイル管理方法
JP2004171224A (ja) * 2002-11-19 2004-06-17 Nec Corp 契約ストレージ代行提供システムおよび契約ストレージ代行提供方法
JP2004227127A (ja) * 2003-01-21 2004-08-12 Hitachi Ltd 複数の環境情報を持つプログラムおよびこのプログラムを持つ情報処理装置
JP2004318743A (ja) * 2003-04-21 2004-11-11 Hitachi Ltd ファイル移送装置
JP2005322020A (ja) * 2004-05-10 2005-11-17 Hitachi Ltd ストレージシステム、ファイルアクセス制御プログラム及びファイルアクセス制御方法
JP2006003962A (ja) * 2004-06-15 2006-01-05 Hitachi Ltd ネットワークストレージシステム
JP2006164169A (ja) * 2004-12-10 2006-06-22 Hitachi Ltd 名前空間を共有するクラスタ構成のネットワークストレージシステム及びその制御方法

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737732A (en) 1992-07-06 1998-04-07 1St Desk Systems, Inc. Enhanced metatree data structure for storage indexing and retrieval of information
JPH06323782A (ja) 1993-05-17 1994-11-25 Ishikawajima Harima Heavy Ind Co Ltd 排ガスエコノマイザの洗浄方法
US5970496A (en) 1996-09-12 1999-10-19 Microsoft Corporation Method and system for storing information in a computer system memory using hierarchical data node relationships
SE514727C2 (sv) 1998-11-12 2001-04-09 Ericsson Telefon Ab L M Kommunikationsnät och förfarande för att dirigera meddelanden inom nätet
JP3490642B2 (ja) 1999-06-30 2004-01-26 松下電器産業株式会社 送信装置および送信方法、受信装置および受信方法、ならびに、送受信システムおよび送受信方法
AU6852800A (en) * 1999-08-19 2001-03-19 Matrix Device Limited Recursive dynamic access to a data model having a hierarchical tree structure
US7320065B2 (en) * 2001-04-26 2008-01-15 Eleven Engineering Incorporated Multithread embedded processor with input/output capability
GB0112017D0 (en) * 2001-05-17 2001-07-11 Koninkl Philips Electronics Nv Wireless master-slave distributed communications network
US20020199017A1 (en) 2001-06-25 2002-12-26 Russell Lance W. Routing meta data for network file access
US20030120896A1 (en) * 2001-06-29 2003-06-26 Jason Gosior System on chip architecture
JP2003167815A (ja) 2001-11-30 2003-06-13 Hitachi Ltd データアクセス制御方法
JP4146653B2 (ja) 2002-02-28 2008-09-10 株式会社日立製作所 記憶装置
KR100453228B1 (ko) 2002-03-21 2004-10-15 한국전자통신연구원 공유 디스크 파일 시스템의 저널링 및 회복 방법
US7590618B2 (en) 2002-03-25 2009-09-15 Hewlett-Packard Development Company, L.P. System and method for providing location profile data for network nodes
US7024519B2 (en) 2002-05-06 2006-04-04 Sony Computer Entertainment Inc. Methods and apparatus for controlling hierarchical cache memory
US7448077B2 (en) 2002-05-23 2008-11-04 International Business Machines Corporation File level security for a metadata controller in a storage area network
US7466698B2 (en) 2002-06-04 2008-12-16 Alcatel-Lucent Usa Inc. Network node with layer 3 interfaces configurable by interface class
US20040015486A1 (en) 2002-07-19 2004-01-22 Jiasen Liang System and method for storing and retrieving data
US7127465B2 (en) 2002-09-30 2006-10-24 Sun Microsystems, Inc. Memory-efficient metadata organization in a storage array
US7509645B2 (en) 2002-10-17 2009-03-24 Intel Corporation Methods and apparatus for load balancing storage nodes in a distributed network attached storage system
GB2395809B (en) * 2002-11-28 2005-12-21 Ibm Metadata lock management in advanced function n-way shared storage controller systems
US20040122917A1 (en) * 2002-12-18 2004-06-24 Menon Jaishankar Moothedath Distributed storage system for data-sharing among client computers running defferent operating system types
US20040153481A1 (en) * 2003-01-21 2004-08-05 Srikrishna Talluri Method and system for effective utilization of data storage capacity
US7610348B2 (en) * 2003-05-07 2009-10-27 International Business Machines Distributed file serving architecture system with metadata storage virtualization and data access at the data server connection speed
GB0310689D0 (en) * 2003-05-09 2003-06-11 Ibm Monitoring operational data in data processing systems
US7523130B1 (en) 2004-01-28 2009-04-21 Mike Meadway Storing and retrieving objects on a computer network in a distributed database
US8249113B2 (en) * 2004-03-19 2012-08-21 Broadlogic Network Technologies, Inc. Method and system for providing faster channel switching in a digital broadcast system
US7490089B1 (en) * 2004-06-01 2009-02-10 Sanbolic, Inc. Methods and apparatus facilitating access to shared storage among multiple computers
US20060031230A1 (en) 2004-07-21 2006-02-09 Kumar Sinha M Data storage systems
CN100367727C (zh) * 2005-07-26 2008-02-06 华中科技大学 一种可扩展的基于对象的存储系统及其控制方法
US7499905B2 (en) 2005-10-17 2009-03-03 Cisco Technology, Inc. Method and apparatus for accessing information based on distributed file system (DFS) paths
US20070150492A1 (en) * 2005-12-27 2007-06-28 Hitachi, Ltd. Method and system for allocating file in clustered file system
US20070214314A1 (en) 2006-03-07 2007-09-13 Reuter James M Methods and systems for hierarchical management of distributed data
US20070233868A1 (en) * 2006-03-31 2007-10-04 Tyrrell John C System and method for intelligent provisioning of storage across a plurality of storage systems
CN100505762C (zh) * 2006-04-19 2009-06-24 华中科技大学 适用于对象网络存储的分布式多级缓存系统
US7840969B2 (en) * 2006-04-28 2010-11-23 Netapp, Inc. System and method for management of jobs in a cluster environment

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266600A (ja) * 1993-03-12 1994-09-22 Hitachi Ltd 分散ファイルシステム
JPH06332782A (ja) * 1993-03-22 1994-12-02 Hitachi Ltd ファイルサーバシステム及びそのファイルアクセス制御方法
JP2003248611A (ja) * 2002-02-26 2003-09-05 Hitachi Ltd 記憶管理統合システム、および、その記憶管理制御方法
JP2003296167A (ja) * 2002-03-29 2003-10-17 Fujitsu Social Science Laboratory Ltd ファイル管理システムおよびファイル管理方法
JP2004171224A (ja) * 2002-11-19 2004-06-17 Nec Corp 契約ストレージ代行提供システムおよび契約ストレージ代行提供方法
JP2004227127A (ja) * 2003-01-21 2004-08-12 Hitachi Ltd 複数の環境情報を持つプログラムおよびこのプログラムを持つ情報処理装置
JP2004318743A (ja) * 2003-04-21 2004-11-11 Hitachi Ltd ファイル移送装置
JP2005322020A (ja) * 2004-05-10 2005-11-17 Hitachi Ltd ストレージシステム、ファイルアクセス制御プログラム及びファイルアクセス制御方法
JP2006003962A (ja) * 2004-06-15 2006-01-05 Hitachi Ltd ネットワークストレージシステム
JP2006164169A (ja) * 2004-12-10 2006-06-22 Hitachi Ltd 名前空間を共有するクラスタ構成のネットワークストレージシステム及びその制御方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6013011250; Shepler et al.: 'Network File System (NFS) version 4 Protocol' Internet Engineering Task Force(IETF) RFC3530 , 200304, pp. 1-61 *
JPN7013000901; Hartman et. al.: 'The Zebra Striped Network File System' Proceedings of the fourteenth ACM symposium on Operating systems principles (SOSP '93) , 19931205, pp. 29-43 *

Also Published As

Publication number Publication date
JP2013061959A (ja) 2013-04-04
EP2081329A1 (en) 2009-07-22
JP5567342B2 (ja) 2014-08-06
HK1114487A1 (en) 2008-10-31
CN101170416B (zh) 2012-01-04
JP5730271B2 (ja) 2015-06-03
US8953602B2 (en) 2015-02-10
WO2008049353A1 (fr) 2008-05-02
CN101170416A (zh) 2008-04-30
EP2081329A4 (en) 2014-05-07
US20100061375A1 (en) 2010-03-11
EP2081329B1 (en) 2020-06-10

Similar Documents

Publication Publication Date Title
JP5730271B2 (ja) ネットワークデータストレージシステムおよびそのデータアクセス方法
JP5254611B2 (ja) 固定内容分散データ記憶のためのメタデータ管理
US9898514B2 (en) System and method for aggregating query results in a fault-tolerant database management system
CN101689129B (zh) 在群集文件系统中的文件系统安装
JP5918243B2 (ja) 分散型データベースにおいてインテグリティを管理するためのシステム及び方法
JP2013545162A5 (ja)
JP2013544386A5 (ja)
US11221785B2 (en) Managing replication state for deleted objects
JP2006268531A (ja) データ処理システム及びデータベースの管理方法
US11409711B2 (en) Barriers for dependent operations among sharded data stores
US11755557B2 (en) Flat object storage namespace in an object storage system
US20210165768A1 (en) Replication Barriers for Dependent Data Transfers between Data Stores
US11343308B2 (en) Reduction of adjacent rack traffic in multi-rack distributed object storage systems
US10387384B1 (en) Method and system for semantic metadata compression in a two-tier storage system using copy-on-write
US10055139B1 (en) Optimized layout in a two tier storage
US20040015522A1 (en) Apparatus, system and method of providing a stackable private write file system
US11868334B2 (en) Integrating change tracking of storage objects of a distributed object storage database into a distributed storage system
US10628391B1 (en) Method and system for reducing metadata overhead in a two-tier storage architecture
US20240104081A1 (en) Integrating change tracking of storage objects of a distributed object storage database into a distributed storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130610

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140325

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20140326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140326

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140619

R150 Certificate of patent or registration of utility model

Ref document number: 5567342

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250