JP2008191897A - データ分散保存システム - Google Patents
データ分散保存システム Download PDFInfo
- Publication number
- JP2008191897A JP2008191897A JP2007025109A JP2007025109A JP2008191897A JP 2008191897 A JP2008191897 A JP 2008191897A JP 2007025109 A JP2007025109 A JP 2007025109A JP 2007025109 A JP2007025109 A JP 2007025109A JP 2008191897 A JP2008191897 A JP 2008191897A
- Authority
- JP
- Japan
- Prior art keywords
- data
- client terminal
- server
- divided
- distributed storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
【課題】サーバを増設することなく記憶領域を確保でき、コスト削減を実現可能なデータ分散保存システムを提供すること。
【解決手段】 サーバ1と、それぞれハードディスク8を備えた複数のクライアント端末3−1〜3−nとでデータ分散保存システムを構築し、サーバ1において単一のデータを複数の分割データに分割し、前記各クライアント端末3−1〜3−nのハードディスク8に分割データを保存する。
【選択図】図4
【解決手段】 サーバ1と、それぞれハードディスク8を備えた複数のクライアント端末3−1〜3−nとでデータ分散保存システムを構築し、サーバ1において単一のデータを複数の分割データに分割し、前記各クライアント端末3−1〜3−nのハードディスク8に分割データを保存する。
【選択図】図4
Description
本発明は、意味のある一まとまりのデータの集合(以下、「単一のデータ」という)を複数の分割データに分割して複数のハードディスクに分散して保存するデータ分散保存システムに関する。
従来のデータ分散保存システムは、複数のサーバに同じデータを分散保存して、1つのサーバがダウンした場合であっても、それ以外のサーバに保存されたデータを利用できるようにしていた。このデータ分散保存システムの場合、同じデータが保存された複数のサーバのうちいずれか一つのサーバが稼動中であれば、データをハンドリングすることができる反面、いずれのサーバ管理者も管轄する自社サーバに保存されたデータからデータ内容を認識することができるため、機密性に欠けるという問題があった。
そこで、単一のデータを複数の分割データに分割する分割部と、前記複数の分割データをそれぞれ格納するN個のサーバと、(N−1)個の前記サーバに格納された前記複数の分割データに基づいて、前記単一のデータを復元するデータ復元部とを備えたデータ分散保存システムが考えられている(例えば、特許文献1参照)。かかるデータ分散保存システムによれば、各サーバに分散保存される分割データ単独では元の単一のデータを復元できないため、機密性を改善することができる。
特開2002−268952号公報
しかしながら、上記データ分散保存システムを構築するためには、複数の分割データをそれぞれ格納する複数台のサーバを設置する必要があるため、コストが上昇するといった問題がある。
本発明は、以上のような事情に鑑みて為されたものであり、サーバを増設することなく記憶領域を確保でき、コスト削減を実現可能なデータ分散保存システムを提供することを目的とする。
上記目的を達成するため、本発明に係るデータ分散保存システムは、サーバと、それぞれディスク装置を備えたパーソナルコンピュータで構成され前記サーバにネットワークを介して接続される複数のクライアント端末と、を備えたデータ分散保存システムであって、前記サーバにおいて単一のデータを複数の分割データに分割し、前記各クライアント端末のディスク装置に前記分割データを保存することを特徴とする。
このデータ分散保存システムによれば、サーバにおいて単一のデータを複数の分割データに分割し、複数のクライアント端末のディスク装置に分割データを分散配置するので、複数台のサーバを用いてシステム構築する場合に比べて大幅にコストダウンを図ることができる。
また本発明は、上記データ分散保存システムにおいて、前記分割データに基づいて生成され、単一のデータの復元に用いられるパリティデータを、前記クライアント端末の所定台数が使用不可能であっても単一のデータを復元可能となるように冗長化して前記複数のクライアント端末のディスク装置に保存することを特徴とする。
このデータ分散保存システムによれば、パリティデータを冗長化して前記複数のクライアント端末のディスク装置に分散配置するので、使用したクライアント端末の何割かが使用不可能であっても冗長化したパリティデータを用いて元の単一のデータを復元することができ、システムの信頼性を向上させることができる。
また本発明は、上記データ分散保存システムにおいて、前記各クライアント端末のディスク装置の記憶領域を、クライアント端末が利用するクライアント端末利用領域とサーバが利用する分散記憶領域とに分離し、前記分散記憶領域に前記分割データ及び前記パリティデータを保存することを特徴とする。
このデータ分散保存システムによれば、クライアント端末が利用できない分散記憶領域に前記分割データ及び前記パリティデータを保存するので、各クライアント端末のディスク装置の容量使用状況に依らず、システム全体で必要な記憶容量を予め確保することができ、クライアント端末との記憶領域の取り合いを排除して安定したシステム運用が可能になる。
また本発明は、上記データ分散保存システムにおいて、前記クライアント端末は、メモリと、前記メモリに常駐する常駐プログラムとを備え、前記常駐プログラムが前記サーバからの要求に応じて当該クライアント端末に備えたディスク装置の分散記憶領域に対して前記分割データ及び前記パリティデータの書き込み/読み出し処理を実行することを特徴とする。
このデータ分散保存システムによれば、クライアント端末のメモリにインストールした常駐プログラムがディスク装置の分散記憶領域への書き込み/読み出し処理を管理するので、クライアント端末においてユーザに意識されること無く、バックグラウンドで分割データ又はパリティデータの書き込み/読み出しを行うことができる。
本発明のデータ分散保存システムによれば、サーバを増設することなく記憶領域を確保でき、コスト削減を実現することができる。
以下、本発明の一実施の形態について図面を参照しつつ詳細に説明する。
図1は本発明の一実施の形態に係るデータ分散保存システムが適用されるネットワーク構成図である。本実施の形態に係るデータ分散保存システムは、サーバ1と該サーバ1にLAN2を介して接続されサーバの記憶領域として利用可能な複数のクライアント端末3−1〜3−nとから構成される。サーバ1の記憶領域として利用する複数のクライアント端末は、サーバ1と同一LAN2上のクライアント端末3−1〜3−nに限られるものではなく、ルータ4a,4b及びインターネット(又はイントラネット)5を経由して接続された他のLAN6上の複数のクライアント端末7−1〜7−nでも良い。又はサーバ1と同一LAN2上のクライアント端末3−1〜3−nと他のLAN6上の複数のクライアント端末7−1〜7−nの組合せであってもよい。以下の説明では同一LAN2上のクライアント端末3−1〜3−nのディスク装置を利用するように構成した形態について説明する。各クライアント端末3−1〜3−nは、サーバの記憶領域として利用可能なディスク装置としてハードディスク8を備えたパーソナルコンピュータで構成される。クライアント端末3−1〜3−nのハードディスク8は、サーバ1が利用する分散記憶領域8aと、当該端末側のオペレーティングシステム等が利用するクライアント端末利用領域8bとに分割されている。
図1は本発明の一実施の形態に係るデータ分散保存システムが適用されるネットワーク構成図である。本実施の形態に係るデータ分散保存システムは、サーバ1と該サーバ1にLAN2を介して接続されサーバの記憶領域として利用可能な複数のクライアント端末3−1〜3−nとから構成される。サーバ1の記憶領域として利用する複数のクライアント端末は、サーバ1と同一LAN2上のクライアント端末3−1〜3−nに限られるものではなく、ルータ4a,4b及びインターネット(又はイントラネット)5を経由して接続された他のLAN6上の複数のクライアント端末7−1〜7−nでも良い。又はサーバ1と同一LAN2上のクライアント端末3−1〜3−nと他のLAN6上の複数のクライアント端末7−1〜7−nの組合せであってもよい。以下の説明では同一LAN2上のクライアント端末3−1〜3−nのディスク装置を利用するように構成した形態について説明する。各クライアント端末3−1〜3−nは、サーバの記憶領域として利用可能なディスク装置としてハードディスク8を備えたパーソナルコンピュータで構成される。クライアント端末3−1〜3−nのハードディスク8は、サーバ1が利用する分散記憶領域8aと、当該端末側のオペレーティングシステム等が利用するクライアント端末利用領域8bとに分割されている。
図2はサーバ1の機能ブロック図である。制御部11から分散保存する単一のデータ(元データ)がディスク装置12に格納される。分割/冗長化処理部13は、ディスク装置12に格納された元データを複数の分割データに分割すると共にパリティデータを作成する。システムの信頼性を上げるためには、分散保存先に使用したクライアント端末の数十パーセントが使用不可能であっても復元が可能になるようにパリティデータの大規模な多重化を行うことが望ましい。
保存先割当部14は、分割/冗長化処理部13が生成した複数の分割データ及びパリティデータの保存先となる複数のクライアント端末を決定し、複数の分割データ及びパリティデータとそれらの保存先クライアント端末情報をサーバ側デーモン16へ渡す。また、複数の分割データ及びパリティデータの保存先クライアント端末情報を分散記憶情報データベース15へ保存する。サーバ側デーモン16は、分割/冗長化処理部13から与えられる複数の分割データ及びパリティデータをそれらの保存先クライアント端末情報に基づいて保存処理する。すなわち、複数の分割データ及びパリティデータをそれらの保存先クライアント端末3−1〜3−nへネットワーク(LAN2)経由でそれぞれ送信してクライアント端末3−1〜3−nのハードディスク8に記憶させる。
またサーバ側デーモン16は、制御部11からの読み出し指示を受けて保存先クライアント端末3−1〜3−nから分割データ及びパリティデータの読み出し処理を行う。クライアント端末3−1〜3−nから読み出しを行う際は分散記憶情報データベース15から保存先クライアント端末情報を取得する。サーバ側デーモン16は、保存先クライアント端末3−1〜3−nから読み出されLAN2経由で受信される分割データ及びパリティデータを復元処理部17へ入力する。
復元処理部17は、複数の分割データを単一のデータに復元する部分である。分散保存先に使用したクライアント端末の幾つかが使用不可能である場合は、パリティデータを使用した復元処理を実行する。
図3はクライアント端末3−1〜3−n、7−1〜7−nにおけるハードディスクの記憶領域の分割状態を示す概念図である。クライアント端末側デーモン21は、サーバ側デーモン16からのリクエストを受けて分割データ又はパリティデータの書き込み/読み出しを実行する常駐プログラムで構成される。アプリケーション22及びオペレーティングシステム23は、クライアント端末の本来的な機能実現のためにインストールされたプログラムである。クライアント端末側デーモン21は、クライアント端末において常駐していてハードディスク8の分散記憶領域8aを使用する使用特権を有する。アプリケーション22及びオペレーティングシステム23は、サーバ1が記憶領域として使用する分散記憶領域8a以外のクライアント端末利用領域8bを使用する。このように本実施の形態では、クライアント端末のハードディスク8をサーバ1が使用する分散記憶領域8aと端末側が使用するクライアント端末利用領域8bとに分割し、サーバ1が使用する分散記憶領域8aについてはクライアント端末側デーモン21が自由に書き込み/読み出しできるようにしている。
次に、以上のように構成された本実施の形態のデータ分散保存システムの動作について説明する。
図4は本実施の形態のデータ分散保存システムによる分散保存及び読み出しの概念図である。サーバ1では単一のデータに対して保存要求が発生すると、制御部11から分割/冗長化処理部13に対して保存対象の単一のデータを指定して保存指示が出される。
図4は本実施の形態のデータ分散保存システムによる分散保存及び読み出しの概念図である。サーバ1では単一のデータに対して保存要求が発生すると、制御部11から分割/冗長化処理部13に対して保存対象の単一のデータを指定して保存指示が出される。
分割/冗長化処理部13では、制御部11から指示された保存対象の単一のデータをディスク装置12から取り出して複数の分割データに分割すると共にパリティデータを作成する。ここでは、保存先クライアント端末の数十パーセントが使用不可能であっても復元が可能になるようにパリティデータの大規模な多重化を行う。
分割/冗長化処理部13で生成された複数の分割データ及びパリティデータの保存先クライアント端末が保存先割当部14において決定される。保存先割当部14はクライアント端末における分散記憶領域8aの使用状況に基づいて保存先を決定することができる。例えば、全てのクライアント端末の使用容量が均等になるように保存先を決定する。また、データの書き込み/読み出し頻度が高いことが予想される場合には、書き込み/読み出しの処理速度が高速のクライアント端末に優先的に割り当てるようにしても良い。保存先割当部14が決定した分割データ及びパリティデータの保存先クライアント端末情報は分散記憶情報データベース15に保存される。図4に示す例では、分割データAはクライアント端末3−1、分割データBはクライアント端末3−2、分割データCはクライアント端末3−3、パリティデータはクライアント端末3−4を、それぞれ保存先として決定している。
サーバ側デーモン16では、保存先割当部14において決定した複数の分割データ及びパリティデータの保存先クライアント端末情報に基づいて、各保存先クライアント端末3−1〜3−4のクライアント端末側デーモン21とネゴシエーションして分割データ等を書き込むように要請する。保存先クライアント端末3−1〜3−4のクライアント端末側デーモン21から了承のレスポンスを受け取ると割り当てた分割データ又はパリティデータを当該クライアント端末3−1〜3−4に対して送信する。全ての保存先クライアント端末3−1〜3−4との間で上記の処理を繰り返す。
以上のようにして、保存要求のあった単一データが複数の分割データ及びパリティデータにされて、複数のクライアント端末3−1〜3−4のハードディスク8に分散保存される。クライアント端末3−1〜3−4に保存された分割データは断片であるので分割データ単独では元の単一のデータを復元できない。したがって、所定台数以上のクライアント端末から分割データを集めなければデータ復元できず、高い機密性を実現することができる。
一方、サーバ1では単一のデータに対する読み出し要求が発生すると、制御部11からサーバ側デーモン16へ読み出し対象の単一のデータを指定して読み出し指示が出される。
サーバ側デーモン16では、制御部11から読み出し指示を受けると、今回読出し要求が出された単一のデータの保存先クライアント端末情報を分散記憶情報データベース15から取得する。サーバ側デーモン16は、保存先クライアント端末3−1〜3−4のクライアント端末側デーモン21とネゴシエーションして分割データ等を読み出すように要請する。保存先クライアント端末3−1〜3−4においてクライアント端末側デーモン21により分散記憶領域8aから読み出された分割データ又はパリティデータは、クライアント端末側デーモン21によってサーバ1へ送信される。
サーバ1において、サーバ側デーモン16は要求した分割データ及ぶパリティデータがクライアント端末側デーモン21から送られてくると、復元処理部17において元の単一のデータを復元する。
ここで、分割データ又はパリティデータを保存した保存先クライアント端末が使用不可能な状態になっている場合、それらの保存先クライアント端末からは分割データ、パリティデータを読み出すことができない。
本実施の形態では、元の単一のデータからパリティデータを作成すると共にパリティデータを多重化しているので、保存先クライアント端末の数十パーセントが使用不可能でも復元処理部17において元の単一のデータを復元することができる。例えば、図4において分割データCを保存したクライアント端末3−3が使用不可能であった場合、クライアント端末3−4から読み出したパリティデータを使用することで完全な単一のデータ(ABC)を復元することができる。なお、パリティデータを使用することにより分割データが一部欠落した複数の分割データから元のデータを復元する技術についてはRAID5又は6を利用することができるが、本発明はRAID5又は6のアルゴリズムに限定されるものではない。
このように本実施の形態によれば、サーバ1において単一のデータを複数の分割データに分割し、複数のクライアント端末3−1〜3−n、7−1〜7−nのハードディスク8に分割データ又はパリティデータを分散配置するので、複数台のサーバを用いてシステム構築する場合に比べて大幅にコストダウンを図ることができる。
また本実施の形態によれば、パリティデータを冗長化して複数のクライアント端末3−1〜3−n、7−1〜7−nのハードディスク8に分散配置するので、使用したクライアント端末の何割かが使用不可能であっても冗長化したパリティデータを用いて元の単一のデータを復元することができ、システムの信頼性を向上させることができる。
また本実施の形態によれば、クライアント端末が利用できない分散記憶領域8aに分割データ及びパリティデータを保存するので、各クライアント端末3−1〜3−n、7−1〜7−nのハードディスク8の容量使用状況に依らず、システム全体で必要な記憶容量を予め確保することができ、クライアント端末3−1〜3−n、7−1〜7−nとの記憶領域の取り合いを排除して安定したシステム運用が可能になる。
また本実施の形態によれば、クライアント端末3−1〜3−n、7−1〜7−nにインストールした常駐プログラムがハードディスク8の分散記憶領域8aへの書き込み/読み出し処理を管理するので、クライアント端末3−1〜3−n、7−1〜7−nにおいてユーザに意識されること無く、バックグラウンドで分割データ又はパリティデータの書き込み/読み出しを行うことができる。
本発明は、単一のデータを複数の分割データに分割して複数のハードディスクに分散して保存するデータ分散保存システムに適用可能である。
1 サーバ
2 LAN
3−1〜3−n クライアント端末
4a,4b ルータ
5 インターネット/イントラネット
6 LAN(他のネットワーク)
7−1〜7−n クライアント端末(他のネットワーク)
8 ハードディスク(ディスク装置)
8a 分散記憶領域
8b クライアント端末利用領域
11 制御部
12 ディスク装置
13 分割/冗長化処理部
14 保存先割当部
15 分散記憶情報データベース
16 サーバ側デーモン
17 復元処理部
21 クライアント端末側デーモン
22 アプリケーション
23 オペレーティングシステム
2 LAN
3−1〜3−n クライアント端末
4a,4b ルータ
5 インターネット/イントラネット
6 LAN(他のネットワーク)
7−1〜7−n クライアント端末(他のネットワーク)
8 ハードディスク(ディスク装置)
8a 分散記憶領域
8b クライアント端末利用領域
11 制御部
12 ディスク装置
13 分割/冗長化処理部
14 保存先割当部
15 分散記憶情報データベース
16 サーバ側デーモン
17 復元処理部
21 クライアント端末側デーモン
22 アプリケーション
23 オペレーティングシステム
Claims (4)
- サーバと、それぞれディスク装置を備えたパーソナルコンピュータで構成され前記サーバにネットワークを介して接続される複数のクライアント端末と、を備えたデータ分散保存システムであって、
前記サーバにおいて単一のデータを複数の分割データに分割し、前記各クライアント端末のディスク装置に前記分割データを保存することを特徴とするデータ分散保存システム。 - 前記分割データに基づいて生成され、単一のデータの復元に用いられるパリティデータを、前記クライアント端末の所定台数が使用不可能であっても単一のデータを復元可能となるように冗長化して前記複数のクライアント端末のディスク装置に保存することを特徴とする請求項1記載のデータ分散保存システム。
- 前記各クライアント端末のディスク装置の記憶領域を、クライアント端末が利用するクライアント端末利用領域とサーバが利用する分散記憶領域とに分離し、前記分散記憶領域に前記分割データ及び前記パリティデータを保存することを特徴とする請求項1又は請求項2記載のデータ分散保存システム。
- 前記クライアント端末は、
メモリと、
前記メモリに常駐する常駐プログラムと、を備え、
前記常駐プログラムが前記サーバからの要求に応じて当該クライアント端末に備えたディスク装置の分散記憶領域に対して前記分割データ及び前記パリティデータの書き込み/読み出し処理を実行することを特徴とする請求項3記載のデータ分散保存システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007025109A JP2008191897A (ja) | 2007-02-05 | 2007-02-05 | データ分散保存システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007025109A JP2008191897A (ja) | 2007-02-05 | 2007-02-05 | データ分散保存システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008191897A true JP2008191897A (ja) | 2008-08-21 |
Family
ID=39751948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007025109A Pending JP2008191897A (ja) | 2007-02-05 | 2007-02-05 | データ分散保存システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008191897A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011221733A (ja) * | 2010-04-08 | 2011-11-04 | Nec Corp | オンラインストレージシステム、及びオンラインストレージサービスの提供方法 |
JP2012175536A (ja) * | 2011-02-23 | 2012-09-10 | Brother Ind Ltd | 情報通信システム、ノード装置、情報処理方法及びプログラム |
US20150278247A1 (en) * | 2014-03-28 | 2015-10-01 | Fujitsu Limited | Data access system and data access method |
JP2019061408A (ja) * | 2017-09-26 | 2019-04-18 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10802888B2 (en) | 2014-09-19 | 2020-10-13 | Nec Corporation | Information processing device and cooperative distributed storage system |
-
2007
- 2007-02-05 JP JP2007025109A patent/JP2008191897A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011221733A (ja) * | 2010-04-08 | 2011-11-04 | Nec Corp | オンラインストレージシステム、及びオンラインストレージサービスの提供方法 |
JP2012175536A (ja) * | 2011-02-23 | 2012-09-10 | Brother Ind Ltd | 情報通信システム、ノード装置、情報処理方法及びプログラム |
US20150278247A1 (en) * | 2014-03-28 | 2015-10-01 | Fujitsu Limited | Data access system and data access method |
JP2015191493A (ja) * | 2014-03-28 | 2015-11-02 | 富士通株式会社 | データアクセスシステム及びデータアクセス方法 |
US10095706B2 (en) * | 2014-03-28 | 2018-10-09 | Fujitsu Limited | Data access system and data access method |
US10802888B2 (en) | 2014-09-19 | 2020-10-13 | Nec Corporation | Information processing device and cooperative distributed storage system |
JP2019061408A (ja) * | 2017-09-26 | 2019-04-18 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP7119324B2 (ja) | 2017-09-26 | 2022-08-17 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6955571B2 (ja) | 分散型ストレージ・ネットワーク内のゾーンにおけるデータの順次記憶 | |
US9772904B2 (en) | Robust reception of data utilizing encoded data slices | |
US10359935B2 (en) | Dispersed storage encoded data slice rebuild | |
US8874868B2 (en) | Memory utilization balancing in a dispersed storage network | |
US10120739B2 (en) | Prioritized data rebuilding in a dispersed storage network | |
US9277011B2 (en) | Processing an unsuccessful write request in a dispersed storage network | |
US9735967B2 (en) | Self-validating request message structure and operation | |
US9432341B2 (en) | Securing data in a dispersed storage network | |
US9009575B2 (en) | Rebuilding a data revision in a dispersed storage network | |
US9632722B2 (en) | Balancing storage unit utilization within a dispersed storage network | |
US20050165972A1 (en) | File input/output control device and method for the same | |
US20150242273A1 (en) | Storage of data with verification in a dispersed storage network | |
US20130282976A1 (en) | Self-protecting mass storage systems and methods | |
JP2008191897A (ja) | データ分散保存システム | |
US8914517B1 (en) | Method and system for predictive load balancing | |
JP5372057B2 (ja) | 通信システム及び通信方法 | |
JP6671708B2 (ja) | バックアップリストアシステム及びバックアップリストア方法 | |
US10769016B2 (en) | Storing a plurality of correlated data in a dispersed storage network | |
JP2008191898A (ja) | データバックアップシステム | |
US8161180B1 (en) | Method and apparatus for routing a data stream through a plurality of data movers independent of a network interface type | |
US20120005253A1 (en) | Method and apparatus for processing distributed data | |
US10642687B2 (en) | Pessimistic reads and other smart-read enhancements with synchronized vaults | |
US10719620B1 (en) | Systems and methods for sending and receiving encrypted submessages | |
JP2011237924A (ja) | ファイル配信方法、配信サーバ、ファイル配信システム、およびプログラム | |
JP2009218636A (ja) | 暗号化装置、暗号化システム及びプログラム |