JPH1125022A

JPH1125022A - クライアントサーバシステム

Info

Publication number: JPH1125022A
Application number: JP9177345A
Authority: JP
Inventors: Yuji Kiyohara; 裕二清原
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 1997-07-02
Filing date: 1997-07-02
Publication date: 1999-01-29

Abstract

(57)【要約】【課題】サーバ側での障害発生への耐性面で強いクラ
イアントサーバシステムを提供する。【解決手段】データが複数のブロックデータに分割さ
れて第１〜第４のサーバ１０１〜１０４に分散格納され
ていると共に、それらのパリティデータがパリティサー
バ１０５に格納されている。クライアント１００がデー
タを読み出す際には、第１〜第４のサーバ１０１〜１０
４に分散格納されている該当ブロックデータを読み出
し、データ結合手段１１３にてそれらを結合して元のデ
ータを得ることができる。また、いずれかのサーバ１０
１〜１０４から正常なデータ読み出しができなかった場
合には、正常に読み出したブロックデータとパリティサ
ーバ１０５から読み出したパリティデータに基づき、エ
ラー訂正手段１１４において正常に読み出せなかったブ
ロックデータを復元し、その復元データを用いてデータ
結合を行えば元のデータを得ることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、クライアントと、
当該クライアントから転送されたデータの格納やクライ
アントからのデータ読み出し要求に応じたデータの供給
などを行なうサーバとが所定の伝送路を介して接続され
てネットワークを構成するクライアントサーバシステム
に関し、特にサーバ側での障害発生への耐性を持つシス
テムに関する。

【０００２】

【従来の技術】従来、例えばインターネットやＬＡＮな
どのネットワークを構築し、そのネットワーク上のクラ
イアントが同じくネットワーク上のサーバに対してデー
タの格納やデータの供給を要求するようなクライアント
サーバシステムが実現されている。あるクライアント
は、あるサーバに格納されている様々なファイルにアク
セスし、また特定のサーバだけでなく、様々なサーバに
もアクセスする。

【０００３】この場合、例えば所定のファイルが特に重
要なものであって破損すると困る場合には、同じファイ
ルをバックアップ用としてコピーし、別のサーバにも記
憶させておくのが効果的である。また、ファイル単体の
破損だけでなく、特定のサーバが故障を起こした場合、
そのサーバが記憶している全てのファイルが使えなくな
るケースも想定される。これに対応するには、サーバを
まるごと二重化することが考えられる。つまり、そのサ
ーバが記憶している全てのファイルをコピーして記憶し
ているバックアップサーバを設け、一方のサーバが故障
しても、バックアップサーバが代わって稼働するような
システムにするのである。

【０００４】

【発明が解決しようとする課題】しかしながら、上述し
たバックアップファイルを別のサーバに作っておく方法
では、記憶装置の容量を２倍使用することになるため非
効率的であり費用もかさむ。サーバ全体を二重化した場
合はなおさらである。

【０００５】また、ファイルやサーバが壊れていない場
合でも、あるサーバにアクセスが集中すると、その特定
サーバの処理速度がネックになってネットワークシステ
ム全体の処理スピードが上がらない。この問題は、ネッ
トワークを構成するクライアントサーバシステムには元
々内在している。

【０００６】そこで、本発明は従来のクライアントサー
バシステムにおける上述の問題を取り除き、特にサーバ
側での障害発生への耐性面で強いクライアントサーバシ
ステムを提供することを目的とする。

【０００７】

【課題を解決するための手段及び発明の効果】上記目的
を達成するためになされた請求項１に記載の発明は、ク
ライアントと、当該クライアントからのデータ読み出し
要求に応じたデータの供給を行なう複数のサーバとが所
定の伝送路を介して接続されてネットワークを構成する
クライアントサーバシステムであって、前記クライアン
トの読み出し対象のデータは、複数のブロックデータに
分割されて前記サーバの内のデータ用サーバとみなした
複数のものに分散して格納されていると共に、前記複数
のブロックデータに対応するエラー訂正データが前記複
数のサーバの内の前記データ用サーバ以外でエラー訂正
用サーバとみなしたものに格納されており、前記クライ
アントは、データ結合手段とエラー訂正手段とを有し、
前記サーバからデータを読み出す際、該当する前記デー
タ用サーバの全てからブロックデータを読み出せた場合
には、その読み出したブロックデータを前記データ結合
手段によって結合することで元のデータを得るように
し、前記いずれかのデータ用サーバから正常なデータ読
み出しができなかった場合には、残りのデータ用サーバ
から正常に読み出したデータと前記エラー訂正用サーバ
から読み出したエラー訂正データに基づき前記エラー訂
正手段において前記正常に読み出せなかったブロックデ
ータを復元し、前記データ結合手段によって元のデータ
を得るよう構成されていることを特徴とする。

【０００８】本発明のクライアントサーバシステムは、
クライアントと複数のサーバとが所定の伝送路を介して
接続されてネットワークを構成する形態であるが、この
場合のサーバは、クライアントからのデータ読み出し要
求に応じたデータの供給を行なうことができるようにさ
れている。そして、クライアントの読み出し対象のデー
タは、複数のブロックデータに分割されてサーバの内の
データ用サーバとみなした複数のものに分散して格納さ
れていると共に、複数のブロックデータに対応するエラ
ー訂正データが複数のサーバの内のデータ用サーバ以外
でエラー訂正用サーバとみなしたものに格納されてい
る。

【０００９】ここで、クライアントがサーバからデータ
を読み出す際には、該当するデータ用サーバの全てから
ブロックデータを読み出せた場合には、その読み出した
ブロックデータを結合して元のデータを得るようにし、
いずれかのデータ用サーバから正常なデータ読み出しが
できなかった場合には、残りのデータ用サーバから正常
に読み出したデータとエラー訂正用サーバから読み出し
たエラー訂正データに基づきエラー訂正手段において正
常に読み出せなかったブロックデータを復元し、その復
元したデータを用いてデータ結合を行い元のデータを得
る。

【００１０】上述したように、クライアントが所望する
データの全てが１つのサーバに記憶されている場合に
は、そのデータが破損した場合を想定して複数のサーバ
に同じデータをバックアップ用にコピーして記憶させて
おくことが考えられる。また、クライアントの所望する
データを記憶しているサーバ自体が故障を起こすと、そ
のサーバに含まれる全てのデータが使えなくなるケース
もある。これに対応するには、サーバをまるごと二重化
し、一方のサーバが故障しても、バックアップサーバが
代わって稼働するようなシステムにする必要がある。し
かしデータのバックアップを別のサーバに作っておく方
法は、記憶装置の容量を２倍使用することになり、費用
がかさみ、サーバ全体を二重化した場合はなおさらであ
る。

【００１１】それに対して、本発明のシステムでは、ク
ライアントの読み出し対象のデータが複数のブロックデ
ータに分割されて複数のデータ用サーバに分散して格納
されている。そのため、たとえ、複数のブロックデータ
の一つが破損していても、残りのブロックデータとエラ
ー訂正用サーバから読み出したエラー訂正データに基づ
き正常に読み出せなかったブロックデータを復元し、所
望のデータを得ることができる。そして、このようなデ
ータの耐故障性を向上することができながら、元のデー
タ以外にはエラー訂正データだけしか必要ない。つま
り、従来のように読み出し対象の全データと同じバック
アップを別のサーバに作っておく方法では、記憶装置の
容量を２倍使うこととなっていたが、本システムの場合
には、読み出し対象の全データに比べて相当データサイ
ズが小さなエラー訂正データだけを準備すればよい。

【００１２】また、このようなネットワークを構成する
クライアントサーバシステムでは、データ自体が破壊さ
れていない場合であっても、あるサーバにアクセスが集
中した場合には、サーバの処理速度がネックになってシ
ステム全体の処理スピードが上がらないという問題が元
々内在している。その点でも、クライアントがあるデー
タを読み出そうとした場合、サーバ単位で見れば、その
データが複数に分割されたブロックデータ分しか記憶し
ていないので、当然ながらクライアントからの読み出し
要求に応じたデータ供給に要する処理時間は短縮され
る。また、一つのサーバへのアクセスが集中することも
防止できる。したがって、システム全体の処理スピード
の向上にも寄与することができる。

【００１３】上述したように、クライアントの読み出し
対象のデータは、複数のブロックデータに分割されてサ
ーバの内のデータ用サーバに分散して格納されると共
に、複数のブロックデータに対応するエラー訂正データ
がエラー訂正用サーバに格納されている。このデータ格
納は、例えばサーバ側の主導で実行してもよいが、クラ
イアント主導で行なうこともできる。つまり、クライア
ントにデータ格納を行なう機能を持たせるのである。

【００１４】この場合、例えば請求項２に示すように、
複数のクライアントの内の少なくとも一つをデータ格納
用クライアントとし、少なくとも一つをデータ読出用ク
ライアントとする構成も考えられるし、あるいは、請求
項３に示すように、クライアントがデータ格納機能及び
データ読出機能を併有するようにしてもよい。

【００１５】請求項２に示す構成では、データ格納用ク
ライアントがデータ分割手段とエラー訂正データ生成手
段とを有している。そして、サーバへデータを格納する
際、格納対象データを複数のブロックデータに分割する
と共に、当該複数のブロックデータに対応するエラー訂
正データを生成し、分割されたブロックデータをデータ
用サーバに分散して格納すると共に、生成したエラー訂
正データをエラー訂正用サーバに格納する。また、デー
タ読出用クライアントはデータ結合手段とエラー訂正手
段とを有している。そして、サーバからデータを読み出
す際、該当するデータ用サーバの全てからブロックデー
タを読み出せた場合には、その読み出したブロックデー
タを結合することで元のデータを得るようにし、いずれ
かのデータ用サーバから正常なデータ読み出しができな
かった場合には、残りのデータ用サーバから正常に読み
出したデータとエラー訂正用サーバから読み出したエラ
ー訂正データに基づき正常に読み出せなかったブロック
データを復元し、その復元データを用いてデータ結合す
ることで元のデータを得る。

【００１６】一方、請求項３に示す場合には、クライア
ントが、データ分割手段と、エラー訂正データ生成手段
と、データ結合手段と、エラー訂正手段とを有してい
る。そして、サーバへデータを格納する際には、格納対
象データを複数のブロックデータに分割すると共に、複
数のブロックデータに対応するエラー訂正データを生成
し、分割されたブロックデータをデータ用サーバに分散
して格納すると共に、生成したエラー訂正データをエラ
ー訂正用サーバに格納する。また、サーバからデータを
読み出す際には、該当するデータ用サーバの全てからブ
ロックデータを読み出せた場合には、その読み出したブ
ロックデータを結合することで元のデータを得るように
し、いずれかのデータ用サーバから正常なデータ読み出
しができなかった場合には、残りのデータ用サーバから
正常に読み出したデータとエラー訂正用サーバから読み
出したエラー訂正データに基づき正常に読み出せなかっ
たブロックデータを復元し、その復元データを用いてデ
ータ結合することで元のデータを得る。

【００１７】また、このようにクライアントがデータ格
納機能及びデータ読出機能を併有するクライアントサー
バシステムにおいては、請求項４に示すように、複数の
データ用サーバ及びエラー訂正用サーバのいずれかにお
いて格納されていたデータが消失した場合には、クライ
アントが、残りのサーバからのデータを読み出し、エラ
ー訂正手段によって消失データを復元してデータ消失の
あったサーバに格納させるリビルド処理を実行するよう
構成してもよい。この場合には、サーバ上で失われたデ
ータを復元することができる。

【００１８】また、上述したクライアントサーバシステ
ムにおいては、請求項５に示すように構成してもよい。
すなわち、クライアントは、サーバからデータを読み出
す際、該当するデータ用サーバ及びエラー訂正用サーバ
の内の、ネットワーク上での経路が近い所定数のサーバ
から読み出したデータあるいはエラー訂正データに基づ
き、データ結合手段によって元のデータを得るよう構成
するのである。

【００１９】ネットワーク上での経路の長短によって、
クライアント側がデータ読み出し要求をしてからその要
求に応じたデータが供給されるまでの時間にも違いが出
る可能性がある。したがって、例えばデータ用サーバか
らのブロックデータが全て供給されるまで必ず待つ必要
はなく、データ用サーバからのブロックデータのいくつ
かとエラー訂正用サーバからのエラー訂正データが供給
されているのであればそれらを用いて元のデータを得れ
ばよい。

【００２０】

【発明の実施の形態】以下、本発明を具体化した一実施
例を図面を参照して説明する。図１は、本発明の実施形
態であるクライアントサーバシステム（以下、Ｃ／Ｓシ
ステムと略記する。）の概略構成を示す機能ブロック図
である。

【００２１】本実施形態のＣ／Ｓシステムは、クライア
ント１００と、複数（ここでは５台）のサーバ１０１〜
１０５とを主要構成として有し、サーバ１０１〜１０５
とクライアント１００はネットワーク２００により接続
されている。このネットワーク２００は、多対多の相互
接続が可能なネットワークであるが、ＬＡＮであるかＷ
ＡＮであるかは問わない。要はクライアント１００から
複数のサーバ１０１〜１０５に対して、ファイルのアク
セスが可能であれば良く、一般的なイーサネット（Ethe
rnet）のＬＡＮでも良いし、ダイアルアップ接続のイン
ターネットでも良い。

【００２２】複数のサーバ１０１〜１０５の内の一つあ
るいは複数にはエラー訂正用データを格納する。エラー
訂正符号には、パリティ、ハミング符号、ＢＣＨ符号、
リードソロモン符号といった技術が知られているが、こ
の実施形態では、エラー訂正符号にはパリティを使用
し、エラー訂正用サーバは一つだけ用意する。以下で
は、エラー訂正用サーバはパリティサーバ１０５と呼ぶ
ことにする。このシステムでは第１〜第４のサーバ１０
１〜１０４に格納されているデータを元にしてパリティ
データを計算し、パリティサーバ１０５に格納する。

【００２３】クライアント１００は、第１〜第４のサー
バ１０１〜１０４にデータを分散させるためのデータ分
割手段１１１と、エラー訂正用データを生成するための
エラー訂正符号生成手段１１２と、第１〜第４のサーバ
１０１〜１０４からのデータを結合して元のデータを得
るデータ結合手段１１３と、第１〜第４のサーバ１０１
〜１０４からのデータとパリティサーバ１０５からのパ
リティデータに基づいて、欠落したデータを復元するた
めのエラー訂正手段１１４とを備えている。

【００２４】図１で示したクライアント１００の構成
は、主にその機能的な面から捉えたものであったが、図
２を参照してクライアント１００の内部構成を説明す
る。図２はクライアント１００の内部ブロック図であ
り、図１では省略されているが、ネットワークＩ／Ｆ１
１５でデータを送る際、分割したデータを順に送るため
分割データを一旦保持するためのバッファを明示してい
る。なお、このバッファは複数のサーバからのデータを
順に集めて一気にデータ結合回路１２３及びエラー訂正
回路１２４に処理させるためにも必要である。このバッ
ファはクライアント１００の構成として必須要件ではな
いが、現実的には大抵の場合は必要になる。

【００２５】図２において、制御手段としてのＣＰＵ１
１６はクライアント１００全体を制御するものである。
記憶手段としてのメモリ１１７とＨＤＤ１１８にはクラ
イアント１００が処理するためのデータが入っている。
ＨＤＤ１１８上のデータは電源を切っても消えないよう
になっている。メモリ１１７上のデータは電源を切ると
消えてしまうが、高速にアクセスできる。データは、利
用者のキーボード１１９の操作によって入力されたり、
外部のサーバから取ってきたりして、メモリ１１７やＨ
ＤＤ１１８上にやってくる。これにＣＰＵ１１６が色々
な処理を施した後、ＨＤＤ１１８に格納したり、ＣＲＴ
１２０に表示したり、外部の機器にデータを渡したりす
る。これがクライアント１００の実行する動作である。

【００２６】本実施形態では、クライアント１００が外
部のサーバ１０１〜１０５にアクセスする際には、デー
タ分割回路１２１、パリティジェネレータ１２２、デー
タ結合回路１２３、エラー訂正回路１２４を通してアク
セスする。データを外部のサーバ１０１〜１０５に格納
する動作を「ライト」、外部のサーバ１０１〜１０５か
らデータを読み出す動作を「リード」と呼ぶことにす
る。以下では、クライアント１００のライトモード、リ
ードモードに分けて各部の動作を説明する。なお、本実
施形態では、このライト、リード以外に、「リビルド」
という動作モードがある。これは、外部のサーバ１０１
〜１０５に故障が起きてデータが紛失した場合に、この
データを復元する動作を言う。これも、以下でリビルド
モードの動作ということで説明する。（１）ライトモードＣＰＵ１１６は、まずサーバに格納したいデータをデー
タ分割回路１２１に転送する。このデータは、所定のデ
ータ、あるいはそのデータに所定のデータ処理をした結
果のデータであり、通常メモリ１１７あるいはＨＤＤ１
１８上にある。したがって、それを読み出してデータ分
割回路１２１に転送する。

【００２７】データ分割回路１２１は、元データをいく
つかのブロックに分割する処理を行なうものであり、本
実施形態では４つに分割される。分割の仕方は、自由度
があるが、各ブロックのサイズは均等になったほうが都
合が良い。差があるとパリティの計算が面倒になるから
である。例えば、１ビットおきに４つに分散させると
か、１バイトおきに４つに分散させるとか、２５６バイ
ト毎に分割するとか、色々考えられる。

【００２８】そして、各々のブロックデータは、別々の
４つの出力バッファ、すなわち第１〜第４の出力バッフ
ァ１３１〜１３４に格納される。データ分割回路１２１
と第１〜第４の出力バッファ１３１〜１３４の間にはそ
れぞれセレクタ１４１〜１４４が介装されているが、こ
れは後述のリビルドモードで使うためのもので、通常
は、データ分割回路１２１の出力が第１〜第４の出力バ
ッファ１３１〜１３４に入るようにスイッチ選択されて
いる。

【００２９】また、データ分割回路１２１の出力はパリ
ティジェネレータ１２２にも入力される。パリティジェ
ネレータ１２２は、４つのブロックデータからパリティ
を計算するものである。例えば、１バイトおきに４つに
分割した場合は、４つのブロックから１バイトずつ取っ
て、その４バイトの排他的論理和（Exclusive-OR）演算
をすることで、偶数パリティが求められる。このパリテ
ィジェネレータ１２２から出力されたパリティデータ
は、上述した第１〜第４の出力バッファ１３１〜１３４
とは別のパリティ用出力バッファ１３５に格納される。
なお、パリティジェネレータ１２２とパリティ用出力バ
ッファ１３５との間にセレクタ１４５が介装されている
が、上述したようにリビルドモードで使うためのもの
で、通常は、パリティジェネレータ１２２の出力がパリ
ティ用出力バッファ１３５に入るようにスイッチ選択さ
れている。

【００３０】上述した第１〜第４の出力バッファ１３１
〜１３４及びパリティ用出力バッファ１３５（以下、こ
れらの区別をしない場合には単に「出力バッファ１３１
〜１３５」と示すことにする。）はネットワークＩ／Ｆ
１１５に接続されている。ネットワークＩ／Ｆ１１５
は、外部のサーバ等の通信機器に対して通信を行うため
のもので、送信時には、出力バッファ１３１〜１３５の
データを送信する。どの出力バッファ１３１〜１３５の
データを出力するかは、ＣＰＵ１１６が制御する。各々
の出力バッファ１３１〜１３５毎に送信先のサーバを違
えてデータを送信する。具体的に説明すると、第１〜第
４の出力バッファ１３１〜１３４からのブロックデータ
は第１〜第４のサーバ１０１〜１０４（図１参照）に送
信され、パリティ用出力バッファ１３５からのパリティ
データはパリティサーバ１０５に送信される。

【００３１】次に、このライトモードの場合のクライア
ント１００が実行する処理の概略を図３のフローチャー
トを参照してさらに説明する。最初のステップＳ１１０
では、サーバに格納したいデータをデータ分割回路１２
１に転送する。続くＳ１２０では、転送されたデータを
データ分割回路１２１にて４つのブロックデータに分割
し、Ｓ１３０では、その分割されたブロックデータを基
にパリティジェネレータ１２２にてパリティデータを生
成する。そしてＳ１４０では、Ｓ１２０の処理で得た４
つのブロックデータとＳ１３０の処理で得たパリティデ
ータをそれぞれ該当するサーバ、つまりブロックデータ
は第１〜第４のサーバ１０１〜１０４に送信し、パリテ
ィデータはパリティサーバ１０５に送信する。（２）リードモードネットワークＩ／Ｆ１１５は、外部のサーバ１０１〜１
０５からのデータを受信することもできる。上述したラ
イトモードで第１〜第４のサーバ１０１〜１０４に分散
して格納したブロックデータを、第１〜第４のサーバ１
０１〜１０４それぞれから受信する。受信したブロック
データは第１〜第４の入力バッファ１５１〜１５４に格
納される。ここでは、第１のサーバ１０１から受信した
ブロックデータは第１の入力バッファ１５１に格納し、
第２のサーバ１０２から受信したブロックデータは第２
の入力バッファ１５１に格納する、というようにそれぞ
れに対応する入力バッファ１５１〜１５４に格納するこ
ととなる。また、パリティサーバ１０５から送信されて
きたパリティデータもパリティ用入力バッファ１５５に
格納される。

【００３２】そして、エラー訂正回路１２４は、４つの
データ用バッファである第１〜第４の入力バッファ１５
１〜１５４とパリティ用入力バッファ１５５からのデー
タを受けて、もしも４つのブロックデータの内にエラー
データがあったとしてもそれを復元することができる。
本実施形態ではエラー訂正符号にパリティを使っている
ので、第１〜第４のサーバ１０１〜１０４のうち１つま
でのデータ欠落に対応できる。ＣＰＵ１１６は各サーバ
１０１〜１０５との通信を管理しており、どのサーバ１
０１〜１０５のデータが欠落しているかを知っている。
したがって、データ欠落があったサーバ１０１〜１０５
から送られてくるはずのデータ復元をエラー訂正回路１
２４に指示する。但し、パリティデータについてはあえ
て復元する必要はないので、実際には、４つのブロック
データの内でデータ欠落があった場合に、そのブロック
データの復元をエラー訂正回路１２４に指示することと
なる。

【００３３】エラー訂正回路１２４にて復元されたデー
タは、第１〜第４の入力バッファ１５１〜１５４からの
データと共にデータ結合回路１２３に入力される。ここ
でも、ＣＰＵ１１６はどのブロックデータが欠落してい
るかを指示することで、適切なブロックデータが選ばれ
て結合される。例えば、先のデータ分割で１バイト単位
で分割した場合、第３のサーバ１０３からのブロックデ
ータがうまく受信できなかった場合は、第１のサーバ１
０１、第２のサーバ１０２、第４のサーバ１０４からの
ブロックデータと、パリティサーバ１０５のエラー訂正
データをエラー訂正回路１２４に入れて第３のサーバ１
０３からのブロックデータを復元するように指示する。
これによって、エラー訂正回路１２４は第３のサーバ１
０３が保持していたはずのブロックデータを生成する。

【００３４】したがって、このエラー訂正回路１２４か
らのブロックデータ（第３のサーバ１０３が保持してい
たはずのブロックデータ）と、第１，第２，第４の入力
バッファ１５１，１５２，１５４からのデータ（第１，
第２，第４のサーバ１０１，１０２，１０４が保持して
いたブロックデータ）とを、データ結合回路１２３で選
んで結合すると元のデータが得られる。

【００３５】なお、ブロックデータの欠落があった場合
を想定して説明したが、データ欠落がない場合には、第
１〜第４の入力バッファ１５１〜１５４からの４つのデ
ータ（第１〜第４のサーバ１０１〜１０４が保持してい
たブロックデータ）がデータ結合回路１２３にて結合さ
れて元のデータが得られる。

【００３６】次に、このリードモードの場合のクライア
ント１００が実行する処理の概略を図４のフローチャー
トを参照してさらに説明する。最初のステップＳ２１０
では、第１〜第４のサーバ１０１〜１０４及びパリティ
サーバ１０５に対して、該当するデータの読み出し要求
を送信する。これは、例えば利用者がキーボード１１９
を操作して所定のデータ読み出しの指示を入力した場合
には、その指示されたデータに対応するブロックデータ
及びパリティデータをそれぞれ読み出す要求を送信する
こととなる。

【００３７】続くＳ２２０では、Ｓ２１０での要求に応
じて各サーバ１０１〜１０５から送信されてきた４つの
ブロックデータとパリティデータを受信し、続くＳ２３
０では、４つのブロックデータの内に欠落しているもの
があるかどうかを判断する。もしも、ブロックデータが
欠落していない場合には（Ｓ２３０：ＮＯ）、Ｓ２４０
へ移行し、受信した４つのブロックデータをデータ結合
回路１２３にて結合し元のデータを得る。一方、ブロッ
クデータが欠落していた場合には（Ｓ２３０：ＹＥ
Ｓ）、Ｓ２５０へ移行し、残りの３つのブロックデータ
とパリティデータに基づきエラー訂正回路１２４にて欠
落していたブロックデータを復元する。その後、Ｓ２４
０へ移行して、Ｓ２５０にて復元したブロックデータを
含めた４つのブロックデータを結合して元のデータを得
る。

【００３８】このようにして、第１〜第４のサーバ１０
１〜１０４に分散して格納していた元のデータを復元す
ることができる。以上のように、データをブロックデー
タに分散して格納し、パリティデータも格納しておく
と、第１〜第４のサーバ１０１〜１０４の一つが故障し
てブロックデータが読み出せなくなっても、パリティサ
ーバ１０５からのパリティデータを読み、これと残りの
３つのブロックデータをつきあわせることで、失われた
データが復元可能となる。

【００３９】また、複数のサーバに分散してデータを格
納することで、サーバを並列動作させることになり、デ
ータの入出力速度を高速化できる。つまり、本実施形態
のように、ネットワークを構成するＣ／Ｓシステムで
は、データ自体あるいはサーバ自体が破壊されていない
場合であっても、あるサーバにアクセスが集中した場合
には、サーバの処理速度がネックになってシステム全体
の処理スピードが上がらないという問題が元々内在して
いる。その点でも、クライアント１００があるデータを
読み出そうとした場合、サーバ１０１〜１０５単位で見
れば、そのデータが複数に分割されたブロックデータ分
あるいはパリティデータ分しか記憶していないので、当
然ながらクライアント１００からの読み出し要求に応じ
たデータ供給に要する処理時間は短縮される。また、一
つのサーバへのアクセスが集中することも防止できる。
したがって、システム全体の処理スピードの向上にも寄
与することができる。但し、このためにはサーバの内部
データ速度に比べて、ネットワークの通信速度が速くな
ければ効果が出ない。ネットワークがボトルネックにな
っては並列化の効果がないからである。（３）リビルドモードサーバ１０１〜１０５が故障し、その故障が直ったとき
サーバ内部のＨＤＤなどが交換されたりして以前のデー
タが消えてしまうことがある。このときに、残りの４つ
のサーバのデータから、その失われたデータを復元し、
この復元したデータを復旧したサーバに格納するという
「リビルド機能」も備えている。このときはリビルド用
バス２５０を使用する。

【００４０】例えば、第２のサーバ１０２が故障したと
すると、故障していない４つのサーバ（第１，第３，第
４のサーバ１０１，１０３，１０４とパリティサーバ１
０５）からのデータが第１，第３，第４の入力バッファ
１５１，１５３，１５４及びパリティ用入力バッファ１
５５に読み込まれ、これらのデータをエラー訂正回路１
２４で処理すると故障した第２のサーバ１０３に格納さ
れていたデータを復元することができる。したがって、
これをリビルド用バス２５０を通して第２の出力バッフ
ァ１３２に格納し、ネットワークＩ／Ｆ１１５を介して
第２のサーバ１０２に書き込むことによって、データ復
元ができる。故障していない各サーバ（第１，第３，第
４のサーバ１０１，１０３，１０４とパリティサーバ１
０５）に格納されている全てのブロックに対してこのリ
ビルド処理を行うと、故障が起きる前の全てのデータを
第２のサーバ１０２上に復元できる。

【００４１】次に、このリビルドモードの場合のクライ
アント１００が実行する処理の概略を図５のフローチャ
ートを参照してさらに説明する。最初のステップＳ３１
０では、リビルド対象のサーバ及びデータ範囲を取得す
る。例えば第２のサーバ１０２が故障したとすると、リ
ビルド対象のサーバは第２のサーバ１０２となる。ま
た、リビルド対象のデータ範囲は、第２のサーバ１０２
が格納していた全てのデータであることもあるし一部の
データであることも考えられる。例えば第２のサーバ１
０２が５台のＨＤＤを備えており、その内の１台が故障
して交換した場合には、その１台に格納されていたデー
タだけがリビルド対象となる。

【００４２】続くＳ３２０では、残りのサーバ、つま
り、第２のサーバ１０２が故障した場合には故障してい
ない４つのサーバ（第１，第３，第４のサーバ１０１，
１０３，１０４とパリティサーバ１０５）に対して、該
当範囲のデータの読み出し要求を送信する。

【００４３】そして、Ｓ３３０にて、Ｓ３２０での要求
に応じて４台の各サーバ１０１，１０３，１０４，１０
５から送信されてきた３つのブロックデータとパリティ
データを受信する。続くＳ３４０では、それらのデータ
（３つのブロックデータとパリティデータ）に基づき、
エラー訂正回路１２４にてリビルド対象のデータ（この
場合は第２のサーバ１０２であるのでブロックデータ）
を復元する。そして、Ｓ３５０では、その復元したブロ
ックデータをリビルド対象のサーバである第２のサーバ
１０２に送信する。

【００４４】以上、本発明はこのような実施形態に何等
限定されるものではなく、本発明の主旨を逸脱しない範
囲において種々なる形態で実施し得る。例えば、上述し
た図２に示すクライアント１００の内部構成では、デー
タ分割回路１２１とデータ結合回路１２３、あるいはパ
リティジェネレータ１２２とエラー訂正回路１２４を、
それぞれ別々の構成のように説明したが、実際にはこれ
らのペアは同じ機能ブロックにした方がバッファあるい
はバスの結線が減って都合がよい。そのように同じ機能
ブロックにした構成を図６に示す。

【００４５】図６に示す分割／結合回路２１１は、図２
に示すデータ分割回路１２１とデータ結合回路１２３の
両方の機能を併せ持つものであり、パリティジェネレー
タ＆エラー訂正回路２１２は、図２に示すパリティジェ
ネレータ１２２とエラー訂正回路１２４の両方の機能を
併せ持つものである。

【００４６】また、図６における第１の入出力バッファ
２３１は、図２における第１の出力バッファ１３１と第
１の入力バッファ１５１の両方の機能を併せ持ったバッ
ファである。同様に、図６における第２，第３，第４の
入出力バッファ２３２，２３３，２３４は、それぞれ図
２における第２の出力バッファ１３２と第２の入力バッ
ファ１５２、第３の出力バッファ１３３と第３の入力バ
ッファ１５３、第４の出力バッファ１３４と第４の入力
バッファ１５４の両方の機能を併せ持ったバッファであ
る。さらに、図６におけるパリティ用入出力バッファ２
３５は、図２におけるパリティ用出力バッファ１３５と
パリティ用入力バッファ１５５の両方の機能を併せ持っ
たバッファである。

【００４７】そして、第１〜第４の入出力バッファ２３
１〜２３４からのデータは、セレクタ２４１〜２４４を
介して分割／結合回路２１１やパリティジェネレータ＆
エラー訂正回路２１２に入力可能とされている。逆に、
分割／結合回路２１１やパリティジェネレータ＆エラー
訂正回路２１２からのデータは、セレクタ２４１〜２４
４を介して第１〜第４の入出力バッファ２３１〜２３４
に入力可能とされている。さらに、パリティ用入出力バ
ッファ２３５とパリティジェネレータ＆エラー訂正回路
２１２との間でも互いにデータの入出力が可能とされて
おり、パリティジェネレータ＆エラー訂正回路２１２か
らのデータは分割／結合回路２１１にも出力可能であ
る。

【００４８】この構成の場合におけるライトモード、リ
ードモード、リビルドモードは上述した内容と同様であ
るので、ここでは省略する。また、図２，図６で示した
構成は、図１に示すデータ分割手段１１１、エラー訂正
符号生成手段１１２，データ結合手段１１３、エラー訂
正手段１１４をそれぞれハードウェアで実現した例であ
ったが、ＣＰＵ１１６とメモリ１１７だけを用意して、
後はソフトウェアだけで実現することも可能である。ハ
ードウェアで実現する場合に比べると、一般に処理速度
が遅くなるが、速度を要求されないケースではこの方法
も有効と考えられる。また、上述の実施形態では、図４
のリードモード処理において、ブロックデータに欠落が
あった場合に限って（Ｓ２３０：ＹＥＳ）、Ｓ２４０で
の欠落データの復元を行っているが、例えば、３つのブ
ロックデータとパリティデータは受信できたが、最後の
１つのブロックデータをまだ受信できていない場合に
は、その最後のブロックデータの受信を待たずに処理を
進めることも可能である。つまり、本実施形態の場合に
は、４つのブロックデータと１つのパリティデータの５
つのデータの内の４つが揃えば、元のデータを得ること
はできるからである。その意味では、ブロックデータを
全て取得することにこだわらず、例えばネットワーク上
での経路が近い４台のサーバから読み出したブロックデ
ータあるいはパリティデータに基づき元のデータを得る
ようにしてもよい。ネットワーク上での経路の長短によ
って、クライアント側がデータ読み出し要求をしてから
その要求に応じたデータが供給されるまでの時間にも違
いが出る可能性がある。したがって、ブロックデータか
パリティデータかにこだわらず早期に取得したデータに
基づいて元のデータを復元すれば、元のデータを取得す
るまでの時間短縮が実現する。

【図面の簡単な説明】

【図１】実施形態のクライアントサーバシステムの概
略構成を示す機能ブロック図である。

【図２】実施形態のクライアントの内部構成を示すブ
ロック図である。

【図３】実施形態のクライアントが実行するライトモ
ード処理を示すフローチャートである。

【図４】実施形態のクライアントが実行するリードモ
ード処理を示すフローチャートである。

【図５】実施形態のクライアントが実行するリビルド
モード処理を示すフローチャートである。

【図６】別実施形態のクライアントの内部構成を示す
ブロック図である。

【符号の説明】

１００…クライアント１０１…第１の
サーバ１０２…第２のサーバ１０３…第３の
サーバ１０４…第４のサーバ１０５…パリテ
ィサーバ１１１…データ分割手段１１２…エラー
訂正符号生成手段１１３…データ結合手段１１４…エラー
訂正手段１１５…ネットワークＩ／Ｆ１１７…メモリ１１８…ＨＤＤ１１９…キーボ
ード１２１…データ分割回路１２２…パリテ
ィジェネレータ１２３…データ結合回路１２４…エラー
訂正回路１３１…第１の出力バッファ１３２…第２の
出力バッファ１３３…第３の出力バッファ１３４…第４の
出力バッファ１３５…パリティ用出力バッファ１４１〜１４５
…セレクタ１５１…第１の入力バッファ１５２…第２の
入力バッファ１５３…第３の入力バッファ１５４…第４の
入力バッファ１５５…パリティ用入力バッファ２００…ネット
ワーク２１１…分割／結合回路２１２…パリティジェネレータ＆エラー訂正回路２３１…第１の入出力バッファ２３２…第２の
入出力バッファ２３３…第３の入出力バッファ２３４…第４の
入出力バッファ２３５…パリティ用入出力バッファ２４１〜２４４
…セレクタ２５０…リビルド用バス

Claims

【特許請求の範囲】

【請求項１】クライアントと、当該クライアントから
のデータ読み出し要求に応じたデータの供給を行なう複
数のサーバとが所定の伝送路を介して接続されてネット
ワークを構成するクライアントサーバシステムであっ
て、前記クライアントの読み出し対象のデータは、複数のブ
ロックデータに分割されて前記サーバの内のデータ用サ
ーバとみなした複数のものに分散して格納されていると
共に、前記複数のブロックデータに対応するエラー訂正
データが前記複数のサーバの内の前記データ用サーバ以
外でエラー訂正用サーバとみなしたものに格納されてお
り、前記クライアントは、データ結合手段とエラー訂正手段とを有し、前記サーバからデータを読み出す際、該当する前記デー
タ用サーバの全てからブロックデータを読み出せた場合
には、その読み出したブロックデータを前記データ結合
手段によって結合することで元のデータを得るように
し、前記いずれかのデータ用サーバから正常なデータ読
み出しができなかった場合には、残りのデータ用サーバ
から正常に読み出したデータと前記エラー訂正用サーバ
から読み出したエラー訂正データに基づき前記エラー訂
正手段において前記正常に読み出せなかったブロックデ
ータを復元し、前記データ結合手段によって元のデータ
を得るよう構成されていることを特徴とするクライアン
トサーバシステム。
【請求項２】複数のクライアントと、当該クライアン
トから転送されたデータの格納及びクライアントからの
データ読み出し要求に応じたデータの供給を行なう複数
のサーバとが所定の伝送路を介して接続されてネットワ
ークを構成するクライアントサーバシステムであって、前記複数のクライアントの内の少なくとも一つは、デー
タ分割手段とエラー訂正データ生成手段とを有するデー
タ格納用クライアントであり、前記サーバへデータを格納する際、格納対象データを前
記データ分割手段によって複数のブロックデータに分割
すると共に、当該複数のブロックデータに対応するエラ
ー訂正データを前記エラー訂正データ生成手段によって
生成し、前記分割されたブロックデータを前記サーバの
内のデータ用サーバとみなした複数のものに分散して格
納すると共に、前記生成したエラー訂正データを前記複
数のサーバの内の前記データ用サーバ以外でエラー訂正
用サーバとみなしたものに格納するよう構成され、前記複数のクライアントの内の少なくとも一つは、デー
タ結合手段とエラー訂正手段とを有するデータ読出用ク
ライアントであり、前記サーバからデータを読み出す際、該当する前記デー
タ用サーバの全てからブロックデータを読み出せた場合
には、その読み出したブロックデータを前記データ結合
手段によって結合することで元のデータを得るように
し、前記いずれかのデータ用サーバから正常なデータ読
み出しができなかった場合には、残りのデータ用サーバ
から正常に読み出したデータと前記エラー訂正用サーバ
から読み出したエラー訂正データに基づき前記エラー訂
正手段において前記正常に読み出せなかったブロックデ
ータを復元し、前記データ結合手段によって元のデータ
を得るよう構成されていることを特徴とするクライアン
トサーバシステム。
【請求項３】クライアントと、当該クライアントから
転送されたデータの格納及びクライアントからのデータ
読み出し要求に応じたデータの供給を行なう複数のサー
バとが所定の伝送路を介して接続されてネットワークを
構成するクライアントサーバシステムであって、前記クライアントは、データ分割手段と、エラー訂正データ生成手段と、デー
タ結合手段と、エラー訂正手段とを有しており、前記サーバへデータを格納する際、格納対象データを前
記データ分割手段によって複数のブロックデータに分割
すると共に、当該複数のブロックデータに対応するエラ
ー訂正データを前記エラー訂正データ生成手段によって
生成し、前記分割されたブロックデータを前記サーバの
内のデータ用サーバとみなした複数のものに分散して格
納すると共に、前記生成したエラー訂正データを前記複
数のサーバの内の前記データ用サーバ以外でエラー訂正
用サーバとみなしたものに格納するよう構成され、一方、前記サーバからデータを読み出す際、該当する前
記データ用サーバの全てからブロックデータを読み出せ
た場合には、その読み出したブロックデータを前記デー
タ結合手段によって結合することで元のデータを得るよ
うにし、前記いずれかのデータ用サーバから正常なデー
タ読み出しができなかった場合には、残りのデータ用サ
ーバから正常に読み出したデータと前記エラー訂正用サ
ーバから読み出したエラー訂正データに基づき前記エラ
ー訂正手段において前記正常に読み出せなかったブロッ
クデータを復元し、前記データ結合手段によって元のデ
ータを得るよう構成されていることを特徴とするクライ
アントサーバシステム。
【請求項４】請求項３に記載のクライアントサーバシ
ステムにおいて、前記複数のデータ用サーバ及びエラー訂正用サーバのい
ずれかにおいて格納されていたデータが消失した場合に
は、前記クライアントが、残りのサーバからのデータを
読み出し、前記エラー訂正手段によって前記消失データ
を復元して前記データ消失のあったサーバに格納させる
リビルド処理を実行するよう構成されていることを特徴
とするクライアントサーバシステム。
【請求項５】請求項１〜４のいずれかに記載のクライ
アントサーバシステムにおいて、前記クライアントは、前記サーバからデータを読み出す
際、該当する前記データ用サーバ及び前記エラー訂正用
サーバの内の、ネットワーク上での経路が近い所定数の
サーバから読み出したデータあるいはエラー訂正データ
に基づき、前記データ結合手段によって元のデータを得
るよう構成されていることを特徴とするクライアントサ
ーバシステム。