JP2000322292A - Cluster type data server system and data storage method - Google Patents

Cluster type data server system and data storage method

Info

Publication number
JP2000322292A
JP2000322292A JP11128273A JP12827399A JP2000322292A JP 2000322292 A JP2000322292 A JP 2000322292A JP 11128273 A JP11128273 A JP 11128273A JP 12827399 A JP12827399 A JP 12827399A JP 2000322292 A JP2000322292 A JP 2000322292A
Authority
JP
Japan
Prior art keywords
data
request
storage device
data storage
computer node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11128273A
Other languages
Japanese (ja)
Inventor
Yuichi Aiba
Koichi Konishi
弘一 小西
雄一 相場
Original Assignee
Nec Corp
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corp, 日本電気株式会社 filed Critical Nec Corp
Priority to JP11128273A priority Critical patent/JP2000322292A/en
Publication of JP2000322292A publication Critical patent/JP2000322292A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To increase the processing speed of an entire cluster system by adaptively distributing the load of processing dependent upon specific data on a data storage device to plural disks and computer nodes at the time of execution to uniformly charge individual data storage devices and computer nodes with the load in a non-shaped cluster system. SOLUTION: Data to be stored in a disk device is roughly divided and is subdivided furthermore, and all subdivided data 100-i1 to 100-im derived from the same roughly divided data are stored in the same disk, and meanwhile, copies 110-i1 to 110-im,..., 1r0-i1 to 1r0-im of respective subdivided data are stored in disks different from the disk, where original data is stored, and different from one another, and processing requests requiring individual subdivided data are distributed to the computer node having the disk, where original data is stored, and computer nodes having disks, where copy data are stored, in consideration of respective load conditions.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、複数の計算機ノードで構成されたクラスタシステムに関し、特に、各計算機ノードがそれぞれローカルなデータ記憶装置を有する無共有型クラスタシステムにおいてクラスタ外のクライアントからの要求を、各ノードのローカルデータ記憶装置内のデータを用いて処理するサーバアプリケーションを実行するサーバシステムに関する。 The present invention relates to relates to a cluster system comprising a plurality of computer nodes, in particular, a request from outside the cluster of the client in the shared-nothing clusters system in which each computer node has a local data storage device respectively the, for the server system running a server application to process using the data in the local data store for each node.

【0002】 [0002]

【従来の技術】一つのアプリケーションを実行するために、複数の独立した計算機を用いて構成したシステムをクラスタシステムという。 To perform the Related Art One application, a system configured with a plurality of independent computer that cluster system. クラスタシステムと分散システムとの相違は、クラスタシステムでは、アプリケーションの実行に、常時、クラスタ全体がかかわることである。 The difference between cluster systems and distributed systems, in a cluster system, the execution of the application, normally, is that the entire cluster is involved. またクラスタシステムと並列計算機との相違は、単独でも使用できる独立した計算機の集合として構成されていることである。 The difference between cluster systems and parallel computer is that it is constructed as a set of individually can be used independent computer.

【0003】クラスタシステムの目的は、大きく、高性能化、大容量化、信頼性向上の三つがある。 [0003] The purpose of the cluster system, a large, high-performance, large-capacity, there are three of reliability improvement. すなわち、 That is,
より多くの計算機を用いることによって、より高い処理性能を達成すること、より多くのデータを扱うこと、複数の計算機を用いることにより、そのうちのいくつかの計算機が停止しても、残りの計算機で処理を継続できるようにすることである。 By using more computer to achieve higher performance, able to handle more data, by using a plurality of computers, be stopped several computers of which the rest of the computer it is to ensure that processing can continue.

【0004】これらの目的が達成されるなら、クラスタシステムは、大規模なサーバアプリケーションを実行するシステムに好適とされる。 [0004] If these objectives are achieved, the cluster system is to be preferred to a system running a large-scale server applications. というのは、このようなアプリケーションは、一般に、ディスク装置(磁気ディスク装置、光ディスク装置等を含む)上の大量のデータを高速に処理する必要があり、また、常時、途切れることなくクライアントからの要求に応えることができる必要もあるからである。 Because, such applications, generally, a disk device must handle large amounts of data on the (magnetic disk device, an optical disk device, etc.) at high speed, also at all times, a request from a client without interruption This is because there is also a need to be able to respond to.

【0005】ディスク装置上の大量のデータを用いて処理を行うサーバアプリケーションとしては、データベース管理システム上のオンライントランザクション処理サーバや、音声・動画データの再生を行うクライアントにそれらのデータを供給するマルチメディアストリームサーバ、膨大な数の文書からユーザーが指定したキーワードを含む文書を見つけてその一覧を返す全文検索サーバ等が知られている。 [0005] The multi-media supply as the large amounts of server application that performs processing by using the data on the disk device, and online transaction processing server on the database management system, these data to the client to perform the playback of audio and video data stream server, and full-text search server or the like to return the list from the vast number of documents to find the document that contains the keywords specified by the user are known.

【0006】クラスタシステムにおいて、ディスクと計算機を接続する形態により、大きく二つに分類される。 [0006] In a cluster system, the form of connection of the disk and a computer, are largely classified into two.
その一つは、「ディスク共有(shared disk)型」と呼ばれ、計算機とディスク装置をネットワークを介して接続し、任意の計算機から任意のディスク装置に対して同じ手順でアクセスができるようにするものであり、他は、 One is called a "disk share (shared disk) type", the computer and the disk device connected via a network, to allow access by the same procedure for any of the disk device from any computer , and the other thing,
「無共有(shared nothing)型」と呼ばれ、各計算機にそれぞれローカルにディスク装置を直接接続し、計算機間で相互接続するためのネットワークを設けるものである。 Called "shared nothing (shared nothing) type" connect the disk drive directly to the local to each computer, in which providing a network for interconnecting between computers.

【0007】無共有型と比べ、ディスク共有型は、ディスク装置上の特定のデータを必要とする処理が、クラスタ内の任意の計算機ノードで行うことができる、という利点を有している。 [0007] Compared with the shared-nothing, disk shared, the process that requires a specific data on the disk device, can be performed in any computer node in the cluster has the advantage that.

【0008】そこで、従来より、ディスク共有型のクラスタシステムの上に構築されるトランザクション処理サーバ等では、各計算機ノードの負荷や稼働状態を常時監視して、クライアントから新しい処理要求を受け付けると、稼働中のより負荷の軽い計算機ノードを選択し、該選択した計算機ノードに処理を割り当てるための手段を備えているものがある。 [0008] Therefore, conventionally, the transaction processing server, etc. that is built on top of the disk shared cluster system monitors the load and operating conditions of each computer node always receives a new call from the client, running more select lighter computer node loaded in, there is provided with means for assigning the processing to the selected computer node. トランザクション処理サーバではトランザクションモニタと呼ばれる。 In the transaction processing server it is referred to as a transaction monitor.

【0009】かかる構成により、ある計算機ノードが停止していたり、負荷が高かったりする場合、当該計算機ノードの代替として、クラスタ内の他の任意の計算機ノードが選択され、処理を代替させて継続させることができる。 [0009] With this configuration, if there computer node or stopped, the load is high or, as an alternative to the computer node, any other computer node in the cluster is selected, and continues by alternative processing be able to.

【0010】このようにして、ディスク共有型クラスタシステムでは、比較的容易に、ある計算機ノードの停止時の運転継続、及び各計算機ノードの負荷の均等化を図ることができる。 [0010] Thus, in the disk shared cluster system, relatively easily, there continued operation of the stop computer node, and it is possible to equalize the load of each computer node.

【0011】一方、無共有型クラスタにおいては、一の計算機ノードから他の計算機ノードにローカルに接続しているディスク装置にアクセスするには、一の計算機ノードから他の計算機ノードに対してディスク装置に対する入出力処理を依頼し、他の計算機ノードにディスク装置に対する入出力処理を代行してもらう必要がある。 Meanwhile, in the non-covalent type cluster, one to access the disk device connected locally from the computer node to another computer node, the disk device to the other computer node from one computer node requesting input and output process with respect, there is a need to have on behalf of the input and output processing to the disk device to another computer node. これを、「遠隔ディスクアクセス」という。 This is referred to as a "remote disk access".

【0012】この際、ネットワークを介して依頼する入出力処理の内容及びこれに伴うデータが二つの計算機ノード間で授受され、一の計算機ノードが該一の計算機ノードに直接接続しているローカルディスク装置にアクセスする場合に比べ、アクセス時間が増大するとともに、 [0012] At this time, the local disk the contents of the input and output processing for requesting via a network and data associated therewith are transferred between two computer node, one computer node is connected directly to a computer node of the one compared with the case of accessing the device, together with the access time increases,
ネットワークトラフィック等が増大する。 Network traffic or the like is increased.

【0013】また、クラスタ内の一の計算機ノードが停止してしまった場合、他の計算機ノードから停止した一の計算機ノードに直接接続しているローカルディスク装置に記憶されているデータにアクセスするための手段がなくなる。 Further, if one computer node in the cluster has stopped, to access data stored in the local disk device connected directly to a computer node that has stopped from another computer node It means there is no of.

【0014】このため、無共有型クラスタシステムは、 [0014] For this reason, a shared-nothing cluster system,
そのままでは計算機ノードが停止時の運転継続を実現することは困難である。 Is intact it is difficult to computer node realizes the operation continuation at stop.

【0015】無共有型クラスタシステムにおいて、計算機ノードの停止時の運転継続を行うための手法としては、ディスクミラリング(mirroring)またはリダンダンントディスクアレイ等の冗長構成がよく知られている。 [0015] In shared-nothing cluster system, as a method for performing a continuous operation of the stop computer nodes, redundancy, such as disk mirroring (mirroring) or redundancy cement disk array is well known. この手法では、同一のデータを複数の異なる計算機ノードに接続するディスクに格納する。 In this approach, it is stored on disk connecting the same data to a plurality of different computer node.

【0016】これにより、一の計算機ノードが停止するかあるいは計算機ノードに接続するローカルディスク装置が停止しても、別のディスク装置にある同じデータの複製を利用して処理を継続することができる。 [0016] Thus, it is possible to continue even if the local disk device stops one computer node is to be connected to or computer node stops, using a copy of the same data in another disk device processing .

【0017】以下に説明する分散ファイルシステム「Ti [0017] The distributed file system, which will be described hereinafter referred to as "Ti
gerShark」は、このようなシステムの例である。 gerShark "is an example of such a system. 「Tige "Tige
rShark」については、文献(RL Haskin、“Tiger Sh For rShark "can be found in the literature (RL Haskin," Tiger Sh
ark-- A scalable file system for multimedia”, IBM ark-- A scalable file system for multimedia ", IBM
J. RES. DEVELOP. VOL. 42NO. 2、 March 1998、pp187 J. RES. DEVELOP. VOL. 42NO. 2, March 1998, pp187
-189)の記載が参照される。 -189), wherein the reference is.

【0018】この「Tiger Shark」の特徴の一つは、ファイルを多数の異なる計算機ノードに接続されたディスク装置に分散して格納する、ストライピングという技術である。 [0018] One feature of the "Tiger Shark" stores distributed to a number of disk devices connected to different computer node a file, a technique called striping. 概略を述べれば、n個の計算機ノードとそのローカルディスク装置があるとき、ファイル内のi番目のブロックを(i mod n)番目(modは剰余演算子)の計算機ノードのローカルディスク装置に格納する。 At a high, when there are n computer node and its local disk device, and stores the i-th block in the file (i mod n) th (mod is remainder operator) to the local disk drive of the computer nodes .

【0019】この「Tiger Shark」の他の特徴は、ファイルの複製をブロック単位で作成して原本と異なるディスク装置に配置する分散冗長格納技術である。 [0019] Another feature of the "Tiger Shark" is a distributed redundancy storage technique to place a copy of the file on a different disk device an original created in blocks. この分散ファイルシステムは、ビデオストリームサーバを実現するために使われている。 The distributed file system is used to implement the video stream server.

【0020】ストライピング技術は、以下記載の作用効果を有している。 The striping technique has effects described below. ビデオ(映像信号)や音声信号等のストリームデータを供給するサーバには、単位時間当たりに大量のデータを供給する能力が求められる。 The server supplies the stream data such as video (video signal) and audio signal, the ability is required to supply a large amount of data per unit time. 単位時間当たりのデータ供給量を「スループット」という。 The data supply amount per unit time of "throughput".

【0021】ストリームデータサーバに求められるスループットはしばしば単一のディスク装置や計算機ノードが提供できるスループットを超えている。 The throughput required for the stream data server often exceeds the throughput can provide a single disk device or computer nodes.

【0022】そこで、ファイルをストライピングしておいて、複数の計算機ノードがそれぞれ異なるディスク装置から並行に、データを読み出して、クライアントに向けて送出することでクラスタシステム全体として高いデータ供給性能を達成することができる。 [0022] Therefore, keep in striped file, in parallel from a plurality of computer nodes different disk devices respectively, reads data, to achieve high data supply performance overall cluster system by sending it to the client be able to.

【0023】一方、分散冗長格納技術の作用効果は以下の通りである。 On the other hand, effects of the dispersion redundant storage techniques are as follows.

【0024】そもそもデータの複製を複数のディスク装置に持つことによって、いくつかのディスク装置や計算機ノードに障害が起きたときにもデータの供給を継続することができる。 The first place by having a copy of data to a plurality of disk devices, it is possible to continue the supply of the data even when a failure to some disk device or computer node happened. 「Tiger Shark」は、さらに「均等ランダムストライピング」という技術によって、障害発生時に、残りの正常なディスク装置や計算機ノードに対して、障害を起こした計算機ノードやディスク装置を肩代わりする分の負荷が均等にかかるようにしている。 By "Tiger Shark" is art that further "uniformly random striping", when a failure occurs, the remaining normal disk device or computer node, even the amount of the load take over computer node or disk device failed so that according to the.

【0025】均等ランダムストライピングにおいては、 [0025] in a uniform random striping,
k個のディスク装置にファイルを分散して格納する場合、一つのファイルを構成するブロックを、先頭からk When storing and distributing files into k disk apparatus, the blocks constituting the one file, from the beginning k
個ずつのグループに分け、各グループごとに異なるランダムに決めた順序でブロックを配置する。 Divided into groups of pieces, to place the blocks in the order determined in different random for each group. 各ファイルの複製も同様に均等ランダムストライピングしておくことで、障害発生等により、あるディスク装置上のデータが利用できない場合、その複製は、ブロックのグループごとに異なるディスクに均等な割合で存在するので、ファイルを先頭から順に読み出していくかぎり、ファイル読み出し負荷は異なるディスク装置間に均等にかかることになる。 By also copy of each file kept uniformly random striping Similarly, the failure or the like, if unavailable data on one disk device, its replication are present in equal proportions on a different disk for each group of blocks so long as we are read sequentially the file from the beginning, the file reading load will be exerted on equally between different disk device.

【0026】 [0026]

【発明が解決しようとする課題】しかしながら上記した「Tiger Shark」等従来のシステムは、下記記載の問題点を有している。 [0005] However the above "Tiger Shark" like conventional system has the following problems described.

【0027】第1の問題点は、マルチメディアストリームデータの供給以外の用途に用いた場合、ディスク装置及び計算機ノードの処理負荷に偏りが生じる可能性が高い、ということである。 The first problem is, when used for purposes other than the supply of the multimedia stream data, there is a high possibility that bias occurs in the processing load of the disk device and the computer node is that.

【0028】その理由は、「Tiger Shark」においては、扱うファイルとして、動画や音声などのマルチメ [0028] The reason for this is that, in the "Tiger Shark" is, as a file handle, multimeter, such as video and audio
ディアストリームデータを想定しており、比較的大きなファイルを先頭から最後まで順番に読み出す、というアクセス方式に適した構成に特化されているためである。 Assumes the media stream data, sequentially reads out a relatively large file from beginning to end, because that is specialized configured for the access method called.

【0029】すなわち、「Tiger Shark」では、各ファイルをそれぞれ全計算機ノードに渡って、一様にストライプ化されたディスク装置に分散格納している。 [0029] That is, the "Tiger Shark" across each file to all computer nodes each, are distributed stored in uniformly striped disk devices. このため、ファイルごとのアクセス頻度の偏りがあっても、計算機ノードごとの処理負荷の偏りは発生しない。 Therefore, even if there is deviation of the access frequency for each file, the bias of the processing load of each computer node is not generated.

【0030】しかしながら、オンライントランザクション処理や、インデクスを用いる検索処理では、一つファイルの中でも場所によってアクセス頻度が相違したり、 [0030] However, online transaction processing and, in the search process using an index, the access frequency or different depending on the location, even within a single file,
アクセスするデータの範囲が毎回異なったりする。 Range of data to be accessed or different every time.

【0031】またファイル全体を先頭から最後まで順番に読み出して走査する検索処理ではディスク装置のアクセス形式は、ストリームデータと同じであるが、検索条件に該当するデータの個数によって、同じ量のデータを読み出しても、計算機ノードごとの処理量は、大きく変わる可能性がある。 Further access type of the disk device the entire file in the search process to scan sequentially reads from beginning to end is the same as stream data, the number of data corresponding to the search condition, the same amount of data be read, the processing amount for each computer node is likely to vary significantly.

【0032】そして、上記した「Tiger Shark」はこのような負荷の偏りへの対策を備えていない。 [0032] Then, the above-mentioned "Tiger Shark" does not have a countermeasure to such a load of bias.

【0033】第2の問題点は、マルチメディアストリームデータの供給以外の用途に用いた場合、従来のストライピングや均等ランダムストライピングでは、処理性能が向上するとは限らず、逆に、低下する可能性もあるという、ことである。 The second problem is, when used for purposes other than the supply of the multimedia stream data, in the conventional striping or even random striping, not necessarily performance is improved, conversely, a possibility of reduction that there is that.

【0034】その理由は、基本的には前記第1の問題点の理由と同じである。 The reason is basically the same as the reason for the first problem. ストリームデータのアクセスでは、比較的大きなファイル全体を先頭から最後まで順番に読み出す必要があると予測できるので、ストライピングしておいて、全てのディスク装置に対し一斉に読み出し開始を指示して並列処理を行うことができ、これによりスループットを向上させることができる。 The access of the stream data, since it can be predicted that it is necessary to read the entire relatively large files sequentially from the start to the end, in advance to striping, parallel processing instructs the simultaneously read start for all disk devices it can be performed, thereby improving the throughput.

【0035】しかしながら、トランザクション処理やインデクスファイルを用いた検索処理では、ファイルに対するアクセスはファイル全体ではなくその小さな一部分に対して、また先頭から順番ではなく、予期できない不特定の順序で行われる。 [0035] However, although search processing using a transaction processing or index files, access to the file for that small portion instead of the entire file, and not in the order from the head, carried out in the order of unpredictable unspecified.

【0036】このため、ストライピングされたファイルに対する個々のアクセスは、全ディスク装置ではなく、 [0036] Therefore, the individual access to striped file, not the entire disk apparatus,
数個のディスク装置に対するアクセスとなり、並列処理の効果が薄い。 It becomes access to several disk device, thin effect parallel processing.

【0037】そして、一連のアクセスは、異なるディスク装置に対するものになる可能性が高いので、これに対する複数のディスク装置による並列処理の効果は期待できるが、ストリームデータとは異なり、ファイルのどの部分に、どんな順序でアクセスが起きるかが予測できないため、各々のアクセス要求が到着するのを待ってからしかアクセスを開始することができず、結局、並列処理の効果は薄い。 [0037] Then, a series of access, it is highly likely to be against a different disk device, but the effect of the parallel processing by a plurality of disk devices can be expected to this, unlike the stream data, which parts of the file , either because the access occurs in any order can not be predicted, it is impossible to start access only after waiting for each access request to arrive, after all, the effect of the parallel processing thin.

【0038】さらに、ストライピングせずに一つのファイルを一つのディスク装置に格納する構成と比べると、 [0038] Further, as compared with the configuration stored in one disk device one file without striping,
複数のディスク装置に対して遠隔ディスクアクセスを行う手間がかかり、かえって、処理性能が低くなる可能性もある。 Takes time to perform a remote disk access to a plurality of disk devices, rather, there is a possibility that the processing performance is low.

【0039】第3の問題点は、ストライピングを止めると、負荷分布に大きな偏りが生じる、ということである。 The third problem, the stop striping, large deviation occurs is that the load distribution.

【0040】その理由は、完全にストライピングをやめて、ファイルの全ブロックを一つのディスク装置に格納してしまうと、当該ディスク装置にアクセスが集中してしまうためである。 [0040] The reason is completely stopped striping and results in store all blocks of the file to one disk device, in order to access the disk device is concentrated.

【0041】また、ここまで極端な状況に到らないまでも、別の問題が生じる。 [0041] In addition, if not lead to an extreme situation so far, another problem arises.

【0042】たとえば、中間的な手法としては、k個のディスクがあるとき、ファイルがk個のブロックに収まるよう、ブロックサイズを大きく設定した上で、均等ランダムストライピングを適用するという方法が考えられる。 [0042] For example, an intermediate approach, when there are k disk, so that the file fits into k blocks, upon setting a large block size is considered a method of applying uniform random striping .

【0043】この場合、ブロックのグループが一つしかできないため、あるディスク装置に配置されるブロックの複製は、別の一つのディスク装置にしか格納されない。 [0043] In this case, since the group of blocks can not be only one replication blocks arranged in one disk device is not stored only in a different one disk device.

【0044】このため、あるディスク装置が停止した時、そのディスク装置を肩代りする負荷は、上記別の一つのディスク装置に集中することになり、均等ランダムストライピングの効果が失われる。 [0044] Thus, when one disk unit is stopped, the load to take over the disk device, will be concentrated into said another one of the disk device, the effect of uniformly random striping is lost.

【0045】この問題を回避するために、ファイルが(m [0045] In order to avoid this problem, the file is (m
×k)個のブロックに収まるようにブロックサイズを設定して均等ランダム ストライピングを行うこともできるが、mを大きくするにつれ、肩代りのディスク装置の負荷はよりよく分散されるものの、上記した第2の問題点がより顕著になるという問題が残る。 While × k) number block size to fit the blocks can be performed uniformly random striping by setting, as to increase the m, although the load is better distributed in the disk device take-over, the above problem 2 problem becomes more marked remains.

【0046】したがって、本発明は、上記問題点に鑑みてなされたものであって、その目的は、無共有型のクラスタシステムにおいて、データ記憶装置上の特定のデータに依存した処理の負荷を、実行時に適応的に複数のディスク及び計算機ノードに拡散して、各データ記憶装置及び計算機ノードにかかる負荷を均等にし、結果的にクラスタシステム全体の処理を高速化する、システム及び方法を提供することにある。 [0046] Accordingly, the present invention was made in view of the above problems, and an object, in a shared-nothing cluster system, the load of processing depends on the particular data on the data storage device, diffuse into adaptively multiple disks and computer node at runtime, to equalize the load applied to each of the data storage device and the computer node, resulting in speeding up the processing of the entire cluster system, to provide a system and method that It is in.

【0047】本発明の他の目的は、いくつかのデータ記憶装置または計算機ノードが停止した時にも、当該データ記憶装置または計算機ノードの分の負荷を稼働中の複数の計算機ノードに分散して均等に肩代りさせる、システム及び方法を提供することにある。 [0047] Another object of the present invention, even when the number of data storage device or computer node stops, by dispersing minute load of the data storage device or computer node to a plurality of computer node running evenly to take over the present invention is to provide a system and method.

【0048】 [0048]

【課題を解決するための手段】前記目的を達成する本願第1発明に係るクラスタサーバシステムは、複数の計算機ノードより構成され、前記各計算機ノードがそれぞれローカルにデータ記憶装置を備える無共有型クラスタシステムの上で、データ記憶装置上のデータに依存する処理を行うサーバ・システムであって、前記データ記憶装置に記憶するデータを粗に分割したものを粗分割データとし、前記粗分割データをさらに分割したものを細分割データとし、同一粗分割データに由来するすべての細分割データを同一のデータ記憶装置に記憶し、前記同一粗分割データに由来するすべての細分割データの複製を原本とは異なる、かつ、互いに異なるデータ記憶装置に記憶するようにしたものである。 Means for Solving the Problems] cluster server system according to the first invention to achieve the object is composed of a plurality of computer node, a shared-nothing clusters each computer node comprises a data storage device locally respectively on systems performs processing which depends on the data on the data storage device to a server system, a material obtained by dividing the data stored in the data storage device to the crude and rough division data, further the coarsely divided data those divided as subdivision data, stores all the subdivision data from the same coarsely divided data to the same data storage device, an original replication of all subdivision data derived from the same rough division data different, and is obtained by adapted to store different data storage devices with each other.

【0049】本願第2発明は、上記第1発明のサーバシステムにおいて、ある細分割データに対する入出力を前記細分割データの原本を記憶するデータ記憶装置と前記細分割データの複製を記憶するデータ記憶装置とのいずれかを利用して実行するよう振り分ける入出力要求割り当て手段を備えている。 The present second invention, in the server system of the first invention, a data storage for storing a data storage device a copy of the subdivision data for storing original of the subdividing data input and output for the subdivision data in using either the device has an output request allocation means for distributing to run.

【0050】また、本願第3発明は、上記第1発明のサーバシステムにおいて、ある細分割データを必要とする処理に対する要求をを前記細分割データの原本を記憶するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記憶するデータ記憶装置を備えた計算機ノードとのどちらかを利用して実行するよう振り分ける処理要求割り当て手段を備えている。 [0050] Further, the present third aspect based on the first invention server system, there computer node that the request for processing that requires a subdivision data with data storage device for storing original of the subdividing data When, and a processing request allocation means for distributing to run using either the computer node having data storage device that stores a copy of the subdivision data.

【0051】本願第4発明は、上記第2発明のサーバシステムにおいて、ある細分割データの原本を記録するデータ記憶装置の負荷と、前記細分割データの複製を記録するデータ記憶装置の負荷を推測する手段と、より軽い負荷を持つと推測されたデータ記憶装置を利用して前記細分割データに対する入出力を実行するよう前記細分割データに対する入出力要求を振り分ける要求割り当て手段と、を備えている。 The fourth aspect of the present invention is inferred in the server system of the second invention, the load of the data storage device for recording original is subdivided data, the load of the data storage device for recording a copy of the subdividing data comprises means for a request allocation means for distributing the output request for the subdivision data to perform input and output to the subdividing data using the inferred data storage device to have a lighter load, the .

【0052】さらに、本願第5発明は、上記第3発明のサーバシステムにおいて、ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードの負荷と、 [0052] Further, the present fifth invention, in the server system of the third invention, the load of the computer node having data storage device that records the original is subdivided data,
前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードの負荷を推測する手段と、より軽い負荷を持つと推測された計算機ノードを利用して前記細分割データを必要とする処理を実行するよう前記細分割データを必要とする処理要求を振り分ける要求割り当て手段と、を備えている。 It means to estimate the load of the computer node having data storage device that records a copy of the subdividing data, a process that requires the subdivision data using the inferred computer node to have a lighter load and a, a request allocation means for allocating a processing request which requires the subdivision data to run.

【0053】また本願第6発明は、上記第2発明のサーバシステムにおいて、各計算機ノードの稼働状態を監視する手段を備え、ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードのうち、稼働中の計算機ノードを利用して前記細分割データに対する入出力を実行するように前記細分割データに対する入出力要求を振り分ける要求割り当て手段を備えている。 [0053] The present sixth invention, in the server system of the second invention comprises means for monitoring the operating status of each computer node, a computer node having data storage device that records the original subdivision data in among the computer node having data storage device that records a copy of the subdivision data, input and output request for the subdivision data as using the computer node running to perform input and output for the subdivision data and a request allocation means for distributing.

【0054】さらに本願第7発明は、上記第3発明のサーバシステムにおいて、各計算機ノードの稼働状態を監視する手段を備え、ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードのうち稼働中の計算機ノードを利用して前記細分割データを必要とする処理を実行するように前記細分割データを必要とする処理要求を振り分ける要求割り当て手段を備えている。 [0054] Further the present seventh invention, in the server system of the third invention, comprising means for monitoring the operating state of each computer node, a computer node having data storage device that records the original is subdivided data , requiring the subdivision data to execute the process that requires the subdivision data using a computer node in operation among the computing nodes with data storage device for recording a copy of the subdividing data and a request allocation means for distributing the processing request.

【0055】 [0055]

【発明の実施の形態】本発明の実施の形態について説明する。 The embodiment of the embodiment of the present invention will be described. まず、本発明の原理・作用について説明する。 First, a description will be given of the principle and operation of the present invention.

【0056】本発明を無共有型クラスタシステム構成のサーバシステムに適用した形態として、データ記憶装置(2_i)(但し、iは1以上n以下の整数)と要求処理手段(7_i)とファイルシステム(5_i)とを備える複数(n台)の計算機ノードと、これら全ての計算機ノードを接続するネットワーク(3)とを備えて構成されている。 [0056] The present invention as applied form the server system shared-nothing cluster system configuration, the data storage device (2_I) (where, i is an integer from 1 to n) and request processing means (7_I) and File System ( 5_I) and a computer node of a plurality (n stand) provided with is configured by a network (3) for connecting all these computer node.

【0057】本発明においては、データ記憶装置上に格納配置するべきデータを、おおまかに分割して粗部分データを作り、粗部分データをさらに分割して細部分データを作り、同一の粗部分データに由来する細部分データを同一の計算機ノードのデータ記憶装置に記憶し、細部分データの一つ以上の複製を互いに異なる、かつ原本とも異なるデータ記憶装置に記憶する。 [0057] In the present invention, the data to be placed stored on a data storage device, making the roughly divided crude partial data, the crude partial data further dividing make detailed partial data, the same crude partial data storing details fraction data from the same data storage device of the computer nodes, different one or more copies of fine partial data with each other, and also stored in different data storage device an original.

【0058】データ記憶装置上のデータを必要とする処理の要求を、データの原本を持つデータ記憶装置と複製を持つデータ記憶装置に細部分データ単位で振り分ける。 [0058] The request processing that requires data on the data storage device, distributes in detail partial data unit to the data storage device having a replicated data storage device having original data.

【0059】具体的には、処理要求を、各データ記憶装置または計算機ノードの稼働状態及び負荷状況に関する情報に基づいて、細部分データの原本または複製のどれに対して割り当てるかを実行時に決定する、要求割り当て手段(8_i)を備える。 [0059] More specifically, the processing request, based on information about the operating state and the load status of each data storage device or computer node, to determine at runtime whether assigned to any of the original or copy of fine partial data includes requesting allocation means (8_i).

【0060】本発明においては、一つの粗部分データに由来するすべての細部分データは、同一のデータ記憶装置に記憶されているのに対し、その複製データは、複数のデータ記憶装置に分散して記憶されている。 [0060] In the present invention, all the details amount data derived from one of the coarse partial data, while stored in the same data storage device, the duplicated data is distributed to a plurality of data storage devices It is stored Te.

【0061】そして、処理要求を満たすために細部分データが必要になるたびに、要求割り当て手段は、該細部分データの原本を使うか複製を使うかを決定する。 [0061] Then, each time it is required detailed partial data to satisfy the process request, requesting assignment means determines whether use replication or use original Said sub partial data.

【0062】このため、すべてのデータ記憶装置及び計算機ノードが稼働していて、おおむね均等に負荷がかかっているときには、一つの粗部分データ内に収まる比較的広い範囲のデータに対するアクセスを、これを格納する一つのデータ記憶装置に対するアクセスとして高々1 [0062] Therefore, all of the data storage device and the computer node is running and when that affects substantially equally loaded, access to a relatively wide range of data that will fit within a single coarse partial data, this at most as access to a single data storage device for storing 1
回の遠隔ディスクアクセスで行うことができる。 It can be carried out in times of remote disk access.

【0063】また、あるデータ記憶装置または該データ記憶装置を持つ計算機ノードの負荷が高い場合には、要求割り当て手段は、該データ記憶装置上に格納されている原本の代わりに複製を使うと決める比率を高めることによって、該データ記憶装置または該計算機ノードの負荷を、複数のデータ記憶装置または計算機ノードに拡散させ、データ記憶装置間または計算機ノード間の負荷の偏りを均等化することができる。 [0063] Further, when the load of the computer node with certain data storage device or the data storage device is high, it requests allocation means decides to use a copy instead of the original stored on the data storage device by increasing the ratio, the load of the data storage device or said computer node, is diffused into a plurality of data storage devices or computer node, it is possible to equalize the imbalance of load between the data storage device or between computer nodes.

【0064】さらにあるデータ記憶装置または計算機ノードが停止している場合には、要求割り当て手段が、該データ記憶装置またはその計算機ノードが持つデータ記憶装置上にある原本の代わりに、複製を使うと決めることによって、該データ記憶装置または計算機ノードの分の負荷を、複数のデータ記憶装置または計算機ノードに、代替させることができる。 [0064] When it is stopped data storage device or computer node is in further requested allocation unit, instead of the original in the data storage device or on a data storage device having its computer node, using replication by determining the amount of load of the data storage device or computer node, a plurality of data storage devices or computer node, it is possible to substitute a.

【0065】なお、本発明において、データ記憶装置は、HDD(ハードディスク装置)に限定されず、媒体への書き込み及び読み出しが自在とされる各種補助記憶装置を含むものとする。 [0065] In the present invention, the data storage device is not limited to the HDD (hard disk drive), is intended to include various auxiliary storage write and read to the media is freely. また各計算機ノードが備えるデータ記憶装置は論理的に一つのデータ記憶装置を構成していればよく、単一のドライブのコントロール装置、ドライブユニットに限定されるものでないことは勿論である。 The data storage device in which each computer node comprises only needs to configure one data storage device logically control device of a single drive, it is not limited to the drive unit is a matter of course.

【0066】本発明の実施の形態について図面を参照してより詳細に説明する。 [0066] An embodiment of the present invention will be now described in more detail.

【0067】 [0067]

【実施の形態1】図1は、本発明の第1の実施の形態の構成を示す図である。 Figure 1 [Embodiment 1] is a diagram showing a configuration of a first embodiment of the present invention. なお、以下では、データ記憶装置はディスク装置よりなるものとして説明する。 In the following, the data storage device will be described as consisting of a disk device. 図1を参照すると、本発明の第1の実施の形態は、複数の計算機ノード1_1〜1_n (nは2以上の整数)、ディスク装置2_1 Referring to FIG. 1, a first embodiment of the present invention, a plurality of computer node 1_1~1_n (n is an integer of 2 or more), the disk device 2_1
〜2_n、及びSAN(System Area Network、システムエリアネットワーク;システム内ネットワーク)3を備えており、各計算機ノード1_1〜1_nは、LAN(Local ~2_N, and SAN (System Area Network, system area network; system network) equipped with a 3, each computer node 1_1~1_n is, LAN (Local
Area Network;ローカルエリアネットワーク)4にも接続している。 Area Network; are also connected to a local area network) 4.

【0068】各計算機ノード1_1〜1_nは、それぞれファイルシステム5_1〜5_n、要求受付手段6_1〜6_n、要求処理手段7_1〜7_nを備えている。 [0068] Each computer node 1_1~1_n each file system 5_1~5_N, request receiving means 6_1~6_N, and a request processing unit 7_1~7_N.

【0069】ファイルシステム5_1〜5_nは、それぞれ、 [0069] file system 5_1~5_n, respectively,
要求割り当て手段8_1〜8_nを備えている。 And a request allocation means 8_1~8_N.

【0070】各計算機ノード1_1〜1_nの各要求受付手段 [0070] Each request receiving means of each computer node 1_1~1_n
6_i(但し、iは1以上n以下の整数)は、それぞれ、ディスク装置2_1〜2_n上のデータを必要とする処理要求を受け取って、該処理要求を複数の部分処理要求に分割し、これらの部分処理要求を、それぞれ要求処理手段7_1〜7_n 6_I (where, i is an integer from 1 to n), respectively, receives a processing request which requires data on the disk device 2_1~2_N, divides the processing request to a plurality of sub-process request, these the partial processing request, each request processing means 7_1~7_n
のいずれかに送り、それぞれの要求に対する応答として返ってきた部分処理結果を一つの処理結果に統合する。 Sent to either integrates the partial processing result is returned as a response to each request to one of the processing result.

【0071】要求処理手段7_1〜7_nは、要求受付手段6_ [0071] request processing means 7_1~7_n is, the request receiving means 6_
iは、部分処理要求に応えて、部分処理結果を作成する。 i is in response to the partial process request, to create a partial processing result.

【0072】ファイルシステム5_1〜5_nは、ファイルに対する入出力要求を受け取ってディスク装置上のデータに対する入出力を行う。 [0072] File system 5_1~5_n inputs and outputs to the data on the disk device receiving the input and output requests for files.

【0073】要求割り当て手段8_1〜8_nは、ファイルに対する入出力要求を、ファイルの原本及び1つ以上の複製の中から、いずれを用いて処理するかを決定する。 [0073] requesting allocation means 8_1~8_n is input and output requests for files from among the original and one or more copies of a file to determine whether treatment with either.

【0074】図2は、本発明の第1の実施の形態の処理を説明するための図である。 [0074] Figure 2 is a diagram for explaining the processing in the first embodiment of the present invention. 図2を参照すると、ディスク装置上のデータは、n個の粗部分データに分割され、 Referring to FIG. 2, the data on the disk device is divided into n crude partial data,
各粗部分データは、更にm個の細部分データ100_ij(但し、iは1以上n以下の整数、jは1以上m以下の整数)に分割されて、それぞれr個(但し、rは1以上の整数)の複製 Each coarse partial data, further the m detailed partial data 100_Ij (where, i is an integer from 1 to n, j is an integer 1 or m) is divided into, r pieces respectively (where, r is 1 or more replication of an integer)
110_ij,120_ij,...,1r0_ijと共に、以下の通り配置される。 110_ij, 120_ij, ..., along with the 1r0_ij, are arranged as follows.

【0075】ディスク装置2_i(但し、iは1以上n以下の整数)上には、細部分データの原本100_i1〜100_im(但し、mは1以上n-1以下の整数)があり、原本100_ij(jは1 [0075] disk device 2_I (where, i is an integer from 1 to n) on the fine partial data original 100_I1~100_im (where, m is 1 or n-1 an integer) has, original 100_Ij ( j 1
以上m以下の整数)の複製110_ij〜1r0_ijは、ディスク装置2_i以外のそれぞれ異なるディスク装置2_k(kは1以上n M or more replication 110_ij~1r0_ij of an integer), the different disk units 2_k other than the disk device 2_i (k is 1 to n
以下の整数)上にある。 In the following integer) on.

【0076】次に図1及び図2を参照して、本発明の第1の実施の形態の動作について説明する。 [0076] Referring now to FIGS. 1 and 2, the operation of the first embodiment of the present invention.

【0077】要求受付手段6_1〜6_nは、それぞれLAN4 [0077] request acceptance means 6_1~6_n, respectively LAN4
を経由して処理要求を受け付ける。 It accepts a processing request via the. 要求受付手段6_k(但し、kは1以上n以下の整数)は、処理要求を受け付けると、それが要求する処理のうち、ディスク装置2_i(但し、iは1以上n以下の整数)に原本が記憶されている細部分データ100_i1〜100_imだけを用いて実行できる部分を要求するn個の部分処理要求200_1〜200_nを作成する。 Request receiving means 6_K (where, k is an integer from 1 to n), when receiving a processing request, among the processes which it requires, a disk device 2_I (where, i is an integer from 1 to n) is the original in using only detailed partial data 100_i1~100_im stored to create a n partial processing request 200_1~200_n requesting portion that can be performed.

【0078】そして、各部分処理要求200_iを、SAN3経由で要求処理手段7_iに送る。 [0078] Then, the respective partial process request 200_I, sends the request processing means 7_i via SAN 3.

【0079】要求処理手段7_iは、細部分データ100_i1 [0079] request processing means 7_i is fine partial data 100_i1
〜100_imに対する入出力要求をファイルシステム5_iに送出する。 It sends the input and output requests for ~100_im the file system 5_I.

【0080】ファイルシステム5_iは、細部分データ100 [0080] file system 5_i is, fine partial data 100
_ijに対する入出力要求を受け取ると、これを要求割り当て手段8_iに渡す。 Upon receiving the input output request for _Ij, passes it to the requesting assignment means 8_I.

【0081】要求割り当て手段8_iは、細部分データの原本100_ij及び複製110_ij〜1r0_ijがどの計算機ノードのディスク装置に記憶されているかを調べ、原本及び複製を記憶している各ディスク装置及び、各ディスク装置に直接接続する計算機ノードの稼働状態と、これらのディスク装置及び計算機ノードにかかっている負荷量を推測し、動作中の計算機ノードに接続された動作中のディスク装置のうち、より負荷が軽いディスク装置または計算機ノードを優先的に選択して、これに、細部分データ [0081] requesting allocation means 8_i examines whether original 100_ij and replication 110_ij~1r0_ij fine partial data stored in the disk device of which computer nodes, original and duplicate each disk device and stores, each disk and operating state of the computer nodes connected device directly to, among these disk units and infer the load hanging on the computer node, the disk device in operation connected to the computer node in operation, more load is light select the disk devices or computer node priority, to the narrow partial data
100_ijに対する入出力要求を割り当てる。 Assigning input and output requests for 100_Ij.

【0082】ファイルシステム5_iは、計算機ノード2_i [0082] file system 5_i is, computer node 2_i
に割り当てられた入出力要求を実行し、その結果を、要求処理手段7_iに返す。 Run O requests assigned to, the result is returned to the requesting processing unit 7_I.

【0083】また他の計算機ノード2_h(但し、hはi以外の1以上n以下の整数)に割り当てられた入出力要求の処理を、SAN3を介して計算機ノード2_hのファイルシステム5_hに依頼し、その結果を受けとって、要求処理手段7 [0083] The other computer node 2_H (where, h is an integer from 1 to n except i) processing the output request assigned to, ask the file system 5_h computer node 2_H via SAN 3, and it receives the result, the request processing unit 7
_iに返す。 Return to _i.

【0084】さらに他の任意のファイルシステム5_l(但し、lはi以外の1以上n以下の整数)からSAN3を介して入出力要求の依頼を受け、これを実行して結果をファイルシステム5_lに返す。 [0084] Yet another optional file system 5_L (where, l is an integer from 1 to n except i) at the request of the output request via the SAN3 from the results by running it in the file system 5_L return.

【0085】要求処理手段7_iは、必要なファイルの入出力の全ての結果を得て、部分処理を完了すると、その結果を要求受付手段6_kに返す。 [0085] request processing means 7_i obtains all the results of the input and output of the required file completes the partial processing, and returns the result to the request receiving means 6_K.

【0086】要求受付手段6_kは、要求処理手段7_1〜7_ [0086] request acceptance means 6_k, the request processing means 7_1~7_
nの全てから部分処理結果を受け取ると、これらを一つの処理結果にまとめて、LAN4経由で処理要求の送付元に返送する。 Upon receiving the partial processing results from all n, these are combined into a single processing result back to the sender of the processing request via the LAN 4.

【0087】次に、本発明の第1の実施の形態の作用効果について説明する。 The following will describe effects of the first embodiment of the present invention.

【0088】本発明の第1の実施の形態においては、ディスク装置2_iの負荷が他のディスク装置に比べて高い場合、要求割り当て手段8_1〜8_nが、ディスク装置2_i [0088] In the first embodiment of the present invention, when the load of the disk device 2_i is higher than the other disk device, the request assignment means 8_1~8_N, disk device 2_i
上にある全ての細部分データを使う割合を減らすよう決定し、これにより、予期できない入出力パターンによって、特定のディスク装置の負荷が突出して高くなった場合にも、その負荷を下げることができ、各ディスク装置にかかる負荷を均等化することにより、システム全体の処理性能を向上させることができる。 Determined to reduce the rate to use all the details amount data in the above, thereby, the output pattern that can not be expected even when the load of a specific disk device becomes higher projected, can lower the load by equalizing the load on the respective disk devices, it is possible to improve the overall processing performance system.

【0089】本発明の第1の実施の形態の第2の作用効果は、ディスク装置2_iが停止している時、要求割り当て手段8_1〜8_nがディスク装置2_i上にある全ての細部分データに代えて、他の複数のディスク装置上にある、 [0089] The second effect of the first embodiment of the present invention, when the disk device 2_i is stopped, requesting allocation means 8_1~8_n is instead all details fraction data on the disk device 2_i Te, on other plurality of disk devices,
その複製または原本を用いるように決定する。 Determining to use the duplicate or original. これにより、障害等予期しない理由により、あるいは保守目的などの予定された理由により、ディスク装置2_iが停止しても、処理を継続できる。 Thus, for reasons unexpected trouble or the like, or by scheduled reasons such as maintenance purposes, even if the disk apparatus 2_i stops can continue.

【0090】本発明の第1の実施の形態の第3の作用効果は、あるディスク装置が記憶する複数の原本に対応する複製がそれぞれ異なるディスク装置にあるため、あるディスク装置が記憶する原本に対する入出力要求を対応する複製を記憶する他のディスク装置に振り向けることによって、一つのディスク装置に対する負荷を複数のディスク装置に拡散することができる。 [0090] The third effect of the first embodiment of the present invention, since the replica corresponding to a plurality of original document stored in the one disk device is in a different disk device, respectively, for the original to be stored is a disk device by diverting the other disk devices for storing the corresponding duplicate O requests, it is possible to spread the load on one disk device to a plurality of disk devices. これにより、少ないステップで数多くのディスク装置に負荷を拡散することができる。 This makes it possible to spread the load on the number of disk devices in fewer steps.

【0091】 [0091]

【実施例1】次に、上記した本発明の第1の実施の形態についてさらに詳細に説明すべく、具体的な実施例に即して説明する。 EXAMPLE 1 Next, further in order to be described in detail, will now be explained with reference to the specific embodiments A first embodiment of the present invention described above. 以下では、本発明を全文検索サーバシステムに適用した実施例について説明する。 Hereinafter, a description will be given of an embodiment in which the present invention is applied to the full-text search server system. なお、本発明の一実施例の基本構成は、図1を参照して説明した前記実施の形態の構成と同様とされる。 The basic configuration of an embodiment of the present invention is the same as that of the foregoing embodiment described with reference to FIG.

【0092】ここで、全文検索とは、与えられた文書群の中から、与えられた文字列群を含む文書を検索してその一覧を求める処理である。 [0092] Here, the full-text search, from among the group of a given document, and search for documents that contain the string group that has been given is a process for obtaining the list. ここではインデクスファイルを用いて全文検索を実現する。 Here to achieve a full-text search using the index file. インデクスファイルとは、文書群中に出現する任意の単語から、それを含む文書群中の全文書一覧を取り出せるようにしたもので、あらかじめ文書群中に出現する全単語について、それを含む文書の一覧を求めて、各単語と対応する文書一覧の対を木構造ないしハッシュ表により対応づけたデータ構造をファイル中に収めたものである。 The index file, from any of the words that appear in the document group, which was to release the entire list of documents in the document group including it, for all the words that appear in advance document group, a document that contains it seeking list, in which the pair of corresponding document list with each word matches the association data structure by a tree structure or a hash table in the file.

【0093】本実施例では、細部分データにあたるものとして、インデクスファイルを分割して作るサブインデクスを設ける。 [0093] In this example, as corresponding to fine partial data, providing a sub-index making by dividing the index file.

【0094】ある文書群のインデクスファイルのサブインデクスは、その文書群を分割して作った部分文書群のインデクスであると定める。 [0094] sub-index of the index file of a document group, defined as an index of a partial document group was made by dividing the document group.

【0095】図3は、本発明の一実施例をなす全文検索サーバの構成の一例を示す図である。 [0095] Figure 3 is a diagram illustrating an example of a configuration of a full-text search server that constitutes an embodiment of the present invention. 図3を参照すると、8台の計算機ノードを備え、ディスク装置2_i(但し、iは1以上8以下の整数)には、それぞれ4つのサブインデクスの原本500_i1〜500_i4と、サブインデクスの複製600_jk(但し、kは1以上4以下の整数、jは整数であり、j=(ik)mod8)が格納されている。 Referring to FIG. 3, comprises eight computer node, the disk device 2_I (where, i is 1 to 8 integer), an original 500_i1~500_i4 of each of the four sub-indices, the sub index replication 600_Jk ( However, k is 1 to 4 integer, j is an integer, j = (ik) mod8) is stored.

【0096】要求割り当て手段8_iは、各計算機ノードに割り当てられた入出力要求を記録する入出力要求割当表9_iと、各計算機ノードの稼働状態を監視する状態監視手段10_iを備える。 [0096] requesting allocation means 8_i includes an input-output request allocation table 9_i recording O requests assigned to each computer node, a status monitoring unit 10_i for monitoring the operating state of each computer node.

【0097】図4は、本発明の一実施例におけるサブインデクスの原本500_ij及び複製600_ijの構成手順を説明するための模式図である。 [0097] Figure 4 is a schematic diagram for explaining the configuration procedure of the original 500_ij and replication 600_ij sub index in one embodiment of the present invention.

【0098】8万件の検索対象文書があり、それぞれ文書ID00001〜80000が与えられている。 [0098] There is a 80,000 document to be searched for, respectively document ID00001~80000 is given. これを先頭から順に1万件ずつ8個に分け、ディスク装置2_1〜2_8に一つずつ割り当てる。 This is separated from the top to eight one by 10,000 in the order, assign one by one in the disk device 2_1~2_8.

【0099】さらにディスク装置2_i(但し、iは1以上8 [0099] In addition disk device 2_i (however, i is from 1 to 8
以下の整数)に割り当てた文書群を2500件ずつ4個に分けて、それぞれについてサブインデクスを作成して500_ The following integer) the assigned document group divided into four one by 2500, 500_ create a sub-indexes for each
i1〜500_i4とする。 And i1~500_i4.

【0100】さらにサブインデクス500_ij(但し、jは1 [0100] Furthermore, the sub-index 500_ij (however, j 1
以上4以下の整数)の複製を作成して600_ijとする。 And 600_ij by creating a copy of or an integer of 4 or less).

【0101】図5は、サブインデクスの原本500_ij及び複製600_ijのディスク装置2_1〜2_8上への配置を示す模式図である。 [0102] Figure 5 is a schematic view showing the arrangement of the sub-index of the original 500_ij and replication 600_ij disk device above 2_1~2_8. 図5を参照すると、原本500_i1〜500_i4 Referring to FIG. 5, the original 500_i1~500_i4
(但し、iは1以上8以下の整数)は、すべてディ スク装置 (Where, i is 1 to 8 of an integer), all disk device
2_iに置く。 Put to 2_i.

【0102】h = (i + j) mod 8 の時、複製600_ih [0102] when h = (i + j) mod 8, duplication 600_ih
は、ディスク装置2_hに置く。 It is put in the disk device 2_h.

【0103】図6は、本発明の一実施例における入出力要求割当表9_1の構成の一例を示す図である。 [0103] Figure 6 is a diagram showing an example of input-output requests allocation table 9_1 configuration of an embodiment of the present invention. 入出力要求割当表9_iは、データ500_i1〜500_i4の原本を持つディスク装置2_iへの入出力要求キュー30_1と、データ500 Output request allocation table 9_i includes input and output request queue 30_1 to the disk device 2_i with original data 500_I1~500_i4, data 500
_i1〜500_i4の複製600_i1〜600_i4を持つディスク装置2 Disk device 2 having the replication 600_i1~600_i4 of _i1~500_i4
_h〜2_k(但し、h = (i + 1) mod 8, k = (i + 4)mod _h~2_k (However, h = (i + 1) mod 8, k = (i + 4) mod
8)のそれぞれへの入出力要求キュー30_2〜30_5を備える。 It comprises output request queues 30_2~30_5 to each 8).

【0104】図7は、本発明の一実施例の動作を説明するためのシーケンス図であり、クエリが計算機ノード1_ [0104] FIG. 7 is a sequence diagram for explaining the operation of an embodiment of the present invention, the query computer node 1_
1の要求受付手段6_1に到着した場 合の処理の流れを説明するための図である。 It is a diagram for explaining the flow of processing of arrived if the first request receiving means 6_1.

【0105】図7を参照すると、要求受付手段6_1は、 [0105] Referring to FIG. 7, the request receiving means 6_1,
クエリをそのまま複製して、全計算機ノード上の要求処理手段7_1〜7_8に投入する。 Duplicate the query as it is put into the request processing means 7_1~7_8 on all computer node.

【0106】各要求処理手段7_i(1≦i≦8)は、検索を行うためにサブインデクス500_i1〜500_i4に対する読み出し要求をファイルシステム5_iに発行する。 [0106] Each request processing means 7_i (1 ≦ i ≦ 8) issues a read request to the sub-index 500_i1~500_i4 file system 5_i for lookups.

【0107】ファイルシステム5_iは、要求割り当て手段8_iに、サブインデクス500_ijに対する読み出し要求を処理するべき計算機ノードの割り当てを依頼する。 [0107] File system 5_i is to request allocation unit 8_I, requests the allocation of the computer node to process the read request to the sub-index 500_Ij.

【0108】要求割り当て手段8_iは、各読み出し要求をキュー30_i〜30_(i+4)のどれかにつなぐ。 [0108] request assignment means 8_i is, connect to any of the each read request queue 30_i~30_ (i + 4).

【0109】ファイルシステム5_iは、キュー30_iにつながれた読み出し要求があれば先頭から順に取り出して、ディスク装置2_iから読み出しを実行し、また、キュー30_(i+q)(但し、qは1以上4以下の整数)のどれかにつながれた読み出し要求があれば、ファイルシステム5_ [0109] File system 5_i takes out from the beginning if there is a read request which is connected to the queue 30_i sequentially perform a read from the disk device 2_I, also queue 30_ (i + q) (where, q is 1 or more 4 if there is a read request which is connected to one of the following integer), the file system 5_
(i+q)にSAN3を経由して送信する。 (I + q) to be transmitted via the SAN3.

【0110】ファイルシステム5_(i+q)は、要求されたデータを、ディスク2_(i+q)装置から読み出し、SAN3経由でファイルシステム5_iに返送する。 [0110] File system 5_ (i + q) is the requested data is read from the disk 2_ (i + q) device, and returns it to the file system 5_i via SAN 3.

【0111】ファイルシステム5_iは、ディスク装置2_i [0111] file system 5_i is, the disk device 2_i
またはファイルシステム5_(i+q)から受けとった読み出し結果を要求処理手段7_iに返す。 Or it returns a file system 5_ (i + q) read result received from the request processing unit 7_I.

【0112】要求処理手段7_iは、読み出し要求に対する結果を、ディスク装置2_iまたはファイルシステム5_ [0112] request processing means 7_i is the result of read request, the disk device 2_i or file system 5_
(i+q)から得ると、その読み出し要求を、キューから取り除く。 When obtained from (i + q), the read request is removed from the queue.

【0113】こうして要求処理手段7_iは、サブインデクス500_i1〜500_i4の原本または複製を用いて、クエリに対する該当文書IDリストを作成し、これを、要求受付手段6_1に返送する。 [0113] Thus the request processing unit 7_i, using the original or copy of the sub-index 500_I1~500_i4, create the corresponding document ID list to the query, which is sent back to the request receiving unit 6-1.

【0114】要求受付手段6_1は、要求処理手段7_1〜7_ [0114] request acceptance means 6_1, request processing means 7_1~7_
8から該当文書IDリストを受け取って、これらを一つにまとめ、クエリの発行元に返送する。 8 receives the relevant document ID list from, collectively in part, to return to the query issuer.

【0115】図8は、本発明の一実施例における要求割当手段8_iの動作を説明するための流れ図である。 [0115] Figure 8 is a flow chart for explaining the operation of the demand assigned means 8_i in an embodiment of the present invention. 図8 Figure 8
を参照して、要求割当手段8_iの動作を説明する。 See, for explaining the operation of the request assignment means 8_I.

【0116】要求割り当て手段8_iは、細部分データ500 [0116] requesting allocation means 8_i is fine partial data 500
_ijに対する、読み出し要求の割り当て依頼を受けると、500_ijの複製600_ijがどのディスク装置にあるかを調べる(ステップS101)。 For _Ij, receives the allotment of a read request, determine in which disk device replication 600_ij of 500_Ij (step S101). ここではディスク装置2_hにあるとする。 Here, it is to be in a disk device 2_H.

【0117】次に、稼働状態監視手段10_iを参照して、 [0117] Next, referring to the operation state monitoring means 10_i,
ディスク装置2_hが稼働しているかどうかを調べる(ステップS102)。 Determine whether the disk device 2_h is operating (step S102).

【0118】停止している場合、次にディスク装置2_i [0118] If it is stopped, then the disk device 2_i
が稼動しているかどうかを調べる(ステップS108)。 There investigate whether the operation (step S108).

【0119】これも停止しているならば、ディスク装置 [0119] This is also If you are stopped, the disk device
2_iが読み出し処理の失敗を通知して終了する(ステップS109)。 2_i is completed notifies the failure of the read process (step S109).

【0120】一方、ステップS108で、ディスク装置2_i [0120] On the other hand, in step S108, the disk device 2_i
が稼動しているならばキュー30_iに読み出し要求をつないで終了する。 There is terminated by connecting a read request to if if queue 30_i running.

【0121】ステップS102で、ディスク2_hが稼動しているならば、次にディスク装置2_iが稼働しているかどうかを調べる(ステップS103)。 [0121] In step S102, if the disk 2_h is running, then find out whether the disk device 2_i is running (step S103). 停止しているならば、キュー30_hに読み出し要求をつないで(ステップS If stopped, it connects a read request in the queue 30_H (step S
107)、終了する。 107), to the end.

【0122】ステップS103でディスク装置2_iが稼働しているならば、割当表9_iを参照して、キュー30_iと30_ [0122] If the disk device 2_i in step S103 is running, by referring to the allocation table 9_i, queue 30_i and 30_
hの長さを調べる(ステップS104)。 Check the length of h (step S104).

【0123】仮にキュー30_hにつないだとしたとしてもまだキュー30_iがキュー30_hの4倍以上長くなるならば、キュー30_hにつなぎ(ステップS107)、4倍未満になるならばキュー30_iに読み出し要求をつないで(ステップS106)、終了する。 [0123] If even if still queue 30_i longer than 4 times the queue 30_H as was tethered to the queue 30_H, connect the queue 30_H (step S107), the read request to Save if queue 30_i less than 4 times connecting at (step S106), and ends.

【0124】次に要求割り当て手段8_iの動作を具体的な例に即して詳細に説明する。 [0124] Next will be described in detail with reference to operation of the request assignment means 8_i a specific example.

【0125】図6において、キュー30_1にはすでに入出力要求a、b、cが、またキュー30_4にはdが入っている。 [0125] In FIG. 6, already output request a is in the queue 30 _ 1, b, c are also in the queue 30_4 containing the d. ここで、500_11に対する入出力要求40_1が投入されたとき、500_11の原本は、ディスク装置2_1に、その複製600_11はディスク装置2_2にあり、この両ディスク装置に対するキューを比べると、キュー30_1には、まだ3 Here, when the input-output request to 500_11 40_1 is turned on, the original of 500_11 is the disk device 2_1, the replication 600_11 is the disk device 2_2, when comparing the queue for the two disk device, the queue 30_1, still 3
個しか要求がないので、キュー30_2は空であるが、入出力要求40_1はキュー30_1に入れる、と決める。 Since only individual there is no request, queue 30_2 but is empty, input and output request 40_1 is placed in a queue 30_1, and decide.

【0126】次に500_12に対する入出力要求40_2が入来したとき、500_12の原本はディスク装置2_1に、複製600 [0126] When the next output request for 500_12 40_2 is incoming, original 500_12 the disk device 2_1, replication 600
_12はディスク装置2_3にあり、この両ディスクに対するキューを比べると、キュー30_1には、4個要求が入っており、キュー30_3は空なので、入出力要求40_2はキュー _12 is in the disk device 2_3, when comparing the queue for the two discs, the queue 30_1, has entered four request, because the queue 30 _ 3 is empty, input and output request 40_2 queue
30_3に入れると決める。 Decide to put to 30_3.

【0127】次に、インデクス500_13に対する入出力要求40_3が来たとき、500_13の原本はディスク装置2_1 [0127] Next, when the input and output requests for index 500_13 40_3 came, the original of 500_13 disk apparatus 2_1
に、複製600_13はディスク装置2_4にあるので、この両ディスクに対応するキューを比べると、キュー30_1には4個要求が入っており、キュー30_4にも1つ要求が入っているので、入出力要求40_3はキュー30_1に入れると決める。 , Since replication 600_13 is the disk device 2_4, when comparing the queue corresponding to the two discs, the queue 30_1 has entered four requirements, since the queue 30_4 one request is on, input and output request 40_3 decide to put in the queue 30_1.

【0128】次に、サブインデクス500_14に対する入出力要求40_4について決める前に、ディスク2_1での処理が進み、キュー30_1から入出力要求aとbが取り除かれたとする。 [0128] Next, before deciding about the output request 40_4 for sub index 500_14, treatment with disk 2_1 advances, and from the queue 30_1 output request a and b have been removed.

【0129】500_14の原本はディスク2_1に、複製はディスク2_5にあり、両ディスクに対するキューを比べると、キュー30_1には3個しか要求がないので、キュー30 [0129] original of 500_14 the disk 2_1, duplication is in the disk 2_5, when comparing the queue for both disk, since it is not only three requests in the queue 30_1, queue 30
_5が空であるが、要求40_4はキュー30_4に入れると決める。 _5 but is empty, request 40_4 decide to put in the queue 30_4.

【0130】この例では、原本を使うか複製を使うかを、キューの中の要求の個数の比が4倍以上か未満かで決めているが、判定基準とする比としては、任意の数値を使うことができる。 [0130] In this example, whether using replication either use the original text is the ratio of the number of requests in the queue is determined by the less than or or 4 times or more, as a ratio to criterion, any numerical value it can be used. 最適な値は、原本にアクセスするコストと複製にアクセスするコストに基づいて決まる。 Optimum value is determined based on the cost of accessing the duplicate and the cost of accessing the original.

【0131】また、比ではなく個数の差が一定値以上か未満かで決めるようにしてもよい。 [0131] The difference in the number rather than the ratio may be decided on whether less or more than a predetermined value.

【0132】また、各ディスクの最近の応答時間や累積アクセス時間の大小に基づいて定めることもできるし、 [0132] Also, it can either be determined based on the magnitude of the recent response time and the cumulative access time for each disk,
各ディスクが一つの入出力要求を終え次第、そのディスク上のデータに対する最も古い要求を割り当てることもできる。 Upon each disk has finished one of the input and output requirements, it is also possible to assign the oldest request for data on the disk.

【0133】 [0133]

【実施の形態2】次に本発明の第2の実施の形態について説明する。 [Second Embodiment] Next will be described a second embodiment of the present invention. 図9は、本発明の第2の実施の形態の構成を示す図である。 Figure 9 is a diagram showing a configuration of a second embodiment of the present invention. 図9を参照すると、本発明の第2の実施の形態は、図1に示した前記第1の実施の形態における要求割り当て手段8_1〜8_nに代えて、要求受付手段6_ Referring to FIG. 9, a second embodiment of the present invention, instead of requesting allocation means 8_1~8_n in the first embodiment shown in FIG. 1, the request reception unit 6_
1〜6_nに、第2の要求割り当て手段21_1〜21_nを備えている点が相違している。 The 1~6_N, point that are different comprise a second request assignment means 21_1~21_N.

【0134】要求受付手段6_iは、LAN4経由でクライアントから処理要求を受けとると、異なる細部分データ50 [0134] request acceptance means 6_i has received the processing request from the client through the LAN4, different details fraction data 50
0_ij(但し、iは1以上n以下の整数、jは1以上m以下の整数)を必要とするn×m個の部分処理要求を作成する。 0_Ij (where, i is an integer from 1 to n, j is an integer 1 or m) to create the n × m pieces of partial process requests requiring.

【0135】そして各部分処理要求をどの要求処理手段に送付するかの決定を第2の要求割り当て手段21_iに依頼する。 [0135] and requests the determination of whether to send the respective partial process request which requests the processing unit to the second request assignment means 21_I. 第2の要求割り当て手段21_iは、細部分データ Second request assignment means 21_i is fine partial data
500_ijを必要とする部分処理要求を、その原本をディスク装置2_i上に持つ要求処理手段7_iに投入するか、その複製600_ijをディスク装置2_h上ににもつ要求処理手段7 The partial process requests requiring 500_Ij, or put into request processing means 7_i with that original onto the disk apparatus 2_I, luggage request processing unit 7 the duplicate 600_ij on disk device 2_h
_h(但し、hはiとは異なる1以上n以下の整数)に投入するかを決定する。 _h (where, h is different an integer from 1 to n and i) determining whether put into.

【0136】要求受付手段6_iは、要求割当手段21_iの決定に従って、部分処理要求を要求処理手段に送付する。 [0136] request acceptance means 6_i is, according to the decision of the requested allocation means 21_i, to send the partial processing request to the request processing means.

【0137】要求処理手段7_kは、ファイルシステム5_i [0137] request processing means 7_k, the file system 5_i
を経由してディスク5_i上の細部分データの原本または複製をアクセスして部分処理要求を実行し、その結果を要求受付手段6_iに返す。 Via performs the partial process request by accessing the original or copy of the detailed content data on the disk 5_I, and returns the result to the request receiving means 6_I.

【0138】要求受付手段は、n個の部分処理要求の結果を使って処理要求の実行し、その結果をクライアントに返す。 [0138] request acceptance means, using the results of the n number of partial processing request to the execution of the processing request, and returns the results to the client.

【0139】次に、本発明の第2の実施の形態の作用効果について説明する。 [0139] Next, the function and effect will be described in the second embodiment of the present invention.

【0140】本発明の第2の実施の形態では、細部分データの原本500_ijをディスク装置2_iにもつ計算機ノード1_i(但し、iは1以上n以下の整数)の負荷が他の計算機ノードに比べて高い場合、第2の要求割り当て手段21_i [0140] In the second embodiment of the present invention, computer node 1_i with original 500_ij fine partial data to the disk device 2_I (where, i is an integer from 1 to n) than the load of the other computer node If Te high, the second request assignment means 21_i
が細部分データ500_ijを必要とする部分処理要求を、複製600_ijをディスク装置2_hに持つ他の計算機ノード1_h Other computer node 1_h with but a partial process requests requiring detailed partial data 500_Ij, replication 600_ij the disk device 2_h
に割り当てる。 Assigned to. このため、特定の計算機ノードの負荷が突出して高くなってもその負荷を下げることができる。 Therefore, it is possible to load a particular computer node reduce its load even higher projects.

【0141】本発明の第2の実施の形態の第2の作用効果は、ディスク装置2_iまたは計算機ノード1_iが停止している時、第2の要求割り当て手段21_1〜21_nが計算機ノード1_iに代えて、ディスク装置2_iに記憶されている細部分データの複製を持つ他のディスク装置を持つ他の複数の計算機ノードを使うように決定する。 [0141] The second effect of the second embodiment of the present invention, when the disk device 2_i or computer node 1_i is stopped, the second request assignment means 21_1~21_n is in place the computer node 1_i , determined to use a plurality of other computer node with other disk devices that have a replica of the detail component data stored in the disk device 2_I.

【0142】これにより、障害など予期しない理由により、あるいは保守目的などの予定された理由により、ディスクが停止しても、処理を継続できる。 [0142] Thus, for the reasons unexpected, such as failure, or by scheduled reasons such as maintenance purposes, even if the disk is stopped, can continue the process.

【0143】本発明の第2の実施の形態の第3の作用効果は、あるディスク装置が記憶する複数の原本に対応する複製がそれぞれ異なるディスク装置に置かれているため、あるディスク装置が記憶する原本を必要とする部分処理要求を対応する複製を記憶する他のディスク装置を持つ計算機ノードに割り当てることによって、一つの計算機ノードの負荷を複数の計算機ノードに拡散することができる。 [0143] The third effect of the second embodiment of the present invention, since the replica corresponding to a plurality of original document stored in the one disk device is placed on a different disk device, respectively, one disk device storage the partial process requests that require an original to be by assigning the computer node with the other disk devices for storing the corresponding replication, it is possible to spread the load of one computer node to a plurality of computer nodes. これにより、少ないステップで数多くの計算機ノードに負荷を拡散することができる。 This makes it possible to spread the load to a number of computer nodes in fewer steps.

【0144】 [0144]

【実施例2】次に本発明の第2の実施の形態について具体的な実施例に即してその動作を説明する。 Second Embodiment Next, a second embodiment of the present invention with reference to specific examples illustrating its operation.

【0145】図10は、本発明の第2の実施例をなす全文検索サーバシステムの構成を示す図である。 [0145] Figure 10 is a diagram showing the configuration of a full-text search server system constituting a second embodiment of the present invention. 図3に示した前記実施例の構成との相違は、第2の要求割り当て手段21_1〜21_8がそれぞれひとつずつ要求受付手段6_1 The difference between the embodiment of the configuration shown in FIG. 3, the second request assignment means 21_1~21_8 request accepting means one by one, respectively 6_1
〜6_8に備わっていること、及び、9台目の計算機ノード1_9を備え、LAN4と接続されていることである。 Be provided as a ~6_8, and comprises nine th computer node 1_9 is that is connected to the LAN 4.

【0146】第2の要求割当手段21_1〜21_8は、それぞれ第2の状態監視手段22_1〜22_8を備えており、また、 [0146] The second request assignment means 21_1~21_8 has a second state monitoring means 22_1~22_8 respectively, also
計算機ノード1_9は、負荷監視手段23と負荷配分再計算手段24を備える。 Computer node 1_9 includes a load monitoring unit 23 a load distribution recalculating unit 24.

【0147】第2の要求割り当て手段21_1〜21_8は、いずれも各データ500_ijごとに複製使用目標比率を記憶しており、この比率を満たすように、部分処理要求を各データの原本と複製に割り当てる。 [0147] The second request assignment means 21_1~21_8 are all stores replicas used target ratio for each data 500_Ij, so as to satisfy the ratio, assigning a partial processing request to replicate an original of each data .

【0148】要求処理手段7_1〜7_8は、一つ部分処理要求を処理するごとに、それに要した実時間を測定し、測定した時間を、LAN4を経由して、負荷監視手段12に送る。 [0148] request processing means 7_1~7_8, each time to process one partial process request, measure the actual time required for it, was determined time, via the LAN 4, and sends the load monitoring means 12.

【0149】負荷監視手段12は、要求処理手段ごとに処理にかかった実時間の累積値を検索負荷として記録し、 [0149] load monitoring means 12 records the cumulative value of the actual time spent processing every request processing means as a retrieval load,
一定時間ごとに、これらの変数の値を、負荷配分再計算手段13に送って、累積値をゼロに戻して記録を続ける。 At regular intervals, the values ​​of these variables, and send to the load allocation recalculating unit 13, and recording is continued by returning the accumulated value to zero.

【0150】負荷配分再計算手段13は、要求処理手段7_ [0150] load distribution recalculating unit 13, the request processing means 7_
1〜7_8の最近の一定時間の検索負荷を受け取る毎に、各データ500_ijの複製使用目標比率から、新しい複製使用目標比率を定め、全ての第2の要求割り当て手段21_1〜 Each time it receives a recent search load constant time 1~7_8, from the duplicate use target ratio of each data 500_Ij, defines a new replica using target ratio, all of the second requests allocation means 21_1~
21_8に送る。 Send to 21_8.

【0151】第2の要求割り当て手段は、新しい複製使用目標比率を受け取ると、それを記憶し、以降その値を用いて部分処理要求の割り当てを行う。 [0151] The second request allocation means receives a new replica using target ratio, store it, to assign partial process request using that value later.

【0152】図11は、本発明の第2の実施例における第2の要求割当手段21_iの処理を説明するための流れ図である。 [0152] Figure 11 is a flowchart for explaining the processing of the second request assignment means 21_i in the second embodiment of the present invention. 図11を参照すると、まず細部分データ500_ij Referring to FIG. 11, detailed partial data 500_ij
の原本及びその複製600_ijがどのディスク装置にあるかを調べる(ステップS201)。 Examine the original and the or replication 600_ij are in which the disk device (step S201). ここでは、原本がディスク Here, the original disk
2_iに、複製がディスク装置2_hにあるとする。 The 2_I, replication is referred to as being disk device 2_H.

【0153】次に、状態監視手段22_iを参照して、計算機ノード1_i及び1_hが稼働しているかどうかを調べる(ステップS202、S208)。 [0153] Next, with reference to the status monitoring means 22_I, computer node 1_i and 1_h determine whether running (step S202, S208). どちらも稼働していなければ、割り当て失敗を通知して終了する(ステップS20 If neither running, and exit notified of the assignment failure (step S20
9)。 9).

【0154】計算機ノード1_iだけが稼働していれば、 [0154] If only computer node 1_i is running,
計算機ノード1_iに部分処理要求を割り当て(ステップS Assign a partial process request to the computer node 1_I (step S
206)、計算機ノード1_hだけが稼働していれば、計算機ノード1_hに部分処理要求を割り当てる(ステップS20 206), if only the computer node 1_H is long running, assigning a partial processing request to the computer node 1_H (step S20
7)。 7).

【0155】両方が稼働していれば、乱数を用い(ステップS204)、計算機ノード1_hを選択する確率が500_ij [0155] If both long running, using a random number (step S204), the probability of selecting the computer node 1_h is 500_ij
の複製仕様目標比率となるように、計算機ノード1_h As the replication specification target ratio, computer node 1_h
(ステップS207)、または計算機ノード1_iにに部分処理要求を割り当てる。 (Step S207), or assigns the partial processing request to the computer node 1_I.

【0156】次に、負荷配分再計算手段13が新しい複製仕様目標比率を定める手順を説明する。 [0156] Next, load distribution recalculation unit 13 will be described a procedure for determining the new replica specification target ratio.

【0157】細部分データ500_ijに関する新しい目標比率R_ijは、原本500_ijを記録するディスク2_iを持つ計算機ノード1_i上の要求処理手段7_iの最近一時間の検索負荷をL_i、複製600_ijを記録するディスク2_hを持つ計算機ノード上の要求処理手段7_hの最近の一定時間の検索負荷をL_h、L_iとL_hの平均をM_ih、古い目標比率をR [0157] The new target ratio R_ij relates fine partial data 500_Ij is, L_i search load for the most recent hour of request processing means 7_i on computer node 1_i with disk 2_i for recording original 500_Ij, the disk 2_h for recording duplicate 600_ij recent L_h search load a predetermined time of request processing means 7_h on computer node, M_ih average of L_i and L_h, the old target ratio R with
_ij_oldとすると、新しい目標比率Rは次式のように定める。 When _Ij_old, new target ratio R is determined as follows.

【0158】R_ij = R_ij_old + (1 - R_ij_old) × (L [0158] R_ij = R_ij_old + (1 - R_ij_old) × (L
_i - M_ih) / L_i ; if L_i>= M_ih _i - M_ih) / L_i; if L_i> = M_ih

【0159】R_ij = R_ij_old * L_i / M_ih ; i [0159] R_ij = R_ij_old * L_i / M_ih; i
f L_i < M_ih f L_i <M_ih

【0160】これにより、原本側の負荷が高ければ複製を使う比率をより高く、 複製側の負荷が高ければ複製を使う比率をより低く定めることになる。 [0160] Thus, the higher the load on the original side higher ratio to use replication, it will define lower the ratio of using replication The higher the load of replication side.

【0161】本実施例では、複製使用目標比率を満たすために、乱数を発生して確率的 にこの比率を満たすが、本発明の実施方法はこれに限られるものではない。 [0161] In this embodiment, in order to satisfy the replication using target ratio, satisfy the stochastically this ratio by generating a random number, but implementation of the present invention is not limited thereto.
た とえば、原本及び複製それぞれを用いた回数を記録しておき、複製使用実績 比率を求めて、これが目標比率を下回っているならば複製を、そうでなければ 原本を用いるよう選択してもよい。 For example, a note of the number of using each original and duplicate, seeking replication use performance ratio, which duplicate if below the target ratio, also choose to use the original otherwise good.

【0162】また、本実施例では、新しい目標比率を、 [0162] Further, in this embodiment, the new target ratio,
特定の数式により算出しているが、本発明において、新しい目標比率の設定方法は、この特定の式に限定されるものではない。 Although calculated by a specific formula, in the present invention, setting of a new target ratio is not limited to this particular formula.

【0163】 [0163]

【発明の効果】以上説明したように、本発明によれば下記記載の効果を奏する。 As described above, according to the present invention, the following effects described according to the present invention.

【0164】本発明の第1の効果は、粗分割データに収まる比較的広い範囲のデータに対するアクセスが、多くの場合、高々1回の遠隔ディスクアクセスで行うことができる、ということである。 [0164] The first effect of the present invention, access to a relatively wide range of data that will fit in rough division data can be done in many cases, at most one remote disk access is that.

【0165】その理由は、本発明においては、同一粗分割データに由来する全ての細分割データが一つのディスク装置に格納されるようにデータを配置しているため、 [0165] The reason is, in the present invention, all of the subdivision data from the same rough division data is arranged data to be stored in one disk device,
そのディスク装置が稼働しており、特に負荷が高くない限り、該ディスク装置に対するアクセスのみで、用が足りるためである。 As it is the disk device is operating, unless the particularly high loads, only access to the disk apparatus, because the use is sufficient.

【0166】本発明の第2の効果は、ディスク装置または計算機ノードの負荷の偏りを削減できる、ということである。 [0166] The second effect of the present invention can reduce the deviation of the load of the disk device or computer node is that.

【0167】その理由は、本発明においては、実行時にファイルの原本と複製のどちらにアクセスするかを決定することにより、負荷の高いディスクまたは計算機ノードから他の複数のディスク装置または計算機ノードに負荷を拡散させることができるためである。 [0167] The reason for this is that in the present invention, by determining whether to access both replication and file of the original at runtime, load from heavily loaded disk or computer node to another of the plurality of disk devices or computer node This is because it is possible to diffuse.

【0168】本発明の第3の効果は、システムを構成する一部のディスク装置または計算機ノードが停止している時にも、処理を継続することができる、ということであその理由は、本発明においては、あるディスク装置または計算機ノードが停止している場合、 該ディスク装置または該計算機ノードが持つディスク装置に記録されている細部分データの原本に代えて、対応する複製を用いるように、実行時に切替制御する構成としたためある。 [0168] A third effect of the present invention, even when a portion of the disk device or computer node is stopped to configure the system, it is possible to continue processing, der reason that the present invention in the case where one disk device or a computer node is down, instead of the original details fraction data recorded in the disk device having the disc device or the computer node, to use the corresponding replication, run there due to a configuration in which at switching control.

【0169】本発明の第4の効果は、あるディスク装置または計算機ノードの負荷を、他の数多くのディスク装置または計算機ノードに少ないステップで拡散して、代替させることができる、ということである。 [0169] The fourth effect of the present invention, the load of one disk device or computer node, diffused in fewer steps in a number of disk devices or computer node of another, it is possible to substitute a is that.

【0170】その理由は、本発明において、一つのディスク装置が記憶するデータの複製が、複数のディスク装置に分散して記憶されているので、一つのディスク装置上の原本に換えて、複数のディスク装置上の複製を用いることができ、また一つの原本を記憶しているディスク装置を持つ計算機ノードに換えて、対応する複製を記憶しているディスク装置を持つ複数の計算機ノードを用いることができるからである。 [0170] This is because, in the present invention, replication of data stored one disk device is, because it is distributed and stored in a plurality of disk devices, instead of the original on one disk device, a plurality of can be used a copy of the disk device and in place of the computer node with the disk device storing one original, the use of multiple computer node having a disk device that stores the corresponding replication This is because possible.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の第1の実施の形態の構成を示す図である。 1 is a diagram showing a configuration of a first embodiment of the present invention.

【図2】本発明の第1の実施の形態における細部分データの原本及び複製の作成手順を示す模式図である。 It is a schematic diagram illustrating the original details amount data and the replica creation process in the first embodiment of the present invention; FIG.

【図3】本発明の第1の実施例をなす全文検索システムの構成を示す図である。 3 is a diagram showing a configuration of a search system which forms a first embodiment of the present invention.

【図4】本発明の第1の実施例におけるサブインデクスの原本及び複製の作成手順を示す図である。 Is a diagram showing the original and replica creation process of a sub index in the first embodiment of the present invention; FIG.

【図5】本発明の第1の実施例におけるサブインデクスの原本及び複製のディスク上の配置を示す図である。 Is a diagram showing the arrangement of the original sub-index and replication of the disk in the first embodiment of the present invention; FIG.

【図6】本発明の第1の実施例における要求割り当て手段の動作の具体例を示す図である。 6 is a diagram showing a specific example of an operation of requesting allocation means in the first embodiment of the present invention.

【図7】本発明の第1の実施例の動作を示すシーケンス図である。 7 is a sequence diagram showing the operation of the first embodiment of the present invention.

【図8】本発明の第1の実施例における要求割り当て手段の処理を説明するためのフローチャートである。 8 is a flowchart of a process for describing the requested allocation unit in the first embodiment of the present invention.

【図9】本発明の第2の実施の形態の構成を示す図である。 9 is a diagram showing a configuration of a second embodiment of the present invention.

【図10】本発明の第2の実施例をなす全文検索システムの構成を示す図である。 10 is a diagram showing a configuration of a search system which forms a second embodiment of the present invention.

【図11】本発明の第2の実施例における第2の要求割り当て手段の処理を示すフローチャートである。 11 is a flowchart showing the processing of the second request allocation unit in the second embodiment of the present invention.

【符号の説明】 DESCRIPTION OF SYMBOLS

1_1〜1_n 計算機ノード 2_1〜2_n ディスク 3 SAN(System Area Network、システム内ネットワーク) 4 LAN(Local Area Network、構内ネットワーク) 5_1〜5_n ファイルシステム 6_1〜6_n 要求受付手段 7_1〜7_n 要求処理手段 8_1〜8_n 要求割り当て手段 9_1〜9_n 要求割り当て表 10_1〜10_n 稼働状態監視手段 21_1〜21_n 第2の要求割り当て手段 22_1〜22_n 第2の稼働状態関し手段 23 負荷状態監視手段 24 負荷配分再計算手段 30_1〜30_5 入出力要求キュー 40_1〜40_4 入出力要求 100_11〜100_nm 細部分データの原本 1r0_11〜1r0_nm 細部分データの複製 200_1〜200_n 部分処理要求 500_11〜500_84 サブインデクスの原本 600_11〜600_84 サブインデクスの複製 1_1~1_n computer node 2_1~2_n disc 3 SAN (System Area Network, system network) 4 LAN (Local Area Network, a local area network) 5_1~5_N file system 6_1~6_n request receiving means 7_1~7_n request processing means 8_1~8_n requesting allocation means 9_1~9_n request allocation table 10_1~10_n Health monitoring means 21_1~21_n second request assignment means 22_1~22_n second operational state respect means 23 load state monitoring means 24 load distribution recalculating means 30_1~30_5 ON replication of the original 600_11~600_84 sub index replication 200_1~200_n partial processing request 500_11~500_84 sub index of the original 1r0_11~1r0_nm fine partial data output request queue 40_1~40_4 output request 100_11~100_nm fine partial data

Claims (13)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】複数の計算機ノードを含み、前記各計算機ノードがそれぞれローカルに固有のデータ記憶装置を備えてなる無共有型クラスタシステム構成とされ、前記データ記憶装置上のデータに依存する処理を行うサーバ・ 1. A includes a plurality of computer node, wherein each computer node is local to become comprises a specific data storage device shared-nothing cluster system configurations, respectively, a process that depends on the data on the data storage device server to perform
    システムであって、 前記データ記憶装置に記憶するデータを粗に分割してなる粗分割データについて、前記粗分割データをさらに分割して細分割データを作成する手段と、 同一の粗分割データに由来するすべての細分割データを同一のデータ記憶装置に記憶し、前記同一の粗分割データに由来するすべての細分割データの複製を、原本が記憶されるデータ記憶装置とは異なるデータ記憶装置であって、かつ、互いに異なる複数のデータ記憶装置に記憶する手段とを備えたことを特徴とするサーバシステム。 A system, derived above for rough division data obtained by dividing data to be stored in the rough in a data storage device, means for creating a further divide and subdivide data the rough division data, the same coarsely divided data to store all of the subdivision data to the same data storage device, a copy of all the subdivision data derived from the same coarsely divided data, there a different data storage device and data storage device that the original is stored Te, and characterized by comprising a means for storing a plurality of different data storage devices with each other server systems.
  2. 【請求項2】請求項1記載のサーバシステムにおいて、 ある細分割データに対する入出力を、前記細分割データの原本を記憶するデータ記憶装置と、前記細分割データの複製を記憶するデータ記憶装置とのうちのいずれかを利用して実行するように振り分ける入出力要求割り当て手段を備えたことを特徴とするサーバシステム。 2. A according to claim 1, wherein the server system, the input and output for a subdivision data, and a data storage device for storing original of the subdivision data, and a data storage device for storing a copy of the subdividing data server system comprising the O requests allocation means for distributing like to run using any of the.
  3. 【請求項3】請求項1記載のサーバシステムにおいて、 ある細分割データを必要とする処理に対する要求を、前記細分割データの原本を記憶するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記憶するデータ記憶装置を備えた計算機ノードとのうちのいずれかを利用して実行するように振り分ける処理要求割り当て手段を備えたことを特徴とするサーバシステム。 3. A according to claim 1, wherein the server system, a request for processing that requires a certain subdivision data, and computer node having data storage device that stores the master copy of the subdivision data, said subdividing data server system comprising the processing request allocation means for distributing to run using any of the computer nodes with data storage device that stores a copy of.
  4. 【請求項4】請求項2記載のサーバシステムにおいて、 ある細分割データの原本を記録するデータ記憶装置の負荷と、前記細分割データの複製を記録するデータ記憶装置の負荷を推測する手段と、 前記負荷を推測する手段によって、より軽い負荷を持つものと推測されたデータ記憶装置を利用して前記細分割データに対する入出力を実行するように前記細分割データに対する入出力要求を振り分ける要求割り当て手段と、を備えたことを特徴とするサーバシステム。 4. A according to claim 2, wherein the server system includes means to estimate the load of the data storage device for recording original is subdivided data, the load of the data storage device for recording a copy of the subdivision data, by means to infer the load, requesting allocation means for distributing the output request for the subdividing data to perform input and output by using the data storage device assumed with lighter load on the subdivision data server system comprising the and.
  5. 【請求項5】請求項3記載のサーバシステムにおいて、 ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードの負荷と、前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードの負荷を推測する手段と、 前記負荷を推測する手段によって、より軽い負荷を持つものと推測された計算機ノードを利用して前記細分割データを必要とする処理を実行するよう前記細分割データを必要とする処理要求を振り分ける要求割当手段と、 を備えたことを特徴とするサーバシステム。 5. A method according to claim 3, wherein the server system, including some with load computer node having data storage device that records the original subdivision data, the data storage device for recording a copy of the subdividing data It means to estimate the load of the computer node, by means to infer the load, the subdivision to perform a process that requires the subdivision data using a computer node that is supposed to have a lighter load server system, characterized in that it and a request allocation means for distributing the process request that requires the data.
  6. 【請求項6】請求項2記載のサーバシステムにおいて、 前記各計算機ノードの稼働状態を監視する手段を備え、 ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードとのうち、稼働中の計算機ノードを利用して、前記細分割データに対する入出力を実行するように前記細分割データに対する入出力要求を振り分ける要求割当手段を備えたことを特徴とするサーバシステム。 6. The server system according to claim 2, comprising means for monitoring the operating status of each computer node, a computer node having data storage device that records the original subdivision data in the subdivision among the computer node having data storage device that records a copy of the data, using the computer node running, distributes the output request for the subdividing data to perform input and output to the subdivision data server system comprising the requested allocation unit.
  7. 【請求項7】請求項3記載のサーバシステムにおいて、 前記各計算機ノードの稼働状態を監視する手段を備え、 ある細分割データの原本を記録するデータ記憶装置を備えた計算機ノードと、前記細分割データの複製を記録するデータ記憶装置を備えた計算機ノードのうち稼働中の計算機ノードを利用して前記細分割データを必要とする処理を実行するように前記細分割データを必要とする処理要求を振り分ける要求割当手段を備えたことを特徴とするサーバシステム。 7. The according to claim 3, wherein the server system comprises means for monitoring the operating status of each computer node, a computer node having data storage device that records the original subdivision data in the subdivision the process requests that require the subdividing data to execute processing utilizing the computer node in operation among the computing nodes with data storage device for recording a copy of data that require the subdividing data server system characterized by comprising a request allocation means for distributing.
  8. 【請求項8】相互に接続されクラスタを構成する複数の計算機ノードを備え、 前記複数の計算機ノードの各々が、それぞれ、ローカルなデータ記憶装置を備えるとともに、ファイルに対する入出力要求を受け取って前記データ記憶装置上でのデータに対する入出力を行うファイルシステムと、クライアントからの要求を受け付ける要求受付手段と、要求処理手段とを備え、 前記各計算機ノードの前記要求受付手段は、前記データ記憶装置上のデータを必要とする処理要求を受け取って、該処理要求を複数の部分処理要求に分割し、これらの部分処理要求を、それぞれ複数の計算機ノードの前記要求処理手段のいずれかに送り、それぞれの要求に対する応答として返ってきた部分処理結果を一つの処理結果に統合し、 前記各計算機ノードの前 8. mutually connected with a plurality of computer node in the cluster, each of said plurality of computer node, respectively, provided with a local data storage device, the data receiving input and output requests for files and file system for inputting and outputting to the data on the storage device, to accept a request from a client, and a request processing unit, said request receiving means of said each computer node, on the data storage device data receive process requests requiring divides the processing request to a plurality of sub-process request, these parts processing requests, respectively sent to one of the request processing unit of the plurality of computer node, each request the returned come parts processing result as a response to integrated into one processing result for said advance of each computer node 要求処理手段は、前記要求受付手段からの部分処理要求に応えて、部分処理結果を作成し、 前記各計算機ノードの前記ファイルシステムが、ファイルに対する入出力要求を、ファイルの原本及び1つ以上の複製の中から、いずれを用いて処理するかを決定する要求割当手段を備え、 前記データ記憶装置に記憶するべきデータをまず粗に分割し、さらにこれを細分割して、同一の粗分割データに由来するすべての細分割データを同一のデータ記憶装置に記憶するとともに、前記各細分割データの複製を原本とは別の、互いに異なるデータ記憶装置に記憶する、ことを特徴とするクラスタシステム。 Request processing means, in response to partial processing request from said request receiving means, to create a partial processing result, wherein the file system of each computer node, the input and output requests for files, the files original and one or more from the duplicate, with a request allocating means for determining whether to process using any, the divided first into coarse data to be stored in the data storage device, and further subdividing this same coarsely divided data cluster system stores the same data storage device all subdivision data from, and stores the copy of the subdivision data separate from the original text to different data storage devices with each other, and wherein the to.
  9. 【請求項9】前記各計算機ノードの前記要求割当手段が、前記各計算機ノードに割り当てられた入出力要求を記録する入出力要求割当表と、前記各計算機ノードの稼働状態を監視する状態監視手段を備え、 前記各細分割データを必要とする処理要求を、原本を記憶するデータ記憶装置を備えた計算機ノードと複製を記憶するデータ記憶装置を備えた計算機ノードにそれぞれの負荷状況に基づき振り分ける、ことを特徴とする請求項8記載のサーバシステム。 Wherein said request allocation unit of each computer node has an input and output request allocation table for recording the output request assigned to each computer node, status monitoring means for monitoring the operating status of the respective computer node the provided, a processing request which requires the respective subdivision data, distributed on the basis of the respective load status to the computer node with the data storage device for storing a copy and a computer node having data storage device that stores the original text server system of claim 8, wherein a.
  10. 【請求項10】相互に接続されクラスタを構成する複数の計算機ノードを備え、 前記複数の計算機ノードの各々が、それぞれ、ローカルなデータ記憶装置を備えるとともに、ファイルに対する入出力要求を受け取って前記データ記憶装置上でのデータに対する入出力を行うファイルシステムと、クライアントからの要求を受け付ける要求受付手段と、要求処理手段とを備え、前記データ記憶装置に記憶するべきデータをまず粗に分割し、さらにこれを細分割して、同一の粗分割データに由来するすべての細分割データを同一のデータ記憶装置に記憶するとともに、前記各細分割データの複製を原本とは別の、互いに異なるデータ記憶装置に記憶し、 前記要求受付手段が要求割当手段を備え、 前記要求受付手段は、クライアントから処理要求 10. A connected to each other with a plurality of computer node in the cluster, each of said plurality of computer node, respectively, provided with a local data storage device, the data receiving input and output requests for files and file system for inputting and outputting to the data on the storage device, to accept a request from a client, and a request processing unit, is divided into first coarse data to be stored in the data storage device, further This subdivision to stores the same data storage device all subdivision data derived from the same rough division data, separate from the original to the copy of the subdivision data, different data storage device stored in the request receiving means comprises a request allocation unit, said request receiving means, the processing request from the client 受けとると、異なる細部分データを必要とする複数個の部分処理要求を作成し、前記各部分処理要求をどの計算機ノードの要求処理手段に送付するか決定することを、前記要求割当手段に依頼し、 前記要求割当手段は、細部分データを必要とする部分処理要求を、その原本をデータ記憶装置上に持つ一の要求処理手段に投入するか、その複製をデータ記憶装置上に持つ他の要求処理手段に投入するかを決定し、 前記要求受付手段は、前記要求割当手段の決定に従って、部分処理要求を前記要求処理手段に送出し、 前記要求処理手段は、前記ファイルシステムを介してデータ記憶装置上の細部分データの原本または複製をアクセスして部分処理要求を実行し、その結果を前記要求受付手段に返し、 前記要求受付手段は、複数個の部分処理要 Receive the creates a plurality of partial process requests that require different detailed content data, determining whether to send the request processing means which computer node the respective partial process request, to request to the request assignment means the request assignment means, the partial process requests that require fine partial data, or put into one request processing means having the original on the data storage device, other requests with its replication on a data storage device process to determine whether to put the unit, said request receiving means, according to determination of said request assignment means sends a partial processing request to the request processing unit, said request processing means, data storage via the file system performs the partial process request by accessing the original or copy of the detailed content data of the device, returns the result to the request receiving means, said request receiving means, a plurality of partial processing requirements の結果を使って処理要求の実行し、その結果をクライアントに返す、ことを特徴とするサーバシステム。 Server system of using the result to the execution of the processing request, and returns the results to the client, and wherein the.
  11. 【請求項11】前記複数の計算機ノードのいずれか一の計算機ノードが、負荷監視手段と負荷配分再計算手段とを備え、 前記他の計算機ノードの前記要求割当手段がそれぞれ自ノードの稼動状態を監視する状態監視手段を備え、 前記要求割当手段は、いずれも各データごとに複製使用目標比率を記憶しており、この比率を満たすように、部分処理要求を各データの原本と複製に割り当て、 前記要求処理手段は、一つ部分処理要求を処理するごとに、該部分処理に要した実時間を測定し、測定した時間を前記負荷監視手段に送り、 前記負荷監視手段は、要求処理手段ごとに処理に要した実時間の累積値を検索負荷として記録し、一定時間ごとに、これらの変数の値を、前記負荷配分再計算手段に送出するとともに、前記累積値をリセットして 11. Any one of the computer nodes of the plurality of computer node is provided with a load monitoring means and load distribution recalculating means, said request allocation unit operation status of each local node of the other computer node comprising a state monitoring means for monitoring, the request assignment means are all stores replicas used target ratio for each data, so as to satisfy the ratio, allocates a partial process request to replicate the original of each data, the request processing unit, each time to process one partial process request, measure the actual time required for partial processing, sends the measured time to the load monitoring unit, the load monitoring means, each request processing means recorded as search load an accumulated value of the actual time required for processing, at regular intervals, the values ​​of these variables, as well as delivered to the load distribution recalculating means, and resets the accumulated value 記録を続け、 前記負荷配分再計算手段は、前記要求処理手段の最近の一定時間の検索負荷を受け取る毎に、各データの複製使用目標比率から、新しい複製使用目標比率を定め、全ての要求割当手段に対して送出し、 前記要求割当手段は、新しい複製使用目標比率を受け取ると、それを記憶し、前記値を用いて部分処理要求の割り当てを行う、ことを特徴とする請求項10記載のサーバシステム。 Continues to record, the load distribution recalculating means, each receiving a search load recent predetermined time of said request processing means, from the duplicate use target ratio of each data defines a new replica using target ratio, all requests assigned was sent to unit, the request assignment unit receives the new replica using target ratio, store it, to assign partial process request using the value, according to claim 10, wherein the server system.
  12. 【請求項12】複数の計算機ノードを含み、前記各計算機ノードがそれぞれローカルに固有のデータ記憶装置を備える無共有型クラスタシステムのデータ格納方法において、 データ記憶装置に記憶するべきデータをまず粗に分割し、さらに粗分割データを細分割し、同一の粗分割データに由来するすべての細分割データを同一のデータ記憶装置に記憶するとともに、前記各細分割データの複製をそれぞれ原本とは別の、また互いに異なるデータ記憶装置に記憶する、ことを特徴とする無共有型クラスタシステムのデータ格納方法。 12. includes a plurality of computer nodes, the method of storing data shared-nothing clusters system wherein each computer node comprises a unique data storage device locally respectively, the first rough data to be stored in the data storage device dividing further the coarsely divided data subdividing stores the same data storage device all subdivision data derived from the same rough division data, the other from the respective original replication of each subdivision data and also stored in different data storage devices with each other, a method of storing data shared-nothing cluster system, characterized in that.
  13. 【請求項13】請求項12記載の無共有型クラスタシステムのデータ格納方法によりデータ記憶装置に格納されたデータの処理方法において、 前記各細分割データを必要とする処理要求を、原本を記憶するデータ記憶装置を持つ計算機ノードと、その複製を記憶するデータ記憶装置を持つ計算機ノードにそれぞれの負荷状況に基づき、振り分ける、ことを特徴とする無共有型クラスタシステムの負荷分散方法。 13. The method of claim 12 processing method of the data stored in the data storage device by the data storing method of a shared-nothing clusters system according, processing requests that require each subdivision data, stores the original a computer node having data storage device, the data storage based device to the computer node with the respective load conditions, distribute, load distribution method of shared-nothing cluster system and to store the duplicate.
JP11128273A 1999-05-10 1999-05-10 Cluster type data server system and data storage method Pending JP2000322292A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11128273A JP2000322292A (en) 1999-05-10 1999-05-10 Cluster type data server system and data storage method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11128273A JP2000322292A (en) 1999-05-10 1999-05-10 Cluster type data server system and data storage method

Publications (1)

Publication Number Publication Date
JP2000322292A true JP2000322292A (en) 2000-11-24

Family

ID=14980763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11128273A Pending JP2000322292A (en) 1999-05-10 1999-05-10 Cluster type data server system and data storage method

Country Status (1)

Country Link
JP (1) JP2000322292A (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008539531A (en) * 2005-04-29 2008-11-13 ネットワーク・アプライアンス・インコーポレイテッド Data placement techniques for striping the data container across a plurality of volumes of the storage system cluster
WO2009088007A1 (en) * 2008-01-11 2009-07-16 Nec Corporation Content management device, content management system, content management method, and program
EP2159984A2 (en) 2008-09-02 2010-03-03 Fujitsu Limited Authentication system and authentication method
JP2012073975A (en) * 2010-09-30 2012-04-12 Hitachi Ltd Computer system and data processing method therefor
JP2013025450A (en) * 2011-07-19 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> Distributed file management system, distributed file arrangement method and program
JP2013513839A (en) * 2009-12-11 2013-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Cluster family for the cluster selection and coordinated replication
JP2013525895A (en) * 2010-04-23 2013-06-20 コンピュヴェルデ アーベー Distributed data storage
US8640178B2 (en) 2003-08-07 2014-01-28 Sony Corporation Server, content providing apparatus, content receiving apparatus, content providing method, content receiving method, and program
US8843710B2 (en) 2011-09-02 2014-09-23 Compuverde Ab Method and device for maintaining data in a data storage system comprising a plurality of data storage nodes
US8997124B2 (en) 2011-09-02 2015-03-31 Compuverde Ab Method for updating data in a distributed data storage system
US9021053B2 (en) 2011-09-02 2015-04-28 Compuverde Ab Method and device for writing data to a data storage system comprising a plurality of data storage nodes
US9026559B2 (en) 2008-10-24 2015-05-05 Compuverde Ab Priority replication
JP2016500883A (en) * 2012-10-24 2016-01-14 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー Data storage device
US9305012B2 (en) 2011-09-02 2016-04-05 Compuverde Ab Method for data maintenance
JP2016170493A (en) * 2015-03-11 2016-09-23 富士通株式会社 Data arrangement program, data arrangement method and data arrangement apparatus
US9626378B2 (en) 2011-09-02 2017-04-18 Compuverde Ab Method for handling requests in a storage system and a storage node for a storage system
JPWO2016047096A1 (en) * 2014-09-24 2017-06-29 日本電気株式会社 Application server, the cloud device, a storage medium access monitoring method and computer program

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8640178B2 (en) 2003-08-07 2014-01-28 Sony Corporation Server, content providing apparatus, content receiving apparatus, content providing method, content receiving method, and program
JP2008539531A (en) * 2005-04-29 2008-11-13 ネットワーク・アプライアンス・インコーポレイテッド Data placement techniques for striping the data container across a plurality of volumes of the storage system cluster
WO2009088007A1 (en) * 2008-01-11 2009-07-16 Nec Corporation Content management device, content management system, content management method, and program
EP2159984A2 (en) 2008-09-02 2010-03-03 Fujitsu Limited Authentication system and authentication method
US8281376B2 (en) 2008-09-02 2012-10-02 Fujitsu Limited Authentication system and authentication method
US9495432B2 (en) 2008-10-24 2016-11-15 Compuverde Ab Distributed data storage
US9329955B2 (en) 2008-10-24 2016-05-03 Compuverde Ab System and method for detecting problematic data storage nodes
US9026559B2 (en) 2008-10-24 2015-05-05 Compuverde Ab Priority replication
JP2013513839A (en) * 2009-12-11 2013-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Cluster family for the cluster selection and coordinated replication
US8812799B2 (en) 2009-12-11 2014-08-19 International Business Machines Corporation Cluster families for cluster selection and cooperative replication
US10073641B2 (en) 2009-12-11 2018-09-11 International Business Machines Corporation Cluster families for cluster selection and cooperative replication
US9684472B2 (en) 2009-12-11 2017-06-20 International Business Machines Corporation Cluster families for cluster selection and cooperative replication
US9250825B2 (en) 2009-12-11 2016-02-02 International Business Machines Corporation Cluster families for cluster selection and cooperative replication
JP2013525895A (en) * 2010-04-23 2013-06-20 コンピュヴェルデ アーベー Distributed data storage
US9948716B2 (en) 2010-04-23 2018-04-17 Compuverde Ab Distributed data storage
US9503524B2 (en) 2010-04-23 2016-11-22 Compuverde Ab Distributed data storage
US8555107B2 (en) 2010-09-30 2013-10-08 Hitachi, Ltd. Computer system and data processing method for computer system
JP2012073975A (en) * 2010-09-30 2012-04-12 Hitachi Ltd Computer system and data processing method therefor
JP2013025450A (en) * 2011-07-19 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> Distributed file management system, distributed file arrangement method and program
US8997124B2 (en) 2011-09-02 2015-03-31 Compuverde Ab Method for updating data in a distributed data storage system
US9305012B2 (en) 2011-09-02 2016-04-05 Compuverde Ab Method for data maintenance
US8843710B2 (en) 2011-09-02 2014-09-23 Compuverde Ab Method and device for maintaining data in a data storage system comprising a plurality of data storage nodes
US9626378B2 (en) 2011-09-02 2017-04-18 Compuverde Ab Method for handling requests in a storage system and a storage node for a storage system
US9021053B2 (en) 2011-09-02 2015-04-28 Compuverde Ab Method and device for writing data to a data storage system comprising a plurality of data storage nodes
US9965542B2 (en) 2011-09-02 2018-05-08 Compuverde Ab Method for data maintenance
JP2016500883A (en) * 2012-10-24 2016-01-14 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー Data storage device
US10235369B2 (en) 2012-10-24 2019-03-19 Fujitsu Limited Data storage arrangement
JPWO2016047096A1 (en) * 2014-09-24 2017-06-29 日本電気株式会社 Application server, the cloud device, a storage medium access monitoring method and computer program
JP2016170493A (en) * 2015-03-11 2016-09-23 富士通株式会社 Data arrangement program, data arrangement method and data arrangement apparatus

Similar Documents

Publication Publication Date Title
Rangan et al. Designing file systems for digital video and audio
US6990547B2 (en) Replacing file system processors by hot swapping
US6775792B2 (en) Discrete mapping of parity blocks
US7509524B2 (en) Systems and methods for a distributed file system with data recovery
US7743033B2 (en) Systems and methods for providing a distributed file system utilizing metadata to track information about data stored throughout the system
US5797005A (en) Shared queue structure for data integrity
US5943690A (en) Data storage apparatus and method allocating sets of data
US7146377B2 (en) Storage system having partitioned migratable metadata
EP1364510B1 (en) Method and system for managing distributed content and related metadata
US6895485B1 (en) Configuring and monitoring data volumes in a consolidated storage array using one storage array to configure the other storage arrays
US6542972B2 (en) Logical view and access to physical storage in modular data and storage management system
US6832248B1 (en) System and method for managing usage quotas
US6526434B1 (en) System and method for efficient transfer of data blocks from client to server
US6990667B2 (en) Server-independent object positioning for load balancing drives and servers
Brinkmann et al. Efficient, distributed data placement strategies for storage area networks
JP4648723B2 (en) Method and apparatus for hierarchical storage management based on the data value
US8209515B2 (en) Storage systems having differentiated storage pools
EP2011042B1 (en) Distributed differential store with non-distributed objects and compression-enhancing data-object routing
US7685459B1 (en) Parallel backup
US6154852A (en) Method and apparatus for data backup and recovery
US6976060B2 (en) Symmetric shared file storage system
Berson et al. Fault tolerant design of multimedia servers
US9785498B2 (en) Archival storage and retrieval system
US20020194526A1 (en) Dynamic redistribution of parity groups
EP0683464A2 (en) Baton passing optimization scheme for load balancing/configuration planning in a video-on-demand computer system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031111