JPH1139340A

JPH1139340A - データベース検索システム、マルチプロセッサシステム及びデータベース検索方法

Info

Publication number: JPH1139340A
Application number: JP9198888A
Authority: JP
Inventors: Toru Takagi; 徹高木; Tsuyoshi Kitani; 強木谷
Original assignee: N T T DATA KK; NTT Data Corp
Current assignee: N T T DATA KK; NTT Data Group Corp
Priority date: 1997-07-24
Filing date: 1997-07-24
Publication date: 1999-02-12

Abstract

(57)【要約】【課題】複数のデータベースの検索にあたり、プロセ
ッサ資源を有効に活用し、データベースの検索時間を短
縮する。【解決手段】データベース３は、複数の分割データベ
ースに分割されており、検索制御部１で生成される各デ
ータベース毎の検索プロセスにより、各分割データベー
スの検索を行う。見積表格納部２は、データベース３の
各分割データベース毎にそれぞれ検索処理量を見積もっ
たプロセッサ資源の資源割当が設定されたテーブルとし
て見積表を格納している。検索制御部１は、クライアン
トＣからの検索要求に基づき、データベース３の各分割
データベースの検索処理量の見積に応じてプロセッサ資
源の資源割当を行い、所要の分割データベースを検索す
るための複数の検索プロセスを生成し、実行させ、さら
に該検索プロセスによる検索結果を収集して、統合し且
つソートしてクライアントＣに返す。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、データベースの
検索に係り、特に複数のデータベースに対する検索をそ
れぞれ別々のプロセスにより並列的に実行して検索結果
を得るデータベース検索システム、マルチプロセッサシ
ステム、及びデータベース検索方法に関する。

【０００２】

【従来の技術】一般に、データベースの検索に際し、ク
ライアントからの１つの検索要求に対して、複数のデー
タベースを一括して検索し、且つこれら複数のデータベ
ースの検索結果を統合して、１つの検索結果としてクラ
イアントに返す処理が行われる。これら複数のデータベ
ース及びデータベース検索プロセスを単一のサーバ（以
下、「検索マシン」と称する）において実現する場合に
は、次のような方法がとられていた。

【０００３】検索マシンは、各データベース検索プロセ
ス及び該データベース検索プロセスを制御する検索コン
トロールプロセスにより、一連の検索処理を行う。な
お、検索コントロールプロセスは、複数のデータベース
検索プロセスの管理及びこれらのデータベース検索プロ
セスによる検索結果の統合処理を含んでいる。クライア
ントからの検索要求は、検索コントロールプロセスにわ
たされる。検索コントロールプロセスは、複数のデータ
ベースの検索のために複数のデータベース検索プロセス
をそれぞれ生成する。各データベース検索プロセスで
は、それぞれ１つのデータベースの検索処理を行い、検
索結果を検索コントロールプロセスに返す。返ってきた
検索結果を検索コントロールプロセスで統合してクライ
アントに返す。

【０００４】特に、検索マシンが、例えばＳＭＰ（Symm
etric Multiprocessor）型マルチプロセッサマシンのよ
うに複数のプロセッサ（ＣＰＵ：Central Proccessing
Unit〜中央処理装置）を有するマルチプロセッサマシン
である場合には、各検索プロセスによる検索処理は並列
的に実行される。なお、単一のプロセッサのみを保持す
るマシンにおいては、各検索プロセスの検索処理を逐次
的に処理する場合もあるが、ここでは各検索プロセスの
検索処理を並列に処理する場合を考える。

【０００５】

【発明が解決しようとする課題】上述した方法において
は、複数のデータベースに対する検索を並列的に実行し
た後に検索処理結果のマージを行う。このため、クライ
アントが、検索要求を発してから検索結果を受け取るま
での時間は、最も検索に時間を要する検索プロセスの検
索時間により影響を受ける。

【０００６】ここでは、複数のプロセッサを有するＳＭ
Ｐ型のマルチプロセッサマシンにおける処理の一例を示
す。ＳＭＰ型のマルチプロセッサマシンからなる検索マ
シンはｎ個（ｎ≧２）のプロセッサを有し、この検索マ
シンにより、ｍ個（ｍ＞ｎ）のデータベースの検索を行
う場合を考える。検索コントロールプロセスは、ｍ個の
検索プロセスを生成し、これらの検索プロセスによりそ
れぞれデータベースの検索を行う。各検索プロセスは、
通常の場合、オペレーティングシステムによりプロセッ
サ消費のスケジューリングがなされ、各検索プロセスの
プロセッサの消費が公平になるよう調整される。そのた
め、各検索プロセスの終了時間は、検索処理の量により
異なってくる。

【０００７】なお、検索処理の量の相違には、種々の要
因があるが、一般的には、データベースのサイズ及び検
索のヒット件数等に依存することが多い。そのような要
因を排除するために各データベースのサイズを均等にす
ることなども考えられるが、特に全文検索等の場合に
は、実現することは難しい。その理由としては、高速検
索用に生成するインデックスの再作成等のメンテナンス
の煩雑さ、及びデータベースを複数に分割した経緯等が
あげられる。データベースを複数に分割した経緯には、
例えば、蓄積されるデータが膨大であるため物理的に分
割する必要があった場合、データベースの作成者が異な
る場合、テキストが作成された時間（年毎及び月毎等）
によりデータベースを分割されている場合、そして頻繁
に検索されるデータベースが含まれているため、処理効
率を考えて細かく分割しておいたほうがよいと判断され
た場合などがある。

【０００８】複数の検索プロセスが並列的に実行されて
いる場合には、検索プロセスは処理の終了したものから
順次消減する。このため、実行中の検索プロセスの数は
徐々に減少してゆく。実行中の検索プロセスの数がプロ
セッサの数より少なくなったときに、プロセッサの中に
は、検索プロセスを全く実行していないものがあらわれ
るため、プロセッサ資源が有効に利用されていない状態
となる。

【０００９】ここで、従来の具体的な処理の例につい
て、図５を参照して説明する。図５の(a) は、プロセッ
サ数ｎが２個（ｎ＝２）、検索対象データベース数が４
個（ｄｂ＝４）の場合の従来の処理の例を示している。
ここで、データベースＤＢ１、ＤＢ２、ＤＢ３及びＤＢ
４は、それぞれ単一プロセッサで検索処理を行った場合
に、８ｔ、３ｔ、４ｔ及びｔなる処理時間を要するもの
する。すなわち、この例では、データベースＤＢ１−デ
ータベースＤＢ３−データベースＤＢ２−データベース
ＤＢ４の順で検索時間を要している。しかしながら、デ
ータベースＤＢ３の検索が終了した時刻６ｔからデータ
ベースＤＢ１の検索が終了する時刻１０ｔまでの間は、
２個のプロセッサのうち１個分のプロセッサ資源は利用
されていない。また、この場合の全体での最終的な検索
処理時間は１０ｔとなっており、データベースＤＢ１の
検索処理時間に依存している。

【００１０】この発明は、上述した事情に鑑みてなされ
たもので、複数のデータベースの検索にあたり、データ
ベース検索における処理量に応じて各データベースの検
索プロセスのプロセッサ資源を割り当てて、プロセッサ
資源を有効に活用し、データベースの検索時間を短縮す
ることを可能とするデータベース検索システム、マルチ
プロセッサシステム及びデータベース検索方法を提供す
ることを目的とする。

【００１１】

【課題を解決するための手段】上記目的を達成するた
め、この発明の第１の観点によるデータベース検索シス
テムは、与えられた検索要求に応じた複数のデータベー
スの検索にそれぞれ予測される処理量に応じてプロセッ
サ資源を割り当てる資源割当手段と、前記資源割当手段
によるプロセッサ資源の資源割当に従って、前記複数の
データベースの検索を並列的に実行する複数の検索プロ
セスを生成し起動する検索プロセス生成手段と、前記複
数の検索プロセスの実行による検索結果を収集する結果
収集手段と、を具備する。

【００１２】各データベース毎の予測される検索処理量
からなる見積テーブルを格納する見積テーブル格納手段
をさらに備え、且つ前記資源割当手段は、前記見積テー
ブルを参照してプロセッサ資源の資源割当を決定する手
段を含んでいてもよい。

【００１３】前記結果収集手段は、その収集実績に基づ
いて前記見積テーブル格納手段に格納される見積テーブ
ルを補正更新する手段を含んでいてもよい。

【００１４】前記見積テーブル格納手段は、前記データ
ベース毎に、予測される検索処理量に基づいて固定的に
設定された資源割当値、及び前記結果収集手段により随
時更新されて前記資源割当値を補正する補正値を含む見
積テーブルを格納していてもよい。

【００１５】前記検索プロセス生成手段は、前記データ
ベース毎に生成した検索プロセスを、該検索プロセスに
前記資源割当手段による前記資源割当に従ったプロセッ
サ資源使用の優先度を与えて、起動する手段を含んでい
てもよい。

【００１６】前記結果収集手段で収集された検索結果を
統合する統合手段をさらに含んでいてもよい。

【００１７】前記統合手段は、統合された検索結果をソ
ートする手段を含んでいてもよい。

【００１８】この発明の第２の観点によるマルチプロセ
ッサシステムは、複数のデータベースをそれぞれ構築す
る複数のデータベース手段と、各々複数のデータベース
の検索プロセスを実行し得る複数のプロセッサ手段と、
与えられた検索要求に応じた複数のデータベースの検索
に、それぞれ予測される処理量に応じて前記複数のプロ
セッサ手段のプロセッサ資源を割り当てる資源割当手段
と、前記資源割当手段によるプロセッサ資源の資源割当
に従い、前記複数のプロセッサ手段を用いて、前記複数
のデータベース手段の検索を並列的に実行する複数の検
索プロセスを生成し起動する検索プロセス生成手段と、
前記複数の検索プロセスの実行による検索結果を収集し
て検索要求元に返す結果収集手段と、を具備する。

【００１９】各データベース手段毎の予測される検索処
理量からなる見積テーブルを格納する見積テーブル格納
手段をさらに備え、且つ前記資源割当手段は、前記見積
テーブルを参照してプロセッサ資源の資源割当を決定す
る手段を含んでいてもよい。

【００２０】前記結果収集手段は、その収集実績に基づ
いて前記見積テーブル格納手段に格納される見積テーブ
ルを補正更新する手段を含んでいてもよい。

【００２１】前記見積テーブル格納手段は、前記データ
ベース手段毎に、予測される検索処理量に基づいて固定
的に設定された資源割当値、及び前記結果収集手段によ
り随時更新されて前記資源割当値を補正する補正値を含
む見積テーブルを格納していてもよい。

【００２２】前記検索プロセス生成手段は、前記データ
ベース手段毎に生成した検索プロセスを、該検索プロセ
スに前記資源割当手段による前記資源割当に従ったプロ
セッサ資源使用の優先度を与えて、起動する手段を含ん
でいてもよい。

【００２３】前記結果収集手段で収集された検索結果
を、検索要求元に返す前に統合する統合手段をさらに含
んでいてもよい。

【００２４】前記統合手段は、統合された検索結果をソ
ートする手段を含んでいてもよい。

【００２５】この発明の第３の観点によるデータベース
検索方法は、与えられた検索要求に応じた複数のデータ
ベースの検索にそれぞれ予測される処理量に応じてプロ
セッサ資源を割り当てる資源割当ステップと、前記資源
割当ステップによるプロセッサ資源の資源割当に従っ
て、前記複数のデータベースの検索を並列的に実行する
複数の検索プロセスを生成し起動する検索プロセス生成
ステップと、前記複数の検索プロセスの実行による検索
結果を収集する結果収集ステップと、を有する。

【００２６】前記資源割当ステップは、予め設定した各
データベース毎の予測される検索処理量からなる見積テ
ーブルを参照してプロセッサ資源の資源割当を決定する
ステップを含んでいてもよい。

【００２７】前記結果収集ステップは、その収集実績に
基づいて前記見積テーブルを補正更新するステップを含
んでいてもよい。

【００２８】前記見積テーブルは、前記データベース毎
に、予測される検索処理量に基づいて固定的に設定され
た資源割当値、及び前記結果収集ステップにより随時更
新されて前記資源割当値を補正する補正値を含んでいて
もよい。

【００２９】前記検索プロセス生成ステップは、各デー
タベース毎に生成した検索プロセスを、該検索プロセス
に前記資源割当に従ったプロセッサ資源使用の優先度を
与えて、起動するステップを含んでいてもよい。

【００３０】前記結果収集ステップで収集された検索結
果を統合する統合ステップをさらに含んでいてもよい。

【００３１】前記統合ステップは、統合された検索結果
をソートするステップを含んでいてもよい。

【００３２】この発明に係るデータベース検索システ
ム、マルチプロセッサシステム及びデータベース検索方
法は、与えられた検索要求に応じた複数のデータベース
の検索にそれぞれ予測される処理量に応じてプロセッサ
資源を割り当て、前記複数のデータベースの検索を並列
的に実行する複数の検索プロセスを該資源割当に基づい
て生成し起動するとともに、前記複数の検索プロセスの
実行による検索結果を収集する。このデータベース検索
システム、マルチプロセッサシステム及びデータベース
検索方法では、プロセスに応じて適切にプロセッサ資源
を割り当てて複数の検索プロセスを並列的に実行するこ
とにより、プロセッサ資源を有効に活用して効率よく且
つ合理的にデータベース検索を行うことができ、データ
ベースの検索時間を短縮することができる。

【００３３】コンピュータ又はプロセッサを上述の各手
段として機能させ或いはコンピュータ又はプロセッサに
上述の各ステップを実行させるためのプログラム・デー
タの全部又は一部を格納した機械読み取り可能な記録媒
体（例えば、ＣＤ−ＲＯＭ、フロッピーディスク等）を
配布してもよい。このプログラムをコンピュータにイン
ストールして、ＯＳ上で実行させる等して、上述の各機
能を実現し、あるいは上述の各ステップを実行させても
よい。

【００３４】

【発明の実施の形態】まず、この発明の実施の形態の説
明に先立ち、この発明の原理について説明する。この発
明では、複数のプロセッサを有する検索マシン上で複数
に分割されたデータベースの検索を高速に行うため、複
数のプロセッサの有効利用により各データベースの検索
処理時間を短縮する。この発明による手法は、ｎ個（ｎ
≧２）のプロセッサでｍ個（ｍ＞ｎ）のデータベースを
検索する場合に有効である。

【００３５】上述したように、従来の方法では、複数の
検索プロセスのすべての検索プロセスが終了していない
にもかかわらず、プロセッサ資源が空いてしまうことが
ある。これは、従来の検索手法では、検索処理に多くの
時間を要するデータベース検索プロセスであっても均等
に分配されたプロセッサ資源しか利用できないことに起
因する。すなわち、従来の検索手法では、検索処理に多
くの時間を要するデータベース検索プロセスであって
も、検索処理にさほど時間を要さないデータベース検索
プロセスであってもプロセッサ資源が均等に分配され
る。このため、検索処理に多くの時間を要するデータベ
ース検索プロセスが、検索処理にさほど時間を要さない
他のデータベース検索プロセスと同等のプロセッサ資源
しか利用することができない。

【００３６】このような状況を回避するため、多くの検
索時間を要するプロセスにプロセッサ資源を優先的に割
り当てるようにする。このとき、各検索プロセスの処理
時間を均等にするようにプロセッサ資源の割当を行う
と、検索開始からすべての検索プロセスが終了するまで
は、プロセッサ資源はすべて利用されることとなり、結
果的に検索時間を短縮できる。

【００３７】プロセッサ資源の割当のためには、各デー
タベース検索プロセスの処理時間を前もって見積もって
おく必要があるが、例えばデータベースがフルテキスト
データベースの場合には、各データべースのテキストサ
イズ、テキスト数及び単語文書出現頻度等の情報を用い
て検索処理時間を見積もることが可能である。また、検
索処理の見積り時間をプロセッサ資源の割り当てに反映
させるためには、例えばSolarisオペレーティングシス
テムにおけるniceコマンドのような資源使用の優先度を
与えるオペレーティングシステムのコマンドを用いて、
プロセッサ資源の使用の優先度を与える方法を用いるこ
とができる。

【００３８】具体的な例を、図５の(a) の従来のケース
と対比させて図５の(b) に示している。図５の(a) の場
合と同様に、データベースＤＢ１、ＤＢ２、ＤＢ３及び
ＤＢ４は、それぞれ単一のプロセッサで検索処理を行っ
た場合、８ｔ、３ｔ、４ｔ及びｔなる処理時間を要す
る。この処理時間の比率に応じて、プロセッサ資源を割
り当てることにより、図５の(b) のようになり、従来は
１０ｔ要していた全体の処理時間（最も長いデータベー
スＤＢ１の検索処理のみの処理時間）が、８ｔに短縮さ
れる（全データベースＤＢ１〜ＤＢ４の各々の検索処理
に要する処理時間が均等に８ｔとなる）ことになり、２
０％の処理効率の改善が可能となる。

【００３９】この発明は、以上のような原理を用いて、
複数のプロセッサを有する検索マシン上で、複数のプロ
セッサの有効利用により各データベースの検索処理時間
を短縮して、複数に分割されたデータベースの検索を高
速に行う。以下、上述した原理に基づく、この発明の実
施の形態を図面を参照して説明する。

【００４０】図１〜図４を参照して、この発明の実施の
形態に係るデータベース検索システムを説明する。

【００４１】図１は、この発明の実施の形態に係るデー
タベース検索システムの構成を模式的に示している。

【００４２】図１に示すデータベース検索システムは、
クライアントＣ及び検索サーバＳを備えている。検索サ
ーバＳは、複数のプロセッサを有するＳＭＰ型のマルチ
プロセッサマシンからなる検索マシンであり、複数に分
割されたデータベースを有する。クライアントＣは、例
えばネットワークのような通信系等を介して検索サーバ
Ｓに結合されており、該検索サーバＳに検索要求を与え
て、検索サーバＳから検索結果を受け取る。

【００４３】検索サーバＳは、検索制御部１、見積表格
納部２及びデータベース３を具備している。データベー
ス３は、複数の分割データベース、例えば第１の分割デ
ータベースＤＢ１、第２の分割データベースＤＢ２、第
３の分割データベースＤＢ３、第４の分割データベース
ＤＢ４、第５の分割データベースＤＢ５、第６の分割デ
ータベースＤＢ６及び第７の分割データベースＤＢ７に
分割されている。これら第１〜第７の分割データベース
ＤＢ１〜ＤＢ７の各々は、図５に示したデータベースＤ
Ｂ１〜ＤＢ４の各々に相当する（そのため同様の参照符
号を用いている）。各分割データベースＤＢ１〜ＤＢ７
は、検索制御部１で生成される各データベース毎の検索
プロセスにより検索される。

【００４４】見積表格納部２は、データベース３の各分
割データベースＤＢ１〜ＤＢ７毎にそれぞれ検索処理量
を見積もったプロセッサ資源の資源割当が設定されたテ
ーブルとして見積表を格納している。この見積表は、例
えば、分割データベースのサイズ及びデータ件数等に基
づいて予め固定値として初期設定される資源割当値、及
び該資源割当値に乗算される定数すなわち係数の形で随
時資源割当値を補正する補正値をそれぞれ分割データベ
ースＤＢ１〜ＤＢ７毎に設定して構成している。

【００４５】検索制御部１は、クライアントＣからの検
索要求に基づき、データベース３の各分割データベース
ＤＢ１〜ＤＢ７の検索処理量の見積に応じてプロセッサ
資源の資源割当を行い、所要の分割データベースＤＢ１
〜ＤＢ７を検索するための複数の検索プロセスを生成
し、実行させる。検索制御部１は、さらに該検索プロセ
スによる検索結果を収集して、統合し且つソートしてク
ライアントＣに返す。

【００４６】すなわち、検索制御部１は、図示するよう
に、通信部１１、資源割当部１２、プロセス生成部１
３、結果収集部１４及び統合・ソート部１５を有する。
通信部１１は、クライアントＣとの通信を行い、クライ
アントＣからの検索要求を受け、検索結果をクライアン
トＣに返す。資源割当部１２は、通信部１１で受信され
た検索要求に基づきデータベース３を分割データベース
ＤＢ１〜ＤＢ７毎に検索するための複数の検索プロセス
を生成して、該検索プロセスにより分割データベースＤ
Ｂ１〜ＤＢ７の検索を行う。この検索プロセスの生成に
際し、資源割当部１２は、見積表格納部２に格納された
テーブルである見積表、つまりデータベース３の各分割
データベースＤＢ１〜ＤＢ７毎にそれぞれ検索処理量を
見積もってプロセッサ資源の資源割当値及び補正値が設
定されたテーブルを参照して、プロセッサ資源を割り当
てる。

【００４７】結果収集部１４は、先に述べた検索プロセ
スにより、データベース３の分割データベースＤＢ１〜
ＤＢ７で検索された検索結果を収集する。該結果収集部
１４は、収集した検索結果に基づき、見積表格納部２に
格納された補正値に修正すべきものが存在するときは、
当該補正値を更新して、以後の資源割当に供する。統合
・ソート部１５は、結果収集部１４で収集された結果
を、マージする等して統合し、さらに所要の順序に従っ
てソートして、最終的な検索結果として通信部１１に与
える。この検索結果は、通信部１１を介してクライアン
トＣに返される。

【００４８】次に、このように構成されたデータベース
検索システムの動作について、図２に示すフローチャー
ト、図３に示す動作概念図及び図４に示す見積表の構成
図を参照して説明する。

【００４９】クライアントＣからの検索要求が、検索サ
ーバＳ内の検索制御部１で実行される検索コントロール
プロセスＰ０に与えられる（ステップＳ１１）。検索コ
ントロールプロセスＰ０は、資源割当部１２により、図
４に示す各分割データベースＤＢ１〜ＤＢ７の検索処理
量の見積表ＴＢを参照して（ステップＳ１２）、各検索
プロセスに割り当てるプロセッサ資源を決定する（ステ
ップＳ１３）。見積表ＴＢにおいて、プロセッサ資源割
当値（初期値）は、予め各分割データベースＤＢ１〜Ｄ
Ｂ７のサイズ及びデータ件数等に基づいて初期設定して
おく。

【００５０】例えば、分割データベースＤＢ１〜ＤＢ７
のデータ件数に基づいて、プロセッサ資源割当値を決定
する場合、単純に各分割データベースＤＢ１〜ＤＢ７に
含まれるデータ件数に応じた値をプロセッサ資源割当値
とする。また、実際のデータ件数のみに基づいてプロセ
ッサ資源割当値を決定しても、他の要因、例えば検索ヒ
ット件数等の要因により検索処理時間が変動するため、
プロセッサ資源割当値に定数として乗算してプロセッサ
資源割当値を補正するための係数である補正値も見積表
ＴＢに格納しておく。該補正値は、各分割データベース
ＤＢ１〜ＤＢ７毎に設定し、随時更新されるが、初期値
は１としておいてよい。

【００５１】さらに、検索コントロールプロセスＰ０
は、各分割データベースＤＢ１〜ＤＢ７の検索処理をそ
れぞれ行う検索プロセスＰ１〜Ｐ７を生成し、これら検
索プロセスＰ１〜Ｐ７を、Solarisにおけるniceコマン
ドのようにプロセッサ資源使用の優先度を与えるオペレ
ーテイングシステムのコマンドを用いて起動する（ステ
ップＳ１４）。具体的には例えば、汎用的なオペレーテ
イングシステムであるSolarisでは、niceコマンドの設
定値として、０〜３９を与えることができるため、処理
量の多い検索プロセスに対してはプロセッサ資源利用の
優先度をあげるよう、nice値を小さく設定する。

【００５２】ここで、例えば検索対象の分割データベー
ス（すなわち検索プロセス）が分割データベースＤＢ
１、ＤＢ２、ＤＢ３、ＤＢ５及びＤＢ７の５個の場合の
nice値を設定する方法の例を示す。まず、検索処理量の
見積表ＴＢより各分割データベースＤＢｉ（ｉ＝１，
２，３，５，７）のプロセッサ資源割当値ＰＡｉを取得
する。さらに、各データベースの補正値Ｈｉにより補正
を行い、補正後のプロセッサ資源割当値Ｑｉを次のよう
に求める。Ｑｉ＝ＰＡｉ×ＨｉこのＱｉの中で、最大値をＱmaxとしたとき、各データ
ベースの検索プロセスに与えるnice値ＮＩＣＥｉを次の
数１で与える。

【００５３】

【数１】ＮＩＣＥｉ＝４０×｛１−（Ｑｉ／Ｑmax）｝

【００５４】起動された各検索プロセスＰｉは、個々の
分割データベースＤＢｉの検索を実行する。各検索プロ
セスＰｉの実行結果は、検索コントロールプロセスに返
されて、結果収集部１４で収集される（ステップＳ１
５）。そうすると、検索コントロールプロセスは、結果
収集部１４において、各検索プロセスＰｉの当該検索処
理に要した検索時間を測定する。測定した検索時間と、
該当する検索プロセスＰｉに与えたプロセッサ資源を勘
案して、図４に示す検索処理量の見積表ＴＢの補正値を
更新し、次回以後の検索処理における検索効率を向上さ
せる（ステップＳ１６）。例えば、各データベースＤＢ
ｉが補正値Ｈｉであるときにおける各データべースＤＢ
ｉの検索プロセスの処理時間Ｔｉ（秒）から平均値Ｔav
eを求め、更新後の補正値Ｈ′ｉを次の数２により算定
する。

【００５５】

【数２】Ｈ′ｉ＝Ｈｉ×（Ｔｉ／Ｔave）

【００５６】このように検索の都度、補正値が更新され
るため、仮に初期値にあまり適切でない値を設定してい
ても、高速な検索を実現することができる。

【００５７】このようにして、すべての検索プロセスＰ
ｉから返された検索結果は、検索コントロールプロセス
Ｐ０で、統合・ソート部１５により統合・ソート処理を
行い（ステップＳ１７）、その結果を検索要求のあった
クライアントＣに最終検索結果として返す（ステップＳ
１８）。

【００５８】このようにすれば、データベース検索の処
理時間を効果的に短縮することができる。特に、データ
ベースサイズ等の均一化を意識しないでデータベースを
分割している場合にも効果的に検索時間を短縮すること
ができる。また、データベース検索を繰り返す度に補正
値が更新されるため、データベース検索を繰り返すほど
一層の処理時間の短縮を実現することができる

【００５９】なお、上述においては、検索サーバをＳＭ
Ｐ型マルチプロセッサマシンを用いて実現する場合につ
いて説明したが、複数の検索プロセスを並列的に実行す
ることができるシステムであれば、どのようなシステム
についても上述と同様にして実施することができる。

【００６０】なお、この発明のシステムは、専用のシス
テムとして構成することなく、通常のコンピュータシス
テムを用いて実現することができる。例えば、コンピュ
ータシステムに上述の動作を実行するためのプログラム
を格納した媒体（フロッピーディスク、ＣＤ−ＲＯＭ
等）から該プログラムをインストールすることにより、
上述の処理を実行するシステムを構築することができ
る。インストールによって、当該プログラムは、コンピ
ュータシステム内のハードディスク等の媒体に格納され
て、システムを構成し、実行に供される。

【００６１】また、コンピュータにプログラムを供給す
るための媒体は、狭義の記憶媒体に限らず、通信回線、
通信ネットワーク及び通信システムのように、一時的且
つ流動的にプログラム等の情報を保持する通信媒体等を
含む広義の記憶媒体であってもよい。

【００６２】例えば、インターネット等の通信ネットワ
ーク上に設けたＦＴＰ（File Transfer Protocol）サー
バに当該プログラムを登録し、ＦＴＰクライアントにネ
ットワークを介して配信してもよく、通信ネットワーク
の電子掲示板（ＢＢＳ：Bulletin Board System）等に
該プログラムを登録し、これをネットワークを介して配
信してもよい。そして、このプログラムを起動し、ＯＳ
（Operating System）の制御下において実行することに
より、上述の処理を達成することができる。さらに、通
信ネットワークを介してプログラムを転送しながら起動
実行することによっても、上述の処理を達成することが
できる。

【００６３】

【発明の効果】以上説明したように、この発明によれ
ば、複数のデータベースの検索にあたり、データベース
検索における処理量に応じて各データベースの検索プロ
セスのプロセッサ資源を適切に割り当てることにより、
プロセッサ資源を有効に活用し、データベースの検索時
間を短縮することを可能とするデータベース検索システ
ム、マルチプロセッサシステム及びデータベース検索方
法を提供することができる。

【図面の簡単な説明】

【図１】この発明の実施の形態に係るデータベース検索
システムの構成を模式的に示すブロック図である。

【図２】図１のデータベース検索システムにおける動作
を説明するためのフローチャートである。

【図３】図１のデータベース検索システムにおける動作
を模式的に示すプロセス概念図である。

【図４】図１のデータベース検索システムに用いられる
見積表の構成を模式的に示す図である。

【図５】従来の検索処理とこの発明による検索処理との
相違を模式的に示す図である。

【符号の説明】

Ｓ検索サーバＣクライアント１検索制御部２見積表格納部３データベース１１通信部１２資源割当部１３プロセス生成部１４結果収集部１５統合・ソート部

Claims

【特許請求の範囲】

【請求項１】与えられた検索要求に応じた複数のデータ
ベースの検索にそれぞれ予測される処理量に応じてプロ
セッサ資源を割り当てる資源割当手段と、前記資源割当手段によるプロセッサ資源の資源割当に従
って、前記複数のデータベースの検索を並列的に実行す
る複数の検索プロセスを生成し起動する検索プロセス生
成手段と、前記複数の検索プロセスの実行による検索結果を収集す
る結果収集手段と、を具備することを特徴とするデータ
ベース検索システム。
【請求項２】データベース毎の予測される検索処理量か
らなる見積テーブルを格納する見積テーブル格納手段を
さらに備え、前記資源割当手段は、前記見積テーブルを参照してプロ
セッサ資源の資源割当を決定する手段を含み、前記結果収集手段は、その収集実績に基づいて前記見積
テーブル格納手段に格納される見積テーブルを補正更新
する手段を含む、ことを特徴とする請求項１に記載のデ
ータベース検索システム。
【請求項３】前記見積テーブル格納手段は、前記データ
ベース毎に、予測される検索処理量に基づいて固定的に
設定された資源割当値、及び前記結果収集手段により随
時更新されて前記資源割当値を補正する補正値を含む見
積テーブルを格納することを特徴とする請求項２に記載
のデータベース検索システム。
【請求項４】前記検索プロセス生成手段は、前記データ
ベース毎に生成した検索プロセスを、該検索プロセスに
前記資源割当手段による前記資源割当に従ったプロセッ
サ資源使用の優先度を与えて、起動する手段を含むこと
を特徴とする請求項１、２又は３に記載のデータベース
検索システム。
【請求項５】前記結果収集手段で収集された検索結果を
統合する統合手段をさらに含むことを特徴とする請求項
１乃至４のうちのいずれか１項に記載のデータベース検
索システム。
【請求項６】前記統合手段は、統合された検索結果をソ
ートする手段を含む、ことを特徴とする請求項５に記載のデータベース検索シ
ステム。
【請求項７】複数のデータベースをそれぞれ構築する複
数のデータベース手段と、各々複数のデータベースの検索プロセスを実行し得る複
数のプロセッサ手段と、与えられた検索要求に応じた複数のデータベースの検索
に、それぞれ予測される処理量に応じて前記複数のプロ
セッサ手段のプロセッサ資源を割り当てる資源割当手段
と、前記資源割当手段によるプロセッサ資源の資源割当に従
い、前記複数のプロセッサ手段を用いて、前記複数のデ
ータベース手段の検索を並列的に実行する複数の検索プ
ロセスを生成し起動する検索プロセス生成手段と、前記複数の検索プロセスの実行による検索結果を収集し
て検索要求元に返す結果収集手段と、を具備することを特徴とするマルチプロセッサシステ
ム。
【請求項８】各データベース手段毎の予測される検索処
理量からなる見積テーブルを格納する見積テーブル格納
手段をさらに備え、前記資源割当手段は、前記見積テーブルを参照してプロ
セッサ資源の資源割当を決定する手段を含み、前記結果収集手段は、その収集実績に基づいて前記見積
テーブル格納手段に格納される見積テーブルを補正更新
する手段を含むことを特徴とする請求項７に記載のマル
チプロセッサシステム。
【請求項９】前記見積テーブル格納手段は、前記データ
ベース手段毎に、予測される検索処理量に基づいて固定
的に設定された資源割当値、及び前記結果収集手段によ
り随時更新されて前記資源割当値を補正する補正値を含
む見積テーブルを格納することを特徴とする請求項８に
記載のマルチプロセッサシステム。
【請求項１０】前記検索プロセス生成手段は、前記デー
タベース手段毎に生成した検索プロセスを、該検索プロ
セスに前記資源割当手段による前記資源割当に従ったプ
ロセッサ資源使用の優先度を与えて、起動する手段を含
むことを特徴とする請求項７、８又は９に記載のマルチ
プロセッサシステム。
【請求項１１】前記結果収集手段で収集された検索結果
を、検索要求元に返す前に統合する統合手段をさらに含
むことを特徴とする請求項８、９又は１０に記載のマル
チプロセッサシステム。
【請求項１２】前記統合手段は、統合された検索結果を
ソートする手段を含む、ことを特徴とする請求項１１に記載のマルチプロセッサ
システム。
【請求項１３】与えられた検索要求に応じた複数のデー
タベースの検索にそれぞれ予測される処理量に応じてプ
ロセッサ資源を割り当てる資源割当ステップと、前記資源割当ステップによるプロセッサ資源の資源割当
に従って、前記複数のデータベースの検索を並列的に実
行する複数の検索プロセスを生成し起動する検索プロセ
ス生成ステップと、前記複数の検索プロセスの実行による検索結果を収集す
る結果収集ステップと、を有することを特徴とするデー
タベース検索方法。
【請求項１４】前記資源割当ステップは、予め設定した
各データベース毎の予測される検索処理量からなる見積
テーブルを参照してプロセッサ資源の資源割当を決定す
るステップを含み、前記結果収集ステップは、その収集実績に基づいて前記
見積テーブルを補正更新するステップを含み、前記見積テーブルは、各データベース毎に、予測される
検索処理量に基づいて固定的に設定された資源割当値、
及び前記結果収集ステップにより随時更新されて前記資
源割当値を補正する補正値を含み、前記検索プロセス生成ステップは、前記データベース毎
に生成した検索プロセスを、該検索プロセスに前記資源
割当に従ったプロセッサ資源使用の優先度を与えて、起
動するステップを含む、ことを特徴とする請求項１３に
記載のデータベース検索方法。
【請求項１５】前記結果収集ステップで収集された検索
結果を統合する統合ステップをさらに含むことを特徴と
する請求項１３又は１４に記載のデータベース検索方
法。
【請求項１６】前記統合ステップは、統合された検索結
果をソートするステップをさらに含むことを特徴とする
請求項１３、１４又は１５に記載のデータベース検索方
法。