JP3155991B2

JP3155991B2 - 集約演算実行方法及びコンピュータ・システム

Info

Publication number: JP3155991B2
Application number: JP33918597A
Authority: JP
Inventors: 裕史松澤; 剛志福田
Original assignee: IBM Japan Ltd
Current assignee: IBM Japan Ltd
Priority date: 1997-04-09
Filing date: 1997-12-09
Publication date: 2001-04-16
Anticipated expiration: 2017-12-09
Also published as: US6182061B1; JPH10340276A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ・マイニン
グ（Data Mining）のようなデータベースの処理等に必
要な集約演算（アグリゲーション：aggregation）の並
列計算機上における処理方法に関する。なお、集約演算
にはデータベース内のグループ毎に集約を行う演算を含
む。

【０００２】

【従来の技術】データ・マイニングのような分野にてよ
く用いられる集約演算とは、関係データベースへの問い
合わせ言語ＳＱＬのgroup-byのように、あるリレーショ
ンに対し、特定の属性が同一の値又同一の値の組若しく
は所定の範囲に属する値を有するようなレコードを１つ
のグループとして、グループ毎に他の属性の合計、最
大、最小、平均等を計算する処理である。このような集
約演算は、最近、ＯＬＡＰ（On Line Analytical Proce
ssing）［詳しくは、E.F.Codd,S.B.Codd, and C.T.Sall
ey, "Beyond decision support," Comupterworld, 27(3
0), July 1993参照のこと］やデータ・マイニング等の
決定支援システムにおいて不可欠な操作となっている。

【０００３】以下集約演算の例を示す。表１は、データ
ベースに記憶されている関係を表している。プロダクト
番号、カスタマー番号、そして売上げについての列があ
り、各行は売上げが生ずるごとに記録されるようになっ
ている。このような関係について、プロダクト番号ごと
に売上げを合計するという演算を考える。この演算は、
プロダクト番号ごとにグループが構成され、その各グル
ープごとに合計を計算するという処理であり、上記集約
演算の１つの例である。この集約演算を実施すると、表
２のような結果を得ることができる。

【表１】

【表２】

【０００４】以前より、１つの集約演算を並列処理する
ためのアルゴリズムについては研究されてきた。以下、
それらのアルゴリズムについて説明する。但し、各アル
ゴリズムにおいては、データベース中の全関係は各プロ
セッサに均等分割されていることを前提としている。

【０００５】１．２Ｐアルゴリズム二段階にて実施されるため２Ｐという。（１）第１フェーズとして、各プロセッサ（ノードとも
いう）は、そのプロセッサ用のディスク装置（データベ
ースを記憶している）に対して、集約演算を実施する。（２）第２フェーズとして、各プロセッサの結果は、集
計用のプロセッサに集められ、最終結果を計算する。

【０００６】このような方法は、特開平５−２６１０号
公報にも記載されている。この公報では、たかだか１つ
のグループについての集約演算しか取り扱っておらず、
先に述べたようなデータ・マイニングのように複数のグ
ループについて集約演算を実施することに何等の考慮も
なされていない。

【０００７】２．Ｒｅｐアルゴリズムリパーティション（repartition）アルゴリズムは以下
のようなアルゴリズムにて実施される（図１）。（１）最初に、各ノードが集約演算を実行すべきグルー
プを決定する（ステップ１１０）。表１の例では、ノー
ド１がプロダクト番号Ｇ１を担当し、ノード２がプロダ
クト番号Ｇ２を担当する、といったような割当てを決定
する。（２）次に、各ノードで、そのノード用のディスク装置
（データベースを記憶した物）から、データの一部を読
み出し、他のノードが集約すべきグループのデータなら
ば、担当ノードに送信する（ステップ１２０）。例えば
表１の例で、この表１がノード１用のディスク装置内に
存在する場合、ノード１が表１の第２行目を読み出した
時、ノード１は第２行目のデータをノード２に送信す
る。（３）そして、各ノードで、他のノードから送られてき
たデータを含む、自己が集約演算をすべきグループに関
するデータに対して集約を実行する（ステップ１３
０）。

【０００８】このような２つのアルゴリズムのうちどち
らを用いると高速に処理できるかは、条件によって異な
る。各アルゴリズムを用いて、１つの集約演算を処理し
た場合の所要時間の見積りを図２に示す。図２は、１６
ノードのＩＢＭＳＰ２（インタナショナル・ビジネス
・マシーンズ・コーポレイションの商標）を用いた場合
の見積りで、グループ数と応答時間の関係を示してい
る。このシステムの場合、グループ数が２×１０⁵より
少ない場合には、２Ｐアルゴリズムの方が高速である
が、グループ数が多い場合には、Ｒｅｐアルゴリズムの
方が高速である。これまで、１つの集約演算の並列処理
には、２ＰアルゴリズムとＲｅｐアルゴリズムを動的に
切り換えるようなアルゴリズムが提案されている（例え
ば、Ambuj Shatdal and Jeffrey F.Naughton, "Adaptiv
e parallel aggregation algorithms," In Proceedings
of the ACM SIGMOD Conference on Management of Dat
a, pages 104-114, May 1995.を参照のこと）。

【０００９】また、上記以外の方法としては、データベ
ース中の全レコードをブロードキャストする方法がある
（Dine Bitton, Haran Boral, David J DeWitt, and W.
Kevin Wilkinson, "Parallel algorithms for the exec
ution of relational database operations," ACM Tran
s. on Database Systems, 8(3):324-353, Sep. 1983.を
参照のこと）。しかし、このようなアルゴリズム（以
下、ＢＣアルゴリズムと呼ぶ。）は、プロセッサ間を接
続するネットワークが低速であった頃には非実用的な方
法であった。

【００１０】このＢＣアルゴリズムをまとめておく。３．ＢＣアルゴリズム（１）全グループの中で、各ノードが集約演算を実施す
べきグループを決定する。Ｒｅｐアルゴリズムと同様で
ある。（２）各ノードは、自己のディスク装置内の全データを
他の全てのノードに、ブロードキャストする。（３）各ノードは、ブロードキャストされたデータ（自
己のディスク装置内のデータを含む）に対して、自己が
集約すべきグループについての集約演算を実施する。

【００１１】これまでは、１つの集約演算を並列に実行
するアルゴリズムを説明したが、１つのプロセッサで複
数の集約演算を実行する場合には、演算の順番を調整し
たり、演算間の関連性を用いて全体の処理を高速化する
方法（例えば、Sameet Agrawal, Rakesh Agrawal, Pras
ad M. Deshpande, Ashish Gupta, Jeffrey F. Naughto
n, Raghu Ramakrishnan, and Sunita Sarawagi, "On th
e computation of multidimensional aggregates," In
Proceedings of the 22nd VLDB Conference, Sep. 199
6.を参照のこと）等が提案されている。しかし、並列計
算機を用いて複数個の演算を同時に処理する方法につい
ては、提案されていない。

【００１２】

【発明が解決しようとする課題】複数の集約演算を並列
に実行する処理は、上記の方法を複数回繰り返せば高速
に実行できる、というわけではない。以上のように本発
明は、複数の集約演算を並列に高速実行する方法を提供
することを目的とする。

【００１３】現在注目を集めている決定支援システムの
コアとなる技術であるＯＬＡＰやデータマイニングで
は、複数個の集約演算を行う必要がある。例えば、多次
元属性を持つデータの分析に対して、複数個の集約演算
を実行するＤａｔａＣｕｂｅ（例えば、Jim Gray, Ad
am Bosworth, Andrew Layman, and Hamid Pirahesh, "D
ata cube: A relational aggregation operator genera
lizing group-by, cross-by, and sub-by, and sub-tot
als," Technical report, Microsoft , Nov. 1995等を
参照のこと）オペレータが提案されている。また、デー
タ・マイニングのあるアプリケーションは、複数の集約
演算の結果を用いて属性間の関係を自動的に発見し、グ
ラフィカルな表示を行う（例えば、Takeshi Fukuda, Ya
suhiko Morimoto, Shinichi Morishita, and Takeshi T
okuyama, "Data Mining optimizedassociation rules f
or numeric attributes, " In Proceedings of the Fif
teenth ACM SIGACT-SIGMOD-SIGART symposium on Princ
iples of Database Systems, pages 182-191, June 199
6, Takeshi Fukuda, Yasuhiko Morimoto, ShinichiMori
shita, and Takeshi Tokuyama, "Data mining using tw
o-dimensional optimized association rules: Scheme,
algorithms, and Visualization," In proceedings of
the ACM SIGMOD conference on Management of Data,
pages 13-23,June 1996.等を参照のこと）。これらの技
術では、インタラクティブに操作できることが要求され
ており、応答時間が重要な要素となっている。応答時間
を短縮するための１つの方法として、事前に集約演算を
実行しておくことが必要となる。よって、複数の集約演
算を並列に高速実行することにより、ＯＬＡＰやデータ
・マイニングの実行を高速にすることも目的である。

【００１４】さらに、複数の集約演算を実行する方法
を、ハードウエアの条件や複数の集約演算の性質等に基
づき、切り換えることができるようにし、様々な条件の
下、複数の集約演算を常に同じ方法で実行するよりも、
より高速に実行することも目的とする。

【００１５】

【課題を解決するための手段】以上の目的を実現するた
めに最も重要な技術的事項は、ディスク装置へのアクセ
スの回数及び時間である。今や、ディスク装置へのアク
セスは、並列処理装置の各プロセッサ間の通信速度より
遅い。よって、このディスク装置へのアクセスをいかに
減らすかが、本発明の目的達成に大きな影響を及ぼす。
以下、このディスク装置へのアクセスを減らす具体的方
法について説明する。

【００１６】本発明の第１の集約演算実行方法は以下の
ようなステップを含む。すなわち、（ａ）各プロセッサ
が、自己のメモリ領域に、Ｎ個の集約演算のうちＭ個
（Ｎ以下の整数）分の演算結果を記憶するスペースを確
保するステップと、(ｂ）各プロセッサが、Ｍ個の集約
演算をまとめて、データベースの自己の部分に対して実
行するステップと、（ｃ）各プロセッサが、Ｍ個の集約
演算の各プロセッサにおける演算結果を、集計すべきプ
ロセッサに送信し、集計すべきプロセッサが最終結果を
計算するステップと、（ｄ）Ｎ個の集約演算の実行が終
了するまで、ステップ（ａ）乃至（ｃ）を繰り返すステ
ップと、である。なお、本発明の集約演算実行方法を実
施するのに適当なコンピュータ・システムは、ネットワ
ークにより接続された複数のプロセッサが各々自己のメ
モリ領域及び１又は複数のグループに分けることができ
るデータを含むデータベースの自己の部分を使用できる
よう構成されている。メモリについては、各ノードごと
に分離されて用意されていても、ネットワークに接続さ
れたメモリが、幾つかのメモリ領域に分けられており、
そのメモリ領域を各プロセッサが用いる方式にしてもよ
い。ディスクについても同様である。

【００１７】この第１の集約演算実行方法は、従来技術
の欄で述べた２Ｐアルゴリズムをベースに考えられた方
法である。この方法では、先に示したＩＢＭＳＰ２
で、結果のグループの数が比較的少ない場合に計算速度
が高速になる。

【００１８】上記のステップ（ｂ）は、（b1）各プロセ
ッサが、自己のメモリ領域のワークスペースに、データ
ベースの自己の部分である部分データベースの一部を読
み出すステップと、（b2）各プロセッサが、自己のメモ
リ領域に格納された本ステップ以前の演算結果と読み出
された部分データベースの一部とについて、Ｍ個の集約
演算を実行するステップと、（b3）各プロセッサが、部
分データベースのすべてに対してＭ個の集約演算が実行
されるまで、ステップ(b1)及び(b2)を繰り返すステップ
とを含むようにすることもできる。ステップ（b2）は、
読み出された部分データベースの一部についてのみＭ個
の集約演算を実行して、それからそのステップ以前の演
算結果との集計を計算するようにすることもできるが、
このような方法では遅くなる。

【００１９】上で述べたＭは、Ｎ以下の整数として、他
の条件と関係なく選択することも可能であるが、集約演
算の演算結果のために自己のメモリ領域に確保できるス
ペースから決定すると、繰り返しのステップ（ステップ
（ｄ））が少なくて済むので、より高速である。

【００２０】本発明の第２の集約演算実行方法は、
（ａ）各プロセッサが、Ｐ個の集約演算のうち自らが実
行するＱ個の集約演算の演算結果を記憶するスペース
を、自己のメモリ領域に確保するステップと、（ｂ）各
プロセッサが、自己のメモリ領域のワークスペースにデ
ータベースの自己の部分である部分データベースの一部
を読み出し、読み出された部分データベースの一部をネ
ットワークを介してブロードキャストすることを繰り返
して、各プロセッサが全てのデータベースのデータに対
し自らが実行するＱ個の集約演算を実行するステップ
と、（ｃ）Ｐ個の集約演算が実行されるまで、ステップ
（ａ）及び（ｂ）を繰り返すステップとを含む。第２の
集約演算実行方法のためのコンピュータ・システムは、
第１の集約演算実行方法と同様である。

【００２１】この第２の集約演算実行方法は、ＢＣアル
ゴリズムをベースに考えられた方法である。この方法で
は、第１の集約演算実行方法より比較的グループの数が
多い場合に、計算速度がより高速になる。

【００２２】この第２の集約演算実行方法のステップ
（ａ）は、（a1）１つの集約演算の演算結果を格納でき
るようなスペースが１つのプロセッサの自己のメモリ領
域に存在するか検査するステップと、（a2）スペースが
存在する場合には、スペースを１つの集約演算の演算結
果のために確保するステップと、（a3）スペースが存在
しない場合には、他のプロセッサのメモリ領域に前記１
つの集約演算の演算結果を格納できるようなスペースが
存在するか検査するステップと、（a4）他のプロセッサ
のメモリ領域にスペースが存在する場合には、当該他の
プロセッサのメモリ領域のスペースを前記１つの集約演
算の演算結果のために確保するステップとを含むように
することもできる。この時、他のプロセッサのメモリ領
域にスペースが存在しない場合には、後の繰り返し処理
にて前記１つの集約演算を実行するようにすることもで
きる。どうしても、ある集約演算にスペースが存在しな
いような場合も生じ得るが、その場合には当該集約演算
を幾つかに分けて実行するようなことも可能である。

【００２３】Ｑについては、先のＭと同様に、集約演算
の演算結果のために自己のメモリ領域に確保できるスペ
ースから決定する、ということも可能である。

【００２４】さらに第２の集約演算実行方法のステップ
（ｂ）は、（b1）各プロセッサが、自己のメモリ領域の
ワークスペースに、部分データベースの一部を読み出す
ステップと、（b2）読み出された部分データベースの一
部をネットワークを介してブロードキャストするステッ
プと、（b3）自己のメモリ領域に格納された本ステップ
以前の演算結果と読み出された部分データベースの一部
と他のプロセッサから送られてきたデータとについて、
自らが実行するＱ個の集約演算を実行するステップと、
（b4）各プロセッサが全てのデータベースの内容に対し
自らが実行するＱ個の集約演算を実行するまでステップ
（b1）乃至（b3）を繰り返すステップとを含むようにす
ることも可能である。ステップ（b3）で、読み出された
部分データベースの一部と他のプロセッサから送られて
きたデータとについてＱ個の集約演算を実行し、後に当
該ステップ以前の演算結果と集計をとってもよいが、こ
れでは遅くなる。

【００２５】本発明の第３の集約演算実行方法は、
（ａ）Ｓ個の集約演算のうち実行するＴ個の集約演算を
決定するステップと、（ｂ）Ｔ個の集約演算を実行する
際に集約される、各集約演算の各グループを取り扱うプ
ロセッサを決定するステップと、（ｃ）各プロセッサ
が、データベースの自己の部分である部分データベース
の一部を自己のメモリ領域に読み出し、読み出されたデ
ータのうち他のプロセッサが集約すべき集約演算のグル
ープに関するデータを当該集約演算のＩＤと共に他のプ
ロセッサにネットワークを介して送信し、自己が集約す
べき集約演算のグループに関するデータについてＴ個の
集約演算を実行するステップと、（ｄ）各プロセッサが
集約すべき集約演算のグループに関する全てのデータに
Ｔ個の集約演算を実行するまで、ステップ（ｃ）を実行
するステップと、（ｅ）Ｓ個の集約演算を実行するま
で、ステップ（ａ）乃至（ｄ）を繰り返すステップとを
含む。第３の集約演算実行方法のためのコンピュータ・
システムも、第１の集約演算実行方法と同様である。

【００２６】この第３の集約演算実行方法は、Ｒｅｐア
ルゴリズムをベースに考えられた方法である。この方法
では、第２の集約演算実行方法より比較的グループの数
が多い場合に、計算速度がより高速になる。

【００２７】第３の集約演算実行方法におけるステップ
（ｃ）は、（c1）各プロセッサが、データベースの自己
の部分である部分データベースの一部を自己のメモリ領
域のワークスペースに読み出すステップと、（c2）各プ
ロセッサが、読み出されたデータの各部分を必要とする
プロセッサを求め、当該部分を関連する集約演算のＩＤ
と共に必要とするプロセッサにネットワークを介して送
信するステップと、（c3）各プロセッサが、読み出され
たデータのうち自己が集約すべき集約演算のグループに
関するデータ及び他のプロセッサからのデータ及び自己
のメモリ領域に格納された本ステップ以前の演算結果に
対し、Ｔ個の集約演算を実行するステップとを含むよう
にすることも考えられる。ネットワークを介しての送信
は、Ｔ個の集約演算と同時に行ってもよい。

【００２８】この第３の集約演算実行方法におけるＴ個
の集約演算の決定方法及びどのプロセッサが集約演算の
どのグループを集約するかについては、各プロセッサの
使用するメモリの容量によって決められる。

【００２９】ところで、第１乃至第３の集約演算実行方
法のうち最適なアルゴリズムは、条件によって異なる。
よって、プロセッサの数とデータベースの大きさとネッ
トワークの通信速度とを含むコンピュータ・システムの
パラメータ及び実行する集約演算の数と各集約演算の結
果を格納するメモリの量とを含む集約演算の性質に関す
るパラメータを用いて、上記のうち最も高速なアルゴリ
ズムを選び出し、最適なアルゴリズムによって複数の集
約演算を実行するようにすれば、ユーザは常に高速に複
数の集約演算の結果を得ることができる。なお、選択は
３つの方法の中から行わなければならないわけではな
く、他の方法を含めてその中で選択することも、３つの
方法のサブセットの中から選択することも可能である。

【００３０】以上の述べた方法は、プログラムによって
実現することも、専用の装置を用いて実現することも可
能である。このように実現形態を変更することは、以下
の説明を理解した当業者が通常行うことのできる事項で
ある。

【００３１】

【発明の実施の形態】初めに本発明において用いられる
コンピュータ・システムのハードウエア構成について説
明する。図３は、その典型的な一例を示すものである。
プロセッサ・エレメントＰＥ１（３ａ）、プロセッサ・
エレメントＰＥ２（３ｂ）、及びプロセッサ・エレメン
トＰＥｎ（３ｃ）がネットワーク１を介して接続されて
いる。このプロセッサ・エレメントは図３のように３つ
である必要はなく、複数であればよい。一般にｎ個とす
る。プロセッサ・エレメントＰＥ１（３ａ）には、メモ
リ５ａ及びディスク装置７ａが接続されており、同様に
プロセッサ・エレメントＰＥ２（３ｂ）にはメモリ５ｂ
及びディスク装置７ｂ、プロセッサ・エレメントＰＥｎ
（３ｃ）にはメモリ５ｃ及びディスク装置７ｃが接続さ
れている。各ディスク装置には、データベースの一部分
がそれぞれ記憶されている。ネットワーク１は、プロセ
ッサ・エレメント間の通信に用いられ、高速にデータを
やり取りできるようになっている。

【００３２】図３は一例であって、例えば図４のよう
に、各プロセッサ・エレメントに直接メモリが接続され
ておらず、メモリ９及びメモリ１０がネットワーク１に
接続されるような構成も可能である。この場合メモリ９
は、プロセッサ・エレメントＰＥ１用の領域９ａとプロ
セッサ・エレメントＰＥ２用の領域９ｂとに分けること
ができる。メモリ９はこのようにそれぞれのプロセッサ
・エレメント用の領域の他、プロセッサ・エレメント間
で共有する領域を設けてもよい。また、メモリ１０はＰ
Ｅｎ専用となっているが、このように、ネットワーク１
に各プロセッサ・エレメント用に別のメモリを接続する
ような構成とすることも可能である。プロセッサ・エレ
メント３ａ，３ｂ，３ｃは、ディスク装置７ａ，７ｂ，
７ｃからデータを読み出すと、ネットワーク１を介して
自己のメモリ領域９ａ，９ｂ，１０のワークエリアにデ
ータを書き込む。

【００３３】また図５のように、プロセッサ・エレメン
トとメモリは図３と同様な接続をしているが、ディスク
装置がネットワーク１に接続されているような構成も考
えられる。ここで、ディスク装置１１はプロセッサ・エ
レメントＰＥ１用のデータ１１ａとプロセッサ・エレメ
ントＰＥ２用のデータ１１ｂとを有している。ディスク
装置１１は、プロセッサ・エレメントＰＥ１及びＰＥ２
用データの他、共有のデータ等を含むことができる。ま
た、ディスク装置１３は、プロセッサ・エレメントＰＥ
ｎ用のデータを格納している。このように、各プロセッ
サ・エレメント専用のディスク装置をネットワーク１に
別々接続する構成も可能である。これらディスク装置内
のデータは、ネットワーク１を介してプロセッサ・エレ
メント３ａ，３ｂ，３ｃによって読み出され、メモリ５
ａ，５ｂ，５ｃのワークエリアに取り込まれる。

【００３４】図３、図４、及び図５を幾つか組み合わせ
た構成も可能である。例えば、幾つかのプロセッサ・エ
レメントは図３のような構成をとっており、幾つかのプ
ロセッサは図４や図５のような構成をすることも可能で
ある。また、図３，図４，図５以外の構成も可能であ
り、要するに、プロセッサ間でメモリやディスク装置を
共有する必要はない。

【００３５】以上のようなハードウエア構成を前提とし
て、以下どのような処理を行うかを説明する。なお、以
下に説明する処理では、システム全体のための処理も一
部に含まれるが、その処理は複数のプロセッサ・エレメ
ントのうち１つをその処理のために割当てたり、そのよ
うな処理専用のプロセッサを用意してもよい。

【００３６】１．２Ｐｍアルゴリズム（図６）本アルゴリズムは、従来技術で説明した２Ｐアルゴリズ
ムをベースとしたものであり、複数の集約演算を並列に
実施するように拡張したものであるため、２Ｐｍアルゴ
リズムと呼ぶことにする。複数の集約演算を実施する際
に、ディスク装置へのアクセスを最小限にすることで高
速化する。なお、全部でＮ個の集約演算を実行すること
を前提とする。

【００３７】（１）最初に、自己のメモリ領域にＭ個の
集約演算の演算結果を記憶するスペースを確保する（ス
テップ２１０）。このＭ個はその演算結果を各プロセッ
サ・エレメントのメモリ領域に格納できる範囲で決めら
れるが、なるべくたくさんの集約演算を１度に実行する
方がディスク・アクセスを共有することができるので、
処理が高速になる。また、本アルゴリズムを実行する全
てのプロセッサ・エレメントが、全て同じＭ個の集約演
算を実行する方が高速処理できる。これは、後に説明す
る集計処理が必要となるため、プロセッサ・エレメント
毎に異なる個数の集約演算を実施していると、集計処理
ができない演算結果の一部がメモリに残ってしまい、他
のプロセッサ・エレメントで演算の実行が終了するのを
待たなければならないといった問題が生じるからであ
る。よって、実行する集約演算は、本アルゴリズムを実
行するプロセッサ・エレメントが同じ個数の同じ集約演
算を１度に実行できるという観点から選択すると、処理
の高速化に効果的である。なお、演算結果を記憶するス
ペースを演算を実行する前に知らなければならないが、
これは少しのデータに対して試算をしてみれば、演算結
果の規模は把握することができ、大きな負担ではない。

【００３８】以下に、ステップ２１０の擬似コードを示
しておく。

【表３】 // 変数 N : number of node mem : size of memory MEM : variable ( 0 ≦ MEM ≦ mem ) q : query NL : list of queries tmpNL : list of queries # 次回以降に実行する分 ML : list of queries # 今回実行する分 // 初期化 NL = { q_1, q_2, ..., q_i,... ,q_Q } # list of Q queries. mem = getMaxMemSize() # メモリサイズを得る。 # 各ノードが協調して最も小さいサイズに合わせる # 各ノードが以下を実行 while NL ≠ NIL 且つ tmpNL ≠ NIL do # NIL : 空リスト begin MEM = mem ; tmpNL = NIL ; ML = NIL ; while NL ≠ NIL do # NL が空になるまで実行 begin q = pop( NL ); # pop() リストの先頭を取ってくる if ( MEM > |q| ) then # q のメモリが確保できるか調べる begin # |q| は演算 q が使用するメモリサイズ append( ML, q ) ; # ML に q を加える MEM = MEM - |q| ; # 残りのメモリサイズから |q| を引く end else begin append( tmpNL, q ) ; # 演算 q を未処理リストに加える end end # ML 中の query について集約演算を実行 # tmpNL は、次回以降に while ML ≠ NIL do # ML が NIL になるまで実行 begin q = pop( ML ) ; # MLから先頭の演算を取ってくる allocate ( q ) ; # 演算 q 用のメモリを確保 end 2Pm( ) ; # ML のリストにあった query について # 2Pmアルゴリズムを実行 copy( NL, tmpNL ) ; # NL に、tmpNL をコピー end

【００３９】（２）データベースの自己の部分に対して
Ｍ個の集約演算を実行する（ステップ２２０）。この処
理をより詳しく説明すると、最初に自己のメモリ領域の
ワークスペースに、データベースの自己の部分のうち、
今回処理する分を読み出す。そして、自己のメモリ領域
に格納された、これまでの演算結果（一番最初のステッ
プにおいては存在しない）と、データベースの自己の部
分のうち、読み出された今回処理する分とについて、Ｍ
個の集約演算を実行する。この２つのステップを、デー
タベースの自己の部分すべてに対して実行するまで繰り
返す。具体例については後に説明する。１回読み出した
データに対し、従来の方法では１つの集約演算しか行わ
れていなかったため、そのままＭ個の集約演算を実行す
る場合に適用すると、Ｍ回データを読み出さなければな
らなかった。一方、本発明では、１回読み出したデータ
に対し、Ｍ個の集約演算が実施されているため、ディス
ク・アクセスのための時間は全体として１／Ｍとなる。

【００４０】（３）そして、Ｍ個の集約演算の演算結果
を集計担当プロセッサ・エレメント（集計担当ノードと
もいう）に送信し、集計担当プロセッサ・エレメントが
最終結果を計算する（ステップ２３０）。集計担当プロ
セッサ・エレメントは、１つでも複数でもよい。例え
ば、Ｍ個のプロセッサ・エレメントが共に本アルゴリズ
ムを実行している場合には、各プロセッサが１つの集約
演算の演算結果の集計担当プロセッサ・エレメントと
し、最終結果を計算するようにすることもできる。Ｍ個
よりプロセッサ・エレメントが少ない場合には、１つの
プロセッサ・エレメントが複数個の集約演算の演算結果
を集計してもよいし、ただ１つのプロセッサ・エレメン
トがＭ個の集約演算の演算結果をすべて集計するように
してもよい。どのプロセッサ・エレメントがどの集約演
算の演算結果を集計するかは、予め決めておく。

【００４１】また、集約演算の演算結果における各グル
ープをプロセッサ・エレメントごとに割当て、集計する
方法も考えられる。例えば、プロセッサ・エレメント１
が集約演算１のグループ１及び２を集計し、プロセッサ
・エレメント２が集約演算１のグループ３及び４と集約
演算２のグループ１及び２を集計する、といった具合で
ある。

【００４２】（４）Ｍ個の集約演算の最終結果が得られ
ると、Ｎ個の集約演算が全て実行されたか判断される
（ステップ２４０）。もし、Ｎ個の集約演算がすべて実
行されたわけではない場合には、ステップ２１０に戻っ
て処理を繰り返す。この場合、通常はもとのＭと異なる
Ｍで繰り返しを実行する。もし、Ｎ個の集約演算がすべ
て実行された場合には、処理を終了する。

【００４３】では実際の実行例を図７乃至図１０の例を
用いて説明する。図７はプロセッサ・エレメント１用の
ディスク装置に記憶されたリレーションを、図８はプロ
セッサ・エレメント２用のディスク装置に記憶されたリ
レーションを、図９はプロセッサ・エレメント３用のデ
ィスク装置に記憶されたリレーションを、図１０はプロ
セッサ・エレメント４用のディスク装置に記憶されたリ
レーションを、それぞれ表し、コンピュータ・システム
には４つのプロセッサ・エレメントが存在するとする。
表の各列は、右から売上げの月、日、曜日、場所、店番
号、製品番号、売上げ数をそれぞれ表す。表の各行は、
売上げが発生した時に生成されるとする。

【００４４】月ごとに売上げ数を合計する演算（演算
１）と、曜日ごとに売上げ数を合計する演算（演算２）
と、場所ごとに売上げ数を合計する演算（演算３）と、
製品番号ごとに売上げ数を合計する演算（演算４）と、
場所及び曜日ごとに売上げ数を合計する演算（演算５）
とを一度に実行することとする。

【００４５】プロセッサ・エレメント１は、図７の第１
行目のデータをディスク装置からメモリのワークスペー
スに読み出す。そして、演算１を実施するため、月と売
上げ数の列を参照する。月は"Ａｐｒ"で売上げ数"３"が
最初に演算１の結果として記憶される。次に、演算２を
実行するため、曜日と売上げ数の列を参照し、曜日は"
Ｓｕｎ"で売上げが"３"が演算２の結果として記憶され
る。演算３を実行するために、場所と売上げ数の列を参
照し、場所"Ｋｙｕｕｓｈｕｕ"で売上げ数"３"が演算３
の結果として記憶される。演算４を実行するために、製
品番号と売上げ数の列を参照し、製品番号２で売上げ
数"３"が演算４の結果として記憶される。演算５を実行
するために、場所、曜日、売上げ数の列が参照され、場
所及び曜日が"Ｋｙｕｕｓｈｕｕ""Ｓｕｎ"で売上げ"３"
が演算５の結果として記憶される。

【００４６】次にプロセッサ・エレメント１は、図７の
第２行目のデータをディスク装置からメモリのワークス
ペースに読み出す。そして、演算１を実行するため、月
と売上げ数の列を参照する。ここで、読み出したデータ
の月のデータは、先に記憶した最初の演算１の結果の月
とは異なるため、新たに月は"Ａｕｇ"で売上げ"４"を演
算１の結果に追加する。次に、演算２を実行するため、
曜日と売上げ数の列を参照する。ここで、読み出したデ
ータの曜日のデータとこれまでの演算２の実行結果の曜
日のデータとは同じなので、演算２の結果の曜日"Ｓｕ
ｎ"の項目に売上げ"４"を足して"７"を記憶する。演算
３を実行するため、場所と売上げ数の列を参照する。こ
こで、読み出したデータの場所のデータは、先に記憶し
た、これまでの演算３の結果の場所とは異なるため、新
たに場所は"Ｈｏｋｋａｉｄｏ"で売上げ数"４"を演算３
の結果に追加する。演算４を実行するため、製品番号と
売上げ数の列を参照する。ここで読み出したデータの製
品番号のデータは先に記憶した、これまでの演算４の結
果の製品番号とは異なるので、新たに製品番号"１"で売
上げ"４"を演算４の結果に追加する。演算５を実行する
ため、場所及び曜日と売上げ数の列を参照する。ここで
読み出したデータの場所及び曜日は、先に記憶した、こ
れまでの演算５の結果の場所及び曜日とは異なるため、
新たに場所及び曜日が"Ｈｏｋｋａｉｄｏ""４"を演算５
の結果に追加する。

【００４７】次にプロセッサ・エレメント１は、図７の
第３行目のデータをディスク装置からメモリのワークス
ペースに読み出す。演算１を実行するため、月と売上げ
数の列を参照する。ここで、読み出したデータの月のデ
ータは、これまでの演算１の結果の月とは異なるため、
新たに月は"Ｊｕｎ"で売上げ"２"を演算１の結果に追加
する。演算２を実行するため、曜日と売上げ数の列を参
照する。ここで、読み出したデータの曜日はこれまでの
演算２の結果の曜日とは異なるため、新たに曜日は"Ｍ
ｏｎ"で売上げ数"２"を追加する。演算３を実行するた
めに、場所と売上げ数の列を参照する。読み出したデー
タの場所とこれまでの演算３の結果の場所とは一致する
ものがある。よって、場所"Ｈｏｋｋａｉｄｏ"で売上げ
数"４"の項目に売上げ数"２"を足して"６"を記憶する。
演算４を実行するために、製品番号と売上げ数の列を参
照する。読み出したデータの製品番号のデータと、これ
までの演算４の結果の製品番号とは一致するものがあ
る。よって、製品番号"１"で売上げ数"４"の項目に売上
げ数"２"を足して"６"を記憶する。演算５を実行するた
めに、場所及び曜日と売上げ数の列を参照する。ここ
で、読み出したデータの場所及び曜日のデータは、これ
までの演算５の結果の場所及び曜日とは異なるため、新
たに場所及び曜日"Ｈｏｋｋａｉｄｏ""Ｍｏｎ"で売上げ
数"２"を追加する。

【００４８】ここまでの処理で、プロセッサ・エレメン
ト１のメモリには図１１の結果が記憶される。このよう
な処理をプロセッサ・エレメント１のディスク装置に記
憶された図７のリレーションに対し繰り返すと、プロセ
ッサ・エレメント１のメモリには図１２のような結果が
記憶されることになる。

【００４９】プロセッサ・エレメント２、プロセッサ・
エレメント３、及びプロセッサ・エレメント４でも同様
の処理が実施され、ディスク装置に記憶された図８、図
９、及び図１０のリレーションに対する演算１乃至演算
５の結果は、それぞれ図１３、図１４、及び図１５に表
わされるようになる。

【００５０】そして、集計処理を実施すれば、集約演算
１乃至５の最終結果を得ることができる。本例では、各
プロセッサ・エレメントが集約演算１乃至５の一部のグ
ループについて集計するという集計方法を採用してい
る。すなわち、プロセッサ・エレメント１は、演算１の
月"Ｊａｎ"と"Ｆｅｂ"のグループ、演算２の曜日"Ｍｏ
ｎ"と"Ｔｕｅ"のグループ、演算３の場所"Ｈｏｋｋａｉ
ｄｏ"のグループ、演算４の製品番号"１"のグループ、
演算５の場所及び曜日のうち場所"Ｈｏｋｋａｉｄｏ"の
グループについて集計する。プロセッサ・エレメント２
は、演算１の月"Ｍａｒ"と"Ａｐｒ"のグループ、演算２
の曜日"Ｗｅｄ"と"Ｔｈｕ"のグループ、演算３の場所"
Ｋａｎｔｏ"のグループ、演算４の製品番号"２"のグル
ープ、演算５の場所及び曜日のうち場所"ｋａｎｔｏ"の
グループについて集計する。

【００５１】さらに、プロセッサ・エレメント３は、演
算１の月"Ｍａｙ"と"Ｊｕｎ"のグループ、演算２の曜
日"Ｆｒｉ"と"Ｓａｔ"のグループ、演算３の場所"Ｋａ
ｎｓａｉ"のグループ、演算４の製品番号"１"のグルー
プ、演算５の場所及び曜日のうち場所"Ｋａｎｓａｉ"の
グループについて集計する。プロセッサ・エレメント４
は、演算１の月"Ｊｕｌ"と"Ａｕｇ"のグループ、演算２
の曜日"Ｓｕｎ"のグループ、演算３の場所"Ｋｙｕｕｓ
ｈｕｕ"のグループ、演算５の場所及び曜日のうち場所"
Ｋｙｕｕｓｈｕｕ"のグループについて集計する。

【００５２】よって、各プロセッサ・エレメントは、自
己が保持しているグループのデータのうち、自己が集計
するグループのデータ以外のデータを集計担当ノードに
送信する必要がある。

【００５３】以上、プロセッサ・エレメント１が集計し
た結果を図１６、プロセッサ・エレメント２が集計した
結果を図１７、プロセッサ・エレメント３が集計した結
果を図１８、プロセッサ・エレメント４が集計した結果
を図１９に示す。

【００５４】２．ＢＣｍアルゴリズム（図２０）本アルゴリズムは、従来技術で説明したＢＣアルゴリズ
ムをベースとしたものであり、複数の集約演算を並列に
実行するように拡張したものであるため、ＢＣｍアルゴ
リズムと呼ぶことにする。本アルゴリズムも、複数の集
約演算を実行する際に、ディスク装置へのアクセスを最
小限にすることで高速化する。なお、全部でＰ個の集約
演算を実行することを前提とする。

【００５５】（１）まず、自らが実行するＱ個の集約演
算の演算結果を記憶するスペースを自己のメモリ領域に
確保する（ステップ３１０）。このＱ個は、２Ｐｍアル
ゴリズムで説明したＭ個と同様に、各プロセッサ・エレ
メントのメモリ領域に格納できる範囲で決められるが、
なるべくたくさんの集約演算を一度に実行する方がディ
スク装置へのアクセスを共有することになるので、処理
が高速になる。なお、Ｑ個の集約演算は、各プロセッサ
・エレメントで異なる集約演算を実行するようにしても
よいし、各プロセッサ・エレメントで同一にしておき、
集約演算の結果のグループを分けるということも可能で
ある。

【００５６】どの集約演算をどのプロセッサ・エレメン
トに割当てるかという処理の一例を図２１に示す。最初
に未実行の集約演算を１つ選択する（ステップ４１
０）。そして、プロセッサ・エレメントを１つ選択する
（ステップ４２０）。その後、選択されたプロセッサ・
エレメントのメモリに選択された集約演算の結果を記憶
するスペースがあるか検査する（ステップ４３０）。も
し、そのプロセッサ・エレメントのメモリにそのスペー
スがあるならば、そのプロセッサ・エレメントに選択さ
れた集約演算を割当てる（ステップ４４０）。一方、選
択されたプロセッサ・エレメントのメモリにその集約演
算の演算結果を格納するスペースがない場合には、他の
プロセッサ・エレメントのメモリについて検査する（ス
テップ４５０）。但し、ある集約演算についてすべての
プロセッサ・エレメントについて検査したにもかかわら
ず、その演算結果用のスペースが確保できなかった場合
には（ステップ４６０）、当該集約演算は別途処理する
（ステップ４７０）。別途処理というのは、図２０のス
テップ３５０で繰り返し処理を実行するようになってい
るので、後の繰り返し処理の時に実行するようにする
か、場合によっては、当該集約演算を幾つかのグループ
に分割して実行するように変更する等の処理を含む。

【００５７】そして、他の集約演算についてプロセッサ
・エレメントの割当てを決定するわけであるが、全ての
プロセッサ・エレメントのメモリに既に十分なスペース
がない場合は図２０のステップ３５０による繰り返し処
理の際に再度割当てを行うので、又、全ての未実行の集
約演算について割当て処理を実行してしまった場合（ス
テップ４８０）には、割当ての済んだ集約演算を実行す
るため、この処理は一旦終了する（ステップ４９０）。

【００５８】集約演算のプロセッサ・エレメントへの上
記の割当て処理は一例であって、他の方法によって割当
てすることもできる。ユーザが、意図的にある集約演算
を特定のプロセッサ・エレメントに割当てることができ
るようにすることも可能である。なお、先にも述べた
が、各プロセッサ・エレメントで同一集約演算を実行す
るが、各プロセッサ・エレメントで集約するグループを
変えることもできる。この場合には、同一種類の集約演
算であるがグループが異なるため別集約演算として図２
１のプロセスにてプロセッサ・エレメントを割当てるこ
ともできる。また、このような実行方法のために、別の
割当てアルゴリズムを用意することも可能である。

【００５９】図２１をより詳しくした擬似コードを以下
に示す。

【表４】 // 変数 N : number of node m_i : memory size for each node ( 1 ≦ i ≦ N ) q : query q_i : query ( 1 ≦ i ≦ Q ) QL : list of queires to be aggregated # 集約すべき演算のリスト tmpQL : list of queries # 次回以降実行する分 ML : list of queries # 今回実行する分 // 初期化 QL = { q_1, q_2, ..., q_i,... ,q_Q } # list of Q queries. while QL ≠ NIL 且つ tmpQL ≠ NIL do # NIL : 空リスト begin for i=0 to N do begin m_j = getMaxMemSize( j ) ; # 各ノードのメモリサイズを得る。 end tmpQL = NIL ; ML = NIL ; while QL ≠ NIL do # QL が空になるまで実行 begin q = pop( QL ); # pop() リストの先頭を取ってくる for j=1 to N do begin if ( m_j > |q| ) then # q のメモリが確保できるか調べる begin # |q| は演算 q が使用するメモリサイズ append( ML, q ) ; # ML に q を加える m_j = m_j - |q| ; # 残りのメモリサイズから |q| を引く break ; # for 文を抜ける end end if (q の割り当て先が見つからない) then begin append( tmpQL, q ) ; # 演算 q を未処理リストに加える end end # ML 中の query について集約演算を実行 # tmpQL は、次回以降に while ML ≠ NIL do # ML が NIL になるまで実行 begin q = pop( ML ) ; # MLから先頭の演算を取ってくる allocate ( q ) ; # 演算 q 用のメモリを確保 end BCm( ) ; # ML のリストにあった query について # BCmアルゴリズムを実行 copy( QL, tmpQL ) ; # QL に、tmpQL をコピー end

【００６０】（２）図２０に戻って、データベースの自
己の部分のうち、今回処理する分を読み出し、読み出し
たデータをネットワークを介してブロードキャストする
（ステップ３２０）。ブロードキャストであるから、同
じ内容のデータが全てのプロセッサ・エレメントに送信
される。この際、どのデータがどのプロセッサ・エレメ
ントで必要となるかは判断しなくともよい。先に述べた
Ｒｅｐアルゴリズム及び後に述べるＲｅｐｍアルゴリズ
ムにおいては、どのプロセッサがどのグループについて
集約を行っているか又はどのプロセッサがどの集約演算
のどのグループについて集約を行っているか判断して、
必要なプロセッサ・エレメントに送信するようになって
いるが、本アルゴリズムにおいては、全てのプロセッサ
・エレメントが同一集約演算を実行しているわけではな
いからである。全プロセッサ・エレメントで用いないよ
うなデータが存在することが予め分かっている場合に
は、そのデータの送信を省略できる。

【００６１】（３）そして、他のプロセッサ・エレメン
トからのデータと、自ら読み出したデータと、これまで
の演算結果（一番最初の場合には存在しない）に対し
て、Ｑ個の集約演算を実行する（ステップ３３０）。（４）この（２）（ステップ３２０）（３）（ステップ
３３０）の処理を、全てのデータベースのデータについ
てＱ個の集約演算を実行し終わるまで繰り返す（ステッ
プ３４０）。個々のプロセッサ・エレメント用のデータ
ベースの大きさにばらつきがある場合には、自己のデー
タベースを全て処理しても他のプロセッサ・エレメント
からデータが送信されてきたり、逆に他のプロセッサ・
エレメントからは送られてこないが自己のデータベース
を全て処理していないという場合も考えられる。この場
合、ステップ３３０は、自己のデータベース又は他プロ
セッサ・エレメントからの未処理のデータとそれまでの
演算結果とに対しＱ個の集約演算を実行する、というこ
とになる。

【００６２】（５）全てのデータベースのデータに対し
てＱ個の集約演算を実行した場合には、Ｐ個の集約演算
すべてについて実行が終了したか判断する（ステップ３
５０）。終了していない場合には、別の集約演算に対し
てステップ３１０以下を実行する。終了している場合に
は、全処理を終了する（ステップ３６０）。

【００６３】このＢＣｍアルゴリズムでは、ある集約演
算を実行するプロセッサ・エレメントが、全てのデータ
について演算を実行するが、ディスク装置へのアクセス
は、自己のディスク装置に対してのみなので、このディ
スク装置へのアクセスのコストは削減されている。ま
た、複数個の集約演算でこのディスク装置へのアクセス
を共有するので、全体としてコストは削減されている。

【００６４】以上の処理を図７，図８，図９，図１０を
用いて具体的に説明する。ここでは、プロセッサ・エレ
メント１が先に示した演算１を、プロセッサ・エレメン
ト２が演算２及び３を、プロセッサ・エレメント３が演
算４を、プロセッサ・エレメント４が演算５を実行する
ものとする。プロセッサ・エレメント２の動作を説明す
る。なお、１行ずつ読み出すような説明であるが、任意
の行数ずつ読み出すようにすることも可能である。

【００６５】プロセッサ・エレメント２は、図８の第１
行目をメモリのワークスペースに読み出す。そして、ネ
ットワークを介して全プロセッサ・エレメントに送信す
る。他のプロセッサ・エレメントも同様に読み出したデ
ータ（各データベースの第１行目）を全プロセッサ・エ
レメントに送信するので、プロセッサ・エレメント２の
メモリのワークスペースには、図７，図８，図９及び図
１０の第１行目が格納されている。そして、先に示した
演算２及び演算３を実行する。すなわち、曜日ごとに売
上げ数を合計する演算（演算２）と、場所ごとに売上げ
数を合計する演算（演算３）である。

【００６６】プロセッサ・エレメント２がワークスペー
スに存在するデータに対し演算２を実行すると、曜日"
Ｓａｔ"で売上げ数"７"、曜日"Ｗｅｄ"で売上げ数"１
５"、曜日"Ｓｕｎ"で売上げ数"３"が得られる。また、
演算３を実行すると、場所"Ｋｙｕｕｓｈｕｕ"で売上げ
数"１０"、場所"Ｋａｎｓａｉ"で売上げ数"６"、場所"
Ｈｏｋｋａｉｄｏ"で売上げ数"９"が得られる。

【００６７】この後、プロセッサ・エレメント２は、図
８の第２行目をメモリのワークスペースに読み出す。そ
して、ネットワークを介して全プロセッサ・エレメント
に送信する。他のプロセッサ・エレメントも同様に読み
出したデータ（各データベースの第２行目）を全プロセ
ッサ・エレメントに送信するので、プロセッサ・エレメ
ント２のメモリのワークスペースには、図７，図８，図
９及び図１０の第２行目が格納されるている。

【００６８】プロセッサ・エレメント２がワークスペー
スのデータ及びこれまでの演算結果に対して演算２を実
行すると、曜日"Ｓａｔ"で売上げ数"１６"、曜日"Ｗｅ
ｄ"で売上げ数"１５"、曜日"Ｓｕｎ"で売上げ数"７"、
曜日"Ｔｕｅ"で売上げ数"８"、曜日"Ｔｈｕ"で売上げ
数"１"が得られる。また、同様に演算３を実行すると、
場所"Ｋｙｕｕｓｈｕｕ"で売上げ数"１１"、場所"Ｋａ
ｎｓａｉ"で売上げ数"６"、場所"Ｈｏｋｋａｉｄｏ"で
売上げ数"２１"、場所"Ｋａｎｔｏ"で売上げ数"９"が得
られる。

【００６９】さらに、プロセッサ・エレメント２は、図
８の第３行目をメモリのワークスペースに読み出す。そ
して、ネットワークを介して全プロセッサ・エレメント
に送信する。他のプロセッサ・エレメントも同様に読み
出したデータ（各データベースの第３行目）を全プロセ
ッサ・エレメントに送信するので、プロセッサ・エレメ
ント２のメモリのワークスペースには、図７，図８，図
９及び図１０の第３行目が格納されるている。

【００７０】プロセッサ・エレメント２がワークスペー
スのデータ及びこれまでの演算結果に対して演算２を実
行すると、曜日"Ｓａｔ"で売上げ数"１６"、曜日"Ｗｅ
ｄ"で売上げ数"１５"、曜日"Ｓｕｎ"で売上げ数"１
５"、曜日"Ｔｕｅ"で売上げ数"８"、曜日"Ｔｈｕ"で売
上げ数"９"、曜日"Ｍｏｎ"で売上げ数"４"が得られる。
また、同様に演算３を実行すると、場所"Ｋｙｕｕｓｈ
ｕｕ"で売上げ数"１１"、場所"Ｋａｎｓａｉ"で売上げ
数"６"、場所"Ｈｏｋｋａｉｄｏ"で売上げ数"３１"、場
所"Ｋａｎｔｏ"で売上げ数"１９"が得られる。

【００７１】以上のような処理を繰り返し、図７，図
８，図９及び図１０の全てのデータに対して、プロセッ
サ・エレメント２が演算２及び演算３を実行すると、図
２２のようなデータが、プロセッサ・エレメント２のメ
モリに記憶されることになる。なお、プロセッサ・エレ
メント１、プロセッサ・エレメント３、プロセッサ・エ
レメント４の最終実行結果を図２３に示しておく。

【００７２】３．Ｒｅｐｍアルゴリズム（図２４）本アルゴリズムは、従来技術の欄で説明したＲｅｐアル
ゴリズムをベースとしたものであり、複数の集約演算を
並列に実施するように拡張したものであるため、Ｒｅｐ
ｍアルゴリズムと呼ぶことにする。複数の集約演算を実
施する際に、ディスク装置へのアクセスを最小限にする
ことで全体を高速化する。なお、全部でＳ個の集約演算
を実行するものとする。

【００７３】（１）最初に、Ｓ個の集約演算のうちどの
集約演算を実行するか決定する（ステップ５１０）。こ
こで実行される集約演算の個数をＴ個とする。以下の説
明では、同時に実行する集約演算は、各プロセッサにつ
いて同一にし、その代わりにグループの種類を変えるよ
うにする。但し、必ず各プロセッサで実行する集約演算
が同一である必要はない。また、このステップは、シス
テム全体で使用可能なメモリ容量を勘案して実施される
べきであるが、必ずしもメモリ容量のみにより制限する
必要はなく、ユーザがメモリ容量の限度において指定す
るようにしてもよい。以下に、本ステップの実施方法の
一例を擬似コードによって示す。

【００７４】

【表５】入力: 集約演算の個数: s 各集約演算の結果の大きさの見積もり: n(1), n(2), ... n(s) システム全体の主記憶の大きさ: M 出力: メモリに入る集約演算を区切って出力する．アルゴリズム: R = { 1, 2, ... s }; # 処理していない集約演算の集合 while R is not empty do m = M; # 残りのメモリサイズ Q = empty; # 結果が入る変数Qを空に初期化 while m >= 0 or R is empty do x = an element in R; # R から一つ要素を取り出して R = R - { x }; # R から取り除き， Q = Q + { x }; # Q に加える． m = m - n(x); # その要素が使用するメモリを引く． done; output(Q); # Qをメモリに入る集約演算のグループとして # 出力する． done.

【００７５】（２）次に、どの集約演算のどのグループ
をどのプロセッサが実行するか決定する（ステップ５２
０）。例えば、Ａという演算のグループとしてｂ，ｃ，
ｄ，ｅが存在するならば、そのｂ，ｃ，ｄ，ｅをそれぞ
れプロセッサ１，２，３，４に割り当て、Ｂという演算
のグループとしてｆ，ｇ，ｈ，ｉが存在するならば、そ
のｆ，ｇ，ｈ，ｉをそれぞれプロセッサ１，２，３，４
に割り当てる等の処理を実施する。なお、各集約演算に
どのようなグループが存在するかが予め分からないと本
ステップは実行できないが、小規模のサンプリングを実
行すれば、グループの種類を把握することができる。ま
た、どのようにグループを割り当てるかは、様々な方法
が考えられる。例えば、グループを入力とするハッシュ
関数を用意しておき、ハッシュ値の範囲によってプロセ
ッサを割り当てることも可能であるし、ユーザ指定によ
り行うことも可能である。

【００７６】以上のステップ５１０及び５２０は、シス
テム全体として実施する必要がある。よって、この処理
は、特定のプロセッサを１つ割り当てて実施することも
可能であるし、システムに制御用のプロセッサを設け、
そのプロセッサに実行させることも可能である。

【００７７】（３）そして、各プロセッサはデータベー
スの自己の部分から今回処理する分を読み出す（ステッ
プ５３０）。例えば、データベースの１タプルを読み出
すようにすることも、複数のタプルを読み出すようにす
ることも可能である。（４）各プロセッサは、読み出したデータのうち、実行
する集約演算に必要なデータを選択する（ステップ５４
０）。例えばデータベースの１タプルを読み出した場
合、集約演算によっては不必要な属性についてのデータ
も読み出していることになるので、システム全体として
不必要なデータについては破棄する。ここで、集約演算
はステップ５１０で決定されたＴ個の集約演算であるか
ら、このＴ個の集約演算に関係のないデータが破棄され
る。従来のＲｅｐアルゴリズムでは、１つの集約演算に
関係するデータのみ用いられていたので、Ｒｅｐｍアル
ゴリズムではディスク装置への１回のアクセスが従来の
Ｔ倍有効利用されていることが分かる。

【００７８】（５）次に、各プロセッサは、読み出した
データのうち他のプロセッサが集約すべきデータを、関
係する集約演算のＩＤと共に当該他のプロセッサにネッ
トワーク１を介して送信する（ステップ５５０）。実行
する集約演算によって必要とするデータの属性が決定さ
れ、その属性値によりグループが決定されるので、この
属性値を入力とするハッシュ関数を用意し、その出力値
により送信先のプロセッサが判別できるようにする。Ｔ
個の集約演算の各々について本処理を実施する。この
際、データを受信するプロセッサがどの集約演算につい
てのデータが送られてきたのが判別できるように集約演
算のＩＤを付して送信する。（６）各プロセッサは、そのプロセッサが集約すべき集
約演算のグループに関するデータについてＴ個の集約演
算を実行する（ステップ５６０）。この処理は、本ステ
ップを実施するまでの演算結果と、読み出したデータの
うち当該プロセッサが必要とするデータと、他のプロセ
ッサから送られてきたデータとについて実施される。

【００７９】（７）そして、各プロセッサが、集約すべ
き集約演算のグループに関する全てのデータについてＴ
個の集約演算を実行するまで、ステップ５３０乃至５６
０を繰り返す（ステップ５７０）。すなわち、自己が読
み出したデータ及び受信したデータが、全データベース
の必要な部分となるまで繰り返される。（８）もし、この処理が終了すると、Ｔ個の集約演算の
処理が終了したことになる。よって、次のＴ個（これま
でのＴとは異なる場合もある）の集約演算についてステ
ップ５１０以下を、全ての（Ｓ個の）集約演算について
の処理を実行するまで行う（ステップ５８０）。

【００８０】では、先に示した図７乃至図１０の例を用
いて実行例を説明する。この際、同時に実行される集約
演算は、先に示した演算１（月ごとの売上げ数を合計す
る演算）及び演算２（曜日ごとの売上げ数を合計する演
算）とする。プロセッサ・エレメントは４つである。そ
して、プロセッサ・エレメント１は、演算１のＪａｎ及
びＦｅｂのグループ、演算２のＭｏｎ及びＴｕｅのグル
ープを集約する。プロセッサ・エレメント２は、演算１
のＭａｒ及びＡｐｒのグループ、演算２のＷｅｄ及びＴ
ｈｕのグループを集約する。プロセッサ・エレメント３
は、演算１のＭａｙ及びＪｕｎのグループ、演算２のＦ
ｒｉ及びＳａｔのグループを集約する。プロセッサ・エ
レメント４は、演算１のＪｕｌ及びＡｕｇのグループ、
演算２のＳｕｎのグループを集約する。

【００８１】プロセッサ・エレメント３の処理を代表し
て説明する。図２５はプロセッサ・レメント３が図９に
示したプロセッサ・エレメント３用のデータベースの第
１行を読み出した状態を示す。この例では１行づつ読み
出すが、一度に読み出す行数は任意である。本例では、
日にち（ｄａｙ）の列、場所（ｌｏｃａｔｉｏｎ）の
列、店番号（ｓｈｏｐ＃）の列及び製品番号（ｐｒｏｄ
ｕｃｔ＃）の列は、演算１及び２に必要でないので破棄
される（ステップ５４０参照）。一方、月（ｍｏｎｔ
ｈ）の列と週（ｗｅｅｋ）の列と売上げ（ｓｏｌｄ）の
列は演算１及び２に必要である。そして、第１行目の
月"Ａｕｇ"及び売上げ"７"は、演算１のＩＤと共に集約
を担当するプロセッサ・エレメント４に送信される（ス
テップ５５０参照）。また、第１行目の週"Ｓａｔ"及び
売上げ"７"は、読み出したプロセッサ・エレメント３が
行う演算２の集約すべきグループであるから、自ら集約
を行う。ここでは最初のデータであるからそのまま記録
する。プロセッサ・エレメント１及び２及び４も同時
に、自己のデータベースの第１行目を読み出して処理を
行っているとすると、プロセッサ・エレメント３には何
も送られてこない。

【００８２】次に、プロセッサ・エレメント３が図９の
第２行目を読み出した状態（不要な部分を除く）を図２
６に示す。月"Ａｐｒ"及び売上げ"８"はプロセッサ・エ
レメント２に演算１のＩＤと共に送信される。また、
週"Ｔｕｅ"及び売上げ"８"はプロセッサ・エレメント１
に演算２のＩＤと共に送信される。プロセッサ・エレメ
ント１及び２及び４も同時に、自己のデータベースの第
２行目を読み出して処理を行っているとすると、プロセ
ッサ・エレメント４から"Ｓａｔ"及び"９"が演算２のＩ
Ｄと共に送信されてくるので、プロセッサ・エレメント
３は、第１行目の結果を参照して、"Ｓａｔ"及び"１６"
を得る。

【００８３】プロセッサ・エレメント３が図９の第３行
目を読み出した状態（不要な部分を除く）を図２７に示
す。月"Ｍａｙ"及び売上げ"８"は、プロセッサ・エレメ
ント３が集約すべき演算１のグループであるので、ここ
では"Ｍａｙ"及び"８"をそのまま記録する。週"Ｔｈｕ"
及び売上げ"８"は、プロセッサ・エレメント２に演算２
のＩＤと共に送信される。プロセッサ・エレメント１及
び２及び４も同時に、自己のデータベースの第３行目を
読み出して処理を行っているとすると、プロセッサ・エ
レメント１からは演算１のＩＤと共に"Ｊｕｎ"及び"
２"、プロセッサ・エレメント２からは演算１のＩＤと
共に"Ｍａｙ"及び"２"が送られてくるので、プロセッサ
・エレメント３はそれまでの結果を参照して、"Ｍａｙ"
及び"１０"、"Ｊｕｎ"及び"２"を格納する。なお、ここ
では、自らが読み出したデータと送信されてきたデータ
を別個に集約しているように説明しているが、これは説
明の都合上であって、区別なく集約することができる。

【００８４】プロセッサ・エレメント３が図９の第４行
目を読み出した状態（不要な部分を除く）を図２８に示
す。月"Ｍａｒ"及び売上げ"８"は、プロセッサ・エレメ
ント２が集約すべき演算１のグループであるので、プロ
セッサ・エレメント２に演算１のＩＤと共に送信する。
また、週"Ｆｒｉ"及び売上げ"８"は、プロセッサ・エレ
メント３が集約すべき演算２のグループであるので、こ
こではそのまま格納する。プロセッサ・エレメント１及
び２及び４も同時に、自己のデータベースの第４行目を
読み出して処理を行っているとすると、プロセッサ・エ
レメント１からは演算１のＩＤと共に"Ｍａｙ"及び"４"
と演算２のＩＤと共に"Ｆｒｉ"及び"４"が、プロセッサ
・エレメント２からは演算２のＩＤと共に"Ｆｒｉ"及
び"９"が、プロセッサ・エレメント４からは演算１のＩ
Ｄと共に"Ｊｕｎ"及び"３"と演算２のＩＤと共に"Ｓａ
ｔ"及び"３"が送られてくる。よって、プロセッサ・エ
レメント３は、これらのデータから、"Ｍａｙ"及び"１
４"と"Ｊｕｎ"及び"５"、"Ｆｒｉ"及び"２１"と"Ｓａ
ｔ"及び"１９"を計算する。

【００８５】以下これらの演算を繰り返すと、プロセッ
サ・エレメント３においては図１８の演算１及び演算２
の部分が得られる。同様にして、プロセッサ・エレメン
ト１においては図１６の演算１及び演算２の部分、プロ
セッサ・エレメント２においては図１７の演算１及び演
算２の部分、プロセッサ・エレメント４においては図１
９の演算１及び演算２の部分が計算されることとなる。
なお、図２９に演算１のＩＤが付されて各プロセッサ・
エレメントから他のプロセッサ・エレメントに送信され
るデータの宛先をまとめておく。逆に、演算１につい
て、各プロセッサ・エレメントに送られてくるデータの
送信元を図３０にまとめておく。さらに、図３１に演算
２のＩＤが付されて各プロセッサ・エレメントから他の
プロセッサ・エレメントに送信されるデータの宛先をま
とめておく。逆に、演算２について、各プロセッサ・エ
レメントに送られてくるデータの送信元を図３２にまと
めておく。

【００８６】これまで説明してきたアルゴリズムをまと
めてみる。２Ｐｍアルゴリズムは、各プロセッサ・エレ
メントが自己のディスク装置のデータに対して集約演算
を実行するため、集約演算の最終結果と同じサイズのメ
モリを各プロセッサ・エレメントがそれぞれ用意しなけ
ればならない。しかし、通信コストが少ない分、最終結
果が小さい場合には、他のアルゴリズムに比べて十分速
い。

【００８７】ＢＣｍアルゴリズムは、集約演算の最終結
果を全プロセッサ・エレメントのメモリで分担できるた
め２Ｐｍアルゴリズムが一度に処理できる集約演算のプ
ロセッサ数倍だけ多くの集約演算に対してディスク装置
へのアクセスを共有することができる。最終結果が１プ
ロセッサ・エレメントのメモリに入りきらない場合、２
Ｐｍアルゴリズムはメモリに入りきらない分を何度か繰
り返し処理を行う必要があるが、ＢＣｍアルゴリズムで
はメモリ内に収まるようにできるため、一度に処理する
ことができ、このような場合には２Ｐｍアルゴリズムよ
り高速に処理することができる。

【００８８】最終結果を格納するのに必要なメモリサイ
ズが非常に大きくなった場合、Ｒｅｐｍアルゴリズム以
外のアルゴリズムはディスク装置へのアクセスや集計の
コストが逆に大きくなるため、Ｒｅｐｍアルゴリズムが
有利になる場合もある。

【００８９】よって、常に最適なアルゴリズムは同一で
はないので、Ｒｅｐｍアルゴリズム、２Ｐｍアルゴリズ
ム及びＢＣｍアルゴリズムのうち最適なアルゴリズムを
選択し、そのアルゴリズムによって複数の集約演算を実
行することが好ましい。そこで、各アルゴリズムを実行
する際のコストを見積もることとする。以下、コストモ
デルについて説明する。

【００９０】最初に、生じ得る各コストを表６に掲げ
る。

【表６】なお、最も右側の列の値で、具体的数値が記載されてい
る部分は一例であって、他のコンピュータ・システムで
は他の値が用いられる。また、縦の線で囲まれた記号
は、その数を示し、縦の線がない記号はそのバイト数を
表す。

【００９１】幾つかの項目は説明を加えておく。ページ
・サイズＰは、コンピュータ・システムが取り扱うデー
タのサイズである。プロジェクティビティｐは、リレー
ションの列のうち用いる割合を示す。１の集約演算のセ
レクティビティは、グループ数をデータ数で除した値を
指す。また、同じ属性に注目する集約演算であっても属
性の取扱いが異なる場合、例えば回数をカウントする場
合もあれば合計を計算する場合、ある条件を満たす値の
み集約する場合等、もあるので、この異なる取扱いの数
をＡとする。データ・マイニングのような用途において
は、大きな値の場合が多いので表６では１００という値
にしている。

【００９２】以上の前提の下、各アルゴリズムのコスト
を示す。

【００９３】１．２Ｐｍアルゴリズム（ａ）データベースからの読み出しコスト（Ｒ_i／Ｐ）＊ＩＯ＊Ｔ（ｂ）必要なデータを選択するコスト｜Ｒ_i｜＊ｔ_r＊Ｔ（ｃ）集約演算するコスト｜Ｒ_i｜＊（ｔ_h＋ｔ_a＊Ａ）＊Ｑ（ｄ）最初のハッシングで処理できなかった分のコスト（Ｒ_i＊ｐ＊Ｑ−Ｍ／Ｓ_l＊Ｔ）／Ｐ＊２＊ＩＯ（ｅ）結果を格納する行を生成するコスト｜Ｇ_i｜＊ｔ_w＊Ｑ（ｆ）送信受信コストＧ_i／Ｐ＊ｔ_m＊Ｑ（ｇ）最終結果を計算するコスト｜Ｇ_i｜＊（ｔ_r＋ｔ_a＊Ａ）＊Ｑ（ｈ）結果を格納する行を生成するコスト（第２フェー
ズ分）｜Ｇ_i｜＊Ｓ_g＊ｔ_w＊Ｑ（ｉ）最初のハッシングで処理できなかった分のコスト
（第２フェーズ分）（Ｇ_i＊Ｑ−Ｍ／Ｓ_g＊Ｔ）／Ｐ＊２＊ＩＯ（ｊ）結果をディスクに格納するコストＧ_i＊Ｓ_g／Ｐ＊ＩＯ＊Ｑこれらのコストの合計が、２Ｐｍアルゴリズムのコスト
ということになる。

【００９４】２．ＢＣｍアルゴリズム（ａ）データベースからの読み出しコスト（Ｒ_i／Ｐ）＊ＩＯ＊Ｔ（ｂ）ブロードキャストのコスト（Ｒ_i／Ｐ）＊ｔ_b＊Ｔ（ｃ）通信バッファから行データを取り出すコスト｜Ｒ_p｜＊ｔ_r＊Ｔ（ｄ）集約演算コスト｜Ｒ｜＊（ｔ_h＋ｔ_a＊Ａ）＊Ｑ（ｅ）最初のハッシングで処理できなかった分のコスト（Ｒ_p＊ｐ＊Ｑ−Ｍ／Ｓ＊Ｔ）／Ｐ＊２＊ＩＯ（ｆ）結果を格納する行を生成するコスト｜Ｒ_p｜＊Ｓ＊ｔ_w＊Ｑ（ｈ）結果をディスク装置に格納するコストＲ_p＊Ｓ／Ｐ＊ｐ＊ＩＯ＊Ｑ以上を合計すると、ＢＣｍアルゴリズムのコストが計算
できる。

【００９５】３．Ｒｅｐｍアルゴリズム（ａ）データベースからの読み出しコスト（Ｒ_i／Ｐ）＊ＩＯ＊Ｔ（ｂ）必要なデータを選択するためのコスト｜Ｒ_i｜＊ｔ_r＊Ｔ（ｃ）宛先を探すためにハッシングし、通信バッファに
書き込むためのコスト｜Ｒ_i｜＊（ｔ_h＋ｔ_w）＊Ｑ（ｄ）リパーティションしたものを送信／受信するコス
トＲ_p／Ｐ＊ｐ＊ｔ_m＊Ｑ（ｅ）集約演算コスト｜Ｒ_p｜＊（ｔ_r＋ｔ_a＊Ａ）＊Ｑ（ｆ）最初のハッシングで処理できなかった分のコスト（Ｒ_p＊ｐ＊Ｑ−Ｍ／Ｓ＊Ｔ）／Ｐ＊２＊ＩＯ（ｇ）結果を格納する行を生成するコスト｜Ｒ_p｜＊Ｓ＊ｔ_w＊Ｑ（ｈ）結果をディスク装置に格納するコストＲ_p＊Ｓ／Ｐ＊ｐ＊ＩＯ＊Ｑ以上を合計することにより、Ｒｅｐｍアルゴリズムに必
要なコストを計算することができる。

【００９６】このように各アルゴリズムの実行に必要な
コストを計算することができる。これを用いて、以下の
ような処理（図３３）にて実行すべきアルゴリズムを決
定する。最初に、ハードウエアに関するパラメータを入
力する（ステップ５１０）。このハードウエアに関する
パラメータは、表６のプロセッサ・エレメントの数、ハ
ッシュ・テーブルのサイズ、ページ読み出しの時間、行
読み出しの時間、行書き込みの時間、ハッシュ計算の時
間、ページ送信の時間、集約演算の時間、ページブロー
ドキャストの時間等、ハードウエア構成から決定するパ
ラメータである。これらのパラメータは、一度コンピュ
ータの構成が決まると変わらないものが多いが、計算に
よってはプロセッサ・エレメントの数を変更したり、ハ
ッシュ・テーブルのサイズも変更可能である。次に実行
する集約演算に関するパラメータを入力する（ステップ
５２０）。表６の項目のうちハードウエアのパラメータ
としてもの以外は、ほぼ集約演算に関するパラメータで
ある。結果の行数等は集約演算のみでは決定しないが、
サンプリングを行いグループ数等を見積もることで数値
を得ることができる。このような事項は、従来から行わ
れてきたことである（例えば、P.J.Haas, J.F.Naughto
n, S.Seshadri, and L.Stockes, "Sampling-based esti
mation of the number of distinct values of an attr
ibute," In Proceedings of the 21st VLDB Conferenc
e, pages 311-322, 1995などを参照のこと）。

【００９７】このように表６に記されたパラメータが入
力されると、先に示したコストモデルにて各アルゴリズ
ムのコストを計算することができる（ステップ５３
０）。その後、その３つのアルゴリズムのうち最小コス
トのアルゴリズムを決定する（ステップ５４０）。これ
により、決定されたアルゴリズムにて集約演算を実行す
れば、３つのアルゴリズムのうち最も高速に演算を実行
することができる。

【００９８】以上、本発明を実施するために必要とされ
るコンピュータ・システム及びプログラムに処理フロー
について説明した。プログラムの処理フローの各ステッ
プを実行するような回路や、プログラムと回路の組み合
わせによって、各ステップを実現する手段を形成するこ
とも可能である。各ステップを実現する手段は、各プロ
セッサ・エレメントの代わりに設け、高速のネットワー
クで並列処理する。繰り返しを制御するような制御回路
を設けること、装置全体を管理するような管理手段を設
けることも考えられる。

【００９９】また、以上の処理フローを実現するための
プログラムは、フロッピー・ディスク、ＣＤ−ＲＯＭや
ＭＯ（Magneto-Optics）ディスク等の記憶媒体上に実現
され、流通することが考えられる。さらに、記憶媒体の
みならず、有線や無線の通信媒体上で流通する場合もあ
る。このような場合、上述した処理フローの各ステップ
のうち、幾つかのステップのためプログラムは、記憶媒
体、通信媒体にて流通するプログラムとは別途ユーザに
提供される場合も考えられる。

【０１００】

【実施例】図３４は、１６ノードのハイパフォーマンス
・スイッチを伴うＩＢＭＳＰ２を用いた場合に、どの
アルゴリズムを用いるとよいかを示すものである。この
システムの場合、領域ａは２Ｐｍアルゴリズムが最適
で、領域ｂはＢＣｍアルゴリズムが最適で、領域ｃはＲ
ｅｐｍアルゴリズムが最適である。演算数と１演算当た
りのグループ数が分かれば、最適なアルゴリズムを選択
することができる。なお、このような図を作成して最適
アルゴリズムを選択する訳ではなく、先に示したコスト
モデルで各アルゴリズムのコストを計算し、そのコスト
との対比にて最適アルゴリズムを選択する。

【０１０１】

【効果】複数の集約演算を並列に高速実行する方法を提
供することができた。

【０１０２】上記の方法を用いると複数の集約演算を並
列に高速実行できるので、ＯＬＡＰやデータ・マイニン
グの実行を高速にすることもできる。

【０１０３】さらに、複数の集約演算を実行する方法
を、ハードウエアの条件や複数の集約演算の性質等に基
づき、切り換えることができるようにし、様々な条件の
下、複数の集約演算を常に同じ方法で実行するよりも、
より高速に実行することができた。

【図面の簡単な説明】

【図１】Ｒｅｐアルゴリズムの処理フローを示した図で
ある。

【図２】２Ｐアルゴリズム、Ｒｅｐアルゴリズム、及び
ＢＣアルゴリズムにおける、グループ数対応答時間の関
係を示した図である。

【図３】本発明で用いられるコンピュータ・システムの
構成の一例である。

【図４】本発明で用いられるコンピュータ・システムの
構成の一例である。

【図５】本発明で用いられるコンピュータ・システムの
構成の一例である。

【図６】２Ｐｍアルゴリズムの処理フローを示した図で
ある。

【図７】プロセッサ・エレメント１のデータベースの内
容を表す図である。

【図８】プロセッサ・エレメント２のデータベースの内
容を表す図である。

【図９】プロセッサ・エレメント３のデータベースの内
容を表す図である。

【図１０】プロセッサ・エレメント４のデータベースの
内容を表す図である。

【図１１】２Ｐｍアルゴリズムの２番目のステップを図
７に対して実行中のプロセッサ・エレメント１のメモリ
内の途中結果を示す図である。

【図１２】２Ｐｍアルゴリズムの２番目のステップを図
７に対して実行したプロセッサ・エレメント１のメモリ
内の結果を示す図である。

【図１３】２Ｐｍアルゴリズムの２番目のステップを図
８に対して実行したプロセッサ・エレメント２のメモリ
内の結果を示す図である。

【図１４】２Ｐｍアルゴリズムの２番目のステップを図
９に対して実行したプロセッサ・エレメント３のメモリ
内の結果を示す図である。

【図１５】２Ｐｍアルゴリズムの２番目のステップを図
１０に対して実行したプロセッサ・エレメント４のメモ
リ内の結果を示す図である。

【図１６】２Ｐｍアルゴリズムの集計処理を実行したプ
ロセッサ・エレメント１のメモリ内の結果を示す図であ
る。

【図１７】２Ｐｍアルゴリズムの集計処理を実行したプ
ロセッサ・エレメント２のメモリ内の結果を示す図であ
る。

【図１８】２Ｐｍアルゴリズムの集計処理を実行したプ
ロセッサ・エレメント３のメモリ内の結果を示す図であ
る。

【図１９】２Ｐｍアルゴリズムの集計処理を実行したプ
ロセッサ・エレメント４のメモリ内の結果を示す図であ
る。

【図２０】ＢＣｍアルゴリズムの処理フローを示した図
である。

【図２１】ＢＣｍアルゴリズムでどのプロセッサ・エレ
メントがどの集約演算を実行するのかを決定するための
処理フローを示す図である。

【図２２】図７乃至図１０に対し、ＢＣｍアルゴリズム
を実行したプロセッサ・エレメント２のメモリ内の結果
を示す図である。

【図２３】ＢＣｍアルゴリズムを実行したプロセッサ・
エレメント１，３乃至４のメモリ内の結果を示す図であ
る。

【図２４】Ｒｅｐｍアルゴリズムの処理フローを示した
図である。

【図２５】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行するプロセッサ・エレメント３の処理の途中の状況
を説明するための図である。

【図２６】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行するプロセッサ・エレメント３の処理の途中の状況
を説明するための図である。

【図２７】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行するプロセッサ・エレメント３の処理の途中の状況
を説明するための図である。

【図２８】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行するプロセッサ・エレメント３の処理の途中の状況
を説明するための図である。

【図２９】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行する際に各プロセッサ・エレメントにおいて送信さ
れる、演算１関連のデータ及びその送信先を表す図であ
る。

【図３０】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行する際に各プロセッサ・エレメントにおいて受信さ
れる、演算１関連のデータ及びその送信元を表す図であ
る。

【図３１】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行する際に各プロセッサ・エレメントにおいて送信さ
れる、演算２関連のデータ及びその送信先を表す図であ
る。

【図３２】Ｒｅｐｍアルゴリズムで演算１及び演算２を
実行する際に各プロセッサ・エレメントにおいて受信さ
れる、演算２関連のデータ及びその送信元を表す図であ
る。

【図３３】２Ｐｍ，ＢＣｍ，Ｒｅｐｍアルゴリズムのう
ち、最適なアルゴリズムを選択するための処理フローを
示す図である。

【図３４】１６ノードのＩＢＭＳＰ２で集約演算を実
行する際のアルゴリズム切り換え位置を示す図である。

【符号の説明】

１ネットワーク３ａ，３ｂ，３ｃプロセッサ・エレメント５ａ，５ｂ，５ｃメモリ７ａ，７ｂ，７ｃディスク装置９メモリ９ａ，９ｂメモリ領域１０メモリ１１ディスク装置１１ａ，１１ｂディスク領域１３ディスク装置

───────────────────────────────────────────────────── フロントページの続き (56)参考文献ＡｍｂｕｊＳ，ＪｅｆｆｒｅｙＦ．Ｎ，”ＡｄａｐｔｉｖｅＰａｒａｌｌｅｌＡｇｇｒｅｇａｔｉｏｎＡｌｇｏｒｉｔｈｍｓ，”ＩｎＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＡＣＭＳＩＧＭＯＤＣｏｎｆｅｒｅｎｃｅｏｎＭａｎａｇｅｍｅｎｔｏｆＤａｔａ，1995年５月，ｐ．104−114 ＤｉｎａＢ，ＨａｒａｎＢ，ＤａｖｉｄＪ．Ｄ，Ｗ．ＫｅｖｉｎＷ，”ＰａｒａｌｌｅｌＡｌｇｏｒｉｔｈｍｓｆｏｒｔｈｅＥｘｅｃｕｔｉｏｎｏｆＲｅｌａｔｉｏｎａｌＤａｔａｂａｓｅＯｐｅｒａｔｉｏｎｓ，”ＡＣＭＴｒａｎｓａｃｔｉｏｎｓｏｎＤａｔａｂａｓｅＳｙｓｔｅｍｓ，Ｖｏｌ．８，Ｎｏ．３，1983 年９月，ｐ．324−353 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/30 G06F 17/18 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】ネットワークにより接続された複数のプロ
セッサが各々自己のメモリ領域及び１又は複数のグルー
プに分けることができるデータを含むデータベースの自
己の部分を使用できるよう構成されたコンピュータ・シ
ステムにおいて、前記グループ毎に集約を行う演算を含
む、Ｎ個の集約演算を前記データベースに対し実行する
方法であって、（ａ）各前記プロセッサが、前記自己のメモリ領域に、
前記Ｎ個の集約演算のうちＭ個（Ｍは２以上かつＮ以下
の整数）分の演算結果を記憶するスペースを確保するス
テップと、（ｂ）各前記プロセッサが、Ｍ個の集約演算をまとめ
て、前記データベースの自己の部分に対して実行するス
テップと、（ｃ）各前記プロセッサが、前記Ｍ個の集約演算の各プ
ロセッサにおける演算結果を、集計すべきプロセッサに
送信し、前記集計すべきプロセッサが最終結果を計算す
るステップと、（ｄ）前記Ｎ個の集約演算の実行が終了するまで、前記
ステップ（ａ）乃至（ｃ）を繰り返すステップとを含む
集約演算実行方法。
【請求項２】前記ステップ（ｂ）が、（b1）各前記プロセッサが、前記自己のメモリ領域のワ
ークスペースに、前記データベースの自己の部分である
部分データベースの一部を読み出すステップと、（b2）各前記プロセッサが、前記自己のメモリ領域に格
納された本ステップ以前の演算結果と読み出された前記
部分データベースの一部とについて、前記Ｍ個の集約演
算を実行するステップと、（b3）前記部分データベースのすべてに対して前記Ｍ個
の集約演算が実行されるまで、前記ステップ(b1)及び(b
2)を繰り返すステップとを含む請求項１記載の集約演算
実行方法。
【請求項３】前記Ｍは集約演算の演算結果のために前記
自己のメモリ領域に確保できるスペースから決定される
ことを特徴とする請求項１記載の集約演算実行方法。
【請求項４】ネットワークにより接続された複数のプロ
セッサが各々自己のメモリ領域及び１又は複数のグルー
プに分けることができるデータを含むデータベースの自
己の部分を使用できるよう構成されたコンピュータ・シ
ステムにおいて、前記グループ毎に集約を行う演算を含
む、Ｐ個の集約演算を前記データベースに対し実行する
方法であって、（ａ）各前記プロセッサが、前記Ｐ個の集約演算のうち
自らが実行するＱ個（Ｑは２以上の整数）の集約演算の
演算結果を記憶するスペースを、前記自己のメモリ領域
に確保するステップと、（ｂ）各前記プロセッサが、前記自己のメモリ領域に前
記データベースの自己の部分である部分データベースの
一部を読み出し、読み出された前記部分データベースの
一部を前記ネットワークを介してブロードキャストする
ことを繰り返して、各前記プロセッサが全ての前記デー
タベースのデータに対し前記自らが実行するＱ個の集約
演算を実行するステップと、（ｃ）前記Ｐ個の集約演算が実行されるまで、前記ステ
ップ（ａ）及び（ｂ）を繰り返すステップとを含む集約
演算実行方法。
【請求項５】前記ステップ（ａ）が、（a1）１つの集約演算の演算結果を格納できるようなス
ペースが１つのプロセッサの前記自己のメモリ領域に存
在するか検査するステップと、（a2）前記スペースが存在する場合には、前記スペース
を前記１つの集約演算の演算結果のために確保するステ
ップと、（a3）前記スペースが存在しない場合には、他のプロセ
ッサの前記メモリ領域に前記１つの集約演算の演算結果
を格納できるようなスペースが存在するか検査するステ
ップと、（a4）前記他のプロセッサの前記メモリ領域にスペース
が存在する場合には、当該他のプロセッサのメモリ領域
のスペースを前記１つの集約演算の演算結果のために確
保するステップとを含み、前記他のプロセッサのメモリ領域にスペースが存在しな
い場合には、後の繰り返し処理にて前記１つの集約演算
を実行することを特徴とする請求項４記載の集約演算実
行方法。
【請求項６】前記Ｑは集約演算の演算結果のために前記
自己のメモリ領域に確保できるスペースから決定される
ことを特徴とする請求項４記載の集約演算実行方法。
【請求項７】前記ステップ（ｂ）が、（b1）各前記プロセッサが、前記自己のメモリ領域のワ
ークスペースに、前記部分データベースの一部を読み出
すステップと、（b2）読み出された前記部分データベースの一部を前記
ネットワークを介してブロードキャストするステップ
と、（b3）前記自己のメモリ領域に格納された本ステップ以
前の演算結果と前記読み出された部分データベースの一
部と他のプロセッサから送られてきたデータとについ
て、前記自らが実行するＱ個の集約演算を実行するステ
ップと、（b4）各前記プロセッサが全ての前記データベースの内
容に対し前記自らが実行するＱ個の集約演算を実行する
まで前記ステップ（b1）乃至（b3）を繰り返すステップ
とを含む請求項４記載の集約演算実行方法。
【請求項８】ネットワークにより接続された複数のプロ
セッサが各々自己のメモリ領域及び１又は複数のグルー
プに分けることができるデータを含むデータベースの自
己の部分を使用できるよう構成されたコンピュータ・シ
ステムにおいて、前記グループ毎に集約を行う演算を含
む、Ｓ個の集約演算を前記データベースに対し実行する
方法であって、（ａ）前記Ｓ個の集約演算のうち実行するＴ個（Ｔは２
以上の整数）の集約演算を決定するステップと、（ｂ）前記Ｔ個の集約演算を実行する際に集約される、
各集約演算の各グループを取り扱うプロセッサを決定す
るステップと、（ｃ）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域に読み出し、読み出されたデータのうち他のプロセ
ッサが集約すべき集約演算のグループに関するデータを
当該集約演算のＩＤと共に前記他のプロセッサに前記ネ
ットワークを介して送信し、自己が集約すべき集約演算
のグループに関するデータについて前記Ｔ個の集約演算
を実行するステップと、（ｄ）各前記プロセッサが集約すべき集約演算のグルー
プに関する全てのデータに対して前記Ｔ個の集約演算を
実行するまで、前記ステップ（ｃ）を実行するステップ
と、（ｅ）前記Ｓ個の集約演算を実行するまで、前記ステッ
プ（ａ）乃至（ｄ）を繰り返すステップとを含む集約演
算実行方法。
【請求項９】前記ステップ（ｃ）が、（c1）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域のワークスペースに読み出すステップと、（c2）各前記プロセッサが、読み出されたデータの各部
分を必要とするプロセッサを求め、当該部分を、関連す
る集約演算のＩＤと共に前記必要とするプロセッサに前
記ネットワークを介して送信するステップと、（c3）各前記プロセッサが、前記読み出されたデータの
うち自己が集約すべき集約演算のグループに関するデー
タ及び前記他のプロセッサからのデータ及び前記自己の
メモリ領域に格納された本ステップ以前の演算結果に対
し、前記Ｔ個の集約演算を実行するステップと、を含む請求項８記載の集約演算実行方法。
【請求項１０】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムにおいて、前記グループ毎に集約を行う演算を
含む、Ｎ個の集約演算を前記データベースに対し実行す
る方法であって、前記プロセッサの数と前記データベースの大きさと前記
ネットワークの通信速度とを含む前記コンピュータ・シ
ステムのパラメータ及び実行する集約演算の数と各集約
演算の結果を格納するメモリの量とを含む集約演算の性
質に関するパラメータから、（ａ）各前記プロセッサが、前記自己のメモリ領域に、
前記Ｎ個の集約演算のうちＭ個（Ｍは２以上かつＮ以下
の整数）分の演算結果を記憶するスペースを確保するス
テップと、（ｂ）各前記プロセッサが、Ｍ個の集約演算をまとめ
て、前記データベースの自己の部分に対して実行するス
テップと、（ｃ）各前記プロセッサが、前記Ｍ個の集約演算の各プ
ロセッサにおける演算結果を、集計すべきプロセッサに
送信し、前記集計すべきプロセッサが最終結果を計算す
るステップと、（ｄ）前記Ｎ個の集約演算の実行が終了するまで、前記
ステップ（ａ）乃至（ｃ）を繰り返すステップとを含む
第１集約演算実行方法と、（ｅ）各前記プロセッサが、前記Ｎ個の集約演算のうち
自らが実行するＱ個（Ｑは２以上の整数）の集約演算の
演算結果を記憶するスペースを、前記自己のメモリ領域
に確保するステップと、（ｆ）各前記プロセッサが、前記自己のメモリ領域に前
記データベースの自己の部分である部分データベースの
一部を読み出し、読み出された前記部分データベースの
一部を前記ネットワークを介してブロードキャストする
ことを繰り返して、各前記プロセッサが全ての前記デー
タベースのデータに対し前記自らが実行するＱ個の集約
演算を実行するステップと、（ｇ）前記Ｎ個の集約演算が実行されるまで、前記ステ
ップ（ｅ）及び（ｆ）を繰り返すステップとを含む第２
集約演算実行方法と、（ｈ）前記Ｎ個の集約演算のうち実行するＴ個（Ｔは２
以上の整数）の集約演算を決定するステップと、（ｉ）前記Ｔ個の集約演算を実行する際に集約される、
各集約演算の各グループを取り扱うプロセッサを決定す
るステップと、（ｊ）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域に読み出し、読み出されたデータのうち他のプロセ
ッサが集約すべき集約演算のグループに関するデータを
当該集約演算のＩＤと共に前記他のプロセッサに前記ネ
ットワークを介して送信し、自己が集約すべき集約演算
のグループに関するデータについて前記Ｔ個の集約演算
を実行するステップと、（ｋ）各前記プロセッサが集約すべき集約演算のグルー
プに関する全てのデータに前記Ｔ個の集約演算を実行す
るまで、前記ステップ（ｊ）を実行するステップと、（ｌ）前記Ｎ個の集約演算を実行するまで、前記ステッ
プ（ｈ）乃至（ｋ）を繰り返すステップとを含む第３集
約演算実行方法とを含む複数の集約演算実行方法のうち
いずれの方法が最も高速に実行できるかを決定するステ
ップと、決定された方法にて、前記Ｎ個の集約演算を実行するス
テップとを含む集約演算実行方法。
【請求項１１】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムであって、前記グループ毎に集約を行う演算を含む、Ｎ個の集約演
算を前記データベースに対し実行するために、前記複数
のプロセッサの各々は、（ａ）前記自己のメモリ領域に、前記Ｎ個の集約演算の
うちＭ個（Ｍは２以上かつＮ以下の整数）分の演算結果
を記憶するスペースを確保するメモリ処理装置と、（ｂ）Ｍ個の集約演算をまとめて、前記データベースの
自己の部分に対して実行するデータベース処理装置と、（ｃ）前記Ｍ個の集約演算の演算結果を、集計すべきプ
ロセッサに送信する送信機と、を有し、前記Ｎ個の集約演算の実行が終了するまで処理
を繰り返し、前記集計すべきプロセッサは自己が集計す
べき集約演算の演算結果を他のプロセッサから受信し、
集計することを特徴とするコンピュータ・システム。
【請求項１２】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムであって、前記グループ毎に集約を行う演算を含む、Ｐ個の集約演
算を前記データベースに対し実行するために、前記複数
のプロセッサの各々は、（ａ）前記Ｐ個の集約演算のうち自らが実行するＱ個
（Ｑは２以上の整数）の集約演算の演算結果を記憶する
スペースを、前記自己のメモリ領域に確保するメモリ処
理装置と、（ｂ）前記自己のメモリ領域のワークスペースに前記デ
ータベースの自己の部分である部分データベースの一部
を読み出し、読み出された前記部分データベースの一部
を前記ネットワークを介してブロードキャストすること
を繰り返して、各前記プロセッサが全ての前記データベ
ースのデータに対し前記自らが実行するＱ個の集約演算
を実行するデータベース処理装置と、を有し、前記Ｐ個の集約演算が実行されるまで処理を繰
り返すことを特徴とするコンピュータ・システム。
【請求項１３】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムであって、前記グループ毎に集約を行う演算を含む、Ｓ個の集約演
算を前記データベースに対し実行するために、前記Ｓ個の集約演算のうち実行するＴ個（Ｔは２以上の
整数）の集約演算を決定し、当該Ｔ個の集約演算を実行
する際に集約される、各集約演算の各グループを取り扱
うプロセッサを決定するコントローラを含み、各前記プロセッサは、前記データベースの自己の部分である部分データベース
の一部を読み出し、読み出されたデータのうち他のプロ
セッサが集約すべき集約演算のグループに関するデータ
を当該集約演算のＩＤと共に前記他のプロセッサに前記
ネットワークを介して送信し、自己が集約すべき集約演
算のグループに関するデータについて前記Ｔ個の集約演
算を実行するデータベース処理装置を有し、各前記プロセッサが集約すべき集約演算のグループに関
する全てのデータに前記Ｔ個の集約演算を実行するまで
前記データベース処理装置を動作させ、前記Ｓ個の集約演算を実行するまで、前記コントローラ
及び各前記プロセッサを動作させることを特徴とするコ
ンピュータ・システム。
【請求項１４】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムであって、前記グループ毎に集約を行う演算を含む、Ｎ個の集約演
算を前記データベースに対し実行するために、前記プロセッサの数と前記データベースの大きさと前記
ネットワークの通信速度とを含む前記コンピュータ・シ
ステムのパラメータ及び実行する集約演算の数と各集約
演算の結果を格納するメモリの量とを含む集約演算の性
質に関するパラメータから、（ａ）各前記プロセッサが、前記自己のメモリ領域に、
前記Ｎ個の集約演算のうちＭ個（Ｍは２以上かつＮ以下
の整数）分の演算結果を記憶するスペースを確保するス
テップと、（ｂ）各前記プロセッサが、Ｍ個の集約演算をまとめ
て、前記データベースの自己の部分に対して実行するス
テップと、（ｃ）各前記プロセッサが、前記Ｍ個の集約演算の各プ
ロセッサにおける演算結果を、集計すべきプロセッサに
送信し、前記集計すべきプロセッサが最終結果を計算す
るステップと、（ｄ）前記Ｎ個の集約演算の実行が終了するまで、前記
ステップ（ａ）乃至（ｃ）を繰り返すステップとを含む
第１集約演算実行方法と、（ｅ）各前記プロセッサが、前記Ｎ個の集約演算のうち
自らが実行するＱ個（Ｑは２以上の整数）の集約演算の
演算結果を記憶するスペースを、前記自己のメモリ領域
に確保するステップと、（ｆ）各前記プロセッサが、前記自己のメモリ領域に前
記データベースの自己の部分である部分データベースの
一部を読み出し、読み出された前記部分データベースの
一部を前記ネットワークを介してブロードキャストする
ことを繰り返して、各前記プロセッサが全ての前記デー
タベースのデータに対し前記自らが実行するＱ個の集約
演算を実行するステップと、（ｇ）前記Ｎ個の集約演算が実行されるまで、前記ステ
ップ（ｅ）及び（ｆ）を繰り返すステップとを含む第２
集約演算実行方法と、（ｈ）前記Ｎ個の集約演算のうち実行するＴ個（Ｔは２
以上の整数）の集約演算を決定するステップと、（ｉ）前記Ｔ個の集約演算を実行する際に集約される、
各集約演算の各グループを取り扱うプロセッサを決定す
るステップと、（ｊ）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域に読み出し、読み出されたデータのうち他のプロセ
ッサが集約すべき集約演算のグループに関するデータを
当該集約演算のＩＤと共に前記他のプロセッサに前記ネ
ットワークを介して送信し、自己が集約すべき集約演算
のグループに関するデータについて前記Ｔ個の集約演算
を実行するステップと、（ｋ）各前記プロセッサが集約すべき集約演算のグルー
プに関する全てのデータに前記Ｔ個の集約演算を実行す
るまで、前記ステップ（ｊ）を実行するステップと、（ｌ）前記Ｎ個の集約演算を実行するまで、前記ステッ
プ（ｈ）乃至（ｋ）を繰り返すステップとを含む第３集
約演算実行方法とを含む複数の集約演算実行方法のうち
いずれの方法が最も高速に実行できるかを決定するセレ
クタと、決定された方法にて、前記Ｎ個の集約演算を実行するよ
う命ずる手段とを有するコンピュータ・システム。
【請求項１５】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムに、前記グループ毎に集約を行う演算を含む、
Ｎ個の集約演算を前記データベースに対し実行させるプ
ログラムを格納した記憶媒体であって、前記プログラムは、（ａ）各前記プロセッサが、前記自己のメモリ領域に、
前記Ｎ個の集約演算のうちＭ個（Ｍは２以上かつＮ以下
の整数）分の演算結果を記憶するスペースを確保するス
テップと、（ｂ）各前記プロセッサが、Ｍ個の集約演算を同時に、
前記データベースの自己の部分に対して実行するステッ
プと、（ｃ）各前記プロセッサが、前記Ｍ個の集約演算の各プ
ロセッサにおける演算結果を、集計すべきプロセッサに
送信し、前記集計すべきプロセッサが最終結果を計算す
るステップと、（ｄ）前記Ｎ個の集約演算が終了するまで、前記ステッ
プ（ａ）乃至（ｃ）を繰り返すステップとを前記コンピ
ュータ・システムに実行させる、記憶媒体。
【請求項１６】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムに、前記グループ毎に集約を行う演算を含む、
Ｐ個の集約演算を前記データベースに対し実行させるプ
ログラムを記憶した記憶媒体であって、前記プログラムは、（ａ）各前記プロセッサが、前記Ｐ個の集約演算のうち
自らが実行するＱ個（Ｑは２以上の整数）の集約演算の
演算結果を記憶するスペースを、前記自己のメモリ領域
に確保するステップと、（ｂ）各前記プロセッサが、前記自己のメモリ領域のワ
ークスペースに前記データベースの自己の部分である部
分データベースの一部を読み出し、読み出された前記部
分データベースの一部を前記ネットワークを介してブロ
ードキャストすることを繰り返して、各前記プロセッサ
が全ての前記データベースのデータに対し前記自らが実
行するＱ個の集約演算を実行するステップと、（ｃ）前記Ｐ個の集約演算が実行されるまで、前記ステ
ップ（ａ）及び（ｂ）を繰り返すステップとを前記コン
ピュータ・システムに実行させる、記憶媒体。
【請求項１７】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムに、前記グループ毎に集約を行う演算を含む、
Ｓ個の集約演算を前記データベースに対し実行させるプ
ログラムを格納した記憶媒体であって、前記プログラムは、（ａ）前記Ｓ個の集約演算のうち実行するＴ個（Ｔは２
以上の整数）の集約演算を決定するステップと、（ｂ）前記Ｔ個の集約演算を実行する際に集約される、
各集約演算の各グループを取り扱うプロセッサを決定す
るステップと、（ｃ）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域に読み出し、読み出されたデータのうち他のプロセ
ッサが集約すべき集約演算のグループに関するデータを
当該集約演算のＩＤと共に前記他のプロセッサに前記ネ
ットワークを介して送信し、自己が集約すべき集約演算
のグループに関するデータについて前記Ｔ個の集約演算
を実行するステップと、（ｄ）各前記プロセッサが集約すべき集約演算のグルー
プに関する全てのデータに前記Ｔ個の集約演算を実行す
るまで、前記ステップ（ｃ）を実行するステップと、（ｅ）前記Ｓ個の集約演算を実行するまで、前記ステッ
プ（ａ）乃至（ｄ）を繰り返すステップとを前記コンピ
ュータ・システムに実行させる、記憶媒体。
【請求項１８】ネットワークにより接続された複数のプ
ロセッサが各々自己のメモリ領域及び１又は複数のグル
ープに分けることができるデータを含むデータベースの
自己の部分を使用できるよう構成されたコンピュータ・
システムに、前記グループ毎に集約を行う演算を含む、
Ｎ個の集約演算を前記データベースに対し実行させるプ
ログラムを格納した記憶媒体であって、前記プログラムは、前記プロセッサの数と前記データベースの大きさと前記
ネットワークの通信速度とを含む前記コンピュータ・シ
ステムのパラメータ及び実行する集約演算の数と各集約
演算の結果を格納するメモリの量とを含む集約演算の性
質に関するパラメータから、（ａ）各前記プロセッサが、前記自己のメモリ領域に、
前記Ｎ個の集約演算のうちＭ個（Ｍは２以上かつＮ以下
の整数）分の演算結果を記憶するスペースを確保するス
テップと、（ｂ）各前記プロセッサが、Ｍ個の集約演算をまとめ
て、前記データベースの自己の部分に対して実行するス
テップと、（ｃ）各前記プロセッサが、前記Ｍ個の集約演算の各プ
ロセッサにおける演算結果を、集計すべきプロセッサに
送信し、前記集計すべきプロセッサが最終結果を計算す
るステップと、（ｄ）前記Ｎ個の集約演算の実行が終了するまで、前記
ステップ（ａ）乃至（ｃ）を繰り返すステップとを含む
第１集約演算実行方法と、（ｅ）各前記プロセッサが、前記Ｎ個の集約演算のうち
自らが実行するＱ個（Ｑは２以上の整数）の集約演算の
演算結果を記憶するスペースを、前記自己のメモリ領域
に確保するステップと、（ｆ）各前記プロセッサが、前記自己のメモリ領域に前
記データベースの自己の部分である部分データベースの
一部を読み出し、読み出された前記部分データベースの
一部を前記ネットワークを介してブロードキャストする
ことを繰り返して、各前記プロセッサが全ての前記デー
タベースのデータに対し前記自らが実行するＱ個の集約
演算を実行するステップと、（ｇ）前記Ｎ個の集約演算が実行されるまで、前記ステ
ップ（ｅ）及び（ｆ）を繰り返すステップとを含む第２
集約演算実行方法と、（ｈ）前記Ｎ個の集約演算のうち実行するＴ個（Ｔは２
以上の整数）の集約演算を決定するステップと、（ｉ）前記Ｔ個の集約演算を実行する際に集約される、
各集約演算の各グループを取り扱うプロセッサを決定す
るステップと、（ｊ）各前記プロセッサが、前記データベースの自己の
部分である部分データベースの一部を前記自己のメモリ
領域に読み出し、読み出されたデータのうち他のプロセ
ッサが集約すべき集約演算のグループに関するデータを
当該集約演算のＩＤと共に前記他のプロセッサに前記ネ
ットワークを介して送信し、自己が集約すべき集約演算
のグループに関するデータについて前記Ｔ個の集約演算
を実行するステップと、（ｋ）各前記プロセッサが集約すべき集約演算のグルー
プに関する全てのデータに前記Ｔ個の集約演算を実行す
るまで、前記ステップ（ｊ）を実行するステップと、（ｌ）前記Ｎ個の集約演算を実行するまで、前記ステッ
プ（ｈ）乃至（ｋ）を繰り返すステップとを含む第３集
約演算実行方法とを含む複数の集約演算実行方法のうち
いずれの方法が最も高速に実行できるかを決定するステ
ップと、決定された方法にて、前記Ｎ個の集約演算を実行するス
テップとを含む記憶媒体。