WO2006126467A1

WO2006126467A1 - マルチプロセッサシステム及びその情報処理方法

Info

Publication number: WO2006126467A1
Application number: PCT/JP2006/310110
Authority: WO
Inventors: Shinji Furusho
Original assignee: Turbo Data Laboratories Inc.
Priority date: 2005-05-24
Filing date: 2006-05-22
Publication date: 2006-11-30
Also published as: US20080215584A1; CA2595858A1; EP1901183A4; US8065337B2; CN101133414B; JP4339381B2; US7801903B2; US20100312802A1; KR101196566B1; CN101133414A; KR20080014726A; EP1901183A1; JPWO2006126467A1

Abstract

　共有メモリ上の大規模な表形式データを複数台のプロセッサで並列にソートする。本発明によれば、最初に、処理対象のレコードが分割されて複数台のプロセッサへ割り当てられる。次に、各プロセッサが処理対象のレコードに関連付けられた項目値番号のローカルな出現回数をカウントする。次に、各プロセッサでカウントされた項目値番号のローカルな出現回数を、項目値番号のグローバルな累計数、すなわち、複数台のプロセッサ間で共通に用いられる累計数に変換する。最後に、各プロセッサは、このグローバルな累計数をポインタとして利用することにより、割り当てられたレコードの順序を入れ替える。

Description

明細書

マルチプロセッサシステム及びその情報処理方法

技術分野

[0001] 本発明は、複数台のプロセッサがメモリを共有して並列処理を行う共有メモリ型マルチプロセッサシステムにおける情報処理方法、特に、共有メモリ上の大規模な表形式データを複数台のプロセッサで並列にソートする情報処理方法に関する。

[0002] 本発明は、また、このような情報処理方法を実施する共有メモリ型マルチプロセッサシステムに関する。

[0003] 本発明は、さらに、このような情報処理方法を実現させるためのプログラムに関する

[0004] 本発明は、さらに、このようなプログラムを記録した記憶媒体に関する。

背景技術

[0005] 社会全体のさまざまな場所にコンピュータが導入され、インターネットをはじめとするネットワークが浸透した今日では、そこここで、大規模データが蓄積'処理されるようになった。

[0006] 一方で、大規模データを処理するために、効率の良、アルゴリズムが開発されて!ヽる。大規模データ、特に、大規模な表形式データを処理する際に頻出する処理はソートである。効率的なソートアルゴリズムとして、基数 (RADIX)ソートとカウンティング（ COUNTING)ソート（計数ソート、分布数え上げソートとも称される）が知られて、る。カウンティングソートは基数ソートの各桁のソートに利用されることがあり、効率の良いァノレゴリズムであるが、その適用のためには、

1)ソート対象が整数であること

2)ソート対象となる整数の上限と下限が分力つて、ること

3)ソート対象となる整数の上限と下限の差が、大きすぎな!/、こと

という前提条件がある。

[0007] これに対して、本発明者は、大規模な表形式データを高速に検索、集計、ソートするために適したデータ管理機構を提案している（特許文献 1を参照)。このデータ管理機構は、表形式データの項目の各項目値を表すための情報ブロックを有する。この情報ブロックでは、表形式データの項目に属する項目値は、各項目値に付与された項目値番号と、項目値番号の順番に並べられた実際の項目値の配列とによって表される。各レコードの項目値に対応した項目値番号をレコード番号順に並べた配列が準備され、各レコードの項目値は、当該レコードの項目値番号に対応した値を項目値の配列力見つけることによって特定される。また、表形式データ中の処理対象のレコードは、レコード番号を順番に並べた配列によって特定される。

[0008] 情報ブロックは、表形式データの各項目に対し、その項目に属する項目値が順序付け (整数化)された項目値番号の順番に、上記項目値番号に対応した項目値が格納されたテーブルである。項目値自体は、数値 (整数、固定小数点、浮動小数点など )、文字列などのどのようなタイプのデータでもよい。したがって、このデータ管理機構は、あらゆるタイプのデータの値が項目値番号という整数で取り扱えることに特長がある。すなわち、このデータ管理機構によれば、たとえば、文字列型のデータのソートを行う際に、文字列型のデータをそのままソート対象としてソートするのではなぐ文字列型のデータの値に対応した項目値番号をソート対象としてソートすることができる。このとき、ソートの結果はレコード番号を順番に並べた配列によって表される。このように、本発明者が提案した情報ブロックに基づくデータ管理機構は、カウンティングソートを適用するための上記 1)から 3)の前提条件を満たしている点で優れている。

[0009] 他方で、大規模データを処理するために必要である膨大な計算を高速に実行するため、並列処理を導入することが試みられている。ソートに関しても各種の並列ソートアルゴリズムが提案されている。一般に、並列処理アーキテクチャは「分散メモリ型」と「共有メモリ型」に大別される。分散メモリ型は、各プロセッサがそれぞれローカルなメモリを持ち、これらを結合してシステムを構築する。この方式では、理論的に数百〜数万台ものプロセッサを組み込んだハードウェアシステムの設計が可能である。しかしながら、分散メモリ型は、データの分掌管理の複雑さや、プロセッサ間通信の効率の低さなどの技術的課題がある。これに対して、共有メモリ型は複数のプロセッサが 1 つの巨大なメモリ空間を共有する方式である。この方式では、プロセッサ群と共有メモリ間のトラフィックがボトルネックとなるので、現実的には百台を越えるプロセッサを用 V、てシステムを構築することは容易ではな、、と考えられて、る。

[0010] しかし、このような状況下で、近年、複数台の CPUを用いた共有メモリ型マルチプロセッサシステムとして構成されたパーソナルコンピュータが入手可能である。この種のパーソナルコンピュータに使用される標準的な CPUは、メモリバスの 5〜6倍程度の内部クロックで動作し、その内部に自動的な並列実行機能やパイプライン処理機能が装備されており、およそ 1データを 1クロック (メモリバス)で処理できる。

特許文献 1：国際公開 WOOOZ10103号公報

発明の開示

発明が解決しょうとする課題

[0011] したがって、大規模な表形式データを処理するために、効率的なソートアルゴリズムと、共有メモリ型マルチプロセッサシステムとを組み合わせることが望まれる。

[0012] 効率的なソートアルゴリズムとして知られているカウンティングソートは、上記の 1)から 3)の前提条件によって制約されているので、本発明者が提案した上記の情報プロックに基づくデータ管理機構を採用しない限り、大規模な表形式データの処理に適用することが困難である。さらに、大規模な表形式データを共有メモリ型マルチプロセッサシステムで並列ソートする技術は未だ知られて、な、。

[0013] したがって、本発明の目的は、上記情報ブロックに基づくデータ管理機構を利用して、共有メモリ上の大規模な表形式データを複数台のプロセッサで並列にソートするための情報処理方法を提案することである。

[0014] また、本発明の目的は、このような情報処理方法を実施する共有メモリ型マルチプ口セッサシステムを提供することである。

[0015] さらに、本発明の目的は、このような情報処理方法を実現させるためのプログラムを提供することである。

[0016] さらに、本発明の目的は、このようなプログラムを記録した記憶媒体を提供することである。

課題を解決するための手段

[0017] 本発明は、表形式データの各項目に対し、その項目に属する項目値が順序付け（整数化)された項目値番号の順番 (昇順又は降順のどちらでもよ、）に、上記項目値番号に対応した項目値が格納されたテーブルである情報ブロックに基づくデータ管理機構に依拠している。項目値自体は、数値 (整数、固定小数点、浮動小数点など）、文字列などのどのようなタイプのデータでもよい。このデータ管理機構を採用することにより、あらゆるタイプのデータの値が項目値番号という整数で取り扱える。すなわち、このデータ管理機構によれば、任意のタイプのデータのソートを行う際に、その任意のタイプのデータをそのままソート対象としてソートするのではなぐそのデータの値に対応した項目値番号をソート対象としてソートすることができる。したがって、この情報ブロックに基づくデータ管理機構は、カウンティングソートを適用するための前提条件を満たしている。また、表形式データ中の処理対象のレコードがレコード番号を順番に並べた配列によって特定されるので、ソートの結果はレコード番号を順番に並ベた配列によって表される。

[0018] 本発明は、このようなデータ管理機構を共有メモリ型マルチプロセッサシステムに適用することにより、共有メモリ上の大規模な表形式データを複数台のプロセッサで並列にソートするための情報処理方法、及び、その情報処理方法を実施する共有メモリ型マルチプロセッサシステムを実現する。そのため、本発明によれば、最初に、処理対象のレコードが分割されて複数台のプロセッサへ割り当てられる。次に、各プロセッサが処理対象のレコードに関連付けられた項目値番号のローカルな出現回数をカウントする。次に、各プロセッサでカウントされた項目値番号のローカルな出現回数を、項目値番号のグローバルな累計数、すなわち、複数台のプロセッサ間で共通に用いられる累計数に変換する。最後に、各プロセッサは、このグローバルな累計数をポインタとして利用することにより、割り当てられたレコードの順序を入れ替える。したがって、本発明によれば、共有メモリ型マルチプロセッサシステムにおいて、レコードのある項目の項目値 (たとえば、整数値、固定小数点数値、浮動小数点数値、文字列など）に関してレコードを並列にソートすることが可能である。

[0019] 処理対象のレコードの複数台のプロセッサへの割り当て、ローカルな出現回数の力ゥント、及び、割り当てられたレコードの順序の入れ替えは、複数台のプロセッサが並列に処理可能である。また、グローバルな累計数の算出は、複数台のプロセッサの並列処理を利用してもよいが、メモリにシーケンシャルにアクセスできるためキャッシュへのヒット率が高いので、 1台又は一部のプロセッサだけが担当して高速性を維持できる。

[0020] 上記の本発明の原理は以下の種々の態様によって実施される。

[0021] 本発明の第 1の態様は、共有メモリ型マルチプロセッサシステムにおいてレコードの所定の項目の項目値に応じてレコード順を並べ換える情報処理方法である。共有メモリ型マルチプロセッサシステムは、表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、前記共有メモリにァクセス可能である複数台のプロセッサと、を具備する。本発明による情報処理方法は、前記レコード番号配列を分割して第 1の複数台のプロセッサに割り当てるステップと前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の出現回数を力ゥントするステップと、

前記項目値番号の範囲を分割して第 2の複数台のプロセッサに割り当てるステップと、

前記第 2の複数台のプロセッサのうちの各プロセッサにおいて、前記項目値番号の順番に、前記項目値番号が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記割り当てられた項目値番号のそれぞれの出現回数を累計数に変換するステップと、

前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、を含む。

[0022] この情報処理方法は、項目値番号の出現回数のカウント処理の並列化、出現回数から累計数への変換処理の並列化、及び、さらなるレコード番号配列の作成処理の並列化を達成する。したがって、本発明は、カウンティングソートの技術を共有メモリ型マルチプロセッサ環境に適合するように拡張することにより、大規模な表形式データを共有メモリ型マルチプロセッサシステムにおいて並列ソートすることが可能である

。尚、マルチプロセッサシステムを構成する複数台のプロセッサのうち、任意の第 1の複数台のプロセッサがレコード番号配列のそれぞれの部分を担当し、任意の第 2の複数台のプロセッサが項目値番号の範囲のそれぞれの部分を担当する。第 1の複数台の個数と第 2の複数台の個数はマルチプロセッサシステムを構成するプロセッサの全数でもよぐその一部でもよいことに注意する必要がある。

また、本発明の情報処理方法は、項目値番号に関して基数ソートの考え方を導入することにより、大規模な表形式データを共有メモリ型マルチプロセッサシステムにおいて多段階で並列ソートすることが可能である。たとえば、項目値番号配列のサイズが大き、場合には、項目値番号配列を圧縮して利用できれば処理を効率化することが可能である。そのため、本発明による情報処理方法は、

前記項目値番号の範囲に応じて前記項目値番号の基数を設定するステップと、前記基数で表現された前記項目値番号の最下位桁から最上位桁まで順番に現在の桁に関して、 1回目は前記レコード番号配列を現在のレコード番号配列として、 2 回目以降はさらなるレコード番号配列を現在のレコード番号配列として、ソート処理を繰り返すステップと、

を含む。これにより、最下位桁カゝら最上位桁まで順番に項目値番号の桁ごとに並列ソート処理が行われる。前記ソート処理は、

前記現在のレコード番号配列を分割して第 1の複数台のプロセッサに割り当てるステツプと、

前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントするステップと、

前記項目値番号の現在の桁の値の範囲を分割して第 2の複数台のプロセッサに割り当てるステップと、前記第 2の複数台のプロセッサのうちの各プロセッサにおいて、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記割り当てられた項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換するステップと、

前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、を含む。

[0024] 本発明によれば、項目値番号の最下位桁カゝら最上位桁へ順番に現在の桁に関するソート処理が繰り返されるので、基数ソートの考え方に従って項目値番号に関するソートが実現される。したがって、大規模な表形式データを共有メモリ型マルチプロセッサシステムにおいて並列ソートすることが可能である。

[0025] 上記の多段階並列ソートでは、項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換するステップは第 2の複数台のプロセッサによって並列に実行される。しかし、このステップは複数台のプロセッサによって並列に実行しなくても高速に行える場合がある。なぜならば、このステップの処理は、シーケンシャルに行われるので、キャッシュヒット率が高いからである。そのため、本発明による情報処理方法は前記項目値番号の範囲に応じて前記項目値番号の基数を設定するステップと、前記基数で表現された前記項目値番号の最下位桁から最上位桁まで順番に現在の桁に関して、 1回目は前記レコード番号配列を現在のレコード番号配列として、 2 回目以降はさらなるレコード番号配列を現在のレコード番号配列として、ソート処理を繰り返すステップと、

を含み、

前記ソート処理が、

前記現在のレコード番号配列を分割して前記複数台のプロセッサに割り当てるステップと、各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントするステップと、少なくとも 1台のプロセッサにおいて、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記割り当てられた項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換するステップと、

前記各プロセッサにお、て、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、

を含む。

[0026] 本情報処理方法では、項目値番号の現在の桁の範囲は複数台のプロセッサに分割されることがなぐ少なくとも 1台、好ましくは、 1台のプロセッサが、項目値番号の現在の桁の値の出現回数を順番に累計数に変換する。この場合も、項目値番号の最下位桁力最上位桁へ順番に現在の桁に関するソート処理が繰り返されるので、基数ソートの考え方に従って項目値番号に関するソートが実現される。したがって、大規模な表形式データを共有メモリ型マルチプロセッサシステムにおいて並列ソートすることが可能である。

[0027] また、本発明は上記目的を達成するため、表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

前記共有メモリにアクセス可能である複数台のプロセッサと、

を具備した共有メモリ型マルチプロセッサシステムにおいて、

前記レコード番号配列を分割して前記複数台のプロセッサに割り当てるステップと、前記複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードの順番を当該レコードに対応した項目値番号に応じて入れ替え、当該レコードのレコード番号をさらなるレコード番号配列に格納するステップと、

を含む、レコードの所定の項目の項目値に応じてレコード順を並べ換える情報処理方法を提供する。

[0028] さらに、本発明は上記目的を達成するため、表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

前記項目値番号の範囲に応じて前記項目値番号の基数を設定するステップと、前記基数で表現された前記項目値番号の上位の桁に関して前記レコード番号配列中のレコード番号を並べ換え、前記項目値番号の上位の桁の値の順番に区分された中間的なレコード番号配列を生成するステップと、

前記中間的なレコード番号配列の区分ごとにプロセッサを割り当てるステップと、前記区分ごとに割り当てられた各プロセッサが、前記中間的なレコード番号配列の前記区分内のレコード番号を前記項目値番号の下位の桁の値の順番に並べ換えるステップと、

[0029] 本発明の第 2の態様は、共有メモリと前記共有メモリにアクセス可能である複数台のプロセッサとを具備し、上記の本発明の情報処理方法を実施する共有メモリ型マルチプロセッサシステムである。本発明の共有メモリ型マルチプロセッサシステムにおヽて、前記共有メモリは、表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する。これにより、本発明の共有メモリ型マルチプロセッサシステムはブロック情報に基づくデータ管理機構を利用することができる。

[0030] 各プロセッサは、

前記レコード番号配列のうち自プロセッサが受け持つ部分を決める手段と、前記レコード番号配列の部分に含まれるレコードに対応した項目値番号の出現回数をカウントする手段と、

前記項目値番号の範囲のうち自プロセッサが受け持つ範囲を決める手段と、前記項目値番号の順番に、前記項目値番号が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記受け持つ範囲内の項目値番号のそれぞれの出現回数を累計数に変換する手段と、

前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する手段と、

を含む。

[0031] 各プロセッサは並列に動作可能であるため、出現回数のカウントの並列化、出現回数の累計数への変換の並列化、及び、さらなるレコード番号配列の作成の並列化が実現される。

[0032] 項目値番号の出現回数を累計数に変換する際に、得られた累計数を項目値番号の順に伝搬させる必要がある。そのため、前記項目値番号の範囲のうち先行する範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって得られた前記累計数が、直後の範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって参照される。

[0033] また、本発明の共有メモリ型マルチプロセッサシステムは、項目値番号に関して基数ソートの考え方を導入することにより、大規模な表形式データを多段階で並列ソートするため、各プロセッサが、

前記項目値番号の範囲に応じて前記項目値番号の基数を設定する手段と、前記基数で表現された前記項目値番号の最下位桁から最上位桁まで順番に現在の桁を設定し、 1回目は前記レコード番号配列を現在のレコード番号配列として、 2 回目以降はさらなるレコード番号配列を現在のレコード番号配列として設定し、ソート処理を繰り返す手段と、

を含む。これにより、項目値番号の最下位桁力最上位桁までの桁ごとの並列ソート処理が順番に実行される。さらに、前記ソート処理を繰り返す手段は、

前記レコード番号配列のうち自プロセッサが受け持つ部分を決める手段と、前記レコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントする手段と、

前記項目値番号の現在の桁の値の範囲のうち自プロセッサが受け持つ範囲を決める手段と、

前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記受け持つ範囲内の項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する手段と、

前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する手段と、

を含む。これにより、項目値番号の桁ごとの並列ソート処理が実現される。本発明によれば、項目値番号の桁ごとのソート処理において、複数台のプロセッサ力出現回数のカウントと、出現回数の累計数への変換と、さらなるレコード番号配列の作成と、を並列に実行する。

[0034] また、出現回数の累計数への変換を複数台のプロセッサで分担して行うため、本発明にお、て、前記項目値番号の現在の桁の範囲のうち先行する範囲を受け持つプ口セッサの前記出現回数を累計数に変換する手段によって得られた前記累計数が、直後の範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によつて参照される。

[0035] さらに、大規模な表形式データを多段階で並列ソートする本発明による共有メモリ型マルチプロセッサシステムは、現在の桁の値のそれぞれの出現回数の累計数化を少なくとも 1台、好ましくは、 1台のプロセッサで実行することも可能である。そのため、本発明による共有メモリ型マルチプロセッサシステムにおいて、各プロセッサは、前記項目値番号の範囲に応じて前記項目値番号の基数を設定する手段と、前記基数で表現された前記項目値番号の最下位桁から最上位桁まで順番に現在の桁を設定し

、 1回目は前記レコード番号配列を現在のレコード番号配列として、 2回目以降はさらなるレコード番号配列を現在のレコード番号配列として設定し、ソート処理を繰り返す手段と、を含む。

[0036] 各プロセッサの前記ソート処理を繰り返す手段は、前記レコード番号配列のうち自プロセッサが受け持つ部分を決める手段と、前記レコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントする手段と、を含む。

[0037] さらに、少なくとも 1台のプロセッサの前記ソート処理を繰り返す手段は、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する手段を含む。

[0038] さらに、前記ソート処理を繰り返す手段は、前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する手段を含む。

[0039] 本発明によれば、各プロセッサは、項目値番号の現在の桁の値の範囲のうち自プ口セッサが受け持つ範囲を決める必要がなくなり、複数台のプロセッサで出現回数を累計数に変換する処理を分担しなくても済むので、共有メモリ型マルチプロセッサシステムの構成が簡単ィ匕される。

[0040] さらに、本発明の第 3の態様によれば、このような情報処理方法を実現させるためのプログラムが提供される。

[0041] さらに、本発明の第 4の態様によれば、このようなプログラムを記録した記憶媒体が提供される。

発明の効果

[0042] 本発明によれば、共有メモリ型の並列処理環境にお!、て、大規模な表形式データの高速並列ソートを実現可能な情報処理装置を提供することが可能となる。

発明を実施するための最良の形態

[0043] 以下、添付図面を参照して本発明の種々の実施例を説明する。

[0044] [コンピュータシステム構成]

図 1は本発明によるレコードの所定の項目の項目値に応じてレコード順を並べ換える情報処理方法を実施するコンピュータシステムの一実施例の概略図である。図 1に示すように、このコンピュータシステム 10は、プログラムを実行することによりシステム全体および個々の構成部分を制御する p台のプロセッサ（CPU) 12— 1、 12- 2, . . . 12— p、ワークデータなどを記憶する共有メモリ、たとえば、 RAM(Random Access Memory) 14,プログラム等を記憶する ROM(Read Only Memory) 16,ハードディスク等の固定記憶媒体 18、 CD— ROM19をアクセスするための CD— ROMドライバ 20 、 CD— ROMドライバ 20や外部ネットワーク（図示せず）と接続された外部端子との間に設けられたインタフェース（IZF) 22、キーボードやマウスからなる入力装置 24、 CRT表示装置 26を備えている。 CPU12、 RAM 14, ROM16、外部記憶媒体 18、 I ZF22、入力装置 24および表示装置 26は、バス 28を介して相互に接続されている。図示されていないが、各 CPUは固有のローカルメモリを備えていてもよい。

[0045] 本実施の形態にかかる、レコードの所定の項目の項目値に応じてレコード順を並べ換えるプログラムは、 CD—ROM19に収容され、 CD— ROMドライバ 20に読取られても良いし、 ROM16に予め記憶されていても良い。また、いったん CD— ROM19 力も読み出したものを、外部記憶媒体 18の所定の領域に記憶しておいても良い。或いは、上記プログラムは、ネットワーク（図示せず）、外部端子および IZF22を経て外部から供給されるものであっても良い。

[0046] また、本発明の実施の形態に力かる共有メモリ型マルチプロセッサシステムは、コンピュータシステム 10にレコードの所定の項目の項目値に応じてレコード順を並べ換えるプログラムを実行させることにより実現される。

[0047] [情報ブロックに基づくデータ管理機構]

図 2はデータ管理機構を説明するための表形式データの一例を表す図である。この表形式データは、上述の国際公開第 WO00Z10103号に提案したデータ管理機構を用いることにより、コンピュータ内では図 3に示されるようなデータ構造として記憶される。

[0048] 図 3に示すように、表形式データの各レコードの並び順の番号と、内部データの並び順の番号を対応付ける配列 301 (以下、この配列を「OrdSet」のように略記する。 ) には、表形式のレコード毎に内部データの並び順番号が値として配置される。この例では、すべての表形式データが内部データとして表されるため、表形式データのレコード番号と内部データの並び順番号とは一致する。

[0049] 例えば、性別に関しては、表形式データのレコード 0に対応する内部データの並び順番号は、配列 OrdSet301から「0」であることがわかる。並び順番号が「0」であるレコードに関する実際の性別の値、即ち、「男」又は「女」は、実際の値が所定の順序に従ってソートされた値リスト 303 (以下、値リストを「VL」のように略記する。）へのポインタ配列 302 (以下、ポインタ配列を「VNo」のように略記する。）を参照することによって取得できる。ポインタ配列 302は、配列 OrdSet301に格納されている並び順番号の順に従って、実際の値リスト 303中の要素を指し示すポインタを格納している。これにより、表形式データのレコード「0」に対応する性別の項目値は、（1)配列 OrdSet301 力もレコード「0」に対応する並び順番号「0」を取り出し、（2)値リストへのポインタ配列 302から並び順番号「0」に対応する要素「1」を取り出し、（3)値リスト 303から、値リストへのポインタ配列 302から取り出された要素「1」によって指し示される要素「女」を取り出すことにより取得できる。

[0050] 他のレコードに対しても、また、年齢及び身長に関しても同様に項目値を取得することができる。

[0051] このように表形式データは、値リスト VLと、値リストへのポインタ配列 VNoの組合せにより表現され、この組合せを、特に、「情報ブロック」と称する。図 3には、性別、年齢及び身長に関する情報ブロックがそれぞれ情報ブロック 308、 309及び 310として示されている。

[0052] 単一のコンピュータ力単一のメモリ（物理的には複数であっても良いが、単一のァドレス空間に配置されアクセスされるという意味で単一のメモリ）であれば、当該メモリに、順序集合の配列 OrdSet、各情報ブロックを構成する値リスト VLおよびポインタ配列 VNoとを記憶しておけばよい。しかしながら、大量のレコードを保持するためには、その大きさに伴ってメモリ容量も大きくなるため、これらの大量のレコードを並列処理できるのが望ましい。

[0053] そこで、本実施の形態においては、複数台のプロセッサが共有メモリに記憶されたレコードのデータにアクセスし、複数台のプロセッサの並列処理により、高速なソートを実現している。

[0054] [並列ソート]

次に、本発明の実施の形態にかかる、共有メモリ型マルチプロセッサシステムにお V、てレコードの所定の項目の項目値に応じてレコード順を並べ換える情報処理方法、すなわち、並列ソート方法を説明する。図 4A、 Bはソート対象のデータ構造を表す図である。図 4Aに示された表形式データ 401は、ソート対象のデータ構造を行列形式で分力りやすく表現したものであり、レコード 0からレコード 19までの 20個のレコードを含み、各レコードは、年齢と地域の二つの項目により構成される。図 4Bに示されたデータ構造 402は、コンピュータシステム 10の共有メモリ 14に記憶されたデータ構造を表している。図 4Bのレコード番号配列 (OrdSet :順序集合を表す) 403はレコード番号 0から 19を所定の順に従って格納する配列である。本例では、レコード番号は 0 力も 19の順に格納されている。年齢と地域のデータは、それぞれ、情報ブロック 404 と情報ブロック 405の形で記憶される。年齢の情報ブロック 404は、年齢の項目値に対応する項目値番号がレコード番号の順番に従って格納された項目値番号配列（以下では、 VNo :値番号とも称される) 406と、年齢の項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列（以下では、 VL：値リストとも称される) 407とにより構成される。同様に、地域の情報ブロック 405は、地域の項目値に対応する項目値番号がレコード番号の順番に従って格納された項目値番号配列 40 8と、地域の項目値が当該項目値に対応する項目番号の順序に従って格納された項目値配列 409とにより構成される。コンピュータシステム 10の p台のプロセッサ 12— 1 、 · · ·、 12— pは、共有メモリ 14上のこれらのデータにアクセスすることが可能である。

[0055] 図 5は、本発明の実施の形態に力かる並列ソート方法のフローチャートである。本実施の形態では、 CPUの台数は 4台とし、すべての CPUが並列に動作する例を考える。システム内の CPUの総数、及び、並列に動作する CPUの台数はこの例に限定されないことに注意すべきである。また、以下では、説明の便宜上、年齢の項目に関して、年齢の昇順にソートする場合を考える。また、年齢の項目値配列の要素は年齢の昇順に並べられている。並列ソート方法は、ステップ 501からステップ 505の 5ステツプにより構成される。

[0056] ステップ 501：レコード番号配列を 4分割して各部分を 4台の CPUに割り当てる（図 6を参照)。

[0057] ステップ 502 :各 CPUは、割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の出現回数を並列的にカウントする（図 7A、 B乃至図 9A 、Bを参照)。

[0058] ステップ 503：項目値番号の範囲、すなわち、項目値番号 0から項目値番号 4までの 5個の値を 4台の CPUに割り当てる。たとえば、 CPU— 0は項目値番号 0及び 1が割り当てられ、 CPU— 1から CPU— 3は項目値番号 2から項目値番号 4までが一つずつ割り当てられる（図 10Aを参照)。

[0059] ステップ 504 :4台の CPUは、それぞれ、項目値番号の順番に、項目値番号が一致する範囲内ではレコード番号配列の部分の順番に従って、割り当てられた項目値番号のそれぞれの出現回数を累計数に変換する（図 10A及び Bを参照)。

[0060] ステップ 505 :4台の CPUは、割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の累計数をポインタとして利用して、割り当てられたレコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する (図 11A、 B乃至図 13A、 Bを参照）。

[0061] 次に各ステップを詳述する。

[0062] 図 6は並列ソート方法の初期化ステップ 501の説明図である。 CPU— 0から CPU— 3の 4台の CPUには、レコード番号配列の先頭から順番に 4レコードずつが割り当てられる。たとえば、 CPU— 0は、レコード番号配列の先頭の OrdSet[0]から 5番目の OrdSet[4]までを担当する（OrdSet[x]の xは配列 OrdSetの添字を表す）。また、共有メモリ 14には、項目値番号の出現回数をカウントするためのカウント配列 Count 0、 Count— 1、 Count— 2及び Count— 3が設けられ、各 CPUに関連付けられる。 Count配列の個数は CPUの数と同数であり、 Count配列の配列サイズは VL配列のサイズと同じである。 Count配列の要素は 0で初期化される。

[0063] 図 7A、 B乃至図 9A、 Bは並列ソート方法のカウントアップステップ 502の説明図である。図 7Aのサブステップ 1では、たとえば、 CPU— 0は、 OrdSet[0]の値 0を読み出し、読み出された値 0を添字として、 VNo [0]の値 1を読み出し、この値 1を添字として、 Count— 0[1]の値 0を 1にインクリメントする。同様に、 CPU— 1は、 OrdSet[5] の値 5を読み出し、読み出された値 5を添字として、 VNo [5]の値 2を読み出し、この値 2を添字として、 Count— 1 [2]の値 0を 1にインクリメントする。 CPU— 2及び CPU —3についても同様である。図 7Bのサブステップ 2では、たとえば、 CPU— 0は、 Ord Set[l]の値 1を読み出し、読み出された値 1を添字として、 VNo [1]の値 3を読み出し、この値 3を添字として、 Count— 0[3]の値 0を 1にインクリメントする。 CPU— 1、 C PU— 2及び CPU— 3についても同様である。各プロセッサは、図 8A及び B、図 9A に示されるように、自プロセッサが担当する配列 OrdSetの各要素を読み出し、その要素を添字として、配列 VNoの要素を読み出し、さらに、その読み出された要素を添字として対応する Count配列の要素をインクリメントする。その結果として、図 9Bに示されるようなカウントアップ結果が得られる。図 9A、 Bの配列じ0111^—0の要素じ01111 t 0 [i]は、 CPU— 0が担当した配列 OrdSetの OrdSet [0]力 OrdSet [4]の範囲内の各レコードに対応する年齢の項目値番号 iの出現回数を表わしている。たとえば

、 Count— 0[0]は、 CPU— 0の担当範囲内の項目値番号 0の出現回数が 1回であることを表し、 Count— 3 [1]は CPU— 3の担当範囲内の項目値番号 1の出現回数力^回であることを表す。

[0064] 図 10A、 Bは並列ソート方法の累計数化ステップ 503及び 504の説明図である。本例では、昇順ソートに対応して、項目値番号の昇順に累計数化を行う。 CPU— 0は、配列 Countの 1行目と 2行目（すなわち、項目値番号 0と 1)の累計数ィ匕を担当し、 CP 11 1乃至じ？11 3は、それぞれ、配列 Countの 3乃至 5行目（すなわち、項目値番号 3乃至 5)の累計数ィ匕を担当する。図 10Aに示されるように、累計数化は配列 Cou ntの横方向（すなわち、添字が一致する行)を優先して行われ、次に、先行する行の累計数を後続する行の累計数に加算することにより、全体の累計数が決まる。尚、横方向の累計数ィ匕は、各 CPUが並列に実行できることに注意すべきである。

[0065] 一般に、 i番目（0≤i≤p— l)の CPUである CPU—iがカウントアップした項目値番号 j (0≤j≤q— 1)のカウント値を Count[i][j]、累計数を Count'[i][j]のように表すと、累計数ィ匕は次のように記述できる。

Count'[0][0]=0

Count'[i][0]=Count'[i-l][q-l]+Count[i-l][q] 但し、 i〉l

Count ' [i] Q]=Count' [i] [j-l]+Count[i] [j-1] 但し、 j〉l

このように、累計数演算では、先行の行力次の行へオフセット Count'[i-l][q-l]を伝搬させることが必要である。したがって、本実施の形態では、累計数化の演算を C PUが分担して行っている力 1台のプロセッサを選択し、そのプロセッサが単独で累計数化を行ってもよい。

[0066] 図 10Bは累計数ィ匕の順番を縦方向で一列に表したものである。たとえば、図 10B において、（l) Count—0 : 0の行は、配列 Count— 0の先頭の要素 Count— 0[0]のカウント値 1が累計数 0に変換されることを表している。すなわち、

1, 2, 2, 0, 2, 0, 2, 2, 0, 2, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1

というカウント値の系列を累計数ィ匕すると、

0, 1, 3, 5, 5, 7, 7, 9, 11, 11, 13, 13, 14, 15, 16, 16, 17, 18, 18, 19 になる。

[0067] 図 11A、 B乃至図 13A、 Bはレコード番号をさらなるレコード番号配列に格納する転送ステップ 505の説明図である。転送ステップでは、各 CPUは、レコード番号配列 O rdSetから自分が担当する範囲内のレコード番号を読み出し、次に、そのレコード番号を添字として、ポインタ配列 VNoから項目値番号を読み出し、さらに、この項目値番号を添字として、自プロセッサに関連付けられた累計数ィ匕された Count配列から累計数値を読み出し、この読み出された累計数値をポイントしてさらなるレコード番号配列 OrdSet'にレコード番号を格納すると共に、 Count配列の累計数値を 1ずつィンクリメントする。

[0068] たとえば、図 11Aのサブステップ 1では、 CPU— 0は、 OrdSet [0]の値 0 (すなわち、レコード番号 0)を読み出し、次に VNo [0]の値 1を読み出し、さらに、関連付けられた Count配列の Count— 0[1]の値 5を読み出し、 OrdSet[5]にレコード番号 0を設定すると共に、 Count— 0[1]の値を 6にインクリメントする。このレコード番号の転送処理は、以下同様に、図 11Bのサブステップ 2、図 12A及び Bのサブステップ 3及び 4、図 13Aのサブステップ 5のように進められ、最終的に、図 13Bに示されるようなさらなるレコード番号配列 OrdSet'が得られる。

[0069] 図 14A〜C及び図 15A、 Bは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる並列ソート方法を適用した結果を示す図である。本例では、年齢に関する昇順ソートを行ったので、結果のレコード番号配列 OrdSet'には、年齢の項目値として 16歳、 18歳、 20歳、 21歳及び 23歳を有するレコードが年齢順に並んでいることがわかる。また、年齢が一致するレコードの順番は、元のレコード番号配列 O rdSet中の順番が保存されて!、る。

[0070] 上記の並列ソート方法は年齢に関する昇順ソートの例について説明している力この並列ソート方法は年齢に関する降順ソートにも同様に適用できる。降順ソートは昇順ソートと同様に行われるが、累計数ィ匕の順番が昇順ソートとは異なる。図 16A、 B は本発明の実施の形態にカゝかる並列（降順)ソート方法の累計数化ステップの説明図である。図 16Aに示されるように、累計数ィ匕は配列 Countの横方向（すなわち、添字が一致する行)を優先して行われ、次に、後方の行の累計数を先行する行の累計数に加算することにより、全体の累計数が決まる。尚、横方向の累計数ィ匕は、各 CPU が並列に実行できることに注意すべきである。

[0071] 一般に、 i番目（0≤i≤p— l)の CPUである CPU—iがカウントアップした項目値番号 j (0≤j≤q— 1)のカウント値を Count[i][j]、累計数を Count'[i][j]のように表すと、累計数ィ匕は次のように記述できる。

Count'[p-l][0]=0

Count'[i][0]=Count'[i+l][q-l]+Count[i+l][q] 但し、 i〉l

Count ' [i] Q]=Count' [i] [j-l]+Count[i] [j-1] 但し、 j〉l

このように、累計数演算では、後方の行力前の行へオフセット Count'[i+l][q-l]を伝搬させることが必要である。したがって、本実施の形態では、累計数化の演算を C PUが分担して行っている力 1台のプロセッサを選択し、そのプロセッサが単独で累計数ィ匕を行ってもよい。図 16Bは累計数ィ匕の順番を縦方向で一列に表したものである。図 16Bにおいて、たとえば、（1) Count— 0 :4の行は、配列 Count— 0の先頭の要素 Count— 0[4]のカウント値 1が累計数 0に変換されることを表している。

[0072] 図 17A、 B乃至図 19A、 Bは降順の並列ソート方法の転送ステップ 505の説明図である。転送ステップでは、各 CPUは、レコード番号配列 OrdSetから自分が担当する範囲内のレコード番号を読み出し、次に、そのレコード番号を添字として、ポインタ配列 VNoから項目値番号を読み出し、さらに、この項目値番号を添字として、自プロセッサに関連付けられた累計数ィ匕された Count配列から累計数値を読み出し、この読み出された累計数値をポイントしてさらなるレコード番号配列 OrdSet'にレコード番号を格納すると共に、 Count配列の累計数値を 1ずつインクリメントする。

[0073] 図 20A、 B及び図 21A〜Cは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる降順の並列ソート方法を適用した結果を示す図である。本例では、年齢に関する降順ソートを行ったので、結果のレコード番号配列 OrdSet'には、年齢の項目値として 23歳、 21歳、 20歳、 18歳及び 16歳を有するレコードが年齢順に並んでいることがわかる。また、年齢が一致するレコードの順番は、元のレコード番号配列 OrdSet中の順番が保存されて!、る。

[0074] [並列累計数化演算]

次に、上記の実施例で説明した累計数化ステップ 504をさらに具体的に説明する。図 9Bに示すようなカウント結果が得られたとき、図 10A及び Bに示されるような累計数化が行われる。累計数ィ匕を並列に行うため、各 CPUには、対象とする項目値番号の値の範囲が割り当てられる。 CPU— 0には項目値番号 0と 1が、 CPU— 1には項目値番号 2が、 CPU— 2には項目値番号 3が、 CPU— 3には項目値番号 4が割り当てられる。したがって、 Count配列の要素を、上述のように Count[i][j]の形で表す (iは力ゥントを担当した CPUの番号、 jは項目値番号を表す）と、各 CPUの累計数ィ匕の担当範囲：

•CPU— 0の担当範囲（項目値番号 0及び 1)

Count[0][0]=l

Count[l][0]=2 Count[2][0]=2

Count[3][0]=0

Count[0][l]=2

Count[l][l]=0

Count[2][l]=2

Count[3][l]=2

•CPU— 1の担当範囲（項目値番号 2)

Count[0][2]=0

Count[l][2]=2

Count[2][2]=0

Count[3][2]=l

•CPU— 2の担当範囲（項目値番号 3)

Count[0][3]=l

Count[l][3]=l

Count[2][3]=0

Count[3][3]=l

•CPU— 3の担当範囲（項目値番号 4)

Count[0][4]=l

Count[l][4]=0

Count[2][4]=l

Count[3][4]=l

が得られる。

このような担当範囲が決まると、最初に、各 CPU— iが担当範囲内のカウントの小計 Sum[i]を計算すると、

Sum[0]=ll

Sum[l]=3

Sum[2]=3

Sum[3]=3 が得られる。この小計の計算は並列処理である。

[0076] 次に、この小計を CPU— 0から CPU— 3へ順番に伝搬させて、小計の累計数 Aggr_ sum[i]を計算すると、

Aggr_sum[0]=0

Aggr_sum[lJ=Aggr_sum[OJ+Sum[OJ=ll

Aggr_sum[2]=Aggr_sum[lJ+Sum[l]=14

Aggr_sum[3]=Aggr_sum[2]+Sum[2]=17

が得られる。小計の累計数は先頭が 0になるように定義される。

[0077] 最後に、各 CPU— iは、担当範囲で Count値を累計数に変換し、算出された小計の累計数 Aggr_sum[i]をその Count値の累計数に加算することにより、最終的なカウントの累計数 Count'を得る。この Count'の計算も並列処理である。これにより、 •CPU— 0の担当範囲（項目値番号 0及び 1)

Count'[0][0]=0+Aggr_sum[0]=0+0=0

Count'[l][0]=Count'[0][0]+Count[0][0]=0+l=l

Count'[2][0]=Count'[l][0]+Count[l][0]=l+2=3

Count'[3][0]=Count'[2][0]+Count[2][0]=3+2=5

Count'[0][l]=Count'[3][0]+Count[3][0]=5+0=5

Count'[l][l]=Count'[0][l]+Count[0][l]=5+2=7

Count'[2][l]=Count'[l][l]+Count[l][l]=7+0=7

Count'[3][l]=Count'[2][l]+Count[2][l]=7+2=9

•CPU- 1の担当範囲（項目値番号 2)

Count'[0][2]=0+Aggr_sum[l]=9+2=11

Count'[l][2]=Count'[0][2]+Count[0][2]=l 1+0=11

Count'[2][2]=Count'[l][2]+Count[l][2]=ll+2=13

Count'[3][2]=Count'[2][2]+Count[2][2]=13+0=13

•CPU— 2の担当範囲（項目値番号 3)

Count ' [0][3]=0+Aggr—sum[2]=0+ 14= 1

Count'[l][3]=Count'[0][3]+Count[0][3]=14+l=15 Count'[2][3]=Count'[l][3]+Count[l][3]=15+l=16

Count ' [3][3]=Count， [2] [3]+Count[2] [3]=16+0=16

•CPU— 3の担当範囲（項目値番号 4)

Count'[0][4]=0+Aggr_sum[3]=0+17=17

Count'[l][4]=Count'[0][4]+Count[0][4]=17+l=18

Count'[2][4]=Count'[l][4]+Count[l][4]=18+0=18

Count'[3][4]=Count'[2][4]+Count[2][4]=18+l=19

が得られる。

[0078] この結果は図 10Bに示された累計数ィ匕の結果と一致している。

[0079] [多段階並列ソート]

上記のカウンティングソートに基づく並列ソートは基数ソートの考え方と組み合わせることが可能である。項目値配列 VLのサイズが大きいとき、すなわち、項目値番号の個数が多数であるときには、項目値番号を基数で表現し、桁ごとに上記の並列ソートを実施することにより、効率的なソートを実現することが可能である。以下では、このような多段階並列ソート方法について説明する。特に、本実施の形態にかかる多段階並列ソートは、最下位の桁力始めて順番に現在の桁に関するソート処理を行い、最後に最上位の桁に関するソート処理を行うことによって最終的なソートを完了する。

[0080] 本発明の実施にかかる多段階並列ソート方法の一例でも、上記の並列ソート方法の例で使用した図 4Bのデータ構造を利用する。本実施の形態では、 CPUの台数は 4台とし、すべての CPUが並列に動作する例を考える。システム内の CPUの総数、及び、並列に動作する CPUの台数はこの例に限定されな、ことに注意すべきである。また、以下では、説明の便宜上、年齢の項目に関して、年齢の昇順にソートする場合を考える。また、年齢の項目値配列の要素は年齢の昇順に並べられている。図 4B のデータ構造では、年齢に関する項目値番号 VNoは 0から 4までの値を取り得るので、基数 =4として項目値番号を分解すると、項目値番号は下の桁と上の桁の 2桁に分解される。具体的には、項目値番号のモジュロ (4)の値が下の桁の値であり、項目値番号を 4で割った商が上の桁の値である。

[0081] 図 22は、本発明の実施の形態に力かる多段階並列ソート方法のフローチャートである。多段階並列ソート方法は、ステップ 2201からステップ 2205の 5ステップにより構成される。

[0082] ステップ 2201：項目値番号の範囲に応じて項目値番号の基数 (本例では基数 =4 )を選択し、初期のレコード番号配列 OrdSetを現在のレコード番号配列に設定し、項目値番号の最下位の桁 (本例では項目値番号のモジュロ（4)の値）を現在の桁に設定する。

[0083] ステップ 2202：現在のレコード番号配列を分割して 4台のプロセッサに割り当てる。

[0084] ステップ 2203 :4台のプロセッサのうちの各プロセッサにおいて、割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントする。

[0085] ステップ 2204：項目値番号の現在の桁の値の範囲を分割して 4台のプロセッサに割り当てる。

[0086] ステップ 2205 :4台のプロセッサのうちの各プロセッサにおいて、項目値番号の現在の桁の値の順番に、項目値番号の現在の桁の値が一致する範囲内ではレコード番号配列の部分の順番に従って、割り当てられた項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する。

[0087] ステップ 2206 :4台のプロセッサのうちの各プロセッサにおいて、割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数の累計数をポインタとして利用して、割り当てられたレコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する。

[0088] ステップ 2207：基数で表現された項目値番号の最上位桁までソート処理が行われた力どうかを判定し、最上位桁までソートされているならば、多段階並列ソート処理を終了する。

[0089] ステップ 2208 :未処理の桁が残っているならば、その桁を現在の桁に設定し、さらなるレコード番号配列を現在のレコード番号配列として、ステップ 2202へ戻る。

[0090] 上記の本発明の実施の形態に力かる多段階並列ソート方法において、ステップ 22 02からステップ 2206までのソート処理は、上記の本発明の並列ソート方法と同様の処理であり、項目値番号の代わりに項目値番号の現在の桁の値が使用される点だけが異なっている。

[0091] 次に、本発明の実施の形態に力かる多段階並列ソート方法を具体的に説明する。

本例では、図 4Bに示されたデータを、 4台の CPUを使用し、年齢の昇順でソートする。初期ィ匕ステップ 2201は、 1段階目のソート処理として、年齢の項目値番号のモジュロー 4 (MOD 4)の値（下位の桁の値）に関するソート処理を設定し、 2段階目のソート処理として、年齢の項目値番号の 4で割った商（DIV 4)の値に関するソート処理を設定する。

[0092] 初期ィ匕ステップ 2201では、図 6に示された Count配列と同様の配列が準備される。但し、本例の配列は、項目値番号の現在の桁の値の出現回数をカウントする配列である。

[0093] 図 23A、 B乃至図 25A、 Bは、多段階並列ソート方法の第 1段階のカウントステップ 2203の説明図である。図 23Aのサブステップ 1では、たとえば、 CPU— 0は、 OrdS et[0]の値 0を読み出し、読み出された値 0を添字として、 VNo[0]の値 1を読み出し、この値 1のモジュロ一 4 (MOD4)の値 1を添字として、 Count— 0[1]の値 0を 1にィンクリメントする。同様に、 CPU— 1は、 OrdSet[5]の値 5を読み出し、この値 5を添字として、 VNo [5]の値 2を読み出し、この値 2の MOD4の値 2を添字として、 Count —1 [2]の値 0を 1にインクリメントする。以下、図 23Bのサブステップ 2、図 24Aのサブステップ 3、図 24Bのサブステップ 4及び図 25Aのサブステップ 5を実行することにより、図 25Bに示されるようなカウントアップ結果が得られる。図 23A、 B〜図 25A、 Bの配列 Count— 0の要素 Count— 0[i]は、じ？11 0が担当した配列0 361;の0 (13 et [0]力 OrdSet [4]の範囲内の各レコードに対応する年齢の項目値番号の下位の桁の値 iの出現回数を表わしている。たとえば、 Count— 0[0]は、 CPU— 0の担当範囲内の項目値番号の下位の桁の値 0の出現回数が 1回であることを表し、 Count 3 [1]は CPU— 3の担当範囲内の項目値番号の下位の桁の値 1の出現回数が 2 回であることを表す。

[0094] 図 26A、Bは多段階並列ソート方法の第 1段階の累計数化ステップの説明図である。本例では、昇順ソートに対応して、項目値番号の下位の桁の値の昇順に累計数ィ匕を行う。 CPU— 0は、配列 Countの 1行目（すなわち、項目値番号の下位の桁の値 0 )の累計数化を担当し、 CPU— 1乃至 CPU— 3は、それぞれ、配列 Countの 2乃至 4 行目（すなわち、項目値番号の下位の桁の値 1乃至 3)の累計数化を担当する。図 2 6Aに示されるように、累計数ィ匕は配列 Countの横方向（すなわち、添字が一致する行)を優先して行われ、次に、先行する行の累計数を後続する行の累計数に加算することにより、全体の累計数が決まる。尚、横方向の累計数ィ匕は、既に説明したように各 CPUが並列に実行可能である力単一の CPUが担当してもよい。

[0095] 図 27A、 B乃至図 29A、 Bは多段階並列ソート方法の第 1段階においてレコード番号をさらなるレコード番号配列に格納する転送ステップの説明図である。転送ステツプでは、各 CPUは、レコード番号配列 OrdSetから自分が担当する範囲内のレコード番号を読み出し、次に、そのレコード番号を添字として、ポインタ配列 VNoから項目値番号の下位の桁の値を読み出し、さらに、この項目値番号の下位の桁の値を添字として、自プロセッサに関連付けられた累計数ィ匕された Count配列カゝら累計数値を読み出し、この読み出された累計数値をポイントしてさらなるレコード番号配列 OrdS et'にレコード番号を格納すると共に、 Count配列の累計数値を 1ずつインクリメントする。図 29Bはこのような転送ステップの結果として第 1段階で得られたレコード番号配列 OrdSet'を表す。

[0096] 第 2段階では、第 1段階で得られたレコード番号配列 OrdSet'を初期条件として、年齢の項目値番号の上位の桁の値 (DIV 4の値）に関する昇順ソートを実行する。

[0097] 図 30は、本発明の実施の形態に力かる多段階並列ソート方法の第 2段階のステツプ 2202において、現在のレコード番号配列 OrdSet，を 4台の CPUに割り当て、それぞれの Count配列を準備した状態を示す図である。

[0098] 図 31A、 B乃至図 33A、 Bは、多段階並列ソート方法の第 2段階のカウントステップの説明図である。図 31Aのサブステップ 1では、たとえば、 CPU— 0は、 OrdSet' [0 ]の値 2を読み出し、読み出された値 2を添字として、 VNo [2]の値 4を読み出し、この値 1の 4で割った商（DIV4)の値 1を添字として、 Count— 0[1]の値 0を 1にインクリメントする。同様に、 CPU— 1は、 OrdSet' [5]の値 12を読み出し、この値 12を添字として、 VNo [12]の値 4を読み出し、この値 4の DIV4の値 1を添字として、 Count— 1 [1]の値 0を 1にインクリメントする。以下、図 31Bのサブステップ 2、図 32Aのサブステツプ 3、図 32Bのサブステップ 4及び図 33Aのサブステップ 5を実行することにより、図 33Bに示されるような第 2段階のカウントアップ結果が得られる。図 31A、 B〜33A 、 Bにおいて、配列 Count— 0の要素 Count— 0[i]は、 CPU— 0が担当した配列 Or dSet，の OrdSet' [0]から OrdSet[4]の範囲内の各レコードに対応する年齢の項目値番号の上位の桁の値 iの出現回数を表わしている。たとえば、 Count—0[0]は、 CPU— 0の担当範囲内の項目値番号の上位の桁の値 0の出現回数が 4回であることを表し、 Count— 3 [1]は CPU— 3の担当範囲内の項目値番号の上位の桁の値 1 の出現回数が 0回であることを表す。

[0099] 図 34は多段階並列ソート方法の第 2段階の累計数化ステップの説明図である。本例では、昇順ソートに対応して、項目値番号の上位の桁の値の昇順に累計数ィ匕を行う。多段階ィ匕によって項目値番号の上位の桁の値の個数は 2個に削減されているので、本例では、たとえば、 CPU— 0がすべての値の累計数ィ匕を担当する。図 34Aに示されるように、 CPU— 0は、 Count[0][0]、 Count[l][0]、 Count[2][0]、 Count[3][0]、 C ount[0][l]、 Count[l][l]、 Count[2][l]、及び、 Count[3][l]の順に累計数化を行う。勿論、本例の場合に、 CPU— 0と CPU— 1の 2台の CPUに項目値番号の上位の桁の値 0と 1を割り当て、 2台の CPUが累計数ィ匕演算を行ってもよい。

[0100] 図 35A、 B乃至図 37A、 Bは多段階並列ソート方法の第 2段階においてレコード番号をさらなるレコード番号配列に格納する転送ステップの説明図である。転送ステツプでは、各 CPUは、レコード番号配列 OrdSetから自分が担当する範囲内のレコード番号を読み出し、次に、そのレコード番号を添字として、ポインタ配列 VNoから項目値番号の上位の桁の値を読み出し、さらに、この項目値番号の上位の桁の値を添字として、自プロセッサに関連付けられた累計数ィ匕された Count配列カゝら累計数値を読み出し、この読み出された累計数値をポイントしてさらなるレコード番号配列 OrdS et"にレコード番号を格納すると共に、 Count配列の累計数値を 1ずつインクリメントする。図 37Bはこのような転送ステップの結果として第 2段階で得られたレコード番号配列 OrdSet"を表す。

[0101] 本実施例の多段階並列ソート方法は項目値番号の下位の桁と上位の桁の 2段階により構成されているので、これ以上のソート処理は行われない。したがって、第 2段階で得られたレコード番号配列 OrdSet"が最初のレコード番号配列 OrdSetを年齢に関して昇順にソートを行った結果である。

[0102] 図 38A〜C及び図 39A、 Bは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる昇順の多段階並列ソート方法を適用した結果を示す図である。本例では、年齢に関する昇順ソートを行ったので、結果のレコード番号配列 OrdSet"には、年齢の項目値として 16歳、 18歳、 20歳、 21歳及び 23歳を有するレコードが年齢順に並んでいることがわかる。また、年齢が一致するレコードの順番は、元のレコード番号配列 OrdSet中の順番が保存されている。この結果は、図 14A〜C及び図 15 A、Bに示された本発明の実施の形態に力かる昇順の並列ソート方法を図 4Bのデータ構造に適用した結果と一致している。

[0103] また、上記の多段階並列ソート方法は昇順ソートであるが、本発明の多段階並列ソートは降順ソートでも同様に動作する。さらに、既に説明したように、多段階並列ソートの各段階における累計数ィ匕演算は、複数台のプロセッサで並列処理してもよぐ或いは、少なくとも 1台、好ましくは、 1台のプロセッサが単独で処理してもよい。

[0104] [多段階ソート]

上記の多段階並列ソートは、最下位の桁力も始めて順番に現在の桁に関するソート処理を行い、最後に最上位の桁に関するソート処理を行うことによって最終的なソートを完了している。これに対して、最上位の桁力も始めて順番に現在の桁に関するソート処理を行い、最後に最下位の桁に関するソート処理を行うことによって最終的なソートを完了することも可能である。以下では、このような最上位力も最下位の順にソート処理を多段化する方法を簡単に説明する。

[0105] 本例では、図 40に示されるようなデータ構造を利用する。また、本例では、 CPUの台数は 1台とする。また、以下では、年齢の項目に関して、年齢の昇順にソートする場合を考える。レコードの総数はレコード番号 0からレコード番号 19までの 20個であり、項目値番号は 0から 8までの 9個である。すなわち、実際の年齢の値は、 15、 16、 18、 19、 20、 21、 23、 25及び 28の 9通りである。図 40のデータ構造では、年齢に関する項目値番号 VNoは 0から 8までの値を取り得るので、基数 =4として項目値番号を分解すると、項目値番号を 4で割った商が上の桁の値であり、項目値番号のモジュロ（4)の値が下の桁の値である。項目値番号の上の桁は 0、 1及び 2の 3通りの値を取り、下の桁は 0、 1、 2及び 3の 4通りの値を取り得る。

[0106] 最初に、第 1段階において、上の桁の値 0、 1及び 2の出現回数をカウントするための配列 Count— 1を準備し、要素を 0で初期化する。たとえば、 Count-l[0]は、項目値番号の上位の桁の値が 0であるレコードの個数をカウントするための領域である。

[0107] 次に、レコード番号配列 OrdSetの先頭の要素（すなわち、レコード）力順番に、その要素に対応する項目値番号を配列 VNoから読み出し、その項目値番号を 4で割った商の値をポインタとして用いて、配列 Count— 1の要素の値をインクリメントする。図 41A〜Dは、 OrdSet[0] =0、 OrdSet [7] = 7,及び、 OrdSet[19] = 19の 3 個のレコード番号について、項目値番号の上位の桁の値を算出し、該当するカウンタをカウントアップし、次に累計数ィ匕する例の説明図である。図 41C力もわ力るように、この第 1段階のカウントアップ処理により、項目値番号の上位の桁の値力^であるレコードの個数は 12個、上位の桁の値が 1であるレコードの個数は 7個、上位の桁の値力 S 2であるレコードの個数は 1個である。さらに、図 41Dに示されるように、このカウント値を累計数化する。

[0108] 次に、項目値番号の上位の桁の値の出現回数が累計数ィ匕された配列 Aggr— 1を用いて、レコード番号配列 OrdSetをさらなるレコード番号配列 OrdSet'に変換する。具体的には、 OrdSet [i] =jであるならば、 VNo [j]を読み出し、この VNo [j]を 4で割った商 (VNo [j] DIV 4)を kとすると、 Aggr— l [k]の値を読み出し、 OrdSet[A ggr— 1 [k] ]にレコード番号 jを設定し、 Aggr- 1 [k]をインクリメントする。図 42A、 B は、このような多段階ソートにおけるレコード番号転送処理の説明図であり、図 42A は OrdSet [0]の転送を、図 42Bは OrdSet [19]の転送を表している。図 43は、第 1 段階のレコード番号転送の結果のレコード番号配列 OrdSet'と、上位の桁の値が分布する範囲とを表している。たとえば、上位の桁の値が 0であるレコードはレコード番号配列 OrdSet'の OrdSet' [0]から OrdSet' [11]の範囲（区間 0)に分布し、上位の桁の値が 1であるレコードはレコード番号配列 OrdSet'の OrdSet' [12]から Ord Set' [18]の範囲（区間 1)に分布し、上位の桁の値が 2であるレコードはレコード番号配列 OrdSet'の OrdSet' [19] (区間 2)に存在する。 [0109] 次に、多段階ソートの第 2段階では、各区間内で、項目値番号の下位の桁の値によつてレコード番号をソートする。たとえば、 OrdSet'の区間 1は、 OrdSet"の対応した区間 1へ転送される。第 2段階のソートでは、既に上位の桁で区間が定められているので、レコード番号が区間外に転送されることはない。

[0110] 図 44は、多段階ソートの第 2段階の初期状態を表す図である。以下の説明では、 O rdSet'の区間 1について説明する。たとえば、複数台のプロセッサが存在する場合には、区間ごとにプロセッサを割り当てることにより、以下の処理を並列化することも可能である。 Count— 2は区間 1内で項目値番号の下位の桁の値（0, 1, 2, 3)の出現回数をカウントするための配列である。

[0111] 図 45A〜Cは、多段階ソートの第 2段階のカウントアップ及び累計数ィ匕の説明図である。図 45Aから始めて順番にカウントアップすることにより、図 45Bに示されるようなカウントアップ配列が得られる。このカウントアップ配列は、図 45Cに示されるように累計数化される。

[0112] 最後に、第 2の累計数配列 Aggr— 2をポインタとして利用して、レコード番号配列 O rdSet，の区間 1をレコード番号配列 OrdSet"の区間 1へ転送することにより、多段階ソートが完了する。図 46A、 Bは、多段階ソートの第 2段階のレコード番号転送の説明図である。具体的には、 OrdSet' [i] =jであるならば、 VNo [j]を読み出し、この VN o [j]を 4で割った余り（VNo [j] MOD 4)を kとすると、 Aggr— 2 [k]の値を読み出し、 OrdSet" [Aggr— 2 [k] ]にレコード番号 jを設定し、 Aggr— 2 [k]をインクリメントする。図 46Aは OrdSet' [14]の転送を、図 46Bは OrdSet' [18]の転送を表している。図 46Bの OrdSet"の区間 1は、区間 1の最終的なソート結果を表している。

[0113] 区間 1と同様に、その他の区間 0、区間 2についても第 2段階のカウントアップ、累計数化、及び、レコード番号転送を適用することにより、レコード番号配列 OrdSetの全体がレコード番号配列 OrdSet"へ転送され、ソートが完了する。

[0114] 前述したように、本発明の実施の形態においては、コンピュータシステム 10にレコードの所定の項目の項目値に応じてレコード順を並べ替えるプログラムを実行させる。より具体的には、本実施の形態においては、以下のように、プログラムは、各 CPU に、上述した処理ステップを実行させ、或いは、上述した機能を実現させる。 [0115] 本実施の形態において、コンピュータシステム 10には、 OS (たとえば、リナックス（L inux:登録商標））が搭載される。初期的には、 OSの制御にしたがって、ある CPU ( たとえば、 CPU12- 1)力プログラムをメモリ（たとえば共有メモリ 14)にロードする。プログラム力 Sメモリにロードされると、 CPU12— 1、 12- 2, . . .、 12— pの各々が処理を実行すべき場合には、 OSの制御の下、各 CPUに、それぞれ、所定の機能を実現させる。つまり、各 CPUが、共有メモリ 14に記憶されたプログラム中の所定の処理ステップを読み出し、当該処理ステップを実行する。その一方、特定の CPUが処理をすべき場合には、 OSの制御の下、当該特定の CPUに、他の所定の機能を実現させる。つまり、特定の CPUのみ力共有メモリ 14に記憶されたプログラム中の他の所定の処理ステップを読み出し、当該他の所定の処理ステップを実行する。なお、各 C PUが実行するプログラムの格納場所は、上記共有メモリ 14に限定されず、各 CPU に付随するそれぞれのローカルメモリ（図示せず)でもよ、。

[0116] このように、本実施の形態においては、 OSの制御の下、プログラムは、各 CPUに所定の機能を実現させるとともに、必要に応じて、特定の CPUに、他の所定の機能を実現させることができる。

[0117] 本発明は、以上の実施の形態に限定されることなぐ特許請求の範囲に記載された発明の範囲内で、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

図面の簡単な説明

[0118] [図 1]図 1は本発明の実施の形態に力かるコンピュータシステムの概要図である。

[図 2]図 2はデータ管理機構を説明するための表形式データの一例を表す図である。

[図 3]図 3は本発明の実施の形態に力かるデータ管理機構の説明図である。

[図 4]図 4A、Bは本発明の実施の形態に力かるソート対象のデータ構造の説明図である。

[図 5]図 5は本発明の実施の形態に力かる並列ソート方法のフローチャートである。

[図 6]図 6は本発明の実施の形態に力かる並列ソート方法の初期ィ匕ステップの説明図である。

[図 7]図 7A、Bは本発明の実施の形態に力かる並列ソート方法のカウントアップステツプの説明図（その 1)である。

[図 8]図 8A、Bは本発明の実施の形態に力かる並列ソート方法のカウントアップステツプの説明図（その 2)である。

[図 9]図 9A、Bは本発明の実施の形態に力かる並列ソート方法のカウントアップステツプの説明図（その 3)である。

[図 10]図 10A、Bは本発明の実施の形態に力かる昇順の並列ソート方法の累計数ィ匕ステップの説明図である。

[図 11]図 11A、Bは本発明の実施の形態に力かる昇順の並列ソート方法の転送ステップの説明図（その 1)である。

[図 12]図 12A、Bは本発明の実施の形態に力かる昇順の並列ソート方法の転送ステップの説明図（その 2)である。

[図 13]図 13A、Bは本発明の実施の形態に力かる昇順の並列ソート方法の転送ステップの説明図（その 3)である。

[図 14]図 14A〜Cは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる昇順の並列ソート方法を適用した結果を示す図（その 1)である。

[図 15]図 15A、 Bは、図 4Bに示されたデータ構造に対して本発明の実施の形態にか力る昇順の並列ソート方法を適用した結果を示す図（その 2)である。

圆 16]図 16A、Bは本発明の実施の形態に力かる降順の並列ソート方法の累計数ィ匕ステップの説明図である。

圆 17]図 17A、Bは本発明の実施の形態に力かる降順の並列ソート方法の転送ステップの説明図（その 1)である。

[図 18]図 18A、Bは本発明の実施の形態に力かる降順の並列ソート方法の転送ステップの説明図（その 2)である。

[図 19]図 19A、Bは本発明の実施の形態に力かる降順の並列ソート方法の転送ステップの説明図（その 3)である。

[図 20]図 20A、 Bは、図 4Bに示されたデータ構造に対して本発明の実施の形態にかかる降順の並列ソート方法を適用した結果を示す図（その 1)である。

[図 21]図 21A〜Cは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる降順の並列ソート方法を適用した結果を示す図（その 2)である。

圆 22]図 22は本発明の実施の形態に力かる多段階並列ソート方法のフローチャートである。

圆 23]図 23A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 1段階のカウントアップステップの説明図（その 1)である。

圆 24]図 24A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 1段階のカウントアップステップの説明図（その 2)である。

圆 25]図 25A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 1段階のカウントアップステップの説明図（その 3)である。

圆 26]図 26A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 1段階の累計数化ステップの説明図である。

圆 27]図 27A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 1段階の転送ステップの説明図（その 1)である。

圆 28]図 28A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 1段階の転送ステップの説明図（その 2)である。

圆 29]図 29A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 1段階の転送ステップの説明図（その 3)である。

圆 30]図 30は本発明の実施の形態に力かる多段階並列ソート方法の第 2段階の初期ィ匕ステップの説明図である。

圆 31]図 31A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 2段階のカウントアップステップの説明図（その 1)である。

圆 32]図 32A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 2段階のカウントアップステップの説明図（その 2)である。

圆 33]図 33A、Bは本発明の実施の形態に力かる多段階並列ソート方法の第 2段階のカウントアップステップの説明図（その 3)である。

圆 34]図 34は本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 2段階の累計数化ステップの説明図である。

圆 35]図 35A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 2段階の転送ステップの説明図（その 1)である。

圆 36]図 36A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第

〇

2段階の転送ステップの説明図（その 2)である。

圆 37]図 37A、Bは本発明の実施の形態に力かる昇順の多段階並列ソート方法の第 2段階の転送ステップの説明図（その 3)である。

[図 38]図 38A〜Cは、図 4Bに示されたデータ構造に対して本発明の実施の形態に力かる昇順の多段階並列ソート方法を適用した結果を示す図（その 1)である。

[図 39]図 39A、 Bは、図 4Bに示されたデータ構造に対して本発明の実施の形態にか力る昇順の多段階並列ソート方法を適用した結果を示す図 (その 2)である。

圆 40]図 40は多段階ソートを説明するためのデータ構造図である。

圆 41]図 41A〜Dは多段階ソートの第 1段階のカウントアップ及び累計数ィ匕の説明図である。

圆 42]図 42A、Bは多段階ソートの第 1段階のレコード番号転送の説明図である。圆 43]図 43は多段階ソートの第 1段階のレコード番号転送の結果の説明図である。圆 44]図 44は多段階ソートの第 2段階の初期状態を表す図である。

圆 45]図 45A〜Cは多段階ソートの第 2段階のカウントアップ及び累計数ィ匕の説明図である。

圆 46]図 46A、Bは多段階ソートの第 2段階のレコード番号転送の説明図である。符号の説明

コンピュータシステム

12- 1, 12- 2, · · · , 12-p

14 共有メモリ

16 ROM

18 固定記憶装置

20 CD— ROMドライバ

22 I/F

24 入力装置

26 表示装置

Claims

請求の範囲

[1] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

を具備した共有メモリ型マルチプロセッサシステムにおいて、レコードの所定の項目の項目値に応じてレコード順を並べ換える情報処理方法であって、

前記レコード番号配列を分割して第 1の複数台のプロセッサに割り当てるステップと前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の出現回数を力ゥントするステップと、

前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、

を含む情報処理方法。

[2] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

を含み、

前記ソート処理が、

前記項目値番号の現在の桁の値の範囲を分割して第 2の複数台のプロセッサに割り当てるステップと、

前記第 2の複数台のプロセッサのうちの各プロセッサにおいて、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記割り当てられた項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換するステップと、

前記第 1の複数台のプロセッサのうちの各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、を含む、情報処理方法。

表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

を含み、

前記ソート処理が、

前記現在のレコード番号配列を分割して前記複数台のプロセッサに割り当てるステップと、

各プロセッサにおいて、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントするステップと、少なくとも 1台のプロセッサにおいて、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記割り当てられた項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換するステップと、

前記各プロセッサにお、て、前記割り当てられたレコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記割り当てられた前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納するステップと、を含む、

情報処理方法。

[4] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

を含む、

情報処理方法。

[5] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

を含む、

情報処理方法。

[6] 共有メモリと前記共有メモリにアクセス可能である複数台のプロセッサとを具備した共有メモリ型マルチプロセッサシステムであって、

前記共有メモリが、表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶し、

各プロセッサが、

を含む、

共有メモリ型マルチプロセッサシステム。

[7] 前記項目値番号の範囲のうち先行する範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって得られた前記累計数が、直後の範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって参照される、請求項 6 に記載の共有メモリ型マルチプロセッサシステム。

共有メモリと前記共有メモリにアクセス可能である複数台のプロセッサとを具備した共有メモリ型マルチプロセッサシステムであって、

各プロセッサが、

を含み、

前記ソート処理を繰り返す手段が、

を含む、

共有メモリ型マルチプロセッサシステム。

[9] 前記項目値番号の現在の桁の範囲のうち先行する範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって得られた前記累計数が、直後の範囲を受け持つプロセッサの前記出現回数を累計数に変換する手段によって参照される、請求項 8に記載の共有メモリ型マルチプロセッサシステム。

[10] 共有メモリと前記共有メモリにアクセス可能である複数台のプロセッサとを具備した共有メモリ型マルチプロセッサシステムであって、

各プロセッサが、

を含み、

前記ソート処理を繰り返す手段が、

を含み、

少なくとも 1台のプロセッサの前記ソート処理を繰り返す手段力前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する手段を含み、

前記ソート処理を繰り返す手段が、前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する手段をさらに含む、

共有メモリ型マルチプロセッサシステム。

[11] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

各プロセッサに、

前記レコード番号配列のうち自プロセッサが受け持つ部分を決める機能と、前記レコード番号配列の部分に含まれるレコードに対応した項目値番号の出現回数をカウントする機能と、

前記項目値番号の範囲のうち自プロセッサが受け持つ範囲を決める機能と、前記項目値番号の順番に、前記項目値番号が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記受け持つ範囲内の項目値番号のそれぞれの出現回数を累計数に変換する機能と、

前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する機能と、

を実現させるためのプログラム。

[12] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

各プロセッサに、

前記項目値番号の範囲に応じて前記項目値番号の基数を設定する機能と、前記基数で表現された前記項目値番号の最下位桁から最上位桁まで順番に現在の桁を設定し、 1回目は前記レコード番号配列を現在のレコード番号配列として、 2 回目以降はさらなるレコード番号配列を現在のレコード番号配列として設定し、前記現在の桁のソート処理を制御する機能と、

前記レコード番号配列のうち自プロセッサが受け持つ部分を決める機能と、前記レコード番号配列の部分に含まれるレコードに対応した項目値番号の現在の桁の値の出現回数をカウントする機能と、

前記項目値番号の現在の桁の値の範囲のうち自プロセッサが受け持つ範囲を決める機能と、

前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記受け持つ範囲内の項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する機能と、

前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する機能と、

を実現させるためのプログラム。

各プロセッサに、

を実現させ、

少なくとも 1台のプロセッサに、前記項目値番号の現在の桁の値の順番に、前記項目値番号の現在の桁の値が一致する範囲内では前記レコード番号配列の部分の順番に従って、前記項目値番号の現在の桁の値のそれぞれの出現回数を累計数に変換する機能を実現させ、

前記各プロセッサに、前記レコード番号配列の部分に含まれるレコードに対応した前記項目値番号の現在の桁の値の累計数をポインタとして利用して、前記レコード番号配列の部分に含まれるレコード番号をさらなるレコード番号配列に格納する機能をさらに実現させるためのプログラム。

前記共有メモリにアクセス可能である複数台のプロセッサと、を具備した共有メモリ型マルチプロセッサシステムにおいて、

前記レコード番号配列の部分が割り当てられた前記複数台のプロセッサのうちの各プロセッサに、前記割り当てられたレコード番号配列の部分に含まれるレコードの順番を当該レコードに対応した項目値番号に応じて入れ替え、当該レコードのレコード番号をさらなるレコード番号配列に格納する機能を実現させるためのプログラム。

[15] 表形式データのレコードのレコード番号が所定のレコード順に従って格納されたレコード番号配列、表形式データのレコードの所定の項目の項目値に対応する項目値番号がレコード番号に従って格納された項目値番号配列、及び、表形式データの項目値が当該項目値に対応する項目値番号の順序に従って格納された項目値配列を記憶する共有メモリと、

少なくとも 1台のプロセッサに、

前記項目値番号の範囲に応じて前記項目値番号の基数を設定する機能と、前記基数で表現された前記項目値番号の上位の桁に関して前記レコード番号配列中のレコード番号を並べ換え、前記項目値番号の上位の桁の値の順番に区分された中間的なレコード番号配列を生成する機能と、

を実現させ、

前記中間的なレコード番号配列の区分ごとに割り当てられた各プロセッサに、前記中間的なレコード番号配列の前記区分内のレコード番号を前記項目値番号の下位の桁の値の順番に並べ換える機能を実現させるためのプログラム。

[16] 請求項 11乃至 15のうちいずれか 1項に記載のプログラムを記録したコンピュータ読み取り可能な記憶媒体。