JPH0748220B2

JPH0748220B2 - データを構成、管理又は検索するための方法及び装置

Info

Publication number: JPH0748220B2
Application number: JP2019393A
Authority: JP
Inventors: トツド・アレン・スミス; ロバート・ジヨン・アークハート
Original assignee: インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date: 1989-01-31
Filing date: 1990-01-31
Publication date: 1995-05-24
Anticipated expiration: 2010-05-24
Also published as: EP0381418A3; EP0381418A2; JPH02231675A

Description

【発明の詳細な説明】 A.産業上の利用分野本発明はデータ処理システム中に記憶されたデータの検
索に関し、さらに詳しくはスペース効率ハツシユ検索テ
ーブルを用いてキーにより認識されるテーブル・エント
リの検索方法に関する。

B.従来技術および解決課題データ処理プログラム情報の多くの部分は後の使用のた
めに記憶あるいは分離されている。この情報はデータ処
理プログラムによつて処理される対象として、例えばカ
スタマ、サプライア等の名前がついている。検索テーブ
ルは情報記憶のためのデータ構造としてよく使われる。
第４図および第５図に見られるようにテーブル10はエン
トリ16を有し、各エントリはキー12を有する。キー12に
加え、各エントリは分離された追加情報を持つ。第４
図、第５図の実施例においてはキー12としてラストネー
ムを持ち、追加情報として対応の電話番号を持つ。すな
わち、キー12に対するデータ14である。検索テーブルに
おいて実行される基本的な処理には次のようなものがあ
る。

INSERT テーブル中に新しいエントリを挿入 DELETE テーブル・エントリの削除 FIND 与えられたキーによつてすべての（又は１つの）
エントリを発見これらの用語は本説明において通常使用されるものとし
て扱うが、他のシステムでは同様の処理を異なる用語で
行うこともある。

FINDがINSERTあるいはDELETEよりも頻繁に使用される環
境においては、検索テーブルは非常に有用である。とい
うのはFIND処理はINSERTあるいはDELETE処理に比較して
非常に早く処理できるからである。さらに、FINDは検索
テーブルの基本的処理であり、INSERTおよびDELETEは多
くの場合、必ずしも必要ではない。

多くのデータ構造においては、効率的な情報検索の問題
はアドレスである。第４図に示すように、最も単純な検
索テーブル構造はリスト中にエントリを順番に配列した
ものである。このようなテーブル10の検索は各エントリ
を初めから所定のキー12が見つかるまで順次確かめるも
のである。これは不要なエントリを見る必要があり、時
間のかかる結果となる。Ｎ個のエントリのテーブルで
は、目的のものを探すのに平均N/2のエントリを確かめ
なければならない。さらに、所定のキーがテーブル中に
存在しない場合にはすべてのＮエントリを確認する必要
がある。この構成にも調書が無いわけではない。これは
シンプルであり、スペースの無駄がなく、エントリ・サ
イズのＮ倍のスペースを使用する。シーケンシヤル検索
テーブルのサーチをスピードアツプする方法もある。例
えば「テーブル・サーチ処理」“IBM Technical Disclo
sure Bulletin,Vo1.17,No.4,September 1984,page 964-
965"である。しかし、検索時間はテーブルの大きさＮに
比例するという問題は解決されない。

検索テーブルの検索効率を高める方法として、シーケン
シヤル・テーブルの記憶データをキーの順序に上から順
に、あるいは下から順にソートすることである。例え
ば、第２図に示すようにデータ14をキー12のラストネー
ムのアルフアベツト順に上から配列する。テーブルがこ
のように構成されていれば、検索対象となる所定のキー
以降については検索必要のないことが確信できる。従つ
て、エントリ発見に要する時間は平均でN/2となり、テ
ーブル中に所定のキーがないことを確認するのに要する
時間もN/2となる。この検索方法はソート・リニア・サ
ーチと以下呼ぶ。

このようなソート・シーケンシヤル検索テーブルを用い
て、検索速度を高めることはできる。この検索技術を２
進サーチと呼ぶ。この２進サーチの使用により、FIND処
理の効率は大きく高められる。２進サーチの間、テーブ
ル・エントリの並びは維持される。検索キーはこのレン
ジにあるかもしれないし、このテーブルには無いかもし
れない。最初、このレンジはすべてのテーブルをカバー
する。２進サーチのかくステツプの間、このレンジの中
間が確かめられる。これが対象キーであれば値その時点
で検索は完了する。そうでなければ、中間のキーと検索
対象キーの比較結果に基づいて、中間エントリを上側値
又は下側に調整する。次に、新しいレンジにおいて、中
間エントリを確かめる。かくステツプにおいて、レンジ
は２分されるこの処理はレンジに残りのテーブル・エン
トリがなくなるか、所望のキーが見つかるまで続けられ
る。各ステツプにおいてレンジのエントリ数は半分に削
減される。従つて、サーチはlogNに比例して終息する。
この検索テーブル構成はコンパクトであり、エントリの
Ｎ倍に比例したスペースを必要とするのみである。しか
し、これはINSERT、DELEATE処理が実行されるごとにエ
ントリの再構成を必要とする。先に述べたように、FIND
処理を最大限に利用することが重要である。２進サーチ
手法については「テーブル検索」“IBM Technical Disc
losure Bulletin,Vol.14,No.10,March 1972"に記載され
ている。

さらに高速の検索テーブル構成は「ハツシング」を使用
したものである。このハツシングを基本としたテーブル
においてはテーブル中にエントリを入れる際の第１ステ
ツプはエントリ・キーをハツシユすることである。これ
はキーに対してハツシユ機能、すなわちキーによつて０
からＭ−１のランダムな値を応答する機能を付与するこ
とを含む。ここでＭはテーブルのエントリ数の最大値で
ある。良好なハツシユ機能は２つの似たキーに対して全
く異なる値を生成する。例えば、挿入されるエントリに
対してＨのハツシユ値が得られると、エントリはＨによ
つて識別される位置、あるいはそれに続く位置であいて
いる部分に挿入される。重要なFIND処理は検索キーのハ
ツシング、その位置におけるテーブルのサーチを始める
ことによつて素早く実行される。同じインデツクスに複
数のキーがハツシユしている場合は複数のサーチが必要
となる。テーブル・エントリの10〜20％を未使用状態に
しておけば、２番目のサーチ総量はメモリの使用を最小
にしたものにできる。このハツシユ検索テーブル方法
は、テーブルが完全に埋まつた状況でない限りにおいて
は従来の２進サーチ技術よりも速いFIND処理を達成す
る。

ハツシユ・ベース検索テーブルの例を第6A〜第6J図の解
放アドレス・ハツシユ検索テーブル11として示す。テー
ブル11は０から11の12、すなわちＭ−１のエントリを持
つ。エントリ数は第6J図に示すようにデータ14よりも20
％多い。ハツシユ・ベース検索テーブル11は、例えばキ
ー12のラストネームをハツシユするために以下のハツシ
ユ関数13を適用する。

ハツシユ関数ｆ（Ａ）＝1,f（Ｂ）＝2,...f（Ｚ）＝26 hash（“ABC"）＝（ｆ（Ａ）＋ｆ（Ｂ）＋ｆ（Ｃ））mo
d12 このハツシユ関数の意味はラストネームの各々にアルフ
アベツトに対応する１から26までの数字を付与すること
である。ラストネームの各々に数値が与えられる。加算
値が11に達したら、また０から11を繰り返す。このラス
トネーム12のハツシユ関数の結果は第6K図に示す。

テーブルへのデータ14の挿入は以下のようにして実行さ
れる。最初に「Johnson」がハツシユされ、第6A図に示
すようにテーブル11の位置11にデータ14とともに挿入さ
れる。同様に、次に続くネームとデータがテーブル11
に、以下のように挿入される。Backlundが８番目の位置
（第6B図）、Smithが９番目の位置（第6C図）、Gossが
０番目の位置（第6D図）、Bledsoeが２番目の位置（第6
E図）、Olsonが３番目の位置（第6F図）、である。「Tu
rner」のハツシユ関数結果は０であり、この場合は０番
に続くあいているスペースに入る。Gossが０番を占めて
いるので、第6G図に示すように次の１番のスペースに入
る。同様にWilsonはハツシユ関数結果が第6K図に示すよ
うにBucklundと同じ８である。Smithが９番目を占めて
いるので、８番に続く最初の空きスペースは第6H図に示
すように10番目の位置となる。次にNashのハツシユ関数
結果は６となる。Nashは第6I図のごとく、そのデータと
ともに６番目に挿入される。最後にハツシユ関数はMorg
anに適用され、値８が得られる。Backloundがすでに８
の値を持つているので、８番に続く空きスペースを捜
す。９番、10番、11番はすでにSmith、Wilson、Johson
によつて占有されているので、ここから０に戻つて捜す
こととなる。０番、１番、２番、３番もGoss、Turner、
Bledsoe、Olsonによつて占有されているので８番に続く
最初の空きスペースは第6J図に示すように４番となる。

第6J図において、FIND処理は以下のように実行される。
検索のキーがSmithであるとすると、ハツシユ関数がSmi
thに適用され、結果９を生成する。FIND処理は即座にキ
ーSmithおよび対応データを捜すために９番目の位置に
行く。同様に、Morganがキーである場合はハツシユ関数
がMorganに適用され、８が産出される。しかし、FIND処
理が８番目に直行しても、そこには検索キーはない。追
加サーチがキーMorganを検索するために、８番目の位置
から始められる。

第7A〜7J図に同じハツシユを有するテーブルの異なるハ
ツシユ構成リンク・エントリを示す。この方法ではエン
トリのＭ個のリンク・リストが保持される。検索キーが
第7Aに示すように０〜Ｍ−１の範囲にハツシユされる。
所望のキーを有するエントリをサーチするために対応リ
ンク・リストが検索される。この方法を使用したエント
リの検索に要する時間は平均N/（2M）である。これはリ
ストにおいてもハツシユ関数がＮエントリに貢献するか
らである。しかし、速度はアツプするが、この方法はリ
ストの次のエントリへのリンクをホールドするために各
エントリに追加スペースが必要となる。

第7A〜7J図はリンク・ハツシユ検索テーブルによる方法
を示したものである。この例では第7A図における各キー
12は以下に示すハツシユ関数によつてハツシユされる。

ハツシユ関数ｆ（Ａ）＝1,f（Ｂ）＝2,...f（Ｚ）＝26 hash（“ABC"）＝（ｆ（Ａ）＋ｆ（Ｂ）＋ｆ（Ｃ））mo
d10 このハツシユ関数から得られた値は第7A図13に示す。Jo
hnsonのハツシユ値は５であり、エントリのリンク・リ
スト18の５番目のエントリは０である。従つて、キーJo
hnsonおよび関連データは第7B図のテーブル17の０番の
位置にある。同様に、Backlundのハツシユ値は８であ
り、リンク・リストの８番目のエントリは１であるの
で、キーBacklundおよび関連データは第7C図のテーブル
17の１番の位置にある。このプロセスがSmith、Goss、B
ledsoeと第7D、7E、7F図に示すように進行する。しか
し、Olsonはハツシユ値が５となり、０番の位置にあるJ
ohnsonと同様になる。従つて、０番の位置において、５
を有するリンク15が０のハツシユ値のOlsonに対して５
番目の位置を提供する（第7G図、テーブル17参照）。同
様に、Wilsonのハツシユ値も第7A図に示すようにBledso
eと同じ２となる。リンク・リスト18の２番目の位置はB
ledsoeによつてテーブル17の４番目の位置が占められて
いる４番目の位置のリンク15は７の値を持ち、第7H図に
示すようにこの位置にWilsonを見つけることができる。
同様に、Nashも値２を持ち、リンク・リスト18の２番
は、位置４のBledsoeによつて占められ、この４番の位
置はWilsonに対応するリンク値７を持ち、この７番の位
置はリンク値８を持ち、ここに最終的なキーNashを見出
すことができる（第7I図参照）。10のエントリが完了し
た図を第7J図に示す。

ハツシユ手段を使用した他の態様としては以下に示す文
献に記載されている。「ハツシングによるインデツクス
手法」、IBM Technical Disclosure Bulletin,Vol.16,N
o.3,August 1973;「キヤツシユ及び／または仮想メモリ
を使用したコンピユータにおけるハツシユおよびインデ
ツクス技術の改良」、IBM Technical Disclosure Bulle
tin,Vol.31,No.1,June 1988;「ハツシユ・ツリー」、IB
M Technical Disclosure Bulletin,Vol.30,No.5,Octobe
r 1987. C.発明の概要および解決課題本発明の目的は、従来の方法に比較して、より速い検索
テーブルにおけるエントリの検索手段を提供し、なお、
従来の方法よりも少ないスペースの使用を達成すること
を目的とする。

本発明のシステムおよび装置においては、高速検索テー
ブルは、１つの小さなエクストラルメモリを使用するよ
うに構成されている。通常のハツシユ・テーブルにおい
ては使用メモリの総量はエントリの数に比例し、エント
リ数の内容およびエントリサイズには比例しない。

本発明の検索テーブルはエントリのベクトルとして考え
られる。テーブル中のエントリは、各エントリ・キーの
ハツシユ値によつて定義されるソート順に保持される。
単純なハツシングでは10〜20％の予約部分が要求される
のに対して、サイズＮのベクトルにおいてはＮエントリ
が保持される。オフセツト・テーブルと呼ばれるＮオフ
セットのエクストラ・ベクトルが保持される。FIND処理
によつてキーがハツシユされ、オフセツト・テーブルで
のインデツクスを獲得する。さらに、オリジナル・イン
デツクスにオフセツト値を加算して、サーチの開始され
るテーブル・エントリのベクトルでのインデツクスを獲
得する。オフセツト・ベクトル中での次の位置（next p
osition）におけるオフセツトがテーブル・エントリす
なわち、キーによつて検索されていたテーブル・エント
リのベクトル中の位置を検索する。これらの手段はFIND
処理が、検索キーを持つエントリがないことを全くサー
チせずに判断することを可能とする。従つて、FIND処理
は第２のサーチに、速い２進サーチを適用できる。

このオフセツト・ハツシングはリンク・ハツシング法と
同じオーダーのサーチ・タイムを持つ。最初のハツシユ
はエントリ・バケツトのサーチに続いて実行される。オ
フセツト・ハツシング構成においては、エントリ・バケ
ツトは近接したものであり、位置ｈ（キー）とｈ（キ
ー）＋１のオフセツト・テーブル中にあるオフセツトに
よつて制限される。リンク・ハツシング構成においては
エントリ・バケツトはすなわちリンク・リストである。
従つて、オフセツト・ハツシングのスピードは上述の検
索テーブルのなかでも最も早いものと同じか、ときには
それ以上のスピードを持つ。というのは第２サーチがリ
ンク・リストとは違い、連続的に実行されるからであ
る。オフセツト・ハツシング方法における他のスピード
上のメリツトはアルゴリズムを使用したデータの良好な
配置にある。良好な配置は仮想メモリにおけるページ不
在を減少させる。

２進サーチ検索テーブル構成は最も小スペースではある
がオフセツト・ハツシングほどのスピードはない。他の
ハツシング法はスピードはあつても、より多くのスペー
スが必要となる。オフセツト・ハツシング法においてス
ペース効率も考慮されたものがオフセツトのベクトルで
ある。オフセツトは極めて小さくでき、リンク・ハツシ
ング法におけるリンクよりも小さい。リンク・ハツシン
グ法の一般的な構成ではリンク・リスト・アンカーのベ
クトルおよび各エントリ中のリンクが必要とされる。オ
フセツト・ハツシング法では各エントリごとのリンクは
必要としない。

かなり、大きなテーブルにおいても、１バイトのオフセ
ツトが適当である。ハツシユ関数がＮ個のテーブル・ス
ロツトに導入された場合、最悪のオフセツト（テーブル
の中心において）は標準偏差分布をする。オフセツトは
正でも負でも有りえるので、4096のエントリのテーブル
の場合は４シグマに対して、16384のテーブルの場合は
２シグマに対して、１バイト・オフセツトが適当とな
る。たつた10ビツトのオフセツトで100万のエントリを
越えるテーブルの２シグマをカバーする。もし、ある状
態におけるオフセツトが所定のビツト数に適合しない場
合には、エスケープが供給され、第２サーチがエントリ
の一部において単純な２進サーチを実行する。１バイト
・オフセツトにおける適当なエスケープは、検索エント
リはテーブルの127前のエントリより前であることを示
す』＋128オフセツト、および検索エントリが127後のエ
ントリより後であることを示す−128のオフセツトであ
る。

D.実施例本発明における検索テーブルにおいて、ハツシユ関数は
各キーにおいてある値を生成するのに使用される。本実
施例において使用されるシツシユ関数は以下に示す通り
である。

ハツシユ関数ｆ（Ａ）＝1,f（Ｂ）＝2,...f（Ｚ）＝26 hash（“ABC"）＝（ｆ（Ａ）＋ｆ（Ｂ）＋ｆ（Ｃ））mo
d10 このハツシユ関数値を計算するいくつかのサンプル・コ
ードを以下に示す。

INPUT AS SUM＝０ FOR I＝1 TO LEN（AS） SUM＝SUM＋ASC（MIDS（AS,I,1）） −ASC（“a"）＋１ NEXT PRINT SUM MOD 10 上記のハツシユ関数の意味は、キーの各文字はアルフア
ベツトに対応した１から26までの値を持つということで
ある。各文字の値は加算される。加算がキー数−１の値
に達すると、加算は０に戻り繰り返される。第1A図に示
す場合、キー数は10である。したがつて、ハツシユ関数
は各キーに対して０から９までの値を生成する。第1A図
は各キー12に対するハツシユ関数13の値を示す。ここで
はキーはラスト・ネームを関連データは電話番号として
ある。

第1B図に示すごとく、エントリ16は、第1A図のリストの
各エントリ・キーのハツシユ関数13の値の順にソートさ
れたテーブル20中に保持されている。例えば、キーGoss
は０のハツシユ関数値13を持つ。従つて、エントリGoss
は第1B図のテーブル20の０番の位置にある。次のハツシ
ユ関数値は２であり、これはBledsoe、Wilson、およびN
ashに対応する。従つて、これらのエントリは第1B図の
テーブル20の次の位置に位置する。これらの３つのエン
トリはテーブル20の第１、第２、第３のどの位置に配置
されてもいいことになるが、この実施例ではアルフアベ
ツト順、すなわちBledsoeが１番、Nashが２番、そしてW
ilsonが３番の位置を占めている。これはすなわち、オ
フセツト・ハツシング検索テーブルにおいて、いくつか
のキーが同じ値になつたときのFIND処理の際に２進サー
チ、あるいはソート・リニア・サーチを可能とする。

第1A図に戻つて、値２の次のハツシユ値はキーJohnso
n、およびOlsonが持つ値５である。再び、同じハツシユ
値を持つものの２進サーチ用にテーブル20がアルフアベ
ツト順に構成される。すなわち、第1B図、テーブル20に
示すごとくJohnsonが次のスペース、第４番に入り、Ols
onが次のエントリ、すなわち第１番に入る。

同様、次のハツシユ値は第1B図に示すごとく６である。
Turnerが次の位置をしめる。次のハツシユ値は８であ
り、BacklundとMorganがアルフアベツト順にテーブルの
次のスペースを占める。次のそして最後のハツシユ値は
９であり、Smithがテーブル20の最後の位置を占める。

第1B図のベクトル22が次に０から始まり、Ｎ−１までの
位置に構成される。ここでＮはエントリ数である。FIND
処理はオフセツトテーブルのインデツクスを獲得するた
めキーのハツシユを実行する。各位置（０からＮ−１）
の順24は、オフセツト・ベクトル22中の位置“i"に等し
い、あるいは大きいハツシユ値を持つテーブル20の第１
エントリを指示する。オフセツト・ベクトル22のそれぞ
れの“i"番の位置において、“i"23に位置“i"の値24が
加算されたものが、“i"より大きい、あるいは等しいハ
ツシユ値を持つた検索テーブルの第１エントリのインデ
ツクスである。これは以下のように表される。

オフセツト・ベクトル［ｉ］＋ｉ＝ハツシユ値を持つテーブルの第１エントリ・インデツ
クス＞または＝ｉ例えば、検索キーが値０にハツシユされたときは、オフ
セツト・ベクトル22の０番の位置の値が０に加算され
る。０＋０＝０であるから、テーブル22の０番の位置は
０より大きいあるいは等しいハツシユ値を持つた第１エ
ントリが占める。検索キーが値１にハツシユされると、
オフセツト・ベクトル22の１番の位置の値が１に加算さ
れる。１番の位置の値は０であるから、０＋１＝１とな
り、テーブル20の１番の位置はハツシユ値が１より大き
いが等しい第１エントリとなる。Bledsoeのハツシユ値
は２であるので、値１にハツシユされた検索キーを持つ
ものはテーブル20にはないことが即座に判明する。

他の例として、FIND処理の間に検索キーが２にハツシユ
されたとする。このとき、オフセツト・ベクトル中の位
置２の値が２に加算される。位置２の値は−１であるの
で、２＋−１＝１となり、テーブル20の１番の位置はハ
ツシユ値が２以上のものとなる。テーブル20の位置１か
らスタートして、検索キーを捜すためにハツシユ値２を
持つ他のエントリーのサーチが実行される。例えば、検
索キーがCoxであると、テーブル20中にCoxがあるとすれ
ば、それはBledsoeとNashとの間にあるはずであるの
で、ここでサーチは終了する。

さらに、他の例として検索キーが３にハツシユされたと
する。オフセツト・ベクトル22中の３番の位置の値が３
に加算される。３番の位置の値は＋１であるので３＋１
＝４となり、テーブル20の４番の位置にはハツシユ値が
３以上のものが占めることになる。３または４の値のハ
ツシユ・キーは存在しないので４番の位置はハツシユ値
５が割当てられる。従つて、検索キーがハツシユ値３を
持つとすれば、FIND処理は大きなハツシユ値を持つ第１
エントリに行くので、検索キーはテーブル20には存在し
ないことが即座に判明する。従つて、FIND処理は検索キ
ーを持つエントリがないことをサーチを実行せずに判断
できる。

例えば、第1B図に示すごとくテーブル28のエントリは矢
印25で示すように位置ｈ（キー）とｈ（キー）＋１にお
いてオフセツト・テーブル22中でオフセツトにより区分
けされている。例えば、ハツシユ値０を持つキーはテー
ブル中の位置０と位置１の開始位置に境界がある。ハツ
シユ値１のキーは位置１の上と下の境界を持つ。従つ
て、テーブル20にはハツシユ値１を持つエントリが存在
しないことがサーチを実行することなく判明する。

第1B図のオフセツト・ハツシユ検索テーブルはオフセツ
ト・ベクトルのためのわずかな付加メモリを要するにす
ぎない。このオフセツト・ハツシング構成のスペース増
加はこのオフセツト・ベクトルのみである。オフセツト
は極めて小さくでき、第7J図のリンク・ハツシユ法のリ
ンク・リストよりも小さい。第1B図のオフセツト・ベク
トル22のためのメモリ量は第7J図のリンク15とリンク・
リスト18に必要なメモリよりも小さいものとなる。第7J
図のリンク・ハツシング法の基本的な構成ではリンク・
リスト・アンカーのベクトルと各エントリ中に保持され
たリンク15を必要とする。本発明のオフセツト・ハツシ
ング法は各エントリに対してリンクを必要としない。こ
のために追加のメモリ・スペースが小さくなる。さら
に、オフセツト・ベクトル22に必要なメモリの総量は第
6A〜6J図に示すオープン・アドレツシング検索テーブル
に必要な追加メモリの10％から20％よりも小さい。

オフセツト・ベクトルのエントリ・サイズは、同じハツ
シユ値を持つ対応キー・レンジの第１テーブル・エント
リの参照に必要なサイズよりも大きくてはならない。前
に述べたように、これらオフセツトは通常小さいサイズ
である。オフセツト・ベクトルのためのスペースが特定
のハツシユ値に対して適当なオフセツトを供与しないよ
うな特殊な場合は、いくつかの解決策がある。新しいハ
ツシユ関数が選択され、テーブル・エントリに適用され
る。これが適当なオフセツト・ベクトル・スペースに適
応するオフセツトを与えることとなる。他の解決策はオ
フセツトがオフセツト・ベクトル中に保持可能な範囲よ
りも大きいことを示すためにオフセツト値の絶対値にお
ける最大値（正でも負でも可）を供与することである。
この場合、サーチ幅はオフセツト幅よりも大であり、検
索キーのハツシユ値外のハツシユ値を含む。

テーブルが完全に満たされていない場合は、未使用テー
ブル・エントリが予約キーの値が検索可能なキーより大
きいことを示すか、または各テーブル・エントリが各々
特定フラグを持ち、それによつてその使用の有無を示
す。

第1B図に示す本発明のオフセツト・ハツシング法は第7J
図に示すリンク・ハツシング法と同じオーダの検索時間
を保持する。どちらの場合も最初のハツシユはエントリ
・バケツトのサーチに続いて実行される。しかし、本発
明のオフセツト・ハツシング法では同じハツシユ値を持
つエントリは連続しており、オフセツト・テーブルのｈ
（キー）とｈ（キー）＋１との位置のオフセツトにより
限定されている。従つて、オフセツト・ハツシング法
は、テーブル28における第２サーチが連続エントリ中で
実行され、リンク・リストを持たないのでなお一層高速
となる。同じハツシユ値を持つ連続エントリはオフセツ
ト・ハツシング法に他の速度的効果をもたらす。さら
に、本発明で採用されているデータの良好な配置は仮想
メモリにおけるページ不在を削減する。

以下に示すプログラム・コードは本発明のオフセツト検
索テーブルの生成を説明したものである。

プロシージヤー構成 −−テーブル中に記憶されたＮエントリに関するリスト
から、サイズＮのオフセツト検索テーブルを構成する。

開始リストからＮエントリをテーブル中に挿入する。

テーブル・エントリの各々にハツシユ関数を適用する。

ハツシユ値に従つてテーブル・エントリをソートする。
同じハツシユ値はキーに従つてソートする。

−−オフセツト・ベクトルの生成。

OFFSET VECTOR［０｝ :0; for I ＝1 to N−1 do OFFSET VECTOR［Ｉ］ : ＝OFFSET VECTOR［Ｉ−１］−1; while OFFSET VECTOR［Ｉ］＋Ｉ＜Ｎ and HASH（TABLE［OFFSET VECTOR ［Ｉ］＋Ｉ］KEY）＜Ｉ do OFFSET VECTOR［Ｉ］＝ OFFSET VECTOR［Ｉ］＋1; end while; end for; endprocedure construct; このプログラム言語をフローに示すと第３図のごとくな
る。オフセツト検索テーブルの構成はエントリのリスト
Ｎによつてステツプ80から開始される。これらのエント
リはステツプ81においてテーブルに挿入されるステツプ
82においてこれらのエントリの各々に対してハツシユ関
数が適用される。ステツプ83において、ハツシユ値に従
つて、同じハツシユ値に対してはキーの値に従つてテー
ブルの記憶が行なわれる。ここまでテーブル・エントリ
が完成する。ステツプ84-92ではオフセツト・ベクトル
を生成する。ステツプ84において、インデツクス０にお
いて、オフセツト・ベクトル中の第１エントリは０にセ
ツトされる。オフセツト・ベクトルに対するインデツク
ス、初期設定Ｉがステツプ85で１にセツトされる。ステ
ツプ86でＩがＮよりも小さい間は、ステツプ87からステ
ツプ91が繰り返される。一方、オフセツト・ベクトルが
完成し、ステツプ92で手続きが完了する。ステツプ87に
おいて、Ｉによつてインデツクスされたオフセツト・ベ
クトルの初期値OFFが、Ｉ−１によりインデックスされ
たオフセット・ベクトルの値を１減分することによって
得られる。この値OFFは、OFFの加算値OFF＋ＩがＮに等
しくなるまで（ステツプ88）、あるいはインデツクスOF
F＋Ｉに保持されたテーブル・エントリのキーのハツシ
ユがＩより大きいか等しい（ステツプ89）場合には、ス
テツプ90において増分される。ステツプ88、89、90にお
けるOFFの増分が終了すると、インデツクスＩのオフセ
ツト・ベクトルはOFFの値を指定し、ステツプ91におい
てオフセツト・ベクトルの次のエントリをインデツクス
するためにＩが増分される。

以下に検索キーに関連するデータの検索に使用可能なfi
nd処理を実行するプログラム言語コードを示す。

operation find（Ｋ） −−テーブル中に検索キーが存在する場合は、その検索
キー、Ｋに等しいテーブル・エントリのインデツクスに
戻り、存在しない場合は−１にもどる。

begin −−データは０からＮ−１の値によつてインデツクスさ
れたオフセツト・ベクトルおよび、長さＮのテーブルを
持つと仮定する。

H :＝HASH（Ｋ）；−−注:Hは０からＮ−１−−検索キ
ーを持つ第１エントリのインデツクスにＪをセツト J :＝OFFSET VECTOR［Ｈ］＋H; −−検索キーを持つ最終エントリのインデツクスより１
つ大のものにリミツトＺをセツト if H＝Ｎ−１ then Z :＝Ｎ else Z :＝OFFSET VECTOR［Ｈ＋１］； −−Ｋに対するサーチ・レンジをＪからＺ−１とする。

while J＜Z and TABLE［Ｊ］.KEY＜K do J :＝J ＋1; −−Ｋを発見できた？ if J＝Z or TABLE［Ｊ］.KEY＞Ｋ then return −１ −−FAILURE else return J; −−SUCCESS end poeration find; 以上のプログラム言語コードを図に示したのが第２図で
ある。検索キーをＫとして、ステツプ60において、FIND
処理が開始する。ステツプ61において、検索キーがハツ
シユ値にハツシユされる。Ｎエントリのテーブルではハ
ツシユ値は０からＮ−１の範囲である。検索キーを持つ
であろうテーブル中の第１エントリはステツプ62におい
て決定され、変数Ｊが指定される。ステツプ62におい
て、ハツシユ値がオフセツト・ベクトルのインデツクス
に使用される。このインデツクスのオフセツト・ベクト
ル中の値が第１エントリを決定したハツシユ値に加算さ
れる。検索キーを有するテーブル中の最終エントリはス
テツプ63、64、65で決定され、ここではテーブル・イン
デツクスより１大きい値に変数Ｚをセツトする。ステツ
プ66、67、68が、エントリをインデツクスＪからＺ−１
の間でサーチし、検索キーが見つかつた時点でストツプ
する。レンジすべての範囲のエントリの検索終了時点
（ステツプ66）、またはレンジ中の残りのエントリには
キーが存在しないことが判明したとき（ステツプ67）に
おいてストツプする。このサーチの出力を決定するテス
トがステツプ69と70で実行される。すべてのエントリが
検索が不成功であるとステツプ69で判断されたときはａ
−１が失敗を示す意味で戻される（ステツプ72）。ステ
ツプ70において検索キーが発見されると、このキーを持
つテーブル・エントリのインデツクスＪがステツプ71に
おいて戻される。さもなければ、ａ−１はステツプ72に
おいて失敗を示す意味で戻される。

E.発明の効果上述のごとく本発明は、従来の方法に比較して、検索テ
ーブルにおけるより早いエントリの検索手段を従来の方
法よりも少ないスペースの使用によつて達成するもので
ある。

【図面の簡単な説明】

第1A図は本発明におけるオフセツト・ハツシング検索テ
ーブル中において使用される各キーのハツシユ値を示し
た図、第1B図は本発明のオフセツト・ハツシユ検索テー
ブルを示す図、第２図はオフセツト検索テーブル中に保
持されたデータの検索処理を示すフロー図、第３図はオ
フセツト検索テーブルを生成するステツプを示すフロー
図、第４図は従来のシーケンシヤル・サーチ検索テーブ
ルを示す図、第５図は従来のシンプル検索テーブルを示
す図、第6A〜第6J図は従来のオープン・アドレツシング
・ハツシング検索テーブルを生成する手段を示す図、第
6K図は第6A〜6J図の検索テーブルにおいて使用される各
キーのハツシユ関数の結果値を示す図、第7A図は従来の
第7A〜7J図のリンク・ハツシング検索テーブルにおいて
使用される各キーのハツシユ関数の結果値を示す図、第
7B〜第7J図は従来のリンク・ハツシング検索テーブルの
生成方法を示す図である。

Claims

【特許請求の範囲】

【請求項１】データ処理装置中における検索のための複
数のデータ要素の構成方法に関し、上記個々のデータ要
素の対応する各々の検索キーのハッシュ値によって決定
された順序で、該データを配列したテーブルを作成する
ステップと、目的とするキーに等しい検索キーに対応するデータ要素
を持つ上記テーブル中の位置を決定するために、該目的
キーのハッシュ値と組合わされるオフセット・ベクトル
を作成するステップとからなる、データ構成方法。
【請求項２】データ処理装置中における検索のための複
数のデータ要素の構成装置に関し、上記個々のデータ要
素の対応する各々の検索キーのハッシュ値によって決定
された順序で、該データを配列したテーブルと、目的とするキーに等しい検索キーに対応するデータ要素
を持つ上記テーブル中の位置を決定するために、該目的
キーのハッシュ値と組合わされるオフセット・ベクトル
を作成するためのオフセット・ベクトル管理手段とから
なる、データ構成装置。
【請求項３】データ処理装置においてデータを管理する
装置であって、各データのエントリの検索キーのハッシュ値ｉに依存し
た順序で、Ｎ個のエントリのベクトルとして該データを
保持する手段と、上記ｉの値とｉ番目の位置に含まれるオフセット値の合
計値が、対応する上記データのエントリを決定するイン
デックスとなるようなオフセット・ベクトルを保持する
手段とを有することを特徴とする、データ管理装置。
【請求項４】データ処理装置においてデータを管理する
装置であって、データのＮ個のエントリの各々についてキーをハッシン
グする手段と、上記キーのハッシュ結果値ｉに従いソートされた順序
で、上記エントリのベクトル中にデータを記憶する手段
と、上記ｉの値とｉ番目の位置に含まれるオフセット値の合
計値が、対応する上記データのエントリを決定するイン
デックスとなるようなオフセット・ベクトルを生成する
手段とを有することを特徴とする、データ管理装置。
【請求項５】データ処理装置においてデータを管理する
方法であって、各データのエントリの検索キーのハッシュ値ｉに依存し
た順序で、Ｎ個のエントリのベクトルとして該データを
保持するステップと、上記ｉの値とｉ番目の位置に含まれるオフセット値の合
計値が、対応する上記データのエントリを決定するイン
デックスとなるようなオフセット・ベクトルを保持する
ステップとを有することを特徴とする、データ管理方
法。
【請求項６】データ処理装置においてデータを管理する
方法であって、データのＮ個のエントリの各々について対応するキーを
ハッシングするステップと、上記キーのハッシュ結果値ｉに従いソートされた順序
で、上記エントリのベクトル中にデータを記憶するステ
ップと、上記ｉの値とｉ番目の位置に含まれるオフセット値の合
計値が、対応する上記データのエントリを決定するイン
デックスとなるようなオフセット・ベクトルを生成する
ステップとを有することを特徴とする、データ管理装
置。
【請求項７】データ処理装置においてデータを検索する
装置であって、各データのエントリのキーのハッシュ値ｉに依存した順
序で、Ｎ個のエントリのベクトルとして該データを保持
する手段と、上記ｉの値とｉ番目の位置に含まれるオフセット値の合
計値が、対応する上記データのエントリを決定するイン
デックスとなるようなオフセット・ベクトルを保持する
手段と、上記オフセット・ベクトルのｉ番目の位置の一つが検索
されるように、検索対象であるデータの対応するキーの
ハッシングを実行する手段と、上記オフセット・ベクトルのｉ番目の位置へのハッシン
グにより指示された上記エントリのベクトルから、検索
対象であるデータを取り出す手段とからなる、データ検
索装置。
【請求項８】データ処理装置においてデータを検索する
方法であって、上記データ処理装置が、各データのエントリのキーのハ
ッシュ値ｉに依存した順序で、Ｎ個のエントリのベクト
ルとして該データを保持する手段とともに、該ｉの値と
ｉ番目の位置に含まれるオフセット値の合計値が、対応
する該データのエントリを決定するインデックスとなる
ようなオフセット・ベクトルを保持する手段を具備して
おり、上記オフセット・ベクトルのｉ番目の位置の一つが検索
されるように、検索対象であるデータの対応するキーの
ハッシングを実行するステップと、上記オフセット・ベクトルのｉ番目の位置へのハッシン
グにより指示された上記エントリのベクトルから、検索
対象であるデータを取り出すステップとからなる、デー
タ検索方法。