JP2607818B2 - コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置 - Google Patents

コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置

Info

Publication number
JP2607818B2
JP2607818B2 JP5014567A JP1456793A JP2607818B2 JP 2607818 B2 JP2607818 B2 JP 2607818B2 JP 5014567 A JP5014567 A JP 5014567A JP 1456793 A JP1456793 A JP 1456793A JP 2607818 B2 JP2607818 B2 JP 2607818B2
Authority
JP
Japan
Prior art keywords
key
record
hash
stored
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5014567A
Other languages
English (en)
Other versions
JPH0612303A (ja
Inventor
フレデリック、ジェイコブ、ダメラウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0612303A publication Critical patent/JPH0612303A/ja
Application granted granted Critical
Publication of JP2607818B2 publication Critical patent/JP2607818B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はコンピュータシステムに
レコードを記憶しそしてとり出すための方法及び装置に
関する。詳細には本発明はキー又はキーに対するポイン
タが記憶されるべき複数のハッシュアドレスを発生する
ためにレコードのキーに複数のハッシュ機能を適用する
ものである。
【0002】
【従来の技術】1つの与えられたビットストリングをビ
ットストリングの大きな基準セットに対して比較するこ
とがしばしば必要とされる。完全に一致する場合にはハ
ッシュテーブル技術を用いることが出来、充分なサイズ
のハッシュテーブルが与えられればそれにより比較回数
をO(1)にすることが出来る。しかしながら、不完全一致
であって"最良"の一致が定義されていない場合には、従
来のハッシュ技術を用いることは出来ない。
【0003】これを具体的に述べるために、例えばAP又
はUPIのような通信社により送られるニュースのコピー
又は近似的コピーを検出する場合を考えてみる。同一の
事実をカバーするニュースストーリーが小さい誤りを修
正しあるいは新しい情報をつけ加えるために伝送中に多
数の回生じることがある。これらのくり返しは、まれな
言葉の頻度を言語内の言葉の"実際"の頻度を越えて高く
するから、生の伝送を言葉の頻度、言葉の順序等を含む
実験には不適当なものにする。これらのくり返しを検出
する1つの手段は例えばニュースストーリー内に生じる
まれな言葉(あるいは他の所望のニュース特徴部)を用い
て夫々のニュースストーリーについてN‐ビットのシグ
ニチャベクトルを計算することである。キーと考えるこ
との出来るニュースストーリー用のこのシグニチャベク
トルはテキストに対するポインタと共にメモリに記憶さ
れる。各ニュースストーリーが入ると、そのシグニチャ
ベクトルが前のニュースストーリーについてのシグニチ
ャベクトルに対し比較され、そして"充分近似ている"ベ
クトルが該ベクトルによりポインティングされるニュー
スストーリーの本質的同一性を示すために採られる。ニ
ュースストーリーの数がふくらむにつれ、比較の回数も
それに比例して増大し、そして時間がかかりすぎるもの
となる。シグニチャベクトルは正確に一致する必要がな
いため、シグニチャベクトルについての1つの単純なハ
ッシュ機能は成功しない。何故なら、1ビットしか異な
らないベクトルでもハッシュ機能にとって非常に異なる
値をもちうるからである。
【0004】米国特許第4290105号明細書には、キー全
体又はキーに対するポインタではなく1ビットのみが対
応するハッシュアドレスに記憶される場合の複数のハッ
シュ機能の利用が示されている。従ってこの特許はキー
の正確な一致を必要とする。
【0005】米国特許第3681781号明細書にはNスペース
内の座標に対応するハッシュアドレスを得るための多数
のハッシュ機能の利用が示されている。すべてのハッシ
ュ値は1個の記憶アドレスを得るため加算される。すべ
てのキーはそれらの上位桁が正しいとものと仮定され
る。
【0006】後述する文献1は不正確な一致を伴わない
複数ハッシュ機能の使用を示している。
【0007】米国特許第5032987号明細書にはハッシュ
衝突ストリング内での線形検索を避けるためキー毎に固
有のアドレスに入るようにするための複数ハッシュ機能
の使用が示されている。また、1つの与えられたキーは1
つのロケーションにのみ記憶され、それによりキーの不
正確な一致を排除している。
【0008】ヨーロッパ特許出願第0233401号明細書は
不正確な文字、欠字又は別の文字を検査するために特殊
なハードウェアを用いた近似していない文字ストリング
の一致を示している。しかしながらこれはハッシュを示
していない。
【0009】米国特許第4433392号明細書は予定の距離
内での一致のテストのために特殊なハードウェアを用い
た近似していない文字ストリングの一致を示している。
ハッシュは示されていない。
【0010】米国特許第4961139号明細書は高速データ
とり出しのためにマルチフィールドデータバスのフィー
ルド毎に1つのハッシュテーブルを設けた複数ハッシュ
テーブルの使用が示されている。
【0011】米国特許第4922417号明細書は1つの文字ス
トリングについて1つのハッシュアドレスを発生する方
法を示す。
【0012】米国特許第4897785号明細書はハッシュ関
数の計算方法とハッシュ値に対する正確な一致のために
適当に操作されたキーを比較するための比較回路を示
す。
【0013】米国特許第4780816号明細書はランダムに
分布されたハッシュアドレスを発生する方法を示す。参
考文献3〜5のすべては一致ではなくハッシュアドレスの
計算方法を示す。
【0014】米国特許第4991087号明細書はハッシュ値
を文書シグニチャをつくるために用いる場合のワードシ
グニチャを計算するためのハッシュ機能の使用を示す。
【0015】文献3は最適とり出し時間を与えるハッシ
ュ機能を選ぶことによるハッシュアドレスの計算方法を
示す。
【0016】文献4はキースペースのサブセットを含む
ハッシュアドレスの計算方法を示す。
【0017】文献5はハッシュテーブルのサイズを予め
特定する必要をなくすハッシュ方法を示す。
【0018】文献6はストリングの不正確な一致用の多
数のアルゴリズムを示す。それらは"エラスチックマッ
チング"のような既知のエラーパターンにもとづくマト
リクス、スピーチ認識及び確率解析を含む。この文献は
また異なるスペルをもつが同音となる名前について固有
の表現となるためのサウンデックス(soundex )を論じて
いる。
【0019】文献7はテキストについてのシグニチャを
つくる技術を示す。この方法は本発明のレコード用のキ
ーの発生に使用しうる。
【0020】文献8は1つの文字ストリングについてのシ
グニチャとして用いられるビットストリング内のハッシ
ュアドレスの計算によるその文字ストリングの構成を示
している。この文献は1つのストリングが他のもののサ
ブストリングであるか否かを知るためのテストを示すの
みであってストリング全体について複数のハッシュを使
用しない。
【0021】文献9は文書用の、キーにほゞ等価な"シグ
ニチャ"を発生する方法を示す。
【0022】参考文献 1. R. R. Carlson, Jr. and A. L. Zorbist, DETECTIO
N OF COMBINEDOCCURRENCES, Communications of the AC
M, Vol.20, No.1, January, 1977,pp.31〜35. 2. C. J. Date, AN INTRODUCTION TO DATABASE SYSTEM
S, Vol.1, Fifthedition, Addison-Wesley Publishing
Company, 1990. 3. J. L. Carter, and M. N. Wegman, UNIVERSAL CLAS
SES OF HASHFUNCTIONS, Proceedings of the 1978 IBM
Symposium on Mathematics andComputation, Vol.1, Sa
n Jose, CA., March, 1978, pp.329〜342. 4. V. G. Winters, MINIMAL PERFECT HASHING FOR LAR
GE SETS OFDATA,Advances in Computing Information-I
CCI'90, International ConferenceProceedings 1990,
pp.275〜284. 5. C. S. Ellis, CONCURRENCY IN EXTENDABLE HASHIN
G, Inf. Syst. (UK)Vol.13, No.1, 1988, pp.97〜109. 6. G. R. Dowling, and P. A. V. Hall, APPROXIMATE
STRING MATCHING,Computing Surveys, Vol.12, No.4, D
ecember, 1980, pp.381〜402. 7. W. B. Croft, and P. Savino, IMPLEMENTING RANKI
NG STRATEGIESUSING TEXT SIGNATURES, ACM Transactio
ns on Office InformationSystems,Vol.6, No.1, Janua
ry, 1988, pp.42〜62. 8. M. C. Harrison, IMPLEMENTATION OF THE SUBSTRIN
G TEDXT, CACM,Vol.14, No.12, 1971. 9. C. Faloutsos and S. Christodoulakis entitled,
SIGNATURE FILES: ANACCESS METHOD FOR DOCUMENTS AND
ITS ANALYTICAL PERFORMANCE EVALUATION,ACM Transac
tions on Office Information Systems, Vol.2, No.4,
October1984, pp.267〜288。
【0023】
【発明が解決しようとする課題】本発明の目的はレコー
ド又はその編集されたバージョンがコンピュータシステ
ム内に記憶されているか否かを判定するための高速且つ
高信頼性の方法及び装置を提供することである。本発明
の他の目的はキーの高速不正確一致を与えることであ
る。
【0024】
【課題を解決するための手段】本発明はレコード又はそ
の編集されたバージョンがコンピュータシステム内に記
憶されているか否かを判定する方法及び装置を提供す
る。システムにレコードを記憶したいときには記憶され
るべきレコードについてのキーが選択されそしてそのキ
ーの多数のサブセットにハッシュ機能を適用することに
より多数のハッシュアドレスがそのキーから発生され
る。次に、発生されたハッシュアドレスの夫々にキー又
はキーに対するポインタが記憶される。レコード又はそ
の編集されたバージョンをシステムからとり出すときに
は、システム内に記憶されているか否かにつき判定され
るべきレコードのキーのサブセットにハッシュ機能を適
用することにより多数のハッシュアドレスが発生され
る。1以上のアドレスにキー又はポインタが記憶されて
いれば、判定対象レコードのキーが後者の発生されたハ
ッシュアドレス内に記憶された又はポインティングされ
たキーと比較される。最後に判定対象レコードのキーが
後者の発生されたハッシュアドレスに記憶されているキ
ーに充分近似したものであれば、即ち近似率が所定の値
以上であれば、その判定対象レコードがそのシステムに
記憶されているものとして受け入れられる。ここで云
う"充分"とはここでは述べない因子により決まるもので
ある。
【0025】
【実施例】図1は本発明の実施に用いられる装置全体の
概略図である。メモリ10は入力レコード5、ハッシュテ
ーブル15及び乱数表18を含む。図示のようにプロセッサ
20はキーエキストラクタ22、ハッシュアドレス発生器24
及びキーコンパレータ26を有する。
【0026】本発明は主として与えられたレコード又は
そのレコードの編集されたバージョンがメモリに記憶さ
れているか否かを判定する有効な方法に関する。本発明
によれば、入力レコードがメモリ10内にあれば、キーエ
キストラクタ22を用いて記憶されるべきレコードからキ
ーを抽出する。次にテーブルTである乱数表18とハッシ
ュアドレス発生器24を用いてハッシュテーブル15内に多
数のハッシュアドレスを発生する。キーのサブセットを
選択するこの方法は使用可能な方法の1つにすぎない。R
個のハッシュアドレスが異なるようにキーのサブセット
を選択する他の方法を使用しうる。使用される方法が不
満足な結果を生じた場合には、異なる選択方法を使用す
べきである。判定対象レコードがメモリ10内にあるか否
かを検査するときにはキーエキストラクタ22が判定対象
レコードから1つのキーを抽出する。次に上述のように
乱数表18とハッシュアドレス発生器24を用いて判定対象
レコードから抽出されたキーから多数のハッシュアドレ
スを発生する。次に、キーコンパレータ26を用いて判定
対象レコードから抽出されたキーと、それから発生され
たハッシュアドレスに記憶されている各キーとを比較す
る。
【0027】図2は図1の乱数表18の概略を示す。このテ
ーブルは各キーについてこの実施例で発生されるハッシ
ュアドレスの数に対応するR=7行を有する。このテーブ
ルはまたハッシュ用に各キーがいくつのセグメントに分
割されているかを判定するN=9コラムを有する。
【0028】段階S1からS8を図3について述べる。 S1: 各キーについて計算されるべきハッシュアドレス
の数である数Rは部分的にPの選択(段階S2)に依存する実
行判定パラメータである。一般に、オリジナルキー内の
すべてのビットが少くとも1つのハッシュアドレスで使
用されるように、Rは充分大きくあるべきである。例え
ば、R個のハッシュアドレスの夫々がオリジナルキーの
ビット数の半分にもとづくものがあって、R=7であれ
ば、そのキーのいくつかのビットがいずれのアドレスに
も使用されない確率は1パーセント未満である。この実
行において、各キーに用いられる特定のビットはキー全
体からビットシーケンスを抽出することで選ばれる。パ
ラメータNはそのハッシュについてのビットの選択にお
いて1つのキーがいくつのセグメントに分割されるかを
判定する。N個の数のリスト内の各数はそのキー内のビ
ットインターバルのスタート点である。1つのインター
バルのエンド点は、減算を行わずに用いられる最後の数
を除き、そのシーケンス内の次の数から1を減じたもの
である。N個の数はそのキーの長さに対するインターバ
ル1内の数をピックアップするために乱数発生器をN−2
回呼び出すことで選ばれる。その結果としてのシーケン
スが区分けされ、段階S6とS12での使用のため図1のテー
ブルTのR番目の行内に記憶される。この例としてのテー
ブルにおいて、各キーは256ビット長であり、8つのイン
ターバルに区切られる。例えばそれらインターバルの第
3シーケンスはビット1〜9、10〜22、23〜64、65〜93、9
4〜207、208〜212、213〜232、233〜256である。 S2: 1つのハッシュアドレスを計算する際に使用するキ
ーのビットのパーセンテージPはアプリケーションによ
りきまる。1つのキー内の"1"ビットの数が非常に小さい
(大きい)場合には、それに比例して多数(少数)のビット
を使用することになり、あるいは結果としてのハッシュ
アドレスはすべて0(1)である。典型的なアプリケーショ
ンについては、P=50%を使用しうる。上述の実施にお
いてはPはターゲットパーセンテージである。テーブルT
の構成方法により、1つのハッシュの計算にインターバ
ルの半分を選ぶことは、通常シーケンスがランダム長さ
であるためにそのビットの正確な半分を使用することで
はない。この実施において、Rが奇数のときには奇のビ
ットシーケンスを用い、Rが偶数のときには偶シーケン
スを用いる。但しこの選択は全く任意である。R=3の場
合にはキーの計算に用いられるシーケンスは1〜9、23〜
64、94〜207、213〜232である。平均するとビットの半
分が用いられるが、この例では185ビットすなわち、全
ビットの73%が用いられる。 S3: キー又はそれらキーに対するポインタが記憶され
ている場合のハッシュテーブルTKのサイズはキーの総数
によりきまる。一般に、ハッシュテーブルはハッシュア
ドレスの衝突が多くならないようにするため全体の80%
未満である。ハッシュテーブルサイズ、オーバーフロー
の処理等を含むハッシュテーブル方法の詳細については
参考文献2を参照され度い。 S4: この段階はこの好適な実施のためのループ制御で
ある。"NO"の場合にはすべてのキーがR個のハッシュア
ドレスの任意のものからアクセス可能な1を記憶してい
る。 S5: 各レコードは固有のキーで識別されるべきであ
る。データベースシステム内のキーについての詳細は文
献1に示されている。例えば郵便リストアプリケーショ
ンでは、1つのキーは宛名、住所及びジップコードのシ
ーケンスである。文書識別では1つのキーはその文書の
レア(rare)ワードから構成される。各レアワードはレン
ジ1〜256内のハッシュアドレスの計算に用いられる。こ
のアドレスは文書シグニチャストリング内の1つのビッ
トを1にセットするために用いられる。結果としてのビ
ットストリングは1つの文書のキーである。 S6: ハッシュ機能は縮小されたビット部分(段階2から)
に加えられる。この機能は任意の標準的なハッシュ機
能、すなわち除算、ミド‐スクエア(mid-square)等でよ
い。文献1を参照されたい。 S7: 段階S2の各ハッシュアドレスからオリジナルキー
をアクセスすることが可能でなくてはならない。キー又
はそれに対するポインタがハッシュテーブルに記憶され
ているか否かは重要でない。 S8: この点において、データベースレコードについて
のはじめの参照キー群はハッシュテーブルあるいはハッ
シュテーブルからのポインタを有する補助テーブルに記
憶されている。
【0029】段階S9からS19について図4により説明す
る。 S9: この段階は参照群内のメンバーシップについてテ
ストされるべきキーについてのループ制御である。 S10: DONEブロックはこの発明には関連しないアプリケ
ーション依存端末処理を行う。 S11: 前述したように、各テストレコードは固有のキー
を有すべきである。文書コピーについてのテストの場合
にはこのキーは前述のようにレアワードから計算される
シグニチャである。 S12: 内部ループS13〜S18は参照キー群内でのテストキ
ーの一致をとるためにR回まで反復される。テストキー
は参照キーと正確に一致することが期待されないから、
1つのハッシュアドレスは一致するビットのみを用いて
見い出さねばならず、従って、2以上のハッシュを用い
各ハッシュアドレス計算における異なるビットの排除が
必要である。 S13: ハッシュアドレスはレコードの記憶について上述
したように計算される。 S14: 計算されたハッシュアドレスのキー又はそれにポ
イントされたキーは参照群からのどのキーにも正確には
一致しない。その理由はそれがエラーを有しあるいは参
照群内に含まれていないからである。テキストとり出し
の場合には、ビットの内の80%の一致は充分近いもので
ある。これは、二つの文書がそのレアワードの殆んどに
おいて共通していることを意味する。 S15: ハッシュアドレスが一致してもすべてのキーにつ
いて比較を行わねばならない。本発明ではテストキーと
参照キーの間の一致テストはアプリケーションに依存す
る。それはエラスチックマッチングと呼ばれる一致ビッ
トのパーセンテージあるいは文献に述べられているビッ
トストリングの近似的一致をとる他の方法である。 S16: 一致の場合にとられるアクションはアプリケーシ
ョンによりきまる。 S17: 一致がない場合にはキーから異なるビットを用い
た他のハッシュアドレスを計算すべきである。 S18: 各入力キーについてR以下の数のハッシュアドレ
スが計算される。 S19: 一致がない場合には、或るアプリケーションに依
存するアクションがとられそして次の入力レコードに対
応する次のキーがテストされる。このアプリケーション
依存アクションは参照群へのこの新しいキーの記憶によ
りデータベースの増加を含むことが出来る。
【図面の簡単な説明】
【図1】本発明の装置、特にそのメモリとプロセッサの
主エレメントを示す図である。
【図2】各キーについて多数のハッシュアドレスを発生
するための1つのキーのサブセットを選択するために用
いられる乱数表を示す図である。
【図3】本発明によるレコード記憶方法のフローチャー
トである。
【図4】本発明によるレコードとり出し方法を示すフロ
ーチャートである。
【符号の説明】
5 入力レコード 10 メモリ 15 ハッシュテーブル 18 乱数表 20 プロセッサ 22 エキストラクタ 24 ハッシュアドレス発生器 26 キーコンパレータ

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】レコード又は該レコードの編集されたバー
    ジョンがコンピュータシステムに記憶されているか否か
    を判定する方法において、 上記システムにレコードを記憶する記憶段階と、 上記システムに特定のレコード又はその編集されたバー
    ジョンが記憶されているか否かを判定する判定段階を含
    み、 前記記憶段階は、 前記システムに記憶されるべきレコードのキーを選択す
    るステップと、 前記キーの複数のサブセットにハッシュ機能を適用する
    ことにより前記キーから複数のハッシュアドレスを生成
    するステップと、 前記ハッシュアドレスの夫々に前記キー又は該キーに対
    するポインタを記憶するステップとを含み、 前記判定段階は、 判定対象のレコードのキーの複数のサブセットにハッシ
    ュ機能を適用することにより複数の第2ハッシュアドレ
    スを生成するステップと、 前記判定対象のレコードのキーを前記第2ハッシュアド
    レスに記憶された 又はポインティングされた各キーと比較するステップ
    と、 前記判定対象のレコードのキーが前記第2ハッシュアド
    レスに記憶された 又はポインティングされたキーのいずれかに所定の近似
    率以上で近似している場合前記判定対象のレコードを前
    記システムに記憶されているものとして認めるステップ
    とを含む ことを特徴とする方法。
  2. 【請求項2】前記記憶されるべきレコードのキー及び判
    定対象のレコードのキーはNビットからなるビットスト
    リームである請求項1の方法。
  3. 【請求項3】前記所定の近似率は前記判定対象のレコー
    ドのキーの所定パーセント以上のビットが前記第2ハッ
    シュアドレスに1つに記憶された又はポインティングさ
    れたキーの所定パーセント以上のビットと一致するよう
    な近似率である請求項2の方法。
  4. 【請求項4】前記所定のパーセントは80%である請求項
    3の方法。
  5. 【請求項5】レコード又は該レコードの編集されたバー
    ジョンがコンピュータシステムに記憶されているか否か
    を判定する装置において、 上記システムにレコードを記憶する記憶手段と、 上記システムに特定のレコード又はその編集されたバー
    ジョンが記憶されているか否かを判定する判定手段を含
    み、 前記記憶手段は、 前記システムに記憶されるべきレコードのキーを選択す
    る手段と、 前記キーの複数のサブセットにハッシュ機能を適用する
    ことにより前記キーから複数のハッシュアドレスを生成
    する手段と、 前記ハッシュアドレスの夫々に前記キー又は該キーに対
    するポインタを記憶する手段とを含み、 前記判定手段は、 判定対象のレコードのキーの複数のサブセットにハッシ
    ュ機能を適用することにより複数の第2ハッシュアドレ
    スを生成する手段と、 前記判定対象のレコードのキーを前記第2ハッシュアド
    レスに記憶された 又はポインティングされた各キーと比較する手段と、 前記判定対象のレコードのキーが前記第2ハッシュアド
    レスに記憶された 又はポインティングされたキーのいずれかに所定の近似
    率以上で近似している場合前記判定対象のレコードを前
    記システムに記憶されているものとして認める手段とを
    含む ことを特徴とする装置。
JP5014567A 1992-03-20 1993-02-01 コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置 Expired - Lifetime JP2607818B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/854,170 US5390359A (en) 1992-03-20 1992-03-20 Storing and retrieving records in a computer system
US854170 1992-03-20

Publications (2)

Publication Number Publication Date
JPH0612303A JPH0612303A (ja) 1994-01-21
JP2607818B2 true JP2607818B2 (ja) 1997-05-07

Family

ID=25317923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5014567A Expired - Lifetime JP2607818B2 (ja) 1992-03-20 1993-02-01 コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置

Country Status (2)

Country Link
US (1) US5390359A (ja)
JP (1) JP2607818B2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269363B1 (en) * 1994-01-24 2001-07-31 Yossi Matias Method of accessing data using approximate data structures by relaxing the operations that define same
US5542089A (en) * 1994-07-26 1996-07-30 International Business Machines Corporation Method and apparatus for estimating the number of occurrences of frequent values in a data set
US5692177A (en) * 1994-10-26 1997-11-25 Microsoft Corporation Method and system for data set storage by iteratively searching for perfect hashing functions
US6704866B1 (en) 1997-07-11 2004-03-09 Cisco Technology, Inc. Compression and encryption protocol for controlling data flow in a network
US6401188B1 (en) 1998-02-27 2002-06-04 Cisco Technology, Inc. Method for selection on a pattern sequence
US6330557B1 (en) * 1998-06-30 2001-12-11 Sun Microsystems, Inc. Method and system for storing data in a hash table that eliminates the necessity of key storage
US7110984B1 (en) * 1998-08-13 2006-09-19 International Business Machines Corporation Updating usage conditions in lieu of download digital rights management protected content
US6341346B1 (en) 1999-02-05 2002-01-22 Cisco Technology, Inc. Method for comparison between a pattern sequence and a variable length key
US7389305B1 (en) * 1999-06-01 2008-06-17 Fair Isaac Corporation System and method for managing a database
US6625592B1 (en) * 1999-08-10 2003-09-23 Harris-Exigent, Inc. System and method for hash scanning of shared memory interfaces
US6625612B1 (en) * 2000-06-14 2003-09-23 Ezchip Technologies Ltd. Deterministic search algorithm
AU2001285161A1 (en) 2000-08-21 2002-03-04 United States Postal Services Delivery point validation system
US7406443B1 (en) * 2000-12-18 2008-07-29 Powerloom Method and system for multi-dimensional trading
US6889225B2 (en) * 2001-08-09 2005-05-03 Integrated Silicon Solution, Inc. Large database search using content addressable memory and hash
US7370044B2 (en) * 2001-11-19 2008-05-06 Equifax, Inc. System and method for managing and updating information relating to economic entities
US7469253B2 (en) * 2003-04-01 2008-12-23 Microsoft Corporation Associative hash partitioning using pseudo-random number generator
DE10351778A1 (de) * 2003-11-06 2005-06-09 Daimlerchrysler Ag Verfahren zur Korrespondenzanalyse in Bilddatensätzen
US7764792B1 (en) * 2005-01-13 2010-07-27 Marvell International Ltd. System and method for encoding data transmitted on a bus
US20060200711A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for processing network messages
US20060198318A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for statistical triggering
US20060198312A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for altering the format and bandwidth of network messages
US20060198319A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for aggregated links
US7899057B2 (en) * 2006-04-28 2011-03-01 Jds Uniphase Corporation Systems for ordering network packets
US20060264178A1 (en) * 2005-05-20 2006-11-23 Noble Gayle L Wireless diagnostic systems
US8107822B2 (en) 2005-05-20 2012-01-31 Finisar Corporation Protocols for out-of-band communication
US20070211696A1 (en) * 2006-03-13 2007-09-13 Finisar Corporation Method of generating network traffic
US20070260728A1 (en) * 2006-05-08 2007-11-08 Finisar Corporation Systems and methods for generating network diagnostic statistics
US20080075103A1 (en) * 2005-05-20 2008-03-27 Finisar Corporation Diagnostic device
US20070038880A1 (en) * 2005-08-15 2007-02-15 Noble Gayle L Network diagnostic systems and methods for accessing storage devices
US20070211697A1 (en) * 2006-03-13 2007-09-13 Finisar Corporation Method of analyzing network with generated traffic
US7370048B2 (en) * 2005-05-27 2008-05-06 International Business Machines Corporation File storage method and apparatus
US7707136B2 (en) * 2006-03-31 2010-04-27 Amazon Technologies, Inc. System and method for providing high availability data
US7925624B2 (en) * 2006-03-31 2011-04-12 Amazon Technologies, Inc. System and method for providing high availability data
US8213333B2 (en) 2006-07-12 2012-07-03 Chip Greel Identifying and resolving problems in wireless device configurations
US8526821B2 (en) * 2006-12-29 2013-09-03 Finisar Corporation Transceivers for testing networks and adapting to device changes
JP5460486B2 (ja) * 2010-06-23 2014-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション データをソートする装置及び方法
US8880871B2 (en) * 2012-01-03 2014-11-04 Broadcom Corporation Hash table organization
US10846275B2 (en) 2015-06-26 2020-11-24 Pure Storage, Inc. Key management in a storage device
CN113271290B (zh) * 2020-12-29 2023-03-31 上海零数众合信息科技有限公司 一种基于区块链的数字身份管理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3681781A (en) * 1970-09-04 1972-08-01 Goodyear Aerospace Corp Storing and retrieval method
US4290105A (en) * 1979-04-02 1981-09-15 American Newspaper Publishers Association Method and apparatus for testing membership in a set through hash coding with allowable errors
EP0174556B1 (de) * 1984-09-12 1990-05-23 BBC Brown Boveri AG Suchverfahren für Speicheradressen und Adressvergleichsschaltung
US4899128A (en) * 1985-12-11 1990-02-06 Yeda Research And Development Co., Ltd. Method and apparatus for comparing strings using hash values
US5032987A (en) * 1988-08-04 1991-07-16 Digital Equipment Corporation System with a plurality of hash tables each using different adaptive hashing functions

Also Published As

Publication number Publication date
US5390359A (en) 1995-02-14
JPH0612303A (ja) 1994-01-21

Similar Documents

Publication Publication Date Title
JP2607818B2 (ja) コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置
EP0510634B1 (en) Data base retrieval system
US5542090A (en) Text retrieval method and system using signature of nearby words
US6173252B1 (en) Apparatus and methods for Chinese error check by means of dynamic programming and weighted classes
US6000008A (en) Method and apparatus for matching data items of variable length in a content addressable memory
US5404507A (en) Apparatus and method for finding records in a database by formulating a query using equivalent terms which correspond to terms in the input query
US5692177A (en) Method and system for data set storage by iteratively searching for perfect hashing functions
US20040139072A1 (en) System and method for locating similar records in a database
US10649997B2 (en) Method, system and computer program product for performing numeric searches related to biometric information, for finding a matching biometric identifier in a biometric database
JP2833580B2 (ja) 全文インデックス作成装置および全文データベース検索装置
US20030158725A1 (en) Method and apparatus for identifying words with common stems
JP3258063B2 (ja) データベース検索システム及び方法
US10956669B2 (en) Expression recognition using character skipping
JPH024026B2 (ja)
JP3151730B2 (ja) データベース検索システム
JPH05257982A (ja) 文字列認識方法
JP2001092841A (ja) クラスター分析処理方法およびクラスター分析プログラムを記録した記録媒体
JP3534471B2 (ja) マージソート方法及びマージソート装置
JP3081093B2 (ja) 索引作成方法およびその装置と文書検索装置
JP2786380B2 (ja) キーワード照合検索処理方法
JP3115459B2 (ja) 文字認識辞書の構成方法及び検索方法
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP2682448B2 (ja) 索引検索方式
JP3288063B2 (ja) 可変長データの格納および参照システム