JPH0612303A - コンピュータシステム内において記録が記憶されているか否かを検査する方法及び装置 - Google Patents

コンピュータシステム内において記録が記憶されているか否かを検査する方法及び装置

Info

Publication number
JPH0612303A
JPH0612303A JP5014567A JP1456793A JPH0612303A JP H0612303 A JPH0612303 A JP H0612303A JP 5014567 A JP5014567 A JP 5014567A JP 1456793 A JP1456793 A JP 1456793A JP H0612303 A JPH0612303 A JP H0612303A
Authority
JP
Japan
Prior art keywords
key
hash
stored
record
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5014567A
Other languages
English (en)
Other versions
JP2607818B2 (ja
Inventor
Frederick J Damerau
フレデリック、ジェイコブ、ダメラウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0612303A publication Critical patent/JPH0612303A/ja
Application granted granted Critical
Publication of JP2607818B2 publication Critical patent/JP2607818B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 記録またはその編集されたバージョンがコン
ピュータシステム内に記憶されているかどうかを決定す
る方法および装置。 【構成】 記録がシステム内に記憶されていれば、ハッ
シュ機能が記憶されるべき記録を表わすキーの副部分に
与えられて複数のハッシュアドレスを発生する。このキ
ーのコピーまたはそれへのポインタがこのように発生さ
れるハッシュアドレスの夫々に記憶される。一つのキー
がこのシステムに記憶されているかどうかを決定すると
きに、ハッシュ機能がテスト記録の副部分に加えられた
複数のハッシュアドレスを発生する。このテスト記録用
のキーは発生されたハッシュアドレスの夫々に記憶され
たキーと比較される。テスト記録用のキーがハッシュア
ドレスにあるキーのいずれかに充分近いものであれば、
そのテスト記録はシステムに記憶されているものとされ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はコンピュータシステムに
記録を記憶しそしてとり出すための方法及び装置に関す
る。詳細には本発明はキーまたはそれに対するポインタ
が記憶される複数のハッシュアドレスを発生するために
一つの記録のキーに複数のハッシュ機能を与えるもので
ある。
【0002】
【従来の技術】ビットストリングの大きな参照セットに
対し一つの与えられたビットストリングを比較すること
がしばしば必要とされる。完全に整合する場合にはハッ
シュテーブル技術を用いることが出来、それにより充分
なサイズのハッシュテーブルが与えられれば比較回数を
0(1)にすることが出来る。しかしながら、不完全な
整合であって“最良”の整合がある意味で限定されない
場合には、従来のハッシュ技術を用いることは出来な
い。
【0003】これを具体的に述べるために、例えばAP
またはUPIのような通信社により送られるニュースの
コピーまたはほゞコピーを検出する場合を考えてみる。
同一の事実をカバーするニュースは小さい誤りを修正し
あるいは新しい情報をつけ加えるために伝送線上に多数
の回生じる。これらのくり返しは、言語内の言葉の“実
際”の頻度を越えてまれな言葉の頻度を高くするから、
生の伝送を言葉の頻度、言葉の順序等を含む実験には不
適当なものにする。これらのくり返しを検出する一つの
手段は例えばニュース内に生じるまれな言葉(あるいは
所望の他のニュース特性)を用いて夫々のニュースにつ
いてn‐ビットのシグニチャベクトルを計算することで
ある。キーと考えることの出来るニュース用のこのシグ
ニチャベクトルはテキストに対するポインタと共にメモ
リに記憶される。各ニュースが入ると、そのシグニチャ
ベクトルが前のニュースについてのそれに対し比較さ
れ、そして“充分似ている”ベクトルがそれらのポイン
トするニュースの本質的な識別を示すために採られる。
多数のニュースはふくらむから、比較の回数もそれに比
例して増大し、そして時間がかかりすぎるものとなる。
シグニチャベクトルは正確に一致する必要がないため、
それらについての一つの簡単なハッシュ機能は、1ビッ
トのみ異るベクトルは計算されてもハッシュ機能にとっ
て非常に異る値をもちうるから成功しない。
【0004】米国特許第4290105号明細書には、
キー全体またはそれに対するポインタではなく1ビット
のみが対応するハッシュアドレスに記憶される場合の複
数のハッシュ機能の利用が示されている。従ってこの特
許はキーの正確な一致を必要とする。
【0005】米国特許第3681781号明細書にはN
スペース内の座標に対応するハッシュアドレスを得るた
めの多数のハッシュ機能の利用が示されている。すべて
のハッシュ値は1個の記憶アドレスを得るため加算され
る。すべてのキーは上位桁において正しいとされる。
【0006】後述する文献1は不正確な一致を伴わない
複数ハッシュ機能の使用を示している。
【0007】米国特許第5032987号明細書にはハ
ッシュ衝突ストリング内での線形検索を避けるためキー
毎に固有のアドレスに入るようにするための複数ハッシ
ュ機能の使用が示されている。また、一つの与えられた
キーは1つのロケーションにのみ記憶され、それにより
キーの不正確な整合を排除している。
【0008】ヨーロッパ特許出願第0233401号明
細書は不正確な文字、欠字または別の文字を検査するた
めに特殊なハードウェアを用いての似ていない文字スト
リングの整合を示している。しかしながらこれはハュシ
ュを示していない。
【0009】米国特許第4433392号明細書は予定
の距離内での整合のテストのために特殊なハードウェア
を用いての似ていない文字ストリングの整合を示してい
る。ハッシュは示されていない。
【0010】米国特許第4961139号明細書は高速
データとり出しのためにマルチフィールドデータバスの
フィールド毎に1つのハッシュテーブルを設けた複数ハ
ッシュテーブルの使用が示されている。
【0011】米国特許第4922417号明細書は一つ
の文字ストリングについて一つのハッシュアドレスを発
生する方法を示す。
【0012】米国特許第4897785号明細書はハッ
シュ関数の計算方法とハッシュ値に対する正確な整合の
ために適当なマニピュレートされたキーを比較するため
の比較回路を示す。
【0013】米国特許第4780816号明細書はラン
ダムに分布されるべきとされるハッシュアドレスを発生
する方法を示す。参考文献3−5のすべては整合ではな
くハッシュアドレスの計算方法を示す。
【0014】米国特許第4991087号明細書はハッ
シュ値を文書シグニチャをつくるために用いる場合のワ
ードシグニチャを計算するためのハッシュ機能の使用を
示す。
【0015】文献3は最適とり出し時間を与えるハッシ
ュ機能を選ぶことによるハッシュアドレスの計算方法を
示す。
【0016】文献4はキースペースの副分割を含むハッ
シュアドレスの計算方法を示す。文献5はハッシュテー
ブルのサイズを予め特定する必要をなくすハッシュ方法
を示す。
【0017】文献6はストリングの不正確な整合用の多
数のアルゴリズムを示す。それらは“エラスチックマッ
チング”のような既知のエラーパターンにもとづくマト
リクス、スピーチ認識および確率解析を含む。この文献
はまた異るスペルをもつが同音となる名前について固有
の表現となるためのサウンデックス(soundex )を論じ
ている。
【0018】文献7はテキストについてのシグニチャを
つくる技術を示す。この方法は本発明の記録用のキーの
発生に使用しうる。
【0019】文献8は一つの文字ストリングについての
シグニチャとして用いられるビットストリング内のハッ
シュアドレスの計算によるその文字ストリングの構成を
示している。この文献は一つのストリングが他のものの
副ストリングであるかどうかを知るためのテストを示す
のみであってストリング全体について複数のハッシュを
使用しない。
【0020】文献9は文書用の、キーにほゞ等価な“シ
グニチャ”を発生する方法を示す。 参考文献 1. R. R. Carlson, Jr. and A. L. Zorbist, DETECT
ION OF COMBINEDOCCURRENCES, Communications of the
ACM, Vol.20, No.1, January, 1977,pp.31-35. 2. C. J. Date, AN INTRODUCTION TO DATABASE SYST
EMS, Vol.1, Fifthedition, Addison-Wesley Publishin
g Company, 1990. 3. J. L. Carter, and M. N. Wegman, UNIVERSAL CL
ASSES OF HASHFUNCTIONS, Proceedings of the 1978 IB
M Symposium on Mathematics andComputation, Vol.1,
San Jose, CA., March, 1978, pp.329-342. 4. V. G. Winters, MINIMAL PERFECT HASHING FOR L
ARGE SETS OF DATA,Advances in Computing Informatio
n-ICCI'90, International ConferenceProceedings 199
0, pp.275-284. 5. C. S. Ellis, CONCURRENCY IN EXTENDABLE HASHI
NG, Inf. Syst. (UK)Vol.13, No.1, 1988, pp.97-109. 6. G. R. Dowling, and P. A. V. Hall, APPROXIMAT
E STRING MATCHING,Computing Surveys, Vol.12, No.4,
December, 1980, pp.381-402. 7. W. B. Croft, and P. Savino, IMPLEMENTING RAN
KING STRATEGIESUSING TEXT SIGNATURES, ACM Transact
ions on Office Information Systems,Vol.6, No.1, Ja
nuary, 1988, pp.42-62. 8. M. C.Harrison, IMPLEMENTATION OF THE SUBSTRI
NG TEDXT, CACM, Vol.14, No.12, 1971. 9. C. Faloutsos and S. Christodoulakis entitle
d, SIGNATURE FILES: ANACCESS METHOD FOR DOCUMENTS
AND ITS ANALYTICAL PERFORMANCE EVALUATION,ACM Tran
sactions on Office Information Systems, Vol.2, No.
4, October1984, pp.267-288.
【0021】
【発明が解決しようとする課題】本発明の目的は一つの
記録またはその編集されたバージョンがコンピュータシ
ステム内に記憶されているかどうかを決定するための高
速且つ高信頼性の手段を提供することである。本発明の
他の目的はキーの高速不正確マッチングを与えることで
ある。
【0022】
【課題を解決するための手段】本発明は記録またはその
編集されたバージョンがコンピュータシステム内に記憶
されているかどうかを決定する方法および装置を提供す
る。そのシステムに記録を記憶したいときには記憶され
るべき記録についてのキーが選択されそして多数のハッ
シュアドレスがそのキーの多数の副部分にハッシュ機能
を与えることによりそのキーから発生される。次にキー
またはそのポインタが発生されたハッシュアドレスの夫
々に記憶される。このシステムから記録またはその編集
されたバージョンをとり出すときには、多数のハッシュ
アドレスが、システム内にそれが記憶されているかどう
かにつきチェックされるべきキーの副部分にハッシュ機
能を与えることにより発生される。1以上のアドレスに
キーまたはポインタが記憶されていれば、テスト記録用
のキーがそれら発生されたハッシュアドレス内に記憶さ
れあるいはそれにポイントするキーと比較される。最後
にテスト記録についてのキーが発生されたハッシュアド
レスに記憶されているキーに充分近いものであればその
テスト記録がそのシステムに記憶されているとして受け
入れられる。ここで云う“充分”とはここでは述べない
因子により決まるものである。
【0023】
【実施例】図1は本発明の実施に用いられる装置全体の
概略図である。メモリ10は入力記録5、ハッシュテー
ブル15および乱数表18を含む。図示のようにプロセ
ッサ20はキーエキストラクタ22、ハッシュアドレス
発生器24およびキーコンパレータ26を有する。
【0024】本発明は主として与えられた記録またはそ
の編集バージョンがメモリに記憶されているかどうかを
決定する有効な方法に関する。本発明によれば、入力記
録がメモリ10内にあれば、キーエキストラクタ22を
用いて記憶されるべき記録からキーを抽出する。次にテ
ーブルTである乱数表18とハッシュアドレス発生器2
4を用いてハッシュテーブル15内に多数のハッシュア
ドレスを発生する。キーの副部分を選択するこの方法は
使用可能な方法の一つにすぎない。Rハッシュアドレス
が異るようにキーの副部分を選択する他の方法を使用し
うる。使用される方法が不満足な結果をつくった場合に
は、異る選択方法を使用すべきである。テスト記録がメ
モリ10内にあるかどうかを検査するときにはキーエキ
ストラクタ22がテスト記録から一つのキーを抽出す
る。次に上述のように乱数表18とハッシュアドレス発
生器24を用いてテスト記録から抽出されたキーから多
数のハッシュアドレスを発生する。次に、キーコンパレ
ータ26を用いてテスト記録から抽出されたキーと、そ
れから発生されたハッシュアドレスに記憶されている各
キーとを比較する。
【0025】図2は図1の乱数表18の概略を示す。こ
のテーブルは各キーについてこの実施例で発生されるハ
ッシュアドレスの数に対応するR=7行を有する。この
テーブルはまたハッシュ用に各キーがいくつのセグメン
トに分割されているかを決定するN=9コラムを有す
る。
【0026】段階S1からS8を図3について述べる。 S1。 各キーについて計算されるべきハッシュアドレ
スの数である数Rは部分的にPの選択(段階S2)に依
存する実行決定パラメータである。一般に、オリジナル
キー内のすべてのビットが少くとも一つのハッシュアド
レスで使用されるように、Rは充分大きくあるべきであ
る。例えば、R個のハッシュアドレスの夫々がオリジナ
ルキーのビット数の半分にもとづくものがあって、R=
7であれば、そのキーのいくつかのビットがいずれのア
ドレスにも使用されない確率は1パーセント未満であ
る。この実行において、各キーに用いられる特定のビッ
トはキー全体からビットシーケンスを抽出することで選
ばれる。パラメータNはそのハッシュについてのビット
の選択において一つのキーがいくつのセグメントに分割
されるかを決定する。N個の数のリスト内の各数はその
キー内のビットインターバルのスタート点である。一つ
のインターバルのエンド点は、減算を行わずに用いられ
る最後の数を除き、そのシーケンス内の次の数から1を
減じたものである。N個の数はそのキーの長さに対する
インターバル1内の数をピックアップするために乱数発
生器をN−2回呼び出すことで選ばれる。その結果とし
てのシーケンスが区分けされ、段階S6とS12での使
用のため図1のテーブルTのR番目の行内に記憶され
る。この例としてのテーブルにおいて、各キーは256
ビット長であり、8つのインターバルに区切られる。例
えばそれらインターバルの第3シーケンスはビット1−
9、10−22、23−64、65−93、94−20
7、208−212、213−232、233−256
である。
【0027】S2。 一つのハッシュアドレスを計算す
る際に使用するキーのビットのパーセンテージPはアプ
リケーションによりきまる。一つのキー内の“1”ビッ
トの数が非常に小さい(大きい)場合には、それに比例
して多数(少数)のビットを使用することになり、ある
いは結果としてのハッシュアドレスはすべて0(1)で
ある。典型的なアプリケーションについては、P=50
%を使用しうる。上述の実施においてはPはターゲット
パーセンテージである。テーブルTの構成方法により、
一つのハッシュの計算にインターバルの半分を選ぶこと
は、通常シーケンスがランダム長さであるためにそのビ
ットの正確な半分を使用することではない。この実施に
おいて、Rが奇数のときには奇のビットシーケンスを用
い、Rが偶数のときには偶シーケンスを用いる。但しこ
の選択は全く任意である。R=3の場合にはキーの計算
に用いられるシーケンスは1−9、23−64、94−
207、213−232である。平均するとビットの半
分が用いられるが、この例では185ビットすなわち、
全ビットの73%が用いられる。
【0028】S3。 キーまたはそれらキーに対するポ
インタが記憶されている場合のハッシュテーブルTKの
サイズはキーの総数によりきまる。一般に、ハッシュテ
ーブルはハッシュアドレスの衝突が多くならないように
するため全体の80%未満である。ハッシュテーブルサ
イズ、オーバーフローの処理等を含むハッシュテーブル
方法の詳細については参考文献2を参照され度い。
【0029】S4。 この段階はこの好適な実施のため
のループ制御である。“NO”の場合にはすべてのキー
がR個のハッシュアドレスの任意のものからアクセス可
能な1を記憶している。
【0030】S5。 各記録は固有のキーで識別される
べきである。データベースシステム内のキーについての
詳細は文献1に示されている。例えば郵便リストアプリ
ケーションでは、一つのキーは宛名、住所およびジップ
コードのシーケンスである。文書識別では一つのキーは
その文書のレア(rare)ワードから構成される。各レア
ワードはレンジ1−256内のハッシュアドレスの計算
に用いられる。このアドレスは文書シグニチャストリン
グ内の一つのビットを1にセットするために用いられ
る。結果としてのビットストリングは一つの文書のキー
である。
【0031】S6。 ハッシュ機能は縮小されたビット
部分(段階2から)に加えられる。この機能は任意の標
準的なハッシュ機能、すなわち除算、ミド‐スクエア
(mid-square)等でよい。文献1を参照され度い。
【0032】S7。 段階S2の各ハッシュアドレスか
らオリジナルキーをアクセスすることが可能でなくては
ならない。キーまたはそれに対するポインタがハッシュ
テーブルに記憶されているかどうかは重要でない。
【0033】S8。 この点において、データベース記
録についてのはじめの参照キー群はハッシュテーブルあ
るいはハッシュテーブルからのポインタを有する補助テ
ーブルに記憶されている。
【0034】段階S9からS19について図4により説
明する。 S9。 この段階は参照群内のメンバーシップについて
テストされるべきキーについてのループ制御である。
【0035】S10。 DONEブロックはこの発明に
は関連しないアプリケーション依存端末処理を行う。
【0036】S11。 前述したように、各テスト記録
は固有のキーを有すべきである。文書コピーについての
テストの場合にはこのキーは前述のようにレアワードか
ら計算されるシグニチャである。
【0037】S12。 内部ループS13−S18は参
照キー群内でのテストキーの一致をとるためにR回まで
反復される。テストキーは参照キーと正確に一致するこ
とが期待されないから、一つのハッシュアドレスは一致
するビットのみを用いて見い出さねばならず、従って、
2以上のハッシュを用い各ハッシュアドレス計算におけ
る異るビットの排除が必要である。
【0038】S13。 ハッシュアドレスは記録の記憶
について上述したように計算される。
【0039】S14。 計算されたハッシュアドレスの
キーまたはそれにポイントされたキーは参照群からのど
のキーにも正確には一致しない。その理由はそれがエラ
ーを有しあるいは参照群内に含まれていないからであ
る。テキストとり出しの場合には、ビットの内の80%
の一致は充分近いものである。これは、二つの文書がそ
のレアワードの殆んどにおいて共通していることを意味
する。
【0040】S15。 ハッシュアドレスが一致しても
すべてのキーについて比較を行わねばならない。本発明
ではテストキーと参照キーの間の一致テストはアプリケ
ーションに依存する。それはエラスチックマッチング
(elastic matching)と呼ばれる一致ビットのパーセン
テージあるいは文献に述べられているビットストリング
の近似的一致をとる他の方法である。
【0041】S16。 一致の場合にとられるアクショ
ンはアプリケーションによりきまる。
【0042】S17。 一致がない場合にはキーから異
るビットを用いた他のハッシュアドレスを計算すべきで
ある。
【0043】S18。 各入力キーについてR以下の数
のハッシュアドレスが計算される。
【0044】S19。 一致がない場合には、或るアプ
リケーションに依存するアクションがとられそして次の
入力記録に対応する次のキーがテストされる。このアプ
リケーション依存アクションは参照群へのこの新しいキ
ーの記憶によりデータベースの増加を含むことが出来
る。
【図面の簡単な説明】
【図1】本発明の装置、特にそのメモリとプロセッサの
主エレメントを示す図である。
【図2】各キーについて多数のハッシュアドレスを発生
するための一つのキーの副部分を選択するために用いら
れる乱数表を示す図である。
【図3】本発明による記録記憶方法のフローチャートで
ある。
【図4】本発明による記録とり出し方法を示すフローチ
ャートである。
【符号の説明】
5 入力記録 10 メモリ 15 ハッシュテーブル 18 乱数表 20 プロセッサ 22 エキストラクタ 24 ハッシュアドレス発生器 26 キーコンパレータ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】コンピュータシステムにおいて、そのシス
    テム内に記録またはその編集したバージョンが記憶され
    ているかどうかを決定する、下記段階を含む、方法:上
    記システムに第1記録を記憶する場合には (a)上記システムに記憶されるべき上記記録の第1キ
    ーを選択する段階; (b)ハッシュ機能を上記第1キーの複数の副部分に与
    えることにより上記第1キーから複数の第1ハッシュア
    ドレスを発生する段階; (c)上記第1ハッシュアドレスの夫々に上記第1キー
    またはそれに対するポインタを記憶する段階; 上記システムに第2記録またはその編集されたバージョ
    ンが記憶されているかどうかを決定するときには (d)上記システムに記憶されているかどうかについて
    検査されるべき第2記録についての上記複数の副部分に
    上記ハッシュ機能を与えることにより複数の第2ハッシ
    ュアドレスを発生する段階; (e)上記第2キーと上記第2ハッシュアドレスに記憶
    またはポイントされる各キーとを比較する段階; (f)上記第2キーが上記第2ハッシュアドレスに記憶
    されているキーのいずれかに充分近いものであるならば
    上記システムに記憶されつつあるものとして上記第2記
    録を受け入れる段階。
  2. 【請求項2】前記第1キーおよび第2キーはNビットか
    らなるビットストリームである請求項1の方法。
  3. 【請求項3】前記第2キーは、そのビットの少くとも最
    小パーセンテージが前記第2ハッシュアドレスの内の1
    個に記憶されたキーのビットの最小パーセンテージと整
    合するならば、上記第2ハッシュアドレスの内の1個に
    記憶されキーに充分近いものである請求項2の方法。
  4. 【請求項4】前記最小パーセンテージは80%である請
    求項3の方法。
  5. 【請求項5】コンピュータシステムにおいて、上記シス
    テム内に記録またはその編集されたバージョンが記憶さ
    れているかどうかを決定するための、下記要件を含む、
    装置:上記システムに第1記録を記憶するために、 (a)上記システムに記憶されるべき上記記録について
    の第1キーを選択する手段; (b)ハッシュ機能を上記第1キーの複数の副部分に与
    えることにより上記第1キーから複数の第1ハッシュア
    ドレスを発生する手段; (c)上記第1ハッシュアドレスの夫々に上記第1キー
    またはそれに対するポインタを記憶する手段; 上記システムに第2記録またはその編集されたバージョ
    ンが記憶されているかどうかを決定するために、 (d)上記システムに記憶されているかどうかについて
    検査されるべき第2記録についての上記複数の副部分に
    上記ハッシュ機能を与えることにより複数の第2ハッシ
    ュアドレスを発生する手段; (e)上記第2キーと上記第2ハッシュアドレスに記憶
    またはポイントされる各キーとを比較する手段; (f)上記第2キーが上記第2ハッシュアドレスに記憶
    されているキーのいずれかに充分近いものであるならば
    上記システムに記憶されつつあるものとして上記第2記
    録を受け入れる手段。
JP5014567A 1992-03-20 1993-02-01 コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置 Expired - Lifetime JP2607818B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US854170 1992-03-20
US07/854,170 US5390359A (en) 1992-03-20 1992-03-20 Storing and retrieving records in a computer system

Publications (2)

Publication Number Publication Date
JPH0612303A true JPH0612303A (ja) 1994-01-21
JP2607818B2 JP2607818B2 (ja) 1997-05-07

Family

ID=25317923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5014567A Expired - Lifetime JP2607818B2 (ja) 1992-03-20 1993-02-01 コンピュータシステム内にレコードが記憶されているか否かを判定する方法及び装置

Country Status (2)

Country Link
US (1) US5390359A (ja)
JP (1) JP2607818B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110984B1 (en) * 1998-08-13 2006-09-19 International Business Machines Corporation Updating usage conditions in lieu of download digital rights management protected content

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269363B1 (en) 1994-01-24 2001-07-31 Yossi Matias Method of accessing data using approximate data structures by relaxing the operations that define same
US5542089A (en) * 1994-07-26 1996-07-30 International Business Machines Corporation Method and apparatus for estimating the number of occurrences of frequent values in a data set
US5692177A (en) * 1994-10-26 1997-11-25 Microsoft Corporation Method and system for data set storage by iteratively searching for perfect hashing functions
US6704866B1 (en) 1997-07-11 2004-03-09 Cisco Technology, Inc. Compression and encryption protocol for controlling data flow in a network
US6401188B1 (en) 1998-02-27 2002-06-04 Cisco Technology, Inc. Method for selection on a pattern sequence
US6330557B1 (en) * 1998-06-30 2001-12-11 Sun Microsystems, Inc. Method and system for storing data in a hash table that eliminates the necessity of key storage
US6341346B1 (en) 1999-02-05 2002-01-22 Cisco Technology, Inc. Method for comparison between a pattern sequence and a variable length key
US7389305B1 (en) * 1999-06-01 2008-06-17 Fair Isaac Corporation System and method for managing a database
US6625592B1 (en) * 1999-08-10 2003-09-23 Harris-Exigent, Inc. System and method for hash scanning of shared memory interfaces
US6625612B1 (en) * 2000-06-14 2003-09-23 Ezchip Technologies Ltd. Deterministic search algorithm
US7302582B2 (en) 2000-08-21 2007-11-27 United States Postal Service Delivery point validation system
US7406443B1 (en) * 2000-12-18 2008-07-29 Powerloom Method and system for multi-dimensional trading
US6889225B2 (en) * 2001-08-09 2005-05-03 Integrated Silicon Solution, Inc. Large database search using content addressable memory and hash
US7370044B2 (en) 2001-11-19 2008-05-06 Equifax, Inc. System and method for managing and updating information relating to economic entities
US7469253B2 (en) * 2003-04-01 2008-12-23 Microsoft Corporation Associative hash partitioning using pseudo-random number generator
DE10351778A1 (de) * 2003-11-06 2005-06-09 Daimlerchrysler Ag Verfahren zur Korrespondenzanalyse in Bilddatensätzen
US7764792B1 (en) * 2005-01-13 2010-07-27 Marvell International Ltd. System and method for encoding data transmitted on a bus
US20060198312A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for altering the format and bandwidth of network messages
US20060198318A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for statistical triggering
US20060200711A1 (en) * 2005-02-01 2006-09-07 Schondelmayer Adam H Network diagnostic systems and methods for processing network messages
WO2006083959A2 (en) * 2005-02-01 2006-08-10 Finisar Corporation Network diagnostic system and methods for aggregated links
US20070211697A1 (en) * 2006-03-13 2007-09-13 Finisar Corporation Method of analyzing network with generated traffic
US20060264178A1 (en) * 2005-05-20 2006-11-23 Noble Gayle L Wireless diagnostic systems
US7899057B2 (en) * 2006-04-28 2011-03-01 Jds Uniphase Corporation Systems for ordering network packets
US20070038880A1 (en) * 2005-08-15 2007-02-15 Noble Gayle L Network diagnostic systems and methods for accessing storage devices
US8107822B2 (en) 2005-05-20 2012-01-31 Finisar Corporation Protocols for out-of-band communication
US20070260728A1 (en) * 2006-05-08 2007-11-08 Finisar Corporation Systems and methods for generating network diagnostic statistics
US20080075103A1 (en) * 2005-05-20 2008-03-27 Finisar Corporation Diagnostic device
US20070211696A1 (en) * 2006-03-13 2007-09-13 Finisar Corporation Method of generating network traffic
US7370048B2 (en) * 2005-05-27 2008-05-06 International Business Machines Corporation File storage method and apparatus
US7707136B2 (en) * 2006-03-31 2010-04-27 Amazon Technologies, Inc. System and method for providing high availability data
US7925624B2 (en) * 2006-03-31 2011-04-12 Amazon Technologies, Inc. System and method for providing high availability data
US8213333B2 (en) 2006-07-12 2012-07-03 Chip Greel Identifying and resolving problems in wireless device configurations
US8526821B2 (en) * 2006-12-29 2013-09-03 Finisar Corporation Transceivers for testing networks and adapting to device changes
JP5460486B2 (ja) * 2010-06-23 2014-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション データをソートする装置及び方法
US8880871B2 (en) * 2012-01-03 2014-11-04 Broadcom Corporation Hash table organization
US10846275B2 (en) 2015-06-26 2020-11-24 Pure Storage, Inc. Key management in a storage device
CN113271290B (zh) * 2020-12-29 2023-03-31 上海零数众合信息科技有限公司 一种基于区块链的数字身份管理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3681781A (en) * 1970-09-04 1972-08-01 Goodyear Aerospace Corp Storing and retrieval method
US4290105A (en) * 1979-04-02 1981-09-15 American Newspaper Publishers Association Method and apparatus for testing membership in a set through hash coding with allowable errors
DE3577938D1 (de) * 1984-09-12 1990-06-28 Bbc Brown Boveri & Cie Suchverfahren fuer speicheradressen und adressvergleichsschaltung.
US4899128A (en) * 1985-12-11 1990-02-06 Yeda Research And Development Co., Ltd. Method and apparatus for comparing strings using hash values
US5032987A (en) * 1988-08-04 1991-07-16 Digital Equipment Corporation System with a plurality of hash tables each using different adaptive hashing functions

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110984B1 (en) * 1998-08-13 2006-09-19 International Business Machines Corporation Updating usage conditions in lieu of download digital rights management protected content
US7487128B2 (en) * 1998-08-13 2009-02-03 International Business Machines Corporation Updating usage conditions in lieu of download digital rights management protected content

Also Published As

Publication number Publication date
US5390359A (en) 1995-02-14
JP2607818B2 (ja) 1997-05-07

Similar Documents

Publication Publication Date Title
JPH0612303A (ja) コンピュータシステム内において記録が記憶されているか否かを検査する方法及び装置
US9552349B2 (en) Methods and apparatus for performing spelling corrections using one or more variant hash tables
EP0510634B1 (en) Data base retrieval system
US6173252B1 (en) Apparatus and methods for Chinese error check by means of dynamic programming and weighted classes
US5542090A (en) Text retrieval method and system using signature of nearby words
EP3292481B1 (en) Method, system and computer program product for performing numeric searches
US20040139072A1 (en) System and method for locating similar records in a database
US20080319987A1 (en) System, method and program for creating index for database
US20100281043A1 (en) Fuzzy Database Matching
CN112364014B (zh) 数据查询方法、装置、服务器及存储介质
US20030158725A1 (en) Method and apparatus for identifying words with common stems
US11609897B2 (en) Methods and systems for improved search for data loss prevention
CN109150886A (zh) 结构化查询语言注入攻击检测方法及相关设备
US8051060B1 (en) Automatic detection of separators for compression
JPH05257982A (ja) 文字列認識方法
Goyal Duplicate record identification in bibliographic databases
US7130470B1 (en) System and method of context-based sorting of character strings for use in data base applications
JP3534471B2 (ja) マージソート方法及びマージソート装置
WO2021051600A1 (zh) 基于信息熵识别新词的方法、装置、设备及存储介质
CN107247708B (zh) 一种姓名识别方法及系统
US20220392578A1 (en) Apparatus and method for genome sequence alignment acceleration
US8498988B2 (en) Fast search
WO2017126057A1 (ja) 情報検索方法
Al-Bakry et al. A String Prefix Dependent Dictionary Structure Based on Hashing and Indexing
KR20220164409A (ko) 유전체 서열 정렬 가속 장치 및 방법