JPH0528194A - Data access system - Google Patents

Data access system

Info

Publication number
JPH0528194A
JPH0528194A JP3182640A JP18264091A JPH0528194A JP H0528194 A JPH0528194 A JP H0528194A JP 3182640 A JP3182640 A JP 3182640A JP 18264091 A JP18264091 A JP 18264091A JP H0528194 A JPH0528194 A JP H0528194A
Authority
JP
Japan
Prior art keywords
key
data
chain
index
pointer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3182640A
Other languages
Japanese (ja)
Other versions
JP2990312B2 (en
Inventor
Tadanobu Miyauchi
忠信 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3182640A priority Critical patent/JP2990312B2/en
Publication of JPH0528194A publication Critical patent/JPH0528194A/en
Application granted granted Critical
Publication of JP2990312B2 publication Critical patent/JP2990312B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To reduce the data size and to maintain high speed at the same time by embedding compressed key information in an index with chain. CONSTITUTION:Data structure of an English/Japanese electronic dictionary system is composed of a hash table 11, an index with chain 12, and a real data file 13. A chain pointer is a pointer the corresponding key to the next index record, and a key identifier exists just after the chain pointer, used for check whether or not an input key corresponds to a registration key. Thus, it is not necessary to refer to the real data on the key other than an entry word for checking a collision by introducing the key identifier in the index 12 with chain. Thus the size of the data is reduced and the retrieval can be kept with high speed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、データアクセス方式
に関し、特にチェイン付きハッシュ法の衝突処理方式に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data access method, and more particularly to a collision processing method of a chained hash method.

【0002】[0002]

【従来の技術】従来、キーに基づいたデータ検索におけ
る高速なデータ構造としては、ハッシュ法が良く知られ
ている(参考文献:A.Aho他著,大野義夫訳,「デ
ータ構造とアルゴリズム」[情報処理シリーズ11],
培風館(1987))。ハッシュ法においては、キー衝
突時の取り扱いが問題となり、解決策として様々な方法
が提案されている。ハッシュ法は、オープンハッシュ法
とチェイン付きハッシュ法に大別され、一般に衝突が多
い場合はチェイン付きハッシュ法が採用されている。特
に、辞書的なデータを扱う場合は、本質的に衝突が多い
うえ、キーが一意でない場合も多い。また、こうした辞
書的なデータは規模が非常に大きいことがしばしばであ
り、主記憶容量の制限などから、データの実体をファイ
ルなどの2次記憶上に持つため、チェイン付きハッシュ
法が用いられている。
2. Description of the Related Art Conventionally, the hash method is well known as a high-speed data structure in key-based data retrieval (reference: A. Aho et al., Translated by Yoshio Ohno, "Data Structure and Algorithm" [ Information Processing Series 11],
Baifukan (1987)). In the hash method, handling at the time of key collision becomes a problem, and various methods have been proposed as solutions. The hash method is roughly classified into an open hash method and a hash method with a chain. Generally, when there are many collisions, the hash method with a chain is adopted. In particular, when dealing with dictionary-like data, there are many collisions by nature, and the keys are often not unique. In addition, such dictionary-like data is often very large in scale, and due to the limitation of the main memory capacity, etc., since the substance of the data is stored in the secondary memory such as a file, the chained hash method is used. There is.

【0003】[0003]

【発明が解決しようとする課題】ところで、チェイン付
きハッシュ法では、衝突の際にチェインを辿って、求め
るキーとの比較によるチェックを順次行うが、この比較
のためのキー情報をいかに保持するかが問題となる。例
えば、キー情報をチェイン中に包含すると高速性は維持
されるが、本来データサイズが大きいためインデックス
情報が巨大なものとなる。また、チェインにはポインタ
のみ持ち、データの実体を参照するようにするとアクセ
スが遅くなってしまう。特に、逆引きのためのインデッ
クスを保持する場合にこの問題は顕著となり、さらに挿
入や削除も遅くなる。上述した参考文献「データ構造と
アルゴリズム」でも、こうした二次インデックスを用い
た場合の問題が述べられている。
By the way, in the hash method with chain, in the case of collision, the chain is traced and checks are sequentially performed by comparing with the desired key. How to hold the key information for this comparison Is a problem. For example, if the key information is included in the chain, high speed performance is maintained, but since the data size is originally large, the index information becomes huge. Also, if the chain has only pointers and the data entity is referenced, access will be slow. In particular, this problem becomes noticeable when an index for reverse lookup is held, and insertion and deletion become slower. The above-mentioned reference "Data Structure and Algorithms" also describes the problem of using such a secondary index.

【0004】一般に、英和辞書を代表とする電子辞書で
は、数万から数十万語の見出し語を持ち、さらに見出し
語以外の派生語、意味などからのインデックスまで含め
ると、データサイズも非常に大きくなる。そのうえ、対
話的に利用されることが多いため、検索には高速性が要
求される。したがって、これまでのデータアクセス方式
では、用途やハードウェアの制限などに応じて速度と容
量のいずれかを選択する形で妥協せざるを得なかったの
が現状である。
Generally, an electronic dictionary typified by an English-Japanese dictionary has headwords of tens to hundreds of thousands of words, and if indexes including derived words and meanings other than headwords are also included, the data size becomes very large. growing. In addition, since it is often used interactively, high speed search is required. Therefore, in the current data access method, there is no choice but to compromise in the form of selecting either speed or capacity according to the use and the limitation of hardware.

【0005】この発明は、辞書的なデータを対象とした
ハッシュ法におけるキー衝突のチェックに際し、データ
サイズの縮小と検索の高速性維持を同時に実現すること
ができるデータアクセス方式を提供することを目的とす
る。
An object of the present invention is to provide a data access method capable of simultaneously realizing reduction of data size and maintenance of high-speed search when checking a key collision in a hash method for dictionary data. And

【0006】[0006]

【課題を解決するための手段】この発明に係わるデータ
アクセス方式では、複数の検索キーと、ハッシュ表と、
チェイン付きインデックスと、実データファイルとを有
するデータ構造を具え、前記チェイン付きインデックス
内のチェインポインタに、キーに関する情報を示すキー
識別子を付加するようにしている。
In the data access method according to the present invention, a plurality of search keys, a hash table,
A data structure having a chained index and an actual data file is provided, and a key identifier indicating information about a key is added to a chain pointer in the chained index.

【0007】前記キー識別子は、通常の検索キーに関し
ては識別に必要な情報のみを持つようにする。また、キ
ー識別子はチェインのリンクにおいて直前のキーと同一
である場合は、省略するように指定してもよい。さら
に、対象とするデータが名前を有し、検索キーが名前そ
のものである場合は、キー識別子は実データの名前を参
照するように指定することができる。同様に、対象とす
るデータが名前を有し、検索キーが名前から解釈可能で
ある場合は、キー識別子は実データの名前を解釈して参
照するように指定することができる。
The key identifier has only information necessary for identification with respect to a normal search key. If the key identifier is the same as the immediately preceding key in the chain link, it may be omitted. Further, when the target data has a name and the search key is the name itself, the key identifier can be designated to refer to the name of the actual data. Similarly, if the target data has a name and the search key can be interpreted from the name, the key identifier can be specified to interpret and refer to the name of the actual data.

【0008】[0008]

【作用】上記データアクセス方式では、まず、与えられ
た検索キーのハッシュ値を求め、ハッシュ表の該当する
位置の内容を読み込む。ここで、チェインポインタにキ
ー識別子が付加されているときは、このキー識別子に基
づいて現在のインデックスレコードがキーに対応するか
どうかを判別する。インデックスレコードがキーに対応
するときは、データポインタを読み込み、実データファ
イル上の位置からデータレコードを取り出して結果のリ
ストに追加する。
In the above data access method, first, the hash value of the given search key is obtained, and the contents of the corresponding position in the hash table are read. Here, when a key identifier is added to the chain pointer, it is determined whether or not the current index record corresponds to the key based on this key identifier. When the index record corresponds to the key, the data pointer is read, the data record is fetched from the position in the actual data file, and it is added to the result list.

【0009】このように、チェイン付きインデックス内
にキーに関する情報を圧縮した形式でキー識別子として
埋め込むことにより、キー衝突時の比較のためのキー情
報を効率よく利用できるようになり、データサイズの縮
小と検索の高速性維持を同時に実現することが可能とな
る。
In this way, by embedding the information about the key in the compressed index as the key identifier in the chained index, the key information for comparison at the time of a key collision can be efficiently used, and the data size can be reduced. It is possible to realize high speed search and search at the same time.

【0010】[0010]

【実施例】以下、この発明に係わるデータアクセス方式
を英和電子辞書システムに適用した場合の実施例を説明
する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment in which the data access system according to the present invention is applied to an English-Japanese electronic dictionary system will be described below.

【0011】図2は、英和電子辞書システムの概略構成
を示すブロック図である。この計算機システムは、表示
画面上に各種のデータなどを表示するCRT21と、前
記CRT21での表示を制御するCRTドライバ22
と、コマンドや文字列、数値などの入力を行うキーボー
ド23と、ポインティングデバイスであるマウス24
と、ユーザーによるキーボード23やマウス24の操作
によって、各種のデータを出力するキーボード/マウス
ドライバ25と、ディスク装置26、ディスク装置ドラ
イバ27、主記憶装置28、CPU(中央処理装置)2
9とから構成されている。
FIG. 2 is a block diagram showing a schematic configuration of the English-Japanese electronic dictionary system. This computer system includes a CRT 21 that displays various data and the like on a display screen, and a CRT driver 22 that controls the display on the CRT 21.
And a keyboard 23 for inputting commands, character strings, and numerical values, and a mouse 24 as a pointing device.
A keyboard / mouse driver 25 that outputs various data by a user operating the keyboard 23 and the mouse 24; a disk device 26, a disk device driver 27, a main storage device 28, a CPU (central processing unit) 2
9 and 9.

【0012】ディスク装置26は、大量のデータを格納
するための二次記憶装置であり、後述するチェイン付き
インデックスや実データファイルなどが格納されてい
る。また、ディスク装置26のデータの入出力はディス
ク装置ドライバ27で制御されている。
The disk device 26 is a secondary storage device for storing a large amount of data, and stores an index with a chain, an actual data file, etc., which will be described later. Data input / output of the disk device 26 is controlled by the disk device driver 27.

【0013】主記憶装置28は、アプリケーションプロ
グラム、及びキーボード23やマウス24から入力され
た文字や数値などのデータのほか、後述するハッシュ表
を格納している。
The main memory 28 stores an application program and data such as characters and numerical values input from the keyboard 23 and the mouse 24, as well as a hash table described later.

【0014】CPU29は、システム全体の制御を行う
と共に、各種の命令に基づいて所定のデータに対する演
算処理を行う回路であり、後述のフローチャートに基づ
いてデータの検索処理を実行する。
The CPU 29 is a circuit that controls the entire system and performs arithmetic processing on predetermined data based on various commands, and executes data retrieval processing based on a flowchart described later.

【0015】上記英和電子辞書システムにおけるデータ
構造の概要を図1に示す。図1のデータ構造は、基本的
にはハッシュ表11、チェイン付きインデックス12、
実データファイル13の3つから構成されている。図に
示すように、通常の見出し語(a、Aなど)からの検索
に加え、転置キーの設定により単語の語義(ひとつの、
イ音など)や発音のカタカナ表記(エ、アなど)からの
検索を行えるようになっており、このため、キー/レコ
ード数ともに非常に多く、またあるキーに対するレコー
ドも一意ではない。
An outline of the data structure in the English-Japanese electronic dictionary system is shown in FIG. The data structure of FIG. 1 is basically a hash table 11, a chained index 12,
It is composed of three actual data files 13. As shown in the figure, in addition to the search from normal entry words (a, A, etc.), the meaning of a word (one,
It is possible to search by using the (a sound, etc.) or pronunciation katakana notation (d, a, etc.), so that the number of keys / records is very large, and the record for a certain key is not unique.

【0016】まず、ハッシュ表11は検索キーkのハッ
シュ値h(k)が指すアドレスよりチェイン付きインデ
ックス12へのポインタを3バイトで保持する。対応す
るキーが未登録の場合、FFFFFFHを保持する。
First, the hash table 11 holds a pointer to the chained index 12 in 3 bytes from the address indicated by the hash value h (k) of the search key k. If the corresponding key is not registered, FFFFFFH is held.

【0017】次に、チェイン付きインデックス12の詳
細を説明する。チェイン付きインデックス12は、デー
タレコードに一対一で対応する情報を持つインデックス
レコードの集合である。インデックスレコードの構造を
図3に示す。インデックスレコードは、レコードに設定
された全てのキーに関するチェインポインタ1〜nと、
キー識別子1〜nのペアの並び、及びデータファイルへ
のポインタ(データポインタ)を保持している。
Next, details of the chained index 12 will be described. The chained index 12 is a set of index records having information corresponding to the data records on a one-to-one basis. The structure of the index record is shown in FIG. The index record includes chain pointers 1 to n related to all the keys set in the record,
It holds an array of pairs of key identifiers 1 to n and a pointer (data pointer) to a data file.

【0018】チェインポインタは、対応するキーに関す
る次のインデックスレコードへのポインタであり、衝突
により同じハッシュ値を持つ登録キーのリスト(データ
のつながり)が構成される。各リストの先頭はハッシュ
表から直接指されており、衝突がある場合、各ポインタ
は図4に示すように次のチェインポインタのアドレスを
保持し、リストの終端の場合にはnilとして0000
00Hが格納される。チェインポインタは3バイトで表
現され、000000Hから7FFFFFHの値を取り
得る。
The chain pointer is a pointer to the next index record related to the corresponding key, and a list (registered data) of registered keys having the same hash value is formed by collision. The head of each list is directly pointed to by the hash table. When there is a collision, each pointer holds the address of the next chain pointer as shown in FIG. 4, and at the end of the list, nil is 0000.
00H is stored. The chain pointer is represented by 3 bytes and can take a value of 000000H to 7FFFFFH.

【0019】キー識別子はチェインポインタの直後に存
在し、入力キーが登録キーに対応するか否かのチェック
に用いられる。この実施例におけるキー識別子の記述ル
ールを以下に示す。なお、文字コードはEUCである。
The key identifier exists immediately after the chain pointer and is used to check whether the input key corresponds to the registration key. The description rule of the key identifier in this embodiment is shown below. The character code is EUC.

【0020】(1)通常の検索キーにおいては、登録キ
ーの文字コード列の各文字コードの下位1バイトと00
80Hの論理和のバイト列を順に格納する。
(1) In a normal search key, the lower 1 byte of each character code of the character code string of the registration key and 00
The byte string of the logical sum of 80H is stored in order.

【0021】(2)登録キーが見出し語から導出できる
場合であれば80Hを格納する。これは、キーが見出し
語そのものである場合はもちろん、“A,a”や“colo
(u)r”といった見出し語では一般的な表記をルール化す
ることで解釈できる。
(2) If the registration key can be derived from the entry word, 80H is stored. This applies not only when the key is the entry word itself, but also when "A, a" or "colo
Headwords such as (u) r ”can be interpreted by making general notations into rules.

【0022】(3)登録キーがチェインの直前と同じで
ある場合は省略される。
(3) It is omitted when the registration key is the same as that immediately before the chain.

【0023】このように、キー識別子を導入することに
より、衝突のチェックのために見出し語以外のキーでは
実データを参照する必要がなくなる。ただし、その場
合、登録キーの情報量は落ちている。これにより、万一
異なるキーにもかかわらずキー下位1バイトが全て同じ
で、かつハッシュ値も等しい場合の区別ができなくなる
が、ハッシュ関数を十分吟味すれば実用上問題ないと考
えられる。また、検索のみを対象にした電子辞書では、
登録キーの情報はデータレコードに持つ必要はないた
め、データ量を節約することができる。例えば、発音の
カタカナ表記はキー設定時に用意したものであるが、実
際には実データにも含まれていないし、キー識別子にも
他のキーとの識別のための情報しか存在していない。
In this way, by introducing the key identifier, it is not necessary to refer to the actual data by the key other than the entry word for checking the collision. However, in that case, the information amount of the registration key is low. This makes it impossible to distinguish when the lower 1 byte of the key is the same and the hash values are the same, even if the keys are different, but it is considered that there is no practical problem if the hash function is carefully examined. Also, in an electronic dictionary that only searches,
Since the information of the registration key does not need to be included in the data record, the amount of data can be saved. For example, the katakana notation for pronunciation is prepared when the key is set, but is not actually included in the actual data, and the key identifier only has information for distinguishing it from other keys.

【0024】データポインタには実データにおける実際
のデータレコードの先頭を指すアドレスが、デリミタF
FHに続けて3バイトで格納されている。データポイン
タがFFFFFFHである場合は、データレコードが削
除されていることを示す。
In the data pointer, the address that points to the beginning of the actual data record in the actual data is the delimiter F.
It is stored in 3 bytes following FH. When the data pointer is FFFFFFH, it indicates that the data record is deleted.

【0025】実データファイルはデータレコードの集合
であり、データレコードは次の形式を持つ。
The actual data file is a set of data records, and the data records have the following format.

【0026】(見出し語)(見出し区切り[NULL])
(内容部)(レコード区切り[LF])キー識別子に前述
のように80Hが用いられた場合、このデータレコード
の見出し語を参照することでキーの識別を行う。ただ
し、このように実データを参照することは、ポインタを
手操る回数や次記憶へのアクセスが増える点で速度の低
下を招くため、速度を重視する場合であれば通常の検索
キーと同様のキー識別子を用いてもよい。
(Heading word) (Heading delimiter [NULL])
(Content part) (Record delimiter [LF]) When 80H is used as the key identifier as described above, the key is identified by referring to the entry word of this data record. However, referencing the actual data in this manner causes a decrease in speed in that the number of times the pointer is manipulated and the number of accesses to the next memory increase, so that if speed is important, the same as a normal search key is used. The key identifier may be used.

【0027】実データファイル13(内容部)は実際の
辞書記述部分であるが、この実施例ではキー識別子によ
り検索キーの情報を含まないため、この内部にフィール
ドなどの概念は不要であり、内容はフラットなテキスト
でよい。データレコードは全体で一つのテキストファイ
ルとなる。
The actual data file 13 (content part) is an actual dictionary description part, but in this embodiment, since the information of the search key is not included by the key identifier, the concept of the field etc. is not necessary inside this and the contents Can be flat text. The data record becomes one text file as a whole.

【0028】次に、上述した英和電子辞書システムによ
るデータ検索のアルゴリズムを、図5のフローチャート
を用いて説明する。
Next, an algorithm for data retrieval by the English-Japanese electronic dictionary system described above will be described with reference to the flowchart of FIG.

【0029】まず、初期化(ステップ101)の後、検
索キーのハッシュ値hを求め、ハッシュ表の位置hの内
容をインデックスポジションipとして読み込む(ステ
ップ102)。次に、ip=FFFFFFHであるかど
うかを判定する(ステップ103)。ここで、ip=F
FFFFFHであれば未登録キーとわかるので終了す
る。また、ip=FFFFFFHでないときは、チェイ
ン付きインデックス上の位置ipから3バイトをチェイ
ンポジションcpとして読み込み(ステップ104)、
[ip+3]≧80Hかどうかを判定する(ステップ1
05)。ここで、ip+3から80H以上のバイト列が
続けば、それをキー識別子krとして読み込む(ステッ
プ106)。また、省略されている場合は直前のものを
用いる。次に、krに基づいて現在のインデックスレコ
ードがキーに対応するか否かを判定し(ステップ10
7)、対応するときはチェイン付きインデックス上のF
FHまでスキップし、続く3バイトをデータポインタd
pとして読み込む(ステップ108)。続いて、dp=
FFFFFFHであるかどうかを判定する(ステップ1
09。ここで、dp=FFFFFFHでなければデータ
レコードは存在するので、データファイル上の位置dp
から、データレコードのフォーマットに従い0AH(=
LF)までを結果のリストに追加する(ステップ11
0)。次に、cp=0かどうかを判定し(ステップ10
1)、cp=0であるなら終了、そうでなければチェイ
ンが続いているので、ipにcpを代入して(ステップ
112)、ステップ104へ戻る。
First, after initialization (step 101), the hash value h of the search key is obtained, and the content of the position h in the hash table is read as the index position ip (step 102). Next, it is determined whether ip = FFFFFFH (step 103). Where ip = F
If it is FFFFFH, it means that the key is an unregistered key, and the process ends. If ip = FFFFFFH is not satisfied, 3 bytes are read as a chain position cp from the position ip on the chained index (step 104),
It is determined whether [ip + 3] ≧ 80H (step 1
05). Here, if a byte string of 80H or more continues from ip + 3, it is read as the key identifier kr (step 106). If omitted, the previous one is used. Next, it is determined whether the current index record corresponds to the key based on kr (step 10
7), if applicable, F on the chained index
Skip to FH and continue to 3 bytes data pointer d
It is read as p (step 108). Then, dp =
It is determined whether FFFFFFH (step 1
09. Here, if dp = FFFFFFH is not satisfied, the data record exists, so the position on the data file dp
From 0AH (=
Add up to LF to the list of results (step 11)
0). Next, it is determined whether cp = 0 (step 10
1) If cp = 0, the process ends. If not, the chain continues, so cp is substituted for ip (step 112) and the process returns to step 104.

【0030】なお、挿入、削除に関しても、チェインの
インデックスとデータの実体が分離されているため、ポ
インタのつなぎかえにより高速に実現可能である。
Since the chain index and the substance of the data are separated, insertion and deletion can be realized at high speed by switching the pointers.

【0031】上記実施例ではインデックスをディスク装
置26に保持することを前提にしているが、主記憶装置
28の容量に余裕があれば主記憶装置28に保持するこ
とによりさらに高速化を図ることができる。
In the above embodiment, it is premised that the index is held in the disk device 26, but if the capacity of the main memory 28 is sufficient, the index can be held in the main memory 28 for further speeding up. it can.

【0032】また、この発明に係わるデータアクセス方
式は、チェイン付きハッシュ法一般に適用可能であり、
上記実施例に示した英和電子辞書システムだけに限定さ
れるものではない。例えば、テキストデータベースなど
の大量の情報を高速に探索するシステムにおける基本的
なデータ構造として利用することもできる。
The data access method according to the present invention can be applied to the chained hash method in general,
The present invention is not limited to the English-Japanese electronic dictionary system shown in the above embodiment. For example, it can be used as a basic data structure in a system for searching a large amount of information at high speed such as a text database.

【0033】[0033]

【発明の効果】以上説明したように、この発明に係わる
データアクセス方式では、チェイン付きインデックス内
のチェインポインタに、キーに関する情報を示す識別子
を付加するようにしたため、キーの比較のためのキー情
報を効率よく利用できるようになり、データ検索の高速
性とデータサイズの節約が同時に可能となる。これによ
り、電子辞書を代表とする検索キーを主体とした検索を
非常に効率的に実現することが可能となる。
As described above, in the data access method according to the present invention, since the identifier indicating the information about the key is added to the chain pointer in the chained index, the key information for key comparison is added. Can be used efficiently, and the speed of data retrieval and the saving of data size can be achieved at the same time. As a result, it is possible to very efficiently realize a search mainly using a search key represented by an electronic dictionary.

【図面の簡単な説明】[Brief description of drawings]

【図1】英和電子辞書システムにおけるデータ構造の概
要を示す図。
FIG. 1 is a diagram showing an outline of a data structure in an English-Japanese electronic dictionary system.

【図2】英和電子辞書システムの概略構成を示すブロッ
ク図。
FIG. 2 is a block diagram showing a schematic configuration of an English-Japanese electronic dictionary system.

【図3】インデックスレコードの構造を示す図。FIG. 3 is a diagram showing a structure of an index record.

【図4】インデックスレコードにおけるチェインポイン
タのリストを示す図。
FIG. 4 is a diagram showing a list of chain pointers in an index record.

【図5】英和電子辞書システムによるデータ検索のアル
ゴリズムを示すフローチャート。
FIG. 5 is a flowchart showing an algorithm for data retrieval by the English-Japanese electronic dictionary system.

【符号の説明】[Explanation of symbols]

11…ハッシュ表、12…チェイン付きインデックス、
13…実データファイル
11 ... Hash table, 12 ... Index with chain,
13 ... Actual data file

Claims (1)

【特許請求の範囲】 【請求項1】ハッシュ表と、チェイン付きインデックス
と、実データファイルとを有するデータ構造を具えたデ
ータアクセス方式であって、前記チェイン付きインデッ
クス内のチェインポインタに、キーに関する情報を示す
識別子を付加したことを特徴とするデータアクセス方
式。
Claims: What is claimed is: 1. A data access method comprising a data structure having a hash table, a chained index, and an actual data file, wherein a chain pointer in the chained index relates to a key. A data access method characterized by adding an identifier indicating information.
JP3182640A 1991-07-23 1991-07-23 Data access method and device Expired - Fee Related JP2990312B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3182640A JP2990312B2 (en) 1991-07-23 1991-07-23 Data access method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3182640A JP2990312B2 (en) 1991-07-23 1991-07-23 Data access method and device

Publications (2)

Publication Number Publication Date
JPH0528194A true JPH0528194A (en) 1993-02-05
JP2990312B2 JP2990312B2 (en) 1999-12-13

Family

ID=16121837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3182640A Expired - Fee Related JP2990312B2 (en) 1991-07-23 1991-07-23 Data access method and device

Country Status (1)

Country Link
JP (1) JP2990312B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099524A (en) * 2004-09-30 2006-04-13 Nec Commun Syst Ltd Data structure and data search method
CN109101640A (en) * 2018-08-21 2018-12-28 赛凡信息科技(厦门)有限公司 A kind of distribution scheme of object data in file system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099524A (en) * 2004-09-30 2006-04-13 Nec Commun Syst Ltd Data structure and data search method
CN109101640A (en) * 2018-08-21 2018-12-28 赛凡信息科技(厦门)有限公司 A kind of distribution scheme of object data in file system

Also Published As

Publication number Publication date
JP2990312B2 (en) 1999-12-13

Similar Documents

Publication Publication Date Title
US6470347B1 (en) Method, system, program, and data structure for a dense array storing character strings
US5721899A (en) Retrieval apparatus using compressed trie node and retrieval method thereof
US4922417A (en) Method and apparatus for data hashing using selection from a table of random numbers in combination with folding and bit manipulation of the selected random numbers
US8190613B2 (en) System, method and program for creating index for database
US6778985B1 (en) Implementing descending indexes with a descend function
US20040221226A1 (en) Method and mechanism for processing queries for XML documents using an index
JPH10501912A (en) System and method for portable document indexing using N-gram word decomposition
JPH02271468A (en) Data processing method
US5566329A (en) System and method for mutation of selected assignment operations on large data objects
JP3003915B2 (en) Word dictionary search device
US5950184A (en) Indexing a database by finite-state transducer
US5347652A (en) Method and apparatus for saving and retrieving functional results
US5956705A (en) Reverse-byte indexing
JP3459053B2 (en) Document search method and apparatus
US20030023584A1 (en) Universal information base system
JP2990312B2 (en) Data access method and device
US6469643B1 (en) Information processing system
JP3565840B2 (en) Document management method and document management device
JP2000090115A (en) Index generating method and retrieval method
CN117290523B (en) Full text retrieval method and device based on dynamic index table
JP3288063B2 (en) Variable length data storage and reference system
CN117235291B (en) Full text retrieval method and device based on static index table
JPH07168848A (en) Word dictionary retrieval device
JPH0772898B2 (en) Index creation method
JP3456127B2 (en) Document search method and apparatus with high-speed index key expansion function

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees