JPS6393033A - Data retrieving system - Google Patents

Data retrieving system

Info

Publication number
JPS6393033A
JPS6393033A JP61237235A JP23723586A JPS6393033A JP S6393033 A JPS6393033 A JP S6393033A JP 61237235 A JP61237235 A JP 61237235A JP 23723586 A JP23723586 A JP 23723586A JP S6393033 A JPS6393033 A JP S6393033A
Authority
JP
Japan
Prior art keywords
keyword
data
key
area
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61237235A
Other languages
Japanese (ja)
Other versions
JPH0612550B2 (en
Inventor
Emika Suzuki
鈴木 恵美香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Dai Ichi Communications Software Ltd
Fujitsu Ltd
Original Assignee
Fujitsu Dai Ichi Communications Software Ltd
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Dai Ichi Communications Software Ltd, Fujitsu Ltd filed Critical Fujitsu Dai Ichi Communications Software Ltd
Priority to JP61237235A priority Critical patent/JPH0612550B2/en
Publication of JPS6393033A publication Critical patent/JPS6393033A/en
Publication of JPH0612550B2 publication Critical patent/JPH0612550B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To retrieve data at a high speed by producing a sub-keyword having the shorter bit length than each keyword to write it to each corresponding data block and having an access to the keyword after converting it into a sub-keyword. CONSTITUTION:A data table 11 of a data retrieving device 10 contains data blocks 11-1-11-n. A block 11-i includes an area KEY-i of a normal keyword (KEY) and an area DATA-i of the data (DATA) corresponding to the area KEY-i together with an area key-i of a sub-keyword (key). The keyword (key) is produced previously via a converting part 12 for each KEY and added to the head of the block 11-i. When a data retrieving request is received, the KEY for access is converted into the key for access by the part 12 for access of each block 11-i. In such a way, data can be retrieved at a high speed.

Description

【発明の詳細な説明】 〔概 要〕 各キーワードに対応したデータを検索するに当り、各キ
ーワード毎のサブキーワードを一定の規則で予め作成し
ておいてそれぞれのキーワードに付加しておき、キーワ
ードを指定して対応のデータを検索すべき要求が発生す
る毎に、当該キーワードを前記一定の規則のもとに対応
のサブキーワードを算出し、算出されたサブキーワード
によって目的とするデータを検索することによりデータ
検索時間の短縮を図る。
[Detailed description of the invention] [Summary] When searching for data corresponding to each keyword, sub-keywords for each keyword are created in advance according to certain rules and added to each keyword. Each time a request to search for corresponding data by specifying a keyword occurs, a corresponding sub-keyword is calculated based on the above-mentioned certain rules, and the target data is searched using the calculated sub-keyword. This aims to shorten data search time.

〔産業上の利用分野〕[Industrial application field]

本発明はデータの検索方式に関する。 The present invention relates to a data search method.

データベースへのアクセスは必ず所望のキーワードを指
定して行う。例えば、データベースが電話番号であれば
、所望の人名(キーワード)を入力して当該電話番号(
データ)を得る。あるいはデータベースが例えば図書目
録であれば、所望の書符名又は著者名(キーワード)を
入力して当該図書目録(データ)を得る。本発明はこの
ようなキーワードによるデータ検索方式に関する。
The database must be accessed by specifying the desired keyword. For example, if the database is a phone number, enter the desired person's name (keyword) and enter the phone number (keyword).
data). Alternatively, if the database is, for example, a library catalog, the desired book name or author name (keyword) is input to obtain the library catalog (data). The present invention relates to a data search method using such keywords.

〔従来の技術〕[Conventional technology]

従来のデータ検索においてはキーワードを一文字一文字
比較して所望のキーワードと一致しているか否かを検出
していた。例えば、上記の例において、人名(仮に“E
MI KA″とする)に対応する電話番号(データ)を
データテーブルから読み出すとすると、先ず、EM I
 KAを例えばアスキーコードを用いて各文字毎に変換
し、“45”。
In conventional data searches, keywords are compared character by character to detect whether the keyword matches a desired keyword. For example, in the example above, the person's name (temporarily “E
When reading out the telephone number (data) corresponding to EM I KA'' from the data table, first
For example, convert KA character by character using ASCII code and get "45".

4D”、“49”、”4B”、”41″とする。4D", "49", "4B", and "41".

そして、データテーブルの各データに付されたキーワー
ドのうち、これら“45”・・・“41″と一致するも
のを検出する。この場合、5文字の1つ1つについて比
較する。ここに一致がとれると、当該データ(電話番号
)の検索がなされる。
Then, among the keywords attached to each data in the data table, keywords that match these "45" . . . "41" are detected. In this case, each of the five characters is compared. If a match is found, the data (telephone number) is searched.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述した従来のデータ検索においてはN文字(Nは自然
数)のキーワードを入力して、データテーブル内の同一
のキーワードを検出する。データテーブル内のキーワー
ドの文字数は各キーワード毎にまちまちであるが、いず
れにしても入力キーワードのN文字について少なくとも
N回の文字対応の比較動作を必要とする。したがって、
目的とするキーワードのアクセスにかなりの時間を要し
、結局、目的とするデータを検索するまでの時間が長く
なるという問題がある。
In the conventional data search described above, a keyword of N characters (N is a natural number) is input to detect the same keyword in a data table. The number of characters of the keyword in the data table varies for each keyword, but in any case, at least N character comparison operations are required for the N characters of the input keyword. therefore,
There is a problem in that it takes a considerable amount of time to access the desired keyword, and as a result, it takes a long time to search for the desired data.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は本発明の方式に基づく原理構成を図解的に示す
図である。本図において、データ検索装置10における
11はデータテーブルであり、いわばデータベースをな
す。データテーブルはn個のデータブロック11−1.
11−2・・・11−1・・・11−nからなる。各デ
ータブロックは同一の構成を有し、例えばデータブロッ
ク11−1を詳細に示す。データブロック11−1は、
通常のキーワード(K E Y)の領域KEY−iとこ
れに対応するデータ(DATA)の領域DATA−1を
少なくとも備えてなり、本発明の特徴をなすサブキーワ
ード(k e y)の領域key−iがさらに付加され
る。
FIG. 1 is a diagram schematically showing the principle configuration based on the system of the present invention. In the figure, numeral 11 in the data search device 10 is a data table, which constitutes a database. The data table consists of n data blocks 11-1.
11-2...11-1...11-n. Each data block has the same configuration; for example, data block 11-1 is shown in detail. The data block 11-1 is
The sub-keyword (key) area key-i, which is a feature of the present invention, comprises at least an area KEY-i for a normal keyword (KEY) and an area DATA-1 for data (DATA) corresponding thereto. i is further added.

このサブキーワードkeyは各キーワードKEY毎に、
変換部12を用いて予め生成され、各データブロック(
11−i)の先頭に付加される。
This sub keyword key is for each keyword KEY,
Each data block (
11-i).

一方、データ検索の要求があったとき、アクセス用の所
望のキーワードKEYが図中の右下より入力される。こ
れを変換部12を介しアクセス用のサブキーワードke
yに変換し、このkeyを用いてデータテーブル11内
の各データブロック(11−i)をアクセスする。
On the other hand, when a data search request is made, a desired keyword KEY for access is input from the lower right of the figure. This is converted into the subkeyword ke for access via the conversion unit 12.
y, and each data block (11-i) in the data table 11 is accessed using this key.

〔作 用〕[For production]

キーワードKEYよりサブキーワードkeyを生成する
ための変換部12は一定の規則のもとにキーワードKE
Yのビット長よりも短いビット長のサブキーワードke
yを生成するものであり、アクセス用のキーワードKE
Yと各データブロック(11−i)のキーワード領域(
KEY−i)との一致不一致を検出する時間に比して、
アクセス用のサブキーワードkeyと各データブロック
(11−i)のサブキーワード領域(key−i)との
一致不一致を検出する時間の方が短くなる。
The conversion unit 12 for generating a sub-keyword key from the keyword KEY converts the keyword KE based on certain rules.
Subkeyword ke with a bit length shorter than the bit length of Y
y, and the access keyword KE
Y and the keyword area (
KEY-i)
The time required to detect a match or mismatch between the access subkeyword key and the subkeyword area (key-i) of each data block (11-i) is shorter.

つまり、データ検索時間は短縮される。なお、第1図中
の上方の変換部12と下方の変換部12とは同じもので
もよいし、あるいは既述の一定の規則が双方同一であり
さえすれば別個のものでもよい。
In other words, data search time is reduced. Note that the upper converter 12 and the lower converter 12 in FIG. 1 may be the same, or may be separate as long as the above-described certain rules are the same for both.

キーワードKEYのビット長に比しサブキーワードke
yのビット長が短いので、サブキーワードkeyで区別
しうるデータブロック(11−i)の数(i)は当然少
なくなる。したがって1つのアクセス用サブキーワード
keyによって2以上のデータブロックがアクセスされ
るケースがありうる。このときは、さらにキーワードK
EY同士の一致不一致を見て、所望の1つを特定する。
Compared to the bit length of the keyword KEY, the subkeyword ke
Since the bit length of y is short, the number (i) of data blocks (11-i) that can be distinguished by the sub-keyword key naturally decreases. Therefore, there may be cases where two or more data blocks are accessed by one access subkeyword key. At this time, the keyword K
Look at the matches and discrepancies between the EYs and identify the desired one.

〔実施例〕〔Example〕

第2Aおよび2B図は変換部12における一動作例を示
すフローチャートであり、前述の“一定の規則・”の−
具体例である。本例による一定の規則では、 (イ)キーワード(KEY)を構成する第1文字を表す
ビット列を一定の方向に1ビットシフトし、(U)1ビ
ットシフトしたビット列と、その1ビットシフトにより
オーバーフローした1ビットキャリーと、第2文字を表
すビット列とを加算する、という操作手順を一単位とし
て、これを各文字毎に最終文字まで繰り返し実行する。
FIGS. 2A and 2B are flowcharts showing an example of the operation in the conversion unit 12.
This is a specific example. According to a certain rule according to this example, (a) the bit string representing the first character constituting the keyword (KEY) is shifted by 1 bit in a certain direction, and (U) the bit string shifted by 1 bit and the bit string that is shifted by 1 bit cause overflow. The operation procedure of adding the 1-bit carry and the bit string representing the second character is taken as one unit, and this is repeated for each character until the final character.

前述の例(EMI KA)によれば、第3図に示すよう
な操作がなされる。第3図は本発明で用いる一定の規則
を実際の例をもって示す図である。
According to the above example (EMI KA), the operations shown in FIG. 3 are performed. FIG. 3 is a diagram illustrating certain rules used in the present invention with practical examples.

また、第4図は第3図の例を簡素化して示す図であり、
しかもキーワード(EMIKA)に対する最終的な結果
であるサブキーワードkey (本図ではBA)まで示
しである。第3図において、最初の文字(第1文字のE
)Wlについては、これに加えるべき加算ビット列(A
DO)もキャリー(CRO)もないから、ADOもCR
Oも共にOにプリセットしておく。したがって第1文字
W1についての加算ビット列ADIは第1文字W1その
ものである。
Moreover, FIG. 4 is a diagram showing a simplified example of FIG. 3,
Furthermore, the sub-keyword key (BA in this figure), which is the final result for the keyword (EMIKA), is also shown. In Figure 3, the first letter (first letter E
)Wl, the addition bit string (A
Since there is no DO) or carry (CRO), there is no ADO or CR.
O is also preset to O. Therefore, the addition bit string ADI for the first character W1 is the first character W1 itself.

次にADIを1ビットシフト(レフトシフト)し、キャ
リーCRI(この場合O)を得ると共に、1ビットシフ
トしたビット列ADI’を得る。
Next, ADI is shifted by 1 bit (left shift) to obtain a carry CRI (O in this case), and a bit string ADI' shifted by 1 bit is obtained.

これらCRIとADI’は、第2文字W2 (EMIK
AのMを示す)に加えられ加算ビット列AD2を得る。
These CRI and ADI' are the second character W2 (EMIK
(indicating M of A) to obtain an addition bit string AD2.

AD2をさらに1ビットシフトしてAD2’を得ると共
に、このときオーバーフローしたキャリーCR2(この
場合1)を得る。
AD2 is further shifted by 1 bit to obtain AD2' and carry CR2 (1 in this case) which has overflowed at this time is obtained.

AD2’とCR2は第3文字(EMIKAの■)W3に
加えられ、同様の操作が最終文字(A)まで順次繰り返
される。
AD2' and CR2 are added to the third character (■ of EMIKA) W3, and the same operation is repeated sequentially until the final character (A).

上記の操作手順は、第2Aおよび2B図にフローチャー
トの形で示されている。
The above operating procedure is illustrated in flowchart form in Figures 2A and 2B.

もっと分り易く示すと(アスキーコードによる)、第4
図に示すとおりになり、最終的な結果BAが、キーワー
ドKEY (EMIKA)に対するサブキーワードke
yとして得られる。なお、第4図では第3図の場合と異
なり、各値(ADO、CRO。
To show it more clearly (using ASCII code), the fourth
As shown in the figure, the final result BA is the subkeyword ke for the keyword KEY (EMIKA).
It is obtained as y. In addition, in FIG. 4, different from the case of FIG. 3, each value (ADO, CRO.

Wl・・・)の加算を左から右へ、そして上段から下段
への流れで示している。
Wl...) is shown in a flow from left to right and from the top to the bottom.

上述した一定の規則は一例であるが、シミュレーション
によれば、かなり一致率が低いことが確められている。
The above-mentioned fixed rule is just an example, but simulations have confirmed that the matching rate is quite low.

一致率とは、一つのサブキーワードによって重複してア
クセスされるキーワードの個数のことであり、この個数
が少ない程良いことは当然である。
The match rate is the number of keywords that are accessed repeatedly by one sub-keyword, and it goes without saying that the smaller the number, the better.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明によれば、従来例えば5バイ
ト分のキーワードをバイト毎に(1文字毎に)5回検査
していたのを、一定の規則によって1バイトのサブキー
ワードに変換し、1回の検査で済むようにしている。し
たがって高速で対応するデータブロックへのアクセスが
可能となる。
As explained above, according to the present invention, conventionally, for example, a 5-byte keyword was checked five times for each byte (for each character), but it is converted into a 1-byte sub-keyword according to a certain rule. We aim to only require one test. Therefore, it becomes possible to access the corresponding data block at high speed.

この場合、1つのサブキーワードkeyで重複して2以
上のキーワードKEYをアクセスすることがありうるが
、そのときに限り本来のキーワード同士でのマツチング
を行えばよい。
In this case, two or more keywords KEY may be accessed redundantly by one sub-keyword key, but only in that case it is sufficient to perform matching between the original keywords.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の方式に基づく原理構成を図解的に示す
図、 第2Aおよび2B図は変換部12における一動作例を示
すフローチャート、 第3図は本発明で用いる一定の規則を実際の例をもって
示す図、 第4図は第3図の例を筒素化して示す図である。 10・・・データ検索装置、 11・・・データテーブル、 11 1.11−2〜11−i〜1l−n・・・データ
ブロック蔦 12・・・変換部、 KEY・・・キーワード、key・・・サブキーワード
、DATA・・・データ。
FIG. 1 is a diagram schematically showing the principle configuration based on the method of the present invention, FIGS. 2A and 2B are flowcharts showing an example of an operation in the converter 12, and FIG. 3 is an actual diagram showing a certain rule used in the present invention. FIG. 4 is a diagram illustrating the example of FIG. 3 as a cylindrical element. DESCRIPTION OF SYMBOLS 10... Data search device, 11... Data table, 11 1.11-2~11-i~1l-n... Data block vine 12... Conversion unit, KEY... Keyword, key. ...Sub keyword, DATA...Data.

Claims (1)

【特許請求の範囲】 1、各々がキーワードの領域(KEY−i)とこれに対
応するデータの領域(DATA−i)とを含んでなるデ
ータブロック(11−i)を複数備えるデータテーブル
(11)に対し、アクセス用のキーワード(KEY)を
もってアクセスすることにより対応のデータ(DATA
)を読み出すデータ検索装置において、 各キーワード(KEY)に対応したサブキーワード(k
ey)であって、一定の規則のもとに、各キーワード(
KEY)よりも短いビット長を有するサブキーワード(
key)を予め生成して対応する各データブロック(1
1−i)のサブキーワードの領域(key−i)に書込
み、 アクセス用のキーワード(KEY)が入力されたとき、
これを前記一定の規則のもとに、対応するサブキーワー
ド(key)に変換して各データブロック(11−i)
をアクセスし、同一のサブキーワードを有する領域(k
ey−i)に対応するデータの領域(DATA−i)よ
り、所望のデータ(DATA)を読み出すことを特徴と
するデータ検索方式。 2、同一のサブキーワード(key)を有するデータブ
ロック(11−i)が2以上あるとき、当該データブロ
ック内のキーワードの領域 (KEY−i)にさらにアクセスして、アクセス用のキ
ーワード(KEY)と同一のキーワード(KEY)を有
するデータブロック(11−i)より所望のデータ(D
ATA)を読み出す特許請求の範囲第1項記載の方式。 3、前記一定の規則が、 (イ)キーワード(KEY)を構成する第1文字を表す
ビット列を一定の方向に1ビットシフトし、(ロ)その
1ビットシフトにより得たビット列と、その1ビットシ
フトによりオーバーフローした1ビットキャリーと、当
該キーワード(KEY)の第2文字を表すビット列とを
加算して加算ビット列を得、 (ハ)その加算ビット列について上記(イ)および(ロ
)と同様の操作を、順次、第3文字以降最終文字まで繰
り返す、という操作手順からなる特許請求の範囲第1項
記載の方式。
[Claims] 1. A data table (11-i) comprising a plurality of data blocks (11-i) each including a keyword area (KEY-i) and a data area (DATA-i) corresponding to the keyword area (KEY-i). ) by using the access keyword (KEY), the corresponding data (DATA
), the sub-keyword (k
ey), and each keyword (
A subkeyword (KEY) that has a bit length shorter than
key) is generated in advance and each corresponding data block (1
1-i) When the sub keyword area (key-i) is written and the access keyword (KEY) is input,
This is converted into a corresponding sub-keyword (key) based on the above-mentioned certain rules, and each data block (11-i) is
and access the area (k
A data search method characterized by reading desired data (DATA) from a data area (DATA-i) corresponding to ey-i). 2. When there are two or more data blocks (11-i) having the same sub-keyword (key), further access the keyword area (KEY-i) in the data block and use the access keyword (KEY) Desired data (D
ATA). 3. The above-mentioned certain rule: (a) Shifts the bit string representing the first character of the keyword (KEY) by 1 bit in a certain direction, and (b) Shifts the bit string obtained by the 1-bit shift and that 1 bit. Add the 1-bit carry that overflowed due to the shift and the bit string representing the second character of the keyword (KEY) to obtain an addition bit string, and (c) perform the same operations as in (a) and (b) above for the added bit string. 2. The method according to claim 1, which comprises an operating procedure of sequentially repeating the steps from the third character to the final character.
JP61237235A 1986-10-07 1986-10-07 Data retrieval method Expired - Lifetime JPH0612550B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61237235A JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61237235A JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Publications (2)

Publication Number Publication Date
JPS6393033A true JPS6393033A (en) 1988-04-23
JPH0612550B2 JPH0612550B2 (en) 1994-02-16

Family

ID=17012388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61237235A Expired - Lifetime JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Country Status (1)

Country Link
JP (1) JPH0612550B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000052600A1 (en) * 1999-03-03 2000-09-08 Sony Corporation Transmitter, receiver, transmitter/receiver system, transmission method and reception method
JP2000347969A (en) * 1999-06-02 2000-12-15 Jisedai Joho Hoso System Kenkyusho:Kk Transmitter, receiver, transmitter-receiver and transmitting method and receiving method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5957341A (en) * 1982-09-27 1984-04-02 Fujitsu Ltd Key converting processing system in data retrieval
JPS6014324A (en) * 1983-07-04 1985-01-24 Nec Corp Associative storage device
JPS60211540A (en) * 1984-04-06 1985-10-23 Nec Corp Data retrieval circuit
JPS60254254A (en) * 1984-05-31 1985-12-14 Fujitsu Ltd Hash table

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5957341A (en) * 1982-09-27 1984-04-02 Fujitsu Ltd Key converting processing system in data retrieval
JPS6014324A (en) * 1983-07-04 1985-01-24 Nec Corp Associative storage device
JPS60211540A (en) * 1984-04-06 1985-10-23 Nec Corp Data retrieval circuit
JPS60254254A (en) * 1984-05-31 1985-12-14 Fujitsu Ltd Hash table

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000052600A1 (en) * 1999-03-03 2000-09-08 Sony Corporation Transmitter, receiver, transmitter/receiver system, transmission method and reception method
JP2000347969A (en) * 1999-06-02 2000-12-15 Jisedai Joho Hoso System Kenkyusho:Kk Transmitter, receiver, transmitter-receiver and transmitting method and receiving method

Also Published As

Publication number Publication date
JPH0612550B2 (en) 1994-02-16

Similar Documents

Publication Publication Date Title
US5649023A (en) Method and apparatus for indexing a plurality of handwritten objects
US6873986B2 (en) Method and system for mapping strings for comparison
JP3152868B2 (en) Search device and dictionary / text search method
US20050278378A1 (en) Systems and methods of geographical text indexing
JPH11212980A (en) Production of index and retrieval method
JPH0675992A (en) Limited-state transducer in related work pattern for indexing and retrieving text
CN102867049B (en) Chinese PINYIN quick word segmentation method based on word search tree
US7676487B2 (en) Method and system for formatting and indexing data
EP0775963A2 (en) Indexing a database by finite-state transducer
JPS6175957A (en) Mechanical translation processor
JPH0869476A (en) Retrieval system
JPS6393033A (en) Data retrieving system
JPH05233704A (en) Keyword extension retrieval system
JP2962287B2 (en) Structured document search device and machine-readable recording medium recording program
JPH10240741A (en) Managing method for tree structure type data
CN117235291B (en) Full text retrieval method and device based on static index table
Bays The compleat PATRICIA
JPS63311432A (en) Retrieving system for associative word
JP3431618B2 (en) Data search device and search method
JPS617937A (en) Association retrieving system of knowledge
JPH09282326A (en) Fast document structure retrieval system
JPH03282961A (en) Mutual conversion dictionary system
Anderson Review 1--No Title
JPS63286930A (en) Character string retrieving device
JPH08278980A (en) Data processor