JPH0612550B2 - Data retrieval method - Google Patents

Data retrieval method

Info

Publication number
JPH0612550B2
JPH0612550B2 JP61237235A JP23723586A JPH0612550B2 JP H0612550 B2 JPH0612550 B2 JP H0612550B2 JP 61237235 A JP61237235 A JP 61237235A JP 23723586 A JP23723586 A JP 23723586A JP H0612550 B2 JPH0612550 B2 JP H0612550B2
Authority
JP
Japan
Prior art keywords
keyword
data
key
sub
data block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61237235A
Other languages
Japanese (ja)
Other versions
JPS6393033A (en
Inventor
恵美香 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Communication Systems Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Communication Systems Ltd filed Critical Fujitsu Ltd
Priority to JP61237235A priority Critical patent/JPH0612550B2/en
Publication of JPS6393033A publication Critical patent/JPS6393033A/en
Publication of JPH0612550B2 publication Critical patent/JPH0612550B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔概 要〕 各キーワードに対応したデータを検索するに当り、各キ
ーワード毎のサブキーワードを一定の規則で予め作成し
ておいてそれぞれのキーワードに付加しておき、キーワ
ードを指定して対応のデータを検索すべき要求が発生す
る毎に、当該キーワードを前記一定の規則のもとに対応
のサブキーワードを算出し、算出されたサブキーワード
によって目的とするデータを検索することによりデータ
検索時間の短縮を図る。
Detailed Description [Summary] When searching data corresponding to each keyword, sub-keywords for each keyword are created in advance according to a certain rule and added to each keyword. Each time a request to search for the corresponding data by specifying is generated, the corresponding subkeyword is calculated based on the keyword based on the certain rule, and the target data is searched by the calculated subkeyword. This will shorten the data search time.

〔産業上の利用分野〕[Industrial application field]

本発明はデータの検索方式に関する。 The present invention relates to a data search method.

データベースへのアクセスは必ず所望のキーワードを指
定して行う。例えば、データベースが電話番号であれ
ば、所望の人名(キーワード)を入力して当該電話番号
(データ)を得る。あるいはデータベースが例えば図書
目録であれば、所望の書籍名又は著者名(キーワード)
を入力して当該図書目録(データ)を得る。本発明はこ
のようなキーワードによるデータ検索方式に関する。
Always access the database by specifying the desired keyword. For example, if the database is a telephone number, a desired person's name (keyword) is input to obtain the telephone number (data). Alternatively, if the database is a book catalog, for example, the desired book name or author name (keyword)
Enter to obtain the book catalog (data). The present invention relates to a data search method using such a keyword.

〔従来の技術〕[Conventional technology]

従来のデータ検索においてはキーワードを一文字一文字
比較して所望のキーワードと一致しているか否かを検出
していた。例えば、上記の例において、人名(仮に“E
MIKA”とする)に対応する電話番号(データ)をデ
ータテーブルから読み出すとすると、先ず、EMIKA
を例えばアスキーコードを用いて各文字毎に変換し、
“45”,“4D”,“49”,“4B”,“41”と
する。そして、データテーブルの各データに付されたキ
ーワードのうち、これら“45”…“41”と一致する
ものを検出する。この場合、5文字の1つ1つについて
比較する。ここに一致がとれると、当該データ(電話番
号)の検索がなされる。
In the conventional data search, keywords are compared character by character to detect whether or not they match a desired keyword. For example, in the above example, the person's name (provisionally "E
If the telephone number (data) corresponding to "MIKA" is read from the data table, first, EMIKA
Is converted for each character using ASCII code,
These are "45", "4D", "49", "4B", and "41". Then, among the keywords attached to each data in the data table, the keywords that match these "45" ... "41" are detected. In this case, the five characters are compared one by one. When a match is found here, the data (telephone number) is searched.

〔発明が解決しようとする問題点〕[Problems to be solved by the invention]

上述した従来のデータ検索においてはN文字(Nは自然
数)のキーワードを入力して、データテーブル内の同一
のキーワードを検出する。データテーブル内のキーワー
ドの文字数は各キーワード毎にまちまちであるが、いず
れにしても入力キーワードのN文字について少なくとも
N回の文字対応の比較動作を必要とする。したがって、
目的とするキーワードのアクセスにかなりの時間を要
し、結局、目的とするデータを検索するまでの時間が長
くなるという問題がある。
In the above-described conventional data search, a keyword of N characters (N is a natural number) is input to detect the same keyword in the data table. The number of characters of the keywords in the data table is different for each keyword, but in any case, the comparison operation corresponding to the characters of N characters of the input keyword is required at least N times. Therefore,
There is a problem that it takes a considerable time to access a target keyword, and eventually, it takes a long time to search for target data.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は本発明の方式に基づく原理構成を図解的に示す
図である。本図において、データ検索装置10における
11はデータテーブルであり、いわばデータベースをな
す。データテーブルはn個のデータブロック11−1,
11−2…11−i…11−nからなる。各データブロ
ックは同一の構成を有し、例えばデータブロック11−
iを詳細に示す。データブロック11−iは、通常のキ
ーワード(KEY)の領域KEY−iとこれに対応する
データ(DATA)の領域DATA−iを少なくとも備
えてなり、本発明の特徴をなすサブキーワード(ke
y)の領域key−iがさらに付加される。
FIG. 1 is a diagram schematically showing the principle configuration based on the method of the present invention. In the figure, reference numeral 11 in the data search device 10 is a data table, which is, so to speak, a database. The data table has n data blocks 11-1,
11-2 ... 11-i ... 11-n. Each data block has the same structure, for example, data block 11-
i is shown in detail. The data block 11-i includes at least an area KEY-i of a normal keyword (KEY) and an area DATA-i of data (DATA) corresponding to the area KEY-i, which is a feature of the present invention.
The area key-i of y) is further added.

このサブキーワードkeyは各キーワードKEY毎に、
変換部12を用いて予め生成され、各データブロック
(11−i)の先頭に付加される。
This sub-keyword key is for each keyword KEY,
It is generated in advance using the conversion unit 12 and added to the beginning of each data block (11-i).

一方、データ検索の要求があったとき、アクセス用の所
望のキーワードKEYが図中の右下より入力される。こ
れを変換部12を介してアクセス用のサブキーワードk
eyに変換し、このkeyを用いてデータテーブル11
内の各データブロック(11−i)をアクセスする。
On the other hand, when a data search request is made, the desired keyword KEY for access is input from the lower right of the figure. The sub-keyword k for access via the conversion unit 12
The data table 11 is converted by using this key.
Access each data block (11-i) in

〔作 用〕[Work]

キーワードKEYよりサブキーワードkeyを生成する
ための変換部12は一定の規則のもとにキーワードKE
Yのビット長よりも短いビット長のサブキーワードke
yを生成するものであり、アクセス用のキーワードKE
Yと各データブロック(11−i)のキーワード領域
(KEY−i)との一致不一致を検出する時間に比し
て、アクセス用のサブキーワードkeyと各データブロ
ック(11−i)のサブキーワード領域(key−i)
との一致不一致を検出する時間の方が短くなる。つま
り、データ検索時間は短縮される。なお、第1図中の上
方の変換部12と下方の変換部12とは同じものでもよ
いし、あるいは既述の一定の規則が双方同一でありさえ
すれば別個のものでもよい。
The conversion unit 12 for generating the sub-keyword key from the keyword KEY uses the keyword KE based on a certain rule.
A subkeyword ke having a bit length shorter than the bit length of Y
y is generated, and the access keyword KE
The sub-keyword for access and the sub-keyword area of each data block (11-i) are compared with the time for detecting a match / mismatch between Y and the keyword area (KEY-i) of each data block (11-i). (Key-i)
It takes less time to detect a match / mismatch with. That is, the data search time is shortened. The upper conversion unit 12 and the lower conversion unit 12 in FIG. 1 may be the same, or may be separate as long as the above-described certain rules are the same.

キーワードKEYのビット長に比しサブキーワードke
yのビット長が短いので、サブキーワードkeyで区別
しうるデータブロック(11−i)の数(i)は当然少な
くなる。したがって1つのアクセス用サブキーワードk
eyによって2以上のデータブロックがアクセスされる
ケースがありうる。このときは、さらにキーワードKE
Y同士の一致不一致を見て、所望の1つを特定する。
Subkeyword ke compared to the bit length of keyword KEY
Since the bit length of y is short, the number (i) of data blocks (11-i) that can be distinguished by the sub-keyword is naturally small. Therefore, one access sub-keyword k
There may be a case where two or more data blocks are accessed by ey. In this case, the keyword KE
The desired one is specified by checking the agreement / disagreement between Ys.

〔実施例〕〔Example〕

第2Aおよび2B図は変換部12における一動作例を示
すフローチャートであり、前述の“一定の規則”の一具
体例である。本例による一定の規則では、 (イ)キーワード(KEY)を構成する第1文字を表すビ
ット列を一定の方向に1ビットシフトし、 (ロ)1ビットシフトしたビット列と、その1ビットシフ
トによりオーバーフローした1ビットキャリーと、第2
文字を表すビット列とを加算する、という操作手順を一
単位として、これを各文字毎に最終文字まで繰り返し実
行する。
2A and 2B are flowcharts showing one operation example in the conversion unit 12, which is a specific example of the above-mentioned "certain rule". According to the fixed rule according to this example, (a) the bit string representing the first character forming the keyword (KEY) is shifted by 1 bit in a fixed direction, and (b) the bit string shifted by 1 bit and the overflow by the 1 bit shift. 1-bit carry and second
The operation procedure of adding a bit string representing a character is used as one unit, and this is repeatedly executed for each character up to the final character.

前述の例(EMIKA)によれば、第3図に示すような
操作がなされる。第3図は本発明で用いる一定の規則を
実際の例をもって示す図である。また、第4図は第3図
の例を簡素化して示す図であり、しかもキーワード(E
MIKA)に対する最終的な結果であるサブキーワード
key(本図ではBA)まで示してある。第3図におい
て、最初の文字(第1文字のE)W1については、これ
に加えるべき加算ビット列(ADO)もキャリー(CR
O)もないから、ADOもCROも共に0にプリセット
しておく。したがって第1文字W1についての加算ビッ
ト列AD1は第1文字W1そのものである。
According to the above-mentioned example (EMIKA), the operation as shown in FIG. 3 is performed. FIG. 3 is a diagram showing an example of a certain rule used in the present invention. Further, FIG. 4 is a diagram showing a simplified example of FIG.
The final result is the sub-keyword key (BA in this figure) for MIKA). In FIG. 3, for the first character (E of the first character) W1, the addition bit string (ADO) to be added to this is also carry (CR).
O) does not exist, so both ADO and CRO are preset to 0. Therefore, the added bit string AD1 for the first character W1 is the first character W1 itself.

次にAD1をビットシフト(レフトシフト)し、キャリ
ーCR1(この場合0)を得ると共に、1ビットシフト
したビット列AD1′を得る。
Next, AD1 is bit-shifted (left-shifted) to obtain a carry CR1 (0 in this case), and a bit string AD1 ′ shifted by 1 bit is obtained.

これらCR1とAD1′は、第2文字W2(EMIKA
のMを示す)に加えられ加算ビット列AD2を得る。A
D2をさらに1ビットシフトしてAD2′を得ると共
に、このときオーバーフローしたキャリーCR2(この
場合1)を得る。
These CR1 and AD1 'are the second characters W2 (EMIKA
(Indicating M of the above) is added to obtain an addition bit string AD2. A
D2 is further shifted by 1 bit to obtain AD2 ', and at the same time, carry CR2 (1 in this case) which overflows is obtained.

AD2′とCR2は第3文字(EMIKAのI)W3に
加えられ、同様の操作が最終文字(A)まで順次繰り返
される。
AD2 'and CR2 are added to the third character (I in EMIKA) W3, and the same operation is sequentially repeated until the final character (A).

上記の操作手順は、第2Aおよび2B図にフローチャー
トの形で示されている。
The above operating procedure is illustrated in flow chart form in FIGS. 2A and 2B.

もっと分り易く示すと(アスキーコードによる)、第4
図に示すとおりになり、最終的な結果BAが、キーワー
ドKEY(EMIKA)に対するサブキーワードkey
として得られる。なお、第4図では第3図の場合と異な
り、各値(ADO,CRO,W1…)の加算を左から右
へ、そして上段から下段への流れで示している。
To make it easier to understand (by ASCII code), the fourth
As shown in the figure, the final result BA is the subkeyword key for the keyword KEY (EMIKA).
Obtained as. Unlike FIG. 3, FIG. 4 shows the addition of each value (ADO, CRO, W1 ...) As a flow from left to right and from upper to lower.

上述した一定の規則は一例であるが、シミュレーション
によれば、かなり一致率が低いことが確められている。
一致率とは、一つのサブキーワードによって重複してア
クセスされるキーワードの個数のことであり、この個数
が少ない程良いことは当然である。
Although the above-mentioned certain rule is an example, it is confirmed by simulation that the matching rate is considerably low.
The matching rate is the number of keywords that are accessed redundantly by one sub-keyword, and it is natural that the smaller the number, the better.

〔発明の効果〕〔The invention's effect〕

以上説明したように本発明によれば、従来例えば5バイ
ト分のキーワードをバイト毎に(1文字毎に)5回検査
していたのを、一定の規則によって1バイトのサブキー
ワードに変換し、1回の検査で済むようにしている。し
たがって高速で対応するデータブロックへのアクセスが
可能となる。この場合、1つのサブキーワードkeyで
重複して2以上のキーワードKEYをアクセスすること
がありうるが、そのとき限り本来のキーワード同士での
マッチングを行えばよい。
As described above, according to the present invention, a keyword for 5 bytes is conventionally inspected 5 times for each byte (for each character), but is converted into a 1-byte sub-keyword according to a certain rule. I try to do it only once. Therefore, the corresponding data block can be accessed at high speed. In this case, one sub-keyword may be used to access two or more keywords KEY, but only at that time, the original keywords may be matched.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の方式に基づく原理構成を図解的に示す
図、 第2Aおよび2B図は変換部12における一動作例を示
すフローチャート、 第3図は本発明で用いる一定の規則を実際の例をもって
示す図、 第4図は第3図の例を簡素化して示す図である。 10……データ検索装置、 11……データテーブル、 11−1,11−2〜11−i〜11−n……データブ
ロック、 12……変換部、 KEY……キーワード、key……サブキーワード、D
ATA……データ。
FIG. 1 is a diagram schematically showing the principle configuration based on the system of the present invention, FIGS. 2A and 2B are flow charts showing one operation example in the conversion unit 12, and FIG. FIG. 4 is a diagram showing an example, and FIG. 4 is a diagram showing the example of FIG. 3 in a simplified manner. 10 ... Data retrieval device, 11 ... Data table, 11-1, 11-2 to 11-i to 11-n ... Data block, 12 ... Conversion unit, KEY ... Keyword, key ... Sub-keyword, D
ATA ... data.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】各々がキーワードの領域(KEY-i)(iは
1,2,3…なる自然数)と、これに対応するデータの
領域(DATA-i)とから構成されるデータブロック(11-
i)を複数備えるデータテーブル(11)に対し、アクセ
ス用のキーワード(KEY)をもって外部からアクセスす
ることにより該アクセス用のキーワード(KEY)に対応
する所望のデータ(DATA)を読み出すデータ検索装置に
おいて、 各前記データブロック(11-i)を、その先頭にさらにサ
ブキーワード(Key)の領域(Key-i)を付加した構成とする
と共に、各前記キーワード(KEY)に対応した各該サブキ
ーワード(Key)は、一定の規則のもとに、各該キーワー
ド(KEY)よりも短いビット長を有するワードに予め変換
されて前記サブキーワード(Key)の領域(Key-i)に書き込
まれ、 データ検索時において、前記アクセス用のキーワード(K
EY)が入力されたとき、これを前記一定の規則と同一の
一定の規則のもとで対応する前記サブキーワード(Key)
に変換したのち、各前記データブロック(11-i)をアク
セスし、この変換されたサブキーワード(Key)と同一の
サブキーワード(Key)が先頭に付加された前記データブ
ロック(11-i)内の前記データの領域(DATA-i)より、前
記所望のデータ(DATA)を読み出し、 前記アクセスにおいてもし、同一のサブキーワード(Ke
y)が先頭に付加された前記データブロック(11-i)が2
以上あるときは、さらに、これら2以上のデータブロッ
クの各々の前記キーワードの領域(KEY-i)をアクセス
し、前記アクセス用のキーワード(KEY)と同一のキーワ
ード(KEY)を備える前記データブロック(11-i)を検出し
て、前記所望のデータ(DATA)を読み出すことを特徴と
するデータ検索方式。
1. A data block (11) comprising a keyword area (KEY-i) (i is a natural number 1, 2, 3, ...) And a corresponding data area (DATA-i). -
In a data retrieval device for reading desired data (DATA) corresponding to the access keyword (KEY) by externally accessing the data table (11) having a plurality of i) with the access keyword (KEY) , Each data block (11-i) has a structure in which a sub-keyword (Key) area (Key-i) is further added to the head of the data block, and each sub-keyword ( Key) is pre-converted into a word having a bit length shorter than each keyword (KEY) according to a certain rule and written in the area (Key-i) of the sub-keyword (Key). , The access keyword (K
EY) is input, the corresponding sub-keyword (Key) corresponding to the same fixed rule as the fixed rule is input.
After the conversion, each data block (11-i) is accessed, and the same sub-keyword (Key) as the converted sub-keyword (Key) is added to the beginning of the data block (11-i). The desired data (DATA) is read out from the data area (DATA-i) of, and the same sub-keyword (Ke
The data block (11-i) with y) added at the beginning is 2
When there is the above, the data block (KEY-i) of each of the two or more data blocks is accessed, and the data block (KEY) having the same keyword (KEY) as the access keyword (KEY) is accessed. 11-i) is detected and the desired data (DATA) is read out.
JP61237235A 1986-10-07 1986-10-07 Data retrieval method Expired - Lifetime JPH0612550B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61237235A JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61237235A JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Publications (2)

Publication Number Publication Date
JPS6393033A JPS6393033A (en) 1988-04-23
JPH0612550B2 true JPH0612550B2 (en) 1994-02-16

Family

ID=17012388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61237235A Expired - Lifetime JPH0612550B2 (en) 1986-10-07 1986-10-07 Data retrieval method

Country Status (1)

Country Link
JP (1) JPH0612550B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000052600A1 (en) * 1999-03-03 2000-09-08 Sony Corporation Transmitter, receiver, transmitter/receiver system, transmission method and reception method
JP3195778B2 (en) * 1999-06-02 2001-08-06 株式会社次世代情報放送システム研究所 Receiving device, transmitting / receiving device, and receiving method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5957341A (en) * 1982-09-27 1984-04-02 Fujitsu Ltd Key converting processing system in data retrieval
JPS6014324A (en) * 1983-07-04 1985-01-24 Nec Corp Associative storage device
JPS60211540A (en) * 1984-04-06 1985-10-23 Nec Corp Data retrieval circuit
JPS60254254A (en) * 1984-05-31 1985-12-14 Fujitsu Ltd Hash table

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5957341A (en) * 1982-09-27 1984-04-02 Fujitsu Ltd Key converting processing system in data retrieval
JPS6014324A (en) * 1983-07-04 1985-01-24 Nec Corp Associative storage device
JPS60211540A (en) * 1984-04-06 1985-10-23 Nec Corp Data retrieval circuit
JPS60254254A (en) * 1984-05-31 1985-12-14 Fujitsu Ltd Hash table

Also Published As

Publication number Publication date
JPS6393033A (en) 1988-04-23

Similar Documents

Publication Publication Date Title
JPWO2006090732A1 (en) Word translation device, translation method, and translation program
JPS6175957A (en) Mechanical translation processor
KR100288144B1 (en) Foreign language coding method in Korean and search method using the same
JPH0869476A (en) Retrieval system
JPH0612550B2 (en) Data retrieval method
JP3253657B2 (en) Document search method
JP2535629B2 (en) Input string normalization method of search system
JPS583033A (en) Tree structure retrieval processor
JPH03116375A (en) Information retriever
JP2962287B2 (en) Structured document search device and machine-readable recording medium recording program
JPH0227423A (en) Method for rearranging japanese character data
JP3574199B2 (en) Database search method
JPS617937A (en) Association retrieving system of knowledge
JP3431618B2 (en) Data search device and search method
JP2835065B2 (en) String search method
JPH03282961A (en) Mutual conversion dictionary system
JPH01114976A (en) Dictionary structure for document processor
JPS59116835A (en) Japanese input device with input abbreviating function
JPS62282364A (en) Character string retrieval system
JPH0656626B2 (en) Language semantic analyzer
JPH08278980A (en) Data processor
JPS63263529A (en) Keyword extracting system
JPH0773189A (en) Composite retrieving device
JPH05120325A (en) Electronic dictionary
JPH023865A (en) Retrieving system for kanji character