JPH0319081A - Information retrieving system - Google Patents

Information retrieving system

Info

Publication number
JPH0319081A
JPH0319081A JP1153914A JP15391489A JPH0319081A JP H0319081 A JPH0319081 A JP H0319081A JP 1153914 A JP1153914 A JP 1153914A JP 15391489 A JP15391489 A JP 15391489A JP H0319081 A JPH0319081 A JP H0319081A
Authority
JP
Japan
Prior art keywords
range
search
key data
type key
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1153914A
Other languages
Japanese (ja)
Inventor
Takako Yamauchi
山内 貴子
Koichi Honma
本間 孝一
Masaya Katabe
形部 真哉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP1153914A priority Critical patent/JPH0319081A/en
Publication of JPH0319081A publication Critical patent/JPH0319081A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To suppress the number of times of I/O of a file required for the retrieval to a prescribed number of times or below irrespective of whether the retrieval range is large or small by generating plural kinds of range type key data which become a combination element of a range containing numerical data and using them as indexes with respect to numerical data of information to be retrieved. CONSTITUTION:With respect to numerical data (m) of information to be retrieved, plural kinds of range type key data which become a combination element of a range containing (m) are generated in advance and stored in an index part. In this state, plural kinds of range type key data contained in a retrieval range given at the time of retrieving the information are combined and read out, an OR processing of the range type key data is executed, and retrieval data is obtained. Accordingly, a range retrieval can be executed by only read-out which combines the range type key data irrespective of whether a retrieval range is large or small. In such a way, the number of times of I/O of a file for reading out the range type key data of an index part required for the retrieval can be suppressed to a prescribed number or below.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報検索システムに関し、特に、被検索対象
情報の数値データに対して、範囲をもつ数値データ、例
えば、化学物質の融点や沸点、微生物の生育温度などの
数値データの検索を効果的に行うことのできる情報検索
システムに関するものである。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to an information retrieval system, and in particular, the present invention relates to an information retrieval system, and in particular, to numerical data of search target information, numerical data having a range, such as the melting point or boiling point of a chemical substance, is searched. The present invention relates to an information retrieval system that can effectively search numerical data such as the growth temperature of microorganisms.

〔従来の技術〕[Conventional technology]

情報検索システムは、情報を蓄積しておいて目的に応じ
て取り出すシステムである。情報検索には、事項検索と
文献検索がある。事項検索は、情報またはデータをその
ままファイルに蓄積し、検索条件を与えて該当するもの
を取り出すことであり、検索条件として与えるデータ要
素を検索キーと呼ぶ、また1文献検索は、情報またはデ
ータが記録されている文献の内容を指定して、該当する
文献を探す検索である。このため、文献情報が有するい
くつかの語のうち、重要な語(キーワード)のみを抽出
し、文献固有の二次情報を蓄積する。
An information retrieval system is a system that stores information and retrieves it according to the purpose. Information searches include item searches and document searches. Item search involves storing information or data as is in a file and retrieving the relevant items by giving search conditions.The data element given as the search condition is called a search key. This is a search that specifies the content of recorded documents and searches for corresponding documents. For this reason, only important words (keywords) are extracted from among several words included in the literature information, and secondary information unique to the literature is accumulated.

文献の検索はいくつかのキーワードの列で与えるように
なっている。
Literature searches can be performed using a string of keywords.

従来、事項検索において、被検索対象情報として数値デ
ータまたは範囲をもつ数値データ、例えば、化学物質の
融点や沸点、微生物の生育温度などの数値データが与え
られ、これらの被検索対象情報の数値データに対して、
事項検索で範囲検索を行う場合、検索キーとして数値範
囲が与えられると、検索キーの数値範囲の条件と、被検
索対象情報である検索事項の多くの情報またはデータと
の比較一致を逐−行わねばならず、事項検索の処理時間
が多くかかる。なお1通常、事項検索のための検索キー
として、インデクス内には、数値データそのままがキー
データとして収録される。
Conventionally, in item searches, numerical data or numerical data with a range, such as the melting point or boiling point of a chemical substance, the growth temperature of microorganisms, etc., are given as the information to be searched, and these numerical data of the information to be searched are For,
When performing a range search in an item search, if a numerical range is given as a search key, the condition of the numerical range of the search key is compared and matched with a lot of information or data of the search item, which is the information to be searched. Therefore, it takes a lot of time to process the item search. Note that 1. Normally, numerical data is recorded as it is as key data in the index as a search key for searching for items.

このため、情報検索システムにおいて、数値データの範
囲検索を行う場合、範囲内に存在する全ての数値データ
をインデクス内より検索し、得られたデータ集合の論理
和を演算する手法により行われている。
For this reason, when performing a range search for numerical data in an information retrieval system, it is performed by searching an index for all numerical data that exists within the range, and calculating the logical OR of the obtained data set. .

なお、画像情報について範囲検索を行う情報検索方法に
関係する公知文献として、例えば、特開昭62−146
31号公報が挙げられる。これは。
In addition, as a publicly known document related to an information retrieval method that performs a range search for image information, for example, Japanese Patent Laid-Open No. 62-146
Publication No. 31 is mentioned. this is.

マイクロフィルムの検索方法であり、検索範囲を設定し
、検索キーを操作し、検索範囲内であれば、検索処理を
繰り返し、検索範囲外となれば、警告を発する手法とな
っている。
This is a microfilm search method in which a search range is set, a search key is operated, and if the search is within the search range, the search process is repeated; if the search is outside the search range, a warning is issued.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

ところで、上述のような技術を用いて範囲検索を行う情
報検索システムを構築する場合においては、次のような
問題が発生する。
By the way, when constructing an information retrieval system that performs a range search using the above-mentioned technology, the following problems occur.

情報検索システム、特にCD−ROM等、二ニーメディ
アを用いた情報検索システムを構築する場合、一番重要
なのは、ターンアラウンドタイムで代表される処理能力
であるが、要求仕様として提示されている範囲検索を従
来の方法で実現すると、処理時間が遅くなり実用に耐え
られないシステムとなることが懸念される。すなわち、
検索対象となる設定された数値の範囲が広くなると、範
囲内に存在する数値データの数が増え、これに比例して
インデクス内を検索しなければならない回数が増大する
。したがって、インデックスの検索回数に応じて、ファ
イルのI10回数が増え、検索時間が長くなる。
When constructing an information retrieval system, especially an information retrieval system using secondary media such as CD-ROM, the most important thing is the processing capacity represented by the turnaround time, but the range presented as the required specification is the most important. If the search is implemented using conventional methods, there is a concern that the processing time will be slow and the system will become impractical. That is,
As the range of set numerical values to be searched becomes wider, the number of numerical data existing within the range increases, and the number of times the index must be searched increases proportionally. Therefore, the number of times the file is searched increases in accordance with the number of times the index is searched, and the search time becomes longer.

本発明は、前記問題点を解決するためになされたもので
ある。
The present invention has been made to solve the above problems.

本発明の目的は、被検索対象情報の数値データに対して
、範囲をもつ数値データの検索を効果的に行うことので
きる情報検索システムに提供することにある。
An object of the present invention is to provide an information retrieval system that can effectively search for numerical data having a range for numerical data of information to be searched.

本発明の他の目的は、範囲検索において、範囲の大小に
関係なく、検索に必要なファイルのI/0回数を一定回
数以下に抑え、検索時間を短縮して、処理能力の向上を
図ることにある。
Another object of the present invention is to suppress the number of file I/Os necessary for a search to a certain number or less in a range search, regardless of the size of the range, to shorten the search time and improve processing capacity. It is in.

本発明の前記ならびにその他の目的と新規な特徴は、本
明細書の記述及び添付図面によって明らかになるであろ
う。
The above and other objects and novel features of the present invention will become apparent from the description of this specification and the accompanying drawings.

〔課題を解決するための手段〕[Means to solve the problem]

上記目的を達成するため、本発明の情報検索システムは
、被検索対象情報の数値データに対して、上限値および
下限値の検索範囲を与え、検索を行う情報検索システム
であって、予め、被検索対象情報の数値データmに対し
て、mを含む範囲の組合せ要素となる範囲型キーデータ
を複数種類作成してインデックス部に格納し、情報検索
時に、与えられた検索範囲に含まれる複数種の範囲型キ
ーデータを組み合わせて読み出し、範囲型キーデータの
論理和処理を行い、検索データを得ることを特徴とする
In order to achieve the above object, the information retrieval system of the present invention is an information retrieval system that performs a search by giving a search range of an upper limit value and a lower limit value to the numerical data of the information to be searched. For numerical data m of search target information, multiple types of range type key data are created and stored in the index section as combination elements of a range including m, and when searching for information, multiple types of range type key data that are included in a given search range are created. The present invention is characterized in that the range type key data are read out in combination, and the range type key data are logically summed to obtain search data.

〔作用〕[Effect]

前記手段によれば、被検索対象情報の数値データに対し
て、上限値および下限値の検索範囲を与え、範囲検索を
行う場合、まず、予め、被検索対象情報の数値データm
に対して、mを含む範囲の組合せ要素となる範囲型キー
データを複数種類作成してインデックス部に格納してお
く。そして、情報検索時に、与えられた検索範囲に含ま
れる複数種の範囲型キーデータを組み合わせて読み出し
According to the above means, when performing a range search by giving a search range of an upper limit value and a lower limit value to the numerical data of the search target information, first, the numerical data m of the search target information is set in advance.
, a plurality of types of range type key data are created and stored in the index section as combination elements of the range including m. Then, when searching for information, multiple types of range-type key data included in a given search range are combined and read out.

範囲型キーデータの論理和処理を行い、検索データを得
る。これにより、検索範囲の大小にかかわらず、範囲型
キーデータを組み合わせた読み出しのみで、範囲検索を
行うことができ、検索で必要するインデックス部の範囲
型キーデータを読み出すファイルのI10回数は、一定
数以下となる。
Performs logical sum processing on range type key data to obtain search data. As a result, regardless of the size of the search range, it is possible to perform a range search just by reading a combination of range type key data, and the number of times a file's I10 number of times the range type key data of the index part required for the search is read is constant. number or less.

このように、範囲検索において、範囲の大小に関係なく
、検索に必要なファイルのI10回数を一定回数以下に
抑え、検索情間を短縮して、処理能力の向上を図ること
ができる。
In this way, in a range search, regardless of the size of the range, it is possible to suppress the I10 number of times of files required for the search to a certain number or less, shorten the search time, and improve processing performance.

〔実施例〕〔Example〕

以下、本発明の一実施例を図面を用いて具体的に説明す
る。
Hereinafter, one embodiment of the present invention will be specifically described using the drawings.

実施例を具体的に説明する前に、まず、本発明の情報検
索システムにおいて、情報検索のためキーデータ(範囲
型キーデータ)の作成方法および検索方法の原理を説明
する。
Before explaining the embodiments in detail, first, the principles of the method for creating key data (range type key data) and the search method for information retrieval in the information retrieval system of the present invention will be described.

(1)範囲型キーデータの作成 範囲型キーデータは、次に説明するように、数値データ
mに対して、3種類の範囲型キーデータを作成する。数
値m(正の整数)が与えられると、■第1の範囲型キー
データ; [m]、 数値データmをそのまま範囲とするキーデータを作成す
る。
(1) Creation of range type key data Three types of range type key data are created for numerical data m, as described below. When a numerical value m (positive integer) is given, ①First range type key data; [m], Create key data whose range is the numerical data m as it is.

■第2の範囲型キーデータ; [(m−2)〜m]t [(m−1)〜(m + 1 )] 。■Second range type key data; [(m-2)~m]t [(m-1) ~ (m + 1)].

[m〜(m + 2 )]、 数値mを含む前後の2の範囲のキーデータを作成する。[m~(m + 2)], Create key data for two ranges before and after the number m.

■第3の範囲型キーデータ; [10a〜(10a+9) ] 。■Third range type key data; [10a-(10a+9)].

[10a〜(10(a+1)+9)] 。[10a~(10(a+1)+9)].

[10a〜(10(a +2)  +9) ] 。[10a~(10(a+2)+9)].

[10a〜(10(a+3)+9)] 。[10a~(10(a+3)+9)].

[10(a −1)〜 [10(a−1)〜 [10(a−1)〜 [10(a−1)〜 (10a+9)] = (10(a+1)+9)] 。[10(a-1)~ [10(a-1)~ [10(a-1)~ [10(a-1)~ (10a+9)] = (10(a+1)+9)].

(10(a+2)+9)] 。(10(a+2)+9)].

(10(a +3)+9)] 。(10(a+3)+9)].

[10(a−2) 〜 (10a+9)  コ 。[10(a-2) to (10a+9).

[10(a−2)〜(10(a+1)+9)] 。[10(a-2) to (10(a+1)+9)].

[10(a−2)〜(10(a+2)+9)] 。[10(a-2) to (10(a+2)+9)].

[10(a−2)〜(10(a+3)+9)] 。[10(a-2) to (10(a+3)+9)].

ただし、aは数値mを10で除算した商の整数である。However, a is an integer of the quotient obtained by dividing the numerical value m by 10.

数値mを10で除算した商をa(!1数)としたとき、
上限値を、検索許容範囲の上限値を越えない間までの値
で、正の整数iの値を順次に増加して(1=O* 1 
m 2 t 3 m・・・)、10 (a+i)+9 の値とし、下限値を、検索許容範囲の下限値以下となら
ない間までの値で、正の整数jの値を順次に増加して(
j==o、l、2,3.・・・)。
When the quotient of dividing the number m by 10 is a (!1 number),
The upper limit value is set by sequentially increasing the value of the positive integer i until it does not exceed the upper limit value of the search tolerance range (1 = O * 1
m 2 t 3 m...), 10 (a+i)+9, and the value of the positive integer j is sequentially increased until the lower limit is not less than the lower limit of the search allowable range. (
j==o, l, 2, 3. ...).

10(a−j) の値で順次に組み合わせた値とした範囲の複数種の範囲
型キーデータを作成する(範囲=9.19,29,39
.・・・・)。
Create multiple types of range type key data with a range of values that are sequentially combined with the values of 10 (a-j) (range = 9.19, 29, 39
.. ...).

このようなキーデータ作成方法により、数値データmに
対して、第1.第2.第3.の3種類の複数種の範囲型
キーデータを作成する。
With such a key data creation method, the first . Second. Third. Create three types of multiple types of range type key data.

そして1作成した範囲型キーデータに対して。And 1 for the created range type key data.

次に説明する検索方法により範囲検索を行う。A range search is performed using the search method described below.

(II)範囲検索方法 数値範囲[x = y ]の範囲検索を行う場合、(a
)まず、下限値Xおよび上限値y(x<y)に対し、各
々を10で除算し、その商をa、cとし、剰余をす、d
とすると、 x=10a+b (a、bは正の整数)y=10c+d
 (ct dは正の整数)の関係を成り立つ。
(II) Range search method When performing a range search for a numerical range [x = y], (a
) First, divide the lower limit value X and upper limit value y (x<y) by 10, set the quotients as a and c, and take the remainder as
Then, x=10a+b (a, b are positive integers) y=10c+d
(ct d is a positive integer).

(b)下限値Xおよび上限値yの10位の数が同じであ
る場合(a=c) (i)1位の差(d−b)が9の場合、数値節1!I 
[x−ylの第3の範囲型キーデータをそのまま検索す
る0例えば、数値範囲[20〜29コの範囲検索を行う
場合には、[20〜29]の範囲型キーデータをそのま
ま検索する。
(b) If the numbers in the 10th place of the lower limit value X and the upper limit value y are the same (a=c) (i) If the difference in the 1st place (d-b) is 9, the numerical clause 1! I
[Search the third range type key data of x-yl as is 0 For example, when performing a range search of the numerical range [20 to 29], the range type key data of [20 to 29] is searched as is.

(…)1位の差(d−b)が3〜8の場合、01位の差
(d−b)を3で除算した商i(整数)の個数分だけ、
それぞれ範囲 [(X + 3 k)〜(x +(3k + 2))コ
 、ただしに=o、1,2.”、(i−1)の第2の範
囲型キーデータを検索する。
(...) If the difference in 1st place (d-b) is 3 to 8, the difference in 01st place (d-b) divided by 3 equals the number of quotient i (integer),
The range [(X + 3k) to (x + (3k + 2)), respectively, where =o, 1, 2. ”, the second range type key data of (i-1) is searched.

すなわち。Namely.

[X〜(x+2)コ 。[X~(x+2)ko.

[(x +(3X l))〜(x+(3xl)+2)]
 。
[(x + (3X l)) ~ (x + (3xl) + 2)]
.

[(x +(3X 2))〜(x +(3x 2)+ 
2)コ 。
[(x + (3X 2)) ~ (x + (3x 2) +
2) Ko.

[(x+3(i−1))〜(x+3(i−1)+2)コ
の第2の範囲型キーデータを検索する。
[Search for second range type key data from (x+3(i-1)) to (x+3(i-1)+2).

■範囲[(y −2)〜y]の第2の範囲型キーデータ
を検索する。
(2) Search for second range type key data in the range [(y −2) to y].

■次に、■の検索および■の検索で得られたデータ集合
の論理和を求める。
■Next, find the logical sum of the data sets obtained from the search in ■ and the search in ■.

具体的には1例えば、数値範囲20〜26の範囲検索を
行う場合には、d−b=6よりi=2であるので、数値
範囲[20〜22]および数値範囲[23〜25]の範
囲型キーデータを検索する。また、y=26より数値範
囲[24〜26]の範囲型キーデータを検索する。そし
て、これらの範囲型キーデータの検索で得られたデータ
集合の論理和を求める。
Specifically, 1. For example, when performing a range search for the numerical range 20 to 26, since i=2 from d-b=6, the numerical range [20 to 22] and the numerical range [23 to 25] are Search range type key data. Also, from y=26, range type key data in the numerical range [24 to 26] is searched. Then, the logical sum of the data sets obtained by searching these range type key data is calculated.

(m)1位の差(d−b)が2の場合、数値範囲[x=
ylの第2の範囲型キーデータを検索し、該当データ集
合を求める。
(m) If the difference in first place (d-b) is 2, the numerical range [x=
The second range type key data of yl is searched to find the corresponding data set.

具体的には、例えば、数値範囲25〜27範囲検索を行
う場合、数値範囲[25〜27]の範囲型のキーデータ
を検索する。
Specifically, for example, when performing a numerical value range 25-27 range search, range-type key data in the numerical value range [25-27] is searched.

(短)1位の差(d−b)が1の場合、[x]および[
ylの第1の範囲型キーデータを検索し、該当データ集
合を求め、論理和を求める。
(Short) If the difference in first place (d-b) is 1, [x] and [
The first range type key data of yl is searched, a corresponding data set is obtained, and a logical sum is obtained.

具体的には、数値範囲25〜26の範囲検索を行う場合
、[25コおよび[26]のキーデータを検索し、その
論理和を求める。
Specifically, when performing a range search in the numerical range 25 to 26, the key data of [25] and [26] are searched and the logical sum thereof is calculated.

(Q)下限値Xおよび上限値yの10位の数に差があり
、その差(c−a)が1の場合、(i)1位の差(d−
b)が9の場合。
(Q) If there is a difference in the numbers in the 10th place of the lower limit value X and the upper limit value y, and the difference (ca) is 1, (i) the difference in the 1st place (d
If b) is 9.

数値範囲[x ” y ]の第3の範囲型キーデータを
検索し該当データ集合を求める。
The third range-type key data of the numerical range [x''y] is searched to obtain a corresponding data set.

具体的には、例えば、数値範囲30〜49の範囲検索を
行う場合には、[30〜49]の範囲型キーデータを検
索する。
Specifically, for example, when performing a range search for a numerical value range of 30 to 49, range type key data of [30 to 49] is searched.

(n)それ以外の場合 範囲[x〜lOa+9]および範囲[10c〜y]の2
つの範囲に分けて、上述した(b)の項の処理を行う、
ただし、x=10a+9またはy=locの場合、その
キー自体[x]および[ylの第1の範囲型キーデータ
を検索する。
(n) otherwise range [x~lOa+9] and range [10c~y] 2
Performing the processing in item (b) above in two ranges,
However, in the case of x=10a+9 or y=loc, the first range type key data of the key itself [x] and [yl is searched.

次に、2つに分けて処理した結果として得られた2つの
データ集合の論理和を求める。
Next, the logical sum of the two data sets obtained as a result of processing the two data sets is determined.

例えば、数値範囲25〜34の範囲検索を行う場合、ま
ず、第1の数値範囲25〜29および声2の数値範囲3
0〜34に分ける。第1の数値範囲25〜29について
は、範囲[25〜27]および範囲[27〜29]の範
囲型キーデータを検索して、その論理和を求める。また
、第2の数値範囲[30〜34コについては、範囲[3
0〜32]および範囲[32〜34]の範囲型キーデー
タを検索し、その論理和を求める。これらの処理で得ら
れた2つのデータ集合の論理和を求める。
For example, when performing a range search for the numerical range 25 to 34, first, search for the first numerical range 25 to 29 and the numerical range 3 for voice 2.
Divide into 0-34. Regarding the first numerical range 25 to 29, range type key data in the range [25 to 27] and the range [27 to 29] is searched, and the logical sum thereof is determined. In addition, for the second numerical range [30 to 34, the range [3
0 to 32] and range type key data in the range [32 to 34], and calculate the logical sum thereof. The logical sum of the two data sets obtained through these processes is calculated.

(d)下限値Xおよび上限値yの10位の数に差があり
、その差(c−a)が2以上の場合。
(d) When there is a difference between the numbers in the 10th place of the lower limit value X and the upper limit value y, and the difference (ca) is 2 or more.

(i)1位の差(d−b)が9の場合、数値範囲[x 
= y ]の第3の範囲型キーデータを検索し該当デー
タ集合を求める。
(i) If the difference in first place (d-b) is 9, the numerical range [x
= y] to find the corresponding data set.

例えば、数値範囲20〜69の範囲検索を行う場合、2
0〜69のキーデータを検索する。
For example, when performing a range search for the numerical range 20 to 69, 2
Search for key data from 0 to 69.

(it)それ以外の場合 範囲[x〜10a+9]、範囲[10(a+1)〜10
(c−1)+9]、および範囲[10C〜y]の3つの
範囲に分けて処理を行う。
(it) otherwise range [x~10a+9], range [10(a+1)~10
(c-1)+9], and the range [10C to y].

■第1の範1[x〜10a+9]および第3の範囲[1
0c=y]の範囲データに対しては、上述した(Q)の
(it)の項と同様な処理を行う。
■First range 1 [x~10a+9] and third range [1
0c=y], the same processing as in the item (it) of (Q) described above is performed.

■第2の範囲[10(a+1) 〜10 (c−1)+
9]の範囲データに対しては、そのまま範囲[10(a
+1) 〜10 (c−1)+91の第3の範囲型キー
データを検索する。
■Second range [10(a+1) to 10(c-1)+
9], the range data [10(a
+1) to 10 (c-1) Search for the third range type key data of +91.

■これらの処理(■、■の処理)で得られたデータ集合
の論理和を求める。
■Calculate the logical OR of the data sets obtained through these processes (■ and ■).

例えば、数値範囲25〜57の範囲検索を行う場合、第
1の数値範囲25〜29.第2の数値範囲30〜49.
および第3の数値範囲50〜57の3つの範囲に分ける
。第1の数値範囲25〜29については、範囲[25〜
27]および範囲[27〜29]の範囲型キーデータを
検索し、論理和を求める。第2の数値範囲50〜57に
ついては、範囲[50〜52]、範囲[53〜55]、
および範囲[55〜57]の範囲型キーデータを検索し
、論理和を求める。
For example, when performing a range search for the numerical range 25-57, the first numerical range 25-29. Second numerical range 30-49.
and a third numerical range of 50 to 57. For the first numerical range 25 to 29, the range [25 to
27] and the range type key data in the range [27 to 29], and calculate the logical sum. For the second numerical range 50-57, range [50-52], range [53-55],
and the range type key data in the range [55 to 57], and calculate the logical sum.

また、数値範囲[30〜49]については、範囲[30
〜49]の範囲型キーデータを検索する。これらの処理
で得られたデータ集合の論理和を求める。
Also, for the numerical range [30 to 49], the range [30
~49] is searched for range type key data. The logical sum of the data sets obtained through these processes is calculated.

範囲検索では、上述のように、与えられた検索範囲に対
して、その下限値および上限値の数値データから範囲型
キーデータを組み合わせて検索することにより範囲検索
を行う、これにより、範囲内の数値データを全てシーケ
ンシャルにサーチする必要がなくなり、インデクス内を
検索する回数を一定回数以下に抑えることができる。
In a range search, as mentioned above, a range search is performed by combining range-type key data from the numerical data of the lower limit value and upper limit value for a given search range. It is no longer necessary to search all numerical data sequentially, and the number of searches within the index can be kept below a certain number of times.

第1図は、本発明の一実施例にかかる情報検索システム
の要部の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of essential parts of an information retrieval system according to an embodiment of the present invention.

第1図において、1は被検索情報が格納されているデー
タベースのCD−ROM装置、2は検索処理機構を有す
るデータ処理装置、3は検索結果を出力する出力装置の
プリンタ、4はデイスプレィ装置、また、5は入力装置
のキーボードである。
In FIG. 1, 1 is a CD-ROM device for a database in which information to be searched is stored, 2 is a data processing device having a search processing mechanism, 3 is a printer as an output device for outputting search results, 4 is a display device, Further, 5 is a keyboard of an input device.

ここでは、CD−ROM化した微生物データのデータベ
ースデータに対して、事項検索を範囲検索で行える情報
検索システムを構築する場合を例として説明する。
Here, a case will be described as an example in which an information retrieval system is constructed that can perform item retrieval by range retrieval for database data of microorganism data stored in CD-ROM.

事項検索を行う数値データは、微生物データにおける各
項目の数値データである。各々の数値データに対して、
上述した原理に基づいて、第2a図に示すように、例え
ば、数値24に対して、それぞれの範囲型キーデータが
作成され、インデックス部にキーデータとして格納され
ている。このインデックス部の範囲型キーデータの各々
のキーデータに対して、第2b図に示すように、対応す
る微生物データのデータ本体の格納位置を対応ずけるた
め、各々のデータの格納位置を示すポインタが、各キー
データに対応して格納され、インデックス部が形成され
る。
The numerical data for performing the item search is the numerical data of each item in the microorganism data. For each numerical data,
Based on the above-mentioned principle, range type key data is created for each numerical value 24, for example, and stored as key data in the index section, as shown in FIG. 2a. As shown in Fig. 2b, for each key data of the range type key data of this index section, in order to associate the storage position of the data main body of the corresponding microorganism data, a pointer indicating the storage position of each data is used. are stored in correspondence with each key data to form an index section.

このように構成された情報検索システムに対して、キー
ボードからユーザが検索式(属性=キーデータ)を入力
することによって、範囲検索を行う、この場合、入力す
る検索式は、所望する数値範囲(上限値と下限値の組み
合わせ)である、検索式を入力することによって、CD
−ROM上の微生物属性データ(vIt生物名、保存機
関番号、タイプ等)の検索を行い、結果を出力する。
In the information retrieval system configured in this way, a range search is performed by the user inputting a search expression (attributes = key data) from the keyboard. In this case, the input search expression is a desired numerical range ( By inputting a search expression that is a combination of upper and lower limit values, CD
- Search the microorganism attribute data (vIt organism name, storage institution number, type, etc.) on the ROM and output the results.

被検索対象の微生物データのうち、生育温度、グアニン
・シトシン含有量は数値データのみからなるので、所望
するデータを得るため、範囲検索を行う、CD−ROM
中のデータ構造は、キーデータとポインタを持つインデ
クス部と各微生物の特性データが収録されたデータ部か
ら成るデータ構造となっている。このため、例えば、生
育温度が21〜67℃の範囲の微生物を検索する場合に
は、検索式として、TM=21〜67の検索条件を与え
る。
Among the microorganism data to be searched, growth temperature and guanine/cytosine content consist only of numerical data, so in order to obtain the desired data, a range search is performed.CD-ROM
The data structure inside consists of an index section with key data and pointers, and a data section containing characteristic data of each microorganism. Therefore, for example, when searching for microorganisms whose growth temperature is in the range of 21 to 67°C, the search condition TM=21 to 67 is given as the search formula.

第3図は、本発明の一実施例にかかる検索処理を説明す
るフローチャートである。また、第4図は、第3図の検
索処理により、読み出される範囲型データの組み合わせ
例を説明する図である。
FIG. 3 is a flowchart illustrating search processing according to an embodiment of the present invention. Further, FIG. 4 is a diagram illustrating an example of combinations of range type data read out by the search process of FIG. 3.

第3図および第4図を参照して説明する。This will be explained with reference to FIGS. 3 and 4.

■まず、ステップ31においては、生育温度のインデク
ス部に格納されている範囲型キーデータを参照し、数値
範囲の下限値21および上限値67の数値を10で除算
し、商および剥除を求める。
■First, in step 31, refer to the range type key data stored in the growth temperature index section, divide the lower limit value 21 and upper limit value 67 of the numerical range by 10, and calculate the quotient and removal. .

2l−10X2+1  、@−a=2.b=1.67=
10X6+7  へc=6.d=7求めた商および剰余
から10位の数の差(c−a)が4であり、1位の数の
差(d−b)が6と判定されるので、数値範囲を21〜
29.30〜59゜60〜67の3つに分類し、各々の
数値範囲について、範囲検索を行う。
2l-10X2+1, @-a=2. b=1.67=
10X6+7 to c=6. d=7 From the obtained quotient and remainder, the difference in the 10th place number (c-a) is 4, and the difference in the 1st place number (d-b) is determined to be 6, so change the numerical range from 21 to
It is classified into three ranges: 29.30-59° and 60-67, and a range search is performed for each numerical range.

■次のステップ32においては、数値範囲21〜29に
ついての範囲検索を行う。
(2) In the next step 32, a range search is performed for the numerical ranges 21-29.

まず、1位の数の差8を3で除算した商iが2となるの
で、範囲[21〜23]、範囲[24〜26]の範囲型
キーデータを検索する0次に範囲[27〜29]の範囲
型キーデータを検索する。
First, the quotient i obtained by dividing the difference 8 between the first-place numbers by 3 is 2, so the 0th order range [27-26] is searched for range-type key data in the ranges [21-23] and [24-26]. 29] is searched for range type key data.

これらの検索の処理で得られたデータ集合の論理和を求
める。これにより、範囲型キーデータa。
The logical sum of the data sets obtained through these search processes is calculated. As a result, range type key data a.

b、c、のポインタが読み出され、組み合わせられる。The pointers of b and c are read and combined.

■次に、ステップ33において、数値範囲30〜59に
ついての範囲検索を行う。
(2) Next, in step 33, a range search is performed for the numerical range 30-59.

この範囲検索は、範囲[30〜59]の範囲型キーデー
タをそのまま検索することにより完了する。これにより
、範囲型キーデータdのポインタが読み出され、組み合
わせられる。
This range search is completed by directly searching the range type key data in the range [30 to 59]. As a result, the pointers of the range type key data d are read and combined.

■次のステップ34において、更に数値範囲60〜67
についての範囲検索を行う。
■In the next step 34, the numerical value range 60 to 67
Perform a range search for.

この範囲検索の処理では、1の位の数の差7を3で除算
した商iが2となるので、範囲[60〜62]、範囲[
63〜65]の範囲型キーデータを検索する6次に、範
囲[65〜67〕の範囲型キーデータを検索し、これら
の検索処理で得られたデータ集合の論理和を求める。こ
れにより、範囲型キーデータelt fs gのポイン
タが読み出され、組み合わせられる。
In this range search process, the quotient i obtained by dividing the 1's digit difference 7 by 3 is 2, so the range [60-62], the range [
63 to 65] Search for range type key data Next, search for range type key data in the range [65 to 67] and calculate the logical sum of the data sets obtained by these search processes. As a result, the pointers of the range type key data elt fs g are read and combined.

■続く、ステップ35において、これらの一連の検索処
理で得られたデータ集合の論理和を求め、与えられた数
値範囲21〜67についての検索を終了する。
(2) Subsequently, in step 35, the logical OR of the data sets obtained through these series of search processes is calculated, and the search for the given numerical range 21-67 is completed.

これらの範囲型キーデータの検索は、それぞれの範囲型
キーデータからポインタのデータを読み出すだけで済む
ため、検索の処理は短時間で終了する。また、各々の範
囲型キーデータから読み出されたデータ集合の論理和の
演算を行う処理も、各々のポインタデータに関する論理
和処理であり、短時間に終了する。このため、全体の検
索処理が短時間で完了する。
Searching for these range-type key data only requires reading pointer data from each range-type key data, so the search process is completed in a short time. Further, the process of calculating the logical sum of data sets read from each range type key data is also a logical sum process regarding each pointer data, and is completed in a short time. Therefore, the entire search process is completed in a short time.

範囲検索を行う場合、検索の範囲が大きくなると、通常
は、その範囲内のキーデータを全て検索して、結果デー
タを求めなければならないが、上述のように、それぞれ
の範囲型キーデータを組み合わせて読み出すだけで検索
処理を行うことができる。範囲型キーデータを、上述の
ように構成しておくことにより、範囲型キーデータの組
み合せにより、検索回数を最大7回に抑えることが可能
となる。
When performing a range search, if the search range becomes large, normally all the key data within that range must be searched to obtain the result data, but as mentioned above, it is possible to combine each range type key data. Search processing can be performed simply by reading the file. By configuring the range type key data as described above, it is possible to suppress the number of searches to a maximum of seven times by combining the range type key data.

CD−ROMは、一つの媒体に格納できる容量が540
MBという大記憶容量の記録媒体であるが、ハードディ
スク、フロッピーディスクに比べ、アクセス時間が長い
、したがって、インデクス部のデータが増大しても、ア
クセスする回数を減らすことにより、全体としての検索
時間を短縮する事ができる。
A CD-ROM has a storage capacity of 540 yen on a single medium.
Although it is a recording medium with a large storage capacity of MB, it takes longer to access compared to hard disks and floppy disks. Therefore, even if the data in the index section increases, by reducing the number of accesses, the overall search time can be reduced. It can be shortened.

以上、説明したように、本実施例によれば、検索処理方
式において、1回の範囲検索に必要となるキーデータの
検索回数および論理演算回数を、従来方式と比較すると
、次の第1表のようになり、検索効率が向上する。
As explained above, according to this embodiment, the number of searches for key data and the number of logical operations required for one range search in the search processing method are compared with the conventional method as shown in Table 1 below. This will improve search efficiency.

(以下この頁余白) 第1表 従来方式と本方式の比較 第1表に示されるように、キーデータの検索回数は、n
の数に関係なく、7回以下となる。したがって、検索時
間を短縮でき、検索効率を向上させる事ができる。
(Hereafter the margin of this page) Table 1 Comparison of the conventional method and this method As shown in Table 1, the number of searches for key data is n
No more than 7 times, regardless of the number of times. Therefore, search time can be shortened and search efficiency can be improved.

以上、本発明を実施例にもとづき具体的に説明したが、
本発明は、前記実施例に限定されるものではなく、その
要旨を逸脱しない範囲において種々変更可能であること
は言うまでもない。
The present invention has been specifically explained above based on examples, but
It goes without saying that the present invention is not limited to the embodiments described above, and can be modified in various ways without departing from the spirit thereof.

〔発明の効果〕〔Effect of the invention〕

以上、説明したように1本発明の情報検索システムによ
れば、範囲検索において、範囲の大小に関係なく、検索
に必要なファイルのI10回数を一定回数以下に抑える
ことができ、検索時間を短縮して、システムの処理能力
の向上を図ることができる。
As explained above, according to the information retrieval system of the present invention, in a range search, regardless of the size of the range, it is possible to suppress the I10 number of times of files required for the search to a certain number or less, thereby shortening the search time. As a result, the processing capacity of the system can be improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、本発明の一実施例にかかる情報検索システム
の要部の構成を示すブロック図、第2a図は、範囲型キ
ーデータの作成法を説明する図、 第2b図は、インデックス部のデータ構造を説明する図
、 第3図は、本発明の一実施例にかかる検索処理を説明す
るフローチャート。 第4図は、第3図の検索処理により、読み出される範囲
型データの組み合せ例を説明する図である。 図中、1・・・CD−ROM装置、2・・・データ処理
装置、3・・・プリンタ、4・・・デイスプレィ装置、
5・・・キーボード。
FIG. 1 is a block diagram showing the configuration of the main parts of an information retrieval system according to an embodiment of the present invention, FIG. 2a is a diagram illustrating a method for creating range type key data, and FIG. 2b is an index section. FIG. 3 is a flowchart illustrating search processing according to an embodiment of the present invention. FIG. 4 is a diagram illustrating an example of combinations of range type data read out by the search process of FIG. 3. In the figure, 1...CD-ROM device, 2...Data processing device, 3...Printer, 4...Display device,
5...Keyboard.

Claims (4)

【特許請求の範囲】[Claims] (1)被検索対象情報の数値データに対して、上限値お
よび下限値の検索範囲を与え、検索を行う情報検索シス
テムであって、予め、被検索対象情報の数値データmに
対して、mを含む範囲の組合せ要素となる範囲型キーデ
ータを複数種類作成してインデックス部に格納し、情報
検索時に、与えられた検索範囲に含まれる複数種の範囲
型キーデータを組み合わせて読み出し、範囲型キーデー
タの論理和処理を行い、検索データを得ることを特徴と
する情報検索システム。
(1) An information retrieval system that performs a search by giving a search range of an upper limit value and a lower limit value to the numerical data of search target information, in which m Multiple types of range type key data are created and stored in the index section as combination elements of a range that includes, and when searching for information, multiple types of range type key data included in a given search range are read out in combination, and the range type An information retrieval system characterized by performing logical sum processing on key data to obtain search data.
(2)請求項1に記載の情報検索システムにおいて、検
索対象のインデクス内に、範囲をもつ数値のキーデータ
を作成して持ち、設定された数値の範囲検索を行う際、
範囲型キーデータを組み合わせて検索をするようにした
ことを特徴とする情報検索システム。
(2) In the information retrieval system according to claim 1, when creating and having numeric key data with a range in the index to be searched, and performing a range search for the set numeric value,
An information retrieval system characterized in that a search is performed by combining range type key data.
(3)請求項1に記載の情報検索システムにおいて、イ
ンデックス部に格納する複数種類の範囲型キーデータは
、被検索対象情報の数値データmに対して、mを含む範
囲の組合せ要素となる範囲型キーデータが、数値データ
mをそのまま範囲とする第1の範囲型キーデータと、数
値データmを含む前後の2の範囲の第2の範囲型キーデ
ータと、数値mを10で除算した商をa(整数)とした
とき、上限値を、検索許容範囲の上限値を越えない間ま
での値で、0以上の整数iの値を順次に増加して、(i
=0、1、2、・・・) 10(a+i)+9 の値とし、下限値を、検索許容範囲の下限値以下となら
ない間までの値で、0以上の整数jの値を順次に増加し
て、(j=0、1、2、・・・)10(a−j) の値で順次に組み合わせた値とする範囲の第3の範囲型
キーデータとから構成されることを特徴とする情報検索
システム。
(3) In the information retrieval system according to claim 1, the plurality of types of range type key data stored in the index section are ranges that are combination elements of a range including m for numerical data m of the search target information. The type key data is first range type key data whose range is numerical data m as it is, second range type key data whose range is two before and after numerical data m, and a quotient obtained by dividing numerical value m by 10. When is a (integer), the upper limit value is a value that does not exceed the upper limit value of the search allowable range, and the value of an integer i greater than or equal to 0 is sequentially increased, and (i
= 0, 1, 2, ...) 10(a+i)+9, and sequentially increase the value of an integer j greater than or equal to 0 until the lower limit is not less than the lower limit of the search allowable range. and third range type key data having a range of sequentially combined values of (j = 0, 1, 2, ...) 10 (a-j). Information retrieval system.
(4)請求項3に記載の情報検索システムにおいて、イ
ンデックス部に格納する複数種類の範囲型キーデータに
対して、下限値xおよび上限値yを与えて範囲検索を行
う場合、下限値xおよび上限値yを10で除算して、1
0位の範囲および1位の範囲に対して、それぞれに与え
られた検索範囲に含まれる複数種の範囲型キーデータを
組み合わせて読み出し、範囲型キーデータの論理和処理
を行い、検索データを得ることを特徴とする情報検索シ
ステム。
(4) In the information retrieval system according to claim 3, when performing a range search by giving a lower limit value x and an upper limit value y to multiple types of range type key data stored in the index section, the lower limit value x and the upper limit value y are given. Divide the upper limit y by 10 and get 1
For the range of 0th place and the range of 1st place, multiple types of range type key data included in each given search range are combined and read, and the range type key data is ORed to obtain search data. An information retrieval system characterized by:
JP1153914A 1989-06-16 1989-06-16 Information retrieving system Pending JPH0319081A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1153914A JPH0319081A (en) 1989-06-16 1989-06-16 Information retrieving system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1153914A JPH0319081A (en) 1989-06-16 1989-06-16 Information retrieving system

Publications (1)

Publication Number Publication Date
JPH0319081A true JPH0319081A (en) 1991-01-28

Family

ID=15572862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1153914A Pending JPH0319081A (en) 1989-06-16 1989-06-16 Information retrieving system

Country Status (1)

Country Link
JP (1) JPH0319081A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008047432A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Information retrieval program, recording media having the program recorded therein, information retrieving method, and information retrieving device
WO2012127989A1 (en) * 2011-03-18 2012-09-27 日本電気株式会社 Service search apparatus and service search method, content provision apparatus, and computer program
US10320579B2 (en) 2016-10-06 2019-06-11 Fujitsu Limited Computer-readable recording medium, index generating apparatus, index generating method, computer-readable recording medium, retrieving apparatus, and retrieving method
US10872060B2 (en) 2016-10-05 2020-12-22 Fujitsu Limited Search method and search apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008047432A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Information retrieval program, recording media having the program recorded therein, information retrieving method, and information retrieving device
JP4707198B2 (en) * 2006-10-19 2011-06-22 富士通株式会社 INFORMATION SEARCH PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, INFORMATION SEARCH METHOD, AND INFORMATION SEARCH DEVICE
US8131721B2 (en) 2006-10-19 2012-03-06 Fujitsu Limited Information retrieval method, information retrieval apparatus, and computer product
US9081874B2 (en) 2006-10-19 2015-07-14 Fujitsu Limited Information retrieval method, information retrieval apparatus, and computer product
WO2012127989A1 (en) * 2011-03-18 2012-09-27 日本電気株式会社 Service search apparatus and service search method, content provision apparatus, and computer program
US10872060B2 (en) 2016-10-05 2020-12-22 Fujitsu Limited Search method and search apparatus
US10320579B2 (en) 2016-10-06 2019-06-11 Fujitsu Limited Computer-readable recording medium, index generating apparatus, index generating method, computer-readable recording medium, retrieving apparatus, and retrieving method

Similar Documents

Publication Publication Date Title
EP1585073B1 (en) Method for duplicate detection and suppression
US7853598B2 (en) Compressed storage of documents using inverted indexes
JP3263963B2 (en) Document search method and apparatus
Tsuruta et al. c-trie++: A dynamic trie tailored for fast prefix searches
Chen et al. MSQ-Index: A succinct index for fast graph similarity search
JPH0319081A (en) Information retrieving system
US6260037B1 (en) Method and computer program product for implementing skip key processing for database grouping queries involving aggregate operations by using one or more indices
JPH05324728A (en) Information retrieving device
JP3418876B2 (en) Data base search apparatus and method
Kim et al. n-Gram/2L-approximation: a two-level n-gram inverted index structure for approximate string matching
JP2990000B2 (en) Search system
JP2000090093A (en) Method and system for full-text retrieval and record medium recording full-text retrieval program
JP2675958B2 (en) Information retrieval computer system and method of operating storage device thereof
JPH11232283A (en) Information retrieving method
JP3665112B2 (en) Character string search method and apparatus
JP3804609B2 (en) Search tuning method and information search system
Neufeld et al. Machine-aided title word indexing for a weekly current awareness publication
JPH04156624A (en) High speed accessing systme in knowledge base systme
JPH05204978A (en) Information retrieving device
JPH0352068A (en) Logical operation system
JPH10320402A (en) Method and device for generating retrieval expression, and record medium
JPS61184635A (en) Retrieving system for data base system
JP2502262B2 (en) Network database access method
KR20030006638A (en) Apparatus And Method of Cell-based Indexing of High-dimensional Data
JP3431618B2 (en) Data search device and search method