JPH04209069A - 前方一致文字列検索方式 - Google Patents
前方一致文字列検索方式Info
- Publication number
- JPH04209069A JPH04209069A JP2400224A JP40022490A JPH04209069A JP H04209069 A JPH04209069 A JP H04209069A JP 2400224 A JP2400224 A JP 2400224A JP 40022490 A JP40022490 A JP 40022490A JP H04209069 A JPH04209069 A JP H04209069A
- Authority
- JP
- Japan
- Prior art keywords
- length
- character string
- index
- record
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
[00011
【産業上の利用分野]本発明は前方一致文字列検索方式
に関し、特にコンピュータを用いた情報検索システムの
前方一致文字列検索方式に関する。 [0002] 【従来の技術】従来の前方一致文字列検索方式は、検索
対象のr個のレコードR1,R2,・・・・・・・・・
Rrを順次に取出して、それぞれのレコードRi内に有
する長さnの文字列検索項目Wi :Wil、 Wi
2.・・・・・・・・・Winと前方−致の検索条件と
して与えられる長さm(1≦m≦n)の条件文字列Ci
:Cil、 Ci2.・・・・・・・・・Cimと
を先頭の文字より順次に照合して、m番目までのすべて
の文字が一致した場合にだけレコードRiを検索条件を
満足するレコードとして選択し、照合の過程で一致しな
い文字が発見されればその段階でレコードRiを検索条
件を満足しないレコードとして棄却していた。 [0003]
に関し、特にコンピュータを用いた情報検索システムの
前方一致文字列検索方式に関する。 [0002] 【従来の技術】従来の前方一致文字列検索方式は、検索
対象のr個のレコードR1,R2,・・・・・・・・・
Rrを順次に取出して、それぞれのレコードRi内に有
する長さnの文字列検索項目Wi :Wil、 Wi
2.・・・・・・・・・Winと前方−致の検索条件と
して与えられる長さm(1≦m≦n)の条件文字列Ci
:Cil、 Ci2.・・・・・・・・・Cimと
を先頭の文字より順次に照合して、m番目までのすべて
の文字が一致した場合にだけレコードRiを検索条件を
満足するレコードとして選択し、照合の過程で一致しな
い文字が発見されればその段階でレコードRiを検索条
件を満足しないレコードとして棄却していた。 [0003]
【発明が解決しようとする課題】上述した従来の前方一
致文字列検索方式は、検索対象のr個のレコードR1゜
R2,・・・・・・・・・Rrを順次に取出して、それ
ぞれ先頭の文字より順次に一致しない文字が発見される
かm番目の文字が終るまで文字照合を行っているので、
使用される文字の種類数をhとして、文字の種類に対す
る使用頻度を均等と仮定すれば、次の数式(1)に示す
文字照合回数が必要となり、レコード数rや条件文字列
の長さmが大きくなると文字照合回数が増大することに
より、長い処理時間がかかるという欠点を有している。 [0004] [0005]
致文字列検索方式は、検索対象のr個のレコードR1゜
R2,・・・・・・・・・Rrを順次に取出して、それ
ぞれ先頭の文字より順次に一致しない文字が発見される
かm番目の文字が終るまで文字照合を行っているので、
使用される文字の種類数をhとして、文字の種類に対す
る使用頻度を均等と仮定すれば、次の数式(1)に示す
文字照合回数が必要となり、レコード数rや条件文字列
の長さmが大きくなると文字照合回数が増大することに
より、長い処理時間がかかるという欠点を有している。 [0004] [0005]
【課題を解決するための手段】第1の発明の前方一致文
字列検索方式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k < n )の部分文字列を取出して、それぞれに
取出し先のレコードへのポインタを付けた索引表を生成
する索引表生成手段、 (B)前方一致の検索条件として与えられる長さm(1
≦m≦n)の条件文字列から、k≦mのときには、先頭
に有する長さにの部分文字列を取出して索引条件を形成
※※し、k>mのときには、先頭から取出した長さmの
部分文字列とこれに続く長さに−mのあらゆる文字列と
による長さにの文字列の集合で索引条件を形成する索引
条件形成手段、 (C)前記索引条件を用いて前記索引表を走査すること
により、前記索引条件を満足する前記索引表の長さにの
部分文字列の集合を取出して、これらに付いたポインタ
の各々が指すレコードを選択する索引表走査手段、(D
)前記索引表走査手段で選択したレコードの各々に対し
て、k<mのときには、長さnの文字列検索項目と長さ
mの条件文字列とのそれぞれのに+1番目からm番目ま
での文字の照合を行って、長さmの検索条件を満足する
レコードのすべてを抽出し、k≧mのときには、選択し
たすべてのレコードを抽出するレコード抽出手段、を備
えて構成されている。 [0006]また、第2の発明の前方一致文字列検索方
式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k<n)の部分文字列を取出して、それぞれに取出し
先のレコードへのポインタを付けた索引表を生成し、(
B)前方一致の検索条件として与えられる長さm(1≦
m≦n)の条件文字列から、54mのときには、先頭に
有する長さにの部分文字列を取出して索引条件を形成し
、k>mのときには、先頭から取出した長さmの部分文
字列とこれに続く長さに−mのあらゆる文字列とによる
長さにの文字列の集合で索引条件を形成し、(C)前記
索引条件を用いて前記索引表を走査することにより、前
記索引条件を満足する前記索引表の長さにの部分文字列
の集合を取出して、これらに付いたポインタの各々が指
すレコードを選択し、 (D)前記索引表走査手段で選択したレコードの各々に
対して、k<mのときには、長さnの文字列検索項目と
長さmの条件文字列とのそれぞれのに+1番目からm番
目までの文字の照合を行って、長さmの検索条件を満足
するレコードのすべてを抽出し、k≧mのときには、選
択したすべてのレコードを抽出する、ことにより構成さ
れている。 (0007]
字列検索方式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k < n )の部分文字列を取出して、それぞれに
取出し先のレコードへのポインタを付けた索引表を生成
する索引表生成手段、 (B)前方一致の検索条件として与えられる長さm(1
≦m≦n)の条件文字列から、k≦mのときには、先頭
に有する長さにの部分文字列を取出して索引条件を形成
※※し、k>mのときには、先頭から取出した長さmの
部分文字列とこれに続く長さに−mのあらゆる文字列と
による長さにの文字列の集合で索引条件を形成する索引
条件形成手段、 (C)前記索引条件を用いて前記索引表を走査すること
により、前記索引条件を満足する前記索引表の長さにの
部分文字列の集合を取出して、これらに付いたポインタ
の各々が指すレコードを選択する索引表走査手段、(D
)前記索引表走査手段で選択したレコードの各々に対し
て、k<mのときには、長さnの文字列検索項目と長さ
mの条件文字列とのそれぞれのに+1番目からm番目ま
での文字の照合を行って、長さmの検索条件を満足する
レコードのすべてを抽出し、k≧mのときには、選択し
たすべてのレコードを抽出するレコード抽出手段、を備
えて構成されている。 [0006]また、第2の発明の前方一致文字列検索方
式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k<n)の部分文字列を取出して、それぞれに取出し
先のレコードへのポインタを付けた索引表を生成し、(
B)前方一致の検索条件として与えられる長さm(1≦
m≦n)の条件文字列から、54mのときには、先頭に
有する長さにの部分文字列を取出して索引条件を形成し
、k>mのときには、先頭から取出した長さmの部分文
字列とこれに続く長さに−mのあらゆる文字列とによる
長さにの文字列の集合で索引条件を形成し、(C)前記
索引条件を用いて前記索引表を走査することにより、前
記索引条件を満足する前記索引表の長さにの部分文字列
の集合を取出して、これらに付いたポインタの各々が指
すレコードを選択し、 (D)前記索引表走査手段で選択したレコードの各々に
対して、k<mのときには、長さnの文字列検索項目と
長さmの条件文字列とのそれぞれのに+1番目からm番
目までの文字の照合を行って、長さmの検索条件を満足
するレコードのすべてを抽出し、k≧mのときには、選
択したすべてのレコードを抽出する、ことにより構成さ
れている。 (0007]
【実施例】次に、本発明の実施例について図面を参照し
て説明する。 [00081図1は本発明の前方一致文字列検索方式の
一実施例を示すブロック図である。また、図2は本実施
例の索引表12とファイル13との一例を示す情報構成
図である。 [0009]本実施例の前方一致文字列検索方式では、
図1に示すように、索引表生成手段1は、あらかじめ、
入力部11から検索対象の各レコードを入力して、ファ
イル13に格納する過程で、検索対象の各レコード内に
有する長さnの文字列検索項目から、先頭に有する長さ
に (1≦k < n )の部分文字列を取出して、そ
れぞれに取出し先のレコードへのポインタを付けた索引
表12を生成している。 [00101図2に示すように、本実施例のファイル1
3は、検索対象のr個のレコードR1,R2,・・・・
・・・・・Rrを有し、レコード番号iのレコードRi
に文字列検索項目W1としてkensakuhous
ik i、レコードRi+1に文字列検索項目Wi+
1としてkoku s ai、レコードRjに文字列検
索項目Wj としてkensaku、レコードRj+1
に文字列検索項目Wj+1としてkeieiなどを有し
ている。 [0011]また、本実施例の索引表12は、長さに=
3の索引用の部分文字列として・・・・・・・・・k
e i 、 −k eh、’:kok、・・・・・・・
・・koy、・・・・・・・・・などを有しており、k
eiにはレコードへのポインタとして・・・・・・・・
・Pj+1、kenにはレコードへのポインタとしてP
i・・・・・・・・・Pj、kokにはレコードへのポ
インタとしてPi+1がそれぞれ付いている。 [00121そして、本実施例の索引表12は、検索を
容易にするために、例えば、・・・・・・・・・kei
、ken、kok、・・・・・・・・・koyを小グル
ープのkoyとし、さらに、ado、ami、・・・・
・・・・・akuを大グループのakUに、・・・・・
・・・・koy・・・・・・・・・kusを大グループ
のkusにまとめて、それぞれaku、dem、kus
、・・・・・・・・・からの木構造を構成している。 [0013]そこで、索引条件形成手段2は、入力部1
4から入力して、前方一致の検索条件として与えられた
長さm(1≦m≦n)の条件文字列から、54mのとき
には、先頭に有する長さにの部分文字列を取出して索引
条件を形成し、k>mのときには、先頭から取出した長
さmの部分文字列とこれに続く長さに−mのあらゆる文
字列とによる長さにの文字列の集合で索引条件を形成し
ている。 [0014]そして、索引表走査手段3は、索引条件形
成手段2が形成した索引条件を用いて索引表12を走査
することにより、その索引条件を満足する索引表12の
長さにの部分文字列の集合を取出して、これらに付いた
ポインタの各々が指すレコードを選択している。 [0015]また、レコード抽出手段4は、索引表走査
手段3で選択したレコードの各々に対して、k<mのと
きには、長さnの文字列検索項目と長さmの条件文字列
とのそれぞれのに+1番目からm番目までの文字の照合
を行って、長さmの検索条件を満足するレコードのすべ
てを抽出し、k≧mのときには、選択したすべてのレコ
ードを抽出して、出力部15から選択したレコードを出
力している。 [0016]
て説明する。 [00081図1は本発明の前方一致文字列検索方式の
一実施例を示すブロック図である。また、図2は本実施
例の索引表12とファイル13との一例を示す情報構成
図である。 [0009]本実施例の前方一致文字列検索方式では、
図1に示すように、索引表生成手段1は、あらかじめ、
入力部11から検索対象の各レコードを入力して、ファ
イル13に格納する過程で、検索対象の各レコード内に
有する長さnの文字列検索項目から、先頭に有する長さ
に (1≦k < n )の部分文字列を取出して、そ
れぞれに取出し先のレコードへのポインタを付けた索引
表12を生成している。 [00101図2に示すように、本実施例のファイル1
3は、検索対象のr個のレコードR1,R2,・・・・
・・・・・Rrを有し、レコード番号iのレコードRi
に文字列検索項目W1としてkensakuhous
ik i、レコードRi+1に文字列検索項目Wi+
1としてkoku s ai、レコードRjに文字列検
索項目Wj としてkensaku、レコードRj+1
に文字列検索項目Wj+1としてkeieiなどを有し
ている。 [0011]また、本実施例の索引表12は、長さに=
3の索引用の部分文字列として・・・・・・・・・k
e i 、 −k eh、’:kok、・・・・・・・
・・koy、・・・・・・・・・などを有しており、k
eiにはレコードへのポインタとして・・・・・・・・
・Pj+1、kenにはレコードへのポインタとしてP
i・・・・・・・・・Pj、kokにはレコードへのポ
インタとしてPi+1がそれぞれ付いている。 [00121そして、本実施例の索引表12は、検索を
容易にするために、例えば、・・・・・・・・・kei
、ken、kok、・・・・・・・・・koyを小グル
ープのkoyとし、さらに、ado、ami、・・・・
・・・・・akuを大グループのakUに、・・・・・
・・・・koy・・・・・・・・・kusを大グループ
のkusにまとめて、それぞれaku、dem、kus
、・・・・・・・・・からの木構造を構成している。 [0013]そこで、索引条件形成手段2は、入力部1
4から入力して、前方一致の検索条件として与えられた
長さm(1≦m≦n)の条件文字列から、54mのとき
には、先頭に有する長さにの部分文字列を取出して索引
条件を形成し、k>mのときには、先頭から取出した長
さmの部分文字列とこれに続く長さに−mのあらゆる文
字列とによる長さにの文字列の集合で索引条件を形成し
ている。 [0014]そして、索引表走査手段3は、索引条件形
成手段2が形成した索引条件を用いて索引表12を走査
することにより、その索引条件を満足する索引表12の
長さにの部分文字列の集合を取出して、これらに付いた
ポインタの各々が指すレコードを選択している。 [0015]また、レコード抽出手段4は、索引表走査
手段3で選択したレコードの各々に対して、k<mのと
きには、長さnの文字列検索項目と長さmの条件文字列
とのそれぞれのに+1番目からm番目までの文字の照合
を行って、長さmの検索条件を満足するレコードのすべ
てを抽出し、k≧mのときには、選択したすべてのレコ
ードを抽出して、出力部15から選択したレコードを出
力している。 [0016]
【発明の効果】以上説明したように、本発明の前方一致
文字列検索方式は、あらかじめ、検索対象の各レコード
内に有する長さnの文字列検索項目から、先頭に有する
長さに (1≦k < n )の部分文字列を取出して
、それぞれに取出し先のレコードへのポインタを付けた
索引表を生成して置くことにより、k≧mのときには、
その索引表を走査するだけで、短い時間に該当のレコー
ドを抽出することができるとともに、k<mのときには
、その索引表を走査する短い時間と、次の数式(2)に
示す文字照合回数を処理するために要する時間とにより
、該当のレコードを抽出することができるので、従来の
前方一致文字列検索方式より、処理時間を大幅に短縮す
ることができるという効果を有している。 [0017]
文字列検索方式は、あらかじめ、検索対象の各レコード
内に有する長さnの文字列検索項目から、先頭に有する
長さに (1≦k < n )の部分文字列を取出して
、それぞれに取出し先のレコードへのポインタを付けた
索引表を生成して置くことにより、k≧mのときには、
その索引表を走査するだけで、短い時間に該当のレコー
ドを抽出することができるとともに、k<mのときには
、その索引表を走査する短い時間と、次の数式(2)に
示す文字照合回数を処理するために要する時間とにより
、該当のレコードを抽出することができるので、従来の
前方一致文字列検索方式より、処理時間を大幅に短縮す
ることができるという効果を有している。 [0017]
【図1】本発明の前方一致文字列検索方式の一実施例を
示すブロック図である。
示すブロック図である。
【図2】本実施例の索引表12とファイル13との一例
を示す情報構成図である。
を示す情報構成図である。
1 索引表生成手段
2 索引条件形成手段
3 索引表走査手段
4 レコード抽出手段
11.14 人力部
12 索引表
13 ファイル
15 出力部
Claims (2)
- 【請求項1】(A)あらかじめ、検索対象の各レコード
内に有する長さnの文字列検索項目から、先頭に有する
長さに(1≦k<n)の部分文字列を取出して、それぞ
れに取出し先のレコードへのポインタを付けた索引表を
生成する索引表生成手段、 (B)前方一致の検索条件として与えられる長さm(1
≦m≦n)の条件文字列から、k≦mのときには、先頭
に有する長さkの部分文字列を取出して索引条件を形成
し、k>mのときには、先頭から取出した長さmの部分
文字列とこれに続く長さk−mのあらゆる文字列とによ
る長さにの文字列の集合で索引条件を形成する索引条件
形成手段、 (C)前記索引条件を用いて前記索引表を走査すること
により、前記索引条件を満足する前記索引表の長さkの
部分文字列の集合を取出して、これらに付いたポインタ
の各々が指すレコードを選択する索引表走査手段、(D
)前記索引表走査手段で選択したレコードの各々に対し
て、k<mのときには、長さnの文字列検索項目と長さ
mの条件文字列とのそれぞれのk+1番目からm番目ま
での文字の照合を行って、長さmの検索条件を満足する
レコードのすべてを抽出し、k≧mのときには、選択し
たすべてのレコードを抽出するレコード抽出手段、を備
えることを特徴とする前方一致文字列検索方式。 - 【請求項2】(A)あらかじめ、検索対象の各レコード
内に有する長さnの文字列検索項目から、先頭に有する
長さk(1≦k<n)の部分文字列を取出して、それぞ
れに取出し先のレコードへのポインタを付けた索引表を
生成し、 (B)前方一致の検索条件として与えられる長さm(1
≦m≦n)の条件文字列から、k≦mのときには、先頭
に有する長さkの部分文字列を取出して索引条件を形成
し、k>mのときには、先頭から取出した長さmの部分
文字列とこれに続く長さk−mのあらゆる文字列とによ
る長さkの文字列の集合で索引条件を形成し、(C)前
記索引条件を用いて前記索引表を走査することにより、
前記索引条件を満足する前記索引表の長さkの部分文字
列の集合を取出して、これらに付いたポインタの各々が
指すレコードを選択し、 (D)前記索引表走査手段で選択したレコードの各々に
対して、k<mのときには、長さnの文字列検索項目と
長さmの条件文字列とのそれぞれのk+1番目からm番
目までの文字の照合を行って、長さmの検索条件を満足
するレコードのすべてを抽出し、k≧mのときには、選
択したすべてのレコードを抽出する、ことを特徴とする
前方一致文字列検索方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2400224A JPH04209069A (ja) | 1990-12-03 | 1990-12-03 | 前方一致文字列検索方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2400224A JPH04209069A (ja) | 1990-12-03 | 1990-12-03 | 前方一致文字列検索方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04209069A true JPH04209069A (ja) | 1992-07-30 |
Family
ID=18510136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2400224A Pending JPH04209069A (ja) | 1990-12-03 | 1990-12-03 | 前方一致文字列検索方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04209069A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217596A (ja) * | 2007-03-06 | 2008-09-18 | Toshiba Corp | 文書検索システム及びプログラム |
US8095526B2 (en) | 2003-12-02 | 2012-01-10 | Nec Corporation | Efficient retrieval of variable-length character string data |
-
1990
- 1990-12-03 JP JP2400224A patent/JPH04209069A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8095526B2 (en) | 2003-12-02 | 2012-01-10 | Nec Corporation | Efficient retrieval of variable-length character string data |
US8200646B2 (en) | 2003-12-02 | 2012-06-12 | Nec Corporation | Efficient retrieval of variable-length character string data |
JP2008217596A (ja) * | 2007-03-06 | 2008-09-18 | Toshiba Corp | 文書検索システム及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0510634B1 (en) | Data base retrieval system | |
JP2929963B2 (ja) | 文書検索装置および単語索引作成方法および文書検索方法 | |
US7010519B2 (en) | Method and system for expanding document retrieval information | |
KR960018993A (ko) | 정보 검색 방법 및 시스템 | |
CN105404677A (zh) | 一种基于树形结构的检索方法 | |
JP3258063B2 (ja) | データベース検索システム及び方法 | |
JPH04209069A (ja) | 前方一致文字列検索方式 | |
CN105426490A (zh) | 一种基于树形结构的索引方法 | |
JP3151730B2 (ja) | データベース検索システム | |
CN109614535A (zh) | 一种基于Scrapy框架的网络数据的采集方法及装置 | |
KR20000073523A (ko) | 기존의 번호 체계를 이용하여 웹사이트에 연결하는 방법. | |
JP3260428B2 (ja) | 情報検索処理装置 | |
JP2519129B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
JP3825829B2 (ja) | 登録情報検索装置及びその方法 | |
JP2535629B2 (ja) | 検索システムの入力文字列正規化方式 | |
JP2000322416A (ja) | 文書検索装置 | |
JP2550022B2 (ja) | 文書情報検索方式 | |
JP2001092831A (ja) | 文書検索装置及び文書検索方法 | |
JPH0991305A (ja) | 情報処理方法及び装置 | |
JPH05135103A (ja) | 単語の簡易検索方式 | |
JPS62191924A (ja) | 情報登録検索装置 | |
JPH05225248A (ja) | データベース検索システム | |
JP2003296354A (ja) | 辞書作成装置 | |
JPH01106263A (ja) | 文書の格納検索装置 | |
JPH1115845A (ja) | 情報検索方法および装置と情報検索プログラムを格納した記録媒体 |