JPH04209069A - 前方一致文字列検索方式 - Google Patents

前方一致文字列検索方式

Info

Publication number
JPH04209069A
JPH04209069A JP2400224A JP40022490A JPH04209069A JP H04209069 A JPH04209069 A JP H04209069A JP 2400224 A JP2400224 A JP 2400224A JP 40022490 A JP40022490 A JP 40022490A JP H04209069 A JPH04209069 A JP H04209069A
Authority
JP
Japan
Prior art keywords
length
character string
index
record
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2400224A
Other languages
English (en)
Inventor
Hirohisa Shimazu
島津 浩久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2400224A priority Critical patent/JPH04209069A/ja
Publication of JPH04209069A publication Critical patent/JPH04209069A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[00011
【産業上の利用分野]本発明は前方一致文字列検索方式
に関し、特にコンピュータを用いた情報検索システムの
前方一致文字列検索方式に関する。 [0002] 【従来の技術】従来の前方一致文字列検索方式は、検索
対象のr個のレコードR1,R2,・・・・・・・・・
Rrを順次に取出して、それぞれのレコードRi内に有
する長さnの文字列検索項目Wi  :Wil、 Wi
2.・・・・・・・・・Winと前方−致の検索条件と
して与えられる長さm(1≦m≦n)の条件文字列Ci
  :Cil、 Ci2.・・・・・・・・・Cimと
を先頭の文字より順次に照合して、m番目までのすべて
の文字が一致した場合にだけレコードRiを検索条件を
満足するレコードとして選択し、照合の過程で一致しな
い文字が発見されればその段階でレコードRiを検索条
件を満足しないレコードとして棄却していた。 [0003]
【発明が解決しようとする課題】上述した従来の前方一
致文字列検索方式は、検索対象のr個のレコードR1゜
R2,・・・・・・・・・Rrを順次に取出して、それ
ぞれ先頭の文字より順次に一致しない文字が発見される
かm番目の文字が終るまで文字照合を行っているので、
使用される文字の種類数をhとして、文字の種類に対す
る使用頻度を均等と仮定すれば、次の数式(1)に示す
文字照合回数が必要となり、レコード数rや条件文字列
の長さmが大きくなると文字照合回数が増大することに
より、長い処理時間がかかるという欠点を有している。 [0004] [0005]
【課題を解決するための手段】第1の発明の前方一致文
字列検索方式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k < n )の部分文字列を取出して、それぞれに
取出し先のレコードへのポインタを付けた索引表を生成
する索引表生成手段、 (B)前方一致の検索条件として与えられる長さm(1
≦m≦n)の条件文字列から、k≦mのときには、先頭
に有する長さにの部分文字列を取出して索引条件を形成
※※し、k>mのときには、先頭から取出した長さmの
部分文字列とこれに続く長さに−mのあらゆる文字列と
による長さにの文字列の集合で索引条件を形成する索引
条件形成手段、 (C)前記索引条件を用いて前記索引表を走査すること
により、前記索引条件を満足する前記索引表の長さにの
部分文字列の集合を取出して、これらに付いたポインタ
の各々が指すレコードを選択する索引表走査手段、(D
)前記索引表走査手段で選択したレコードの各々に対し
て、k<mのときには、長さnの文字列検索項目と長さ
mの条件文字列とのそれぞれのに+1番目からm番目ま
での文字の照合を行って、長さmの検索条件を満足する
レコードのすべてを抽出し、k≧mのときには、選択し
たすべてのレコードを抽出するレコード抽出手段、を備
えて構成されている。 [0006]また、第2の発明の前方一致文字列検索方
式は、 (A)あらかじめ、検索対象の各レコード内に有する長
さnの文字列検索項目から、先頭に有する長さに (1
≦k<n)の部分文字列を取出して、それぞれに取出し
先のレコードへのポインタを付けた索引表を生成し、(
B)前方一致の検索条件として与えられる長さm(1≦
m≦n)の条件文字列から、54mのときには、先頭に
有する長さにの部分文字列を取出して索引条件を形成し
、k>mのときには、先頭から取出した長さmの部分文
字列とこれに続く長さに−mのあらゆる文字列とによる
長さにの文字列の集合で索引条件を形成し、(C)前記
索引条件を用いて前記索引表を走査することにより、前
記索引条件を満足する前記索引表の長さにの部分文字列
の集合を取出して、これらに付いたポインタの各々が指
すレコードを選択し、 (D)前記索引表走査手段で選択したレコードの各々に
対して、k<mのときには、長さnの文字列検索項目と
長さmの条件文字列とのそれぞれのに+1番目からm番
目までの文字の照合を行って、長さmの検索条件を満足
するレコードのすべてを抽出し、k≧mのときには、選
択したすべてのレコードを抽出する、ことにより構成さ
れている。 (0007]
【実施例】次に、本発明の実施例について図面を参照し
て説明する。 [00081図1は本発明の前方一致文字列検索方式の
一実施例を示すブロック図である。また、図2は本実施
例の索引表12とファイル13との一例を示す情報構成
図である。 [0009]本実施例の前方一致文字列検索方式では、
図1に示すように、索引表生成手段1は、あらかじめ、
入力部11から検索対象の各レコードを入力して、ファ
イル13に格納する過程で、検索対象の各レコード内に
有する長さnの文字列検索項目から、先頭に有する長さ
に (1≦k < n )の部分文字列を取出して、そ
れぞれに取出し先のレコードへのポインタを付けた索引
表12を生成している。 [00101図2に示すように、本実施例のファイル1
3は、検索対象のr個のレコードR1,R2,・・・・
・・・・・Rrを有し、レコード番号iのレコードRi
 に文字列検索項目W1としてkensakuhous
 ik i、レコードRi+1に文字列検索項目Wi+
1としてkoku s ai、レコードRjに文字列検
索項目Wj としてkensaku、レコードRj+1
に文字列検索項目Wj+1としてkeieiなどを有し
ている。 [0011]また、本実施例の索引表12は、長さに=
3の索引用の部分文字列として・・・・・・・・・k 
e i 、 −k eh、’:kok、・・・・・・・
・・koy、・・・・・・・・・などを有しており、k
eiにはレコードへのポインタとして・・・・・・・・
・Pj+1、kenにはレコードへのポインタとしてP
i・・・・・・・・・Pj、kokにはレコードへのポ
インタとしてPi+1がそれぞれ付いている。 [00121そして、本実施例の索引表12は、検索を
容易にするために、例えば、・・・・・・・・・kei
、ken、kok、・・・・・・・・・koyを小グル
ープのkoyとし、さらに、ado、ami、・・・・
・・・・・akuを大グループのakUに、・・・・・
・・・・koy・・・・・・・・・kusを大グループ
のkusにまとめて、それぞれaku、dem、kus
、・・・・・・・・・からの木構造を構成している。 [0013]そこで、索引条件形成手段2は、入力部1
4から入力して、前方一致の検索条件として与えられた
長さm(1≦m≦n)の条件文字列から、54mのとき
には、先頭に有する長さにの部分文字列を取出して索引
条件を形成し、k>mのときには、先頭から取出した長
さmの部分文字列とこれに続く長さに−mのあらゆる文
字列とによる長さにの文字列の集合で索引条件を形成し
ている。 [0014]そして、索引表走査手段3は、索引条件形
成手段2が形成した索引条件を用いて索引表12を走査
することにより、その索引条件を満足する索引表12の
長さにの部分文字列の集合を取出して、これらに付いた
ポインタの各々が指すレコードを選択している。 [0015]また、レコード抽出手段4は、索引表走査
手段3で選択したレコードの各々に対して、k<mのと
きには、長さnの文字列検索項目と長さmの条件文字列
とのそれぞれのに+1番目からm番目までの文字の照合
を行って、長さmの検索条件を満足するレコードのすべ
てを抽出し、k≧mのときには、選択したすべてのレコ
ードを抽出して、出力部15から選択したレコードを出
力している。 [0016]
【発明の効果】以上説明したように、本発明の前方一致
文字列検索方式は、あらかじめ、検索対象の各レコード
内に有する長さnの文字列検索項目から、先頭に有する
長さに (1≦k < n )の部分文字列を取出して
、それぞれに取出し先のレコードへのポインタを付けた
索引表を生成して置くことにより、k≧mのときには、
その索引表を走査するだけで、短い時間に該当のレコー
ドを抽出することができるとともに、k<mのときには
、その索引表を走査する短い時間と、次の数式(2)に
示す文字照合回数を処理するために要する時間とにより
、該当のレコードを抽出することができるので、従来の
前方一致文字列検索方式より、処理時間を大幅に短縮す
ることができるという効果を有している。 [0017]
【図面の簡単な説明】
【図1】本発明の前方一致文字列検索方式の一実施例を
示すブロック図である。
【図2】本実施例の索引表12とファイル13との一例
を示す情報構成図である。
【符号の説明】
1  索引表生成手段 2  索引条件形成手段 3  索引表走査手段 4  レコード抽出手段 11.14   人力部 12  索引表 13  ファイル 15  出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】(A)あらかじめ、検索対象の各レコード
    内に有する長さnの文字列検索項目から、先頭に有する
    長さに(1≦k<n)の部分文字列を取出して、それぞ
    れに取出し先のレコードへのポインタを付けた索引表を
    生成する索引表生成手段、 (B)前方一致の検索条件として与えられる長さm(1
    ≦m≦n)の条件文字列から、k≦mのときには、先頭
    に有する長さkの部分文字列を取出して索引条件を形成
    し、k>mのときには、先頭から取出した長さmの部分
    文字列とこれに続く長さk−mのあらゆる文字列とによ
    る長さにの文字列の集合で索引条件を形成する索引条件
    形成手段、 (C)前記索引条件を用いて前記索引表を走査すること
    により、前記索引条件を満足する前記索引表の長さkの
    部分文字列の集合を取出して、これらに付いたポインタ
    の各々が指すレコードを選択する索引表走査手段、(D
    )前記索引表走査手段で選択したレコードの各々に対し
    て、k<mのときには、長さnの文字列検索項目と長さ
    mの条件文字列とのそれぞれのk+1番目からm番目ま
    での文字の照合を行って、長さmの検索条件を満足する
    レコードのすべてを抽出し、k≧mのときには、選択し
    たすべてのレコードを抽出するレコード抽出手段、を備
    えることを特徴とする前方一致文字列検索方式。
  2. 【請求項2】(A)あらかじめ、検索対象の各レコード
    内に有する長さnの文字列検索項目から、先頭に有する
    長さk(1≦k<n)の部分文字列を取出して、それぞ
    れに取出し先のレコードへのポインタを付けた索引表を
    生成し、 (B)前方一致の検索条件として与えられる長さm(1
    ≦m≦n)の条件文字列から、k≦mのときには、先頭
    に有する長さkの部分文字列を取出して索引条件を形成
    し、k>mのときには、先頭から取出した長さmの部分
    文字列とこれに続く長さk−mのあらゆる文字列とによ
    る長さkの文字列の集合で索引条件を形成し、(C)前
    記索引条件を用いて前記索引表を走査することにより、
    前記索引条件を満足する前記索引表の長さkの部分文字
    列の集合を取出して、これらに付いたポインタの各々が
    指すレコードを選択し、 (D)前記索引表走査手段で選択したレコードの各々に
    対して、k<mのときには、長さnの文字列検索項目と
    長さmの条件文字列とのそれぞれのk+1番目からm番
    目までの文字の照合を行って、長さmの検索条件を満足
    するレコードのすべてを抽出し、k≧mのときには、選
    択したすべてのレコードを抽出する、ことを特徴とする
    前方一致文字列検索方式。
JP2400224A 1990-12-03 1990-12-03 前方一致文字列検索方式 Pending JPH04209069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2400224A JPH04209069A (ja) 1990-12-03 1990-12-03 前方一致文字列検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2400224A JPH04209069A (ja) 1990-12-03 1990-12-03 前方一致文字列検索方式

Publications (1)

Publication Number Publication Date
JPH04209069A true JPH04209069A (ja) 1992-07-30

Family

ID=18510136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2400224A Pending JPH04209069A (ja) 1990-12-03 1990-12-03 前方一致文字列検索方式

Country Status (1)

Country Link
JP (1) JPH04209069A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217596A (ja) * 2007-03-06 2008-09-18 Toshiba Corp 文書検索システム及びプログラム
US8095526B2 (en) 2003-12-02 2012-01-10 Nec Corporation Efficient retrieval of variable-length character string data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8095526B2 (en) 2003-12-02 2012-01-10 Nec Corporation Efficient retrieval of variable-length character string data
US8200646B2 (en) 2003-12-02 2012-06-12 Nec Corporation Efficient retrieval of variable-length character string data
JP2008217596A (ja) * 2007-03-06 2008-09-18 Toshiba Corp 文書検索システム及びプログラム

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
JP2929963B2 (ja) 文書検索装置および単語索引作成方法および文書検索方法
US7010519B2 (en) Method and system for expanding document retrieval information
KR960018993A (ko) 정보 검색 방법 및 시스템
CN105404677A (zh) 一种基于树形结构的检索方法
JP3258063B2 (ja) データベース検索システム及び方法
JPH04209069A (ja) 前方一致文字列検索方式
CN105426490A (zh) 一种基于树形结构的索引方法
JP3151730B2 (ja) データベース検索システム
CN109614535A (zh) 一种基于Scrapy框架的网络数据的采集方法及装置
KR20000073523A (ko) 기존의 번호 체계를 이용하여 웹사이트에 연결하는 방법.
JP3260428B2 (ja) 情報検索処理装置
JP2519129B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JP2000322416A (ja) 文書検索装置
JP2550022B2 (ja) 文書情報検索方式
JP2001092831A (ja) 文書検索装置及び文書検索方法
JPH0991305A (ja) 情報処理方法及び装置
JPH05135103A (ja) 単語の簡易検索方式
JPS62191924A (ja) 情報登録検索装置
JPH05225248A (ja) データベース検索システム
JP2003296354A (ja) 辞書作成装置
JPH01106263A (ja) 文書の格納検索装置
JPH1115845A (ja) 情報検索方法および装置と情報検索プログラムを格納した記録媒体