JP2519130B2 - マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 - Google Patents

マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置

Info

Publication number
JP2519130B2
JP2519130B2 JP3013879A JP1387991A JP2519130B2 JP 2519130 B2 JP2519130 B2 JP 2519130B2 JP 3013879 A JP3013879 A JP 3013879A JP 1387991 A JP1387991 A JP 1387991A JP 2519130 B2 JP2519130 B2 JP 2519130B2
Authority
JP
Japan
Prior art keywords
character set
character
keyword
search
set position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3013879A
Other languages
English (en)
Other versions
JPH04340165A (ja
Inventor
忠一 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TELEMATIC KOKUSAI KENKYUSHO
Original Assignee
TELEMATIC KOKUSAI KENKYUSHO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TELEMATIC KOKUSAI KENKYUSHO filed Critical TELEMATIC KOKUSAI KENKYUSHO
Priority to JP3013879A priority Critical patent/JP2519130B2/ja
Publication of JPH04340165A publication Critical patent/JPH04340165A/ja
Application granted granted Critical
Publication of JP2519130B2 publication Critical patent/JP2519130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報検索を行う情報検
索処理方式に関する。本発明は、特にマルチキーワード
を用いた部分一致検索を行うことに適し、入力されたマ
ルチ検索入力文字列と登録キーワードとの文字列照合回
数を大幅に削減して、マルチ検索入力文字列に対する部
分一致(中間一致、前方一致、後方一致)や完全一致の
各検索処理を、高速に行うことができる情報検索処理方
式に関する。本発明は、データベースシステムにおいて
マルチキーワード部分一致検索処理を行う情報検索処理
方式に適する。
【0002】
【従来の技術】従来から、検索対象であるレコードが有
するキーワードの最初から最後まで、検索入力文字列と
の文字列照合を行い、検索者が指定する入力文字列と検
索条件に合致するキーワードからレコード番号をサーチ
する逐次検索方式や、キーワードから検索入力可能な文
字列を作成して索引形式に検索ファイルを格納し、検索
者が指定する入力文字列と検索条件に合致するキーワー
ドを検索ファイルのインデックス構造を利用してサーチ
するインデックス方式がマルチキーワードを用いた部分
一致検索技術として一般的である。
【0003】
【発明が解決しようとする課題】しかし逐次検索方式で
は、検索対象レコードの有するキーワードの最初から最
後まで、検索入力文字列との照合を行うため、多量のキ
ーワードを有する場合、その検索に多くの時間を要す
る。このため、大規模データベースの検索では、高速な
文字列照合を行う専用のプロセッサやLSIが提案され
ているが、これらの方式では、ハードウエアが限定され
るほか、検索処理を行う計算機と専用プロセッサやLS
Iとの間での文字列転送に時間がかかり、システムとし
て満足できる高速性の実現が課題となっている。
【0004】また、インデックス方式は、部分一致検索
の高速化が可能であるが、検索ファイルが巨大になると
いう欠点がある。このため完全一致、前方一致、後方一
致の検索が使用されているが、中間一致はサポートされ
ていないことが多い。これは、中間一致を行うために、
完全一致、前方一致、後方一致の検索インデックスとは
別に、中間一致用のインデックスが多量に必要になり、
検索ファイルの記憶容量が巨大となること、これに伴い
検索時間が増大すること、および検索ファイルの保守が
容易でないことが主な理由となっている。また、システ
ムによっては検索ファイルの規模の制約から、キーワー
ドの全ての前方一致や後方一致検索がサポートされない
こともある。しかし、検索者はキーワードの中の特徴あ
る文字や文字列を記憶することが多く、このため中間一
致を含む部分一致検索のサポートにより検索がスムーズ
に行なえるようになることが求められている。
【0005】本発明者は、日本語の場合には、キーワー
ドになりうる単語に同じ文字や同じ文字列が出現する頻
度が低い特徴がある点に着目し、キーワード構成文字を
先頭文字から1文字ずつ、その文字と次に続く合計r文
字で文字セットを作成し、これらを文字セット種ごとに
格納して検索ファイルを作成し、検索時には、検索入力
された任意の文字列の構成文字を先頭文字からr文字単
位の文字セットに分解し、分解した文字セットと同じ文
字セットを検索ファイルから取り出し、文字セットの連
続性を照合することにより検索を高速化することができ
ることを見出した。
【0006】本発明は、上述の観点から巨大なデータベ
ースシステムを対象とするマルチキーワードを用いた部
分一致検索の高速化を実現することができ、しかも特定
のハードウエアに限定されず、検索処理を主記憶上で行
うことにより専用プロセッサやLSIとの文字列の転送
が不要であり、文字セットと文字セット位置に着目する
ことにより任意の文字列検索が可能である汎用性に富む
情報検索処理方式を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の第一の特徴は、
複数のキーワードから構成されたレコードを検索単位と
し、各キーワードはそのキーワードの論理区分にしたが
って属性が定められ、このレコードを検索対象として所
定の入力文字列に合致するキーワードのレコードを検索
するマルチキーワード情報検索処理方式の検索ファイル
作成装置において、検索対象となるレコードが現れる
とに昇順の符号を付与するレコード識別符号付与手段
と、このレコードが有する各キーワードにキーワードの
論理的な区分を示す属性符号を付与するキーワード属性
符号付与手段と、上記レコードの有する全てのキーワー
ドをキーワード属性ごとによって定められた文字位置を
先頭位置とする固定長のキーワード属性領域に配列して
連結されたキーワード列を生成するキーワード列作成手
段と、上記生成されたキーワード列のキーワードを各文
字ごとに分解してその文字と次に続く合計r文字(但し
rは2以上の自然数)からなる文字セットを作成し、
の文字セットにキーワード中での文字セットの先頭文字
位置を示す文字セット位置順序符号を付与する文字セッ
ト位置順序符号付与手段と、上記レコード識別符号とキ
ーワード属性符号と文字セット位置順序符号とからな
文字セット位置順序情報を最下位情報とする文字セット
位置情報を作成して、この文字セット位置情報を文字セ
ット種ごとの領域に格納して検索ファイルを作成する手
段とを備えたことを特徴とする。
【0008】なお、文字セット位置情報は、レコードが
有する各キーワードをキーワード属性符号に対応するキ
ーワード属性領域に配列して作成するキーワード列につ
いて、各キーワードの全ての文字セットを、レコード識
別符号とキーワード属性符号と文字セット位置順序符号
とで整数からなるコードに変換して作成するもので、レ
コード識別符号×n+(Pa −1)+文字位置順序符号 n:キーワード列文字数 Pa :キーワード属性符号aのキーワード属性領域のキ
ーワード列における先頭文字位置なる数字として与えら
れることが好ましい。
【0009】また本発明の第二の特徴は、第一の特徴で
作成された検索ファイルを備え、検索入力文字列の構成
文字を先頭文字からr文字単位の文字セットに分解して
検索入力文字セット列を作成し、この文字セットと同じ
文字セットの文字セット位置情報を上記検索ファイルか
ら取り出す手段と、この取り出した各文字セットの文字
セット位置情報間で、レコード識別符号とキーワード属
性符号が共通で文字セット位置順序符号の差が検索入力
文字列の該当する文字セットの先頭文字位置差に等し
く、かつそのキーワード属性符号が検索入力と等しい文
字セット位置情報の組み合わせを抽出する手段と、この
抽出された文字セット位置情報の組み合わせに基づいて
検索入力文字列に対応するレコード識別符号を検索結果
として出力する手段とを備えたことを特徴とする。
【0010】なお、検索入力文字列を先頭文字からr文
字単位の文字セットに分解したとき、最後の文字セット
が(r−1)以下になり、r文字単位の文字セットを作
成できないことがある。このときには、最後の文字セッ
トの直前の文字セットの後部から不足文字数分の文字を
取り出し、最後の文字セットの前部に連結してr文字単
位の文字セットを作成することが好ましい。
【0011】また、検索入力文字セット列と同じ文字セ
ット列を構成できる文字セット位置情報の組み合わせの
抽出は、検索入力の全キーワードにおける出現頻度の低
い文字セットから順に行うことが好ましい。
【0012】また、検索入力文字セット列と同じ文字セ
ット列を構成できる文字セット位置情報の組み合わせの
抽出は、検索入力文字セット列の全キーワードにおける
出現頻度の低い文字セットの文字セット位置順序符号を
i、出現頻度の高い文字セットの文字セット位置順序符
号をjとするとき、(文字セット位置順序符号iの文字
セットの文字セット位置情報)−(文字セット位置順序
符号jの文字セットの文字セット位置情報)=i−jの
式により行うことが好ましい。
【0013】なお、キーワードが記号を含む欧文文字列
の場合は、少なくとも3文字記号単位の文字セットと
し、記号を含む欧文字のみの文字セット種グループの検
索ファイルを用いることがよい。
【0014】また、キーワードが漢字を含む場合は、漢
字については1文字単位の文字位置情報とし、仮名文字
については少なくとも2文字単位の文字セット位置情報
とする検索ファイルを用いることができる。
【0015】
【作用】文書中に同じ文字列が出現する頻度は低い。例
えば広辞苑の見出し語の説明文書は約900 万字あるが、
その中で仮名文字の出現頻度を調べると平均約53200 回
と高い。しかし、仮名2文字の文字列の出現頻度を調べ
ると平均出現頻度472 回と低くなる。このため仮名2 文
字を文字セットとすると、検索入力がn文字の場合、抽
出する照合対象は平均すれば(n/2)×472 個の文字
セット位置情報となる。漢字は文字種が仮名文字より多
いので、漢字2文字の文字列の出現頻度は仮名文字より
低くなり、抽出する照合対象も仮名文字より少なくな
る。一般的に検索入力は数十文字以下であるため、出現
頻度の高い文字を含む文字列であっても、全部の文字を
逐次照合するものに比べるとその照合回数は極めて少な
くなる。
【0016】例えば、「通信」という2つの文字列を使
用する用語は多々あるとしても「通信・・」という文字
列は「通信回線」、「通信装置」のように4文字で同一
の文字が発生する頻度は非常に低くなる。この結果、
「通信」に続く「回線」や「装置」の文字列を照合する
と、検索対象が急激に絞り込まれていく。このようにし
て、検索入力文字セット列の構成文字セットで検索ファ
イルとの照合を進めていくと、それまでに得られた検索
対象候補のキーワードの中から、検索入力文字セット列
と異なるキーワードが削除され、照合する構成文字セッ
トごとに検索対象が絞り込まれていく。特に、検索入力
の中の全キーワードにおける出現頻度の低い文字セット
から順に照合を行うと一層絞り込まれて照合一致を取る
回数を低減できる。
【0017】したがって、検索対象となるレコードが有
するキーワードを構成する各文字セットに対応して、レ
コードを特定できるレコード識別符号と、キーワードの
属性を特定できるキーワード属性符号と、キーワード中
の文字セット位置を特定できる文字セット位置順序符号
とから文字セット位置情報を作成し、この文字セット位
置情報を文字セット種ごとに格納して検索ファイルを作
成し、この検索ファイルに対して検索入力文字列との照
合一致を行うことにより文字列検索における照合一致処
理回数を大幅に低減することができる。
【0018】この検索ファイルの作成は次のように行
う。
【0019】まず検索対象となる各レコードに登録順序
に従って昇順にレコード識別符号を付与する。次に、各
レコードが有するキーワードの論理的な種別を属性とし
て、その属性を示すキーワード属性符号を付与する。例
えば図書検索システムの場合、図書名、著者名、発行者
名、刊行年、抄録などの属性を示すキーワード属性符号
が付与される。さらに、キーワードの先頭文字から1文
字ずつ取り出し、その文字と次に続く合計r文字で文字
セットを作成し、各文字セットにキーワード中での文字
セットの先頭文字位置を示す文字セット位置順序符号を
付与する。これらのレコード識別符号とキーワード属性
符号と文字セット位置順序符号とから、キーワードの各
文字セットの文字セット位置情報を生成する。このとき
キーワード属性を文字位置で表せるように、キーワード
属性符号ごとにあらかじめ設定されたキーワードの先頭
文字位置が定数として文字セット位置情報に加算される
ようにしている。この文字セット位置情報を文字セット
種ごとにグループ化し、これらの各グループを集合して
検索ファイルを作成する。したがってこの検索ファイル
は、文字セット種ごとに文字セット位置情報が格納され
た形のファイル構造となり、周知の記憶媒体に記憶され
る。
【0020】検索処理では、検索入力文字列と検索入力
文字列属性とが対で1個以上入力される。各検索入力文
字列について検索入力文字列を先頭文字からr文字単位
の文字セットに分解し、検索ファイル中から分解した文
字セットと同じ文字セットの文字セット位置情報を取り
出して、レコード識別符号が共通で文字セット位置順序
符号の差が該当する検索入力文字列の文字セットの先頭
文字位置差に等しく、かつそのキーワード属性符号が検
索入力と等しい文字位セット置情報の組み合わせを照合
して取り出す。取り出した各検索入力に対応する文字セ
ット位置情報の組み合わせから検索入力文字列に対応す
るレコード識別符号を検索結果として取り出す。
【0021】なお、検索入力文字列を先頭文字からr文
字単位の文字セットに分解したとき、最後の文字セット
が(r−1)以下になり、r文字単位の文字セットを作
成できないことがある。このときには、最後の文字セッ
トの直前の文字セットの後部から不足文字数分の文字を
取り出し、最後の文字セットの前部に連結してr文字単
位の文字セットを作成する。
【0022】この照合処理は、検索入力と検索ファイル
との文字セット列の連続性の一致と属性の一致とをみる
もので、検索ファイル中の文字セット位置情報からレコ
ードの識別符号が共通していて文字セット位置順序符号
の差が該当する検索入力文字列の文字セットの先頭文字
位置差に等しくかつキーワード属性符号が同じキーワー
ドを取り出すことにより行う。
【0023】これにより、検索ファイル中の全キーワー
ドとの照合が不要になり、検索ファイルにある検索入力
と同じ文字セットの文字セット位置情報だけの照合一致
を行えばよいので、照合回数は逐次照合に比べるときわ
めて低減することができる。また、日本語の単語では、
同じ文字列の出現頻度が低いので、r文字単位の文字セ
ットを照合するたびに、検索対象が絞り込まれるので、
照合回数は低減していく。
【0024】さらに、検索ファイルから取り出した文字
セット位置情報を照合するとき、検索入力の中の全キー
ワードにおける出現頻度の低い文字セットから順に行う
と検索対象が一層絞り込まれ、照合一致をとる回数がさ
らに低減できる。
【0025】このようにして検索入力に合致する文字セ
ット位置情報を見出したときは検索入力に対応するレコ
ード識別符号に該当するレコードを抽出して、検索者に
検索結果として出力する。
【0026】
【実施例】以下図面を参照して本発明の実施例を説明す
る。
【0027】図1は本発明一実施例における情報検索処
理装置の構成を示すものである。
【0028】本実施例の情報検索処理装置は、各種演算
処理あるいは判断処理を行うCPU1と、検索処理、検
索ファイル作成等のプログラム、作成されたあるいは検
索処理を行うための検索ファイル、検索入力等を記憶す
るメモリ2、キーボード4、ディスプレイ5を接続する
入出力部3、各種情報が記憶される外部記憶装置7を接
続する外部記憶装置制御部6、CPU1、メモリ2、入
出力部3、外部記憶装置制御部6を接続する共通バス8
とを備える。
【0029】本実施例での情報検索処理は、検索処理に
供するための検索対象となるレコードが有するマルチキ
ーワードから作成するキーワード列について各キーワー
ドの構成文字をキーワード列の先頭文字から1文字ずつ
取り出し、その文字と次に続く文字の合計2文字で文字
セットを作成し、これらの文字セット種を文字セット種
ごとに格納して検索ファイルを作成する検索ファイル作
成処理と、検索ファイルとの照合一致を行って検索入力
に合致するキーワードのレコードを抽出する検索処理と
の二つに分けられる。
【0030】まず、検索ファイル作成処理について説明
する。
【0031】この検索ファイル作成処理は、大まかに分
けると、検索ファイル領域確保、各キーワード構成
文字セットへの文字セット位置情報の付与、文字セッ
ト種別ごとにグループ化した文字セット位置情報のファ
イルへの格納の3つに分けることができる。この各処理
についてそれぞれ説明する。
【0032】 検索ファイル領域確保 検索ファイルは、図2に示すように、JISコード表に
記載されている文字順に配列された文字セット群で構成
される。各文字セット群は図3に示すように、JISコ
ード表に記載されている文字順に、記載文字を先頭文字
とする2文字の文字列で構成される文字セットグループ
で構成される。そこで登録するレコードの有するキーワ
ードの先頭文字から1文字ずつ取り出し、その文字と次
に続く合計2文字で文字セットを作成し、これらの文字
セット種ごとに出現頻度を計数する。これにより、検索
ファイルを構成する各文字セット種グループに登録され
る文字セット位置情報の数がわかるので、全文字セット
種グループで構成される検索ファイルの領域を確保でき
る。また同時に、各文字セット種グループに登録される
文字セット位置情報の数から、検索ファイル内に連続し
て格納される文字セット種グループの先頭番地もわか
る。この文字セット種グループの先頭番地を図3の文字
セット群一覧の記載順に配列したのが図4に示す文字セ
ットグループアドレス表である。
【0033】 各キーワード構成文字セットへの文字
セット位置情報の付与 ここで述べる文字セット位置情報は、レコードが有する
各キーワードをキーワード属性番号に対応するキーワー
ド属性領域に配列して作成するキーワード列において、
各キーワードを構成するすべての文字セットが属するレ
コードの登録する順番を示すレコード番号と、キーワー
ドにおけるその文字セットの出現する位置をその文字セ
ットの先頭文字の位置で示す文字セット位置番号と、キ
ーワードの論理的な種別を示すキーワード属性番号とで
作成される。
【0034】まずレコード番号を説明する。例えば、一
般的な図書検索システムでは、図書名、著者名、発行者
名、刊行年、抄録のキーワードで図書を検索する。この
ときレコードは、図書名、著者名、発行者名、刊行年、
抄録のキーワードで構成される検索対象であって、この
レコードが登録される順序に1から昇順に番号を付与し
てレコード番号とする。
【0035】次にキーワード属性番号を説明する。一般
的に検索者は、検索する図書を特定しやすいキーワード
を検索入力としたり、あるいは記憶しているキーワード
を検索入力する。このため図書検索システムでは、例え
ば図書名、著者名、発行者名、刊行年、抄録の各キーワ
ードにキーワード属性を付加し、検索入力と図書検索シ
ステムのキーワード間に論理的な関連付けを行ってい
る。ここではキーワード属性番号として、図書名に
「1」、著者名に「2」、発行者名に「3」、刊行年に
「4」、抄録に「5」を付与する。
【0036】次に文字セット位置番号を説明する。キー
ワードごとに、キーワードの先頭から1文字ずつ取り出
し、その文字と次に続く文字の合計2文字で文字セット
を作成し、作成順に1、2、3・・・と昇順に番号を付
与して文字セット位置番号とする。キーワードの最後の
文字にはキーワードの最後を示す特殊記号EM(エンド
マーク)を付加し、このEM記号と連結させて文字セッ
トとし、文字セット位置番号を付与する。なおEM記号
にはJISコード表の未使用コードを割り当てる。ここ
では数字9の直後にあるJISコードA3BAを割り当
てる。
【0037】次にキーワード列を説明する。レコードの
有するキーワードに対する部分一致検索を検索入力文字
セット列との文字セット列照合により実現するために、
レコードの有するすべてのキーワードを連結して文字列
を構成し、これをキーワード列とする。すなわち、各キ
ーワードをキーワード属性番号に対応する固定長のキー
ワード属性領域に配列しキーワード列を作成する。これ
によりキーワード列における文字位置から、その文字セ
ットが属するキーワードの属性がわかる。なお、各キー
ワード属性領域に続いてキーワード属性領域の区切りを
示すEND記号がキーワード列に配列される。このEN
D記号はJISコード表の未使用コードを割り当てる。
ここではEM記号の直後にあるJISコードA3BBを
割り当てる。
【0038】そしてこのキーワード列を対象として、レ
コード番号とキーワード属性番号と文字セット位置番号
からキーワードを構成するすべての文字セットを整数か
らなるコードに変換して文字セット位置情報を作成す
る。この文字セット位置情報は、次の式(1)で与えら
れる整数のコードである。 文字セット位置情報コード=レコード番号×n+(Pa
−1)+p…(1) n:キーワード列文字数 Pa :キーワード属性番号aのキーワード属性領域のキ
ーワード列における先頭文字位置 p:文字セット位置番号
【0039】例えば、キーワード列のキーワード属性領
域サイズが、図書名=64バイト32文字、著者名=32バイ
ト16文字、発行者=64バイト32文字、刊行年=8バイト
4文字、抄録=400 バイト200 文字の図書検索システム
において、レコード番号が100 のレコードが、「図書名
=通信文書の構造」、「著者名=田中一郎」、「発行者
=太平洋出版」、「刊行年=1990」、「抄録=初めての
人にも〜ている」の場合、キーワード列は図5に示すよ
うになる。このときキーワード列は578 バイト(289 文
字)であるから各文字セットの文字セット位置情報は図
6に示すように構成される。
【0040】そして、このように文字セット位置情報を
それぞれ4バイトのコードで構成すれば、289 文字数の
キーワード列を232÷289 ≒1486万個取り扱うことが可
能である。
【0041】 文字位置情報の検索ファイルへの登録 次にこの各文字セットごとに付与された文字セット位置
情報を検索ファイルに登録する。上述のように文字セッ
ト種グループは、JISコード表に記載された順に検索
ファイルに格納される。そして各文字セットの文字セッ
ト位置情報を各文字セット種グループに登録する。この
文字セット位置情報の登録は、文字セット種グループの
未格納領域の先頭にそれぞれ文字セット位置情報を格納
することによって行われる。このため、登録順にレコー
ド番号を付与すれば文字セット種グループ内には文字セ
ット位置情報が数値順の昇順に登録されることになる。
【0042】上述の図書名「通信文書の構造」の文字セ
ット位置情報を検索ファイルに登録した例を図7に示
す。このとき、各グループ内の文字セット位置情報は昇
順に格納される。このファイル容量は、文字セット位置
情報が4バイトであると、
【数1】になる。
【0043】なお、文字セット位置情報の追加登録は、
追加レコードが有する各キーワードの各文字セットに該
当するグループの未格納領域の先頭に新規コードを追加
することで行う。また、削除は削除レコードが有する各
キーワードの各文字セットに該当するグループ内の該当
文字セット位置情報を特殊記号に変更することによって
行う。これにより追加登録と削除を短時間に行うことが
できる。
【0044】なお上述のようにこの検索ファイルの各文
字セット種グループごとに格納された文字セット位置情
報は、図4の文字セットグループアドレス表の各文字セ
ットグループ先頭番地をディレクトリとして取り出すこ
とができる。
【0045】以上の検索ファイルの作成処理の流れを図
8および図9に示す。
【0046】すなわち、文字セット種の出現度数を計数
して文字セット欄アドレス表を作成し(S11、12)、検
索ファイルの領域を確保する(S13)。次にレコード登
録順位カウンタをk=1に初期設定して、レコード番号
を「1」に、キーワード列文字数をn=289 に、キーワ
ード属性領域の先頭文字位置を図書名用としてP1
1、著者名用としてP2 =34、発行者名用としてP3
51、刊行年用としてP4=84、抄録用としてP5 =89を
設定する(S14)。そして最初のレコードを取り出す
(S15)。ここまでが登録の前処理である。ここからレ
コードごとの登録処理となり、まず、キーワード属性番
号をa=1にセットし(S16)、レコードの中からキー
ワード属性番号aのキーワードを取り出す(S17)。さ
らに、キーワードの構成文字数をmに、文字セット位置
番号をp=1に、キーワード属性番号aに該当するキー
ワード属性領域の先頭文字位置をPa に設定する(S1
8)。次に、取り出したキーワードの先頭文字から順
に、文字セット位置番号pに相当する文字セット位置情
報を D=k×n+(Pa −1)+p …(2) の式(2)を用いて作成する(S19)。
【0047】そして、文字セット位置番号pにある文字
セットの文字セット種グループが格納されている検索フ
ァイルの文字セット欄を示す文字セット欄ディレクトリ
(文字セット欄先頭番地)を文字セット欄アドレス表か
ら取り出して(S20)、文字セット欄ディレクトリが示
す検索ファイルの文字セット欄の未格納行の先頭に文字
セット位置情報を格納する(S21)。そして、p=p+
1、m=m−1とし、キーワード内のすべての文字セッ
トを処理したところで、a=a+1でキーワード属性番
号を+1して次のキーワード処理に移る(S24、S2
5)。また、レコードが有するすべてのキーワードを処
理すると、k=k+1でレコード登録順位カウンタを+
1して次のレコードの処理に移る(S26、S27、S2
8)。全レコードの処理が終了すると登録処理が終わる
(S26)。
【0048】次にこのようにして作成された検索ファイ
ルを用いる検索処理について説明する。
【0049】本実施例では、検索ファイルから取り出し
た文字セット位置情報を対象として、検索入力文字列と
同じ文字列を含むキーワードを文字列照合し、かつ検索
入力と同じ属性であることを確認後、すべての検索入力
文字列に共通するレコードを検索する例で説明する。
【0050】まず、その検索処理は大まかに分けると以
下の構成からなっている。 検索入力文字列をその先頭文字から2文字単位の文字
セットに分解し、検索入力文字セット列を作成する。 検索入力文字セット列の各文字セットに該当する文字
セットグループアドレス表内の文字セットグループ先頭
番地を算出する。 検索入力文字セット列を出現頻度の少ない文字セット
から順に並べ変える。 並べ変えた文字セット列の先頭から順に該当する文字
セット種グループを検索ファイルから取り出してそこに
格納されている文字セット位置情報から検索入力文字セ
ット列を構成できる文字セット位置情報の組み合わせを
取り出す。 抽出した文字セット位置情報から検索入力と同じ属性
を有する文字セット位置情報を取り出し照合一致とす
る。 〜を検索入力数分繰り返した後、すべての検索入
力文字列に共通するレコード番号を検索結果として出力
する。
【0051】次に具体的にそれぞれの処理を説明する。
【0052】 検索入力文字セット列の作成 検索ファイルに格納されている文字セットと照合可能な
ように、検索入力文字列を先頭文字から2文字単位の文
字セットに分解し、検索入力文字セット列とする。な
お、検索入力文字列を先頭文字から2文字単位の文字セ
ットに分解したとき、最後に1文字が残り2文字単位の
文字セットを作成できないことがある。このときには、
最後の1文字の直前の文字セットから不足分の1文字を
取り出し、最後の1文字の前部に連結した2文字単位の
文字セットを作成する。
【0053】 各検索入力文字セットに該当する文字
セットグループアドレス表内の文字セットグループ先頭
番地の算出 検索ファイルの作成時と同様に、各検索入力文字セット
の図3における文字セット記載順位を算出し、これを文
字セットグループアドレス表における各検索入力文字セ
ットのアドレスポインタとする。
【0054】 出現頻度順の並べ変え そして、検索ファイルの各文字セット種グループの先頭
番地を示す文字セットグループアドレス表の文字セット
グループ先頭番地を参照して、各検索入力文字セットの
出現頻度を調べ、検索入力文字セット列を全キーワード
における出現頻度の低いものから順に並べ変える。上述
のように、文字セットグループアドレス表内の先頭番地
は、検索ファイルに格納されている各文字セット種グル
ープの先頭番地を示しており、次に続く文字セットグル
ープ先頭番地との差をとれば、各文字セット種グループ
に格納されている文字セット位置情報の数から、全キー
ワードにおける文字セット種別出現頻度がわかる。
【0055】これは出現頻度の低い文字セットから照合
一致を行うことにより、検索ファイルに格納された各文
字セットの文字セット位置情報間の照合回数をきわめて
低減できるためである。すなわち文字セット位置情報を
照合して各文字セットの連続性を調べる場合に二つの文
字セット種グループ内の文字セット位置情報中のレコー
ド番号と文字セット位置番号とキーワード属性番号とを
照合するため、その二つの文字セット種グループ内に格
納されている文字セット位置情報の数が少なければそれ
だけ照合回数を少なくすることができる。したがって、
文字セット位置情報の照合を行うときに、出現頻度の低
い文字セットから照合を行うことが照合回数を低減させ
る。特に検索入力文字が多くなるほど出現頻度の低い文
字セットが含まれる割合が高まるため低減効果は大き
い。
【0056】 文字列の照合 出現頻度の低い文字セットから文字セットグループアド
レス表を参照してそれぞれの文字セット種グループに格
納されている文字セット位置情報を取り出す。そして取
り出した文字セット位置情報をもとに、出現頻度の低い
文字セット種グループから順に、各文字セット種グルー
プ間でレコード番号が等しくかつ文字セット位置番号の
差が検索入力文字列の該当する文字セットの先頭文字位
置差に等しい文字セット位置情報の組み合わせを抽出す
る。
【0057】この文字セット位置情報の照合は、検索入
力文字セット列の全キーワードにおける出現頻度の低い
文字セットの文字セット位置番号をi、出現頻度の高い
文字セットの文字セット位置番号をjとするとき、次の
式(3)で (文字セット位置番号iの文字セットの文字セット位置
情報)−(文字セット位置番号jの文字セットの文字セ
ット位置情報)=i−j … (3) となる文字セット位置情報の組み合わせを抽出すればよ
い。
【0058】この文字セット種グループ間での文字セッ
ト位置情報の照合処理では、出現頻度の低い文字セット
種グループの文字セット位置情報とそれより出現頻度の
高い文字セット種グループの文字セット位置情報との差
を取って文字の連続を照合する。
【0059】検索入力文字列における任意の文字セット
をABとCDとすると、該当する文字セット位置情報を
抽出するには、ABとCDとの文字セット位置番号差が
Lであるとし、グループABの文字セット位置情報をA
x 、グループCDの文字セット位置情報をCy としたと
き Ax +L>Cy ならCy を削除 Ax +L<Cy ならCx を削除 Ax +L=Cy ならAx 、Cy を合致として共に削除 というように不連続な文字セット位置情報を照合対象か
ら削除していくことによりその照合回数を削減させる。
【0060】例えばグループABの文字セット位置情報
が 571 、1140、10230 、11365 、11928 、13069 グループCDの文字セット位置情報が 569 、1706、10231 、10235 、11362 文字セット位置番号差L=2であった場合、この二つの
グループ間の照合回数は全体で7回だけですみ、グルー
プ内の全ての文字セット位置情報を照合する必要はな
い。
【0061】 キーワード属性番号の照合 文字列照合から得られた文字セット位置情報の文字セッ
ト位置番号についてキーワード属性を照合する。すなわ
ち、文字セット位置番号が1〜32ならば文字セット位置
情報のキーワード属性は図書名であり、文字セット位置
番号が34〜49ならば文字セット位置情報のキーワード属
性は著者名であり、文字セット位置番号が51〜82ならば
文字セット位置情報のキーワード属性は発行者名であ
り、文字セット位置番号が84〜87ならば文字セット位置
情報のキーワード属性は刊行年であり、文字セット位置
番号が89〜288 ならば文字セット位置情報のキーワード
属性は抄録であることがわかる。そこで、文字セット列
照合で得られた文字セット位置情報の中から検索入力時
に指定された属性と同じ文字セット位置情報だけを取り
出す。
【0062】 レコード番号の抽出 検索入力の数だけ〜を繰り返し、得られた各検索入
力文字列に該当する文字セット位置情報間で、すべての
検索入力文字列に共通するレコード番号を取り出す。な
お、この実施例では検索入力が1個以上の場合について
説明した。また、検索入力が複数の場合には、各検索入
力間で論理積演算を行う例として説明したが、論理積演
算以外の論理演算を伴う複数の検索入力の場合は、照合
結果として残ったレコード番号を各検索入力に対応付け
て指定された論理演算を行って検索入力の論理を満足す
るレコード番号を検索結果として出力する。
【0063】なお、1検索入力を複数の文字列で指定す
る場合、例えば抄録のような文字数が多い項目を対象と
する場合よくあることであるが、最初の文字列のキーワ
ード属性照合終了後、2番目以降の文字列に対しては、
その文字列の最初の照合文字セットの文字セット種グル
ープから、それまで得られたレコード番号とキーワード
属性番号を有する文字セット位置情報を取り出し、得ら
れた文字セット位置情報を文字セット列照合の先頭文字
の文字セット種グループとして同じ文字列内の他の文字
セットについて照合処理を行う。
【0064】以上の〜の動作を具体例を挙げて説明
する。
【0065】検索対象として図書名が指定され、検索入
力文字列としては「通信文書の」が指定されたとする。
この場合図書名のキーワードの属性の属性番号は「1」
とする。
【0066】検索入力が「通信文書の」であるから、検
索入力文字セットは「通信」と「文書」と「書の」にな
る。全キーワードにおける出現頻度が「通信」<「文
書」<「書の」の順であり、照合をこの順序に行うとす
ると、まず検索ファイル中の「通信」の文字セットグル
ープ欄から取り出した文字セット位置情報と「文書」の
文字セットグループ欄から取り出した文字セット位置情
報との間で、検索入力「通信文書の」における「通」と
「文」との文字位置が各々「1」と「3」であるから、
文字セット位置差が「−2」になる文字セット位置情報
を抽出すると、図7の検索ファイルの「通信」内の文字
セット位置情報の「28901 」と「文書」内の「28903 」
とを連続性ある文字セット位置情報の組み合わせとして
抽出することができる。次に「通信」の中で照合結果と
して残った文字セット位置情報と、検索ファイル中の
「書の」の文字セットグループ欄から取り出した文字セ
ット位置情報との間で、文字セット位置差が「−3」に
なる文字セット位置情報を抽出すると、図7の検索ファ
イルの「通信」内の文字セット位置情報の「28901 」と
「書の」内の文字セット位置情報の「28904 」とを連続
性ある文字セット位置情報の組み合わせとして抽出する
ことができる。さらに、キーワード属性は「図書名」で
あるから、これまでの文字セット列照合で残った文字セ
ット位置情報の中から、文字セット位置番号が1〜32の
文字位置情報として、「28901 」と「28903 」と「2890
4 」とを抽出できる。
【0067】キーワード列の文字数が「289 」であるか
ら、文字セット位置番号は、28901÷289 =100 余り1
から、1であることがわかる。またこの文字列が属する
レコード番号は100 であることもわかる。
【0068】この検索処理動作を図10および図11に
フローチャートとして示す。
【0069】すなわち、キーワード列文字数をn=289
に、キーワード属性領域の文字位置範囲Pa を図書名は
1 =1 〜32、著者名はP2 =34〜49、発行者名はP3
=51〜82、刊行年はP4 =84〜87、抄録はP5 =89〜28
8 に、キーワード属性番号をa=1に設定し(S31)、
キーワード属性番号aの検索入力文字列がある場合には
それを取り出す(S32、S33)。ここからは検索入力文
字列の照合処理になる。そこで、検索入力を取り出し、
検索入力文字列の先頭から2文字単位の文字セットに分
割して検索入力文字セット列を作成し、その文字セット
数−1を照合回数qとし(S34、S35)、検索入力文字
セット列を全キーワードにおける出現頻度の低いものか
ら順に並べ変える(S36)。そして検索ファイルから、
並べ変えた各文字セットに該当する文字セット種グルー
プに格納されている文字セット位置情報を取り出す(S
37)。次に検索入力文字セット列の全キーワードにおけ
る出現頻度の低い文字セットの文字セット位置番号を
i、出現頻度の低い文字セットの文字セット位置番号を
jとするとき、二つの文字セット種グループ間で、(文
字セット位置番号iの文字セットの文字セット位置情
報)−(文字セット位置番号jの文字セットの文字セッ
ト位置情報)=i−jである文字セット位置情報の組み
合わせを取り出す(S38)。同様の処理を検索入力文字
セット列の残りの文字セットについても行い(S39、S
40)、残った文字セット位置情報の中から文字セット位
置番号がキーワード属性番号aの文字位置範囲Pa 内に
あるレコード番号だけを取り出す。文字セット位置情報
から文字セット位置番号を取り出すには、次の式(4)
を用いる。 (文字セット位置情報)÷(キーワード列文字数)=レ
コード番号余り文字セット位置番号…(4) ここまでの処理で、検索入力文字列を文字列として持
ち、さらに検索入力された属性と同じキーワードを有す
るレコード番号がわかる(S41)。抄録まで同様の処理
を行い、検索入力された属性と同じキーワードを有する
レコード番号を取り出す(S42、S43)。すべての検索
入力文字列の照合が終わると、残ったレコード番号を対
象として、すべての検索入力文字列に共通するレコード
番号を検索結果として出力する(S44)。
【0070】上記実施例では日本語文書の検索処理の例
を説明したが、他の例として例えば英文字のように字種
の少ない言語の文書では、JISコード表の中から、仮
名文字と漢字を除いた字種だけで検索ファイルと文字セ
ット群一覧と文字セットグループアドレス表を作成する
と、日本語文書に比べ文字セットの少ない検索ファイル
が構成でき、日本語文書に比較してコンパクトなマルチ
キーワード検索用検索ファイルが構成でき、またその検
索も容易にできる。この場合、英文字(記号を含む)に
ついてはJISコードに変えて、例えばISOコード、
ASCIIコードを用いた文字セットグループアドレス
表を作成し、文字セットは最低3文字で構成されたもの
とすることがよい。
【0071】なお、マルチキーワード検索の高速性が求
められる場合、文字セットの構成文字数を増加するとま
すます文字セットの出現頻度が低くなり、各文字セット
種グループに格納される文字セット位置情報が少なくな
るため、容易に高速化を実現できる。
【0072】また、日本語文書の場合に、連続する片仮
名文字または平仮名文字のみを文字セットとし、漢字に
ついては1文字単位とする検索ファイルを作成してもよ
い。漢字はその字種が多く、その出現頻度も低いため、
1文字単位の文字種グループとしても検索の高速化を図
ることができる。
【0073】
【発明の効果】以上説明したように、本発明は検索対象
となるレコードが有するキーワードの構成文字の文字セ
ット種ごとにその文字セットが属するレコード識別符
号、文字セット位置順序符号、キーワードの種別を示す
キーワード属性番号からなる文字セット位置情報を格納
した検索ファイルを作成し、この検索ファイルを検索入
力の文字列を構成する文字セット種ごとにその文字セッ
ト位置情報を取り出して、検索入力を含む文字列を検索
するようにした。
【0074】このため、 (1) 検索処理のための文字列照合回数を低減することが
できるため、高速検索を行うことができる、 (2) 文字セットと文字位置に着目して検索処理を行うた
め任意の文字列による検索ができ、 (3) 専用のハードウエアを用いることなくソフトウエア
だけで高速検索を実現できるため、汎用の情報処理装置
でマルチキーワードを用いた部分一致検索を効率よく行
うことができ汎用性に富む、 (4) データベースシステムに利用したとき、その検索フ
ァイルの作成に使用可能な部分一致検索文字列の作成を
行う必要がなく、検索対象となるレコードが有するキー
ワードから自動的に検索ファイルを作成することができ
るため、データベースシステムを経済的にかつ効率よく
構築することが可能である、 (5) 欧文字のように字種の少ない文字からなる文字列
も、同じ文字列の出現頻度は低いため各文字セットの出
現頻度は低くなり、その文字列を構成する文字セット種
グループで文字セット位置情報を格納した検索ファイル
を作成して検索することにより、高速検索を可能にする
優れた効果がある。
【図面の簡単な説明】
【図1】本発明一実施例に使用する情報検索処理装置の
構成例。
【図2】実施例の検索ファイル例表。
【図3】実施例の文字セット群一覧。
【図4】実施例の文字セットグループアドレス表。
【図5】実施例のキーワード例。
【図6】実施例の文字セット位置情報作成例。
【図7】実施例の検索ファイル例。
【図8】実施例の検索ファイル作成処理手順を説明する
フローチャート。
【図9】実施例の検索ファイル作成処理手順を説明する
フローチャート。
【図10】実施例の検索処理手順を説明するフローチャ
ート。
【図11】実施例の検索処理手順を説明するフローチャ
ート。
【符号の説明】
1…CPU 2…メモリ 3…入出力部 4…キーボード 5…ディスプレイ 6…外部記憶装置制御部 7…外部記憶装置 8…共通バス

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数のキーワードから構成されたレコー
    ドを検索単位とし、各キーワードはそのキーワードの論
    理区分にしたがって属性が定められ、このレコードを検
    索対象として所定の入力文字列に合致するキーワードの
    レコードを検索するマルチキーワード情報検索処理方式
    の検索ファイル作成装置において、 検索対象となるレコードが現れるごとに昇順の符号を付
    与するレコード識別符号付与手段と、 このレコードが有する各キーワードにキーワードの論理
    的な区分を示す属性符号を付与するキーワード属性符号
    付与手段と、上記レコードの有する全てのキーワードをキーワード属
    性ごとによって定められた文字位置を先頭位置とする固
    定長のキーワード属性に配列して連結されたキーワード
    列を生成するキーワード列生成手段と、 上記生成されたキーワード列の各 キーワードを各文字ご
    とに分解してその文字と次に続く合計r文字(但しrは
    2以上の自然数)からなる文字セットを作成し、この文
    字セットにキーワード中での文字セットの先頭文字位置
    を示す文字セット位置順序符号を付与する文字セット位
    置順序符号付与手段と、 上記レコード識別符号とキーワード属性符号と文字セッ
    ト位置順序符号とからなり文字セット位置順序符号を最
    下位情報とする文字セット位置情報を作成して、この文
    字セット位置情報を文字セット種ごとの領域に格納して
    検索ファイルを作成する手段とを備えた検索ファイル作
    成装置
  2. 【請求項2】 文字セット位置情報は、レコードを構成
    する各キーワードをキーワード属性符号に対応してキー
    ワード属性領域に配列したキーワード列の各キーワード
    を構成するすべての文字セットについて、 レコード識別符号×n+(Pa −1)+文字セット位置
    順序符号 n:キーワード列文字数 Pa :キーワード属性符号aのキーワード属性領域のキ
    ーワード列における先頭文字位置なる数字コードとして
    与えられる請求項1記載の検索ファイル作成装置
  3. 【請求項3】 複数のキーワードが連結されたキーワー
    ド列から構成されたレコードを検索単位とし、各キーワ
    ードはそのキーワードの論理区分にしたがって属性が定
    められ、このレコードを検索対象として所定の入力文字
    列に合致するキーワードのレコードを検索するマルチキ
    ーワード情報検索処理方式において、 検索対象となるレコードの複数のキーワードがその論理
    区分に従って固定の文字位置を先頭位置とするキーワー
    ド属性領域に配列されたキーワード列について、各キー
    ワードを構成する文字ごとに、レコードごとに昇順に付
    与されたレコード識別符号と、このレコードが有するキ
    ーワードの論理区分を示すキーワード属性符号とキーワ
    ード中でのその文字セットの先頭文字位置を示す文字セ
    ット位置順序符号とからなり文字セット位置順序符号を
    最下位情報とする文字セット位置情報を文字セット種別
    ごとに格納した検索ファイルを備え、 検索入力文字列の構成文字を先頭文字からr文字単位の
    文字セットに分解した検索入力文字セット列を構成し、
    分解した文字セットと同じ文字セットの文字セット位置
    情報を上記検索ファイルから取り出す手段と、 この取り出した各文字セットの文字セット位置情報間
    で、レコード識別符号とキーワード属性符号が共通で文
    字セット位置順序符号が検索入力文字列の該当する文字
    セットの先頭文字位置差に等しく、かつそのキーワード
    属性符号が検索入力と等しい文字セット位置情報の組み
    合わせを抽出する手段と、 この抽出された文字セット位置情報の組み合わせに基づ
    いて検索入力に対応するレコード識別符号を検索結果と
    して出力する手段とを備えたマルチキーワード情報検索
    処理方式。
  4. 【請求項4】 検索入力文字セット列と同じ文字セット
    列を構成できる文字セット位置情報の組み合わせの抽出
    は、検索入力文字セット列の全キーワードにおける出現
    頻度の低い文字セットから順に行う請求項3記載のマル
    チキーワード情報検索処理方式。
  5. 【請求項5】 検索入力文字セット列と同じ文字セット
    列を構成できる文字セット位置情報の組み合わせ抽出
    は、検索入力文字セット列の全キーワードにおける出現
    頻度の低い文字セットの文字セット位置順序符号をi、
    出現頻度の高い文字セットの文字セット位置順序符号を
    jとするとき、 (文字セット位置順序符号iの文字セットの文字セット
    位置情報)−(文字セット位置順序符号jの文字セット
    の文字セット位置情報)=i−j に合致する文字位置情報の組み合わせを抽出する請求項
    3または請求項4記載のマルチキーワード情報検索処理
    方式。
  6. 【請求項6】 キーワードが記号を含む欧文字列の場合
    は、少なくとも3文字記号単位の文字セットで記号を含
    む欧文字の文字セット種のみの検索ファイルを用いる請
    求項1ないし請求項5のいずれか記載のマルチキーワー
    情報検索処理方式。
  7. 【請求項7】 キーワードが漢字を含む場合は、仮名文
    字について少なくとも2文字単位の文字セット種で構成
    された検索ファイルを用いる請求項1ないし請求項5の
    いずれか記載のマルチキーワード情報検索処理方式。
JP3013879A 1991-01-10 1991-01-10 マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 Expired - Fee Related JP2519130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3013879A JP2519130B2 (ja) 1991-01-10 1991-01-10 マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3013879A JP2519130B2 (ja) 1991-01-10 1991-01-10 マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置

Publications (2)

Publication Number Publication Date
JPH04340165A JPH04340165A (ja) 1992-11-26
JP2519130B2 true JP2519130B2 (ja) 1996-07-31

Family

ID=11845499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3013879A Expired - Fee Related JP2519130B2 (ja) 1991-01-10 1991-01-10 マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置

Country Status (1)

Country Link
JP (1) JP2519130B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916616A (ja) * 1995-06-30 1997-01-17 Toyo Joho Syst:Kk 索引データ生成検索装置
JP3275816B2 (ja) 1998-01-14 2002-04-22 日本電気株式会社 記号列検索方法及び記号列検索装置並びに記号列検索プログラムを記録した記録媒体
JP6038427B1 (ja) 2016-01-15 2016-12-07 三菱電機株式会社 暗号化装置、暗号化方法、暗号化プログラム及び保管装置
EP3605360A4 (en) 2017-04-25 2020-02-12 Mitsubishi Electric Corporation SEARCH DEVICE, SEARCH SYSTEM, SEARCH METHOD, AND SEARCH PROGRAM
CN109087368B (zh) * 2018-06-14 2023-04-07 创新先进技术有限公司 一种字符串图形化方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会研究報告DE90−24(1990−12−14)P.1−7

Also Published As

Publication number Publication date
JPH04340165A (ja) 1992-11-26

Similar Documents

Publication Publication Date Title
JP3160201B2 (ja) 情報検索方法、情報検索装置
Robertson et al. Applications of n‐grams in textual information systems
CN102142038B (zh) 用于记号空间资料库的多级查询处理系统与方法
JP2832988B2 (ja) データ検索システム
US20080319987A1 (en) System, method and program for creating index for database
JPH08249354A (ja) 単語索引および単語索引作成装置および文書検索装置
JP2833580B2 (ja) 全文インデックス作成装置および全文データベース検索装置
JP2000163442A (ja) 記号辞書作成方法及び記号辞書検索方法
JP2669601B2 (ja) 情報検索方法及びシステム
JPH0484271A (ja) 文書内情報検索装置
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JP2519130B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JPH05225238A (ja) データベース検索システム
JP2519129B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JP3151730B2 (ja) データベース検索システム
Robertson et al. A comparison of spelling-correction methods for the identification of word forms in historical text databases
JP3081093B2 (ja) 索引作成方法およびその装置と文書検索装置
WO1992009960A1 (en) Data retrieving device
JPH07109603B2 (ja) 情報検索処理方式および検索ファイル作成装置
JPH10177582A (ja) 最長一致検索方法及び装置
JPH0748218B2 (ja) 情報処理装置
JPH09114856A (ja) 検索用索引生成装置
KR20070033657A (ko) 전자사전 검색방법과 장치
JPH07325837A (ja) 抽象単語による通信文検索装置及び抽象単語による通信文検索方法
JP2993539B2 (ja) データベース検索システムおよびその方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080517

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090517

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100517

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees