JPH0822475A - 文字列情報検索装置 - Google Patents

文字列情報検索装置

Info

Publication number
JPH0822475A
JPH0822475A JP6158765A JP15876594A JPH0822475A JP H0822475 A JPH0822475 A JP H0822475A JP 6158765 A JP6158765 A JP 6158765A JP 15876594 A JP15876594 A JP 15876594A JP H0822475 A JPH0822475 A JP H0822475A
Authority
JP
Japan
Prior art keywords
character string
search
index
registration
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6158765A
Other languages
English (en)
Inventor
Yasuhiro Takayama
泰博 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP6158765A priority Critical patent/JPH0822475A/ja
Publication of JPH0822475A publication Critical patent/JPH0822475A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文字列全体を登録するだけで、木構造ベース
索引による検索機能に加え文字ベース索引を併用し効率
的に部分文字列を検索する。 【構成】 登録対象の文字列情報11を入力する文字列
登録処理手段1で文字列全体を登録するとともに生成す
る木構造と文字ベース索引の登録内容12を登録内容保
持手段2で格納し保持する。前方一致か否かの部分文字
列検索要求15に従い部分文字列検索処理手段3で、登
録内容保持手段2から木構造索引16と文字索引17と
のいずれかを参照し当該部分文字列を検索し、当該検索
結果18を出力する。 【効果】 従来方式に比べ、特別な登録処理手順や中間
的な特殊の作業ファイルを必要としない。また登録すべ
き文字列情報の採用基準が明確であり、かつ動的な追加
登録も可能である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は検索すべき全体の文字
列情報(辞書見出しや文書抽出キーワードなど)を登録
しておくだけで部分文字列検索を可能にする文字列情報
検索装置に関する。
【0002】
【従来の技術】たとえば特開平2−122374号公報
に示す従来例の文字列情報検索装置は図15のように、
予め部分文字列検索を指定する対象検索キー値100に
対し、登録済検索キー値200を探索し、未登録検査キ
ー値300を検索キー登録簿20に追加する検査キー値
登録手段10と、初期登録時の検索対象レコード索引定
義項目(抽出対象項目)のデータ値400から作成する
部分キー値500を一旦部分キー保存ファイル40に格
納し、さらに当該格納部分キー値500と検索キー登録
簿20からの参照検索キー値600との一致をする抽出
検索キー値700を一旦検索キー保存ファイル50に格
納する検索キー抽出手段30と、検索キー保存ファイル
50からレコードアドレス付き検索キー値800で木構
造ベースの部分キー索引情報900を作成し索引ファイ
ル70に格納する索引作成手段60とを備える。
【0003】上記従来例の文字列情報検索装置は、従来
の一般的な部分キーの検索効率や索引領域の使用効率上
の問題点を解決するため、対象を予め指定する部分キー
に限る木構造ベース索引を採用し部分キー検索をする方
式(木構造ベース索引検索方式)を採る。
【0004】
【発明が解決しようとする課題】上記のような従来の文
字列情報検索装置では、索引対象を予め指定する部分キ
ー値に限る方式を採るから、検索要求に応じられない場
合が発生し部分キーを漏れなく検索できない。また通常
の登録処理手順のほかに複数の特別な処理手順や余分な
作業ファイルを必要とする。登録対象の文字列数が増え
ると登録時間がかかる。部分キーのうちどこまでキーワ
ードとして登録すべきかの採用基準を設定し難いなどの
問題点があった。
【0005】この発明が解決しようとする課題は、文字
列情報検索装置で通常の処理手順の自然な拡張で文字列
全体を登録するだけで、木構造ベース索引による検索機
能に加え、文字ベース索引を併用し部分文字列を検索す
る方式(木構造/文字ベース索引併用検索方式)を提供
することにある。
【0006】
【課題を解決するための手段】この発明の文字列情報検
索装置は、上記課題を解決するためつぎの手段を設け、
木構造/文字ベース索引併用検索方式を採ることを特徴
とする。
【0007】文字列登録処理手段は、入力する文字列情
報を登録し、木構造と文字ベース索引を生成する。また
は登録対象文字列のうちの単一文字ベースだけでなく連
続文字ベースの索引を採用する。または登録対象文字列
のうちの文字の組に対し変換関数を適用し写像する変換
値ベースの索引を採用する。または文字登録時に作成す
る木構造ベース索引のうち探索ノード部を取り除いたデ
ータ構造に対し生成する文字ベース索引を採用する。ま
たは登録内容/検索結果保持・編集手段からの登録要求
に従い、限定する特定検索キーと対応する葉ノードアド
レスを登録し、当該情報索引を生成する。
【0008】登録内容保持手段は、文字列登録処理手段
から木構造ベースと文字ベース索引または限定する特定
検索キーと対応する葉ノードアドレスからなる情報索引
の登録内容を格納し保持する。
【0009】部分文字列検索処理手段は、前方一致か否
かの部分文字列検索要求に従い、登録内容保持手段から
木構造と文字ベース索引のいずれか、または限定する特
定検索キーと対応する葉ノードアドレスからなる情報索
引を参照し、当該部分文字列を検索し出力する。
【0010】登録内容/検索結果保持・編集手段は、文
字列登録処理手段から登録内容と部分文字列検索処理手
段から検索結果とを格納・保持し、部分文字列検索処理
手段に対し当該キーの部分文字列を指定し再検索要求を
する。または文字列登録処理手段に対し限定する特定検
索キーと対応する葉ノードアドレスからなる索引情報の
登録要求をする。
【0011】
【作用】この発明の文字列情報検索装置は上記手段で、
まず通常の処理手順の自然な拡張で文字列全体を登録す
る。つぎに生成する木構造と文字ベースの索引を併用し
部分文字列を検索する。さらに機能を付加し、検索結果
の情報を利用し再検索をし、特定検索キーによる高速検
索をする。
【0012】
【実施例】この発明を示す一実施例の文字列情報検索装
置は図1のように、文字列登録処理手段1は、入力する
登録対象文字列情報11に対し、データ登録が最初のと
きは、当該アイテム(キー文字列と値の対)を登録し、
木構造ベースの索引を生成するとともに、線形リスト形
式の1文字索引を生成する。最初でないときは、登録内
容保持手段2から登録済アイテム13を探索し未登録ア
イテム14を木構造索引に挿入するとともに、1文字索
引を更新する。登録内容保持手段2は、文字列登録手段
1から木構造と1文字索引の登録内容12を格納・保持
する。部分文字列検索処理手段3は、部分文字列の検索
要求15が前方一致か否かで登録内容保持手段2から木
構造索引16と1文字索引17とのいずれかを参照し当
該部分文字列を検索し、当該検索結果18を出力する。
【0013】上記実施例の文字列情報検索装置は、通常
の処理手順の自然な拡張で文字列全体を登録するだけ
で、木構造ベース索引による検索機能に加え、文字ベー
ス索引を併用し部分文字列を検索する方式(木構造/文
字ベース索引併用検索方式)を採る。
【0014】文字列登録処理手段1は図2のように、ま
ず主記憶上にページ(ノードに対応する作業領域単位)
のバッファ領域は確保する(図2の手順S1)。つぎに
入力する登録対象文字列情報11に対し、データ登録が
最初のときは、当該ページバッファに最初のアイテム
(キー文字列と値の対)を木構造索引ベースで設定す
る。登録内容保持手段2(たとえば2次記憶)上の検索
ページアドレス(ADDR)に最初のページ領域を確保
し、当該ページ領域に当該ページバッファの内容12
(木構造索引)を書き込み、先頭と最後の葉ノードポイ
ンタを初期化する(以上図2の手順S2〜S6)。デー
タ登録が最初でないときは、図3の探索サブルーチンS
earch(ADDR、キー、値)を呼び出し、当該キ
ー文字列で木構造索引の登録済アイテム13を探索して
挿入すべき位置(木の性質を満たす位置)に当該未登録
アイテム14を挿入する(図2の手順S7)。さらにオ
ーバーフローするときは、当該ページバッファの先頭に
オーバーフロー・アイテムを設定し、2次記憶上のAD
DRに確保する領域に当該ページバッファの内容12を
書き込み、1文字索引を更新する。オーバーフローしな
いときは、1文字索引を更新する(以上図2の手順S8
〜S12)。探索サブルーチンSearch(ADD
R、キー、値)は図3のように、まず主記憶上に動的に
作業ページバッファ領域を確保し、当該ページバッファ
に2次記憶上のADDRノードを読み込む(以上図3の
手順S101〜S103)。つぎに登録対象のキー文字
列が当該ページバッファ内にあるか調べ、ページ内キー
位置をページ内のアイテム挿入予定位置(Item N
o)に保存しておく。当該ページバッファ内の属性が葉
ノードのとき、図4の挿入サブルーチンInsert
(NDDR、Item No、アイテム)を呼び出し、
当該ページに当該アイテムを挿入する(以上図3の手順
S104〜S106)。当該ページバッファ内の属性が
探索ノードのとき、登録対象のキー文字列が当該ページ
内の文字列より前の値をもつ(変数Item Noの値
が0)ならば、次の検索ページアドレス(ADDR0)
に下位ノードポインタ(p0)を設定する。当該ページ
内の文字列より前の値をもたないならば、ADDR0に
Item No番目のアイテムポインタ(p(Item
No))を設定する。図3の探索サブルーチンSea
rch(ADDR0、キー、値)を再帰的に呼び出し、
当該下位ノードを探索し当該アイテムを挿入する。当該
下位ノードのオーバーフロー時、図4の挿入サブルーチ
ンInseart(ADDR、Item No、オーバ
ーフロー・アイテム)を呼び出し、当該ページに当該オ
ーバーフロー・アイテムを挿入する(以上図3の手順S
105、S109〜S114)。さらに主記憶上の動的
な作業ページバッファ領域を解放し、手順S8(オーバ
ーフローしたか)に復帰する(以上図3の手順S10
7、S108、S115、S116)。挿入サブルーチ
ンInseart(ADDR、Item No、アイテ
ム)は図4のように、まず主記憶上に「左ページ」、
「右ページ」、「右ページの次のページ」の各作業ペー
ジバッファ領域を確保し、当該左ページバッファに2次
記憶上のADDRノードを読み込む(以上図4の手順S
201〜S203)。つぎに当該ページが一杯(たとえ
ば位数×2個分のアイテムが既納済)でないとき、当該
ページ内に挿入でき、当該左ページバッファ内を右シフ
トして場所を空け当該アイテムを挿入しアイテム計数を
1増やす。2次記憶上のADDRに当該左ページバッフ
ァの内容を書き込み、手順S8(オーバーフローなし)
に復帰する(以上図4の手順S204〜S207)。当
該ページが一杯のとき、当該ページを分割し新しいペー
ジに再配置でき、Item Noが位数番目より左なら
ば、当該左ページバッファの位数番目からのアイテムを
当該右ページバッファに移し、当該左ページバッファ内
を右シフトして場所を空け、当該左ページに当該アイテ
ムを挿入する。Item Noが位数番目より右なら
ば、当該右ページバッファ内の挿入位置を計算し、当該
左ページバッファから(位数−1)個のアイテムを当該
右ページに移動し、当該右ページバッファに当該アイテ
ムを挿入する(以上図4の手順S208〜S211)。
さらにオーバーフローしたデータを処理するため、2次
記憶上のアドレスADDR1に当該右ページ領域を確保
し、当該右ページバッファ内の属性に当該左ページバッ
ファ内の属性をコピーし、当該ページバッファ内のアイ
テム数を位数に設定する。当該左ページが探索ノード部
ならば、当該左ページバッファ内のアイテム数を位数に
設定し、オーバーフロー・アイテムが指している当該ペ
ージを当該右ページの下位ページとする。該当左ページ
が葉ノード部ならば、当該左ページバッファ内のアイテ
ム数を(位数+1)に設定し、当該「右ページの次ペー
ジ」アドレス(ADDR2)を当該左ページバッファに
読み込む。たとえばB+ 木の性質である葉ノードの順序
関係を保持するため、当該「右ページ」と「左ページ」
と「右ページの次ページ」の各前方と後方ポインタを付
け替え、2次記憶上のADDR2に当該「右ページの次
ページ」の内容を書き込む。先頭と最後の葉ノードポイ
ンタを更新する。以上ページ再編成処理を終了すると、
2次記憶に当該左ページADDRと右ページADDR1
の内容を書き込む。オーバーフロー・アイテムが当該右
ページADDR1を指すように設定し、手順S8(オー
バーフローあり)に復帰する(以上図4の手順S212
〜S223)。
【0015】登録内容保持手段2は、検索時に参照すべ
き図5の木構造索引16と図6の1文字索引17の各内
部データ構造を保持する。木構造索引16は図5のよう
に、たとえば木構造としてノード内に格納できる最大ア
イテム(キー文字列と値の対)数が(位数×2)個であ
るB+ 木を採用し、登録すべきキー文字列が3文字以内
の英文字列18個で位数が2である探索部(探索ノード
からなる部分)と終端部(葉ノードからなる部分)から
なる。検索開始位置を指す根(root)ノードポイン
タと先頭と最後を指す葉(leaf)ノードポインタを
もつ。1文字索引17は図6のように、たとえば線形リ
スト形式を採用し、1文字A、当該文字に対応する葉ノ
ードアドレスCと次ノードポインタDをもつ葉ノード数
B、葉ノードアドレスCおよび後続葉ノードアドレスを
格納する次ノードポインタDの各フィールドからなる。
上記木構造索引16の探索部と終端部各ノードは図7の
ように、当該ノードに格納するキー数(count)、
葉ノードまたは探索ノード属性(type)、探索ノー
ドに格納するキー値より小さいキー値を格納する下位ノ
ードポインタまたは先行葉ノードポインタ(p0)、キ
ー文字列(k1 〜k4 )、葉ノードならデータ値もしく
はデータ格納先アドレスまたは探索ノードなら下位ノー
ドポインタを表す値(p0〜p4)および後続葉ノード
ポインタ(next)の各フィールドからなる。キー値
対フィールドに格納する最大アイテム(キー文字列と値
の対)数は、位数2のB+ 木の場合位数の2倍の4個で
ある。
【0016】部分文字列検索処理手段3は図8のよう
に、まず部分文字列の検索要求15を判定し、前方一致
のときは木構造索引16と中間一致または後方一致のと
きは1文字索引17とのいずれかを参照する(図8の手
順S21)。つぎに木構造索引16の参照時、検索ペー
ジアドレス(ADDR)を根ノードに設定し、2次記憶
から主記憶のページバッファに当該ADDRノードを読
み込み、検索キー文字列が当該ページバッファ内にある
か調べ、ページ内キー位置をItem Noに保存して
おく。当該ページバッファ内の属性が探索ノード判定の
とき、ItemNoの値が0ならば、ADDRに下位ノ
ードポインタ(p0)を設定し、0でないならば、AD
DRにItem No番目のアイテムポインタ(p(I
temNo))を設定し、葉ノード判定を確認するまで
繰返す。葉ノード判定のとき、当該ページバッファ内に
検索キー文字列がなければ、検索失敗として終了し、あ
れば検索成功としてItem No番目の当該アイテム
を検索結果18とし終了する(図8の手順S22〜S3
2)。さらに1文字索引の参照時、たとえば1文字
「a」を含む部分文字列「*a*」(*は任意数の任意
文字)の検索要求があり、「a」を含む葉ノードアドレ
スを取り出せない(1文字索引17の葉ノード数Bフィ
ールドの値が0)ならば、検索失敗として終了し、取り
出せるならば、当該葉ノード内に検索キー文字列を含む
か否かで検索成功か失敗として終了する(以上図8の手
順S33〜S39)。
【0017】なお上記実施例で図9のように、文字列登
録処理手段1と部分文字列検索処理手段3から登録内容
12と検索結果18を格納・保持し、部分文字列検索処
理手段3に対し当該キー文字列の部分文字列を指定して
再検索要求15aをする登録内容/検索結果保持・編集
手段4を設けてもよい。登録内容12のキー文字列や検
索結果18の保持文字列が検索要求に利用できるとき
は、検索対象の部分文字列を新たに入力しないでも一度
検索した情報を用い繰返し、容易に検索できる。登録内
容/検索結果保持・編集手段4は図11のように、たと
えば検索要求15の対象が「文字列」のとき、ユーザイ
ンタフェースとして文字列検索ウィンドウ(窓)上で
「登録/検索対象文字列」欄の「文字列」表示を確認
し、「検索」プッシュボタン表示を選択すれば、「登録
内容/検索結果」欄に検索結果18のたとえば「文字列
検索」を表示する。「文字列検索」中の部分文字列「検
索」を範囲指定し再検索要求15aをし、再度「検索」
プッシュボタン表示を選択すれば、「登録内容/検索結
果」欄に今度は新たな検索結果18のたとえば「Sea
rch;retrieve;」を表示する。
【0018】また上記実施例で図10のように、文字登
録時に図11の文字列検索ウィンドウ上で「しおり登
録」プッシュボタン表示を選択し登録内容/検索結果保
持・編集手段4からのしおり情報登録要求19に従い、
文字列登録処理手段1の図4に示す処理位置Aで文字列
検索ウィンドウ上の「登録/検索対象文字列」欄にある
当該文字列と対応葉ノードアドレスとを図12のように
それぞれ「キー文字列」と「葉ノードアドレス」の各フ
ィールドに登録・生成し格納・保持するしおり情報索引
20を登録内容保持手段2から木構造索引16と1文字
索引17の代わりに参照するようにしてもよい。部分文
字列検索処理手段3の図8に示す処理位置Bで検索要求
の特定文字列がしおり情報索引20の登録済キー文字列
に一致するとき、対応葉ノードアドレスで高速に検索で
きる。
【0019】また上記実施例で文字列登録処理手段1
は、図6の1文字索引を採用するとして説明したが、図
13のようにたとえば2文字連続の文字列AA、当該文
字列に対応する葉ノードアドレスCCと次ノードポイン
タDDをもつ葉ノード数BB、葉ノードアドレスCCお
よび後続葉ノードアドレスを格納する次ノードポインタ
DDの各フィールドからなる2文字索引を採用するよう
にしてもよい。たとえば2文字「de」を含む部分文字
列「*de*」(*は任意数の任意文字)の検索要求に
対し、「de」を含む葉ノードアドレスとして、01B
9番地の1つに確定し無駄なく検索できる(図6の1文
字索引17では01B9番地と02C7番地の2つが取
り出され両方の葉ノード内を調べる必要がある)。検索
要求の性質や物理的な制約から連続文字数nを決定し、
n文字索引を採用するようにしてもよいのはいうまでも
ない。部分文字列をより効率良く検索できる。
【0020】また上記実施例で文字列登録処理手段1
は、図6の1文字索引や図13のたとえば2文字索引の
代わりに、図14のように文字列中の文字C1、C2、
C3、C4、C5、C6の組(C1,C2)、(C3,
C4)、(C5,C6)に対し、たとえば日本語文字
(一般に2バイトコードの上位バイトで特定の値を表現
することが多い)の上位バイトを取り除いた値に変換す
るなどの変換関数f(C1,C2)、f(C3,C
4)、f(C5,C6)を適用し、写像(マッピング)
する変換値x=f(C1,C2)に対応する葉ノードア
ドレスa及び変換値y=f(C3,C4)=f(C5,
C6)に対応する葉ノードアドレスbとcを格納する多
対1文字索引を採用するようにしてもよい。たとえば文
字の組(C3,C4)を含む部分文字列「*C3C4
*」の検索要求に対し、葉ノードアドレスbとcの2つ
が取り出され両方の葉ノード内を調べる必要はあるが、
索引の大きさを小さくできる(文字列中の文字が日本語
の場合、n文字索引(n=1、2、・・・)では大きく
なってしまう可能性がある)。
【0021】また上記実施例で文字列登録処理手段1
は、文字登録時に作成する図5の木構造索引から探索部
を取り除いたデータ構造に対し生成する、図6の1文字
索引や図13のたとえば2文字索引や図14の多対1文
字索引を採用するようにしてもよい。木構造索引生成後
にこれ以上文字列の追加登録を要しないとき有効であ
り、木構造索引の終端部で葉ノード空き領域の詰直し
(領域圧縮)操作をし、文字索引のアドレスを修正し、
さらに領域を節約できる。
【0022】また上記実施例でB+ 木を採用する木構造
索引や2次記憶上の文字列検索の場合について説明した
が、たとえばトライ木(Trie Tree)などの他
の木構造索引や主記憶上の文字列検索に利用できること
はいうまでもない。
【0023】
【発明の効果】上記のようなこの発明の文字列情報検索
装置では、通常の処理手順の自然な拡張で文字列全体を
登録するだけで、木構造ベース索引による検索機能に加
え、文字ベース索引を併用する方式を採るから、従来の
ように索引対象を予め指定する部分キー値に限る方式に
比べ、部分文字列を効率的にかつ漏れなく検索できる。
また特別な登録処理手順や中間的な特殊の作業ファイル
を必要としない。登録すべき文字列情報の採用基準が明
確であり、かつ動的な追加登録も可能である効果があ
る。
【図面の簡単な説明】
【図1】 この発明を示す一実施例の文字列情報検索装
置の機能ブロック図。
【図2】 図1に示す文字列登録処理手段のルーチンを
説明するフロー図。
【図3】 図1に示す文字列登録処理手段の探索サブル
ーチンを説明するフロー図。
【図4】 図1に示す文字列登録処理手段の挿入サブル
ーチンを説明するフロー図。
【図5】 木構造索引を説明する図。
【図6】 1文字索引を説明する図。
【図7】 木構造索引の各ノード構成を説明する図。
【図8】 図1に示す部分文字列検索処理手段のルーチ
ンを説明するフロー図。
【図9】 この発明を示す他の一実施例の機能ブロック
図。
【図10】 この発明を示す他の一実施例の機能ブロッ
ク図。
【図11】 図9と図10に示す登録内容/検索結果保
持・編集手段の機能を説明する図。
【図12】 しおり情報索引を説明する図。
【図13】 2文字索引を説明する図。
【図14】 多対1文字索引を説明する図。
【図15】 従来例の文字列情報検索装置の機能ブロッ
ク図。
【符号の説明】
1 文字列登録処理手段、2 登録内容保持手段、3
部分文字列検索処理手段、4 登録内容/検索結果保持
・編集手段、11 登録対象文字列情報、12登録内
容、13 登録済アイテム、14 未登録アイテム、1
5 部分文字列検索要求、15a 部分文字列再検索要
求、16 参照木構造索引、17 参照1文字索引、1
8 検索結果、19 しおり情報登録要求、20 しお
り情報索引。なお図中、同一符号は同一または相当部分
を示す。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力する文字列情報を登録し木構造と文
    字ベース索引を生成する文字列登録処理手段と、該文字
    列登録処理手段から前記木構造と文字ベース索引の登録
    内容を格納し保持する登録内容保持手段と、前方一致か
    否かの部分文字列検索要求に従い、前記登録内容保持手
    段から前記木構造と文字ベース索引のいずれかを参照
    し、当該部分文字列を検索し出力する部分文字列検索処
    理手段とを備える文字列情報検索装置。
  2. 【請求項2】 文字列登録処理手段から登録内容と部分
    文字列検索処理手段から検索結果とを格納・保持し、前
    記部分文字列検索処理手段に対し当該キーの部分文字列
    を指定し再検索要求をする登録内容/検索結果保持・編
    集手段を設けることを特徴とする請求項1記載の文字列
    情報検索装置。
  3. 【請求項3】 登録内容/検索結果保持・編集手段で限
    定する特定検索キーと対応する葉ノードアドレスからな
    る索引情報の登録要求をし、文字列登録処理手段で前記
    特定検索キーと葉ノードアドレスを登録し索引を生成
    し、登録内容保持手段で格納し保持する当該情報索引に
    対し、部分文字列検索処理手段で木構造と文字ベース索
    引の代わりに参照することを特徴とする請求項2記載の
    文字列情報検索装置。
  4. 【請求項4】 文字列登録処理手段で登録対象文字列の
    うちの単一文字ベースだけでなく連続文字ベースの索引
    を採用することを特徴とする請求項1または2記載の文
    字列情報検索装置。
  5. 【請求項5】 文字列登録処理手段で登録対象文字列の
    うちの文字の組に対し変換関数を適用し写像する変換値
    ベースの索引を採用することを特徴とする請求項1また
    は2記載の文字列情報検索装置。
  6. 【請求項6】 文字列登録処理手段で文字登録時に作成
    する木構造ベース索引のうち探索ノード部を取り除いた
    データ構造に対し生成する文字ベース索引を採用するこ
    とを特徴とする請求項1,2,4または5記載の文字列
    情報検索装置。
JP6158765A 1994-07-11 1994-07-11 文字列情報検索装置 Pending JPH0822475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6158765A JPH0822475A (ja) 1994-07-11 1994-07-11 文字列情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6158765A JPH0822475A (ja) 1994-07-11 1994-07-11 文字列情報検索装置

Publications (1)

Publication Number Publication Date
JPH0822475A true JPH0822475A (ja) 1996-01-23

Family

ID=15678854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6158765A Pending JPH0822475A (ja) 1994-07-11 1994-07-11 文字列情報検索装置

Country Status (1)

Country Link
JP (1) JPH0822475A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001048637A1 (en) * 1999-12-29 2001-07-05 Incyte Genomics, Inc. Sequence database search with sequence search trees

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001048637A1 (en) * 1999-12-29 2001-07-05 Incyte Genomics, Inc. Sequence database search with sequence search trees
US6633817B1 (en) 1999-12-29 2003-10-14 Incyte Genomics, Inc. Sequence database search with sequence search trees

Similar Documents

Publication Publication Date Title
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
KR100414236B1 (ko) 데이터의 검색을 위한 서치 시스템 및 방법
ES2214535T3 (es) Procedimiento y sistema portatil de indexacion de documentos utilizando la descomposicion de palabras en n-grams.
US7290001B2 (en) Identification and enumeration of data components in a trie
JP5038939B2 (ja) 情報検索システム、方法及びプログラム
US20070150469A1 (en) Multi-segment string search
JP3003915B2 (ja) 単語辞書検索装置
JPH09179872A (ja) 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置
CN111400323A (zh) 数据检索方法、系统、设备及存储介质
JPH05189490A (ja) 関数結果をセーブし検索する方法と装置
JP2008083769A (ja) 文書検索装置および文書検索方法
KR100269114B1 (ko) 캐쉬 운영방법
JPH0822475A (ja) 文字列情報検索装置
JP3565840B2 (ja) 文書管理方法および文書管理装置
JP3187671B2 (ja) 電子辞書表示装置
JPH09212523A (ja) 全文検索方法
JP3329476B2 (ja) かな漢字変換装置
JP2000259629A (ja) 形態素解析方法およびその装置
JP3896683B2 (ja) 使用者定義文字管理装置および記憶媒体
JPH0748218B2 (ja) 情報処理装置
JP2006172029A (ja) 検索結果提示方法
KR930011444B1 (ko) 한글조합형 코드의 변환방법
JPH03137772A (ja) データベース利用システム
JPH09138809A (ja) 全文検索方法
JPS62109126A (ja) デ−タベ−スのデ−タ検索方法