JPH06139278A - 文字コード変換機能を備えた文字列検索装置 - Google Patents

文字コード変換機能を備えた文字列検索装置

Info

Publication number
JPH06139278A
JPH06139278A JP4287261A JP28726192A JPH06139278A JP H06139278 A JPH06139278 A JP H06139278A JP 4287261 A JP4287261 A JP 4287261A JP 28726192 A JP28726192 A JP 28726192A JP H06139278 A JPH06139278 A JP H06139278A
Authority
JP
Japan
Prior art keywords
character
code
character string
search
character code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4287261A
Other languages
English (en)
Inventor
Hisamitsu Kawaguchi
川口  久光
Katsumi Tada
勝己 多田
Kanji Kato
寛次 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4287261A priority Critical patent/JPH06139278A/ja
Publication of JPH06139278A publication Critical patent/JPH06139278A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 不要なスロットを削減することにより少量の
メモリ量の状態遷移テーブルを実現し、コンパクトな文
字列検索装置を提供することにある。 【構成】 テキストを格納する文字列記憶手段105と、
文字列記憶手段から読み出されたテキストから1文字ず
つ取り込み、文字コードが検索タームに含まれている文
字コードの場合には文字に対応したコードを出力し、そ
れ以外の場合には特定のコードを出力する文字コード変
換手段4000と、予め与えられた検索タームの文字コード
を対応するコードに変換する検索制御手段101と、文字
コード変換手段の出力するコード列中に検索制御手段か
ら送られた複数の検索タームに対応したコード列が存在
するか否かを一括して照合する文字列照合手段102によ
り文字列検索装置を構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報処理システム、特に
情報検索システムにおける検索タームの照合方法に係
り、テキスト文字列から検索タームとして指定された複
数の部分文字列が存在するか否かを一括して探索するた
めのものである。
【0002】データベース、文書ファイリングシステ
ム、およびワードプロセッサなどにおける検索に利用し
得るものである。
【0003】
【従来の技術】情報処理システムの分野では、文字列デ
ータの集まりからなる文書(以後、テキストと呼ぶ)の
中から、検索者の探したいある特定の部分文字列(以
後、検索タームと呼ぶ)を含む全ての文書を探し出すこ
とが一つの重要な情報処理内容となっている。
【0004】このような検索システムを実現するための
文字列検索装置がいくつか提案されている。その中の代
表的な文字列検索装置の構成を図2に示し、その内容に
ついて説明する。
【0005】(エル エー ホラー :“テキスト リ
トリーバル コンピューターズ”、コンピューター、3
月 1979年、L.A. Hollaar:“Tex
t Retrieval Computers”、CO
MPUTER、March 1979) 文字列検索装置1において、検索制御手段101は、検
索装置全体の制御と、ホストコンピュータとの通信を行
う。すなわち、ホストコンピュータから送られてくる検
索要求201を受け付け、これを解析し、文字列照合手
段102と複合条件判定手段103へ検索情報202と
して送出する。また、検索制御手段101は記憶装置制
御手段104を制御して、文字列記憶手段105に格納
された文字列データ204を文字列照合手段102へ読
み出す。
【0006】文字列照合手段102は、入力文字列デー
タ204の中に検索要求201に合致する文字列、すな
わち検索タームがあるかどうかを調べ、もし該当するも
のがあれば、文字列を識別する情報205を複合条件判
定手段103へ出力する。複合条件判定手段103は該
文字列識別情報205に対して、検索要求201中に指
示されたANDやORで構成される論理条件などが満足
されるか否かを調べる。指定された複合条件を満足する
場合には、該当する文書の識別情報や文書内容のテキス
トデータを検索結果206としてホストコンピュータへ
返送する。
【0007】上述した文字列検索装置1の要となる文字
列照合手段102における文字列の照合方式としては、
有限オートマトンを用いて複数の文字列を1回のテキス
ト走査で探索する方法が知られている。その代表的なも
のとして、Ahoらが提案している方法がある。(エ
ー.ブイ.エーホ アンド エム.ジェイ.コラッシッ
ク:”エフィシェント ストリング マッチング”、コ
ミュニケーションズ エー シー エム、第18巻、第
6号、1975年、A.V.Aho and M.J.Corasick:“Effi
cient String Matching"、CACM、VOL.18、No.6、197
5)。
【0008】そして、このAhoによるオートマトンを
高速に実行するためのハードウェアとしては特開昭60
−105039号公報により提案されている。ここで述
べられている文字列照合回路について図3のブロック図
を用いて説明する。
【0009】本従来技術は、文字コードレジスタ21
1、状態遷移テーブル220、状態番号レジスタ25
0、および照合IDテーブル260から構成される。
【0010】以下、本従来技術の文字列照合動作につい
て説明する。
【0011】まず、初期設定として、状態遷移テーブル
220には指定された検索タームを照合するためのオー
トマトンが設定される。さらにこのオートマトンの初期
状態である状態番号0が状態番号レジスタ250に設定
される。したがって、現状態番号305は状態番号0と
なる。
【0012】照合時動作は、入力文字列204から1文
字ずつ文字コードレジスタ211に入力されることから
始まる。文字コードレジスタ211の出力である文字コ
ード302と状態番号レジスタ250の出力である現状
態番号305をアドレスとして状態遷移テーブル220
がアクセスされ、次に遷移すべき状態番号である次状態
番号303が読み出される。次状態番号303は新たな
現状態番号305として状態番号レジスタ250に保持
される。
【0013】状態遷移テーブル220のアクセス動作に
並行して照合IDテーブル260が状態番号レジスタ2
50から出力される現状態番号305と文字コード30
2をアドレスとしてアクセスされ、検索タームの識別番
号が照合結果205として読み出される。ただし、読み
出された検索タームの識別番号が0の場合、検索ターム
が照合されていないことを表わす。
【0014】その後、次の1文字が文字コードレジスタ
211に入力される。
【0015】以上の一連の動作が繰り返されることによ
り文字列照合動作が実現される。
【0016】以下、本従来技術の動作について具体例で
説明する。図4に示すオートマトンを例に用いる。
【0017】本図は、入力テキストの中から、検索者が
与えた2つの検索ターム、すなわち“DOG”と“CA
T”を照合するためのオートマトンの状態遷移図を示し
たものである。ここで、円はオートマトンの状態を、矢
印は状態遷移を表す。各矢印に付記された文字はこれに
対応した遷移を引き起こす入力文字を示している。各円
の内部に記された数値は、その状態の状態番号を示す。
状態0は、本オートマトンの初期状態である。遷移が記
述されていない入力文字に対しては、全て初期状態0に
遷移する。遷移にスラッシュ“/”が付記されている矢
印404および矢印405はそれぞれ“DOG”および
“CAT”が照合されたことを示す遷移を表す。すなわ
ち、状態2から遷移する矢印404は“DOG”を、状
態4から遷移する矢印405は“CAT”が照合された
ことを示す。
【0018】以下、同図を用いて本従来技術の文字列照
合動作について説明する。このオートマトンは初期状態
0から状態遷移が始まる。初期状態0では、入力文字
が、“D”であると状態1へ遷移し、“C”ならば状態
3に遷移する。“D”および“C”以外の文字が入力さ
れた場合は初期状態0に遷移する。状態1についても同
様に、入力文字が“O”ならば状態2へ、“C”ならば
状態3へ、“D”ならば状態1へ遷移し、それ以外は初
期状態0へ戻る。状態2において、入力文字が“G”な
らば照合結果が格納されている矢印404の遷移が起こ
り“DOG”が照合されたことになる。以下、他の状態
における遷移についても同様である。
【0019】図4のオートマトンを格納した状態遷移テ
ーブル220および照合IDテーブル260の使用例を
それぞれ図5と図6に示す。
【0020】ここでは文字コードとしてJISコードを
用いている。状態遷移テーブル220は入力文字コード
302と着目しているオートマトンの現状態番号305
でアドレッシングされる構成となっている。すなわち、
現状態番号305が0で入力文字コード302が“D”
のとき、0と“D”に対応する1が次に遷移すべきオー
トマトンの次状態番号303として出力される。
【0021】照合IDテーブル260には検索タームが
照合されたことを示す矢印404および矢印405の照
合結果情報が格納されている。すなわち、検索タームの
末尾文字で遷移するときの現状態番号と検索タームの末
尾文字コード(図4の“DOG”の場合には状態2と文
字“G”)でアドレッシングされる照合IDテーブル2
60の内容には検索タームの識別番号(以後、照合識別
子とも呼ぶ)が格納されている。この“DOG”の例で
は、1が照合識別子として格納されている。0以外の内
容が検索タームの識別番号を表している。照合識別子と
しては0以外の数値を割付け、照合対象以外には0を割
付けることにより、照合出力を区別できるようにしてい
る。
【0022】このようにして従来技術では検索処理が実
行される。
【0023】
【発明が解決しようとする課題】状態遷移テーブルの全
スロット数は状態数と文字コード数との積で表すことが
できる。本従来技術では、状態数として256状態、文
字コード数として256種類用意しているため、スロッ
ト数は64Kスロットとなる。
【0024】このように本従来技術では、検索タームに
はわずかな文字コードの種類しか使用されないにもかか
わらず、全ての文字コードに対応した状態遷移テーブル
のスロットを用意しなければならない。図4のオートマ
トン例では6種類の文字コードしか使用されていない。
さらに、図4のオートマトンに対応した図5の状態遷移
テーブル例からも明らかなように、遷移情報が設定され
いるスロットは極わずかである。ここでは1024スロ
ット中12スロット、すなわち約100分の1しか使用
されていない。したがって、約99%が不要なスロット
となっている。よって本従来技術には、状態遷移テーブ
ルの使用効率が悪いため、不要に大きな状態遷移テーブ
ルを必要とするという問題がある。
【0025】本発明の目的は、不要なスロットを削減す
ることにより少量のメモリ量の状態遷移テーブルを実現
し、コンパクトな文字列検索装置を提供することにあ
る。
【0026】
【課題を解決するための手段】上記目的を達成するた
め、コード表現された文字で構成されるテキスト中に、
指定された複数の検索タームが存在するか否かを一括し
て探索する文字列検索装置において、テキストを格納す
る文字列記憶手段と、該文字列記憶手段から読み出され
たテキストから1文字ずつ取り込み、該文字コードが前
記検索タームに含まれている文字コードか否かを判定
し、検索タームに含まれている文字コードの場合には該
文字に対応したコードを出力し、それ以外の場合には特
定のコードを出力する文字コード変換手段と、予め与え
られた検索タームの文字コードを対応する上記コードに
変換する検索制御手段と、該文字コード変換手段の出力
するコード列中に検索制御手段から送られた複数の検索
タームに対応したコード列が存在するか否かを一括して
照合する文字列照合手段により文字列検索装置を構成す
る。
【0027】
【作用】上記手段を用いた本発明の照合原理について説
明する。
【0028】まず、検索制御手段101において検索タ
ームにどのような文字コードが指定されているかを調
べ、これらの文字コードに例えばシリアル番号を割り付
ける。このような文字コード対応テーブルを文字コード
変換手段4000に設定する。さらにシリアル番号に変
換した検索タームから作成したオートマトンを文字列照
合手段102に設定する。
【0029】検索時には、文字列記憶手段102から読
み出されたテキストが1文字ずつ文字コード変換手段4
000に取り込まれ、該文字コードが前記検索タームに
含まれている文字コードか否かが判定され、検索ターム
に含まれている文字コードの場合には該文字に対応した
シリアル番号が出力され、それ以外の場合には特定の番
号として例えば0(ゼロ)が出力される。
【0030】文字コード変換手段4000から出力され
たコード列中に複数の検索タームに対応したコード列が
存在するか否かが文字列照合手段102で一括して照合
される。
【0031】以上述べた原理について具体例を用いて説
明する。
【0032】まず、設定情報の作成方法について述べ
る。
【0033】本例では、検索タームとして図4のオート
マトンと同様に“CAT”と“DOG”の2つを用い
る。これらの検索タームには6種類の文字が使用されて
いる。つまり、検索タームに使用されている文字の
“C”、“A”、“T”、“D”、“O”、および
“G”を、“(1)”、“(2)”、“(3)”、
“(4)”、“(5)”、および“(6)”にそれぞれ
対応させ、検索タームに使用されていない文字には
“(0)”を対応させる。この文字コード変換テーブル
が文字コード変換手段4000に設定される。このよう
に設定された本例の文字コード変換テーブルを図7に示
す。
【0034】また、検索タームも同様に“CAT”に対
応する“(1)(2)(3)”と“DOG”に対応する
“(4)(5)(6)”にそれぞれ変換される。このよ
うに変換された検索タームから作成されたオートマトン
を図8に示す。図4のオートマトンの遷移に付記された
文字が対応するシリアル番号に変換されている。このオ
ートマトンが文字列照合手段102に設定される。
【0035】本例ではこのコード変換により、文字コー
ドの種類が“(0)”〜“(6)”の7種類に削減で
き、従来技術の256種類の約40分の1となる。した
がって、状態遷移テーブルは約40分の1の容量で済む
ことになる。
【0036】次に照合動作について述べる。ここではテ
キスト例として“HOTDOG”を用いる。
【0037】まず、文字コード変換手段4000に
“H”が入力されると図7に示す文字コード変換テーブ
ルにより、対応する“(0)”が出力される。
【0038】次に、“O”が入力されると文字コード変
換テーブルにより、対応する“(5)”が出力される。
【0039】同様に、“T”、“D”、“O”、“G”
が次々に入力されると出力として“(3)”、
“(4)”、“(5)”、“(6)”が出力される。つ
まり、出力テキストとして“(0)(5)(3)(4)
(5)(6)”が文字列照合手段102に送出されるこ
とになる。
【0040】文字列照合手段102では文字コード変換
手段4000から送出された出力テキスト中から“CA
T”に対応する“(1)(2)(3)”または“DO
G”に対応する“(4)(5)(6)”を図8に示すオ
ートマトンに基づき探索する。ここでは、“(0)
(5)(3)(4)(5)(6)”の入力により“DO
G”に対応する“(4)(5)(6)”が照合される。
【0041】以上のように動作させることにより、状態
遷移テーブルを従来技術の数十分の1のメモリ容量で実
現でき、コンパクトな文字列検索装置を提供することが
可能となる。
【0042】
【実施例】以下、本発明の原理を用いた第1の実施例に
ついて図1を用いて説明する。
【0043】本実施例では従来技術の文字列検索装置1
の文字列記憶手段105と文字列照合手段102の間に
コード変換手段4000を設けている。コード変換手段
4000においては、文字列記憶手段から読み出した文
字が検索タームに指定されている文字コードの場合に
は、この文字コードに対応した所定のコードに変換し、
検索タームに指定されていない場合には特定のコードに
変換し、文字列照合手段102に出力する。このように
することにより文字列照合手段102で使用している状
態遷移テーブルの文字コードに対応するエントリ数が検
索タームに指定されている文字コード数+1となり、文
字コードに対応したエントリ数を大幅に削減できるため
少量のメモリで状態遷移テーブルが実現可能となる。
【0044】本実施例では、少量のメモリで状態遷移テ
ーブルを実現することによりコンパクトな文字列検索装
置を提供することを目的としている。
【0045】本実施例で用いる文字列検索装置の一構成
例を図1に示す。文字コード変換4000は、文字列記
憶手段105より読み出されたテキストから1文字入力
される毎にこれを文字コードに対応した所定のコードに
変換し、文字列照合手段102へ出力する。
【0046】本文字コード変換回路は、文字コード変換
テーブルから構成されている。
【0047】文字コード変換テーブル4100は図7に
示す構成をとり、文字コードをアドレスとしてアクセス
する一次元メモリである。本テーブルには、検索ターム
に使用されている文字コードの場合は、対応する予め定
められたコードが設定され、その他の文字コードの場合
は特定のコードが設定されている。
【0048】文字コード変換テーブル4100の具体例
を用いて説明する。
【0049】ここでは、検索タームとして図4のオート
マトンと同様に“CAT”と“DOG”の2つ検索ター
ムを用いる。これらの検索タームには6種類の文字が使
用されているため、検索タームに使用されている文字の
“C”、“A”、“T”、“D”、“O”、および
“G”を、“(1)”、“(2)”、“(3)”、
“(4)”、“(5)”、および“(6)”にそれぞれ
対応させ、検索タームに使用されていない文字には
“(0)”を対応させる。このように設定した文字コー
ド変換テーブルの具体例を図7に示す。
【0050】次にコード変換動作について述べる。ここ
ではテキスト例として“HOTDOG”を用いる。
【0051】まず、コード変換手段4000に“H”が
入力されると文字コード変換テーブルにより、対応する
“(0)”が出力される。
【0052】次に、“O”が入力されると文字コード変
換テーブルにより、対応する“(5)”が出力される。
【0053】同様に、“T”、“D”、“O”、“G”
が次々に入力されると出力として“(3)”、
“(4)”、“(5)”、“(6)”が出力される。つ
まり、出力テキストとして“(0)(5)(3)(4)
(5)(6)”が文字列照合手段102に送出されるこ
とになる。
【0054】次に、文字列照合手段では、検索タームが
“CAT”に対応する“(1)(2)(3)”と“DO
G”に対応する“(4)(5)(6)”にそれぞれ変換
され、これらより作成された図8に示すオートマトンが
設定される。本オートマトンでは、図4のオートマトン
の矢印に付記された文字が対応するコードに変換されて
いる。
【0055】本例に対応した状態遷移テーブルを図9に
示す。本テーブルではこのコード変換により、文字コー
ドの種類が“(0)”〜“(6)”の7種類に削減で
き、従来技術の256種類の約40分の1となってい
る。したがって、状態遷移テーブルは約40分の1の容
量で済むことになる。
【0056】文字列照合手段102ではコード変換手段
4000から送出された出力テキスト中から“CAT”
に対応する“(1)(2)(3)”と“DOG”に対応
する“(4)(5)(6)”を図7に示すオートマトン
に基づき探索する。
【0057】ここでは、出力テキスト207として
“(0)(5)(3)(4)(5)(6)”が文字列照
合手段102へ入力され、“DOG”に対応する
“(4)(5)(6)”が照合される。
【0058】以上説明したように本発明によれば、文字
列記憶手段105と文字列照合手段102との間に文字
コード変換手段を設けることにより、状態遷移テーブル
を従来技術の数十分の1のメモリ容量で実現でき、コン
パクトな文字列検索装置を提供することが可能となる。
【0059】
【発明の効果】本実施例によれば、小規模な文字コード
変換手段を設けるだけで、状態遷移テーブルのサイズを
数十分の1に縮小でき、コンパクトな文字列検索装置を
提供することが可能となる。
【図面の簡単な説明】
【図1】本発明の文字列検索装置の説明図である。
【図2】従来の文字列検索装置の説明図である。
【図3】従来の文字列照合回路の構成を示すブロック図
である。
【図4】従来のオートマトンの状態遷移図である。
【図5】従来の状態遷移テーブルの説明図である。
【図6】従来の照合IDテーブルの説明図である。
【図7】本発明を用いた文字コード変換テーブルの説明
図である。
【図8】本発明を用いたオートマトンの状態遷移図であ
る。
【符号の説明】
101…検索制御手段、102…文字列照合手段、10
3…複合条件判定手段、104…記憶装置制御手段、1
05…文字列記憶手段、220…状態遷移テーブル、2
60…照合IDテーブル、303…次状態番号、305
…現状態番号、403…初期状態を示す矢印、4000
…文字コード変換手段、4100…文字コード変換テー
ブル。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成5年3月29日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】本発明の文字列検索装置の説明図である。
【図2】従来の文字列検索装置の説明図である。
【図3】従来の文字列使用号回路の構成を示すブロック
図である。
【図4】従来のオートマトンの状態遷移図である。
【図5】従来の状態遷移テーブルの説明図である。
【図6】従来の照合IDテーブルの説明図である。
【図7】本発明を用いた文字コード変換テーブルの説明
図である。
【図8】本発明を用いたオートマトンの状態遷移図であ
る。
【図9】本発明による状態遷移テーブルの説明図であ
る。
【符号の説明】 101…検索制御手段、102…文字列照合手段、10
3…複合条件判定手段、104…記憶装置制御手段、1
05…文字列記憶手段、220…状態遷移テーブル、2
60…照合IDテーブル、303…次状態番号、305
…現状態番号、403…初期状態を示す矢印、4000
…文字コード変換手段、4100…文字コード変換テー
ブル。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】コード表現された文字で構成されるテキス
    ト中に、指定された複数の検索タームが存在するか否か
    を一括して探索する文字列検索装置において、 テキストを格納する文字列記憶手段と、 該文字列記憶手段から読み出されたテキストから1文字
    ずつ取り込み、該文字コードが前記検索タームに含まれ
    ている文字コードか否かを判定し、検索タームに含まれ
    ている文字コードの場合には該文字に対応したコードを
    出力し、それ以外の場合には特定のコードを出力する文
    字コード変換手段と、 予め与えられた検索タームの文字コードを対応する上記
    コードに変換する検索制御手段と、 該文字コード変換手段の出力するコード列中に検索制御
    手段から送られた複数の検索タームに対応したコード列
    が存在するか否かを一括して照合する文字列照合手段
    と、 を有することを特徴とする文字列検索装置。
JP4287261A 1992-10-26 1992-10-26 文字コード変換機能を備えた文字列検索装置 Pending JPH06139278A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4287261A JPH06139278A (ja) 1992-10-26 1992-10-26 文字コード変換機能を備えた文字列検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4287261A JPH06139278A (ja) 1992-10-26 1992-10-26 文字コード変換機能を備えた文字列検索装置

Publications (1)

Publication Number Publication Date
JPH06139278A true JPH06139278A (ja) 1994-05-20

Family

ID=17715113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4287261A Pending JPH06139278A (ja) 1992-10-26 1992-10-26 文字コード変換機能を備えた文字列検索装置

Country Status (1)

Country Link
JP (1) JPH06139278A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103596B2 (en) 2001-07-27 2006-09-05 Fujitsu Limited Data sort method, data sort apparatus, and data sort program
WO2009050797A1 (ja) * 2007-10-17 2009-04-23 Fujitsu Limited 検索装置および検索方法
JP5071486B2 (ja) * 2008-01-22 2012-11-14 富士通株式会社 検索装置および検索方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103596B2 (en) 2001-07-27 2006-09-05 Fujitsu Limited Data sort method, data sort apparatus, and data sort program
WO2009050797A1 (ja) * 2007-10-17 2009-04-23 Fujitsu Limited 検索装置および検索方法
US8219538B2 (en) 2007-10-17 2012-07-10 Fujitsu Limited Search device and search method
JP5041003B2 (ja) * 2007-10-17 2012-10-03 富士通株式会社 検索装置および検索方法
JP5071486B2 (ja) * 2008-01-22 2012-11-14 富士通株式会社 検索装置および検索方法

Similar Documents

Publication Publication Date Title
US5140644A (en) Character string retrieving system and method
JP4559371B2 (ja) Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法
US6122626A (en) Sparse index search method
EP1227412B1 (en) Pattern retrieval
Roberts A specialized computer architecture for text retrieval
JPH09245043A (ja) 情報検索装置
KR100459832B1 (ko) N-그램워드(n-gramword)분해원리를이용하여이식가능한문서를인덱싱하는시스템및방법
JPH06139278A (ja) 文字コード変換機能を備えた文字列検索装置
JP3728877B2 (ja) 文字列変換装置およびそのプログラム記録媒体
US4327407A (en) Data driven processor
JPH05101102A (ja) 検索装置
EP0468402B1 (en) Character string retrieving system and method
JP3459049B2 (ja) 文字列検索方法およひ装置
JPH07287716A (ja) 辞書検索装置
Hollaar et al. A specialized architecture for textual information retrieval
JPH0746362B2 (ja) 文字列照合方法
JP3288063B2 (ja) 可変長データの格納および参照システム
CN117290523B (zh) 基于动态索引表的全文检索方法及装置
JP2921119B2 (ja) 数値検索装置および数値検索方法
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPH0752450B2 (ja) 辞書デ−タ検索装置
JPH04348469A (ja) 文字列検索装置およびその方法
JP3360308B2 (ja) 文字列検索方法および装置
JPH10301940A (ja) 情報処理装置及びその方法
JPH08106453A (ja) ソート処理装置