JPH0752451B2 - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH0752451B2
JPH0752451B2 JP61218783A JP21878386A JPH0752451B2 JP H0752451 B2 JPH0752451 B2 JP H0752451B2 JP 61218783 A JP61218783 A JP 61218783A JP 21878386 A JP21878386 A JP 21878386A JP H0752451 B2 JPH0752451 B2 JP H0752451B2
Authority
JP
Japan
Prior art keywords
search
attribute
state transition
memory
transition table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61218783A
Other languages
English (en)
Other versions
JPS6373422A (ja
Inventor
太門 真下
秀文 増崎
敏彦 田宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61218783A priority Critical patent/JPH0752451B2/ja
Publication of JPS6373422A publication Critical patent/JPS6373422A/ja
Publication of JPH0752451B2 publication Critical patent/JPH0752451B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ハードウェアにより情報の検索を行う情報検
索装置に関し、特に、ハードウェアを小型化し、検索速
度を向上することが可能な情報検索装置に関する。
〔従来技術〕
光ディスクファイル装置等において、登録している画像
を検索したり、文章等の文字列データの中からキーとな
る部分文字列を含むものを検索する場合、従来はソフト
ウェアによる検索を行っている。しかし、この技術で
は、登録される画像の枚数や文字列データが大きくなる
と、検索時間が増大し、ユーザーの待ち時間も長くなる
という問題があった。
この問題の対策として、ハードウェアによる検索技術が
注目され、有限オートマトンによる検索技術が一般に知
られている。例えば、有限オートマトンにより文字検索
を行う場合、文字列検索装置は、状態遷移テーブルを格
納したランダム・アクセス・メモリ(以下RAMと略す)
を備え、このRAMに予め検索項目のキーとなる部分文字
列を入力し、記憶装置から送られた文字列データと、キ
ーとなる部分文字列とを照合し、両者が一致した時点で
一致信号を出力する。
この有限オートマトンの状態遷移は、第4図のように、
例えば、HITという3文字のキーを検索する場合、記憶
装置からの入力文字がHならば、オートマトンの状態は
初期状態“0"から状態“1"へ遷移する。なお、状態“0"
における入力文字がH以外ならば、引き続き状態“0"に
なる。
状態“1"では、次の入力文字がTならば、状態“2"に遷
移し、Hならば遷移せず、その他の入力文字ならば、状
態“0"に遷移する。
状態“2"では、次の入力文字がTならば、状態“3"に遷
移し、Hならば、状態“1"に遷移し、その他の入力文字
ならば、状態“0"に遷移する。このように入力文字によ
り状態遷移先が異なり、状態“3"へ遷移した場合、HIT
というキーを検出したことになる。しかし、この技術で
は、RAMの状態遷移テーブルに格納されるデータの大半
が状態“0"であるため、メモリの利用効率が低いという
問題があった。このため、状態遷移テーブルを小型化す
る提案もなされている。
例えば、特開昭60-105040号公報に記載されている技術
では、状態遷移テーブルのエントリとして、文字コード
を2のべき乗数個に分割したパターンを使用し、状態遷
移テーブルのサイズを小型化して、ある1つの検索項目
(アトリビュート)について、有限オートマトンが状態
遷移を行いながら検索を行っている。
しかし、この技術では、キーとなる文字列が数バイト〜
数10バイト程度の小規模システムにおいて、検索される
情報が複数の項目に分割され、その各々の項目に対して
検索キーを指定する場合,すなわち、アトリビュートが
複数ある場合に、アトリビュートの処理を連続して行う
技術については述べられていない。
〔発明が解決しようとする問題点〕
このように、アトリビュート毎に有限オートマトンを有
する技術では、アトリビュートが複数の場合、そのアト
リビュート数と同数の有限オートマトンを並列に持つ必
要があるため、ハードウェアの物量が大きくなり、検索
装置を構成することが難しく、また、検索速度に問題が
あった。
本発明の目的は、このような問題点を改善し、キーとな
る文字列が数バイト〜数10バイトの小規模システムにお
いて、ハードウェアを小型化し、検索速度を向上するこ
とが可能な情報検索装置を提供することにある。
〔問題を解決するための手段〕
上記目的を達成するため、本発明の情報検索装置は、
(1)状態遷移テーブルを用いた有限オートマトンによ
る検索を行なう情報検索装置において、設定入力された
各検索項目別の複数の状態遷移テーブルを各々異なるア
ドレスに格納するメモリと、各状態遷移テーブルを用い
た各検索項目に対する検索の終了を、入力文字の入力を
カウントして検出し、1つの検索項目に対する検索終了
後に、次の検索項目に対応する状態遷移テーブルの開始
アドレスの設定を行なうアドレスポイント手段とを設け
ることを特徴とする。
また、(2)上記(1)に記載の情報検索装置におい
て、アドレスポイント手段は、各検索項目のバイト長を
格納するアトリビュート長メモリと、各状態遷移テーブ
ルの開始アドレスを格納する初期値メモリと、検索項目
の各文字の入力毎に、アトリビュート長メモリに格納し
た当該検索項目のバイト長分のカウントを行なうバイト
長カウンタと、検索開始時に、初期値メモリから、最初
の状態遷移テーブルの開始アドレスを読み出すと共に、
バイト長カウンタによる各検査項目のバイト長分のカウ
ント終了をカウントし、各検索項目に対応する各状態遷
移テーブルの開始アドレスを、初期値メモリに対して順
次に指定するアトリビュート数カウンタと、このアトリ
ビュート数カウンタで指定された状態遷移テーブルの開
始アドレスを、状態遷移メモリに設定するデータセレク
タとからなることを特徴とする。
〔作用〕
本発明においては、1個の有限オートマン内の状態遷移
RAMのエリアを、アトリビュート毎に分割して使用す
る。
アトリビュートの検索が開始されると、そのアトリビュ
ートに対応する状態遷移RAMの初期アドレスが、データ
セレクタによって初期値RAMから読み出され、アドレス
ラッチに格納される。
次に、1バイト毎の文字入力が開始されると、有限オー
トマトンは、検索中のアトリビュート長を示すバイト数
分の文字が入力されるまで、入力文字毎に初期アドレス
から状態遷移を繰り返す。
こうして、アトリビュート長分の文字入力が終了する
と、このアトリビュートに対する判定結果がデータラッ
チに出力される。
なお、これらの動作を繰り返すことにより、アトリビュ
ートの連続処理を行うことが可能である。
〔実施例〕
以下、本発明の一実施例を図面により説明する。
第1図は、本発明の一実施例における情報検索装置の構
成図,第2図は本発明の一実施例における各種信号のタ
イミングチャート,第3図は本発明の一実施例における
情報検索装置の動作フローチャートである。
本実施例の情報検索装置は、第1図のように、状態遷移
RAM3,データラッチ4,判定回路5,セレクタ6,アトリビュ
ート数カウンタ(CNT1)7,初期値RAM8,アトリビュート
長RAM9,アトリビュート長カウンタ(CNT2)10,アドレス
ラッチ13,およびインバータ14を備える。また、アドレ
スラッチ13,およびデータラッチ4はフリップフロップ
(FF)が構成され、これらのFFと状態遷移RAM3とが1個
の有限オートマトンを構成している。
この有限オートマトンでは、状態遷移RAM3は、状態遷移
テーブルを格納し、複数のアトリビュートに分割されて
いる。また、アドレスラッチ13に8ビットデータが1文
字を示す入力文字11と、その入力文字11の入力タイミン
グを与えるクロック信号CLK22とが入力されると、アド
レスラッチ13は状態遷移RAM3上のアドレスを出力し、状
態遷移RAM3は、このアドレスに従って、入力される文字
毎に状態を遷移して、そのアドレスに対応するデータを
データラッチ4にセットする。さらに、データセレクタ
6は、検索対象のアトリビュートのアトリビュート長分
の文字入力が完了すると、次のアトリビュートに対応す
る状態遷移RAM3上の初期アドレスを、初期値RAM8から読
み出してアドレスラッチ13にセットする。
アトリビュート数カウンタ7は、状態遷移RAM3上で、現
在何番目のアトリビュートの処理を行っているかを示
し、また、アトリビュート長カウンタ10は、検索開始時
に処理対象のアトリビュートのバイト長をセットし、処
理中のアトリビュートの残バイト数を順次カウントダウ
ンして、そのアトリビュートの区切れ目を検出する。
さらに、初期値RAM8は、状態遷移RAM3に分割して格納さ
れている各アトリビュート毎のスタートアドレスを記憶
し、また、アトリビュート長RAM9は、それらのアトリビ
ュートの長さを記憶している。なお、本実施例では、初
期値,およびアトリビュート長は同一のRAMに格納され
ている。
本実施例において、情報検索を行う以前は、第2図,お
よび第3図のように、外部からアトリビュート数カウン
タ7に与えられるリセット信号RST21は“0"である(30
0)。この時、アトリビュート数カウンタ7,およびアト
リビュート長カウンタ10のカウントは、クリア,つまり
“0"となっている。従って、CNT1出力24は内容“0"であ
り、アトリビュート長カウンタ10のゼロ出力端子の出
力,つまりZ出力23は“1"となっている。
オペレータが検索するアトリビュートを設定すると(30
1)、外部からアトリビュート数カウンタ7に与えられ
るリセット信号RST21が解除され、“1"となる(302)。
この時、初期値RAM8,およびアトリビュート長RAM9は、
最初に検索するアトリビュートに対応するデータ,つま
り、初期アドレス,およびアトリビュート長をデータセ
レクタ6に送る。
次に、入力文字11と同期してCLK22がアドレスラッチ13
に入力されると、データセレクタ6は、選択制御信号,
つまり、アトリビュート長カウンタ10のZ出力23が“1"
であるため、データセレクタ6のA端子の入力データ,
つまり初期値データを、アドレスラッチ13に出力し、こ
の初期値データはアドレスラッチ13にラッチされる(30
4)。また、同時に、アトリビュート長カウンタ10の初
期値ロード端子LDの入力,つまり、アトリビュート長カ
ウンタ10のZ出力23が“1"であるため、最初のアトリビ
ュート長がアトリビュート長カウンタ10にラッチされる
(304)。
こうして、初期設定が行なわれると、文字入力が行われ
る度に(305)、有限オートマトンは1文字毎に状態を
遷移する(306)。この文字入力に従って、例えば、ア
トリビュート長が4の場合、アトリビュート長カウンタ
10は、3から0に順次カウントダウンし(307)、CNT2
出力25が“0"となると(308)、アトリビュート長カウ
ンタ10のZ出力23は“1"となる。この時、データラッチ
4の出力は、Z出力23を同期信号として判定回路5に送
られ(309)、判定回路5は判定結果を出力し(310)、
検索を終了する。
検索を続行する場合(311)、アトリビュート数カウン
タ7(CMT1)は、1から2にカウントアップされ、次の
アトリビュートのデータをポイントする(312)。この
ポイントに従って、次のアトリビュートに対応する初期
値,およびアトリビュート長が読み出され(303)、そ
れぞれ、アドレスラッチ13,およびアトリビュート長カ
ウンタ10にセットされて(304)、状態遷移RAM3は、新
たにラッチされたアドレスから次のアトリビュートの検
索を開始する(305,306)。
これらのシーケンスを繰り返して、アトリビュート毎の
検索を行う。
このように、状態遷移RAM3のアドレスをアトリビュート
毎に分割することにより、キーとなる文字列が数バイト
〜数10バイトの情報検索装置において、1個の有限オー
トマトンを用いて、複数のアトリビュートの検索処理を
行うことができる。
〔発明の効果〕
本発明によれば、キーとなる文字列が数バイト〜数10バ
イトの有限オートマトンを用いた情報検索装置におい
て、ハードウェアを小型化し、検索速度を向上すること
が可能である。
【図面の簡単な説明】
第1図は本発明の一実施例における情報検索装置の構成
図,第2図は本発明の一実施例における各種信号のタイ
ミングチャート,第3図は本発明の一実施例における情
報検索装置の動作フローチャート,第4図は有限オート
マトンの状態遷移の説明図である。 3:状態遷移RAM,4:データラッチ,5:判定回路,6:データセ
レクタ,7:アトリビュート数カウンタ(CNT1)、8:初期
値RAM,9:アトリビュート長RAM,10:アトリビュート長カ
ウンタ(CNT2),11:入力文字,13:アドレスラッチ,14:イ
ンバータ,21:リセット信号(RST),22:クロック信号(C
LK),23:アトリビュート長カウンタのZ端子の出力(Z
出力),24:アトリビュート数カウンタの出力(CNT1出
力),25:アトリビュート長カウンタの出力(CNT2出
力)。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】状態遷移テーブルを用いた有限オートマト
    ンによる検索を行なう情報検索装置において、設定入力
    された各検索項目別の複数の上記状態遷移テーブルを各
    々異なるアドレスに格納するメモリと、上記各状態遷移
    テーブルを用いた各検索項目に対する検索の終了を、入
    力文字の入力をカウントして検出し、1つの検索項目に
    対する検索終了後に、次の検索項目に対応する状態遷移
    テーブルの開始アドレスの設定を行なうアドレスポイン
    ト手段とを設けることを特徴とする情報検索装置。
  2. 【請求項2】特許請求の範囲第1項記載の情報検索装置
    において、上記アドレスポイント手段は、上記各検索項
    目のバイト長を格納するアトリビュート長メモリと、上
    記各状態遷移テーブルの開始アドレスを格納する初期値
    メモリと、上記検索項目の各文字の入力毎に、上記アト
    リビュート長メモリに格納した当該検索項目のバイト長
    分のカウントを行なうバイト長カウンタと、検索開始時
    に、上記初期値メモリに、最初の状態遷移テーブルの開
    始アドレスを読み出すと共に、上記バイト長カウンタに
    よる上記各検索項目のバイト長分のカウント終了をカウ
    ントし、各検索項目に対応する各状態遷移テーブルの開
    始アドレスを、上記初期値メモリに対して順次に指定す
    るアトリビュート数カウンタと、該アトリビュート数カ
    ウンタで指定された状態遷移テーブルの開始アドレス
    を、上記状態遷移メモリに設定するデータセレクタとか
    らなることを特徴とする情報検索装置。
JP61218783A 1986-09-17 1986-09-17 情報検索装置 Expired - Fee Related JPH0752451B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61218783A JPH0752451B2 (ja) 1986-09-17 1986-09-17 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61218783A JPH0752451B2 (ja) 1986-09-17 1986-09-17 情報検索装置

Publications (2)

Publication Number Publication Date
JPS6373422A JPS6373422A (ja) 1988-04-04
JPH0752451B2 true JPH0752451B2 (ja) 1995-06-05

Family

ID=16725306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61218783A Expired - Fee Related JPH0752451B2 (ja) 1986-09-17 1986-09-17 情報検索装置

Country Status (1)

Country Link
JP (1) JPH0752451B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04348469A (ja) * 1990-07-23 1992-12-03 Hitachi Ltd 文字列検索装置およびその方法
JP2529466B2 (ja) * 1990-11-28 1996-08-28 松下電器産業株式会社 区切り装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60105040A (ja) * 1983-11-12 1985-06-10 Nippon Telegr & Teleph Corp <Ntt> 文章検索方式
JPS617934A (ja) * 1984-06-22 1986-01-14 Fujitsu Ltd 汎用ビツト操作方式

Also Published As

Publication number Publication date
JPS6373422A (ja) 1988-04-04

Similar Documents

Publication Publication Date Title
US4916655A (en) Method and apparatus for retrieval of a search string
US5081608A (en) Apparatus for processing record-structured data by inserting replacement data of arbitrary length into selected data fields
JPH0752451B2 (ja) 情報検索装置
JPS634334A (ja) 文書イメ−ジ電子フアイル装置
JP2880192B2 (ja) 文字列検索方法及び装置
JPS61256442A (ja) レコ−ド検索高速化法
JPH0642248B2 (ja) 情報検索装置
JPH0728836A (ja) データベース検索方法及びこの方法を用いたデータベースシステム
JP2696832B2 (ja) 情報検索回路
JP2991007B2 (ja) キー取り出し装置及びキー取り出し方法及びソート処理装置及びデータベース処理装置
JP3360308B2 (ja) 文字列検索方法および装置
JPH07230469A (ja) 検索装置
JP2586172B2 (ja) 学習機能付テーブル検索装置
JPH09330322A (ja) データ検索装置
JPH043251A (ja) 文書検索方法および文書検索処理装置
GB2345556A (en) Device for searching sorted list of data
JPH03244068A (ja) シミュレーション方式
JPS638837A (ja) スキヤンデ−タ表示方式
JPS6143734B2 (ja)
JPS63155324A (ja) 情報検索装置
JPH0546666A (ja) 情報検索装置
JPH04195681A (ja) 区切り装置
JPH04230576A (ja) 項目選択装置
JPH0721191A (ja) 文字列検索装置
JPS60203066A (ja) 画像情報フアイルシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees