JPH03196260A - 全文検索装置 - Google Patents

全文検索装置

Info

Publication number
JPH03196260A
JPH03196260A JP1335398A JP33539889A JPH03196260A JP H03196260 A JPH03196260 A JP H03196260A JP 1335398 A JP1335398 A JP 1335398A JP 33539889 A JP33539889 A JP 33539889A JP H03196260 A JPH03196260 A JP H03196260A
Authority
JP
Japan
Prior art keywords
read
address
memory
search
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1335398A
Other languages
English (en)
Inventor
Yoshihide Kikuchi
芳秀 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1335398A priority Critical patent/JPH03196260A/ja
Publication of JPH03196260A publication Critical patent/JPH03196260A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は外部記憶装置内に格納されたデータについて全
文検索を行う全文検索装置に関する。
(従来の技術) 全文検索とは、所望のキーワードを含んだ文書ファイル
を検索する際、前もって文書にキーワードを割り振って
おくことをせず、文書の文字列を先頭から検索していく
検索方式である。検索対象が文書全体であり、被検索デ
ータのすべてをメモリに置くことができないから、検索
要求があるたびに外部記憶装置から文書を読み出して検
索を行っている。ちなみに、ここで述べるファイルとは
、前記外部記憶装置に格納された物理的ファイルだけで
なく、1つの物理的ファイルを内部で文書毎にいくつか
に分けたレコードなどもファ不ルと呼ぶことにする。
従来、この種の検索装置としては、第7図のような装置
が知られている。以下、図面を参照して従来の技術につ
いて説明する。
外部記憶手段702は、被検索用データを蓄えるための
ものでり、外部記憶手段702としては通常、磁気ディ
スク、光磁気ディスク、レーザディスクなどが使われて
いる。また、制御手段701から外部記憶手段702ヘ
ファイル読み出しの指示が送られる。すると外部記憶手
段702から検索手段703へ被検索データが送られ、
該検索手段703にあらかじめ登録されている検索文字
列が検索される。検索において、被検索データと検索文
字列とが一致すると検索手段703から制御手段701
へ一致信号が送られる。制御手段701は、一致信号を
受け取ると、外部記憶手段702に対し検索結果の外部
への読み出し指示を送る。すると検索はいったん中止さ
れ、現在検索を行っていたファイルが再度先頭から或い
は途中から読み出されて外部へ送られる。
以後、検索すべきファイルがなくなるまで上記の動作を
繰り返し、外部記憶手段702に格納されている複数の
ファイルの中から所望のファイルを検索するというもの
であった。
(発明が解決しようとする課題) 上記の方式では、検索を行って一致した場合、いったん
検索を中止して、検索結果を外部へ出力するために再び
同じファイルを外部記憶手段から読み出さなければなら
なかった。このような方式の従来の全文検索装置では、
外部記憶手段から連続して検索を行うことができず、大
変に効率の悪いものとなっていた。
本発明の目的は、上記の課題を解決し、外部記憶手段か
らの読み出しおよび検索を連続で行いながら、検索され
たファイルの読み出しをも同時に行う全文検索装置を提
供することにある。
(課題を解決するための手段) 前述の課題を解決するための本発明の全文検索装置は、
外部記憶手段に格納されている被検索データについて全
文検索を行う全文検索装置において、前記外部記憶手段
から読み出されるデータを順次に格納していくメモリと
、前記メモリへの書き込みアドレスの生成を行う書き込
みアドレス生成手段と、前記外部記憶手段から送られる
データの中から予め記憶されているデータの検索を行う
検索手段と、前記検索手段から出力される一致信号を受
け取りで現在検索されているファイルの前記メモリ上に
おける一部分または全部分の読み出し開始アドレスと読
み出し終了アドレスを格納し、かつ該読み出し開始アド
レスから該読み出し終了アドレスまでの読み出しアドレ
スを順次生成する読み出しアドレス生成手段とを備えて
成ることを特徴とする。
(作用) 本発明においては、前記外部記憶から読み出した被検索
データを前記検索手段へ入力すると同時にメモリへも入
力している。さらにメモリへの入出力のためには、書き
込みアドレスを生成する書き込みアドレス生成部と、読
み出しアドレスを生成する読み出しアドレス生成部とを
別々に備えており、前記外部記憶手段からの書き込みを
止めることなく外部へ検索されたデータの読み出しがで
きる。すなわち、前記外部装置から連続に読み出しを行
いながら、検索と検索結果の読み出しとを併せて行う。
(実施例) 以下、図面を参照して本発明の実施例について説明する
第1図は本発明の全文検索装置の一実施例の構成を示す
ブロック図である。
まず、第1図における、本発明の全文検索装置の基本的
構成と構成要素を説明する。
外部記憶手段101は、被検索データを格納するための
ものであり、制御手段103からの命令で被検索データ
を読み出す。外部記憶手段101には磁気ディスク、光
磁気ディスク、CD−ROMル−ザーディスク等が使わ
れる。
検索手段102は、あらかじめ登録されている検索文字
列を外部記憶手段101から送られてくる被検索データ
の中から検索する手段であり、−致した場合は一致信号
を読み出しアドレス生成手段104へ送る。この種の検
索手段102は従来からよく知られた手段であり、例え
ば、文献r文字列のパターンマツチ法」 (花田、情報
処理、第24巻、第4号、第494頁〜第498頁、1
983年4月)に記載されている方法や、文献r文字列
検索LSIJ  (山田・平田・水弁・高欄、電子情報
通信学会技術研究報告CAS87−25.1987年5
月29日)に記載されているLSIなどが用いられる。
メモリ106は、外部記憶手段101から送られるデー
タを一時的に格納するためのものである。
書き込み時は書き込みアドレス生成手段105で生成さ
れるアドレスへ書き込み、読み出し時は読み出しアドレ
ス生成手段104で生成されるアドレスのデータを読み
出す。メモリ106には外部記憶装置より高速な手段、
例えばICメモリなどが用いられる。同時に読み書きの
できるメモリは、FIFOメモリや2ポートメモリなど
、その存在はよく知られているが、書き込みと読み出し
を非同期で行う必要のない場合、通常のメモリを用いて
書き込みクロックと読み出しクロックを交互に送るよう
にしても実現できる。
書き込みアドレス生成手段105は、外部記憶手段10
1から送られるデータが格納されるメモリ106上のア
ドレスを生成する手段であり、メモリ106の最大アド
レスまでカウントした後、0に戻るようなリングカウン
タ等が用いられる。
読み出しアドレス生成手段104は、前記検索手段10
2から受けた一致信号を基に、メモリ106から読み出
すデータのアドレスを生成する手段である。
制御手段103は、外部記憶手段101ヘフアイルの読
み出し要求を行ったり、読み出しアドレス生成手段10
4ヘフアイルの開始/終了を通知したり、書き込みアド
レス生成手段105へ書き込み信号を送るための手段で
ある。該制御手段103にはコンピュータのCPU等が
用いられる。
ただし、該制御手段103から読み出しアドレス生成手
段104へのファイルの開始/終了の通知は、あとで説
明するように、ない場合もありえる。
次に、この全文検索装置の基本動作について説明する。
制御手段103から、外部記憶手段101ヘファイル読
み出し命令が送られる。該外部記憶手段101では、検
索手段102とメモリ106へ被検索データを送る。こ
のとき、制御手段103は書き込みアドレス生成手段1
05へ書き込みクロックを送り、該書き込みアドレス生
成手段105からメモリ106へ書き込むためのアドレ
スが送られる。これにより、外部記憶手段101からの
被検索データは、逐次にメモリ106へ書き込まれる。
一方、検索手段102では、外部記憶手段101から送
られたデータの中から、あらかじめ格納されている検索
文字列を検索する。一致が起こると一致信号が読み出し
アドレス生成手段104へ送られる。該読み出しアドレ
ス生成手段104では、一致信号を受け取り、読み出す
データの開始アドレスと終了アドレスを生成して内部に
格納する。かつ、該読み出しアドレス生成手段104は
、内部に読み出し開始/終了アドレスが格納されると、
読み出し開始アドレスから読み出し終了アドレスまでの
読み出しアドレスを順次に生成してメモリ106へ送り
、検索されたデータを読み出す。
ここで、読み出したアドレス生成手段104について詳
しく説明する。
第2図は読み出しアドレス生成手段104の一興体例の
構成を示す図である。
まず、第2図における、読み出しアドレス生成手段10
4の基本的構成と構成要素を説明する。
読み出し制御装置201は読み出しアドレス生成手段1
04全体の制御を行うためのものであり、コンピュータ
のCPU等が用いられる。
アドレス格納手段203は、メモリ106から読み出す
ための読み出し開始アドレスと読み出し終了アドレスを
格納する手段であり、メモリ等が用いられる。第3図は
アドレス格納手段203の内容を模式的に表わした図で
ある。
読み出しカウンタ204はメモリ106からデータを読
み出すための読み出しアドレスを生成する手段であり、
書き込みアドレス生成手段105と同様なカウンタが用
いられる。
終了判定手段202はアドレス格納手段203へ格納さ
れた終了アドレスを読み出し、読み出しカウンタ204
の計数値と比較し、一致したときに読み出しの終了を読
み出し制御装置201へ知らせる手段である。
次に、読み出しアドレス生成手段104の基本動作につ
いて説明する。ここでは、読み出すメモリ領域が異なる
3つの例について説明する。
1つめの例は、検索中一致が起きたとき、検索結果をフ
ァイル単位で読み出す場合についてである。これには、
まず、制御手段103からファイル読み出し開始信号が
読み出し制御装置201へ出されると、書き込みアドレ
ス生成手段105よリファイル書き込み開始時のカウン
タ値がアドレス格納手段203へ送られ、該アドレス格
納手段203内に設けられたバッファへ格納される。そ
の後、同一ファイル内で検索の一致が起きると、検索手
段102より一致信号が読み出し制御装置201へ送ら
れる。すると、該読み出し制御装置201はアドレス格
納手段203へ信号を送り、バッファに格納されていた
読み出し開始アドレスを正規の開始アドレス格納用メモ
リへ移す。さらに、制御手段103よりファイル読み出
し終了信号が読み出し制御装置201へ送られると、そ
のときの書き込み終了アドレスをアドレス格納手段20
3の終了アドレス格納用メモリへ格納する。
読み出し制御装置201では開始アドレスと終了アドレ
スがそろうと、開始アドレスを読み出しカウンタ204
へ移し、終了アドレスを終了判定手段202へ移し、メ
モリ106からの読み出しを開始する。
第4図はメモリ106内に書き込まれたファイルを模式
的に示した図である。いま、この図に示す如くにファイ
ル内に検索文字列401が見つかったとすると、そのフ
ァイルの読み出し開始アドレス402と読み出し終了ア
ドレス403がアドレス格納手段203へ格納される。
2つめの例は、検索中一致が起きたとき、検索結果とし
て、一致したときのアドレス付近のデータのみを読み出
す場合についてである。この場合、検索の一致が起きる
と、検索手段102より一致信号が読み出し制御装置2
01へ送られる。すると、該読み出し制御装置201は
アドレス格納手段203へ信号を送り、書き込みアドレ
ス生成手段105から一致した時点での書き込みアドレ
スを読み込む。そして、前記書き込みアドレスよりも予
め格納しておいた第1の定数分だけ小さな値を読み出し
カウンタ204へ格納する。また、前記書き込みアドレ
スよりも予め格納しておいた第2の定数分だけ大きな値
を終了判定手段202へ格納する。その後、読み出しカ
ウンタ204を動作させてメモリ106からの読み出し
を開始する。
第5図はメモリ106内に書き込まれたファイルを模式
的に表わしたものである。この図を用いて上記処理を説
明する。検索が一致すると、検索文字列401の一致ア
ドレス405がアドレス格納手段203へ送られ、一致
アドレス405より第1の定数分だけ少ないアドレス4
04が読み出し開始アドレスへ格納される。また、一致
アドレス405より第2の定数分だけ多いアドレス40
6が読み出し終了アドレスへ格納される。この実施例で
は制御手段103から読み出し制御装置201へのファ
イル読み出し開始/終了信号は必要ないが、アドレス4
04がファイルの開始アドレスよりも小さい場合には読
み出し開始アドレスとしてファイル開始アドレスを与え
ることが考えられる。同様に、アドレス406がファイ
ルの終了アドレスよりも大きい場合には読み出し終了ア
ドレスとしてファイル終了アドレスを与えることが考え
られる。
3つめの例は、検索結果として、第1のキーワードによ
る一致から第2のキーワードによる一致までの被検索デ
ータを読み出す場合についてである。これには、第1の
キーワードによる一致が起きると、検索手段102より
一致信号が読み出し制御装置201へ送られる。すると
、該読み出し゛制御装置201はアドレス格納手段20
3へ信号を送り、書き込みアドレス生成手段105から
一致した時点での書き込みアドレスを読み込み、これを
開始アドレスメモリへ格納する。その後、第2のキーワ
ードによる一致が起きると、同様にして書き込みアドレ
ス生成手段105から書き込み終了アドレスを読み込ん
で、アドレス格納手段203の終了アドレスメモリへ格
納する。読み出し制御装置201では開始アドレスと終
了アドレスが揃うと、開始アドレスを読み出しカウンタ
204へ移し、終了アドレスを終了判定手段202へ移
し、メモリ106からの読み出しを開始する。
第6図はメモリ内に書き込まれたファイルを模式的に表
わしたものである。この図を用いて上記処理を説明する
。第1の検索文字列601との一致がおきると、第1の
一致アドレス603が読み出し開始アドレスへ格納され
る。次に第2の一致アドレス602との一致が起きると
第2の一致アドレス604が読み出し終了アドレスへ格
納される。この例でも制御手段103から読み出し制御
装置201へのファイル読み出し開始/終了信号は必要
ないが、第2の検索文字列が検索される前にファイルの
終了信号がきた場合、格納された読み出し開始アドレス
をキャンセルすることも考えられる。
上記のように3つの例について説明したが、これらは互
いに独立である必要はなく、これらを組み合わせて検索
結果の出力をより細かく制御することが可能である。
(発明の効果) このように本発明の全文検索装置によれば、外部記憶手
段からの検索データを検索すると同時にメモリへの格納
している。そのため外部記憶手段から検索結果を再度読
み出す必要がなく、効率がよい。さらに、メモリへの書
き込みと読み出しが同時にできるから、検索結果を読み
出す間でも次の検索が実行できるという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図はその実施例における読み出しアドレス生成手段の
一興体例の構成を示すブロック図、第3図は第2のアド
レス格納手段203における格納内容を例示する図、第
4図乃至第6図は第1図のメモリ106に書き込まれた
ファイルを模式的に示す図、第7図は従来の全文検索装
置の構成を示すブロック図である。 101・・・外部記憶手段、102・・・検索手段、1
03・・・制御手段、104・・・読み出しアドレス生
成手段、105・・・書き込みアドレス生成手段、10
6・・・メモリ。 01 ( 第1図

Claims (1)

    【特許請求の範囲】
  1. 外部記憶手段に格納されている被検索データについて全
    文検索を行う全文検索装置において、前記外部記憶手段
    から読み出されるデータを順次に格納していくメモリと
    、前記メモリへの書き込みアドレスの生成を行う書き込
    みアドレス生成手段と、前記外部記憶手段から送られる
    データの中から予め記憶されているデータの検索を行う
    検索手段と、前記検索手段から出力される一致信号を受
    け取って現在検索されているファイルの前記メモリ上に
    おける一部分または全部分の読み出し開始アドレスと読
    み出し終了アドレスを格納し、かつ該読み出し開始アド
    レスから該読み出し終了アドレスまでの読み出しアドレ
    スを順次に生成する読み出しアドレス生成手段とを備え
    て成ることを特徴とする全文検索装置。
JP1335398A 1989-12-25 1989-12-25 全文検索装置 Pending JPH03196260A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1335398A JPH03196260A (ja) 1989-12-25 1989-12-25 全文検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1335398A JPH03196260A (ja) 1989-12-25 1989-12-25 全文検索装置

Publications (1)

Publication Number Publication Date
JPH03196260A true JPH03196260A (ja) 1991-08-27

Family

ID=18288099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1335398A Pending JPH03196260A (ja) 1989-12-25 1989-12-25 全文検索装置

Country Status (1)

Country Link
JP (1) JPH03196260A (ja)

Similar Documents

Publication Publication Date Title
JPH03196260A (ja) 全文検索装置
JP3180336B2 (ja) 多層バッファを用いるデータアクセス方法
JPH02108157A (ja) 情報検索方法
JPH043251A (ja) 文書検索方法および文書検索処理装置
JPH02116936A (ja) 再編成方式
JPS6143734B2 (ja)
JP2661223B2 (ja) Pos端末制御装置
JPH06149897A (ja) 電子ファイル装置の文書画像検索方法
JPS63291145A (ja) ファイル管理方法
JP2003323449A (ja) データベース検索装置および検索方法ならびに記憶媒体、プログラム
JPS633351A (ja) バツフア検索制御方式
JPS62118453A (ja) フアイル管理装置
JPS59133640A (ja) メモリ制御方式
JPH0752451B2 (ja) 情報検索装置
JPH0664599B2 (ja) 文書ファイル検索装置
JPH06149647A (ja) マルチメディアファイル管理方式
JPH05128050A (ja) 電子計算機システムにおけるデータ検索制御方法
JPH04250568A (ja) レコード検索装置
JPH0516608B2 (ja)
JPS60235257A (ja) 問合せデ−タ処理装置
JPH02257282A (ja) 作表処理装置
JPH05334362A (ja) メッセージを管理する処理装置
JPH01129324A (ja) データ検索装置
JPH02157934A (ja) 可変長データ処理装置
JPH01282630A (ja) データベース検索情報一時蓄積システム