JPH09223152A - Document retrieval device - Google Patents

Document retrieval device

Info

Publication number
JPH09223152A
JPH09223152A JP8029354A JP2935496A JPH09223152A JP H09223152 A JPH09223152 A JP H09223152A JP 8029354 A JP8029354 A JP 8029354A JP 2935496 A JP2935496 A JP 2935496A JP H09223152 A JPH09223152 A JP H09223152A
Authority
JP
Japan
Prior art keywords
document
index data
search
index
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8029354A
Other languages
Japanese (ja)
Inventor
Yasuo Tanosaki
康雄 田野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8029354A priority Critical patent/JPH09223152A/en
Publication of JPH09223152A publication Critical patent/JPH09223152A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a document retrieval device capable of instantaneously processing a newly registered document file as an object to be retrieved and attaining efficient resource management. SOLUTION: When a new document file is inputted by a new document input part 15, a retrieval index preparing part 16 prepares index data corresponding to the newly registered document file and stores the prepared data in a memory 13 and a document retrieving part 12 retrieves document files by using the index data of the new document file stored in the memory 13 and that of an existing document file stored in a disk device 17. Thereby the new document can be instantaneously processed as an object to be retrieved without waiting the storage of the index data corresponding to the new document in the disk device 17.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、膨大な数の文書
ファイルの中から指定されたキーワードを含む文書ファ
イルを検索する文書検索装置に係り、特に文書ファイル
を高速に検索するためのインデックスデータを予め作成
しておき、このインデックスデータを用いて文書ファイ
ルを検索するタイプの文書検索装置において、新規に登
録された文書ファイルを即座に検索対象とし、かつ効率
的な資源管理を実現することのできる文書検索装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieval apparatus for retrieving a document file containing a specified keyword from a huge number of document files, and more particularly to index data for fast retrieval of document files. In a document retrieval device of a type that is created in advance and retrieves a document file using this index data, a newly registered document file can be immediately targeted for retrieval, and efficient resource management can be realized. The present invention relates to a document search device.

【0002】[0002]

【従来の技術】近年、ワードプロセッサなどの普及に伴
なって、膨大な数の文書ファイルの中からユーザが必要
とする文書ファイルを探し出す文書検索システムが種々
開発されている。このような文書検索システムでは、ユ
ーザに所望のキーワードを入力させ、このキーワードを
含んだ文書ファイルを検索してその検索結果を一覧表示
するといったものが主流となっている。
2. Description of the Related Art In recent years, with the widespread use of word processors and the like, various document search systems have been developed for searching for a document file required by a user from a huge number of document files. In such a document search system, a method in which a user inputs a desired keyword, a document file including the keyword is searched, and the search result is displayed in a list is mainly used.

【0003】現在、このようなキーワード検索を行なう
文書検索装置としては、予め検索用のインデックスを作
成しておき、ディスクなどに格納して高速検索を実現す
るものと、検索用インデックスは作成せず、検索実行時
に文書のテキストデータを直接検索するものとに大きく
分けられる。
Currently, as a document retrieval apparatus for performing such a keyword retrieval, an index for retrieval is prepared in advance and stored in a disk or the like to realize high-speed retrieval, and a retrieval index is not prepared. , It is roughly divided into the one that directly searches the text data of the document when executing the search.

【0004】前者の方法では、計算機の処理能力の向上
に伴なって、インデックスの作成に多くの時間を費やす
ことはなくなったが、たとえばディスクなどの二次記憶
装置の入出力処理には依然として多くの時間を費やして
しまうため、たとえばメールやニュースの記事のような
新規に入力された文書を検索する場合、検索を実行する
前に、ユーザはその作成したインデックスが二次記憶装
置に格納されるまでの多くの時間、新規文書についての
検索を待機させられることになり、インデックスを利用
するメリットが生かされない。
The former method does not spend a lot of time for index creation as the processing capacity of a computer is improved, but it is still large for input / output processing of a secondary storage device such as a disk. Therefore, when searching a newly entered document such as an email or news article, the user stores the created index in the secondary storage device before executing the search. It takes a lot of time to wait for a search for a new document, and the merit of using the index is not utilized.

【0005】一方、後者の方法では、このようなインデ
ックスの格納完了をユーザに待機させるといった不具合
は生じないが、検索速度自体が比較的遅く、大量の文書
の検索には適していない。また、検索試行を繰り返し、
複数のキーワードを入力して候補文書を絞りこんでいく
といった高機能処理を想定した場合、前者のほうが効率
がよいことは明白である。
On the other hand, the latter method does not cause such a problem that the user waits for the completion of the storage of such an index, but the retrieval speed itself is relatively slow and is not suitable for retrieval of a large number of documents. Also, repeat the search trial,
It is clear that the former is more efficient in the case of high-performance processing such as inputting a plurality of keywords and narrowing down candidate documents.

【0006】[0006]

【発明が解決しようとする課題】このように、従来の文
書検索システムでは、検索インデックスを予め作成する
場合には、その検索インデックスの格納段階に要する時
間が大きいため、新規登録文書を即座に検索対象とする
ことができないといった問題があり、一方、検索インデ
ックスを作成しない場合には、その検索インデックスの
格納段階に要する時間が不要となる結果、新規登録文書
を即座に検索対象とすることができる反面、検索自体に
多くの時間を費やしてしまうといった問題があった。
As described above, in the conventional document search system, when a search index is created in advance, it takes a long time to store the search index, so that a newly registered document is immediately searched. However, if a search index is not created, the time required to store the search index becomes unnecessary, and as a result, a newly registered document can be immediately searched. On the other hand, there is a problem that the search itself spends a lot of time.

【0007】この発明はこのような実情に鑑みてなされ
たものであり、検索用のインデックスを用いて高速検索
を図る文書検索装置において、新規文書を検索する際、
検索インデックスを作成する場合に生じる不具合を極力
小さくする文書検索装置を提供することを目的とする。
The present invention has been made in view of the above circumstances, and when a new document is searched for in a document search device for high-speed search using a search index,
An object of the present invention is to provide a document search device that minimizes the problems that occur when creating a search index.

【0008】[0008]

【課題を解決するための手段】この発明は、複数の文書
ファイルの中から所望のキーワードを含む文書ファイル
を検索する文書検索装置であって、前記文書ファイルを
高速に検索するためのインデックスデータを予め作成し
ておき、このインデックスデータを用いて前記文書ファ
イルを検索する文書検索装置において、新たな文書ファ
イルを登録する新規文書登録手段と、この新たに登録さ
れた文書ファイルに対応するインデックスデータを作成
してメモリに格納するインデックス作成手段と、前記メ
モリに格納された新規文書ファイルのインデックスデー
タおよび二次記憶装置に格納された既存の文書ファイル
のインデックスデータの双方を用いて文書ファイルを検
索する文書検索手段とを具備してなることを特徴とす
る。
SUMMARY OF THE INVENTION The present invention is a document retrieval device for retrieving a document file containing a desired keyword from a plurality of document files, wherein index data for retrieving the document file at high speed is provided. In a document search device that is created in advance and uses the index data to search for the document file, a new document registration means for registering a new document file and index data corresponding to the newly registered document file are provided. A document file is searched using both the index creating means for creating and storing it in the memory, and the index data of the new document file stored in the memory and the index data of the existing document file stored in the secondary storage device. And a document search means.

【0009】この発明によれば、新たに登録された文書
ファイルに対応するインデックスデータは、その格納に
比較的大きな時間を要するディスク装置などの二次記憶
装置に格納されるのではなく、比較的格納時間の短いメ
モリにまず格納される。そして、文書ファイルの検索
は、このメモリに格納された新規文書のインデックスデ
ータと、ディスク装置などに格納された既存の文書のイ
ンデックスデータとの双方が利用されて行なわれる。
According to the present invention, the index data corresponding to the newly registered document file is not stored in a secondary storage device such as a disk device which requires a relatively long time to store the index data, but rather in a comparative manner. It is first stored in a memory with a short storage time. Then, the search for the document file is performed by using both the index data of the new document stored in this memory and the index data of the existing document stored in the disk device or the like.

【0010】これにより、新規文書に対応したインデッ
クスデータがディスク装置に格納されるのを、ユーザに
待機させるなどといったことがなくなり、インデックス
データを用いた高速検索を実行する場合であっても、新
規文書を即座に検索対象とすることが可能となる。
As a result, the user does not have to wait for the index data corresponding to the new document to be stored in the disk device, and even if a high speed search using the index data is executed, It becomes possible to immediately search a document.

【0011】また、この発明は、前記新規文書登録手段
によって登録された新規文書ファイルのうち、いずれの
文書ファイルに対応するインデックスデータを作成する
のかをユーザに選択させる新規文書選択手段をさらに具
備し、前記インデックス作成手段は、前記新規文書選択
手段によって選択指示された文書ファイルに対応するイ
ンデックスデータのみを作成して前記メモリに格納する
手段を具備してなることを特徴とする。
The present invention further comprises new document selecting means for allowing the user to select which of the new document files registered by the new document registering means the index data corresponding to which is to be created. The index creating means is provided with means for creating only index data corresponding to the document file selected and instructed by the new document selecting means and storing the index data in the memory.

【0012】新規に登録される複数の文書ファイルは、
たとえばその文書のジャンルやカテゴリなどによって、
ユーザが今後も高速に検索される対象としたい文書ファ
イルと、取り敢えず格納されていれば良いといった文書
ファイルとに分類されるが、これらの文書ファイルは新
規文書として混在していることが通常であるため、新規
に登録される文書ファイルすべてについてインデックス
データを作成するのではなく、ユーザが選択したものの
み作成するといった管理を行なうことが望ましい。これ
により、不必要にメモリなどの資源を費やすことを防止
し、かつ、インデックスデータの量を制限する結果、効
率的な検索が実現されることとなる。
A plurality of newly registered document files are
For example, depending on the genre and category of the document,
Document files are classified into document files that the user wants to search at high speed in the future and document files that should be stored first, but these document files are usually mixed as new documents. Therefore, it is desirable to manage such that index data is not created for all newly registered document files, but only those selected by the user. As a result, it is possible to prevent unnecessary consumption of resources such as a memory and to limit the amount of index data, so that an efficient search can be realized.

【0013】また、この発明は、前記メモリに格納され
たインデックスデータのみを用いて検索する第1の検
索、前記二次記憶装置に格納されたインデックスデータ
のみを用いて検索する第2の検索、および前記メモリに
格納されたインデックスデータならびに前記二次記憶装
置に格納されたインデックスデータの双方を用いて検索
する第3の検索のいずれかを検索範囲としてユーザに指
定させる検索範囲指定手段をさらに具備し、前記文書検
索手段は、前記検索範囲指定手段の指定にしたがって検
索を実施する手段を具備してなることを特徴とする。
Further, according to the present invention, a first search is performed using only the index data stored in the memory, and a second search is performed using only the index data stored in the secondary storage device. And a search range designating unit that allows the user to designate, as a search range, any one of the third searches using both the index data stored in the memory and the index data stored in the secondary storage device. However, the document search means includes means for performing a search according to the designation of the search range designation means.

【0014】すなわち、メモリに格納された新規文書の
インデックスデータと、二次記憶装置に格納された既存
文書のインデックスデータとをどのように利用するかを
ユーザに選択させれば、新規文書のみの検索や、既存文
書のみの検索、あるいは双方を含んだ検索などといっ
た、複数の検索範囲が設定可能な柔軟な検索環境をユー
ザに提供できることになる。
That is, if the user selects how to use the index data of the new document stored in the memory and the index data of the existing document stored in the secondary storage device, only the new document can be selected. It is possible to provide the user with a flexible search environment in which a plurality of search ranges can be set, such as a search, a search only for existing documents, or a search including both.

【0015】また、この発明は、前記メモリに格納され
たインデックスデータを前記二次記憶装置に格納するか
否かをユーザに指示させる格納指示手段と、前記二次記
憶装置への格納が指示されたときに、前記メモリに格納
されたインデックスデータを前記二次記憶装置に格納す
る格納手段とをさらに具備してなることを特徴とする。
Further, according to the present invention, storage instruction means for instructing a user whether or not to store the index data stored in the memory in the secondary storage device, and storage in the secondary storage device are instructed. And a storage unit for storing the index data stored in the memory in the secondary storage device.

【0016】この発明によれば、メモリに格納された新
規文書のインデックスデータを二次記憶装置に格納する
か否かをユーザに選択させるといったことを行なうた
め、必ずしもすべてのインデックスデータを二次記憶装
置に格納することなく、たとえば一度検索して不要と感
じたインデックスデータを破棄することも可能となり、
より効率的な資源管理が実現されることとなる。
According to the present invention, the user is allowed to select whether to store the index data of the new document stored in the memory in the secondary storage device, so that all the index data are not necessarily stored in the secondary storage. Without storing it in the device, it is also possible to search once and discard index data that you feel is unnecessary,
More efficient resource management will be realized.

【0017】また、この発明は、前記メモリに格納され
たインデックスデータが所定の期間を越えて用いられな
かったときに、このインデックスデータを破棄する手段
をさらに具備してなることを特徴とする。
Further, the present invention is characterized by further comprising means for discarding the index data when the index data stored in the memory has not been used for a predetermined period.

【0018】また、この発明は、前記メモリに格納され
たインデックスデータが所定の期間を越えて用いられな
かったときに、このインデックスデータを前記二次記憶
装置に退避させる手段をさらに具備してなることを特徴
とする。
The present invention further comprises means for saving the index data stored in the memory in the secondary storage device when the index data has not been used for a predetermined period. It is characterized by

【0019】すなわち、この発明によれば、この新規文
書のインデックスデータの格納有無をユーザに判断させ
るのではなく、たとえば所定の期間を越えて利用がなか
ったときに破棄する、あるいは所定の期間を越えて利用
がなかったときに二次記憶装置に退避するなどどいった
ことを行なうことにより、その使い勝手を飛躍的に向上
させることができる。
That is, according to the present invention, the user is not allowed to judge whether or not the index data of the new document is stored, but the index data is discarded when it has not been used for a predetermined period of time, or a predetermined period of time has passed. By doing something such as saving to the secondary storage device when there is no use beyond it, the usability can be dramatically improved.

【0020】[0020]

【発明の実施の形態】以下、図面を参照してこの発明の
一実施形態を説明する。図1は本実施形態に係る文書検
索装置の概略構成を示す図である。この文書検索装置1
0は、図1に示したように、インタフェース部11、文
書検索部12、メモリ13、文書管理部14、新規文書
入力部15、検索インデックス作成部16、およびディ
スク装置17を備えてなる。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a schematic configuration of a document search device according to the present embodiment. This document retrieval device 1
As shown in FIG. 1, 0 includes an interface unit 11, a document search unit 12, a memory 13, a document management unit 14, a new document input unit 15, a search index creation unit 16, and a disk device 17.

【0021】インタフェース部11は、ユーザと文書検
索装置10とのインタフェースを司り、たとえばキーボ
ードや、マウスなどのポインティングデバイスを介して
ユーザの指示を取り込むとともに、ディスプレイを介し
てユーザに処理結果などの各種画面を呈示する。文書検
索部12は、インタフェース部11を介して通知される
検索指示にしたがって、ディスク装置17に格納された
複数の文書ファイル172の中から該当する文書ファイ
ルを検索する。この検索指示には、検索すべきキーワー
ドや検索範囲などが含まれる。なお、この検索範囲は、
本実施形態の特徴の一つであり、これについては後述す
る。
The interface unit 11 administers an interface between the user and the document retrieval apparatus 10, and takes in a user's instruction via a pointing device such as a keyboard or a mouse, and also displays various processing results to the user via a display. Present the screen. The document retrieval unit 12 retrieves the corresponding document file from the plurality of document files 172 stored in the disk device 17 according to the retrieval instruction notified via the interface unit 11. The search instruction includes a keyword to be searched, a search range, and the like. This search range is
This is one of the features of this embodiment, which will be described later.

【0022】メモリ13は、検索インデックス作成部1
6によって作成された新規登録文書のインデックスデー
タを保持する。文書管理部14は、新規文書が登録され
た際に、この中のどの文書ファイルについてインデック
スデータを作成するのかをユーザに選択させるべく、新
規文書の一覧をインタフェース部11によりユーザに呈
示し、この呈示に対してユーザが行なった選択結果を検
索インデックス作成部16に通知する。
The memory 13 has a search index creating section 1
The index data of the newly registered document created by No. 6 is held. When a new document is registered, the document management unit 14 presents a list of new documents to the user through the interface unit 11 so that the user can select which document file to create index data for. The search index creation unit 16 is notified of the selection result made by the user for the presentation.

【0023】新規文書入力部15は、文書管理部14の
指示にしたがって、新たな文書ファイルを入力しディス
ク装置17に登録する。検索インデックス作成部16
は、この新規文書入力部15がディスク装置17に登録
した新規文書ファイルのうち、文書管理部14によって
指示された文書ファイルに対応したインデックスデータ
を作成してメモリ13に格納する。
The new document input unit 15 inputs a new document file according to the instruction of the document management unit 14 and registers it in the disk device 17. Search index creation unit 16
The new document input unit 15 creates index data corresponding to the document file instructed by the document management unit 14 among the new document files registered in the disk device 17, and stores it in the memory 13.

【0024】次に、図2を参照して本実施形態の動作に
ついて説明する。本実施形態の文書検索装置10は、そ
の起動が開始されると、まず初期化処理が実行され(ス
テップS1)、各処理部およびメモリなどが初期状態と
なる。そして、この初期化処理が終了すると、文書管理
部14は、新規文書入力部15に新規文書ファイルのロ
ードを指示する(ステップS2)。この指示を受け取っ
た新規文書入力部15は、たとえば新たに配信された文
書ファイルをディスク装置17に格納する。
Next, the operation of this embodiment will be described with reference to FIG. When the document search apparatus 10 according to the present embodiment is started, the initialization process is first executed (step S1), and each processing unit, the memory, and the like are initialized. Then, when this initialization processing ends, the document management unit 14 instructs the new document input unit 15 to load the new document file (step S2). Upon receiving this instruction, the new document input unit 15 stores the newly distributed document file in the disk device 17, for example.

【0025】次に、文書管理部14は、この新規文書入
力部15が新たにディスク装置17に格納した新規文書
ファイルのうち、どの文書ファイルについて検索インデ
ックスを作成するのかをユーザに選択指示させるべく、
インタフェース部11にその新規文書の一覧表示および
選択結果の通知を指示する(ステップS3)。ユーザに
よる選択結果がインタフェース部11を介して通知され
ると、文書管理部14は、検索インデックス作成部16
に、その選択された文書ファイルに対応する索引インデ
ックスの作成を指示する(ステップS4)。
Next, the document management unit 14 allows the user to select and instruct which of the new document files newly stored in the disk device 17 by the new document input unit 15 the search index is to be created. ,
The interface unit 11 is instructed to display the list of the new documents and notify the selection result (step S3). When the selection result by the user is notified via the interface unit 11, the document management unit 14 causes the search index creation unit 16 to
Is instructed to create an index index corresponding to the selected document file (step S4).

【0026】一方、この指示を受けた検索インデックス
作成部16は、ディスク装置17の該当する文書ファイ
ル172を読み込み、この文書ファイルに対応した索引
インデックスを作成してメモリ13に格納する。この索
引インデックスの作成は、たとえば文書ファイル中の語
句に対して形態素解析を施し、冗長的な文書を名詞句か
らなる簡潔な文書に変換することによって作成するなど
といった、キーワードを検索するのに適した形式でのデ
ータ作成が行なわれる。また、ここでは、ディスク装置
17への格納は行なわないため、必要以上にユーザを待
機させることもない。
On the other hand, upon receipt of this instruction, the search index creating section 16 reads the corresponding document file 172 of the disk device 17, creates an index index corresponding to this document file, and stores it in the memory 13. This index index is suitable for searching keywords, for example, by performing morphological analysis on words and phrases in a document file and converting redundant documents into concise documents consisting of noun phrases. Data is created in the specified format. Further, here, since the data is not stored in the disk device 17, the user is not made to wait more than necessary.

【0027】したがって、この段階では、本実施形態の
文書検索装置10は、新規文書ファイルについての検索
インデックスは、メモリ13に保持し、既存の文書ファ
イルについての検索インデックスは、ディスク装置17
に保持している状態にあることとなる。
Therefore, at this stage, the document search apparatus 10 of this embodiment holds the search index for the new document file in the memory 13, and the search index for the existing document file as the disk device 17.
It will be in the state of holding.

【0028】ここで、ユーザは、文書検索を行なう際、
まず、キーワードの入力と(ステップS5)、検索範囲
の指定(ステップS6)を行なう。この検索範囲は、メ
モリ13に格納された索引インデックスのみを使用した
新規文書ファイルの範囲内での検索、またはメモリ13
に格納された索引インデックスならびにディスク装置1
7に格納された索引インデックスの双方を使用した、新
規文書ファイルおよび既存の文書ファイルすべてを範囲
内とした検索のいずれかが選択されることになる。
Here, when the user searches for documents,
First, a keyword is input (step S5) and a search range is designated (step S6). This search range is a search within the range of a new document file using only the index index stored in the memory 13 or the memory 13
Index index stored in disk and disk device 1
Either the new document file or the search within the range of all the existing document files using both of the index indexes stored in 7 will be selected.

【0029】この検索範囲の指定が新規文書のみであっ
た場合(ステップS7のY)、その指定はインタフェー
ス部11から文書検索部12にその旨とキーワードが引
き渡され、文書検索部12は、メモリ13に格納された
索引インデックスのみを用いて、すなわち、新規登録文
書のみを検索範囲としてそのキーワードを含む文書ファ
イルを検索する(ステップS8)。一方、検索範囲の指
定が新規文書のみでなかった場合(ステップS7の
N)、その指定はインタフェース部11から文書検索部
12にその旨とキーワードが引き渡され、文書検索部1
2は、メモリ13に格納された索引インデックスと、デ
ィスク装置17に格納された索引インデックスとの双方
を用いて、すなわち、新規登録文書と既存の文書との双
方を検索範囲としてそのキーワードを含む文書ファイル
を検索する(ステップS9)。
When the search range is specified only for a new document (Y in step S7), the specification and the keyword are passed from the interface unit 11 to the document search unit 12, and the document search unit 12 stores in the memory. Only the index index stored in 13 is used, that is, only the newly registered document is set as the search range to search the document file including the keyword (step S8). On the other hand, when the designation of the search range is not only for the new document (N in step S7), the designation and the keyword are passed from the interface unit 11 to the document search unit 12, and the document search unit 1
Reference numeral 2 denotes a document that includes both the index index stored in the memory 13 and the index index stored in the disk device 17, that is, a document including the keyword as a search range for both a newly registered document and an existing document. A file is searched (step S9).

【0030】そして、文書検索部12は、その検索結果
をインタフェース部11を介してユーザに呈示する(ス
テップS10)。これにより、ユーザは、インデックス
データを用いた文書検索においても、新規文書を即座に
検索対象とすることができることとなる。
Then, the document search section 12 presents the search result to the user via the interface section 11 (step S10). As a result, the user can immediately search for a new document even in the document search using the index data.

【0031】このメモリ13に格納された索引インデッ
クスは、ユーザによってディスク装置17に既存の文書
ファイルの索引インデックスとして格納しておくか否か
が指示され(ステップS11)、ディスク装置17に格
納する場合には(ステップS11のY)、その旨がイン
タフェース部11から文書管理部14に通知され、この
通知を受けた文書管理部14は、メモリ13に格納され
ている索引インデックスをディスク装置17に格納する
(ステップS12)。
When the index index stored in the memory 13 is to be stored in the disk device 17 by the user, it is instructed whether or not to store it in the disk device 17 as an index index of an existing document file (step S11). (Y in step S11), the interface unit 11 notifies the document management unit 14 of the fact, and the document management unit 14 having received this notification stores the index index stored in the memory 13 in the disk device 17. Yes (step S12).

【0032】そして、文書管理部14は、メモリ13に
格納されている索引インデックスを消去して(ステップ
S13)、次の新規文書ファイルのロード(ステップS
2)に備える。
Then, the document management unit 14 erases the index index stored in the memory 13 (step S13), and loads the next new document file (step S13).
Prepare for 2).

【0033】これにより、新たに登録された文書ファイ
ルについても、その索引インデックスのディスク装置へ
の格納を待機することがないため、新たに登録された文
書を即座に検索対象とすることが可能となる。また、索
引インデックスのディスク装置17への格納有無を選択
することができるため、効率的な資源管理を実現でき
る。
As a result, even for a newly registered document file, there is no need to wait for storage of the index index in the disk device, so that the newly registered document can be immediately searched. Become. Further, since it is possible to select whether or not the index index is stored in the disk device 17, it is possible to realize efficient resource management.

【0034】なお、メモリ13に格納された新規文書フ
ァイルをユーザの選択によってディスク装置17に格納
するか否かを決定するのではなく、たとえば文書管理部
14が次のように管理するのも有効である。 (1)メモリ13に格納された索引インデックスが所定
の期間を越えて使用されなかったときに、その索引イン
デックスをメモリ13上から消去する。 (2)メモリ13に格納された索引インデックスが所定
の期間を越えて使用されなかったときに、その索引イン
デックスをディスク装置17に退避させる(メモリ13
上からは消去する)。 これにより、メモリ13の有効利用が図られるととも
に、その使い勝手は飛躍的に向上する。
It is also effective that the document management unit 14 manages the new document file stored in the memory 13 as follows instead of deciding whether to store the new document file in the disk device 17 according to the user's selection. Is. (1) When the index index stored in the memory 13 has not been used for a predetermined period of time, the index index is deleted from the memory 13. (2) When the index index stored in the memory 13 has not been used for a predetermined period of time, the index index is saved in the disk device 17 (memory 13
Erase from above). As a result, the memory 13 can be effectively used, and its usability is dramatically improved.

【0035】[0035]

【発明の効果】以上詳述したように、この発明によれ
ば、インデックスデータを用いて高速検索を実行するタ
イプの文書検索装置においても、新規に登録した文書フ
ァイルを即座に検索対象として取り込むことが可能とな
り、また、新規文書のみの検索や既存の文書を含めた検
索など、より柔軟な検索が実施でき、さらに、メモリ上
に常駐させるインデックスデータを所定の規則にしたが
って二次記憶装置に格納し直すため、効率的な資源管理
が行なわれることとなる。
As described in detail above, according to the present invention, a newly registered document file can be immediately incorporated as a search target even in a document search device of a type that executes high-speed search using index data. In addition, more flexible searches such as searches for new documents only and searches for existing documents can be performed. Furthermore, index data to be resident in memory is stored in the secondary storage device according to prescribed rules. As a result, the resources will be efficiently managed.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施形態の文書検索装置の概略構成
を示す図。
FIG. 1 is a diagram showing a schematic configuration of a document search device according to an embodiment of the present invention.

【図2】同実施形態の動作を説明するためのフローチャ
ート。
FIG. 2 is a flowchart for explaining the operation of the same embodiment.

【符号の説明】[Explanation of symbols]

10…文書検索装置、11…インタフェース部、12…
文書検索部、13…メモリ、14…文書管理部、15…
新規文書入力部、16…検索インデックス作成部、17
…ディスク装置、171…検索インデックス、172…
文書ファイル。
10 ... Document search device, 11 ... Interface unit, 12 ...
Document search unit, 13 ... Memory, 14 ... Document management unit, 15 ...
New document input unit, 16 ... Search index creation unit, 17
... Disk device, 171 ... Search index, 172 ...
Document file.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/401 340A ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI technical display location G06F 15/401 340A

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数の文書ファイルの中から所望のキー
ワードを含む文書ファイルを検索する文書検索装置であ
って、前記文書ファイルを高速に検索するためのインデ
ックスデータを予め作成しておき、このインデックスデ
ータを用いて前記文書ファイルを検索する文書検索装置
において、 新たな文書ファイルを登録する新規文書登録手段と、 この新たに登録された文書ファイルに対応するインデッ
クスデータを作成してメモリに格納するインデックス作
成手段と、 前記メモリに格納された新規文書ファイルのインデック
スデータおよび二次記憶装置に格納された既存の文書フ
ァイルのインデックスデータの双方を用いて文書ファイ
ルを検索する文書検索手段とを具備してなることを特徴
とする文書検索装置。
1. A document retrieval device for retrieving a document file containing a desired keyword from a plurality of document files, wherein index data for fast retrieval of the document file is created in advance, and the index data is created. In a document retrieval device for retrieving the document file using data, a new document registration means for registering a new document file, and an index for creating index data corresponding to the newly registered document file and storing it in a memory And a document search unit for searching the document file using both the index data of the new document file stored in the memory and the index data of the existing document file stored in the secondary storage device. A document retrieval device characterized by:
【請求項2】 前記新規文書登録手段によって登録され
た新規文書ファイルのうち、いずれの文書ファイルに対
応するインデックスデータを作成するのかをユーザに選
択させる新規文書選択手段をさらに具備し、 前記インデックス作成手段は、前記新規文書選択手段に
よって選択指示された文書ファイルに対応するインデッ
クスデータのみを作成して前記メモリに格納する手段を
具備してなることを特徴とする請求項1記載の文書検索
装置。
2. A new document selecting means for allowing a user to select which of the new document files registered by said new document registering means the index data corresponding to which document file is to be created, the index creation 2. The document search device according to claim 1, wherein the means comprises means for creating only index data corresponding to the document file selected and instructed by the new document selecting means and storing the index data in the memory.
【請求項3】 前記メモリに格納されたインデックスデ
ータのみを用いて検索する第1の検索、前記二次記憶装
置に格納されたインデックスデータのみを用いて検索す
る第2の検索、および前記メモリに格納されたインデッ
クスデータならびに前記二次記憶装置に格納されたイン
デックスデータの双方を用いて検索する第3の検索のい
ずれかを検索範囲としてユーザに指定させる検索範囲指
定手段をさらに具備し、 前記文書検索手段は、前記検索範囲指定手段の指定にし
たがって検索を実施する手段を具備してなることを特徴
とする請求項1または2記載の文書検索装置。
3. A first search for searching using only the index data stored in the memory, a second search for searching using only the index data stored in the secondary storage device, and a memory for searching the memory. The document further includes a search range designating unit that allows a user to designate, as a search range, any one of a third search that is performed using both the stored index data and the index data stored in the secondary storage device. 3. The document search device according to claim 1, wherein the search means comprises means for performing a search according to the designation of the search range designation means.
【請求項4】 前記メモリに格納されたインデックスデ
ータを前記二次記憶装置に格納するか否かをユーザに指
示させる格納指示手段と、 前記二次記憶装置への格納が指示されたときに、前記メ
モリに格納されたインデックスデータを前記二次記憶装
置に格納する格納手段とをさらに具備してなることを特
徴とする請求項1、2または3記載の文書検索装置。
4. A storage instructing means for instructing a user whether or not to store the index data stored in the memory in the secondary storage device, and a storage instructing means for instructing a user to store the index data in the secondary storage device, 4. The document search device according to claim 1, further comprising a storage unit that stores the index data stored in the memory in the secondary storage device.
【請求項5】 前記メモリに格納されたインデックスデ
ータが所定の期間を越えて用いられなかったときに、こ
のインデックスデータを破棄する手段をさらに具備して
なることを特徴とする請求項1、2または3記載の文書
検索装置。
5. The method according to claim 1, further comprising means for discarding the index data when the index data stored in the memory has not been used for a predetermined period. Alternatively, the document search device described in 3.
【請求項6】 前記メモリに格納されたインデックスデ
ータが所定の期間を越えて用いられなかったときに、こ
のインデックスデータを前記二次記憶装置に退避させる
手段をさらに具備してなることを特徴とする請求項1、
2または3記載の文書検索装置。
6. When the index data stored in the memory has not been used for a predetermined period of time, the index data is further stored in the secondary storage device. Claim 1,
The document search device described in 2 or 3.
JP8029354A 1996-02-16 1996-02-16 Document retrieval device Pending JPH09223152A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8029354A JPH09223152A (en) 1996-02-16 1996-02-16 Document retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8029354A JPH09223152A (en) 1996-02-16 1996-02-16 Document retrieval device

Publications (1)

Publication Number Publication Date
JPH09223152A true JPH09223152A (en) 1997-08-26

Family

ID=12273882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8029354A Pending JPH09223152A (en) 1996-02-16 1996-02-16 Document retrieval device

Country Status (1)

Country Link
JP (1) JPH09223152A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269753A (en) * 2007-04-25 2008-11-06 Kenwood Corp Reproducing device, program, and reproducing method
JP2011022922A (en) * 2009-07-17 2011-02-03 Nec Corp Document management system, document management method and program
US8301603B2 (en) 2006-10-06 2012-10-30 Nec Corporation Information document search system, method and program for partitioned indexes on a time series in association with a backup document storage
US8452788B2 (en) 2007-10-05 2013-05-28 Nec Corporation Information retrieval system, registration apparatus for indexes for information retrieval, information retrieval method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301603B2 (en) 2006-10-06 2012-10-30 Nec Corporation Information document search system, method and program for partitioned indexes on a time series in association with a backup document storage
JP2008269753A (en) * 2007-04-25 2008-11-06 Kenwood Corp Reproducing device, program, and reproducing method
US8452788B2 (en) 2007-10-05 2013-05-28 Nec Corporation Information retrieval system, registration apparatus for indexes for information retrieval, information retrieval method and program
JP2011022922A (en) * 2009-07-17 2011-02-03 Nec Corp Document management system, document management method and program

Similar Documents

Publication Publication Date Title
KR100489913B1 (en) Document display system and electronic dictionary
EP0536077B1 (en) Method and system for enhancing interactive query of a database
US5220625A (en) Information search terminal and system
JP2003058414A (en) Server, web contents editing device, program for realizing these by using computer, and their editing method and method for providing web contents
JPH0528190A (en) Information retrieval terminal equipment
JPH07175825A (en) Document retrieving/displaying method
JPH08235160A (en) Method and device for document retrieval
JPH10289240A (en) Image processor and its control method
JPH09223152A (en) Document retrieval device
JP2008234078A (en) Information processor, information processing method, information processing program, and recording medium in which information processing program is recorded
JP3588507B2 (en) Information filtering device
JP2005202714A (en) Document retrieval system
JP2001005830A (en) Information processor, its method and computer readable memory
JPH10289241A (en) Image processor and its control method
JP3415214B2 (en) Document search device
JPH086963A (en) Character string retrieval device
JPS634334A (en) Electronic file device for document image
JP2000222436A (en) Method and device for supporting information retrieval by using ontology, and storage medium recording information retrieval support program
JP2001092850A (en) Terminal for information retrieval and its information displaying and inputting-outputting method
JPS63191271A (en) Storing/retrieving system for picture information
JPH06195386A (en) Data retriever
JP3328913B1 (en) Multilingual document retrieval system
JPH05257980A (en) Document retrieving device
JP2004348768A (en) Document retrieval method
JPH08263516A (en) Method and device for information retrieval