JPH1145250A - Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recorded - Google Patents
Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recordedInfo
- Publication number
- JPH1145250A JPH1145250A JP9199610A JP19961097A JPH1145250A JP H1145250 A JPH1145250 A JP H1145250A JP 9199610 A JP9199610 A JP 9199610A JP 19961097 A JP19961097 A JP 19961097A JP H1145250 A JPH1145250 A JP H1145250A
- Authority
- JP
- Japan
- Prior art keywords
- search
- condition
- retrieval
- document
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、複数回にわたる検
索処理を行わなければならない場合に、前回の検索結果
を利用して、次の検索処理のための検索条件を効率良く
設定することができるようにし、情報検索の利便性の向
上を図った情報検索装置,検索結果を利用した検索条件
の生成方法およびその方法をコンピュータに実行させる
ためのプログラムを記録したコンピュータ読み取り可能
な記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention makes it possible to efficiently set search conditions for the next search process by using a previous search result when a search process must be performed a plurality of times. As described above, the present invention relates to an information search apparatus that improves the convenience of information search, a method of generating search conditions using search results, and a computer-readable recording medium storing a program for causing a computer to execute the method.
【0002】[0002]
【従来の技術】コンピュータの発達に伴って、紙を媒体
として記録され、また保存されていた文書についても、
電子化された情報として取り扱うことが一般的となり、
大量の電子化された文書がデータベースに蓄積されるこ
ととなっている。2. Description of the Related Art With the development of computers, documents recorded and stored using paper as a medium have been developed.
It has become common to handle it as electronic information,
A large number of electronic documents are to be stored in a database.
【0003】ところで、大量の電子化された文書が蓄積
されていくに従って、大量の文書の中から所望の文書を
容易に探し出すことができる検索技術が重要となってく
る。特に、誰もがコンピュータを用いて作業を行う今日
にあっては、特殊な手法を用いることなく、コンピュー
タの初心者であっても簡単に所望の文書を検索できるよ
うな検索システムを構築することが重要なポイントとな
る。[0003] By the way, as a large number of digitized documents are accumulated, a search technology that can easily find a desired document from a large number of documents becomes important. In particular, in today's world where everyone works on a computer, it is possible to construct a search system that allows even a novice computer user to easily search for a desired document without using a special technique. This is an important point.
【0004】検索の容易化を図るための1つの手法とし
て、人間が通常用いる自然言語を用いてクエリー(Qu
ery)を入力することができるようにする技術を挙げ
ることができる。この技術は、近年の自然言語処理技術
の発達に伴って、多くの検索システムに取り入れられつ
つある。[0004] As one technique for facilitating retrieval, a query (Quu) using a natural language usually used by humans is used.
ery) can be input. This technology has been adopted in many search systems with the development of natural language processing technology in recent years.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上述し
たように、自然言語でクエリーを入力できる検索システ
ムを構築したとしても、1回の検索処理で満足できる検
索結果を得ることは困難であるため、所望の検索結果を
得るためには、既に行った検索結果を参照し、再びクエ
リーを入力し直して検索処理を実行する必要があるとい
う問題があった。換言すれば、前回の検索結果を利用し
て、所望の検索結果を得るためにふさわしいクエリーを
考え、考えたクエリーを入力しなければならなかった。However, as described above, even if a search system capable of inputting a query in a natural language is constructed, it is difficult to obtain satisfactory search results in one search process. In order to obtain a desired search result, there is a problem that it is necessary to refer to the already performed search result, input a query again, and execute a search process. In other words, using the previous search result, a query suitable for obtaining a desired search result has to be considered and the considered query must be input.
【0006】また、検索の目的によっては、複数回の検
索処理を行わなければ所望の検索結果を得ることができ
ないような場合もあり、このような場合にあっても、既
に行った検索結果を参照し、再びクエリーを入力し直し
て検索処理を実行する必要があるという問題があった。[0006] Further, depending on the purpose of the search, there is a case where a desired search result cannot be obtained unless a plurality of search processes are performed. There is a problem that it is necessary to refer to, input a query again, and execute a search process.
【0007】本発明は上記に鑑みてなされたものであっ
て、複数回にわたる検索処理を行わなければならない場
合に、前回の検索結果を利用して、次の検索処理のため
の検索条件を効率良く設定することができるようにし、
情報検索の利便性の向上を図ることを目的とする。The present invention has been made in view of the above, and when search processing must be performed a plurality of times, the search conditions for the next search processing can be efficiently performed by using the previous search result. So that it can be set well,
An object is to improve the convenience of information retrieval.
【0008】[0008]
【課題を解決するための手段】上記目的を達成するた
め、請求項1の情報検索装置は、指定された検索条件に
基づいて検索処理を行う情報検索装置において、第1の
検索条件を設定する第1の設定手段と、前記第1の設定
手段で設定された第1の検索条件に基づいて検索処理を
行う検索手段と、前記第1の検索条件による検索結果か
ら得られた情報の少なくとも1つを制約条件として指定
する指定手段と、前記指定手段で指定された制約条件を
用いて第2の検索条件を設定する設定手段と、を備え、
前記検索手段が、前記設定手段で設定された第2の検索
条件に基づいて検索処理を行うものである。In order to achieve the above object, an information retrieval apparatus according to claim 1 sets a first retrieval condition in an information retrieval apparatus which performs retrieval processing based on a designated retrieval condition. First setting means; searching means for performing a search process based on the first search condition set by the first setting means; at least one of information obtained from a search result based on the first search condition; Designating means for designating one as a constraint condition, and setting means for setting a second search condition using the constraint condition designated by the designating means,
The search means performs a search process based on the second search condition set by the setting means.
【0009】また、請求項2の情報検索装置は、指定さ
れた検索条件に基づいて検索処理を行う情報検索装置に
おいて、第1の検索条件を設定する第1の設定手段と、
前記第1の設定手段で設定された第1の検索条件に基づ
いて検索処理を行う検索手段と、前記第1の検索条件に
よる検索結果から得られた情報の少なくとも1つを制約
条件として指定し、かつ、新たな検索条件を追加指定す
る指定手段と、前記指定手段で指定された制約条件およ
び検索条件を用いて第2の検索条件を設定する設定手段
と、を備え、前記検索手段が、前記設定手段で設定され
た第2の検索条件に基づいて検索処理を行うものであ
る。According to a second aspect of the present invention, there is provided an information search device for performing a search process based on a specified search condition, wherein the first setting means sets a first search condition;
A search unit for performing a search process based on the first search condition set by the first setting unit; and at least one of information obtained from a search result based on the first search condition is specified as a constraint condition. And designating means for additionally designating a new search condition, and setting means for setting a second search condition using the constraint condition and the search condition designated by the designating means, wherein the search means comprises: The search processing is performed based on the second search condition set by the setting means.
【0010】また、請求項3の検索結果を利用した検索
条件の生成方法は、設定された第1の検索条件に基づい
て検索処理を行った後、前記第1の検索条件による検索
結果から得られた情報の少なくとも1つを制約条件とし
て指定する指定工程と、前記指定工程で指定された制約
条件を用いて第2の検索条件を設定する設定工程と、を
含むものである。According to a third aspect of the present invention, there is provided a method for generating a search condition using a search result, comprising: performing a search process based on a set first search condition; And a setting step of setting a second search condition using the constraint condition specified in the specifying step.
【0011】また、請求項4の検索結果を利用した検索
条件の生成方法は、設定された第1の検索条件に基づい
て検索処理を行った後、前記第1の検索条件による検索
結果から得られた情報の少なくとも1つを制約条件とし
て指定し、かつ、新たな検索条件を追加指定する指定工
程と、前記指定工程で指定された制約条件および検索条
件を用いて第2の検索条件を設定する設定工程と、を含
むものである。According to a fourth aspect of the present invention, there is provided a method for generating a search condition using a search result, comprising: performing a search process based on a set first search condition; A specifying step of specifying at least one of the specified information as a constraint condition and additionally specifying a new search condition, and setting a second search condition using the constraint condition and the search condition specified in the specifying step Setting step to be performed.
【0012】さらに、請求項5のコンピュータ読み取り
可能な記録媒体は、前記請求項3または4に記載の検索
結果を利用した検索条件の生成方法の各工程をコンピュ
ータに実行させるためのプログラムを記録したものであ
る。A computer-readable recording medium according to a fifth aspect of the present invention has recorded thereon a program for causing a computer to execute each step of the search condition generating method using the search result according to the third or fourth aspect. Things.
【0013】[0013]
【発明の実施の形態】以下、情報検索装置,検索結果を
利用した検索条件の生成方法およびその方法をコンピュ
ータに実行させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体の一実施の形態について、
添付の図面を参照しつつ詳細に説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An information retrieval apparatus, a method for generating a retrieval condition using a retrieval result, and a computer-readable recording medium on which a program for causing a computer to execute the method will be described below.
This will be described in detail with reference to the accompanying drawings.
【0014】図1は、本実施の形態の情報検索装置のシ
ステム構成図である。図1に示す情報検索装置は、所望
の文書を検索するための検索条件を出力する複数のクラ
イアント100と、文書DB(データベース)101か
ら転置ファイル102を生成すると共に、ベクトル空間
検索およびブーリアン検索を行うことが可能な検索エン
ジン(例えば、CLARITECH社のCLARIT
等)を備え、クライアント100から検索条件を入力
し、入力した検索条件に基づいて、転置ファイル102
を用いて該当する文書を検索する検索サーバ103と、
上記クライアント100や検索サーバ103等を接続す
るネットワーク104と、から構成されている。FIG. 1 is a system configuration diagram of an information retrieval apparatus according to the present embodiment. The information search device shown in FIG. 1 generates a plurality of clients 100 that output search conditions for searching for a desired document, an inverted file 102 from a document DB (database) 101, and performs a vector space search and a Boolean search. Search engines that can be used (for example, CLARIT of CLARITECH)
), And input search conditions from the client 100. Based on the input search conditions, the transposed file 102
A search server 103 for searching for a corresponding document by using
And a network 104 for connecting the client 100, the search server 103, and the like.
【0015】図1において、文書DB101は、複数の
文書、例えば、新聞記事等の文書を格納したものであ
る。本実施の形態においては、文書DB101に格納さ
れた文書として新聞記事を例とし、この新聞記事を検索
対象とする。ただし、検索対象を新聞記事や文書DB1
01中の文書に限定するものではない。In FIG. 1, a document DB 101 stores a plurality of documents, for example, documents such as newspaper articles. In the present embodiment, a newspaper article is taken as an example of a document stored in the document DB 101, and this newspaper article is a search target. However, the search target is newspaper articles and document DB1
However, the present invention is not limited to the document in FIG.
【0016】転置ファイル102は、文書DB101中
の複数の文書と、これら複数の文書それぞれから後述す
る方法で抽出した複数の索引語との関係を規定し、ある
索引語が各文書それぞれにおいてどの程度重要な語彙で
あるかをベクター表現を用いて示したものであって、こ
の索引語を用いて該当する文書を検索することができる
ようにしたものである。The transposed file 102 defines the relationship between a plurality of documents in the document DB 101 and a plurality of index terms extracted from each of the plurality of documents by a method described later. An important vocabulary is indicated using a vector expression, and a corresponding document can be searched using the index word.
【0017】具体的には、1つの文書を予め複数のセン
テンスからなるサブドキュメント単位に区切り、サブド
キュメントから上記索引語となる名詞句を抽出して、抽
出した名詞句それぞれについて、サブドキュメント中の
出現頻度,文書DB101全体における分布等の統計情
報を求め、求めた名詞句毎の統計情報を用いて各サブド
キュメントをベクター表現に変換する。そして、変換し
たサブドキュメントのベクター表現に基づいて、文書の
ベクター表現を生成する。転置ファイル102は、この
ようにしてベクター表現された文書DB101中の文書
を格納したものである。More specifically, one document is divided into sub-documents consisting of a plurality of sentences in advance, and the noun phrases serving as the index words are extracted from the sub-documents. Statistical information such as an appearance frequency and distribution in the entire document DB 101 is obtained, and each sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. Then, a vector expression of the document is generated based on the vector expression of the converted sub-document. The transposition file 102 stores the document in the document DB 101 thus vectorized.
【0018】なお、各索引語には、対応する文書中の重
要度に応じた重み付けを行うことができる。また、文書
のベクター表現については、実際の検索を行う際に、サ
ブドキュメントのベクター表現に基づいて生成すること
にしても良い。Each index word can be weighted according to the degree of importance in the corresponding document. Also, the vector expression of the document may be generated based on the vector expression of the sub-document when performing an actual search.
【0019】クライアント100および検索サーバ10
3は、パーソナルコンピュータやワークステーション等
によって構成される。図2は、クライアント100の処
理を示す概略ブロック図である。クライアント100
は、自然言語によって記述されたクエリー(Quer
y)200を入力し、入力したクエリー200につい
て、品詞情報等を格納した辞書202および各単語の係
り受け等を解析するための文法辞書203を用いて形態
素解析,構文解析等の解析処理を行い、解析処理の結果
に基づいて、クエリー200から日付等の制約条件20
4と、上記転置ファイル102の索引語に対応する名詞
句からなる検索語205とを抽出する処理を行い、分離
した制約条件204および検索語205を検索条件20
6として検索サーバ103に出力する自然言語処理モジ
ュール201を備えている。Client 100 and search server 10
Reference numeral 3 includes a personal computer, a workstation, and the like. FIG. 2 is a schematic block diagram showing the processing of the client 100. Client 100
Is a query written in natural language (Quer
y) The user inputs 200 and performs analysis processing such as morphological analysis and syntax analysis using the dictionary 202 storing part of speech information and the like and the grammar dictionary 203 for analyzing the dependency of each word. , Based on the result of the analysis processing, the query
4 and a search term 205 consisting of a noun phrase corresponding to the index term of the transposed file 102 are extracted, and the separated constraints 204 and search terms 205
6 is provided with a natural language processing module 201 for outputting to the search server 103.
【0020】また、クライアント100は、検索サーバ
103による検索結果を入力し、入力した検索結果を表
示すると共に、表示した検索結果に含まれる文書の属性
情報、例えば、文書の作成日,作成者等の文書情報を指
定するための指定部208を介して指定された属性情報
を制約条件として抽出して、自然言語処理モジュール2
01に出力する制約条件設定部207を備えている。後
に詳細に説明するが、この制約条件設定部207および
指定部208は、前回の検索結果を利用して再度検索処
理を行う際に利用される。The client 100 inputs a search result by the search server 103, displays the input search result, and displays attribute information of a document included in the displayed search result, for example, a creation date of the document, a creator, and the like. The attribute information specified via the specifying unit 208 for specifying the document information of the document is extracted as a constraint, and the natural language processing module 2
01 is provided. As will be described in detail later, the constraint condition setting unit 207 and the specifying unit 208 are used when performing a search process again using the previous search result.
【0021】なお、制約条件204は、文書の本文に記
載された事項に関するものではなく、文書の作成日や作
成者等の文書情報に関するものである。一方、検索語2
05は、文書の本文に記載された事項に関するものであ
る。すなわち、検索語205に該当する文書が検索さ
れ、さらに、制約条件204に基づいて、検索語205
に該当する文書の作成日,作成者等の文書情報を参照し
て検索結果に絞り込みをかける処理が行われる。ここで
は上記文書情報を対象として、制約条件204を用いた
絞り込みを行うことにするが、本文中の日付等を対象と
して絞り込みをかけるようにしても良い。Note that the constraints 204 do not relate to items described in the text of the document, but to document information such as the date of creation of the document and the creator. On the other hand, search term 2
Reference numeral 05 relates to matters described in the text of the document. That is, a document corresponding to the search term 205 is searched, and further, based on the constraint condition 204, the search term 205 is searched.
A process for narrowing down the search results with reference to the document information such as the creation date and the creator of the document corresponding to. Here, narrowing down using the constraint conditions 204 is performed on the document information, but narrowing down may be performed on dates in the text.
【0022】また、図3は、検索サーバ103の処理を
示す概略ブロック図である。検索サーバ103は、文書
DB101中の文書を転置ファイル102に登録する処
理と、ベクトル空間検索およびブーリアン検索を利用し
た検索処理とを行うものである。FIG. 3 is a schematic block diagram showing the processing of the search server 103. The search server 103 performs a process of registering a document in the document DB 101 in the transposed file 102 and a search process using a vector space search and a Boolean search.
【0023】この検索サーバ103は、文書DB101
から文書を入力し、文書のフォーマットの認識処理や、
品詞情報等を格納した辞書301および各単語の係り受
け等を解析するための文法辞書302を用いて形態素解
析,構文解析,名詞句抽出等の解析処理を行い、上述し
たサブドキュメント毎の名詞句リストを含むドキュメン
ト・セット303を生成する自然言語処理モジュール3
00と、自然言語処理モジュール300で生成したドキ
ュメント・セット303を入力し、入力したドキュメン
ト・セット303中の各サブドキュメントをベクター表
現に変換すると共に、サブドキュメントのベクター表現
に基づいて、文書のベクター表現を生成して転置ファイ
ル102に登録するデータベース・ビルド・コンポーネ
ント304と、クライアント100から制約条件204
および検索語205からなる検索条件206を入力し、
入力した検索条件206の検索語205を構成する各名
詞句について、クエリー200中の出現頻度,文書DB
101全体における分布等の統計情報を求め、求めた名
詞句毎の統計情報を用いて検索語205をベクター表現
に変換したクエリー・ドキュメント306を生成するク
エリー・ビルド・コンポーネント305と、クエリー・
ビルド・コンポーネント305で生成したクエリー・ド
キュメント306を入力し、転置ファイル102中の各
文書のベクトルとクエリー・ドキュメント306のベク
トルとを比較して、クエリー・ドキュメント306との
類似度に応じたスコアを各文書に付与し、所定の閾値を
超えるスコアが付与された文書のリストを生成すると共
に、制約条件204を用いてリスト中の文書をさらに絞
り込む処理を行った後、検索結果として文書リスト30
8を出力する検索エンジン307と、を備えている。This search server 103 stores the document DB 101
Input the document from, and recognize the format of the document,
Analysis processing such as morphological analysis, syntax analysis, and noun phrase extraction is performed using a dictionary 301 storing part-of-speech information and a grammar dictionary 302 for analyzing the dependency of each word, and the like. Natural language processing module 3 for generating a document set 303 including a list
00, the document set 303 generated by the natural language processing module 300 is input, each sub-document in the input document set 303 is converted into a vector expression, and the vector of the document is converted based on the vector expression of the sub-document. A database build component 304 for generating an expression and registering it in the transposition file 102;
And a search condition 206 consisting of a search term 205 and
For each noun phrase constituting the search term 205 of the input search condition 206, the appearance frequency in the query 200, the document DB
A query build component 305 that obtains statistical information such as distribution in the entire 101 and generates a query document 306 in which the search term 205 is converted into a vector expression using the obtained statistical information for each noun phrase;
The query document 306 generated by the build component 305 is input, a vector of each document in the transposed file 102 is compared with a vector of the query document 306, and a score according to the similarity with the query document 306 is calculated. After a list of documents assigned to each document and having a score exceeding a predetermined threshold is generated, and a process of further narrowing down the documents in the list using the constraint condition 204 is performed, the document list 30 is obtained as a search result.
And a search engine 307 that outputs the search engine 8.
【0024】なお、図1においては、文書DB101お
よび転置ファイル102をネットワーク104に単独に
接続した構成を示したが、これらを検索サーバ103に
直接接続する構成としても良い。また、図1において
は、本実施の形態の情報検索装置をネットワーク104
を介したシステムで構成するように示したが、図2に示
したクライアント100の処理を図3に示した検索サー
バ103の自然言語処理モジュール300に行わせるよ
うに構成することにより、1台のコンピュータで本実施
の形態の情報検索装置を構成することができる。Although FIG. 1 shows a configuration in which the document DB 101 and the transposed file 102 are independently connected to the network 104, a configuration in which these are directly connected to the search server 103 may be used. In FIG. 1, the information retrieval apparatus according to the present embodiment is connected to a network 104.
However, the configuration is such that the processing of the client 100 shown in FIG. 2 is performed by the natural language processing module 300 of the search server 103 shown in FIG. The information search device of the present embodiment can be configured by a computer.
【0025】次に、上述した構成を備えた情報検索装置
の動作について、(1)転置ファイルの生成処理,
(2)新聞記事の検索処理の順で詳細に説明する。Next, the operation of the information retrieval apparatus having the above-described configuration will be described with respect to (1) an inverted file generation process,
(2) Details will be described in the order of newspaper article search processing.
【0026】(1)転置ファイルの生成処理 図4は、転置ファイルの生成処理を示すフローチャート
である。検索サーバ103は、新たな文書、即ち新聞記
事が文書DB101に登録される毎に(S401)、こ
の新聞記事を入力して転置ファイル102に登録するた
めの処理を開始する(S402)。(1) Transposition File Generation Process FIG. 4 is a flowchart showing a transposition file generation process. Each time a new document, that is, a newspaper article is registered in the document DB 101 (S401), the search server 103 starts processing for inputting the newspaper article and registering it in the transposed file 102 (S402).
【0027】検索サーバ103において、自然言語処理
モジュール300は、ステップS402で入力した新聞
記事を解析する処理を行う(S403)。具体的には、
入力した新聞記事がワープロ文書,HTML等の構造化
文書等、いかなるフォーマットの文書であるかを判定す
る処理を行う。その後、辞書301および文法辞書30
2を用いて形態素解析,係り受け等の構文解析等を行
い、新聞記事を複数のサブドキュメントに区分すると共
に、区分したサブドキュメントから名詞句を抽出する等
の処理を行う。In the search server 103, the natural language processing module 300 performs processing for analyzing the newspaper article input in step S402 (S403). In particular,
Processing is performed to determine the format of the input newspaper article, such as a word processing document or a structured document such as HTML. After that, the dictionary 301 and the grammar dictionary 30
2 to perform a morphological analysis, a syntax analysis such as dependency, etc., to divide a newspaper article into a plurality of sub-documents, and to perform processing such as extracting a noun phrase from the divided sub-documents.
【0028】そして、自然言語処理モジュール300
は、ステップS403における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット303を生成
する(S404)。Then, the natural language processing module 300
Is based on the result of the processing in step S403.
A noun phrase list is generated for each sub-document, and a document set 303 including the generated noun phrase list is generated (S404).
【0029】その後、データベース・ビルド・コンポー
ネント304は、自然言語処理モジュール300で生成
したドキュメント・セット303を入力し、文書のベク
ター表現を転置ファイル102に登録する処理を行う
(S405)。After that, the database build component 304 inputs the document set 303 generated by the natural language processing module 300, and performs a process of registering the vector expression of the document in the transposed file 102 (S405).
【0030】具体的には、ドキュメント・セット303
中のサブドキュメントの各名詞句を転置ファイル102
の索引語として、サブドキュメント中の出現頻度,文書
DB101全体における分布等の統計情報を求め、求め
た名詞句毎の統計情報を用いてサブドキュメントをベク
ター表現に変換する。この処理をドキュメント・セット
303中の全てのサブドキュメントについて行い、変換
したサブドキュメントのベクター表現に基づいて、文書
のベクター表現を生成して転置ファイル102に登録す
る。Specifically, the document set 303
Transpose file 102 for each noun phrase of subdocument in
The statistical information such as the frequency of occurrence in the sub-document and the distribution in the entire document DB 101 is obtained as an index term, and the sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. This processing is performed for all the sub-documents in the document set 303, and based on the converted sub-document vector expression, a vector expression of the document is generated and registered in the transposed file 102.
【0031】(2)新聞記事の検索処理 続いて、新聞記事の検索処理について説明する。ここで
は、日銀総裁のどのような発言が円相場に影響を与えて
いるかを調査するために、円相場が変動したことを伝え
た新聞記事を検索し、そして、その記事が出された日の
前1週間を制約条件として日銀総裁の発言の記事を検索
する処理を例にとり、円相場への影響に関する記事の
検索(通常の検索処理),日銀総裁の発言に関する記
事の検索(検索結果を利用した検索処理:本発明の検索
結果を利用した検索条件の生成方法に該当する)の順で
説明する。(2) Newspaper Article Retrieval Processing Next, newspaper article retrieval processing will be described. Here, in order to investigate what the Bank of Japan's remarks are affecting the yen market, we searched for newspaper articles that reported that the yen had fluctuated. Searching for articles on the impact on the Japanese yen market (normal search processing), searching for articles on the BOJ's statement (using search results) Search processing: corresponds to a method of generating search conditions using search results of the present invention).
【0032】 円相場への影響に関する記事の検索 図5は、通常の検索処理を示すフローチャートである。
クライアント100の自然言語処理モジュール201
は、ユーザによって入力されたクエリー200を入力す
る(S501)。ここでは、クエリー200として、
「円相場への影響」を入力する。Searching for Articles Related to Yen Market Price FIG. 5 is a flowchart showing a normal search process.
Natural language processing module 201 of client 100
Inputs the query 200 input by the user (S501). Here, as query 200,
Enter "Impact on the yen market".
【0033】自然言語処理モジュール201は、入力し
たクエリー200の解析処理を行う(S502)。具体
的には、辞書202および文法辞書203を用いて形態
素解析,係り受け等の構文解析処理を行う。The natural language processing module 201 analyzes the input query 200 (S502). Specifically, syntax analysis processing such as morphological analysis and dependency is performed using the dictionary 202 and the grammar dictionary 203.
【0034】続いて、自然言語処理モジュール201
は、ステップS502における解析結果に基づいて、ク
エリー200から制約条件204および検索語205を
抽出して、検索条件206を設定する(S503)。ク
エリー200の例である「円相場への影響」には、制約
条件204は含まれておらず、ここでは「円相場への影
響」または「円相場」および「影響」が検索語205と
して抽出される。Subsequently, the natural language processing module 201
Extracts the constraint condition 204 and the search term 205 from the query 200 based on the analysis result in step S502, and sets the search condition 206 (S503). The “impact on the yen market”, which is an example of the query 200, does not include the constraint condition 204, and here the “impact on the yen market” or “the yen market” and “impact” are extracted as search terms 205. Is done.
【0035】上述したようにして設定された制約条件2
04および検索語205からなる検索条件206は、ク
ライアント100から検索サーバ103に出力される。Restriction condition 2 set as described above
The search condition 206 including the search term 04 and the search term 205 is output from the client 100 to the search server 103.
【0036】そして、検索サーバ103のクエリー・ビ
ルド・コンポーネント305は、クライアント100か
ら制約条件204および検索語205からなる検索条件
206を入力し、入力した検索条件206の検索語20
5を構成する各名詞句について、クエリー200中の出
現頻度,文書DB101全体における分布等の統計情報
を求め、求めた名詞句毎の統計情報を用いて検索語20
5をベクター表現に変換したクエリー・ドキュメント3
06を生成する(S504)。Then, the query build component 305 of the search server 103 inputs the search condition 206 including the constraint condition 204 and the search word 205 from the client 100, and searches the search word 20 of the input search condition 206.
For each of the noun phrases constituting No. 5, statistical information such as the frequency of appearance in the query 200 and the distribution in the entire document DB 101 is determined, and the search term 20 is calculated using the statistical information for each noun phrase.
Query document 3 which converted 5 into vector expression
06 is generated (S504).
【0037】検索エンジン307は、クエリー・ビルド
・コンポーネント305で生成したクエリー・ドキュメ
ント306を入力し、転置ファイル102中の各新聞記
事のベクトルとクエリー・ドキュメント306のベクト
ルとを比較して、クエリー・ドキュメント306との類
似度に応じたスコアを各新聞記事に付与し、所定の閾値
を超えるスコアが付与された新聞記事のリストを生成す
る(S505)。すなわち、ベクトル空間検索による検
索処理を行って、検索語205に該当する文書DB10
1中の新聞記事のリストを生成する。The search engine 307 inputs the query document 306 generated by the query build component 305, compares the vector of each newspaper article in the transposed file 102 with the vector of the query document 306, and A score corresponding to the degree of similarity to the document 306 is given to each newspaper article, and a list of newspaper articles given a score exceeding a predetermined threshold is generated (S505). That is, a search process based on a vector space search is performed, and the document DB 10
Generate a list of newspaper articles in 1.
【0038】なお、類似度に応じたスコアは、各新聞記
事とクエリー・ドキュメント306との類似度を余弦距
離に基づいて表現したものであり、スコアが大きい新聞
記事がよりクエリー・ドキュメント306と類似してい
ることを表している。そして、検索エンジン307に
は、予めスコアの閾値が設定されており、この閾値を超
えるスコアが付与された新聞記事を含む文書リスト30
8を生成して検索結果とする。The score according to the similarity expresses the similarity between each newspaper article and the query document 306 on the basis of the cosine distance. A newspaper article having a higher score is more similar to the query document 306. It shows that you are doing. A score threshold is set in the search engine 307 in advance, and the document list 30 including newspaper articles to which a score exceeding the threshold is assigned.
8 is generated as a search result.
【0039】なお、クエリー200から、例えば、1年
分の新聞記事という制約条件204を抽出した場合に
は、上記ステップS505で、1年分の新聞記事に絞り
込む処理も併せて行われる。When the constraint condition 204 of, for example, one year's newspaper article is extracted from the query 200, the process of narrowing down to one year's newspaper article is also performed in step S505.
【0040】その後、検索エンジン307は、生成した
文書リスト308を最終的な検索結果としてクライアン
ト100に出力し、この文書リスト308はクライアン
ト100に画面表示される(S506)。クライアント
100のユーザは、画面表示された文書リスト308か
ら任意の新聞記事を選択することにより、文書DB10
1中の該当する新聞記事を画面表示させることができ
る。Thereafter, the search engine 307 outputs the generated document list 308 to the client 100 as a final search result, and the document list 308 is displayed on the screen of the client 100 (S506). The user of the client 100 selects an arbitrary newspaper article from the document list 308 displayed on the screen, so that the document DB 10
1 can be displayed on the screen.
【0041】 日銀総裁の発言に関する記事の検索
(検索結果を利用した検索処理) 次に、上述した円相場への影響に関する記事を検索した
結果を利用した検索処理について説明する。図6は、検
索結果を利用した検索処理を示すフローチャートであ
る。Search for Articles Related to the Statement by the Governor of the Bank of Japan (Search Processing Using Search Results) Next, search processing using the results of searching for articles regarding the influence on the yen market will be described. FIG. 6 is a flowchart illustrating a search process using a search result.
【0042】円相場の影響等の新聞記事を検索した場
合、その検索結果として表示される文書リスト308に
は、記事の見出し,新聞社名,日付等が属性情報として
表示されている。そこで、記事が出された日の前1週間
を制約条件として日銀総裁の発言の記事を検索する処理
を行うため、ユーザは、指定部208を介して文書リス
ト308中に表示された記事の日付を指定する(属性情
報の指定:S601)。When a newspaper article, such as the influence of the yen exchange rate, is searched, a document list 308 displayed as a result of the search displays the article headline, newspaper company name, date, and the like as attribute information. Therefore, in order to perform a process of searching for an article with a statement made by the Governor of the Bank of Japan with one week before the date of publication of the article as a constraint, the user must input the date (Designation of attribute information: S601).
【0043】具体的には、例えば、検索結果として、円
相場の変動を伝えた5つの記事が表示されている状態
で、5つの記事の全てに関する日銀総裁の発言の影響に
ついて知りたい場合には、全ての記事の日付を指定す
る。また、一部の記事に関する日銀総裁の発言の影響に
ついて知りたい場合には、知りたい記事の日付を指定す
る。さらに、ここで、指定した記事の日付に対して「1
週間前」,「1ヶ月前」,「1年前」等の期間を指定す
る。ここでは、「1週間前」を指定するものとする。More specifically, for example, when five articles that convey the fluctuation of the yen market are displayed as search results, and it is desired to know the effect of the Governor's statement on all five articles, , Specify the dates of all articles. If you want to know the effect of the Governor's remarks on some articles, specify the date of the article you want to know. Further, here, the date of the specified article is "1".
Specify a period such as "week ago", "one month ago", "one year ago", and so on. Here, "one week ago" is specified.
【0044】なお、ステップS601においては、日付
等の属性情報や期間を指定するためのアイコン等を画面
表示することにしても良い。また、「1週間前」等の期
間は、以下に説明するステップS603におけるクエリ
ー200の入力の際に同時に入力することにしても良
い。In step S601, attribute information such as a date and an icon for designating a period may be displayed on the screen. A period such as “one week ago” may be input at the same time as the input of the query 200 in step S603 described below.
【0045】ステップS601において記事の日付(属
性情報)が指定されると、制約条件設定部207は、指
定された日付を検索の制約条件として抽出し、自然言語
処理モジュール201に出力する(S602)。When the article date (attribute information) is specified in step S601, the constraint condition setting unit 207 extracts the specified date as a search constraint condition and outputs it to the natural language processing module 201 (S602). .
【0046】そして、ユーザは、ステップS602にお
いて日付および期間を指定した後、クエリー200を入
力する(S603)。ここでは、例えば、「日銀総裁の
発言」が、クエリー200として入力される。Then, after designating the date and the period in step S602, the user inputs the query 200 (S603). Here, for example, “the statement of the governor of the Bank of Japan” is input as the query 200.
【0047】なお、ステップS601の属性情報指定と
ステップS603のクエリーの入力については、どちら
を先に行っても良い。また、先の検索結果から得た属性
情報(日付等)で単に検索結果の絞り込みを行う場合に
は、ステップS603でクエリー200を入力する必要
はない。したがって、この場合においては、後述するス
テップS606およびS607の実行が省略される。Note that either of the attribute information designation in step S601 and the query input in step S603 may be performed first. When the search results are simply narrowed down by the attribute information (date or the like) obtained from the previous search results, there is no need to input the query 200 in step S603. Therefore, in this case, execution of steps S606 and S607 described later is omitted.
【0048】その後、自然言語処理モジュール201
は、制約条件設定部207から日付および期間の指定を
入力すると共に、クエリー200を入力し、これらを解
析する処理を行う(S604)。具体的には、辞書20
2および文法辞書203を用いて形態素解析,係り受け
等の構文解析処理を行う。Thereafter, the natural language processing module 201
Inputs the designation of the date and the period from the constraint condition setting unit 207, inputs the query 200, and performs a process of analyzing them (S604). Specifically, the dictionary 20
2 and a grammar dictionary 203 to perform syntax analysis such as morphological analysis and dependency.
【0049】続いて、自然言語処理モジュール201
は、ステップS502における解析結果に基づいて、検
索条件206の設定を行う(S605)。具体的には、
制約条件設定部207から入力した日付および期間の指
定を用いて、「日付範囲=YYMMDD〜YYMMD
D」という制約条件204が設定される。また、入力し
たクエリー200から制約条件204および検索語20
5を抽出する。クエリー200の例である「日銀総裁の
発言」には、制約条件204は含まれておらず、ここで
は「日銀総裁の発言」または「日銀総裁」および「発
言」が検索語205として設定される。このステップS
605における処理により、制約条件204と検索語2
05とからなる検索条件206が設定される。Subsequently, the natural language processing module 201
Sets the search condition 206 based on the analysis result in step S502 (S605). In particular,
Using the specification of the date and period input from the constraint condition setting unit 207, “date range = YYMMDD to YYMMD
D "is set. Also, based on the input query 200, the constraint conditions 204 and the search term 20
5 is extracted. The “statement of the Governor of the Bank of Japan”, which is an example of the query 200, does not include the constraint condition 204. Here, the “statement of the Governor of the Bank of Japan” or “the Governor of the Bank of Japan” and “utterance” are set as the search terms 205. . This step S
By the processing in 605, the constraint condition 204 and the search term 2
05 is set.
【0050】このようにして設定された制約条件204
および検索語205からなる検索条件206は、クライ
アント100から検索サーバ103に出力される。The constraints 204 set in this way
The search condition 206 including the search term 205 and the search term 205 is output from the client 100 to the search server 103.
【0051】そして、検索サーバ103のクエリー・ビ
ルド・コンポーネント305は、クライアント100か
ら制約条件204および検索語205からなる検索条件
206を入力し、図5のステップS504で説明したよ
うにして、クエリー・ドキュメント306を生成する
(S606)。Then, the query build component 305 of the search server 103 inputs the search condition 206 including the constraint condition 204 and the search word 205 from the client 100, and executes the query / build as described in step S504 of FIG. The document 306 is generated (S606).
【0052】検索エンジン307は、クエリー・ビルド
・コンポーネント305で生成したクエリー・ドキュメ
ント306を入力し、転置ファイル102中の各新聞記
事のベクトルとクエリー・ドキュメント306のベクト
ルを比較して、クエリー・ドキュメント306との類似
度に応じたスコアを各新聞記事に付与し、所定の閾値を
超えるスコアが付与された新聞記事、即ち、日銀総裁の
発言に関する記事のリストを生成する(S607)。す
なわち、検索処理を行って、検索語205に該当する文
書DB101中の新聞記事のリストを生成する。The search engine 307 inputs the query document 306 generated by the query build component 305, compares the vector of each newspaper article in the transposed file 102 with the vector of the query document 306, and A score corresponding to the degree of similarity with 306 is assigned to each newspaper article, and a list of newspaper articles to which a score exceeding a predetermined threshold has been assigned, that is, articles relating to statements by the Governor of the Bank of Japan is generated (S607). That is, a search process is performed to generate a list of newspaper articles in the document DB 101 corresponding to the search term 205.
【0053】なお、類似度に応じたスコアは、各新聞記
事とクエリー・ドキュメント306との類似度を余弦距
離に基づいて表現したものであり、スコアが大きい新聞
記事がよりクエリー・ドキュメント306と類似してい
ることを表している。そして、検索エンジン307に
は、予めスコアの閾値が設定されており、この閾値を超
えるスコアが付与された新聞記事が検索結果の候補とさ
れる。The score according to the similarity expresses the similarity between each newspaper article and the query document 306 based on the cosine distance. A newspaper article having a higher score is more similar to the query document 306. It shows that you are doing. Then, a score threshold is set in the search engine 307 in advance, and newspaper articles to which a score exceeding the threshold is given are set as search result candidates.
【0054】続いて、検索エンジン307は、各新聞記
事の属性情報(文書情報)を参照し、制約条件204を
用いて検索結果の絞り込みを行って、文書リスト308
を生成する(S608)。具体的には、ステップS60
7で作成されたリスト中の記事の属性情報を参照し、
「日付範囲=YYMMDD〜YYMMDD」という制約
条件204に該当する新聞記事を選択する(ブーリアン
検索)。Subsequently, the search engine 307 refers to the attribute information (document information) of each newspaper article, narrows down the search results using the constraint conditions 204, and obtains the document list 308.
Is generated (S608). Specifically, step S60
Referring to the attribute information of the articles in the list created in step 7,
A newspaper article corresponding to the constraint condition 204 of “date range = YYMMDD to YYMMDD” is selected (Boolean search).
【0055】なお、本実施の形態においては、ステップ
S607で検索語205による検索処理を行った後、ス
テップS608で制約条件204で絞り込みを行うとい
う順序としたが、この順序は逆であっても同様な検索結
果を得ることができる。In the present embodiment, the order is such that the search processing based on the search term 205 is performed in step S607, and then the refinement is performed in accordance with the constraint condition 204 in step S608, but the order may be reversed. Similar search results can be obtained.
【0056】その後、検索エンジン307は、生成した
文書リスト308を最終的な検索結果としてクライアン
ト100に出力し、この文書リスト308はクライアン
ト100に画面表示される(S609)。クライアント
100のユーザは、画面表示された文書リスト308か
ら任意の記事を選択することにより、日銀総裁のどのよ
うな発言が円相場に影響を与えているかを調べることが
できる。After that, the search engine 307 outputs the generated document list 308 to the client 100 as a final search result, and the document list 308 is displayed on the screen of the client 100 (S609). By selecting an arbitrary article from the document list 308 displayed on the screen, the user of the client 100 can check what statement by the Governor of the Bank of Japan has affected the yen market.
【0057】なお、以上では、円相場の変動に関する記
事の検索を例としたが、本実施の形態の情報検索装置
は、以下に挙げるような検索処理についても容易に行う
ことができる。In the above description, an example of searching for articles relating to fluctuations in the yen market has been described. However, the information search apparatus according to the present embodiment can easily perform the following search processing.
【0058】第1に、ニュースグループ等において、
「自動車」に関する記事を検索し、該当する記事の投稿
者を制約条件として自動車に関連のない記事を検索する
処理である。この検索処理により、自動車に関心を持つ
人々が他にどのようなトピックについて興味を持ってい
るかを調査することができ、本実施の形態の情報検索装
置をマーケティング等に利用することができる。First, in a newsgroup or the like,
This is a process of searching for articles related to "automobile" and searching for articles unrelated to automobiles using the poster of the relevant article as a constraint. By this search process, it is possible to investigate what other topics people who are interested in cars are interested in, and to use the information search device of the present embodiment for marketing and the like.
【0059】第2に、「機械翻訳」に関する特許公開公
報を検索して、該当する公報中に記載された企業名を取
得し、取得した企業名を制約条件として、「文書検索」
に関する特許公開公報を検索すれば、「機械翻訳」およ
び「文書検索」の両方を出願している企業名を調査する
ことができる。Second, a patent publication relating to “machine translation” is searched to obtain a company name described in the relevant publication, and “document search” is performed using the obtained company name as a constraint.
Searching for patent publications related to "Machine Translation" and "Document Search" allows you to search for companies that have applied for both.
【0060】このように、本実施の形態の情報検索装置
によれば、複数回にわたった検索処理を行わなければな
らない場合に、前回の検索結果として示された文書等の
属性情報を制約条件とし、新たに入力したクエリーと共
に自動的に検索条件を設定することにしたため、次の検
索処理のための検索条件を効率良く設定することがで
き、情報検索の利便性の向上を図ることができる。ま
た、クエリー200に自然言語を用いることができるよ
うにし、また、ベクトル空間法を用いた検索処理と制約
条件204によるブーリアン検索を併用しているため、
ベクトル空間法による検索のみやブーリアン検索のみで
は困難である複雑な検索処理を容易に行うことができ
る。As described above, according to the information retrieval apparatus of the present embodiment, when the retrieval processing must be performed a plurality of times, the attribute information such as the document indicated as the previous retrieval result is restricted. Since the search condition is automatically set together with the newly input query, the search condition for the next search process can be set efficiently, and the convenience of information search can be improved. . In addition, since natural language can be used for the query 200, and the search processing using the vector space method and the Boolean search based on the constraint conditions 204 are used together,
It is possible to easily perform complicated search processing that is difficult only by the search using the vector space method or the Boolean search.
【0061】上述した説明においては、日銀総裁のどの
ような発言が円相場に影響を与えているかについて、
「円相場の影響」に関する記事の検索と、「日銀総裁の
発言」に関する記事の検索という2回のステップで検索
処理を行うように説明した。ところが、本実施の形態の
情報検索装置は、クエリー200から制約条件204お
よび検索語205からなる検索条件206を生成するこ
とができるため、クエリー200として「円相場が変動
した日の前一週間の日銀総裁の発言」を入力することに
より、上述した検索処理を1回のステップで行うことも
できる。In the above explanation, what kind of statement by the Governor of the Bank of Japan has influenced the yen market
It has been explained that the search process is performed in two steps, that is, the search for the article on "Effect of the yen market" and the search for the article on "BoJ's statement". However, the information search device of the present embodiment can generate the search condition 206 including the constraint condition 204 and the search term 205 from the query 200, By inputting the statement of the Governor of the Bank of Japan, the above-described search processing can be performed in a single step.
【0062】また、上述した本実施の形態の情報検索装
置で得た検索結果である文書リスト308において、ユ
ーザが検索結果としてふさわしいと思う文書やふさわし
くないと思う文書については、その結果を検索サーバ1
03にフィードバックすることができる。すなわち、ユ
ーザは、検索結果としてふさわしいと思う文書に対し
て、正の重み、例えば「+」を指定することができ、検
索結果としてふさわしくないと思う文書に対して負の重
み、例えば「−」を指定することができる。その結果、
入力した重みが正の指定である場合には、転置ファイル
102中の該当する文書の重みが強化され、入力した重
みが負の指定である場合には、文書の重みが弱められ
る。In the document list 308 which is a search result obtained by the information search apparatus according to the above-described embodiment, for a document which the user considers appropriate or unsuitable as a search result, the result is stored in a search server. 1
03 can be fed back. That is, the user can specify a positive weight, for example, “+” for a document that is considered to be appropriate as a search result, and a negative weight, for example, “−” for a document that is not appropriate for the search result. Can be specified. as a result,
When the input weight is a positive specification, the weight of the corresponding document in the transposed file 102 is strengthened, and when the input weight is a negative specification, the weight of the document is weakened.
【0063】さらに、本実施の形態で説明した情報検索
装置および検索結果を利用した検索条件の生成方法は、
予め用意されたプログラムをコンピュータやワークステ
ーションで実行することによって実現される。このプロ
グラムは、ハードディスク,フロッピーディスク,CD
−ROM,MO,DVD等のコンピュータで読み取り可
能な記録媒体に記録され、コンピュータによって記録媒
体から読み出されることによって実行される。また、こ
のプログラムは、上記記録媒体を介して、またはネット
ワークを介して配布することができる。Further, the information search apparatus and the method of generating search conditions using search results described in the present embodiment are as follows:
It is realized by executing a prepared program on a computer or a workstation. This program is for hard disk, floppy disk, CD
-The program is recorded on a computer-readable recording medium such as a ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. This program can be distributed via the recording medium or via a network.
【0064】[0064]
【発明の効果】以上説明したように、本発明の情報検索
装置(請求項1)によれば、第1の検索条件を設定する
第1の設定手段と、前記第1の設定手段で設定された第
1の検索条件に基づいて検索処理を行う検索手段と、前
記第1の検索条件による検索結果から得られた情報の少
なくとも1つを制約条件として指定する指定手段と、前
記指定手段で指定された制約条件を用いて第2の検索条
件を設定する設定手段と、を備え、前記検索手段は、前
記設定手段で設定された第2の検索条件に基づいて検索
処理を行うため、複数回にわたる検索処理を行わなけれ
ばならない場合に、前回の検索結果を利用して、次の検
索処理のための検索条件を効率良く設定することがで
き、情報検索の利便性の向上を図ることができる。As described above, according to the information search apparatus of the present invention (claim 1), the first setting means for setting the first search condition and the first setting means set the first search condition. Searching means for performing a search process based on the first search condition, specifying means for specifying at least one of information obtained from a search result based on the first search condition as a constraint condition, and specifying by the specifying means Setting means for setting a second search condition using the set constraint condition, wherein the search means performs a search process based on the second search condition set by the setting means, a plurality of times. When it is necessary to perform search processing over a long time, it is possible to efficiently set search conditions for the next search processing by using the previous search result, and to improve the convenience of information search. .
【0065】また、本発明の情報検索装置(請求項2)
によれば、第1の検索条件を設定する第1の設定手段
と、前記第1の設定手段で設定された第1の検索条件に
基づいて検索処理を行う検索手段と、前記第1の検索条
件による検索結果から得られた情報の少なくとも1つを
制約条件として指定し、かつ、新たな検索条件を追加指
定する指定手段と、前記指定手段で指定された制約条件
および検索条件を用いて第2の検索条件を設定する設定
手段と、を備え、前記検索手段は、前記設定手段で設定
された第2の検索条件に基づいて検索処理を行うため、
複数回にわたる検索処理を行わなければならない場合
に、前回の検索結果を新たな検索条件を用いて、次の検
索処理のための検索条件を効率良く設定することがで
き、情報検索の利便性の向上を図ることができる。Further, the information retrieval apparatus of the present invention (Claim 2)
According to the first aspect, the first setting means for setting a first search condition, the search means for performing a search process based on the first search condition set by the first setting means, and the first search Specifying means for designating at least one of the information obtained from the search results based on the condition as a constraint condition, and additionally designating a new search condition; and using the constraint condition and the search condition designated by the designating means, Setting means for setting a second search condition, wherein the search means performs a search process based on the second search condition set by the setting means,
When multiple search processes need to be performed, the previous search results can be set efficiently using new search conditions, and the search conditions for the next search process can be set efficiently. Improvement can be achieved.
【0066】また、本発明の検索結果を利用した検索条
件の生成方法(請求項3)によれば、設定された第1の
検索条件に基づいて検索処理を行った後、前記第1の検
索条件による検索結果から得られた情報の少なくとも1
つを制約条件として指定する指定工程と、前記指定工程
で指定された制約条件を用いて第2の検索条件を設定す
る設定工程と、を含むため、複数回にわたる検索処理を
行わなければならない場合に、前回の検索結果を利用し
て、次の検索処理のための検索条件を効率良く設定する
ことができ、情報検索の利便性の向上を図ることができ
る。Further, according to the search condition generating method using the search result of the present invention (claim 3), after performing the search processing based on the set first search condition, the first search is performed. At least one of the information obtained from the search results by the condition
When a search process must be performed a plurality of times because it includes a designation step of designating one as a constraint condition and a setting step of setting a second search condition using the constraint condition designated in the designation step In addition, the search conditions for the next search process can be efficiently set using the previous search result, and the convenience of information search can be improved.
【0067】また、本発明の検索結果を利用した検索条
件の生成方法(請求項4)によれば、設定された第1の
検索条件に基づいて検索処理を行った後、前記第1の検
索条件による検索結果から得られた情報の少なくとも1
つを制約条件として指定し、かつ、新たな検索条件を追
加指定する指定工程と、前記指定工程で指定された制約
条件および検索条件を用いて第2の検索条件を設定する
設定工程と、を含むため、複数回にわたる検索処理を行
わなければならない場合に、前回の検索結果を新たな検
索条件を用いて、次の検索処理のための検索条件を効率
良く設定することができ、情報検索の利便性の向上を図
ることができる。Further, according to the search condition generating method using the search result of the present invention (claim 4), after performing the search processing based on the set first search condition, the first search is performed. At least one of the information obtained from the search results by the condition
And a setting step of setting a second search condition using the constraint condition and the search condition specified in the specifying step. Therefore, when search processing must be performed multiple times, the previous search results can be set efficiently by using new search conditions to set search conditions for the next search processing. Convenience can be improved.
【0068】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項5)によれば、請求項3または4
に記載の検索結果を利用した検索条件の生成方法の各工
程をコンピュータに実行させるためのプログラムを記録
したため、このプログラムをコンピュータに実行させる
ことにより、複数回にわたる検索処理を行わなければな
らない場合に、前回の検索結果を利用して、次の検索処
理のための検索条件を効率良く設定することができ、情
報検索の利便性の向上を図った検索結果を利用した検索
条件の生成方法を実現することができる。Further, according to the computer readable recording medium of the present invention (claim 5), claim 3 or 4
Since a program for causing a computer to execute each step of the search condition generation method using the search result described in the above is recorded, by executing this program on the computer, it is necessary to perform a plurality of search processes. , It is possible to efficiently set search conditions for the next search process using the previous search results, and realize a search condition generation method using search results that improves the convenience of information search can do.
【図1】本実施の形態の情報検索装置のシステム構成図
である。FIG. 1 is a system configuration diagram of an information search device according to an embodiment.
【図2】図1に示したクライアントの処理を示す概略ブ
ロック図である。FIG. 2 is a schematic block diagram illustrating processing of a client illustrated in FIG. 1;
【図3】図1に示した検索サーバの処理を示す概略ブロ
ック図である。FIG. 3 is a schematic block diagram illustrating processing of a search server illustrated in FIG. 1;
【図4】本実施の形態の情報検索装置において、転置フ
ァイルの生成処理を示すフローチャートである。FIG. 4 is a flowchart showing a process of generating a transposed file in the information search device of the present embodiment.
【図5】本実施の形態の情報検索装置において、通常の
検索処理を示すフローチャートである。FIG. 5 is a flowchart showing a normal search process in the information search device of the present embodiment.
【図6】本実施の形態の情報検索装置において、検索結
果を利用した検索処理を示すフローチャートである。FIG. 6 is a flowchart illustrating a search process using a search result in the information search device of the present embodiment.
100 クライアント 101 文書DB 102 転置ファイル 103 検索サーバ 104 ネットワーク 200 クエリー 201,300 自然言語処理モジュール 202,301 辞書 203,302 文法辞書 204 制約条件 205 検索語 206 検索条件 207 制約条件設定部 208 指定部 303 ドキュメント・セット 304 データベース・ビルド・コンポーネント 305 クエリー・ビルド・コンポーネント 306 クエリー・ドキュメント 307 検索エンジン 308 文書リスト REFERENCE SIGNS LIST 100 client 101 document DB 102 transposed file 103 search server 104 network 200 query 201, 300 natural language processing module 202, 301 dictionary 203, 302 grammar dictionary 204 constraint condition 205 search word 206 search condition 207 constraint condition setting unit 208 designation unit 303 document Set 304 Database Build Component 305 Query Build Component 306 Query Document 307 Search Engine 308 Document List
Claims (5)
を行う情報検索装置において、 第1の検索条件を設定する第1の設定手段と、 前記第1の設定手段で設定された第1の検索条件に基づ
いて検索処理を行う検索手段と、 前記第1の検索条件による検索結果から得られた情報の
少なくとも1つを制約条件として指定する指定手段と、 前記指定手段で指定された制約条件を用いて第2の検索
条件を設定する設定手段と、を備え、 前記検索手段は、前記設定手段で設定された第2の検索
条件に基づいて検索処理を行うことを特徴とする情報検
索装置。1. An information search apparatus for performing a search process based on a specified search condition, wherein: a first setting means for setting a first search condition; and a first setting means for setting the first search condition. Search means for performing a search process based on search conditions; designating means for designating at least one of information obtained from a search result based on the first search condition as a constraint condition; constraint condition designated by the designating means Setting means for setting a second search condition by using the information search device, wherein the search means performs a search process based on the second search condition set by the setting means. .
を行う情報検索装置において、 第1の検索条件を設定する第1の設定手段と、 前記第1の設定手段で設定された第1の検索条件に基づ
いて検索処理を行う検索手段と、 前記第1の検索条件による検索結果から得られた情報の
少なくとも1つを制約条件として指定し、かつ、新たな
検索条件を追加指定する指定手段と、 前記指定手段で指定された制約条件および検索条件を用
いて第2の検索条件を設定する設定手段と、を備え、 前記検索手段は、前記設定手段で設定された第2の検索
条件に基づいて検索処理を行うことを特徴とする情報検
索装置。2. An information retrieval apparatus for performing a retrieval process based on a designated retrieval condition, comprising: a first setting means for setting a first retrieval condition; and a first setting means for setting the first retrieval condition. Search means for performing a search process based on a search condition; designating means for designating at least one of information obtained from a search result based on the first search condition as a constraint condition and additionally designating a new search condition And setting means for setting a second search condition using the constraint condition and the search condition specified by the specifying means, wherein the search means sets the second search condition by the setting means. An information search device for performing a search process based on the information search device.
索処理を行った後、前記第1の検索条件による検索結果
から得られた情報の少なくとも1つを制約条件として指
定する指定工程と、 前記指定工程で指定された制約条件を用いて第2の検索
条件を設定する設定工程と、 を含むことを特徴とする検索結果を利用した検索条件の
生成方法。3. A specifying step of performing a search process based on the set first search condition, and then specifying at least one of information obtained from a search result based on the first search condition as a constraint condition. A setting step of setting a second search condition using the constraint condition specified in the specifying step, and a search condition generation method using a search result.
索処理を行った後、前記第1の検索条件による検索結果
から得られた情報の少なくとも1つを制約条件として指
定し、かつ、新たな検索条件を追加指定する指定工程
と、 前記指定工程で指定された制約条件および検索条件を用
いて第2の検索条件を設定する設定工程と、 を含むことを特徴とする検索結果を利用した検索条件の
生成方法。4. After performing a search process based on the set first search condition, at least one of information obtained from a search result based on the first search condition is specified as a constraint condition, and Using a search result characterized by including: a specifying step of additionally specifying a new search condition; and a setting step of setting a second search condition using the constraint condition and the search condition specified in the specifying step. How to generate search conditions.
を利用した検索条件の生成方法の各工程をコンピュータ
に実行させるためのプログラムを記録したことを特徴と
するコンピュータ読み取り可能な記録媒体。5. A computer-readable recording medium recording a program for causing a computer to execute each step of the search condition generating method using the search result according to claim 3 or 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199610A JPH1145250A (en) | 1997-07-25 | 1997-07-25 | Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recorded |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199610A JPH1145250A (en) | 1997-07-25 | 1997-07-25 | Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recorded |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1145250A true JPH1145250A (en) | 1999-02-16 |
Family
ID=16410729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9199610A Pending JPH1145250A (en) | 1997-07-25 | 1997-07-25 | Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recorded |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1145250A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278988A (en) * | 2001-03-15 | 2002-09-27 | Just Syst Corp | Phrase string converting device, retrieving device, phrase string converting method, retrieving method and record medium |
JP2010079625A (en) * | 2008-09-26 | 2010-04-08 | Oki Electric Ind Co Ltd | Search device, search system, and search method |
JPWO2018030350A1 (en) * | 2016-08-08 | 2019-06-13 | 株式会社ジャム | Information provision device |
-
1997
- 1997-07-25 JP JP9199610A patent/JPH1145250A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278988A (en) * | 2001-03-15 | 2002-09-27 | Just Syst Corp | Phrase string converting device, retrieving device, phrase string converting method, retrieving method and record medium |
JP2010079625A (en) * | 2008-09-26 | 2010-04-08 | Oki Electric Ind Co Ltd | Search device, search system, and search method |
JPWO2018030350A1 (en) * | 2016-08-08 | 2019-06-13 | 株式会社ジャム | Information provision device |
US11669536B2 (en) | 2016-08-08 | 2023-06-06 | Jam Corporation | Information providing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3691844B2 (en) | Document processing method | |
US6366908B1 (en) | Keyfact-based text retrieval system, keyfact-based text index method, and retrieval method | |
US8250074B2 (en) | Document processing system and method thereof | |
JP3266586B2 (en) | Data analysis system | |
JP4347226B2 (en) | Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method | |
JP2007287134A (en) | Information extracting device and information extracting method | |
US20110307497A1 (en) | Synthewiser (TM): Document-synthesizing search method | |
JP4091146B2 (en) | Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
JP2008243024A (en) | Information acquisition device, program therefor and method | |
JP4065346B2 (en) | Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method | |
JP3767763B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device | |
JPH1145268A (en) | Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded | |
JPH1145250A (en) | Information retrieval device, generating method for retrieval condition using retrieval result, and computer-readable recording medium where program making computer implement same method is recorded | |
JPH1145252A (en) | Information retrieval device and computer readable recording medium for recording program for having computer function as the same device | |
JP2008204133A (en) | Answer search apparatus and computer program | |
JP2002183175A (en) | Text mining method | |
JPH1145251A (en) | Information analysis support device for using retrieval function and computer readable recording medium for recording program for making computer function as the same device | |
JPH1145249A (en) | Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded | |
JPH11259524A (en) | Information retrieval system, information processing method in information retrieval system and record medium | |
JP4497337B2 (en) | Concept search device and recording medium recording computer program | |
JP4384736B2 (en) | Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device | |
JPH1145254A (en) | Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device | |
JP4000332B2 (en) | Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
JP2003288332A (en) | Method and system for supporting structured document creation | |
JPH1145238A (en) | Document management system and computer readable recording medium for recording program for having computer function as the same system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070903 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071002 |