JPH09218881A - Additional retrieval word candidate presenting method, document retrieving method and devices therefor - Google Patents

Additional retrieval word candidate presenting method, document retrieving method and devices therefor

Info

Publication number
JPH09218881A
JPH09218881A JP8048385A JP4838596A JPH09218881A JP H09218881 A JPH09218881 A JP H09218881A JP 8048385 A JP8048385 A JP 8048385A JP 4838596 A JP4838596 A JP 4838596A JP H09218881 A JPH09218881 A JP H09218881A
Authority
JP
Japan
Prior art keywords
word
search
document
predetermined
additional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8048385A
Other languages
Japanese (ja)
Other versions
JP3422350B2 (en
Inventor
Takashi Inoue
孝史 井上
Kazuo Tanaka
一男 田中
Atsushi Takeshita
敦 竹下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04838596A priority Critical patent/JP3422350B2/en
Publication of JPH09218881A publication Critical patent/JPH09218881A/en
Application granted granted Critical
Publication of JP3422350B2 publication Critical patent/JP3422350B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a proper retrieval result by a reretrieval by picking up the word existing in the document obtained by the retrieval for which a prescribed retrieval condition is used and presenting the picked up word as the candidate of a new retrieval word to be added at the retrieval of the next time. SOLUTION: A memory 11 for retrieval word is a storage part storing a prescribed retrieval word. The prescribed retrieval word is stored to be taken out when the prescribed retrieval word is made AND or OR with an additional retrieval word in the second and succeeding retrievals. A control part 10 is a word pickup means picking up the word existing in the document obtained by the retrieval for which a prescribed retrieval condition is used. An additional retrieval candidate presenting means 20 presents the picked up word as the candidate of a new retrieval word to be added at the retrieval of the next time. Thus, a user can easily acquire truly necessary information in short time.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、所定の文書をデー
タベースに登録し、所定の検索語が含まれる文書等を上
記データベースから取り出す場合における追加検索語候
補提示方法、文書検索方法およびそれらの装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an additional search word candidate presentation method, a document search method, and devices for registering a predetermined document in a database and retrieving a document or the like containing a predetermined search word from the database. It is about.

【0002】[0002]

【従来の技術】全文検索とは、1つの文書の全体を登録
対象として、複数の文書をデータベースに予め登録し、
ユーザが与えた検索条件に関連する文書をそのデータベ
ースから取り出す技術である。検索条件は、たとえば
「通信」のように1つの検索語だけに関連する文書、
「通信AND計算機」のように「通信」と「計算機」と
の両方の検索語に関連する文書、「通信OR計算機」の
ようにいずれかの検索語に関連する文書も受諾されるこ
とが多い。
2. Description of the Related Art A full-text search is a document in which a plurality of documents are registered in advance in a database.
This is a technology for retrieving documents related to the search condition given by the user from the database. The search condition is a document related to only one search word, such as "communication",
Documents related to both search words "communication" and "calculator" such as "communication AND calculator" and documents related to either search word such as "communication OR calculator" are often accepted. .

【0003】ここで、「所定の検索条件に関連する文
書」とは、「所定の検索語が含まれる文書」とほぼ同義
であり、「所定の検索語と同一の単語が含まれる文書」
以外に、「所定の検索語と同義の単語が含まれる文
書」、「所定の検索語と送りがなのみが異なる単語が含
まれる文書」も含まれる。
Here, "a document related to a predetermined search condition" is almost synonymous with "a document including a predetermined search word", and "a document including the same word as the predetermined search word".
In addition, "a document containing a word synonymous with a predetermined search word" and "a document containing a word different from the predetermined search word only in advance" are also included.

【0004】図17は、従来の一般的な検索方法を示す
フローチャートである。
FIG. 17 is a flowchart showing a conventional general search method.

【0005】図17に示すフローチャートにおいて、ま
ず、ユーザが1つの検索語を与えて検索し(S1)、そ
の検索結果がディスプレイに表示され(S2)、この検
索結果に応じて、ユーザが新たな検索語を考え、この考
えた新たな検索語を追加することによって検索条件を変
更し(S3)、再度検索する(S4)。
In the flow chart shown in FIG. 17, first, the user searches by giving one search word (S1), the search result is displayed on the display (S2), and the user creates a new one according to the search result. A search term is considered, the search condition is changed by adding the new search term considered (S3), and the search is performed again (S4).

【0006】たとえば、最初「通信」という語を検索条
件として検索したときに、この検索の結果、希望する文
書数よりも多くの文書が検索された場合、「通信AND
計算機」等のように検索条件を変更して検索条件を絞り
込む。
For example, when a search is made using the word "communication" as a search condition, if more than the desired number of documents are found as a result of this search, "communication AND
Search conditions are narrowed down by changing the search conditions such as "Calculator".

【0007】[0007]

【発明が解決しようとする課題】従来の全文検索方法に
おいては、最初の検索結果に対して、ユーザが、AND
条件で検索語を追加することによって検索条件を変更す
る場合、どの検索語を新たに追加すればよいかという明
確な指針が存在しない。したがって、ユーザは、経験と
直感とに頼って新たな検索語を決め、この決められた検
索語を追加して再検索するが、このようにして再検索し
ても、以前の検索結果とほとんど変化がなかったり、ま
たは逆に、必要以上に検索結果が少なくなる(典型的に
は空になる)等、適切な結果が得られないことが多い。
In the conventional full-text search method, the user ANDs the first search result.
When changing a search condition by adding a search word as a condition, there is no clear guideline as to which search word should be newly added. Therefore, the user relies on his / her experience and intuition to decide a new search term, adds the decided search term, and re-searches. In many cases, appropriate results cannot be obtained because there is no change, or conversely, there are fewer search results than necessary (typically empty).

【0008】従来方法においては、検索条件の変更が試
行錯誤で何度も行なわれることになり、結局、検索効率
が悪いという問題がある。この問題は、文書の一部を検
索対象とした場合、文書のキーワードのみを検索対象と
した場合のように、全文検索以外の検索の場合も同様に
生じる問題である。
In the conventional method, the search condition is changed many times by trial and error, and as a result, there is a problem that the search efficiency is poor. This problem is also a problem that occurs in a search other than the full-text search, such as a case where a part of a document is searched and only a keyword of the document is searched.

【0009】本発明は、再検索によって適切な検索結果
を得ることができ、したがって、ユーザは、本当に必要
な情報を短時間にしかも容易に取得することができる追
加検索語候補提示方法、文書検索方法およびそれらの装
置を提供することを目的とするものである。
According to the present invention, an appropriate search result can be obtained by re-searching. Therefore, the user can easily obtain the really necessary information in a short time and easily, the additional search word candidate presentation method and the document search. It is an object to provide methods and their devices.

【0010】[0010]

【課題を解決するための手段】本発明は、所定の文書を
データベースに予め登録し、所定の検索条件に関連する
文書を上記データベースから取り出す場合、所定の検索
条件を用いた検索によって得られた文書中に存在する単
語をピックアップし、次回の検索時に追加すべき新たな
検索語の候補として、上記ピックアップされた単語を提
示するものである。
According to the present invention, a predetermined document is registered in a database in advance, and when a document related to a predetermined search condition is retrieved from the database, it is obtained by a search using the predetermined search condition. The words present in the document are picked up, and the picked-up words are presented as candidates for new search words to be added in the next search.

【0011】[0011]

【発明の実施の形態および実施例】図1は、本発明の一
実施例である追加検索語候補提示装置PS1を示すブロ
ック図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing an additional search word candidate presentation device PS1 which is an embodiment of the present invention.

【0012】追加検索語候補提示装置PS1は、制御部
10と、検索語用メモリ11と、出現単語表用メモリ1
2と、追加検索語候補提示手段20とを有する。追加検
索語候補提示手段20は、出現単語順位付け部21と、
追加検索語候補選択部22と、追加検索語候補提示部2
3とを有する。
The additional search word candidate presentation device PS1 includes a control unit 10, a search word memory 11, and an appearance word table memory 1.
2 and additional search word candidate presenting means 20. The additional search word candidate presentation unit 20 includes an appearance word ranking unit 21 and
Additional search word candidate selection unit 22 and additional search word candidate presentation unit 2
And 3.

【0013】追加検索語候補提示装置PS1は、全文検
索の対象になる文書全体をデータベースに登録し、所定
の検索条件に関連する文書を上記データベースから取り
出す文書検索装置において、追加すべき検索語の候補を
提示する装置である。ここで、「所定の検索条件に関連
する文書」は、「所定の検索語と同一の単語が含まれる
文書」、「所定の検索語と同義の単語が含まれる文
書」、「所定の検索語と送りがなが異なる単語が含まれ
る文書」である。また、上記の場合、所定の検索語と
は、1つの検索語または複数の検索語のことである。
The additional search word candidate presentation device PS1 registers all the documents to be subjected to full-text search in a database, and retrieves documents relevant to a predetermined search condition from the database. This is a device that presents candidates. Here, "a document related to a predetermined search condition" means "a document including the same word as a predetermined search word", "a document including a word synonymous with the predetermined search word", and "a predetermined search word". Is a document that contains words that are different from each other. Further, in the above case, the predetermined search word is one search word or a plurality of search words.

【0014】検索語用メモリ11は、所定の検索語を記
憶する記憶部であり、2回目以降の検索において、上記
所定の検索語を追加検索語とANDまたはORする場合
に、その所定の検索語を取り出すために記憶させるもの
である。出現単語表用メモリ12は、図2に示す出現単
語表T1を記憶する部分である。
The search word memory 11 is a storage unit for storing a predetermined search word, and when the predetermined search word is ANDed or ORed with the additional search word in the second and subsequent searches, the predetermined search word. It is a memory to retrieve a word. The appearance word table memory 12 is a part for storing the appearance word table T1 shown in FIG.

【0015】制御部10は、所定の検索条件を用いた検
索によって得られた文書中に存在する単語をピックアッ
プする単語ピックアップ手段の例である。追加検索語候
補提示手段20は、次回の検索時に追加すべき新たな検
索語の候補として、上記ピックアップされた単語を提示
する追加検索語候補提示手段の例である。
The control unit 10 is an example of a word pickup means for picking up a word existing in a document obtained by a search using a predetermined search condition. The additional search word candidate presenting means 20 is an example of the additional search word candidate presenting means that presents the above-mentioned picked-up word as a candidate for a new search word to be added in the next search.

【0016】図2は、上記実施例における出現単語表T
1の例を示す図である。
FIG. 2 shows an appearance word table T in the above embodiment.
It is a figure which shows the example of 1.

【0017】出現単語表T1は、ヒットした所定の文書
に存在する全ての単語をピックアッップし、このピック
アップされた各単語と、このピックアップされた各単語
が存在する文書(ヒットした所定の文書に限る)の数と
を対応させた表である。
In the appearance word table T1, all the words existing in the hit predetermined document are picked up, and each of the picked-up words and the document in which the picked-up word exists (the specified hit document is It is a table corresponding to the number of (limited).

【0018】つまり、所定の検索語に基づく検索によっ
てヒットした文書中に、「ネットワーク」、「システ
ム」等の単語が存在し、そのうちの「ネットワーク」と
いう単語が含まれるヒット文書が10個あり、「システ
ム」という単語が含まれるヒット文書が4つ存在してい
る例が図2に示されている。
That is, words such as "network" and "system" exist in the documents hit by the search based on the predetermined search word, and there are 10 hit documents including the word "network" among them. An example in which there are four hit documents including the word "system" is shown in FIG.

【0019】なお、出現単語表T1に表示される単語
は、助詞、助動詞等の付属語を含まない自立語である。
The words displayed in the appearance word table T1 are independent words that do not include auxiliary words such as particles and auxiliary verbs.

【0020】追加検索語候補提示手段20は、所定の検
索語に対応する単語を追加検索語候補として提示する手
段であり、出現単語順位付け部21と、追加検索語候補
選択部22と、追加検索語候補提示部23とを有する。
The additional search word candidate presenting means 20 is a means for presenting a word corresponding to a predetermined search word as an additional search word candidate, and has an appearance word ranking unit 21, an additional search word candidate selecting unit 22, and an addition unit. The search word candidate presentation unit 23 is included.

【0021】出現単語順位付け部21は、出現単語を所
定の方法で順位付けする部分であり、追加検索語候補選
択部22は、この順位付けされた出現単語を所定の順序
で所定数選択する部分であり、追加検索語候補提示部2
3は、この追加検索語候補選択部22が選択した出現単
語を追加検索語候補として提示する部分である。
The appearance word ranking unit 21 is a unit for ranking the appearance words by a predetermined method, and the additional search word candidate selection unit 22 selects a predetermined number of the ranked appearance words in a predetermined order. The additional search word candidate presentation unit 2
Reference numeral 3 denotes a portion for presenting the appearing word selected by the additional search word candidate selection unit 22 as an additional search word candidate.

【0022】なお、追加検索語候補を提示する場合、そ
の追加検索語候補を追加したときに検索結果が空になら
ないという条件(第1の条件)と、その追加検索語候補
を追加したときの検索結果の文書数が適切に減少すると
いう条件(第2の条件)とを満たすものとする。
When presenting additional search word candidates, there are a condition (first condition) that the search result is not empty when the additional search word candidates are added, and a condition when the additional search word candidates are added. It is assumed that the condition (second condition) that the number of documents in the search result is appropriately reduced is satisfied.

【0023】図3は、上記実施例において出現単語を順
位付けする場合に使用する関数の一例をグラフ化したも
のである。
FIG. 3 is a graph showing an example of a function used to rank the appearing words in the above embodiment.

【0024】図3に示すグラフにおいて、その横軸は、
(所定の出現単語に関する出現文書数)/(検索された
文書の数)であり、0〜1の値を取るものであり、その
縦軸は、追加検索語としての出現単語の評価を示す点数
であり、この点数が高い程、その出現単語の上記順位が
高くなるとする。
In the graph shown in FIG. 3, the horizontal axis is
It is (the number of appearing documents concerning a predetermined appearing word) / (the number of retrieved documents), which takes a value of 0 to 1, and the vertical axis thereof is a score indicating the evaluation of the appearing word as an additional search word. It is assumed that the higher the score is, the higher the rank of the appearing word is.

【0025】図4は、上記実施例において、順位付けさ
れた出現単語の例を示す図である。図4に示す例におい
て、出現単語「ファイル」、「システム」、「通信」、
「処理」、「ネットワーク」、……の順位は、それぞ
れ、1位、2位、3位、4位、5位、……である。
FIG. 4 is a diagram showing an example of ranked appearing words in the above embodiment. In the example shown in FIG. 4, the occurrence words “file”, “system”, “communication”,
The ranks of “processing”, “network”, ... Are 1st, 2nd, 3rd, 4th, 5th ,.

【0026】図5は、上記実施例において、追加検索語
候補選択部22によって選択された追加検索語候補の例
を示す図である。図5に示す例は、出現単語順位付け部
21によって順位付けられた追加検索語候補のうち、順
位1〜4位のものが選択されている。
FIG. 5 is a diagram showing an example of the additional search word candidates selected by the additional search word candidate selecting section 22 in the above embodiment. In the example shown in FIG. 5, among the additional search word candidates ranked by the appearing word ranking unit 21, those of ranks 1 to 4 are selected.

【0027】次に、上記実施例の動作について説明す
る。
Next, the operation of the above embodiment will be described.

【0028】図6は、上記第1の実施例の動作を示すフ
ローチャートである。
FIG. 6 is a flow chart showing the operation of the first embodiment.

【0029】まず、1つの単語が最初の検索語として入
力され(S1)、この検索語に対する検索が終わり、こ
の検索結果が表示されたが(S2)、ヒットした文書数
が多いので、ユーザはその結果に満足せず、新たな検索
語をANDで追加したいと考えたとする。ここで、従来
例では、ユーザが任意に思いつく単語を検索語として追
加することになるが、上記実施例においては、ユーザか
ら要求があると有効な追加検索語の候補が提示され(S
10)(または、ユーザからの要求がなくても自動的に
有効な追加検索語の候補が提示され)、ユーザはその中
から追加すべき検索語を任意に選択し(S20)、選択
した検索語を追加し(S3)、再検索する(S4)。
First, one word is input as the first search word (S1), the search for this search word is completed, and this search result is displayed (S2). However, since the number of hit documents is large, the user Suppose that you are not satisfied with the result and want to add a new search word with AND. Here, in the conventional example, a word that the user can think of arbitrarily is added as a search word. However, in the above-described embodiment, a valid additional search word candidate is presented when the user requests (S).
10) (Or, even if there is no request from the user, valid additional search word candidates are automatically presented), the user arbitrarily selects a search word to be added from among them (S20), and selects the selected search word. A word is added (S3) and a search is performed again (S4).

【0030】図7は、上記実施例における追加検索語候
補提示動作(S10)を具体的に示すフローチャートで
ある。
FIG. 7 is a flow chart specifically showing the additional search word candidate presentation operation (S10) in the above embodiment.

【0031】図7に示すフローチャートにおいて、ユー
ザからの追加検索語候補提示要求を制御部10が受ける
と(S11)、制御部10が出現単語表T1を作成する
(S12)。そして、その出現単語を取り出し、順位付
けする(S13)。順位づけの方法としては種々の方法
が考えられるが、出現文書数の少ないものから順位づけ
する方法(第1の方法)や、出現文書数が中程度のもの
を絞り込むことがより有効であるとして、図3に示すグ
ラフの関数に応じて、点数づけし(評価し)、その点数
の高いものから順位づけする方法(第2の方法)等が考
えられる。
In the flowchart shown in FIG. 7, when the control unit 10 receives a request for presenting additional search word candidates from the user (S11), the control unit 10 creates the appearance word table T1 (S12). Then, the appearing words are taken out and ranked (S13). Various methods can be considered as the ranking method, but it is more effective to rank the ones with the smallest number of appearing documents (first method) or to narrow down the ones with a medium number of appearing documents. A method (second method) of scoring (evaluating) according to the function of the graph shown in FIG. 3 and ranking from the highest score is conceivable.

【0032】このように順位づけされた出現単語の中か
ら、所定数の出現単語を絞って追加検索語候補とするよ
うな追加検索語候補選択を行なう(S14)。この場
合、適当な閾値を定め、この定められた閾値よりも低い
順位の出現単語を、追加検索語候補から除去する。
From the appearing words ranked in this way, additional search word candidates are selected such that a predetermined number of appearing words are narrowed down to be additional search word candidates (S14). In this case, an appropriate threshold value is set, and the appearing words having a rank lower than the set threshold value are removed from the additional search word candidates.

【0033】このようにして残った出現単語を追加検索
語候補として、出現文書数とともにユーザに提示する
(S15)。ユーザは、この中から追加検索語を任意に
選び出し、検索条件にAND条件として追加し(S
3)、再検索を行なう(S4)。
The remaining appearing words are presented to the user together with the number of appearing documents as additional search word candidates (S15). The user arbitrarily selects an additional search word from these and adds it as an AND condition to the search condition (S
3) Then, re-search is performed (S4).

【0034】図8は、上記実施例における出現単語表T
1の作り方(S12)を示すフローチャートである。
FIG. 8 shows an appearance word table T in the above embodiment.
It is a flow chart which shows how to make 1 (S12).

【0035】まず、空の出現単語表T1を作成し(S2
1)、直前に設定した検索語(検索条件)でヒットした
文書の集合を文書群Sdとし(S22)、ヒット文書群
Sdから1つの文書Dを抜き出し(S24)、文書Dに
出現する(存在する)単語の集合を単語群Swとする
(S25)。ただし、単語群Sw中に同一の単語は1つ
のみ含むとする。そして、単語群Swから1つの単語W
を抜き出し(S27)、この単語Wが出現単語表T1の
出現単語欄に存在していなければ(S28)、出現単語
表T1の出現単語欄に単語Wを追加し、対応する出現文
書数の欄を「1」にする(S29)。単語Wが出現単語
表T1の出現単語欄に存在していれば(S28)、2つ
目以降の文書が検出されたのであるから、出現単語表T
1の出現単語欄に既に記載されている単語Wに対応する
出現文書数の欄の数字を1インクリメントする(S3
0)。
First, an empty appearance word table T1 is created (S2
1), a set of documents hit by the search word (search condition) set immediately before is set as a document group Sd (S22), one document D is extracted from the hit document group Sd (S24), and appears in the document D (existence) A set of words is defined as a word group Sw (S25). However, it is assumed that the word group Sw includes only one identical word. Then, one word W from the word group Sw
(S27), if this word W does not exist in the appearing word column of the appearing word table T1 (S28), the word W is added to the appearing word column of the appearing word table T1 and the corresponding appearing document number column is displayed. Is set to "1" (S29). If the word W exists in the appearing word column of the appearing word table T1 (S28), the second and subsequent documents have been detected, so the appearing word table T
The number in the number-of-appearing-documents column corresponding to the word W already described in the 1-word column is incremented by 1 (S3).
0).

【0036】そして、単語群Swから当該単語Wを除去
し(S31)、単語群Swから次の単語Wを抜き出し
(S26、S27)、上記動作(S28〜S31)を実
行し、これらを繰り返し、単語群Swに単語Wが無くな
れば(S26)、ヒット文書群Sdから当該文書Dを取
り除く(S32)。その後、ヒット文書群Sdから次の
文書Dを抜き出し(S23、S24)、上記動作(S2
5〜S32)を実行し、これらを繰り返し、ヒット文書
群Sdに文書Dが無くなれば(S23)、リターンす
る。
Then, the word W is removed from the word group Sw (S31), the next word W is extracted from the word group Sw (S26, S27), the above operation (S28 to S31) is executed, and these are repeated. When the word W disappears from the word group Sw (S26), the document D is removed from the hit document group Sd (S32). After that, the next document D is extracted from the hit document group Sd (S23, S24), and the above operation (S2
5 to S32) are repeated and these are repeated, and if there is no document D in the hit document group Sd (S23), the process returns.

【0037】次に、上記実施例をより具体的に説明す
る。
Next, the above embodiment will be described more specifically.

【0038】まず、ユーザは「計算機」という単語を最
初の検索語として検索を行ない、その検索された文書数
が当初の希望数よりも多かったとし、AND条件で新た
な検索語を追加するために、追加検索語候補提示要求を
出したとする。このときに、図2に示す出現単語表T1
が制御部10によって与えられ、「出現単語順位づけ方
法」として、「出現文書数の少ないものから順位づけす
る方法」を採用することとし、追加検索語候補選択部2
2の閾値として「4」を用いる(順位第4位までを抜き
出す)ものとする。
First, the user searches with the word "calculator" as the first search word, and it is assumed that the number of documents searched is larger than the initially desired number, and a new search word is added under the AND condition. It is assumed that a request for presenting additional search word candidates is issued to. At this time, the appearance word table T1 shown in FIG.
Is given by the control unit 10, and as the “appearance word ranking method”, the “method of ranking from the smallest number of appearing documents” is adopted, and the additional search word candidate selection unit 2
It is assumed that “4” is used as the threshold value of 2 (extracting up to the 4th place in the order).

【0039】ここで、要求を受けた制御部10は、出現
単語表T1を調べ、結果として図5に示す順位づけされ
た出現単語を得る。
Upon receipt of the request, the control unit 10 examines the appearing word table T1 and as a result obtains the ranked appearing words shown in FIG.

【0040】最後に、追加検索語候補選択部22におい
て、図5に示すように、順位の上位4個の出現単語が残
り、この上位4個の出現単語を追加検索語候補としてユ
ーザーに提示する。この場合、その候補を表示装置等に
表示することによって提示する。ユーザーは、提示され
た4個の追加検索語候補の中から適当なものを選び、こ
の選ばれた追加検索語を検索条件に追加し、再検索を行
なう。
Finally, in the additional search word candidate selection section 22, as shown in FIG. 5, the four highest-ranked appearing words remain, and the upper four appearing words are presented to the user as additional search word candidates. . In this case, the candidates are presented by being displayed on a display device or the like. The user selects an appropriate one from the four additional search word candidates presented, adds the selected additional search word to the search condition, and performs the search again.

【0041】上記実施例によれば、所定の検索語による
検索結果に応じて、AND条件で追加すべき有効な追加
検索語の候補を、ユーザに提示するようにしているの
で、ユーザ自身の勘に頼ることなく、ユーザがその中か
ら追加検索語を容易に選択でき、また、このようにして
選択された追加検索語を追加して検索するので、より適
切な文書を得ることができる。
According to the above embodiment, the valid additional search word candidates to be added under the AND condition are presented to the user according to the search result by the predetermined search word. The user can easily select an additional search word from the list without relying on, and the additional search word selected in this way is added and searched, so that a more appropriate document can be obtained.

【0042】なお、追加検索語候補提示手段20が、追
加検索語候補提示部23のみで構成されているものであ
るとしてもよく、この場合、追加検索語候補提示手段2
0は、所定の検索語に対応する出現単語を追加検索語候
補として提示する手段であり、順位付け、追加検索語の
選択を行わない。このようにしても、従来方法と比較す
ると、必要な情報を短時間にしかも容易に取得すること
ができる。
The additional search word candidate presenting means 20 may be constituted only by the additional search word candidate presenting section 23. In this case, the additional search word candidate presenting means 2 is provided.
0 is a means for presenting an appearance word corresponding to a predetermined search word as an additional search word candidate, and does not perform ranking and selection of the additional search word. Even in this case, as compared with the conventional method, necessary information can be acquired easily in a short time.

【0043】また、追加検索語候補提示手段20が、出
現単語順位付け部21と、追加検索語候補提示部23と
で構成され、追加検索語候補選択部22が削除されたも
のであるとしてもよく、この場合、追加検索語候補提示
手段20は、出現単語を所定の方法で順位付けする出現
単語順位付け部と、この順位付けされた出現単語を上記
順位とともに追加検索語候補として提示する追加検索語
候補提示部とで構成されている。このようにすれば、追
加検索語候補提示手段20が追加検索語候補提示部23
のみで構成されている場合よりも、2回目の検索が容易
になる。
Further, even if the additional search word candidate presenting means 20 is composed of the appearance word ranking section 21 and the additional search word candidate presenting section 23, the additional search word candidate selecting section 22 is deleted. Of course, in this case, the additional search word candidate presenting means 20 presents an appearing word ranking unit that ranks the appearing words by a predetermined method, and presents the ranked appearing words together with the above order as additional search word candidates. The search word candidate presentation unit. In this way, the additional search word candidate presenting means 20 causes the additional search word candidate presenting unit 23 to perform.
The second search is easier than the case of being configured with only.

【0044】上記実施例において、追加検索語選択22
は、提示された追加検索語候補から所望の追加検索語を
選択する追加検索語選択手段の例であり、制御部10
は、選択された追加検索語と所定の検索語とを用いて、
再び検索を行う再検索手段の例である。
In the above embodiment, the additional search word selection 22
Is an example of additional search word selection means for selecting a desired additional search word from the presented additional search word candidates, and is the control unit 10.
Using the selected additional search word and the predetermined search word,
It is an example of a re-search means for performing a search again.

【0045】また、制御部10は、単語ピックアップ手
段の例であるが、この単語ピックアップ手段は、所定の
検索条件に基づく検索によってヒットした所定の文書を
得た後に、上記ヒットした所定の文書中の1つの文書に
存在する所定の単語と、上記ヒットした所定の文書中の
他の文書に存在する単語とがともに存在する文書の数を
検出する手段である。
The control unit 10 is an example of a word pick-up means. This word pick-up means obtains a predetermined document hit by a search based on a predetermined search condition, and then, in the hit predetermined document. Is a means for detecting the number of documents in which a predetermined word existing in one of the documents and a word existing in another document in the above-mentioned hit predetermined documents are both present.

【0046】追加検索語候補提示装置PS1において
は、所定の検索語に基づく検索によって所定の文書を得
ており、1つの検索語を使用して検索しているが、2つ
以上の検索語を同時に使用して検索するようにしてもよ
く、つまり、所定の検索条件で検索するようにしてもよ
い。
In the additional search word candidate presentation device PS1, a predetermined document is obtained by a search based on a predetermined search word, and one search word is used for the search, but two or more search words are searched. You may make it search simultaneously using, ie, you may make it search by predetermined search conditions.

【0047】図9は、本発明の他の実施例である追加検
索語候補提示装置PS2を示すブロック図である。
FIG. 9 is a block diagram showing an additional search word candidate presentation device PS2 which is another embodiment of the present invention.

【0048】追加検索語候補提示装置PS2は、制御部
30と、検索語用メモリ31と、共起表用メモリ32
と、追加検索語候補提示手段40とを有する。追加検索
語候補提示手段40は、共起単語順位付け部41と、追
加検索語候補選択部42と、追加検索語候補提示部43
とを有する。
The additional search word candidate presentation device PS2 includes a control unit 30, a search word memory 31, and a co-occurrence table memory 32.
And additional search word candidate presenting means 40. The additional search word candidate presenting unit 40 includes a co-occurrence word ranking unit 41, an additional search word candidate selecting unit 42, and an additional search word candidate presenting unit 43.
And

【0049】追加検索語候補提示装置PS2は、全文検
索の対象になる文書全体をデータベースに登録し、所定
の検索条件に関連する文書を上記データベースから取り
出す文書検索装置であり、基本的には、追加検索語候補
提示装置PSと同じであるが、出現単語表T1の代わり
に共起表T2を使用し、制御部10の代わりに制御部3
0を使用し、追加検索語候補提示手段20の代わりに、
追加検索語候補提示手段40を使用している点が異な
る。
The additional search word candidate presentation device PS2 is a document search device that registers the entire document to be subjected to full-text search in the database and retrieves documents related to a predetermined search condition from the database. Basically, It is the same as the additional search word candidate presentation device PS, but uses the co-occurrence table T2 instead of the appearance word table T1, and the control unit 3 instead of the control unit 10.
0, instead of the additional search word candidate presenting means 20,
The difference is that the additional search word candidate presenting means 40 is used.

【0050】また、共起表T2は、原則として、データ
ベース完成時に1回のみ作れば足りるものであり、検索
する度に作る必要はない(データベースを更新した場合
には共起表も更新する)。制御部30は、基本的には、
制御部10と同じであるが、出現単語表T1の代わりに
共起表T2を使用することに応じて動作が多少異なる。
また、追加検索語候補提示手段40も、基本的には、追
加検索語候補提示手段20と同じであるが、出現単語表
T1の代わりに共起表T2を使用することに応じて、そ
の構成、動作が多少異なる。検索語用メモリ31は、最
初の検索語を記憶する記憶部である。
In principle, the co-occurrence table T2 need only be created once when the database is completed, and need not be created each time the database is searched (the co-occurrence table is also updated when the database is updated). . The control unit 30 basically has
It is the same as the control unit 10, but the operation is slightly different depending on the use of the co-occurrence table T2 instead of the appearance word table T1.
Further, the additional search word candidate presenting means 40 is basically the same as the additional search word candidate presenting means 20, but its configuration is based on the use of the co-occurrence table T2 instead of the appearance word table T1. , The operation is slightly different. The search word memory 31 is a storage unit that stores the first search word.

【0051】制御部30は、単語ピックアップ手段の例
であり、この単語ピックアップ手段は、データベース中
の全文書に存在する単語をピックアップし、このピック
アップされた単語中の1つの単語と、このピックアップ
された単語中の1つの単語とともに同一の文書に存在す
る共起単語と、共起文書数とが対応する共起表を、検索
前に作成し、検索してヒットした文書中に存在する各単
語について、上記共起表から対応する共起単語と共起文
書数とを取り出す手段の例である。
The control unit 30 is an example of word pick-up means, and this word pick-up means picks up a word existing in all the documents in the database, and one word among the picked-up words and this picked-up word. A co-occurrence table in which the number of co-occurrence documents corresponding to one co-occurrence word in the same document together with one word is created before the retrieval, and each word present in the retrieved document is found. Is an example of means for extracting the corresponding co-occurrence word and the number of co-occurrence documents from the co-occurrence table.

【0052】さらに、共起単語順位付け部41は、ピッ
クアップされた単語が存在する文書の数に応じた所定の
基準によって、上記ピックアップされた単語を順位付け
て提示する手段の例であり、追加検索語候補提示部43
は、ピックアップされた単語と、このピックアップされ
た単語が存在する文書の数とを対応させて提示する手段
の例でありる。
Further, the co-occurrence word ranking unit 41 is an example of a means for ranking and presenting the picked-up words according to a predetermined criterion according to the number of documents in which the picked-up words are present. Search term candidate presentation unit 43
Is an example of a means for presenting the picked-up word and the number of documents in which the picked-up word exists in association with each other.

【0053】ところで、「共起単語」は、データベース
中の全文書に存在する単語をピックアップし、このピッ
クアップされた単語中の1つの単語と、このピックアッ
プされた単語中の1つの単語とともに同一の文書に存在
する単語である。また、「共起文書数」は、ピックアッ
プされた単語中の1つの単語とともに共起単語が存在す
る文書の数である。「共起表」は、ピックアップされた
単語中の1つの単語と、その共起単語と、その共起文書
数とが対応している表である。
By the way, the "co-occurrence word" picks up a word existing in all documents in the database, and one word in the picked-up word and the same word together with one word in the picked-up word are the same. A word that exists in a document. The “number of co-occurrence documents” is the number of documents in which a co-occurrence word exists together with one word in the picked-up words. The “co-occurrence table” is a table in which one word among the picked-up words, the co-occurrence word, and the number of co-occurrence documents correspond to each other.

【0054】図10は、上記第2の実施例における共起
表T2の例を示す図である。
FIG. 10 is a diagram showing an example of the co-occurrence table T2 in the second embodiment.

【0055】図10に示す共起表T2おいて、各行の左
端に示す「単語の欄」には、データベースに登録されて
いる文書中の単語が記載され、「単語の欄」の右に記載
されている「共起単語の欄」には、「単語の欄」に記載
されている単語と共起する単語(同一文書中に存在する
単語)が列挙されている。なお、「共起単語」の欄に記
載されている括弧中の数字は、共起単語が記載されてい
る文書の数である。また、「共起単語」として採用され
る単語は、助詞、助動詞等の付属語を含まない自立語で
ある。
In the co-occurrence table T2 shown in FIG. 10, the words in the document registered in the database are written in the "word column" shown at the left end of each line, and written to the right of the "word column". In the "co-occurrence word column", the words co-occurring with the words described in the "word column" (words existing in the same document) are listed. The number in parentheses in the “Co-occurrence word” column is the number of documents in which the co-occurrence word is described. The word adopted as the “co-occurrence word” is an independent word that does not include auxiliary words such as particles and auxiliary verbs.

【0056】つまり、データベースに登録されている文
書中には、「ファイル」、「計算機」、「処理」等の単
語が含まれ、たとえば「計算機」という単語と共起する
単語(共起単語)、すなわち、「計算機」という単語が
含まれる文書中に含まれる単語は、図10の例によれ
ば、「通信」、「ネットワーク」、「処理」、「ファイ
ル」等である。この場合、「通信」という単語が含まれ
る文書はデータベースに3つ登録され、「ネットワー
ク」という単語が含まれる文書はデータベースに10個
登録されている。
That is, the words registered in the database include the words "file", "calculator", "process", etc., for example, a word that co-occurs with the word "calculator" (co-occurrence word). That is, the words included in the document including the word "computer" are "communication", "network", "processing", "file", etc. according to the example of FIG. In this case, three documents including the word "communication" are registered in the database, and ten documents including the word "network" are registered in the database.

【0057】制御部30は、データベース完成時に共起
表T2を作成する部分であり、この作成した共起表を共
起表用メモリ32に記憶し、この共起表T2から、所定
の検索語に対応する共起単語を追加検索語として取得す
る部分である。たとえば、所定の検索語を「計算機」と
した場合、「通信」、「ネットワーク」、「処理」、
「ファイル」等の共起単語を追加検索語として取得す
る。
The control unit 30 is a part that creates the co-occurrence table T2 when the database is completed. The co-occurrence table T32 is stored in the co-occurrence table memory 32. Is a part for acquiring the co-occurrence word corresponding to as an additional search word. For example, if the predetermined search term is "computer", "communication", "network", "processing",
Acquire a co-occurrence word such as “file” as an additional search term.

【0058】共起単語順位付け部41は、共起単語を所
定の方法で順位付けする部分であり、追加検索語候補選
択部42は、この順位付けされた共起単語を所定の順序
で所定数選択する部分であり、追加検索語候補提示部4
3は、この追加検索語候補選択部が選択した上記共起単
語を追加検索語候補として提示する部分である。
The co-occurrence word ranking unit 41 is a unit for ranking the co-occurrence words by a predetermined method, and the additional search word candidate selection unit 42 determines the ranked co-occurrence words in a predetermined order. This is a part for selecting a number, and the additional search word candidate presenting section 4 is provided.
Reference numeral 3 is a part for presenting the above-mentioned co-occurrence word selected by this additional search word candidate selection unit as an additional search word candidate.

【0059】図11は、上記第2の実施例において共起
単語を順位付けする場合に使用する関数の一例をグラフ
化したものである。
FIG. 11 is a graph showing an example of a function used for ranking the co-occurrence words in the second embodiment.

【0060】図11に示すグラフにおいて、その横軸
は、(最初の検索語の共起単語が含まれる文書の数)/
(最初の検索によって得られた文書の数)であり、0〜
1の値を取るものであり、その縦軸は、追加検索語とし
ての共起単語の評価を示す点数であり、この点数が高い
程、その共起単語の上記順位が高くなるとする。
In the graph shown in FIG. 11, the horizontal axis is (the number of documents including the co-occurrence word of the first search word) /
(The number of documents obtained by the first search), 0 to
It takes a value of 1, and the vertical axis thereof is a score indicating the evaluation of the co-occurrence word as an additional search word. The higher the score, the higher the rank of the co-occurrence word.

【0061】図12は、上記第2の実施例において、順
位付けされた共起単語の例を示す図である。図12に示
す例において、共起単語「ファイル」、「システム」、
「通信」、「処理」、「ネットワーク」、……の順位
は、それぞれ、1位、2位、3位、4位、5位、……で
ある。
FIG. 12 is a diagram showing an example of ranked co-occurrence words in the second embodiment. In the example shown in FIG. 12, the co-occurrence words “file”, “system”,
The ranks of “communication”, “processing”, “network”, ... Are 1st, 2nd, 3rd, 4th, 5th ,.

【0062】図13は、上記第2の実施例において、追
加検索語候補選択部42によって選択された追加検索語
候補の例を示す図である。図13に示す例は、共起単語
順位付け部41によって順位付けられた追加検索語候補
のうち、順位1〜4位のものが選択されている。
FIG. 13 is a diagram showing an example of the additional search word candidates selected by the additional search word candidate selecting section 42 in the second embodiment. In the example shown in FIG. 13, the additional search word candidates ranked by the co-occurrence word ranking unit 41 are selected from the first to fourth ranks.

【0063】次に、上記第2の実施例の動作について説
明する。
Next, the operation of the second embodiment will be described.

【0064】図14は、上記第2の実施例の動作を示す
フローチャートである。
FIG. 14 is a flow chart showing the operation of the second embodiment.

【0065】まず、データベース完成時に共起表T2を
作成しておく(S0)。そして、検索時に、1つの単語
が最初の検索語として入力され(S1)、この検索語に
対する検索が終わり、この検索結果が表示されたが(S
2)、ヒットした文書数が多いので、ユーザはその結果
に満足せず、新たな検索語をANDで追加したいと考え
たとする。ここで、従来例では、ユーザが任意に思いつ
く単語を検索語として追加することになるが、上記第2
の実施例においては、ユーザから要求があると有効な追
加検索語の候補が提示され(S10a)(または、ユー
ザからの要求がなくても自動的に有効な追加検索語の候
補が提示され)、ユーザはその中から追加すべき検索語
を選択し(S20a)、選択した検索語を追加し(S
3)、再検索する(S4)。
First, the co-occurrence table T2 is created when the database is completed (S0). Then, at the time of search, one word is input as the first search word (S1), the search for this search word ends, and this search result is displayed (S1).
2) Since the number of hit documents is large, the user is not satisfied with the result and wants to add a new search word by AND. Here, in the conventional example, a word that the user can think of arbitrarily is added as a search word.
In the embodiment of the present invention, a valid additional search word candidate is presented when the user requests it (S10a) (or a valid additional search word candidate is automatically presented without a request from the user). , The user selects a search word to be added from among them (S20a), and adds the selected search word (S20a).
3), search again (S4).

【0066】図15は、上記第2の実施例における追加
検索語候補提示動作(S10a)を具体的に示すフロー
チャートである。
FIG. 15 is a flow chart specifically showing the additional search word candidate presentation operation (S10a) in the second embodiment.

【0067】図15に示すフローチャートにおいて、ユ
ーザが追加検索語候補提示を制御部30に要求すると
(S11)、最初の検索語を検索語用メモリ31から取
り出し、この最初の検索語と共起する共起単語を、共起
表T2の対応する行から取り出し、このときに、共起単
語とともに共起する文書の数(共起単語が含まれる文書
の数)も取り出す(S12a)。
In the flowchart shown in FIG. 15, when the user requests the control unit 30 to present additional search word candidates (S11), the first search word is retrieved from the search word memory 31 and co-occurs with this first search word. The co-occurrence word is extracted from the corresponding row of the co-occurrence table T2, and at this time, the number of documents that co-occur with the co-occurrence word (the number of documents including the co-occurrence word) is also extracted (S12a).

【0068】このときに取り出した共起単語が、追加検
索語の初期候補になる。つまり、最初の検索語とその取
り出した共起単語とをAND条件で追加検索した場合
に、その検索結果として得られる文書は、最初の検索語
と追加された共起単語との両方が同時に含まれている文
書であるので、第1の条件(その語を追加したときに検
索結果が空にならないという条件)を満たす共起単語
は、追加検索語の初期候補になり、しかも、その共起単
語は必ず第1の条件を満たす。また、共起表T2中の共
起文書の数は、その共起単語を最初の検索語とAND条
件で追加検索した場合に検索される文書数である。
The co-occurrence word extracted at this time becomes the initial candidate for the additional search word. That is, when an additional search is performed on the first search word and the extracted co-occurrence word under the AND condition, the document obtained as the search result includes both the first search word and the added co-occurrence word at the same time. The co-occurrence word that satisfies the first condition (the condition that the search result is not empty when the word is added) is the initial candidate for the additional search word, and the co-occurrence Words always satisfy the first condition. The number of co-occurrence documents in the co-occurrence table T2 is the number of documents searched when the co-occurrence word is additionally searched with the first search word and the AND condition.

【0069】そして、取り出された共起単語に順位づけ
を行なう(S13a)。順位づけの方法としては種々の
方法が考えられるが、共起文書数の少ないものから順位
づけする方法(第1の方法)や、共起文書数が中程度の
ものを絞り込むことがより有効であるとして、図11に
示すグラフの関数に応じて、点数づけし(評価し)、そ
の点数の高いものから順位づけする方法(第2の方法)
等が考えられる。
Then, the extracted co-occurrence words are ranked (S13a). There are various possible methods for ranking, but it is more effective to rank the ones with the smallest number of co-occurring documents (first method) or to narrow down the number of co-occurring documents. Assuming that there is, a method of scoring (evaluating) according to the function of the graph shown in FIG. 11 and ranking from the one with the highest score (second method)
And so on.

【0070】このように順位づけされた共起単語の中か
ら、所定数の共起単語を絞って追加検索語候補とするよ
うな追加検索語候補選択を行なう(S14a)。この場
合、適当な閾値を定め、この定められた閾値よりも低い
順位の共起単語を、追加検索語候補から除去する。
From the co-occurrence words ranked in this way, additional search word candidates are selected so that a predetermined number of co-occurrence words are narrowed down to be additional search word candidates (S14a). In this case, an appropriate threshold value is set, and co-occurrence words lower than the set threshold value are removed from the additional search word candidates.

【0071】このようにして残った共起単語を追加検索
語候補として、共起文書数とともにユーザに提示する
(S15a)。ユーザは、この中から追加検索語を選び
出し、検索条件にAND条件として追加し(S3)、再
検索を行なう(S4)。
The remaining co-occurrence words are presented to the user as additional search word candidates together with the number of co-occurrence documents (S15a). The user selects an additional search word from these, adds it to the search condition as an AND condition (S3), and re-searches (S4).

【0072】図16は、上記第2の実施例における共起
表T2の作り方(S0)を示すフローチャートである。
FIG. 16 is a flow chart showing a method (S0) of creating the co-occurrence table T2 in the second embodiment.

【0073】まず、空の共起表T2を作成し、テキスト
データベース中の文書の集合をSdとし(S41)、文
書群Sdから1つの文書Dを抜き出し(S43)、文書
Dに存在する全ての単語の集合を単語群Swとする(S
44)。ただし、単語群Sw中に同一の単語は1つのみ
含むとする。そして、単語群Swから1つの単語Wを抜
き出し(S46)、この単語Wが共起表T2の単語欄に
存在していなければ(S47)、共起表T2の単語欄に
単語Wを追加する(S48)。
First, an empty co-occurrence table T2 is created, a set of documents in the text database is set to Sd (S41), one document D is extracted from the document group Sd (S43), and all the documents existing in the document D are extracted. Let a set of words be a word group Sw (S
44). However, it is assumed that the word group Sw includes only one identical word. Then, one word W is extracted from the word group Sw (S46), and if this word W does not exist in the word column of the co-occurrence table T2 (S47), the word W is added to the word column of the co-occurrence table T2. (S48).

【0074】そして、文書D中に存在する全ての単語の
集合を、共起単語検索用の単語群Scとする(S4
9)。ただし、単語群Sc中に同一の単語は1つのみ含
むとする。その後、単語群Scから1つの単語Wcを抜
き出し(S52)、単語Wcが共起表T2の単語Wに対
応する共起単語欄に存在しなければ(S53)、共起表
T2の単語Wに対応する共起単語の欄に単語Wcを追加
し、その共起文書の数を「1」にする(S54)。単語
Wcが共起表T2の単語Wに対応する共起単語欄に存在
すれば(S53)、単語Wcに対応する共起文書の数を
1インクリメントし(S55)、単語群Scから単語W
cを取り除き(S56)、単語群Scから次の単語Wc
を抜き出し(S51、S52)、上記動作(S53〜S
56)を実行し、これらを繰り返す。
Then, a set of all the words existing in the document D is set as a word group Sc for cooccurrence word search (S4).
9). However, it is assumed that only one identical word is included in the word group Sc. Then, one word Wc is extracted from the word group Sc (S52), and if the word Wc does not exist in the co-occurrence word column corresponding to the word W of the co-occurrence table T2 (S53), the word W of the co-occurrence table T2 is selected. The word Wc is added to the corresponding co-occurrence word column, and the number of co-occurrence documents is set to "1" (S54). If the word Wc exists in the co-occurrence word column corresponding to the word W of the co-occurrence table T2 (S53), the number of co-occurrence documents corresponding to the word Wc is incremented by 1 (S55), and the word group Sc is replaced with the word W.
c is removed (S56), and the next word Wc from the word group Sc
(S51, S52), the above operation (S53-S
56) is executed and these are repeated.

【0075】そして、単語群Scに単語Wが無くなれば
(S51)、所定単語に関する共起単語を検索するため
の単語としての単語Wを単語群Swから取り除き(S5
7)、新たな単語について共起単語を検索するために、
単語群Swから次の単語Wを抜き出し(S46)、上記
動作(S47〜S56)を実行し、これらを繰り返す。
そして、Swが無くなれば(S45)、文書群Sdから
文書Dを取り除き(S58)、文書群Sdから次の文書
Dを抜き出し(S43)、上記動作(S44〜S56)
を繰り返し、文書群Sdに文書Dが無くなれば(S4
2)、リターンする。
Then, when the word W is not present in the word group Sc (S51), the word W as a word for searching the co-occurrence word relating to the predetermined word is removed from the word group Sw (S5).
7), to search for co-occurrence words for new words,
The next word W is extracted from the word group Sw (S46), the above operation (S47 to S56) is executed, and these are repeated.
Then, if Sw disappears (S45), the document D is removed from the document group Sd (S58), the next document D is extracted from the document group Sd (S43), and the above operation (S44 to S56) is performed.
When the document D disappears from the document group Sd (S4
2) Return.

【0076】次に、上記第2の実施例をより具体的に説
明する。
Next, the second embodiment will be described more specifically.

【0077】まず、ユーザは「計算機」という単語を最
初の検索語として検索を行ない、その検索された文書数
が当初の希望数よりも多かったとし、AND条件で新た
な検索語を追加するために、追加検索語候補提示要求を
出したとする。このときに、共起表用メモリ32に図1
0に示す共起表T2が記憶されているので、候補提示要
求を受けた制御部30は、検索語用メモリ31から最初
の検索語である「計算機」を取り出し、共起表T2を調
べ、「計算機」の右に書かれている共起単語を取り出
す。この例では「通信(5)」、「ネットワーク(1
O)」、「処理(8)」、「ファイル(3)」、「ソフ
トウェア(10)」、「システム(4)」等を取り出
す。なお、括弧内は共起文書の数である。
First, the user searches with the word "calculator" as the first search word, and if the number of searched documents is larger than the desired number initially, the user adds a new search word with the AND condition. It is assumed that a request for presenting additional search word candidates is issued to. At this time, FIG.
Since the co-occurrence table T2 shown in FIG. 0 is stored, the control unit 30 that has received the candidate presentation request extracts the first search word “computer” from the search word memory 31 and checks the co-occurrence table T2. Take out the co-occurrence word written on the right side of "Calculator". In this example, "communication (5)", "network (1
"O)", "Process (8)", "File (3)", "Software (10)", "System (4)", etc. are taken out. The number in parentheses is the number of co-occurring documents.

【0078】次に、共起単語順位づけ部41において、
制御部30で取り出した共起単語の順位づけを行う。順
位づけの方法として、「共起文書の少ないものから順位
づけする方法」を採用しているから、結果として図13
に示す順位づけされた共起単語を得る。
Next, in the co-occurrence word ranking section 41,
The co-occurrence words retrieved by the control unit 30 are ranked. As a ranking method, the “ranking method with the least number of co-occurrence documents” is adopted. As a result, FIG.
Get the ranked co-occurrence words shown in.

【0079】最後に、追加検索語候補選択部42におい
て、図13に示すように、順位の上位4個の共起単語が
残り、この上位4個の共起単語を追加検索語候補として
ユーザーに提示する。ユーザーは、提示された4個の追
加検索語候補の中から適当なものを選び、この選ばれた
追加検索語を検索条件に追加し、再検索を行なう。
Finally, in the additional search word candidate selecting section 42, as shown in FIG. 13, the upper four co-occurrence words remain, and the upper four co-occurrence words are made available to the user as additional search word candidates. Present. The user selects an appropriate one from the four additional search word candidates presented, adds the selected additional search word to the search condition, and performs the search again.

【0080】上記第2の実施例によれば、所定の検索語
による検索結果に応じて、AND条件で追加すべき有効
な追加検索語の候補をユーザに提示するようにしている
ので、ユーザがその中から追加検索語を選んで追加する
ので、より適切な文書を得ることができ、しかも追加検
索語の選択が容易である。さらに、上記第2の実施例に
よれば、共起表T2がデータベース完成時に作成される
ので、検索の度に共起表T2を作成する必要がなく、こ
の作成時間だけ、追加検索語の候補を提示する準備時間
が短くなる。
According to the second embodiment, the user is presented with valid additional search word candidates to be added under the AND condition according to the search result by the predetermined search word. Since an additional search word is selected and added from among them, a more appropriate document can be obtained and the additional search word can be easily selected. Further, according to the second embodiment, since the co-occurrence table T2 is created when the database is completed, it is not necessary to create the co-occurrence table T2 every time the search is performed, and the additional search word candidates are required only for this creation time. The preparation time to present is shortened.

【0081】上記第2の実施例においては、共起表T2
における「単語の欄」の1行に1つの単語のみが記載さ
れているが、その1行に2つ以上の単語を記載するよう
にしてもよい。この場合、共起表における「単語の欄」
の1行に2つ以上の単語が記載されている共起表を、デ
ータベース完成時に作成してもよく、また、検索時に作
成するようにしてもよい。
In the second embodiment, the co-occurrence table T2
Although only one word is described in one line of the "word column" in, the two or more words may be described in that one line. In this case, the "word column" in the co-occurrence table
The co-occurrence table in which two or more words are described in one line may be created when the database is completed, or may be created when the search is performed.

【0082】なお、上記各実施例において、再検索する
場合、選択された追加検索語と所定の検索語とを、AN
D条件で検索するようにしてもよく、また、選択された
追加検索語と所定の検索語とを、OR条件で検索するよ
うにしてもよい。このようにOR条件で検索できるよう
にすれば、最初の検索語(所定の検索語)による検索が
いわゆる絞り込み過ぎていた場合に、より適切な検索を
行うことができる。
In each of the above-mentioned embodiments, when re-searching is performed, the selected additional search word and the predetermined search word are set to AN.
The search may be performed under the D condition, or the selected additional search word and the predetermined search word may be searched under the OR condition. By thus enabling the search under the OR condition, a more appropriate search can be performed when the search by the first search word (predetermined search word) is too narrowed down.

【0083】また、上記各実施例を方法として把握する
と、所定の文書をデータベースに登録し、所定の検索条
件に関連する文書を上記データベースから取り出す文書
検索方法において、所定の検索条件を用いた検索によっ
て得られた文書中に存在する単語をピックアップする単
語ピックアップ段階と、次回の検索時に追加すべき新た
な検索語の候補として、上記ピックアップされた単語を
提示する追加検索語候補提示段階とを有する追加検索語
候補提示方法である。また、この方法において、上記提
示された追加検索語候補から所望の追加検索語を選択す
る追加検索語選択段階と、上記選択された追加検索語と
上記所定の検索条件とを用いて、再び検索を行う再検索
段階とを追加することによって、文書検索方法を構成す
るようにしてもよい。
Further, grasping each of the above embodiments as a method, in a document search method of registering a predetermined document in a database and extracting a document related to a predetermined search condition from the database, a search using a predetermined search condition is performed. And a word pick-up step of picking up a word existing in the document obtained by the above, and an additional search word candidate presenting step of presenting the picked-up word as a candidate for a new search word to be added in the next search. This is a method for presenting additional search word candidates. In this method, a search is performed again using the additional search word selection step of selecting a desired additional search word from the presented additional search word candidates, the selected additional search word, and the predetermined search condition. The document retrieval method may be configured by adding a re-retrieval step for performing.

【0084】また、上記各実施例は、文書の一部を検索
対象とした場合、文書のキーワードのみを検索対象とし
た場合等のように、全文検索する場合以外の検索にも適
用できるものである。
Further, each of the above-described embodiments can be applied to a search other than a full-text search, such as a case where a part of a document is a search target, or a case where only a keyword of a document is a search target. is there.

【0085】[0085]

【発明の効果】本発明によれば、再検索によって適切な
検索結果を得ることができ、したがって、ユーザは、本
当に必要な情報を短時間にしかも容易に取得することが
できるという効果を奏する。
According to the present invention, an appropriate search result can be obtained by re-searching, and therefore, the user can easily obtain the really necessary information in a short time.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例である追加検索語候補提示装
置PS1を示すブロック図である。
FIG. 1 is a block diagram showing an additional search word candidate presentation device PS1 which is an embodiment of the present invention.

【図2】上記実施例における出現単語表T1の例を示す
図である。
FIG. 2 is a diagram showing an example of an appearance word table T1 in the above embodiment.

【図3】上記実施例において出現単語を順位付けする場
合に使用する関数の一例をグラフ化したものである。
FIG. 3 is a graph showing an example of a function used for ranking the appearing words in the above embodiment.

【図4】上記実施例において、順位付けされた共起単語
の例を示す図である。
FIG. 4 is a diagram showing an example of ranked co-occurrence words in the above embodiment.

【図5】上記実施例において、追加検索語候補選択部2
2によって選択された追加検索語候補の例を示す図であ
る。
FIG. 5 is an additional search word candidate selection unit 2 in the above embodiment.
It is a figure which shows the example of the additional search word candidate selected by 2.

【図6】上記第1の実施例の動作を示すフローチャート
である。
FIG. 6 is a flowchart showing the operation of the first embodiment.

【図7】上記実施例における追加検索語候補提示動作
(S10)を具体的に示すフローチャートである。
FIG. 7 is a flowchart specifically showing an additional search word candidate presentation operation (S10) in the above embodiment.

【図8】上記実施例における出現単語表T1の作り方
(S12)を示すフローチャートである。
FIG. 8 is a flowchart showing how to create an appearance word table T1 (S12) in the above embodiment.

【図9】本発明の他の実施例である追加検索語候補提示
装置PS2を示すブロック図である。
FIG. 9 is a block diagram showing an additional search word candidate presentation device PS2 which is another embodiment of the present invention.

【図10】上記第2の実施例における共起表T2の例を
示す図である。
FIG. 10 is a diagram showing an example of a co-occurrence table T2 in the second embodiment.

【図11】上記第2の実施例において共起単語を順位付
けする場合に使用する関数の一例をグラフ化したもので
ある。
FIG. 11 is a graph showing an example of a function used when ranking the co-occurrence words in the second embodiment.

【図12】上記第2の実施例において、順位付けされた
共起単語の例を示す図である。
FIG. 12 is a diagram showing an example of ranked co-occurrence words in the second embodiment.

【図13】上記第2の実施例において、追加検索語候補
選択部42によって選択された追加検索語候補の例を示
す図である。
FIG. 13 is a diagram showing an example of additional search word candidates selected by an additional search word candidate selection unit 42 in the second embodiment.

【図14】上記第2の実施例の動作を示すフローチャー
トである。
FIG. 14 is a flowchart showing the operation of the second embodiment.

【図15】上記第2の実施例における追加検索語候補提
示動作(S10a)を具体的に示すフローチャートであ
る。
FIG. 15 is a flowchart specifically showing an additional search word candidate presentation operation (S10a) in the second embodiment.

【図16】上記第2の実施例における共起表T2の作り
方(S0)を示すフローチャートである。
FIG. 16 is a flowchart showing how to create a co-occurrence table T2 (S0) in the second embodiment.

【図17】従来の一般的な検索方法を示すフローチャー
トである。
FIG. 17 is a flowchart showing a conventional general search method.

【符号の説明】[Explanation of symbols]

PS1、PS2…追加検索語候補提示装置、 10、30…制御部、 11、31…検索語用メモリ、 12…出現単語表用メモリ、 20、40…追加検索語候補提示手段、 21…出現単語順位付け部、 22、42…追加検索語候補選択部、 23、43…追加検索語候補提示部、 32…共起表用メモリ、 41…共起単語順位付け部。 PS1, PS2 ... Additional search word candidate presentation device, 10, 30 ... Control unit, 11, 31 ... Search word memory, 12 ... Appearing word table memory, 20, 40 ... Additional search word candidate presenting means, 21 ... Appearing word Ranking unit, 22, 42 ... Additional search word candidate selection unit, 23, 43 ... Additional search word candidate presentation unit, 32 ... Co-occurrence table memory, 41 ... Co-occurrence word ranking unit.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 所定の文書をデータベースに登録し、所
定の検索条件に関連する文書を上記データベースから取
り出す文書検索方法において、 所定の検索条件を用いた検索によって得られた文書中に
存在する単語をピックアップする単語ピックアップ段階
と;次回の検索時に追加すべき新たな検索語の候補とし
て、上記ピックアップされた単語を提示する追加検索語
候補提示段階と;を有することを特徴とする追加検索語
候補提示方法。
1. A document search method for registering a predetermined document in a database and retrieving a document related to a predetermined search condition from the database, wherein a word existing in a document obtained by a search using the predetermined search condition. An additional search word candidate presenting step of presenting the picked-up word as a candidate for a new search word to be added in the next search; Presentation method.
【請求項2】 所定の文書をデータベースに登録し、所
定の検索条件に関連する文書を上記データベースから取
り出す文書検索方法において、 所定の検索条件を用いた検索によって得られた文書中に
存在する単語をピックアップする単語ピックアップ段階
と;次回の検索時に追加すべき新たな検索語の候補とし
て、上記ピックアップされた単語を提示する追加検索語
候補提示段階と;上記提示された追加検索語候補から所
望の追加検索語を選択する追加検索語選択段階と;上記
選択された追加検索語と上記所定の検索条件とを用い
て、再び検索を行う再検索段階と;を有することを特徴
とする文書検索方法。
2. A document search method for registering a predetermined document in a database and retrieving a document related to a predetermined search condition from the database, wherein a word existing in a document obtained by a search using the predetermined search condition. A step of picking up a word; a step of presenting an additional search word candidate that presents the word that has been picked up as a candidate for a new search word to be added in the next search; A document search method comprising: an additional search word selection step of selecting an additional search word; and a re-search step of performing a search again using the selected additional search word and the predetermined search condition. .
【請求項3】 所定の文書をデータベースに登録し、所
定の検索条件に関連する文書を上記データベースから取
り出す文書検索装置において、 所定の検索条件を用いた検索によって得られた文書中に
存在する単語をピックアップする単語ピックアップ手段
と;次回の検索時に追加すべき新たな検索語の候補とし
て、上記ピックアップされた単語を提示する追加検索語
候補提示手段と;を有することを特徴とする追加検索語
候補提示装置。
3. A word existing in a document obtained by a search using a predetermined search condition in a document search device that registers a predetermined document in a database and retrieves a document related to the predetermined search condition from the database. An additional search word candidate presenting means for presenting the above-mentioned picked-up word as a candidate for a new search word to be added in the next search; Presentation device.
【請求項4】 所定の文書をデータベースに登録し、所
定の検索条件に関連する文書を上記データベースから取
り出す文書検索装置において、 所定の検索条件を用いた検索によって得られた文書中に
存在する単語をピックアップする単語ピックアップ手段
と;次回の検索時に追加すべき新たな検索語の候補とし
て、上記ピックアップされた単語を提示する追加検索語
候補提示手段と;上記提示された追加検索語候補から所
望の追加検索語を選択する追加検索語選択手段と;上記
選択された追加検索語と上記所定の検索条件とを用い
て、再び検索を行う再検索手段と;を有することを特徴
とする文書検索装置。
4. A document retrieval device that registers a predetermined document in a database and retrieves a document related to a predetermined search condition from the database, a word existing in a document obtained by a search using the predetermined search condition. A word pick-up means for picking up; and an additional search word candidate presenting means for presenting the picked-up word as a candidate for a new search word to be added in the next search; a desired one from the presented additional search word candidates A document search device comprising: an additional search word selecting means for selecting an additional search word; and a re-searching means for performing a search again using the selected additional search word and the predetermined search condition. .
【請求項5】 請求項4において、 上記単語ピックアップ手段は、所定の検索条件に基づく
検索によってヒットした所定の文書を得た後に、上記ヒ
ットした所定の文書中の1つの文書に存在する所定の単
語と、上記ヒットした所定の文書中の他の文書に存在す
る単語とがともに存在する文書の数を検出する手段であ
ることを特徴とする文書検索装置。
5. The word pick-up device according to claim 4, wherein the word pickup means obtains a predetermined document hit by a search based on a predetermined search condition, and then a predetermined document existing in one of the hit predetermined documents. A document retrieval device, characterized in that it is means for detecting the number of documents in which both a word and a word existing in another document among the above-mentioned predetermined hit documents are present.
【請求項6】 請求項4において、 上記単語ピックアップ手段は、データベース中の全文書
に存在する単語をピックアップし、このピックアップさ
れた単語中の所定の単語と、このピックアップされた単
語中の所定の単語とともに同一の文書に存在する共起単
語と、上記共起単語が上記所定の単語とともに存在する
文書の数である共起文書数とが対応する共起表を、検索
前に作成し、検索してヒットした文書中に存在する各単
語について、対応する共起単語と共起文書数とを上記共
起表から取り出す手段であることを特徴とする文書検索
装置。
6. The word pick-up unit according to claim 4, picking up a word existing in all documents in the database, and selecting a predetermined word in the picked-up word and a predetermined word in the picked-up word. Before the search, a co-occurrence table in which the co-occurrence words that exist with the word in the same document and the co-occurrence document number that is the number of documents in which the co-occurrence word exists with the predetermined word correspond to each other are created and searched. Then, the document retrieval apparatus is a means for extracting from the co-occurrence table the corresponding co-occurrence word and the number of co-occurrence documents for each word existing in the hit document.
【請求項7】 請求項4または請求項5において、 追加検索語候補提示手段は、上記ピックアップされた単
語と、このピックアップされた単語が存在する文書の数
とを対応させて提示する手段であることを特徴とする文
書検索装置。
7. The additional search word candidate presenting means according to claim 4 or 5, which presents the picked-up word in correspondence with the number of documents in which the picked-up word exists. A document retrieval device characterized by the above.
【請求項8】 請求項4〜7のいずれか1項において、 追加検索語候補提示手段は、上記ピックアップされた単
語が存在する文書の数に応じた所定の基準によって、上
記ピックアップされた単語を順位付けて提示する手段で
あることを特徴とする文書検索装置。
8. The additional search word candidate presenting means according to claim 4, wherein the additional search word candidate presenting means selects the picked-up word based on a predetermined criterion according to the number of documents in which the picked-up word exists. A document retrieval device, characterized in that the document retrieval device is a means for ranking and presenting.
【請求項9】 請求項4において、 上記再検索手段は、上記選択された追加検索語と上記所
定の検索語とを、AND条件またはOR条件で検索する
手段であることを特徴とする文書検索装置。
9. The document search according to claim 4, wherein the re-search means is means for searching the selected additional search word and the predetermined search word under an AND condition or an OR condition. apparatus.
JP04838596A 1996-02-09 1996-02-09 Additional search word candidate presentation method, document search method, and their devices Expired - Fee Related JP3422350B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04838596A JP3422350B2 (en) 1996-02-09 1996-02-09 Additional search word candidate presentation method, document search method, and their devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04838596A JP3422350B2 (en) 1996-02-09 1996-02-09 Additional search word candidate presentation method, document search method, and their devices

Publications (2)

Publication Number Publication Date
JPH09218881A true JPH09218881A (en) 1997-08-19
JP3422350B2 JP3422350B2 (en) 2003-06-30

Family

ID=12801847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04838596A Expired - Fee Related JP3422350B2 (en) 1996-02-09 1996-02-09 Additional search word candidate presentation method, document search method, and their devices

Country Status (1)

Country Link
JP (1) JP3422350B2 (en)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185786A (en) * 1997-09-05 1999-03-30 Hitachi Ltd Document retrieval method, document retrieval service and document retrieval supporting service
JP2000155758A (en) * 1998-11-19 2000-06-06 Hitachi Ltd Method and service for document retrieval from plural document data bases
JP2000311179A (en) * 1999-02-25 2000-11-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for supporting data retrieval and storage medium stored with data retrieval supporting program
JP2001216312A (en) * 2000-02-01 2001-08-10 Just Syst Corp Knowledge finding device
JP2002518748A (en) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド Search query improvement system and method
JP2003022275A (en) * 2001-07-06 2003-01-24 Telecommunication Advancement Organization Of Japan System and method for retrieving document
JP2003178095A (en) * 2002-09-17 2003-06-27 Hitachi Ltd Method and service for document retrieval from a plurality of document databases
JP2003316807A (en) * 2002-04-23 2003-11-07 Communication Research Laboratory Information retrieving device and recording medium with information retrieving software stored thereon
JP2004054619A (en) * 2002-07-19 2004-02-19 Nec Soft Ltd Document search system and method and document search program
JP2007047882A (en) * 2005-08-05 2007-02-22 Honda Motor Co Ltd Information retrieval device
JP2008510228A (en) * 2004-08-13 2008-04-03 グーグル インコーポレイテッド Multi-stage query processing system and method for use with a token space repository
JP2008518345A (en) 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data processing system and data processing method
JP2008165401A (en) * 2006-12-27 2008-07-17 Fujitsu Ltd Literature retrieval program, literature retrieval device and literature retrieval method
US7467132B2 (en) 2003-05-14 2008-12-16 International Business Machines Corporation Search supporting apparatus, and method utilizing exclusion keywords
JP2009069874A (en) * 2007-09-10 2009-04-02 Sharp Corp Content retrieval device, content retrieval method, program, and recording medium
JP2009289202A (en) * 2008-05-30 2009-12-10 Toshiba Corp Keyword input support device, keyword input support method and program
JP2010086294A (en) * 2008-09-30 2010-04-15 Casio Computer Co Ltd Electronic device provided with dictionary function, and program
JP2012168844A (en) * 2011-02-16 2012-09-06 Yahoo Japan Corp Retrieval suggestion device and method
US8321445B2 (en) 2004-08-13 2012-11-27 Google Inc. Generating content snippets using a tokenspace repository
JP2013003796A (en) * 2011-06-15 2013-01-07 Navitime Japan Co Ltd Facility information provision device, facility information provision system, server apparatus, terminal device, facility information provision method, and program
JP2013242621A (en) * 2012-05-17 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for detecting related word for document retrieval
JP2014120080A (en) * 2012-12-18 2014-06-30 Fujitsu Ltd Keyword presentation program, keyword presentation method, and keyword presentation device
JP2015511746A (en) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary Interactive information retrieval system and method
JP2016091354A (en) * 2014-11-06 2016-05-23 富士ゼロックス株式会社 Information processing device and information processing program
JP2019066979A (en) * 2017-09-29 2019-04-25 キヤノンマーケティングジャパン株式会社 Search device, control method thereof, and program, as well as search system, control method thereof, and program
JP2020004217A (en) * 2018-06-29 2020-01-09 富士通株式会社 Information display method, information display program and information display apparatus
JP2020123134A (en) * 2019-01-30 2020-08-13 富士通株式会社 Extraction method, information processing device, and extraction program
JP2020177549A (en) * 2019-04-22 2020-10-29 株式会社プレシジョン Information processing device, information processing method and information processing program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03294964A (en) * 1990-04-12 1991-12-26 Ricoh Co Ltd Document retrieving method
JPH05314182A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device
JPH07192010A (en) * 1993-12-27 1995-07-28 Canon Inc Document processing unit

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03294964A (en) * 1990-04-12 1991-12-26 Ricoh Co Ltd Document retrieving method
JPH05314182A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device
JPH07192010A (en) * 1993-12-27 1995-07-28 Canon Inc Document processing unit

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185786A (en) * 1997-09-05 1999-03-30 Hitachi Ltd Document retrieval method, document retrieval service and document retrieval supporting service
JP2002518748A (en) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド Search query improvement system and method
JP2000155758A (en) * 1998-11-19 2000-06-06 Hitachi Ltd Method and service for document retrieval from plural document data bases
US7693910B2 (en) 1998-11-19 2010-04-06 Hitachi, Ltd. Method of searching documents and a service for searching documents
JP2000311179A (en) * 1999-02-25 2000-11-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for supporting data retrieval and storage medium stored with data retrieval supporting program
JP2001216312A (en) * 2000-02-01 2001-08-10 Just Syst Corp Knowledge finding device
JP2003022275A (en) * 2001-07-06 2003-01-24 Telecommunication Advancement Organization Of Japan System and method for retrieving document
JP2003316807A (en) * 2002-04-23 2003-11-07 Communication Research Laboratory Information retrieving device and recording medium with information retrieving software stored thereon
JP2004054619A (en) * 2002-07-19 2004-02-19 Nec Soft Ltd Document search system and method and document search program
JP2003178095A (en) * 2002-09-17 2003-06-27 Hitachi Ltd Method and service for document retrieval from a plurality of document databases
US8375027B2 (en) 2003-05-14 2013-02-12 International Business Machines Corporation Search supporting apparatus and method utilizing exclusion keywords
US7467132B2 (en) 2003-05-14 2008-12-16 International Business Machines Corporation Search supporting apparatus, and method utilizing exclusion keywords
US8489602B2 (en) 2003-05-14 2013-07-16 International Business Machines Corporation Systems and methods for determining exclusion efficiencies of a plurality of keywords appearing in a search result
JP2008510228A (en) * 2004-08-13 2008-04-03 グーグル インコーポレイテッド Multi-stage query processing system and method for use with a token space repository
US9098501B2 (en) 2004-08-13 2015-08-04 Google Inc. Generating content snippets using a tokenspace repository
US8407239B2 (en) 2004-08-13 2013-03-26 Google Inc. Multi-stage query processing system and method for use with tokenspace repository
US8321445B2 (en) 2004-08-13 2012-11-27 Google Inc. Generating content snippets using a tokenspace repository
US9146967B2 (en) 2004-08-13 2015-09-29 Google Inc. Multi-stage query processing system and method for use with tokenspace repository
JP4805267B2 (en) * 2004-08-13 2011-11-02 グーグル インコーポレイテッド Multi-stage query processing system and method for use with a token space repository
JP2008518345A (en) 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data processing system and data processing method
JP4689401B2 (en) * 2005-08-05 2011-05-25 本田技研工業株式会社 Information retrieval device
JP2007047882A (en) * 2005-08-05 2007-02-22 Honda Motor Co Ltd Information retrieval device
JP2008165401A (en) * 2006-12-27 2008-07-17 Fujitsu Ltd Literature retrieval program, literature retrieval device and literature retrieval method
JP2009069874A (en) * 2007-09-10 2009-04-02 Sharp Corp Content retrieval device, content retrieval method, program, and recording medium
JP2009289202A (en) * 2008-05-30 2009-12-10 Toshiba Corp Keyword input support device, keyword input support method and program
US8874590B2 (en) 2008-05-30 2014-10-28 Kabushiki Kaisha Toshiba Apparatus and method for supporting keyword input
JP2010086294A (en) * 2008-09-30 2010-04-15 Casio Computer Co Ltd Electronic device provided with dictionary function, and program
JP2012168844A (en) * 2011-02-16 2012-09-06 Yahoo Japan Corp Retrieval suggestion device and method
JP2013003796A (en) * 2011-06-15 2013-01-07 Navitime Japan Co Ltd Facility information provision device, facility information provision system, server apparatus, terminal device, facility information provision method, and program
JP2015511746A (en) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary Interactive information retrieval system and method
JP2013242621A (en) * 2012-05-17 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for detecting related word for document retrieval
JP2014120080A (en) * 2012-12-18 2014-06-30 Fujitsu Ltd Keyword presentation program, keyword presentation method, and keyword presentation device
JP2016091354A (en) * 2014-11-06 2016-05-23 富士ゼロックス株式会社 Information processing device and information processing program
JP2019066979A (en) * 2017-09-29 2019-04-25 キヤノンマーケティングジャパン株式会社 Search device, control method thereof, and program, as well as search system, control method thereof, and program
JP2020004217A (en) * 2018-06-29 2020-01-09 富士通株式会社 Information display method, information display program and information display apparatus
JP2020123134A (en) * 2019-01-30 2020-08-13 富士通株式会社 Extraction method, information processing device, and extraction program
JP2020177549A (en) * 2019-04-22 2020-10-29 株式会社プレシジョン Information processing device, information processing method and information processing program

Also Published As

Publication number Publication date
JP3422350B2 (en) 2003-06-30

Similar Documents

Publication Publication Date Title
JP3422350B2 (en) Additional search word candidate presentation method, document search method, and their devices
US7096218B2 (en) Search refinement graphical user interface
US5848409A (en) System, method and computer program product for maintaining group hits tables and document index tables for the purpose of searching through individual documents and groups of documents
JP5740029B2 (en) System and method for improving interactive search queries
US5404507A (en) Apparatus and method for finding records in a database by formulating a query using equivalent terms which correspond to terms in the input query
US6567805B1 (en) Interactive automated response system
US7257574B2 (en) Navigational learning in a structured transaction processing system
US7519580B2 (en) Search criteria control system and method
US6704729B1 (en) Retrieval of relevant information categories
US6701310B1 (en) Information search device and information search method using topic-centric query routing
US20030120645A1 (en) Method and system for improving a text search
US6807544B1 (en) Method and system for information retrieval based on parts of speech conditions
US20090125504A1 (en) Systems and methods for visualizing web page query results
JPH11102376A (en) Method and device for automatically displaying text extracted from data base relating to retrieval inquiry
US20070244862A1 (en) Systems and methods for ranking vertical domains
JPH08255172A (en) Document retrieval system
KR100593561B1 (en) Information Searching Method, Information Searching Program, and Computer-Readable Recording Medium on which Information Searching Program is Recorded
JP4375626B2 (en) Search service system and method for providing input order of keywords by category
JP2002230037A (en) Retrieval system, retrieval method and program
JP4860439B2 (en) Automatic question generation system
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
JP3007375B2 (en) Document information retrieval device
JP2005234772A (en) Documentation management system and method
JP2006092251A (en) Keyword addition support device, method, and program
JP2812357B2 (en) Database search system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees