JPH10171821A - Method for presenting retrieval word candidate and device therefor - Google Patents

Method for presenting retrieval word candidate and device therefor

Info

Publication number
JPH10171821A
JPH10171821A JP8327275A JP32727596A JPH10171821A JP H10171821 A JPH10171821 A JP H10171821A JP 8327275 A JP8327275 A JP 8327275A JP 32727596 A JP32727596 A JP 32727596A JP H10171821 A JPH10171821 A JP H10171821A
Authority
JP
Japan
Prior art keywords
search
text
word
user
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8327275A
Other languages
Japanese (ja)
Inventor
Takashi Inoue
孝史 井上
Kazuo Tanaka
一男 田中
Masakatsu Ookubo
雅且 大久保
Masayuki Sugizaki
正之 杉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8327275A priority Critical patent/JPH10171821A/en
Publication of JPH10171821A publication Critical patent/JPH10171821A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a retrieval word candidate presenting method and device for executing efficient retrieval and obtaining a further proper text. SOLUTION: Words are extracted from a text designated by a user to be related with a retrieval request from among texts included in the previous retrieved result, and the group of words which are left as the result of narrowing-down such as the specification of a part of speed is presented to a user, and a retrieval expression is re-constituted only of words designated as those which are judged to be appropriate by the user from among them. Therefore, the candidates of the words being the elements of a new retrieval expression are presented to the user from the text designated by the user, and the retrieval expression is generated from the words designated by the user from among them. Thus, a further proper text can be obtained by this time retrieval.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、テキストデータベ
ースに対する検索、すなわちテキスト検索における検索
語候補提示方法およびその装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for searching a text database, that is, a method and apparatus for presenting search word candidates in a text search.

【0002】[0002]

【従来の技術】テキスト検索とは、文書の集合をデータ
ベースに登録しておき、ユーザが与えた検索式に関連す
る文書をそのデータベースから取り出す技術である。検
索式は「通信」のような単語だけでなく、「通信AND
計算機」のように「通信」と「計算機」の両方の単語に
関連するという検索式や、「通信OR計算機」のように
いずれかの単語に関連するという検索式も受諾されるこ
とが多い。
2. Description of the Related Art Text search is a technique in which a set of documents is registered in a database, and documents related to a search formula given by a user are extracted from the database. The search expression is not limited to words like "communication", but also "communication AND
A search expression relating to both words of "communication" and "computer" such as "computer" and a retrieval expression relating to any word such as "communication OR computer" are often accepted.

【0003】また、図1に示す如くユーザがある検索式
を与えて検索し(ステップ(以下S)11)、その検索結
果を表示し(S12)、これに基づいてユーザが検索式
を変更し(S13)、再度検索する(S14)というこ
とがよく行なわれる。例えば、最初「通信」という語を
検索式として検索した時に、検索結果が希望するよりも
狭い範囲からの数少ない文書の集合であった場合には、
「通信0R計算機」などと検索式を変更して検索条件を
広げる。
Also, as shown in FIG. 1, a user gives a search formula to perform a search (step (hereinafter, S) 11), displays the search result (S12), and based on this, the user changes the search formula. (S13) and re-search (S14) are often performed. For example, if you first search for the word "communication" as a search expression and the search result is a collection of a few documents from a narrower range than you want,
Change the search formula to "communication 0R calculator" or the like to broaden search conditions.

【0004】テキスト検索において、ある程度自動的に
検索式を変更して再検索するための手法として、適合フ
ィードバックという技術が提案されている。詳細な方法
については、たとえば“Information Retrieval”(Wil
lam B.Frakes and Ricardo Baeza-Yates著 Prentice Ha
llの出版)という本の第11章に記述されているが、こ
こでは簡単に適合フィードバックについて説明する。
[0004] In text search, a technique called relevance feedback has been proposed as a technique for automatically changing the search formula to some extent and performing a search again. See “Information Retrieval” (Wil
Prentice Ha by lam B. Frakes and Ricardo Baeza-Yates
ll publication), described in Chapter 11 of this book, but here is a brief description of relevance feedback.

【0005】まず、一般的な適合フィードバックを含む
検索の流れを図2に示す。ユーザから指定された検索式
に基づき検索を行い(S21)、その検索結果を表示す
る(S22)。検索結果として得られたテキストのう
ち、適切であるとユーザが指定したテキストから、新た
な検索式を自動的に生成する(S23)。この新たな検
索式に基づいて再び検索を行う(S24)。この様にし
て、必要な情報が得られるまで、指定されたテキストか
らの検索式の自動生成と、再検索を繰り返す。
[0005] First, the flow of a search including general relevance feedback is shown in FIG. A search is performed based on a search formula specified by the user (S21), and the search result is displayed (S22). A new search formula is automatically generated from the text specified by the user as appropriate among the texts obtained as search results (S23). The search is performed again based on the new search formula (S24). In this way, until the necessary information is obtained, the automatic generation of the search formula from the specified text and the re-search are repeated.

【0006】次に、適合フィードバックにおける一般的
な検索式生成処理の流れを図3に示す。第1に、指定さ
れたテキストに対して、単語分割と各単語の品詞同定等
を行う形態素解析が遂行される(S31)。例えば指定
されたテキストの一部が、「…サービスCは競合各社に
対抗するための新サービスで…」であった場合には、こ
の部分に対する形態素解析の結果は図4に示すようにな
る。例えば、「サービスC」と「は」はそれぞれ1単語
として分割され、その品詞はそれぞれ名詞と助詞であ
る。第2に、指定されたテキストから有効単語の抽出が
行われる(S32)。よく用いられる方法は、指定され
たテキストに含まれる単語から、あらかじめ定められた
品詞だけを抽出する方法であり、この方法では名詞だけ
を抽出することが多い。例えば、あるテキストの一部
が、前記に示すものである場合には、この部分からは
「サービスC」「競合」「各社」「サービス」が選ばれ
る。
Next, FIG. 3 shows a flow of a general search expression generation process in matching feedback. First, a morphological analysis is performed on the designated text to perform word division and part-of-speech identification of each word (S31). For example, if a part of the specified text is "... service C is a new service to compete with competitors ...", the result of the morphological analysis for this part is as shown in FIG. For example, "service C" and "ha" are each divided into one word, and their parts of speech are nouns and particles, respectively. Second, valid words are extracted from the designated text (S32). A frequently used method is to extract only a predetermined part of speech from words included in a specified text. In this method, only a noun is often extracted. For example, when a part of a certain text is as described above, "service C", "competition", "each company", and "service" are selected from this part.

【0007】ここまでで抽出された単語に対して、その
出現頻度に基づいて点数を付け、高い点数を持つ単語だ
けに絞り込むこともよく行なわれる。点数を付けるには
種々の方法が考えられるが、たとえば次のような方法が
ある。すなわち、指定されたテキスト中に現れる語のう
ち、検索対象のテキストデータベース全体の中での出現
頻度が少ない語が、指定したテキストの特徴をより強く
示していると考えて、より高い点数を与える。これを実
現する簡単な計算式は、 単語に与える点数= log(1÷テキストデータペース中
のテキストのうち、その単語を含むものの数) となる。この点数がしきい値を超えるものだけを抽出す
る。なお、出現頻度はテキスト登録時にあらかじめ求め
ておく。
[0007] The words extracted so far are often scored based on the frequency of appearance, and narrowed down to only words with high scores. Various methods are conceivable for assigning points. For example, the following methods are available. That is, words that appear less frequently in the entire text database to be searched among words appearing in the specified text are considered to indicate the characteristics of the specified text more strongly, and are given higher scores. . A simple formula for achieving this is: score given to a word = log (1 ÷ the number of texts in the text data pace that include the word). Only those whose score exceeds the threshold are extracted. The appearance frequency is obtained in advance at the time of text registration.

【0008】第3に、検索式の構築を行う(S33)。
単純な方法は、抽出された有効単語をORで結ぶこと、
すなわち有効単語のいずれかを含んでいればよいという
検索式を構築することである。先に挙げたテキスト例か
らは以下のような検索式が構築される。
Third, a search formula is constructed (S33).
A simple method is to OR the extracted valid words with OR ,
That is, it is to construct a search formula that only needs to include any of the valid words. From the text examples given above, the following search formula is constructed.

【0009】“…ORサービスCOR競合OR各社OR
サービスOR…” この様に、指定されたテキストから関連のある用語を抽
出して、検索式に反映することにより、前回の検索では
得ることのできなかった広い範囲の関連するテキストを
次の検索では得ることが可能となる。
[…] OR Service C OR Competitive OR OR
Service OR … ”In this way, by extracting relevant terms from the specified text and reflecting them in the search formula, a wide range of related texts that could not be obtained in the previous search is searched for next. Now you can get it.

【0010】また、再検索で得られたテキストに対し
て、より適切な順にスコア付けする場合もあるがここで
は割愛する。
In some cases, the text obtained by the re-search is scored in a more appropriate order, but is omitted here.

【0011】[0011]

【発明が解決しようとする課題】前述した従来の検索技
術では、前回の検索で得られた結果を参考に検索条件を
変更することが可能だが、どのように変更すればよいか
に関する指針がなく、試行錯誤が行われるため効率が悪
い。一方、適合フィードバック技術では、品詞の特定な
どの絞り込みは行われるものの、指定されたテキストか
ら抽出した単語から機械的に検索式を生成していたため
に、不要な単語まで生成された検索式に含まれてしま
い、再計算の際に関連のないテキストまで取得するとい
う問題点があった。
In the conventional search technique described above, it is possible to change the search condition with reference to the result obtained in the previous search, but there is no guideline on how to change the search condition. However, efficiency is low because trial and error is performed. On the other hand, in the adaptive feedback technology, although narrowing down, such as identification of part of speech, is performed, since the search expression is generated mechanically from words extracted from the specified text, unnecessary words are included in the generated search expression. There was a problem that even when recalculating, even unrelated text was obtained.

【0012】本発明の目的は、効率のよい検索を実行で
き、より適切なテキストを得ることが可能な検索語候補
提示方法およびその装置を提供することにある。
An object of the present invention is to provide a method and apparatus for presenting a search term candidate which can execute an efficient search and obtain a more appropriate text.

【0013】[0013]

【課題を解決するための手段】本発明は、前記目的を達
成するため、前回の検索結果に含まれるテキストの中
で、検索要求に関連があるとユーザが指定したテキスト
から単語を抽出し、品詞の特定等の絞り込みを行った結
果残った単語の集合をユーザに提示し、その中からユー
ザが適当と判断するものを指定した単語のみから検索式
を再構成する。また、提示する際には、指定されたテキ
スト中のより特徴的な語から順に提示する。
According to the present invention, in order to achieve the above object, words are extracted from a text specified by a user as being relevant to a search request among texts included in a previous search result, A set of words remaining as a result of narrowing down the part of speech and the like is presented to the user, and a search formula is reconstructed from only words that specify those that the user deems appropriate from among them. In addition, when presenting, the words are presented in order from the more characteristic words in the designated text.

【0014】本発明によれば、ユーザが指定したテキス
トから、新たな検索式の要素となる単語の候補をユーザ
に提示し、その中からユーザが指定した単語から検索式
を生成することによって、今回の検索でより適切なテキ
ストを得ることを可能とする。
According to the present invention, word candidates to be elements of a new search formula are presented to the user from the text specified by the user, and a search formula is generated from the word specified by the user from among them. It is possible to obtain more appropriate text in this search.

【0015】[0015]

【発明の実施の形態】以下に、本発明の一実施の形態に
ついて説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below.

【0016】図5は本発明に係る検索語候補提示装置を
示すブロック図であり、図6は同じく検索語候補提示処
理のフローチャートを示すものである。検索語候補提示
装置は、制御部51と、表示部52と、ユーザ指定部5
3と、有効単語抽出部54と、点数計算部55と、絞り
込み部56、検索式生成部57と、検索部58とからな
る。以下に、検索語候補提示処理の流れを説明する。
FIG. 5 is a block diagram showing a search word candidate presenting apparatus according to the present invention, and FIG. 6 is a flowchart showing a search word candidate presenting process. The search word candidate presentation device includes a control unit 51, a display unit 52, and a user designation unit 5.
3, a valid word extraction unit 54, a score calculation unit 55, a refinement unit 56, a search formula generation unit 57, and a search unit 58. Hereinafter, the flow of the search word candidate presentation process will be described.

【0017】第1に検索結果の表示を表示部52を用い
て行う(S61)。ユーザは、ユーザ指定部53によ
り、検索語候補提示のために、表示された検索結果のテ
キストの中から、検索要求と関連するテキストを指定す
る(S62)。
First, search results are displayed on the display unit 52 (S61). The user specifies the text related to the search request from the displayed text of the search result by the user specifying unit 53 to present the search word candidate (S62).

【0018】第2に、指定されたテキストから有効単語
抽出部54によって有効単語を抽出する(S63)。有
効単語の抽出には従来の技術の欄で説明したように、品
詞の特定(普通は名詞のみ)と、単語の頻度に基づく点
数付けが用いられる。有効単語の点数は、点数計算部5
5により計算され(S64)、これを用いた絞り込みを
絞り込み部56で行う(S65)。ここまでは従来技術
と同様である。
Second, valid words are extracted from the designated text by the valid word extracting unit 54 (S63). As described in the section of the related art, the extraction of the effective word uses the identification of the part of speech (usually only a noun) and the scoring based on the frequency of the word. The score of the effective word is calculated by the score calculation unit 5
5 (S64), and the narrowing-down unit 56 performs narrowing using this (S65). Up to this point, it is the same as the prior art.

【0019】第3に、ここまでの方法で抽出された単語
の集合を検索語の候補として、点数の高いものから順に
ユーザに表示部52にて提示する(S66)。ユーザ
は、提示された単語の中から適当な単語を複数指定する
(S67)。ここが、従来技術と異なる点である。
Third, a set of words extracted by the above-described methods is presented to the user on the display unit 52 in the order of the highest score as search word candidates (S66). The user specifies a plurality of appropriate words from the presented words (S67). This is a point different from the prior art.

【0020】第4に、ユーザから指定された単語を用い
て検索式生成部57で検索式を生成し(S69)、検索
部58で検索を行う(S69)。
Fourth, a search formula is generated by the search formula generation unit 57 using the word specified by the user (S69), and the search is performed by the search unit 58 (S69).

【0021】例を用いて本発明の処理の流れをさらに具
体的に説明する。表示された検索結果に対して、検索要
求に関連するテキストとして、ユーザが、「CFなどの
宣伝という面でもサービスCを積極的にアピールしてお
り、C社の力の入れ具合が伺える。実際、これらのサー
ビスの契約数は非常に増加しており、ドル箱となってい
る。」を指定したとする。このテキストから、有効単語
の抽出によって取り出される名詞は、CF、宣伝、面、
サービスC、A社、力、入れ、具合、サービス、契約、
ドル箱である。さらに前述の従来技術の説明で示したも
のと同様の頻度統計による点数付けを行い、閾値以下の
ものを除去することによって絞り込みを行う。これによ
って最終的に抽出される追加単語の候補を点数順に並べ
たものが、ドル箱、CF、サービスC、A社、競合、シ
リーズ、具合になったとする。これをユーザに提示し、
その中からユーザが指定したものをORでつないで検索
式を生成する。例えば、今ユーザが指定した単語が、 A社、サービスC、シリーズ であったとすると、生成される検索式は A社ORサービスCORシリーズ となり、これを新しい検索条件として再検索を行う。
The processing flow of the present invention will be described more specifically with reference to examples. In response to the displayed search result, as a text associated with the search request, the user has actively promoted the service C in terms of promotion of CF and the like, indicating the strength of Company C's efforts. , The number of contracts for these services has increased significantly, making them dollar boxes. " Nouns extracted from this text by extracting valid words are CF, advertisement, face,
Service C, company A, power, investment, condition, service, contract,
It is a dollar box. Further, a score is assigned based on the same frequency statistic as that described in the description of the related art described above, and narrowing-down is performed by removing those below the threshold value. It is assumed here that the candidates of the additional words finally extracted are arranged in the order of score, such as dollar box, CF, service C, company A, competition, series, and so on. This is presented to the user,
A search expression is generated by connecting the items designated by the user from among them by OR . For example, if the word specified by the user is company A, service C, series, the generated search formula is company A OR service COR series, and the search is performed again using this as a new search condition.

【0022】[0022]

【発明の効果】以上説明したように本発明によれば、今
回の再検索ではより適切なテキストを得ることが可能と
なる。それにより、ユーザは本当に必要な情報を、より
短時間に、より容易に取得することが可能となる。
As described above, according to the present invention, it is possible to obtain a more appropriate text in this re-search. As a result, the user can more easily obtain the necessary information in a shorter time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】一般的な「検索〜検索式変更〜再検索」の流れ
を示すフローチャート
FIG. 1 is a flowchart showing a general flow of “search-change search formula-re-search”;

【図2】一般的な適合フィードバックの流れを示すフロ
ーチャート
FIG. 2 is a flowchart showing a flow of a general adaptation feedback;

【図3】適合フィードバックにおける一般的な検索式生
成処理を示すフローチャート
FIG. 3 is a flowchart showing a general search expression generation process in matching feedback;

【図4】形態素解析の例を示す図FIG. 4 shows an example of morphological analysis.

【図5】本発明の一実施の形態を示す検索語候補提示装
置のブロック図
FIG. 5 is a block diagram of a search word candidate presenting apparatus according to an embodiment of the present invention.

【図6】本発明の一実施の形態の検索語候補提示処理を
示すフローチャート
FIG. 6 is a flowchart showing search word candidate presentation processing according to one embodiment of the present invention;

───────────────────────────────────────────────────── フロントページの続き (72)発明者 杉崎 正之 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内 ──────────────────────────────────────────────────の Continued on the front page (72) Inventor Masayuki Sugizaki 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 テキスト検索における検索語候補の提示
方法であって、検索結果と検索語候補とを表示し、表示
された検索結果中のテキストと検索語候補中の検索語を
ユーザが指定し、指定されたテキストから有効な検索語
を抽出し、検索語候補の点数を計算し、点数に基づき検
索語候補を絞り込み、指定された検索語から検索式を生
成し、生成された検索式を用いて検索を行なうことを特
徴とする検索語候補提示方法。
1. A method of presenting a search word candidate in a text search, wherein a search result and a search word candidate are displayed, and a user designates a text in the displayed search result and a search word in the search word candidate. , Extract valid search terms from the specified text, calculate the number of search term candidates, narrow down the search term candidates based on the score, generate a search formula from the specified search terms, and generate the generated search formula A method for presenting a candidate for a search word, characterized by performing a search using the search term.
【請求項2】 テキスト検索における検索語候補の提示
装置であって、検索結果と検索語候補とを表示する表示
部と、表示された検索結果中のテキストと検索語候補中
の検索語をユーザが指定するユーザ指定部と、指定され
たテキストから有効な検索語を抽出する有効単語抽出部
と、検索語候補の点数を計算する点数計算部と、点数に
基づき検索語候補を絞り込む絞り込部と、指定された検
索語から検索式を生成する検索式生成部と、生成された
検索式を用いて検索を行なう検索部とを有することを特
徴とする検索語候補提示装置。
2. An apparatus for presenting a search word candidate in a text search, comprising: a display unit for displaying a search result and a search word candidate; and a user displaying text in the displayed search result and a search word in the search word candidate. , A valid word extraction unit that extracts valid search words from the specified text, a score calculation unit that calculates the number of search word candidates, and a narrowing unit that narrows down search word candidates based on the points A search term candidate presentation device, comprising: a search term generation unit that generates a search term from a specified search term; and a search unit that performs a search using the generated search term.
JP8327275A 1996-12-06 1996-12-06 Method for presenting retrieval word candidate and device therefor Pending JPH10171821A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8327275A JPH10171821A (en) 1996-12-06 1996-12-06 Method for presenting retrieval word candidate and device therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8327275A JPH10171821A (en) 1996-12-06 1996-12-06 Method for presenting retrieval word candidate and device therefor

Publications (1)

Publication Number Publication Date
JPH10171821A true JPH10171821A (en) 1998-06-26

Family

ID=18197310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8327275A Pending JPH10171821A (en) 1996-12-06 1996-12-06 Method for presenting retrieval word candidate and device therefor

Country Status (1)

Country Link
JP (1) JPH10171821A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123544A (en) * 2000-10-13 2002-04-26 Tokyo Electric Power Co Inc:The Retrieval preprocessing apparatus, document retrieving apparatus, and retrieval preprocessing method and document retrieving method
JP2004178421A (en) * 2002-11-28 2004-06-24 Ricoh Co Ltd Document retrieval device, method for retrieving document, program, and recording medium
JP2009289202A (en) * 2008-05-30 2009-12-10 Toshiba Corp Keyword input support device, keyword input support method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123544A (en) * 2000-10-13 2002-04-26 Tokyo Electric Power Co Inc:The Retrieval preprocessing apparatus, document retrieving apparatus, and retrieval preprocessing method and document retrieving method
JP2004178421A (en) * 2002-11-28 2004-06-24 Ricoh Co Ltd Document retrieval device, method for retrieving document, program, and recording medium
JP2009289202A (en) * 2008-05-30 2009-12-10 Toshiba Corp Keyword input support device, keyword input support method and program
US8874590B2 (en) 2008-05-30 2014-10-28 Kabushiki Kaisha Toshiba Apparatus and method for supporting keyword input

Similar Documents

Publication Publication Date Title
JP3429184B2 (en) Text structure analyzer, abstracter, and program recording medium
JP3719415B2 (en) Information search method, information search system, and program
US6687689B1 (en) System and methods for document retrieval using natural language-based queries
EP1225517B1 (en) System and methods for computer based searching for relevant texts
JP3820242B2 (en) Question answer type document search system and question answer type document search program
JP5316158B2 (en) Information processing apparatus, full-text search method, full-text search program, and recording medium
JP2002521767A (en) Information retrieval device using probability
US20070016581A1 (en) Category setting support method and apparatus
JPH1049549A (en) Document retrieving device
CA2485546A1 (en) Apparatus and method for region sensitive dynamically configurable document relevance ranking
US11573989B2 (en) Corpus specific generative query completion assistant
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JP4671164B2 (en) Document clustering apparatus, clustering method, and clustering program
JPH1145274A (en) Extension method for key word using co-occurrence between words and computer readable recording medium recording program for making computer execute respective processes of the method
JPH1145257A (en) Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device
JPH10171821A (en) Method for presenting retrieval word candidate and device therefor
JPH064584A (en) Text retriever
JPH11143892A (en) Device and method for keyword weight generation and program storage medium
JP2000227922A (en) Information retrieval device and method therefor, and recording medium recording program for executing its method
JPH11272709A (en) File retrieval system
JP3100955B2 (en) Information search method and information search device
JPH09185632A (en) Method and device for retrieving/editing information
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
JPH09128402A (en) Document similarity calculation device and document sorting device
JP2001243230A (en) Similarity discriminating method