JPH0528199A - Document retrieval device - Google Patents

Document retrieval device

Info

Publication number
JPH0528199A
JPH0528199A JP3178303A JP17830391A JPH0528199A JP H0528199 A JPH0528199 A JP H0528199A JP 3178303 A JP3178303 A JP 3178303A JP 17830391 A JP17830391 A JP 17830391A JP H0528199 A JPH0528199 A JP H0528199A
Authority
JP
Japan
Prior art keywords
word
search
words
retrieval
related word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3178303A
Other languages
Japanese (ja)
Inventor
Takanari Ueda
隆也 上田
Shiro Ito
史朗 伊藤
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3178303A priority Critical patent/JPH0528199A/en
Publication of JPH0528199A publication Critical patent/JPH0528199A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To prevent a retrieval omission and to enable an accurate document retrieval by providing a means selecting a required word from a word related to a retrieval word. CONSTITUTION:On a retrieval word inputted by a retrieval word input part 1, the related word is developed in a related word development part 3. With a related word dictionary part 4, the synonyms, high and low-order words of the retrieval word held in retrieval word holding part 2 are obtained. Then, the list of the related words is displayed on a related word display part 6, and a user selects the related word. Thus selected related word and the original retrieval word are held in the retrieval word holding part 2. A retrieval processing part 9 retrieves the retrieval word and synonyms. The retrieval result is held in a retrieval result holding part 10. Thus, the retrieval omission at the time of retrieval can be prevented, further, excess retrieval result generation can be prevented, resulting in accurate document retrieval.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、計算機によって検索を
行う文書検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieving device for retrieving by a computer.

【0002】[0002]

【従来の技術】文書データベースの普及と計算機処理能
力の向上により、大量の文書データベースから指定した
検索語を含む文書を検索する文書検索装置が用いられる
ようになってきている。このような検索装置において、
従来は各文書にキーワードを与えておき、検索する際に
そのキーワードを用いる形態が一般的であった。
2. Description of the Related Art Due to the spread of document databases and the improvement of computer processing capability, a document retrieval apparatus for retrieving a document containing a designated retrieval word from a large number of document databases has come to be used. In such a search device,
Conventionally, it has been a general practice to give a keyword to each document and use the keyword when searching.

【0003】最近では、さらに検索の際の柔軟性を向上
させるために、予めキーワードを与えず、自由なキーワ
ードを指定できるようにしたフルテキストサーチの方式
が用いられるようになってきている。
In recent years, in order to further improve the flexibility in searching, a full text search method has been used in which a keyword is not given in advance and a free keyword can be designated.

【0004】この方式では、ユーザが指定したキーワー
ドを文書中から検索するので、キーワードの指定のしか
たによっては、検索漏れが生じるという問題点がある。
これを防ぐために、ユーザの与えたキーワードの関連語
(類義語・上位語・下位語など)を求めて、その全てを
検索するということが行われる。
According to this method, since the keyword specified by the user is searched from the document, there is a problem in that the search may be omitted depending on how the keyword is specified.
In order to prevent this, the related words (synonyms, high-rank words, low-rank words, etc.) of the keyword given by the user are obtained and all of them are searched.

【0005】[0005]

【発明が解決しようとする課題】しかし、このように検
索語として指定した語の関連語まで検索すると、関連語
が必ずしもそのときのユーザの検索意図に合っていると
は限らないため、余分な結果まで出てしまうことがある
という問題があった。
However, if the related words of the word designated as the search word are searched in this way, the related words do not always match the user's search intention at that time. There was a problem that the results could be obtained.

【0006】よって本発明の目的は、上述の欠点を除去
し、利用しやすい文書検索装置を提供することにある。
Therefore, an object of the present invention is to eliminate the above-mentioned drawbacks and provide a document retrieval device which is easy to use.

【0007】[0007]

【課題を解決するための手段】本発明に係る文書検索装
置は、検索すべき語を入力する検索語入力手段と、各語
に対してその関連語を記述した関連語辞書と、前記検索
すべき語の関連語を前記関連語辞書から検索する関連語
展開手段と、入力した前記検索すべき語から検索に用い
る関連語を求める際に、関連語を選択する手段とを具備
したものである。
A document search device according to the present invention includes a search word input means for inputting a word to be searched, a related word dictionary describing a related word for each word, and the search word. A related word expanding means for searching a related word of a power word from the related word dictionary, and a means for selecting a related word when obtaining a related word to be used for a search from the inputted words to be searched. .

【0008】本発明に係る文書検索装置は、検索すべき
語を入力する検索語入力手段と、各語に対してその類義
語・上位語・下位語を階層構造の形で記述した関連語辞
書と、前記検索すべき語の関連語を前記関連語辞書から
検索する関連語展開手段と、展開する関連語の数を設定
する語数設定手段と、関連語を展開する際の条件を設定
する条件設定手段とを備え、入力した前記検索すべき語
から検索に用いる関連語を求める際に、予め設定された
値にしたがって関連語の展開を行うものである。
A document search device according to the present invention includes a search word input means for inputting a word to be searched, and a related word dictionary in which synonyms, high-rank words, and low-rank words are described for each word in a hierarchical structure. , Related word expanding means for searching a related word of the word to be searched from the related word dictionary, word number setting means for setting the number of related words to be expanded, and condition setting for setting a condition for expanding the related word Means for expanding related words according to a preset value when obtaining related words to be used for the search from the inputted words to be searched.

【0009】本発明に係る文書検索装置は、検索すべき
語を入力する検索語入力手段と、各語に対してその類義
語・上位語・下位語を階層構造の形で記述した関連語辞
書と、前記検索すべき語の関連語を前記関連語辞書から
検索する関連語展開手段と、入力した前記検索すべき語
から検索に用いる関連語を求める際に、検索語の意味が
広く関連語の数が多い場合に、再度検索語を指定するこ
とを指示する評価手段とを具備したものである。
A document search device according to the present invention includes a search word input means for inputting a word to be searched, and a related word dictionary in which synonyms, high-rank words, and low-rank words are described for each word in a hierarchical structure. , Related word expanding means for searching a related word of the word to be searched from the related word dictionary, and when searching for a related word to be used from the input word to be searched, the meaning of the search word is In the case where the number is large, the evaluation means for instructing to specify the search word again is provided.

【0010】[0010]

【作用】 本発明では、検索語の関連語を求める手段
と、求められた関連語から必要な語を選択する手段を設
け、その結果、検索の際に適切な検索語が用いられるよ
うにして余計な検索結果が出ないようにしたものであ
る。
In the present invention, a means for obtaining a related word of a search word and a means for selecting a necessary word from the obtained related words are provided, and as a result, an appropriate search word is used at the time of search. This is to prevent extra search results.

【0011】 本発明では、検索語の関連語を求める
手段と、関連語の語数を設定する手段と、展開する関連
語の範囲を制限する条件設定手段を設け、その結果、検
索の際に余計な検索結果が出ないようにしたものであ
る。
According to the present invention, a means for obtaining a related word of a search word, a means for setting the number of words of the related word, and a condition setting means for limiting the range of the related word to be developed are provided, and as a result, an extra amount is added in the search. This is to prevent the retrieval of various search results.

【0012】 本発明では、検索語の関連語を求める
手段と、関連語の意味の広さを評価する手段を設け、そ
の結果、検索の際に余計な検索結果が出ないようにした
ものである。
According to the present invention, a means for obtaining a related word of a search word and a means for evaluating the breadth of the meaning of the related word are provided, and as a result, an unnecessary search result is not produced during the search. is there.

【0013】[0013]

【実施例】以下、図面を参照して本発明を詳細に説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described in detail below with reference to the drawings.

【0014】実施例1 図1は、本発明の一実施例に係る装置の構成を示すブロ
ック図である。同図において1は検索する語を入力する
検索語入力部、2は検索語入力部1から入力された検索
語を保持する検索語保持部、3は検索語保持部2に保持
された検索語から類義語・上位語・下位語などの関連語
を求める関連語展開部、4は関連語展開部3で関連語の
展開に用いる関連語辞書、5は関連語の選択を行う関連
語選択部、6は関連語の選択の際に表示を行うための関
連語表示部、7は関連語の選択の際に入力を行うための
選択入力部、8は文書を蓄えている文書保持部、9は検
索語保持部2に保持された検索語を文書保持部8の文書
から検索する検索処理部、10は検索処理部9で検索し
た結果を保持するための検索結果保持部である。
Embodiment 1 FIG. 1 is a block diagram showing the configuration of an apparatus according to an embodiment of the present invention. In the figure, 1 is a search word input unit for inputting a search word, 2 is a search word holding unit for holding a search word input from the search word input unit 1, and 3 is a search word held in the search word holding unit 2. A related word expansion unit for obtaining related words such as synonyms, upper words, and lower words from 4; a related word dictionary used in the related word expansion unit 3 for expanding related words; 5 a related word selection unit for selecting related words; 6 is a related word display unit for displaying when selecting a related word, 7 is a selection input unit for inputting when selecting a related word, 8 is a document holding unit that stores documents, and 9 is A search processing unit 10 for searching the search word held in the search word holding unit 2 from the document in the document holding unit 8 is a search result holding unit for holding the result searched by the search processing unit 9.

【0015】図2は、図1に示した装置における動作の
処理手順を示すフローチャートである。本図を参照しな
がら本発明の一実施例の動作を説明する。
FIG. 2 is a flow chart showing a processing procedure of the operation in the apparatus shown in FIG. The operation of the embodiment of the present invention will be described with reference to the figure.

【0016】まず、ステップS1では検索語入力部1で
検索語の入力を行う。入力された検索語は検索語保持部
2に保持する。
First, in step S1, the search word input unit 1 inputs a search word. The input search word is held in the search word holding unit 2.

【0017】次にステップS2に移り、関連語展開部3
において関連語の展開を行う。ここでは関連語辞書4を
用いて、検索語保持部2に保持された検索語の類義語・
上位語・下位語などを求める。そして、得られた結果お
よび元の検索語を検索語保持部2に保持する。
Next, in step S2, the related word expansion unit 3
Related words are expanded in. Here, using the related word dictionary 4, the synonyms of the search word held in the search word holding unit 2
Search for high-rank words and low-rank words. Then, the obtained result and the original search word are held in the search word holding unit 2.

【0018】次にステップS3において、ステップS2
で求められた関連語の一覧を関連語表示部6に表示す
る。続いてステップS4でユーザが関連語の選択を行
う。選択の入力は選択入力部7で行うが、これは例えば
表示されている関連語をポインティングデバイスなどで
指示することによって行えばよい。
Next, in step S3, step S2
The list of related words obtained in step 3 is displayed on the related word display unit 6. Then, in step S4, the user selects a related word. The selection input is performed by the selection input unit 7, but this may be performed, for example, by pointing the displayed related word with a pointing device or the like.

【0019】選択の終了は、終了を指示する入力によっ
て示す。ステップS5ではユーザからのこうした入力が
あったかどうかを調べる。ステップS4・S5は入力が
あるまで繰り返す。
The end of the selection is indicated by an input instructing the end. In step S5, it is checked whether or not there is such an input from the user. Steps S4 and S5 are repeated until there is an input.

【0020】入力があった場合は、ステップS6におい
て、選択された関連語および元の検索語を検索語保持部
2に保持する。
When there is an input, the related word selected and the original search word are held in the search word holding unit 2 in step S6.

【0021】次にステップS7に進み、検索処理部9に
おいて、検索語保持部2に保持された検索語を文書保持
部8から検索する検索処理を行う。ここでの検索処理
は、例えば複数の文字列を同時に検索するAC法のよう
な手法によればよい。検索処理を行った結果は検索結果
保持部10に保持する。
Next, in step S7, the retrieval processing unit 9 performs retrieval processing for retrieving the retrieval word held in the retrieval word holding unit 2 from the document holding unit 8. The search processing here may be performed by a method such as an AC method for simultaneously searching for a plurality of character strings. The result of the search processing is held in the search result holding unit 10.

【0022】次に、検索語入力部1において図3に示す
検索語が入力された場合を例にとり、本実施例のさらな
る説明を行う。
Next, the present embodiment will be further described by taking the case where the search word shown in FIG. 3 is input in the search word input section 1 as an example.

【0023】検索語「殺人」を関連語辞書4で展開した
結果、図4に示すように関連語として「絞殺」「毒殺」
「暗殺」「自殺」「殺害」「刺殺」などが得られる。こ
れらは関連語表示部6に表示される。ここでユーザはこ
の中から関連語を選択する。選択の方法は、例えばポイ
ンティングデバイスで選択したい語を示すことによって
行えばよい。
As a result of expanding the search word "murder" in the related word dictionary 4, as shown in FIG. 4, "striking" and "poisoning" as related words.
"Assassination,""suicide,""murder,""stabbed," etc. can be obtained. These are displayed on the related word display unit 6. Here, the user selects a related word from these. The selection method may be performed, for example, by indicating the word to be selected with a pointing device.

【0024】図5は選択した結果を示している。ここで
網掛けになっているのが選択された語である。実際の関
連語表示部では反転表示などによって示される。これら
の語と元の検索語「殺人」が検索語保持部2に保持さ
れ、実際の検索に用いられる。検索の際にはユーザが選
択しなかった「暗殺」「自殺」は検索されず、不要な検
索結果が得られずにすむ。
FIG. 5 shows the selected results. The selected words are shaded here. In the actual related word display portion, it is indicated by reverse display or the like. These words and the original search word “murder” are held in the search word holding unit 2 and used for the actual search. In the search, "assassination" and "suicide" that the user did not select are not searched, and unnecessary search results cannot be obtained.

【0025】次に他の実施例について列挙する。Next, other embodiments will be listed.

【0026】1.上記実施例では、関連語を選択するの
にポインティングデバイスで指示したが、これは関連語
についている番号を指定することによって行ってもよ
い。
1. In the above embodiment, the pointing device is used to select the related word, but this may be performed by specifying the number of the related word.

【0027】2.上記実施例では、検索語として一つの
語を用いたが、複数の語であっても個々に関連語選択の
処理をすれば、本発明実施例と同様な方法で対応でき
る。
2. Although one word is used as the search word in the above-mentioned embodiment, a plurality of words can be dealt with in the same manner as in the embodiment of the present invention by individually processing the related word selection.

【0028】3.上記実施例では、検索に用いる関連語
を指示したが、逆に不要な関連語を指示するようにして
もよい。この場合は選択されなかった語を検索に用いる
ことになる。
3. In the above-mentioned embodiment, the related word used for the search is instructed, but, on the contrary, the unnecessary related word may be instructed. In this case, the unselected word is used for the search.

【0029】4.上記実施例では、常にユーザが関連語
を選択するようにしたが、閾値を設けておき、関連語の
数がその閾値を上回るときのみユーザに関連語を選択さ
せるようにしてもよい。
4. In the above embodiment, the user always selects the related word. However, a threshold may be set and the user may select the related word only when the number of related words exceeds the threshold.

【0030】5.上記実施例では、検索の際にAC法を
用いたが、その他のパタンマッチング・アルゴリズムで
あってもかまわないし、また文解析などの手法によって
もよい。どのような検索手法であっても本発明を実施す
ることができる。
5. In the above embodiment, the AC method was used for the search, but other pattern matching algorithms may be used, or a method such as sentence analysis may be used. The present invention can be implemented by any search method.

【0031】実施例2 図6は、本発明のその他の一実施例に係る装置の構成を
示すブロック図である。同図において21は検索する語
を入力する検索語入力部、22は検索語入力部21から
入力された検索語を保持する検索語保持部、23は検索
語保持部22に保持された検索語から類義語・上位語・
下位語などの関連語を求める関連語展開部、24は関連
語展開部23で関連語の展開に用いる関連語辞書、25
は展開する関連語の数を設定する関連語数設定部、26
は関連語を展開する際の条件を保持する展開条件保持
部、27は文書を蓄えている文書保持部、28は検索語
保持部22に保持された検索語を文書保持部27の文書
から検索する検索処理部、29は検索処理部28で検索
した結果を保持するための検索結果保持部である。
Embodiment 2 FIG. 6 is a block diagram showing the arrangement of an apparatus according to another embodiment of the present invention. In the figure, 21 is a search word input unit for inputting a search word, 22 is a search word holding unit for holding a search word input from the search word input unit 21, and 23 is a search word held in the search word holding unit 22. To synonyms, broader terms,
A related word expansion unit for obtaining related words such as subordinate words, 24 is a related word dictionary used by the related word expansion unit 23 for expanding related words, and 25
Is a related word number setting unit for setting the number of related words to be expanded, 26
Is a development condition holding unit that holds a condition for expanding related words, 27 is a document holding unit that stores documents, 28 is a search word held in the search word holding unit 22 from a document in the document holding unit 27 Reference numeral 29 denotes a search result holding unit for holding the result searched by the search processing unit 28.

【0032】図7は、図6に示した装置における動作の
処理手順を示すフローチャートである。本図を参照しな
がら本発明の一実施例の動作を説明する。
FIG. 7 is a flow chart showing the processing procedure of the operation in the apparatus shown in FIG. The operation of the embodiment of the present invention will be described with reference to the figure.

【0033】まず、ステップS21では検索語入力部2
1で検索語の入力を行う。入力された検索語は検索語保
持部22に保持する。
First, in step S21, the search word input unit 2
Enter the search word at 1. The input search word is held in the search word holding unit 22.

【0034】次にステップS22に移り、関連語展開部
23において関連語の展開を行う。ここでは関連語辞書
24を用いて、検索語保持部22に保持された検索語の
類義語・上位語・下位語を求める。得られた結果および
元の検索語を検索語保持部22に保持する。
Next, in step S22, the related word expansion unit 23 expands the related words. Here, the related word dictionary 24 is used to find synonyms, high-rank words, and low-rank words of the search word held in the search word holding unit 22. The obtained result and the original search word are held in the search word holding unit 22.

【0035】次にステップS23において、ステップS
22で求められた関連語の数を調べる。この数が予め関
連語数設定部25で設定されている値以下かどうかをス
テップS24で判定する。
Next, in step S23, step S
Check the number of related words found in 22. In step S24, it is determined whether this number is less than or equal to the value set in advance by the related word number setting unit 25.

【0036】関連語数が設定値以下の場合は、ステップ
S26の検索処理に移る。
If the number of related words is less than or equal to the set value, the search process of step S26 is performed.

【0037】一方、関連語数が設定値以下より大きかっ
た場合は、ステップS25に移る。
On the other hand, if the number of related words is larger than the set value, the process proceeds to step S25.

【0038】ステップS25では、関連語を展開する範
囲を制限する。例えば、展開条件保持部26に初期条件
として保持されている条件が「類義語,距離1の上位
語,距離1の下位語」というものだとして、これを「類
義語のみ」という条件に狭める。
In step S25, the range in which the related words are expanded is limited. For example, assuming that the conditions held as the initial conditions in the expansion condition holding unit 26 are “synonyms, high-rank words of distance 1, low-rank words of distance 1”, this is narrowed down to “synonyms only”.

【0039】ここで距離とは、階層構造の形で記述され
た関連語辞書における距離である。
Here, the distance is the distance in the related word dictionary described in a hierarchical structure.

【0040】新しい条件は展開条件保持部26に保持
し、再度ステップS23において関連語展開を行う。
The new condition is held in the expansion condition holding unit 26, and related words are expanded again in step S23.

【0041】次にステップS26に進み、検索処理部2
8において、検索語保持部22に保持された検索語を文
書保持部27から検索する検索処理を行う。ここでの検
索処理は、例えば複数の文字列を同時に検索するAC法
のような手法によればよい。検索処理を行った結果は検
索結果保持部29に保持する。
Next, in step S26, the search processing unit 2
In 8, a search process for searching the search word held in the search word holding unit 22 from the document holding unit 27 is performed. The search processing here may be performed by a method such as an AC method for simultaneously searching for a plurality of character strings. The result of the search process is held in the search result holding unit 29.

【0042】次に、実例を示して、本実施例のさらなる
説明を行う。
Next, the present embodiment will be further described by showing an actual example.

【0043】図8は関連語辞書24の一部を示す図であ
る。「殺人」の上位語として「犯罪」があり、類義語と
して「殺害」「殺し」があり、下位語として「刺殺」
「毒殺」「絞殺」などがある。さらに、「犯罪」には上
位語があり、「刺殺」「毒殺」などには下位語があると
いう具合に関連語辞書は階層構造を成している。「犯
罪」から見た場合、「殺人」は距離1の下位語、「刺
殺」は距離2の下位語である。
FIG. 8 is a diagram showing a part of the related word dictionary 24. "Crime" is a broader term of "murder", "murder" and "murder" are synonymous terms, and "stabbing" is a subordinate term.
There are "poisoning" and "stroking". Further, the related word dictionary has a hierarchical structure such that “crime” has an upper word and “stabbed” and “poison” have a lower word. From the viewpoint of “crime”, “murder” is a subordinate word of distance 1 and “stabbed” is a subordinate word of distance 2.

【0044】関連語数設定部25に関連語の数として5
が設定されているとする。ここで、図9に示すように検
索語入力部21において検索語として「殺人」が入力さ
れた場合を考える。
The related word number setting unit 25 sets the number of related words to 5
Is set. Here, consider the case where "murder" is input as a search word in the search word input unit 21 as shown in FIG.

【0045】まず、展開条件保持部26に「類義語,距
離1の上位語,距離1の下位語」が初期条件として保持
されていると、図10に示すものが「殺人」の関連語と
して得られる。ここで得られた関連語の数は設定値の5
より大きいので、展開条件を「類義語のみ」に変更す
る。
First, when the expansion condition holding unit 26 holds "synonyms, upper word of distance 1, lower word of distance 1" as initial conditions, the one shown in FIG. 10 is obtained as a related word of "murder". To be The number of related words obtained here is 5 which is the set value.
Since it is larger, the expansion condition is changed to "synonyms only".

【0046】この結果、「殺人」の関連語として、図1
1に示すように「殺し」「殺害」が残る。設定値より少
ないので、これを検索に用いる。
As a result, as a related term of "murder", as shown in FIG.
As shown in 1, "kill" and "murder" remain. Since it is less than the set value, this is used for search.

【0047】次に、他の実施例について列挙する。Next, other examples will be listed.

【0048】1.上記実施例では、検索語として一つの
語を用いたが、複数の語であっても個々に関連語展開の
処理をすれば、本発明実施例と同様な方法で対応でき
る。
1. In the above embodiment, one word is used as the search word, but a plurality of words can be dealt with in the same manner as the embodiment of the present invention by individually processing the related word expansion.

【0049】2.上記実施例では、関連語展開の初期条
件として「類義語,距離1の上位語,距離1の下位
語」,制限した条件として「類義語のみ」というものを
示したが、これらの条件は別のものであってもかまわな
い。また、条件の制限は3段階以上に分かれていてもよ
い。
2. In the above embodiment, "synonyms, high-rank words of distance 1 and low-rank words of distance 1" are shown as initial conditions for related word expansion, and "synonyms only" are shown as restricted conditions, but these conditions are different. It doesn't matter. Further, the restriction of conditions may be divided into three or more stages.

【0050】3.上記実施例では、関連語を展開した後
その数を調べて、設定値より大かった場合に展開条件を
変更するようにしたが、関連語を展開する際に展開条件
を変更して設定値以下になるようにしてもよい。
3. In the above embodiment, after expanding the related words, the number of them is checked, and the expansion condition is changed when the number is larger than the set value. However, when the related word is expanded, the expansion condition is changed and the set value is changed. The following may be set.

【0051】4.上記実施例では、関連語数をシステム
が設定するようにしたが、これはユーザが設定するよう
にしてもよい。
4. In the above embodiment, the system sets the number of related words, but this may be set by the user.

【0052】5.関連語数を0に設定すれば、関連語の
展開を行わないことになる。したがって、関連語の展開
を行わないモードを設ける、という実施例も本発明に含
まれる。
5. If the number of related words is set to 0, the related words will not be expanded. Therefore, an embodiment of providing a mode in which the related words are not expanded is also included in the present invention.

【0053】6.上記実施例では、検索の際にAC法を
用いたが、その他のパタンマッチング・アルゴリズムで
あってもかまわないし、また文解析などの手法によって
もよい。どのような検索手法であっても本発明を実施す
ることができる。
6. In the above embodiment, the AC method was used for the search, but other pattern matching algorithms may be used, or a method such as sentence analysis may be used. The present invention can be implemented by any search method.

【0054】実施例3 図12は、本発明のその他の一実施例に係る装置の構成
を示すブロック図である。同図において31は検索する
語を入力する検索語入力部、32は検索語入力部31か
ら入力された検索語を保持する検索語保持部、33は検
索語保持部32に保持された検索語から類義語・上位語
・下位語などの関連語を求める関連語展開部、34は関
連語展開部33で関連語の展開に用いる関連語辞書、3
5は展開する関連語の数を設定する関連語数設定部、3
6は関連語の数を評価して数が多い場合には再度検索語
を指定するように求める関連語評価部、37は関連語評
価部36が表示に用いる表示部、38は文書を蓄えてい
る文書保持部、39は検索語保持部32に保持された検
索語を文書保持部38の文書から検索する検索処理部、
40は検索処理部39で検索した結果を保持するための
検索結果保持部である。
Embodiment 3 FIG. 12 is a block diagram showing the arrangement of an apparatus according to another embodiment of the present invention. In the figure, 31 is a search word input unit for inputting a search word, 32 is a search word holding unit for holding the search word input from the search word input unit 31, and 33 is a search word held in the search word holding unit 32. A related word expansion unit for finding related words such as synonyms, upper terms, and lower terms from 34, a related word dictionary used by the related word expansion unit 33 for expanding related words, 3
5 is a related word number setting unit for setting the number of related words to be expanded, 3
Reference numeral 6 is a related word evaluation unit that evaluates the number of related words and, if the number is large, requests to specify the search word again, 37 is a display unit used by the related word evaluation unit 36 for display, and 38 is a document storage A document holding unit 39, a search processing unit 39 for searching the search word held in the search word holding unit 32 from the document in the document holding unit 38,
Reference numeral 40 is a search result holding unit for holding the results searched by the search processing unit 39.

【0055】図13は、図12に示した装置における動
作の処理手順を示すフローチャートである。本図を参照
しながら本発明の一実施例の動作を説明する。
FIG. 13 is a flow chart showing the processing procedure of the operation in the apparatus shown in FIG. The operation of the embodiment of the present invention will be described with reference to the figure.

【0056】まず、ステップS31では検索語入力部3
1で検索語の入力を行う。入力された検索語は検索語保
持部32に保持する。
First, in step S31, the search word input unit 3
Enter the search word at 1. The input search word is held in the search word holding unit 32.

【0057】次にステップS32に移り、関連語展開部
33において関連語の展開を行う。ここでは関連語辞書
34を用いて、検索語保持部32に保持された検索語の
類義語・上位語・下位語を求める。得られた結果および
元の検索語を検索語保持部32に保持する。
Next, in step S32, the related word expansion unit 33 expands the related words. Here, the related word dictionary 34 is used to obtain synonyms, high-rank words, and low-rank words of the search word held in the search word holding unit 32. The obtained result and the original search word are held in the search word holding unit 32.

【0058】次に、ステップS33において、ステップ
S32で求められた関連語の数を調べる。この数が予め
関連語数設定部35で設定されている値以下かどうかを
ステップS34で判定する。
Next, in step S33, the number of related words obtained in step S32 is checked. In step S34, it is determined whether or not this number is less than or equal to the value set in advance by the related word number setting unit 35.

【0059】関連語数が設定以下の場合はステップS3
6の検索処理に移る。
If the number of related words is less than or equal to the setting, step S3
Move on to the search process of 6.

【0060】一方、関連語数が設定値より大きかった場
合は、ステップS35に移る。
On the other hand, if the number of related words is larger than the set value, the process proceeds to step S35.

【0061】ステップS35では、より意味の限定した
検索語を改めて入力するようにユーザに求める。このメ
ッセージは表示部37に表示する。次にステップS31
に戻り再度検索語の入力を行う。
In step S35, the user is requested to input again a search word having a more limited meaning. This message is displayed on the display unit 37. Next in step S31
Return to and enter the search term again.

【0062】次にステップS36に進み、検索処理部3
9において、検索語保持部32に保持された検索語を文
書保持部38から検索する検索処理を行う。ここでの検
索処理は、例えば複数の文字列を同時に検索するAC法
のような手法によればよい。検索処理を行った結果は検
索結果保持部40に保持する。
Next, in step S36, the search processing unit 3
In 9, a search process for searching the search word held in the search word holding unit 32 from the document holding unit 38 is performed. The search processing here may be performed by a method such as an AC method for simultaneously searching for a plurality of character strings. The search result holding unit 40 holds the result of the search processing.

【0063】次に、実例を示して、本実施例のさらなる
説明を行う。
Next, this example will be further described by showing an actual example.

【0064】図14は、関連語辞書34の一部を示す図
である。「乗り物」の下位語として「飛行機」「自動
車」「電車」「船」などがあり、「飛行機」の下位語と
して「旅客機」「戦闘機」「爆撃機」などがある。さら
に、「乗り物」には上位語があり、「旅客機」「戦闘
機」「爆撃機」などには下位語があるという具合に関連
語辞書は階層構造を成している。
FIG. 14 is a diagram showing a part of the related word dictionary 34. The subordinate terms of "vehicle" include "airplane", "automobile", "train", "ship", and the subordinate terms of "airplane" include "passenger aircraft", "fighter plane", and "bomber plane". Further, the related word dictionary has a hierarchical structure such that “vehicle” has a higher-ranking word and “passenger aircraft”, “fighter”, “bomber” etc. have a lower-ranking word.

【0065】関連語数設定部35に関連語の数として2
0が設定されているとする。ここで、図15に示すよう
に検索語入力部31において検索語として「乗り物」が
入力された場合を考える。
The number of related words is set to 2 in the related word number setting unit 35.
It is assumed that 0 is set. Here, consider a case where "vehicle" is input as a search word in the search word input unit 31 as shown in FIG.

【0066】ここで、関連語辞書の階層構造において、
下位にある語全てを関連語として選ぶとすると、得られ
る関連語の数は設定値の20より大きい。そこで、図1
6に示すように、もっと意味の限定した語を検索語とし
て指定するように指示する。これに対してユーザは、例
えば図17に示すように、「飛行機」を新たな検索語と
して指示する。
Here, in the hierarchical structure of the related word dictionary,
If all lower-order words are selected as related words, the number of obtained related words is larger than the set value of 20. Therefore, in FIG.
As shown in 6, an instruction is given to specify a word having a more limited meaning as a search word. On the other hand, the user designates “airplane” as a new search term, as shown in FIG. 17, for example.

【0067】次に、その他の実施例を列挙する。Next, other examples will be listed.

【0068】1.上記実施例では、検索語として一つの
語を用いたが、複数の語であっても個々に関連語展開の
処理をすれば、本発明実施例と同様な方法で対応でき
る。
1. In the above embodiment, one word is used as the search word, but a plurality of words can be dealt with in the same manner as the embodiment of the present invention by individually processing the related word expansion.

【0069】2.上記実施例では、検索語の意味の広さ
を評価するのに関連語の数を用いたが、評価尺度として
は、検索語が関連語辞書の階層構造のどこに位置するか
ということを用いてもよい。この場合、階層構造の上の
方に位置する語の場合は、再度検索語を指定するように
求める。
2. In the above example, the number of related words was used to evaluate the breadth of the meaning of the search word, but as an evaluation measure, the position of the search word in the hierarchical structure of the related word dictionary was used. Good. In this case, in the case of a word located in the upper part of the hierarchical structure, it is requested to specify the search word again.

【0070】3.上記実施例では、検索語の意味が広い
場合に、ユーザに新たに検索語を入力させたが、階層構
造において前記検索語の一段下位に位置する語の一覧を
示し、その中から選択させるようにしてもよい。
3. In the above-mentioned embodiment, when the meaning of the search word is wide, the user is prompted to input a new search word. However, a list of words located one step below the search word in the hierarchical structure is shown and the search word is selected from the list. You may

【0071】4.上記実施例では、検索の際にAC法を
用いたが、その他のパタンマッチング・アルゴリズムで
あってもかまわないし、また文解析などの手法によって
もよい。どのような検索手法であっても本発明を実施す
ることができる。
4. In the above embodiment, the AC method was used for the search, but other pattern matching algorithms may be used, or a method such as sentence analysis may be used. The present invention can be implemented by any search method.

【0072】[0072]

【発明の効果】以上説明したように、本発明によれば、
検索の際の検索漏れが防げ、さらに余分な検索結果が生
じるのも防げるので、精度のよい文書検索装置がえられ
る。
As described above, according to the present invention,
Since it is possible to prevent the omission of the search at the time of the search and to prevent the generation of extra search results, it is possible to obtain the document search device with high accuracy.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例に係る装置の構成を示す
ブロック図である。
FIG. 1 is a block diagram showing a configuration of an apparatus according to a first exemplary embodiment of the present invention.

【図2】本発明の第1の実施例に係る処理手順を示すフ
ローチャートである。
FIG. 2 is a flowchart showing a processing procedure according to the first embodiment of the present invention.

【図3】本発明の第1の実施例を説明するための検索語
を示す図である。
FIG. 3 is a diagram showing search terms for explaining the first embodiment of the present invention.

【図4】図3の検索語を使って処理を行ったときの表示
を示す図である。
FIG. 4 is a diagram showing a display when processing is performed using the search word of FIG.

【図5】図3の検索語を使って処理を行ったときの表示
を示す図である。
5 is a diagram showing a display when processing is performed using the search word of FIG.

【図6】本発明の第2の実施例に係る装置の構成を示す
ブロック図である。
FIG. 6 is a block diagram showing a configuration of an apparatus according to a second exemplary embodiment of the present invention.

【図7】本発明の第2の実施例に係る処理手順を示すフ
ローチャートである。
FIG. 7 is a flowchart showing a processing procedure according to a second embodiment of the present invention.

【図8】本発明の第2の実施例を説明するための関連語
辞書の構造を示す図である。
FIG. 8 is a diagram showing a structure of a related word dictionary for explaining a second embodiment of the present invention.

【図9】図8の関連語辞書の構造を示す図である。9 is a diagram showing a structure of a related word dictionary shown in FIG. 8;

【図10】図8の関連語辞書の構造を示す図である。10 is a diagram showing a structure of a related word dictionary shown in FIG. 8;

【図11】図8の関連語辞書の構造を示す図である。11 is a diagram showing a structure of a related word dictionary in FIG.

【図12】本発明の第3の実施例に係る装置の構成を示
すブロック図である。
FIG. 12 is a block diagram showing a configuration of an apparatus according to a third exemplary embodiment of the present invention.

【図13】本発明の第3の実施例に係る処理手順を示す
フローチャートである。
FIG. 13 is a flowchart showing a processing procedure according to the third embodiment of the present invention.

【図14】本発明の第3の実施例を説明するための関連
語辞書の構造を示す図である。
FIG. 14 is a diagram showing a structure of a related word dictionary for explaining a third embodiment of the present invention.

【図15】図14の関連語辞書を使った処理を説明する
ための図である。
FIG. 15 is a diagram for explaining processing using the related word dictionary of FIG. 14;

【図16】図14の関連語辞書を使った処理を説明する
ための図である。
16 is a diagram for explaining a process using the related word dictionary of FIG. 14. FIG.

【図17】図14の関連語辞書を使った処理を説明する
ための図である。
17 is a diagram for explaining a process using the related word dictionary of FIG. 14. FIG.

【符号の説明】[Explanation of symbols]

1 検索語入力部 2 検索語保持部 3 関連語展開部 4 関連語辞書 5 関連語選択部 6 関連語表示部 7 選択入力部 8 文書保持部 9 検索処理部 10 検索結果保持部 21 検索語入力部 22 検索語保持部 23 関連語展開部 24 関連語辞書 25 関連語数設定部 26 展開条件保持部 27 文書保持部 28 検索処理部 29 検索結果保持部 31 検索語入力部 32 検索語保持部 33 関連語展開部 34 関連語辞書 35 関連語数設定部 36 関連語評価部 37 表示部 38 文書保持部 39 検索処理部 40 検索結果保持部 1 Search word input section 2 Search word storage 3 Related term expansion section 4 Related term dictionary 5 Related word selection section 6 Related word display 7 Selection input section 8 Document storage 9 Search processing unit 10 Search result storage 21 Search word input section 22 Search word storage 23 Related term expansion section 24 Related term dictionary 25 Related Word Number Setting Section 26 Deployment condition holding unit 27 Document Holder 28 Search Processing Unit 29 Search result storage 31 Search term input section 32 Search term storage 33 Related term expansion section 34 Related term dictionary 35 Related Word Number Setting Section 36 Related Words Evaluation Department 37 Display 38 Document holding unit 39 Search Processing Unit 40 Search result storage

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 検索すべき語を入力する検索語入力手段
と、 各語に対してその関連語を記述した関連語辞書と、 前記検索すべき語の関連語を前記関連語辞書から検索す
る関連語展開手段と、 入力した前記検索すべき語から検索に用いる関連語を求
める際に、関連語を選択する手段とを具備したことを特
徴とする文書検索装置。
1. A search word input means for inputting a word to be searched, a related word dictionary describing the related word for each word, and searching for a related word of the word to be searched from the related word dictionary. A document search device comprising: a related word expanding means; and a means for selecting a related word when a related word used for a search is obtained from the inputted words to be searched.
【請求項2】 検索すべき語を入力する検索語入力手段
と、 各語に対してその類義語・上位語・下位語を階層構造の
形で記述した関連語辞書と、 前記検索すべき語の関連語を前記関連語辞書から検索す
る関連語展開手段と、 展開する関連語の数を設定する語数設定手段と、 関連語を展開する際の条件を設定する条件設定手段とを
備え、入力した前記検索すべき語から検索に用いる関連
語を求める際に、予め設定された値にしたがって関連語
の展開を行うことを特徴とする文書検索装置。
2. A search word input means for inputting a word to be searched, a related word dictionary in which synonyms / upper words / lower words are described in a hierarchical structure for each word, and a word to be searched. The related word expanding means for searching the related words from the related word dictionary, the word number setting means for setting the number of related words to be expanded, and the condition setting means for setting the condition for expanding the related words are inputted. A document search device, wherein when a related word used for a search is obtained from the words to be searched, the related word is expanded according to a preset value.
【請求項3】 検索すべき語を入力する検索語入力手段
と、 各語に対してその類義語・上位語・下位語を階層構造の
形で記述した関連語辞書と、 前記検索すべき語の関連語を前記関連語辞書から検索す
る関連語展開手段と、 入力した前記検索すべき語から検索に用いる関連語を求
める際に、検索語の意味が広く関連語の数が多い場合
に、再度検索語を指定することを指示する評価手段とを
具備したことを特徴とする文書検索装置。
3. A search word input means for inputting a word to be searched, a related word dictionary in which synonyms, high-rank words, and low-rank words are described in a hierarchical structure for each word, and the word to be searched. Related word expanding means for searching a related word from the related word dictionary and, when a related word used for a search is obtained from the inputted words to be searched, when the meaning of the search word is wide and the number of the related words is large, A document search device comprising: an evaluation unit that gives an instruction to specify a search word.
JP3178303A 1991-07-18 1991-07-18 Document retrieval device Pending JPH0528199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3178303A JPH0528199A (en) 1991-07-18 1991-07-18 Document retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3178303A JPH0528199A (en) 1991-07-18 1991-07-18 Document retrieval device

Publications (1)

Publication Number Publication Date
JPH0528199A true JPH0528199A (en) 1993-02-05

Family

ID=16046118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3178303A Pending JPH0528199A (en) 1991-07-18 1991-07-18 Document retrieval device

Country Status (1)

Country Link
JP (1) JPH0528199A (en)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309362A (en) * 1993-04-27 1994-11-04 Fujitsu Ltd Information retrieving method
JPH0944507A (en) * 1995-07-26 1997-02-14 Fuji Xerox Co Ltd Matching device
JPH1021266A (en) * 1996-07-03 1998-01-23 Oki Electric Ind Co Ltd Method and device for information retrieval
JPH10105577A (en) * 1996-08-28 1998-04-24 Philips Electron Nv Method and system for selecting information item
JPH11306182A (en) * 1998-04-24 1999-11-05 Fujitsu Ltd Processing method for relative word and recording medium
JP2002351924A (en) * 2001-05-22 2002-12-06 Nippon Gijutsu Joho:Kk System and method for retrieving information
JP2003122780A (en) * 2001-10-18 2003-04-25 Ntt Data Corp Device and method for retrieving information and program
JP2006039871A (en) * 2004-07-26 2006-02-09 Patolis Corp Synonym retrieval device, method, and program, storage medium recording the program, and information retrieval device
WO2007060726A1 (en) * 2005-11-25 2007-05-31 Mitsubishi Space Software Co., Ltd. Document retrieval device, method, and program
JP2008009543A (en) * 2006-06-27 2008-01-17 Hitachi Systems & Services Ltd Retrieval device
JP2008165304A (en) * 2006-12-27 2008-07-17 Fujifilm Corp Retrieval system
JP2009176274A (en) * 2007-10-05 2009-08-06 Fujitsu Ltd Implementing expanded search, and providing expanded search result
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
JP2009295186A (en) * 2009-09-16 2009-12-17 Mitsubishi Space Software Kk Document search device, document search method, and document search program
JP2011525669A (en) * 2008-06-26 2011-09-22 アルカテル−ルーセント Method for searching for a product, system for searching for a product, related product semantic determination device, and related product search device
JP2012194245A (en) * 2011-03-15 2012-10-11 Fujitsu Ltd Speech recognition device, speech recognition method and speech recognition program

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309362A (en) * 1993-04-27 1994-11-04 Fujitsu Ltd Information retrieving method
JPH0944507A (en) * 1995-07-26 1997-02-14 Fuji Xerox Co Ltd Matching device
JPH1021266A (en) * 1996-07-03 1998-01-23 Oki Electric Ind Co Ltd Method and device for information retrieval
JPH10105577A (en) * 1996-08-28 1998-04-24 Philips Electron Nv Method and system for selecting information item
JPH11306182A (en) * 1998-04-24 1999-11-05 Fujitsu Ltd Processing method for relative word and recording medium
JP2002351924A (en) * 2001-05-22 2002-12-06 Nippon Gijutsu Joho:Kk System and method for retrieving information
JP2003122780A (en) * 2001-10-18 2003-04-25 Ntt Data Corp Device and method for retrieving information and program
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
JP2006039871A (en) * 2004-07-26 2006-02-09 Patolis Corp Synonym retrieval device, method, and program, storage medium recording the program, and information retrieval device
WO2007060726A1 (en) * 2005-11-25 2007-05-31 Mitsubishi Space Software Co., Ltd. Document retrieval device, method, and program
JP2008009543A (en) * 2006-06-27 2008-01-17 Hitachi Systems & Services Ltd Retrieval device
JP2008165304A (en) * 2006-12-27 2008-07-17 Fujifilm Corp Retrieval system
JP2009176274A (en) * 2007-10-05 2009-08-06 Fujitsu Ltd Implementing expanded search, and providing expanded search result
JP2011525669A (en) * 2008-06-26 2011-09-22 アルカテル−ルーセント Method for searching for a product, system for searching for a product, related product semantic determination device, and related product search device
JP2009295186A (en) * 2009-09-16 2009-12-17 Mitsubishi Space Software Kk Document search device, document search method, and document search program
JP2012194245A (en) * 2011-03-15 2012-10-11 Fujitsu Ltd Speech recognition device, speech recognition method and speech recognition program

Similar Documents

Publication Publication Date Title
JPH0528199A (en) Document retrieval device
US7440947B2 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
KR100295354B1 (en) Document information retrieval system
US7058624B2 (en) System and method for optimizing search results
JP2002197096A (en) Method and system for generating general text summary of document
JPH07160731A (en) Method and device for picture retrieval
JPH06309362A (en) Information retrieving method
KR20080034363A (en) System and method for searching information using synonyms
US6278990B1 (en) Sort system for text retrieval
EP1445708A1 (en) Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JPH06314296A (en) Information retrieving system
JPH08255163A (en) Document retrieval device
JPH05151253A (en) Document retrieving device
JPH05101107A (en) Device and method for narrowed-down data retrieval using adaption rate
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JPH0877203A (en) Document retrieval device
JPH08235204A (en) Method and device for retrieving document
JPH07210565A (en) Method and device for retrieving information
JPH05181912A (en) Document retrieving device
JPH08137892A (en) Method and device for document retrieval
CN112463950B (en) Document searching method and device and electronic equipment
JPH10307839A (en) Text retrieving device and its method
JPH08235191A (en) Method and device for document retrieval
JPS6126172A (en) Kana/kanji conversion system