JPH06309362A - Information retrieving method - Google Patents

Information retrieving method

Info

Publication number
JPH06309362A
JPH06309362A JP5101348A JP10134893A JPH06309362A JP H06309362 A JPH06309362 A JP H06309362A JP 5101348 A JP5101348 A JP 5101348A JP 10134893 A JP10134893 A JP 10134893A JP H06309362 A JPH06309362 A JP H06309362A
Authority
JP
Japan
Prior art keywords
keyword
search
search keyword
word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5101348A
Other languages
Japanese (ja)
Inventor
Yasuyo Kikuta
泰代 菊田
Kazuhiko Tazawa
和彦 田澤
Akira Murata
彬 村田
Tatsuo Ota
竜夫 太田
Yuri Akamatsu
由理 赤松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5101348A priority Critical patent/JPH06309362A/en
Publication of JPH06309362A publication Critical patent/JPH06309362A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To shorten the retrieval time while obtaining a high hit rate at the time of retrieval as to the information retrieving means which retrieves information from a book data base for an information processing field by using a key word for retrieval. CONSTITUTION:When book data are registered, the book data to be registered are divided (101) into words by using a morpheme dictionary, a word which is not necessary as a key word is removed by using an unnecessary word dictionary to employ the result as the key word (102), and a high-order word for the key word is developed (103) by using a high-order word dictionary; and a synonym for the key word which is already generated is developed (104) by using a synonym dictionary, a compound word for the key word which is already generated is divided (105) by using a compound dictionary, and a synonym for the key word generated by dividing the compound word is developed (106) by using the synonym dictionary. Then a new key word is generated (107) by developing a different-notation word for the key word which is already generated by using a different-notation word dictionary.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は情報検索方法に係り、特
に、検索用キーワードを用いて情報処理分野の文献デー
タベースより情報を検索する情報検索方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval method, and more particularly to an information retrieval method for retrieving information from a document database in the information processing field using a retrieval keyword.

【0002】文献データベースより情報を検索する情報
検索方法では、目的とする文献データのヒット率の向
上、検索時間の短縮が必要とされている。
In the information retrieval method for retrieving information from a literature database, it is necessary to improve the hit rate of desired literature data and shorten the retrieval time.

【0003】[0003]

【従来の技術】文献データベースの検索を行う情報検索
装置では、文献データの登録時に、登録する文献データ
にキーワードを付与して情報検索装置に登録しておき、
検索時には、キーワードを入力して、目的の文献データ
を検索している。
2. Description of the Related Art In an information search device for searching a document database, when registering document data, a keyword is added to the document data to be registered and registered in the information search device.
At the time of search, a keyword is input to search for desired document data.

【0004】従来、検索時のヒット率を向上させるため
に、検索時に、同義語辞書、上位語辞書、下位語辞書等
の展開語辞書を用いて、検索者により入力された元のキ
ーワードを展開して関連するキーワードを生成し、この
生成した関連するキーワードにより検索を行う方法があ
る。
Conventionally, in order to improve the hit rate at the time of search, at the time of search, the original keywords input by the searcher are expanded using expanded word dictionaries such as synonym dictionary, upper word dictionary and lower word dictionary. Then, there is a method of generating a related keyword and performing a search by using the generated related keyword.

【0005】[0005]

【発明が解決しようとする課題】しかし、従来の、検索
時に展開語辞書を用いてキーワードを展開して、生成し
た関連するキーワードを用いて検索を行う方法では、キ
ーワードの展開に時間がかかるため、検索に要する時間
が長いという問題がある。
However, in the conventional method of expanding the keywords using the expanded word dictionary at the time of searching and performing the search using the generated related keywords, it takes time to expand the keywords. There is a problem that the search time is long.

【0006】また、文献データの登録時には、人手でキ
ーワードを付けるため、ヒット率の向上を可能とする適
切なキーワードを付けることが難しく、手間もかかると
いう問題がある。
Further, when the document data is registered, the keywords are manually added, so that it is difficult and time-consuming to attach an appropriate keyword that can improve the hit rate.

【0007】本発明は、上記の点に鑑みてなされたもの
で、検索時の高いヒット率を実現しながら、検索時間を
短縮することができる情報検索方法を提供することを目
的とする。
The present invention has been made in view of the above points, and an object of the present invention is to provide an information search method capable of shortening the search time while realizing a high hit rate at the time of search.

【0008】[0008]

【課題を解決するための手段】請求項1の発明は、形態
素辞書を用いて、文献データベースに登録する文献デー
タの文章を単語に分割するステップと、不要語辞書を用
いて、上記分割された単語から、検索用キーワードとし
て不要な単語を除去して、残った単語を検索用キーワー
ドとして採用するステップと、上位語辞書を用いて、上
記採用されたキーワードに対する上位語を展開して新た
な検索用キーワードを生成するステップと、同義語辞書
を用いて、生成済の検索用キーワードに対して、読みは
異なるが同じ意味の同義語を展開して新たな検索用キー
ワードを生成するステップと、複合語辞書を用いて、生
成済の検索用キーワードに対して、複合語を分割して新
たな検索用キーワードを生成するステップと、上記同義
語辞書を用いて、上記複合語の分割により生成された検
索用キーワードに対して、読みは異なるが同じ意味の同
義語を展開して新たな検索用キーワードを生成するステ
ップと、異表記語辞書を用いて、生成済の検索用キーワ
ードに対して、本来同じ単語であるが表記のみが異なる
異表記語を展開して新たな検索用キーワードを生成する
ステップとを有し、上記文献データベースに、上記文献
データと共に上記生成した検索用キーワードを登録して
おき、文献データの検索時には、検索者により入力され
た検索用キーワードを用いて、目的とする文献データを
検索する構成とする。
According to a first aspect of the invention, a step of dividing a sentence of document data to be registered in a document database into words using a morpheme dictionary and the above-mentioned division using an unnecessary word dictionary. A step of removing unnecessary words from the words as a search keyword and adopting the remaining words as a search keyword, and using a broader word dictionary, expanding a broader word for the adopted keyword to perform a new search. Generating a keyword for search and a step of generating a new search keyword by expanding synonyms that have different readings but have the same meaning to the generated search keyword using the synonym dictionary. Using the word dictionary, for the generated search keyword, dividing the compound word to generate a new search keyword, and using the synonym dictionary, For the search keyword generated by dividing the compound word, the step of generating a new search keyword by expanding synonyms with different readings but the same meaning, and using the different notation word dictionary For the search keyword, to generate a new search keyword by expanding different notation words that are originally the same word but different in notation, and generate the new search keyword in the document database together with the document data. The search keyword is registered in advance, and when the document data is searched, the target document data is searched by using the search keyword input by the searcher.

【0009】請求項3の発明は、文献データの検索時
に、入力された検索用キーワードにより文献データを検
索した結果、検索用キーワードに該当する文献データの
件数が所定値以上であるかどうかを判断するステップ
と、上記判断の結果、検索用キーワードに該当する文献
データの件数が基準値以上である場合には、下位語展開
により下位概念の検索用キーワードの候補を生成し、上
記検索用キーワードの候補を検索者に提示して、検索者
に検索用キーワードを選択させるステップを有する構成
とする。
According to the third aspect of the invention, when the document data is searched, it is determined whether or not the number of document data corresponding to the search keyword is equal to or more than a predetermined value as a result of searching the document data with the input search keyword. If the number of document data corresponding to the search keyword is equal to or greater than the reference value, the candidate for the search keyword of the subordinate concept is generated by the expansion of the subordinate word and the search keyword The configuration includes a step of presenting the candidates to the searcher and allowing the searcher to select the search keyword.

【0010】請求項4の発明は、文献データの検索時に
検索者により入力された自然語の質問文を、前記形態素
辞書により単語に分割し、前記不要語辞書により不要な
単語を辞去して検索用キーワードとして有用な単語のみ
を残して、検索用キーワードの候補とするステップと、
検索者に、上記検索用キーワードの候補を提示して確認
させ、必要に応じて検索用キーワードを変更させて検索
用キーワードを決定するステップとを有し、上記決定さ
れた検索用キーワードを用いて文献データを検索する構
成とする。
According to a fourth aspect of the present invention, a natural language question sentence input by a searcher at the time of searching document data is divided into words by the morpheme dictionary, and unnecessary words are removed by the unnecessary word dictionary for searching. Leaving only words that are useful as search keywords, and using them as search keyword candidates,
Presenting the candidate of the search keyword to the searcher for confirmation, changing the search keyword as necessary to determine the search keyword, and using the determined search keyword It is configured to search for literature data.

【0011】[0011]

【作用】請求項1の発明では、文献データの登録時に、
展開語辞書により自動的に適切な検索用キーワードを生
成して登録する。このため、検索時の高いヒット率を実
現しながら、検索時間を短縮することを可能とし、ま
た、検索用キーワードを付与する手間を削減することを
可能とする。
In the invention of claim 1, when the document data is registered,
Appropriate search keywords are automatically generated and registered using the expanded word dictionary. Therefore, it is possible to shorten the search time while realizing a high hit rate at the time of search, and it is also possible to reduce the time and effort to add the search keyword.

【0012】請求項3の発明では、検索用キーワードに
よる文献データの検索の結果、該当する文献データの件
数が基準値以上の場合には、下位概念の検索用キーワー
ド候補を生成して検索者に選択させて、検索対象を絞り
込む。このため、検索用キーワードに該当する文献デー
タの件数が多い場合に、目的の文献データを検索するま
での検索時間を短縮することを可能とする。
According to the third aspect of the present invention, as a result of the search of the document data by the search keyword, when the number of the relevant document data is equal to or more than the reference value, the search keyword candidate of the subordinate concept is generated and the searcher is informed. Select and narrow down the search target. Therefore, when the number of document data items corresponding to the search keyword is large, it is possible to shorten the search time until the target document data item is searched.

【0013】請求項4の発明では、検索時に、検索者に
より入力された自然語の質問文から、適切なキーワード
を生成する。このため、容易に適切なキーワードを生成
させることができ、検索時のヒット率を向上させること
を可能とする。
According to the fourth aspect of the present invention, at the time of search, an appropriate keyword is generated from the natural language question sentence input by the searcher. Therefore, it is possible to easily generate an appropriate keyword and improve the hit rate at the time of search.

【0014】[0014]

【実施例】図1は本発明の第1実施例を適用した情報検
索装置の構成図を示す。この情報検索装置は、情報処理
分野の文献データベースを登録し、検索する装置の例で
ある。図1に示す情報検索装置は、登録する文献データ
を入力する文献データ入力装置12、検索者が検索用キ
ーワードやコマンド等を入力する入力装置13、検索結
果等を表示する表示装置14、文献データとキーワード
の登録処理、検索処理を行う処理部11を備えている。
FIG. 1 is a block diagram of an information retrieval apparatus to which a first embodiment of the present invention is applied. This information retrieval device is an example of a device that registers and retrieves a document database in the information processing field. The information retrieval device shown in FIG. 1 includes a document data input device 12 for inputting document data to be registered, an input device 13 for a searcher to input search keywords and commands, a display device 14 for displaying search results, and document data. And a processing unit 11 for performing keyword registration processing and search processing.

【0015】また、補助記憶装置等に格納されるデータ
ベース25は、複数の文献データからなる文献データフ
ァイル26と、各文献データに付与された検索用キーワ
ードの集まりでありキーワードファイル27からなる。
キーワードファイル27中の各キーワードは、対応する
文献データの格納位置を示すポインタと共に記憶されて
いる。
The database 25 stored in the auxiliary storage device or the like is composed of a document data file 26 composed of a plurality of document data and a keyword file 27 which is a collection of search keywords attached to each document data.
Each keyword in the keyword file 27 is stored together with a pointer indicating the storage position of the corresponding document data.

【0016】また、文献データ登録時に、文献データの
文章からキーワードを抽出して、抽出した各キーワード
を基に、関連する単語にキーワードを展開して検索用キ
ーワードを生成するために、形態素辞書15、不要語辞
書16、展開語辞書17を備えている。展開語辞書17
は、上位語辞書18、同義語辞書19、複合語辞書2
0、異表記語辞書21からなる。上記の各辞書は、補助
記憶装置等に格納されている。
Further, at the time of registering the document data, the morpheme dictionary 15 is used in order to extract the keywords from the sentences of the document data and expand the keywords into related words based on the extracted keywords to generate the search keywords. , An unnecessary word dictionary 16 and an expanded word dictionary 17. Expanded word dictionary 17
Is a high-ranking word dictionary 18, synonym dictionary 19, compound word dictionary 2
0, different notation word dictionary 21. Each of the above dictionaries is stored in the auxiliary storage device or the like.

【0017】形態素辞書15には、各種文字列と品詞
(名詞、接続詞、助詞等)の対応を示す情報が記憶され
ている。不要語辞書16には、接続詞、助詞等の不要な
単語、及び、情報処理分野でキーワードとして無用な単
語が登録されている。例えば、“ソフト”という単語
は、極一般的な単語であるため、不要語として登録され
ている。
The morpheme dictionary 15 stores information indicating the correspondence between various character strings and parts of speech (nouns, conjunctions, particles, etc.). In the unnecessary word dictionary 16, unnecessary words such as conjunctions and particles, and unnecessary words as keywords in the information processing field are registered. For example, the word “soft” is a very common word and is therefore registered as an unnecessary word.

【0018】また、上位語辞書18には、情報処理分野
で使われる各種の単語について、上位概念の単語、下位
概念の単語を示す情報が記憶されている。同義語辞書1
9には、情報処理分野で使われる各種の単語について、
読みは異なるが同じ意味の同義語を示す情報が記憶され
ている。
Further, the high-level word dictionary 18 stores information indicating a high-level concept word and a low-level concept word for various words used in the information processing field. Synonym dictionary 1
9 shows various words used in the information processing field,
Information indicating different synonyms but having the same meaning is stored.

【0019】複合語辞書20には、情報処理分野で使わ
れる各種複合語について、複合語を分割した単語が登録
されている。
In the compound word dictionary 20, words obtained by dividing the compound word are registered for various compound words used in the information processing field.

【0020】異表記語辞書21には、情報処理分野で使
われる各種単語について、本来同じ単語であるが表記の
みが異なる異表記語を示す情報が記憶されている。互い
に異表記語の関係にあるものとしては、例えば、一つの
単語を、アルファベットで表記した単語と、カタカナで
表記した単語がある。
The different notation word dictionary 21 stores, for various words used in the information processing field, information indicating different notation words that are originally the same word but differ only in the notation. Examples of mutually different notation words include a word in which one word is written in alphabet and a word in which one word is written in katakana.

【0021】なお、上記展開語辞書17には、キーワー
ドとして無用なものは、登録していない。
Note that unnecessary words are not registered as keywords in the expanded word dictionary 17.

【0022】次に、第1実施例における、文献データを
登録する際のキーワードの展開について説明する。本実
施例では、文献データを登録する際に、処理部11が、
文献データの文章から自動的にキーワードを抽出して、
抽出した各キーワードを基に、関連する単語にキーワー
ドを展開して検索用キーワードを生成する。
Next, the expansion of keywords when registering document data in the first embodiment will be described. In the present embodiment, when the document data is registered, the processing unit 11
Keywords are automatically extracted from the text of the literature data,
Based on each extracted keyword, the keyword is expanded into related words to generate a search keyword.

【0023】図2は、第1実施例におけるキーワードの
展開手順を示すフローチャートである。また、図3は、
第1実施例におけるキーワードの展開の一例の説明図を
示す。
FIG. 2 is a flow chart showing the keyword expansion procedure in the first embodiment. In addition, FIG.
FIG. 7 is an explanatory diagram of an example of keyword expansion in the first embodiment.

【0024】先ず、文献データ入力装置12により入力
された文献データの文章を、形態素辞書15を用いて単
語に分割する(ステップ101)。次に、不要語辞書1
6を用いて、接続詞、助詞等の不要な単語、及び、情報
処理分野におけるキーワードとして無用な単語を辞去す
る。この不要語の除去が終了した時点で残った単語を、
文献データの文章から抽出されたキーワードとして採用
する(ステップ102)。
First, the sentence of the document data input by the document data input device 12 is divided into words using the morpheme dictionary 15 (step 101). Next, unnecessary word dictionary 1
6 is used to eliminate unnecessary words such as conjunctions and particles, and unnecessary words as keywords in the information processing field. When the removal of this unnecessary word is completed,
It is adopted as a keyword extracted from the text of the document data (step 102).

【0025】この後に続くキーワード展開処理では、ス
テップ102で抽出された各キーワードに対して、順
次、各展開処理を行って、新たなキーワードを生成す
る。先ず、上位語辞書18を用いて、元のキーワードの
上位語を展開して新たなキーワードを生成する。図3の
例では、上位語展開113に示すように、元のキーワー
ドである、“LOTUS1−2−3”に対して、上位語
である“スプレッドシート”を新たなキーワードとして
生成している(ステップ103)。
In the subsequent keyword expansion process, each expansion process is sequentially performed on each keyword extracted in step 102 to generate a new keyword. First, using the upper word dictionary 18, the upper word of the original keyword is expanded to generate a new keyword. In the example of FIG. 3, as shown in the high-order word expansion 113, the high-order word “spreadsheet” is generated as a new keyword with respect to the original keyword “LOTUS1-2-3” ( Step 103).

【0026】次に、同義語辞書19を用いて、ステップ
103までに生成済のキーワードに対して同義語を展開
して、新たなキーワードを生成する。図3の例では、同
義語展開114に示すように、“スプレッドシート”に
対する同義語である、“表計算ソフト”を新たなキーワ
ードとして生成している(ステップ104)。
Next, using the synonym dictionary 19, the synonyms are expanded with respect to the keywords generated up to step 103, and new keywords are generated. In the example of FIG. 3, as shown in the synonym expansion 114, "spreadsheet software", which is a synonym for "spreadsheet", is generated as a new keyword (step 104).

【0027】次に、複合語辞書20を用いて、ステップ
104までに生成済のキーワードに対して複合語を分割
して、新たなキーワードを生成する。図3の例では、複
合語展開115に示すように、複合語である“表計算ソ
フト”に対して、分割した“表計算”と、“計算ソフ
ト”を新たなキーワードとして生成している。なお、
“表計算ソフト”を分割すると“表”、“計算”、“ソ
フト”も生じるが、これらは、情報処理分野のキーワー
ドとして無用であるので、複合語辞書20には、登録し
ていない。このように、複合語を分割して生成される単
語のうち、キーワードとして無用なものを登録しないで
おくことにより、余分なキーワードを生成することを防
ぐことができ、キーワードファイル27の容量の削減も
できる(ステップ105)。
Next, using the compound word dictionary 20, the compound word is divided into the keywords already generated up to step 104 to generate a new keyword. In the example of FIG. 3, as shown in the compound word expansion 115, the divided “table calculation” and “calculation software” are generated as new keywords with respect to the compound word “table calculation software”. In addition,
When "spreadsheet software" is divided, "table", "calculation", and "software" are also generated, but these are not used as keywords in the information processing field, so they are not registered in the compound word dictionary 20. As described above, by not registering unnecessary words as keywords among the words generated by dividing the compound word, it is possible to prevent extra keywords from being generated and reduce the capacity of the keyword file 27. It is also possible (step 105).

【0028】次に、再度、同義語辞書19を用いて、ス
テップ105で複合語の分割により生成されたキーワー
ドに対して同義語を展開して、新たなキーワードを生成
する。図3の例では、同義語展開116に示すように、
“表計算”に対する同義語である、“カルク”を新たな
キーワードとして生成している(ステップ106)。
Next, using the synonym dictionary 19 again, the synonyms are expanded with respect to the keywords generated by dividing the compound word in step 105, and new keywords are generated. In the example of FIG. 3, as shown in the synonym expansion 116,
"Calc", which is a synonym for "spreadsheet", is generated as a new keyword (step 106).

【0029】次に、異表記語辞書21を用いて、ステッ
プ106までに生成済のキーワードに対して異表記語を
展開して、新たなキーワードを生成する。図3の例で
は、異表記語展開117に示すように、“LOTUS1
−2−3”に対する異表記語の“ロータス1−2−
3”、及び“スプレッドシート”に対する異表記語の
“SPREADSHEET”を、新たなキーワードとし
て生成している(ステップ107)。
Next, the different notation word dictionary 21 is used to expand the different notation word with respect to the keywords already generated up to step 106 to generate a new keyword. In the example of FIG. 3, as shown in the different notation expansion 117, “LOTUS1
The synonym “Lotus 1-2” for “-2-3”
3 "and" SPREADSHEET ", which is a different notation for" spreadsheet ", are generated as new keywords (step 107).

【0030】上記の展開辞書17を用いたキーワード展
開で生成されたキーワードは、登録する文献データのキ
ーワードとして、キーワードファイル27に登録され
る。一方、文献データは、データベース25の文献デー
タファイル26に登録される。
The keywords generated by the keyword expansion using the expansion dictionary 17 are registered in the keyword file 27 as the keywords of the document data to be registered. On the other hand, the document data is registered in the document data file 26 of the database 25.

【0031】上記のように、本実施例では、文献データ
の登録時に、展開語辞書17を用いて、文献データから
抽出した元のキーワードと関連する有用なキーワードを
自動的に生成して登録する。このため、文献データの検
索時には、キーワードの展開処理をすることなく、広い
範囲のキーワードで目的の文献を検索することができ
る。
As described above, in this embodiment, when the document data is registered, the expanded word dictionary 17 is used to automatically generate and register a useful keyword related to the original keyword extracted from the document data. . Therefore, at the time of searching document data, it is possible to search for a target document with a wide range of keywords without performing keyword expansion processing.

【0032】従って、本実施例では、文献データの検索
時に、従来方法に比べて、キーワード展開処理に要する
時間分、検索時間を短縮することができ、かつ、良好な
ヒット率を実現することができる。また、人手により検
索用キーワードを付与する手間を削減することができ
る。
Therefore, in the present embodiment, when searching the document data, the search time can be shortened by the time required for the keyword expansion processing as compared with the conventional method, and a good hit rate can be realized. it can. In addition, it is possible to reduce the labor of manually adding the search keyword.

【0033】次に、第1実施例における、文献データの
検索について説明する。図4は、第1実施例における検
索の手順を示すフローチャートである。
Next, the retrieval of document data in the first embodiment will be described. FIG. 4 is a flowchart showing the search procedure in the first embodiment.

【0034】キーワードが検索者により入力されると
(ステップ201)、入力されたキーワードを用いて、
データベース25より文献データの検索を行う(ステッ
プ202)。次に、検索の結果、キーワードに該当する
文献データの件数が基準値以上であるかどうかを判断す
る(ステップ203)。
When a keyword is input by the searcher (step 201), the input keyword is used to
Document data is searched from the database 25 (step 202). Next, as a result of the search, it is determined whether or not the number of document data corresponding to the keyword is equal to or larger than the reference value (step 203).

【0035】検索結果の件数が基準値以上である場合に
は、件数を絞るために、下記の処理を行う。先ず、上位
語辞書18を逆引きして、元のキーワードの下位語を展
開して、下位概念のキーワードを生成する(ステップ2
04)。次に、生成した下位概念のキーワードの一覧を
表示装置14により表示して、検索者に使用する下位概
念のキーワードを選択させる(ステップ205)。
When the number of search results is greater than or equal to the reference value, the following processing is performed to narrow down the number of search results. First, the high-order word dictionary 18 is reversely searched, the low-order word of the original keyword is expanded, and the low-order concept keyword is generated (step 2).
04). Next, the generated list of subordinate concept keywords is displayed on the display device 14 to allow the searcher to select a subordinate concept keyword to be used (step 205).

【0036】次に、ステップ202に戻って、ステップ
205で選択された、元のキーワードの下位概念のキー
ワードを用いて、再度文献データの検索を行う。以後、
検索結果の件数が基準値未満になるまで、上記の処理を
続ける。
Next, returning to step 202, the reference data is searched again using the keyword of the subordinate concept of the original keyword selected in step 205. After that,
The above processing is continued until the number of search results becomes less than the reference value.

【0037】ステップ203で、検索結果の件数が基準
値未満である場合は、検索結果の文献データの一覧を表
示装置14に表示して、検索者に文献データを選択させ
る(ステップ206)。検索者により文献データが選択
されると、この選択された文献データを表示装置14等
に出力する(ステップ207)。
In step 203, if the number of search results is less than the reference value, a list of document data of the search results is displayed on the display device 14 and the searcher is made to select the document data (step 206). When the document data is selected by the searcher, the selected document data is output to the display device 14 or the like (step 207).

【0038】図5は、第1実施例の検索時における下位
概念のキーワードの生成例を示す。図5のA欄では、元
のキーワードの“製造”に該当する件数が基準値以上
で、下位概念のキーワードである、“化学”,“機械”
〜 が生成された例を示している。
FIG. 5 shows an example of generating a keyword of a subordinate concept at the time of searching in the first embodiment. In column A of FIG. 5, the number of cases corresponding to the original keyword “manufacturing” is equal to or greater than the reference value, and the subordinate keywords “chemistry” and “machine”
The following shows an example in which ~ is generated.

【0039】また、図5のB欄では、元のキーワードの
“保険”に該当する件数が基準値以上で、下位概念のキ
ーワードである、“生命保険”,“損害保険”〜 が生
成された例を示している。また、図5のC欄では、元の
キーワードの“パソコン”に該当する件数が基準値以上
で、下位概念のキーワードである、“FMRシリー
ズ”,“FM−TOWNSシリーズ”〜 が生成された
例を示している。
In column B of FIG. 5, the number of cases corresponding to the original keyword "insurance" is equal to or greater than the reference value, and subordinate keywords "life insurance", "non-life insurance" ... are generated. An example is shown. Further, in the column C of FIG. 5, the number of cases corresponding to the original keyword “personal computer” is equal to or greater than the reference value, and the subordinate keywords “FMR series”, “FM-TOWNS series” to are generated. Is shown.

【0040】上記のように、第1実施例の検索方法で
は、検索者により入力されたキーワードによる文献デー
タの検索の結果、該当する文献データの件数が基準値以
上の場合には、自動的に、下位語展開により下位概念の
キーワードを生成して検索者に提示し、検索者に下位概
念のキーワードを選択させて、検索対象を絞り込むこと
ができる。このため、キーワードに該当する文献データ
の件数が多い場合に、目的の文献データを検索するまで
の検索時間を短縮することができる。
As described above, according to the search method of the first embodiment, when the number of relevant document data is equal to or larger than the reference value as a result of the document data search by the keyword input by the searcher, it is automatically performed. , It is possible to narrow down the search target by generating a subordinate concept keyword by the subordinate word expansion, presenting it to the searcher, and causing the searcher to select the subordinate concept keyword. Therefore, when the number of document data corresponding to the keyword is large, the search time until the target document data is searched can be shortened.

【0041】なお、検索時にも、文献データ登録時と同
様に、キーワードの展開を行う方法とすることも可能で
ある。
It should be noted that it is also possible to employ a method of expanding keywords even during retrieval, as in the case of document data registration.

【0042】図6は本発明の第2実施例を適用した情報
検索装置の構成図を示す。図6において、図1と同一構
成部分には同一符号を付し、適宜説明を省略する。この
情報検索装置は、情報処理分野の文献データベースを登
録し、検索する装置の例である。
FIG. 6 is a block diagram of an information retrieval apparatus to which the second embodiment of the present invention is applied. 6, the same components as those in FIG. 1 are designated by the same reference numerals, and the description thereof will be omitted as appropriate. This information retrieval device is an example of a device that registers and retrieves a document database in the information processing field.

【0043】補助記憶装置等には、データベース群24
として、複数のデータベース251〜25n が格納され
ている。また、格納されている複数のデータベース25
1 〜25n に関する、データベース定義情報22が格納
されている。また、検索者により入力される質問文から
抽出したキーワードを分類するために、知識ベース23
を備えている。また、文献データとキーワードの登録処
理、検索処理は、処理部11により行われる。
A database group 24 is provided in the auxiliary storage device or the like.
, A plurality of databases 25 1 to 25 n are stored. In addition, a plurality of stored databases 25
The database definition information 22 regarding 1 to 25 n is stored. In addition, in order to classify the keywords extracted from the question sentence input by the searcher, the knowledge base 23
Is equipped with. Further, the processing unit 11 performs the registration process and the search process of the document data and the keyword.

【0044】図6の情報検索装置では、図1の装置と同
様に、形態素辞書15、不要語辞書16、展開語辞書1
7を備えており、文献データ登録時には、文献データの
文章からキーワードを抽出して、抽出した各キーワード
を基に、関連する単語にキーワードを展開して検索用キ
ーワードを生成して登録する。
In the information retrieval apparatus of FIG. 6, the morpheme dictionary 15, the unnecessary word dictionary 16, and the expanded word dictionary 1 are the same as those of the apparatus of FIG.
When the document data is registered, the keyword is extracted from the sentence of the document data, and the keyword is expanded to the related word based on each extracted keyword to generate and register the search keyword.

【0045】第2実施例では、検索時に、検索者に自然
語の質問文を入力させ、入力された質問文からキーワー
ドの候補を抽出して検索者に提示し、検索者がこのキー
ワードを確認した後、文献データの検索を行う。
In the second embodiment, at the time of search, the searcher is made to input a question sentence in natural language, candidate keywords are extracted from the inputted question sentence and presented to the searcher, and the searcher confirms this keyword. After that, the document data is searched.

【0046】図7は、第2実施例における、検索の手順
を示すフローチャートである。また、図8,図9は、自
然語の質問文の例と、抽出されたキーワードに基づく検
索条件の確認時及び検索条件変更時の表示例を示す。
FIG. 7 is a flow chart showing the search procedure in the second embodiment. 8 and 9 show an example of a natural language question sentence and display examples at the time of confirming the search condition based on the extracted keyword and at the time of changing the search condition.

【0047】自然語の質問文が検索者により入力される
と(ステップ301)、形態素辞書15を用いて、質問
文を単語に分割し(ステップ302)、不要語辞書16
を用いて、キーワードとして不要な単語を辞去する(ス
テップ303)。
When a natural language question sentence is input by the searcher (step 301), the question sentence is divided into words using the morpheme dictionary 15 (step 302), and the unnecessary word dictionary 16 is generated.
Is used to remove unnecessary words as keywords (step 303).

【0048】次に、情報処理分野に関する知識ベース2
3を用いて、不要語を除去して残った単語を、機種、O
S(オペレーティングシステム)、業種、業務等の検索
キーにより分類して、上記各検索キーに割り振る。この
各検索キーに割り振られた単語を、キーワードの候補で
あるキーワードの選択肢とする。また、各検索キーのキ
ーワードの選択肢のうち、第1候補のキーワードを選定
する。
Next, a knowledge base 2 relating to the information processing field.
The remaining words after the unnecessary words are removed by using
The search keys such as S (operating system), type of business, and business are classified and assigned to each of the search keys. The words assigned to each of the search keys are selected as keywords that are candidates for keywords. In addition, the keyword of the first candidate is selected from the keyword options of each search key.

【0049】また、データベース定義情報22を用い
て、上記各検索キーの第1候補のキーワードと関係のあ
るデータベースの種類を調べて、データベースの選択肢
を生成する(ステップ304)。
Further, the database definition information 22 is used to check the type of database related to the first candidate keyword of each search key, and database options are generated (step 304).

【0050】次に、各検索キーのキーワードの選択肢と
データベースの選択肢を表示装置14に表示して、検索
者に選択肢の選択をさせる。この場合、選択肢のうちの
第1候補に印を付けて表示する。検索者が、キーワード
の選択肢とデータベースの選択肢を選択した時点で、検
索条件が決定される(ステップ305)。
Next, the keyword options of the respective search keys and the database options are displayed on the display device 14 to allow the searcher to select the options. In this case, the first candidate of the alternatives is marked and displayed. The search condition is determined when the searcher selects a keyword option and a database option (step 305).

【0051】図8の例では、検索者により図8(A)に
示す、自然語の質問文、「食品販売店に食品を卸す食品
卸業の、物流管理と在庫管理の事例と手法を探したい」
が、入力されている。これに対して、図8(B)に示す
ように、各検索キーごとのキーワードの選択肢と、デー
タベースの選択肢を表示装置14に表示している。
In the example of FIG. 8, a searcher searches for a natural language question sentence “A case and method of physical distribution management and inventory management of a food wholesaler who sells food to a food store” shown in FIG. 8A. I want to
Has been entered. On the other hand, as shown in FIG. 8B, the keyword selection for each search key and the database selection are displayed on the display device 14.

【0052】検索キーの業種には、キーワードの選択肢
として、「食品卸」と「食品販売」が表示され、検索キ
ーの業務には、キーワードの選択肢として、「物流管
理」と「在庫管理」が表示されている。また、他の検索
キーには、キーワードの選択肢として、「事例」と「手
法」が表示されている。図8において、四角□は、選択
用の枠を示し、黒色の四角■は、現在選択されているこ
とを示す。
In the industry of the search key, "food wholesale" and "food sales" are displayed as the keyword options, and in the tasks of the search key, "distribution management" and "stock management" are the keyword options. It is displayed. Further, in other search keys, “case” and “method” are displayed as keyword options. In FIG. 8, a square □ indicates a frame for selection, and a black square ■ indicates that it is currently selected.

【0053】上記キーワードの選択肢を表示する時点で
は、処理部11により、第1候補として、「食品卸」、
「物流管理」、「事例」が選択されている。
At the time of displaying the above-mentioned keyword options, the processing unit 11 selects "food wholesale" as the first candidate,
"Logistics management" and "case" are selected.

【0054】また、データベースの選択肢には、上記各
検索キーで現在選択されている選択肢に関係するデータ
ベースの種類が表示される。図8(B)では、「事例デ
ータベース」、「提案書事例データベース」、「開発事
例データベース」〜が表示されている。また、第1候補
として、処理部11により、「事例データベース」が選
択されている。
In the database options, the type of database related to the option currently selected by each of the search keys is displayed. In FIG. 8B, "case database", "proposal case database", "development case database" and the like are displayed. Further, as the first candidate, the processing unit 11 selects “case database”.

【0055】検索者は、上記例のように表示されたキー
ワードの選択肢とデータベースの選択肢を選択して、検
索条件を決定する。
The searcher selects the keyword option and the database option displayed as in the above example to determine the search condition.

【0056】検索者がキーワードの選択肢とデータベー
スの選択肢を選択して、検索条件が決定されると、処理
部11は、文献データの検索を行う。即ち、データベー
ス定義情報22を基に、選択されたデータベースを調べ
て、決定された検索条件に従って、文献データの検索を
行う(ステップ306)。この検索の結果、各検索キー
のキーワードの組合せに該当する文献データの件数を表
示する(ステップ307)。
When the searcher selects a keyword option and a database option and the search condition is determined, the processing section 11 searches the document data. That is, the selected database is searched based on the database definition information 22 and the document data is searched according to the determined search condition (step 306). As a result of this search, the number of document data items corresponding to the combination of keywords of each search key is displayed (step 307).

【0057】次に、検索者に、検索範囲の拡大又は絞り
込みのために、検索条件の変更をするかどうかの確認を
させる。検索の結果、該当件数が少なく、検索者が検索
条件の変更を選択し、かつ、検索範囲の拡大を選択した
場合には、展開語辞書17を用いてキーワードの上位語
を展開して、展開した上位概念のキーワードを検索者に
選択させる。
Next, the searcher is asked to confirm whether or not to change the search condition in order to expand or narrow down the search range. As a result of the search, when the number of hits is small, the searcher selects the change of the search condition and also selects the expansion of the search range, the expanded word dictionary 17 is used to expand and expand the high-order word of the keyword. Let the searcher select the keyword of the superordinate concept.

【0058】また、検索の結果、該当件数が多く、検索
者が検索条件の変更を選択し、かつ、検索範囲の絞り込
みを選択した場合には、図4の検索手順で示したよう
に、展開語辞書17を用いてキーワードの下位語を展開
して、展開した下位概念のキーワードを検索者に選択さ
せる。
Further, as a result of the search, when the number of hits is large, the searcher selects the change of the search condition and the search range is narrowed down, as shown in the search procedure of FIG. The word dictionary 17 is used to expand the subordinate words of the keyword, and the searcher is made to select the expanded subordinate concept keyword.

【0059】検索条件が変更されて、検索者により新た
なキーワードが選択された場合には、ステップ306に
戻って、再度、文献データの検索を行う。
When the search condition is changed and the searcher selects a new keyword, the process returns to step 306 and the document data is searched again.

【0060】ステップ308で、検索者が検索条件の変
更を選択しなかった場合には、検索結果の文献データの
一覧を表示装置14に表示して、検索者に文献データを
選択させる(ステップ310)。検索者により文献デー
タが選択されると、この選択された文献データを表示装
置14等に出力する(ステップ311)。
In step 308, when the searcher does not select the change of the search condition, the list of the document data of the search result is displayed on the display device 14 and the searcher is made to select the document data (step 310). ). When the document data is selected by the searcher, the selected document data is output to the display device 14 or the like (step 311).

【0061】図8の例では、図8(B)に示す検索条件
で検索を行った結果、図8(C)に示すように、検索結
果の表示がされている。この場合、該当件数が1件で少
ないため、図8(C)に示すように、検索者は、検索条
件の変更を選択して、検索範囲の拡大を選択し、範囲を
広げたい検索キーとして、業種を選択している。
In the example of FIG. 8, as a result of performing the search under the search condition shown in FIG. 8B, the search result is displayed as shown in FIG. 8C. In this case, the number of hits is one, which is small. Therefore, as shown in FIG. 8C, the searcher selects the change of the search condition, selects the expansion of the search range, and selects the search key to expand the range. , Industry is selected.

【0062】これにより、処理部11は、業種の元のキ
ーワードである「食品卸」を上位語に展開して、上位概
念のキーワードの一覧である、「流通」、「販売」〜を
表示している。検索者は、この表示された上位概念のキ
ーワードの一覧から、キーワードを選択する。これによ
り、検索対象を拡大して、再度、検索を行うことができ
る。
As a result, the processing unit 11 expands the original keyword “food wholesale” of the industry into a broader term, and displays a list of broader concepts such as “distribution” and “sales”. ing. The searcher selects a keyword from the displayed list of keywords of the superordinate concept. As a result, the search target can be expanded and the search can be performed again.

【0063】また、図9の例では検索者により図9
(A)に示す、自然語の質問文、「UNIXに関するマ
ニュアルとアプリケーションガイドを探したい」が、入
力されている。これに対して、図9(B)に示すよう
に、各検索キーごとのキーワードの選択肢と、データベ
ースの選択肢を表示している。
Further, in the example of FIG.
The natural language question sentence “I want to find a manual and application guide regarding UNIX” shown in (A) is input. On the other hand, as shown in FIG. 9 (B), the keyword choices for each search key and the database choices are displayed.

【0064】検索キーのOSには、キーワードの選択肢
として、「UNIX」だけが表示され、他の検索キーに
は、キーワードの選択肢として、「マニュアル」と「ア
プリケーションガイド」が表示されている。なお、情報
検索装置により、第1候補として、「マニュアル」が選
択されている。
On the OS of the search key, only "UNIX" is displayed as a keyword option, and on other search keys, "manual" and "application guide" are displayed as a keyword option. Note that the information retrieval device selects "manual" as the first candidate.

【0065】また、データベースの選択肢には、「マニ
ュアルデータベース」、「入門書データベース」〜が表
示されている。また、第1候補として、処理部11によ
り、「マニュアルデータベース」が選択されている。
In addition, "manual database", "introduction database" to are displayed as the database options. Further, the processing unit 11 selects “manual database” as the first candidate.

【0066】検索者は、上記例のように表示されたキー
ワードの選択肢とデータベースの選択肢を選択して、検
索条件を決定する。
The searcher selects the keyword option and the database option displayed as in the above example to determine the search condition.

【0067】図9の例では、図9(B)に示す検索条件
で検索を行った結果、図9(C)に示すように、検索結
果の表示がされている。この場合、該当件数が68件と
多いいため、図9(C)に示すように、検索者は、検索
条件の変更を選択して、検索範囲の絞り込みを選択し、
絞り込みたい条件として、OSを選択している。
In the example of FIG. 9, the search result is displayed as shown in FIG. 9C as a result of the search performed under the search condition shown in FIG. 9B. In this case, since the number of hits is as high as 68, as shown in FIG. 9C, the searcher selects change of the search condition and narrows down the search range,
The OS is selected as the condition to be narrowed down.

【0068】これにより、処理部11では、OSの元の
キーワードである「UNIX」を下位語に展開して、下
位概念のキーワードの一覧である、「UTS/M」、
「UXP/M」、「SX/A」、「UXP/DS」、
「SUN/OS」〜を表示している。検索者は、この表
示された下位概念のキーワードの一覧から、キーワード
を選択する。これにより、検索対象を絞り込んで、再
度、検索を行うことができる。
As a result, the processing unit 11 expands the original keyword "UNIX" of the OS into the subordinate words, "UTS / M", which is a list of subordinate concept keywords,
"UXP / M", "SX / A", "UXP / DS",
"SUN / OS" -is displayed. The searcher selects a keyword from the displayed list of subordinate concept keywords. As a result, the search target can be narrowed down and the search can be performed again.

【0069】上記のように、第2実施例では、検索時
に、検索者により入力された自然語の質問文から、キー
ワードの選択肢とデータベースの選択肢を生成し、検索
者にこの選択肢を選択させて決定した検索条件で、文献
データの検索を行う。このため、検索時に、SQL(S
tructured Query Language)
等のような所定の質問式による記述が不要で、容易に適
切なキーワードを生成させることができ、検索時のヒッ
ト率を向上させることができる。
As described above, in the second embodiment, at the time of search, a keyword option and a database option are generated from a natural language question sentence input by the searcher, and the searcher is allowed to select this option. Document data is searched under the determined search conditions. Therefore, when searching, SQL (S
Structured Query Language)
It is possible to easily generate an appropriate keyword and improve the hit rate at the time of search without the need for description by a predetermined question expression such as.

【0070】[0070]

【発明の効果】上述の如く、請求項1の発明によれば、
文献データの登録時に、展開語辞書により自動的に適切
な検索用キーワードを生成して登録するため、検索時の
高いヒット率を実現しながら、検索時間を短縮すること
ができ、また、検索用キーワードを付与する手間を削減
することができる等の特長を有する。
As described above, according to the invention of claim 1,
When registering document data, an expanded word dictionary is used to automatically generate and register appropriate search keywords, which enables a high hit rate during search while reducing the search time. It has features such as the time and effort of assigning keywords.

【0071】請求項3の発明によれば、検索用キーワー
ドによる文献データの検索の結果、該当する文献データ
の件数が基準値以上の場合には、下位概念の検索用キー
ワード候補を生成して検索者に選択させて、検索対象を
絞り込むため、検索用キーワードに該当する文献データ
の件数が多い場合に、目的の文献データを検索するまで
の検索時間を短縮することができる。
According to the third aspect of the present invention, as a result of the search of the document data by the search keyword, when the number of the relevant document data is equal to or more than the reference value, the search keyword candidate of the subordinate concept is generated and searched. Since the search target is narrowed down by the user, the search time until the target document data is searched can be shortened when the number of document data corresponding to the search keyword is large.

【0072】請求項4の発明では、検索時に、検索者に
より入力された自然語の質問文から、適切なキーワード
を生成するため、容易に適切なキーワードを生成させる
ことができ、検索時のヒット率を向上させることができ
る。
According to the fourth aspect of the present invention, since an appropriate keyword is generated from a natural language question sentence input by a searcher at the time of search, it is possible to easily generate an appropriate keyword, and a hit at the time of search. The rate can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1実施例を適用した情報検索装置の
構成図である。
FIG. 1 is a configuration diagram of an information search device to which a first embodiment of the present invention is applied.

【図2】第1実施例におけるキーワードの展開手順を示
すフローチャートである。
FIG. 2 is a flowchart showing a keyword expansion procedure in the first embodiment.

【図3】第1実施例におけるキーワード展開の一例の説
明図である。
FIG. 3 is an explanatory diagram of an example of keyword expansion in the first embodiment.

【図4】本発明の第1実施例における、検索手順を示す
フローチャートである。
FIG. 4 is a flowchart showing a search procedure in the first embodiment of the present invention.

【図5】第1実施例の検索時における下位概念のキーワ
ードの生成例を示す図である。
FIG. 5 is a diagram showing an example of generating subordinate concept keywords at the time of searching in the first embodiment.

【図6】本発明の第2実施例を適用した情報検索装置の
構成図である。
FIG. 6 is a configuration diagram of an information search device to which a second embodiment of the present invention is applied.

【図7】本発明の第2実施例における、検索手順を示す
フローチャートである。
FIG. 7 is a flowchart showing a search procedure in the second embodiment of the present invention.

【図8】自然語の質問文の例と、検索条件確認時及び検
索条件変更時の表示例を示す図である。
FIG. 8 is a diagram showing an example of a natural language question sentence and a display example when a search condition is confirmed and when a search condition is changed.

【図9】自然語の質問文の例と、検索条件確認時及び検
索条件変更時の表示例を示す図である。
FIG. 9 is a diagram illustrating an example of a natural language question sentence and a display example when a search condition is confirmed and when a search condition is changed.

【符号の説明】[Explanation of symbols]

11 処理部 12 文献データ入力装置 13 入力装置 14 表示装置 15 形態素辞書 16 不要語辞書 17 展開語辞書 18 上位語辞書 19 同義語辞書 20 複合語辞書 21 異表記語辞書 22 データベース定義情報 23 知識ベース 24 データベース群 25 データベース 251 〜25n データベース 26 文献データファイル 27 キーワードファイル11 processing unit 12 document data input device 13 input device 14 display device 15 morpheme dictionary 16 unnecessary word dictionary 17 expanded word dictionary 18 superordinate word dictionary 19 synonym dictionary 20 compound word dictionary 21 different notation word dictionary 22 database definition information 23 knowledge base 24 database group 25 database 25 1 to 25 n database 26 literature data file 27 keyword file

───────────────────────────────────────────────────── フロントページの続き (72)発明者 太田 竜夫 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 赤松 由理 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Tatsuo Ota 1015 Kamiodanaka, Nakahara-ku, Kawasaki-shi, Kanagawa, Fujitsu Limited (72) Inventor Yuri Akamatsu 1015 Kamedota, Nakahara-ku, Kawasaki, Kanagawa Prefecture, Fujitsu Limited

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 形態素辞書(15)を用いて、文献デー
タベースに登録する文献データの文章を単語に分割する
ステップ(101)と、 不要語辞書(16)を用いて、上記分割された単語か
ら、検索用キーワードとして不要な単語を除去して、残
った単語を検索用キーワードとして採用するステップ
(102)と、 上位語辞書(18)を用いて、上記採用されたキーワー
ドに対する上位語を展開して新たな検索用キーワードを
生成するステップ(103)と、 同義語辞書(19)を用いて、生成済の検索用キーワー
ドに対して、読みは異なるが同じ意味の同義語を展開し
て新たな検索用キーワードを生成するステップ(10
4)と、 複合語辞書(20)を用いて、生成済の検索用キーワー
ドに対して、複合語を分割して新たな検索用キーワード
を生成するステップ(105)と、 上記同義語辞書(19)を用いて、上記複合語の分割に
より生成された検索用キーワードに対して、読みは異な
るが同じ意味の同義語を展開して新たな検索用キーワー
ドを生成するステップ(106)と、 異表記語辞書(21)を用いて、生成済の検索用キーワ
ードに対して、本来同じ単語であるが表記のみが異なる
異表記語を展開して新たな検索用キーワードを生成する
ステップ(107)とを有し、 上記文献データベースに、上記文献データと共に上記生
成した検索用キーワードを登録しておき、文献データの
検索時には、検索者により入力された検索用キーワード
を用いて、目的とする文献データを検索する構成とした
ことを特徴とする情報検索方法。
1. A step (101) of dividing a sentence of document data to be registered in a document database into words using a morpheme dictionary (15), and a step of extracting words from the divided words using an unnecessary word dictionary (16). , A step (102) of removing unnecessary words as the search keyword and adopting the remaining words as the search keyword, and a high-order word dictionary (18) is used to expand the high-order word to the adopted keyword. Using the step (103) of generating a new search keyword and the synonym dictionary (19), a synonym having a different reading but having the same meaning is developed for the generated search keyword to generate a new search keyword. Step of generating search keyword (10
4) and, using the compound word dictionary (20), dividing the compound word with respect to the generated search keyword to generate a new search keyword (105), and the synonym dictionary (19). ) Is used to generate a new search keyword by expanding synonyms that have different readings but have the same meaning with respect to the search keyword generated by dividing the compound word (106). Using the word dictionary (21), a step (107) of expanding a different notation word that is originally the same word but different in notation with respect to the generated search keyword to generate a new search keyword. In addition, the generated search keyword is registered in the reference database together with the reference data, and when the reference data is searched, the search keyword input by the searcher is used to An information retrieval method characterized in that it is configured to retrieve target literature data.
【請求項2】 前記上位語辞書(18)、同義語辞書
(19)、複合語辞書(20)、及び異表記語辞書(2
1)は、検索用キーワードとして有用なものだけが登録
されていることを特徴とする請求項1記載の情報検索方
法。
2. The superordinate word dictionary (18), the synonym dictionary (19), the compound word dictionary (20), and the different notation word dictionary (2).
The information retrieval method according to claim 1, wherein in 1), only useful keywords are registered as retrieval keywords.
【請求項3】 文献データの検索時に、入力された検索
用キーワードにより文献データを検索した結果、検索用
キーワードに該当する文献データの件数が所定値以上で
あるかどうかを判断するステップ(203)と、 上記判断の結果、検索用キーワードに該当する文献デー
タの件数が基準値以上である場合には、下位語展開によ
り下位概念の検索用キーワードの候補を生成し、上記検
索用キーワードの候補を検索者に提示して、検索者に検
索用キーワードを選択させるステップ(204、20
5)を有することを特徴とする請求項1記載の情報検索
方法。
3. A step (203) of determining whether or not the number of document data corresponding to the search keyword is equal to or more than a predetermined value as a result of searching the document data by the input search keyword when searching the document data. And, as a result of the above judgment, when the number of document data corresponding to the search keyword is equal to or more than the reference value, the search keyword candidates of the subordinate concept are generated by the expansion of the subordinate words, and the search keyword candidates are selected. Presenting to the searcher and allowing the searcher to select a search keyword (204, 20)
The information retrieval method according to claim 1, further comprising 5).
【請求項4】 文献データの検索時に検索者により入力
された自然語の質問文を、前記形態素辞書(15)によ
り単語に分割し、前記不要語辞書(16)により不要な
単語を辞去して検索用キーワードとして有用な単語のみ
を残して、検索用キーワードの候補とするステップ(3
02、303、304)と、 検索者に、上記検索用キーワードの候補を提示して確認
させ、必要に応じて検索用キーワードを変更させて検索
用キーワードを決定するステップ(305)とを有し、 上記決定された検索用キーワードを用いて文献データを
検索することを特徴とする請求項1記載の情報検索方
法。
4. A natural language question sentence input by a searcher when searching document data is divided into words by the morpheme dictionary (15), and unnecessary words are removed by the unnecessary word dictionary (16). Retaining only words that are useful as search keywords and making them candidates for search keywords (3
02, 303, 304) and a step (305) of presenting the search keyword candidate to the searcher for confirmation and changing the search keyword as necessary to determine the search keyword. The information retrieval method according to claim 1, wherein the document data is retrieved using the determined retrieval keyword.
JP5101348A 1993-04-27 1993-04-27 Information retrieving method Pending JPH06309362A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5101348A JPH06309362A (en) 1993-04-27 1993-04-27 Information retrieving method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5101348A JPH06309362A (en) 1993-04-27 1993-04-27 Information retrieving method

Publications (1)

Publication Number Publication Date
JPH06309362A true JPH06309362A (en) 1994-11-04

Family

ID=14298336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5101348A Pending JPH06309362A (en) 1993-04-27 1993-04-27 Information retrieving method

Country Status (1)

Country Link
JP (1) JPH06309362A (en)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152778A (en) * 1993-11-29 1995-06-16 Sanyo Electric Co Ltd Document retrieval device
JPH08137897A (en) * 1994-11-08 1996-05-31 Fujitsu Ltd Device and method for retrieving sound corresponding to scene
JPH08263516A (en) * 1995-03-28 1996-10-11 Canon Inc Method and device for information retrieval
JPH09212185A (en) * 1996-02-06 1997-08-15 Brother Ind Ltd Karaoke device
JPH1074207A (en) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk Information retrieval device and information retrieval method
JPH1153384A (en) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp Device and method for keyword extraction and computer readable storage medium storing keyword extraction program
JPH11194942A (en) * 1997-10-31 1999-07-21 Ricoh Co Ltd Information retrieval system for fusing diagnosis expert system and external information
WO2001013269A1 (en) * 1999-08-11 2001-02-22 Recruit Co., Ltd. Keyword inferring device and keyword inferring method
JP2001060199A (en) * 1999-08-20 2001-03-06 Toshiba Corp Device and method for classifying document and computer readable recording medium storing document classfication program
JP2001249931A (en) * 2000-03-03 2001-09-14 Nippon Telegr & Teleph Corp <Ntt> Request confirmation type information provision method and device
JP2002014983A (en) * 2000-06-28 2002-01-18 Dainippon Printing Co Ltd Document server, document processing system and recording medium
JP2003030282A (en) * 2001-07-19 2003-01-31 Nec Corp System and method for managing quality information
JP2003085203A (en) * 2001-09-14 2003-03-20 Canon Inc Information retrieving device and method, and storage medium
JP2003308324A (en) * 2002-04-12 2003-10-31 Yomiuri Shimbun Search word processor, and device for retrieving document
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2008276737A (en) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd Method and system for providing access to information of user's potential interest
US7467132B2 (en) 2003-05-14 2008-12-16 International Business Machines Corporation Search supporting apparatus, and method utilizing exclusion keywords
JP2009026233A (en) * 2007-07-23 2009-02-05 Design Exchange Co Ltd System, method and program for automatically creating search keyword
JP2009193600A (en) * 2009-06-01 2009-08-27 Canon Inc Information processor, information processing method, and program
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
JP2011076364A (en) * 2009-09-30 2011-04-14 Oki Electric Industry Co Ltd Device and method of adjusting search result
JP2015511746A (en) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary Interactive information retrieval system and method
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US11640432B2 (en) 2019-06-11 2023-05-02 Fanuc Corporation Document retrieval apparatus and document retrieval method

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method
JPS6325774A (en) * 1986-07-18 1988-02-03 Matsushita Electric Ind Co Ltd Information registering/retrieving device
JPS6446831A (en) * 1987-08-17 1989-02-21 Nippon Telegraph & Telephone Automatic key word extracting device
JPH02189680A (en) * 1989-01-18 1990-07-25 Nec Corp Information retrieving system
JPH03116375A (en) * 1989-09-29 1991-05-17 Ricoh Co Ltd Information retriever
JPH0528199A (en) * 1991-07-18 1993-02-05 Canon Inc Document retrieval device
JPH0528190A (en) * 1991-07-19 1993-02-05 Hitachi Ltd Information retrieval terminal equipment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method
JPS6325774A (en) * 1986-07-18 1988-02-03 Matsushita Electric Ind Co Ltd Information registering/retrieving device
JPS6446831A (en) * 1987-08-17 1989-02-21 Nippon Telegraph & Telephone Automatic key word extracting device
JPH02189680A (en) * 1989-01-18 1990-07-25 Nec Corp Information retrieving system
JPH03116375A (en) * 1989-09-29 1991-05-17 Ricoh Co Ltd Information retriever
JPH0528199A (en) * 1991-07-18 1993-02-05 Canon Inc Document retrieval device
JPH0528190A (en) * 1991-07-19 1993-02-05 Hitachi Ltd Information retrieval terminal equipment

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152778A (en) * 1993-11-29 1995-06-16 Sanyo Electric Co Ltd Document retrieval device
JPH08137897A (en) * 1994-11-08 1996-05-31 Fujitsu Ltd Device and method for retrieving sound corresponding to scene
JPH08263516A (en) * 1995-03-28 1996-10-11 Canon Inc Method and device for information retrieval
JPH09212185A (en) * 1996-02-06 1997-08-15 Brother Ind Ltd Karaoke device
JPH1074207A (en) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk Information retrieval device and information retrieval method
JPH1153384A (en) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp Device and method for keyword extraction and computer readable storage medium storing keyword extraction program
JPH11194942A (en) * 1997-10-31 1999-07-21 Ricoh Co Ltd Information retrieval system for fusing diagnosis expert system and external information
WO2001013269A1 (en) * 1999-08-11 2001-02-22 Recruit Co., Ltd. Keyword inferring device and keyword inferring method
JP2001060199A (en) * 1999-08-20 2001-03-06 Toshiba Corp Device and method for classifying document and computer readable recording medium storing document classfication program
JP2001249931A (en) * 2000-03-03 2001-09-14 Nippon Telegr & Teleph Corp <Ntt> Request confirmation type information provision method and device
JP2002014983A (en) * 2000-06-28 2002-01-18 Dainippon Printing Co Ltd Document server, document processing system and recording medium
JP2003030282A (en) * 2001-07-19 2003-01-31 Nec Corp System and method for managing quality information
JP2003085203A (en) * 2001-09-14 2003-03-20 Canon Inc Information retrieving device and method, and storage medium
JP2003308324A (en) * 2002-04-12 2003-10-31 Yomiuri Shimbun Search word processor, and device for retrieving document
US8489602B2 (en) 2003-05-14 2013-07-16 International Business Machines Corporation Systems and methods for determining exclusion efficiencies of a plurality of keywords appearing in a search result
US7467132B2 (en) 2003-05-14 2008-12-16 International Business Machines Corporation Search supporting apparatus, and method utilizing exclusion keywords
US8375027B2 (en) 2003-05-14 2013-02-12 International Business Machines Corporation Search supporting apparatus and method utilizing exclusion keywords
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2008276737A (en) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd Method and system for providing access to information of user's potential interest
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
JP2009026233A (en) * 2007-07-23 2009-02-05 Design Exchange Co Ltd System, method and program for automatically creating search keyword
JP2009193600A (en) * 2009-06-01 2009-08-27 Canon Inc Information processor, information processing method, and program
JP2011076364A (en) * 2009-09-30 2011-04-14 Oki Electric Industry Co Ltd Device and method of adjusting search result
JP2015511746A (en) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary Interactive information retrieval system and method
US11640432B2 (en) 2019-06-11 2023-05-02 Fanuc Corporation Document retrieval apparatus and document retrieval method

Similar Documents

Publication Publication Date Title
JPH06309362A (en) Information retrieving method
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP3820242B2 (en) Question answer type document search system and question answer type document search program
US6602300B2 (en) Apparatus and method for retrieving data from a document database
JPH0418673A (en) Method and device for extracting text information
KR20040077918A (en) Retrieving matching documents by queries in any national language
EP1342177A1 (en) Method for structuring and searching information
WO2016020757A1 (en) Method and system to associate meaningful expressions with abbreviated names
US6505198B2 (en) Sort system for text retrieval
US20050065920A1 (en) System and method for similarity searching based on synonym groups
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JP4091146B2 (en) Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP3178421B2 (en) Text search device and computer-readable recording medium storing text search program
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JP4888677B2 (en) Document search system
JPH0581326A (en) Data base retrieving device
JP2008210229A (en) Device, method and program for retrieving intellectual property information
JP2010009237A (en) Multi-language similar document retrieval device, method and program, and computer-readable recording medium
US20020065794A1 (en) Phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
JP2003345824A (en) Device, method, and program for document retrieval
JP2002073656A (en) Method and device for normalizing and developing different notation, method and device for retrieving document by using the method, and program recording medium
JPH04237371A (en) Check item data base retrieving system
KR20190084370A (en) A Intelligent Method for Searching Legal Information
JPH0728845A (en) Document retrieval device and method therefor
JP2831837B2 (en) Document search device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021126