JPH04123264A - Device for preparing relational word table and device for retrieving document - Google Patents

Device for preparing relational word table and device for retrieving document

Info

Publication number
JPH04123264A
JPH04123264A JP2245126A JP24512690A JPH04123264A JP H04123264 A JPH04123264 A JP H04123264A JP 2245126 A JP2245126 A JP 2245126A JP 24512690 A JP24512690 A JP 24512690A JP H04123264 A JPH04123264 A JP H04123264A
Authority
JP
Japan
Prior art keywords
related word
storage device
word
data
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2245126A
Other languages
Japanese (ja)
Inventor
Junichi Matsuda
純一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2245126A priority Critical patent/JPH04123264A/en
Publication of JPH04123264A publication Critical patent/JPH04123264A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To efficiently collect relational word data by preparing a means for forming/updating the contents of a relational word table stored in a storage device based upon relational word data extracted from a meaning expression table. CONSTITUTION:Respective sentences of a document inputted by an input device 1 are successively analyzed to obtain meaning expression. The obtained meaning expression is registered as a meaning expression table, respective relational word extraction rules are successively inputted and whether structure coincident with the structure of the condition part of each rule exists in the meaning expression or not is checked. When a coincident part exists, whether key words of an operation part in a relational word extraction rule table have been already registered in the key words 91 of the relational word table or not is checked. When the key words have been registered, no operation is executed, but in the case of no registration, relational word data 92 are added to the relational word table and the processing is repeated until the processing of all read sentences is ended. Thus, relational word extraction appropriate for each user can be efficiently executed.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、キーワード又はキーフレーズの関連語テーブ
ル作成装置ならびにキーワード又はキーフレーズ等を用
いた文書検索装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a device for creating a related word table for keywords or key phrases, and a document search device using keywords, key phrases, or the like.

[従来の技術] 従来より、同義語や上位概念語、同−分野語などの関連
語を用いて文書検索精度や文書解析精度を向上させる試
みがなされている。
[Prior Art] Conventionally, attempts have been made to improve document retrieval accuracy and document analysis accuracy using related words such as synonyms, generic terms, and same-field words.

しかしながら、特開平2−41565にみられるように
、関連語データを保守するためのツールはあっても、関
連語データの内容自体の収集は人手により行なうのが一
般的であった。
However, as seen in Japanese Patent Application Laid-Open No. 2-41565, even though there are tools for maintaining related word data, the content of the related word data itself has generally been collected manually.

また、情報処理学会第34口金国大会lX−6に見られ
るように、市販の辞書の語義文がらシソーラスを自動的
に構築する方法が提案されているが、シソーラスが汎用
的なものであって、特定の分野に応じて関連語データを
作ったり、ユーザに応じて関連語を定義することができ
なかった。
Furthermore, as seen in the Information Processing Society of Japan's 34th National Conference IX-6, a method has been proposed for automatically constructing a thesaurus from the meanings and sentences of commercially available dictionaries, but the thesaurus is a general-purpose one. , it was not possible to create related word data according to a specific field or define related words according to the user.

[発明が解決しようとする課題] 関連語データを全て人手で入力する方法では効率が悪く
、充分なデータを集めることが困難である。また、関連
語データは、利用者が利用分野、利用目的によって異な
ることがあり、汎用的なデ−夕を作ることによる効果を
大きくない。
[Problems to be Solved by the Invention] The method of manually inputting all related word data is inefficient and difficult to collect sufficient data. Furthermore, the related word data may differ depending on the user's field of use and purpose of use, so the effect of creating a general-purpose data is not great.

本発明の目的は、関連語データを文書中から自動的に抜
き出し、関連語データの収集を効率化すること並びに文
書検索中においても、検索文書中から関連語データを自
動的に抜き出し、関連語データの収集を出来るようにし
たことにある。
The purpose of the present invention is to automatically extract related word data from a document and improve the efficiency of related word data collection. The purpose is to make it possible to collect data.

[課題を解決するための手段] 上記目的を達成するために、文書中の並列構造や特定語
句を含む構文などの構文情報から、関連する単語を拾い
だし、関連語テーブルに登録する手段を設けており、ま
た、上記目的を達成するために、関連語抽出ルールを登
録する手段を設けている。さらに、文書検索装置に上記
関連語テーブルに登録する手段を組合せ設けている。
[Means for solving the problem] In order to achieve the above purpose, a means is provided to pick up related words from syntactic information such as parallel structure in a document or syntax including specific words and phrases, and register them in a related word table. Furthermore, in order to achieve the above purpose, a means for registering related word extraction rules is provided. Furthermore, the document search device is combined with means for registering in the related word table.

[作用コ 文書の構文解析結果からあらかじめ決められた特定の構
文があるかどうかを探し、関連語となる単語を特定し、
関連語テーブルに登録する。文解析処理技術を用いるこ
とにより、特定の構文を、ユーザが自然言語文で指定す
ることもできる。また、文書検索中においても、検索文
書中から関連語データを自動的に抜き出し、関連語デー
タの収集をする。
[Look for a specific predetermined syntax from the syntactic analysis results of the action document, identify related words,
Register in the related word table. By using sentence analysis processing technology, a user can also specify a specific syntax using a natural language sentence. Furthermore, even during document searching, related word data is automatically extracted from the searched document and related word data is collected.

[実施例] 以下、本発明を、日本語文書に適用した例を図面を用い
て詳細に説明する。
[Example] Hereinafter, an example in which the present invention is applied to a Japanese document will be described in detail with reference to the drawings.

第1図は、関連語テーブル作成処理のフローチャート図
である。
FIG. 1 is a flowchart of related word table creation processing.

第2図は、関連語テーブル作成装置の構成図である。l
は入力装置であり、関連語抽出対象の文書を読み込む処
理を行なう。2は、中央処理装置であり、関連語を抽出
し、関連語テーブルの作成処理を行なう。3は出力装置
であり、必要があれば処理結果を出力する。4は各種テ
ーブルを蓄える記憶装置である。
FIG. 2 is a block diagram of the related word table creation device. l
is an input device, which performs a process of reading a document from which related words are to be extracted. 2 is a central processing unit that extracts related words and creates a related word table. 3 is an output device, which outputs the processing results if necessary. 4 is a storage device that stores various tables.

第3図は、意味表現の例である。意味表現は、ノードと
アークからなる有向グラフで表される。
FIG. 3 is an example of a meaning expression. A semantic expression is represented by a directed graph consisting of nodes and arcs.

第4図は、第3図の意味表現を記憶している複数のレコ
ードからなる意味表現テーブルの例である。レコードは
、ノード番号41、単語42、子ノード番号43関係子
44から構成される。
FIG. 4 is an example of a semantic expression table consisting of a plurality of records storing the semantic expressions shown in FIG. A record is composed of a node number 41, a word 42, a child node number 43, and a relation 44.

第5図は、関連語データを記憶している関連語テーブル
の例(既に作成されたもの)であり複数のレコードから
成っている。レコードは、キー単語51.関連語52、
出現頻度53から構成されている。
FIG. 5 is an example of a related word table (already created) that stores related word data, and is made up of a plurality of records. The record contains key words 51. Related words 52,
It is composed of appearance frequency 53.

第6図は、第5図の関連語テーブルが更新された関連語
テーブルである。
FIG. 6 is a related word table that is an updated version of the related word table shown in FIG.

次に、第1図に示したフローチャート図に従って、本発
明の関連語テーブルの作成処理を説明する。まず、文書
を入力装置から読み込む(100)。読み込んだ各文を
順に解析しく101) 、意味表現を得る。なお、この
ことは既に公知の事項であるので説明を省略する。意味
表現は、概念を表すノードと関係を意味する関係子とか
らなる有向グラフを用いる。得られた意味表現を意味表
現テーブルとして登録する(102)。意味表現から、
並列を意味する関係子を検索しく103)、並列になっ
ている語すべてを取り出す(104)。各並列語に対し
て、その語がすでに第5図の関連語テーブルのキー単語
欄51に登録されているか否かを調べる(105)。登
録されていなければ、該並列語をキー単語とするレコー
ドを関連語テーブルに追加する(106)。登録されて
いれば何もしない。次に、該並列語に対して同列にある
他の並列要素が関連語テーブルの関連語槽52に登録さ
れているかを調べる(107)。登録されていれば何も
しないが、登録されていなければ、並列要素を関連語テ
ーブルの関連語槽に登録する(108)。さらに、関連
語テーブルの関連語の出現頻度欄53の値に1を加える
(109)。105から1.09までの処理を、すべて
の並列語に対して行なう(110)。すべての並列語に
対して処理を終えたら、読み込んだ全ての文に対して1
01から110までの処理を終えたかどうかを確認し、
読み込んだ全ての文に対して処理を終えるまで101か
ら110までの処理を繰り返す(111)。
Next, the related word table creation process of the present invention will be explained according to the flowchart shown in FIG. First, a document is read from an input device (100). Each read sentence is analyzed in turn (101) to obtain a semantic representation. Note that since this is already a known matter, the explanation will be omitted. For semantic representation, a directed graph consisting of nodes representing concepts and relations representing relationships is used. The obtained semantic expression is registered as a semantic expression table (102). From the meaning expression,
A search is made for a relation that means parallel (103), and all words that are parallel are extracted (104). For each parallel word, it is checked whether the word has already been registered in the key word field 51 of the related word table shown in FIG. 5 (105). If it is not registered, a record having the parallel word as a key word is added to the related word table (106). If it is registered, do nothing. Next, it is checked whether other parallel elements in the same row as the parallel word are registered in the related word tank 52 of the related word table (107). If it is registered, nothing is done, but if it is not registered, the parallel element is registered in the related word tank of the related word table (108). Furthermore, 1 is added to the value in the related word appearance frequency column 53 of the related word table (109). The processing from 105 to 1.09 is performed for all parallel words (110). After processing all parallel words, 1 for all sentences read.
Check whether processing from 01 to 110 has been completed,
The processes from 101 to 110 are repeated until all the sentences read have been processed (111).

実例として、[検索、転記、集計、解析などの操作が簡
単に行える。Jという文を読み込む場合を考える。文書
読み込み前の関連語テーブルの状態は、第5図に示すと
おりである。また、この文の解析結果は、第3図に示す
とおりである。この中から関係子「並列」で結ばれた並
列要素「検索、転記、集計、解析」を取り出す。第5図
の関連語テーブルに示されているように「検索」に対し
ては、既にレコードが存在しているので「転記J、[集
計」、「解析」のうち、「検索」の関連語として登録さ
れていない1転記」、「集計」をキー単語欄41に追加
する。「転記」、「集計」、「解析」に対しては、関連
語テーブルにレコードが存在しないのでレコードを追加
し、各々3単語を関連語欄52に記述する。また、全て
の関連語の8現頻度に1を加える。処理路T後の関連語
テーブルは第6図に示すようになる。
As an example, [Operations such as search, transcription, aggregation, and analysis can be performed easily. Consider the case of reading the sentence J. The state of the related word table before the document is read is as shown in FIG. Moreover, the analysis result of this sentence is as shown in FIG. From this, the parallel elements ``search, transcription, aggregation, analysis'' connected by the relation ``parallel'' are extracted. As shown in the related word table in Figure 5, there is already a record for "Search", so the related word for "Search" among "Transfer J", "Aggregation", and "Analysis" ``1 posting not registered as `` and ``totalization'' are added to the key word column 41. Since there are no records for "transcription,""aggregation," and "analysis," records are added to the related word table, and three words for each are written in the related word column 52. In addition, 1 is added to the 8-current frequency of all related words. The related word table after the processing path T is as shown in FIG.

関連語を抽出する際には、並列要素を用いる処理のほか
に、特定の単語を含む特定構文を参照する処理が考えら
れる。
When extracting related words, in addition to processing using parallel elements, processing that refers to specific syntax that includes specific words can be considered.

第8図は、関連語抽出ルールのテーブルの内容を表した
ものであり、複数のレコードからなっている。関連語抽
出ルールのテーブルは、条件部と操作部とから構成され
る。さららに、条件部はノード番号81、単語82、子
ノード番号83、関係子84から構成される。また、操
作部は、キー単語85、関連語86、関連種別87 (
同義、L位、同一分野なとの種別かある)から構成され
る、この関連語抽出ルールのテーブルは複数用意されて
いる。
FIG. 8 shows the contents of a table of related word extraction rules, which consists of a plurality of records. The table of related word extraction rules is composed of a condition part and an operation part. Furthermore, the condition part is composed of a node number 81, a word 82, a child node number 83, and a relation 84. The operation unit also includes key words 85, related words 86, and related types 87 (
A plurality of tables are prepared for this related word extraction rule, which are composed of synonyms, L rank, and same field).

第9図は、関連語データを記憶する第5、第6図の関連
語テーブルとは異なる形式の関連語テーブルであり、複
数のレコードからなる。レコードは、キー単語91.関
連語92、関連種別93からなる。
FIG. 9 is a related word table of a different format from the related word tables of FIGS. 5 and 6 that store related word data, and is composed of a plurality of records. The record contains key word 91. It consists of related words 92 and related types 93.

この処理を、第7図に示すフローチャートに従って説明
する。まず、文章を入力装置から読み込む(700)。
This process will be explained according to the flowchart shown in FIG. First, a text is read from an input device (700).

読み込んた各文を順に解析しく701)、意味表現を得
る。得られた意味表現を意味表現デープルとして登録す
る(702)。関連語抽出ルールを順番に読み込み(7
03)、その条件部の構造と一致する構造が意味表現中
にあるかどうかを調べる(704)。一致する部分があ
れば、関連語抽出ルールのテーブル内の操作部のキー単
語がすでに第9図の関連語テーブルのキー単語91に登
録されているか否かを調べる(705)。登録されてい
なければ、操作部のキー単語をキー単語とするレコード
を関連語テーブルに追加する(706)。登録されてい
れば何もしない。
Each read sentence is analyzed in turn (701) to obtain a semantic representation. The obtained semantic expression is registered as a semantic expression table (702). Load related word extraction rules in order (7
03), it is checked whether there is a structure in the semantic expression that matches the structure of the conditional part (704). If there is a matching part, it is checked whether the key word of the operation unit in the table of related word extraction rules has already been registered in the key word 91 of the related word table of FIG. 9 (705). If not registered, a record having the key word of the operation unit as a key word is added to the related word table (706). If it is registered, do nothing.

次に、関連語抽出ルールのテーブル内の操作部に示され
た関連語データの内容が第9図の関連語テーブルにすで
に登録済みであるかどうかを調べる(707)。登録さ
れていれば何もしないが、登録されていなければ、関連
語テーブルに、関連語データ92を追加する(708)
。さらに、読み込んだ全ての文に対してこれまでの処理
を終えたかどうかを確認し、読み込んだ全ての文に対し
て処理を終えるまで処理を繰り返す(709)。
Next, it is checked whether the contents of the related word data shown in the operation section in the table of related word extraction rules have already been registered in the related word table of FIG. 9 (707). If it is registered, nothing is done, but if it is not registered, the related word data 92 is added to the related word table (708).
. Furthermore, it is checked whether the processing up to now has been completed for all the sentences read, and the processing is repeated until the processing is finished for all the sentences read (709).

上記、関連語抽出ルールは、人手により登録することも
可能である。
The related word extraction rules described above can also be registered manually.

第11図は、ルール入力画面の例である。画面には、条
件部入力フィールドと操作部人力フィールドがある。操
作部入力フィールドは、さらにキー単語入力フィールド
、関連詰入カフイールド、関連種別入力フィールドから
なる。第12図は、人力されたルールを記憶するレコー
ドの例である。
FIG. 11 is an example of a rule input screen. The screen has a condition section input field and an operation section manual field. The operation unit input field further includes a key word input field, a related field, and a related type input field. FIG. 12 is an example of a record that stores manually-written rules.

レコードは、条件部1201と操作部キー単語1202
、操作部関連語1203、操作部関連種別1204から
成る。
The record includes a condition part 1201 and an operation part key word 1202
, an operation unit related term 1203, and an operation unit related type 1204.

登録処理を第10図に示すフローチャー1・に従って説
明する。まず、人手により関連語抽出ルールの内容を入
力する。条件部にあたる部分のもとになる句または文は
自然言語で入力する。操作部にあたる部分は、キー単語
と関連語を字面で入力し、関係種別は番号を入力する(
1001)。入力された条件部の句または文を構文解析
しく1002)、構文解析結果を関連語抽出ルールのテ
ーブル内の条件部に書き込む(1003)。入力された
操作部は、そのまま関連語抽出ルールの操作部に書き込
む(1004)。
The registration process will be explained according to flowchart 1 shown in FIG. First, the content of the related word extraction rule is input manually. The phrase or sentence that forms the basis of the conditional part is input in natural language. In the operation section, enter the key word and related words in text, and enter the number for the related type (
1001). The input phrase or sentence in the conditional part is parsed (1002), and the result of the parsing is written in the conditional part in the related word extraction rule table (1003). The input operation section is written as is into the operation section of the related word extraction rule (1004).

例えば、「A2を含むA1の構造」なる句の構文解析結
果が条件部に入力されると、操作部は、キー単語がA1
、関連語がA2、関連種別が[上位Jと指定される。ル
ールを読み込んだ結果は、第8図に示す状態と同じであ
る。
For example, when the syntactic analysis result of the phrase "Structure of A1 including A2" is input to the conditional part, the operation part determines that the key word is A1.
, the related word is A2, and the related type is specified as [Top J]. The result of reading the rules is the same as the state shown in FIG.

上で述べた関連語抽出処理を、文書検索システムと組合
せることにより、精度の高い検索が可能である。
By combining the related word extraction process described above with a document search system, highly accurate searches are possible.

第14図は、単語分解結果を記憶する単語分解結果テー
ブルの例であり、複数のレコードからなる。レコードは
単語欄1401からなる。第15図は、検索キーの関連
語を記憶する検索キー関連語テーブルの例であり、複数
のレコードからなる。
FIG. 14 is an example of a word decomposition result table that stores word decomposition results, and is composed of a plurality of records. The record consists of a word column 1401. FIG. 15 is an example of a search key related word table that stores search key related words, and is made up of a plurality of records.

レコードは関連語槽1501からなる。The record consists of a related word tank 1501.

検索処理を第13図に示すフローチャートに従って説明
する。まず、ユーザが検索キーを入力装置より入力する
(1301)。検索キーは複合語でもよい。入力された
キーを単語に分割しく1302)、分割結果を単語分解
結果テーブルの単語欄1401に順に登録する。分割さ
れた各単語について、この単語をキーとするレコードが
あるかどうか関連語テーブルを検索する(1303)。
The search process will be explained according to the flowchart shown in FIG. First, a user inputs a search key from an input device (1301). The search key may be a compound word. The input key is divided into words (1302), and the division results are sequentially registered in the word column 1401 of the word decomposition result table. For each divided word, the related word table is searched to see if there is a record with this word as a key (1303).

レコードがあれば、関連語槽にある単語を読み込み(1
304)、検索キーの該単語を関連語に変えたものを検
索キーの関連語を記憶する検索キー関連語テーブルの関
連語槽1501に順に登録する(1305)。次に、検
索対象文書を一つずつ読み込み(1306)、キー単語
および関連語槽1501にある単語が存在するかどうか
検査する(1307)。存在すればその文書を出力する
(1.308)。さらに、第1図で述べた処理と全く同
様にして、検索対象文書から関連語データを抽出し、関
連語テーブルを更新する(1309)。
If there is a record, read the word in the related word tank (1
304), the word of the search key is changed into a related word and is sequentially registered in the related word tank 1501 of the search key related word table that stores the related words of the search key (1305). Next, the documents to be searched are read one by one (1306), and it is checked whether the words in the key word and related word tank 1501 exist (1307). If the document exists, the document is output (1.308). Furthermore, in exactly the same way as the process described in FIG. 1, related word data is extracted from the search target document and the related word table is updated (1309).

これにより、次回の文書検索時には、更新された関連語
テーブルを利用することができ、より精度の高い文書検
索ができる。以上の処理をすべての文書について繰り返
す(1310)。
As a result, the updated related word table can be used the next time a document is searched, and a more accurate document search can be performed. The above process is repeated for all documents (1310).

例えば、検索キーとして「データ検索」を入力した場合
、第6図に示す関連語テーブルを用いると、「データ転
記」、「データ集計」、「データ解析」を関連語として
認識し、これらの単語を含む文書を全て取りだすことが
できる。
For example, when you enter "data search" as a search key, using the related word table shown in Figure 6, "data transcription", "data aggregation", and "data analysis" are recognized as related words, and these words are You can retrieve all documents containing .

[発明の効果] 本発明によれば、自然言語文から、関連語データを自動
的に抽出することができる。また、ユーザによる句、文
などの入力に基づき関連語抽出ルールのテーブルを自動
的に作成し、この作成されたテーブルを用いることによ
り、ユーザに適した関連語抽出を効率よく行うことがで
きる。
[Effects of the Invention] According to the present invention, related word data can be automatically extracted from natural language sentences. Furthermore, by automatically creating a table of related word extraction rules based on the user's input of phrases, sentences, etc., and using this created table, related word extraction suitable for the user can be efficiently performed.

また、この関連語抽出処理を文書検索システムと結合す
ることにより精度の高い検索が可能となる。
Furthermore, by combining this related word extraction process with a document search system, highly accurate searches become possible.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明に係る関連語テーブル作成処理の1実
施例を示すフローチャート、第2図は本発明装置の基本
的構成を示す構成図、第3図は意味表現の例を示す図、
第4図は意味表現を記憶している意味表現テーブルの例
、第5図、第6図は関連語データを記憶する関連語テー
ブルの例、第7図は本発明に係る関連語テーブル作成処
理の他の実施例を示すフローチャート、第8図は関連語
抽出ルールのテーブルの例、第9図は関連語データを記
憶する関連語テーブルの例、第10図は本発明に係る関
連語抽出ルールのテーブルの作成処理の実施例を示すフ
ローチャート、第11図は関連語抽出ルール入力画面、
第12図は関連語抽出ルールの入力レコードの例である
。第13図は本発明に係る検索処理の実施例を示すフロ
ーチャート、第14図は単語分割結果テーブルの例、第
15図は検索キー関連語テーブルの例である。 1・・・・・・入力装置、2・・・・・・処理装置、3
・・・・・・出力装置、4・・・・・・記憶装置 特許出願人 株式会社 日立製作所
FIG. 1 is a flowchart showing one embodiment of related word table creation processing according to the present invention, FIG. 2 is a block diagram showing the basic configuration of the device of the present invention, and FIG. 3 is a diagram showing an example of semantic expression.
FIG. 4 is an example of a semantic expression table that stores semantic expressions, FIGS. 5 and 6 are examples of related word tables that store related word data, and FIG. 7 is a related word table creation process according to the present invention. FIG. 8 is an example of a related word extraction rule table, FIG. 9 is an example of a related word table that stores related word data, and FIG. 10 is a related word extraction rule according to the present invention. A flowchart showing an example of table creation processing, FIG. 11 is a related word extraction rule input screen,
FIG. 12 is an example of an input record for related word extraction rules. FIG. 13 is a flowchart showing an embodiment of search processing according to the present invention, FIG. 14 is an example of a word division result table, and FIG. 15 is an example of a search key related word table. 1...Input device, 2...Processing device, 3
...Output device, 4...Storage device Patent applicant Hitachi, Ltd.

Claims (1)

【特許請求の範囲】 1、自然言語文から関連語データを抽出して関連語テー
ブルを作成する装置であって、入力装置、処理装置、記
憶装置及び出力装置を備え、前記処理装置は、前記入力
装置から入力された自然言語文を解析して意味表現を得
て前記記憶装置上に意味表現テーブルを作成する手段と
、該意味表現テーブルから関連語データを抽出し、該抽
出した関連語データにより前記記憶装置上の関連語テー
ブルの内容を作成、更新する関連語テーブル作成、更新
手段とからなることを特徴とする関連語テーブル作成装
置。 2、前記関連語テーブル作成、更新手段は自然言語文の
並列構文中の各並列要素同士を関連語データとして抽出
することを特徴とする特許請求の範囲第1項記載の関連
語テーブル作成装置。 3、前記関連語テーブル作成、更新手段は自然言語文か
ら抽出した関連語データと他の自然言語文から抽出した
関連語データが共通の単語を含む場合に二つの関連語デ
ータの和集合を関連語テーブルに登録することを特徴と
する特許請求の範囲第1項記載の関連語テーブル作成装
置。 4、上記関連語テーブルは複数のレコードからなり、各
レコードはキー単語、関連語データ及び出現頻度からな
ることを特徴とする特許請求の範囲第1項記載の関連語
テーブル作成装置。 5、自然言語文から関連語データを抽出して関連語テー
ブルを作成する装置であって、入力装置、処理装置、記
憶装置及び出力装置を備え、前記処理装置は、前記入力
装置から入力された自然言語文を解析して意味表現を得
て前記記憶装置上に意味表現テーブルを作成する手段と
、前記記憶装置に記憶されている関連語抽出ルールのテ
ーブル内の条件部に登録されている構造が前記意味表現
中に存在するか否かを検査し、存在するとき前記関連語
抽出ルールのテーブル内の操作部に登録されているキー
単語と関連語データを抽出し、該抽出したキー単語と関
連語データにより前記記憶装置上の関連語テーブルの内
容を作成、更新する関連語テーブル作成、更新手段とか
らなることを特徴とする関連語テーブル作成装置。 6、前記記憶装置には、前記関連語抽出ルールのテーブ
ルが複数個事前に登録されている特許請求の範囲第4項
記載の関連語テーブル作成装置。 7、前記関連語テーブル作成、更新手段は、前記抽出さ
れたキー単語が前記関連語テーブルに登録されていない
とき、該キー単語をキー単語とするレコードを関連語テ
ーブルに追加登録することを特徴とする特許請求の範囲
第4項記載の関連語テーブル作成装置。 8、前記関連語テーブル作成、更新手段は、前記抽出さ
れた関連語データが前記関連語テーブルに登録されてい
ないとき、該関連語データを前記関連語テーブルに追加
登録することを特徴とする特許請求の範囲第4項記載の
関連語テーブル作成装置。 9、自然言語文から条件部及び操作部からなる関連語抽
出ルールのテーブルを作成する装置であって、入力装置
、処理装置、記憶装置及び出力装置を備え、前記処理装
置は、前記入力装置から入力された自然言語文を解析し
て意味表現を得て、該意味表現を前記記憶装置上の前記
テーブルの条件部に書き込むと共に前記入力装置から入
力された操作部のデータを前記テーブルの操作部に書き
込む手段を備えることを特徴とする関連語抽出ルールの
テーブル作成装置。 10、入力キーワードに関連する文書を検索する文書検
索装置であって、入力装置、処理装置、記憶装置及び出
力装置を備え、前記処理装置は、前記入力キーワードに
より前記記憶装置上の関連語テーブルを検索して検索結
果を前記記憶装置上に検索キー関連語テーブルとして登
録する手段と、検索対象文書を順次読み込み、該文書中
に前記入力キーワードまたは検索キー関連語テーブル上
の関連語データが存在するか否かを検査して存在すると
きその文書を出力する手段と、前記順次読み込まれた検
索対象文書を解析して意味表現を得て前記記憶装置上に
意味表現テーブルを作成する手段と、該意味表現テーブ
ルから関連語データを抽出し、該抽出した関連語データ
により前記記憶装置上の関連語テーブルの内容を作成、
更新する関連語テーブル作成、更新手段とからなること
を特徴とする文書検索装置。 11、前記処理装置は、前記入力キーワードが複合語の
とき該複合語を単語に分割して前記記憶装置上に検索キ
ー関連語テーブルとして登録する手段と、前記入力キー
ワード及び前記単語により前記記憶装置上の関連語テー
ブルを検索して検索結果を前記記憶装置上に検索キー関
連語テーブルとして登録する手段をそなえる特許請求の
範囲第11項記載の文書検索装置。
[Scope of Claims] 1. A device for extracting related word data from a natural language sentence to create a related word table, comprising an input device, a processing device, a storage device, and an output device, the processing device means for analyzing a natural language sentence input from an input device to obtain a semantic expression and creating a semantic expression table on the storage device; extracting related word data from the semantic expression table; and extracting related word data from the semantic expression table; A related word table creation device comprising a related word table creation and updating means for creating and updating the contents of the related word table on the storage device. 2. The related word table creation device according to claim 1, wherein the related word table creation and updating means extracts each parallel element in a parallel syntax of a natural language sentence as related word data. 3. The related word table creation and updating means associates the union of two related word data when related word data extracted from a natural language sentence and related word data extracted from another natural language sentence contain a common word. 2. The related word table creation device according to claim 1, wherein the related word table creation device registers the related word table in a word table. 4. The related word table creation device according to claim 1, wherein the related word table is made up of a plurality of records, and each record is made up of a key word, related word data, and appearance frequency. 5. A device for extracting related word data from a natural language sentence to create a related word table, comprising an input device, a processing device, a storage device, and an output device, and the processing device receives input from the input device. means for analyzing a natural language sentence to obtain a semantic expression and creating a semantic expression table on the storage device; and a structure registered in a condition section in a table of related word extraction rules stored in the storage device. is present in the meaning expression, and if so, extracts the key word and related word data registered in the operation section of the related word extraction rule table, and extracts the key word and related word data registered in the operation section of the related word extraction rule table A related word table creation device comprising related word table creation and updating means for creating and updating the contents of the related word table on the storage device based on related word data. 6. The related word table creation device according to claim 4, wherein a plurality of tables of the related word extraction rules are registered in advance in the storage device. 7. The related word table creation and updating means is characterized in that when the extracted key word is not registered in the related word table, a record having the key word as a key word is additionally registered in the related word table. A related term table creation device according to claim 4. 8. A patent characterized in that the related word table creation and updating means additionally registers the extracted related word data in the related word table when the extracted related word data is not registered in the related word table. A related term table creation device according to claim 4. 9. A device for creating a table of related word extraction rules consisting of a condition part and an operation part from a natural language sentence, comprising an input device, a processing device, a storage device, and an output device, and the processing device is configured to extract information from the input device. The input natural language sentence is analyzed to obtain a semantic expression, and the semantic expression is written into the condition section of the table on the storage device, and the data input from the input device is transferred to the operation section of the table. 1. A table creation device for related word extraction rules, characterized in that the device includes means for writing in a related word extraction rule. 10. A document search device for searching documents related to an input keyword, comprising an input device, a processing device, a storage device, and an output device, and the processing device searches a related word table on the storage device using the input keyword. means for searching and registering the search results as a search key related word table on the storage device; and means for sequentially reading search target documents such that the input keyword or related word data on the search key related word table is present in the document. means for inspecting whether or not the document exists and outputting the document when it exists; means for analyzing the sequentially read search target documents to obtain a semantic expression and creating a semantic expression table on the storage device; extracting related word data from the meaning expression table and creating the contents of the related word table on the storage device using the extracted related word data;
A document retrieval device comprising a means for creating and updating a related word table to be updated. 11. The processing device includes means for dividing the compound word into words when the input keyword is a compound word and registering the compound word into words on the storage device as a search key related word table; 12. The document retrieval device according to claim 11, further comprising means for searching the above related word table and registering the search results as a search key related word table on the storage device.
JP2245126A 1990-09-14 1990-09-14 Device for preparing relational word table and device for retrieving document Pending JPH04123264A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2245126A JPH04123264A (en) 1990-09-14 1990-09-14 Device for preparing relational word table and device for retrieving document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2245126A JPH04123264A (en) 1990-09-14 1990-09-14 Device for preparing relational word table and device for retrieving document

Publications (1)

Publication Number Publication Date
JPH04123264A true JPH04123264A (en) 1992-04-23

Family

ID=17129013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2245126A Pending JPH04123264A (en) 1990-09-14 1990-09-14 Device for preparing relational word table and device for retrieving document

Country Status (1)

Country Link
JP (1) JPH04123264A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0773197A (en) * 1993-09-03 1995-03-17 Fujitsu Ltd Supporting system for preparing different notation word dictionary
JPH10134077A (en) * 1996-11-05 1998-05-22 Tokkyo Joho Shuppan:Kk Word processing system and storage medium
JP2006293731A (en) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0773197A (en) * 1993-09-03 1995-03-17 Fujitsu Ltd Supporting system for preparing different notation word dictionary
JPH10134077A (en) * 1996-11-05 1998-05-22 Tokkyo Joho Shuppan:Kk Word processing system and storage medium
JP2006293731A (en) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program

Similar Documents

Publication Publication Date Title
US6957213B1 (en) Method of utilizing implicit references to answer a query
CN110555153A (en) Question-answering system based on domain knowledge graph and construction method thereof
JPH0242572A (en) Preparation/maintenance method for co-occurrence relation dictionary
JP2001167087A (en) Device and method for retrieving structured document, program recording medium for structured document retrieval and index preparing method for structured document retrieval
JP2000315216A (en) Method and device for retrieving natural language
JP2005251115A (en) System and method of associative retrieval
KR100835706B1 (en) System and method for korean morphological analysis for automatic indexing
JPH0816620A (en) Data sorting device/method, data sorting tree generation device/method, derivative extraction device/method, thesaurus construction device/method, and data processing system
CN110119404B (en) Intelligent access system and method based on natural language understanding
JP3612769B2 (en) Information search apparatus and information search method
JP3565239B2 (en) Information retrieval device
JPH04123264A (en) Device for preparing relational word table and device for retrieving document
CN115617965A (en) Rapid retrieval method for language structure big data
KR100376931B1 (en) A Method of Database System Implementation for Korean-English Translation Using Information Retrieval Techniques
JP2783622B2 (en) Complex database system
JP2535629B2 (en) Input string normalization method of search system
JP2003303194A (en) Idiom dictionary producing device, retrieval index producing device, document retrieving device, and their method, program, and recording medium
JP2005284776A (en) Text mining apparatus and text analysis method
JPH0612451A (en) Illustrative sentence retrieving system
JPS61187077A (en) Japanese language analyzer
JPH09245051A (en) Device and method for retrieving natural language instance
JPH02253474A (en) Text base retrieving method
Liu The semantic vector space model (SVSM): a text representation and searching technique
Sunne SQL
JPH0540783A (en) Natural language analysis device