JPH08129554A - Relation expression extracting device and retrieval device for relation expression - Google Patents

Relation expression extracting device and retrieval device for relation expression

Info

Publication number
JPH08129554A
JPH08129554A JP7009656A JP965695A JPH08129554A JP H08129554 A JPH08129554 A JP H08129554A JP 7009656 A JP7009656 A JP 7009656A JP 965695 A JP965695 A JP 965695A JP H08129554 A JPH08129554 A JP H08129554A
Authority
JP
Japan
Prior art keywords
expression
search
language
relationship
relational expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7009656A
Other languages
Japanese (ja)
Other versions
JP3617096B2 (en
Inventor
Mamiko Oka
満美子 岡
Takehiro Koyama
剛弘 小山
Yoshihiro Ueda
良寛 上田
Tadanobu Miyauchi
忠信 宮内
Juhei Nakagaki
寿平 中垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP00965695A priority Critical patent/JP3617096B2/en
Publication of JPH08129554A publication Critical patent/JPH08129554A/en
Application granted granted Critical
Publication of JP3617096B2 publication Critical patent/JP3617096B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE: To provide an extracting device which can extracts a more appropriate key word without depending upon surface expression by utilizing relation between words and a retrieval device which can perform a retrieve at a more appropriage retrieval request. CONSTITUTION: An expression extraction part 2 analyzes respective texts in document data inputted from a data input part 1 by a morpheme analysis part 14 to divide them into words, and then extracts plural mutually related words as expressions by a word group extraction part 15 on the basis of a word group extraction rule together with information on parts of speech. The expressions extracted by the expression extraction part 2 are related by a relation extraction part 3 on the basis of a relation extraction rule and further normalized by a normalization part 4. The related expressions normalized by the normalization part 4 are registered in a storage part 5 together with the inputted original data. The registered original data can be retrieved by using the related expression as a retrieval key.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、キーワードにより検索
を行なう検索装置に関連するもので、特に、文書からキ
ーワードとなりうる関係表現を抽出する関係表現抽出装
置、および、入力される関係表現を検索キーとして検索
を行なう関係表現検索装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a search device for performing a search by a keyword, and more particularly, a relational expression extraction device for extracting a relational expression that can be a keyword from a document, and a relational expression to be input. The present invention relates to a relational expression search device that performs a search as a key.

【0002】[0002]

【従来の技術】従来、データベース等に蓄積された大量
の情報の中から、所望の情報を検索する手法として、各
データにあらかじめキーワードを割り当てておき、ユー
ザの入力した検索キーと一致したキーワードを持つ情報
を検索して出力する装置が開発されている。
2. Description of the Related Art Conventionally, as a method for searching desired information from a large amount of information stored in a database or the like, a keyword is assigned to each data in advance, and a keyword matching a search key input by a user is used. Devices have been developed to search for and output the information that they have.

【0003】キーワード検索においては、インデクサと
呼ばれる専門家が適切なキーワードをあらかじめテキス
ト情報に付与するのが一般的である。しかし、このキー
ワードの付与は、膨大な手間がかかることから、キーワ
ードを自動的に抽出する技術の研究が数多く行なわれて
いる。例えば、特開平1−112331号公報に記載さ
れているキーワード重要度自動評価装置では、文書中か
ら名詞をキーワードとして抽出し、さらに統計的、構文
的、意味的な重要度の評価を加えている。
In the keyword search, it is general that an expert called an indexer gives an appropriate keyword to the text information in advance. However, since the addition of this keyword requires a huge amount of work, many studies have been conducted on a technique for automatically extracting the keyword. For example, in the keyword importance automatic evaluation device described in JP-A-1-112331, a noun is extracted as a keyword from a document, and evaluation of statistical, syntactic, and semantic importance is added. .

【0004】しかし、このような従来のキーワード抽出
方法では、一般に単語単位で抽出を行なうため、たとえ
重要度などを付与しても、どうしても検索結果に本来求
めるものと無関係なものが多くなってしまう。すなわ
ち、適合率が低下するという問題があった。これは、ユ
ーザが欲する検索要求に対応する概念は、必ずしも単語
レベルの表現と一致しないことに起因している。そのた
め、単語レベルのキーワードで検索した場合、ユーザが
想定していた意味とは別の意味で用いられているテキス
トも検索されてしまう。
However, in such a conventional keyword extraction method, since the extraction is generally performed on a word-by-word basis, even if the degree of importance is added, there are many things that are irrelevant to the original search result. . That is, there is a problem in that the precision rate decreases. This is because the concept corresponding to the search request desired by the user does not always match the word-level expression. Therefore, when searching with a word-level keyword, a text used in a meaning different from the meaning assumed by the user is also searched.

【0005】これに対し、特公昭58−33993号公
報に記載されているキーワード抽出装置においては、複
合語を用いることによりキーワードの意味を限定する方
法が提案されている。これにより、係り受け関係などに
ある語を抽出することが可能になり、単語単位で概念を
表現するという制約はなくなる。
On the other hand, in the keyword extracting device described in Japanese Patent Publication No. 58-33993, there is proposed a method of limiting the meaning of a keyword by using a compound word. As a result, it becomes possible to extract words having a dependency relationship and the like, and there is no restriction that the concept is expressed in word units.

【0006】ところが、この方法では、固定キーワード
として複合語またはこれに準ずる表現を用いているた
め、例えば、「文書を検索する」と「文書から検索す
る」の意味の違いを扱うことができず、結果として、
「文書検索」といった表現しか抽出されない。すなわ
ち、複合語を用いることにより、表層的な表現に依存し
なくなる代わりに、せっかく解析した係り受け関係など
の情報が欠落してしまう。このため、検索結果には、依
然として適切でないものが含まれてしまうことが多かっ
た。
However, in this method, since a compound word or an expression similar to this is used as a fixed keyword, it is impossible to handle the difference in meaning between "search a document" and "search a document", for example. ,as a result,
Only expressions such as "document search" are extracted. In other words, by using the compound word, the information such as the dependency relationship that is analyzed in detail is lost instead of being independent of the surface expression. For this reason, the search results often include unsuitable ones.

【0007】このように、従来の技術においては、キー
ワードから効率的な検索をすることは、依然として困難
であった。
As described above, in the conventional technique, it was still difficult to efficiently search for a keyword.

【0008】[0008]

【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、特に文書中から単語など複
数の表現とその表現間の関係を抽出することにより、従
来無視されていた単語間の関係を利用し、かつ表層的な
表現には依存せず、より適切なキーワードを抽出するこ
とのできる抽出装置を提供するとともに、より適切な検
索要求に基づく検索を行なうことのできる検索装置を提
供することを目的とするものである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above-mentioned circumstances, and has been conventionally ignored by extracting a plurality of expressions such as words from a document and the relationship between the expressions. Retrieval that utilizes a relationship between words and provides an extraction device that can extract a more appropriate keyword without depending on a surface expression and that can perform a search based on a more appropriate search request The purpose is to provide a device.

【0009】[0009]

【課題を解決するための手段】本発明は、請求項1に記
載の発明においては、原データからキーワードとなりう
る関係表現を抽出する関係表現抽出装置において、前記
原データから互いに関係を持ち得る複数の表現を抽出す
る表現抽出手段と、該表現抽出手段により抽出された表
現群に関係を与える関係抽出手段を有することを特徴と
するものである。
According to a first aspect of the present invention, in a relational expression extracting device for extracting a relational expression that can be a keyword from original data, a plurality of relational expressions that can have a relationship with each other from the original data. The present invention is characterized by having an expression extracting means for extracting the expression (1) and a relationship extracting means for giving a relationship to the expression group extracted by the expression extracting means.

【0010】請求項2に記載の発明においては、請求項
1に記載の関係表現抽出装置において、前記関係抽出手
段により与えられた関係に基づいて表層的な表現に依存
しない表現に正規化する正規化手段をさらに有すること
を特徴とするものである。
According to a second aspect of the present invention, in the relational expression extracting device according to the first aspect, the normalization is performed to normalize into a representation that does not depend on a surface expression based on the relation given by the relation extracting means. It is characterized in that it further comprises a converting means.

【0011】請求項3に記載の発明においては、請求項
1または2に記載の関係表現抽出装置において、前記表
現抽出手段は、前記原データを解析する解析手段と、該
解析手段による解析結果から互いに関係を持ち得る複数
の単語を取り出す単語群抽出手段を有することを特徴と
するものである。
According to a third aspect of the present invention, in the relational expression extracting device according to the first or second aspect, the expression extracting means is based on an analyzing means for analyzing the original data and an analysis result by the analyzing means. It is characterized by having a word group extraction means for extracting a plurality of words that may have a relationship with each other.

【0012】請求項4に記載の発明においては、請求項
1ないし3のいずれか1項に記載の関係表現抽出装置に
おいて、前記関係抽出手段あるいは前記正規化手段から
与えられる関係表現を言語に依存しない表現に正規化す
る言語正規化手段をさらに有することを特徴とするもの
である。
According to a fourth aspect of the present invention, in the relational expression extracting device according to any one of the first to third aspects, the relational expression given from the relation extracting means or the normalizing means depends on a language. It is characterized by further comprising a language normalization means for normalizing into a non-expression.

【0013】請求項5に記載の発明においては、請求項
1ないし3のいずれか1項に記載の関係表現抽出装置に
おいて、前記表現抽出手段は前記原データが記述されて
いる言語に応じて前記原データを解析する言語別解析手
段からなり、前記関係抽出手段は言語に応じて互いに関
係を持ち得る複数の単語とその間の関係からなる関係表
現を抽出する言語別関係抽出手段からなり、複数の言語
における等価な意味の単語が登録された対訳単語辞書
と、複数の言語における等価な言語的関係を表わす情報
が登録された対訳関係辞書と、前記対訳単語辞書と前記
対訳関係辞書を用い言語に応じて前記関係抽出手段によ
って抽出された関係表現を言語に依存しない表現に正規
化する言語正規化手段をさらに有することを特徴とする
ものである。
According to a fifth aspect of the present invention, in the relational expression extracting device according to any one of the first to third aspects, the expression extracting means is adapted to correspond to a language in which the original data is described. The relationship extracting means comprises language-specific analyzing means for analyzing the original data, and the relationship extracting means comprises language-specific relationship extracting means for extracting a relational expression consisting of a plurality of words which may have a relationship with each other depending on the language and a relationship between the words. A bilingual word dictionary in which words having an equivalent meaning in a language are registered, a bilingual relationship dictionary in which information indicating an equivalent linguistic relationship in a plurality of languages is registered, and a language using the bilingual word dictionary and the bilingual relationship dictionary Accordingly, it further comprises a language normalization means for normalizing the relational expression extracted by the relational extraction means into a language-independent expression.

【0014】請求項6に記載の発明においては、関係表
現を検索キーとして検索を行なう検索装置において、原
データから互いに関係を持ち得る複数の表現として抽出
された関係表現がキーとして原データとともに登録され
ている記憶手段と、入力される関係表現を検索キーとし
て前記記憶部に登録されている原データを検索する検索
手段を有することを特徴とするものである。
In a sixth aspect of the present invention, in a search device that performs a search using a relational expression as a search key, the relational expressions extracted as a plurality of expressions that may have a relationship with each other from the original data are registered as keys with the original data. The present invention is characterized in that it has a storage means that is stored and a search means that searches the original data registered in the storage section using the input relational expression as a search key.

【0015】請求項7に記載の発明においては、請求項
6に記載の関係表現検索装置において、前記検索手段
は、少なくとも、入力された検索要求を概念的に同一に
なり得る関係表現に展開して検索を行なう関係展開手段
を含むことを特徴とするものである。
In the invention according to claim 7, in the relational expression search device according to claim 6, the search means expands at least the input search request into a relational expression that can be conceptually the same. It is characterized in that it includes a relationship expanding means for performing a search.

【0016】請求項8に記載の発明においては、請求項
7に記載の関係表現検索装置において、入力データから
互いに関係を持ち得る複数の表現を取り出す表現抽出手
段と、該表現抽出手段により取り出された複数の表現の
関係を抽出する関係抽出手段と、該関係抽出手段により
抽出した関係に基づいて表層的な表現に依存しない表現
に正規化する正規化手段を有し、前記記憶手段は、原デ
ータを入力データとして前記単語群抽出手段、前記関係
抽出手段、前記正規化手段により互いに関係を持ち得る
複数の表現として抽出し正規化した関係表現がキーとし
て原データとともに登録されており、前記関係展開手段
は、自然語を入力データとし前記単語群抽出手段、前記
関係抽出手段、前記正規化手段により互いに関係を持ち
得る複数の表現として抽出し正規化した検索要求を概念
的に同一になり得る関係表現に展開して検索を行なうこ
とを特徴とするものである。
According to an eighth aspect of the invention, in the relational expression retrieving apparatus according to the seventh aspect, the expression extracting means for extracting a plurality of expressions that may have a relationship with each other from the input data, and the expression extracting means extracts the expressions. And a normalization means for normalizing the relationship extracted by the relationship extraction means to an expression that does not depend on the surface expression based on the relationship extracted by the relationship extraction means. The relational expression extracted and normalized as a plurality of expressions that can have a relationship with each other by the word group extraction means, the relation extraction means, and the normalization means using the data as input data is registered as a key together with the original data. The expanding means uses natural language as input data, and a plurality of expressions that can have a relationship with each other by the word group extracting means, the relationship extracting means, and the normalizing means. It is characterized in that to perform the search by expanding the extracted normalized search request conceptually identical to become obtain relational representation Te.

【0017】請求項9に記載の発明においては、請求項
6または7に記載の関係表現検索装置において、前記記
憶手段には、原データから互いに関係を持ち得る複数の
表現として抽出され、言語に依存しない表現に正規化さ
れた関係表現がキーとして原データとともに登録されて
いることを特徴とするものである。
According to a ninth aspect of the present invention, in the relational expression retrieval device according to the sixth or seventh aspect, the storage means extracts a plurality of expressions that may have a relationship with each other from the original data and converts them into languages. It is characterized in that a relational expression normalized to an independent expression is registered as a key together with the original data.

【0018】請求項10に記載の発明においては、請求
項6または7に記載の関係表現検索装置において、入力
データが記述されている言語に応じて前記入力データか
ら互いに関係を持ち得る複数の表現を取り出す表現抽出
手段と、該表現抽出手段により取り出された複数の表現
の関係を言語に応じて抽出する関係抽出手段と、複数の
言語における等価な意味の単語が登録された対訳単語辞
書と、複数の言語における等価な言語的関係を表わす情
報が登録された対訳関係辞書と、前記対訳単語辞書と前
記対訳関係辞書を用い言語に応じて前記関係抽出手段に
よって言語に応じて抽出された関係表現を言語に依存し
ない表現に正規化する言語正規化手段を有し、前記記憶
手段には、原データを入力データとして前記表現抽出手
段、前記関係抽出手段、前記言語正規化手段により言語
に依存しない表現に正規化した関係表現がキーとして原
データとともに登録されており、前記検索手段は、自然
語を入力データとし前記単語群抽出手段、前記関係抽出
手段、前記正規化手段により言語に依存しない表現とし
て正規化した検索要求を用いて検索を行なうことを特徴
とするものである。
According to a tenth aspect of the present invention, in the relational expression search device according to the sixth or seventh aspect, a plurality of expressions that can have a relationship with each other from the input data according to the language in which the input data is described. An expression extraction means for extracting the expression, a relationship extraction means for extracting a relationship between the plurality of expressions extracted by the expression extraction means according to a language, and a bilingual word dictionary in which words having equivalent meanings in the plurality of languages are registered, A bilingual relation dictionary in which information indicating equivalent linguistic relations in a plurality of languages is registered, and a relational expression extracted by the relation extracting means according to the language according to the language using the bilingual word dictionary and the bilingual relation dictionary. Has a language normalization means for normalizing the expression into a language-independent expression, and the storage means uses the original data as input data for the expression extraction means and the relation extraction. A relational expression normalized to a language-independent expression by the language normalizing means is registered as a key together with the original data, and the searching means uses natural language as input data, the word group extracting means, and the relation extracting Means for performing a search using a search request normalized as an expression independent of language by the normalizing means.

【0019】請求項11に記載の発明においては、請求
項6ないし10のいずれか1項に記載の関係表現検索装
置において、前記検索手段は、入力された検索要求に基
づく関係表現と前記記憶手段に記憶されている関係表現
を比較して確信度を評価し該確信度に基づいて検索結果
を並べ替える確信度評価手段を有することを特徴とする
ものである。
According to an eleventh aspect of the present invention, in the relational expression retrieving apparatus according to any one of the sixth to tenth aspects, the retrieving means includes the relational expression based on the input retrieval request and the storage means. It is characterized by further comprising certainty factor evaluation means for comparing the relational expressions stored in, to evaluate the certainty factor, and rearranging the search results based on the certainty factor.

【0020】[0020]

【作用】本発明によれば、請求項1に記載の発明におい
て、表現抽出手段で原データから互いに関係を持ち得る
複数の表現を抽出し、関係抽出手段で抽出された表現群
に関係を与えることにより、単なる一単語ではなく複数
の表現とその間の関係をキーとして抽出することが可能
となる。これにより、表層表現に依存しない概念、主題
が抽出されることとなり、より適切なキーワードを抽出
することができる。また、請求項2に記載の発明のよう
に、正規化手段を有する構成とし、関係抽出手段で抽出
した表現間の関係を、正規化手段で正規化することによ
り、表層的な表現に依存しない表現をキーワードとする
ことができる。表現抽出手段において表現を抽出する処
理としては、例えば、請求項3に記載の発明のように、
解析手段で原データを解析し、単語群抽出手段で互いに
関係を持ち得る複数の単語を取り出すように構成するこ
とができる。
According to the present invention, in the invention described in claim 1, the expression extracting means extracts from the original data a plurality of expressions which may have a relationship with each other, and gives the relationship to the expression group extracted by the relationship extracting means. As a result, it becomes possible to extract not only one word but a plurality of expressions and the relation between them as a key. As a result, concepts and subjects that do not depend on the surface expression are extracted, and more appropriate keywords can be extracted. Further, as in the invention according to claim 2, the structure having the normalizing means is adopted, and the relation between the expressions extracted by the relation extracting means is normalized by the normalizing means, so that the expression does not depend on the surface expression. Expressions can be keywords. As the processing for extracting the expression in the expression extracting means, for example, as in the invention described in claim 3,
The analysis unit may be configured to analyze the original data and the word group extraction unit may extract a plurality of words that may be related to each other.

【0021】請求項4に記載の発明によれば、言語正規
化手段を有し、関係抽出手段あるいは正規化手段から与
えられる関係表現を言語に依存しない表現に正規化する
ことにより、言語に依存しない表現によりキーワードを
抽出することができる。原データが複数の言語により記
述されている場合には、それぞれの言語ごとに解析を行
なって言語に依存しない表現に正規化すればよい。請求
項5に記載の発明によれば、これを実現するため、表現
抽出手段を原データが記述されている言語に応じて原デ
ータを解析する言語別解析手段により構成し、関係抽出
手段を言語に応じて互いに関係を持ち得る複数の単語と
その間の関係からなる関係表現を抽出する言語別関係抽
出手段により構成する。そして、得られた各言語ごと
に、言語正規化手段は、複数の言語における等価な意味
の単語が登録された対訳単語辞書と、複数の言語におけ
る等価な言語的関係を表わす情報が登録された対訳関係
辞書を用い、言語に依存しない表現に正規化する。これ
により、複数の言語により記述されている原データから
言語に依存しない表現によりキーワードを抽出すること
ができる。
According to the fourth aspect of the invention, a language normalization unit is provided, and the relational expression given from the relation extraction unit or the normalization unit is normalized to a language-independent expression, thereby making it dependent on the language. The keyword can be extracted by the expression that does not exist. When the original data is described in a plurality of languages, it is sufficient to analyze each language and normalize it into a language-independent expression. According to the invention described in claim 5, in order to realize this, the expression extraction means is constituted by a language-specific analysis means for analyzing the original data according to the language in which the original data is described, and the relation extraction means is a language. The language-specific relation extracting means extracts a relational expression consisting of a plurality of words that may have a relation to each other and a relation between them. Then, for each of the obtained languages, the language normalization means registers the bilingual word dictionary in which words of equivalent meaning in a plurality of languages are registered, and the information indicating the equivalent linguistic relationship in a plurality of languages. It uses a bilingual relation dictionary and normalizes it into a language-independent expression. As a result, the keyword can be extracted from the original data described in a plurality of languages by a language-independent expression.

【0022】請求項6に記載の発明においては、例え
ば、請求項1ないし5に記載の関係表現抽出装置により
抽出されたキーなど、原データから互いに関係を持ち得
る複数の表現として抽出された関係表現がキーとして、
原データとともに記憶手段に登録されている。この記憶
手段に登録されている原データを、入力される関係表現
を検索キーとして検索手段で検索する。これにより、単
なる一単語ではなく複数の表現とその間の関係をキーと
して検索することが可能となり、表層表現に依存しない
概念、主題からの、効率的な検索が実現できる。
In the invention described in claim 6, for example, a relation extracted from the original data as a plurality of relations which can have a relation with each other, such as a key extracted by the relational expression extraction device according to the first aspect. Expression is the key
It is registered in the storage means together with the original data. The original data registered in this storage means is searched by the search means using the input relational expression as a search key. As a result, it is possible to search using not only a single word but a plurality of expressions and the relationship between them, and it is possible to realize an efficient search from concepts and subjects that do not depend on surface expressions.

【0023】原データに付された関係表現の中には、相
違する関係表現であっても意味的あるいは概念的に同一
のものが存在する場合がある。請求項7に記載の発明に
おいて、関係展開手段により、入力された検索要求を概
念的に同一になり得る関係表現に展開し、展開された関
係表現で検索を行なうことにより、検索漏れを減少させ
ることが可能となる。このとき、意味的、概念的に同一
のもののみが検索されるので、不要なデータまで検索結
果として提示されることはなく、効率的な検索を実現す
ることができる。
Among the relational expressions attached to the original data, there are cases where different relational expressions have the same meaning or concept. In the invention according to claim 7, the relationship expansion means expands the input search request into a relational expression that can be conceptually the same, and performs a search with the expanded relational expression, thereby reducing search omissions. It becomes possible. At this time, since only the same semantically and conceptually is searched, unnecessary data is not presented as a search result, and an efficient search can be realized.

【0024】請求項8に記載の発明においては、入力デ
ータから互いに関係を持ち得る複数の表現を取り出す表
現抽出手段と、表現抽出手段により取り出された複数の
表現の関係を抽出する関係抽出手段と、関係抽出手段に
より抽出した関係に基づいて表層的な表現に依存しない
表現に正規化する正規化手段を有し、これらの手段をキ
ーワードの抽出と、検索キーの生成の両方に用いてい
る。キーワードの抽出時には、原データを入力データと
して、単語群抽出手段、関係抽出手段、正規化手段によ
り、互いに関係を持ち得る複数の表現として抽出し、正
規化した関係表現がキーとして、原データとともに記憶
手段に登録する。検索時には、自然語を入力データと
し、単語群抽出手段、前記関係抽出手段、前記正規化手
段により互いに関係を持ち得る複数の表現として抽出
し、正規化した検索要求を、関係展開手段により概念的
に同一になり得る関係表現に展開して検索を行なう。こ
れにより、原データに付与されるキーワードも、検索に
用いる検索キーも、同様のプロセスにより生成されるの
で、より適切な検索を行なうことができる。また、各手
段をキーワードの抽出および検索に兼用できるので、装
置構成を簡略化し、低コストの検索装置を実現すること
が可能である。
In the invention described in claim 8, expression extracting means for extracting from the input data a plurality of expressions that may have a relationship with each other, and relationship extracting means for extracting a relationship between the plurality of expressions extracted by the expression extracting means. , And has a normalizing means for normalizing to an expression that does not depend on the surface expression based on the relationship extracted by the relationship extracting means, and these means are used both for extracting the keyword and for generating the search key. When extracting a keyword, the original data is extracted as input data, and a plurality of expressions that may have a relationship with each other are extracted by the word group extraction means, the relation extraction means, and the normalization means, and the normalized relational expression is used as a key together with the original data. Register in storage means. At the time of search, the natural language is used as input data, and a plurality of expressions that can be related to each other are extracted by the word group extraction means, the relationship extraction means, and the normalization means, and the normalized search request is conceptualized by the relationship expansion means. The search is performed by expanding the relational expression that can be the same as. As a result, the keyword added to the original data and the search key used for the search are generated by the same process, so that a more appropriate search can be performed. Further, since each unit can be used for both keyword extraction and search, it is possible to simplify the device configuration and realize a low-cost search device.

【0025】請求項9に記載の発明によれば、記憶手段
には、原データから互いに関係を持ち得る複数の表現と
して抽出され、言語に依存しない表現に正規化された関
係表現がキーとして原データとともに登録されている。
この記憶手段に登録されている原データを、言語に依存
しない正規化された関係表現を検索キーとして検索手段
で検索する。これにより、原データが記述されている言
語に関係なく、検索することが可能となる。
According to the invention described in claim 9, in the storage means, a relational expression extracted from the original data as a plurality of expressions which may have a relation with each other and normalized to a language-independent expression is used as a key. It is registered with the data.
The original data registered in this storage means is searched by the search means using the normalized relational expression independent of language as a search key. This makes it possible to search regardless of the language in which the original data is written.

【0026】請求項10に記載の発明によれば、入力デ
ータについても言語によらずに検索を行なうために、表
現抽出手段において入力データが記述されている言語に
応じて前記入力データから互いに関係を持ち得る複数の
表現を取り出し、取り出した複数の表現の関係を関係抽
出手段で言語に応じて抽出する。抽出した関係は、言語
正規化手段において、複数の言語における等価な意味の
単語が登録された対訳単語辞書と、複数の言語における
等価な言語的関係を表わす情報が登録された対訳関係辞
書を用い、言語に依存しない表現に正規化して検索要求
とする。このとき、請求項7に記載のように、関係展開
手段により関係を展開することもできる。一方、記憶手
段には、原データを入力データとして前記表現抽出手
段、前記関係抽出手段、前記言語正規化手段により言語
に依存しない表現に正規化した関係表現がキーとして原
データとともに登録されている。検索手段は、言語に依
存しない表現として正規化した検索要求を用いて検索を
行なう。これにより、種々の言語により検索要求を入力
することができ、検索要求で使用した言語にかかわら
ず、また、原データで使用されている言語にかかわら
ず、関係のある情報を検索することが可能となる。
According to the tenth aspect of the present invention, since the input data is searched regardless of the language, the input data are related to each other according to the language in which the input data is described in the expression extracting means. A plurality of expressions that can have the expression are extracted, and the relationship extraction unit extracts the relationship between the extracted expressions according to the language. For the extracted relations, the language normalization means uses a bilingual word dictionary in which words having equivalent meanings in a plurality of languages are registered, and a bilingual relation dictionary in which information indicating equivalent linguistic relationships in a plurality of languages is registered. , The search request is normalized to a language-independent expression. At this time, as described in claim 7, the relationship can be expanded by the relationship expanding means. On the other hand, in the storage means, the relational expression normalized to the language-independent expression by the expression extracting means, the relation extracting means, and the language normalizing means using the original data as input data is registered as a key together with the original data. . The search means searches using a search request normalized as a language-independent expression. This allows you to enter search requests in various languages, and to search for relevant information regardless of the language used in the search request and the language used in the original data. Becomes

【0027】請求項11に記載の発明においては、請求
項6ないし10のいずれか1項に記載の関係表現検索装
置において、入力された検索要求に基づく関係表現と、
検索された文書に対応づけられた関係表現とを比較し
て、同じ関係であり得る確信度を評価し、確信度に基づ
いて検索結果を並べ替えてユーザに提示することができ
る。ユーザは、例えば、確信度の高い順に検索結果を参
照することができ、より効率的な検索を行なうことがで
きる。
According to an eleventh aspect of the present invention, in the relational expression retrieval device according to any one of the sixth to tenth aspects, a relational expression based on an input retrieval request,
It is possible to compare the retrieved document with the relational expression associated with the retrieved document, evaluate the certainty factor that may have the same relationship, and rearrange the search results based on the certainty factor and present them to the user. For example, the user can refer to the search results in descending order of certainty, and can perform a more efficient search.

【0028】[0028]

【実施例】図1は、本発明の関係表現抽出装置の一実施
例を示すブロック図である。図中、1はデータ入力部、
2は表現抽出部、3は関係抽出部、4は正規化部、5は
記憶部、11は磁気ディスク、12はOCR、13はM
T、14は形態素解析部、15は単語群抽出部、16は
データベースである。
FIG. 1 is a block diagram showing an embodiment of a relational expression extracting device of the present invention. In the figure, 1 is a data input section,
2 is an expression extraction unit, 3 is a relation extraction unit, 4 is a normalization unit, 5 is a storage unit, 11 is a magnetic disk, 12 is OCR, and 13 is M.
T and 14 are morphological analysis units, 15 is a word group extraction unit, and 16 is a database.

【0029】データ入力部1は、関係表現を抽出すべき
文書データを与える。データ入力部1は、例えば、既存
電子文書を保持する磁気ディスク11、OCR12、M
T13などで構成することができる。もちろん、他の入
力装置、記憶装置、あるいは、ネットワークなどを介し
て、文書データを受け取るように構成してもよい。
The data input unit 1 provides document data from which relational expressions should be extracted. The data input unit 1 includes, for example, a magnetic disk 11, an OCR 12 and an M that holds an existing electronic document.
It can be configured by T13 or the like. Of course, the document data may be received via another input device, a storage device, or a network.

【0030】表現抽出部2は、入力された文書データを
解析し、関係を持ち得る接続パターンに応じ、所定の規
則に基づいて、単語とその品詞などの情報からなる表現
を抽出する。表現抽出部2は、形態素解析部14および
単語群抽出部15を含むように構成することができる。
形態素解析部14は、文書データ中の各テキストを解析
し、単語単位に分割する。単語群抽出部15は、形態素
解析部14による解析結果から、単語群抽出規則に基づ
いて、互いに関係を持ち得る複数の単語を取り出す。
The expression extracting unit 2 analyzes the input document data and extracts an expression consisting of information such as a word and its part of speech based on a predetermined rule according to a connection pattern that may have a relationship. The expression extraction unit 2 can be configured to include a morpheme analysis unit 14 and a word group extraction unit 15.
The morphological analysis unit 14 analyzes each text in the document data and divides it into word units. The word group extraction unit 15 extracts a plurality of words that may have a relationship with each other from the analysis result by the morpheme analysis unit 14 based on the word group extraction rule.

【0031】関係抽出部3は、表現抽出部2で抽出され
た表現に対し、関係抽出規則に基づいて関係を付与す
る。正規化部4は、関係抽出部3で付与された関係に基
づいて、関係表現を正規化する。これらの処理により、
求める関係表現が得られる。
The relation extraction unit 3 gives a relation to the expressions extracted by the expression extraction unit 2 based on the relation extraction rule. The normalization unit 4 normalizes the relational expression based on the relation given by the relation extraction unit 3. By these processing,
The desired relational expression is obtained.

【0032】記憶部5は、例えば、データベース16な
どにより構成することができる。表現抽出部2、関係抽
出部3、および、正規化部4の処理により得られた関係
を、入力された原データとともに登録する。
The storage unit 5 can be composed of, for example, a database 16. The relationships obtained by the processes of the expression extraction unit 2, the relationship extraction unit 3, and the normalization unit 4 are registered together with the input original data.

【0033】図2は、本発明の関係表現抽出装置の一実
施例における全体の動作の一例を示すフローチャートで
ある。最初に、S21において、データ入力部1より抽
出すべき文書データを電子的に読み込む。S22で、読
み込んだ文書データ中に未処理の文が残っている間は、
S23以降の処理を繰り返し行なう。
FIG. 2 is a flow chart showing an example of the entire operation in one embodiment of the relational expression extracting device of the present invention. First, in S21, the document data to be extracted is electronically read from the data input unit 1. In S22, while unprocessed sentences remain in the read document data,
The processing after S23 is repeated.

【0034】S23において、読み込んだ文書データか
ら未処理の1文を取り出す。次のステップにおける形態
素解析の単位として、日本語においては句点(。)まで
を読み込めば1文単位の読み込みが簡単であるため、こ
れを適用する。もちろん、メモリなどに余裕があれば、
より長い単位で解析しても良い。
At S23, one unprocessed sentence is taken out from the read document data. As a unit of morphological analysis in the next step, in Japanese, if even a punctuation mark (.) Is read, it is easy to read one sentence, so this is applied. Of course, if you have enough memory,
Analysis may be performed in longer units.

【0035】S24において、形態素解析部14により
形態素解析を行なって、1文のテキストを単語の並びに
分割する。形態素解析は、自然言語処理の基本技術とし
て広く知られており、例えば、特開昭60−20234
号公報に記載されている日本語形態素解析方式など、種
々の公知の技術を用いることができる。
In step S24, the morpheme analysis unit 14 performs morpheme analysis to divide the text of one sentence into words. Morphological analysis is widely known as a basic technique of natural language processing. For example, Japanese Patent Laid-Open No. 60-20234.
Various known techniques such as the Japanese morphological analysis method described in Japanese Patent Publication can be used.

【0036】S25において、単語群抽出部15による
単語群の抽出処理が行なわれる。単語群の抽出は、単語
群抽出規則を用いて行なう。以下の説明において抽出さ
れる単語群の基本的なパターンは、次のようなパターン
である。「前自立語並び+付属語並び+後自立語並び」
単語群抽出規則は、このような単語群のパターンを抽出
するための規則である。また、複合表現についても、1
つの表現として抽出する。複合表現の抽出基準は、基本
的には活用しない語の連続であり、具体的には、「名
詞、サ変、形容動詞のいずれかが連続する。」という条
件による。もちろん、他のパターンにより単語群を抽出
することも可能であり、抽出するパターンに応じて、単
語群抽出規則が決められる。
In S25, the word group extraction unit 15 performs the word group extraction processing. The word group extraction is performed using the word group extraction rule. The basic pattern of the word group extracted in the following description is the following pattern. "Pre-independent word sequence + adjunct word sequence + rear-independent word sequence"
The word group extraction rule is a rule for extracting such a word group pattern. Also, for compound expressions, 1
Extract as one expression. The extraction criterion of the compound expression is basically a series of words that are not used, and specifically, it is based on the condition that "any one of a noun, a sahen, and an adjective is continuous." Of course, it is also possible to extract the word group by other patterns, and the word group extraction rule is determined according to the pattern to be extracted.

【0037】単語群抽出部15で単語群が抽出される
と、S26において、関係抽出部3により関係を付与す
る。関係の抽出には、関係抽出規則を用いる。関係抽出
規則には、単語群と、その単語群が有する関係とが対に
なり、登録されている。この関係抽出規則を用い、抽出
された単語群に対応する登録項目がある場合には、その
単語群に対応する関係を取り出し、単語群に取り出した
関係を付与し、出力する。
When the word group is extracted by the word group extraction unit 15, the relation extraction unit 3 gives a relation in S26. A relation extraction rule is used to extract the relation. A word group and a relationship that the word group has are paired and registered in the relationship extraction rule. Using this relation extraction rule, if there is a registered item corresponding to the extracted word group, the relation corresponding to that word group is extracted, the extracted relation is added to the word group, and the result is output.

【0038】関係抽出が終了すると、S27において、
抽出された関係をもとに、正規化部4において、関係の
正規化を行なう。すなわち、関係抽出部3で抽出した関
係から、活用や出現順など、表層的な表現に依存しない
部分を取り出す。以下の説明では、上述の単語群を抽出
したときのパターンの前自立語並びを表現1とし、後自
立語並びを表現2とし、関係抽出部3で抽出された関係
を[関係]として、{[関係] 表現1 表現2}とい
う形式の関係を生成する。ただし、表現1、表現2につ
いては、出現順に極力依存しない処理が必要となるた
め、規則に基づいて入れ替えを行なう。これは、実際の
検索時に、概念的に近い類似表現とのマッチングを容易
にするためである。表現1および表現2の順序は、基本
的には用言性のものを表現2としており、より具体的な
規則としては、次のように、前自立語並びのみサ変動詞
語幹の場合、後自立語並びを表現1、前自立語並びを表
現2にする。なお、サ変動詞語幹をサ変、形容動詞語幹
を形容動詞と略記している。以下の説明および図面でも
同様である。 (A)サ変+する動詞+名詞→{[スル](名詞)(サ
変)} (B)サ変+が+形容動詞→{[ガ格](形容動詞)
(サ変)} 以上の処理により、正規表現が得られる。
When the relation extraction is completed, in S27,
The normalization unit 4 normalizes the relationship based on the extracted relationship. That is, from the relationship extracted by the relationship extracting unit 3, a part that does not depend on surface expression such as utilization or appearance order is extracted. In the following description, the preceding independent word sequence of the pattern when the above-mentioned word group is extracted is defined as expression 1, the subsequent independent word sequence is defined as expression 2, and the relation extracted by the relation extraction unit 3 is defined as [relationship], { [Relationship] A relationship in the form of expression 1 expression 2} is generated. However, the expressions 1 and 2 need to be replaced in accordance with the rules because processing that does not depend on the appearance order as much as possible is required. This is to facilitate matching with similar expressions that are conceptually close at the time of actual search. As for the order of expression 1 and expression 2, basically, the expression 2 is defensive, and as a more specific rule, as shown below, in the case of the pre-independence word sequence only, the syllable stem, the post-independence word The word sequence is expressed as expression 1 and the pre-independent word sequence as expression 2. In addition, the adjective verb stem is abbreviated as Sa, and the adjective verb stem is abbreviated as adjective verb. The same applies to the following description and drawings. (A) Sa-hen + verb to move + noun → {[sul] (noun) (sa-hen)} (B) Sa-hen + is + adjective verb → {[ga case] (adjective verb)
The regular expression is obtained by the above processing.

【0039】S27までの処理で抽出され、正規化され
た関係表現は、付属語や活用形、さらには出現順序など
の表層表現に依存せず、しかも単語レベルより明確な概
念を表わしているといえる。この関係表現は、もとの文
の主題を表わしていると考えられる。
The relational expressions extracted and normalized by the processes up to S27 do not depend on surface expressions such as adjunct words, inflectional forms, and appearance order, and represent a clearer concept than the word level. I can say. This relational expression is considered to represent the subject of the original sentence.

【0040】以上で、S23で取り出した1文に対する
関係表現抽出が終了する。正規化した関係表現の内容
は、結果出力ストリームSOに書き出し、S22へ戻っ
て、さらに入力文書中にデータが続く限り、同様に1文
単位で処理を続ける。最後に、S29で、こうして得ら
れた関係表現を、記憶部5に登録する。上述のように、
記憶部5には、通常のデータベースシステム16を用い
ることができる。すなわち、結果出力ストリームSOに
保持された各正規表現の表現1,表現2,関係をそれぞ
れ転置キーとして、原データである入力文書とともに登
録すればよい。
Thus, the relational expression extraction for one sentence extracted in S23 is completed. The content of the normalized relational expression is written to the result output stream SO, the process returns to S22, and the processing is continued in the same sentence unit as long as the data continues in the input document. Finally, in S29, the relational expression thus obtained is registered in the storage unit 5. As mentioned above,
A normal database system 16 can be used for the storage unit 5. That is, the expression 1, expression 2, and relationship of each regular expression held in the result output stream SO may be registered as transposed keys together with the input document that is the original data.

【0041】以上の処理により、入力した文書から主題
を関係表現として抽出し、データベース上に原文書とと
もに蓄えられる。こうして、文書に順次主題を付与する
ことで、関係表現抽出装置を用いた主題表現抽出システ
ムが実現される。
By the above processing, the subject is extracted as a relational expression from the input document and stored in the database together with the original document. In this way, a subject expression extraction system using the relational expression extraction device is realized by sequentially adding the subject to the document.

【0042】図3は、本発明の関係表現抽出装置の一実
施例における単語群抽出部15の動作の一例を示すフロ
ーチャートである。上述のように、単語群抽出部15で
は、例えば、関係表現抽出規則に基づいて、「前自立語
並び+付属語並び+後自立語並び」というパターンを抽
出する。このパターンに従い、それぞれ、自立語並び1
格納ストリームJF、付属語並び格納ストリームFZ、
自立語並び2格納ストリームJBを用意する。形態素解
析された単語列は、一旦、単語取り出しバッファWDに
読み込んだ上で、この並びにしたがって、自立語なら自
立語が続く限り順次各ストリームに読み込まれ、規則と
のマッチングを行なう。
FIG. 3 is a flow chart showing an example of the operation of the word group extraction unit 15 in one embodiment of the relational expression extraction device of the present invention. As described above, the word group extraction unit 15 extracts, for example, the pattern “preceding independent word arrangement + adjunct word arrangement + successive independent word arrangement” based on the relational expression extraction rule. Independent word sequence 1 according to this pattern
Storage stream JF, auxiliary word sequence storage stream FZ,
An independent word line 2 storage stream JB is prepared. The morphologically analyzed word string is once read into the word extraction buffer WD, and accordingly, as long as the independent word continues as long as the independent word continues, it is sequentially read into each stream to perform matching with the rule.

【0043】S31において、まず、自立語並び1格納
ストリームJF、付属語並び格納ストリームFZ、自立
語並び2格納ストリームJBをクリアする。S32にお
いて、文の最後に達していない場合には、S33で形態
素解析された単語列から単語を1つ取り出し、単語取り
出しバッファWDに読み込む。S34で単語取り出しバ
ッファWDに読み込まれた単語が自立語か否かを判定
し、自立語であれば、S35で自立語並び1格納ストリ
ームJFに追加する。そして、S32へ戻り、次の単語
の処理を繰り返す。S34の判断において、自立語でな
い場合には、S36で単語取り出しバッファWDに読み
込まれている単語を付属語並び格納ストリームFZに追
加する。また、S37において、自立語並び1格納スト
リームJFに格納されている単語群が複合表現である場
合には、その複合表現のみで一つの関係表現となり得る
ので、表現格納ストリームEXに書き出す。
In S31, first, the independent word sequence 1 storage stream JF, the adjunct word sequence storage stream FZ, and the independent word sequence 2 storage stream JB are cleared. If the end of the sentence is not reached in S32, one word is extracted from the word string subjected to the morphological analysis in S33, and is read into the word extraction buffer WD. In S34, it is determined whether or not the word read into the word extraction buffer WD is an independent word, and if it is an independent word, it is added to the independent word arrangement 1 storage stream JF in S35. Then, the process returns to S32 and the processing of the next word is repeated. If the word is not an independent word in the determination in S34, the word read in the word extraction buffer WD in S36 is added to the auxiliary word alignment storage stream FZ. Further, in S37, when the word group stored in the independent word sequence 1 storage stream JF is a compound expression, the compound expression alone can be one relational expression, and therefore it is written to the expression storage stream EX.

【0044】S38において、これまでに取り出された
前自立語並びおよび付属語並びにより、表現抽出規則を
参照し、一致する規則があるか否かを判定する。一致す
る規則がない場合には、S31へ戻り、新たなパターン
の探索を開始する。一致する規則が存在する場合には、
S39で単語取り出しバッファWDに読み込まれている
単語の位置を、ポジション変数WPに保持する。
In S38, the expression extraction rule is referred to based on the pre-independent word sequence and the adjunct word extracted so far, and it is determined whether there is a matching rule. If there is no matching rule, the process returns to S31 to start searching for a new pattern. If there is a matching rule,
The position of the word read in the word extraction buffer WD in S39 is held in the position variable WP.

【0045】S40において、文の最後か否かを判定し
た後、文の途中の場合には、S41で単語取り出しバッ
ファWDに次の単語を取り出す。S42において、取り
出した単語が自立語か否かを判定する。取り出した単語
が自立語である場合には、S43において、取り出した
単語を自立語並び2格納ストリームJBに格納し、S4
0へ戻って、次の単語の処理を行なう。また、S42に
おいて、S41で取り出した単語が自立語でない場合に
は、S44において、自立語並び1格納ストリームJ
F、付属語並び格納ストリームFZ、自立語並び2格納
ストリームJBの内容により、単語群抽出規則を参照し
て、一致する規則があるか否かを判定する。不一致であ
れば、S45で自立語並び2格納ストリームJBをクリ
アし、S40へ戻って、新たな後自立語並びの探索を行
なう。一致する規則がある場合には、S46において、
自立語並び1格納ストリームJF、付属語並び格納スト
リームFZ、自立語並び2格納ストリームJBからなる
単語群を、表現格納ストリームEXに書き出す。
After determining in S40 whether or not the sentence is at the end, if the sentence is in the middle, the next word is fetched in the word fetch buffer WD in S41. In S42, it is determined whether the extracted word is an independent word. If the extracted word is an independent word, in S43, the extracted word is stored in the independent word arrangement 2 storage stream JB, and S4
Returning to 0, the next word is processed. If the word extracted in S41 is not an independent word in S42, the independent word arrangement 1 storage stream J is determined in S44.
Based on the contents of F, the attached word sequence storage stream FZ, and the independent word sequence 2 storage stream JB, it is determined whether or not there is a matching rule by referring to the word group extraction rule. If they do not match, the independent word arrangement 2 storage stream JB is cleared in S45, the process returns to S40, and a new post independent word arrangement is searched. If there is a matching rule, in S46,
The word group consisting of the independent word sequence 1 storage stream JF, the adjunct word sequence storage stream FZ, and the independent word sequence 2 storage stream JB is written to the expression storage stream EX.

【0046】S40で文の最後を検出した場合、すなわ
ち、パターンが抽出できなかった場合、および、S46
までのステップにより単語群を検出して表現格納ストリ
ームEXに書き出した場合には、後自立語群の抽出処理
を終了し、S47で単語取り出しバッファWDの位置を
ポジション変数WPの位置に戻し、S31へ戻って、ポ
ジション変数WPの次の単語の処理から再開する。
When the end of the sentence is detected in S40, that is, when the pattern cannot be extracted, and S46
When the word group is detected by the steps up to and is written in the expression storage stream EX, the process of extracting the independent word group is ended, the position of the word extraction buffer WD is returned to the position of the position variable WP in S47, and S31 Returning to, processing is resumed from the processing of the next word of the position variable WP.

【0047】S32において、文の最後を検出すると、
S48で自立語並び1格納ストリームJFに格納されて
いる単語群が複合表現である場合には、その複合表現を
表現格納ストリームEXに書き出し、単語群抽出部15
の処理を終了する。
When the end of the sentence is detected in S32,
If the word group stored in the independent word sequence 1 storage stream JF in S48 is a compound expression, the compound expression is written to the expression storage stream EX, and the word group extraction unit 15
Is completed.

【0048】図4は、本発明の関係表現抽出装置の一実
施例における単語群抽出部15の動作の別の例を示すフ
ローチャートである。図3に示した例では、「前自立語
並び+付属語並び+後自立語並び」というパターンのう
ち、後自立語並びは付属語並びと連続していなくても抽
出した。このパターンが連続している場合のみ抽出する
ことも可能であり、そのような例を図4に示している。
このようにすることにより、抽出される関係は少なくな
るものの、より確実に接続し得る関係のみ抽出すること
ができる。どのような範囲を抽出するかは、目的に応じ
て適宜選択すればよい。
FIG. 4 is a flow chart showing another example of the operation of the word group extraction unit 15 in the embodiment of the relational expression extraction device of the present invention. In the example shown in FIG. 3, in the pattern “pre-autonomous word sequence + adjunct word sequence + post-independent word sequence”, the post-independent word sequence is extracted even if it is not continuous with the adjunct word sequence. It is also possible to extract only when this pattern is continuous, and such an example is shown in FIG.
By doing so, although there are few relationships to be extracted, it is possible to extract only relationships that can be connected more reliably. The range to be extracted may be appropriately selected according to the purpose.

【0049】S51において、自立語並び1格納ストリ
ームJF、付属語並び格納ストリームFZ、自立語並び
2格納ストリームJBをクリアし、S52において、単
語取り出しバッファWDに形態素解析部14で分割され
た単語1語を取り出す。S53で取り出した単語が自立
語か否かを判定し、自立語である場合には、その単語を
自立語並び1格納ストリームJFに書き込む。自立語で
ない場合には、S55において、単語取り出しバッファ
WDに取り出した単語を付属語並び格納ストリームFZ
に書き込む。
In S51, the independent word sequence 1 storage stream JF, the adjunct word sequence storage stream FZ, and the independent word sequence 2 storage stream JB are cleared, and in S52, the word 1 divided into the word extraction buffer WD by the morpheme analysis unit 14 is used. Take out a word. It is determined whether or not the word extracted in S53 is an independent word. If the word is an independent word, the word is written in the independent word sequence 1 storage stream JF. If it is not an independent word, in S55, the words fetched in the word fetch buffer WD are stored in the auxiliary word sequence storage stream FZ.
Write in.

【0050】そして、自立語並び1格納ストリームJ
F、付属語並び格納ストリームFZに書き込まれた単語
群により、単語群抽出規則を参照し、一致する単語群抽
出規則があるか否かをS56で判定する。一致する単語
群抽出規則がない場合には、S51へ戻り、新たなパタ
ーンの検索を再開する。一致する単語群抽出規則がある
場合には、S57において、自立語並び1格納ストリー
ムJFが複合表現ならば、表現格納ストリームEXに書
き出す。そして、自立語並び2の取得処理を行なう。
The independent word sequence 1 storage stream J
F, the word group extraction rule is referred to by the word group written in the attached word sequence storage stream FZ, and it is determined in S56 whether there is a matching word group extraction rule. If there is no matching word group extraction rule, the process returns to S51 to restart the search for a new pattern. If there is a matching word group extraction rule, in S57, if the independent word sequence 1 storage stream JF is a complex expression, it is written to the expression storage stream EX. Then, the acquisition process of the independent word sequence 2 is performed.

【0051】S58において、単語取り出しバッファW
Dに単語を1語取り出す。S59において、取り出した
単語が自立語か否かを判定し、自立語である場合には、
S60で自立語並び2格納ストリームJBに取り出した
単語を書き込む。自立語でない場合には、S61におい
て、これまで抽出した自立語並び1格納ストリームJ
F、付属語並び格納ストリームFZ、自立語並び2格納
ストリームJBの各単語群をもとに、単語群抽出規則を
参照し、一致する単語群抽出規則があるか否かを判定す
る。一致する単語群抽出規則が存在する場合には、S6
2で表現格納ストリームEXに自立語並び1格納ストリ
ームJF、付属語並び格納ストリームFZ、自立語並び
2格納ストリームJBで構成される表現を出力する。
In S58, the word extraction buffer W
Extract one word into D. In S59, it is determined whether the extracted word is an independent word, and if it is an independent word,
In S60, the extracted word is written in the independent word arrangement 2 storage stream JB. If it is not an independent word, in S61, the independent word sequence 1 storage stream J extracted so far is stored.
Based on each word group of F, the attached word sequence storage stream FZ, and the independent word sequence 2 storage stream JB, the word group extraction rule is referred to and it is determined whether there is a matching word group extraction rule. If there is a matching word group extraction rule, S6
In 2, the expression storage stream EX outputs an expression composed of the independent word sequence 1 storage stream JF, the adjunct word sequence storage stream FZ, and the independent word sequence 2 storage stream JB.

【0052】この時点で、自立語並び2格納ストリーム
JBに格納されている自立語並びは、次の自立語並び1
になり得る。そのため、S61における単語群抽出規則
との一致または不一致にかかわらず、S63において、
自立語並び2格納ストリームJBの内容を自立語並び1
格納ストリームJFにコピーし、付属語並び格納ストリ
ームFZ、自立語並び2格納ストリームJBをクリアす
る。そして、S64で文の終わりか否かを判定した後、
文の最後でなければ、S55へ戻って処理を続行し、文
の最後まで抽出処理が終了した場合は、S65で自立語
並び1格納ストリームJB内の単語群が複合表現であれ
ば、表現格納ストリームEXに書き出して、単語群抽出
部15の処理を終了する。
At this time, the independent word sequence stored in the independent word sequence 2 storage stream JB is the next independent word sequence 1
Can be. Therefore, regardless of whether the word group extraction rule in S61 matches or does not match, in S63,
Independent word sequence 2 Contents of the storage stream JB are independent word sequence 1
It is copied to the storage stream JF, and the adjunct word arrangement storage stream FZ and the independent word arrangement 2 storage stream JB are cleared. Then, after determining in S64 whether or not the sentence is the end,
If it is not the end of the sentence, the process returns to S55 to continue the process, and if the extraction process is completed until the end of the sentence, if the word group in the independent word sequence 1 storage stream JB is a complex expression in S65, the expression storage The data is written to the stream EX, and the processing of the word group extraction unit 15 ends.

【0053】図5は、本発明の関係表現抽出装置の一実
施例における関係抽出部3の動作の一例を示すフローチ
ャートである。単語群抽出部15において抽出された表
現は、表現格納ストリームEXに格納されて関係抽出部
3に渡されるものとする。S71において、表現格納ス
トリームEXから表現を1つ取り出し、S72におい
て、関係抽出規則を参照して、一致するものがあるか否
かを調べる。一致するものがあるときには、S73でそ
の表現と関係を関係格納ストリームRLに書き出す。S
74で表現格納ストリームEXが最後に達したか否かを
判定し、未処理の表現が残っている場合には、S71へ
戻り、次の表現についての処理を繰り返し行なう。表現
格納ストリームEX内の表現がすべて処理された時点
で、関係抽出部3の処理を終了する。
FIG. 5 is a flow chart showing an example of the operation of the relation extracting unit 3 in the embodiment of the relation expression extracting apparatus of the present invention. The expressions extracted by the word group extraction unit 15 are stored in the expression storage stream EX and passed to the relationship extraction unit 3. In S71, one expression is extracted from the expression storage stream EX, and in S72, the relationship extraction rule is referenced to check whether there is a match. If there is a match, the expression and the relationship are written to the relationship storage stream RL in S73. S
In 74, it is determined whether or not the expression storage stream EX has reached the end. If there is an unprocessed expression, the process returns to S71 and the processing for the next expression is repeated. When all the expressions in the expression storage stream EX have been processed, the processing of the relation extracting unit 3 ends.

【0054】図6は、本発明の関係表現抽出装置の一実
施例における正規化部4の動作の一例を示すフローチャ
ートである。関係抽出部3で関係抽出規則に基づいて抽
出された表現およびその関係は、関係格納ストリームR
Lに格納されて、正規化部4に渡されるものとする。S
81において、関係格納ストリームRLから、表現およ
び関係の組を1つ取り出す。S82において、取り出し
た表現が入れ替える必要があるものか否かを判定する。
入れ替えの必要性は、上述したように、用言性の表現が
表現1に存在する場合などで発生する。入れ替えの必要
がある場合には、S83で表現1と表現2を入れ替え
る。入れ替えの必要がない場合には、そのままS84へ
進む。
FIG. 6 is a flow chart showing an example of the operation of the normalizing section 4 in the embodiment of the relational expression extracting device of the present invention. The expressions and their relationships extracted by the relationship extraction unit 3 based on the relationship extraction rules are stored in the relationship storage stream R.
It shall be stored in L and passed to the normalization unit 4. S
At 81, one set of expressions and relationships is retrieved from the relationship storage stream RL. In S82, it is determined whether the extracted expressions need to be replaced.
The necessity of replacement occurs, for example, when there is an expression of verbality in Expression 1, as described above. If it is necessary to replace them, the expressions 1 and 2 are replaced in S83. If there is no need for replacement, the process proceeds directly to S84.

【0055】S84において、上述した正規表現{[関
係] 表現1 表現2}を生成する。生成した正規表現
は、S85で順次結果出力ストリームNEに出力する。
S86において、関係格納ストリームRLが最後に達し
たか否かを判定し、未処理の表現と関係の組が残ってい
る場合には、S81へ戻り、次の表現と関係の組につい
ての処理を繰り返し行なう。関係格納ストリームRL内
の表現と関係の組がすべて処理された時点で、正規化部
4の処理を終了する。
At S84, the above-mentioned regular expression {[relationship] expression 1 expression 2} is generated. The generated regular expression is sequentially output to the result output stream NE in S85.
In S86, it is determined whether or not the relation storage stream RL has reached the end. If there is an unprocessed expression-relational pair remaining, the process returns to S81 to process the next expression-relational pair. Repeat. When all the sets of expressions and relations in the relation storage stream RL have been processed, the process of the normalization unit 4 ends.

【0056】上述の処理の一例では、計算機の負担軽減
のため、解析を形態素解析の範囲にとどめ、2つの自立
語もしくは自立語並びとそのあいだの関係として扱って
いる。この場合、複雑な係り受けなどの関係は抽出され
ないものもあるが、有効な関係の多くは形態素解析情報
により推定可能であり、複雑な関係も、抽出した基本関
係の組み合わせとして表わすことができる。一方、たと
え構文解析を用いたとしても、すべての関係が明確に決
定できるわけではないため、本実施例は効率的な方法で
あるといえる。もちろん、計算機資源などに余裕がある
場合は、構文解析、意味解析などの深い分析を行なうこ
とも有効である。
In the example of the above-mentioned processing, in order to reduce the load on the computer, the analysis is limited to the range of morphological analysis, and it is treated as two independent words or independent word sequences and the relationship between them. In this case, some relationships such as complex relationships are not extracted, but most effective relationships can be estimated by morphological analysis information, and complex relationships can also be expressed as a combination of the extracted basic relationships. On the other hand, even if the syntactic analysis is used, not all the relationships can be clearly determined, so that the present embodiment can be said to be an efficient method. Of course, when computer resources and the like are available, deep analysis such as syntactic analysis and semantic analysis is also effective.

【0057】上述の処理の一例について、具体例をもと
に説明する。ここでは、単語群抽出部15における処理
は、図3に示したように、離れた単語群についても抽出
する場合の処理を用いることとする。 S21でデータ
入力部1から文書を読み込み、S23において、例え
ば、次の1文を文書から読み込んだとする。「我々が実
現したシステムは、本手法適用により文書の高速な検索
機能を実現する。」
An example of the above processing will be described based on a specific example. Here, as the processing in the word group extraction unit 15, as shown in FIG. 3, the processing in the case of extracting even distant word groups is used. It is assumed that the document is read from the data input unit 1 in S21, and the following one sentence is read from the document in S23. "The system we have realized realizes a high-speed document search function by applying this method."

【0058】この1文は、S24において、形態素解析
部14で形態素解析が行なわれ、その結果、次のような
形態素解析結果が得られる。 我々(代名詞) が(格助詞) 実現(サ変) した(する動詞終止/連体) システム(名詞) は(副助詞) 、(記号) 本(接頭語) 手法(名詞) 適用(サ変) により(格助詞相当語) 文書(名詞) の(格助詞) 高速(形容動詞) な(形容動詞語尾/連体) 検索(サ変) 機能(サ変) を(格助詞) 実現(サ変) する(する動詞終止/連体) 。(記号)
In S24, the morpheme analysis unit 14 performs morpheme analysis on this one sentence, and as a result, the following morpheme analysis result is obtained. We (pronouns) realized (case particles) realized (sa change) verb ending / union system (noun) is (adverb), (symbol) book (prefix) method (noun) applied (sa case) (Particle equivalent) Document (noun) (case particle) High-speed (adjective verb) Fast (adjective verb ending / union) Search (sahen) Function (sahen) (case particle) realize (sahen) ). (symbol)

【0059】上述のように形態素解析され、分割された
単語は、S25において、単語群抽出部15により単語
群として抽出される。図7は、単語群抽出規則の一例の
説明図である。単語群抽出部15は、図7に一部を示す
ような単語群抽出規則を用いて、「前自立語並び+付属
語並び+後自立語並び」というパターンの単語群の抽出
を行なう。この単語群抽出規則は、上述のパターンに対
応して、自立語並び1、付属語並び、自立語並び2の各
欄から構成されている。例えば、1行目の規則は、名詞
+「に」+サ変、サ変+「に」+サ変、形容動詞+
「に」+サ変というパターンを表現として抽出すること
を示している。
The words that have been morphologically analyzed and divided as described above are extracted as word groups by the word group extraction unit 15 in S25. FIG. 7 is an explanatory diagram of an example of the word group extraction rule. The word group extraction unit 15 uses a word group extraction rule, a part of which is shown in FIG. 7, to extract a word group having a pattern of “preceding independent word arrangement + adjunct word arrangement + after independent word arrangement”. The word group extraction rule is composed of columns of independent word arrangement 1, adjunct word arrangement, and independent word arrangement 2 corresponding to the above pattern. For example, the rule of the first line is noun + "ni" + sahen, sahen + "ni" + sahen, adjective verb +
It indicates that the pattern "ni" + sahen is extracted as an expression.

【0060】まず、形態素解析結果より単語を順に読み
込み、規則とのパターンマッチを行なう。形態素解析さ
れた単語列は、一旦単語取り出しバッファWDに読み込
んだ上で、この並びにしたがって、自立語なら自立語が
続く限り順次各ストリームに読み込まれ、規則とのマッ
チングを行なう。
First, words are read in order from the result of morphological analysis, and pattern matching with rules is performed. The morphologically analyzed word string is once read into the word extraction buffer WD, and if it is an independent word, therefore, it is sequentially read into each stream as long as the independent word continues, and matching with rules is performed.

【0061】図3のS31で自立語並び1格納ストリー
ムJF、付属語並び格納ストリームFZ、自立語並び2
格納ストリームJBをクリアした後、S33で、まず、
“我々”(代名詞)が単語取り出しバッファWDに読み
込まれる。この単語は自立語であるので、S34からS
35へ進み、“我々”が自立語並び1格納ストリームJ
Fに書き込まれる。S33に戻り、次の単語“が”(格
助詞)が単語取り出しバッファWDに読み込まれる。こ
の単語は自立語ではないので、S34からS36へ進
み、単語“が”が付属語並び格納ストリームFZに書き
込まれる。自立語並び1格納ストリームJFの内容は複
合表現でないので、S37はスキップされる。そして、
S38において、「代名詞+が(格助詞)」というパタ
ーンが、例えば、図7に示すような単語群抽出規則内に
一致するものがあるか否かを判定する。図7には、この
パターンが存在しない。そのため、S31へ戻り、各ス
トリームの内容はクリアされる。
In S31 of FIG. 3, independent word sequence 1 storage stream JF, adjunct word sequence storage stream FZ, independent word sequence 2
After clearing the stored stream JB, first in S33,
"We" (pronoun) is read into the word fetch buffer WD. Since this word is an independent word, S34 to S
35, "we" are independent words and one storage stream J
Written to F. Returning to S33, the next word "ga" (case particle) is read into the word extraction buffer WD. Since this word is not an independent word, the process proceeds from S34 to S36, and the word "ga" is written in the auxiliary word sequence storage stream FZ. Since the content of the independent word sequence 1 storage stream JF is not a compound expression, S37 is skipped. And
In S38, it is determined whether or not the pattern "pronoun + ga (case particle)" matches within the word group extraction rule as shown in FIG. 7, for example. This pattern does not exist in FIG. Therefore, the process returns to S31 and the contents of each stream are cleared.

【0062】続いて、同様に“実現”(サ変)が自立語
並び1格納ストリームJFに、“した”(する動詞終止
/連体)が付属語並び格納ストリームFZに書き込まれ
る。そして、S38で単語群抽出規則が参照される。こ
のとき、「サ変+した(する動詞)」のパターンは、図
7に示す単語群抽出規則中、最下行に示した規則に該当
するため、そのまま保持される。また、S39におい
て、“した”の位置がポジション変数WPに保持され
る。
Then, similarly, "realization" (sa change) is written in the independent word sequence 1 storage stream JF, and "done" (the verb ending / union) is written in the auxiliary word sequence storage stream FZ. Then, the word group extraction rule is referred to in S38. At this time, since the pattern of "sahen + wa (do verb)" corresponds to the rule shown in the bottom line of the word group extraction rules shown in FIG. 7, it is held as it is. Further, in S39, the position of "done" is held in the position variable WP.

【0063】さらに、S41において、“システム”
(名詞)が単語取り出しバッファWDに読み込まれ、S
42で自立語か否かが判定される。“システム”は自立
語であるので、S43で自立語並び2として自立語並び
2格納ストリームJBに書き込まれる。次の単語“は”
(副助詞)が単語取り出しバッファWDに読み込まれる
が、自立語ではないので、S42からS44へ進み、単
語群抽出規則を参照する。このときの各ストリームか
ら、「サ変+した+名詞」というパターンが単語群抽出
規則にあるか否かを判定する。図7に示す単語群抽出規
則の最下行に示した規則が該当するので、「実現/した
/システム」という表現が抽出され、S46において、
表現格納ストリームEXに出力される。以下、自立語と
付属語の間には、‘/’を付して示す。
Further, in S41, "system"
(Noun) is read into the word extraction buffer WD, and S
At 42, it is determined whether the word is an independent word. Since "system" is an independent word, it is written as independent word arrangement 2 in independent word arrangement 2 storage stream JB in S43. The next word "ha"
Although (sub particle) is read into the word extraction buffer WD, but it is not an independent word, the process proceeds from S42 to S44, and the word group extraction rule is referred to. From each stream at this time, it is determined whether or not the pattern “sahen + da + noun” is in the word group extraction rule. Since the rule shown in the bottom line of the word group extraction rule shown in FIG. 7 is applicable, the expression "realized / executed / system" is extracted, and in S46,
It is output to the expression storage stream EX. Hereinafter, "/" is attached between the independent word and the attached word.

【0064】S47で、ポジション変数WPに保持され
ている位置、すなわち、単語“した”の位置に戻し、S
31で各ストリームをクリアして、さらに処理を続け
る。次の単語“システム”が読み込まれて自立語並び1
格納ストリームJFに書き込まれ、“は”が付属語並び
格納ストリームFZに書き込まれる。“システム”(名
詞)+“は”(副助詞)のパターンは図7に示す単語群
抽出規則中に存在しないので、各ストリームはクリアさ
れる。続く「、」は、記号なので単語群抽出規則にはマ
ッチせず、次の単語の処理に移る。次に“本”(接頭
辞)を読み込むが、これも自立語でないため、無視され
る。
In S47, the position held in the position variable WP, that is, the position of the word "do" is returned to S47.
Each stream is cleared at 31 and the processing is further continued. The next word "system" is read and the independent word sequence 1
It is written in the storage stream JF, and "ha" is written in the auxiliary word sequence storage stream FZ. Since the pattern of “system” (noun) + “wa” (sub particle) does not exist in the word group extraction rule shown in FIG. 7, each stream is cleared. The subsequent "," does not match the word group extraction rule because it is a symbol, and the processing for the next word is started. Next, "book" (prefix) is read, but this is also ignored because it is not an independent word.

【0065】今度は、“手法”が自立語並び1格納スト
リームJFに書き込まれる。続く単語“適用”も自立語
であるので、自立語並び1格納ストリームJFに書き込
まれる。この「手法適用」は、いわゆる複合語である。
付属語を伴わない自立語並び単独でも、複合表現として
抽出の対象である。このとき、複合語をまとめて単一の
名詞として扱う。これは、前述のように2つの自立語並
びとその間の関係のみを扱うので、自立語並び1をひと
まとまりに扱う必要があるためである。同じ理由から、
自立語が3つ以上並ぶものを単独で抽出する場合も、各
単語が直結するという以上の関係は特定しない。
This time, the "method" is written in the independent word sequence 1 storage stream JF. Since the subsequent word "apply" is also an independent word, it is written in the independent word sequence 1 storage stream JF. This "method application" is a so-called compound word.
An independent word sequence without an accompanying word is also a target for extraction as a compound expression. At this time, the compound words are collectively treated as a single noun. This is because, as described above, since only two independent word sequences and the relationship between them are handled, it is necessary to handle the independent word sequence 1 as a unit. For the same reason,
Even when extracting three or more independent words arranged independently, a relationship other than the direct connection of each word is not specified.

【0066】続いて、次の単語“により”を読み込む
が、このとき前自立語並びはまとめて複合の名詞として
扱う。単語“により”は、格助詞相当語であるので、付
属語並びとして付属語並び格納ストリームFZに書き込
まれる。S37では、自立語並び1格納ストリームJF
内に複合表現が書き込まれているので、この自立語の並
び「手法|適用」を抽出し、表現格納ストリームEXに
書き出す。以下、自立語並びの各単語の間には‘|’を
付して示す。この時点では、“手法適用”+“により”
(名詞+格助詞相当語)というパターンが保持されてい
る。このパターンは、図7の単語群抽出規則の5行目の
パターンに相当する。
Next, the next word "by" is read, but at this time, the preceding independent word sequence is treated as a compound noun. Since the word "by" is a case particle equivalent word, it is written in the adjunct word storage stream FZ as an adjunct word list. In S37, the independent word sequence 1 storage stream JF
Since the complex expression is written in this, this sequence of independent words "method | application" is extracted and written to the expression storage stream EX. Hereinafter, '|' is attached between each word in the independent word sequence. At this point, "applying method" + "by"
The pattern (noun + case particle equivalent) is held. This pattern corresponds to the pattern on the fifth line of the word group extraction rule in FIG.

【0067】続いて、“文書”(名詞)が自立語並び2
格納ストリームJBに書き込まれ、次の単語“の”が単
語取り出しバッファWDに読み出され、自立語ではない
ので、S44に進む。S44において、「名詞+により
+名詞」というパターンと単語群抽出規則との一致が判
定される。図7の単語群抽出規則の5行目のパターン
は、自立語並び2として接続し得る単語は、サ変または
形容動詞に限られる。そのため、続く単語“文書”(名
詞)はマッチせず、このパターンは抽出されない。S4
5で自立語並び2格納ストリームJBをクリアし、S4
0へ戻って、離れた単語とのマッチングを行なう。この
とき、自立語並び1および付属語並びまでのパターンは
固定して考える。
Next, the "document" (noun) is a sequence of independent words 2
It is written in the storage stream JB, and the next word “NO” is read in the word fetch buffer WD. Since it is not an independent word, the process proceeds to S44. In S44, it is determined whether the pattern "noun + by + noun" matches the word group extraction rule. In the pattern on the 5th line of the word group extraction rule of FIG. 7, the words that can be connected as the independent word sequence 2 are limited to the sahen or adjective verbs. Therefore, the following word "document" (noun) does not match and this pattern is not extracted. S4
In step 5, the independent word line 2 storage stream JB is cleared, and S4
Returning to 0, matching with distant words is performed. At this time, the patterns up to the independent word sequence 1 and the adjunct word sequence are fixed and considered.

【0068】今度は“高速”(形容動詞)が自立語並び
2格納ストリームJBに書き込まれるが、「名詞+によ
り+形容動詞」も単語群抽出規則にマッチしない。さら
に、“検索”(サ変)および“機能”(サ変)が自立語
並び2格納ストリームJBに複合表現として書き込まれ
るが、複合表現の品詞は名詞として扱うので、「名詞+
により+名詞」のパターンは単語群抽出規則とマッチし
ない。次に、“実現”(サ変)が自立語並び2格納スト
リームJBに書き込まれる。「名詞+により+サ変」の
パターンは、単語群抽出規則にマッチする。そのため、
S46で「手法|適用/により/実現」という単語群が
抽出され、表現格納ストリームEXに出力される。
This time, "high speed" (adjective verb) is written in the independent word array 2 storage stream JB, but "noun + by + adjective verb" does not match the word group extraction rule. Furthermore, "search" (sa-hen) and "function" (sa-hen) are written in the independent word array 2 storage stream JB as a compound expression, but since the part of speech of the compound expression is treated as a noun, "noun +
Therefore, the pattern of "+ noun" does not match the word group extraction rule. Next, "realization" (sa-hen) is written in the independent word array 2 storage stream JB. The pattern of “noun + by + sahen” matches the word group extraction rule. for that reason,
In S46, the word group "method | application / by / realization" is extracted and output to the expression storage stream EX.

【0069】この時点で、ポジション変数WPは“によ
り”の位置を保持している。S47において、単語取り
出しバッファWDの位置をこの単語に戻し、次の単語か
ら抽出処理を再開する。上述の処理と同様に、自立語並
び1格納ストリームJFに“文書”を書き込み、続いて
“の”を付属語並び格納ストリームFZに書き込み、
“文書”+“の”(名詞+格助詞)というパターンとな
る。ポジション変数WPに“の”の位置を保持させ、自
立語並び2を検索する。まず、“高速”(形容動詞)が
自立語並び2格納ストリームJBに書き込まれ、“な”
(形容動詞語尾)が単語取り出しバッファWDに読み込
まれる。しかし、「名詞+の+形容動詞」のパターンは
単語群抽出規則とマッチしないため、スキップされる。
今度は「検索(サ変)」、「機能(サ変)」が続くの
で、これらは複合名詞として自立語並び2格納ストリー
ムJBにまとめて格納される。結果として、「名詞+の
(格助詞)+(複合)名詞)というパターンで単語群抽
出規則とのパターンマッチに成功し、「文書/の/検索
|機能」が抽出され、表現格納ストリームEXに出力さ
れる。
At this point, the position variable WP holds the position of "due". In S47, the position of the word extraction buffer WD is returned to this word, and the extraction process is restarted from the next word. Similarly to the above-mentioned processing, "document" is written in the independent word sequence 1 storage stream JF, and subsequently "no" is written in the auxiliary word sequence storage stream FZ.
The pattern is "document" + "no" (noun + case particle). The position "WP" is held in the position variable WP, and the independent word sequence 2 is searched. First, "high speed" (adjective verb) is written in the independent word sequence 2 storage stream JB, and "na"
(Adjective verb ending) is read into the word extraction buffer WD. However, the pattern of "noun + no-adjective verb" does not match the word group extraction rule and is skipped.
This time, since "search (sahen)" and "function (sahen)" follow, these are collectively stored in the independent word array 2 storage stream JB as compound nouns. As a result, the pattern matching with the word group extraction rule was successful in the pattern of "noun + (case particle) + (composite) noun", the "document / no / search | function" was extracted, and the expression storage stream EX was extracted. Is output.

【0070】ポジション変数WPに保持されている
“の”の位置にポインタを戻し、次の単語から、再度、
抽出処理を行なうことにより、「高速/な/検索|機
能」が、さらに、“な”の次の単語から抽出処理を行な
って、自立語並び「検索|機能」、および、「検索|機
能/を/実現」が抽出される。
The pointer is returned to the position "NO" held in the position variable WP, and from the next word, again,
By performing the extraction processing, "high speed / na / search / function" further performs extraction processing from the word next to "na", and the independent word sequence "search / function" and "search / function / "/ Realization" is extracted.

【0071】このような処理により、表現格納ストリー
ムEXには、次のような単語群が抽出される。 実現/した/システム(サ変+“した”+名詞) 手法|適用(複合名詞(名詞+サ変)) 手法|適用/によって/実現(複合名詞(名詞+サ変)
+“によって”+サ変) 文書/の/検索|機能(名詞+“の”+複合名詞(サ変
+サ変)) 高速/な/検索|機能(形容動詞+“な”+複合名詞
(サ変+サ変) 検索|機能(複合名詞(サ変+サ変)) 検索|機能/を/実現(複合名詞(サ変+サ変)+
“を”+サ変)
By the above processing, the following word groups are extracted from the expression storage stream EX. Realization / Achieved / System (Sahen + "Shi" + Noun) Method | Apply (Compound Noun (Noun + Sahen)) Method | Apply / By / Realize (Compound Noun (Noun + Sahen))
+ “By” + Sahen) Document / no / search | function (noun + “no” + compound noun (sahen + sahen)) High-speed / na / search | function (adjective verb + “na” + compound noun (sahen + sahen) ) Search | Function (Compound noun (Sahen + Sahen)) Search | Function / Achieve (Compound noun (Sahen + Sahen) +
"Wa" + sa strange)

【0072】単語群抽出部15において、上述のように
して単語群が抽出されると、関係抽出部3により関係を
付与する。図8は、関係抽出規則の一例の説明図であ
る。関係抽出部は、例えば、図8に一部を示すような関
係抽出規則を用いる。関係抽出規則は、単語群抽出部1
5で抽出された自立語並び1、自立語並び2、付属語並
びと、付与すべき関係とを対応づけている。例えば、図
8の1行目では、「名詞またはサ変+“が”+サ変また
は形容動詞」というパターンには、関係[ガ格]を付与
することを示している。関係抽出部3では、表現格納ス
トリームEXから単語群を取り出し、関係抽出規則にマ
ッチするものを取り出して関係を付与して、関係格納ス
トリームRLに出力する。
When the word group extraction unit 15 extracts the word group as described above, the relation extraction unit 3 adds a relation. FIG. 8 is an explanatory diagram of an example of the relation extraction rule. The relationship extraction unit uses, for example, a relationship extraction rule partially shown in FIG. The relation extraction rule is the word group extraction unit 1.
The independent word sequence 1, the independent word sequence 2, and the adjunct word sequence extracted in 5 are associated with the relationship to be given. For example, the first line in FIG. 8 shows that a relation [ga case] is given to the pattern "noun or sahen +" ga "+ sahen or adjective verb". The relationship extracting unit 3 extracts a word group from the expression storage stream EX, extracts a word that matches the relationship extraction rule, adds a relationship, and outputs the relationship storage stream RL.

【0073】上述のように、この例では形態素解析に基
づく単語間の関係を扱うため、付与する関係は、形態素
情報から得られるレベルとしている。しかし、深い解析
を行なえば、さらに詳細な関係を得ることも可能であ
る。
As described above, in this example, since the relation between words based on the morpheme analysis is handled, the added relation is at a level obtained from the morpheme information. However, it is possible to obtain a more detailed relationship by performing a deep analysis.

【0074】上述の例では、まず、図5のS71で表現
格納ストリームEXより最初の表現「実現したシステ
ム」が取り出される。S72において、関係抽出規則を
参照する。この場合、自立語並び1、自立語並び2は、
それぞれ、サ変および名詞であり、“した”は「する動
詞」の活用形であるので、図8に示す関係抽出規則か
ら、関係[スル]が得られる。そのため、S73におい
て、表現に関係[スル]を付与し、関係格納ストリーム
RLに出力する。
In the above example, first, in S71 of FIG. 5, the first expression "realized system" is extracted from the expression storage stream EX. In S72, the relation extraction rule is referenced. In this case, independent word sequence 1 and independent word sequence 2 are
Since they are sa-hen and noun, respectively, and "do" is an inflectional form of "suru verb", the relation [suru] is obtained from the relation extraction rule shown in FIG. Therefore, in S73, the relation [suru] is added to the expression and is output to the relation storage stream RL.

【0075】次の表現「手法適用」は、2語の自立語か
らなる複合表現である。自立語のみの複合表現において
は、2単語の場合は両方の品詞間に「直結」という関係
を付与する。
The following expression "applying method" is a compound expression consisting of two independent words. In a compound expression consisting of only independent words, in the case of two words, a relationship of "direct connection" is given between both parts of speech.

【0076】以下、同様に表現格納ストリームEX内の
各表現に対して関係が求められ、次に示すように、表現
に関係が付与され、関係格納ストリームRLに出力され
る。 実現/した/システム(サ変+“する”+名詞)[ス
ル] 手法/適用(名詞+サ変)[直結] 手法|適用/によって/実現(複合名詞+“によって”
+サ変)[デ格] 文書/の/検索|機能(名詞+“の”+複合名詞)[名
詞接続] 高速/な/検索|機能(形容動詞+“な”+複合名詞)
[ナ格] 検索|機能(サ変+サ変)[直結] 検索|機能/を/実現(複合名詞+“を”+サ変)[ヲ
格]
Similarly, a relationship is obtained for each expression in the expression storage stream EX, and as shown below, the relationship is added to the expression and output to the relationship storage stream RL. Realize / Done / System (Sahen + “do” + noun) [Sul] Method / Apply (Noun + Sahen) [Direct connection] Method | Apply / By / Realize (Compound noun + “By”)
+ Sa-hen) [De-case] Document / no / search | function (noun + "no" + compound noun) [noun connection] Fast / na / search | function (adjective verb + "na" + compound noun)
[Na case] Search | Function (Sahen + Sahen) [Direct connection] Search | Function / Achieve / (Compound noun + "wa" + Sahen) [wo case]

【0077】関係抽出部3における関係抽出および関係
付与の処理が終了すると、関係格納ストリームRLに出
力された表現と関係の対をもとに、正規化部4におい
て、関係の正規化を行ない、順次結果出力ストリームN
Eに出力する。すなわち、正規化により、抽出した関係
から活用や出現順など表層的な表現に依存しない部分を
取り出す。上述したように、正規化処理では、必要に応
じて自立語並び1と自立語並び2を入れ替え、{[関
係] 表現1 表現2}という形式の正規表現を生成す
る。
When the relation extracting and relation giving process in the relation extracting unit 3 is completed, the normalizing unit 4 normalizes the relation in the normalizing unit 4 based on the pair of expression and relation output to the relation storing stream RL. Sequential result output stream N
Output to E. That is, by normalization, parts that do not depend on surface expression such as utilization and appearance order are extracted from the extracted relation. As described above, in the normalization processing, the independent word sequence 1 and the independent word sequence 2 are exchanged as necessary to generate a regular expression of the form {[relationship] expression 1 expression 2}.

【0078】上述の例では、まず、図6のS81で関係
格納ストリームRLより最初の表現と関係の対を取り出
す。取り出した「実現/した/システム(サ変+“す
る”+名詞)[スル]」は、表現の入れ替えの必要なパ
ターンである。S83において、表現1と表現2を入れ
替え、S84において正規表現{[スル] システム実
現}が生成される。得られた正規表現は、S85におい
て、順次結果出力ストリームNEに書き出される。
In the above-mentioned example, first, in S81 of FIG. 6, the first expression-relationship pair is extracted from the relation storage stream RL. The extracted "realization / done / system (sahen +" do "+ noun) [sul]" is a pattern that requires replacement of expressions. In S83, the expression 1 and the expression 2 are replaced with each other, and in S84, the regular expression {[sul] system realization} is generated. The obtained regular expression is sequentially written in the result output stream NE in S85.

【0079】続いて、「手法/適用(名詞+サ変)[直
結]」は、直結表現であるので、そのまま正規表現
{[直結] 手法 適用}が生成され、順次結果出力ス
トリームNEに出力される。以下、同様に正規化処理を
行ない、順次結果出力ストリームNEには次のような結
果が出力される。 {[スル] システム 実現} {[直結] 手法 適用} {[デ格] 手法|適用 実現} {[名詞接続] 文書 検索|機能} {[ナ格] 高速 検索|機能} {[直結] 検索 機能} {[ヲ格] 検索|機能 実現}
Subsequently, since "method / application (noun + sahen) [direct connection]" is a direct connection expression, the regular expression {[direct connection] method application} is generated as it is and sequentially output to the result output stream NE. . Thereafter, the normalization process is similarly performed, and the following result is output to the sequential result output stream NE. {[Through] system realization} {[direct connection] method application} {[de-case] method | application realization} {[noun connection] document search | function} {[na case] high-speed search | function} {[direct connection] search function } {Search for [Wo] | Function realization}

【0080】以上で、例に示した1文に対する関係表現
抽出処理が終了する。正規化し、順次結果出力ストリー
ムNEに出力された関係表現の内容は、図2のS28で
結果出力ストリームSOに書き出され、S22へ戻っ
て、さらに入力文書中にデータが続く限り、同様に1文
単位で処理を続ける。最後に、S29で、こうして得ら
れた関係表現を記憶部5に登録する。これにより、記憶
部5には結果出力ストリームSOに保持された各正規表
現中の関係、表現1、表現2をそれぞれキーとして、原
データである入力文書とともに登録される。
This is the end of the relational expression extraction processing for one sentence shown in the example. The content of the relational expression that has been normalized and sequentially output to the result output stream NE is written to the result output stream SO in S28 of FIG. 2, returns to S22, and as long as data continues in the input document, 1 Continue processing sentence by sentence. Finally, in S29, the relational expression thus obtained is registered in the storage unit 5. As a result, the relationship among the regular expressions held in the result output stream SO, Expression 1 and Expression 2, are registered as keys into the storage unit 5 together with the input document which is the original data.

【0081】記憶部5に登録された文書の検索を行なう
場合には、表現1、表現2、および、関係を検索キーと
して検索を行なう。これにより、表層表現に依存しない
概念、主題から検索を行なうことができるようになる。
検索において意味的に一致するものを得ることで適合率
を向上させ、効率的な検索が可能となる。
When a document registered in the storage unit 5 is searched, the search is performed using Expression 1, Expression 2, and the relation as search keys. As a result, it becomes possible to search from concepts and subjects that do not depend on surface representation.
By obtaining semantically matching items in the search, the matching rate is improved and efficient search is possible.

【0082】上述の具体例では、単語群抽出部15の処
理として、図3に示した処理を用いた。しかし、図4に
示す処理を用いることができる。この場合には、上述の
例文の場合、単語群抽出部15からは次の表現が出力さ
れる。 実現/した/システム(サ変+“した”+名詞) 手法|適用(複合名詞(名詞+サ変)) 高速/な/検索|機能(形容動詞+“な”+複合名詞
(サ変+サ変)) 検索|機能(複合名詞(サ変+サ変)) 検索|機能/を/実現(複合名詞(サ変+サ変)+
“を”+サ変)
In the above-described specific example, the processing shown in FIG. 3 is used as the processing of the word group extraction unit 15. However, the process shown in FIG. 4 can be used. In this case, in the case of the above-mentioned example sentence, the word group extraction unit 15 outputs the following expression. Realization / achieved / system (sahen + “ta” + noun) Method | Apply (compound noun (noun + sahen)) High-speed / na / search | Function (adjective verb + “na” + compound noun (sahen + sahen)) Search | Function (Compound noun (Sahen + Sahen)) Search | Function / Implementation (Compound noun (Sahen + Sahen) +
"Wa" + sa strange)

【0083】この抽出された表現をもとに、関係抽出部
3で関係が付与され、次の関係が付与された表現が得ら
れる。 実現/した/システム(サ変+“する”+名詞)[ス
ル] 手法/適用(名詞+サ変)[直結] 高速/な/検索|機能(形容動詞+“な”+複合名詞)
[ナ格] 検索|機能(サ変+サ変)[直結] 検索|機能/を/実現(複合名詞+“を”+サ変)[ヲ
格]
Based on the extracted expressions, the relation extraction unit 3 gives the relations, and the expressions having the following relations are obtained. Realization / achieved / system (sahen + “do” + noun) [sul] Method / application (noun + sahen) [direct connection] Fast / na / search | function (adjective verb + na) + compound noun)
[Na case] Search | Function (Sahen + Sahen) [Direct connection] Search | Function / Achieve / (Compound noun + "wa" + Sahen) [wo case]

【0084】さらに、正規化部4で正規化し、次の正規
表現が得られる。 {[スル] システム 実現} {[直結] 手法 適用} {[ナ格] 高速 検索|機能} {[直結] 検索 機能} {[ヲ格] 検索|機能 実現}
Further, the normalizing section 4 performs normalization to obtain the following regular expression. {[Through] system realization} {[direct connection] method application} {[na case] high-speed search | function} {[direct connection] search function} {[wo case] search | function realization}

【0085】このようにして求められた正規表現がキー
として文書とともに記憶部5に記憶されることになる。
The regular expression thus obtained is stored as a key in the storage unit 5 together with the document.

【0086】上述の関係表現抽出装置の一実施例では、
正規化部4を含む構成について説明したが、本発明は、
正規化手段を含まない構成とすることも可能である。す
なわち、上述した検索を前提としたシステムでなく、例
えば、原データより概念を抽出するのみのシステムであ
れば、正規化手段は不要である。この場合、構成として
は、図1に示した構成から正規化部4を除き、関係抽出
部3を記憶部5に接続することで実現される。処理の流
れとしても、図2のS27のステップで行なわれる正規
化の処理を省くのみである。具体的には、関係表現格納
ストリームRLより関係表現を取り出した結果を、その
まま結果格納ストリームSOに出力すれば良い。
In one embodiment of the above-described relational expression extracting device,
Although the configuration including the normalization unit 4 has been described, the present invention
It is also possible to adopt a configuration that does not include normalizing means. That is, if the system is not a system based on the above-described search but is, for example, a system that only extracts a concept from the original data, the normalizing means is unnecessary. In this case, the configuration is realized by removing the normalization unit 4 from the configuration shown in FIG. 1 and connecting the relationship extraction unit 3 to the storage unit 5. As for the flow of processing, only the normalization processing performed in step S27 of FIG. 2 is omitted. Specifically, the result of extracting the relational expression from the relational expression storage stream RL may be output to the result storage stream SO as it is.

【0087】関係抽出部3で抽出されたままの表現は、
原データの持つ概念を表していると考えられ、これらを
適宜編集することで、例えば、文献のアブストラクトを
作成したり、OHP発表資料を作成することができる。
これを応用し、要約作成支援システムを実現することが
できる。
The expression as it is extracted by the relation extracting unit 3 is
It is considered that it represents the concept of the original data, and by appropriately editing these, it is possible to create an abstract of a document or an OHP presentation material.
By applying this, a summary creation support system can be realized.

【0088】本発明の関係表現抽出装置は、テキストデ
ータからのキーワード抽出一般に適用でき、前述の実施
例のみに関するものではないことはいうまでもない。例
えば、文書から抽出するのではなく、ユーザの検索要求
から関係を抽出することも可能である。
It goes without saying that the relational expression extraction device of the present invention is applicable to general keyword extraction from text data and is not limited to the above-mentioned embodiment. For example, it is possible to extract the relationship from the user's search request instead of extracting it from the document.

【0089】従来、検索要求の与え方として、SQLな
どの検索用言語を介するものや、いわゆる自然言語イン
ターフェースなどが存在する。しかし、これらは、結局
はキーワード検索の延長であり、AND検索などのよう
に単語単位のキーワードの論理演算に帰着するものでっ
た。
Conventionally, as a method of giving a search request, there are a method of using a search language such as SQL and a so-called natural language interface. However, these are eventually extensions of the keyword search and result in logical operation of keywords in word units such as AND search.

【0090】そこで、本発明の関係表現抽出装置を検索
要求の入力に用いることが考えられる。すなわち、検索
要求として「自立語+付属語+自立語」というパターン
を与え、そこから関係表現を抽出するものである。
Therefore, it is conceivable to use the relational expression extracting device of the present invention for inputting a search request. That is, a pattern of "independent word + adjunct word + independent word" is given as a search request, and a relational expression is extracted from the pattern.

【0091】例えば、ユーザが「文書を作成」「文書か
ら作成」「作成した文書」などの自然な表現を与えた場
合でも、従来の自然言語インターフェースでは区別せず
「文書&作成」といった検索キーを生成するのが一般的
であった。これに対し、本発明の関係表現抽出装置を用
いることにより、それぞれ、「[ヲ格] 文書 作成」
「[カラ] 文書 作成」「[スル] 文書 作成」と
いった関係を伴った表現を抽出できる。これにより、ユ
ーザはごく自然な表記を用いて、簡単に自分の意図を検
索要求として与えることが可能となる。
For example, even when the user gives a natural expression such as “create a document”, “create from a document”, or “created document”, a search key such as “document & create” is not distinguished by the conventional natural language interface. Was generally generated. On the other hand, by using the relational expression extraction device of the present invention, it is possible to “create a [Wo”] document respectively.
Expressions with relations such as "[color] document creation" and "[through] document creation" can be extracted. As a result, the user can easily give his / her intention as a search request using a very natural notation.

【0092】実現方法としては、上述の図1に示した構
成において、正規化部4あるいは関係抽出部3からの出
力を検索手段に与えるように構成すればよい。このと
き、検索されるデータベースには、上述の実施例のよう
に、関係表現がキーとして付与されている必要がある。
As an implementation method, in the configuration shown in FIG. 1 described above, the output from the normalization section 4 or the relation extraction section 3 may be provided to the search means. At this time, the relational expression needs to be added as a key to the searched database, as in the above-described embodiment.

【0093】このように、データベースに登録する情報
に対して付与するキーを生成する場面と、ユーザによる
検索要求に基づいて、検索キーを生成する場面におい
て、本発明の関係表現抽出装置を適用することができ
る。すなわち、データベースへの情報の登録時と、デー
タベース内の情報の検索時に同じ関係表現抽出処理を行
なうように構成した関係表現検索装置を実現することが
できる。以下、このような関係表現検索装置について説
明する。
As described above, the relational expression extracting device of the present invention is applied to the scene of generating the key to be added to the information registered in the database and the scene of generating the search key based on the search request from the user. be able to. That is, it is possible to realize a relational expression search device configured to perform the same relational expression extraction process when information is registered in the database and when information in the database is searched. Hereinafter, such a relational expression search device will be described.

【0094】図9は、本発明の関係表現検索装置の第1
の実施例を示すブロック図である。図中、図1と同様の
部分には同じ符号を付して説明を省略する。6は検索要
求入力部、7は関係展開部、8は出力部、17はキーボ
ード、18はマウス、19はCRTディスプレイであ
る。検索要求入力部6は、キーボード17、マウス18
など、種々の周知の入力手段から構成される。ユーザ
は、検索要求入力部6より、関係に基づく検索要求を入
力する。表現抽出部2は、現データ入力部あるいは検索
要求入力部6より入力されたテキストを解析し、形態素
解析部14で形態素解析を行なって、単語単位に分割
し、単語群抽出部15で単語群抽出規則に基づいて互い
に関係を持ち得る複数の単語およびその品詞などの情報
を、表現として取り出す。関係抽出部3は、表現抽出部
2で抽出された表現に対し、関係を付与する。正規化部
4は、関係抽出部3で付与された関係に基づいて、関係
の付与された表現を正規化し、求める関係表現を得る。
正規化部4で得られた関係表現は、情報の登録時には、
入力された原データとともに、記憶部5でデータベース
に登録される。一方、検索時には、関係展開部7へ正規
表現を渡す。関係展開部7は、正規化部4で得られた正
規表現を展開し、概念的に同一になり得る表現を生成
し、記憶部5を検索する。出力部8は、例えば、CRT
ディスプレイ19などの表示手段で構成され、検索によ
り得られた検索結果が出力される。
FIG. 9 shows a first example of the relational expression retrieval device of the present invention.
It is a block diagram showing an example of. In the figure, the same parts as those in FIG. Reference numeral 6 is a search request input unit, 7 is a relationship expansion unit, 8 is an output unit, 17 is a keyboard, 18 is a mouse, and 19 is a CRT display. The search request input unit 6 includes a keyboard 17 and a mouse 18.
And various other well-known input means. The user inputs a search request based on the relationship from the search request input unit 6. The expression extraction unit 2 analyzes the text input from the current data input unit or the search request input unit 6, performs morpheme analysis by the morpheme analysis unit 14, divides into words, and the word group extraction unit 15 performs word group extraction. Information such as a plurality of words and their parts of speech that may have a relationship with each other based on the extraction rule is extracted as an expression. The relation extracting unit 3 gives a relation to the expressions extracted by the expression extracting unit 2. The normalization unit 4 normalizes the relation-added expression based on the relation given by the relation extraction unit 3, and obtains a relational expression to be obtained.
The relational expression obtained by the normalization unit 4 is
It is registered in the database in the storage unit 5 together with the input original data. On the other hand, at the time of search, the regular expression is passed to the relationship expansion unit 7. The relationship expansion unit 7 expands the regular expression obtained by the normalization unit 4, generates an expression that can be conceptually the same, and searches the storage unit 5. The output unit 8 is, for example, a CRT.
It is composed of display means such as the display 19 and outputs the search result obtained by the search.

【0095】次に、本発明の関係表現検索装置の第1の
実施例における動作の一例について説明する。ここで
は、関係の登録と関係からの検索に分けて述べる。
Next, an example of the operation of the first embodiment of the relational expression search device of the present invention will be described. Here, the registration of the relationship and the search from the relationship will be described separately.

【0096】まず、文書などの原データにより関係を抽
出して、これを記憶部5に記憶する場合の動作について
説明する。この場合の動作は、上述の関係表現抽出装置
の一実施例における動作と同様である。すなわち、デー
タ入力部1より抽出すべき文書データを電子的に読み込
み、読み込んだ文書データから未処理の1文を取り出
す。取り出した1文を形態素解析により単語の並びに分
割する。そして、単語群抽出部15によって、単語群抽
出規則に基づいて、規則にマッチする単語群の抽出処理
が行なわれる。抽出される単語群の基本的なパターンと
しては、例えば、「前自立語並び+付属語並び+後自立
語並び」というパターン、および、複合表現とすること
ができる。単語群抽出部15で抽出された表現は、関係
抽出部3において、関係抽出規則に基づいて、関係が付
与される。そして、正規化部4において、必要に応じて
単語群の入れ替えなどを行なって、正規表現を生成す
る。正規表現としては、例えば、{[関係] 表現1
表現2}という形式とすることができる。
First, the operation of extracting a relationship from original data such as a document and storing it in the storage unit 5 will be described. The operation in this case is similar to the operation in the above-described embodiment of the relational expression extraction device. That is, the document data to be extracted is electronically read from the data input unit 1, and one unprocessed sentence is extracted from the read document data. The extracted one sentence is divided into words by morphological analysis. Then, the word group extraction unit 15 extracts the word group that matches the rule based on the word group extraction rule. The basic pattern of the extracted word group can be, for example, a pattern of "preceding independent word arrangement + adjunct word arrangement + rear independent word arrangement" and a complex expression. The expressions extracted by the word group extraction unit 15 are given a relationship by the relationship extraction unit 3 based on the relationship extraction rule. Then, the normalization unit 4 replaces the word groups as necessary to generate a regular expression. As a regular expression, for example, {[relationship] expression 1
Expression 2}.

【0097】以上で、1文に対する関係表現抽出が終了
する。さらに、入力文書中にデータが続く限り、同様に
1文単位で処理を続ける。最後に、こうして得られた関
係表現を、入力文書とともに記憶部5に登録する。この
とき、各正規表現の表現1,表現2,関係をそれぞれ転
置キーとして、原データである入力文書とともに登録す
ればよい。
This is the end of the relational expression extraction for one sentence. Further, as long as the data continues in the input document, the processing is similarly continued for each sentence. Finally, the relational expression thus obtained is registered in the storage unit 5 together with the input document. At this time, the expression 1, expression 2, and relationship of each regular expression may be registered as transposed keys together with the input document that is the original data.

【0098】以上の処理により、入力した文書から主題
を関係表現として抽出し、データベース上に原文書とと
もに蓄えられる。
Through the above processing, the subject is extracted as a relational expression from the input document and stored in the database together with the original document.

【0099】続いて、あらかじめ抽出した関係に基づく
検索について説明する。検索は、大きくは、検索要求の
入力、関係表現の抽出、関係の展開、データベースへの
問い合わせという流れによる。図10は、本発明の関係
表現検索装置の第1の実施例における検索処理の一例を
示すフローチャートである。最初に、S91において、
検索要求入力部6より、検索要求を自然語として入力す
る。
Next, the search based on the relationship extracted in advance will be described. The search is mainly performed by inputting a search request, extracting a relational expression, developing a relation, and inquiring a database. FIG. 10 is a flowchart showing an example of a search process in the first embodiment of the relational expression search device of the present invention. First, in S91,
The search request input unit 6 inputs the search request as a natural language.

【0100】検索要求が入力されると、S92ないしS
95の処理により、登録時と同様に正規化した関係表現
を抽出する。このときの処理については、登録時に1文
から関係表現を抽出する際と同一のアルゴリズムが適用
できる。例えば、図2ないし図6で示した処理を用いて
正規表現を得ることができる。
When a search request is input, S92 to S92
By the processing of 95, the normalized relational expression is extracted as in the case of registration. For the processing at this time, the same algorithm as when extracting the relational expression from one sentence at the time of registration can be applied. For example, a regular expression can be obtained by using the processing shown in FIGS.

【0101】正規表現が得られると、S96において、
関係展開部7は関係展開規則を参照し、一致する関係展
開規則があるか否かを判定する。関係展開規則がある場
合には、S97で関係展開規則を用いて、正規表現と概
念的に同一になり得る表現を生成する。S98におい
て、正規表現およびS97で生成された展開表現を検索
キーとして用い、記憶部5に対して検索を行なう。得ら
れた検索結果は、S99において、出力部8に出力す
る。
When the regular expression is obtained, in S96,
The relationship expansion unit 7 refers to the relationship expansion rule and determines whether there is a matching relationship expansion rule. If there is a relation expansion rule, the relation expansion rule is used in S97 to generate an expression that can be conceptually identical to the regular expression. In S98, the storage unit 5 is searched using the regular expression and the expanded expression generated in S97 as a search key. The obtained search result is output to the output unit 8 in S99.

【0102】上述の動作の一例を具体例をもとに説明す
る。具体例として、ユーザが「何らかのシステムを実現
したもの」に関する文献を検索したいとする。S91に
おいて、検索要求入力部6から検索要求を入力する。こ
のとき、実際の検索要求としては、例えば、「システム
を実現した」という本来の検索意図にごく近い表現を自
然語で与える。
An example of the above operation will be described based on a specific example. As a specific example, suppose that the user wants to search for documents related to "what realized a system". In S91, the search request is input from the search request input unit 6. At this time, as an actual search request, for example, an expression "a system is realized" which is very close to the original search intention is given in a natural language.

【0103】検索要求が入力されると、S92におい
て、「システムを実現した」という検索要求を、まず、
形態素解析部14で形態素解析する。形態素解析の結果
を以下に示す。 システム(名詞) を(格助詞) 実現(サ変) した(する動詞終止/連体)
When the search request is input, in S92, the search request "system realized" is first issued.
The morphological analysis unit 14 performs morphological analysis. The results of morphological analysis are shown below. The system (noun) is realized (case particle) (sa strange) (is a verb ending / union)

【0104】続いて、S93において、単語群抽出部1
5で単語群を抽出する。このとき抽出するパターンとし
て、「前自立語並び+付属語並び+後自立語並び」と
し、例えば、図7に示すような単語群抽出規則を用いる
と、次の1つの表現が得られる。 システム/を/実現(名詞+“ヲ”+サ変)
Then, in S93, the word group extraction unit 1
In step 5, the word group is extracted. As the pattern to be extracted at this time, “preceding independent word arrangement + adjunct word arrangement + sufficient independent word arrangement” is used, and if the word group extraction rule as shown in FIG. 7 is used, the following one expression is obtained. System / Achieve / Realize (Noun + "wo" + Sahen)

【0105】また、S94において、関係抽出部3で関
係を付与する。このとき、例えば、図8に示すような関
係抽出規則を用いると、単語群抽出部15で抽出された
上述の表現に[ヲ格]が付与され、次のような関係が付
与された表現が得られる。システム/を/実現(名詞+
“を”+サ変)[ヲ格]
Further, in S94, the relation extraction unit 3 gives a relation. At this time, for example, if a relation extraction rule as shown in FIG. 8 is used, [wo case] is given to the above-mentioned expression extracted by the word group extraction unit 15, and an expression with the following relation is given. can get. System / Implement / Realize (Noun +
"Wa" + Sa strange) [Wo]

【0106】さらに、S95において、正規化部4で正
規表現を生成する。このとき生成される正規表現を
{[関係] 表現1 表現2}とすると、上述の関係が
付与された表現から、次のような正規表現が得られる。
この例では、自立語並びを入れ替える必要がないので、
そのまま、前自立語並びを表現1、後自立語並びを表現
2とする。 {[ヲ格] システム 実現}
Further, in S95, the normalizing section 4 generates a regular expression. Assuming that the regular expression generated at this time is {[relationship] expression 1 expression 2}, the following regular expression is obtained from the expressions to which the above-mentioned relationship is given.
In this example, it is not necessary to switch the independent word sequence, so
As it is, the front independent word sequence is represented as expression 1 and the rear independent word sequence is represented as expression 2. {[Wo] system realization}

【0107】このようにして、正規化された関係表現が
得られた。検索要求の場合には、正規化された関係表現
が得られると、関係展開部7に送られる。関係展開部7
において、正規化された関係表現を展開し、概念的に同
一になり得るものを生成する。展開には、関係展開規則
を用いる。図11は、本発明の関係表現検索装置の第1
の実施例における関係展開規則の一例の説明図である。
図11に示したように、関係展開規則は、正規化部4で
得られた正規表現中の関係、表現1、表現2の組と、展
開可能な関係とが対になって登録されている。上述の例
では、関係がヲ格、表現1が名詞、表現2がサ変である
ので、図11の2行目の規則にマッチする。そのため、
S96からS97に進む。このとき得られた表現は、
[ヲ格]以外に[ノ格],[直結],[スル]に展開可
能であることが分かる。これに従い、S97で次のよう
な関係表現を生成する。 {[ヲ格] システム 実現} {[ノ格] システム 実現} {[直結] システム 実現} {[スル] システム 実現}
In this way, a normalized relational expression was obtained. In the case of a search request, when the normalized relational expression is obtained, it is sent to the relation expansion unit 7. Relationship development department 7
In, the normalized relational expressions are expanded to generate what can be conceptually the same. The relation expansion rule is used for expansion. FIG. 11 shows a first example of the relational expression search device of the present invention.
6 is an explanatory diagram of an example of a relationship expansion rule in the embodiment of FIG.
As shown in FIG. 11, in the relation expansion rule, the relation in the regular expression obtained by the normalization unit 4, the set of the expressions 1 and 2 and the expandable relation are registered as a pair. . In the above example, the relation is o, the expression 1 is a noun, and the expression 2 is sa, so it matches the rule on the second line of FIG. 11. for that reason,
The process proceeds from S96 to S97. The expression obtained at this time is
It can be seen that it can be expanded to [No Case], [Direct Connection], and [Through] in addition to [Wo Case]. Accordingly, the following relational expression is generated in S97. {[Wo] system realization} {[No case] system realization} {[Direct connection] system realization} {[Thru] system realization}

【0108】そして、S98において、展開した関係表
現に基づいて、データベースシステム16への問い合わ
せを行なう。この場合、得られた各関係表現をキーとし
て検索を行なう。検索結果は、S99において、CRT
ディスプレイ19に出力される。
Then, in S98, an inquiry is made to the database system 16 based on the expanded relational expression. In this case, a search is performed using each obtained relational expression as a key. The search result is the CRT in S99.
It is output to the display 19.

【0109】検索の結果として得られた候補は、概念的
に同一になり得るものである。例えば、上述の関係表現
抽出装置の具体例において抽出し、記憶部5に登録した
文書は、{[スル] システム 実現}という関係表現
を持つため、検索される。この文書は、少なくともある
システムを実現したことについて述べているから、候補
として妥当である。
The candidates obtained as a result of the search can be conceptually the same. For example, the document extracted in the above-described specific example of the relational expression extracting device and registered in the storage unit 5 has the relational expression {[Sul] system realization}, and is searched. This document is a good candidate, since it describes at least the implementation of a system.

【0110】一方、例えば、別の文書が「このシステム
が実現する機能」というフレーズを持つとする。このフ
レーズから抽出される関係表現は、{[ガ格] システ
ム実現}のようになる。この場合、表現1,表現2は全
く同一であるが、先ほどの展開結果に関係[ガ格]は含
まれないので、文書中の他の部分にマッチする関係表現
がない限り候補にならない。実際、「このシステムが実
現する機能」は、「システムを実現した」とは異なる概
念を表わすため、検索されないことは妥当である。
On the other hand, for example, another document is assumed to have the phrase "function realized by this system". The relational expression extracted from this phrase is as follows. In this case, Expression 1 and Expression 2 are exactly the same, but since the relation [ga case] is not included in the expansion result, it is not a candidate unless there is a relational expression that matches other parts in the document. In fact, “function realized by this system” represents a concept different from “function realized by the system”, and therefore it is appropriate that it is not searched.

【0111】このように、この実施例では、ユーザが必
要とする概念を、表層構造を気にせずに自然語を用い
て、容易に検索することができる。さらに、関係表現を
介して検索を行なうことにより、不要な候補の出現が低
減される。
As described above, in this embodiment, the concept required by the user can be easily retrieved using the natural language without worrying about the surface structure. Further, by performing a search through the relational expression, the appearance of unnecessary candidates is reduced.

【0112】上述の関係表現検索装置の第1の実施例で
は、検索要求として自然語を入力したが、本発明の関係
表現検索装置としては、検索要求として自然語入力に限
定されることはない。例えば、正規化部4から出力され
る関係、表現1、表現2をユーザが与えて検索すること
ももちろん可能である。この場合、検索要求入力部6か
らの入力は、直接、関係展開部7に入力されるように構
成する。あるいは、表現抽出部2、関係抽出部3、正規
化部4で処理を行なわずに、関係展開部7に入力される
ように構成すればよい。
In the first embodiment of the relational expression search device described above, the natural language is input as the search request, but the relational expression search device of the present invention is not limited to the input of the natural language as the search request. . For example, it is of course possible that the user gives the relation, the expression 1, and the expression 2 output from the normalization unit 4 and retrieves them. In this case, the input from the search request input unit 6 is directly input to the relationship expansion unit 7. Alternatively, the expression extracting unit 2, the relationship extracting unit 3, and the normalizing unit 4 may be configured to be input to the relationship expanding unit 7 without performing processing.

【0113】図12は、本発明の関係表現検索装置の第
1の実施例におけるGUIを用いた検索要求の入力画面
の一例の説明図である。図中、101は表現1入力部、
102は表現2入力部、103は関係選択部、104は
検索指示ボタン、105は検索結果リストサブウィンド
ウ、106は内容表示サブウィンドウである。近年、G
UI(Graphical User Interfa
ce)の進歩が顕著である。そこで、GUIを用いて、
検索要求として関係、表現1、表現2を入力するための
ウィンドウイメージを図12に示している。ここでは、
検索要求入力部6における入力のための表示と、出力部
8における検索結果の表示を1つのウィンドウ内に表示
した場合の一例を示している。
FIG. 12 is an explanatory diagram showing an example of a search request input screen using the GUI in the first embodiment of the relational expression search device of the present invention. In the figure, 101 is an expression 1 input section,
102 is an expression 2 input unit, 103 is a relation selection unit, 104 is a search instruction button, 105 is a search result list subwindow, and 106 is a content display subwindow. In recent years, G
UI (Graphical User Interface)
ce) is remarkable. So, using the GUI,
FIG. 12 shows a window image for inputting the relation, expression 1, and expression 2 as a search request. here,
An example of a case where the display for input in the search request input unit 6 and the display of the search result in the output unit 8 are displayed in one window is shown.

【0114】ユーザは、ウィンドウ左上の表現1入力部
101、表現2入力部102において、表現1と表現2
を単語単位で入力する。また、関係はウィンドウ右上の
関係選択部103に配列された各関係を示すボタンをマ
ウスによりセレクトする。図12では、表現1として
「システム」、表現2として「実現」が入力され、関係
としてヲ格が選択されている。このように入力すれば、
検索要求をそのまま関係表現として扱えるため、これを
関係展開部に渡せば、関係表現の展開および検索が可能
である。関係表現の展開および検索の実行は、ウィンド
ウ左上の検索指示ボタン104をマウスによりセレクト
すればよい。
The user selects the expression 1 and the expression 2 in the expression 1 input section 101 and the expression 2 input section 102 at the upper left of the window.
Enter in word units. As for the relation, a button indicating each relation arranged in the relation selection unit 103 on the upper right of the window is selected by the mouse. In FIG. 12, “system” is input as the expression 1, “realization” is input as the expression 2, and the case is selected as the relationship. If you enter like this,
Since the search request can be handled as a relational expression as it is, the relational expression can be expanded and searched by passing it to the relational expansion unit. To develop the relational expression and execute the search, the search instruction button 104 at the upper left of the window may be selected with the mouse.

【0115】検索に成功すると、ウィンドウ左下の検索
結果リストサブウィンドウ105に、検索された候補の
タイトルが関係の情報とともに表示される。ユーザは、
このタイトルを参照し、容易に欲しい結果を選ぶことが
できる。図12においては、関係[スル]に展開された
検索キーによって検索された候補を、検索結果リストサ
ブウィンドウ105に表示されたリスト上でセレクトし
ている。このセレクトにより、文献の内容が右下の内容
表示サブウィンドウ106に表示される。
When the search is successful, the titles of the searched candidates are displayed in the search result list subwindow 105 at the lower left of the window together with related information. The user
You can easily select the desired result by referring to this title. In FIG. 12, the candidates searched by the search key expanded to the relation [Suru] are selected on the list displayed in the search result list subwindow 105. By this selection, the contents of the document are displayed in the contents display subwindow 106 at the lower right.

【0116】このように、自然言語インターフェースに
よらない方式は、例えば、携帯型の検索装置など複雑な
処理を内蔵することが困難である場合には特に有効であ
る。このとき、原データ入力部1、表現抽出部2、関係
抽出部3、正規化部4は、記憶部5に関係表現と文書を
対応させて登録させるときのみ必要であるので、このよ
うな携帯型の検索装置などの場合には搭載する必要はな
い。記憶部5には、例えば、上述の関係表現抽出装置な
どを用いて、あらかじめ関係表現と文書を対応させて登
録しておけばよい。もちろん、文書の登録および更新の
ために、原データ入力部1、表現抽出部2、関係抽出部
3、正規化部4を搭載してもよい。
As described above, the method not relying on the natural language interface is particularly effective when it is difficult to incorporate a complicated process such as a portable search device. At this time, the original data input unit 1, the expression extraction unit 2, the relation extraction unit 3, and the normalization unit 4 are necessary only when the relational expression and the document are registered in the storage unit 5 in association with each other. It does not need to be installed in the case of a type search device. In the storage unit 5, for example, the relational expression and the document may be registered in advance in association with each other using the relational expression extraction device described above. Of course, the original data input unit 1, the expression extraction unit 2, the relation extraction unit 3, and the normalization unit 4 may be installed for registering and updating the document.

【0117】また、上述の関係表現検索装置において
も、正規化部4を用いずに構成することも可能である。
The relational expression search device described above can also be configured without using the normalization unit 4.

【0118】上述の関係表現検索装置によれば、検索要
求として入力された関係表現、または自然語で入力され
た検索要求から抽出した関係表現をキーとして検索する
ことが可能である。その際に、検索要求を概念的に同一
になり得る関係表現に展開して検索を行なうこともでき
る。例えば、検索要求として、{[ノ格] システム実
現}という検索要求が入力されると、概念的に同一にな
り得る関係表現として、{[ノ格] システム 実
現}、{[ヲ格] システム 実現}、{[直結] シ
ステム 実現}などに展開し、そのいずれかにマッチす
るものをすべて検索する。
According to the above-described relational expression search device, it is possible to search using the relational expression input as a search request or the relational expression extracted from the search request input in natural language as a key. At that time, it is possible to expand the search request into a relational expression that can be conceptually the same and perform the search. For example, if a search request of {[no case] system realization} is input as a search request, the relational expressions that can be conceptually the same are {[no case] system realization}, {[wo case] system realization. }, {[Direct connection] system realization}, etc., and search for all that match any of them.

【0119】しかしながら、展開された関係表現すべて
が、常に検索要求と同じ関係を表わしているとは限らな
い。場合によっては、検索要求とは異なる関係を表わし
ていることもあり得る。すなわち、表現によって、概念
的に同一であるかどうかの確信度が異なる。上述の装置
では、ユーザは、検索結果のどのような関係とマッチし
たかを知ることは可能であるが、それが本当に概念的に
同一であるか否かはユーザが自分で判断しなければなら
ず、検索結果が多い場合などに、効率的に検索結果を得
ることが困難である。これを解決する装置として、以下
に確信度を用いて検索結果を並べ替えてユーザに提示
し、効率的な検索を行なう装置の一例を示す。
However, not all the developed relational expressions always represent the same relation as the search request. In some cases, it may represent a relationship different from the search request. In other words, the degree of certainty that they are conceptually the same differs depending on the expression. In the above-mentioned device, the user can know what kind of relationship in the search result is matched, but the user must judge whether it is really conceptually the same or not. However, it is difficult to efficiently obtain search results when there are many search results. As an apparatus that solves this problem, an example of an apparatus that rearranges search results using a certainty factor and presents them to the user to perform an efficient search will be described below.

【0120】図13は、本発明の関係表現検索装置の第
2の実施例を示すブロック図である。図中、図9と同様
の部分には同じ符号を付して説明を省略する。20は確
信度評価部である。
FIG. 13 is a block diagram showing a second embodiment of the relational expression search device of the present invention. In the figure, parts similar to those in FIG. 9 are designated by the same reference numerals, and description thereof will be omitted. Reference numeral 20 is a certainty factor evaluation unit.

【0121】確信度評価部20は、検索に用いられた表
現と正規表現を比較して確信度を評価し、これに基づい
て検索結果を並べ替える。出力部8は、確信度評価部2
0で並べ替えられた検索結果を出力する。
The certainty factor evaluation unit 20 compares the expression used for the search with the regular expression to evaluate the certainty factor, and rearranges the search results based on this. The output unit 8 uses the certainty factor evaluation unit 2
The search results sorted by 0 are output.

【0122】次に、本発明の関係表現検索装置の第2の
実施例における動作の一例について説明する。この実施
例の関係表現検索装置においても、検索時に、関係表現
がキーとして記憶部5に記憶されている必要があるが、
関係の登録については、上述の実施例と同様であるの
で、説明を省略する。
Next, an example of the operation of the second embodiment of the relational expression search device of the present invention will be described. Also in the relational expression retrieval device of this embodiment, the relational expression needs to be stored as a key in the storage unit 5 at the time of retrieval.
The registration of the relationship is the same as that of the above-mentioned embodiment, and the description thereof is omitted.

【0123】あらかじめ抽出した関係に基づく検索につ
いて説明する。図14は、本発明の関係表現検索装置の
第2の実施例における検索処理の一例を示すフローチャ
ートである。図10と同様の処理には同じ番号を付して
ある。S91の検索要求の入力から、S98の検索指示
および検索の実行までは、上述の実施例と同様である。
The search based on the relationship extracted in advance will be described. FIG. 14 is a flowchart showing an example of search processing in the second embodiment of the relational expression search device of the present invention. The same processes as those in FIG. 10 are denoted by the same numbers. The process from the input of the search request in S91 to the search instruction and execution of the search in S98 is the same as in the above-described embodiment.

【0124】S98において、関係展開部7で生成され
た展開表現を検索キーとして用い、記憶部5に対して検
索を行なう。検索結果が得られると、確信度評価部20
は、S111において、検索に用いられた展開表現と正
規表現を比較し、関係評価規則に基づいて確信度を評価
する。続いてS112において、この評価結果に基づい
て検索結果を並べ替え、S113において、出力部8に
出力する。
In S98, the expanded expression generated by the relationship expansion unit 7 is used as a search key to search the storage unit 5. When the search result is obtained, the certainty factor evaluation unit 20
In S111, the expanded expression used for the search is compared with the regular expression, and the certainty factor is evaluated based on the relation evaluation rule. Subsequently, in S112, the search results are rearranged based on this evaluation result, and in S113, the search results are output to the output unit 8.

【0125】上述の関係表現検索装置の第2の実施例に
おける動作の一例を、具体例をもとに説明する。具体例
としては、上述の実施例と同様、ユーザが「何らかのシ
ステムを実現したもの」に関する文献を検索したいとす
る。S91において、検索要求入力部6から検索要求を
入力する。S92における形態素解析、S93における
単語群抽出、S94における関係抽出の後、S95で正
規化して、正規化された関係表現{[ヲ格] システム
実現}が得られる。
An example of the operation of the above-described relational expression search device in the second embodiment will be described based on a specific example. As a specific example, it is assumed that the user wants to search for documents related to "what realized some system", as in the above-described embodiment. In S91, the search request is input from the search request input unit 6. After the morphological analysis in S92, the word group extraction in S93, and the relation extraction in S94, the normalized relation expression {[wo case] system realization} is obtained in S95.

【0126】次に、関係展開部7において、正規化され
た関係表現を展開し、概念的に同一になり得るものを生
成する。図15は、本発明の関係表現検索装置の第2の
実施例における関係展開規則の一例の説明図である。図
15に示した関係展開規則では、正規化部4で得られた
正規表現中の関係と、展開可能な関係のみを対にして登
録してある。このように、図11に示した関係展開規則
を簡略化することも可能である。上述の例では、関係が
ヲ格であるので、図15の2行目の規則にマッチする。
そのため、正規表現は、[ヲ格]以外に[ノ格],[直
結],[スル]に展開可能であることが分かる。これに
従い、S97で次のような関係表現を生成する。 {[ヲ格] システム 実現} {[ノ格] システム 実現} {[直結] システム 実現} {[スル] システム 実現}
Next, the relationship expanding unit 7 expands the normalized relationship expression to generate what can be conceptually the same. FIG. 15 is an explanatory diagram of an example of a relation expansion rule in the second embodiment of the relational expression search device of the present invention. In the relationship expansion rule shown in FIG. 15, only the relationships in the regular expression obtained by the normalization unit 4 and the expandable relationships are registered as a pair. In this way, the relation expansion rule shown in FIG. 11 can be simplified. In the above example, since the relation is wo case, it matches the rule on the second line in FIG.
Therefore, it can be seen that the regular expression can be expanded to [No case], [Direct connection], and [Thru] in addition to [Wo case]. Accordingly, the following relational expression is generated in S97. {[Wo] system realization} {[No case] system realization} {[Direct connection] system realization} {[Thru] system realization}

【0127】そして、S98において、展開した関係表
現に基づいて、データベースシステム16への問い合わ
せを行なう。この場合、得られた各関係表現をキーとし
て検索を行なう。この結果、例えば、それぞれ{[ヲ
格] システム 実現}、{[ノ格] システム 実
現}、{[スル] システム 実現}という関係表現を
もつ文書が記憶部5に登録されている場合、これらの文
書が検索される。
Then, in S98, an inquiry is made to the database system 16 based on the expanded relational expression. In this case, a search is performed using each obtained relational expression as a key. As a result, for example, when documents having the relational expressions of {[wo case] system realization}, {[no case] system realization}, and {[suru] system realization} are registered in the storage unit 5, respectively. The document is searched.

【0128】検索結果が得られると、確信度評価部20
は、S111において検索に用いられた関係ともとの正
規表現の関係を比較して、確信度を評価する。例えば、
{[ノ格] システム 実現}という関係表現を持つ文
書が検索された場合、[ノ格]と、もとの関係[ヲ格]
を比較する。S97において展開された関係表現は、も
との表現と概念的に同一になり得るものであるが、必ず
しも同一の表現であるとは言えないので、同一である確
信度を評価値として与える。
When the search result is obtained, the certainty factor evaluation unit 20
Compares the relationship used in the search in S111 with the relationship of the original regular expression to evaluate the certainty factor. For example,
When a document with a relational expression of {[no case] system realization} is searched, [no case] and the original relationship [wo case]
To compare. The relational expressions developed in S97 can be conceptually the same as the original expressions, but they cannot be said to be the same expressions, so the same certainty factor is given as the evaluation value.

【0129】確信度の評価は、例えば、関係評価規則を
用いて行なうことができる。図16は、本発明の関係表
現検索装置の第2の実施例における関係評価規則の一例
の説明図である。図16に示した例では、例えば、[ヲ
格]と[ヲ格]のように関係がまったく同じか否か、例
えば、[ノ格]から[ヲ格]のように関係がより具体的
になる方向に展開されているか、あるいは、[ヲ格]か
ら[ノ格]のように関係が抽象的になる方向に展開され
ているかなどにより、あらかじめ評価値を決めている。
上述のように、正規化された関係表現{[ヲ格] シス
テム 実現}および展開された関係表現から、それぞれ
{[ヲ格] システム 実現}、{[ノ格] システム
実現}、{[スル] システム 実現}という関係表
現をもつ文書が検索された場合、図16に基づいて、そ
れぞれの関係表現{[ヲ格] システム 実現}、
{[ノ格] システム 実現}、{[スル] システム
実現}には、それぞれ100、80、80という確信
度評価値が与えられる。
The certainty factor can be evaluated by using, for example, a relation evaluation rule. FIG. 16 is an explanatory diagram of an example of the relation evaluation rule in the second embodiment of the relational expression search device of the present invention. In the example shown in FIG. 16, whether or not the relationships are exactly the same, for example, [wo case] and [wo case], more specifically, the relationship is more concrete, for example, from [no case] to [wo case]. The evaluation value is determined in advance depending on whether the relationship is expanded in the direction of, or the relationship is expanded in the direction of abstraction from [wo case] to [no case].
As described above, from the normalized relational expression {[wo case] system realization} and the expanded relational expression, {[wo case] system realization}, {[no case] system realization}, {[thru] When a document having a relation expression "system implementation" is retrieved, based on FIG. 16, each relation expression {[wo case] system implementation},
The {[no case] system realization} and {[thru] system realization} are given confidence evaluation values of 100, 80, and 80, respectively.

【0130】S112において、確信度評価部20は、
評価点に基づいて、例えば、大きい順に検索結果を並べ
替える。そして、S113において、並べ替えられた検
索結果をCRTディスプレイ19に出力する。
At S112, the certainty factor evaluation unit 20
For example, the search results are sorted in descending order based on the evaluation points. Then, in S113, the sorted search results are output to the CRT display 19.

【0131】このように、本実施例によれば、検索結果
を確信度の高い順にユーザに提示することができ、ユー
ザは効率よく結果を参照することができる。
As described above, according to the present embodiment, the search results can be presented to the user in descending order of certainty, and the user can efficiently refer to the results.

【0132】なお、確信度の評価は、上述の方法に限ら
ず、種々の方法を用いることができる。例えば、大量の
データを用いてある関係表現と別の関係表現が同一の関
係になる確率を計算し、これに基づいて確信度を決めて
もよい。また、上述の実施例のように各関係間で確信度
を与えておくのではなく、各関係に関係の抽象度レベル
などを与えておき、その差に基づいて確信度を計算する
ようにしてもよい。さらに、検索結果の表示において
は、単に確信度に基づいて並べ替えて表示するだけでな
く、確信度も共に表示するようにしてもよい。
The evaluation of the certainty factor is not limited to the above method, and various methods can be used. For example, a certain amount of data may be used to calculate the probability that one relational expression and another relational expression have the same relationship, and the certainty factor may be determined based on this. Further, instead of giving the certainty factor between the respective relations as in the above-described embodiment, the relational abstraction level or the like is given to each relation, and the certainty factor is calculated based on the difference. Good. Further, in displaying the search results, not only may the images be sorted and displayed based on the certainty factors, but the certainty factors may be displayed together.

【0133】上述の関係表現検索装置の第2の実施例に
おいても、先の実施例と同様、検索要求として自然語入
力に限定されることはなく、例えば、正規化部4から出
力される関係、表現1、表現2をユーザが与えて検索す
ることももちろん可能である。この場合、検索要求入力
部6からの入力は、直接、関係展開部7に入力されるよ
うに構成する。あるいは、表現抽出部2、関係抽出部
3、正規化部4で処理を行なわずに、関係展開部7に入
力されるように構成すればよい。
In the second embodiment of the relational expression retrieval device described above, the retrieval request is not limited to the input of the natural language as in the previous embodiment, and the relation output from the normalization unit 4 is used, for example. Of course, it is also possible for the user to search by giving Expression 1 and Expression 2. In this case, the input from the search request input unit 6 is directly input to the relationship expansion unit 7. Alternatively, the expression extracting unit 2, the relationship extracting unit 3, and the normalizing unit 4 may be configured to be input to the relationship expanding unit 7 without performing processing.

【0134】図17は、本発明の関係表現検索装置の第
2の実施例におけるGUIを用いた検索要求の入力画面
の一例の説明図である。図中の符号は図12と同様であ
る。上述の関係表現検索装置の第2の実施例において
も、図12に示したようなGUIを用いて検索要求の入
力を行なうことができる。表現1入力部101、表現2
入力部102、および、関係選択部103を用いて、表
現1と表現2およびその関係を入力する。そして検索指
示ボタン104をセレクトすることによって検索が行な
われる。検索に成功すると、ウィンドウ左下の検索結果
リストサブウィンドウ105に、検索された候補のタイ
トルが確信度の大きい順にソートされ、図17に示すよ
うに、確信度、関係の情報とともに表示される。ユーザ
は、このタイトルを参照し、容易に欲しい結果を選ぶこ
とができる。
FIG. 17 is an explanatory diagram showing an example of a search request input screen using a GUI in the second embodiment of the relational expression search device of the present invention. Reference numerals in the figure are the same as those in FIG. Also in the second embodiment of the relational expression search device described above, the search request can be input using the GUI as shown in FIG. Expression 1 input unit 101, Expression 2
Using the input unit 102 and the relation selection unit 103, the expressions 1 and 2 and their relations are input. Then, the search is performed by selecting the search instruction button 104. If the search is successful, the titles of the searched candidates are sorted in descending order of certainty in the search result list subwindow 105 at the lower left of the window, and as shown in FIG. 17, displayed together with information on the certainty and relationship. The user can refer to this title and easily select the desired result.

【0135】このように、自然言語インターフェースに
よらない方式は、図12の場合と同様に、例えば、携帯
型の検索装置など複雑な処理を内蔵することが困難であ
る場合には特に有効であり、記憶部5にあらかじめ抽出
された関係表現を文書と対応させて登録しておけばよ
い。このとき、原データ入力部1、表現抽出部2、関係
抽出部3、正規化部4を用いずに構成することが可能で
ある。また、原データ入力部1のみを搭載し、あらかじ
め抽出された関係表現と原データをそれぞれデータ入力
部1に入力し、これをそのまま記憶部5に記憶するよう
にしてもよい。
As described above, the method not relying on the natural language interface is particularly effective when it is difficult to incorporate a complicated process such as a portable search device, as in the case of FIG. The relational expressions extracted in advance may be registered in the storage unit 5 in association with the document. At this time, it is possible to configure without using the original data input unit 1, the expression extraction unit 2, the relation extraction unit 3, and the normalization unit 4. Alternatively, only the original data input unit 1 may be installed, and the relational expressions and the original data extracted in advance may be input to the data input unit 1 and stored in the storage unit 5 as they are.

【0136】上述の関係表現検索装置の第2の実施例に
おいては、正規化部4で得られた正規表現をもとに関係
展開部7で概念的に同一になり得る表現に展開し、展開
された表現と一致する関係表現をキーとして持つ文書を
検索している。しかし、これに限らず、関係展開部7の
代わりに検索部を設け、正規表現と一致しなくても概念
的に同一になり得る表現を直接検索するように構成して
もよい。この場合、確信度評価部20による確信度の評
価は、正規表現と文書にキーとして付された関係表現を
比較することにより行なえばよい。
In the second embodiment of the relational expression search device described above, the relational expansion unit 7 develops and expands the regular expression obtained by the normalization unit 4 into an expression that can be conceptually the same. You are searching for documents that have a relational expression that matches the specified expression as a key. However, the present invention is not limited to this, and a search unit may be provided in place of the relationship expansion unit 7 to directly search for an expression that can be conceptually the same even if it does not match the regular expression. In this case, the certainty factor evaluation unit 20 may evaluate the certainty factor by comparing the regular expression with the relational expression attached as a key to the document.

【0137】図18は、本発明の関係表現検索装置の第
3の実施例を示すブロック図である。図中、図9、図1
3と同様の部分には同じ符号を付して説明を省略する。
121は解析切り換え部、122は言語別解析部、12
3は言語別関係抽出部、124は対訳単語辞書、125
は対訳関係辞書、126は言語別正規化部、127は登
録部、128は検索部である。
FIG. 18 is a block diagram showing a third embodiment of the relational expression search device of the present invention. In the figure, FIG. 9 and FIG.
The same parts as those in 3 are assigned the same reference numerals and explanations thereof will be omitted.
121 is an analysis switching unit, 122 is a language analysis unit, 12
3 is a language-specific relation extraction unit, 124 is a bilingual word dictionary, and 125.
Is a bilingual relation dictionary, 126 is a language normalization unit, 127 is a registration unit, and 128 is a search unit.

【0138】上述の各実施例では、単一の言語について
のみ適用可能である。すなわち、日本語で記述された原
データがデータベースに蓄積され、それらを日本語によ
り検索する場合には問題はない。しかし、類似の内容を
有する原データが英語やドイツ語など、別の言語で記述
され、データベースに格納されている場合には、これら
のデータを検索することはできない。また、検索要求の
入力も、種々の言語によって行なわれることも考えられ
る。その場合に、入力された言語にかかわらず、類似の
内容を有するデータであれば他の言語で記述されたデー
タをも検索できるようにすることが望ましい。この第3
の実施例では、このような多言語を含むデータベースの
検索を行なう例を示している。
The above-described embodiments are applicable only to a single language. That is, there is no problem when the original data described in Japanese is stored in the database and they are searched in Japanese. However, if the original data having similar contents is described in another language such as English or German and stored in the database, these data cannot be retrieved. It is also possible that the search request is input in various languages. In that case, regardless of the input language, it is desirable to be able to retrieve data described in another language as long as the data has similar contents. This third
In this embodiment, an example of searching a database including such multi-languages is shown.

【0139】データ入力部1は、検索対象であり、検索
のためのキーとなる関係表現を抽出すべき文書データを
入力する部分である。入力される文書データは、日本語
の他、例えば、英語、ドイツ語、フランス語など、他の
言語で記述されていてもよい。また、文書データは、少
なくとも自然言語で記述されたテキストを含むものであ
れば、絵や図形などを含んでいてもよい。
The data input unit 1 is a part for inputting document data which is a search target and from which a relational expression serving as a key for the search is to be extracted. The input document data may be described in other languages such as English, German, French, etc. in addition to Japanese. Further, the document data may include pictures and figures as long as it includes at least text described in natural language.

【0140】表現抽出部2は、入力データを、その入力
データ中のテキストが記述されている言語に応じて解析
し、互いに関係を持ち得る複数の単語とその間の関係か
らなる関係表現を抽出する。表現抽出部2は、解析切り
換え部121、言語別解析部122を含むように構成す
ることができる。
The expression extraction unit 2 analyzes the input data in accordance with the language in which the text in the input data is described, and extracts a relational expression consisting of a plurality of words that may have a relationship with each other and the relationship between them. . The expression extraction unit 2 can be configured to include an analysis switching unit 121 and a language-specific analysis unit 122.

【0141】解析切り換え部121は、入力データ中の
テキストが記述されている言語に応じて、複数の言語別
解析部122の中から対応するものを選択する。テキス
トが記述されている言語の種別は、あらかじめ入力デー
タ中に記録されているか、入力データの入力時にデータ
入力部1や検索要求入力部6から入力データとともに入
力するか、またはテキストの特徴を解析することによっ
て得られる。テキストを解析する方法では、対訳辞書な
どを利用してテキストを構成する各単語を得ることによ
って判別する方法がある。この時用いる対訳辞書は、各
言語が判別できればよいので、10個程度の単語を有す
る程度でも十分利用可能である。ここでは、データ入力
部1から入力されるデータには、あらかじめ文書データ
中に言語の種別が記録されているものとする。言語の種
別の記述方法としては、表題や作成日付などと同様に本
文のテキストとは別に記載する方法と、本文中にタグな
どを用いて埋め込む方法がある。後者の方法では、本文
の一部に他言語で記載されている部分がある場合にも対
処できる。この実施例では、簡単にするため、前者の本
文のテキストとは別に記載する方法を採用する。
The analysis switching section 121 selects a corresponding one from the plurality of language-specific analysis sections 122 according to the language in which the text in the input data is described. The type of language in which the text is described is recorded in the input data in advance, or is input together with the input data from the data input unit 1 or the search request input unit 6 when the input data is input, or the characteristics of the text are analyzed. It is obtained by doing. As a method of analyzing a text, there is a method of determining by obtaining each word that constitutes the text using a bilingual dictionary or the like. The bilingual dictionary used at this time is sufficient as long as it can discriminate each language, so that it can be sufficiently used even if it has about 10 words. Here, it is assumed that the type of language is recorded in advance in the document data in the data input from the data input unit 1. As a method of describing the type of language, there are a method of describing it separately from the text of the text like a title and a creation date, and a method of embedding it in the text by using a tag or the like. The latter method can deal with the case where a part of the text is described in another language. In this embodiment, for simplicity, a method described separately from the text of the former text is adopted.

【0142】言語別解析部122は、文書データ中のテ
キストを解析する。言語別解析部122は、例えば、日
本語、英語、ドイツ語、フランス語など、言語の種類別
に複数用意されている。解析切換え部121の判断結果
によって、該当する言語を解析する解析部が選択され
る。各解析部は、その言語専用の文法規則、辞書などを
備え、各言語を解析するのに適切な構成となっている。
ただし解析エンジンは共通のものを使用してもよい。一
方、解析のレベルを言語別に変えることも可能である。
例えば、英語とドイツ語は共通の言語解析部を用い、日
本語は上述の各実施例のように形態素解析部を用いて構
成することができる。
The language-specific analysis unit 122 analyzes the text in the document data. A plurality of language-specific analysis units 122 are prepared for each language type, such as Japanese, English, German, and French. The analysis unit that analyzes the corresponding language is selected according to the determination result of the analysis switching unit 121. Each analysis unit has a grammar rule, a dictionary, etc. dedicated to that language, and has a configuration suitable for analyzing each language.
However, a common analysis engine may be used. On the other hand, it is also possible to change the analysis level for each language.
For example, English and German can be configured by using a common language analysis unit, and Japanese can be configured by using a morphological analysis unit as in each of the above-described embodiments.

【0143】言語別関係抽出部123は、言語別解析部
122の解析結果から、互いに関係を持ち得る複数の単
語とその間の関係からなる関係表現を抽出する。言語別
関係抽出部123も、言語別解析部122と同様に、言
語の種類別に複数用意されており、該当する言語のもの
が選択される。また、言語別解析部122と同様に、そ
の言語専用の関係抽出規則などの情報を備え、言語別に
適した構成を有している。
The language-specific relation extraction unit 123 extracts a relational expression consisting of a plurality of words that may have a relation with each other and the relation between them, from the analysis result of the language-specific analysis unit 122. As with the language-specific analysis unit 122, a plurality of language-specific relation extraction units 123 are also prepared for each language type, and the corresponding language is selected. Further, like the language-specific analysis unit 122, the language-specific relationship extraction rule and other information are provided, and the configuration is suitable for each language.

【0144】対訳単語辞書124は、複数の言語におけ
る等価な意味の単語が登録されている。また、対訳単語
辞書124は、ある語に対して類似した意味を持つ語を
集めた類義語辞書を複数の言語に拡張したものと考える
こともできる。図19は、対訳単語辞書のデータの一例
の説明図である。例えば、日本語の類義語辞書では、
「生産」という語に対して、「製造」、「制作」、「産
出」などが同義語として登録されている。対訳単語辞書
124では、類似した意味を持つ語を、同一言語だけで
なく複数言語にわたって収録したものである。例えば、
図19に示すように、同じ「生産」という語に関して
は、英語では“produce”,“manufact
ure”,“create”などが、ドイツ語では“s
chaffen”,“produzieren”などが
登録されている。図19に示した対訳単語辞書124で
は、これらの語がそれぞれの言語を示す記号と対をなし
てリストとして保持されている。ある言語の単語を入力
すると、あらかじめ決められたある言語での等価な単語
を出力する。出力言語での等価な単語が複数あるとき
は、例えば、リストの先頭の単語、あるいは、単語のリ
ストを出力するように構成することができる。この対訳
単語辞書124によって、種々の言語の単語を入力と
し、あらかじめ決められたある言語に統一した類似語を
得ることができる。
In the bilingual word dictionary 124, words having equivalent meanings in a plurality of languages are registered. Further, the bilingual word dictionary 124 can be considered as an extension of a synonym dictionary in which words having similar meanings to a certain word are expanded to a plurality of languages. FIG. 19 is an explanatory diagram of an example of the data of the bilingual word dictionary. For example, in a Japanese synonym dictionary,
With respect to the word "production", "manufacturing", "production", "production", etc. are registered as synonyms. In the bilingual word dictionary 124, words having similar meanings are recorded not only in the same language but also in a plurality of languages. For example,
As shown in FIG. 19, with respect to the same word “production”, “produce” and “manufact” in English.
"ure", "create", etc. are "s" in German.
“Chaffen”, “produzieren”, etc. are registered. In the bilingual word dictionary 124 shown in FIG. 19, these words are held as a list in pairs with symbols indicating the respective languages. When you input, the equivalent word in a predetermined language is output. When there are multiple equivalent words in the output language, for example, output the first word of the list or a list of words. With this bilingual word dictionary 124, it is possible to input words in various languages and obtain similar words unified in a predetermined language.

【0145】対訳関係辞書125は、複数の言語におけ
る等価な言語的関係を表わす関係名が登録されている。
図20は、対訳関係辞書のデータの一例の説明図であ
る。ここでは、上述の各例における「ガ格」、「ヲ格」
等を「GA−NOMINATIVE」、「WO−ACC
USATIVE」等のように示している。言語間の関係
は、例えば、日本語の「WO−ACCUSATIVE」
という関係に対して、英語、ドイツ語、フランス語では
「ACC」という関係が登録されている。ある言語での
関係を入力すると、あらかじめ決められたある出力言語
での等価な関係名を出力する。この対訳関係辞書125
を用いることによって、それぞれの言語における関係
を、あらかじめ決められたある言語での関係に統一する
ことができる。
In the bilingual relation dictionary 125, relation names representing equivalent linguistic relations in a plurality of languages are registered.
FIG. 20 is an explanatory diagram of an example of data in the bilingual relation dictionary. Here, "ga" and "wo" in the above examples
"GA-NOMINATIVE", "WO-ACC"
"USATIVE" or the like. The relationship between languages is, for example, Japanese “WO-ACCUSATIVE”.
On the other hand, the relationship "ACC" is registered in English, German and French. When you input a relation in a certain language, the equivalent relation name in a predetermined output language is output. This bilingual dictionary 125
By using, the relationship in each language can be unified to the relationship in a predetermined language.

【0146】言語別正規化部126は、言語別関係抽出
部123で抽出された関係表現を言語に依存しない表現
に正規化する。言語に依存しない表現として、もとのテ
キストが記述された言語によらず、あらかじめ定めた言
語、例えば、日本語の表現に変換する。言語の正規化に
は、対訳単語辞書124および対訳関係辞書125を用
いる。関係表現を構成する単語を対訳単語辞書124を
用いてあらかじめ定めた言語に翻訳し、関係を表わす記
号を対訳関係辞書125を用いてあらかじめ定めた言語
での記号に変換する。この言語別正規化部126によ
り、ある言語に統一した単語及び関係が得られる。
The language-based normalization unit 126 normalizes the relational expressions extracted by the language-based relation extraction unit 123 into language-independent expressions. As a language-independent expression, it is converted into a predetermined language, for example, a Japanese expression, regardless of the language in which the original text is written. The bilingual word dictionary 124 and the bilingual relation dictionary 125 are used for language normalization. The words constituting the relational expression are translated into a predetermined language using the bilingual word dictionary 124, and the symbols representing the relation are converted into symbols in a predetermined language using the bilingual relation dictionary 125. The language-based normalization unit 126 can obtain words and relationships unified in a certain language.

【0147】登録部127は、言語別正規化部26から
得られた言語に依存しない正規化された関係表現をキー
として、データ入力部1から入力された文書データと共
に記憶部5に登録する。これにより、記憶部5には言語
に依存しない関係表現がキーとして付加されて、文書デ
ータが格納される。
The registration unit 127 registers in the storage unit 5 together with the document data input from the data input unit 1, using the normalized relational expression independent of the language obtained from the language normalization unit 26 as a key. As a result, the language-independent relational expression is added as a key to the storage unit 5, and the document data is stored.

【0148】検索部128は、関係展開部7より得られ
た展開された関係表現がキーとして、記憶部3に登録さ
れている文書データを検索する。関係展開部7から与え
られる関係表現は、言語別正規化部127によって言語
に依存しない表現に正規化されている。また、記憶部5
に格納されている文書データに付加されたキーも言語に
依存しない表現に正規化されている。そのため、検索部
128は、言語に依存しない表現によって検索を行なう
ことができる。
The search unit 128 searches the document data registered in the storage unit 3 using the expanded relational expression obtained by the relationship expansion unit 7 as a key. The relational expression given from the relational expansion unit 7 is normalized by the language normalization unit 127 into a language-independent expression. Also, the storage unit 5
The key added to the document data stored in is also normalized to a language-independent expression. Therefore, the search unit 128 can perform a search using a language-independent expression.

【0149】なお、この実施例では、登録部127及び
検索部128を明示的に示しているが、上述の各実施例
においても当然に備わっている構成である。また、言語
別正規化部126から出力される言語に依存しない正規
化された検索要求が、関係展開部7を介さずに、直接、
確信度評価部20に入力されているが、関係展開部7を
介すか否かはどちらでもよい。上述の第2の実施例にお
いても、関係展開部7を介さずに、正規化された検索要
求を直接確信度評価部20に入力するように構成しても
よい。
Although the registration unit 127 and the search unit 128 are explicitly shown in this embodiment, they are naturally provided in each of the above embodiments. In addition, the normalized search request that does not depend on the language and that is output from the language-based normalization unit 126 does not go through the relationship expansion unit 7, but directly.
Although input to the certainty factor evaluation unit 20, it does not matter whether the relation expansion unit 7 is used or not. Also in the above-described second embodiment, the normalized search request may be directly input to the certainty factor evaluation unit 20 without going through the relationship expansion unit 7.

【0150】以下、本発明の第3の実施例における動作
の一例を説明する。以下の説明では、関係表現の登録時
の動作と、関係表現からの検索時の動作に分けて説明す
る。
An example of the operation of the third embodiment of the present invention will be described below. In the following description, the operation at the time of registering the relational expression and the operation at the time of searching from the relational expression will be described separately.

【0151】図21は、本発明の関係表現検索装置の第
3の実施例における関係表現の登録時の動作の一例を示
すフローチャートである。検索のためのキーとしての関
係表現の登録時には、データ入力部1、表現抽出部2、
言語別関係抽出部123、言語別正規化部126、登録
部127、および、記憶部5が動作する。
FIG. 21 is a flow chart showing an example of the operation at the time of registration of a relational expression in the third embodiment of the relational expression search device of the present invention. When registering a relational expression as a key for searching, the data input unit 1, the expression extracting unit 2,
The language-specific relationship extraction unit 123, the language-specific normalization unit 126, the registration unit 127, and the storage unit 5 operate.

【0152】S131において、データ入力部1より文
書データを読み込み、解析切り換え部121および登録
部127に送る。解析切り換え部121は、S132に
おいて、文書データに記載されている、テキストが記述
されている言語の種別に関する情報を読み取り、その言
語に応じた言語別解析部122、言語別関係抽出部12
3、言語別正規化部126を選択する。S133におい
て、解析切り換え部121で選択された言語に応じた言
語別解析部122は、文書データ中のテキストを解析す
る。S134において、解析切り換え部121で選択さ
れた言語に応じた言語別関係抽出部123は、テキスト
の解析結果をもとに、選択された言語に応じた関係を抽
出する。S135では、解析切り換え部121で選択さ
れた言語に応じた言語別正規化部126は、対訳単語辞
書124および対訳関係辞書125を用い、S134で
抽出された関係をあらかじめ決められたある言語の関係
に正規化する。そして、S136において、登録部12
7は、S135で正規化した関係とS131で読み込ん
だ文書データとを対にして記憶部5に登録する。
In S131, the document data is read from the data input unit 1 and sent to the analysis switching unit 121 and the registration unit 127. In S132, the analysis switching unit 121 reads the information about the type of language in which the text is described, which is described in the document data, and the analysis unit 122 by language and the relationship extraction unit by language 12 according to the language.
3. Select the language-specific normalization unit 126. In S133, the language-specific analysis unit 122 corresponding to the language selected by the analysis switching unit 121 analyzes the text in the document data. In S134, the language-specific relation extraction unit 123 corresponding to the language selected by the analysis switching unit 121 extracts a relation according to the selected language based on the text analysis result. In S135, the language-based normalization unit 126 corresponding to the language selected in the analysis switching unit 121 uses the bilingual word dictionary 124 and the bilingual relation dictionary 125 to set the relation extracted in S134 to a predetermined language relation. Normalize to. Then, in S136, the registration unit 12
In step 7, the relationship normalized in S135 and the document data read in step S131 are paired and registered in the storage unit 5.

【0153】この登録時の動作を、具体例を用いて説明
する。ここでは、データ入力部1から入力される文書デ
ータ中のテキストは英語で記述されており、正規化後の
言語を日本語とする。S131において、データ入力部
1より英語で記述されたテキストを含む文書データを読
み込み、解析切り換え部121および登録部127に送
る。S132において、解析切り換え部121は、文書
データ中のテキストが英語で記述されていることを判別
し、英語用の言語別解析部122、言語別関係抽出部1
23、言語別正規化部126を選択する。ここでは、こ
れらを英語解析部122E、英語関係抽出部123E、
英語正規化部126Eとする。
The operation at the time of registration will be described using a specific example. Here, the text in the document data input from the data input unit 1 is described in English, and the normalized language is Japanese. In S131, the document data including the text described in English is read from the data input unit 1 and sent to the analysis switching unit 121 and the registration unit 127. In S132, the analysis switching unit 121 determines that the text in the document data is described in English, and the language-specific analysis unit 122 for English and the language-specific relationship extraction unit 1
23, the language-based normalization unit 126 is selected. Here, these are analyzed by the English analysis unit 122E, the English relation extraction unit 123E,
The English normalization unit 126E is used.

【0154】S133において、英語解析部122E
は、文書データ中のテキストを解析する。ここでは、解
析レベルとして構文解析を行なうものとする。図22
は、本発明の関係表現検索装置の第3の実施例における
英語解析部の解析結果の一例の説明図である。図22で
は、“The ABC Ltd. will prod
uce wine.”という文の解析結果の例である。
ここでは、解析結果をツリー構造とし、属性とともに示
している。
In step S133, the English analysis unit 122E.
Analyzes the text in the document data. Here, it is assumed that syntax analysis is performed as the analysis level. FIG.
FIG. 9 is an explanatory diagram showing an example of an analysis result of an English analysis unit in the third embodiment of the relational expression search device of the present invention. In FIG. 22, "The ABC Ltd. will prod"
uce wine. It is an example of the analysis result of the sentence ".
Here, the analysis result is shown as a tree structure together with attributes.

【0155】S134において、英語関係抽出部123
Eでは、図22に示したような解析結果の木構造と、英
語関係表現抽出規則とを照合することによって、互いに
関係を持ち得る複数の単語とその間の関係を抽出する。
図23は、英語関係表現抽出規則の一例の説明図であ
る。ここでは、関係表現として2つの単語とその間の関
係を抽出する場合の例を示している。図23において、
「−>」の左側、すなわち左辺は、単語のパターンであ
る。この中で、(#1 #2 #3 #4)は、#1を
親とし、その下に#2, #3, #4の3つの子があ
る木構造を表わす。「<」と「>」で囲まれている部分
は、そのノードの属性の指定である。「cat」はカテ
ゴリーであり、構文的な役割を示す。「form」は単
語そのもの、「infl」は語形変化を示す。「pre
s−p」は現在分詞(ing形)、「past−p」は
過去分詞を示す。右辺は、抽出される関係表現であり、
第一項が関係名、第二、第三項が関係を持つ単語であ
る。「#2.head」は名詞句の被修飾名詞を示し、
「#3.main」は動詞句の主動詞(助動詞を除いた
もの)を示している。規則中には示していないが、関係
表現中では基本的には動詞は原形、名詞は単数形で保持
される。
At S134, the English relationship extraction unit 123
In E, the tree structure of the analysis result as shown in FIG. 22 is collated with the English relational expression extraction rule to extract a plurality of words that may have a relationship with each other and the relationship between them.
FIG. 23 is an explanatory diagram of an example of the English relational expression extraction rule. Here, an example is shown in which two words and the relationship between them are extracted as the relationship expression. In FIG. 23,
The left side of "->", that is, the left side is a pattern of words. Among them, (# 1 # 2 # 3 # 4) represents a tree structure in which # 1 is a parent, and three children # 2, # 3, and # 4 are under it. The part enclosed by "<" and ">" is the designation of the attribute of the node. “Cat” is a category and indicates a syntactic role. “Form” indicates the word itself, and “infl” indicates the inflection. "Pre
“Sp” indicates the present participle (ing form), and “past-p” indicates the past participle. The right side is the relational expression to be extracted,
The first term is the relation name, and the second and third terms are the related words. "# 2.head" indicates the modified noun of the noun phrase,
“# 3.main” indicates the main verb (excluding the auxiliary verb) of the verb phrase. Although not shown in the rules, verbs are basically kept in their original forms and nouns are kept in the singular form in relational expressions.

【0156】図22に示す解析結果と、図23に示す英
語関係表現抽出規則を照合すると、最初の規則と2番目
の規則が適用され、次のような関係表現が抽出される。 (NOM “ABC Ltd.” “produc
e”) (ACC “WINE” “produce”)
When the analysis result shown in FIG. 22 and the English relational expression extraction rule shown in FIG. 23 are collated, the first rule and the second rule are applied, and the following relational expressions are extracted. (NOM "ABC Ltd.""product
e ”) (ACC“ WINE ”“ produce ”)

【0157】英語関係抽出部123Eで抽出された関係
表現は、S135において、英語正規化部126Eで言
語に依存しない形に正規化される。ここで、対訳単語辞
書124及びたい訳関係辞書125には、それぞれ、図
19、図20に示した内容が格納されているものとす
る。このとき、例えば、上述の関係表現(ACC “W
INE” “produce”)の場合、まず対訳単語
辞書124を用いて、関係表現を構成する単語”WIN
E”、”produce”を、あらかじめ決められた言
語の単語に翻訳する。ここでは、出力言語は日本語であ
るとし、日本語の単語が複数ある場合には、リストの先
頭の語を出力するものとすれば、図19より、”WIN
E”、”produce”は、それぞれ、「ワイン」、
「生産」と翻訳される。次に、対訳関係辞書25を用い
て、関係名「ACC」を日本語の関係名「WO−ACC
USATIVE」に変換する。これにより、言語に依存
しない関係表現(WO−ACCUSATIVE 「ワイ
ン」 「生産」)に正規化される。このようにして正規
化された関係表現は、もとのテキストを含む文書データ
と対応づけられて、登録部127により記憶部5に登録
される。
The relational expression extracted by the English relation extracting unit 123E is normalized in S135 by the English normalizing unit 126E so as not to depend on the language. Here, it is assumed that the bilingual word dictionary 124 and the desired translation relation dictionary 125 store the contents shown in FIGS. 19 and 20, respectively. At this time, for example, the relational expression (ACC “W
INE "" produce "), first, using the bilingual word dictionary 124, the word" WIN "forming the relational expression.
Translate E "and" produce "into words in a predetermined language. Here, the output language is Japanese, and if there are multiple Japanese words, the first word in the list is output. Assuming that, from FIG. 19, "WIN
E "and" produce "are" wine "and
Translated as "production". Next, using the bilingual relation dictionary 25, the relation name "ACC" is converted into the Japanese relation name "WO-ACC".
Convert to "Usative". As a result, it is normalized to a language-independent relational expression (WO-ACCUSATIVE "wine""production"). The relational expression thus normalized is associated with the document data containing the original text and registered in the storage unit 5 by the registration unit 127.

【0158】次に、文書データのテキストが日本語で記
述されている場合の動作について説明する。解析切り換
え部121は、文書データのテキストが日本語で記述さ
れていることを判別し、日本語に対応する言語別解析部
122、言語別関係抽出部123、言語別正規化部12
6を選択する。ここでは、これらを日本語解析部122
J、日本語関係抽出部123J、日本語正規化部126
Jとする。
Next, the operation when the text of the document data is described in Japanese will be described. The analysis switching unit 121 determines that the text of the document data is described in Japanese, and the analysis unit 122 for each language corresponding to Japanese, the extraction unit 123 for each language, and the normalization unit 12 for each language.
Select 6. Here, these are analyzed by the Japanese analysis unit 122.
J, Japanese relation extraction unit 123J, Japanese normalization unit 126
Let's say J.

【0159】日本語解析部122Jでは、上述の各実施
例と同様に、文書データ中のテキストを解析する。ここ
では、解析レベルとして形態素解析を行なうものとす
る。日本語関係抽出部123Jでは、形態素解析結果と
日本語関係表現抽出規則とを照合することによって、互
いに関係を持ち得る複数の単語とその間の関係を抽出す
る。
The Japanese analysis unit 122J analyzes the text in the document data as in the above-described embodiments. Here, morphological analysis is performed as the analysis level. The Japanese-relationship extraction unit 123J extracts a plurality of words that may have a relationship with each other and the relationship between them by collating the morphological analysis result with the Japanese-relationship expression extraction rule.

【0160】図24は、本発明の関係表現検索装置の第
3の実施例における日本語関係表現抽出規則の一例の説
明図である。この関係表現抽出規則は、図8に示した関
係抽出規則と基本的に同じ規則である。ここでは英語の
場合と同様に、関係表現として2つの単語とその間の関
係を抽出することとする。形態素解析結果とこれらの規
則を照合して、規則とマッチする(自立語1、付属語、
自立語2)の並びがあれば、自立語1と自立語2の関係
として、関係の欄の関係名を与える。例えば、「ABC
社がワインを製造する。」という文の場合、これを形態
素解析した結果と図24を照合して、次のような関係表
現が抽出される。 (GA−NOMINATIVE 「ABC社」 「製
造」) (WO−ACCUSATIVE 「ワイン」 「製
造」)
FIG. 24 is an explanatory diagram of an example of Japanese relational expression extraction rules in the third embodiment of the relational expression retrieval device of the present invention. This relational expression extraction rule is basically the same as the relational extraction rule shown in FIG. Here, as in the case of English, two words and the relationship between them are extracted as the relationship expression. Match these rules with the results of morphological analysis (independent word 1, adjunct word,
If there is a sequence of independent words 2), the relationship name in the relationship column is given as the relationship between independent word 1 and independent word 2. For example, "ABC
The company produces wine. 24, the result of morphological analysis is collated with FIG. 24, and the following relational expression is extracted. (GA-NOMINATIVE "ABC""manufacturing") (WO-ACCUSATIVE "wine""manufacturing")

【0161】日本語関係抽出部123Jで抽出された関
係表現は、日本語であるため、言語に依存しない形に正
規化する必要はないが、日本語正規化部126Eにおい
て対訳単語辞書124を用いて類義語を正規化する。こ
れにより、例えば、上述の関係表現(WO−ACCUS
ATIVE 「ワイン」 「製造」)は、関係表現(W
O−ACCUSATIVE 「ワイン」 「生産」)に
正規化される。このようにして正規化された関係表現
は、登録部127に送られ、正規化された関係表現をデ
ータ入力部1より送られた文書データのキーとして、文
書データとともに記憶部5に登録する。以上で関係表現
の登録の動作が終了する。
Since the relational expression extracted by the Japanese-language relation extracting unit 123J is Japanese, it is not necessary to normalize it into a language-independent form. However, the Japanese-language normalizing unit 126E uses the bilingual word dictionary 124. Normalize synonyms. Thereby, for example, the above-mentioned relational expression (WO-ACCUS
ATIVE "wine""manufacturing") is a relational expression (W
O-ACCUSATIVE "Wine""Production"). The relational expression thus normalized is sent to the registration unit 127, and the normalized relational expression is registered in the storage unit 5 together with the document data as a key of the document data sent from the data input unit 1. This completes the operation of registering the relational expression.

【0162】このように、英語で記述された“The
ABC Ltd. will produce win
e.”という文、および、日本語で記述された「ABC
社がワインを製造する。」という文から、同一の言語に
依存しない関係表現(WO−ACCUSATIVE
「ワイン」 「生産」)がキーとして生成されて登録さ
れる。このようにして、言語に依存しない関係表現をキ
ーとして登録することができる。
As described above, "The" written in English
ABC Ltd. will product win
e. ", And" ABC written in Japanese
The company produces wine. From the sentence "," a relational expression (WO-ACCUSATIVE
"Wine" and "Production") are generated and registered as keys. In this way, the language-independent relational expression can be registered as a key.

【0163】次に、検索時の動作について説明する。図
25は、本発明の関係表現検索装置の第3の実施例にお
ける関係表現の検索時の動作の一例を示すフローチャー
トである。検索のためのキーとしての関係表現の検索時
には、検索要求入力部6、表現抽出部2、言語別関係抽
出部123、言語別正規化部126、関係展開部7、検
索部128、確信度評価部20、および、記憶部5が動
作する。ここでは、検索要求をある言語を用いた自然語
で入力するものとする。
Next, the operation at the time of search will be described. FIG. 25 is a flowchart showing an example of an operation at the time of searching for a relational expression in the third embodiment of the relational expression search device of the present invention. At the time of searching for a relational expression as a key for retrieval, a search request input unit 6, an expression extraction unit 2, a language-specific relation extraction unit 123, a language-specific normalization unit 126, a relation expansion unit 7, a search unit 128, a confidence factor evaluation. The unit 20 and the storage unit 5 operate. Here, it is assumed that the search request is input in a natural language using a certain language.

【0164】S141において、ユーザは、検索要求入
力部6より、検索要求を自然語で入力する。検索要求入
力部5で入力された検索要求は、表現抽出部2に送られ
る。表現抽出部2では、文書データからの関係表現の抽
出時と同様に、S142において、解析切り換え部12
1で検索要求の記述されている言語の種別を判別し、S
143において、検索要求の記述されている言語に応じ
て言語別解析部122で解析を行ない、S144におい
て、言語別関係抽出部123で互いに関係を持ち得る複
数の単語とその間の関係を抽出し、S145において、
言語別正規化部126で言語に依存しない表現に正規化
する。
In S141, the user inputs a search request from the search request input unit 6 in natural language. The search request input by the search request input unit 5 is sent to the expression extraction unit 2. In the expression extraction unit 2, in the same manner as when the relational expression is extracted from the document data, in S142, the analysis switching unit 12
The type of the language in which the search request is described is determined in 1 and S
In 143, the language-specific analysis unit 122 performs analysis according to the language in which the search request is described, and in S144, the language-specific relationship extraction unit 123 extracts a plurality of words that may have a relationship with each other and the relationship between them. In S145,
The language-specific normalization unit 126 normalizes the language-independent expression.

【0165】言語別正規化部126より得られた関係表
現は、関係展開部7に送られる。S146において、関
係展開部7では、言語別正規化部126より得られた関
係表現を、概念的に同一になり得る関係表現に展開す
る。この展開には、関係表現展開規則を用いる。展開さ
れた関係表現は、検索部128に送られる。S147に
おいて、検索部128は、展開された関係表現と、記憶
部5に登録されている文書データのキーである関係表現
を比較して、一致する文書データをキーとともに検索結
果として確信度評価部20に送出する。
The relational expression obtained by the language-specific normalization unit 126 is sent to the relation expansion unit 7. In S146, the relationship expansion unit 7 expands the relational expression obtained by the language-based normalization unit 126 into a relational expression that can be conceptually the same. A relational expression expansion rule is used for this expansion. The expanded relational expression is sent to the search unit 128. In S147, the search unit 128 compares the expanded relational expression with the relational expression that is the key of the document data registered in the storage unit 5, and determines the matching document data together with the key as the search result. Send to 20.

【0166】S148において、確信度評価部20は、
言語別正規化部126より得られた関係表現と、検索時
にマッチした関係表現を比較し、確信度を評価する。確
信度の評価は、例えば、関係評価規則を用いて行なうこ
とができる。確信度評価部20は、S149において、
各検索結果の確信度評価値に基づいて、例えば、大きい
順に検索結果を並べ替える。確信度評価部20で並べ替
えられた検索結果は、S150において、出力部8の例
えばCRTディスプレイ19に並べ替えられた順に表示
される。
At S148, the certainty factor evaluation unit 20
The relational expression obtained by the language-based normalization unit 126 is compared with the relational expression matched at the time of search to evaluate the certainty factor. The confidence can be evaluated using, for example, a relation evaluation rule. The certainty factor evaluation unit 20 determines in S149 that
For example, the search results are sorted in descending order based on the certainty factor evaluation value of each search result. The search results sorted by the certainty factor evaluation unit 20 are displayed in the sorted order, for example, on the CRT display 19 of the output unit 8 in S150.

【0167】上述の検索時の動作を、具体例をもとに説
明する。例えば、検索要求として“To produc
e wine”という表現が入力された場合を考える。
解析切り換え部121は、この検索要求が英語で記述さ
れていることを判別し、言語別解析部122、言語別関
係抽出部123、言語別正規化部126を英語用に切り
換える。登録時と同様に、英語解析部122E、英語関
係抽出部123E、英語正規化部126Eによって、
(WO−ACCUSATIVE 「ワイン」「生
産」)という関係表現が抽出される。
The above-mentioned search operation will be described with reference to a specific example. For example, as a search request, "To product
Consider the case where the expression "e wine" is entered.
The analysis switching unit 121 determines that this search request is described in English, and switches the language-specific analysis unit 122, the language-specific relationship extraction unit 123, and the language-specific normalization unit 126 for English. Similar to the time of registration, the English analysis unit 122E, the English relation extraction unit 123E, and the English normalization unit 126E
A relational expression of (WO-ACCUSIVE "Wine""Production") is extracted.

【0168】英語正規化部126Eにより得られた関係
表現は、関係展開部7に送られる。関係展開部7では、
言語別正規化部126より得られた関係表現を、関係表
現展開規則を用いて概念的に同一になり得る関係表現に
展開する。図26は、本発明の関係表現検索装置の第3
の実施例における関係表現展開規則の一例の説明図であ
る。この関係表現展開規則は、基本的には上述の図11
に示した関係展開規則と同様の規則である。この図26
に示した関係表現展開規則により、検索要求から抽出さ
れ、正規化された上述の関係表現は、次のように展開さ
れる。 (WO−ACCUSATIVE 「ワイン」 「生
産」) (HA−THEME 「ワイン」 「生産」) (MO−ADDITION 「ワイン」 「生産」) (CASE−UNSPEC 「ワイン」 「生産」) (UNSPEC 「ワイン」 「生産」)
The relational expression obtained by the English normalization unit 126E is sent to the relation expansion unit 7. In the relationship expansion unit 7,
The relational expression obtained by the language-based normalization unit 126 is developed into a relational expression that can be conceptually identical using a relational expression expansion rule. FIG. 26 shows a third example of the relational expression search device according to the present invention.
5 is an explanatory diagram of an example of a relational expression expansion rule in the embodiment of FIG. This relational expression expansion rule is basically the same as that shown in FIG.
This is a rule similar to the relation expansion rule shown in. This FIG.
The normalized relational expression extracted from the search request according to the relational expression expansion rule shown in (1) is expanded as follows. (WO-ACCUSIVE "Wine""Production") (HA-THEME "Wine""Production") (MO-ADDITION "Wine""Production") (CASE-UNSPEC "Wine""Production") (UNSPEC "Wine""production")

【0169】検索部128は、関係展開部7で展開され
た関係表現と、記憶部5に登録されている文書データに
キーとして付与されている関係表現とを比較して、一致
するキーを有する文書データをキーとともに検索結果と
して確信度評価部20に送出する。ここでは、上述の登
録時の動作の一例で用いた英語で記述された文書データ
および日本語で記述された文書データが記憶部5に登録
されているものとすれば、これらの文書データが検索さ
れる。そして、これらの文書にキーとして付与されてい
る関係表現(WO−ACCUSATIVE 「ワイン」
「生産」)とともに、これらの文書が確信度評価部2
0に送られる。
The search unit 128 compares the relational expression developed by the relationship developing unit 7 with the relational expression given as a key to the document data registered in the storage unit 5, and has a matching key. The document data is sent to the certainty factor evaluation unit 20 as a search result together with the key. Here, assuming that the document data described in English and the document data described in Japanese used in the example of the operation at the time of registration are registered in the storage unit 5, these document data are searched. To be done. Then, the relational expression (WO-ACCUSATIVE "Wine") given as a key to these documents.
"Production") together with these documents
Sent to 0.

【0170】確信度評価部20は、英語正規化部126
Eより得られた関係表現と、検索時にマッチした関係表
現を比較し、確信度を評価する。図27は、本発明の関
係表現検索装置の第3の実施例における関係評価規則の
一例の説明図である。図27に示した関係評価規則は、
上述の図16に示した関係評価規則と基本的に同じであ
る。ここでは、検索された2つの文書は、ともに関係表
現(WO−ACCUSATIVE 「ワイン」 「生
産」)を有しているので、図27の5つ目の関係評価規
則とマッチし、確信度評価値として100が得られる。
確信度評価部20は、そのほかの検索結果とともに、確
信度評価値に基づいて、例えば、大きい順に検索結果を
並べ替え、CRTディスプレイ19に並べ替えられた順
に表示する。このとき、第2の実施例と同様に、確信度
評価値も表示するように構成することができる。なお、
確信度の評価は、第2の実施例で説明したような種々の
方法を用いることができる。
The certainty factor evaluation unit 20 includes an English normalization unit 126.
The relational expression obtained from E and the relational expression matched at the time of search are compared to evaluate the certainty factor. FIG. 27 is an explanatory diagram of an example of the relation evaluation rule in the third embodiment of the relational expression search device of the present invention. The relationship evaluation rule shown in FIG.
It is basically the same as the relation evaluation rule shown in FIG. Here, since the two retrieved documents both have the relational expression (WO-ACCUSATIVE “wine” “production”), the two documents are matched with the fifth relational evaluation rule in FIG. Is obtained as 100.
The certainty factor evaluation unit 20, along with other search results, sorts the search results, for example, in descending order based on the certainty factor evaluation value, and displays them on the CRT display 19 in the sorted order. At this time, similarly to the second embodiment, the reliability evaluation value can be displayed. In addition,
Various methods as described in the second embodiment can be used to evaluate the certainty factor.

【0171】このようにして、検索要求として日本語に
限らず、英語やその他の言語を用いて検索を行なうこと
ができる。また、上述のように、英語による検索要求で
あっても、英語だけでなく、日本語やその他の言語を用
いてテキストが記述されている同様の内容を有する文書
データを検索することができる。このように、検索要求
および文書データのテキストの記述言語によらず、検索
を行なうことができる。
In this way, the search request is not limited to Japanese, but English or other languages can be used for the search. Further, as described above, even in the case of a search request in English, it is possible to search for document data having similar contents in which texts are described not only in English but also in Japanese or other languages. In this way, the search can be performed regardless of the search request and the description language of the text of the document data.

【0172】この第3の実施例では、言語に依存しない
正規化された関係表現として、日本語の関係表現を用
い、日本語の関係表現へ他の言語の関係表現を統一する
場合を示したが、これに限らず、他の言語の関係表現に
統一したり、あるいは、新たな関係表現を定義し、その
関係表現に統一するように構成してもよい。
In the third embodiment, the case where a Japanese relational expression is used as a normalized relational expression independent of language and the relational expressions of other languages are unified to the Japanese relational expression is shown. However, the present invention is not limited to this, and may be unified to a relational expression of another language, or a new relational expression may be defined and unified to the relational expression.

【0173】また、検索の際に、検索要求で用いた言語
と同じ言語によりテキストが記述されている文書データ
のみに制限したり、あるいは、指定されたいくつかの言
語によりテキストが記述されている文書データのみを検
索するように構成することも可能である。
Further, at the time of the search, the text is described only in the document data in which the text is described in the same language as the language used in the search request, or the text is described in several designated languages. It is also possible to configure to search only the document data.

【0174】上述の第3の実施例では、確信度評価部2
0を有する構成を示したが、上述の第1の実施例のよう
に、確信度評価部20を用いずに構成することも可能で
ある。検索要求を行なう言語としてある1つの言語に決
まっている場合には、検索時の構成及び動作は上述の第
1及び第2の実施例と同様の構成及び動作となるが、記
憶部5に言語に依存しない正規化された関係表現をキー
として登録しておくことによって、文書データ中のテキ
ストの記述言語によらない文書データの検索を行なうこ
とができる。また、データ入力部1、解析切り換え部1
21、言語別解析部122、言語別関係抽出部123、
対訳単語辞書124、対訳関係辞書125、言語別正規
化部126、記憶部5により、図1に示した関係表現抽
出装置を多言語に拡張した装置を得ることができる。 〔図面の簡単な説明〕
In the above-mentioned third embodiment, the certainty factor evaluation unit 2
Although the configuration having 0 is shown, it is also possible to configure without using the certainty factor evaluation unit 20 as in the first embodiment described above. When one language is selected as the language for requesting the search, the configuration and operation at the time of the search are the same as those of the first and second embodiments described above, but the language is stored in the storage unit 5. By registering a normalized relational expression that does not depend on the key as a key, it is possible to search for document data that does not depend on the description language of the text in the document data. Also, the data input unit 1 and the analysis switching unit 1
21, language-specific analysis unit 122, language-specific relationship extraction unit 123,
With the bilingual word dictionary 124, the bilingual relation dictionary 125, the language-based normalization unit 126, and the storage unit 5, it is possible to obtain a device in which the relational expression extraction device illustrated in FIG. 1 is expanded into multiple languages. [Brief description of drawings]

【0175】[0175]

【発明の効果】以上の説明から明らかなように、本発明
の関係表現抽出装置によれば、単なる一単語ではなく複
数の表現とその間の関係をキーとして抽出することが可
能となる。これにより、表層表現に依存しない概念,主
題が抽出されることとなり、より適切なキーワードを抽
出することができる。
As is apparent from the above description, according to the relational expression extracting apparatus of the present invention, it is possible to extract not only a single word but a plurality of expressions and the relationship between them as a key. As a result, concepts and subjects that do not depend on the surface expression are extracted, and more appropriate keywords can be extracted.

【0176】また、本発明の関係表現検索装置によれ
ば、単なる一単語ではなく複数の表現とその間の関係を
キーとして検索することが可能となる。これにより、表
層表現に依存しない概念,主題からの、効率的な検索を
実現することができる。
Further, according to the relational expression retrieval apparatus of the present invention, it is possible to retrieve not only one word but a plurality of expressions and the relation between them as a key. As a result, it is possible to realize an efficient search from concepts and subjects that do not depend on the surface representation.

【0177】さらに、検索要求に対する結果の確信度に
基づいて結果を表示することにより、ユーザは、より効
率良く、所望の検索結果を得ることができる。
Further, by displaying the result based on the certainty factor of the result for the search request, the user can obtain the desired search result more efficiently.

【0178】さらに、検索要求を行なう言語、および、
文書データのテキストの記述言語によらず、所望の内容
を含む文書データを検索することができるという効果が
ある。
Furthermore, the language in which the search request is made, and
There is an effect that it is possible to search for document data containing desired contents regardless of the description language of the text of the document data.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の関係表現抽出装置の一実施例を示す
ブロック図である。
FIG. 1 is a block diagram showing an embodiment of a relational expression extraction device of the present invention.

【図2】 本発明の関係表現抽出装置の一実施例におけ
る全体の動作の一例を示すフローチャートである。
FIG. 2 is a flowchart showing an example of the overall operation in an embodiment of the relational expression extraction device of the present invention.

【図3】 本発明の関係表現抽出装置の一実施例におけ
る単語群抽出部15の動作の一例を示すフローチャート
である。
FIG. 3 is a flowchart showing an example of the operation of a word group extraction unit 15 in one embodiment of the relational expression extraction device of the present invention.

【図4】 本発明の関係表現抽出装置の一実施例におけ
る単語群抽出部15の動作の別の例を示すフローチャー
トである。
FIG. 4 is a flowchart showing another example of the operation of the word group extraction unit 15 in the embodiment of the relational expression extraction device of the present invention.

【図5】 本発明の関係表現抽出装置の一実施例におけ
る関係抽出部3の動作の一例を示すフローチャートであ
る。
FIG. 5 is a flowchart showing an example of the operation of the relation extracting unit 3 in the embodiment of the relation expression extracting device of the present invention.

【図6】 本発明の関係表現抽出装置の一実施例におけ
る正規化部4の動作の一例を示すフローチャートであ
る。
FIG. 6 is a flowchart showing an example of the operation of the normalization unit 4 in the embodiment of the relational expression extraction device of the present invention.

【図7】 単語群抽出規則の一例の説明図である。FIG. 7 is an explanatory diagram of an example of a word group extraction rule.

【図8】 関係抽出規則の一例の説明図である。FIG. 8 is an explanatory diagram of an example of a relation extraction rule.

【図9】 本発明の関係表現検索装置の第1の実施例を
示すブロック図である。
FIG. 9 is a block diagram showing a first embodiment of the relational expression search device of the present invention.

【図10】 本発明の関係表現検索装置の第1の実施例
における検索処理の一例を示すフローチャートである。
FIG. 10 is a flowchart showing an example of a search process in the first embodiment of the relational expression search device of the present invention.

【図11】 本発明の関係表現検索装置の第1の実施例
における関係展開規則の一例の説明図である。
FIG. 11 is an explanatory diagram of an example of a relation expansion rule in the first embodiment of the relational expression search device of the present invention.

【図12】 本発明の関係表現検索装置の第1の実施例
におけるGUIを用いた検索要求の入力画面の一例の説
明図である。
FIG. 12 is an explanatory diagram of an example of a search request input screen using a GUI in the first embodiment of the relational expression search device of the present invention.

【図13】 本発明の関係表現検索装置の第2の実施例
を示すブロック図である。
FIG. 13 is a block diagram showing a second embodiment of the relational expression search device of the present invention.

【図14】 本発明の関係表現検索装置の第2の実施例
における検索処理の一例を示すフローチャートである。
FIG. 14 is a flowchart showing an example of search processing in the second embodiment of the relational expression search device of the present invention.

【図15】 本発明の関係表現検索装置の第2の実施例
における関係展開規則の一例の説明図である。
FIG. 15 is an explanatory diagram of an example of a relation expansion rule in the second embodiment of the relational expression search device of the present invention.

【図16】 本発明の関係表現検索装置の第2の実施例
における関係評価規則の一例の説明図である。
FIG. 16 is an explanatory diagram of an example of a relation evaluation rule in the second embodiment of the relational expression search device of the present invention.

【図17】 本発明の関係表現検索装置の第2の実施例
におけるGUIを用いた検索要求の入力画面の一例の説
明図である。
FIG. 17 is an explanatory diagram showing an example of a search request input screen using a GUI in the second embodiment of the relational expression search device of the present invention.

【図18】 本発明の関係表現検索装置の第3の実施例
を示すブロック図である。
FIG. 18 is a block diagram showing a third embodiment of the relational expression search device of the present invention.

【図19】 対訳単語辞書のデータの一例の説明図であ
る。
FIG. 19 is an explanatory diagram of an example of bilingual word dictionary data.

【図20】 対訳関係辞書のデータの一例の説明図であ
る。
FIG. 20 is an explanatory diagram of an example of data of a bilingual relation dictionary.

【図21】 本発明の関係表現検索装置の第3の実施例
における関係表現の登録時の動作の一例を示すフローチ
ャートである。
FIG. 21 is a flowchart showing an example of an operation at the time of registering a relational expression in the third embodiment of the relational expression search device of the present invention.

【図22】 本発明の関係表現検索装置の第3の実施例
における英語解析部の解析結果の一例の説明図である。
FIG. 22 is an explanatory diagram showing an example of the analysis result of the English analysis unit in the third embodiment of the relational expression search device of the present invention.

【図23】 英語関係表現抽出規則の一例の説明図であ
る。
FIG. 23 is an explanatory diagram of an example of English-related expression extraction rules.

【図24】 本発明の関係表現検索装置の第3の実施例
における日本語関係表現抽出規則の一例の説明図であ
る。
FIG. 24 is an explanatory diagram of an example of Japanese relational expression extraction rules in the third embodiment of the relational expression search device of the present invention.

【図25】 本発明の関係表現検索装置の第3の実施例
における関係表現の検索時の動作の一例を示すフローチ
ャートである。
FIG. 25 is a flowchart showing an example of an operation at the time of searching for a relational expression in the third embodiment of the relational expression search device of the present invention.

【図26】 本発明の関係表現検索装置の第3の実施例
における関係表現展開規則の一例の説明図である。
FIG. 26 is an explanatory diagram of an example of a relational expression expansion rule in the third embodiment of the relational expression search device of the present invention.

【図27】 本発明の関係表現検索装置の第3の実施例
における関係評価規則の一例の説明図である。
FIG. 27 is an explanatory diagram of an example of a relation evaluation rule in the third embodiment of the relational expression search device of the present invention.

【符号の説明】[Explanation of symbols]

1…データ入力部、2…表現抽出部、3…関係抽出部、
4…正規化部、5…記憶部、6…検索要求入力部、7…
関係展開部、8…出力部、11…磁気ディスク、12…
OCR、13…MT、14…形態素解析部、15…単語
群抽出部、16…データベース、17…キーボード、1
8…マウス、19…CRTディスプレイ、20…確信度
評価部、121…解析切り換え部、122…言語別解析
部、123…言語別関係抽出部、124…対訳単語辞
書、125…対訳関係辞書、126…言語別正規化部、
127…登録部、128…検索部。
1 ... Data input unit, 2 ... Expression extraction unit, 3 ... Relationship extraction unit,
4 ... Normalization unit, 5 ... Storage unit, 6 ... Search request input unit, 7 ...
Relationship developing unit, 8 ... Output unit, 11 ... Magnetic disk, 12 ...
OCR, 13 ... MT, 14 ... Morphological analysis unit, 15 ... Word group extraction unit, 16 ... Database, 17 ... Keyboard, 1
8 ... Mouse, 19 ... CRT display, 20 ... Certainty factor evaluation part, 121 ... Analysis switching part, 122 ... Language analysis part, 123 ... Language relationship extraction part, 124 ... Bilingual word dictionary, 125 ... Bilingual relationship dictionary, 126 … Language normalization section,
127 ... registration unit, 128 ... search unit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 良寛 神奈川県横浜市保土ヶ谷区神戸町134番地 横浜ビジネスパークイーストタワー 富 士ゼロックス株式会社内 (72)発明者 宮内 忠信 神奈川県横浜市保土ヶ谷区神戸町134番地 横浜ビジネスパークイーストタワー 富 士ゼロックス株式会社内 (72)発明者 中垣 寿平 神奈川県横浜市保土ヶ谷区神戸町134番地 横浜ビジネスパークイーストタワー 富 士ゼロックス株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Yoshihiro Ueda 134 Kobe-cho, Hodogaya-ku, Yokohama-shi, Kanagawa Yokohama Business Park East Tower Fuji Xerox Co., Ltd. (72) Tadanobu Miyauchi Kobe-cho, Hodogaya-ku, Yokohama, Kanagawa Address 134, Yokohama Business Park East Tower, Fuji Xerox Co., Ltd. (72) Inventor: Juhei Nakagaki, 134, Kobe-cho, Hodogaya-ku, Yokohama-shi, Kanagawa Yokohama Business Park East Tower, Fuji Xerox Co., Ltd.

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 原データからキーワードとなりうる関係
表現を抽出する関係表現抽出装置において、前記原デー
タから互いに関係を持ち得る複数の表現を抽出する表現
抽出手段と、該表現抽出手段により抽出された表現群に
関係を与える関係抽出手段を有することを特徴とする関
係表現抽出装置。
1. In a relational expression extraction device for extracting a relational expression that can be a keyword from original data, an expression extraction means for extracting a plurality of expressions that may have a relationship with each other from the original data, and an expression extraction means for extracting the expression. A relational expression extracting device having a relation extracting means for giving a relation to an expression group.
【請求項2】 前記関係抽出手段により与えられた関係
に基づいて表層的な表現に依存しない表現に正規化する
正規化手段をさらに有することを特徴とする請求項1に
記載の関係表現抽出装置。
2. The relational expression extracting device according to claim 1, further comprising a normalization unit that normalizes into an expression that does not depend on a surface expression based on the relationship given by the relationship extraction unit. .
【請求項3】 前記表現抽出手段は、前記原データを解
析する解析手段と、該解析手段による解析結果から互い
に関係を持ち得る複数の単語を取り出す単語群抽出手段
を有することを特徴とする請求項1または2に記載の関
係表現抽出装置。
3. The expression extracting means includes an analyzing means for analyzing the original data, and a word group extracting means for extracting a plurality of words which may have a relationship with each other from an analysis result by the analyzing means. Item 1. The relational expression extraction device according to Item 1 or 2.
【請求項4】 前記関係抽出手段あるいは前記正規化手
段から与えられる関係表現を言語に依存しない表現に正
規化する言語正規化手段をさらに有することを特徴とす
る請求項1ないし3のいずれか1項に記載の関係表現抽
出装置。
4. The language normalization means for normalizing the relational expression given by the relational extraction means or the normalization means into a language-independent expression. A relational expression extraction device according to item.
【請求項5】 前記表現抽出手段は前記原データが記述
されている言語に応じて前記原データを解析する言語別
解析手段からなり、前記関係抽出手段は言語に応じて互
いに関係を持ち得る複数の単語とその間の関係からなる
関係表現を抽出する言語別関係抽出手段からなり、複数
の言語における等価な意味の単語が登録された対訳単語
辞書と、複数の言語における等価な言語的関係を表わす
情報が登録された対訳関係辞書と、前記対訳単語辞書と
前記対訳関係辞書を用い言語に応じて前記関係抽出手段
によって抽出された関係表現を言語に依存しない表現に
正規化する言語正規化手段をさらに有することを特徴と
する請求項1ないし3のいずれか1項に記載の関係表現
抽出装置。
5. The expression extraction means comprises language-specific analysis means for analyzing the original data according to the language in which the original data is described, and the relationship extraction means can have a plurality of relationships with each other according to the language. It consists of language-specific relation extracting means for extracting relational expressions consisting of words and their relations, and represents a bilingual word dictionary in which words of equivalent meaning in a plurality of languages are registered and an equivalent linguistic relation in a plurality of languages. A bilingual relation dictionary in which information is registered, and a language normalizing means for normalizing the relational expression extracted by the relation extracting means according to the language into a language-independent expression using the bilingual word dictionary and the bilingual relational dictionary. The relational expression extraction device according to any one of claims 1 to 3, further comprising:
【請求項6】 関係表現を検索キーとして検索を行なう
検索装置において、原データから互いに関係を持ち得る
複数の表現として抽出された関係表現がキーとして原デ
ータとともに登録されている記憶手段と、入力される関
係表現を検索キーとして前記記憶部に登録されている原
データを検索する検索手段を有することを特徴とする関
係表現検索装置。
6. A search device for performing a search using a relational expression as a search key, and storage means in which the relational expressions extracted from the original data as a plurality of expressions having a relationship with each other are registered as keys together with the original data, and input. A relational expression retrieving apparatus comprising a retrieval means for retrieving original data registered in the storage section using the relational expression as a retrieval key.
【請求項7】 前記検索手段は、少なくとも、入力され
た検索要求を概念的に同一になり得る関係表現に展開し
て検索を行なう関係展開手段を含むことを特徴とする請
求項6に記載の関係表現検索装置。
7. The search unit according to claim 6, further comprising at least a relationship expansion unit that expands an input search request into a relational expression that can be conceptually the same and performs a search. Relational expression retrieval device.
【請求項8】 入力データから互いに関係を持ち得る複
数の表現を取り出す表現抽出手段と、該表現抽出手段に
より取り出された複数の表現の関係を抽出する関係抽出
手段と、該関係抽出手段により抽出した関係に基づいて
表層的な表現に依存しない表現に正規化する正規化手段
を有し、前記記憶手段は、原データを入力データとして
前記単語群抽出手段、前記関係抽出手段、前記正規化手
段により互いに関係を持ち得る複数の表現として抽出し
正規化した関係表現がキーとして原データとともに登録
されており、前記関係展開手段は、自然語を入力データ
とし前記単語群抽出手段、前記関係抽出手段、前記正規
化手段により互いに関係を持ち得る複数の表現として抽
出し正規化した検索要求を概念的に同一になり得る関係
表現に展開して検索を行なうことを特徴とする請求項7
に記載の関係表現検索装置。
8. An expression extracting means for extracting a plurality of expressions that may have a relationship with each other from input data, a relationship extracting means for extracting a relationship between the plurality of expressions extracted by the expression extracting means, and an extracting by the relationship extracting means. Has a normalizing means for normalizing to an expression that does not depend on a surface expression based on the above relationship, and the storage means uses the original data as input data to extract the word group, the relationship extracting means, and the normalizing means. A relational expression extracted and normalized as a plurality of expressions that can be related to each other is registered as a key together with the original data, and the relation expansion means uses the natural language as input data and the word group extraction means and the relational extraction means. , A search request that is extracted and normalized as a plurality of expressions that may have a relationship with each other by the normalizing means is expanded into a relationship expression that can be conceptually the same 8. The method according to claim 7, wherein
The relational expression retrieval device described in.
【請求項9】 前記記憶手段には、原データから互いに
関係を持ち得る複数の表現として抽出され、言語に依存
しない表現に正規化された関係表現がキーとして原デー
タとともに登録されていることを特徴とする請求項6ま
たは7に記載の関係表現検索装置。
9. The relational expression extracted from the original data as a plurality of expressions that may have a relationship with each other and normalized to a language-independent expression is registered as a key with the original data in the storage means. The relational expression search device according to claim 6 or 7.
【請求項10】 入力データが記述されている言語に応
じて前記入力データから互いに関係を持ち得る複数の表
現を取り出す表現抽出手段と、該表現抽出手段により取
り出された複数の表現の関係を言語に応じて抽出する関
係抽出手段と、複数の言語における等価な意味の単語が
登録された対訳単語辞書と、複数の言語における等価な
言語的関係を表わす情報が登録された対訳関係辞書と、
前記対訳単語辞書と前記対訳関係辞書を用い言語に応じ
て前記関係抽出手段によって言語に応じて抽出された関
係表現を言語に依存しない表現に正規化する言語正規化
手段を有し、前記記憶手段には、原データを入力データ
として前記表現抽出手段、前記関係抽出手段、前記言語
正規化手段により言語に依存しない表現に正規化した関
係表現がキーとして原データとともに登録されており、
前記検索手段は、自然語を入力データとし前記単語群抽
出手段、前記関係抽出手段、前記正規化手段により言語
に依存しない表現として正規化した検索要求を用いて検
索を行なうことを特徴とする請求項6または7に記載の
関係表現検索装置。
10. An expression extraction unit for extracting a plurality of expressions that may have a relationship from each other from the input data according to a language in which the input data is described, and a relationship between the plurality of expressions extracted by the expression extraction unit. A relationship extraction means for extracting according to, a bilingual word dictionary in which words having equivalent meanings in a plurality of languages are registered, and a bilingual relationship dictionary in which information indicating equivalent linguistic relationships in a plurality of languages is registered,
The storage means includes a language normalization means for normalizing the relational expression extracted according to the language by the relation extracting means according to the language using the bilingual word dictionary and the bilingual relation dictionary into a language-independent expression. In, the relational expression normalized to the language-independent expression by the expression extracting means, the relation extracting means, and the language normalizing means using the original data as input data is registered together with the original data as a key.
The search means performs a search using a search request normalized with natural language as input data by the word group extraction means, the relation extraction means, and the normalization means as a language-independent expression. Item 6. The relational expression search device according to Item 6 or 7.
【請求項11】 前記検索手段は、入力された検索要求
に基づく関係表現と前記記憶手段に記憶されている関係
表現を比較して確信度を評価し該確信度に基づいて検索
結果を並べ替える確信度評価手段を有することを特徴と
する請求項6ないし10のいずれか1項に記載の関係表
現検索装置。
11. The search means compares a relational expression based on an input search request with a relational expression stored in the storage means to evaluate a certainty factor, and rearranges search results based on the certainty factor. 11. The relational expression search device according to claim 6, further comprising a certainty factor evaluation unit.
JP00965695A 1994-05-25 1995-01-25 Relational expression extraction apparatus, relational expression search apparatus, relational expression extraction method, relational expression search method Expired - Fee Related JP3617096B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00965695A JP3617096B2 (en) 1994-05-25 1995-01-25 Relational expression extraction apparatus, relational expression search apparatus, relational expression extraction method, relational expression search method

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP11160294 1994-05-25
JP21339294 1994-09-07
JP6-111602 1994-09-07
JP6-213392 1994-09-07
JP00965695A JP3617096B2 (en) 1994-05-25 1995-01-25 Relational expression extraction apparatus, relational expression search apparatus, relational expression extraction method, relational expression search method

Publications (2)

Publication Number Publication Date
JPH08129554A true JPH08129554A (en) 1996-05-21
JP3617096B2 JP3617096B2 (en) 2005-02-02

Family

ID=27278579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00965695A Expired - Fee Related JP3617096B2 (en) 1994-05-25 1995-01-25 Relational expression extraction apparatus, relational expression search apparatus, relational expression extraction method, relational expression search method

Country Status (1)

Country Link
JP (1) JP3617096B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011462A (en) * 1996-06-26 1998-01-16 Fuji Xerox Co Ltd Similar relation development dictionary, similarity evaluating device, and retrieval device
JPH11282881A (en) * 1998-01-27 1999-10-15 Fuji Xerox Co Ltd Document summarizing device and recording medium
JPH11353314A (en) * 1998-06-02 1999-12-24 Sharp Corp Method and device for preparing index, use of index and storage medium
US6574622B1 (en) 1998-09-07 2003-06-03 Fuji Xerox Co. Ltd. Apparatus and method for document retrieval
JP2011048558A (en) * 2009-08-26 2011-03-10 Ntt Docomo Inc Device and method for generating task model
JP2014134871A (en) * 2013-01-08 2014-07-24 Nippon Telegr & Teleph Corp <Ntt> Method for generating search keyword for question-and-answer, device and program
JP2015518220A (en) * 2012-05-22 2015-06-25 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Online product search method and system
US9223779B2 (en) 2010-11-22 2015-12-29 Alibaba Group Holding Limited Text segmentation with multiple granularity levels
KR20190115405A (en) * 2018-04-02 2019-10-11 페가트론 코포레이션 Search method and electronic device using the method
JP2020035236A (en) * 2018-08-30 2020-03-05 株式会社日立製作所 Search support device and search support method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6074081A (en) * 1983-09-30 1985-04-26 Fujitsu Ltd Generating device for natural language sentence
JPS6421624A (en) * 1987-07-17 1989-01-25 Nippon Telegraph & Telephone Japanese document retrieval system
JPH03148765A (en) * 1989-11-06 1991-06-25 Matsushita Electric Ind Co Ltd Document retrieving device
JPH04139580A (en) * 1990-09-29 1992-05-13 Fujitsu Ltd Keyword searching system
JPH05165890A (en) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd Electronic example dictionary
JPH05324719A (en) * 1992-05-26 1993-12-07 Sanyo Electric Co Ltd Document retrieval system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6074081A (en) * 1983-09-30 1985-04-26 Fujitsu Ltd Generating device for natural language sentence
JPS6421624A (en) * 1987-07-17 1989-01-25 Nippon Telegraph & Telephone Japanese document retrieval system
JPH03148765A (en) * 1989-11-06 1991-06-25 Matsushita Electric Ind Co Ltd Document retrieving device
JPH04139580A (en) * 1990-09-29 1992-05-13 Fujitsu Ltd Keyword searching system
JPH05165890A (en) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd Electronic example dictionary
JPH05324719A (en) * 1992-05-26 1993-12-07 Sanyo Electric Co Ltd Document retrieval system

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011462A (en) * 1996-06-26 1998-01-16 Fuji Xerox Co Ltd Similar relation development dictionary, similarity evaluating device, and retrieval device
JPH11282881A (en) * 1998-01-27 1999-10-15 Fuji Xerox Co Ltd Document summarizing device and recording medium
JPH11353314A (en) * 1998-06-02 1999-12-24 Sharp Corp Method and device for preparing index, use of index and storage medium
US6574622B1 (en) 1998-09-07 2003-06-03 Fuji Xerox Co. Ltd. Apparatus and method for document retrieval
JP2011048558A (en) * 2009-08-26 2011-03-10 Ntt Docomo Inc Device and method for generating task model
US9223779B2 (en) 2010-11-22 2015-12-29 Alibaba Group Holding Limited Text segmentation with multiple granularity levels
JP2015518220A (en) * 2012-05-22 2015-06-25 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Online product search method and system
US9563665B2 (en) 2012-05-22 2017-02-07 Alibaba Group Holding Limited Product search method and system
JP2014134871A (en) * 2013-01-08 2014-07-24 Nippon Telegr & Teleph Corp <Ntt> Method for generating search keyword for question-and-answer, device and program
KR20190115405A (en) * 2018-04-02 2019-10-11 페가트론 코포레이션 Search method and electronic device using the method
JP2020035236A (en) * 2018-08-30 2020-03-05 株式会社日立製作所 Search support device and search support method

Also Published As

Publication number Publication date
JP3617096B2 (en) 2005-02-02

Similar Documents

Publication Publication Date Title
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
Kowalski et al. Information storage and retrieval systems: theory and implementation
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
JP4306894B2 (en) Natural language processing apparatus and method, and natural language recognition apparatus
KR101136007B1 (en) System and method for anaylyzing document sentiment
JP2012248210A (en) System and method for retrieving content of complicated language such as japanese
MXPA04002816A (en) Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system.
JPH11110416A (en) Method and device for retrieving document from data base
JPH0447364A (en) Natural language analying device and method and method of constituting knowledge base for natural language analysis
JPH0424869A (en) Document processing system
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
JP2001043236A (en) Synonym extracting method, document retrieving method and device to be used for the same
JP3831357B2 (en) Parallel translation information creation device and parallel translation information search device
JP3617096B2 (en) Relational expression extraction apparatus, relational expression search apparatus, relational expression extraction method, relational expression search method
JPH0844771A (en) Information retrieval device
JPH0981568A (en) Chinese language generation device for machine translation
JPH09190453A (en) Database device
JPH06231178A (en) Document retrieving device
KR950013129B1 (en) Method and apparatus for machine translation
JP4845857B2 (en) Machine translation apparatus and machine translation program
JP2004220226A (en) Document classification method and device for retrieved document
JPH07244669A (en) Document retrieval system
JP2002278963A (en) Example translation device
JPH07325826A (en) Japanese language processing system
JP4043176B2 (en) Natural language processing device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040507

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040827

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040830

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071119

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111119

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111119

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121119

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121119

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees