JPH08212223A - Modification destination decision device - Google Patents

Modification destination decision device

Info

Publication number
JPH08212223A
JPH08212223A JP7015161A JP1516195A JPH08212223A JP H08212223 A JPH08212223 A JP H08212223A JP 7015161 A JP7015161 A JP 7015161A JP 1516195 A JP1516195 A JP 1516195A JP H08212223 A JPH08212223 A JP H08212223A
Authority
JP
Japan
Prior art keywords
certainty
dependency
degree
dependency relationship
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7015161A
Other languages
Japanese (ja)
Inventor
Miki Sasaki
美樹 佐々木
Tokuji Ikeno
篤司 池野
Hitoshi Sakamoto
仁 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7015161A priority Critical patent/JPH08212223A/en
Publication of JPH08212223A publication Critical patent/JPH08212223A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE: To improve the decision precision of a modification destination. CONSTITUTION: A modification relation extraction part 11 analyzes the modification relation of a natural language sentence based on the analysis result of a clause and extracts the analyzed modification relation. A first certainty estimation part 13 discriminates the type for the respective modification relations and estimates the certainty (first certainty) based on the discriminated result. A second certainty estimation part 15 calculates similarity with the modification relation where only one candidate of the modification destination exists and estimates the certainty (second certainty) based on the calculated result. A third certainty estimation part 17 estimates the certainty (third certainty) based on a first and second certainty for the respective modified relations. A modification destination part 18 decides one candidate as the appropriate modification destination among plural ones based on third certainty when plural modifications exist.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、機械翻訳システム等
の自然言語処理システムにおいて、修飾語の係り先の候
補が複数存在する場合、この複数の候補の中の1つを係
り先として決定する係り先決定装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention, in a natural language processing system such as a machine translation system, when there are a plurality of candidates for the modifier destination, one of the plurality of candidates is determined as the destination. The present invention relates to a contact determination device.

【0002】[0002]

【従来の技術】一般に、自然言語文を構文解析等を用い
て機械的に処理にする場合、修飾語の係り先を正確に解
析できることは少なく、通常は、係り先の候補が複数存
在する。したがって、この場合は、修飾語の係り先を決
定する機能が必要になる。
2. Description of the Related Art Generally, when a natural language sentence is mechanically processed by using a syntactic analysis or the like, it is rarely possible to accurately analyze the modifier destination, and there are usually a plurality of candidate candidates. Therefore, in this case, a function of determining the destination of the modifier is required.

【0003】修飾語の係り先の候補が複数存在する場合
において、この複数の候補の中から1つを係り先として
決定する係り先決定装置としては、従来、特開平5−2
33688号公報に記載された装置が知られている。
In the case where there are a plurality of candidates for the modification destination of a modifier, a related-party determination device for determining one of the plurality of candidates as a modification destination has been conventionally disclosed in Japanese Patent Laid-Open No. 5-2.
The device described in Japanese Patent No. 33688 is known.

【0004】この文献に記載された係り先決定装置は、
各候補ごとに、修飾語との位置上の距離と、他の候補の
数と、格要素としてのヒットの度合いとに基づいて、そ
の確実度を推定し、この推定結果に基づいて、複数の候
補の中から1つを妥当な係り先として決定するようにな
っている。
The relationship determining apparatus described in this document is
For each candidate, its certainty is estimated based on the position distance from the modifier, the number of other candidates, and the degree of hit as a case element. One of the candidates is decided as a proper contact.

【0005】[0005]

【発明が解決しようとする課題】[Problems to be Solved by the Invention]

(1) しかしながら、このような構成では、係り先が
各文ごとに個別に決定されるため、1つの文章の中に、
係り先の候補が1つしか存在しない係り受け関係、すな
わち、「確実な」係り受け関係が存在する場合であって
も、これを利用して係り先を決定することができないと
いう問題があった。これにより、従来の係り先決定装置
には、高い決定精度を得ることができないという問題が
あった。
(1) However, in such a configuration, since the related party is individually determined for each sentence, in one sentence,
Even if there is a dependency relationship in which there is only one candidate for the dependency, that is, there is a "certain" dependency relationship, there is a problem that the dependency cannot be determined using this. . As a result, the related party determining device has a problem that high determination accuracy cannot be obtained.

【0006】これを、具体例を使って説明する。いま、
次の2つの自然言語文o,pを含む文章を解析するもの
とする。 o:アメリカの業界への反発は・・・。 p:日本の業界に対して、閉鎖的であると、アメリカの
反発が・・・。
This will be described using a specific example. Now
A sentence including the following two natural language sentences o and p shall be analyzed. o: The reaction to the American industry ... p: If it's closed to the Japanese industry, there will be a US backlash ...

【0007】自然言語文oにおいては、「アメリカ
(の)」の係り先の候補が「業界(への)」と「反発」
の2つ存在する。したがって、この2つの候補の中の1
つを「アメリカ(の)」の係り先として決定する必要が
ある。
In the natural language sentence o, the candidates for the "American (or) 's" are "industry (or)" and "repulsion"
There are two. Therefore, one of these two candidates
It is necessary to decide which one is the "American" contact.

【0008】しかし、従来の係り先決定装置は、自然言
語文oの「アメリカ(の)」の係り先を決定する場合、
この自然言語文oの2つの係り受け関係(「アメリカ
(の)」→「業界(への)」),(「アメリカ(の)」
→「反発」)の確実度を比較することによって決定する
ようになっていた。
However, in the case of determining the destination of the "American (of)" of the natural language sentence o, the conventional destination determining device
Two dependency relations of this natural language sentence o (“America ()” → “Industry (to)”), (“America (to)”)
→ "Repulsion") was decided by comparing the certainty.

【0009】したがって、自然言語文pに、「アメリカ
(の)」の係り先の候補が「反発」だけしかない係り受
け関係が存在するにもかかわらず、従来は、これを利用
して係り先を決定することができないため、係り先の決
定精度を高めることができなかった。
Therefore, even though the natural language sentence p has a dependency relationship in which the candidate for the dependency of "American (only)" is only "repulsion", it has been conventionally utilized by utilizing this. Since it is not possible to determine, it was not possible to improve the accuracy of determination of the person in charge.

【0010】(2) また、従来の係り先決定装置で
は、1つの文章の中に、「確実な」係り受け関係ではな
いが、共起して出現する頻度の高い係り受け関係が存在
する場合であっても、これを利用して係り先を決定する
ことができないという問題があった。これにより、人間
が帰納的な推論によって係り先を決定する場合のよう
に、係り先を決定することができないため、高い決定精
度を得ることができないという問題があった。
(2) Further, in the conventional dependency determining apparatus, when a sentence has a dependency relationship that is not a "certain" dependency relationship but frequently appears co-occurring. However, there is a problem in that it is not possible to determine the contact person by using this. As a result, there is a problem in that it is not possible to obtain a high degree of accuracy because a person cannot determine the contact as in the case where a person determines the contact by inductive inference.

【0011】これを、具体例を使って説明する。いま、
次の3つの自然言語文q,r,sを含む文章を解析する
ものとする。 q:アメリカの業界への反発は・・・。
This will be described using a specific example. Now
A sentence including the following three natural language sentences q, r, and s is analyzed. Q: The reaction to the American industry ...

【0012】r:アメリカの市場への反発では・・・。R: In reaction to the American market ...

【0013】s:アメリカの政府への反発・・・。S: Repulsion from the US government ...

【0014】自然言語文qにおいては、「アメリカ
(の)」の係り先の候補が「業界(への)」と「反発」
の2つある。したがって、この2つの候補のいずれかを
「アメリカ(の)」の係り先として決定する必要があ
る。
In the natural language sentence q, the candidates for the "American (or) 's" are "industry (to)" and "repulsion".
There are two. Therefore, it is necessary to decide which of these two candidates is to be the "American" affiliate.

【0015】しかし、従来の係り先決定装置は、自然言
語文qの「アメリカ(の)」の係り先を決定する場合、
この自然言語文qの2つの係り受け関係(「アメリカ
(の)」→「業界(への)」),(「アメリカ(の)」
→「反発」)の確実度を比較することによって決定する
ようになっていた。
However, in the case of determining the destination of the "American (or)" of the natural language sentence q, the conventional dependency determining device determines:
Two dependency relations of this natural language sentence q (“America (of)” → “Industry (to)”), (“America (of)”)
→ "Repulsion") was decided by comparing the certainty.

【0016】したがって、自然言語文r,sに、「確実
な」係り受け関係ではないが、自然言語文qの係り受け
関係(「アメリカ(の)」→「反発」)と同じ係り受け
関係が含まれているにもかかわらず、これを利用して係
り先を決定することができなかった。これにより、従来
の係り先決定装置では、人間が自然言語文qの「アメリ
カ(の)」の係り先を決定する場合のように、帰納的な
推論によって係り先を決定することができないため、係
り先の決定精度を高めることができなかった。
Therefore, the natural language sentences r and s have the same dependency relationship as the dependency relationship of the natural language sentence q (“American (no)” → “repulsion”), although it is not a “certain” dependency relationship. Although included, it was not possible to use this to determine who to contact. As a result, in the related-arts-affiliation determining device, since the human beings cannot determine the affiliated destinations by inductive inference, unlike the case where a human determines the affiliated destinations of "American (of)" of the natural language sentence q, It was not possible to improve the accuracy of the decision of the person in charge.

【0017】この発明は、上述したような問題に鑑みて
なされたもので、係り先の決定精度を高めることができ
る係り先決定装置を提供することを課題とする。
The present invention has been made in view of the above problems, and an object of the present invention is to provide an engagement destination determining apparatus capable of enhancing the accuracy of determination of the engagement destination.

【0018】[0018]

【課題を解決するための手段】[Means for Solving the Problems]

(1) 請求項1に係る発明は、係り先の各候補ごと
に、「確実な」係り受け関係との類似度を算出し、この
算出結果に基づいて、その確実度を推定する手段と、こ
の推定結果に基づいて、係り先を決定する手段とを設け
るようにしたものである。
(1) The invention according to claim 1 is to calculate a degree of similarity with a “certain” dependency relationship for each candidate of a dependency, and to estimate the degree of certainty based on the calculation result, Based on this estimation result, a means for determining a contact person is provided.

【0019】(2) 請求項2に係る発明は、請求項1
に係る発明において、係り先の各候補ごとに、修飾語と
の位置上の距離に基づいて、その確実度を推定し、この
確実度と類似度から推定された確実度とに基づいて、係
り先を決定するようにしたものである。
(2) The invention according to claim 2 provides the invention according to claim 1.
In the invention according to, the degree of certainty is estimated for each candidate of the related person based on the positional distance from the modifier, and the degree of certainty is estimated based on the certainty degree and the certainty degree estimated from the similarity. It is designed to decide the destination.

【0020】(3) 請求項3に係る発明は、各係り受
け関係ごとに、その確実度を推定する手段と、この推定
結果を同じ係り受け関係が出現するたびに累積する手段
と、この累積結果に基づいて、係り先を決定する手段と
を設けるようにしたものである。
(3) In the invention according to claim 3, means for estimating the certainty for each dependency relationship, means for accumulating the estimation result each time the same dependency relationship appears, and this accumulation Based on the result, a means for determining a contact person is provided.

【0021】(4) 請求項4に係る発明は、請求項3
に係る発明において、複数の候補の中の各候補ごとに、
係り先の候補が1つしか存在しない係り受け関係との類
似度を算出し、この算出結果に基づいて、その確実度を
推定するようにしたものである。
(4) The invention according to claim 4 relates to claim 3
In the invention according to, for each of the plurality of candidates,
The similarity with a dependency relationship in which only one dependency candidate exists is calculated, and the certainty is estimated based on the calculation result.

【0022】(5) 請求項5に係る発明は、請求項4
に係る発明において、「確実な」係り受け関係とは異な
る係り受け関係の累積値が、同じ係り受け関係の累積値
より大きくなることはないように、累積処理を行うよう
にしたものである。
(5) The invention according to claim 5 relates to claim 4
In the invention according to the third aspect, the cumulative processing is performed so that the cumulative value of the dependency relationship different from the “certain” dependency relationship does not become larger than the cumulative value of the same dependency relationship.

【0023】[0023]

【作用】[Action]

(1) 請求項1に係る発明によれば、まず、係り先の
各候補ごとに、その係り受け関係と「確実な」係り受け
関係との類似度が算出され、この類似度に基づいて、確
実度が推定される。次に、この確実度に基づいて、複数
の係り先の候補の中から1つが係り先として決定され
る。これにより、文章中に、「確実な」係り受け関係が
ある場合、これに基づいて、係り先を決定することがで
きるので、係り先の決定精度を高めることができる。
(1) According to the invention of claim 1, first, the similarity between the dependency relationship and the “certain” dependency relationship is calculated for each candidate of the dependency destination, and based on this similarity degree, Certainty is estimated. Next, based on this certainty, one of the plurality of candidates for the dependency is determined as the dependency. Accordingly, when the sentence has a “certain” dependency relationship, the dependency destination can be determined based on this, so that the determination accuracy of the dependency destination can be improved.

【0024】(2) 請求項2に係る発明によれば、ま
ず、係り先の各候補ごとに、修飾語との位置上の距離に
基づいて、確実度が推定されるとともに、「確実な」係
り受け関係との類似度に基づいて、確実度が推定され
る。次に、この2種類の確実度に基づいて、複数の係り
先の候補の中から1つが係り先として決定される。これ
により、類似度から得られた確実度のみに基づいて、係
り先を決定する場合より、さらに、係り先の決定精度を
高めることができる。
(2) According to the second aspect of the invention, first, for each candidate of the related party, the certainty is estimated based on the positional distance from the modifier, and "certain" is obtained. The certainty is estimated based on the similarity to the dependency relationship. Next, based on these two types of certainty factors, one of a plurality of candidates for the dependency is determined as the dependency. As a result, it is possible to further improve the accuracy of determining the engagement destination, compared to the case where the engagement destination is determined based on only the certainty obtained from the similarity.

【0025】(3) 請求項3に係る発明によれば、係
り先の各候補ごとに、確実度が推定される。この確実度
は、同じ係り受け関係が出現するたびに累積される。そ
して、この累積結果に基づいて、複数の係り先の候補の
中から1つが係り先として決定される。これにより、
「確実な」係り受け関係ではないが、共起して出現する
頻度の高い係り受け関係を利用して、係り先を決定する
ことができるので、係り先の決定精度を高めることがで
きる。
(3) According to the invention of claim 3, the certainty is estimated for each candidate of the related party. This certainty is accumulated each time the same dependency relationship appears. Then, based on the cumulative result, one of the plurality of candidates for the relationship is determined as the relationship. This allows
Since the dependency relationship can be determined by utilizing the dependency relationship that is not a “certain” dependency relationship but frequently co-occurs, it is possible to improve the determination accuracy of the dependency target.

【0026】(4) 請求項4に係る発明によれば、請
求項3に係る発明において、請求項1に係る発明と同じ
ように、「確実な」係り受け関係に基づいて、係り先を
決定することができるので、係り先の決定精度を高める
ことができる。
(4) According to the invention of claim 4, in the invention of claim 3, as in the invention of claim 1, the engagement destination is determined based on the "certain" dependency relationship. Therefore, it is possible to improve the accuracy of determination of the contact person.

【0027】(5) 請求項5に係る発明によれば、請
求項4に係る発明において、「確実な」係り受け関係と
は異なる係り受け関係が多数出現する場合であっても、
その確実度の累積値が、「確実な」係り受け関係と同じ
係り受け関係の確実度の累積値より大きくなることはな
い。これにより、「確実な」係り受け関係と同じ係り受
け関係が存在するにもかかわらず、確実度を累積するた
めに、「確実な」係り受け関係とは異なる係り受け関係
が妥当な係り受け関係として決定されしまうのを防止す
ることができる。
(5) According to the invention of claim 5, in the invention of claim 4, even when many dependency relationships different from the “certain” dependency relationships appear,
The cumulative value of the certainty is never larger than the cumulative value of certainty in the same dependency relationship as the “certain” dependency relationship. As a result, a dependency relationship different from the “certain” dependency relationship is appropriate in order to accumulate certainty even though the same dependency relationship as the “certain” dependency relationship exists. Can be prevented.

【0028】[0028]

【実施例】以下、図面を参照しながら、この発明の実施
例を詳細に説明する。図1は、この発明の第1の実施例
の構成を示すブロック図である。なお、図1において、
太い矢印は、処理の流れを示し、細い矢印はデータの流
れを示す。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the first embodiment of the present invention. In FIG. 1,
Thick arrows indicate the flow of processing, and thin arrows indicate the flow of data.

【0029】図において、11は、自然言語文の句の解
析結果に基づいて、自然言語文に含まれる係り受け関係
を機械的に解析し、解析した係り受け関係を抽出する係
り受け関係抽出部である。
In the figure, reference numeral 11 denotes a dependency relationship extracting section for mechanically analyzing the dependency relationship included in the natural language sentence based on the analysis result of the phrase of the natural language sentence and extracting the analyzed dependency relationship. Is.

【0030】12は、係り受け関係辞書を記憶する係り
受け関係辞書記憶部である。ここで、係り受け関係辞書
とは、各係り受け関係ごとに、その確実度が格納される
辞書である。また、確実度とは、真の係り受け関係とし
て確実さの度合いをいう。なお、この係り受け関係辞書
に格納される確実度は、後述する第3の確実度である。
Reference numeral 12 is a dependency relation dictionary storage unit for storing a dependency relation dictionary. Here, the dependency relation dictionary is a dictionary in which the degree of certainty is stored for each dependency relation. The certainty is the degree of certainty as a true dependency relationship. The certainty factor stored in the dependency relation dictionary is a third certainty factor described later.

【0031】13は、各係り受け関係ごとに、その種類
を判別し、この判別結果に基づいて、その確実度を推定
する第1の確実度推定部である。以下、この第1の確実
度推定部13により推定される確実度を第1の確実度と
いう。なお、この第1の確実度推定部13の機能につい
ては、後で詳細に説明する。
Reference numeral 13 denotes a first certainty degree estimating section for discriminating the type of each dependency relation and estimating the certainty degree based on the discrimination result. Hereinafter, the certainty estimated by the first certainty estimation unit 13 is referred to as the first certainty. The function of the first reliability estimation unit 13 will be described in detail later.

【0032】14は、確実度辞書を記憶する確実度辞書
記憶部である。ここで、確実度辞書とは、係り受け関係
の各種類ごとに、第1の確実度が格納される辞書であ
る。
Reference numeral 14 is a certainty dictionary storage unit for storing the certainty dictionary. Here, the certainty degree dictionary is a dictionary in which the first certainty degree is stored for each type of dependency relationship.

【0033】15は、各係り受け関係ごとに、後述する
意味距離に基づいて、その類似度を算出し、この算出結
果に基づいて、その確実度を推定する第2の確実度推定
部である。以下、この第2の確実度推定部15により推
定される確実度を第2の確実度という。なお、この第2
の確実度推定部15の機能については、後で詳細に説明
する。
Reference numeral 15 is a second certainty degree estimating unit which calculates the degree of similarity for each dependency relationship based on a semantic distance described later and estimates the certainty degree based on the calculation result. . Hereinafter, the certainty estimated by the second certainty estimation unit 15 will be referred to as the second certainty. In addition, this second
The function of the certainty estimation unit 15 will be described in detail later.

【0034】16は、意味距離辞書を記憶する意味距離
辞書記憶部である。ここで、意味距離辞書とは、2つの
語の間の意味上の距離が格納される辞書である。
Reference numeral 16 is a semantic distance dictionary storage unit for storing a semantic distance dictionary. Here, the semantic distance dictionary is a dictionary that stores the semantic distance between two words.

【0035】17は、各係り受け関係ごとに、第1,第
2の確実度推定部13、15により推定された第1,第
2の確実度の積を算出し、この算出結果に基づいて、そ
の確実度を推定する第3の確実度推定部である。以下、
この第3の確実度推定部17により推定される確実度を
第3の確実度という。
17 calculates a product of the first and second certainty degrees estimated by the first and second certainty degree estimating units 13 and 15 for each dependency relationship, and based on the calculation result. , A third certainty degree estimating unit for estimating the certainty degree. Less than,
The certainty estimated by the third certainty estimator 17 is referred to as the third certainty.

【0036】18は、第3の確実度に基づいて、ある修
飾語に複数の係り先の候補が存在する場合に、この複数
の候補の中から1つを妥当な係り先として決定する係り
先決定部である。
The reference numeral 18 is a party to determine, based on the third certainty, when one modifier has a plurality of candidates to be related parties, one of the plurality of candidates is determined as a proper relationship to be modified. It is the decision unit.

【0037】以上が第1の実施例の構成である。ここ
で、上述した第1,第2の確実度推定部13,15の機
能をさらに詳細に説明する。
The above is the configuration of the first embodiment. Here, the functions of the above-described first and second reliability estimation units 13 and 15 will be described in more detail.

【0038】まず、第1の確実度推定部13の機能を説
明する。この第1の確実度推定部13は、上記の如く、
各係り受け関係ごとに、その種類を判別し、この判別結
果に基づいて、第1の確実度を推定する。
First, the function of the first reliability estimation unit 13 will be described. As described above, the first reliability estimation unit 13
The type is discriminated for each dependency relation, and the first reliability is estimated based on the discrimination result.

【0039】この場合、係り受け関係の種類としては、
例えば、「確実な」係り受け関係と、「近くの」係り受
け関係と、「離れた」係り受け関係の3つがある。ここ
で、「確実な」係り受け関係とは、上述したように、修
飾語の係り先の候補が1つしか存在しない関係をいう。
また、「近くの」係り受け関係とは、修飾語の係り先の
候補が複数存在する場合において、修飾語がその次の語
に係る関係いう。同様に、「離れた」係り受け関係と
は、修飾語がその次の次の語以降の語に係る関係をい
う。
In this case, the types of dependency relationship are:
For example, there are three "firm" dependency relationships, "near" dependency relationships, and "remote" dependency relationships. Here, the "certain" dependency relation means a relation in which there is only one candidate for the dependency destination of the modifier, as described above.
In addition, the “near” dependency relationship is a relationship in which a modifier is related to the next word when there are a plurality of candidates for the modifier to which the modifier is related. Similarly, a "distant" dependency relationship is a relationship in which a modifier is related to the word after the next word.

【0040】これを図面を使って説明する。いま、図2
(a)に示すように、n(n≧2)個の文節Am (m=
n,(n−1),…,2,1)からなる自然言語文Aを
考える。この自然言語文Aから係り受け関係を機械的に
抽出すると、図2(b)に示すように、{n(n−
1)}/2個の係り受け関係が抽出される。
This will be described with reference to the drawings. Figure 2 now
As shown in (a), n (n ≧ 2) clauses A m (m =
Consider a natural language sentence A consisting of n, (n-1), ..., 2, 1). When the dependency relation is mechanically extracted from the natural language sentence A, {n (n-
1)} / 2 dependency relationships are extracted.

【0041】この場合、「確実な」係り受け関係は、
(A2 →A1 )で表される一番最後の係り受け関係に相
当する。また、「近くの」係り受け関係は、(Ai →A
i-1(n>i≧2))で表される係り受け関係に相当す
る。さらに、「離れた」係り受け関係は、(Ai →Aj
(n≧i,j≧1,i≧j+2))で表される係り受け
関係に相当する。
In this case, the "certain" dependency relationship is
This corresponds to the last dependency relationship represented by (A 2 → A 1 ). In addition, the dependency relationship “near” is (A i → A
This corresponds to the dependency relationship represented by i-1 (n> i ≧ 2). In addition, the "remote" dependency relationship is (A i → A j
This corresponds to the dependency relationship represented by (n ≧ i, j ≧ 1, i ≧ j + 2)).

【0042】例えば、自然言語文Aが図3(a)に示す
ような「蓋の壊れたポット」であるとする。この場合、
この自然言語文Aからは、図3(b)に示すように、3
つの係り受け関係(A3 →A2 ),(A3 →A1 ),
(A2 →A1 )が抽出される。ここで、「壊れた」(A
2 )の係り先の候補は、「ポット」(A1 )しか存在し
ない。したがって、「壊れた」→「ポット」(A2 →A
1 )は、上述した「確実な」係り受け関係に相当する。
For example, assume that the natural language sentence A is a "pot with a broken lid" as shown in FIG. 3 (a). in this case,
From this natural language sentence A, as shown in FIG.
Dependency relationships (A 3 → A 2 ), (A 3 → A 1 ),
(A 2 → A 1 ) is extracted. Here, "broken" (A
There is only "pot" (A 1 ) as the candidate for the contact in 2 ). Therefore, "broken" → "pot" (A 2 → A
1 ) corresponds to the “certain” dependency relationship described above.

【0043】これに対し、「蓋(の)」(A3 )の係り
先の候補は、「壊れた」(A2 )と「ポット」(A1
の2つ存在する。この場合、「壊れた」(A2 )は、
「蓋(の)」(A3 )の次の語である。したがって、
「蓋(の)」→「壊れた」(A3 →A2 )は、「近く
の」係り受け関係に相当する。また、「ポット」
(A1 )は、「蓋(の)」(A3 )の次の次の語であ
る。したがって、「蓋(の)」→「ポット」(A3 →A
1 )は、上述した「離れた」係り受け関係に相当する。
[0043] On the other hand, "lid (s)" head candidates of (A 3) is "broken" (A 2) and the "pot" (A 1)
There are two. In this case, "broken" (A 2 ) is
Is the next of the term "lid (s)" (A 3). Therefore,
“Lid” → “broken” (A 3 → A 2 ) corresponds to the “near” dependency relationship. Also, "pot"
(A 1 ) is the next word after “the lid” (A 3 ). Therefore, "lid" → "pot" (A 3 → A
1 ) corresponds to the “distant” dependency relationship described above.

【0044】なお、係り受け関係の種類の判別は、係り
先の候補の数と、修飾語と非修飾語の位置距離とに基づ
いてなされる。
The type of the dependency relation is determined based on the number of candidates of the dependency destination and the positional distance between the modifier and the non-modifier.

【0045】第1の確実度推定部13は、「確実な」係
り受け関係には、最も大きな第1の確実度を付与し、
「近く」の係り受け関係には、2番目に大きな第1の確
実度を付与し、「離れた」係り受け関係には、最も小さ
な第1の確実度を付与する。この場合、この第1の確実
度は、例えば、0〜1の値で表され、値が大きくなるほ
ど、確実さの度合いが増す。
The first certainty degree estimating unit 13 gives the largest certainty degree to the "certain" dependency relationship,
The “close” dependency relationship is given the second largest first certainty, and the “distant” dependency relationship is given the smallest first certainty. In this case, the first degree of certainty is represented by, for example, a value of 0 to 1, and the greater the value, the greater the degree of certainty.

【0046】「確実な」係り受け関係に最も大きな第1
の確実度を付与するのは、この関係は、係り先の候補が
1つしか存在しない関係であるため、文の意味を推測す
るまでもなく、真の係り受け関係とみなすことができる
からである。
The 1st largest in "definite" dependency relationship
The degree of certainty is given because this relationship can be regarded as a true dependency relationship without guessing the meaning of the sentence because there is only one candidate for the dependency. is there.

【0047】また、「近くの」係り受け関係に「離れ
た」係り受け関係より大きな第1の確実度を付与するの
は、ある修飾語の係り先の候補が複数存在する場合、こ
の修飾語は、大抵、次の語に係るからである。例えば、
図3の例の場合は、「蓋(の)」(A3 )の係り先の候
補は、「壊れた」(A2 )と「ポット」(A1 )の2つ
存在する。しかし、その意味から推測すると、「蓋
(の)」(A3 )は、「壊れた」(A2 )に係る。
Further, the first certainty degree greater than that of the "distant" dependency relationship is given to the "near" dependency relationship, when there are a plurality of candidates of the dependency destination of a modifier, this modifier Is usually associated with the following words: For example,
In the case of the example in FIG. 3, there are two candidates for the “lid” (A 3 ) to be related to, “broken” (A 2 ) and “pot” (A 1 ). However, when deduced from the meaning "lid (s)" (A 3), in accordance with "broken" (A 2).

【0048】さらに、「離れた」係り受け関係にも、0
以外の第1の確実度を付与するのは、文意によっては、
「離れた」係り受け関係が真の係り受け関係となる場合
があるからである。例えば、自然言語文Aが、図4
(a)に示すような「部屋の壊れたポット」であるとす
ると、「部屋(の)」(A3 )の係り先の候補として
は、図4(b)に示すように、「壊れた」(A2 )と
「ポット」(A1 )の2つが存在する。しかし、文の意
味を考えると、「部屋(の)」(A3 )は「ポット」
(A1 )に係る。
Furthermore, even in the case of the "distant" dependency relationship,
Depending on the meaning of the sentence, the first certainty other than
This is because the "distant" dependency relationship may become a true dependency relationship. For example, the natural language sentence A is shown in FIG.
When a as shown in (a) "broken pot room", as the head candidates of "room (s)" (A 3), as shown in FIG. 4 (b), "broken "(A 2 ) and" pot "(A 1 ) exist. However, considering the meaning of the sentence, "the room (s)" (A 3) is "pot"
(A 1 ).

【0049】次に、第2の確実度推定部15の機能を説
明する。この第2の確実度推定部15は、上記の如く、
各係り受け関係ごとに、その類似度を算出し、この算出
結果に基づいて、第2の確実度を推定する。但し、この
実施例では、算出された類似度が第2の確実度として使
用される。
Next, the function of the second reliability estimation section 15 will be described. As described above, the second reliability estimation unit 15
The degree of similarity is calculated for each dependency relationship, and the second degree of certainty is estimated based on the calculation result. However, in this embodiment, the calculated similarity is used as the second certainty.

【0050】ここで、係り受け関係の類似度とは、ある
係り受け関係と「確実な」係り受け関係との類似の度合
いをいう。この類似度は、ある係り受け関係と「確実
な」係り受け関係の修飾語間の意味距離と非修飾語間の
意味距離との積で表される。
Here, the degree of similarity of the dependency relationship refers to the degree of similarity between a certain dependency relationship and a "certain" dependency relationship. This degree of similarity is represented by the product of the semantic distance between modifiers of a certain dependency and the “certain” dependency, and the semantic distance between non-modifiers.

【0051】例えば、ある係り受け関係を(Ai
j )とし、「確実な」係り受け関係を(Bi →Bj
とすると、ある係り受け関係(Ai →Aj )の類似度
は、修飾語Ai ,Bi 間の意味距離と非修飾語Aj ,B
j 間の意味距離との積で表される。
For example, a dependency relation (A i
A j ), and a “certain” dependency relationship (B i → B j ).
Then, the similarity of a dependency relation (A i → A j ) is determined by the semantic distance between the modifiers A i and B i and the non-modifiers A j and B j .
It is expressed as the product of the semantic distances between j .

【0052】2つの語の間の意味距離とは、2つの語の
意味の近さをいう。この語間の意味距離は、例えば、
“「共起データを用いた単語の意味ネットワークの作
成」、松平、沖電気工業、情報処理学会第42回全国大
会”、“「共起データの補完方式」、松平、沖電気工
業、特開平3−303432”に開示された方法で与え
られる。
The semantic distance between two words refers to the closeness of meaning of the two words. The semantic distance between the words is, for example,
"Creating a Semantic Network of Words Using Co-occurrence Data", Matsudaira, Oki Electric Industry, 42nd National Conference of Information Processing Society of Japan, "" Complementary Method for Co-occurrence Data ", Matsudaira, Oki Electric Industry, JP 3-303432 ".

【0053】これらの文献によれば、語間の意味距離
は、例えば、0〜1の値で表され、値が大きくなるほど
意味が近くなる。この場合、同一語間の意味距離は、1
で表される。語間の意味距離が0〜1の値で表される場
合、類似度も0〜1の値で表される。この場合、値が大
きくなるほど、類似の度合いが高くなる。
According to these documents, the semantic distance between words is represented by, for example, a value of 0 to 1, and the larger the value, the closer the meaning. In this case, the semantic distance between the same words is 1
It is represented by. When the semantic distance between words is represented by a value of 0 to 1, the similarity is also represented by a value of 0 to 1. In this case, the larger the value, the higher the degree of similarity.

【0054】なお、「確実な」係り受け関係が複数存在
する場合は、ある係り受け関係の類似度は、例えば、あ
る係り受け関係と各「確実な」係り受け関係との類似度
の平均値として算出される。
When there are a plurality of "certain" dependency relationships, the similarity of a certain dependency relationship is, for example, the average value of the similarities between a certain dependency relationship and each "certain" dependency relationship. Is calculated as

【0055】以上が第1の実施例の構成である。次に、
上記構成において、図5のフローチャートを参照しなが
ら動作を説明する。
The above is the configuration of the first embodiment. next,
The operation of the above configuration will be described with reference to the flowchart of FIG.

【0056】自然言語文の句の解析結果は係り受け解析
部11に供給される(ステップS11)。係り受け関係
解析部11は、この解析結果を受け取ると、まず、この
解析結果に基づいて、自然言語文の係り受け関係を解析
し、解析した係り受け関係を抽出する(ステップS1
2)。
The analysis result of the phrase of the natural language sentence is supplied to the dependency analysis unit 11 (step S11). Upon receiving this analysis result, the dependency relationship analysis unit 11 first analyzes the dependency relationship of the natural language sentence based on this analysis result, and extracts the analyzed dependency relationship (step S1).
2).

【0057】次に、係り受け関係解析部11は、抽出し
た解析結果を係り受け関係辞書に格納する(ステップS
13)。抽出したすべての係り受け関係の格納が終了す
ると、係り受け関係抽出部11は、第1の確実度推定部
13に第1の確実度の推定を依頼する。
Next, the dependency relation analysis unit 11 stores the extracted analysis result in the dependency relation dictionary (step S).
13). When the storage of all the extracted dependency relationships is completed, the dependency relationship extraction unit 11 requests the first certainty degree estimation unit 13 to estimate the first certainty degree.

【0058】第1の確実度推定部13は、この依頼を受
けると、まず、確実度辞書に格納されている第1の確実
度を参照し(ステップS14)、これを変更するか否か
を判定する(ステップS15)。この判定は、係り受け
関係辞書に係り受け関係が格納された文の数や文間の分
野の近さ等に基づいて行われる。入力される文の数や分
野の近さを示す情報は、例えば、利用者から装置に与え
られる。
Upon receipt of this request, the first certainty degree estimating unit 13 first refers to the first certainty degree stored in the certainty degree dictionary (step S14) and determines whether or not to change it. The determination is made (step S15). This determination is made based on the number of sentences in which the dependency relation is stored in the dependency relation dictionary, the closeness of fields between the sentences, and the like. Information indicating the number of input sentences and the closeness of fields is given to the device from the user, for example.

【0059】第1の確実度を変更する場合、第1の確実
度推定部13は、変更後の第1の確実度を求め、これを
確実度辞書に格納する(ステップS16)。この場合、
第1の確実度推定部13は、文の数が多ければ多いほ
ど、また、文の分野が近ければ近いほど、「確実な」係
り受け関係に付与される第1の確実度と「近くの」係り
受け関係や「離れた」係り受け関係に付与される第1の
確実度との差を大きくする。
When changing the first certainty factor, the first certainty factor estimating unit 13 obtains the changed first certainty factor and stores it in the certainty factor dictionary (step S16). in this case,
The larger the number of sentences and the closer the sentence fields are, the first certainty degree estimating unit 13 determines the first certainty degree and the “closer” given to the “certain” dependency relationship. The difference from the first certainty given to the “dependency relationship” or the “distant” modification relationship is increased.

【0060】この処理が終了すると、第1の確実度推定
部13は、ステップS17の処理を実行する。これに対
し、確実度を変更しない場合は、そのままステップS1
7の処理を実行する。
Upon completion of this process, the first certainty estimation unit 13 executes the process of step S17. On the other hand, when the reliability is not changed, the step S1 is performed as it is.
The process of 7 is executed.

【0061】このステップS17においては、第1の確
実度推定部13は、係り受け関係辞書に格納された各係
り受け関係ごとに、その種類を判別し、判別した種類に
対応する第1の確実度を確実度辞書から読み出し、これ
を当該係り受け関係に付与する。この処理がすべての係
り受け関係について終了すると、第1の確実度推定部1
3は、第2の確実度推定部15に第2の確実度の推定を
依頼する。
In step S17, the first certainty degree estimating unit 13 determines the type of each dependency relation stored in the dependency relation dictionary, and the first certainty factor corresponding to the determined type. The degree is read out from the certainty dictionary and is added to the dependency relation. When this process is completed for all dependency relationships, the first certainty estimation unit 1
3 requests the second certainty estimation unit 15 to estimate the second certainty.

【0062】第2の確実度推定部15は、この依頼を受
けると、第1の確実度を付与された各係り受け関係ごと
に、意味距離辞書を参照しながら(ステップS18)、
その類似度を計算し(ステップS19)、これを第2の
確実度として、当該係り受け関係に付与する(ステップ
S20)。
Upon receipt of this request, the second certainty degree estimating unit 15 refers to the semantic distance dictionary for each dependency relation given the first certainty degree (step S18),
The degree of similarity is calculated (step S19), and the second degree of certainty is given to the dependency relationship (step S20).

【0063】なお、類似度を計算する場合は、今回の処
理により抽出された「確実な」係り受け関係との類似度
のみを計算するようにしてもよいし、係り受け関係辞書
に、以前の処理により抽出された「確実な」係り受け関
係が格納されている場合には、この係り受け関係との類
似度をも計算するようにしてもよい。いずれにするか
は、例えば、利用者からの指示により決定するようにす
ればよい。
When calculating the degree of similarity, it is possible to calculate only the degree of similarity with the "certain" dependency relation extracted by this processing, or in the dependency relation dictionary. When the “certain” dependency relationship extracted by the process is stored, the similarity to this dependency relationship may also be calculated. Which one should be used may be determined by, for example, an instruction from the user.

【0064】以上の処理がすべての係り受け関係につい
て終了すると、第2の確実度推定部15は、第3の確実
度推定部17に第3の確実度の推定を依頼する。
When the above processing is completed for all dependency relationships, the second certainty degree estimating unit 15 requests the third certainty degree estimating unit 17 to estimate the third certainty degree.

【0065】第3の確実度推定部17は、この依頼を受
けると、各係り受け関係ごとに、この係り受け関係に付
与された第1の確実度と第2の確実度との積を計算し
(ステップS21)、これを第3の確実度として、当該
係り受け関係に付与する(ステップS22)。この後、
第3の確実度推定部17は、この第3の確実度を付与し
た係り受け関係を係り受け関係辞書に格納する(ステッ
プS23)。
Upon receipt of this request, the third certainty degree estimating unit 17 calculates, for each dependency relationship, the product of the first certainty degree and the second certainty degree given to this dependency relationship. (Step S21), this is given to the dependency relationship as the third certainty (step S22). After this,
The third certainty degree estimation unit 17 stores the dependency relationship with the third certainty degree in the dependency relationship dictionary (step S23).

【0066】以上の処理がすべての係り受け関係につい
て終了すると、第3の確実度推定部17は、係り先決定
部18に係り先の決定を依頼する。係り先決定部18
は、この依頼を受けると、各修飾語ごとに、その係り先
を決定する。この場合、係り先決定部18は、当該修飾
語の係り先の候補が1つしかない場合は、当該候補を妥
当な係り先として決定し、複数存在する場合は、第3の
確実度が最も大きい候補を妥当な係り先として決定す
る。
When the above processing is completed for all the dependency relationships, the third certainty level estimating section 17 requests the dependency determining section 18 to determine the dependency. Contact determination unit 18
Upon receipt of this request, will determine the contact person for each modifier. In this case, when there is only one candidate for the modification destination of the modifier, the modification determining unit 18 determines the candidate as a valid modification target, and when there are a plurality of candidates, the third certainty factor is the highest. The large candidate is determined as a reasonable contact.

【0067】以上が第1の実施例の動作である。ここ
で、上述した動作を、次の3つの自然言語文a,b,c
を含む文章1の句の解析結果が係り受け関係抽出部11
に与えられた場合を代表として説明する。
The above is the operation of the first embodiment. Here, the above-mentioned operation is performed by the following three natural language sentences a, b, and c.
The analysis result of the phrase of the sentence 1 including
Will be described as a representative.

【0068】[文章1] a:日本のアジアへの輸出は、工業製品が主である。 b:日本の貿易への風当りは強く、黒字減らしに懸命で
ある。 c:しかし、最近では、円高が日本の貿易を変化させて
いる。
[Sentence 1] a: Japanese exports to Asia are mainly industrial products. b: Japan has a strong wind hit on trade and is working hard to reduce the surplus. c: However, recently, the appreciation of the yen is changing Japanese trade.

【0069】係り受け関係抽出部11は、自然言語文a
からは、次の3つの係り受け関係を抽出する。
The dependency relationship extracting unit 11 determines the natural language sentence a.
From, the following three dependency relationships are extracted.

【0070】 「日本(の)」 →「アジア」 (a3 →a2 ) 「日本(の)」 →「輸出」 (a3 →a1 ) 「アジア(への)」 →「輸出」 (a2 →a1 ) また、自然言語文bからは、次の3つの係り受け関係を
抽出する。
“Japan ()” → “Asia” (a3 → a2) “Japan ()” → “Export” (a3 → a1) “Asia (to)” → “Export” (a2 → a1) , The following three dependency relationships are extracted from the natural language sentence b.

【0071】 「日本(の)」 →「貿易(への)」 (b3 →b2 ) 「日本(の)」 →「風当たり」 (b3 →b1 ) 「貿易(への)」 →「風当たり」 (b2 →b1 ) また、自然言語文bからは、次の1つの係り受け関係を
抽出する。
“Japan (of)” → “trade (to)” (b3 → b2) “Japan (of)” → “wind hit” (b3 → b1) “trade (to)” → “wind hit” (b2) → b1) In addition, the following one dependency relation is extracted from the natural language sentence b.

【0072】 「日本(の)」 →「貿易」 (c2 →c1 ) ここで、(a2 →a1 ),(b2 →b1 ),(c2 →c
1 )は、「確実な」係り受け関係であり、(a3 →a2
),(b3 →b2 )は「近くの」係り受け関係であ
り、(a3 →a1 ),(b3 →b1 )は、「離れた」係
り受け関係である。
“Japan ()” → “trade” (c2 → c1) where (a2 → a1), (b2 → b1), (c2 → c)
1) is a "certain" dependency relationship, and (a3 → a2
) And (b3 → b2) are "close" dependencies, and (a3 → a1) and (b3 → b1) are "distant" dependencies.

【0073】第1の確実度推定部13は、各係り受け関
係に第1の確実度を付与する。いま、「確実な」係り受
け関係には、0.9を付与し、「近くの」係り受け関係
には、0.2を付与し、「離れた」係り受け関係には
0.1を付与するものとすると、(a2 →a1 ),(b
2 →b1 ),(c2 →c1 )には、0.9が付与され、
(a3 →a2 ),(b3 →b2 )には、0.2が付与さ
れ、(a3 →a1 ),(b3 →b1 )には、0.1が付
与される。
The first certainty degree estimating unit 13 gives the first certainty degree to each dependency relationship. Now, 0.9 is given to the "certain" dependency relationship, 0.2 is given to the "close" dependency relationship, and 0.1 is given to the "remote" dependency relationship. Assuming that (a2 → a1), (b
0.9 is given to 2 → b1) and (c2 → c1),
0.2 is given to (a3 → a2) and (b3 → b2), and 0.1 is given to (a3 → a1) and (b3 → b1).

【0074】第2の確実度推定部15は、各係り受け関
係ごとに、その類似度を計算し、これを第2の確実度と
して付与する。第3の確実度推定部17は、各係り受け
関係ごとに、その第1の確実度と第2の確実度の積を計
算し、これを第3の確実度として付与する。
The second certainty degree estimating unit 15 calculates the degree of similarity for each dependency relationship and gives this as the second certainty degree. The third certainty degree estimation unit 17 calculates the product of the first certainty degree and the second certainty degree for each dependency relationship, and assigns this as the third certainty degree.

【0075】いま、自然言語文a,b,cから抽出され
た「確実な」係り受け関係のみに基づいて、類似度を計
算するものとすると、係り受け関係(a3 →a2 )の類
似度は、 (a3 →a2 )と(a2 →a1 )との類似度と、 (a3 →a2 )と(b2 →b1 )との類似度と、 (a3 →a2 )と(c2 →c1 )との類似度と の平均値として求められる。
Now, assuming that the similarity is calculated only based on the "certain" dependency relationships extracted from the natural language sentences a, b, and c, the similarity of the dependency relationship (a3 → a2) is , (A3 → a2) and (a2 → a1), the degree of similarity between (a3 → a2) and (b2 → b1), and the degree of similarity between (a3 → a2) and (c2 → c1) It is calculated as the average value of and.

【0076】(a3 →a2 )と(a2 →a1 )の類似度
は、 「日本」と「アジア」との意味距離と、 「アジア」と「輸出」との意味距離と の積として求められる。
The similarity between (a3 → a2) and (a2 → a1) is obtained as the product of the semantic distance between “Japan” and “Asia” and the semantic distance between “Asia” and “export”.

【0077】(a3 →a2 )と(b2 →b1 )の類似度
は、 「日本」と「貿易」との意味距離と、 「アジア」と「風当たり」との意味距離と の積として求められる。
The degree of similarity between (a3 → a2) and (b2 → b1) is obtained as the product of the semantic distance between “Japan” and “trade” and the semantic distance between “Asia” and “windbreak”.

【0078】(a3 →a2 )と(c2 →c1 )の類似度
は、 「日本」と「日本」との意味距離と、 「アジア」と「貿易」との意味距離と の積として求められる。
The similarity between (a3 → a2) and (c2 → c1) is obtained as the product of the semantic distance between “Japan” and “Japan” and the semantic distance between “Asia” and “trade”.

【0079】いま、各語間の意味距離が図6のように設
定されているとすると、各類似度は 、 (a3 →a2 )と(a2 →a1 )の類似度=0.9×0.1 (a3 →a2 )と(b2 →b1 )の類似度=0.1×0.2 (a3 →a2 )と(c2 →c1 )の類似度=1.0×0.1 となる。
Assuming that the semantic distance between each word is set as shown in FIG. 6, each similarity is as follows: (a3 → a2) and (a2 → a1) similarity = 0.9 × 0. 1 The similarity between (a3 → a2) and (b2 → b1) = 0.1 × 0.2 The similarity between (a3 → a2) and (c2 → c1) = 1.0 × 0.1.

【0080】これにより、(a3 →a2 )の第2の確実
度は、 (a3 →a2 )の第2の確実値 =(0.9×0.1+0.1×0.2+1.0×0.1)/3 となる。その結果、(a3 →a2 )の第3の確実度は、 (a3 →a2 )の第3の確実値 =0.2×{(0.9×0.1+0.1×0.2+1.0×0.1)/3} =0.014 となる。
Thus, the second certainty factor of (a3 → a2) is the second certainty value of (a3 → a2) = (0.9 × 0.1 + 0.1 × 0.2 + 1.0 × 0. 1) / 3. As a result, the third certainty value of (a3 → a2) is the third certainty value of (a3 → a2) = 0.2 × {(0.9 × 0.1 + 0.1 × 0.2 + 1.0 × 0.1) / 3} = 0.014.

【0081】同様に、(a3 →a1 ),(a2 →a1
),(a2 →a1 ),(b3 →b2 ),(b3 →b1
),(b2 →b1 ),(c2 →c1 )の第3の確実度
は、それぞ れ (a3 →a1 )の第3の確実度 =0.1×{(0.9×0.1+0.1×0.2+1.0×0.1)/3} =0.058 (a2 →a1 )の第3の確実度 =0.9×{(1.0×1.0+0.1×0.3+0.9×0.8)/3} =0.525 (b3 →b2 )の第3の確実度 =0.2×{(0.9×0.8+0.1×0.3+1.0×1.0)/3} =0.117 (b3 →b1 )の第3の確実度 =0.1×{(0.9×0.3+0.1×1.0+1.0×1.0)/3} =0.022 (b2 →b1 )の第3の確実度 =0.9×{(0.1×0.3+1.0×1.0+0.1×0.3)/3} =0.318 (c2 →c1 )の第3の確実度 =0.9×{(0.9×0.8+0.1×0.3+1.0×1.0)/3} =0.525 となる。
Similarly, (a3 → a1), (a2 → a1)
), (A2 → a1), (b3 → b2), (b3 → b1)
), (B2 → b1), and (c2 → c1), the third certainty of (a3 → a1) is 0.1 × {(0.9 × 0.1 + 0. 1 × 0.2 + 1.0 × 0.1) / 3} = 0.058 Third certainty of (a2 → a1) = 0.9 × {(1.0 × 1.0 + 0.1 × 0.3 + 0) .9 × 0.8) / 3} = 0.525 Third certainty of (b3 → b2) = 0.2 × {(0.9 × 0.8 + 0.1 × 0.3 + 1.0 × 1. 0) / 3} = 0.117 (b3 → b1) third certainty = 0.1 × {(0.9 × 0.3 + 0.1 × 1.0 + 1.0 × 1.0) / 3} = 0.022 (b2 → b1) third certainty = 0.9 × {(0.1 × 0.3 + 1.0 × 1.0 + 0.1 × 0.3) / 3} = 0.318 ( Third certainty of c2 → c1 = 0.9 × {(0.9 × 0.8 + 0.1 × 0.3 + 1.0 A 1.0) / 3} = 0.525.

【0082】(a3 →a2 )と(a3 →a1 )の第3の
確実度を比較すると、(a3 →a1)の第3の確実度の
方が(a3 →a2 )の第3の確実度より大きい。したが
って、この場合、係り先決定部18は、自然言語文aの
「日本(の)」(a3 )の係り先を「輸出」(a1 )と
決定する。
Comparing the third certainties of (a3 → a2) and (a3 → a1), the third certainty of (a3 → a1) is better than the third certainty of (a3 → a2). large. Therefore, in this case, the dependency determining unit 18 determines the dependency of "Japan (no)" (a3) of the natural language sentence a as "export" (a1).

【0083】(b3 →b2 )と(b3 →b1 )の第3の
確実度を比較すると、(b3 →b2)の第3の確実度の
方が(b3 →b1 )の第3の確実度より大きい。したが
って、この場合、係り先決定部18は、自然言語文bの
「日本(の)」(b3 )の係り先を「貿易(への)」
(b2 )と決定する。これにより、自然言語文bの「日
本(の)」(b3 )の係り先は、自然言語文cの「確実
な」係り受け関係(c2→c1 )における「日本
(の)」(c2 )の係り先と同じ「貿易」(c1 )に設
定される。
Comparing the third certainty factors of (b3 → b2) and (b3 → b1), the third certainty factor of (b3 → b2) is better than the third certainty factor of (b3 → b1). large. Therefore, in this case, the contact determination unit 18 assigns the contact of "Japan (no)" (b3) of the natural language sentence b to "trade (to)".
(B2). As a result, the destination of "Japan" (b3) of the natural language sentence b is the "Japan" (c2) of the "certain" dependency relation (c2 → c1) of the natural language sentence c. It is set to the same "trade" (c1) as the contact.

【0084】なお、係り先決定部18は、自然言語文
a,b,cにおける「アジア(への)」(a2 ),「貿
易(への)」(b2 ),「日本(の)」(c2 )の係り
先を決定する場合は、これらの候補がそれぞれ1つしか
ないので、それぞれ「輸出」(a1 ),「風当たり」
(b2 ),「貿易」(c2 )と決定する。
Note that the contact determination section 18 uses the "Asia (to)" (a2), "Trade (to)" (b2), and "Japan (to)" (in the natural language sentences a, b and c) ( When deciding who is responsible for c2), there is only one of these candidates, so "export" (a1) and "wind hit" respectively.
(B2) and "trade" (c2).

【0085】以上が第1の実施例の構成と動作である。
このような構成によれば、次のような効果が得られる。
The above is the configuration and operation of the first embodiment.
According to such a configuration, the following effects can be obtained.

【0086】(1) まず、この実施例によれば、各係
り受け関係ごとに、「確実な」係り受け関係との類似度
を算出し、この算出結果に基づいて、第2の確実度を推
定し、この第2の確実度に基づいて、妥当な係り先を決
定するようにしたので、「確実な」係り受け関係に基づ
いて、係り先を決定することができる。これにより、係
り先の決定精度を高めることができる。
(1) First, according to this embodiment, the degree of similarity with the "certain" dependency relation is calculated for each dependency relation, and the second certainty factor is calculated based on this calculation result. Since the estimation is performed and the appropriate relationship is determined based on the second certainty, the relationship can be determined based on the “certain” relationship. As a result, it is possible to improve the accuracy of determining the contact person.

【0087】(2) また、この実施例によれば、各係
り受け関係ごとに、その種類を判別し、この判別結果に
基づいて、第1の確実度を推定し、この第1の確実度と
上述した第2の確実度に基づいて、係り先を決定するよ
うにしたので、第2の確実度のみに基づいて係り先を決
定する場合より、さらに、決定精度を高めることができ
る。
(2) According to this embodiment, the type is discriminated for each dependency relation, the first certainty is estimated based on the discrimination result, and the first certainty is calculated. Since the dependent is determined based on the second certainty described above, the accuracy of the determination can be further improved as compared with the case where the dependent is determined only based on the second certainty.

【0088】(3) また、この実施例によれば、各係
り受け関係が「確実な」係り受け関係と同じか否かを判
別し、この判別結果に基づいて、係り先を決定するので
はなく、「確実な」係り受け関係との類似度を算出し、
この算出結果に基づいて、係り先を決定するようにした
ので、各係り受け関係が「確実な」係り受け関係と同じ
場合だけでなく、異なる場合にも対処することができ
る。
(3) Further, according to this embodiment, it is determined whether or not each dependency relationship is the same as the "certain" dependency relationship, and the dependency destination is not determined based on this determination result. Instead, calculate the degree of similarity with a "certain" dependency relationship,
Since the dependents are determined based on this calculation result, it is possible to deal not only with the case where each dependency relationship is the same as the “certain” dependency relationship, but also when it is different.

【0089】なお、ある係り受け関係が「確実な」係り
受け関係と同じ場合とは、ある係り受け関係の修飾語お
よび被修飾語がそれぞれ「確実な」係り受け関係の修飾
語および被修飾語と同じ場合をいう。また、ある係り受
け関係が「確実な」係り受け関係と異なる場合とは、あ
る係り受け関係の修飾語および被修飾語の少なくとも一
方が「確実な」係り受け関係の修飾語および被修飾語と
異なる場合をいう。
When a certain dependency relationship is the same as a "certain" dependency relationship, a modifier and a modified word of a certain dependency relationship are a modifier and a modified word of a "certain" dependency relationship, respectively. Same as. Further, when a certain dependency relation is different from the “certain” dependency relation, at least one of the modifier and the modifier of the certain dependency relation is different from the modifier and the modifier of the “certain” dependency relation. When different.

【0090】次に、この発明の第2の実施例を詳細に説
明する。先の実施例では、既に出現した係り受け関係と
同じ係り受け関係が出現しても、この係り受け関係を既
出の係り受け関係とは独立に扱う場合を説明した。これ
に対し、この実施例は、同じ係り受け関係が出現するた
びに、その確実度(第3の確実度)を累積することによ
り、同じ係り受け関係を1つの係り受け関係として扱う
ようにしたものである。
Next, the second embodiment of the present invention will be described in detail. In the above-described embodiment, even when the same dependency relationship as the already-appearing dependency relationship appears, this dependency relationship is treated independently of the already existing dependency relationship. On the other hand, in this embodiment, every time the same dependency relationship appears, the certainty degree (third certainty degree) is accumulated so that the same dependency relationship is treated as one dependency relationship. It is a thing.

【0091】図7は、この実施例の構成を示すブロック
図である。なお、図7において、先の図1とほぼ同一機
能を果たす部分には、同一符号を付して詳細な説明を省
略する。
FIG. 7 is a block diagram showing the structure of this embodiment. Note that, in FIG. 7, parts that perform substantially the same functions as in FIG. 1 described above are denoted by the same reference numerals, and detailed description thereof is omitted.

【0092】図7において、図1と異なる点は、確実度
累積部19が設けられている点である。この確実度累積
部19は、同じ係り受け関係が出現するたびに、第3の
確実度を累積し、この累積値を当該係り受け関係の第3
の確実度として係り受け関係辞書に格納する機能を有す
る。
7 is different from FIG. 1 in that a certainty degree accumulating section 19 is provided. The certainty degree accumulating unit 19 accumulates the third certainty degree each time the same dependency relationship appears, and uses this accumulated value as the third dependency degree.
It has a function of storing in the dependency relation dictionary as the certainty of.

【0093】上記構成において、図8を参照しながら動
作を説明する。図8は、この実施例の動作を示すフロー
チャートである。なお、図8において、図5と異なる点
は、確実度累積部19の処理が付加された点にある。し
たがって、図8において、図5とほぼ同一処理を行うス
テップには、同一符号を付し、詳細な説明を省略する。
The operation of the above structure will be described with reference to FIG. FIG. 8 is a flowchart showing the operation of this embodiment. Note that FIG. 8 differs from FIG. 5 in that the processing of the certainty degree accumulation unit 19 is added. Therefore, in FIG. 8, steps that perform substantially the same processing as in FIG. 5 are assigned the same reference numerals and detailed description thereof will be omitted.

【0094】第3の確実度推定部17は、すべての係り
受け関係に対する第3の確実度の付与が終了すると、確
実度累積部19に第3の確実度の累積処理を依頼する。
確実度累積部19は、この依頼を受けると、各係り受け
関係ごとに、当該係り受け関係が係り受け関係辞書に格
納されている係り受け関係と同じか否かを判定する(ス
テップS31)。
When the third certainty degree estimating unit 17 finishes giving the third certainty degree to all the dependency relationships, the third certainty degree estimating unit 17 requests the certainty degree accumulating unit 19 to perform the third certainty degree accumulating process.
Upon receipt of this request, the certainty factor accumulating unit 19 determines, for each dependency relationship, whether the dependency relationship is the same as the dependency relationship stored in the dependency relationship dictionary (step S31).

【0095】以下、判定対象の係り受け関係をYとし、
その第3の確実度をyとする。また、すでに、係り受け
関係辞書に格納されている係り受け関係をXとし、その
第3の確実度xとする。
Hereinafter, the dependency relationship to be judged is Y, and
The third degree of certainty is y. Further, the dependency relationship already stored in the dependency relationship dictionary is X, and the third certainty factor x thereof is used.

【0096】同じであれば、確実度累積部19は、係り
受け関係Xの第3の確実度xと係り受け関係Yの第3の
確実度yとの累積値f(x,y)を計算する(ステップ
S32)。この後、確実度累積部19は、この累積値f
(x,y)を、係り受け関係Xの新たな第3の確実度x
として、係り受け関係辞書に格納する(ステップS2
3)。これに対し、同じでなければ、係り受け関係Yと
その第3の確実度yを係り受け関係辞書に格納する(ス
テップS23)。
If the same, the certainty factor accumulator 19 calculates the cumulative value f (x, y) of the third certainty factor x of the dependency relation X and the third certainty factor y of the dependency relation Y. Yes (step S32). After that, the certainty factor accumulator 19 calculates the accumulated value f
(X, y) is a new third certainty factor x of the dependency relation X
Is stored in the dependency relation dictionary (step S2)
3). On the other hand, if they are not the same, the dependency relation Y and the third certainty factor y thereof are stored in the dependency relation dictionary (step S23).

【0097】以上の処理がすべての係り受け関係につい
て終了すると、確実度累積部19は、係り先決定部18
に係り先の決定を依頼する。係り先決定部18は、この
依頼を受けると、第3の確実度の累積結果(実際に累積
されているか否かは問わない)に基づいて、係り先を決
定する。
When the above processing is completed for all dependency relationships, the certainty degree accumulating section 19 determines the dependency determining section 18
Request the decision of the person in charge. Upon receipt of this request, the dependent determination unit 18 determines the dependent based on the cumulative result of the third certainty degree (whether or not it is actually cumulative).

【0098】上記累積値f(x,y)は、例えば、次の
ような関数で表される。 f(x,y)=log(x+y−x×y/3+1) これにより、(x,y)が、例えば、(0.01,0.01),(0.
1,0.1),(0.9,0.9),(0.99,0.99),(0.1,0.9)ならば、f
(x,y)は、それぞれ f(0.01,0.01)=0.02,f(0.1,0.1)=0.18,f(0.9,0.9)=
0.93,f(0.99,0.99)=0.98,f(0.1,0.9)=0.68 となる。
The cumulative value f (x, y) is represented by the following function, for example. f (x, y) = log (x + y−x × y / 3 + 1) Thereby, (x, y) is, for example, (0.01, 0.01), (0.
If 1,0.1), (0.9,0.9), (0.99,0.99), (0.1,0.9), f
(X, y) are f (0.01,0.01) = 0.02, f (0.1,0.1) = 0.18, f (0.9,0.9) =
0.93, f (0.99,0.99) = 0.98, f (0.1,0.9) = 0.68.

【0099】この累積演算関数は次の要件を満たす。 (1) x,yの値が大きくなると、f(x,y)の値
が大きくなる(f(x,y)は増加関数である)。 (2) x,yの値が大きくなるほど、f(x,y)の
伸びは鈍くなる(x,yの値が大きくなるほど、f
(x,y)の増加の割合は減少する)。 (3) f(x,y)は0以上で1を越えない(0≦f
(x,y)<1)。 (4) xとyの値が0ならば、f(x,y)の値は0
である(x=0,y=0ならばf(x,y)=0)。 (5) f(x,y)の値は、xとyの和より小さい
(f(x,y)<x+y)。 (6) x,yの和が一定ならば、xとyの差の絶対値
が大きくなるほど、f(x,y)の値が大きくなる。
This cumulative calculation function satisfies the following requirements. (1) The value of f (x, y) increases as the value of x, y increases (f (x, y) is an increasing function). (2) The expansion of f (x, y) becomes slower as the value of x, y becomes larger (the larger the value of x, y becomes, f
The rate of increase of (x, y) decreases). (3) f (x, y) is 0 or more and does not exceed 1 (0 ≦ f
(X, y) <1). (4) If the values of x and y are 0, the value of f (x, y) is 0
(If x = 0 and y = 0, then f (x, y) = 0). (5) The value of f (x, y) is smaller than the sum of x and y (f (x, y) <x + y). (6) If the sum of x and y is constant, the value of f (x, y) increases as the absolute value of the difference between x and y increases.

【0100】ここで、(1),(2)の要件は、累積処
理により、「確実な」係り受け関係(M1)とは異なる
係り受け関係(M2)の累積値f(x,y)が、「確実
な」係り受け関係(M1)と同じ係り受け関係(M3)
の累積値f(x,y)より大きくなるのを防止するため
の要件である。
Here, the requirements of (1) and (2) are that the cumulative value f (x, y) of the dependency relationship (M2) different from the “certain” dependency relationship (M1) is obtained by the accumulation processing. , The same dependency relationship (M1) as the "certain" dependency relationship (M1)
Is a requirement for preventing the value from becoming larger than the cumulative value f (x, y) of.

【0101】すなわち、係り先の候補が複数存在する場
合において、これらの中に、「確実な」係り受け関係
(M1)と同じ係り受け関係(M3)が存在する場合
は、これを妥当な係り受け関係として決定する必要があ
る。
That is, in the case where there are a plurality of dependency candidates, if a dependency relation (M3) that is the same as the “certain” dependency relation (M1) exists among them, this is regarded as a valid dependency. It is necessary to decide as a receiving relationship.

【0102】しかし、第3の確実度を累積する構成で
は、「確実な」係り受け関係(M1)とは異なる係り受
け関係(M2)の出現頻度が同じ係り受け関係(M3)
の出現頻度より高いと、前者の累積値が後者の累積値よ
り大きくなることがある。その結果、この場合は、「確
実な」係り受け関係(M1)と同じ係り受け関係(M
3)が存在するにもかかわらず、異なる係り受け関係
(M2)が妥当な係り受け関係として決定されてしまう
ことがある。
However, in the structure for accumulating the third certainty factor, the dependency relation (M2) different from the "certain" dependency relation (M1) has the same appearance frequency.
If it is higher than the appearance frequency of, the former cumulative value may be larger than the latter cumulative value. As a result, in this case, the same dependency relationship (M1) as the “certain” dependency relationship (M1)
Despite the existence of 3), a different dependency relationship (M2) may be determined as an appropriate dependency relationship.

【0103】そこで、この実施例では、上述した
(1),(2)の要件を満たす累積演算関数に基づい
て、累積値を求めることにより、「確実な」係り受け関
係(M1)とは異なる係り受け関係(M2)の出現頻度
が同じ係り受け関係(M3)の出現頻度より高い場合で
あっても、前者の累積値が後者の累積値より大きくなる
ことがないようにしている。
Therefore, in this embodiment, the cumulative value is obtained based on the cumulative arithmetic function satisfying the above-mentioned requirements (1) and (2), which is different from the "certain" dependency relationship (M1). Even when the appearance frequency of the dependency relationship (M2) is higher than that of the same dependency relationship (M3), the cumulative value of the former does not exceed the cumulative value of the latter.

【0104】ここで、上述した動作を、次の自然言語文
d,eを含む文章2あるいは自然言語文d,fを含む文
章3の句の解析結果が入力された場合を代表として説明
する。なお、以下の説明では、「確実な」係り受け関係
の第1の確実度を0.9とし、「近くの」係り受け関係
の第1の確実度を0.2とし、「離れた」係り受け関係
の第1の確実度を0.1とする。また、語間の意味距離
を図9に示すようなものとする。
Here, the above-described operation will be described as a representative example when the analysis result of the phrase of the sentence 2 including the following natural language sentences d and e or the sentence 3 including the natural language sentences d and f is input. In the following description, the first certainty factor of the “certain” dependency relationship is 0.9, the first certainty factor of the “near” dependency relationship is 0.2, and the first factor of the “distant” dependency relationship is The first certainty of the receiving relationship is 0.1. The semantic distance between words is as shown in FIG.

【0105】[文章2] d:当社は他社のシステムの動向を調査した。 e:当社は他社の販売の動向を調査した。 [文章3] d:当社は他社のシステムの動向を調査した。 f:当社は他社のシステムの評判を調査した。[Sentence 2] d: Our company investigated the trend of systems of other companies. e: We investigated the sales trends of other companies. [Sentence 3] d: Our company investigated the trends of the systems of other companies. f: We investigated the reputation of other companies' systems.

【0106】まず、文章2の句の解析結果が係り受け関
係解析部11に与えられた場合を説明する。
First, the case where the analysis result of the phrase of the sentence 2 is given to the dependency relation analysis unit 11 will be described.

【0107】この場合、この文章2から係り受け関係を
機械的に抽出し、抽出したすべての係り受け関係の第3
の確実度を計算すると、次のようになる。
In this case, the dependency relations are mechanically extracted from the sentence 2, and the third dependency relations of all the extracted dependency relations are extracted.
The certainty of is calculated as follows.

【0108】 「他社(の)」 →「システム」(d3 →d2 ) 第3の確実度(0.006) 「他社(の)」 →「動向」 (d3 →d1 ) 第3の確実度(0.01) 「システム(の)」→「動向」 (d2 →d1 ) 第3の確実度(0.54) 「他社(の)」 →「販売」 (e3 →e2 ) 第3の確実度(0.008) 「他社(の)」 →「動向」 (e3 →e1 ) 第3の確実度(0.01) 「販売(の)」 →「動向」 (e2 →e1 ) 第3の確実度(0.54) この算出結果は、確実度累積部19に供給される。確実
度累積部19は、この結果を受けると、係り受け関係
(d3 →d2 )から順に、各係り受け関係の第3の確実
度が係り受け関係辞書に格納されているか否かを判定す
る。
“Other company (of)” → “System” (d3 → d2) Third certainty (0.006) “Other company (of)” → “Trend” (d3 → d1) Third certainty (0.01) “ System (of) → Trend (d2 → d1) Third certainty (0.54) "Other company (of)" → "Sales" (e3 → e2) Third certainty (0.008) Other company (of) → “Trend” (e3 → e1) Third certainty (0.01) “Sales (of)” → “Trend” (e2 → e1) Third certainty (0.54) This calculation result is the certainty cumulative part. 19 are supplied. Upon receipt of this result, the certainty factor accumulating unit 19 determines whether or not the third certainty factor of each dependency relation is stored in the dependency relation dictionary in order from the dependency relation (d3 → d2).

【0109】いま、係り受け関係辞書に、未だ係り受け
関係の第3の確実度がまったく格納されていないとする
と、確実度累積部19は、係り受け関係(d3 →d2
),(d3 →d1 ),(d2 →d1 ),(e3 →e2
),(e2 →e1 )については、その第3の確実度を
そのまま係り受け関係辞書に格納する(ステップS3
1,S23)。
Now, assuming that the dependency relation dictionary does not store the third certainty of the dependency relation at all, the certainty degree accumulating unit 19 determines that the dependency relation (d3 → d2).
), (D3 → d1), (d2 → d1), (e3 → e2)
), (E2 → e1), the third certainty factor is stored as it is in the dependency relation dictionary (step S3).
1, S23).

【0110】これに対し、係り受け関係(e3 →e1 )
については、すでに、これと同じ係り受け関係(d3 →
d1 )が格納されているので、次式に基づいて、その累
積値f(0.01,0.01)を計算し、この計算結果を係り受け
関係辞書に格納する(ステップS31,S32,S2
3)。
On the other hand, the dependency relationship (e3 → e1)
Already, the same dependency relationship (d3 →
Since d1) is stored, the cumulative value f (0.01,0.01) is calculated based on the following formula, and the calculation result is stored in the dependency relation dictionary (steps S31, S32, S2).
3).

【0111】 f(0.01,0.01) =log(0.01+0.01−0.01×0.01/3+1) =0.02 これにより、係り受け関係辞書には、文章2から抽出さ
れた6つの係り受け関係より1つ少ない次の5つの係り
受け関係とその第3の確実度が格納される。
F (0.01,0.01) = log (0.01 + 0.01−0.01 × 0.01 / 3 + 1) = 0.02 As a result, the dependency relation dictionary contains six sentences extracted from the sentence 2. The following five dependency relationships, which are one less than the dependency relationship, and the third certainty thereof are stored.

【0112】 「他社(の)」 →「システム」 第3の確実度(0.006) 「他社(の)」 →「動向」 第3の確実度(0.02) 「システム(の)」→「動向」 第3の確実度(0.54) 「他社(の)」 →「販売」 第3の確実度(0.008) 「販売(の)」 →「動向」 第3の確実度(0.54) ここで、2つの係り受け関係(「他社(の)」→「シス
テム」),(「他社(の)」→「動向」)の第3の確実
度を比較すると、係り受け関係(「他社(の)」→「動
向」)の第3の確実度の方が係り受け関係(「他社
(の)」→「システム」)の第3の確実度より大きい。
したがって、この場合、自然言語文dの「他社(の)」
の係り先は「動向」と決定される。
“Other company (of)” → “system” Third certainty (0.006) “Other company (of)” → “Trend” Third certainty (0.02) “System (of)” → “Trend” 3 Certainty (0.54) "Other company (of)" → "Sales" Third certainty (0.008) "Sales (of)" → "Trends" Third certainty (0.54) Here, two dependencies Comparing the third certainty of relationships (“other company (of)” → “system”), (“other company (of)” → “trend”), dependency relationship (“other company (of)” → “trend”) ) Is higher than the third certainty of the dependency relationship (“other company (of)” → “system”).
Therefore, in this case, the "other company" of the natural language sentence d
"Trend" is decided as the contact person.

【0113】また、2つの係り受け関係(「他社
(の)」→「販売」),(「他社(の)」→「動向」)
の第3の確実度を比較すると、係り受け関係(「他社
(の)」→「動向」)の第3の確実度の方が係り受け関
係(「他社(の)」→「販売」)の第3の確実度より大
きい。したがって、この場合、自然言語文eの「他社
(の)」の係り先は「動向」と決定される。
Two dependency relationships (“other company (of)” → “sales”), (“other company (of)” → “trend”)
Comparing the third certainty of the dependency relationship (“other company (of)” → “trend”), the third certainty of the dependency relationship (“other company (of)” → “sales”) Greater than the third certainty. Therefore, in this case, the related party of the "other company" of the natural language sentence e is determined to be the "trend".

【0114】なお、自然言語文d,eにおける「システ
ム(の)」,「販売(の)」の係り先の候補はそれぞれ
1つしかない。したがって、これらの係り先はそれぞれ
「動向」と決定される。
Note that there is only one candidate for the “system (of)” and “sales (of)” parties in the natural language sentences d and e, respectively. Therefore, each of these parties is determined to be a “trend”.

【0115】次に、文章3の句の解析結果が係り受け関
係解析部11に与えられた場合を説明する。
Next, the case where the analysis result of the phrase of the sentence 3 is given to the dependency relationship analysis unit 11 will be described.

【0116】この場合、この文章3から係り受け関係を
機械的に抽出し、抽出したすべての係り受け関係の第3
の確実度を計算すると、次のようになる。
In this case, the dependency relations are mechanically extracted from this sentence 3, and the third dependency relations of all the extracted dependency relations are extracted.
The certainty of is calculated as follows.

【0117】 「他社(の)」 →「システム」(d3 →d2 ) 第3の確実度(0.006) 「他社(の)」 →「動向」 (d3 →d1 ) 第3の確実度(0.007) 「システム(の)」→「動向」 (d2 →d1 ) 第3の確実度(0.63) 「他社(の)」 →「システム」(f3 →f2 ) 第3の確実度(0.006) 「他社(の)」 →「評判」 (f3 →f1 ) 第3の確実度(0.007) 「システム(の)」 →「動向」(f2 →f1 ) 第3の確実度(0.63) 確実度累積部19は、係り受け関係(d3 →d2 ),
(d3 →d1 ),(d2→d1 )(f3 →f1 ),(f2
→f1 )については、その第3の確実度をそのまま係
り受け関係辞書に格納する(ステップS31,S2
3)。
“Other company (of)” → “System” (d3 → d2) Third certainty (0.006) “Other company (of)” → “Trend” (d3 → d1) Third certainty (0.007) “ System (of) → Trend (d2 → d1) Third certainty (0.63) "Other company (of)" → "System" (f3 → f2) Third certainty (0.006) Other company (of) → “Reputation” (f3 → f1) Third certainty (0.007) “System (of)” → “Trend” (f2 → f1) Third certainty (0.63) Certainty accumulation part 19 is Relationship (d3 → d2),
(D3 → d1), (d2 → d1) (f3 → f1), (f2
→ For f1), the third certainty factor is stored as it is in the dependency relation dictionary (steps S31, S2).
3).

【0118】これに対し、係り受け関係(f3 →f2 )
については、すでに、この係り受け関係(f3 →f2 )
と同じ係り受け関係(f3 →f2 )が格納されているの
で、次式に基づいて、累積値f(0.006,0.006)を計算
し、この計算結果を係り受け関係辞書に格納する(ステ
ップS31,S32,S23)。
On the other hand, the dependency relationship (f3 → f2)
As for, the dependency relationship (f3 → f2) has already been
Since the same dependency relation (f3 → f2) is stored, the cumulative value f (0.006,0.006) is calculated based on the following equation, and the calculation result is stored in the dependency relation dictionary (step S31, S32, S23).

【0119】 f(0.006,0.006) =log(0.006+0.006−0.006×0.006/3+1) =0.012 これにより、係り受け関係辞書には、文章3から抽出さ
れた6つの係り受け関係より1つ少ない次の5つの係り
受け関係とその第3の確実度が格納される。
F (0.006,0.006) = log (0.006 + 0.006−0.006 × 0.006 / 3 + 1) = 0.0012 Thus, the dependency relation dictionary includes the six sentences extracted from the sentence 3. The following five dependency relationships, which are one less than the dependency relationship, and the third certainty thereof are stored.

【0120】 「他社(の)」 →「システム」 第3の確実度(0.012) 「他社(の)」 →「動向」 第3の確実度(0.007) 「システム(の)」→「動向」 第3の確実度(0.63) 「他社(の)」 →「評判」 第3の確実度(0.007) 「システム(の)」→「評判」 第3の確実度(0.63) ここで、係り受け関係(「他社(の)」→「システ
ム」),(「他社(の)」→「動向」)の第3の確実度
を比較すると、係り受け関係(「他社(の)」→「動
向」)の第3の確実度の方が係り受け関係(「他社
(の)」→「システム」)の第3の確実度より大きい。
したがって、この場合、自然言語文dの「他社(の)」
の係り先は「動向」と決定される。
“Other company (of)” → “System” Third certainty (0.012) “Other company (of)” → “Trend” Third certainty (0.007) “System (of)” → “Trend” 3 Certainty (0.63) "Other company (of)" → "Reputation" Third certainty (0.007) "System (of)" → "Reputation" Third certainty (0.63) where the dependency relationship ( Comparing the third degree of certainty of "other company (of)" → "system"), ("other company (of)" → "trend"), the dependency relationship ("other company (of)" → "trend") of The third certainty is higher than the third certainty of the dependency relationship (“other company's” → “system”).
Therefore, in this case, the "other company" of the natural language sentence d
"Trend" is decided as the contact person.

【0121】また、係り受け関係(「他社(の)」→
「システム」),(「他社(の)」→「評判」)の第3
の確実度を比較すると、係り受け関係(「他社(の)」
→「評判」)の第3の確実度の方が係り受け関係(「他
社(の)」→「システム」)の第3の確実度より大き
い。したがって、この場合、自然言語文fの「他社
(の)」の係り先は「評判」と決定される。
In addition, the dependency relationship ("other company") →
Third of "system"), ("other company (of)" → "reputation")
Comparing the certainty factors, the dependency relationship (“other company's”)
→ The third degree of certainty of “reputation” is greater than the third degree of dependency (“other company's” → “system”). Therefore, in this case, the contact of the "other company" of the natural language sentence f is determined to be "reputation".

【0122】なお、自然言語文d,fにおける「システ
ム(の)」の係り先の候補はそれぞれ1つしかない。し
たがって、これらの係り先は、それぞれ「動向」、「評
判」と決定される。
Note that there is only one candidate for the "system (no)" in the natural language sentence d, f. Therefore, these parties are determined to be “trend” and “reputation”, respectively.

【0123】以上詳述したこの実施例においても、先の
実施例と同様の効果を得ることができることは勿論、さ
らに、次ような効果を得ることができる。
In this embodiment described in detail above, the same effects as those of the previous embodiment can be obtained, and further, the following effects can be obtained.

【0124】(1) すなわち、この実施例によれば、
同じ係り受け関係が出現するたびに、その第3の確実度
を累積し、この累積結果に基づいて、係り先を決定する
ようにしたので、「確実な」係り受け関係ではないが、
共起して出現する頻度の高い係り受け関係が存在する場
合、これを利用して係り先を決定することができる。こ
れにより、人間が帰納的な推論によって係り先を決定す
る場合のように、係り先を決定することができるので、
係り先の決定精度を高めることができる。
(1) That is, according to this embodiment,
Each time the same dependency relationship appears, the third certainty factor is accumulated, and the dependency destination is determined based on this cumulative result, so it is not a “certain” dependency relation,
If there is a dependency relationship that frequently appears with co-occurrence, this can be used to determine the dependency destination. This allows the person to determine the contact, as in the case where a person determines the contact by inductive inference.
It is possible to improve the accuracy of determination of the contact person.

【0125】(2) また、この実施例によれば、第3
の確実度を累積する際、「確実な」係り受け関係(M
1)とは異なる係り受け関係(M2)の累積値が、同じ
係り受け関係(M3)の累積値より大きくなることがな
いようにしたので、「確実な」係り受け関係(M1)と
同じ係り受け関係(M3)が存在するにもかかわらず、
異なる係り受け関係(M2)が妥当な係り受け関係とし
て決定されてしまうことを防止することができる。
(2) According to this embodiment, the third
When accumulating the certainty of, the "certain" dependency relation (M
Since the cumulative value of the dependency relationship (M2) different from 1) does not become larger than the cumulative value of the same dependency relationship (M3), it is the same as the "certain" dependency relationship (M1). Although there is a receiving relationship (M3),
It is possible to prevent the different dependency relationship (M2) from being determined as a proper dependency relationship.

【0126】以上、この発明の2つの実施例を詳細に説
明したが、この発明は、上述したような実施例に限定さ
れるものではない。
Although the two embodiments of the present invention have been described in detail above, the present invention is not limited to the above-mentioned embodiments.

【0127】(1) 例えば、先の実施例では、係り受
け関係の類似度を算出する場合、「確実な」係り受け関
係が複数存在すると、各「確実な」係り受け関係との類
似度の平均値を算出する場合を説明した。しかし、この
発明は、各「確実な」係り受け関係との類似度の加算値
を算出するようにしてもよい。
(1) For example, in the above embodiment, when calculating the similarity of the dependency relationships, if there are a plurality of “certain” dependency relationships, the similarity of each “certain” dependency relationship is calculated. The case of calculating the average value has been described. However, the present invention may be configured to calculate the added value of the similarity with each “certain” dependency relationship.

【0128】(2) また、先の実施例では、係り先の
候補が複数存在する係り受け関係を種類分けする場合、
「近くの」係り受け関係と「離れた」係り受け関係の2
つに分ける場合を説明した。しかし、この発明は、3つ
以上の種類に分けるようにしてもよい。
(2) In addition, in the above embodiment, when classifying dependency relationships in which there are a plurality of dependency candidates,
Two relationships, "near" and "remote"
I explained how to divide it into two. However, the present invention may be divided into three or more types.

【0129】(3) また、先の実施例では、係り先の
候補が複数存在する係り受け関係を種類分けする場合、
修飾語と被修飾語の位置距離のみに基づいて分ける場合
を説明した。しかし、この発明は、これにさらに別の情
報を加えて分けるようにしてもよい。
(3) Further, in the above embodiment, when classifying dependency relationships having a plurality of dependency candidates,
The case of dividing based on only the positional distance between the modifier and the modified word has been described. However, the present invention may also be divided by adding other information thereto.

【0130】(4) また、先の実施例では、係り受け
関係の確実度に基づいて、係り先を決定する場合、係り
受け関係の種類に基づいて推定された第1の確実度と係
り受け関係の類似度に基づいて推定された第2の確実度
に基づいて、係り先を決定する場合を説明した。しか
し、この発明は、第2の確実度のみに基づいて、係り先
を決定するようにしてもよい。
(4) Further, in the above embodiment, in the case of determining the dependent on the basis of the certainty of the dependency relationship, the first certainty and the dependency estimated on the basis of the type of the dependency relationship. The case of determining the partner based on the second certainty estimated based on the similarity of the relationship has been described. However, in the present invention, the engagement destination may be determined based only on the second certainty degree.

【0131】(5) また、先の実施例では、係り受け
関係の確実度を累積し、この累積結果に基づいて、係り
先を決定する場合、第3の確実度を累積し、この累積結
果に基づいて、係り先を決定する場合を説明した。しか
し、この発明は、例えば、第1の確実度あるいは第2の
確実度を累積し、この累積結果に基づいて、係り先を決
定するようにしてもよい。
(5) In the above embodiment, the certainty degrees of the dependency relationships are accumulated, and when the dependency is determined based on the accumulated result, the third certainty degree is accumulated and the accumulated result is calculated. The case of determining the contact person based on the above is explained. However, in the present invention, for example, the first certainty degree or the second certainty degree may be accumulated, and the related party may be determined based on the accumulated result.

【0132】(6) このほかにも、この発明は、その
要旨を逸脱しない範囲で、種々様々変形実施可能なこと
は勿論である。
(6) In addition to this, it goes without saying that the present invention can be variously modified without departing from the scope of the invention.

【0133】[0133]

【発明の効果】【The invention's effect】

(1) 以上詳述したように、請求項1に係る発明によ
れば、係り先の各候補ごとに、「確実な」係り受け関係
との類似度を算出し、この類似度に基づいて、その確実
度(第2の確実度)を推定し、この確実度に基づいて、
係り先を決定するようにしたので、「確実な」係り受け
関係を利用して係り先を決定することができる。これに
より、係り先の決定精度を高めることができる。
(1) As described in detail above, according to the invention of claim 1, the similarity with the “certain” dependency relationship is calculated for each candidate of the dependency, and based on this similarity, Estimate its certainty (second certainty), and based on this certainty,
Since the contact is determined, the contact can be determined using the "certain" dependency relationship. As a result, it is possible to improve the accuracy of determining the contact person.

【0134】(2) 請求項2に係る発明によれば、請
求項1に係る発明において、係り先の各候補ごとに、修
飾語との位置上の距離に基づいて、その確実度(第1の
確実度)を推定し、この確実度に基づいて、係り先を決
定するようにしたので、第2の確実度のみに基づいて、
係り先を決定する場合より、さらに、係り先の決定精度
を高めることができる。
(2) According to the invention of claim 2, in the invention of claim 1, for each candidate of the dependent, the certainty factor (first The certainty) is estimated and the related party is determined based on this certainty. Therefore, based on only the second certainty,
It is possible to further improve the accuracy of determining the contact, as compared with the case of determining the contact.

【0135】(3) 請求項3に係る発明によれば、各
係り受け関係ごとに、その確実度を推定し、この確実度
を同じ係り受け関係同士で累積し、この累積結果に基づ
いて、係り先を決定するようにしたので、「確実な」係
り受け関係ではないが、共起して出現する頻度の高い係
り受け関係を利用して、係り先を決定することができ
る。これにより、人間が帰納的な推論によって係り先を
決定する場合と同じように、係り先を決定することがで
きるため、係り先の決定精度を高めることができる。
(3) According to the invention of claim 3, the certainty degree is estimated for each dependency relationship, the certainty degrees are accumulated in the same dependency relationships, and based on the cumulative result, Since the dependency is determined, the dependency can be determined using the dependency having a high frequency of co-occurrence, although it is not a “certain” dependency. As a result, the human being can determine the business partner in the same way as when the human beings determine the business partner by inductive inference, so that the accuracy of the business partner determination can be improved.

【0136】(4) 請求項4に係る発明によれば、請
求項3に係る発明において、各係り受け関係ごとに、
「確実な」係り受け関係との類似度を算出し、この類似
度に基づいて、その確実度(第2の確実度)を推定する
ようにしたので、請求項1に係る発明と同様に、係り先
の決定精度を高めることができる。
(4) According to the invention of claim 4, in the invention of claim 3, for each dependency relationship,
Since the degree of similarity with the “certain” dependency relationship is calculated, and the degree of certainty (second certainty) is estimated based on this degree of similarity, as in the invention according to claim 1, It is possible to improve the accuracy of determination of the contact person.

【0137】(5) 請求項5に係る発明によれば、請
求項4に係る発明において、「確実な」係り受け関係と
は異なる係り受け関係の累積値が同じ係り受け関係の累
積値より大きくなることがないように、確実度を累積す
るようにしたので、「確実な」係り受け関係と同じ係り
受け関係が存在するにもかかわらず、異なる係り受け関
係が妥当な係り受け関係として決定されるのを防止する
ことができる。
(5) According to the invention of claim 5, in the invention of claim 4, the cumulative value of the dependency relationship different from the "certain" dependency relationship is larger than the cumulative value of the same dependency relationship. Since the certainty is accumulated so that it does not happen, different dependency relationships are determined as appropriate dependency relationships even though the same dependency relationship as the "certain" dependency relationship exists. Can be prevented.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の第1の実施例の構成を示すブロック
図である。
FIG. 1 is a block diagram showing a configuration of a first embodiment of the present invention.

【図2】第1の実施例を説明するための図である。FIG. 2 is a diagram for explaining the first embodiment.

【図3】第1の実施例を説明するための図である。FIG. 3 is a diagram for explaining the first embodiment.

【図4】第1の実施例を説明するための図である。FIG. 4 is a diagram for explaining the first embodiment.

【図5】第1の実施例を動作を説明するためのフローチ
ャートである。
FIG. 5 is a flowchart for explaining the operation of the first embodiment.

【図6】第1の実施例を説明するための図である。FIG. 6 is a diagram for explaining the first embodiment.

【図7】この発明の第2の実施例の構成を示すブロック
図である。
FIG. 7 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.

【図8】第2の実施例を動作を説明するためのフローチ
ャートである。
FIG. 8 is a flowchart for explaining the operation of the second embodiment.

【図9】第2の実施例を説明するための図である。FIG. 9 is a diagram for explaining the second embodiment.

【符号の説明】[Explanation of symbols]

11…係り受け関係抽出部 12…係り受け関係辞書記憶部 13…第1の確実度推定部 14…確実度辞書記憶部 15…第2の確実度推定部 16…意味距離辞書記憶部 17…第3の確実度推定部 18…係り先決定部 19…確実度累積部 11 ... Dependency relationship extraction unit 12 ... Dependency relationship dictionary storage unit 13 ... First certainty degree estimation unit 14 ... Certainty degree dictionary storage unit 15 ... Second certainty degree estimation unit 16 ... Semantic distance dictionary storage unit 17 ... 3 Certainty estimation unit 18 ... Dependent determination unit 19 ... Certainty accumulation unit

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 修飾語の係り先の候補が複数存在する場
合、この複数の候補の中の1つを係り先として決定する
係り先決定装置において、 前記複数の候補の中の各候補ごとに、係り先の候補が1
つしか存在しない係り受け関係との類似度を算出し、こ
の算出結果に基づいて、その確実度を推定する確実度推
定手段と、 この確実度推定手段により推定された確実度に基づい
て、前記複数の候補の中の1つを前記係り先として決定
する係り先決定手段とを具備したことを特徴とする係り
先決定装置。
1. When there are a plurality of candidates for a modifier to which a modifier belongs, in a modifier determining device that determines one of the candidates as a modifier, for each candidate in the plurality of candidates. , The candidate for the contact is 1
The degree of similarity with the dependency relationship that exists only one and the degree of certainty that estimates the degree of certainty based on this calculation result, and the degree of certainty estimated by this degree of certainty estimating means An engagement destination determination device, comprising: an engagement destination determination unit that determines one of a plurality of candidates as the engagement destination.
【請求項2】 前記確実度推定手段は、 前記複数の候補の中の各候補ごとに、修飾語との位置上
の距離に基づいて、その確実度を推定する第1の確実度
推定手段と、 前記複数の候補の中の各候補ごとに、係り先の候補が1
つしか存在しない係り受け関係との類似度を算出し、こ
の算出結果に基づいて、その確実度を推定する第2の確
実度推定手段と を具備するように構成され、 前記係り先決定手段は、前記第1,第2の確実度推定手
段により推定された確実度に基づいて、前記複数の候補
の中の1つを前記係り先として決定するように構成され
ていることを特徴とする請求項1記載の係り先決定装
置。
2. The certainty estimating means includes a first certainty estimating means for estimating the certainty of each of the plurality of candidates based on a positional distance from a modifier. , For each candidate in the plurality of candidates, one candidate
And a second certainty degree estimating means for estimating a certainty degree based on the calculation result. , One of the plurality of candidates is determined as the related party based on the certainty degrees estimated by the first and second certainty degree estimating means. Item 1. The contact determination device according to item 1.
【請求項3】 修飾語の係り先の候補が複数存在する場
合、この複数の候補の中の1つを係り先として決定する
係り先決定装置において、 前記複数の候補の中の各候補ごとに、その確実度を推定
する確実度推定手段と、 この確実度推定手段により推定された確実度を、同じ係
り受け関係が出現するたびに累積する確実度累積手段
と、 この確実度累積手段の累積結果に基づいて、前記複数の
候補の中の1つを係り先として決定する係り先決定手段
とを具備したことを特徴とする係り先決定装置。
3. When there are a plurality of candidates for the modifier's dependency destination, a dependency determination device for determining one of the plurality of candidates as a dependency, for each candidate of the plurality of candidates. The certainty degree estimating means for estimating the certainty degree, the certainty degree accumulating means for accumulating the certainty degree estimated by the certainty degree estimating means each time the same dependency relationship appears, and the certainty degree accumulating means for accumulating the certainty degree. An engagement destination determining apparatus, comprising: an engagement destination determining unit that determines one of the plurality of candidates as an engagement destination based on a result.
【請求項4】 前記確実度推定手段は、前記複数の候補
の中の各候補ごとに、係り先の候補が1つしか存在しな
い係り受け関係との類似度を算出し、この算出結果に基
づいて、その確実度を推定するように構成されているこ
とを特徴とする請求項3記載の係り先決定装置。
4. The certainty degree estimating means calculates, for each of the plurality of candidates, a degree of similarity with a dependency relationship in which there is only one candidate for dependency, and based on the calculation result. The dependency determination apparatus according to claim 3, wherein the dependency determination apparatus is configured to estimate the certainty.
【請求項5】 前記確実度累積手段は、前記係り先の候
補が1つしか存在しない係り受け関係とは異なる係り受
け関係の累積値が、前記係り先の候補が1つしか存在し
ない係り受け関係と同じ係り受け関係の累積値より大き
くなることはないように、累積処理を行うように構成さ
れていることを特徴とする請求項4記載の係り先決定装
置。
5. The certainty degree accumulating means has a dependency relationship in which a cumulative value of a dependency relationship different from a dependency relationship in which there is only one candidate for the dependency is a dependency in which there is only one candidate for the dependency. 5. The dependency determination apparatus according to claim 4, wherein the dependency determination apparatus is configured to perform an accumulation process so that the cumulative value does not become larger than the cumulative value of the dependency relationship that is the same as the relationship.
JP7015161A 1995-02-01 1995-02-01 Modification destination decision device Pending JPH08212223A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7015161A JPH08212223A (en) 1995-02-01 1995-02-01 Modification destination decision device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7015161A JPH08212223A (en) 1995-02-01 1995-02-01 Modification destination decision device

Publications (1)

Publication Number Publication Date
JPH08212223A true JPH08212223A (en) 1996-08-20

Family

ID=11881086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7015161A Pending JPH08212223A (en) 1995-02-01 1995-02-01 Modification destination decision device

Country Status (1)

Country Link
JP (1) JPH08212223A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323471A (en) * 2005-05-17 2006-11-30 Fujitsu Ltd Service processing circumstance analyzing program, service processing circumstance analyzing method and service processing circumstance analyzing device
JP2015228170A (en) * 2014-06-02 2015-12-17 富士通株式会社 Machine translation method, machine translation program and machine translation apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323471A (en) * 2005-05-17 2006-11-30 Fujitsu Ltd Service processing circumstance analyzing program, service processing circumstance analyzing method and service processing circumstance analyzing device
JP2015228170A (en) * 2014-06-02 2015-12-17 富士通株式会社 Machine translation method, machine translation program and machine translation apparatus

Similar Documents

Publication Publication Date Title
Chang et al. Structured learning with constrained conditional models
McCallum et al. Conditional models of identity uncertainty with application to noun coreference
Lau et al. Learning word sense distributions, detecting unattested senses and identifying novel senses using topic models
Nakagawa et al. Stock price prediction using k‐medoids clustering with indexing dynamic time warping
NZ524988A (en) A document categorisation system
WO2008097194A1 (en) Keyword classification and determination in language modelling
CN114095270B (en) Network attack prediction method and device
US20050071365A1 (en) Method for keyword correlation analysis
EP2558988A1 (en) Ascribing actionable attributes to data that describes a personal identity
Wick et al. A unified approach for schema matching, coreference and canonicalization
CN112836017B (en) Event detection method based on hierarchical theme-driven self-attention mechanism
Iwata et al. Sequential modeling of topic dynamics with multiple timescales
Ushio et al. Back to the basics: A quantitative analysis of statistical and graph-based term weighting schemes for keyword extraction
CN117176471B (en) Dual high-efficiency detection method, device and storage medium for anomaly of text and digital network protocol
CN112287111B (en) Text processing method and related device
JPH08212223A (en) Modification destination decision device
Amini et al. Learning for Sequence Extraction Tasks.
US20170076219A1 (en) Prediction of future prominence attributes in data set
Aluffi Two characteristic numbers for smooth plane curves of any degree
Dupont et al. Using symbol clustering to improve probabilistic automaton inference
CN111368068A (en) Short text topic modeling method based on part-of-speech feature and semantic enhancement
JP3775239B2 (en) Text segmentation method and apparatus, text segmentation program, and storage medium storing text segmentation program
JP3934586B2 (en) Information classification system and program
Fernandez et al. Naive Bayes web page classification with HTML mark-up enrichment
CN112559768B (en) Short text mapping and recommendation method