JPH04174070A - Natural language sentence analyzing device - Google Patents

Natural language sentence analyzing device

Info

Publication number
JPH04174070A
JPH04174070A JP2303684A JP30368490A JPH04174070A JP H04174070 A JPH04174070 A JP H04174070A JP 2303684 A JP2303684 A JP 2303684A JP 30368490 A JP30368490 A JP 30368490A JP H04174070 A JPH04174070 A JP H04174070A
Authority
JP
Japan
Prior art keywords
functional
structures
functional structure
information
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2303684A
Other languages
Japanese (ja)
Inventor
Makoto Ishii
信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2303684A priority Critical patent/JPH04174070A/en
Publication of JPH04174070A publication Critical patent/JPH04174070A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To eliminate the need for the knowledge of an object language by extracting one or plural pieces of information for discriminating between plural functional structures and other functional structures by an interactive process part which performs various-meaning dissolution process after a syntax analysis by a syntax analytic part, and performing the extraction on an interactive basis. CONSTITUTION:An input part 1 inputs information from an operator at the time of the interactive various-meaning dissolution process. The syntax analytic part 3 divides an input sentence from an input part 1 into morphemes and plural constituent structures are generated for the divided morphemes; and functional structures are formed of the constituent structures and restrictions are applied when the functional structures are formed. After the syntax analysis by the syntax analytic part 3, an interactive process part 4 which performs the interactive various-meaning dissolution process extracts one or plural pieces of information for discriminating between plural functional structures and other functional structures and the extraction of one or plural pieces of information is performed on an interactive basis. Consequently, the knowledge of the language is unnecessary.

Description

【発明の詳細な説明】 挟先分互 本発明は、自然言語文解析装置に関し、機械翻訳装置な
ど自然言語文を入力とするシステムの実現において用い
られる自然言語文の構文解析装置、特に操作者との対話
を情報源とする対話型構文解析装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a natural language sentence analysis device, and more particularly to a natural language sentence parsing device used in realizing a system that receives natural language sentences as input, such as a machine translation device. This invention relates to an interactive syntax analysis device that uses dialogue with the user as an information source.

災米技先 自然言語文にはその意味があいまいな文が数多く存在す
る。例えば、 (、)私はきのう買った本を読んだ。
There are many sentences in natural language whose meanings are ambiguous. For example, (,) I read the book I bought yesterday.

については「きのう買った」のか「きのう読んだ」のか
があいまいである。こうしたあいまいさを「係り受け」
のあいまいさと呼ぶ。すなわち「きのう」の係り先があ
いまいであるという意味である。また、 (b)魚は食べる。
It is unclear whether it means "I bought it yesterday" or "I read it yesterday." This ambiguity is ``required''
It is called ambiguity. In other words, the meaning of ``yesterday'' is ambiguous. Also, (b) I eat fish.

についてはr魚が何かを食べるjのか「何かが魚を食べ
る」のかあいまいである。こうしたあいまいさを「役割
」のあいまいさと呼ぶ。すなわち「魚は」の「食べる」
に対する役割が主語であるのか目的語であるのかがあい
まいであるという意味である。
It is unclear whether r fish eats something j or ``something eats fish.'' This ambiguity is called ``role'' ambiguity. In other words, "eat" in "fish"
This means that it is ambiguous whether the role of the word is the subject or the object.

人間の場合、自然言語におけるこうしたあいまいさは、
発話においては発話の状況とかイントネーション、間の
取り方などを情報として解消していると考えられるが、
機械翻訳などに用いられる構文解析装置においては、入
力部を通して入力された文字列データだけをもって入力
データとみなすので、上記のようなあいまいさを除去す
ることは困難である。そこで操作者が介入して操作者の
意図する結果を得ようとする技術には数多くの提案がな
されてきた。自然言語文解析装置の応用分野である機械
翻訳処理について、例えば、特開昭63−300360
号公報、特開昭59−140582号公報、特開昭61
−18073号公報などがある。以下こうしたあいまい
な文の解析結果を絞り込む技術を「多義の解消」に関す
る技術と呼ぶわ まず、特開昭63−300360号公報に記載のものは
、翻訳・編集作業の効率化を図るために、編集制御部は
翻訳部で翻訳継続中に、翻訳が既に終了した訳文を訳文
記憶部から続出して表示部で表示せしめる機能と、翻訳
継続中に出される編集コマンド情報に応答して、該翻訳
が既に終了した訳文について編集処理を行なう機能を有
するものであり、このような従来技術および類似する技
術をポストエデイツト方式と呼び、自然言語文解析装置
は可能な解析結果のうち一つを強制的に選択し、その唯
−解を機械翻訳装置の変換生成部が対象言語に変換する
。解析装置の選択が誤ったことによる翻訳結果の誤りの
修正は対象言語そのものを編集することによって行なわ
れるものである。
For humans, these ambiguities in natural language are
In speech, it is thought that the situation of the utterance, intonation, pauses, etc. are resolved as information.
In a syntax analysis device used for machine translation, etc., only character string data input through an input unit is considered as input data, so it is difficult to eliminate the above-mentioned ambiguity. Therefore, many proposals have been made for techniques in which the operator intervenes to obtain the results intended by the operator. Regarding machine translation processing, which is an application field of natural language sentence analysis devices, for example, Japanese Patent Application Laid-Open No. 63-300360
No. 59-140582, Japanese Patent Application Laid-open No. 1982-140582
-18073, etc. Hereinafter, the technology for narrowing down the analysis results of ambiguous sentences will be referred to as the technology for "resolving ambiguity."The technology described in Japanese Patent Application Laid-Open No. 63-300360 is designed to improve the efficiency of translation and editing work. The editing control unit has the function of retrieving translated sentences that have already been translated from the translation storage unit and displaying them on the display unit while the translation is continuing in the translation unit, and in response to editing command information issued while the translation is continuing. This type of conventional technology and similar technologies are called post-editing methods, in which natural language sentence analysis devices force one of the possible analysis results. The translation generation unit of the machine translation device converts the unique solution into the target language. Correcting errors in translation results due to incorrect selection of an analysis device is performed by editing the target language itself.

また、特開昭59−140582号公報に記載されたも
のは、自然言語の解析において、多義性の生じる場合を
あらかじめ分類し、これらの分類に属して多義性が生じ
る可能性のある入力言語の該当部分に、構文解析処理以
前にあらかじめ指示用データを、多義性を解消する指示
方法にしたがって挿入しておくことにより翻訳処理を行
うものであり、このような従来技術および類似する技術
をプレエデイツト方式と呼び、自然言語文解析装置に入
力する入力文にあいまいさを解消するための情報を付加
することによって多義を解消する。
In addition, what is described in Japanese Patent Application Laid-open No. 59-140582 classifies cases in which ambiguity occurs in natural language analysis in advance, and identifies input languages that belong to these classifications and are likely to cause ambiguity. Translation processing is performed by inserting instruction data into the relevant part in advance according to an instruction method that eliminates ambiguity before syntax analysis processing. This method eliminates ambiguity by adding information to resolve the ambiguity to the input sentence input to the natural language sentence analysis device.

また、特開昭61−18073号公報に記載されたもの
は、翻訳処理において、第1言語の解析終了時点で校正
を行い、例えば、解析結果を解析木として表示し、その
ノード番号を用いて校正を行い、使用頻度の高い一連の
校正に対して、マクロ的なコマンドを使用するものであ
り、このような従来技術および類似する技術をインタエ
デイツト方式と呼び、自然言語文解析装置が入力文の解
析結果を操作者に示し、操作者はその解析結果が間違っ
ていれば自ら修正し、修正された結果が変換生成の処理
対象となる。
Furthermore, in the method described in Japanese Patent Application Laid-open No. 61-18073, proofreading is performed at the end of the analysis of the first language in the translation process, and, for example, the analysis results are displayed as an analysis tree and the node numbers are used. This method performs proofreading and uses macro commands for a series of frequently used proofreadings.This conventional technology and similar technologies are called interedit methods, in which a natural language sentence analysis device analyzes input sentences. The analysis result is shown to the operator, and if the analysis result is incorrect, the operator corrects it himself, and the corrected result becomes the object of conversion generation processing.

また多義の解消を操作者との対話によって行なおうとす
る対話型の自然言語文解析装置には、例えば、「対話翻
訳の一方式についてJ (青白外4名、電気情報通信学
会技術研究報告、NLC90−14、P、17〜24.
1990)に述べられている方式がある。これらの方式
を対話方式とよぶ。前述の従来技術はあいまいさを操作
者が編集形式で解消しようというものであったが、該文
献に記載された従来技術ではあいまいさをシステムが検
知した場合は、解消するために必要な情報を操作者に求
め、操作者がそれに答えることによって多義を解消する
インタラクション形式になっている。
In addition, for interactive natural language sentence analysis devices that attempt to eliminate ambiguity through dialogue with the operator, there are examples such as ``On a Method of Dialogue Translation'' (4 people from Aohaku, Technical Research Report of the Institute of Electrical Information and Communication Engineers). NLC90-14, P, 17-24.
There is a method described in (1990). These methods are called interactive methods. In the prior art described above, the operator resolves the ambiguity in an editing format, but in the prior art described in this document, when the system detects an ambiguity, the information necessary to resolve the ambiguity is generated. It is an interaction format in which ambiguity is resolved by asking the operator and the operator responding.

一方、自然言語文を構文解析する際には、構文解析木の
ような構造的データ構造を構成するだけでは精密な解析
は困難である。そこで構造的データ構造に加えて、意味
的データ構造を構成し、これら二つのデータ構造により
相補的に文法を記述する枠組みを提供する文法理論とし
て、rThe Mental Representat
ion of GrammaticalRelatio
ns、J (Bresnan、J+阿IT Press
、 1982 )に開示された諸費機能文法がある。
On the other hand, when parsing a natural language sentence, it is difficult to perform precise analysis just by constructing a structural data structure such as a parse tree. Therefore, in addition to the structural data structure, a semantic data structure is constructed, and as a grammar theory that provides a framework for describing grammar complementary to these two data structures, the Mental Representat
ion of GrammaticalRelation
ns, J (Bresnan, J+A IT Press
, 1982) discloses an overhead functional grammar.

前記ポストエデイツト方式については、対象言語を編集
するためには対象言語の知識がなければならないという
問題点がある。これは例えば日英機械翻訳装置を日本人
が用いようとする場合には、英語の知識をも必要とする
ことになる。
The problem with the post-editing method is that knowledge of the target language is required in order to edit the target language. For example, if a Japanese person wants to use a Japanese-English machine translation device, knowledge of English is also required.

また、前記プレエデイツト方式については、対象言語の
知識は必要ないが、入力文のあいまいさを予想しなけれ
ばならない。あいまいさを解消するのに十分な情報を付
加するためには、入力文の各所に多くの情報を付加しな
ければならず、これが必要十分であるためには言語に関
する十分な知識とシステムの処理に関する十分な知識を
必要とする。すなわち操作者の意図する解析結果を得る
ために必要最小限の情報を付加することは困難であり、
どうしても冗長な情報を付加することになり、むだであ
る。また入力する各文に情報を付加する作業自体が煩雑
である。
Furthermore, although the pre-editing method does not require knowledge of the target language, it is necessary to anticipate the ambiguity of the input sentence. In order to add enough information to resolve ambiguity, it is necessary to add a lot of information to various parts of the input sentence, and for this to be necessary and sufficient, sufficient knowledge of the language and system processing are required. requires sufficient knowledge of In other words, it is difficult to add the minimum amount of information necessary to obtain the analysis results intended by the operator.
This inevitably adds redundant information, which is wasteful. Further, the work itself of adding information to each input sentence is complicated.

また、インタエディタ方式については、入力文の解析構
造としてツリー構造あるいは類似する構造が表示され、
操作者はその表示を修正、確認する。しかし、入力文に
関する複雑な構造を示されても操作者は分からないとい
う問題点がある。
In addition, regarding the inter-editor method, a tree structure or similar structure is displayed as the analysis structure of the input sentence.
The operator corrects and confirms the display. However, there is a problem that the operator cannot understand even if the complicated structure of the input sentence is shown to him.

前述した従来技術でいえば、本発明は対話方式に属する
。しかし、従来の対話方式ではシステムの必要とする情
報と操作者の答えることのできる情報との間のギャップ
が問題となってきた。
In terms of the prior art described above, the present invention belongs to the interactive method. However, in conventional interactive systems, a gap between the information required by the system and the information that the operator can respond to has become a problem.

例えば、「係り受け」に関する質問や「役割」に関する
質問ならばまだよいが、多義語の語義の関する質問など
には文法的知識が十分でない操作者にとって困難な質問
が多い。例を言えば1日本語の「買われた本は・・・」
という文の「れる」の語義が「受身」か「尊敬」かとい
う質問を受けても1日本語文法に強くない操作者は意味
が分からないであろう。したがって、その答えも好い加
減なものとなるであろう。従来の対話型構文解析装置で
は操作者との対話で得た情報を絶対のものとして、操作
者の答えに合わない解を棄却するため、操作者が間違っ
た答えをしてしまった場合には、解を得ることができな
くなる、またシステムからの質問自体も操作者の文法的
知識を考慮していないという問題点があった。
For example, questions about "dependency" or "roles" are fine, but questions about the meaning of polysemous words are often difficult for operators without sufficient grammatical knowledge. For example, 1 in Japanese: "The book I bought was..."
Even when asked whether the meaning of ``reru'' in the sentence ``reru'' is ``passive'' or ``respect,'' an operator who is not familiar with Japanese grammar would not be able to understand the meaning. Therefore, the answer will probably be arbitrary. Conventional interactive parsers treat the information obtained through dialogue with the operator as absolute and reject solutions that do not match the operator's answer, so if the operator gives a wrong answer, , it becomes impossible to obtain a solution, and the questions from the system themselves do not take into account the grammatical knowledge of the operator.

且−一呵 本発明は、上述のごとき実情に鑑みてなされたもので、
自然言語文解析装置が入力文の解析時に入力文のあいま
いさを検知した場合、その時点で多義を解消するに足る
情報を最も効率の良い順番で質問し、この質問が入力文
に関しての「係り受け」や「役割」の質問であることに
より対象言語の知識を必要としないこと、また、あいま
いさを検知した時点で質問を行ない、また最も効率の良
い順番で質問するため、その質問は多義を解消するのに
必要十分なものであること、さらに、質問内容は入力文
に関する係り受けに関するものや、構文要素の役割に関
するものであり、解析構造を示すといった操作者に分か
りにくいインターフェースを排除することができるよう
にすること、さらに、各質問についてその質問の平易さ
、言い替えればその質問に対する操作者の答えの確実さ
に関する情報を持ち、その情報を用いて効率の良さを計
算し、また確実さの高い質問に対する答えと確実さの低
い質問とで、扱いを変えることにより、操作者に必要以
上の文法的知識を要求せず、また、多くの文法的知識を
必要とする質問に対しては答えが間違ってもよいような
自然言語文解析装置を提供することを目的としてなされ
たものである。
The present invention was made in view of the above-mentioned circumstances, and
When the natural language sentence analysis device detects ambiguity in the input sentence when analyzing the input sentence, it asks for enough information to resolve the ambiguity at that point in the most efficient order, and this question Since the questions are "receive" or "role" questions, knowledge of the target language is not required, and the questions are asked when ambiguity is detected, and the questions are asked in the most efficient order, so the questions are ambiguous. In addition, the content of the questions is about dependencies in the input sentence and the role of syntactic elements, and the interface that is difficult for the operator to understand, such as showing the parsed structure, is eliminated. In addition, for each question we have information about the simplicity of that question, in other words, the certainty of the operator's answer to that question, and we use that information to calculate efficiency and By handling answers to questions with high certainty and questions with low certainty differently, we do not require more grammatical knowledge from the operator than necessary, and we can also answer questions that require a lot of grammatical knowledge. was developed with the aim of providing a natural language sentence analysis device that does not allow incorrect answers.

1−一双 本発明は、上記目的を達成するために、(1)自然言語
文を入力とする入力部と、該入力部からの入力文を形態
素分割し、該形態素分割されたものに対して複数の構成
素構造を作成し、該構成素構造の各々から機能構造を作
成し、該機能構造を作成するに際しては制約の適用を行
なう構文解析部と、該構文解析部による構文解析の後、
対話による多義の解消処理を行なう対話処理部と、該対
話処理部による解析結果を出力する出力部とから成り、
前記対話処理部は複数の機能構造の各々から他の機能構
造と区別する一つあるいは複数の情報を抽出し、該情報
の一つあるいは複数を対話形式で行うこと、或いは、(
2)自然言語文を入力とする入力部と、該入力部からの
入力文を形態素分割し、該形態素分割されたものに対し
て複数の構成素構造を作成し、該構成素構造の各々から
機能構造を作成し、該機能構造を作成するに際しては制
約の適用を行なう構文解析部と、複数の機能構造の各々
を他の機能構造と区別する一つあるいは複数の特徴を摘
出し、該特徴の一つあるいは複数を問い、その答えを用
いて多義の解消処理を行なう対話処理部と、該対話処理
部による解析結果を出力する出力部とから成り、前記対
話処理部は得られた答えの確実性に関する情報を有する
こと、更には、(3)前記(1)又は(2)において、
前記構文解析部は各々の機能構造に対しての不適合性に
関する値を計算する演算手段を有し、前記対話処理部は
、抽出した情報のうち一つあるいは複数を対話形式で行
う際に、該不適合性に関する値に基づき対話を行なうこ
とを特徴としたものである。
1-1 In order to achieve the above objects, the present invention provides (1) an input section that inputs natural language sentences, morpheme segmentation of the input sentence from the input section, and morpheme segmentation of the morpheme segmented sentences. A syntax analysis unit that creates a plurality of constituent structures, creates a functional structure from each of the constituent structures, and applies constraints when creating the functional structure, and after the syntax analysis by the syntax analysis unit,
It consists of a dialogue processing unit that performs ambiguity resolution processing through dialogue, and an output unit that outputs the analysis result by the dialogue processing unit,
The interaction processing unit extracts one or more pieces of information that distinguishes it from other functional structures from each of the plurality of functional structures, and performs one or more of the pieces of information in an interactive format, or (
2) An input section that receives a natural language sentence as input, and divides the input sentence from the input section into morphemes, creates multiple component structures for the morpheme division, and generates a component structure from each of the component structures. A syntax analysis unit that creates a functional structure and applies constraints when creating the functional structure; and a syntax analysis unit that extracts one or more features that distinguish each of the multiple functional structures from other functional structures, and It consists of a dialogue processing unit that asks one or more of the questions and uses the answers to perform ambiguity resolution processing, and an output unit that outputs the analysis results of the dialogue processing unit, and the dialogue processing unit Having information regarding certainty; and (3) in (1) or (2) above,
The syntax analysis unit has a calculation means for calculating a value related to incompatibility with each functional structure, and the interaction processing unit calculates a value related to incompatibility with each functional structure. The feature is that dialogue is conducted based on values related to non-conformity.

本発明による自然言語文解析装置では、文法的性質を制
約として表現し、各制約にはその制約のもつ文法的強さ
(例外の少なさ)に関する情報を付加する。一方で入力
文に対して公知の諸量機能文法での機能構造に相当する
構造を構成し、さらに機能構造が実現するためのいくつ
かの制約のチエツクを行なう。各々の制約は例外の少な
さに関する情報を持っているので、満たされなかった制
約について上記例外の少なさに関する情報を総合評価し
てその評価を数値で表現し、機能構造の不適合性とみな
し、この不適合性をペナルティと呼ぶ。
In the natural language sentence analysis device according to the present invention, grammatical properties are expressed as constraints, and information regarding the grammatical strength (few exceptions) of each constraint is added to each constraint. On the other hand, a structure corresponding to a functional structure in a known functional grammar is constructed for the input sentence, and several constraints for realizing the functional structure are checked. Since each constraint has information on the number of exceptions, the information on the number of exceptions mentioned above is comprehensively evaluated for constraints that are not satisfied, the evaluation is expressed numerically, and it is regarded as an incompatibility of the functional structure. This nonconformity is called a penalty.

あいまいな文が入力された場合、複数個の機能構造が各
々ペナルティを計算されて得られる。ペナルティはその
機能構造が正しい解析結果であることの可能性の少なさ
を表現している。本発明ではこれら複数個の機能構造の
各々から他の解析結果と区別するに足る情報を抽出して
構造表現ベクタを構成する。ここで各々の機能構造から
抽出された構造表現ベクタは各機能構造を十分に表現し
ている。こうして得られた複数個のペナルティ付きの構
造表現ベクタから、一つのベクタを特定するのに最も効
率の良い質問を操作者に問う。この時、各質問に関して
質問の平易さ、答えの確実さに関する値が計算されるの
で、効率の計算にはその値をも考慮する。複数個の構造
表現ベクタから一つのベクタを特定するのに最も効率の
良い質問は、構造表現ベクタが機能構造を十分に表現し
ているため、複数個の機能構造から一つの機能構造を特
定するのに、操作者の文法的知識を考慮したうえでの最
も効率の良い質問となる。さらに操作者の答えについて
、答えの確実さを、その答えにあわない機能構造へのペ
ナルティとしてやることにより、操作者の文法的知識を
反映した処理が可能となる。以下、本発明の実施例に基
づいて説明する。
When an ambiguous sentence is input, a plurality of functional structures are obtained by calculating penalties for each. The penalty expresses the low probability that the functional structure is the correct analysis result. In the present invention, a structure representation vector is constructed by extracting information sufficient to distinguish the functional structures from other analysis results from each of the plurality of functional structures. Here, the structure expression vectors extracted from each functional structure sufficiently express each functional structure. The operator is asked the most efficient question for specifying one vector from the plurality of penalized structure expression vectors thus obtained. At this time, values related to the simplicity of the question and the certainty of the answer are calculated for each question, so these values are also taken into consideration when calculating efficiency. The most efficient question to identify one vector from multiple structural representation vectors is to identify one functional structure from multiple functional structures because the structural representation vector sufficiently represents the functional structure. However, this is the most efficient question after considering the operator's grammatical knowledge. Furthermore, regarding the operator's answer, by using the certainty of the answer as a penalty for functional structures that do not match the answer, processing that reflects the operator's grammatical knowledge becomes possible. Hereinafter, the present invention will be explained based on examples.

第1図は、本発明による自然言語文解析装置の一実施例
を説明するための構成図で、図中、1は入力部、2は出
力部、3は構文解析部、4は対話処理部、5は辞書部、
6は構文規則部、7は制約部、8は機能関係部である。
FIG. 1 is a block diagram for explaining one embodiment of a natural language sentence analysis device according to the present invention, in which 1 is an input section, 2 is an output section, 3 is a syntactic analysis section, and 4 is a dialogue processing section. , 5 is the dictionary section,
6 is a syntax rule section, 7 is a constraint section, and 8 is a function relationship section.

入力部1はキーボードなどの入力装置あるいは記憶装置
からの入力を含む。また入力部1は対話による多義の解
消処理時に操作者からの情報を入力する手段でもある。
The input unit 1 includes input from an input device such as a keyboard or a storage device. The input unit 1 also serves as a means for inputting information from the operator during ambiguity resolution processing through dialogue.

出力部2は解析結果あるいは質問内容を操作者に伝える
ためのデイスプレィなどであり1機械翻訳などの場合の
ように構文解析装置を用いたアプリケーションが解析結
果を用いようとする場合も含む。
The output unit 2 is a display or the like for conveying the analysis results or the content of the question to the operator, and also includes cases where an application using a syntax analysis device attempts to use the analysis results, such as in the case of machine translation.

第2図(a)〜(c)は、辞書部の内容の一部である辞
書D、構文規則部の内容の一部である構文規則R1制約
部の内容の一部である制約Cを示すものであり、第4図
は機能関係部の内容の一部を示すものである。
FIGS. 2(a) to (c) show a dictionary D, which is part of the contents of the dictionary part, and a constraint C, which is part of the contents of the syntactic rule R1 constraint part, which is part of the contents of the syntax rule part. FIG. 4 shows part of the contents of the function-related section.

第2図(a)に示す辞書りの各要素は見出し語、諸費範
喀(品詞)、素性リストで表現される。素性リストは素
性のリストで、各素性は(素性名、素性値)の形のペア
である。ここで素性とは諸費の持つ性質を抽出したもの
である。
Each element of the dictionary shown in FIG. 2(a) is expressed by a headword, a category (part of speech), and a feature list. The feature list is a list of features, and each feature is a pair of the form (feature name, feature value). Here, the characteristics are extracted characteristics of miscellaneous expenses.

第2図(b)に示す構文規則Rは公知の句構造文法の表
記法を拡張したラベル付きの句構造文法で記述されてい
る。右辺の各要素はラベル付きの非終端記号か、ラベル
なしの非終端記号である。
The syntactic rule R shown in FIG. 2(b) is written in a labeled phrase structure grammar that is an extension of the notation of a known phrase structure grammar. Each element on the right-hand side is either a labeled nonterminal or an unlabeled nonterminal.

R1中の(N P ; case)の場合、NPは非終
端記号でラベルcaseが付加されている。また右辺の
非終端記号で小文字の英字は前終端記号(語業範1ll
)、大文字の英字は前終端記号以外の非終端記号である
。また構文規則中のラベルは機能名を表す。ここで機能
名とは公知の諸量機能文法での用法と同様である。すな
わちR1の記述は語當機能文法における以下のRIOと
同しである。
In the case of (N P ; case) in R1, NP is a non-terminal symbol and the label case is added. Also, the non-terminal symbols on the right side, lowercase letters, are pre-terminal symbols (language range 1ll).
), uppercase alphabetic characters are nonterminal symbols other than preterminal symbols. Also, the labels in the syntax rules represent function names. Here, the term "function name" is used in the same manner as in the well-known function grammar. That is, the description of R1 is the same as the following RIO in the word-function grammar.

RIOVP−>   NP   VP ↓=↑case  ↓:↑ 第2図(c)に示す制約Cの各要素は機能名とペナルテ
ィ付きのプロダクションルールである。
RIOVP->NP VP ↓=↑case ↓:↑ Each element of the constraint C shown in FIG. 2(c) is a production rule with a function name and a penalty.

表記法は、 (機能名:ペナルティ)制約規則 の形式である。ここでペナルティは各制約の持つ文法的
な強さを表す数値であり、その値が大きいほどその制約
が文法的に強い、すなわち1例外が少ないことを意味す
る。各々の制約規則は機能構造中の情報、特に辞書から
の素性を参照している。
The notation is in the form of a (Function name: Penalty) constraint rule. Here, the penalty is a numerical value representing the grammatical strength of each constraint, and the larger the value, the stronger the grammatical constraint, that is, the fewer one exceptions. Each constraint rule references information in the functional structure, specifically features from the dictionary.

ここで機能構造とは公知の諸費機能文法での用法と同様
であり、機能名を属性名、機能構造を属性値とする再帰
的なマトリクスである。第6図に機能構造の例を示す。
Here, the term "functional structure" is used in the same manner as in the well-known overhead functional grammar, and is a recursive matrix in which the functional name is the attribute name and the functional structure is the attribute value. FIG. 6 shows an example of the functional structure.

第3図は、本発明による自然言語文解析装置の構文解析
部と対話処理部のフローチャートである。
FIG. 3 is a flowchart of the syntactic analysis section and the dialogue processing section of the natural language sentence analysis device according to the present invention.

廷弘工;入力部より「べた書き」の日本語文が入力され
た構文解析部は、形態素解析の処理にしたがって入力文
を形態素のリストに分割する。例えば、 (aO)彼が公園で遊ぶ が入力文であるとすると、形態素分割の結果は、 (al)(彼:n)(が:P)(公園:n)(で:P)
(遊ぶ:v) となる。ここで各形態素は(見出し語二諸費範II)の
形式で表現されている。形態素分割においては辞書部か
ら形態素分割用辞書を抽出して用いる。
Hiroko Tate: The syntactic analysis unit receives a Japanese sentence written in “solid writing” from the input unit and divides the input sentence into a list of morphemes according to morphological analysis processing. For example, if the input sentence is (aO) He plays in the park, the result of morpheme segmentation is (al) (He: n) (Ga: P) (Park: n) (De: P)
(Play: v) It becomes. Here, each morpheme is expressed in the format (headword 2 miscellaneous expenses range II). In morpheme segmentation, a dictionary for morpheme segmentation is extracted from the dictionary section and used.

廷圧又;次に、形態素解析後の形態素の列に対して構文
規則部の内容を用いて構成製構造を作成する。ここで構
成製構造とは公知の諸費機能文法での用法と同様であり
、第5図に示すようなラベル付きの木構造である。木構
造に付いているラベルは機能名を表し、構文規則中に記
述されているラベルを構文規則の適用時に参照すること
により得ることができる。
Next, a compositional structure is created using the contents of the syntax rule section for the morpheme sequence after the morphological analysis. Here, the compositional structure is used in the same way as in the well-known expense function grammar, and is a labeled tree structure as shown in FIG. Labels attached to the tree structure represent function names, and can be obtained by referring to the labels described in the syntax rules when applying the syntax rules.

形態素の列から構成製構造を作成する処理については、
多くの手法が提案されていて公知であるが、ここではボ
トムアップにCKY法により構成する。形態素列から構
成製構造を作成する際に、処理すべき形態素がなくなっ
た時点で、最終状態に達した構成製構造は全て5tep
 2の出力であり、一般に複数解がある。
Regarding the process of creating a compositional structure from a sequence of morphemes,
Although many methods have been proposed and are known, here, the CKY method is used from the bottom up. When creating a compositional structure from a morpheme sequence, when there are no more morphemes to process, all compositional structures that have reached the final state are processed in 5 steps.
2, and there are generally multiple solutions.

ここで最終状態に達したかどうかは文全体に対して作ら
れた構成製構造のルートノードが非終端記号Sであるか
どうかで判断される。
Here, whether the final state has been reached is determined by whether the root node of the compositional structure created for the entire sentence is a non-terminal symbol S.

(al)の形態素列から作成された構成製構造の一つ(
a2)を第5図に示す。
One of the construction structures created from the morpheme sequence of (al) (
a2) is shown in FIG.

扛蛇立;前記5tep 2で得られた複数個の構成製構
造の各々から機能構造を作成する。この処理は公知の諸
費機能文法における構成製構造から機能構造を作成する
処理にしたがっても良いし、構成製構造でラベルのない
子ノードについては主要語としてエントリ部にブツシュ
し、ラベル付きの子ノードについてはそのラベルを属性
名とし子ノードについての機能構造を属性値とするよう
に再帰的に機能構造を作成しても良い。第5図に示す構
成素構造(C2)から作成された機能構造(C3)を第
6図に示す。このst’ep3では辞書部から機能構造
作用辞書を抽出して用いる。この辞書の内容は辞書りに
おける素性リストの部分である。構成素構造と機能構造
は一対一で対応するので、5tep 3の出力における
機能構造は複数解がある。
A functional structure is created from each of the plurality of constituent structures obtained in Step 2 above. This process may follow the process of creating a functional structure from a constituent structure in the well-known overhead functional grammar, or it may be possible to follow the process of creating a functional structure from a constituent structure in the known expense function grammar, or to write a child node without a label in the constituent structure as a main word in the entry section, and to write it to a labeled child node. , the functional structure may be created recursively by using the label as the attribute name and the functional structure of the child node as the attribute value. FIG. 6 shows a functional structure (C3) created from the component structure (C2) shown in FIG. 5. In this st'ep3, a functional structure action dictionary is extracted from the dictionary section and used. The contents of this dictionary are part of the feature list in the dictionary. Since there is a one-to-one correspondence between constituent structure and functional structure, there are multiple solutions for the functional structure in the output of 5tep 3.

麩吐±;前記機能構造について制約部からの制約と辞書
部からの制約適用用辞書を用いて制約の適用を行なう。
Constraints are applied to the functional structure using the constraints from the constraint section and the constraint application dictionary from the dictionary section.

制約適用の手順は以下の通りである。The procedure for applying constraints is as follows.

■機能構造中の全機能について、各機能でインデクスさ
れる制約を全て適用し、満たされなかった制約について
はその制約の持つペナルティを加算する。またこの時、
ペナルティが十分に大きい機能構造については解析失敗
として以後の解析を行なわない。
■For all functions in the functional structure, all constraints indexed by each function are applied, and for constraints that are not satisfied, the penalty of that constraint is added. At this time again,
Functional structures for which the penalty is sufficiently large are treated as analysis failures and no further analysis is performed.

■制約適用の終了した機能については、機能関係部を参
照して、その機能の子の機能に変更する。このときの子
の機能が複数個ある場合は機能構造を複数個にコピーす
る。
■For a function to which constraints have been applied, refer to the function-related section and change it to a child function of that function. If there are multiple child functions at this time, the functional structure is copied to multiple functions.

■変更された機能名について上記■、■をさらに行なう
。この■、■、■を機能名の変更ができなくなるまで続
ける。
■Repeat steps (2) and (2) above for the changed function name. Continue these ■, ■, and ■ until the function name cannot be changed.

上記の■〜■を機能構造の再帰的構造について再帰的に
行なう。ここで各制約には制約Cに示すように機能名、
ペナルティが付いているので参照は容易である。また機
能関係部では機能名を第4図に示すように木構造で管理
されているので、各機能を子の機能に変更するのは容易
である。
The above steps (1) to (2) are performed recursively for the recursive structure of the functional structure. Here, each constraint has a function name, as shown in constraint C,
It is easy to refer to because it has a penalty attached to it. Furthermore, since the function names are managed in a tree structure as shown in FIG. 4 in the function-related section, it is easy to change each function to a child function.

前記5tep 4における処理の例を第6図に示す機能
構造(C3)について実行する。文節「公園で」に相当
する機能名は、最初は構文規則R1によって与えられた
CaSeである。このCaSe機能について、前記■に
したがって制約COが適用されるが、親の機能構造にお
ける主要語は「Mぶ」という用言であるので満たされて
いる。次に前記■にしたがってcase機能がその子の
機能である5ubj、 obj、obj2、oblに変
更される。この場合、子の機能は複数個あるのでその各
々に対応するように機能構造はコピーされる。例として
5ubj機能に変更された場合は、次に5ubj機能に
ついて、前記■にしたがって制約C1〜C4が適用され
る。この中でC3については5ubj格中の格マーカー
素性の値は「で」であるので満たされていない。したが
ってこの機能構造はペナルティ200を加算されるが、
このペナルティは十分に大きいので「公園で」が5ub
j格となるこの機能構造は解析失敗となり、以後の解析
は行なわない。一方、case機能がob1機能に変更
された機能構造については制約C5、C6が適用される
がいずれも満たされているためペナルティはOで、前記
■でさらに機能名の変更を受ける。以上の処理を文節「
彼が」についても行い、最終的に得られた機能構造の一
例を第7図に示す。この機能構造のペナルティはOであ
る。前記5tep 4での処理は一つの機能構造につい
て複数個の機能構造を作成する。前記5tep 4への
入力は複数個の機能構造であるので5tep 4の出力
は第7図に示すような機能構造が複数個となり、各々の
機能構造はペナルティが計算されている。
An example of the processing in step 4 is executed for the functional structure (C3) shown in FIG. The function name corresponding to the phrase "in the park" is initially CaSe given by the syntax rule R1. Regarding this CaSe function, the constraint CO is applied according to the above-mentioned (2), but it is satisfied because the main term in the parent functional structure is the term "Mbu". Next, the case function is changed to its child functions 5ubj, obj, obj2, and obl according to the above item (2). In this case, since there are multiple child functions, the functional structure is copied to correspond to each child function. As an example, when the function is changed to 5ubj function, the constraints C1 to C4 are applied to the 5ubj function according to the above-mentioned (■). Among these, C3 is not satisfied because the value of the case marker feature in the 5ubj case is "de". Therefore, this functional structure is subject to a penalty of 200, but
This penalty is large enough that "in the park" is 5ub.
This functional structure, which has a j case, results in an analysis failure and no further analysis is performed. On the other hand, constraints C5 and C6 are applied to the functional structure in which the case function is changed to the ob1 function, but since both are satisfied, the penalty is O, and the function name is further changed in the above-mentioned ■. The above processing is performed in the clause ``
An example of the finally obtained functional structure is shown in FIG. 7. The penalty for this functional structure is O. The process in step 4 creates a plurality of functional structures for one functional structure. Since the input to 5tep 4 is a plurality of functional structures, the output of 5tep 4 is a plurality of functional structures as shown in FIG. 7, and a penalty has been calculated for each functional structure.

W;前記ペナルティをもとに機能構造の選択を行なう。W: Select a functional structure based on the penalty.

具体的にはペナルティの十分に低い機能構造をひとつあ
るいは複数個選択する。
Specifically, one or more functional structures with sufficiently low penalties are selected.

(a O)のようなあいまいさのない文については5t
ep 5で選択される機能構造は第7図に示すひとつし
かなく(ペナルティoン、そのため対話による多義の解
消処理は必要がなく、次の5tep 6は何もしない。
5t for unambiguous sentences like (a O)
There is only one functional structure selected in ep 5, as shown in FIG. 7 (penalty is on), so there is no need for ambiguity resolution processing through dialogue, and nothing is done in the next 5tep 6.

% ;最後に対話による多義の解消の処理後の機能構造
を解析結果として出方部に出力する。
% ;Finally, the functional structure after the process of eliminating ambiguity through dialogue is output to the output section as an analysis result.

(al)の例文については第7図に示す機能構造が出力
される。
For the example sentence (al), the functional structure shown in FIG. 7 is output.

以上は[彼が公園で遊ぶΔというあいまいさのない入力
文についてであった。しかし、(bo)きのう買った本
を読んだ については、前述のように「きのう」が「買った」に係
るのか「読んだ」に係るのかがあいまいである。「きの
う」が「買った」に係った構成製構造を第8図に示す。
The above was about the unambiguous input sentence Δhe plays in the park. However, regarding (bo) I read the book I bought yesterday, as mentioned above, it is unclear whether ``yesterday'' refers to ``bought'' or ``read.'' FIG. 8 shows the structure of "yesterday" related to "bought".

第8図中で機能rentai#objは機能renta
iの子の機能であり1機能rentaiは連体修飾節(
埋込文)を、機能rentai#objはその中でも被
修飾体言が修飾肺中の目的格と一致することを意味する
。この例ではr本」は「買った」の目的格であるという
意味である。第8図の構成製構造から作成された機能構
造(bl)を第9図に示す。さて(bO)は「きのう」
の係り先があいまいであったため、第3図の5tep5
の処理後の第7図に示す機能構造は第9図に示すものと
第10図に示すもの(b2)との二つが得られる(各々
のペナルティはO)。ここで第10図では簡単のため素
性を省略して書いである。二つの機能構造の相違点が「
きのうJの機能構造中の位置であることが分かる。
In Figure 8, the function rentai#obj is the function renta.
It is a child function of i, and 1 function rentai is an adnominal modification clause (
(embedded sentence), the function rentai#obj means that the modified nominal matches the objective case in the modified lung. In this example, ``r book'' means that it is the objective case of ``bought''. FIG. 9 shows a functional structure (bl) created from the configuration structure shown in FIG. 8. Now, (bO) is "yesterday"
5 step 5 in Figure 3 because the person involved was ambiguous.
After processing, two functional structures shown in FIG. 7 are obtained, one shown in FIG. 9 and one (b2) shown in FIG. 10 (each penalty is O). Here, in FIG. 10, the features are omitted for simplicity. The difference between the two functional structures is
It can be seen that this is the position in the functional structure of Yesterday J.

第11図は、第3図の5tep6において対話処理部の
行う対話による多義の解消処理についてのフローチャー
トである。以下、各ステップに従って順に説明する。
FIG. 11 is a flowchart of the ambiguity resolution process by dialogue performed by the dialogue processing unit in step 5 of FIG. 3. Below, each step will be explained in order.

幻fLL」−;対話による多義の解消を行なうのは機能
構造が複数個ある場合である。その場合各機能構造につ
いて構造表現ベクタを求める。
Phantom fLL''-; Ambiguity is resolved through dialogue when there are multiple functional structures. In that case, a structure representation vector is obtained for each functional structure.

これは(bl)については、 (b3)ペナルティ=O (2adverb 3 rentaistobj 4 
obj Ohead(b2)については (b4)ペナルティ=O (4adverb 3 rentai#obj 4 o
bj Oheadとなる。ここで各ベクタについてその
奇数番目の要素は前から順に各文節の修飾光の文節番号
を表す。例えば上記(b3)の最初の「2」は文節「き
のう」が2番目の文節「買った」を修飾していることを
表す。またrQJは修飾する形態素が存在しないことを
表す。各ベクタの偶数番目の要素は前から順に各形態素
の文における役割を表す。ここで文における「役割」と
は機能名で表現している。上記(b3)の二番目の要素
であるr adverb Jは形態素「きのう」の機能
名がr adverb Jであることを表す。ここで各
構造表現ベクタは辞書の情報を用いて機能構造を復元す
るに足る、すなわち機能構造を十分に表現している。言
い替えれば機能構造の違いは構造表現ベクタを比べれば
分かるのである。
For (bl), (b3) penalty = O (2 adverb 3 rentaistobj 4
For obj Ohead (b2), (b4) penalty = O (4adverb 3 rentai#obj 4 o
bj Ohead. Here, the odd-numbered elements of each vector represent the clause number of the decoration light of each clause in order from the front. For example, the first "2" in (b3) above indicates that the phrase "yesterday" modifies the second phrase "bought." Furthermore, rQJ indicates that there is no modifying morpheme. The even-numbered elements of each vector represent the role of each morpheme in the sentence in order from the front. Here, the "role" in the sentence is expressed by a function name. The second element in (b3) above, r adverb J, represents that the functional name of the morpheme "yesterday" is r adverb J. Here, each structure expression vector is sufficient to restore the functional structure using dictionary information, that is, it sufficiently represents the functional structure. In other words, differences in functional structure can be seen by comparing the structure expression vectors.

上記例の(b3)と(b4)では「きのう」の係り先が
「買った」か「読んだ」かの違いであることがすぐに分
かる。
In the above examples (b3) and (b4), it is immediately clear that the difference is whether "yesterday" is related to "bought" or "read."

旦」」」5機能構造は複数個あるので構造表現ベクタは
複数細末められる。以後対話によって得た情報をもとに
このベクタを一つに絞る。
5. Since there are multiple functional structures, multiple structure expression vectors can be subdivided. From now on, we will narrow down this vector to one based on the information obtained through dialogue.

一つに絞られた場合は5tep15で構造表現ベクタに
相当する機能構造を出力する。
If the number is narrowed down to one, a functional structure corresponding to the structure expression vector is output in step 515.

n上」−;構造表現ベクタが複数個ある場合、構造表現
ベクタの集合から最もバラツキの大きい列を求める。上
記例では第1要素以外は同じであるので第1番目の列で
あることが分かる。
"on n"-: If there are a plurality of structure expression vectors, find the sequence with the largest variation from the set of structure expression vectors. In the above example, the elements other than the first element are the same, so it can be seen that it is the first column.

旦笠工立;前記5tep12で求めた列を操作者に問う
。上記例では、 (b5)rきのう」の係り先は何ですか?あるいは、 (bO)rきのう」の係り先は「買った」と「読んだ」
のどちらですか? と問えば良い。
Tangasa Kori: Ask the operator the sequence obtained in step 12 above. In the above example, what does (b5) r yesterday relate to? Or, the person in charge of (bO)r yesterday's "bought" and "read"
Which one? Just ask.

斗ヨ」」5前記5tep13で得た問いの答えに合う構
造表現ベクタだけを残し、他のベクタは解析失敗とする
。(b5)あるいは(bO)の問いの答えが「買った」
であった場合、構造表現ベクタ(b4)だけを残す。
5. Leave only the structure expression vectors that match the answer to the question obtained in step 13 above, and treat other vectors as failures in analysis. The answer to question (b5) or (bO) is “I bought it.”
If so, only the structure expression vector (b4) is left.

旦町」」電前記5tep 14の時点で構造表現ベクタ
は一つに絞られたので、構造表現ベクタに相当する機能
構造(bl)を出力する。
Since the structure expression vector has been narrowed down to one at step 14, the functional structure (bl) corresponding to the structure expression vector is output.

以上は「きのう買った本を読んだ」というあいまいさは
あるが、そのあいまいさは「きのう」の係り先の一つで
ある入力文についてであった。しかし、 (e O)彼がきのう買った本を読んだ。
Above, there is an ambiguity in ``I read the book I bought yesterday,'' but the ambiguity concerns the input sentence, which is one of the dependencies of ``yesterday.'' However, (e O) he read the book he bought yesterday.

については、「きのう」が「買った」に係るのか「読ん
だ」に係るのかがあいまいであり、また「彼が」が「買
った」に係るのか「読んだ」に係るのかがあいまいであ
り、二つのあいまいさがある。すなわち第3図の5te
p 5における構文解析部は例えば3つの機能構造を出
力する。その各々から対話処理部が計算した構造表現ベ
クタは例えば以下の3つである。
Regarding ``yesterday,'' it is ambiguous whether it relates to ``bought'' or ``read,'' and it is also ambiguous whether ``he'' relates to ``bought'' or ``read.'' , there are two ambiguities. In other words, 5te in Figure 3
The parser in p5 outputs, for example, three functional structures. The structure expression vectors calculated by the interaction processing unit from each of them are, for example, the following three.

(el)ペナルティ=O (35ubj 3 adverb 4 rentaNf
obj 5 obj Ohead)(e2)ペナルティ
=10 (55ubj 3 adverb 4 rentai#
obj 5 obj Ohead)(e3)ペナルティ
=15 (55ubj 5 adverb 4 rentai#
obj 5 obj Ohead)となる。この結果の
意味することは、(eo)の解釈として、 (e4)r彼がきのう買った本を誰か(おそらく発話者
)が読んだ。」 ととるのが最も尤もらしいという意味である。
(el) Penalty = O (35ubj 3 adverb 4 rentaNf
obj 5 obj Ohead) (e2) Penalty = 10 (55ubj 3 adverb 4 rentai#
obj 5 obj Ohead) (e3) Penalty = 15 (55ubj 5 adverb 4 rentai#
obj 5 obj Ohead). What this result means is that (e4) r someone (probably the speaker) read the book he bought yesterday. ” is the most plausible meaning.

(e2)は「(訛かが)きのう買った本を彼が読んだ。(e2) says, ``He read the book I bought yesterday.

」、(e3)は「(誰かがいつか)買った本を彼がきの
う読んだ。」という解釈に相当する。
'', (e3) corresponds to the interpretation ``Yesterday he read a book that (someone) bought.''

ペナルティの値によりこれら二つの解釈は(e4)の解
釈よりも尤もらしさが小さいことが判る。
It can be seen that these two interpretations are less likely than interpretation (e4) based on the penalty values.

この場合対話処理部としては各々の構造表現ベクタの持
つペナルティ値に基づき、 (e5)r彼が」の係り先は何ですか?(e6)rきの
う」の係り先は何ですか?の二つの可能な質問のうち、
(e5)を選択して操作者に問う。その理由は以下であ
る。
In this case, the dialogue processing section uses the penalty value of each structure expression vector to ask (e5) What is the role of "r"? (e6) What is the person responsible for "r yesterday"? Of the two possible questions,
Select (e5) and ask the operator. The reason is as follows.

対話処理部はペナルティの値に基づき構造表現ベクタが
(el)である機能構造が正解であると予想している。
The dialog processing unit predicts that the functional structure whose structure expression vector is (el) is the correct answer based on the penalty value.

したがって操作者の返答は(el)に合う答えであると
考える。もしくe6)を先に質問したとしてもおそらく
「買った」という返答が返ってくるであろう。その場合
続けて(e5)の質問をしなければ(e 1)  (e
 2)のいずれに相当する機能構造が正解であるかが判
らない。−方(e5)を先に問い、「買った」という返
答が返ってくれば(e6)を問わずに(el)に相当す
る機能構造が正解であることが判る。
Therefore, the operator's response is considered to be an answer that matches (el). Even if you asked about e6) first, you would probably get a response saying "I bought it." In that case, if you do not continue to ask question (e5), (e 1) (e
It is unclear which functional structure corresponding to 2) is correct. - question (e5) first, and if the answer is "I bought it," then it can be determined that the functional structure corresponding to (el) is the correct answer, regardless of (e6).

以上のように対話処理部では構文解析部で各機能構造に
付加されたペナルティに基づき、最も効率が良いように
対話を行なう。これは情報量が最大となる対話を行なう
ことに他ならないので、公知の情報理論に基づく方法に
よっても実現可能である。
As described above, the dialogue processing unit performs dialogue in the most efficient manner based on the penalty added to each functional structure by the syntax analysis unit. Since this is nothing but a conversation that maximizes the amount of information, it can also be achieved by a method based on known information theory.

次に、 (fO)きのう買われた本を読んだ。next, (fO) I read the book you bought yesterday.

については、「きのう」が「買われた」に係るのか「読
んだ」に係るのかがあいまいであり、また「買われた」
が「受身」の意味なのか「尊敬」の意味なのかがあいま
いである。したがって、構文解析部S5は、たとえば3
つの機能構造を呂力する。その各々から対話処理部が計
算した構造表現ベクタは、例えば以下の4つである。
Regarding ``yesterday'', it is ambiguous whether it relates to ``bought'' or ``read'';
It is ambiguous whether it means "passive" or "respect". Therefore, the syntactic analysis unit S5 has, for example, 3
It has two functional structures. The structure expression vectors calculated by the interaction processing unit from each of them are, for example, the following four.

(fl) ペナルティ=0 (2adverb 3 rentaNIpass#ob
j 4 obj Ohead)(f2) ペナルティ=
10 (4adverb 3 rentai#pass#ob
j 4 obj Ohead)(f3) ペナルティ=
0 (2adverb 3 rentai#reg#obj
 4 obj Ohead)(f4) ペナルティ=1
0 (4adverb 3 rentai#reg#obj
 4obj Ohead)ここで機能名rentai#
pass#objは文節「買われた」が「本を」連体修
飾していて、受身の用法であり、「本」が「買う」の目
的語となっていることを表わし、また機能名renta
i#reg#objは文節「買われた」が「本を」を連
体修飾していて、尊敬の意味であり、「本」が「買う」
の目的語となっていることを表す。
(fl) Penalty = 0 (2adverb 3 rentaNIpass#ob
j 4 obj Ohead) (f2) Penalty =
10 (4adverb 3 rental#pass#ob
j 4 obj Ohead) (f3) Penalty =
0 (2adverb 3 rentai#reg#obj
4 obj Ohead) (f4) Penalty = 1
0 (4adverb 3 rentai#reg#obj
4obj Ohead) Function name rentai# here
pass#obj is a passive usage in which the phrase ``bought'' modifies the adjunct with ``book,'' indicating that ``book'' is the object of ``buy,'' and the function name ``renta.''
In i#reg#obj, the phrase ``bought'' modifies ``hon'', meaning respect, and ``hon'' means ``buy''.
It means that it is the object of.

これら4つの構造表現ベクタから一つを選択するのに尤
も効率のよい質問は、ペナルティだけを考えた上述の方
法では、ベクタの第1列、すなわち「きのう」の係り先
のあいまいさと、第4列、すなわち「れる」の語義のあ
いまいさの二つが同じ優先度で考えられる。しかし、対
話処理部にはあらかじめ第13図に示すような質問パタ
ーン情報量テーブルがあるので、これを参照して「係り
先を問う」質問に較べて、「語義を問う」質問は0.2
分の情報量しかないことが分かる。そこでシステムは (f5)4きのう」の係り先は何ですか?という質問を
する。その後、「れる」の意味を問うてもいいし、情報
量が十分に少ないとみなして質問を止めてもよい。質問
を止めた場合は、操作者の文法的知識を考慮して、「れ
る」の意味を分離することは不要であったとシステムが
判断したことを意味する。その場合の出力機能構造は第
12図に示すように「れる」の意味を決定していない、
すなわち、圧縮したものとなる。この機能構造を得てシ
ステムは必要ならば公知のデフオールド処理により「受
身」の意味を選択してもよい。
The most efficient question for selecting one of these four structure expression vectors is that the above method considering only the penalty is based on the ambiguity of the first column of the vector, that is, the ``yesterday'', and the fourth column. In other words, the ambiguity of the meaning of ``reru'' can be considered with the same priority. However, since the dialogue processing unit already has a question pattern information table as shown in Figure 13, by referring to this table, compared to the question ``asking the person involved'', the question ``asking the meaning of the word'' is 0.2
It turns out that there is only so much information. So what is the system responsible for (f5) 4 yesterday? I ask this question. After that, you can ask the person what ``reru'' means, or you can stop asking questions if you think the amount of information is sufficiently small. If the question is stopped, this means that the system has determined that it is unnecessary to separate the meaning of ``reru'', taking into account the operator's grammatical knowledge. In that case, the output function structure does not determine the meaning of "reru" as shown in Figure 12.
In other words, it is compressed. Having obtained this functional structure, the system may select the meaning of "passive" by a known default process if necessary.

効   果 以上の説明から明らなように、本発明によると、以下の
ような効果がある。
Effects As is clear from the above explanation, the present invention has the following effects.

(1)対象言語の知識を必要としないので、例えば日本
人を操作者とする日英機械翻訳システムなどに応用でき
る。
(1) Since it does not require knowledge of the target language, it can be applied to, for example, a Japanese-English machine translation system operated by a Japanese person.

(2)操作者が加えるべき情報は多義を解消するのに必
要十分なものであるので、むだな情報を加える必要がな
く、またその質問の順番も最も効率の良いものであり、
操作者の負担を軽減できる。
(2) The information that the operator should add is necessary and sufficient to eliminate ambiguity, so there is no need to add unnecessary information, and the order of questions is the most efficient.
The burden on the operator can be reduced.

(3)操作者が加えるべき情報の内容が判り易いので、
質問内容は入力文に関する係り受けに関するものや、構
文要素の役割に関するものであり、解析構造を示すとい
った操作者に分かりにくいインターフェースを排除する
ことができる。
(3) The content of the information that the operator should add is easy to understand, so
The content of the questions is related to dependencies regarding input sentences and the roles of syntactic elements, and it is possible to eliminate interfaces that are difficult for the operator to understand, such as showing analysis structures.

(4)操作者に必要以上の文法的知識を必要としない。(4) Does not require the operator to have more grammatical knowledge than necessary.

また多くの文法的知識を必要とする質問に対する答えは
間違ってもよい。また、各質問についてその質問の平易
さが計算され、平易な質問はど先に出され易くなる。さ
らに、平易な質問の対する答えほど答えを重視すること
ができる。
Also, the answers to questions that require a lot of grammatical knowledge may be wrong. Additionally, the ease of each question is calculated, and easy questions are more likely to be asked first. Furthermore, the simpler the answer to the question, the more important the answer can be.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明による自然言語文解析装置の一実施例
を説明するための構成図、第2図は、辞書、構文規則、
制約を示す図、第3図は、本発明による自然言語文解析
装置の処理部のフローチャート、第4図は1機能関係部
の内容を示す図、第5図は、構成素構造を示す図、第6
図、第7図は、機能構造を示す図、第8図は、他の構成
素構造を示す図、第9図、第10図は、他の機能構造を
示す図、第11図は、対話による多義の解消処理のフロ
ーチャートを示す図、第12図は、更に他の機能構造を
示す図、第13図は、質問パターン情報量テーブルを示
す図である。 1・・・入力部、2・・出力部、3・・・構文解析部、
4・・・対話処理部、5・・・辞書部、6・・・構文規
則部、7・・・制約部、8・・・機能関係部。 特許出願人  株式会社 リ コ − 第1図 第4図 第2図 (a)  辞書D (b)構文規則R 第2図 (e)制約 C 第3図 第5図 P 彼が 公園で遊I3τ 第6図 第7図 第8図 きのう   買う た  本 を  読む  た第9区 第10図 第11図 第12図
FIG. 1 is a block diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention, and FIG. 2 shows a dictionary, syntax rules,
3 is a flowchart of the processing section of the natural language sentence analysis device according to the present invention; FIG. 4 is a diagram showing the contents of one function-related section; FIG. 5 is a diagram showing the component structure; 6th
7 is a diagram showing the functional structure, FIG. 8 is a diagram showing other component structures, FIGS. 9 and 10 are diagrams showing other functional structures, and FIG. 11 is a diagram showing dialogue. FIG. 12 is a diagram showing still another functional structure, and FIG. 13 is a diagram showing a question pattern information amount table. 1...Input section, 2...Output section, 3...Syntax analysis section,
4... Dialogue processing section, 5... Dictionary section, 6... Syntax rule section, 7... Constraint section, 8... Function related section. Patent applicant Rico Co., Ltd. - Figure 1 Figure 4 Figure 2 (a) Dictionary D (b) Syntax rule R Figure 2 (e) Constraint C Figure 3 Figure 5 P He was playing in the park I3τ Fig. 6 Fig. 7 Fig. 8 I bought a book yesterday. I read it. Ward 9. Fig. 10 Fig. 11 Fig. 12

Claims (1)

【特許請求の範囲】 1、自然言語文を入力とする入力部と、該入力部からの
入力文を形態素分割し、該形態素分割されたものに対し
て複数の構成素構造を作成し、該構成素構造の各々から
機能構造を作成し、該機能構造を作成するに際しては制
約の適用を行なう構文解析部と、該構文解析部による構
文解析の後、対話による多義の解消処理を行なう対話処
理部と、該対話処理部による解析結果を出力する出力部
とから成り、前記対話処理部は複数の機能構造の各々か
ら他の機能構造と区別する一つあるいは複数の情報を抽
出し、該情報の一つあるいは複数を対話形式で行うこと
を特徴とする自然言語文解析装置。 2、自然言語文を入力とする入力部と、該入力部からの
入力文を形態素分割し、該形態素分割されたものに対し
て複数の構成素構造を作成し、該構成素構造の各々から
機能構造を作成し、該機能構造を作成するに際しては制
約の適用を行なう構文解析部と、複数の機能構造の各々
を他の機能構造と区別する一つあるいは複数の特徴を抽
出し、該特徴の一つあるいは複数を問い、その答えを用
いて多義の解消処理を行なう対話処理部と、該対話処理
部による解析結果を出力する出力部とから成り、前記対
話処理部は得られた答えの確実性に関する情報を有する
ことを特徴とする自然言語文解析装置。 3、前記構文解析部は各々の機能構造に対しての不適合
性に関する値を計算する演算手段を有し、前記対話処理
部は、抽出した情報のうち一つあるいは複数を対話形式
で行う際に、該不適合性に関する値に基づき対話を行な
うことを特徴とする請求項1又は2記載の自然言語文解
析装置。
[Claims] 1. An input section that inputs a natural language sentence, morpheme-divides the input sentence from the input section, creates a plurality of component structures for the morpheme-divided thing, and A syntax analysis unit that creates a functional structure from each constituent structure and applies constraints when creating the functional structure, and an interaction process that performs ambiguity resolution processing through dialogue after the syntax analysis by the syntax analysis unit. and an output unit that outputs an analysis result by the interaction processing unit, and the interaction processing unit extracts one or more pieces of information from each of the plurality of functional structures to distinguish it from other functional structures, and outputs the information. A natural language sentence analysis device characterized by performing one or more of the following in an interactive manner. 2. An input section that inputs a natural language sentence, divides the input sentence from the input section into morphemes, creates multiple component structures for the morpheme division, and creates a structure from each of the component structures. A syntax analysis unit that creates a functional structure and applies constraints when creating the functional structure; and a syntax analysis unit that extracts one or more features that distinguish each of the multiple functional structures from other functional structures; It consists of a dialogue processing unit that asks one or more of the questions and uses the answers to perform ambiguity resolution processing, and an output unit that outputs the analysis results of the dialogue processing unit, and the dialogue processing unit A natural language sentence analysis device characterized by having information regarding certainty. 3. The syntax analysis unit has a calculation means for calculating a value related to incompatibility with each functional structure, and the interaction processing unit is configured to calculate a value related to incompatibility with each functional structure, and the interaction processing unit is configured to calculate a value related to incompatibility with each functional structure. , the natural language sentence analysis device according to claim 1 or 2, wherein the dialogue is performed based on the value related to the incompatibility.
JP2303684A 1990-07-16 1990-11-08 Natural language sentence analyzing device Pending JPH04174070A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2303684A JPH04174070A (en) 1990-07-16 1990-11-08 Natural language sentence analyzing device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2-187399 1990-07-16
JP18739990 1990-07-16
JP2303684A JPH04174070A (en) 1990-07-16 1990-11-08 Natural language sentence analyzing device

Publications (1)

Publication Number Publication Date
JPH04174070A true JPH04174070A (en) 1992-06-22

Family

ID=26504330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2303684A Pending JPH04174070A (en) 1990-07-16 1990-11-08 Natural language sentence analyzing device

Country Status (1)

Country Link
JP (1) JPH04174070A (en)

Similar Documents

Publication Publication Date Title
EP0370778B1 (en) Method for manipulating digital text data
US5649215A (en) Language parsing device and method for same
US5610812A (en) Contextual tagger utilizing deterministic finite state transducer
JPS62163173A (en) Mechanical translating device
Roche Parsing with finite-state transducers
KR20160138077A (en) Machine translation system and method
JPH0567144A (en) Method and device for pre-edit supporting
JPH08292955A (en) Language processing method and data processor applying the same
US20220284188A1 (en) Machine based expansion of contractions in text in digital media
KR20040086775A (en) System and method for word analysis
Antony et al. A survey of advanced methods for efficient text summarization
JPH0351022B2 (en)
KR100474823B1 (en) Part of speech tagging apparatus and method of natural language
KR101472029B1 (en) Natural language-based syntax analysis method using index element and system thereof
JPH04174070A (en) Natural language sentence analyzing device
Kempen et al. Author environments: Fifth generation text processors
Kübler et al. Adding context information to part of speech tagging for dialogues
Hardie Automated part-of-speech analysis of Urdu: conceptual and technical issues
JPH0415750A (en) Analyzing device for natural language sentence
CN110955748B (en) Semantic processing method, electronic device and non-transitory computer readable recording medium
Misra et al. Nested Noun Phrase Identification Using BERT
JP2006277674A (en) Sentence division computer program
Ying et al. A hybrid approach to Chinese-English machine translation
JP2880600B2 (en) Word string translator
小林茂之 et al. Development of CP Structure in Old English with Special Reference to The Vercelli Homilies