JPH0414175A - Analyzing device for natural language sentence - Google Patents

Analyzing device for natural language sentence

Info

Publication number
JPH0414175A
JPH0414175A JP2117156A JP11715690A JPH0414175A JP H0414175 A JPH0414175 A JP H0414175A JP 2117156 A JP2117156 A JP 2117156A JP 11715690 A JP11715690 A JP 11715690A JP H0414175 A JPH0414175 A JP H0414175A
Authority
JP
Japan
Prior art keywords
analysis
functional structure
natural language
penalty
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2117156A
Other languages
Japanese (ja)
Inventor
Makoto Ishii
信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2117156A priority Critical patent/JPH0414175A/en
Publication of JPH0414175A publication Critical patent/JPH0414175A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To obtain an analyzing device for natural language sentences which has a wide range of application by calculating the inadequacy of a function structure by means of the limitation of a limiting part and a dictionary part at production of the function structure. CONSTITUTION:An input sentence given from an input device 2 is divided into morphemes by a dictionary part 6, and plural component element structures are produced for those morphemes based on the contents of a syntax rule part 4. Then a function structure is produced from each component element structure. At production of the function structure, a controller 1 applies the limitation by means of the limitation of a limiting part 5 and the dictionary 6. Then the inadequacy of the function structure is calculated and the analyzing result is outputted from an output device 3. In such a constitution, the ambiguity is satisfactorily deleted and at the same time even an exceptional metaphorical expression can be analyzed. Thus it is possible to obtain an analyzing device for natural language sentences which has a wide range of application with no occurrence of explosion in terms of space and time.

Description

【発明の詳細な説明】 狡亙分互 本発明は、自然言語文解析装置に関し、より詳細には、
機械翻訳装置など自然言語文を入力とするシステムの実
現において用いられる自然言語文の構文解析装置に関す
る。
[Detailed Description of the Invention] The present invention relates to a natural language sentence analysis device, and more specifically,
The present invention relates to a natural language sentence parsing device used in realizing a system that takes natural language sentences as input, such as a machine translation device.

k米技晰 自然言語文を構文解析する際には、構文解析木のような
構造的データ構造を構成するだけでは精密な解析は困難
である。そこで構造的データ構造に加えて、意味的デー
タ構造を構成し、これら二つのデータ構造により相補的
に文法を記述する枠組みを提供する文法理論に語常機能
文法がある。
When parsing a natural language sentence, precise analysis is difficult only by constructing a structural data structure such as a parse tree. Therefore, regular functional grammar is a grammatical theory that constitutes a semantic data structure in addition to a structural data structure, and provides a framework for describing grammar complementary to these two data structures.

これに関しては、 「丁he Mental Repr
esentationof GramIIlatica
l Re1ations、J (Bresnan、J、
 MITPress、 1982 )がある。
Regarding this, “Ding he Mental Repr.
estation of GramIIlatica
l Relations, J (Bresnan, J,
MITPress, 1982).

この諸費機能文法では後者の意味的データ構造を機能構
造と呼び、機能構造を最終出力とする。
In this overhead functional grammar, the latter semantic data structure is called a functional structure, and the functional structure is the final output.

機能構造は「意味的」といっても表層格フレームのよう
な構造であり、自然言語文の意味構造として適当な構造
とはいえない。そこで解析系を利用するアプリケーショ
ン、例えば機械翻訳は1機能構造の情報をもとに辞書な
どの外部情報源から必要な意味的情報を得なければなら
ない。
Although the functional structure is ``semantic,'' it is a structure similar to a superficial case frame, and cannot be said to be an appropriate structure as a semantic structure for natural language sentences. Therefore, applications that use an analysis system, such as machine translation, must obtain necessary semantic information from an external information source such as a dictionary based on information about a single functional structure.

外部情報源から抽出する情報は、諸費の持つ意味的な情
報であり、この意味的情報も開業機能文法の枠組みの中
で扱おうとし、さらにこの意味的情報を解析のあいまい
さ解消に用いようとする従来技術には、例えば、rLF
Gと意味解析の融合に向けて」 (新田善人情報処理学
会自然言語処理研究会論文集、68−2,1988 )
がある。ここで「あいまいさ」とは解析結果が複数解出
力されることである。しかしながら、この従来技術には
以下のような問題点がある。
The information extracted from external information sources is the semantic information of miscellaneous expenses, and we will try to handle this semantic information within the framework of business function grammar, and furthermore, use this semantic information to resolve ambiguity in analysis. For example, rLF
"Towards the fusion of G and semantic analysis" (Yoshito Nitta Information Processing Society Natural Language Processing Research Group Proceedings, 68-2, 1988)
There is. Here, "ambiguity" means that multiple solutions are output as an analysis result. However, this conventional technique has the following problems.

(1)文法的性質において構文的な強さによるレベル化
ができない。
(1) Grammatical properties cannot be leveled by syntactic strength.

(A)単文中には主語は二つ以上あることはない。(A) There cannot be more than one subject in a simple sentence.

(B)「飲む」の主語は動物である。(B) The subject of "drink" is an animal.

上記の二つの文法現象は、(A)は非常に強い文法的性
質の例として、(B)はより弱い文法的性質の例として
挙げた。これら二つの文法的性質はその「強さ」言い替
えれば例外の少なさについて大きく差がある。したがっ
て構文解析は(A)の性質については常に成り立ってい
なければならないが、(B)については成り立っていな
い場合もあるとして処理すべきである。つまり(B)の
ような性質が成り立っていない解析結果を失敗として扱
う構文解析では、「自動車はガソリンを飲む。」のよう
な例外的で比喰的な文は解析できない。だからといって
(B)のような性質を用いない構文解析は解析のあいま
いさを除去できない。
Regarding the above two grammatical phenomena, (A) was given as an example of a very strong grammatical property, and (B) was given as an example of a weaker grammatical property. These two grammatical properties differ greatly in their ``strength'', or in other words, the number of exceptions. Therefore, in syntactic analysis, property (A) must always hold true, but property (B) should be treated as not holding true in some cases. In other words, a syntactic analysis that treats an analysis result in which the property (B) does not hold as a failure cannot analyze an exceptional and comparative sentence such as "Cars drink gasoline." However, parsing that does not use properties like (B) cannot eliminate ambiguity in the parsing.

また、機能構造の構成時に全ての文法的性質のチエツク
が行なわれるため文法的性質を「用いる」か「用いない
」かの選択は、「あいまいさを除去すること」と「例外
に強いこと」とのトレードオフになってしまう。すなわ
ちよりあいまいさを除去するように−すれば例外的表現
を解析できないし、例外的表現でも解析できるようにす
ればあいまいさは除去できないという問題点がある。こ
れは文法的性質において構文的な強さによるレベル化が
できないためである。
In addition, since all grammatical properties are checked when constructing a functional structure, the choice of whether to use or not use grammatical properties is based on ``removal of ambiguity'' and ``resistance to exceptions.'' It becomes a trade-off. In other words, there is a problem in that if you try to remove more ambiguity, you will not be able to analyze exceptional expressions, and if you make it possible to analyze even exceptional expressions, you will not be able to remove ambiguity. This is because grammatical properties cannot be leveled by syntactic strength.

また、構文解析の後フェーズとして意味解析を行ない、
それによって解析のあいまいさを解消しようとする従来
技術には、例えば「意味解析における言語知識の体系的
活用」 (池田裕治外2名情報処理学会第39回全国大
会資料、5F−8゜1989)がある。この技術は言語
知識をプロダクションルールとして記述し、各プロダク
ションルールにおいては、付随する条件について解の適
合度合いに応じてスコア付けを行ない、全てのルールの
チエツクが終了した時点で解の候補のうちでもっともス
コアの良いものを選択することによって解析のあいまい
さを解消するものである。しかしながら、以下のような
問題点がある。
In addition, semantic analysis is performed as a phase after syntactic analysis,
Conventional techniques that attempt to resolve ambiguity in analysis include, for example, "Systematic Utilization of Linguistic Knowledge in Semantic Analysis" (Yuji Ikeda and two others, Information Processing Society of Japan's 39th National Conference Materials, 5F-8゜1989) There is. This technology describes linguistic knowledge as production rules, and for each production rule, scores are given according to the degree of conformity of the solution to the accompanying conditions. This eliminates ambiguity in analysis by selecting the one with the best score. However, there are the following problems.

(2)−時的な空間的、時間的爆発が生じやすい。(2) - Spatiotemporal and temporal explosions are likely to occur.

例外に強くしようとすれば構文解析の時点で除去できる
解析結果は少なく、そのため解析のあいまいさの解消に
ついては意味解析の処理に大きく依存することになる。
If we try to make it robust against exceptions, there are only a few analysis results that can be removed at the time of syntactic analysis, and as a result, resolving ambiguity in analysis will depend heavily on semantic analysis processing.

そのため構文解析の処理の終了時に一時的に解析結果が
非常に増え、空間的、時間的に処理が困難になりうる。
Therefore, at the end of the syntax analysis process, the number of analysis results temporarily increases significantly, which can make processing difficult both spatially and temporally.

このことは文の長さが長くなれば必ず起こる現象であり
、そのため解析できる文は短いものになってしまうとい
う問題点がある。この問題が生じる原因は構文解析、意
味解析という2フエーズの処理にある。すなわち意味解
析も構文解析の時点から並行して行なわなければ解析の
あいまいさを除去できずに空間的、時間的爆発は生じや
すくなるのである。
This phenomenon always occurs when the length of a sentence becomes long, and the problem is that the sentences that can be analyzed are short. The cause of this problem is the two-phase processing of syntactic analysis and semantic analysis. In other words, unless semantic analysis is performed in parallel from the point of syntactic analysis, ambiguity in the analysis cannot be removed and spatial and temporal explosions are likely to occur.

上記問題点(1)については、文法的性質を制約として
表現し、かつ各々の制約に制約の持つ文法的強さに関す
る情報を付加し、この情報を用いながら解析のあいまい
さを除去する。上記文法的強さに関する情報は例えば数
値で表現し、その値の大小がレベル化の基準となる。
Regarding the above problem (1), grammatical properties are expressed as constraints, information about the grammatical strength of the constraints is added to each constraint, and ambiguity in the analysis is removed using this information. The information regarding the grammatical strength is expressed, for example, as a numerical value, and the magnitude of the value serves as a standard for leveling.

上記問題点(2)については、構文解析、意味解析とい
った処理のモジュール化をせずに、いずれも同じ制約と
して記述することにより、従来技術でいう「構文解析」
は文法的に強い制約として、また「意味解析」は文法的
に弱い制約として統一的に扱う。また解析の途中でもい
くつかの制約を満たさないことによって解でないとみな
せるものは解析処理から一時的に外すことにより空間的
、時間的爆発を防止する。
Regarding problem (2) above, by not modularizing processing such as syntactic analysis and semantic analysis, but by describing both as the same constraint, it is possible to solve the problem by
is uniformly treated as a grammatically strong constraint, and ``semantic analysis'' is treated as a grammatically weak constraint. In addition, even during the analysis, if some constraints are not satisfied and it is considered not to be a solution, it is temporarily removed from the analysis process to prevent spatial and temporal explosions.

■−一カ 本発明は、上述のごとき実情に鑑みてなされたもので、
あいまいさを十分に除去でき、一方で例外的な比喰的表
現についても解析を可能にし、また空間的1時間的爆発
の生じない、したがってアプリケーションの幅の広い自
然言語文解析装置を提供することを目的としてなされた
ものである。
■-The present invention was made in view of the above-mentioned circumstances.
To provide a natural language sentence analysis device which can sufficiently remove ambiguities, can also analyze exceptional figurative expressions, does not cause spatial or temporal explosions, and therefore has a wide range of applications. It was made for the purpose of

盈−一双 本発明は、上記目的を達成するために、自然言語文を入
力する入力装置と、該入力装置からの入力文を辞書部を
用いて形態素分割し、該形態素分割されたものに対して
、構文規則部の内容を用いて複数の構成素構造を作成し
、該構成素構造の各々から機能構造を作成し、該機能構
造を作成するに際しては、制約部からの制約と前記辞書
部を用いて制約の適用を行う制御装置と、該制御装置に
よる解析結果を出力する出力装置とから成り、前記機能
構造の作成時に該機能構造の不適合性を計算することを
特徴としたものである。
In order to achieve the above-mentioned object, the present invention includes an input device for inputting a natural language sentence, a dictionary section that divides the input sentence from the input device into morphemes, and divides the morpheme-divided sentences into Then, a plurality of constituent structures are created using the contents of the syntax rule section, a functional structure is created from each of the constituent structures, and when creating the functional structure, the constraints from the constraint section and the dictionary section are used. The present invention is comprised of a control device that applies constraints using the control device, and an output device that outputs analysis results by the control device, and is characterized in that the incompatibility of the functional structure is calculated when the functional structure is created. .

本発明の自然言語文解析装置は、入力文を文の構成要素
に分割し、いくつかの構成要素を組み合わせてより大き
な構成要素を構成する作業を再帰的に行ない、最終的に
文として正当な構成要素になった解析結果を妥当な解析
結果として出力する。
The natural language sentence analysis device of the present invention divides an input sentence into sentence components, recursively combines some of the components to form a larger component, and finally obtains a valid sentence. Output the analysis results that have become constituent elements as valid analysis results.

いくつかの構成要素を組み合わせてより大きな構成要素
を構成する際には、その構成が実現するためのいくつか
の制約がチエツクされる。各々の制約は制約の持つ文法
的強さに関する情報を持っているので、満たされなかっ
た制約について上記文法的強さに関する情報を総合評価
して、構成時に不適合性とみなす。不適合性がある程度
大きくなってくると解析装置はその解析状態は不適格と
みなして、−時的に以後の解析から外す。したがってよ
り不適合性の小さな、すなわちより適合性の大きな解析
状態だけが解析処理の対象となる。以下、本発明の実施
例に基づいて説明する6第1図は、本発明による自然言
語文解析装置の一実施例を説明するための構成図で、図
中、1は制御装置、2は入力装置、3は出力装置、4は
構文規則部、5は制約部、6は辞書部である。
When constructing a larger component by combining several components, several constraints are checked to realize the configuration. Since each constraint has information regarding the grammatical strength of the constraint, the information regarding the grammatical strength is comprehensively evaluated for constraints that are not satisfied, and the constraints are considered to be incompatible at the time of composition. When the incompatibility becomes large to a certain extent, the analyzer considers the analysis state to be unsuitable and temporarily excludes it from future analysis. Therefore, only analysis states with smaller incompatibility, ie, greater compatibility, are subject to analysis processing. Hereinafter, the explanation will be based on an embodiment of the present invention.6 Fig. 1 is a block diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention.In the figure, 1 is a control device, 2 is an input 3 is an output device, 4 is a syntax rule section, 5 is a constraint section, and 6 is a dictionary section.

入力装N2はキーボードなどの入力装置あるいは記憶装
置からの入力を含む。出力装置3は解析結果をデイスプ
レィなどで視認する場合あるいは機械翻訳などの場合の
ように構文解析装置を用いたアプリケーションである場
合も含む。
The input device N2 includes input from an input device such as a keyboard or a storage device. The output device 3 includes a case where the analysis result is visually confirmed on a display or the like, or a case where it is an application using a syntax analysis device such as in the case of machine translation.

第2図(a)〜(c)は、辞書D、構文規則R1制約C
を各々示すものである。
Figures 2 (a) to (c) show a dictionary D, a syntax rule R1, a constraint C
are shown respectively.

第2図(a)に示す辞書りの各要素は見出し語、語當範
!I(品詞)、素性で表現される。素性は(素性名、素
性値)の形のリストである。ここで素性とは諸費の持つ
性質を抽出したものである。
Each element of the dictionary shown in Figure 2 (a) is a headword, a word range! I (part of speech) is expressed as a feature. A feature is a list of the form (feature name, feature value). Here, the characteristics are extracted characteristics of miscellaneous expenses.

第2図(b)に示す構文規則Rはラベル付の句構造文法
で記述されている。右辺の各要素はラベル付きの非終端
記号かラベルなしの非終端記号である。(R1)中の(
N P ; topic)の場合、非終端記号がNPで
ラベルがtopicである。また右辺の非終端記号で小
文字の英字は前終端記号(開業範鴫)、大文字の英字は
前終端記号以外の非終端記号である。また構文規則中の
ラベルは機能名を表す。ここで機能名とは公知の開業機
能文法での用法と同様である。すなわち(R1)の記述
は諸量機能文法における以下のRIOと同じである。
The syntactic rule R shown in FIG. 2(b) is written in a phrase structure grammar with labels. Each element on the right-hand side is a labeled or unlabeled nonterminal. (R1) in (
N P ; topic), the nonterminal symbol is NP and the label is topic. Also, among the non-terminal symbols on the right side, the lower-case alphabetic characters are pre-terminal symbols (opening ranges), and the upper-case alphabetic characters are non-terminal symbols other than the pre-terminal symbols. Also, the labels in the syntax rules represent function names. Here, the term "function name" is used in the same manner as in the known practice function grammar. That is, the description of (R1) is the same as the following RIO in the various quantity functional grammar.

(RIO)  VP−>   NP    VP↓=↑
topic  ↓:↑ 制約Cは機能名とペナルティ付きのプロダクションルー
ルである。表記法は、 (機能名:ペナルティ)制約規則 の形式である。各々の制約規則は機能構造中の情報、特
に辞書から抽出される素性の値を参照している。ここで
機能構造とは公知の語索機能文法での用法と同様であり
、機能名を属性名、機能構造を属性値とする再帰的なマ
トリクスである。第11図に機能構造の例を示す。
(RIO) VP->NP VP↓=↑
topic ↓:↑ Constraint C is a production rule with a function name and a penalty. The notation is in the form of a (Function name: Penalty) constraint rule. Each constraint rule refers to information in the functional structure, particularly feature values extracted from a dictionary. Here, the term "functional structure" is used in the same manner as in the known word search functional grammar, and is a recursive matrix in which the functional name is the attribute name and the functional structure is the attribute value. FIG. 11 shows an example of the functional structure.

第3図は、本発明による自然言語文解析装置の制御装置
のフローチャートである。以下、各ステップに従って順
に説明する。
FIG. 3 is a flowchart of a control device for a natural language sentence analysis device according to the present invention. Below, each step will be explained in order.

シリ」」2;入力装置より「べた書き」の日本語文を入
力する。
"Siri"2; Input the Japanese sentence "solid writing" from the input device.

銭肚I;日本語文の入力された制御装置は、入力文を形
態素のリストに分割し、KLに代入する。例えば。
Qian Chu I: The control device to which the Japanese sentence is input divides the input sentence into a list of morphemes and substitutes them into KL. for example.

(al)彼は泳ぐ が入力文であるとすると、KLは、 (a2)(彼:n)(は:P)(泳ぐ:v)となる。こ
こで各形態素は(見出し語二開業範II)の形式で表現
されている。r開業範鴫」とは、いわゆる品詞であり、
構文規則においては小文字の英数字で表現されている。
If (al) He swims is the input sentence, then KL becomes (a2) (He: n) (Ha: P) (Swim: v). Here, each morpheme is expressed in the format (Headword 2 Opening Range II). "r-opening range" is the so-called part of speech,
In syntax rules, it is represented by lowercase alphanumeric characters.

KLは形態素のリストであり、以後はKLの先頭から順
に一形態素ずつ処理をし、形態素がなくなった時点で、
最終状態として妥当な解析が得られれば解析成功となる
。このアルゴリズムは文のLeft−to−Right
構文解析法であり、ユーザによる文の入力に同期したリ
アルタイムの構文解析アルゴリズムとして、対話型の自
然言語文解析装置に適したものである。
KL is a list of morphemes, and from now on, we process each morpheme from the beginning of KL, and when there are no more morphemes,
If a valid analysis is obtained as the final state, the analysis is successful. This algorithm uses the Left-to-Right
It is a syntactic analysis method, and is suitable for an interactive natural language sentence analysis device as a real-time syntax analysis algorithm that synchronizes with the user's input of sentences.

畦虻y;形態素のリスト(列)が終わったかどうかを調
べる。
Check whether the list (column) of morphemes has ended.

桂吐旦;終わった場合はNSSに解析結果がリストされ
るので、その中から最終状態として妥当なもの、すなわ
ち文に相当する構文要素が構成された解析結果を抽出す
る。
When the analysis is completed, the analysis results are listed in the NSS, and from there, those that are valid as the final state, that is, the analysis results that are composed of syntactic elements corresponding to a sentence, are extracted.

W;解析結果を出力装置3に出力する。構文規則Rの場
合では非終端記号Sが構成された場合に文に相当する構
文要素が構成されたと判断する。
W: Output the analysis result to the output device 3. In the case of syntactic rule R, it is determined that a syntactic element corresponding to a sentence is constructed when a non-terminal symbol S is constructed.

旦肛土; 5tep 3において形態素の列が終わって
いない場合は先頭の形態素をWに代入する。先頭の形態
素をポツプしたのでKLの長さは一つ短くなっている。
Danko Sat; 5tep If the string of morphemes has not ended in step 3, substitute the first morpheme to W. Since the first morpheme was popped, the length of KL is one less.

さて前の形態素まで処理した時点での解析状態はSSに
リストされている。そこでSSの各要素(前の形態素ま
で処理した解析状態)について新しい形態素Wを用いて
解析を進める作業を行なう。
Now, the analysis state at the time when the previous morpheme has been processed is listed in SS. Therefore, the analysis is performed using a new morpheme W for each element of SS (an analysis state in which the previous morpheme has been processed).

鮭肛旦; S Sが空であるかどうかをチエツクする。Check if S is empty.

空であった場合は前回までの解析状態について新たに処
理すべきことは終了しているので後処理を行なう。
If it is empty, the new processing for the previous analysis state has been completed, so post-processing is performed.

畦旺旦;空でない場合は前の形態素まで処理した解析状
態をSとする。
If it is not empty, let S be the analysis state in which the previous morpheme has been processed.

社弘ユ; SとWについてシフトリデュース処理を行な
う。S7のシフトリデュース処理については後述する。
Hiroyu Sha: Perform shift-reduce processing for S and W. The shift-reduce process in S7 will be described later.

畦旺↓よ; 5tep 5においてssが空であった場
合は後処理を行なうが、この際NSSに今回の形態素ま
で処理した解析状態がリストされている。NSSが空で
あるかどうかをチエツクする。空でない場合は5tep
14でSsにNSSを代入してこの形態素に関する処理
を終了する。
5 step If ss is empty in step 5, post-processing is performed, but at this time, the analysis state that has been processed up to the current morpheme is listed in NSS. Check if NSS is empty. 5tep if not empty
At step 14, NSS is substituted for Ss, and the processing regarding this morpheme is completed.

畦吐よ2;NSSが空である場合は可能な解析状態がな
くなってしまったということであり、構文解析が一時的
に失敗したことを意味する。
2: If NSS is empty, it means that there are no more possible parsing states, and it means that parsing has temporarily failed.

この場合の処理については後述する。Processing in this case will be described later.

第4図は、第3図における5tep 7のシフトリデュ
ース処理のフローチャートである。以下、各ステップに
従って順に説明する。
FIG. 4 is a flowchart of the shift-reduce process in step 5 in FIG. 3. Below, each step will be explained in order.

この部分の処理については公知のシフトリデュースパー
サのアルゴリズムを一部拡張したものになっている。シ
フトリデュース処理が呼ばれた時点でSに前の形態素ま
で処理が終了した時点での解析状態が、Wに今回の形態
素が代入されている。
This part of the processing is a partial extension of a known shift-reduce parser algorithm. When the shift-reduce process is called, the analysis state at the time when processing up to the previous morpheme is completed is assigned to S, and the current morpheme is assigned to W.

解析状態Sは一般のシフトリデュースパーサと同様に、
構文要素(非終端記号)からなるスタックで表現されて
いる。第9図(、)に解析状態のスタックの例を示す。
The analysis state S is similar to a general shift reduce parser,
It is represented by a stack of syntactic elements (nonterminal symbols). FIG. 9(,) shows an example of a stack in an analysis state.

5tep21 ;まず今回の形態素まで処理を行なった
解析状態を一時的にリストするためにTSSに空を代入
する。
5tep21; First, empty is assigned to TSS in order to temporarily list the analysis state that has been processed up to the current morpheme.

畦旺主又; SとWでシフトを行ない結果をNSに代入
する。シフトとは構文要素からなるスタックSに前終端
記号Wをブツシュすることである。
Master: Shift with S and W and assign the result to NS. Shifting means pushing a preterminal symbol W onto a stack S of syntax elements.

7;新しくできた解析状態NSについて、0回以上のリ
デュース操作を行なってできた解析状態は全てTSSに
リストされる。
7; Regarding the newly created analysis state NS, all analysis states created by performing reduce operations zero or more times are listed in the TSS.

ここで5tep23におけるリデュース処理について第
5図を用いてさらに詳細に説明する。
Here, the reduce processing in step 23 will be explained in more detail using FIG. 5.

扛吐主工;解祈状態NSについて適用可能な構文規則を
構文規則から抽出する。この処理は公知のりデユーステ
ーブルによってもよいし、スタックの先頭(この場合は
新しい形態素W)が構文規則の右辺最終項となる規則を
抽出する方法もある。こうして抽出してきた構文規則は
RLにリストされる。
Extract the syntax rules applicable to the prayer state NS from the syntax rules. This process may be performed using a known glue use table, or there may be a method of extracting a rule in which the top of the stack (in this case, the new morpheme W) is the final term on the right side of the syntax rule. The syntax rules thus extracted are listed in the RL.

扛吐旦又:適用できる構文規則がまだあるか(RLが空
でないか)をチエツクする。空であれば適用できる構文
規則が終了したことになるので終了する。
Trigger: Checks if there are more syntactic rules that can be applied (RL is not empty). If it is empty, this means that the applicable syntax rules have ended, so exit.

d;空でない場合は、RLをポツプしてRに代入する。d; If it is not empty, pop RL and assign it to R.

扛吐主土;次の構文規則(RLの次の要素)を適用する
際に再びNSが必要になってくるので、NSを壊さない
ようにTSにコピーしている。
When applying the next syntax rule (next element of RL), NS will be needed again, so we copy it to TS so as not to break it.

d;コピーされたTSにRを適用する。より詳細にはス
タックの先端部のいくつかの構文要素(非終端記号)を
右辺とする構文規則の左辺で置き換えることである。
d; Apply R to the copied TS. More specifically, it involves replacing some syntax elements (non-terminal symbols) at the top of the stack with the left side of the syntax rule that is the right side.

第9図にリデュースの例を示す。第9図(a)の解析状
態のスタックは先端部のパターンがNとPであり、これ
は構文規則Rの(R6)の右辺のパターンと一致する。
FIG. 9 shows an example of reduction. The stack in the parsed state in FIG. 9(a) has patterns N and P at the leading end, which match the pattern on the right side of (R6) of the syntax rule R.

そこでこの部分を(R6)の左辺であるNPに置き換え
る。5tep35のリデュースの結果はTSに代入され
る。
Therefore, this part is replaced with NP, which is the left side of (R6). The result of reduce in step 5 is assigned to TS.

step36;新しくできた解析状態TSが最終状態に
到達しうるかをチエツクする。このチエツクは公知の回
速テーブルを用いてできる。ここで回速テーブルとは構
文規則から予め構成されるテーブルで、スタックパター
ンからそのスタックが最終状態に到達しうるかをすぐに
参照するためのものである。
Step 36: Check whether the newly created analysis state TS can reach the final state. This check can be performed using a known speed table. Here, the speed table is a table configured in advance from syntax rules, and is used to quickly refer to whether a stack can reach its final state based on a stack pattern.

壮ユ立ユ;前記5tep36において最終状態に到達し
うろことが分かった場合はTSをTSSにブツシュする
。到達しえないことが分かった場合はこの5tep37
をスキップする。さてTSは一回のリデュースを行なっ
た結果の解析状態にあるので、さらにこれ以上のリデュ
ースを行なうにはTSをNSに代入して再帰的にリデュ
ース処理を呼び出す必要がある。この際NSが破壊され
てしまうとループの次の処理の時点で困るので局所的に
代入しなげればならない。
If it is found in step 36 that the final state is about to be reached, TS is pushed to TSS. If you find that it cannot be reached, follow these 5 steps 37
Skip. Now, since TS is in the state of analyzing the result of one reduction, in order to perform further reduction, it is necessary to assign TS to NS and call the reduce process recursively. At this time, if NS is destroyed, it will cause problems in the next processing of the loop, so it must be substituted locally.

第4図の5tep23でリデュース処理が終わった時点
でTSSには0回以上のりデユースが終った解析状態が
リストされている。これらの解析状態について以後ペナ
ルティの計算とペナルティによる分別を行なう。
When the reduce process is completed in step 23 of FIG. 4, the TSS lists analysis states in which reuse has been completed zero or more times. Penalty calculation and penalty classification will be performed for these analysis states.

担徂Lλ4;TSSが空になっていればシフトリデュー
ス処理は終了する。
Transfer Lλ4: If the TSS is empty, the shift-reduce process ends.

麩肚叢旦;前記5tep 24において空でなければT
SSをポツプしてPSに代入する。したがってPSは今
回の形態素についてシフトおよび0回以上のリデュース
を行なった結果の解析状態である。
麩肚斗田; if it is not empty in the above 5tep 24, T
Pop SS and assign it to PS. Therefore, PS is the analysis state resulting from shifting and reducing zero or more times for the current morpheme.

畦肚I且: PSのペナルティを計算してPに代入する
。この処理はペナルティの計算処理として後述する。
畦肚I且: Calculate the PS penalty and substitute it for P. This process will be described later as a penalty calculation process.

4;次にPがKILL以上であるかどうかをチエツクす
る。KILLはここでは200としている。このチエツ
クの意味はペナルティが十分に大きい解析状態について
は完全に解析失敗として扱うという意味である。
4; Next, check whether P is greater than or equal to KILL. KILL is set to 200 here. This check means that an analysis state with a sufficiently large penalty is completely treated as an analysis failure.

step28;次にペナルティがKILL以下の解析状
態については、PがTH以上であるがどうかをチエツク
する。
Step 28: Next, for analysis states where the penalty is below KILL, it is checked whether P is greater than or equal to TH.

7; PがTH以上であればPsをSLにブシュする。7; If P is greater than or equal to TH, bush Ps to SL.

ジ徂1λ」−;PがTH未満であればpsをNSSにブ
シュする。THは現時点での処理の対象とすべき解析状
態のペナルティの上限値を意味する。PがTH以上であ
れば処理の対象とできないので、以後の処理対象になら
ないようにSLにブツシュする。ここでSLは以後の処
理から外された言わば「眠らされた」解析状態のリスト
である。一方PがTHより小さい場合はその解析状態に
ついては問題がないのでNSSにブツシュする。NSS
が以後の処理の対象となる解析状態のリストである。
If P is less than TH, push ps to NSS. TH means the upper limit value of the penalty of the analysis state to be processed at the current time. If P is greater than or equal to TH, it cannot be processed, so it is bushed to SL so that it will not be processed later. Here, SL is a list of analysis states that are excluded from subsequent processing and are, so to speak, "sleeped". On the other hand, if P is smaller than TH, there is no problem with the analysis state, so it is sent to NSS. NSS
is a list of analysis states to be processed later.

ここで5tep26におけるペナルティの計算について
第6図を用いてさらに詳細に説明を行なう。
Here, the calculation of the penalty in step 526 will be explained in more detail using FIG.

畦呼旦土;先ず入力された解析状態(step 26 
”CはPS)をUとする。これはペナルティの計算処理
は後述する5tep43からも呼ばれるためである。
First, the input analysis state (step 26
``C is PS) is set as U. This is because the penalty calculation process is also called from 5tep43, which will be described later.

扛虻旦主;解析状態Uから機能構造を構成する。扛虻danlord: Constructs a functional structure from the analysis state U.

この処理は解析状態が非終端記号のスタックだけでなく
今まで適用されたシフトリデュースの履歴を残していれ
ば、語索機能文法で公知の構成素構造から機能構造を構
成するアルゴリズムによって実現できる。
This process can be realized by an algorithm that constructs a functional structure from constituent structures known in word search functional grammars, as long as the analysis state leaves not only a stack of nonterminal symbols but also a history of shift-reduces that have been applied so far.

ste 53  ste 54 ;機能構造ができたら
機能構造のペナルティを計算する。
ste 53 ste 54; Once the functional structure is created, calculate the penalty for the functional structure.

この処理については、機能構造は第11図に示すように
再帰的マトリクスであるので、機能構造の部分構造につ
いて部分ペナルティを計算する方法と部分ペナルティを
総合してペナルティを計算する方法を規定すればよい。
Regarding this process, since the functional structure is a recursive matrix as shown in Figure 11, it is necessary to define a method for calculating partial penalties for the substructures of the functional structure and a method for calculating the penalty by integrating the partial penalties. good.

実施例では部分ペナルティを総合する方法は単に部分ペ
ナルティを加算することとする。また部分ペナルティを
計算することについては、以下第7図を用いて詳細に説
明する。
In the embodiment, the method of integrating the partial penalties is simply adding the partial penalties. Further, calculation of the partial penalty will be explained in detail below using FIG. 7.

虹呼旦よ;ペナルティを計算しようとする機能構造の部
分構造が親の機能構造における関係名(機能名)を求め
RELに代入する。ここで機能名は構文規則中のラベル
であり、リデュースの履歴を調べることにより、あるい
は既に機能構造が構成されていれば機能構造中より求め
ることができる。
Dear Rainbow Caller: The substructure of the functional structure for which a penalty is to be calculated finds the relationship name (function name) in the parent functional structure and substitutes it into REL. Here, the function name is a label in the syntax rules, and can be found by checking the history of reduce or from the function structure if the function structure has already been configured.

4;次に機能名でRELでインデクスされている制約を
全て抽呂しCLにリストする。
4; Next, check all constraints indexed in REL by function name and list them in CL.

制約は制約Cのように機能名でインデクスされているの
でCLの構成は容易である。
Constraints are indexed by function name like constraint C, so CL is easy to configure.

n旦」−;ペナルティを代入する変数PENを初期化す
る。CLには適用されるべき制約がリストされているの
で、その全ての適用を行ない満たされなかった制約のも
つペナルティを加算することによりPENを計算する。
nth day'-; Initialize the variable PEN to which the penalty is assigned. Since CL lists the constraints to be applied, PEN is calculated by applying all of them and adding the penalties of the constraints that are not satisfied.

この処理は5tep 64〜5tep 68のループで
行なう。
This process is performed in a loop of 5 steps 64 to 5 steps 68.

計算されたPENは機能名RELについてのペナルティ
である。機能名は機能構造の部分構造を標識する名称で
あるので、機能構造中の全ての機能名について再帰的に
以上の処理を行ない、求められたペナルティを加算する
ことにより機能構造全体のペナルティを計算できる6 以上述へた機能構造の作成とペナルティの計算処理につ
いて(al)の例文の解析を第10図、第11図、第1
2図を用いて説明する。第10図は(C2)の形態素列
を第3図に示す処理によって解析した結果を示す構文解
析木(C3)である。この構文解析木(C3)と等価な
シフトリデュースの履歴を第12図(a)〜(g)に示
す。
The calculated PEN is the penalty for function name REL. Since a function name is a name that indicates a substructure of a functional structure, the above process is performed recursively for all function names in the functional structure, and the penalty for the entire functional structure is calculated by adding the obtained penalty. 6 Regarding the creation of the functional structure and the calculation of penalties as described above, the analysis of the example sentence of (al) is shown in Figures 10, 11, and 1.
This will be explained using Figure 2. FIG. 10 is a parse tree (C3) showing the result of analyzing the morpheme sequence of (C2) by the process shown in FIG. Shift-reduce history equivalent to this parse tree (C3) is shown in FIGS. 12(a) to 12(g).

第12図中でSはシフト操作、すなわち新しい形態素を
一つ取り込む作業を、Rをリデュース操作、すなわち構
文規則の適用を意味する。Rの後の数値は適用された構
文規則の構文規則Rにおける番号である。第12図(g
)で最終状態に到達した。第12図に示すシフトリデュ
ースの履歴から第10図に示すラベル付きの構文解析木
が一意に作成できる。第10図に示す構文解析木は既述
の開業機能文法の用語では構成素構造と呼ぶが、この構
成素構造から第11図に示す機能構造(C4)を構成す
る処理は公知である。機能構造(C4)はer+try
部に主要語のリストがあり、また主要語の持つ素性も記
述されている。素性については辞書りを用いた。次に第
11図の機能構造についてペナルティの計算を行なう。
In FIG. 12, S means a shift operation, that is, the work of incorporating one new morpheme, and R means a reduce operation, that is, the application of a syntactic rule. The number after R is the number in syntax rule R of the applied syntax rule. Figure 12 (g
) reached the final state. The labeled parsing tree shown in FIG. 10 can be uniquely created from the shift-reduce history shown in FIG. 12. The parse tree shown in FIG. 10 is called a constituent structure in the terminology of the practitioner functional grammar described above, and the process of constructing the functional structure (C4) shown in FIG. 11 from this constituent structure is well known. Functional structure (C4) is er+try
There is a list of main words in the section, and the characteristics of the main words are also described. A dictionary was used for background information. Next, a penalty is calculated for the functional structure shown in FIG.

機能構造(C4)は素性を無視すると機能名を属性名と
するマトリクスになっている。マトリクスの深さは1段
で、最外構造の機能はtopic機能だけである。した
がってこのtopic機能について部分ペナルティを計
算すれば良い。第7図5tep61におけるRELはt
opicとなる。制約C中でtopicでインデクスさ
れている制約は(C4)〜(C7)で、これらがCLに
リストされる。これら4つの制約が機能構造(C4)に
適用され、満たされなかった制約についてのペナルティ
の総和がtopic機能についてのペナルティになる。
Ignoring features, the functional structure (C4) is a matrix with function names as attribute names. The depth of the matrix is one level, and the function of the outermost structure is only the topic function. Therefore, it is sufficient to calculate a partial penalty for this topic function. REL in FIG. 7, step 61 is t
It becomes opic. Constraints indexed by topic in constraint C are (C4) to (C7), and these are listed in CL. These four constraints are applied to the functional structure (C4), and the sum of the penalties for the unsatisfied constraints becomes the penalty for the topic function.

機能構造(C4)は制約(C4)(C5)(C6)を満
たしている6次に制約(C7)を満たすために、機能構
造(C4)は第13図に示す機能構造(C5)に変形さ
れる。
The functional structure (C4) satisfies the constraints (C4) (C5) (C6). In order to satisfy the 6th order constraint (C7), the functional structure (C4) is transformed into the functional structure (C5) shown in Figure 13. be done.

(a4)と(a5)の相違は(a5)においては5ub
j機能が存在し、その値はtopic機能と一致してい
ることである。そのため機能構造(a5)では5ubj
機能についての制約(CO)〜(C3)も満たされなけ
ればならない。特に(C3)について検査を行なうと、
5ubj機能の意味属性素性は「人間」であり、これは
親の機能構造における下位範躊化素性中の5ubjの後
に記述されている意味属性と一致している。すなわち(
C3)は満たされているのでペナルティはOである。他
の制約についても同様であり、結果として機能構造(a
5)のペナルティはOとなる。一方機能構造(a4)で
は制約(C3)が満たされないためペナルティは20と
なる。
The difference between (a4) and (a5) is 5ub in (a5)
j function exists and its value matches the topic function. Therefore, in the functional structure (a5), 5ubj
Functional constraints (CO) to (C3) must also be satisfied. Especially when examining (C3),
The semantic attribute feature of the 5ubj function is "human," which matches the semantic attribute described after 5ubj in the lower categorization features in the parent functional structure. That is, (
Since C3) is satisfied, the penalty is O. The same holds true for other constraints, resulting in a functional structure (a
The penalty for 5) is O. On the other hand, in the functional structure (a4), the penalty is 20 because the constraint (C3) is not satisfied.

最後に第3図で残された5tep 11〜5tep 1
4について説明する。
Finally, the remaining 5 steps in Figure 3 11 to 5 steps 1
4 will be explained.

畦吐よ1;以上説明した処理によりNSSに新しい解析
状態がリストされるがその値が空でない場合は5tep
 14でNSSの値を解析状態のリストSSに代入して
次の形態素の処理を行なう。
A new analysis state is listed in NSS by the process explained above, but if the value is not empty, take 5 steps
At step 14, the value of NSS is substituted into the analysis state list SS to process the next morpheme.

部組り上」工;空である場合は、各解析状態の機能構造
について計算されたペナルティがTHより太きく5te
p3QでSLにリストされたためであるので、でTHの
値を再計算し、より具体的にはすこし大きい値に変更す
る。この処理は予めTHの初効値と一回5tep12を
通るたびに変更されるべき値を定めておくことにより実
現できる。
If it is empty, the penalty calculated for the functional structure of each analysis state is 5te thicker than TH.
This is because it was listed in SL in p3Q, so the value of TH is recalculated, and more specifically, it is changed to a slightly larger value. This process can be realized by predetermining the initial value of TH and the value to be changed each time 5 tep 12 is passed.

5telL旦;新しいTHが定められると、SLと新し
いTHについてアラエイフ処理を行なう。
5telL: When a new TH is determined, an emergency process is performed for the SL and the new TH.

扛牝上土;結果はNSSに入っているのでSSにNSS
を代入して次の形態素の処理を行なう。
扛扝上田; The result is in NSS, so it is NSS in SS.
Substitute , and process the next morpheme.

アラエイフ処理について第8図を用いて詳細に説明する
The last-minute processing will be explained in detail using FIG. 8.

畦呼±よ;SL中の解析状態について処理を行なうので
、SLが空になれば終了する。
Since the analysis state in the SL is processed, the process ends when the SL becomes empty.

Σmλ、;SLをポツプしてLに代入する。SL中の解
析状態りについて5tep43から5tep46の処理
を行なう。
Σmλ,; Pop SL and assign it to L. Processing from step 543 to step 546 is performed regarding the analysis state during SL.

扛呼土菱;既に述べたペナルティの計算処理に基づきL
のペナルティを計算し、結果はPに代入する。
Based on the penalty calculation process already mentioned, L
Calculate the penalty for P and assign the result to P.

1週り主1−; PがTHより大きければ何もしないが
、THより小さい場合は眠らされていた解析状態りを起
こす。この処理は眠ってしまった時点から現在の形態素
までの形態素と解析状態りについて処理することである
ので第3図5tep 3〜5tep 7までのループを
回すことと同様である。ただしSSは初期値としてLだ
けからなるリストである。
1 week main 1-: If P is larger than TH, nothing is done, but if it is smaller than TH, the analysis state that was put to sleep is awakened. This process is to process the morphemes and analysis states from the time when the user fell asleep to the current morpheme, so it is similar to running the loop from step 3 to step 5 in FIG. 3. However, SS is a list consisting only of L as an initial value.

麩肚土旦;前記5tep45の処理の結果はPSに入っ
ているとすると、NSSとPSを連結してNSSに代入
する。この結果NSSはSLにリストされていた解析状
態の中で、ペナルティの閾値をTHに変更したことによ
り「起こされ」た解析状態について現在の形態素まで処
理した解析状態がリストされることになる。
If the result of the process in Step 45 is included in PS, NSS and PS are concatenated and assigned to NSS. As a result, in the NSS, among the analysis states listed in SL, the analysis states that have been "awoke" by changing the penalty threshold to TH and have been processed up to the current morpheme are listed.

アラエイフ処理により一旦ペナルティが閾値THを超え
たことにより以後の解析から外された解析状態も、ほか
に可能な解がない場合は再び解析の対象となることが保
証される。したがって解析状態数を抑えて空間的、時間
的爆発を防止しながら同時に例外的、比喰的な表現につ
いても扱えるようになっている。
It is guaranteed that an analysis state that is once excluded from subsequent analysis due to the penalty exceeding the threshold TH through the last-life processing will be subject to analysis again if there is no other possible solution. Therefore, it is possible to suppress the number of analysis states and prevent spatial and temporal explosions, while at the same time being able to handle exceptional and comparative expressions.

効   米− 以上の説明から明らかなように、本発明によると、文法
的性質を制約として表現し、かつ各々の制約に制約の持
つ文法的強さに関する情報をペナルティとして付加し、
この情報を用いて解析状態のペナルティを計算すること
により解析のあいまいさを除去する。このペナルティの
値の大小が文法的性質のレベルであり、従来技術では得
られなかった精密な文法記述、解析を可能にする。
Efficacy - As is clear from the above explanation, according to the present invention, grammatical properties are expressed as constraints, and information regarding the grammatical strength of the constraint is added as a penalty to each constraint,
This information is used to remove ambiguity in the analysis by calculating the penalty for the analysis state. The magnitude of this penalty value is the level of grammatical properties, and enables precise grammatical description and analysis that could not be achieved with conventional techniques.

また本発明では、従来技術で区別されていた構文解析、
意味解析といった処理のモジュール化をせずに、いずれ
も同じ制約として表現し、従来技術でいう「構文解析」
はペナルティの大きい制約として、また「意味解析」は
ペナルティの小さい制約として統一的に扱い、また解析
処理の途中においていくつかの制約を満たさないために
ペナルティが大きくなり解でないとみなせる解析状態に
ついては以後の解析処理から一時的に外すことにより、
空間的1時間的爆発を防止する。
In addition, in the present invention, syntactic analysis, which was distinguished in the prior art,
Instead of modularizing processing such as semantic analysis, all constraints are expressed as the same constraint, which is called "syntax analysis" in conventional technology.
is uniformly treated as a constraint with a large penalty, and ``semantic analysis'' is treated as a constraint with a small penalty.Also, for analysis states that have a large penalty due to not satisfying some constraints during the analysis process and can be considered not to be a solution, By temporarily removing it from further analysis processing,
Prevent spatial and temporal explosions.

また、解析のあいまいさを十分に除去でき、−方で例外
的比喰的表現についても解析を可能とし、また空間的、
時間的爆発の生じない、したがってアプリケーションに
幅の広い自然言語文解析装置を構成できる。
In addition, it is possible to sufficiently remove ambiguity in the analysis, and it is possible to analyze even exceptionally comparative expressions, and it is also possible to analyze spatially,
It is possible to configure a natural language sentence analysis device that does not cause time explosion and has a wide range of applications.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明による自然言語文解析装置の一実施例
を説明するための構成図、第2図は、辞書、構文規則、
制約を示す図、第3図は、本発明による自然言語文解析
装置の制御装置のフローチャート、第4図は、第3図に
おけるシフトリデュース処理のフローチャート、第5図
は、リデュース処理のフローチャート、第6図は、ペナ
ルティ計算のフローチャート、第7図は、部分ペナルテ
ィ計算のフローチャート、第8図は、アラエイフ処理の
フローチャート、第9図は、リデュースの例を示す図、
第10図は、構文解析木を示す図、第11図は、機能構
造を示す図、第12図は、シフトリデュースの履歴を示
す図、第13図は、他の機能構造を示す図である。 1・・・制御装置、2・・・入力装置、3・・・出力装
置、4・構文規則部、5・・・制約部、6・・・辞書部
。 特許出願人  株式会社 リ コ 第1図 第2図 (a)  辞書り 第6図 (b)  #1.tltllllR (c)  制約C 第 図 第 図 第 図 第 図 第 図 第 図 第 図 第 図
FIG. 1 is a block diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention, and FIG. 2 shows a dictionary, syntax rules,
3 is a flowchart of the control device of the natural language sentence analysis device according to the present invention; FIG. 4 is a flowchart of the shift-reduce processing in FIG. 3; and FIG. 5 is a flowchart of the reduce processing. 6 is a flowchart of penalty calculation, FIG. 7 is a flowchart of partial penalty calculation, FIG. 8 is a flowchart of last-minute processing, and FIG. 9 is a diagram showing an example of reduce.
FIG. 10 is a diagram showing a parse tree, FIG. 11 is a diagram showing a functional structure, FIG. 12 is a diagram showing a shift-reduce history, and FIG. 13 is a diagram showing other functional structures. . DESCRIPTION OF SYMBOLS 1... Control device, 2... Input device, 3... Output device, 4... Syntax rule part, 5... Constraint part, 6... Dictionary part. Patent applicant Rico Co., Ltd. Figure 1 Figure 2 (a) Dictionary Figure 6 (b) #1. tltllllR (c) Constraint C

Claims (1)

【特許請求の範囲】[Claims] 1、自然言語文を入力する入力装置と、該入力装置から
の入力文を辞書部を用いて形態素分割し、該形態素分割
されたものに対して、構文規則部の内容を用いて複数の
構成素構造を作成し、該構成素構造の各々から機能構造
を作成し、該機能構造を作成するに際しては、制約部か
らの制約と前記辞書部を用いて制約の適用を行う制御装
置と、該制御装置による解析結果を出力する出力装置と
から成り、前記機能構造の作成時に該機能構造の不適合
性を計算することを特徴とする自然言語文解析装置。
1. An input device that inputs a natural language sentence, and a dictionary unit that divides the input sentence from the input device into morphemes, and divides the morpheme division into multiple configurations using the contents of the syntax rule unit. a control device that creates an elementary structure, creates a functional structure from each of the component structures, and applies the constraints using the constraints from the constraint section and the dictionary section; 1. A natural language sentence analysis device comprising: an output device for outputting an analysis result by a control device, and calculating incompatibility of the functional structure when the functional structure is created.
JP2117156A 1990-05-07 1990-05-07 Analyzing device for natural language sentence Pending JPH0414175A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2117156A JPH0414175A (en) 1990-05-07 1990-05-07 Analyzing device for natural language sentence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2117156A JPH0414175A (en) 1990-05-07 1990-05-07 Analyzing device for natural language sentence

Publications (1)

Publication Number Publication Date
JPH0414175A true JPH0414175A (en) 1992-01-20

Family

ID=14704844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2117156A Pending JPH0414175A (en) 1990-05-07 1990-05-07 Analyzing device for natural language sentence

Country Status (1)

Country Link
JP (1) JPH0414175A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039034A1 (en) * 1999-11-17 2001-05-31 United Nations System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded
WO2001039035A1 (en) * 1999-11-17 2001-05-31 United Nations Language translation system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039034A1 (en) * 1999-11-17 2001-05-31 United Nations System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded
WO2001039035A1 (en) * 1999-11-17 2001-05-31 United Nations Language translation system
US6704700B1 (en) 1999-11-17 2004-03-09 United Nations System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded
US7107206B1 (en) 1999-11-17 2006-09-12 United Nations Language conversion system
JP2009238255A (en) * 1999-11-17 2009-10-15 United Nations System for creating expression by universal language and recorded medium on which translation rule used for the system is recorded

Similar Documents

Publication Publication Date Title
Oflazer Error-tolerant finite state recognition with applications to morphological analysis and spelling correction
Wang A robust parser for spoken language understanding.
EP2950306A1 (en) A method and system for building a language model
Kempe et al. Parallel replacement in finite state calculus
US20020152246A1 (en) Method for predicting the readings of japanese ideographs
Srihari et al. Incorporating syntactic constraints in recognizing handwritten sentences
Hayes-Roth et al. An Automatically Compilable Recognition Network For Structured Patterns.
Vasiu et al. Enhancing tokenization by embedding romanian language specific morphology
Klovstad et al. The CASPERS linguistic analysis system
JPH0414175A (en) Analyzing device for natural language sentence
KR20210059540A (en) Device and method for correcting Korean spelling
Osborne et al. Learning unification-based grammars using the Spoken English Corpus
JP2002123281A (en) Speech synthesizer
JPH03296860A (en) Device for analyzing natural language sentence
Willson Preservation of prefixed preterite forms in Biblical Hebrew
JP3995186B2 (en) Parser
Rojc et al. A multilingual text processing engine for the papageno text-to-speech synthesis system
JPH01255957A (en) 'kanji' converter
JP3339006B2 (en) Parallel Noun Phrase Processor in Machine Translation Equipment
Garay-Vitoria et al. Evaluation of prediction methods applied to an inflected language
JPS63175971A (en) Natural language processing system
JP2560224B2 (en) Contextual structure analyzer
Mariño Acebal et al. Demisyllable based Spanish Number Recognition Experiments
Fraj et al. Modeling the Data of an Arabic Treebank as Patterns of Syntactic Trees
Kempe et al. The Parallel Replacement Operation in Finite State Calculus