JP3197110B2 - Natural language analyzer and machine translator - Google Patents

Natural language analyzer and machine translator

Info

Publication number
JP3197110B2
JP3197110B2 JP11945593A JP11945593A JP3197110B2 JP 3197110 B2 JP3197110 B2 JP 3197110B2 JP 11945593 A JP11945593 A JP 11945593A JP 11945593 A JP11945593 A JP 11945593A JP 3197110 B2 JP3197110 B2 JP 3197110B2
Authority
JP
Japan
Prior art keywords
dependency
unit
natural language
symbol
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP11945593A
Other languages
Japanese (ja)
Other versions
JPH06332938A (en
Inventor
信治 徳永
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11945593A priority Critical patent/JP3197110B2/en
Publication of JPH06332938A publication Critical patent/JPH06332938A/en
Application granted granted Critical
Publication of JP3197110B2 publication Critical patent/JP3197110B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、文章理解装置等の自
然言語の解析を必要とする装置に用いられる自然言語解
析装置およびこの自然言語解析装置が搭載された機械翻
訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language analyzer used for a device that requires analysis of a natural language, such as a sentence comprehension device, and a machine translator equipped with the natural language analyzer.

【0002】[0002]

【従来の技術】従来、機械翻訳装置等の自然言語を解析
する必要がある装置においては、自然言語が有する係り
受けの曖昧性に対して次のような方法によって対処して
いる。
2. Description of the Related Art Conventionally, in a device such as a machine translation device which needs to analyze a natural language, the following method is used to deal with the ambiguity of the dependency of a natural language.

【0003】1.構文解析の結果得られた複数の構文構
造候補に対して意味情報を用いた意味解析を実施し、意
味解析の結果に基づいて複数の構文構造候補の中から最
も確からしい構文構造候補を選択して入力文の構文構造
とする。 2.装置の次候補表示機能を用いて構文解析の結果得ら
れた複数の構文構造候補を確からしさの順に表示し、オ
ペレータは一つの構文構造候補をマニュアル選択する。 3.装置が解釈した係り受け関係を表示し、オペレータ
によって変更/選択された係り受け関係を用いて構文解
析を実施して入力文の構文構造を得る。 4.オペレータによって装置の前処理機能を用いて予め
係り受けが指示され、この指示を理解して構文解析を実
施して入力文の構文構造を得る。
[0003] 1. Performs semantic analysis using semantic information on multiple syntactic structure candidates obtained as a result of syntactic analysis, and selects the most probable syntactic structure candidate from among the multiple syntactic structure candidates based on the semantic analysis result. To be the syntax structure of the input sentence. 2. A plurality of syntax structure candidates obtained as a result of the syntax analysis are displayed in order of likelihood using the next candidate display function of the apparatus, and the operator manually selects one syntax structure candidate. 3. The dependency relationship interpreted by the device is displayed, and a syntax analysis is performed using the dependency relationship changed / selected by the operator to obtain a syntax structure of the input sentence. 4. The operator is instructed in advance by using the pre-processing function of the apparatus, and understands the instruction and performs syntax analysis to obtain the syntax structure of the input sentence.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記従
来の係り受けの曖昧性に対する対処方法には次のような
問題がある。すなわち、意味解析の結果に基づいて最も
確からしい構文構造を選択する対処方法の場合には、一
般常識等の知識や文脈を用いた意味解析でなければ係り
受けには曖昧性が残り、しかも知識や文脈を用いた意味
解析によって係り受けの曖昧性を除去する方法は未だ実
用段階には達していない。
However, the conventional method for dealing with the ambiguity of dependency has the following problems. In other words, in the case of a coping method that selects the most probable syntactic structure based on the result of semantic analysis, ambiguity remains in the dependency unless knowledge such as general common sense or semantic analysis using context is used. The method of removing dependency ambiguity by semantic analysis using context and context has not yet reached the practical stage.

【0005】また、次候補表示機能を用いて構文構造候
補を表示する対処方法や、装置が解釈した係り受け関係
を表示する対処方法や、前処理機能を用いて予め係り受
けを指示する対処方法の場合には、装置とインタラクテ
ィブに作業が実施されるために大量処理の場合には非常
に効率が落ちる。
Further, a coping method for displaying a syntax structure candidate using the next candidate display function, a coping method for displaying a dependency relationship interpreted by the apparatus, and a coping method for instructing a pre-modification using a preprocessing function In the case of (1), the work is performed interactively with the apparatus, so that the efficiency is extremely reduced in the case of a large amount of processing.

【0006】そこで、この発明の目的は、自然言語によ
る入力文に対して正しい係り受け解析を実施でき、且つ
大量の入力文を処理可能な自然言語解析装置、および、
その自然言語解析装置を搭載した機械翻訳装置を提供す
ることにある。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a natural language analysis device capable of performing correct dependency analysis on an input sentence in a natural language and capable of processing a large number of input sentences.
It is an object of the present invention to provide a machine translation device equipped with the natural language analysis device.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するため
に、請求項1に係る発明は、入力部から入力された自然
言語による入力文の形態素解析を形態素解析部によって
行い、形態素解析結果に基づいて構文解析部によって入
力文の構文を解析する自然言語解析装置において、上記
形態素解析部による形態素解析に先立って、入力文中に
おける係り受け関係にある文節に付加されて係り受け関
係にあることを表している係り受け記号を検出する係り
受け記号検出部と、上記係り受け記号検出部で検出され
た係り受け記号を当該入力文の文字の属性として記憶す
ることによって,当該入力文の係り受けの関係を記憶す
る係り受け記憶部と、上記構文解析部によって得られた
当該入力文の構文解析結果のうち,上記係り受け記憶部
に記憶された係り受けの関係を満たす構文解析結果を当
該入力文の構文構造として出力する係り受け処理部を備
えると共に、上記形態素解析部は、入力文を複数の文節
に分割するに際して上記係り受け記号記憶部に記憶され
た係り受け記号で示される箇所を優先的に分割位置とす
る分割手段を有することを特徴としている。
According to an aspect of the present invention, a morphological analysis of an input sentence in a natural language input from an input unit is performed by a morphological analysis unit, and the morphological analysis result is obtained. In a natural language analysis device that analyzes the syntax of an input sentence based on a syntax analysis unit based on a morphological analysis performed by the morphological analysis unit, it is determined that a sentence that is added to a dependency relationship in the input sentence has a dependency relationship. A dependency symbol detecting unit for detecting the dependency symbol that is being represented, and a dependency symbol detected by the dependency symbol detecting unit being stored as an attribute of the character of the input sentence. A dependency storage unit for storing the relationship; and a dependency storage unit stored in the dependency storage unit among the syntax analysis results of the input sentence obtained by the syntax analysis unit. And a dependency processing unit that outputs a syntax analysis result satisfying the relationship as a syntax structure of the input sentence, and the morphological analysis unit is stored in the dependency symbol storage unit when the input sentence is divided into a plurality of clauses. It is characterized by having a dividing means which preferentially sets a portion indicated by a dependency symbol as a dividing position.

【0008】また、請求項2に係る発明は、請求項1に
係る発明の自然言語解析装置において、上記係り受け記
号検出部は、係り受け関係にある2つの文節の夫々に付
加されて文節の範囲と係り受けの関係にあることとを表
す特定の係り受け記号を検出する検出手段を備えたこと
を特徴としている。
According to a second aspect of the present invention, in the natural language analysis device according to the first aspect of the present invention, the dependency symbol detection unit is added to each of the two phrases having a dependency relationship, and The present invention is characterized in that a detection means is provided for detecting a specific dependency symbol indicating a range and a dependency relationship.

【0009】また、請求項3に係る発明は、請求項1あ
るいは請求項2に係る発明の自然言語解析装置におい
て、上記係り受け記号検出部は、係り受け関係にある2
つの文節の夫々の直後に付加されて係り受け関係にある
ことを表す特定の係り受け記号を検出する検出手段を備
えたことを特徴としている。
According to a third aspect of the present invention, in the natural language analysis device according to the first or second aspect, the dependency symbol detecting section has a dependency relationship.
It is characterized by comprising a detecting means for detecting a specific dependency symbol which is added immediately after each of the two phrases and indicates a dependency relationship.

【0010】また、請求項4に係る発明は、変換部によ
って自然言語による入力文の内部構造をターゲット言語
による内部構造に変換し、この得られたターゲット言語
による内部構造に基づいて生成部によって翻訳文を生成
する機械翻訳装置において、請求項1乃至請求項3の何
れか一つに記載の自然言語解析装置を備えて、上記変換
部および生成部は、上記自然言語解析装置における係り
受け処理部から出力された自然言語による入力文の構文
構造に基づいて、上記入力文の翻訳文を生成することを
特徴としている。
According to a fourth aspect of the present invention, an internal structure of an input sentence in a natural language is converted into an internal structure in a target language by a conversion unit, and is translated by a generation unit based on the obtained internal structure in the target language. A machine translation device for generating a sentence, comprising the natural language analysis device according to any one of claims 1 to 3, wherein the conversion unit and the generation unit are a dependency processing unit in the natural language analysis device. And generating a translated sentence of the input sentence based on the syntax structure of the input sentence in natural language output from the input sentence.

【0011】[0011]

【作用】請求項1に係る発明では、入力部から入力され
た自然言語による入力文を形態素解析部によって形態素
解析するに先立って、係り受け記号検出部によって、入
力文中における係り受け関係にある文節に付加されてい
る係り受け記号が検出される。こうして検出された係り
受け記号が当該入力文の文字の属性として係り受け記憶
部によって記憶されることによって、当該入力文の係り
受けの関係が記憶される。そして、上記形態素解析部に
よる形態素解析の際に分割手段によって入力文を複数の
文節に分割する場合には、上記係り受け記憶部に記憶さ
れた係り受け記号で示される箇所を優先的に分割位置と
して分割される。
According to the first aspect of the present invention, prior to the morphological analysis of the input sentence in the natural language input from the input unit by the morphological analysis unit, the dependency symbol detecting unit detects the phrases having a dependency relationship in the input sentence. Is detected. The dependency symbol thus detected is stored by the dependency storage unit as the attribute of the character of the input sentence, so that the dependency relationship of the input sentence is stored. When the input sentence is divided into a plurality of clauses by the dividing means at the time of the morphological analysis by the morphological analysis unit, the portion indicated by the dependency symbol stored in the dependency storage unit is preferentially divided into the division positions. Is divided as

【0012】こうして分割された文節に基づく上記形態
素解析部による形態素解析結果に基づいて、構文解析部
によって入力文の構文が解析される。そして、係り受け
処理部によって、上記構文解析部からの構文解析結果の
うち上記係り受け記憶部に記憶された係り受けの関係を
満たす構文解析結果が当該入力文の構文構造として出力
される。
The syntax of the input sentence is analyzed by the syntax analysis unit based on the result of the morphological analysis by the morphological analysis unit based on the phrase thus divided. Then, the dependency processing unit outputs a syntax analysis result satisfying the dependency relationship stored in the dependency storage unit among the syntax analysis results from the syntax analysis unit as the syntax structure of the input sentence.

【0013】こうして、予めオペレータによって上記係
り受け記号で示された箇所が反映されて入力文が文節に
分割され、オペレータによって指示された係り受け関係
を満たす構文構造が得られるのである。
In this way, the input sentence is divided into phrases reflecting the portion indicated by the dependency symbol by the operator in advance, and a syntax structure that satisfies the dependency relationship designated by the operator is obtained.

【0014】また、請求項2に係る発明では、形態素解
析するに先立って、上記係り受け記号検出部の検出手段
によって、入力文における係り受け関係にある2つの文
節の夫々に付加されて文節の範囲と係り受けの関係にあ
ることとを表している特定の係り受け記号が検出され
る。こうして、オペレータによって適確に指示された入
力文における係り受け関係にある文節に従って、オペレ
ータの意図する係り受け関係を最もよく反映している構
文構造が得られる。
Further, in the invention according to claim 2, prior to performing the morphological analysis, the detecting means of the dependency symbol detecting unit adds each of the two clauses having a dependency relationship to each other in the input sentence to form the phrase. A particular dependency symbol is detected that indicates a range and dependency relationship. In this way, a syntax structure that best reflects the dependency relationship intended by the operator can be obtained according to the clauses in the dependency relationship in the input sentence that is properly instructed by the operator.

【0015】また、請求項3に係る発明では、形態素解
析するに先立って、上記係り受け記号検出部の検出手段
によって、入力文における係り受け関係にある2つの文
節の夫々の直後に付加されて係り受けの関係にあること
を表している特定の係り受け記号が検出される。こうし
て、オペレータによって指示された入力文における係り
受け関係にある箇所の終了位置に従って、オペレータの
意図する係り受け関係を最もよく反映している構文構造
が得られる。
Further, in the invention according to claim 3, before the morphological analysis, the detecting means of the dependency symbol detecting unit adds the two clauses in the input sentence immediately after each of the two clauses having a dependency relationship. A particular dependency symbol indicating a dependency relationship is detected. In this way, a syntax structure that best reflects the dependency relationship intended by the operator is obtained according to the end position of the dependency relationship portion in the input sentence specified by the operator.

【0016】また、請求項4に係る発明では、上記自然
言語解析装置の入力部に自然言語による入力文が入力さ
れると係り受け処理部から当該入力文の構文構造が出力
される。そうすると、この出力された当該入力文の構文
構造に基づいて、変換部によって、当該入力文の内部構
造がターゲット言語による内部構造に変換される。さら
に、この得られたターゲット言語による内部構造に基づ
いて、生成部によって翻訳文が生成される。こうして、
オペレータによって指示された入力文における係り受け
関係を理解して翻訳処理が実施されるのである。
Further, in the invention according to claim 4, when an input sentence in a natural language is input to the input unit of the natural language analysis device, the dependency processing unit outputs a syntax structure of the input sentence. Then, based on the syntax structure of the output input sentence, the conversion unit converts the internal structure of the input sentence into an internal structure in the target language. Furthermore, a translation is generated by the generation unit based on the obtained internal structure in the target language. Thus,
The translation process is performed by understanding the dependency relationship in the input sentence specified by the operator.

【0017】[0017]

【実施例】以下、この発明を図示の実施例により詳細に
説明する。尚、本実施例においては、この発明の自然言
語解析装置を機械翻訳装置に搭載した場合を例に説明す
る。図1は本実施例の自然言語解析装置が搭載された機
械翻訳装置の構成の一例を示す図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the illustrated embodiments. In this embodiment, a case where the natural language analysis device of the present invention is mounted on a machine translation device will be described as an example. FIG. 1 is a diagram showing an example of the configuration of a machine translation device equipped with the natural language analysis device of the present embodiment.

【0018】図1において、1はCPU(中央演算処理
装置)、2はメインメモリ、3はCRT(カソード・レイ・
チューブ)、4はキーボード、5は翻訳モジュール、6
は翻訳用の辞書,文法規則,木構造変換規則等が格納され
た外部記憶部、7はデータバスである。尚、翻訳モジュ
ール5は後に詳述するように与えられたソース言語をタ
ーゲット言語に翻訳する。また、キーボード4には、機
械翻訳装置を駆動するためのスタートキー,テンキー,文
字キーおよびその他翻訳を実行するためのキーが設けら
れている。
In FIG. 1, 1 is a CPU (Central Processing Unit), 2 is a main memory, and 3 is a CRT (Cathode Ray Device).
Tube), 4 for keyboard, 5 for translation module, 6
Is an external storage unit storing a dictionary for translation, grammar rules, tree structure conversion rules, etc., and 7 is a data bus. The translation module 5 translates a given source language into a target language as described in detail later. The keyboard 4 is provided with a start key for driving the machine translation device, a numeric keypad, a character key, and other keys for executing translation.

【0019】上記CPU1の制御に基づいて、キーボー
ド4から入力されたソース言語による入力文は翻訳モジ
ュール5に送出され、外部記憶部6に格納された辞書や
文法規則や木構造変換規則等を用いてターゲット言語に
変換される。こうして得られた翻訳文はメインメモリ2
に格納されると共に、CRT3に表示される。
Under the control of the CPU 1, the input sentence in the source language input from the keyboard 4 is sent to the translation module 5 and uses the dictionary, grammar rules, tree structure conversion rules and the like stored in the external storage unit 6. To the target language. The translation thus obtained is stored in the main memory 2
And displayed on the CRT 3.

【0020】図2は、上記翻訳モジュール5の構成の一
例を示すブロック図である。上述のようにして入力され
たソース言語による入力文は辞書引き形態素解析部8に
よる形態素解析処理によってソース言語の形態素に分割
されて品詞等の情報が得られる。構文解析部9は、外部
記憶部6に格納された文法規則を用いて辞書引き形態素
解析部8からの形態素解析結果に基づいて入力文の構文
を解析して構文解析結果を得る。そうすると、係り受け
処理部10は、構文解析部9によって得られた構文解析
結果に対して、後に詳述するような係り受け処理を実施
して入力文の構文構造を特定する。変換部11は、外部
記憶部6に格納された木構造変換規則を用いて、ソース
言語の構文構造をターゲット言語による構文構造に変換
する。そして、生成部12によって、上述のようにして
得られたターゲット言語の構文構造からターゲット言語
の文を生成する。
FIG. 2 is a block diagram showing an example of the configuration of the translation module 5. The input sentence in the source language input as described above is divided into morphemes in the source language by morphological analysis processing by the lexical analysis unit 8 to obtain information such as part of speech. The syntax analysis unit 9 analyzes the syntax of the input sentence based on the morphological analysis result from the dictionary lookup morphological analysis unit 8 using the grammar rules stored in the external storage unit 6 to obtain a syntax analysis result. Then, the dependency processing unit 10 performs a dependency process, which will be described in detail later, on the syntax analysis result obtained by the syntax analysis unit 9 to specify the syntax structure of the input sentence. The conversion unit 11 uses the tree structure conversion rules stored in the external storage unit 6 to convert the syntax structure of the source language into the syntax structure of the target language. Then, the generation unit 12 generates a sentence of the target language from the syntax structure of the target language obtained as described above.

【0021】すなわち、本実施例においては、上記入力
部をキーボード4で構成し、上記記憶部を外部記憶部6
で構成する。そして、上記入力部,記憶部,辞書引き形態
素解析部8,構文解析部9,係り受け処理部10およびC
PU1で上記自然言語解析装置を構成するのである。
That is, in the present embodiment, the input unit is constituted by the keyboard 4, and the storage unit is replaced by the external storage unit 6.
It consists of. Then, the input unit, storage unit, dictionary lookup morphological analysis unit 8, syntax analysis unit 9, dependency processing unit 10, and C
PU1 constitutes the natural language analysis device.

【0022】ところで、日本文「 私は双眼鏡で走っている生徒を見た。」「 私は運動場で走っている生徒を見た。」 では、「双眼鏡で」や「運動場で」が「走っている」に係るの
か「見た」に係るのかは構文解析部9では判定できず、構
文に曖昧性を有している。そこで、本実施例において
は、記号“*"及び“*#"をエスケープ文字とし、この
エスケープ文字で表記される係り受け記号を設定する。
そして、以下に例示するように、入力文における互いに
係り受け関係にある2つの文節の夫々の前に係り受け記
号“*”を付加する一方、後ろには係り受け記号“*
#"を付加するのである。尚、係り受け記号“*"の直後
に付加された番号は係り受け関係にある文節同士である
ことを表し、同じ番号が付加された文節同士は係り受け
関係にある。
By the way, in the Japanese sentence "I saw a student running with binoculars.""I saw a student running on the playground." The syntax analysis unit 9 cannot determine whether the word belongs to “is” or “seen”, and the syntax has ambiguity. Therefore, in the present embodiment, the symbols “*” and “* #” are used as escape characters, and a dependency symbol represented by the escape characters is set.
Then, as exemplified below, a dependency symbol “*” is added before each of two clauses having a dependency relationship in the input sentence, while a dependency symbol “*” is added after the two clauses.
The number added immediately after the dependency symbol "*" indicates that the phrases are in a dependency relationship, and the phrases with the same number are in a dependency relationship. is there.

【0023】したがって、次のように係り受け記号が付
加され場合には、 (イ) 「私は *1双眼鏡で*# 走っている 生徒を
1見た*#。」 (ロ) 「私は *1運動場で*# *1走っている*#
徒を 見た。」 例文(イ)では、係り受け記号“*1"と“*#"とに挟ま
れた文節「双眼鏡で」と文節「見た」とが係り受け関係にあ
り、文節「双眼鏡で」が文節「見た」に係ること意味する。
同様に、例文(ロ)では、係り受け記号“*1"と“*#"
とに挟まれた文節「運動場で」と文節「走っている」とが係
り受け関係にあり、文節「運動場で」が文節「走っている」
に係ること意味する。
Therefore, when a dependency symbol is added as follows, (a) "I am a student running * 1 with * 1 binoculars .
I saw 1 * # . (B) "I saw the ** student running ** on the * 1 playground ." In the example sentence (a), the phrase between the dependency symbols "* 1" and "* #" The phrase “with binoculars” and the phrase “saw” are in a dependency relationship, meaning that the phrase “with binoculars” relates to the phrase “saw”.
Similarly, in the example sentence (b), the dependency symbols “* 1” and “* #”
The phrase "at the playground" and the phrase "running" are in a dependency relationship, and the phrase "at the playground" is phrase "running".
Means that

【0024】また、例文(ハ) (ハ) 「*1昨日*# *2運動場で*# *2走ってい
る*#生徒を *1見た*#。」 の場合には、係り受け記号“*1"と“*#"とに挟まれ
ている文節「昨日」と文節「見た」とが係り受け関係にあ
り、係り受け記号“*2"と“*#"とに挟まれた文節
「運動場で」と文節「走っている」とが係り受け関係にあ
る。そして、文節「昨日」が文節「見た」に係り、文節「運
動場で」が文節「走っている」に係ること意味するのであ
る。
[0024] In addition, the sentence (c) (c) "* 1 yesterday * # * 2 in the playground * # * 2 not running
* # I saw the student * 1 * # . In the case of "", the phrase "Yesterday" and the phrase "Mita" sandwiched between the dependency symbols "* 1" and "* #" have a dependency relationship, and the dependency symbol "* 2" The phrase “at the playground” sandwiched between “* #” and the phrase “running” have a dependency relationship. The phrase “yesterday” relates to the phrase “saw”, and the phrase “at the playground” relates to the phrase “running”.

【0025】上記係り受け記号は、本自然言語解析装置
における辞書引き形態素解析部8で形態素解析処理を実
施する前に翻訳対象文中にマニュアル挿入される。した
がって、翻訳対象文に係り受け記号を付加する際には、
オペレータは当該自然言語解析システムにおける“文
節"の定義を把握しておく必要がある。
The dependency symbol is manually inserted into the translation target sentence before the morphological analysis is performed by the dictionary lookup morphological analyzer 8 in the natural language analyzer. Therefore, when adding a dependency symbol to the translation target sentence,
The operator needs to know the definition of “phrase” in the natural language analysis system.

【0026】品詞の分け方や文節の定義付けには種々の
説があり、さらに、自然言語の解析処理を必要とする各
装置では、個々に都合のよいように品詞や文節の設定方
法を定義付けている。そこで、上述のように係り受け記
号を用いて係り受け関係を指示する際には、オペレータ
は当該自然言語解析システムにおける品詞や文節の定義
を理解しておかないと適確な位置に係り受け記号を付加
できないのである。
There are various theories on how to classify parts of speech and how to define phrases. Further, in each device that requires natural language analysis processing, the method of setting parts of speech and phrases is defined individually and conveniently. I have. Therefore, when instructing the dependency relationship using the dependency symbol as described above, the operator must understand the definition of the part of speech or phrase in the natural language analysis system, and the dependency symbol must be located at an appropriate position. Cannot be added.

【0027】例えば、次のような例文(ニ)を考える。 (ニ) 「私は双眼鏡を使って走っている生徒を見た。」 その際に、「を使って」を助詞のように扱う自然言語解析
システムの場合には、「双眼鏡を使って」を1文節として
扱い、例文(イ)の場合のように、文節「双眼鏡を使って」
が文節「見た」に係ると係り受け関係を解析する。これに
対して、「双眼鏡を使って」を、文節「双眼鏡を」と文節
「使って」の2文節として扱う自然言語解析システムもあ
る。
For example, consider the following example sentence (d). (D) "I saw a student running with binoculars." At that time, in the case of a natural language analysis system that treats "using" like a particle, "using binoculars" Treat as one phrase, as in the example sentence (a), using the phrase "using binoculars"
Is related to the phrase "I saw" and analyzes the dependency relationship. On the other hand, there is also a natural language analysis system that treats "using binoculars" as two phrases, the phrase "using binoculars" and the phrase "using".

【0028】ところが、オペレータは必ずしも使用する
自然言語解析システムにおける文節の定義を理解してい
るとは限らない。そこで、本実施例においては、そのよ
うなオペレータでも容易に入力文における係り受け関係
にある箇所を指示できるように、次のような係り受け記
号の付加をも可能ならしめるのである。
However, the operator does not always understand the definition of a clause in the natural language analysis system used. Therefore, in the present embodiment, it is possible to add the following dependency symbol so that such an operator can easily designate a portion having a dependency relationship in the input sentence.

【0029】すなわち、上記例文(ニ)の場合には、 (ホ) 「私は双眼鏡を使って*1走っている生徒を見
*1。」 のように、係り受け関係にある箇所の終了位置を係り受
け記号“*"で指示するのである。尚、上述の場合と同
様に、係り受け記号“*"の直後に番号を付加して同じ
番号は係り受け関係にある文節の終位置同士であること
を示す。このようにして係り受け関係を指示することに
よって、オペレータは使用する自然言語解析システムに
おける文節の定義を理解していなくとも、係り記号(前
方に位置する係り受け記号“*1")の直前の「て」で終了
している文節(この文節の範囲は特に問わない)が受け記
号(後方に位置する係り受け記号“*1")の直前の「た」
で終了している文節(この文節の範囲は特に問わない)に
係ることを指示できるのである。以下、前者のような文
節範囲を指定する係り受け記号を付加する処理を“通常
付加処理"と呼び、後者のような文節の終了位置のみを
指定する係り受け記号を付加する処理を“簡易付加処
理"と呼ぶ。
That is, in the case of the above example (d), (e) "I saw a student running with * 1 using binoculars .
* 1 . ", The end position of a part having a dependency relationship is indicated by a dependency symbol" * ". As in the above-described case, a number is added immediately after the dependency symbol "*", and the same number indicates the end positions of the phrases in the dependency relationship. By instructing the dependency relation in this manner, the operator does not understand the definition of the clause in the natural language analysis system to be used, and can immediately determine the dependency symbol (the preceding dependency symbol “* 1”). The phrase ending with "te" (the range of this phrase does not matter in particular) is the "ta" immediately before the receiving symbol (the dependency symbol "* 1" located behind).
Can be indicated for a clause ending with (the range of this clause does not matter). Hereinafter, the process of adding a dependency symbol that specifies a phrase range, such as the former, is called “normal addition processing”, and the process of adding a dependency symbol, which specifies only the end position of a phrase, such as the latter, is called “simple addition”. Processing ".

【0030】尚、本実施例における上記係り受け記号
“*"および“*#"の入力文への付加処理は、本機械翻
訳装置によらなくとも、例えば文書処理装置等の係り受
け記号“*"および“*#"を入力可能な装置によっても
実施できる。また、本実施例における係り受け記号付加
処理は本機械翻訳装置と非インタラクティブに実施でき
る。したがって、本機械翻訳装置による翻訳処理に先立
って、本機械翻訳装置やワードプロセッサ等によって係
り受け記号付加処理を実施しておけば、翻訳処理を効率
良く実施できるのである。
Note that the processing of adding the dependency symbols "*" and "* #" to the input sentence in the present embodiment is not dependent on the machine translation apparatus, but may be performed, for example, on the dependency symbol "*" of a document processing apparatus or the like. "And" * # "can also be implemented by a device capable of inputting. Further, the dependency symbol addition processing in the present embodiment can be performed non-interactively with the machine translation apparatus. Therefore, if the dependency symbol adding process is performed by the machine translation device or the word processor before the translation process by the machine translation device, the translation process can be performed efficiently.

【0031】以下、上記構成の機械翻訳装置によって日
英翻訳を実施する場合を例に、この発明の自然言語解析
装置を用いた機械翻訳装置の処理動作について詳細に説
明する。図3は、上記CPU1の制御の下に実施される
本機械翻訳装置による日英翻訳処理のフローチャートで
ある。以下、図3に従って日英翻訳処理動作について説
明する。
Hereinafter, the processing operation of the machine translation apparatus using the natural language analyzer of the present invention will be described in detail, taking as an example the case where Japanese-English translation is performed by the machine translation apparatus having the above configuration. FIG. 3 is a flowchart of a Japanese-English translation process performed by the machine translation device under the control of the CPU 1. Hereinafter, the Japanese-English translation processing operation will be described with reference to FIG.

【0032】上記係り受け記号が付加された日本語によ
る翻訳対象の文章がキーボード4等から入力されてメイ
ンメモリ2に一旦格納されて、日英翻訳処理動作がスタ
ートする。ステップS1で、上記メインメモリ2に格納
された日本語文章から1文が読み出されて、翻訳モジュ
ール5内の原文バッファ(図示せず)に図4に示すように
格納される。但し、図4(a)は、上記通常付加処理によ
って文節の開始位置と終了位置とを示す係り受け記号の
組“*"−“*#"が付加された入力文の例である。一
方、図(b)は、上記簡易付加処理によって文節の終了位
置のみを示す係り受け記号“*"が付加された入力文の
例である。ステップS2で、上記原文バッファに格納さ
れた1文中に上記係り受け記号が存在するか否かが判断
される。その結果存在すればステップS3に進み、存在
しなければステップS12に進む。
The sentence to be translated in Japanese to which the dependency symbol has been added is input from the keyboard 4 or the like, is temporarily stored in the main memory 2, and the Japanese-English translation processing operation starts. In step S1, one sentence is read from the Japanese sentence stored in the main memory 2 and stored in an original sentence buffer (not shown) in the translation module 5 as shown in FIG. However, FIG. 4A shows an example of an input sentence to which a pair of dependency symbols “*”-“* #” indicating the start position and the end position of a phrase has been added by the normal addition processing. On the other hand, FIG. 6B shows an example of an input sentence to which a dependency symbol “*” indicating only the end position of a phrase has been added by the simple addition process. In step S2, it is determined whether or not the dependency symbol exists in one sentence stored in the original sentence buffer. As a result, if it exists, the process proceeds to step S3, and if not, the process proceeds to step S12.

【0033】ステップS3で、上記1文中に存在する係
り受け記号の種類が、文節の開始位置と終了位置とを示
す係り受け記号の組“*"−“*#"であるか、文節の終
了位置のみを示す係り受け記号“*"であるかが判断さ
れる。そして、判断結果を表すフラグ(図示せず)がセッ
トされる。ここで、上記係り受け記号の種類の判断は、
例えば、次のようにして実施される。すなわち、上記通
常付加処理を実施する第1のモードと上記簡易付加処理
を実施する第2のモードとを設定し、予め上述の係り受
け記号付加処理時に上記第1のモードあるいは第2のモ
ードを表すコードを入力文に付けておく。そして、本ス
テップで上記コードによってモードを判別することによ
って係り受け記号の種類を判断するのである。あるい
は、入力文中における文節の終位置を示す係り受け記号
“*#"の有無によって係り受け記号の種類を判断して
もよい。
At step S3, the type of the dependency symbol present in the one sentence is a pair of dependency symbols "*"-"* #" indicating the start position and the end position of the phrase, or the end of the phrase. It is determined whether it is a dependency symbol “*” indicating only the position. Then, a flag (not shown) indicating the determination result is set. Here, the type of the dependency symbol is determined by:
For example, it is performed as follows. That is, a first mode in which the normal addition processing is performed and a second mode in which the simple addition processing is performed are set, and the first mode or the second mode is previously set at the time of the dependency symbol addition processing. A code to represent is attached to the input sentence. In this step, the type of the dependency symbol is determined by determining the mode based on the code. Alternatively, the type of the dependency symbol may be determined based on the presence or absence of the dependency symbol “* #” indicating the end position of the phrase in the input sentence.

【0034】ステップS4で、入力文中に混在している
係り受け記号が入力文から取り出され、図5に示すよう
に、バッファにおける当該係り受け記号が付加されてい
る文字の位置にその文字の属性として当該係り受け記号
の一部がセットされる。その際に、上記ステップS3に
おいてセットされたフラグの内容に応じて、係り受け記
号の組“*"−“*#"が付加された入力文の場合には図
5(a)に示すようにセットされる。一方、終了位置のみ
を示す係り受け記号“*"が付加された入力文の場合に
は図5(b)に示すようにセットされる。
In step S4, the dependency symbol mixed in the input sentence is extracted from the input sentence, and as shown in FIG. 5, the attribute of the character is added to the position of the character to which the dependency symbol is added in the buffer. Is set as a part of the dependency symbol. At this time, in the case of an input sentence to which a pair of dependency symbols “*”-“* #” is added according to the contents of the flag set in step S3, as shown in FIG. Set. On the other hand, in the case of an input sentence to which a dependency symbol “*” indicating only the end position is added, the input sentence is set as shown in FIG.

【0035】ステップS5で、以下のようにして入力文
に対して形態素解析処理が実行される。すなわち、先ず
前処理として、図5に示すようにバッファに格納されて
いる入力文の文字列に対して、係り受け記号で示される
箇所に区切りが入れられる。その際に、図5(a)に示す
ような係り受け記号の組“*"−“*#"が付加された入
力文の場合には、係り受け記号の“番号"によって指示
される文節開始位置と記号“#"によって指示される文
節終了位置とで区切る。その結果を図6[1](a)に示
す。尚、以後の処理では文節終了位置の情報は必要とは
しないので、終了位置を示す記号“#"は消去される。
一方、図5(b)に示すような文節の終了位置のみを示す
係り受け記号“*"が付加された入力文の場合には、係
り受け記号の“番号"によって指示される文節終了位置
で区切る。その結果を図6[1](b)に示す。
In step S5, a morphological analysis process is performed on the input sentence as follows. That is, first, as a pre-process, as shown in FIG. 5, the character string of the input sentence stored in the buffer is delimited at the position indicated by the dependency symbol. At this time, in the case of an input sentence to which a pair of dependency symbols "*"-"* #" is added as shown in FIG. The position is separated from the phrase end position indicated by the symbol "#". The results are shown in FIG. 6 [1] (a). In the following processing, since the information on the phrase end position is not required, the symbol "#" indicating the end position is deleted.
On the other hand, in the case of an input sentence to which a dependency symbol "*" indicating only the end position of a phrase as shown in FIG. 5B is added, the phrase end position indicated by the dependency symbol "number" is used. punctuate. The result is shown in FIG. 6 [1] (b).

【0036】こうした前処理が終了すると、辞書引き形
態素解析部8によって外部記憶部6に格納された辞書を
引いて形態素解析処理が実行される。その際に、形態素
に分割する際には次のようにして上記前処理で得られた
区切りの箇所を反映させる。すなわち、上記入力文に対
して、辞書引き形態素解析部8によって従来の形態素解
析を実施して文節候補を得る。その後、得られた総ての
文節候補に対してオペレータによる指示内容が満たされ
ているか否かをチェックするのである。
When such preprocessing is completed, the dictionary lookup morphological analysis unit 8 performs a morphological analysis process by referring to the dictionary stored in the external storage unit 6. At this time, when dividing into morphemes, the location of the break obtained in the preprocessing is reflected as follows. That is, a conventional morphological analysis is performed on the input sentence by the dictionary lookup morphological analysis unit 8 to obtain a phrase candidate. Thereafter, it is checked whether or not the content of the instruction by the operator is satisfied for all the obtained phrase candidates.

【0037】上記チェックは次のように実施する。図4
(a)に示す例文のように、係り受け記号の組“*"−“*
#"が付加されて文節の開始位置および終了位置の両方
が指示された入力文では、その指示された位置間の文字
列「昨日」,「運動場で」,「走っている」,「見た」のうち本自
然言語解析システムの定義によって文節になり得るもの
を優先して文節として採用する。また、図4(b)に示す
例文のように、係り受け記号“*"が付加されて文節の
終了位置のみが指示された入力文では、その指示された
位置である「日」と「運」との間,「で」と「走」との間,「る」と
「生」との間が文節の区切りとなるような本自然言語解析
システムの定義による文節を優先して文節として採用す
る。こうして得られた入力文の文節を図6[2]に示す。
この文節は、図4(a)あるいは図4(b)に示すように、オ
ペレータによって係り受け記号で指示された文節位置に
相反してはいない。
The above check is performed as follows. FIG.
As in the example sentence shown in (a), the set of dependency symbols “*”-“*
In an input sentence where "#" is added to indicate both the start position and end position of a phrase, the character strings "Yesterday", "At the playground", "Running", and " , Those that can become phrases according to the definition of the natural language analysis system are preferentially adopted as phrases. In addition, as in the example sentence shown in FIG. 4B, in an input sentence in which only the end position of a phrase is indicated by adding a dependency symbol “*”, the designated positions “day” and “ , And between "de" and "run", and between "ru" and "raw", which are defined by the natural language analysis system, are used as the clauses. I do. The clause of the input sentence thus obtained is shown in FIG. 6 [2].
As shown in FIG. 4 (a) or FIG. 4 (b), this phrase does not conflict with the phrase position indicated by the dependency symbol by the operator.

【0038】ステップS6で、オペレータによって指示
された文節の範囲あるいは係り受け箇所の終了位置のな
かに、上記ステップS5において得られた文節の区切り
位置に適合しない位置が存在するか否かが判別される。
その結果存在する場合にはステップS7に進み、存在し
ない場合には、ステップS7をスキップする。ステップ
S7で、オペレータによって指示された文節区切り位置
に相反する(つまり、係り受け記号に対応しない)文節が
存在するので、その旨をCRT3に表示して通常の処理
に移行するか、エラー扱いにするか、入力文あるいは係
り受け記号付加箇所の変更を促すかの処理が実施され
る。
In step S6, it is determined whether or not there is a position in the range of the phrase or the end position of the dependency point designated by the operator that does not conform to the break position of the phrase obtained in step S5. You.
As a result, if it exists, the process proceeds to step S7; otherwise, step S7 is skipped. In step S7, since there is a conflicting phrase (that is, not corresponding to the dependency symbol) at the phrase break position specified by the operator, the fact is displayed on the CRT 3 and the processing is shifted to the normal processing, or the error is treated. Or a prompt to change the input sentence or the modification symbol addition location.

【0039】ステップS8で、上記外部記憶部6に格納
された文法規則を用いて構文解析部9によって構文解析
処理が実行される。その結果、得られた複数の構文解析
結果が総て出力される。図7に、上記得られた構文解析
結果としての構文解析木の構造およびその構文解析木に
よる係り受け構造を示す。本実施例の入力文によっては
3通りの係り受け構造が得られる。但し、その場合にお
ける構文解析処理のアルゴリズムは特に限定するもので
はない。尚、図7に示す構文解析木では、係り受け関係
にある文節のうちの係り文節が受け文節の1段下に記さ
れている。
In step S8, the syntax analysis unit 9 executes a syntax analysis process using the grammar rules stored in the external storage unit 6. As a result, all of the plurality of obtained parsing results are output. FIG. 7 shows the structure of a parsing tree as a result of the parsing obtained above and the dependency structure by the parsing tree. Depending on the input sentence of this embodiment, three types of dependency structures can be obtained. However, the algorithm of the syntax analysis processing in that case is not particularly limited. Note that, in the syntax analysis tree shown in FIG. 7, among the clauses having a dependency relationship, the dependency clause is described one row below the receiving clause.

【0040】ステップS9で、上記係り受け処理部10
によって、上記ステップS8において得られた係り受け
構造の候補のなかにオペレータによって指示された係り
受けの構造に適合する係り受け構造が存在するか否か
が、図6[2]の下段に示す係り受け指示情報に基づいて
判別される。その結果存在しない場合にはステップS10
に進み、存在する場合にはステップS10をスキップす
る。ステップS10で、さらに、オペレータによって指示
された係り受け指示情報に相反しない(つまり、係り受
け記号に対応する)係り受け構造が得られないので、そ
の旨をCRT3に表示して通常の処理に移行するか、エ
ラー扱いにするか、入力文あるいは係り受け記号付加箇
所の変更を促すかの処理が実施される。ステップS11
で、さらに、上記係り受け指示情報に適合した係り受け
構造を有する構文解析木が変換部11に送出される。
In step S9, the dependency processing unit 10
Thus, it is determined whether or not there is a modification structure that matches the modification structure specified by the operator among the modification structure candidates obtained in step S8, as shown in the lower part of FIG. 6 [2]. It is determined based on the receiving instruction information. As a result, if it does not exist, step S10
And if it exists, skip step S10. In step S10, since a dependency structure that does not contradict the dependency instruction information specified by the operator (that is, corresponds to the dependency symbol) cannot be obtained, the fact is displayed on the CRT 3 and the process proceeds to normal processing. , An error, or a prompt to change an input sentence or a portion where a dependency symbol is added. Step S11
Then, a parse tree having a dependency structure suitable for the dependency instruction information is sent to the conversion unit 11.

【0041】ステップS12で、上記ステップS2におい
て入力文中に係り受け記号が付加されていないと判定さ
れたので通常処理に移行する。そして、先ず辞書引き形
態素解析部8によって、外部記憶部6に格納された辞書
を用いて形態素解析処理が実行される。ステップS13
で、上記構文解析部9によって、辞書引き形態素解析部
8による形態素解析結果に基づいて、外部記憶部6に格
納された文法規則を用いて構文解析処理が実行される。
そして、得られた構文解析木が変換部11に送出され
る。
In step S12, since it is determined in step S2 that no dependency symbol has been added to the input sentence, the process proceeds to normal processing. Then, first, the morphological analysis processing is performed by the dictionary lookup morphological analysis unit 8 using the dictionary stored in the external storage unit 6. Step S13
Then, the parsing unit 9 executes a parsing process using the grammatical rules stored in the external storage unit 6 based on the result of the morphological analysis performed by the dictionary lookup morphological analyzing unit 8.
Then, the obtained parse tree is sent to the conversion unit 11.

【0042】ステップS14で、上記変換部11によっ
て、外部記憶部6に格納された木構造変換規則を用い
て、係り受け処理部10からの構文解析木あるいは構文
解析部9からの構文解析木がターゲット言語(英語)の内
部構造に変換される。そして、さらに生成部12によっ
て、上記変換されて得られた英語の内部構造に基づいて
英語の文が生成される。尚、その際における上記変換部
11による変換処理および生成部12による生成処理の
アルゴリズムは特に限定されるものではない。
In step S14, the parsing tree from the dependency processing unit 10 or the parsing tree from the parsing unit 9 is converted by the conversion unit 11 using the tree structure conversion rules stored in the external storage unit 6. Converted to the internal structure of the target language (English). Then, the generating unit 12 generates an English sentence based on the converted internal structure of the English language. In this case, the algorithm of the conversion process by the conversion unit 11 and the algorithm of the generation process by the generation unit 12 are not particularly limited.

【0043】ステップS15で、上記ステップS14におい
て生成された入力文に対応する翻訳文がCRT3に表示
されると共に、メインメモリ2のバッファ(図示せず)内
に格納される。ステップS16で、上記メインメモリ2内
に未翻訳処理の次文が在るか否かが判別される。その結
果、在ればステップS1に戻って未翻訳処理の次の1文
が読み込まれて次文の翻訳処理に入る。一方、無ければ
日英翻訳処理動作を終了する。
In step S15, a translated sentence corresponding to the input sentence generated in step S14 is displayed on the CRT 3 and stored in a buffer (not shown) of the main memory 2. In step S16, it is determined whether or not the next sentence of the untranslated process exists in the main memory 2. As a result, if there is, the process returns to step S1 to read the next sentence of the untranslated process and start the translation process of the next sentence. On the other hand, if not, the Japanese-English translation processing operation is terminated.

【0044】このように、本実施例においては、自然言
語解析装置に係り受け処理部10を設けると共に、入力
文における係り受け関係にある文節に文節開始位置を示
す係り受け記号“*"と文節終了位置を示す係り受け記
号“*#"を付加する。あるいは、入力文における係り
受け関係にある箇所の終端に終了位置を示す係り受け記
号“*"を付加する。そして、上記辞書引き形態素解析
部8による形態素解析時には、係り受け記号“*",“*
#"が付加された位置を反映させて入力文を文節に分割
する。したがって、オペレータが所望する係り文節およ
び受け文節を反映して文節に分割できる。さらに、上記
係り受け処理部10によって、構文解析部9による構文
解析処理の結果得られた構文解析木の候補の中からオペ
レータが所望する係り受け関係を満足する構文解析木を
入力文の構文構造として出力する。したがって、入力文
の構文解析に際してオペレータの指示に即して正しく係
り受け解析を実施できるのである。
As described above, in the present embodiment, the dependency processing unit 10 is provided in the natural language analysis device, and the dependency symbol "*" indicating the start position of the phrase and the phrase "*" indicating the phrase start position are added to the phrases in the dependency relationship in the input sentence. A dependency symbol “* #” indicating the end position is added. Alternatively, a dependency symbol “*” indicating the end position is added to the end of a portion having a dependency relationship in the input sentence. When the morphological analysis is performed by the dictionary lookup morphological analysis unit 8, the dependency symbols “*”, “*
The input sentence is divided into phrases by reflecting the position where "#" is added. Therefore, the input sentence can be divided into phrases by reflecting the dependency phrase and the receiving phrase desired by the operator. The parsing tree that satisfies the dependency relation desired by the operator is output as the syntax structure of the input sentence from the parsing tree candidates obtained as a result of the parsing processing by the parsing unit 9. Therefore, the parsing of the input sentence In this case, the dependency analysis can be correctly performed in accordance with the instruction of the operator.

【0045】また、上記入力文に対する係り受け記号
“*",“*#"の付加は、本機械翻訳装置によって又は
別体の文書処理装置等によって非インタラクティブに実
施可能である。したがって、翻訳処理動作を妨害するこ
となく大量の文に付加可能である。すなわち、本実施例
によれば、大量の文書の機械翻訳処理を実施することが
可能である。
The addition of the dependency symbols "*" and "* #" to the input sentence can be carried out non-interactively by the machine translation apparatus or by a separate document processing apparatus or the like. Therefore, it can be added to a large number of sentences without interfering with the translation processing operation. That is, according to the present embodiment, it is possible to execute machine translation processing of a large number of documents.

【0046】上記実施例における日英翻訳処理動作のア
ルゴリズムは、図3に示すフローチャートに限定される
ものではない。また、上記係り受け記号は、記号“*"
および“*#"に限定されるものではない。
The algorithm of the Japanese-English translation processing operation in the above embodiment is not limited to the flowchart shown in FIG. In addition, the dependency symbol is a symbol “*”.
And "* #".

【0047】また、上記実施例においては、この発明の
自然言語解析装置を機械翻訳装置に搭載している。つま
り、上記係り受け処理部10によって特定された構文解
析木を変換部11に入力して英語の内部構造を得、生成
部12で英語による翻訳文を生成するようにしている。
しかしながら、この発明はこれに限定されるものではな
い。すなわち、上記係り受け処理部10からの構文解析
木を他の外部装置に送出するようにすれば、文章理解シ
ステム等の自然言語によってコンピュータへの指示を行
うようなシステムに適用可能である。
In the above embodiment, the natural language analysis device of the present invention is mounted on a machine translation device. That is, the parse tree specified by the dependency processing unit 10 is input to the conversion unit 11 to obtain an internal structure in English, and the generation unit 12 generates an English translation.
However, the present invention is not limited to this. In other words, if the parse tree from the dependency processing unit 10 is sent to another external device, it can be applied to a system such as a text comprehension system that gives instructions to a computer using a natural language.

【0048】[0048]

【発明の効果】以上より明らかなように、請求項1に係
る発明の自然言語解析装置は、形態素解析部の分割手段
によって入力文を複数の文節に分割する際には、係り受
け記号検出部によって検出されて係り受け記憶部に記憶
された当該入力文における係り受け記号で示される箇所
を優先的に分割位置とし、係り受け処理部によって、構
文解析部からの当該入力文の構文解析結果のうち上記係
り受け記憶部に記憶された係り受け関係を満たす構文解
析結果を当該入力文の構文構造として出力するので、オ
ペレータによって上記係り受け記号で予め指示された係
り受けの関係を満たす構文構造を得ることができる。し
たがって、この発明によれば、自然言語による入力文に
対して正しい係り受け解析を実施できる。
As is apparent from the above description, the natural language analysis apparatus according to the first aspect of the present invention uses the dependency symbol detection unit when the input sentence is divided into a plurality of phrases by the division unit of the morphological analysis unit. A portion indicated by the dependency symbol in the input sentence detected and stored in the dependency storage unit is preferentially set as a division position, and the dependency processing unit outputs the result of the syntax analysis of the input sentence from the syntax analysis unit. Since the syntax analysis result that satisfies the dependency relationship stored in the dependency storage unit is output as the syntax structure of the input sentence, a syntax structure that satisfies the dependency relationship specified in advance by the dependency symbol by the operator is output. Obtainable. Therefore, according to the present invention, correct dependency analysis can be performed on an input sentence in a natural language.

【0049】さらに、上記係り受け記号の付加は本自然
言語解析装置と非インタラクティブに実施できるので、
この発明によれば大量の入力文の解析処理が可能であ
る。
Further, the addition of the dependency symbol can be carried out non-interactively with the natural language analyzer.
According to the present invention, it is possible to analyze a large number of input sentences.

【0050】また、請求項2に係る自然言語解析装置の
係り受け記号検出部は、係り受け関係にある2つの文節
の夫々に付加されて文節の範囲と係り受けの関係にある
こととを表す特定の係り受け記号を検出手段によって検
出するので、形態素解析部によって入力文を文節に分割
する際に、オペレータによって指示された係り受けの関
係にある文節を正しく反映されて分割できる。したがっ
て、この発明によれば、自然言語による入力文に対して
オペレータによる指示に従ってより正しく係り受け解析
を実施できる。
Further, the dependency symbol detecting section of the natural language analysis device according to claim 2 is added to each of the two clauses in the dependency relationship to indicate that they are in a dependency relationship with the range of the clause. Since the specific dependency symbol is detected by the detecting means, when the morphological analysis unit divides the input sentence into phrases, the phrase having the dependency relationship specified by the operator can be correctly reflected and divided. Therefore, according to the present invention, a dependency analysis can be more correctly performed on an input sentence in a natural language in accordance with an instruction from an operator.

【0051】また、請求項3に係る自然言語解析装置の
係り受け記号検出部は、係り受け関係にある2つの文節
の夫々の直後に付加されて係り受けの関係にあることを
表す特定の係り受け記号を検出手段によって検出するの
で、オペレータが入力文における係り受けの関係にある
文節の範囲を指示しなくとも、係り受けの関係にある箇
所の終了位置に基づいて、その終了位置を反映させて係
り受けの関係にある文節に正しく分割することができ
る。したがって、この発明によれば、文節の定義を知ら
ないオペレータであっても入力文における係り受けの関
係にある箇所の終了位置さえ指示すれば、自動的に自然
言語による入力文に対して正しく係り受け解析を実施で
きる。
In addition, the dependency symbol detecting section of the natural language analysis device according to claim 3 is a special dependency symbol which is added immediately after each of the two clauses in the dependency relationship to indicate that they are in a dependency relationship. Since the receiving symbol is detected by the detecting means, the end position is reflected on the basis of the end position of the dependency-related portion even if the operator does not indicate the range of the dependency-related phrase in the input sentence. Therefore, it can be correctly divided into phrases having a dependency relationship. Therefore, according to the present invention, even an operator who does not know the definition of a phrase automatically correctly associates a natural language input sentence with an input sentence as long as the operator indicates the end position of a dependency relationship in the input sentence. Receive analysis can be performed.

【0052】また、請求項4に係る機械翻訳装置は、上
記自然言語解析装置における係り受け処理部から出力さ
れるオペレータによって指示された係り受けの関係を満
たすような構文構造に基づいて、変換部および生成部に
よって入力文の翻訳文を生成するので、オペレータによ
って指示された係り受けの関係を正しく理解して自然な
翻訳文を生成できる。その際におけるオペレータによる
係り受けの関係の指示は、上記係り受け記号を用いて本
機械翻訳装置と非インタラクティブに実施できるので、
この発明によれば大量の入力文の翻訳処理が可能であ
る。
According to a fourth aspect of the present invention, there is provided a machine translation apparatus which converts a conversion unit based on a syntax structure that satisfies a relation of dependency specified by an operator output from a dependency processing unit in the natural language analysis device. Since the translated sentence of the input sentence is generated by the generating unit, a natural translated sentence can be generated by correctly understanding the dependency relationship specified by the operator. Since the instruction of the dependency relationship by the operator at that time can be implemented non-interactively with the machine translation apparatus using the dependency symbol,
According to the present invention, a large number of input sentences can be translated.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の自然言語解析装置が搭載された機械
翻訳装置におけるブロック図である。
FIG. 1 is a block diagram of a machine translator equipped with a natural language analyzer of the present invention.

【図2】図1における翻訳モジュールのブロック図であ
る。
FIG. 2 is a block diagram of a translation module in FIG. 1;

【図3】日英翻訳処理動作のフローチャートである。FIG. 3 is a flowchart of a Japanese-English translation processing operation.

【図4】係り受け記号が挿入された入力文の一例を示す
図である。
FIG. 4 is a diagram illustrating an example of an input sentence into which a dependency symbol is inserted.

【図5】入力文から取り出された係り受け記号の一部が
バッファへ格納されたようすを示す図である。
FIG. 5 is a diagram illustrating a state in which a part of a dependency symbol extracted from an input sentence is stored in a buffer.

【図6】入力文を係り受け記号に基づいて文節に分割し
たようすを示す図である。
FIG. 6 is a diagram showing a state in which an input sentence is divided into phrases based on dependency symbols.

【図7】図2における構文解析部による構文解析処理の
結果得られた構文解析木およびその係り受け構造を示す
図である。
7 is a diagram illustrating a parse tree obtained as a result of a parse process performed by the parse unit in FIG. 2 and a dependency structure thereof.

【符号の説明】[Explanation of symbols]

1…CPU、 2…メインメモ
リ、3…CRT、 4…キーボ
ード、5…翻訳モジュール、 6…外部
記憶装置、8…辞書引き形態素解析部、 9…
構文解析部、10…係り受け処理部、 1
1…変換部、12…生成部。
DESCRIPTION OF SYMBOLS 1 ... CPU, 2 ... Main memory, 3 ... CRT, 4 ... Keyboard, 5 ... Translation module, 6 ... External storage device, 8 ... Dictionary morphological analysis unit, 9 ...
Syntax analysis unit, 10 ... dependency processing unit, 1
1 ... Conversion unit, 12 ... Generation unit.

フロントページの続き (56)参考文献 特開 平4−235673(JP,A) 特開 平1−280868(JP,A) 特開 平1−8479(JP,A) 特開 平1−35661(JP,A) 特開 昭63−317879(JP,A) 平井章博、梶博行、芦沢実、「機械翻 訳向け前編集のための日本語係り受け構 造の曖昧性検出方式」、情報処理学会論 文誌、第31巻、第10号、p.1425−p. 1437(1990.10)Continuation of front page (56) References JP-A-4-235673 (JP, A) JP-A-1-280868 (JP, A) JP-A-1-8479 (JP, A) JP-A-1-35661 (JP) , A) JP-A-63-317879 (JP, A) Akihiro Hirai, Hiroyuki Kaji, Minoru Ashizawa, "A Method for Detecting Ambiguity of Japanese Dependency Structure for Preediting for Machine Translation", IPSJ Theory Bibliography, Vol. 31, No. 10, p. 1425-p. 1437 (1990.10)

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力部から入力された自然言語による入
力文の形態素解析を形態素解析部によって行い、形態素
解析結果に基づいて構文解析部によって入力文の構文を
解析する自然言語解析装置において、 上記形態素解析部による形態素解析に先立って、入力文
中における係り受け関係にある文節に付加されて係り受
け関係にあることを表している係り受け記号を検出する
係り受け記号検出部と、 上記係り受け記号検出部で検出された係り受け記号を当
該入力文の文字の属性として記憶することによって、当
該入力文の係り受けの関係を記憶する係り受け記憶部
と、 上記構文解析部によって得られた当該入力文の構文解析
結果のうち、上記係り受け記憶部に記憶された係り受け
の関係を満たす構文解析結果を当該入力文の構文構造と
して出力する係り受け処理部を備えると共に、 上記形態素解析部は、入力文を複数の文節に分割するに
際して、上記係り受け記憶部に記憶された係り受け記号
で示される箇所を優先的に分割位置とする分割手段を有
することを特徴とする自然言語解析装置。
1. A natural language analysis device for performing a morphological analysis of an input sentence in a natural language input from an input unit by a morphological analysis unit and analyzing a syntax of the input sentence by a syntax analysis unit based on a result of the morphological analysis. Prior to the morphological analysis by the morphological analysis unit, a dependency symbol detection unit that detects a dependency symbol that is added to a phrase having a dependency relationship in the input sentence and indicates a dependency relationship, and the dependency symbol A dependency storage unit that stores a dependency relation of the input sentence by storing the dependency symbol detected by the detection unit as a character attribute of the input sentence; and the input obtained by the syntax analysis unit. Among the syntax analysis results of the sentence, a syntax analysis result that satisfies the dependency relationship stored in the dependency storage unit is output as the syntax structure of the input sentence. The morphological analysis unit, when dividing the input sentence into a plurality of clauses, preferentially sets a location indicated by a dependency symbol stored in the dependency storage unit as a division position. A natural language analyzer having a dividing unit.
【請求項2】 請求項1に記載の自然言語解析装置にお
いて、 上記係り受け記号検出部は、係り受け関係にある2つの
文節の夫々に付加されて文節の範囲と係り受けの関係に
あることとを表す特定の係り受け記号を検出する検出手
段を備えたことを特徴とする自然言語解析装置。
2. The natural language analysis device according to claim 1, wherein the dependency symbol detection unit is added to each of the two phrases having a dependency relationship, and has a relationship between the range of the phrase and the dependency. A natural language analysis device comprising a detecting means for detecting a specific dependency symbol indicating the following.
【請求項3】 請求項1あるいは請求項2に記載の自然
言語解析装置において、 上記係り受け記号検出部は、係り受け関係にある2つの
文節の夫々の直後に付加されて係り受けの関係にあるこ
とを表す特定の係り受け記号を検出する検出手段を備え
たことを特徴とする自然言語解析処理装置。
3. The natural language analysis device according to claim 1, wherein the dependency symbol detection unit is added immediately after each of the two clauses in the dependency relationship to determine the dependency relationship. A natural language analysis processing device comprising a detection means for detecting a specific dependency symbol indicating that there is a certain dependency symbol.
【請求項4】 変換部によって自然言語による入力文の
内部構造をターゲット言語による内部構造に変換し、こ
の得られたターゲット言語による内部構造に基づいて生
成部によって翻訳文を生成する機械翻訳装置において、 請求項1乃至請求項3の何れか一つに記載の自然言語解
析装置を備えて、上記変換部および生成部は、上記自然
言語解析装置における係り受け処理部から出力された自
然言語による入力文の構文構造に基づいて、上記入力文
の翻訳文を生成することを特徴とする機械翻訳装置。
4. A machine translation apparatus that converts an internal structure of an input sentence in a natural language into an internal structure in a target language by a conversion unit, and generates a translated sentence by a generation unit based on the obtained internal structure in the target language. The natural language analysis device according to any one of claims 1 to 3, wherein the conversion unit and the generation unit are configured to input the natural language output from the dependency processing unit of the natural language analysis device. A machine translator for generating a translation of the input sentence based on a syntax structure of the sentence.
JP11945593A 1993-05-21 1993-05-21 Natural language analyzer and machine translator Expired - Lifetime JP3197110B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11945593A JP3197110B2 (en) 1993-05-21 1993-05-21 Natural language analyzer and machine translator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11945593A JP3197110B2 (en) 1993-05-21 1993-05-21 Natural language analyzer and machine translator

Publications (2)

Publication Number Publication Date
JPH06332938A JPH06332938A (en) 1994-12-02
JP3197110B2 true JP3197110B2 (en) 2001-08-13

Family

ID=14761802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11945593A Expired - Lifetime JP3197110B2 (en) 1993-05-21 1993-05-21 Natural language analyzer and machine translator

Country Status (1)

Country Link
JP (1) JP3197110B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7823297B2 (en) 2004-01-22 2010-11-02 Geox S.P.A. Shoe with breathable and waterproof sole and upper

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平井章博、梶博行、芦沢実、「機械翻訳向け前編集のための日本語係り受け構造の曖昧性検出方式」、情報処理学会論文誌、第31巻、第10号、p.1425−p.1437(1990.10)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7823297B2 (en) 2004-01-22 2010-11-02 Geox S.P.A. Shoe with breathable and waterproof sole and upper

Also Published As

Publication number Publication date
JPH06332938A (en) 1994-12-02

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPS62163173A (en) Mechanical translating device
JPH0644296A (en) Machine translating system
GB2234614A (en) Machine translation apparatus
US5608623A (en) Special cooccurrence processing method and apparatus
JP2815714B2 (en) Translation equipment
JPH0261763A (en) Mechanical translation equipment
JP3197110B2 (en) Natural language analyzer and machine translator
JP2632806B2 (en) Language analyzer
JPH0332106B2 (en)
JP2719453B2 (en) Machine translation equipment
JP2938897B2 (en) Document creation processing device
JP2794919B2 (en) Machine translation equipment
JP3253311B2 (en) Language processing apparatus and language processing method
JP2752025B2 (en) Machine translation equipment
JP2856736B2 (en) Dictionary reference device and dictionary reference method
JP3353873B2 (en) Machine translation equipment
JPH07200592A (en) Text processor
JPS62271054A (en) Correction system for morpheme analysis result of translation device
JPH06243163A (en) Document analyzing device
JPH0785057A (en) Syntax analyzing method and device therefor
JPH10340264A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded
JPH0816910B2 (en) Language analyzer
JPH10320395A (en) Machine translation device and computer readable recording medium recording machine translation processing program
JPS63136264A (en) Mechanical translating device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090608

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 12

EXPY Cancellation because of completion of term