JP3113257B2 - Machine translation equipment - Google Patents

Machine translation equipment

Info

Publication number
JP3113257B2
JP3113257B2 JP02104180A JP10418090A JP3113257B2 JP 3113257 B2 JP3113257 B2 JP 3113257B2 JP 02104180 A JP02104180 A JP 02104180A JP 10418090 A JP10418090 A JP 10418090A JP 3113257 B2 JP3113257 B2 JP 3113257B2
Authority
JP
Japan
Prior art keywords
language
word
target language
arc
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02104180A
Other languages
Japanese (ja)
Other versions
JPH041852A (en
Inventor
宏 安原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP02104180A priority Critical patent/JP3113257B2/en
Publication of JPH041852A publication Critical patent/JPH041852A/en
Application granted granted Critical
Publication of JP3113257B2 publication Critical patent/JP3113257B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、自然言語間の翻訳を行う機械翻訳装置、特
に自然言語の構文構造表現として、共通の手段を用いる
ことにより、日本語と英語等といった語族の全く異なる
言語間の機械翻訳にも適用し得る機械翻訳装置に関する
ものである。
DETAILED DESCRIPTION OF THE INVENTION (Industrial application field) The present invention relates to a machine translator for translating between natural languages, and more particularly, to using a common means as a syntax structure expression of a natural language, thereby enabling Japanese and English translation. The present invention relates to a machine translation apparatus that can be applied to machine translation between languages of completely different languages such as.

(従来の技術) 従来、このような分野の技術としては、次のよな文献
1,2に記載されるものがあった。
(Prior art) Conventionally, techniques in such a field include the following documents:
There was a thing described in 1,2.

文献1;自然言語処理研究会資料、26[10](1985−1
0)情報処理学会、長尾等「科学技術庁機械翻訳プロジ
ェクトの概要」P.1203−1213 文献2;特公平1−57828号公報 従来、前記文献1,2に記載されているように、機械翻
訳装置には、例えばトランスファー方式と中間言語方式
のものがあった。
Reference 1: Natural Language Processing Research Group, 26 [10] (1985-1
0) Information Processing Society of Japan, Nagao et al. "Outline of the Machine Translation Project of the Science and Technology Agency" P.1203-1213 Reference 2; Japanese Patent Publication No. 1-57828 Conventionally, as described in References 1 and 2, machine translation The devices include, for example, a transfer system and an intermediate language system.

中間言語方式の機械翻訳装置では、言語に独立した中
間言語を定めることにより、全ての自然言語を中間言語
に解析するものと、その中間言語から生成するものを作
ることにより、任意の言語対(例えば、日本語/英語
等)に対して、相互の翻訳を可能にするものである。こ
の方式において、中間言語は言語独立のため、構文構造
が失われており、意味構造(例えば、格構造等)になっ
ている。
In the intermediate language machine translation apparatus, by defining an intermediate language that is independent of a language, a natural language is parsed into an intermediate language, and a language generated from the intermediate language is created. For example, Japanese / English) can be mutually translated. In this method, since the intermediate language is language-independent, the syntactic structure is lost, and the intermediate language has a semantic structure (eg, case structure).

これに対してトランスファー方式の機械翻訳装置で
は、原言語の構文構造、意味構造を目的言語の構文構
造、意味構造へ変換することによって翻訳を行う方式で
ある。この方式は、英語から仏語等への翻訳のように、
構文構造が類似の言語対に対してよく用いられている。
On the other hand, a transfer-type machine translation apparatus performs translation by converting a syntax structure and a semantic structure of a source language into a syntax structure and a semantic structure of a target language. This method, like the translation from English to French, etc.,
Syntactic structures are often used for similar language pairs.

(発明が解決しようとする課題) しかしながら、上記いずれの方式の装置でも、次のよ
うな課題があった。
(Problems to be Solved by the Invention) However, any of the above-described systems has the following problems.

(a) 中間言語方式 この方式では、入力言語を中間言語に解析するため、
入力言語の構文構造あるいは語順が失われる。そのた
め、類似の語族間の翻訳(例えば、英語/仏語等)で
は、原文のもつ構文や語順が目的言語に反映されず、例
えば機械翻訳の結果を人間が修正する後編集等におい
て、その編集作業が煩雑になるという問題があった。
(A) Intermediate language method In this method, the input language is analyzed into an intermediate language,
The syntax or word order of the input language is lost. Therefore, in the translation between similar languages (for example, English / French), the syntax and word order of the original sentence are not reflected in the target language. Is complicated.

(b) トランスファー方式 この方式では、原言語の構文構造等を目的言語の構文
構造等へ変換するため、語族の異なる言語間の翻訳で
は、構文構造の変換が複雑になる。しかも、各言語対に
対応する変換処理を行うことが必要となるため、多くの
言語対での機械翻訳システムを作成することが困難であ
った。
(B) Transfer method In this method, the syntax structure of the source language is converted into the syntax structure of the target language, and so the translation between languages having different families is complicated. In addition, since it is necessary to perform conversion processing corresponding to each language pair, it has been difficult to create a machine translation system for many language pairs.

本発明は前記従来技術が持っていた課題として、中間
言語方式における構文構造消失と、トランスファー方式
における変換処理の複雑さの点について解決した機械翻
訳装置を提供するものである。
An object of the present invention is to provide a machine translation apparatus which solves the problems of the prior art as to the loss of the syntax structure in the intermediate language system and the complexity of the conversion processing in the transfer system.

(課題を解決するための手段) 前記課題を解決するために、本発明のうちの第1の発
明では、自然言語間の翻訳を行う機械翻訳装置におい
て、原言語の文を解析する原言語辞書を格納する第1の
記憶手段と、原言語の文を解析する文法規則である原言
語解析文法を格納する第2の記憶手段と、前記原言語辞
書と前記原言語解析文法に基づいて入力文章を解析した
結果、文章中に用言が存在する場合は用言と用言を修飾
する単語を1つのまとまりとする連用アークを生成し、
文章中に体言が存在する場合は体言と体言を修飾する単
語を1つのまとまりとする連体アークを生成し、連用ア
ークと連体アークとその他の語を入力された文章の語順
を保つ形式に組み合わせ、単語を原言語毎に固有の言語
で表現した構文構造を生成する原言語解析装置と、原言
語の単語を目的言語の単語に置換する原言語・目的言語
対訳辞書を格納する第3の記憶手段と、目的言語の文を
生成するのに必要な情報を収めた目的言語辞書を格納す
る第4の記憶手段と、目的言語を生成するための生成規
則である目的言語生成文法を格納する第5の記憶手段
と、前記原言語・目的言語対訳辞書と前記目的言語辞書
と前記目的言語生成文法に基づいて前記原言語解析装置
が生成した構文構造から目的言語を生成する目的言語生
成装置とを有している。
(Means for Solving the Problems) In order to solve the above problems, according to a first aspect of the present invention, in a machine translation apparatus for translating between natural languages, a source language dictionary for analyzing a source language sentence First storage means for storing a source language analysis grammar, which is a grammar rule for analyzing a source language sentence, and an input sentence based on the source language dictionary and the source language analysis grammar. As a result of analyzing, if there is a verb in the sentence, a continuous arc is generated that combines the verbal and the word that modifies the verbal into one unit,
If there is a noun in the sentence, a continuous arc is generated by combining the noun and the word that modifies the noun into one, and the combined arc, the union arc, and other words are combined into a form that maintains the word order of the input sentence, Third language storage device for storing a source language analysis device that generates a syntax structure expressing words in a language unique to each source language, and a source / target language bilingual dictionary for replacing source language words with target language words Fourth storage means for storing a target language dictionary containing information necessary for generating a target language sentence, and a fifth storage means for storing a target language generation grammar, which is a generation rule for generating the target language. Storage means, and a target language generation device that generates a target language from the syntax structure generated by the source language analysis device based on the source language / target language bilingual dictionary, the target language dictionary, and the target language generation grammar. Doing .

ここで、前記目的言語生成装置は、前記原言語解析装
置が生成した構文構造のうち、連用アークに含まれる用
言を修飾している付属語または機能語から目的言語の構
文の枠組みを決定する連用アーク生成部と、前記原言語
解析装置が生成した構文構造のうち、連体アークにつな
がる付属語または機能語から目的言語の構文を決定する
連体アーク生成部とを有している。
Here, the target language generation device determines a framework of the syntax of the target language from an auxiliary word or a functional word that modifies a verb included in the continuous arc among the syntax structures generated by the source language analysis device. It has a continuous arc generator and a continuous arc generator that determines a syntax of a target language from an attached word or a functional word connected to the continuous arc in the syntax structure generated by the source language analysis device.

第2の発明の機械翻訳装置では、自然言語を中間言語
に対応させた原言語辞書を格納する第1の記憶手段と、
原言語の文を解析する文法規則である原言語解析文法を
格納する第2の記憶手段と、前記原言語辞書と前記原言
語解析文法に基づいて入力文章を解析した結果、文章中
に用言が存在する場合は用言と用言を修飾する単語を1
つのまとまりとする連用アークを生成し、文章中に体言
が存在する場合は体言と体言を修飾する単語を1つのま
とまりとする連体アークを生成し、連用アークと連体ア
ークとその他の語を入力された文章の語順を保つ形式に
組み合わせ、単語を言語に依存しない中間言語で表現し
た構文構造を生成する原言語解析装置と、自然言語を中
間言語に対応させた目的言語辞書を格納する第3の記憶
手段と、目的言語を生成するための生成規則である目的
言語生成文法を格納する第4の記憶手段と、前記目的言
語辞書と前記目的言語生成文法に基づいて前記原言語解
析装置が生成した構文構造から目的言語を生成する目的
言語生成装置とを有している。
In the machine translation apparatus according to a second aspect, a first storage unit stores a source language dictionary in which a natural language corresponds to an intermediate language;
Second storage means for storing a source language analysis grammar, which is a grammar rule for analyzing a source language sentence; and, as a result of analyzing an input sentence based on the source language dictionary and the source language analysis grammar, a word in the sentence If the word exists, the declinable word and the word that
Generates a combined arc as a unit, and if there is a noun in the sentence, generates a unified arc that combines the noun and the word that modifies the noun into one unit, and inputs the combined arc, the unified arc, and other words. A source language analysis device that generates a syntax structure in which words are expressed in an intermediate language independent of a language by combining them in a format that maintains the word order of the written sentences, and a third target language dictionary that stores a natural language corresponding to the intermediate language. Storage means, fourth storage means for storing a target language generation grammar which is a generation rule for generating a target language, and the source language analysis device generating the target language generation grammar based on the target language dictionary and the target language generation grammar A target language generation device for generating a target language from the syntax structure.

ここで、前記目的言語生成装置は、前記原言語解析装
置が生成した構文構造のうち、連用アークに含まれる用
言を修飾している付属語または機能語の中間言語に相当
する意味的な関係子から目的言語の構文の枠組みを決定
する連用アーク生成部と、前記原言語解析装置が生成し
た構文構造のうち、連体アークにつながる付属語または
機能語の中間言語に相当する意味的な関係子から目的言
語の構文を決定する連体アーク生成部とを有している。
In this case, the target language generation device may include a semantic relation corresponding to an intermediate language of an adjunct or a functional word that modifies a word included in the continuous arc in the syntax structure generated by the source language analysis device. A continuous arc generation unit that determines a framework of a target language syntax from a child, and a semantic relational element corresponding to an intermediate language of an adjunct or a functional word connected to the continuous arc in the syntax structure generated by the source language analysis device. And a continuous arc generation unit that determines the syntax of the target language from.

(作 用) 第1の発明によれば、以上のように機械翻訳装置を構
成したので、翻訳すべき文章が原言語解析装置に入力さ
れると、原言語解析装置では、第1、第2の記憶手段に
それぞれ格納された原言語辞書と原言語解析文法に基づ
いて、入力文章を解析し、文章中に用言が存在する場合
は連用アークを生成し、文章中に体言が存在する場合は
連体アークを生成し、これらの連用アークと連体アーク
とその他の語を、入力文章の語順を保つ形式に組み合わ
せて構文構造を生成し、目的言語生成装置に与える。
(Operation) According to the first invention, the machine translation device is configured as described above. When a text to be translated is input to the source language analysis device, the source language analysis device generates the first and second sentences. The input sentence is analyzed based on the source language dictionary and the source language analysis grammar stored respectively in the storage means, and if there is a word in the sentence, a continuous arc is generated, and if the word is present in the sentence Generates a continuous arc, combines these continuous arcs, continuous arcs, and other words into a form that maintains the word order of the input sentence, generates a syntax structure, and provides the generated syntax structure to the target language generation device.

目的言語生成装置の連用アーク生成部では、第3、第
4、第5の記憶手段にそれぞれ格納された原言語・目的
言語対訳辞書と目的言語辞書と目的言語生成文法に基づ
いて、原言語解析装置が生成した構文構造のうち、連用
アークに含まれる用言を修飾している付属語または機能
語から目的言語の構文の枠組みを決定する。さらに、目
的言語生成装置の連体アーク生成部でも、原言語・目的
言語対訳辞書、目的言語辞書及び目的言語生成文法に基
づいて、原言語解析装置が生成した構文構造のうち、連
体アークにつながる付属語または機能語から目的言語の
構文を決定する。これにより、目的言語が生成される。
The continuous arc generation unit of the target language generation device analyzes the source language based on the source language / target language bilingual dictionary, the target language dictionary, and the target language generation grammar stored in the third, fourth, and fifth storage units, respectively. From the syntax structure generated by the device, the framework of the syntax of the target language is determined from the attached words or functional words that modify the verbs included in the combined arc. In addition, the adjoining arc generation unit of the target language generating device also uses the source language / target language bilingual dictionary, the target language dictionary, and the target language generating grammar to generate, among the syntax structures generated by the source language analysis device, the attached Determine the target language syntax from words or functional words. Thereby, a target language is generated.

第2の発明によれば、翻訳すべき文章が原言語解析装
置に入力されると、原言語解析装置では、第1、第2の
記憶手段にそれぞれ格納された原言語辞書と原言語解析
文法に基づき、入力文章を解析して連用アークと連体ア
ークを生成し、これらの連用アークと連体アークとその
他の語を、入力文章の語順を保つ形式に組み合わせ、中
間言語で表現した構文構造を生成し、目的言語生成装置
に与える。
According to the second invention, when a sentence to be translated is input to the source language analysis device, the source language analysis device causes the source language dictionary and the source language analysis grammar stored in the first and second storage means, respectively. Analyzes the input sentence based on, generates combined arcs and union arcs, combines these combined arcs, union arcs, and other words into a form that maintains the word order of the input sentence, and generates a syntax structure expressed in an intermediate language And gives it to the target language generator.

目的言語生成装置の連用アーク生成部では、第3、第
4の記憶手段にそれぞれ格納された目的言語辞書と目的
言語生成文法に基づいて、原言語解析装置が生成した構
文構造のうち、連用アークに含まれる用言を修飾してい
る付属語または機能語の中間言語に相当する意味的な関
係子から、目的言語の構文の枠組みを決定する。さら
に、目的言語生成装置の連体アーク生成部でも、目的言
語辞書及び目的言語生成文法に基づいて、原言語解析装
置が生成した構文構造のうち、連体アークにつながる付
属語または機能語の中間言語に相当する意味的な関係子
から、目的言語の構文を決定する。これにより、目的言
語が生成される。
The continuous arc generation unit of the target language generating apparatus includes a continuous arc generator of the syntax structures generated by the source language analyzing apparatus based on the target language dictionary and the target language generating grammar stored in the third and fourth storage units, respectively. The framework of the syntax of the target language is determined from the semantic relations equivalent to the intermediate language of the adjunct or functional word that modifies the verb included in the target language. In addition, the adjoint arc generation unit of the target language generation device also converts the syntactic structure generated by the source language analysis device into an intermediate language of an auxiliary word or a function word connected to the adjacency arc based on the target language dictionary and the target language generation grammar. From the corresponding semantic relations, determine the syntax of the target language. Thereby, a target language is generated.

(実施例) 第1図は、本発明の第1の実施例を示す機械翻訳装置
の構成ブロック図である。
(Embodiment) FIG. 1 is a configuration block diagram of a machine translation apparatus showing a first embodiment of the present invention.

この機械翻訳装置は、入力言語を種々の言語に共通す
る語修飾、例えば連体修飾及び連用修飾等の形式で、か
つ該入力言語の語順を保存する形式で表現した構文構造
に変換する原言語解析装置1と、その原言語解析装置1
で変換された構文構造を構成する単語を言語毎に固有の
言語で表現し、目的言語を生成する目的言語生成装置2
とを、備えている。原言語解析装置1には、原言語辞書
3を格納する第1の記憶手段と、原言語解析文法4を格
納する第2の記憶手段とが接続されている。また目的言
語生成装置2には、原言語・目的言語対訳辞書5を格納
する第3の記憶手段と、目的言語辞書6を格納する第4
の記憶手段と、目的言語生成文法7を格納する第5の記
憶手段とが接続されている。
This machine translator translates an input language into a syntax structure expressed in a form of word modification common to various languages, for example, union modification and continuous modification, and in a form that preserves the word order of the input language. Device 1 and its source language analysis device 1
Language generating device 2 that expresses the words constituting the syntax structure converted by the above in a language specific to each language, and generates a target language
And The source language analysis device 1 is connected to a first storage unit that stores the source language dictionary 3 and a second storage unit that stores the source language analysis grammar 4. The target language generation device 2 includes a third storage unit that stores the source language / target language bilingual dictionary 5 and a fourth storage unit that stores the target language dictionary 6.
And a fifth storage unit for storing the target language generation grammar 7 are connected.

目的言語生成装置2は、連用アークから文を生成する
連用アーク生成部2aと、連体アークから文を生成する連
体アーク生成部2bとを、有している。原言語辞書3は、
原言語の文を解析するのに必要な情報(品詞、活用変化
等)が収められており、動詞の格情報や名詞の意味カテ
ゴリ等を含んでおり、解析用辞書としての機能を有して
いる。原言語解析文法4は、解析用の文法規則である。
The target language generating device 2 includes a continuous arc generation unit 2a that generates a sentence from a continuous arc and a continuous arc generation unit 2b that generates a sentence from a continuous arc. The source language dictionary 3
Contains information necessary to analyze source language sentences (part-of-speech, inflectional changes, etc.), contains verb case information and noun semantic categories, and has a function as an analysis dictionary. I have. The source language analysis grammar 4 is a grammar rule for analysis.

原言語・目的言語対訳辞書5は、原言語の単語を目的
言語の単語に置換するための辞書であり、原言語の多義
語については訳語を選択できるような条件が付加されて
いる。目的言語辞書6は、目的言語の文を生成するのに
必要な情報(品詞、活用変化等)が収められており、目
的言語生成用の辞書としての機能を有している。目的言
語生成文法7は、目的言語を生成するための生成規則で
ある。
The source language / target language bilingual dictionary 5 is a dictionary for replacing words in the source language with words in the target language, and a condition for selecting a translated word is added to polysemy in the source language. The target language dictionary 6 stores information (part of speech, changes in utilization, etc.) necessary to generate a sentence in the target language, and has a function as a dictionary for generating the target language. The target language generation grammar 7 is a generation rule for generating a target language.

以上のように構成される機械翻訳装置の動作を、第2
図〜第5図を参照しつつ説明する。
The operation of the machine translation apparatus configured as described above
This will be described with reference to FIGS.

第2図は、言語に共通な構文構造表現の一例を示す図
である。言語を構成する単語は、名詞や動詞といった自
立語と、助詞や前置詞といったいくつかの付属語(また
は機能語)とに、分類できる。これらの自立語と付属語
(または機能語)とから、文節が構成され、それらの文
節間に修飾関係が存在する。この修飾関係を「係り受
け」といい、連体修飾関係(受け側が体言である関
係)、連用修飾関係(受け側が用言である関係)、及び
格修飾関係(述語に対する修飾関係)の3つに分類され
ている。ここで、体言とは、自立語で、活用がなく、主
語となれるものの総称(名詞、代名詞)である。用言と
は、活用があり、単独で述語となれるものの総称(動
詞、形容詞、形容動詞)である。
FIG. 2 is a diagram showing an example of a syntax structure expression common to languages. The words that make up a language can be classified into independent words, such as nouns and verbs, and some adjuncts (or functional words), such as particles and prepositions. A phrase is composed of these independent words and ancillary words (or function words), and a modification relationship exists between the phrases. This qualification relation is called "dependency", and is classified into three types: adnominal qualification relation (relationship where the receiving side is a noun), combination modification relation (relationship where the receiving side is a verbal), and case qualification relation (modification relation for predicate). Classified. Here, the nomenclature is a general term (a noun, a pronoun) of an independent word that has no use and can be a subject. An adjective is a generic term (verb, adjective, adjective verb) of something that can be used and can be used alone as a predicate.

この第2図の構文構造表現の特徴は、言語を構成する
単語を、自立語Ji(但し、i=1,2,…,n)と、付属語
(または機能語)Fi(但し、i=1,2,…,n)に分類し、
自立語Jiを出現順にノード(節点)にし、付属語Fiをそ
のノードからでるアーク(直線)11〜15とする。文は、
用言とそれを修飾するものを1つのまとまりとみなし
て、アーク18で結ぶ。これを連用アークAという。ま
た、体言を修飾するものがあれば、それをまとめて1つ
のアーク16,17で結ぶ。これを連体アークBという。付
属語の種類によってアークの形を変えたり、連用修飾と
連体修飾も区別すると、識別が容易になる。
The feature of the syntax structure expression of FIG. 2 is that words constituting a language are composed of independent words Ji (where i = 1, 2,..., N) and attached words (or functional words) Fi (where i = 1,2,…, n)
The independent words Ji are made nodes (nodes) in the order of appearance, and the attached words Fi are arcs (straight lines) 11 to 15 coming out of the nodes. The statement is
The word and its modifiers are regarded as one unit and are connected by an arc 18. This is called continuous arc A. Also, if there is something that modifies the nominative, it is connected together by one arc 16,17. This is called a continuous arc B. If the shape of the arc is changed depending on the type of the attached word, or if the continuous modification and the continuous modification are distinguished, the identification becomes easy.

第3図は、構文構造表現例を示すもので、「私はシー
フードレストランに行く」という文の構文構造を表現し
たものである。第4図は、第3図の英訳“I GO TO
SEAFOOD RESTAURANT"を構文構造に表現したものであ
る。また、第5図は、第3図の英訳の途中の構文構造表
現例を示す図である。
FIG. 3 shows an example of the syntax structure expression, which expresses the syntax structure of the sentence “I go to a seafood restaurant”. Figure 4 is the English translation of Figure 3 "I GO TO
SEAFOOD RESTAURANT "in a syntax structure. FIG. 5 is a diagram showing an example of a syntax structure expression in the middle of the English translation of FIG.

第1図の翻訳動作について説明すると、先ず、原言語
の文「私はシーフードレストランに行く」が原言語解析
装置1に入力されると、原言語解析装置1では、原言語
辞書3及び原言語解析文法4を用いて、入力文「私はシ
ーフードレストランに行く」を解析する。この解析結果
は、第3図に示すような構文構造を持つ。これが目的言
語生成装置2へ入力される。
First, when the source language sentence "I go to a seafood restaurant" is input to the source language analysis device 1, the source language analysis device 1 outputs a source language dictionary 3 and a source language. The input sentence “I go to a seafood restaurant” is analyzed using the analysis grammar 4. This analysis result has a syntax structure as shown in FIG. This is input to the target language generation device 2.

目的言語生成装置2は、連用アーク生成部2a及び連体
アーク生成部2bを有し、原言語・目的言語対訳辞書5、
目的言語辞書6及び目的言語生成文法7を用いて、入力
された構文構造から目的言語を生成処理する。
The target language generation device 2 includes a continuous arc generation unit 2a and a continuous arc generation unit 2b, and includes a source language / target language bilingual dictionary 5,
Using the target language dictionary 6 and the target language generation grammar 7, a target language is generated from the input syntax structure.

即ち、連用アーク生成部2aは、連用アークAに含まれ
る用言に注目し、それを修飾している付属語(または機
能語)から構文の枠組みを決定する。付属語(または機
能語)につながる自立語が連体アークBからなっている
ときは、連体アーク生成部2bに制御を渡す。連体アーク
生成部2bでは、連体アークBにつながる付属語(または
機能語)から構文を決定する。構文構造が深くなってい
る時は、連用アーク生成部2a及び連体アーク生成部2bで
は再帰的に処理(繰返し処理)を行う。
That is, the combined arc generation unit 2a pays attention to the verb included in the continuous arc A, and determines the framework of the syntax from the attached words (or functional words) that modify the word. When the independent word connected to the attached word (or function word) is composed of the continuous arc B, the control is passed to the continuous arc generator 2b. The continuous arc generation unit 2b determines the syntax from the attached words (or functional words) connected to the continuous arc B. When the syntax structure is deep, the continuous arc generation unit 2a and the continuous arc generation unit 2b perform processing (repetition processing) recursively.

第3図の例では、連用アークAには、付属語「は」、
「に」がつながり、用言「行く」が終止形になってい
る。原言語・目的言語対訳辞書5内の「行く」の内容を
参照して第3図の構文構造を英訳に変換すると、第5図
のような構文になる。この時、「行く」は“GO"に、
「私」は「I」に、「は」は“SUB"(主部)に、「に」
は“TO"に変換しておく。「に」の自立語は、連体アー
クBになっているので、連体アーク生成部2bが起動さ
れ、最終的に目的言語生成装置2によって第4図の英訳
された構文構造が生成されることになる。
In the example of FIG. 3, the auxiliary arc “A”
"Ni" is connected, and the word "go" is an end. When the syntax structure of FIG. 3 is converted into an English translation with reference to the contents of “go” in the source language / target language bilingual dictionary 5, the syntax becomes as shown in FIG. At this time, “go” becomes “GO”,
"I" is "I", "Ha" is "SUB" (main part), "Ni"
Is converted to “TO”. Since the independence word of “ni” is the continuous arc B, the continuous arc generator 2b is activated, and the target language generator 2 finally generates the translated syntax structure in FIG. Become.

この第1の実施例では、次のような利点を有してい
る。
The first embodiment has the following advantages.

原言語解析装置1では、解析した構文構造を言語に共
通な形式で表現するため、語族の異なる言語に対しても
構文変換が容易になり、トランスファー方式による機械
翻訳でも多言語間機械翻訳に適応できる。しかも、構文
構造や語順を保って目的語を生成するため、類似言語間
の翻訳では原文に忠実な訳が得られ、さらにトランスフ
ァー方式の利点である、きめ細かい訳文生成が行える。
In the source language analysis device 1, since the analyzed syntax structure is expressed in a format common to the languages, the syntax conversion can be easily performed even for languages of different languages, and the machine translation by the transfer method can be applied to the multilingual machine translation. it can. In addition, since the object is generated while maintaining the syntactic structure and the word order, a translation faithful to the original sentence can be obtained in the translation between similar languages, and a detailed translation can be generated, which is an advantage of the transfer method.

第6図は、本発明の第2の実施例を示す機械翻訳装置
の構成ブロック図である。
FIG. 6 is a configuration block diagram of a machine translation apparatus showing a second embodiment of the present invention.

この機械翻訳装置は、第1図とほぼ同様に、原言語解
析装置21と、連用アーク生成部22a及び連体アーク生成
部22bを有する目的言語生成装置22とを備えている。さ
らに、原言語解析装置21には、原言語辞書23を格納する
第1の記憶手段と、原言語解析文法24を格納する第2の
記憶手段とが接続されると共に、目的言語生成装置22に
は、目的言語辞書26を格納する第3の記憶手段と、目的
言語生成文法27を格納する第4の記憶手段とが接続され
ている。
This machine translation device includes a source language analysis device 21 and a target language generation device 22 having a continuous arc generation unit 22a and a continuous arc generation unit 22b, similarly to FIG. Further, a first storage means for storing the source language dictionary 23 and a second storage means for storing the source language analysis grammar 24 are connected to the source language analysis apparatus 21. Is connected to third storage means for storing the target language dictionary 26 and fourth storage means for storing the target language generation grammar 27.

前記第1の実施例では、言語対毎に対訳辞書を参照し
て訳文を作り、目的言語生成装置2及び目的言語生成文
法7も、原言語に依存していた。これに対し、この第2
の実施例では、言語に独立な中間言語を設定するため、
中間言語方式の機械翻訳に近い構成になっている。
In the first embodiment, a translated sentence is created with reference to a bilingual dictionary for each language pair, and the target language generating device 2 and the target language generating grammar 7 also depend on the source language. In contrast, this second
In the example, to set the language independent intermediate language,
The structure is similar to that of the intermediate language machine translation.

即ち、原言語解析装置21は、原言語辞書23及び原言語
解析文法24を用いて入力言語を解析して中間言語の構文
構造に変換する機能を有している。また、目的言語生成
装置22は、目的言語辞書26及び目的言語生成文法27を用
いて、入力された中間言語から目的言語を生成する機能
を有している。ここで、原言語辞書23及び目的言語辞書
26は、いずれも単語の各種文法情報と単語を表わす中間
言語を持っている。
That is, the source language analysis device 21 has a function of analyzing the input language using the source language dictionary 23 and the source language analysis grammar 24 and converting the input language into a syntax structure of an intermediate language. Further, the target language generation device 22 has a function of generating a target language from an input intermediate language using a target language dictionary 26 and a target language generation grammar 27. Here, the source language dictionary 23 and the target language dictionary
26 has various grammatical information of words and an intermediate language representing words.

第7図は構文構造の展開例を示す図であり、この図を
参照しつつ、第6図の動作を説明する。なお、第7図中
のAGTは動作主格、GOLはゴール(行き先)である。
FIG. 7 is a diagram showing an example of the development of the syntax structure. The operation of FIG. 6 will be described with reference to FIG. In FIG. 7, AGT is the action nominative, and GOL is the goal (destination).

例えば、例文「私はシーフードレストランへ行く」を
入力すると、原言語解析装置21は、原言語辞書23及び原
言語解析文法24を用いて、原文を第7図のような構文構
造に展開する。ここで、第7図における( )でくくっ
たものは、中間言語を意味している。原言語解析装置21
で中間言語の構文構造に変換されると、付属語(または
機能語)は、意味的な関係子に変換される。この場合で
も、原文の語順は保存されている。
For example, when the example sentence “I go to a seafood restaurant” is input, the source language analysis device 21 uses the source language dictionary 23 and the source language analysis grammar 24 to develop the source sentence into a syntax structure as shown in FIG. Here, what is enclosed in parentheses in FIG. 7 means an intermediate language. Source language analyzer 21
Is converted to an intermediate language syntactic structure, the auxiliary word (or function word) is converted to a semantic relation. Even in this case, the word order of the original sentence is preserved.

第7図の構文構造を目的言語生成装置22に入力する
と、目的言語生成装置22は、目的言語辞書26及び目的言
語生成文法27を用いて、前記第1の実施例とほぼ同様
に、第4図に示すような構文構造の目的言語を生成す
る。
When the syntax structure shown in FIG. 7 is input to the target language generation device 22, the target language generation device 22 uses the target language dictionary 26 and the target language generation grammar 27 to generate the fourth language in substantially the same manner as in the first embodiment. A target language having a syntax structure as shown in the figure is generated.

この第2の実施例では、中間言語方式のように原言語
辞書13及び目的言語辞書26を用いて単語と中間言語との
対応をとるようにしているので、中間言語方式の利点で
ある機械翻訳装置における開発工数の削減と、トランス
ファー方式の利点であるきめ細かい訳文生成を併せもっ
た機械翻訳が可能となる。その他は、前記第1の実施例
とほぼ同様の利点を有している。
In the second embodiment, the correspondence between words and an intermediate language is obtained by using the source language dictionary 13 and the target language dictionary 26 as in the intermediate language system. Machine translation that reduces the number of development man-hours in the device and the fine-grained translation generation that is an advantage of the transfer method becomes possible. Others have substantially the same advantages as the first embodiment.

なお、本発明は、図示の実施例に限定されず、例えば
第1図及び第6図に他の機能ブロックを付加したり、あ
るいは原言語辞書3,23、原言語・目的言語対訳辞書5、
及び目的言語辞書6,26等の内容を変えることにより、種
々の自然言語間の翻訳を行うことが可能である。
The present invention is not limited to the illustrated embodiment. For example, other functional blocks may be added to FIGS. 1 and 6 or the source language dictionaries 3 and 23, the source language / target language bilingual dictionary 5,
By changing the contents of the target language dictionaries 6, 26, etc., translation between various natural languages can be performed.

(発明の効果) 以上詳細に説明したように、第1の発明によれば、原
言語解析装置を設け、入力文章を種々の言語に共通する
語修飾関係で、かつ該入力文章の語順を保存する形式で
表現した構文構造に変換するようにしたので、変換され
る構文構造が言語に共通な形式で表現される。そのた
め、語族の異なる言語に対しても構文変換が容易にな
り、トランスファー方式による機械翻訳でも多言語間機
械翻訳に適応できる。しかも、原言語解析装置の変換処
理では、構文構造や語順を保っているため、類似言語間
の翻訳の場合には原文に忠実な訳が得られる。
(Effects of the Invention) As described in detail above, according to the first invention, the source language analysis device is provided, and the input sentence is stored in a word modification relationship common to various languages, and the word order of the input sentence is stored. Since the syntactic structure is converted into a syntactic structure expressed in a format, the syntactic structure to be converted is expressed in a format common to languages. For this reason, syntax conversion is facilitated even for languages of different families, and machine translation by transfer method can be applied to multilingual machine translation. Moreover, in the conversion processing of the source language analysis device, since the syntactic structure and the word order are maintained, a translation faithful to the original sentence can be obtained in the case of translation between similar languages.

第2の発明では、中間言語の辞書を用いて翻訳するの
で、中間言語方式のように単語と中間言語の対応がと
れ、中間言語方式の利点である開発工数の削減と、トラ
ンスファー方式の利点であるきめ細かい訳文生成を併せ
もった機械翻訳が可能となる。
In the second invention, since translation is performed using an intermediate language dictionary, correspondence between words and an intermediate language can be obtained as in the intermediate language system, so that the development man-hours, which are the advantages of the intermediate language system, and the transfer system can be reduced. Machine translation with certain fine-grained translation generation is possible.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の第1の実施例を示す機械翻訳装置の構
成ブロック図、第2図は言語に共通な構文構造表現の例
を示す図、第3図は構文構造表現の例を示す図、第4図
は第3図の英訳の構文構造表現の例を示す図、第5図は
第3図の英訳の途中の構文構造表現の例を示す図、第6
図は本発明の第2の実施例を示す機械翻訳装置の構成ブ
ロック図、第7図は構文構造の展開例を示す図である。 1,21……原言語解析装置、2,22……目的言語生成装置、
2a,22a……連用アーク生成部、2b,22b……連体アーク生
成部、3,23……原言語辞書、4,24……原言語解析文法、
5……原言語・目的言語対訳辞書、6,26……目的言語辞
書、7,27……目的言語生成文法。
FIG. 1 is a block diagram showing the configuration of a machine translation apparatus according to a first embodiment of the present invention, FIG. 2 is a diagram showing an example of a syntax structure expression common to languages, and FIG. 3 is an example of a syntax structure expression. FIG. 4 is a diagram showing an example of the syntax structure expression of the English translation of FIG. 3, FIG. 5 is a diagram showing an example of the syntax structure expression in the middle of the English translation of FIG.
FIG. 7 is a block diagram showing the configuration of a machine translation apparatus according to a second embodiment of the present invention, and FIG. 7 is a view showing an example of developing a syntax structure. 1,21… Source language analyzer, 2,22… Target language generator,
2a, 22a: Continuous arc generator, 2b, 22b: Continuous arc generator, 3, 23: Source language dictionary, 4, 24: Source language analysis grammar,
5 Source / target language bilingual dictionary, 6, 26 Target language dictionary, 7, 27 Target language generation grammar.

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/28 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06F 17/28 JICST file (JOIS)

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】原言語の文を解析する原言語辞書を格納す
る第1の記憶手段と、 原言語の文を解析する文法規則である原言語解析文法を
格納する第2の記憶手段と、 前記原言語辞書と前記原言語解析文法に基づいて入力文
章を解析した結果、文章中に用言が存在する場合は用言
と用言を修飾する単語を1つのまとまりとする連用アー
クを生成し、文章中に体言が存在する場合は体言と体言
を修飾する単語を1つのまとまりとする連体アークを生
成し、連用アークと連体アークとその他の語を入力され
た文章の語順を保つ形式に組み合わせ、単語を原言語毎
に固有の言語で表現した構文構造を生成する原言語解析
装置と、 原言語の単語を目的言語の単語に置換する原言語・目的
言語対訳辞書を格納する第3の記憶手段と、 目的言語の文を生成するのに必要な情報を収めた目的言
語辞書を格納する第4の記憶手段と、 目的言語を生成するための生成規則である目的言語生成
文法を格納する第5の記憶手段と、 前記原言語・目的言語対訳辞書と前記目的言語辞書と前
記目的言語生成文法に基づいて前記原言語解析装置が生
成した構文構造から目的言語を生成する目的言語生成装
置とを有し、 前記目的言語生成装置は、 前記原言語解析装置が生成した構文構造のうち、連用ア
ークに含まれる用言を修飾している付属語または機能語
から目的言語の構文の枠組みを決定する連用アーク生成
部と、 前記原言語解析装置が生成した構文構造のうち、連体ア
ークにつながる付属語または機能語から目的言語の構文
を決定する連体アーク生成部とを 有することを特徴とする機械翻訳装置。
1. A first storage means for storing a source language dictionary for analyzing a source language sentence, a second storage means for storing a source language analysis grammar which is a grammar rule for analyzing a source language sentence, As a result of analyzing the input sentence based on the source language dictionary and the source language analysis grammar, if there is a word in the sentence, a combined arc is generated in which the word and the word modifying the word are united as one unit. If there is a noun in the sentence, a continuous arc is generated by combining the noun and the word that modifies the noun into a single unit, and the combined arc, the union arc, and other words are combined in a form that maintains the word order of the input sentence. A source language analysis device for generating a syntax structure in which words are expressed in a language unique to each source language, and a third storage for storing a source language / target language bilingual dictionary for replacing source language words with target language words Means and generate sentences in the target language A fourth storage unit for storing a target language dictionary containing information necessary for storing the target language, a fifth storage unit for storing a target language generation grammar as a generation rule for generating the target language, A target language generation device that generates a target language from a syntax structure generated by the source language analysis device based on the target language bilingual dictionary, the target language dictionary, and the target language generation grammar; An arc generation unit that determines a syntactic framework of a target language from an appendix or a function word that modifies a verb included in an arc used in the syntactic structure generated by the source language analyzer; A machine translation apparatus, comprising: an union arc generation unit that determines a syntax of a target language from an appendix or a function word connected to an union arc, from a syntax structure generated by the analysis apparatus.
【請求項2】自然言語を中間言語に対応させた原言語辞
書を格納する第1の記憶手段と、 原言語の文を解析する文法規則である原言語解析文法を
格納する第2の記憶手段と、 前記原言語辞書と前記原言語解析文法に基づいて入力文
章を解析した結果、文章中に用言が存在する場合は用言
と用言を修飾する単語を1つのまとまりとする連用アー
クを生成し、文章中に体言が存在する場合は体言と体言
を修飾する単語を1つのまとまりとする連体アークを生
成し、連用アークと連体アークとその他の語を入力され
た文章の語順を保つ形式に組み合わせ、単語を言語に依
存しない中間言語で表現した構文構造を生成する原言語
解析装置と、 自然言語を中間言語に対応させた目的言語辞書を格納す
る第3の記憶手段と、 目的言語を生成するための生成規則である目的言語生成
文法を格納する第4の記憶手段と、 前記目的言語辞書と前記目的言語生成文法に基づいて前
記原言語解析装置が生成した構文構造から目的言語を生
成する目的言語生成装置とを有し、 前記目的言語生成装置は、 前記原言語解析装置が生成した構文構造のうち、連用ア
ークに含まれる用言を修飾している付属語または機能語
の中間言語に相当する意味的な関係子から目的言語の構
文の枠組みを決定する連用アーク生成部と、 前記原言語解析装置が生成した構文構造のうち、連体ア
ークにつながる付属語または機能語の中間言語に相当す
る意味的な関係子から目的言語の構文を決定する連体ア
ーク生成部とを 有することを特徴とする機械翻訳装置。
2. A first storage means for storing a source language dictionary in which a natural language corresponds to an intermediate language, and a second storage means for storing a source language analysis grammar which is a grammar rule for analyzing a sentence in the source language. As a result of analyzing the input sentence based on the source language dictionary and the source language analysis grammar, if there is a word in the sentence, a continuous arc that combines the word and the word that modifies the word as one unit is formed. Generated, if there is a nomenclature in the sentence, form a union arc that combines the noun and the word that modifies the noun into one, and maintain the word order of the sentence in which the combined arc, the union arc, and other words are input A source language analysis device that generates a syntax structure in which words are expressed in an intermediate language independent of a language, a third storage unit that stores a target language dictionary in which a natural language corresponds to the intermediate language, Raw to produce Fourth storage means for storing a target language generation grammar which is a composition rule, and a target language generation for generating a target language from the syntax structure generated by the source language analysis device based on the target language dictionary and the target language generation grammar A target language generating device, wherein the syntactic structure generated by the source language analyzing device has a meaning corresponding to an intermediate language of an adjunct word or a functional word that modifies a word contained in a continuous arc. Arc generator for determining the framework of the syntax of the target language from a functional correlator; of the syntactic structure generated by the source language analyzer, a semantic equivalent to an intermediate language of an appendix or a functional word connected to the adjunct arc A machine translation device, comprising: a continuous arc generation unit that determines a syntax of a target language from various relations.
JP02104180A 1990-04-19 1990-04-19 Machine translation equipment Expired - Fee Related JP3113257B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02104180A JP3113257B2 (en) 1990-04-19 1990-04-19 Machine translation equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02104180A JP3113257B2 (en) 1990-04-19 1990-04-19 Machine translation equipment

Publications (2)

Publication Number Publication Date
JPH041852A JPH041852A (en) 1992-01-07
JP3113257B2 true JP3113257B2 (en) 2000-11-27

Family

ID=14373811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02104180A Expired - Fee Related JP3113257B2 (en) 1990-04-19 1990-04-19 Machine translation equipment

Country Status (1)

Country Link
JP (1) JP3113257B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6997041B2 (en) 2018-06-21 2022-01-17 東芝ライフスタイル株式会社 refrigerator

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07175496A (en) * 1993-12-18 1995-07-14 Ricoh Co Ltd Device for generating sentence
US7620683B2 (en) 2001-05-18 2009-11-17 Kabushiki Kaisha Square Enix Terminal device, information viewing method, information viewing method of information server system, and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6997041B2 (en) 2018-06-21 2022-01-17 東芝ライフスタイル株式会社 refrigerator

Also Published As

Publication number Publication date
JPH041852A (en) 1992-01-07

Similar Documents

Publication Publication Date Title
JPS62163173A (en) Mechanical translating device
JPH02281372A (en) Inserted adverbe phrase processing method in machine translation equipment
Güngördü et al. Parsing Turkish using the lexical functional grammar formalism
JPH0261763A (en) Mechanical translation equipment
JPS6318458A (en) Method and apparatus for extracting feeling information
Megerdoomian Unification-based Persian morphology
JP3113257B2 (en) Machine translation equipment
Arwidarasti et al. Converting an Indonesian constituency treebank to the Penn treebank format
Soudi et al. A prototype English-to-Arabic interlingua-based MT system
JP3919732B2 (en) Machine translation apparatus and machine translation program
Angelov Multiword expressions in multilingual applications within the Grammatical Framework
Wintner et al. Syntactic analysis of Hebrew sentences
Nirenburg et al. Two principles and six techniques for rapid MT development
JP2859661B2 (en) Machine translation equipment
JPS63136265A (en) Mechanical translating device
JP4092861B2 (en) Natural language pattern creation apparatus and method
JP2555921B2 (en) Word processor with translation conversion function
Enikuomehin et al. A Structural Algorithm for Complex Natural Languages Parse Generation
JPH0256066A (en) Processing system for converting translated word to compound noun
Kapanadze The multilingual grug parallel treebank–syntactic annotation for under-resourced languages
Ranta Machine translation and type theory
Nichols Applying Deep Grammars to Machine Translation, Paraphrasing, and Ontology Construction
Khin IMPLEMENTATION OF NATURAL LANGUAGE TRANSLATION SYSTEM BASED ON NLP: MYANMAR TO JAPAN TRANSLATION PROCESS
Bellaachia Natural Language Processing Paradigms and Applications
Byron et al. Constraint-Based Processing for Discourse Anaphor Resolution

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees