JP2608384B2 - Machine translation apparatus and method - Google Patents

Machine translation apparatus and method

Info

Publication number
JP2608384B2
JP2608384B2 JP6089941A JP8994194A JP2608384B2 JP 2608384 B2 JP2608384 B2 JP 2608384B2 JP 6089941 A JP6089941 A JP 6089941A JP 8994194 A JP8994194 A JP 8994194A JP 2608384 B2 JP2608384 B2 JP 2608384B2
Authority
JP
Japan
Prior art keywords
translation
sentence
expression
frame
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6089941A
Other languages
Japanese (ja)
Other versions
JPH07295992A (en
Inventor
伸敏 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6089941A priority Critical patent/JP2608384B2/en
Publication of JPH07295992A publication Critical patent/JPH07295992A/en
Application granted granted Critical
Publication of JP2608384B2 publication Critical patent/JP2608384B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、自動翻訳システムや情
報検索のシステムなどにおいて、入力されたある原言語
の文を、ある目標とする言語の文に翻訳する機械翻訳装
置及びその方法に関し、特に、目標文において、原文の
意味に忠実に、著者の意図した表現を実現する機械翻訳
装置及びその方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation apparatus and method for translating an input source language sentence into a target language sentence in an automatic translation system or an information retrieval system. In particular, the present invention relates to a machine translation apparatus and method for realizing an expression intended by the author in a target sentence faithfully in the meaning of the original sentence.

【0002】[0002]

【従来の技術】従来の機械翻訳方式としては、「言語処
理と機械翻訳」(野村浩郷/編)に記載されているよう
に、『直接方式』、『トランスファ方式』、『中間言語
方式』などの方法がある。
2. Description of the Related Art As a conventional machine translation system, as described in "Language Processing and Machine Translation" (Hirogo Nomura / ed.), "Direct system", "transfer system", "intermediate language system" And so on.

【0003】『直接方式』は、原文の中に現れる1つ1
つの単語を、それぞれ目標言語の単語に置き換え、その
後に訳語の語順を入れ換えて訳文として完成させる方式
である。
[0003] The "direct method" is one that appears in the original text.
In this method, each word is replaced with a word in the target language, and then the word order of the translated word is replaced to complete the translated sentence.

【0004】また、『トランスファ方式』は、文の構造
の表現を言語間で形式的に変換することを基本とし、原
文を文法的に解析した結果を原言語の構文構造表現とし
て表し、その構文構造表現を目標言語の構文構造表現に
変換し、変換された構文構造表現から訳文を作り上げ
る。このように、構文構造表現という間接的な中間表現
を経由して翻訳する方式である。
[0004] The "transfer method" is based on the formal conversion of the expression of the structure of a sentence between languages, and the result of grammatically analyzing an original sentence is expressed as a syntax structure expression of the original language. The structural expression is converted into the syntactic structural expression of the target language, and a translated sentence is created from the converted syntactic structural expression. In this way, the translation is performed via an indirect intermediate expression called a syntax structure expression.

【0005】また、『中間言語方式』は、構文構造表現
の代わりに、言語の特性に依存しない1つの表現手段を
設定し、その表現手段を使って記述した原文の中間表現
から直接的に目標文を作り出すことを考えた方式であ
る。
In the "intermediate language system", one expression means independent of language characteristics is set in place of the syntax structure expression, and a target is directly obtained from the intermediate expression of the original text described using the expression means. This is a method that considers creating sentences.

【0006】以上の3つの方法では、いずれにおいて
も、翻訳処理のプロセスとして、形態素解析および形態
素生成の共通した各プロセスを経て翻訳処理がなされ
る。また、『トランスファ方式』および『中間言語方
式』には、加えるに構文構造解析、意味構造解析、語彙
・構造変換、意味構造生成、構文構造生成の処理過程が
存在する。従って、従来の機械翻訳方式には、一旦、文
章をバラバラに語の最小単位に分割し、目標言語の構文
構造に従って訳語を並び換えると言う共通した処理過程
が存在している。
[0006] In any of the above three methods, the translation process is performed through the common processes of morphological analysis and morphological generation as the translation process. In the "transfer method" and the "intermediate language method", there are processing steps of syntactic structure analysis, semantic structure analysis, vocabulary / structure conversion, semantic structure generation, and syntactic structure generation. Therefore, in the conventional machine translation method, there is a common processing step of once dividing a sentence into minimum units of words and rearranging translated words according to the syntax structure of a target language.

【0007】この方法であると、言い回し表現や熟語表
現などにおいて、解析則や生成則に巧く乗らなかった
り、発火しても原文に従って忠実に正確に訳すため、逆
に、実際の表現からかけ離れたぎこちない表現になる場
合が多く、また、係り受けの先が複数存在した時は多義
性の解消などにおいて精度よく結果が得られる保証がな
かった。
According to this method, in a phrase expression or an idiom expression, the parsing rule or the generation rule is not skillfully applied, or even if fired, it is faithfully and accurately translated according to the original text. In many cases, the expression becomes awkward, and when there are a plurality of dependencies, there is no guarantee that the result can be obtained with high accuracy in eliminating polysemy.

【0008】この欠点を補完するものとして、『縦形探
索方式』および『横形探索方式』が考えられた。しかし
ながら、この2つは、埋め込み文と埋め込み文の修飾先
の候補名詞との間のみで論じられており、使用の範囲が
名詞句に限定された。しかも、埋め込み文の多義の解消
や埋め込み文の修飾先の候補名詞の多義の解消に難点が
あり、高い精度の解析や生成された名詞句全体の良さを
評価する必要があった。
As a supplement to this drawback, a "vertical search method" and a "horizontal search method" have been considered. However, these two are discussed only between the embedded sentence and the candidate noun to which the embedded sentence is to be modified, and the range of use is limited to noun phrases. In addition, there is a problem in eliminating polysemy of the embedded sentence and polysemy of the candidate noun to which the embedded sentence is modified, and it is necessary to analyze with high precision and evaluate the goodness of the entire generated noun phrase.

【0009】この欠点を解決するため、特開昭63 -2130
65号公報には、更に、埋め込み文の構造と修飾先の名詞
を2次元のマトリックスとして表現し、候補の名詞に対
して修飾関係の解析を行うことが開示されている。
To solve this drawback, Japanese Patent Application Laid-Open No. 63-2130
Japanese Patent Laid-Open No. 65 further discloses that the structure of an embedded sentence and a noun to be modified are expressed as a two-dimensional matrix, and the modification relation is analyzed for a candidate noun.

【0010】[0010]

【発明が解決しようとしている課題】しかしながら、特
開昭63 -213065号公報に開示された方法も、自動翻訳に
より生成された名詞句の目標文での生成箇所の情報を保
持していないため、生成された訳文そのものの意味関係
を破壊し、生成された訳文の語順が精度よく決定される
保証がなく、機械翻訳システムそのものがもつ欠点の1
つである訳文の文章としての感性を著しく低下させる可
能性を解決するに至らなかった。
However, the method disclosed in Japanese Patent Application Laid-Open No. 63-213065 does not hold information on the location of the noun phrase generated by automatic translation in the target sentence. One of the drawbacks of the machine translation system itself is that there is no guarantee that the semantic relationship of the generated translation itself is destroyed and the word order of the generated translation is determined with high accuracy.
It did not solve the possibility of significantly lowering the sensitivity of the translated sentence as a sentence.

【0011】以上のように、従来の機械翻訳方式では、
形態素解析を経て、一旦、繋がりのある語群を語の最小
単位に分割するため、繋がりのある語であることの情報
を訳文生成時まで保持することができない。例えば、日
本語文から英語文の変換において、連用修飾語、連体修
飾語は副詞句と形容詞句に変換され、互いに繋がりのあ
る語群として形成され、正しい訳においては繋がりのあ
る語群として翻訳される。
As described above, in the conventional machine translation system,
After the morphological analysis, the group of connected words is once divided into the minimum units of words, so that information indicating that the words are connected cannot be held until the translated sentence is generated. For example, in the conversion of a Japanese sentence to an English sentence, the conjunctive modifier and the adnominal modifier are converted into an adverb phrase and an adjective phrase, formed as a connected word group, and translated as a connected word group in a correct translation. You.

【0012】しかしながら、機械翻訳処理において、語
群からなる複数の修飾語が存在する場合に、語群として
まとまりのある情報を使用しないために、形態素解析の
段階での品詞情報が精度よく確定しなかったり、語の係
り受けの先が複数存在した時の多義性の解消が巧くいか
ないことに起因して、複数の語群の間で組み合わせるべ
き語が違うグループの語群に入れ子になるなど、意味不
明の翻訳生成結果になることがしばしば出現するという
問題があった。
However, in a machine translation process, when there are a plurality of modifiers composed of a word group, since the coherent information is not used as the word group, the part-of-speech information at the stage of the morphological analysis is accurately determined. The word that should be combined among multiple word groups is nested in a different group of words, due to the lack of ambiguity when there are multiple destinations of word dependency, However, there is a problem that a translation generation result of unknown meaning often appears.

【0013】これは、また、目標文らしくない語順や修
飾位置として翻訳文が生成されることもある。
[0013] In this case, a translated sentence may be generated as a word order or a modification position that does not look like a target sentence.

【0014】更に、従来の機械翻訳の通常の処理では、
語の単位で並び変えて訳文を生成するため、機械翻訳シ
ステムがもつ通常の変換則と構文生成則に縛られ、逆
に、実態に合った訳の導出に困難が生じることがある。
Further, in the ordinary processing of conventional machine translation,
Since the translation is generated by rearranging the words in units of words, the translation rules and syntax generation rules of the machine translation system are restricted, and conversely, it may be difficult to derive a translation that matches the actual situation.

【0015】例えば、原文での品詞は名詞であるが、訳
文では節を生成するとか、動詞が副詞に、合成名詞の一
方が形容詞に変換されるなどのように、原文と訳文とに
おいて構文構造変換パターンが一般化ができない場合
は、通常の機械翻訳システムがもつ一般的な変換則や構
文生成則に縛られるため、変換則や生成則が発火して
も、逆に、実態に合わない訳を生成することになる。
For example, the part of speech in the original sentence is a noun, but in the translated sentence, a syntactic structure is formed between the original sentence and the translated sentence, such as generating a clause or converting a verb into an adverb and one of the compound nouns into an adjective. If the conversion pattern cannot be generalized, it is bound by the general conversion rules and syntax generation rules of a normal machine translation system. Will be generated.

【0016】例えば、日本語文『今日は良い天気で
す。』を機械翻訳により英訳すると、翻訳結果は、『To
day is good weather 』となる。また、『スィッチON』
は『switch ON 』となる。上記において、通常使用され
る表現は『It's fine today 』であり、また、『switch
is turned ON 』と訳させたい場合なども、通常の機械
翻訳処理では難しい。
For example, the Japanese sentence "Today is fine weather. Is translated into English by machine translation.
day is good weather. Also, "Switch ON"
Becomes "switch ON". In the above, the commonly used expression is "It's fine today" and "switch
is turned ON], it is difficult with normal machine translation processing.

【0017】つまり、特定の言い回し表現は、機械翻訳
の通常の変換則や構文生成則に乗りにくい。構文構造の
変換のパターンを対応づけにくい場合や、原文と訳文間
での品詞の違いは、正しい訳の生成ができないばかり
か、誤訳になる場合がある。
That is, a specific wording expression is difficult to follow the usual conversion rules and syntax generation rules of machine translation. When it is difficult to associate the pattern of the conversion of the syntactic structure, or the difference in the part of speech between the original sentence and the translated sentence, not only a correct translation cannot be generated, but also a mistranslation may occur.

【0018】これらの問題に対して、解決の道を与える
のが埋め込み法による機械翻訳システムであるが、上述
したごとく、従来の埋め込み法は、埋め込み文と埋め込
み文の修飾先の候補名詞との間の候補名詞を選定する多
義性の解消に終始し、上記の課題を解決するに至ってい
ない。更に、従来の埋め込み法は、対象が、名詞と名詞
を修飾する語から構成される名詞句に限定されている
が、原文においては、連体修飾語、連用修飾語、独立文
などについて、目標となる訳文においては、名詞句、副
詞句、形容詞句、動詞句及び節など文を構成するすべて
について、上記の課題を解決する必要がある。
Although a machine translation system using the embedding method provides a solution to these problems, as described above, the conventional embedding method uses an embedding sentence and a candidate noun to which the embedding sentence is to be modified. All the while, the ambiguity of selecting candidate nouns between them has been resolved, and the above-mentioned problem has not been solved. Furthermore, in the conventional embedding method, the target is limited to a noun phrase composed of a noun and a word that modifies the noun, but in the original sentence, the adjunct modifier, the repeated modifier, the independent sentence, etc. In a translated sentence, it is necessary to solve the above-described problem for all of the sentences such as a noun phrase, an adverb phrase, an adjective phrase, a verb phrase, and a clause.

【0019】[0019]

【課題を解決するための手段】本発明によれば、機械翻
訳装置に、原文の特定表現に用いられる特定語句を原文
フレームとして記憶したフレーム記憶手段と、前記原文
フレームと、該原文フレームと組み合わされて前記特定
表現を構成する語または語群の属性とに対して、当該原
文フレームに対応する訳文フレームと、前記特定表現か
ら該特定表現に対応する前記訳文フレームを含んだ翻訳
表現への構文構造の変換パターンとをルールとして記憶
する変換ルール記憶手段と、原文の単語の属性及び訳語
を記憶した辞書手段と、翻訳の対象となる原文を入力す
る入力手段と、該入力手段より入力された原文中より、
前記フレーム記憶手段を参照して原文フレームを検出す
る検出手段と、前記入力された原文中で、該検出手段に
より検出された原文フレームと組み合わされて特定表現
を構成している語または語群の属性及び訳語を前記辞書
手段より検索する検索手段と、前記検出手段により検出
された原文フレームと、該検索手段により検索された語
または語群の属性とに基づいて、前記変換ルール記憶手
段より適用すべきルールを選出する選出手段と、該選出
手段により選出されたルールに基づいて、前記検出され
た原文フレームに対応する訳文フレームと、前記検出さ
れた原文フレームを含む特定表現から翻訳表現への構文
構造の変換パターンとを決定する決定手段と、該決定手
段により決定された訳文フレームに対して、該決定手段
により決定された変換パターンに基づいた位置に、前記
検索された語または語群の訳語を埋め込み、前記入力さ
れた原文中の特定表現に対応する翻訳表現を生成する生
成手段と、前記入力された原文が前記特定表現以外の部
分を含むかを判断する判断手段と、該判断手段により、
前記特定表現以外の部分を含むと判断されたときは、当
該特定表現を一まとまりとして前記入力された原文を翻
訳する翻訳手段と、該翻訳手段による翻訳結果における
前記特定表現に対応する部分を、前記生成手段により生
成された翻訳表現で置換する置換手段とを具える。
According to the present invention, a machine translation device stores a specific word used in a specific expression of an original sentence as an original sentence frame, a combination of the original sentence frame, and the original sentence frame. And for the attribute of a word or a group of words forming the specific expression, a translation frame corresponding to the original text frame and a syntax from the specific expression to a translation expression including the translation frame corresponding to the specific expression. A conversion rule storage unit that stores the conversion pattern of the structure as a rule, a dictionary unit that stores the attributes and translations of the words of the original sentence, an input unit that inputs the original sentence to be translated, and an input from the input unit. From the original text,
A detecting means for detecting an original sentence frame by referring to the frame storing means; and, in the input original sentence, a word or a group of words constituting a specific expression in combination with the original sentence frame detected by the detecting means. A search unit for searching attributes and translations from the dictionary unit, an original frame detected by the detection unit, and an attribute of the word or word group searched by the search unit, applied from the conversion rule storage unit. Selecting means for selecting a rule to be selected, a translation frame corresponding to the detected original text frame, and a translation from a specific expression including the detected original text frame to a translation expression based on the rule selected by the selecting means. Deciding means for deciding a conversion pattern of the syntax structure, and a translation frame determined by the deciding means, Generating means for embedding a translation of the searched word or group of words at a position based on the replacement pattern and generating a translation expression corresponding to the specific expression in the input original text; Determining means for determining whether a part other than an expression is included, and
When it is determined that a part other than the specific expression is included, a translation unit that translates the input original text as a unit of the specific expression, and a part corresponding to the specific expression in a translation result by the translation unit, Replacement means for replacing with the translation expression generated by the generation means.

【0020】また、本発明の他の態様によれば、機械翻
訳方法に、翻訳の対象となる原文を入力する入力工程
と、該入力工程により入力された原文中より、原文の特
定表現に用いられる特定語句が原文フレームとして登録
されたフレーム記憶部を参照して原文フレームを検出す
る検出工程と、前記入力された原文中で、該検出工程に
より検出された原文フレームと組み合わされて特定表現
を構成している語または語群の属性及び訳語を、原文の
単語の属性及び訳語が登録された辞書より検索する検索
工程と、前記原文フレームと、該原文フレームと組み合
わされて前記特定表現を構成する語または語群の属性と
に対して、当該原文フレームに対応する訳文フレーム
と、前記特定表現から該特定表現に対応する前記訳文フ
レームを含んだ翻訳表現への構文構造の変換パターンと
をルールとして記憶した変換ルール記憶部より、前記検
出工程により検出された原文フレームと、前記検索工程
により検索された語または語群の属性とに基づいて、適
用すべきルールを選出する選出工程と、該選出工程によ
り選出されたルールに基づいて、前記検出された原文フ
レームに対応する訳文フレームと、前記検出された原文
フレームを含む特定表現から翻訳表現への構文構造の変
換パターンとを決定する決定工程と、該決定工程により
決定された訳文フレームに対して、該決定工程により決
定された変換パターンに基づいた位置に、前記検索され
た語または語群の訳語を埋め込み、前記入力された原文
中の特定表現に対応する翻訳表現を生成する生成工程
と、前記入力された原文が前記特定表現以外の部分を含
むかを判断する判断工程と、該判断工程により、前記特
定表現以外の部分を含むと判断されたときは、当該特定
表現を一まとまりとして前記入力された原文を翻訳する
翻訳工程と、該翻訳工程による翻訳結果における前記特
定表現に対応する部分を、前記生成工程により生成され
た翻訳表現で置換する置換工程とを具える。
According to another aspect of the present invention, in the machine translation method, an inputting step of inputting an original sentence to be translated, and an original sentence input from the inputting step are used to specify an original sentence. A detecting step of detecting an original sentence frame by referring to a frame storage unit in which a specific phrase is registered as an original sentence frame, and combining the input sentence with the original sentence frame detected by the detecting step to form a specific expression. A retrieval step of retrieving the attributes and translations of the constituent words or word groups from a dictionary in which the attributes and translations of the original sentence are registered; and forming the specific expression in combination with the original sentence frame and the original sentence frame. Translation table including the translation frame corresponding to the original text frame and the translation frame corresponding to the specific expression from the specific expression for the attribute of the word or word group to be changed From the conversion rule storage unit storing the conversion pattern of the syntactic structure into the rules based on the original frame detected in the detection step and the attribute of the word or word group searched in the search step. A selecting step of selecting a power rule, a translation frame corresponding to the detected original sentence frame based on the rule selected by the selecting step, and a syntax from a specific expression including the detected original sentence frame to a translated expression. A determining step of determining a conversion pattern of a structure; and a translated word of the searched word or group of words at a position based on the conversion pattern determined by the determining step with respect to the translation frame determined by the determining step. Generating a translation expression corresponding to the specific expression in the input original text; and And a translation step of translating the input original text as a unit of the specific expression when it is determined by the determination step that the part includes a part other than the specific expression. And a replacement step of replacing a portion corresponding to the specific expression in the translation result of the translation step with the translation expression generated by the generation step.

【0021】[0021]

【作用】本発明の機械翻訳装置は、入力手段より入力さ
れた原文中より、検出手段によりフレーム記憶手段を参
照して原文フレームを検出し、検索手段により、前記入
力された原文中で、前記検出手段により検出された原文
フレームと組み合わされて特定表現を構成している語ま
たは語群の属性及び訳語を辞書手段より検索し、前記検
出手段により検出された原文フレームと、該検索手段に
より検索された語または語群の属性とに基づいて、選出
手段によって変換ルール記憶手段より適用すべきルール
を選出すると、該選出されたルールに基づいて、決定手
段により前記検出された原文フレームを含む特定表現か
ら翻訳表現への構文構造の変換パターンとを決定し、生
成手段により、該決定された訳文フレームに対して、該
決定された変換パターンに基づいた位置に、前記検索さ
れた語または語群の訳語を埋め込み、前記入力された原
文中の特定表現に対応する翻訳表現を生成する。判断手
段により、前記入力された原文が特定表現以外の部分を
含むと判断されたときは、翻訳手段により当該特定表現
を一まとまりとして前記入力された原文を翻訳し、該翻
訳手段による翻訳結果における前記特定表現に対応する
部分を、置換手段により前記生成された翻訳表現で置換
する。
According to the machine translation apparatus of the present invention, the detecting means refers to the frame storage means to detect an original sentence frame from the original sentence inputted from the input means, and the searching means finds the original sentence frame in the inputted original sentence. The dictionary unit searches for attributes and translations of a word or a group of words constituting the specific expression in combination with the original sentence frame detected by the detection unit, and searches the original sentence frame detected by the detection unit and the search unit. When a rule to be applied is selected from the conversion rule storage unit by the selection unit based on the attribute of the selected word or word group, the identification unit including the detected original text frame is determined by the determination unit based on the selected rule. A conversion pattern of the syntax structure from the expression to the translation expression is determined, and the determined conversion pattern is generated by the generation unit with respect to the determined translation frame. A position based on the over down, burying the translation of the retrieved words or word groups, to produce a translation representation corresponding to a particular representation in textual the inputted. When the judgment unit judges that the input original sentence includes a part other than the specific expression, the translation unit translates the input original sentence as a unit by the translation unit, and The part corresponding to the specific expression is replaced by the generated translation expression by the replacing means.

【0022】また、本発明の機械翻訳方法では、入力工
程により入力された原文中より、検出工程によりフレー
ム記憶部を参照して原文フレームを検出し、検索工程に
より、前記入力された原文中で、前記検出工程により検
出された原文フレームと組み合わされて特定表現を構成
している語または語群の属性及び訳語を辞書工程より検
索し、前記検出工程により検出された原文フレームと、
該検索工程により検索された語または語群の属性とに基
づいて、選出工程によって変換ルール記憶工程より適用
すべきルールを選出すると、該選出されたルールに基づ
いて、決定工程により前記検出された原文フレームを含
む特定表現から翻訳表現への構文構造の変換パターンと
を決定し、生成工程により、該決定された訳文フレーム
に対して、該決定された変換パターンに基づいた位置
に、前記検索された語または語群の訳語を埋め込み、前
記入力された原文中の特定表現に対応する翻訳表現を生
成する。判断工程により、前記入力された原文が特定表
現以外の部分を含むと判断されたときは、翻訳工程によ
り当該特定表現を一まとまりとして前記入力された原文
を翻訳し、該翻訳工程による翻訳結果における前記特定
表現に対応する部分を、置換工程により前記生成された
翻訳表現で置換する。
Further, in the machine translation method of the present invention, an original sentence frame is detected by referring to a frame storage unit in a detection step from an original sentence input in an input step, and is searched for in the input original sentence in a search step. Searching the dictionary process for the attributes and translations of the words or word groups that make up the specific expression in combination with the original text frame detected by the detection process, and the original text frame detected by the detection process;
When a rule to be applied is selected from the conversion rule storage step by the selecting step based on the attribute of the word or the word group searched by the searching step, based on the selected rule, the rule is detected by the determining step. A conversion pattern of a syntax structure from a specific expression including an original text frame to a translation expression is determined, and the search step is performed by the generation step at the position based on the determined conversion pattern with respect to the determined translation frame. The translated word of the word or group of words is embedded, and a translated expression corresponding to the specific expression in the input original sentence is generated. When it is determined by the determining step that the input original sentence includes a part other than the specific expression, the input original text is translated as a unit by the translation step, and the translation result in the translation result by the translation step is obtained. The part corresponding to the specific expression is replaced with the translation expression generated in the replacing step.

【0023】[0023]

【実施例】以下、添付図面を参照しながら、本発明に係
る好適な一実施例を詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a preferred embodiment according to the present invention will be described in detail with reference to the accompanying drawings.

【0024】図1は、本発明に係る機械翻訳装置の1実
施例の基本構成を示すブロック図である。
FIG. 1 is a block diagram showing a basic configuration of one embodiment of a machine translation apparatus according to the present invention.

【0025】図1において、1は、翻訳の対象となる原
文を入力する入力装置であり、例えば、文字を入力する
キーボードである。あるいは、他の装置から文字情報を
受信する通信装置、音声を入力・認識する装置、光学的
に文字を認識するOCRなどであってもよい。2は、入
力された原文を埋め込み翻訳処理する処理部であり、C
PUがROMあるいはRAMなどのメモリに記憶された
プログラムを実行することにより実現される。
In FIG. 1, reference numeral 1 denotes an input device for inputting an original sentence to be translated, for example, a keyboard for inputting characters. Alternatively, a communication device that receives character information from another device, a device that inputs and recognizes voice, and an OCR that optically recognizes characters may be used. Reference numeral 2 denotes a processing unit for embedding and translating an input original sentence.
The PU is realized by executing a program stored in a memory such as a ROM or a RAM.

【0026】3は、この処理部2を経て得られた訳文を
出力する出力装置であり、例えば、文字情報を表示する
ディスプレイである。また、音声を合成出力する装置、
他の装置へ文字情報を送信する通信装置などであっても
よい。4、5は、それぞれ、処理部2の動作中に使用さ
れる補助記憶装置および主記憶装置である。補助記憶装
置4は、フロッピー・ディスクあるいはハードディスク
などの不揮発な記憶媒体を用いる。補助記憶装置4の内
容は、処理の過程において、必要な部分を読み出すよう
にしてもよいし、処理に先立って、予めRAMにロード
してもよい。また、補助記憶装置に代えて、その内容を
ROMに記憶するようにしてもよい。主記憶装置5はR
AMとし、処理過程で生じたデータを一時記憶する。
Reference numeral 3 denotes an output device for outputting a translated sentence obtained through the processing unit 2, for example, a display for displaying character information. A device for synthesizing and outputting voice;
A communication device that transmits character information to another device may be used. Reference numerals 4 and 5 are an auxiliary storage device and a main storage device used during the operation of the processing section 2, respectively. The auxiliary storage device 4 uses a nonvolatile storage medium such as a floppy disk or a hard disk. The contents of the auxiliary storage device 4 may be obtained by reading necessary portions in the course of the processing, or may be loaded in the RAM in advance before the processing. Further, the contents may be stored in the ROM instead of the auxiliary storage device. The main storage device 5 is R
AM, and temporarily stores data generated in the process.

【0027】処理部2は、フレーム抽出部6、コード埋
め込み部7、翻訳処理部8、埋め込み文解析部9、埋め
込み文変換部10、埋め込み文生成部11を有する。また、
補助記憶装置4は、フレーム表現辞書12、埋め込みパタ
ーン13、埋め込み訳語辞書14埋め込みルール15を含んで
いる。主記憶装置5は、原文→訳文変換テーブル16、埋
め込み文テーブル17、*input18、 *output19を記憶す
る。
The processing section 2 has a frame extracting section 6, a code embedding section 7, a translation processing section 8, an embedded sentence analyzing section 9, an embedded sentence converting section 10, and an embedded sentence generating section 11. Also,
The auxiliary storage device 4 includes a frame expression dictionary 12, an embedding pattern 13, an embedding translation word dictionary 14, and embedding rules 15. The main storage device 5 stores an original sentence → translation sentence conversion table 16, an embedded sentence table 17, * input18, and * output19.

【0028】入力装置1からは、任意の文書が翻訳対象
として入力される。以下では、この入力される翻訳対象
の文書を原文と呼ぶこととする。入力された原文は、*i
nput18に記憶される。フレーム抽出部6では、特定の言
い回し表現や熟語などがフレーム表現として登録された
フレーム表現辞書12を参照して、*input18の原文中よ
り、フレーム表現辞書12に登録されたフレーム表現の抽
出を行う。
An arbitrary document is input from the input device 1 as a translation target. Hereinafter, the input document to be translated is referred to as an original sentence. The input text is * i
Stored in nput18. The frame extracting unit 6 extracts the frame expressions registered in the frame expression dictionary 12 from the original text of * input 18 with reference to the frame expression dictionary 12 in which specific phrase expressions and idioms are registered as frame expressions. .

【0029】埋め込み文解析部9は、抽出されたフレー
ムと組み合わせて用いられている単語、句、節、文の並
びから、埋め込みパターン13および埋め込み訳語辞書14
を参照して、埋め込みルール15の適合するルールを発火
させ、原文の埋め込みパターンを決定し、訳文での埋め
込みパターンに従い、構文構造を決定する。
The embedded sentence analyzing unit 9 determines an embedded pattern 13 and an embedded translated word dictionary 14 based on the arrangement of words, phrases, sections, and sentences used in combination with the extracted frames.
, A rule matching the embedding rule 15 is fired, the embedding pattern of the original sentence is determined, and the syntax structure is determined according to the embedding pattern in the translated sentence.

【0030】埋め込み文変換部10では、発火したルール
および埋め込み訳語辞書14を参照しながら、原文でのフ
レームと組み合わせて用いられている単語、句、節、文
を訳語に変換し、訳文での決定した埋め込みパターンに
従い、構文構造の変換を行う。変換された結果は原文→
訳文変換テーブル16として出力する。
The embedded sentence conversion unit 10 converts the words, phrases, sections, and sentences used in combination with the frames of the original sentence into translated words while referring to the rule that fired and the embedded translated word dictionary 14. The syntax structure is converted according to the determined embedding pattern. The converted result is the original →
Output as the translation conversion table 16.

【0031】ここで、入力装置1により入力された文書
が、登録された原文フレームと、このフレームと組み合
わされた単語、句、節、文からなる場合には、埋め込み
文生成部11にて、決定した訳文の埋め込み構文構造に従
って、訳文フレームに、組み合わせて用いる語、句、
節、文を内側あるいは外側に埋め込んで訳文を生成す
る。これに形態素生成を加え、出力文として *output19
を記憶する。その内容を、出力装置3により出力する。
Here, when the document input by the input device 1 is composed of a registered original sentence frame and words, phrases, sections and sentences combined with this frame, the embedded sentence generation unit 11 According to the determined sentence embedded syntax structure, words, phrases,
Embed clauses and sentences inside or outside to generate translated sentences. Add morpheme generation to this and output * output19
Is stored. The contents are output by the output device 3.

【0032】一方、入力された原文が、登録されたフレ
ームと、それと組み合わされている単語、句、節、文だ
けによらない場合には、コード埋め込み部7において、
原文→訳文変換テーブル16を参照して、原文での埋め込
み対象部分を埋め込みコードに変換する。同時に、原文
中に埋め込んだコードの位置と、埋め込み対象部分の訳
とを対応づけた埋め込み文テーブル17を、主記憶装置5
上に展開する。この埋め込み文テーブル17と、埋め込み
コードを埋め込んだ原文(例えば、図8)とを翻訳処理
部8に引き渡し、通常の機械翻訳処理を経て翻訳する。
On the other hand, if the input original text does not depend only on the registered frame and the words, phrases, clauses, and sentences combined with the registered frame, the code embedding unit 7
Referring to the original-to-translation conversion table 16, the portion to be embedded in the original is converted into an embedded code. At the same time, an embedded sentence table 17 that associates the position of the code embedded in the original sentence with the translation of the portion to be embedded is stored in the main storage device 5.
Expand on top. The embedded sentence table 17 and the original sentence (for example, FIG. 8) in which the embedded code is embedded are delivered to the translation processing unit 8, and are translated through a normal machine translation process.

【0033】埋め込み文生成部11では、翻訳処理部8で
得た翻訳結果と埋め込み文テーブル17とを参照しなが
ら、翻訳結果中の埋め込みコードを、埋め込み文テーブ
ル17の対応する埋め込み対象部分の訳文と置換し、更
に、入力された全文に亙って形態素生成を加え、 *outp
ut19上に訳文を生成する。この結果を出力装置3より出
力する。
The embedded sentence generation unit 11 refers to the translation result obtained by the translation processing unit 8 and the embedded sentence table 17, and converts the embed code in the translation result into the translated sentence of the corresponding embedding target portion of the embedded sentence table 17. And add morpheme generation over the entire input text. * Outp
Generate a translation on ut19. The result is output from the output device 3.

【0034】図12は、本実施例装置の翻訳動作のフロー
チャートである。同図に従って、本実施例の翻訳手順を
説明する。
FIG. 12 is a flowchart of the translation operation of the apparatus of this embodiment. The translation procedure of this embodiment will be described with reference to FIG.

【0035】ステップS1: 原文文章の入力 入力装置1により、任意の文書を翻訳対象の原文文章と
して入力する。これを主記憶装置5に*input18として記
憶させ、ステップS2へ進む。ここでは、図2に示す例文
が入力されたものとする。
Step S1: Input of Original Sentence An arbitrary document is input by the input device 1 as an original sentence to be translated. This is stored in the main storage device 5 as * input 18, and the process proceeds to step S2. Here, it is assumed that the example sentence shown in FIG. 2 has been input.

【0036】ステップS2: 登録された原文フレームの検
図2の例文は、埋め込み対象部分を含んでいる。この例
文中の表現により、補助記憶装置4に蓄えられた図3の
フレーム表現辞書12のフレームの見出しを順次スキャン
して、埋め込み対象部分である『〜に応じて』、『〜か
ら〜までの間』、『〜が同じになるように』が検出され
る。*input18から検出した原文フレームのi番目の見出
しの第1、第2フレームを、領域Fr1(i),Fr2(i) に記憶
させる。
Step S2: Detect registered original text frame
Sentences of the outgoing Figure 2 includes an embedded object part. With the expressions in this example sentence, the headings of the frames of the frame expression dictionary 12 of FIG. 3 stored in the auxiliary storage device 4 are sequentially scanned, and the embedding target portions “according to” and “from to "" And "is the same" are detected. The first and second frames of the i-th headline of the original text frame detected from * input18 are stored in areas Fr1 (i) and Fr2 (i).

【0037】『〜に応じて』について説明すると、図3
に示すフレーム表現辞書12により、組み合わせて用いる
単語(第1、第2埋め込み語)は名詞であることが分か
る。また、埋め込みパターンは2であり、図4の埋め込
みパターン13の2番目のパターンから、原文でのパター
ンは『第1埋め込み語+第1フレーム(+第2埋め込み
語)』であり、訳文での埋め込みパターンは『第1フレ
ーム+第1埋め込み語』であることが候補として挙げら
れる。正確には、埋め込みルールが発火するまで埋め込
みパターンは決定しない。このように、フレームが検出
できた場合には、ステップS3に進み、検出できない場合
はステップS9に進む。
"According to" will be described with reference to FIG.
It can be understood from the frame expression dictionary 12 shown in (1) that the words (first and second embedded words) used in combination are nouns. The embedding pattern is 2, and from the second pattern of the embedding pattern 13 in FIG. 4, the pattern in the original sentence is “first embedding word + first frame (+ second embedding word)”. The candidate for the embedding pattern is “first frame + first embedding word”. To be precise, the embedding pattern is not determined until the embedding rule is fired. As described above, when a frame can be detected, the process proceeds to step S3, and when the frame cannot be detected, the process proceeds to step S9.

【0038】ステップS3: 埋め込み訳語の辞書引き ステップS3では、埋め込み文解析部9に処理を移し、
『に応じて』を含む文章の辞書引きを行う。図2の例文
中の『測定値に応じてバイアスを決定する』において、
『に応じて』の隣接単語は『測定値』と『バイアス』で
あるから、図5に示す埋め込み訳語辞書14の辞書引きを
行い、3行目及び6行目より、『バイアス』の品詞は名
詞で、意味属性は『程度』であることが分かる。同様
に、『測定値』の品詞は名詞で意味属性は『環境』であ
ることが分かる。ここで、辞書引きの結果をそれぞれの
領域に、見出し語の領域:JWd2= バイアス/JWd1= 測定
値、意味属性:IAtr2=程度/IAtr1=環境、訳語:EWd1=m
easurementとして主記憶装置5上に記憶させ、ステップ
S4に進む。
Step S3: At step S3, the process goes to the embedded sentence analyzing unit 9, and
Performs dictionary lookup for sentences containing "according to". In "Determining bias according to measured value" in the example sentence of FIG.
Since the adjacent words of “according to” are “measurement value” and “bias”, the dictionary translation of the embedded translation dictionary 14 shown in FIG. 5 is performed, and from the third and sixth lines, the part of speech of “bias” is In the noun, the semantic attribute is understood to be “degree”. Similarly, it can be seen that the part of speech of “measurement value” is a noun and the semantic attribute is “environment”. Here, the result of dictionary lookup is stored in each area, and the headword area: JWd2 = bias / JWd1 = measured value, semantic attribute: IAtr2 = approximately / IAtr1 = environment, translation: EWd1 = m
stored in the main storage device 5 as an easurement, and
Go to S4.

【0039】ステップS4: 埋め込みルールの発火 ステップS3により得られた意味属性IAtr1 、IAtr2 より
IAtr1==RAtr1、IAtr2==RAtr2を満足し、ステップS2によ
り得られたフレーム見出しに基づいて、Fr1(i)==JFrm1
(j)、Fr2(i)==JFrm2(j)となるルールを、図6の埋め込
みルール15より発火させる。
Step S4: From the semantic attributes IAtr1 and IAtr2 obtained in the firing step S3 of the embedding rule
IAtr1 == RAtr1, IAtr2 == RAtr2 is satisfied, and based on the frame header obtained in step S2, Fr1 (i) == JFrm1
(j), a rule where Fr2 (i) == JFrm2 (j) is fired from the embedding rule 15 in FIG.

【0040】図2の例文中の『測定値に応じてバイアス
を決定する』について説明すると、図6の埋め込みルー
ル15のフレーム訳語選択条件において、第1埋め込み語
『測定値』の意味属性は『環境』であり、第2埋め込み
語『バイアス』の意味属性は『程度』である。よって、
訳語選択条件を満足するルールである第1番目のルール
が発火することになる。このように、埋め込みルールが
発火した場合には、ステップS5に進み、発火しない場合
はステップS9に進む。
Referring to “determining bias according to measured value” in the example sentence of FIG. 2, in the frame translation word selection condition of embedding rule 15 in FIG. 6, the semantic attribute of the first embedded word “measured value” is “ Environment ”, and the semantic attribute of the second embedded word“ bias ”is“ degree ”. Therefore,
The first rule that satisfies the translation selection condition is fired. As described above, when the embedding rule is fired, the process proceeds to step S5, and when not fired, the process proceeds to step S9.

【0041】ステップS5: 埋め込み構文の決定及び訳文
生成時までの継承情報の決定 ステップS4のルールの発火により、埋め込みパターンが
2であることが決定する。補助記憶装置4上の埋め込み
パターン13(図4)を参照すると、n(j)=2であることか
ら、原文フレームおよび訳文フレームは次の様になる。
Step S5: Determination of embedded syntax and translated text
It is determined that the embedding pattern is 2 by the firing of the rule in step S4 for determining the inheritance information until generation . Referring to the embedding pattern 13 (FIG. 4) in the auxiliary storage device 4, since n (j) = 2, the original sentence frame and the translated sentence frame are as follows.

【0042】JPatern(j)= 第1埋め込み語+第1フレー
ム(+第2埋め込み語) EPatern(j)= 第1フレーム+第1埋め込み語
JPatern (j) = first embedded word + first frame (+ second embedded word) EPatern (j) = first frame + first embedded word

【0043】また、この埋め込み対象部分の、文中にお
ける品詞的役割は、埋め込みルール15(図6)の発火し
たルールにより、連用修飾語である。
The part-of-speech role of the part to be embedded in the sentence is a continuous modifier according to the firing rule of the embedding rule 15 (FIG. 6).

【0044】図2の例文中には、同一の原文フレーム
『に応じて』が3ヵ所存在する。
In the example sentence shown in FIG. 2, there are three identical original sentence frames "according to".

【0045】測定値に応じてバイアスを決定する。The bias is determined according to the measured value.

【0046】規格条件に応じて目標電位を調整する。The target potential is adjusted according to the standard conditions.

【0047】マイクロコンピュータは倍率に応じて
稿の寸法を計算する。
The microcomputer calculates the size of the original according to the magnification.

【0048】これらの埋め込み対象部分は次の通りであ
る。(以降、は上記の例文を示す。) 測定値に応じて 規格条件に応じて 倍率に応じて については、ステップS4で第1番目のルールが発火し
たことより、『に応じて』のフレーム訳語は『to sui
t』に決定する。およびについても、ステップS2〜
ステップS4の同様の手続きを経て、については2番目
のルールが発火して、フレーム訳語は『according to』
となり、については3番目のルールが発火してフレー
ム訳語は『based on』と決定する。
The portions to be embedded are as follows. (Hereinafter, the above example sentence is shown.) According to the measured value, according to the standard condition, according to the magnification, the first rule is fired in step S4, so the frame translation of “according to Is "to sui
t ”. And also from step S2
After the same procedure in step S4, the second rule fires, and the frame translation is "according to"
, The third rule fires and the frame translation is determined to be "based on".

【0049】本実施例によれば、図2の例文に示す如く
原文中において、同一のフレーム見出しが複数個、原文
中に存在していても、フレームの訳語選択条件の発火に
より、訳し分けができ、逆に、フレーム訳語に多義語が
存在していても同様の手続きを経て多義語選択の解消を
行うことができる。更に、この埋め込み対象部分の訳文
中の役割は副詞句を生成し、生成位置は文末で、文末よ
り動詞を修飾することが決定する。
According to the present embodiment, as shown in the example sentence of FIG. 2, even if a plurality of the same frame headings exist in the original sentence, the translation is divided by the firing of the translation word selection condition of the frame. Conversely, even if a polysemy exists in the frame translation, the polysemy selection can be eliminated through the same procedure. Furthermore, the role of the portion to be embedded in the translation is to generate an adverb phrase, the generation position is at the end of the sentence, and it is determined that the verb is modified from the end of the sentence.

【0050】これらの情報は、訳文生成時まで継承情報
として埋め込みコードと共に保持される。
These pieces of information are held together with the embedded code as inheritance information until a translated sentence is generated.

【0051】訳文生成時までの継承情報の例 例『測定値に応じてバイアスを決定する』 埋め込み訳語の語順 Position(j)=逆順 原文での品詞 JPart(j)= 連用修飾語 訳文での品詞 EPart(j)= 副詞句:文末 埋め込みコード Code(j)=#200&& 構文及び継承情報が決定したなら、ステップS6に進む。Example of inheritance information up to the time of generation of translated sentence Example "Determine bias according to measured value" Word order of embedded translation Position (j) = reverse order Part of speech in original sentence JPart (j) = Modified word of continuous use Part of speech in translated sentence EPart (j) = Adverb phrase: end of sentence Embed code Code (j) = # 200 && When the syntax and inheritance information are determined, the process proceeds to step S6.

【0052】ステップS6: 埋め込み対象部分の訳文への
変換 ステップS6では、埋め込み文変換部10に処理を進め、ス
テップS3で決定した埋め込み訳語とステップS4及びステ
ップS5で決定した訳文パターンとにより、原文の単語の
訳語への変換と構文構造の変換を行う。 例『測定値に応じてバイアスを決定する』 I)原文から訳文への埋め込み語の変換 JWd1= 測定値 → EWd1=measurement (JWd2= バイアス) ルール発火のために用いる II)原文パタ−ンから訳文パターンへの変換 n(j)=2 JWd1+JFrm1(+JWd2) = 測定値+に応じて(+バイアス) ↓ EFrm1+EWd1 = to suit + measurement 埋め込み文変換部10により得た変換結果に対して、形態
素生成を加える。この例においては、『the 』を付加
し、『to suit the measurement 』となる。以下、結果
のみを示すが、およびは、次のようになる。
Step S6: Inserting the part to be embedded into the translated sentence
In the conversion step S6, the process proceeds to the embedded sentence conversion unit 10, and the embedded translation word determined in step S3 and the translation pattern determined in step S4 and step S5 convert the original word into a translation word and convert the syntax structure. Do. Example: “Determine bias according to measured value” I) Conversion of embedded word from original text to translated text JWd1 = measured value → EWd1 = measurement (JWd2 = bias) Used for firing rules II) Translated text from original text pattern Conversion to pattern n (j) = 2 JWd1 + JFrm1 (+ JWd2) = According to measured value + (+ bias) ↓ EFrm1 + EWd1 = to suit + measurement For conversion result obtained by embedded sentence conversion unit 10 Add morpheme generation. In this example, "the" is added, resulting in "to suit the measurement". Hereinafter, only results are shown, and are as follows.

【0053】規格条件に応じて目標電位を調整する。The target potential is adjusted according to the standard conditions.

【0054】埋め込み対象部分:規格条件に応じて→ac
cording to the specified condition マイクロコンピュータは倍率に応じて原稿の寸法を計
算する。
Embedding part: → ac according to standard conditions
The microcomputer calculates the size of the document according to the magnification.

【0055】埋め込み対象部分:倍率に応じて→based
on the reduction ratio 埋め込み文変換部10により処理されたその他の埋め込み
対象部分についても、同様に変換される。ここで、以上
の変換により得られた埋め込み対象部分の変換結果と埋
め込みコードとをテーブル上に対応づけ、図7に示す原
文→訳文変換テーブル16として主記憶装置5上に展開す
る。
Embedding part: → based on magnification
On the reduction ratio The other embedding target portions processed by the embedding sentence conversion unit 10 are similarly converted. Here, the conversion result of the portion to be embedded obtained by the above-described conversion and the embedding code are associated with each other on a table, and are developed on the main storage device 5 as an original sentence → translation sentence conversion table 16 shown in FIG.

【0056】なお、この段階で、原文中の修飾先が情報
として得られていなくてもよい。その理由は、グループ
化された語群で品詞情報を与えることから、後の機械翻
訳処理において、修飾先の候補の組み合わせが限定さ
れ、容易に修飾先が決定できるからである。
At this stage, the modification destination in the original text may not be obtained as information. The reason is that the part-of-speech information is given by the grouped words, so that in the subsequent machine translation processing, the combination of candidates for the modification destination is limited, and the modification destination can be easily determined.

【0057】埋め込みコードと対応づけて記憶させた内
容 について 埋め込みコード Code(j)=#200&& 原文での埋め込み対象部分 JWd1+JFrm1= 測定値に応じ
て 訳文での変換結果 EFrm1+EWd1= to suit the
measurement 訳文での品詞 Epart(j)= 副詞句:文末 次に、ステップS7に進む。
About the contents stored in association with the embed code Embed code Code (j) = # 200 && Target part to be embedded in original text JWd1 + JFrm1 = Conversion result in translation according to measured value EFrm1 + EWd1 = to suit the
measurement Part of speech in translation Epart (j) = adverb phrase: end of sentence Next, the process proceeds to step S7.

【0058】ステップS7: 埋め込み対象文章と対象外文
章との判定 原文フレームの見出しに合致するフレームが存在しない
場合は、入力文書の全てが通常の機械翻訳処理を経て処
理される。逆に、入力装置1により入力された原文が全
て登録されたフレームと組み合わせる語からなる場合
は、この生成する文書全体に形態素生成を加えて、出力
装置3より生成結果を出力する。
Step S7: sentences to be embedded and sentences not to be embedded
If there is no frame that matches the header of the original text frame determined as a chapter , all of the input document is processed through normal machine translation processing. Conversely, when the original sentence input by the input device 1 is composed of words to be combined with the registered frames, morpheme generation is added to the entire generated document, and the output device 3 outputs the generation result.

【0059】実際には、全文が埋め込み対象文章からな
ると言うのは少なく、図2の例文では、埋め込み対象文
章が5文章存在し、対象外は5文章からなる。従って、
埋め込み法により得られた翻訳結果と、通常の機械翻訳
処理を経て得られる翻訳結果とを合成する必要がある。
ここでは以上のことを判定する。
Actually, it is rare that the whole sentence is composed of the sentences to be embedded. In the example sentence of FIG. 2, there are five sentences to be embedded, and the non-target includes five sentences. Therefore,
It is necessary to synthesize a translation result obtained by the embedding method and a translation result obtained through normal machine translation processing.
Here, the above is determined.

【0060】判定の結果、入力文書の全てが埋め込み対
象文章からなる場合は、ステップS7からステップS10 へ
進み、埋め込み文生成部11で処理を行う。一方、入力文
書が埋め込み対象文章と対象外文章からなる場合(第2
の例文)は、ステップS8に進む。
As a result of the determination, if all of the input documents are composed of sentences to be embedded, the process proceeds from step S7 to step S10, where the embedded sentence generation unit 11 performs processing. On the other hand, if the input document is composed of a sentence to be embedded and a sentence that is not
Example sentence) proceeds to step S8.

【0061】ステップS8: 埋め込みコードを原文に埋め
込む 図7の原文→訳文変換テーブルを参照して、原文での埋
め込み対象部分を埋め込みコードに変換する。原文中の
埋め込みコードの埋め込み位置が確定することにより、
埋め込み位置と埋め込みコードとを対応づけた図9の埋
め込み文テーブル17を主記憶装置5上に展開する。
Step S8: Embedding the embed code in the original text
Referring to original → translation conversion table of FIG. 7 writing, to convert the embedding target portion in a textual embedded code. By determining the embedding position of the embed code in the original text,
The embedding sentence table 17 of FIG. 9 in which the embedding position and the embedding code are associated with each other is developed on the main storage device 5.

【0062】このテーブル17では、埋め込み位置情報と
して行と桁とを用いているが、これに代えて、埋め込み
コードの出現順位を与えるようにしても、移行の処理に
おいて、同様に機能させることができる。 例『測定値に応じてバイアスを決定する』→『#200&&
ハ゛イアスを決定する。』 埋め込み位置情報:No:BdN(j)=1 行:Rw(j)=1 桁:clm(j)=1 埋め込みコード: Code(j)=#200&& 埋め込み対象部分の生成された訳: EFrm1+EW
d1= to suit the measureme
nt この例では、埋め込みコードは#200&&であること
から、原文→訳文変換テーブル16を参照して、訳文での
品詞的役割は副詞句であり、生成位置情報は文末位置で
後方より動詞を修飾することが、継承情報として保持で
きる。
In this table 17, the row and the digit are used as the embedding position information. Alternatively, even if the appearance order of the embedding code is given, the same function can be performed in the transition processing. it can. Example: " Determine bias according to measured value " → "# 200 &&
Determine the bias. Embedding position information: No: BdN (j) = 1 Line: Rw (j) = 1 Digit: clm (j) = 1 Embedding code: Code (j) = # 200 && Translation target part generated: EFrm1 + EW
d1 = to switch the measure
nt In this example, since the embedding code is # 200 &&, the part-of-speech role in the translated sentence is an adverb phrase with reference to the original sentence → translation sentence conversion table 16, and the generation position information modifies the verb from the end at the end of the sentence. Can be retained as inheritance information.

【0063】他の埋め込み対象部分も同様に埋め込みコ
ードに置き換え、図8のごとく、“埋め込みコード”を
埋め込んだ原文を得る。これを主記憶装置5上の*input
18に展開し、原文→訳文変換テーブル16及び埋め込み文
テーブル17を翻訳処理部8に引き渡す。以上の処理を受
け持つのがコード埋め込み部7である。続いて、ステッ
プS9に進む。
The other embedding target parts are similarly replaced with the embedding code, and the original text in which the “embedding code” is embedded is obtained as shown in FIG. This is stored in * input on main memory 5.
Then, the original sentence → translation sentence conversion table 16 and the embedded sentence table 17 are delivered to the translation processing unit 8. The code embedding unit 7 is responsible for the above processing. Subsequently, the process proceeds to step S9.

【0064】ステップS9: 翻訳処理部8での処理 翻訳処理部8では、原文→訳文変換テーブル16及び埋め
込み文テーブル17を参照して、埋め込みコードの訳文で
の品詞と生成位置を決定して、翻訳処理を行う。
Step S9: Processing in the translation processing section 8 The translation processing section 8 refers to the original-to-translation sentence conversion table 16 and the embedded sentence table 17 to determine the part of speech and the generation position in the translated sentence of the embedded code. Perform translation processing.

【0065】原文→訳文変換テーブル16による継承情報 について 埋め込みコード:Code(j)=#200&& 原文での品詞 :Jpart(j)= 連用修飾語 修飾先 :ModifyPart(j)=決定する 訳文での品詞 :Epart(j)= 副詞句:文末 *input上に展開された例文のの翻訳処理前 (図8に
示す)
Inheritance information based on original-to-translation translation table 16 Embedding code: Code (j) = # 200 && Part of speech in original: Jpart (j) = Continuous modifier Modifier: ModifyPart (j) = determine Part of speech in translated : Epart (j) = Adverb phrase: end of sentence * Before translation of example sentence expanded on input (shown in Fig. 8)

【0066】[0066]

【外1】 例文のの翻訳処理部8による生成結果[Outside 1] Example sentences generated by translation processing unit 8

【0067】[0067]

【外2】 [Outside 2]

【0068】上記に示した継承情報を参照して、埋め込
みコードの訳文結果を文末位置に生成し、文末より、動
詞を修飾する様に訳文生成を翻訳処理部8で行う。他の
埋め込みコードについても同様の処理を施し、翻訳処理
部8により生成された結果を*output19 上に展開する。
この結果の生成途中の訳文を図10に示す。ステップS10
に進む。
Referring to the inheritance information described above, a translation result of the embedded code is generated at the end of the sentence, and a translation is generated by the translation processing unit 8 so as to modify the verb from the end of the sentence. The same processing is performed on other embedded codes, and the result generated by the translation processing unit 8 is expanded on * output19.
FIG. 10 shows a translated sentence during the generation of this result. Step S10
Proceed to.

【0069】ステップS10:埋め込みコードを訳語に変換 ステップS10 では、翻訳処理部8からの生成結果(*outp
ut19 )を、埋め込み文生成部11に受け渡す。埋め込み文
生成部11は、生成結果中より埋め込みコードを検出し、
図9に示す埋め込み文テーブル17を参照して、埋め込み
コードを、対応する埋め込み対象部分の生成された訳と
置換する。
Step S10: Convert the embedded code into a translated word In step S10, the generation result (* outp
ut19) is passed to the embedded sentence generation unit 11. The embedded sentence generation unit 11 detects an embedded code from the generation result,
Referring to the embedded sentence table 17 shown in FIG. 9, the embedded code is replaced with the generated translation of the corresponding portion to be embedded.

【0070】翻訳処理部8から受け渡された生成結果
(図10に示す) *output19 のの内容: Determines the bias #200&
&. 図9の埋め込み文テーブル17の継承情報 埋め込み位置No:BdN(j)=1 埋め込みコード:Code(j)=#200&& 埋め込み対象部分の生成された訳 EFrm1+EWd1= to suit the measurement 埋め込み文生成部11で生成された結果 『Determines the bias to suit the measuremenet. 』 *output19 上から埋め込みコード#200&&を検出し、図9の
埋め込み文テ−ブル17を参照して、埋め込み位置BdN(j)
=1に対応する訳EFrm1+EWd1=to suit the measurementと
変換する。その結果、上記のような埋め込み文生成部11
で生成された結果を得る。その他の埋め込みコードにつ
いても、同様に処理を行うことで、図11に示す生成され
た埋め込み文を得る。本処理において、更に、*output1
9 中の生成結果に対して、必要な形態素生成を施す。
Generation result passed from translation processing unit 8
(Shown in Figure 10) * Contents of output19: Determines the bias# 200 &
&Inheritance information of embedded sentence table 17 in FIG. 9 Embedding position No: BdN (j) = 1 Embedding code: Code (j) = # 200 && Translation of part to be embedded EFrm1 + EWd1 = to suit the measurement Embedding sentence generation Result generated by part 11 `` Determines the bias to suit the measuremenet. '' * Output 19 embed code # 200 && detected from above,
Referring to the embedded sentence table 17, the embedding position BdN (j)
EFrm1 + EWd1 = to suit the measurement
Convert. As a result, the embedded sentence generation unit 11
To get the result generated by About other embed codes
However, by performing the same processing, the
Get embedded sentence. In this processing, * output1
9 The necessary morpheme generation is performed on the generation result in 9.

【0071】例えば、 埋め込みコード変換前 #400&&. 埋め込みコード変換後after end of LSTR until the COPY START KEY is turn
ed ON. 形態素生成後After end of LSTR until the COPY START KEY is turn
ed ON. この様に、文章の先頭を大文字にするなどの作業が存在
する。勿論、3単現の処理や単複の処理も、必要に応じ
て実行する。
For example, # 400 &&. Before embedding code conversion after end of LSTR until the COPY START KEY is turn
ed ON. After morpheme generation After end of LSTR until the COPY START KEY is turn
ed ON. In this way, there are tasks such as capitalizing the beginning of sentences. Of course, the processing of three simplexes and the processing of a single simplex are also executed as necessary.

【0072】ステップS11:出力装置から出力 *output19 の内容を出力装置3により出力する。 Step S11: The output device 3 outputs the contents of the output * output19 from the output device.

【0073】上記実施例においては、フレーム表現辞書
12が、フレームの見出しと、埋め込み語の品詞属性と、
埋め込みパターンの番号とを備え、埋め込みルール15
が、フレームの見出しと、フレームの訳語と、フレーム
の訳語の選択条件としての埋め込み語の意味属性と、埋
め込み訳語の語順と、埋め込み対象部分の変換コード
と、埋め込みパターンの番号とを備えるようにしてい
る。
In the above embodiment, the frame expression dictionary
12 is the heading of the frame, the part of speech attribute of the embedded word,
With the number of the embedding pattern, the embedding rule 15
Has the heading of the frame, the translation of the frame, the semantic attribute of the embedding word as the selection condition of the translation of the frame, the word order of the embedding translation word, the conversion code of the embedding target part, and the number of the embedding pattern. ing.

【0074】しかしながら、フレーム表現辞書12及び埋
め込みルール15の構成はこれに限らず、両者を参照する
ことで、フレームが抽出でき、埋め込み語の品詞・意味
属性に基づいて、フレームの訳語、埋め込み訳語の語順
と、埋め込み対象部分の変換コード、埋め込みパターン
が決定されるように構成されていれば、両者の間で項目
の一部に異同があっても、3つ以上に分割されていて
も、1つにまとめられていてもよい。また、埋め込み箇
所が3か所以上存在するような場合にも、同様の手法に
より、対処することができる。
However, the configurations of the frame expression dictionary 12 and the embedding rule 15 are not limited to the above. A frame can be extracted by referring to both, and the translation of the frame and the embedded translation can be extracted based on the part of speech / semantic attribute of the embedding word. , The conversion code of the embedding target portion, and the embedding pattern are determined, even if there is a difference in some of the items between the two, even if it is divided into three or more, They may be combined into one. Further, even when there are three or more embedding portions, it is possible to cope with the same method.

【0075】なお、本発明の機能が実行されるのであれ
ば、単体の装置であっても、複数の装置からなるシステ
ムであってもよい。また、装置もしくはシステムにプロ
グラムを供給することにより処理が行なわれる場合であ
っても、本発明が適用されることは言うまでもない。
As long as the functions of the present invention are performed, a single device or a system including a plurality of devices may be used. Further, it goes without saying that the present invention is applied even when the processing is performed by supplying a program to an apparatus or a system.

【0076】以上説明した本実施例によれば、繰り返し
使用される表現や、特定の言い回し表現において、原文
及び訳文の表現をフレームとして登録し、フレームの内
側あるいは外側に組み合わせて用いる語、句、節、文を
訳語辞書として登録し記憶させている。
According to the present embodiment described above, in expressions used repeatedly or in specific wording expressions, expressions of the original sentence and the translated sentence are registered as frames, and words, phrases, and combinations used inside or outside the frames are registered. Sections and sentences are registered and stored as a translation dictionary.

【0077】これは、丁度、文章の中に( )を設け、
( )外はフレームとして、( )内に埋め込む語は訳
語辞書として予め登録しておくようなものである。そし
て、その( )の前後に出現した言葉の流れから、(
)内の言葉を埋め込む作業となる。このことにより、
文章中にフレームを検出すると、組み合わせて用いる
語、すなわち、( )内に埋め込む語を、訳語辞書の辞
書引きを行って決定し、訳文生成時にフレームの訳語と
埋め込み訳語とを原文から訳文への構文変換パターンに
基づいて目標とする訳文を生成する。
This is because just () is provided in the text,
The frames outside the parentheses are registered as frames, and the words embedded in the parentheses are registered as a translation word dictionary in advance. Then, from the flow of words that appeared before and after (), (
Embed the words in parentheses). This allows
When a frame is detected in a sentence, a word to be used in combination, that is, a word to be embedded in parentheses, is determined by performing a dictionary lookup of the translation dictionary, and when generating a translation, the translation of the frame and the embedded translation are converted from the original to the translation. A target translation is generated based on the syntax conversion pattern.

【0078】この方法は、従来の機械翻訳処理において
複雑でかつ精度の要求される解析と生成をするのではな
く、構文構造及び語彙の相互関連や変換パターンを利用
して、グループ化された語群に対して、一対一のmappin
g を行う方法である。言い変えると、原文中に登録され
た固定された表現や特定の表現が存在すると、これを検
出し、この表現と組み合わせて用いる語、句、節、文の
埋め込み対象部分の情報を元に埋め込みル−ルが発火し
て構文変換のパタ−ンが定まり、目標文の訳文フレーム
と埋め込み訳語を訳語辞書の辞書引きにより決定し、訳
文フレームに埋め込み訳語を埋め込むことを特徴とす
る。
This method does not perform the analysis and generation that is complicated and requires high precision in the conventional machine translation processing, but uses the mutual relation of the syntactic structure and vocabulary and the conversion pattern to group words. For groups, one-to-one mappin
How to do g. In other words, if there is a fixed expression or a specific expression registered in the original sentence, it is detected and embedded based on the information of the word, phrase, clause, sentence to be embedded used in combination with this expression. The rule is fired, the pattern of syntax conversion is determined, the translation frame of the target sentence and the embedded translation are determined by dictionary lookup of the translation dictionary, and the embedded translation is embedded in the translation frame.

【0079】ここで、フレームと埋め込み語を合わせて
埋め込み対象部分と言うとすれば、この対象部分に、原
文から訳語への品詞情報や埋め込み対象の中に存在する
語を互いに関連する語のグループとして継承させること
により、繋がりのある語であることの情報を訳文生成時
まで保持することができ、訳文生成時に原文の語群から
目標文の対応のある語群として、翻訳文を生成すること
ができる。
Here, if the frame and the embedding word are combined and referred to as an embedding target portion, the target portion includes the part of speech information from the original sentence to the translated word and the word existing in the embedding target as a group of words related to each other. By inheriting as, it is possible to retain information on connected words until the translated sentence is generated, and to generate a translated sentence from the original sentence group as the target sentence group when the translated sentence is generated. Can be.

【0080】文を最小単位の語に分割して、一旦、バラ
バラにして並び換える方法では、語の修飾先の決定など
においては、候補となる修飾先の多義性の解消が問題と
なるが、上述のように、グループ化された語群で一括し
て品詞情報を処理することにより、修飾先の候補の組み
合わせも限定され、修飾先の多義性の解消が容易にな
る。従って、原文の語順から目標文での語順に従い、正
しい生成位置に生成することができ、どの位置から修飾
して行くかが容易になり、目標言語らしい語順の生成に
寄与する。
In a method in which a sentence is divided into words of the minimum unit and rearranged once in a random manner, in the determination of the modification destination of a word, etc., there is a problem in eliminating polysemy of candidate modification destinations. As described above, by processing the part-of-speech information collectively with the grouped words, the combinations of the candidates for the modification destination are also limited, and the ambiguity of the modification destination can be easily eliminated. Therefore, it can be generated at a correct generation position according to the word order of the original sentence from the word order of the target sentence, and it becomes easy to modify from which position to modify, thereby contributing to the generation of a word order suitable for the target language.

【0081】翻訳対象となる文章は、日本語から英語へ
の変換を例に挙げると、主部、述部に分割され、かつ、
それらを修飾する連体修飾語や連用修飾語の構造に分割
される。変換後の英語の構造は句構造で構成され、副詞
句、名詞句、動詞句、形容詞句などに変換され、この語
群の単位で変換される場合が多い。
For example, when a sentence to be translated is converted from Japanese into English, it is divided into a main part and a predicate, and
The structure is divided into adnominal modifiers and repeated modifiers that modify them. The converted English structure is composed of a phrase structure, and is converted into an adverb phrase, a noun phrase, a verb phrase, an adjective phrase, and the like, and is often converted in units of this word group.

【0082】これに着目して、埋め込み対象部分に対し
て原文での品詞情報および目標文での品詞情報を埋め込
み対象部分単位に与えることにより、目標文での生成位
置が文法情報に従って決定できる。勿論、特定位置に生
成位置を指定することもできる。これにより、複数の語
群の間で組み合わせるべき語が違うグループの語群に入
れ子になるなどのことが回避できる。
By paying attention to this, by giving the part of speech information in the original sentence and the part of speech information in the target sentence to the embedding target part in units of the embedding target part, the generation position in the target sentence can be determined according to the grammatical information. Of course, the generation position can be specified at the specific position. As a result, it is possible to prevent words to be combined among a plurality of word groups from being nested in different word groups.

【0083】この様に、構文構造の解析則や生成則によ
らないから、原文では名詞で訳文では節を生成すると
か、原文では動詞で目標文では副詞に品詞の変換が行わ
れる場合などの、構文構造での異質な変換や品詞の変換
の場合に、フレーム訳語や埋め込み訳語に品詞情報を与
えることで、パターンの変換ルールに従って、訳文を生
成することができる。
As described above, since parsing rules are not based on parsing rules or generating rules of the syntactic structure, there are cases where nouns are used in the original sentence and clauses are generated in the translated sentence, or parts of speech are converted into verbs in the original sentence and adverbs in the target sentence. In the case of heterogeneous conversion or part-of-speech conversion in a syntactic structure, by giving part-of-speech information to a frame translation or an embedded translation, a translation can be generated in accordance with a pattern conversion rule.

【0084】更に、原言語と目標言語の言語間の構造の
違いに着目し、構造を形づくるスケルトンを原文フレー
ムと訳文フレームとして登録し、埋め込み対象部分単位
に品詞情報を与えることにより、構文構造の変換パター
ンの一対一対応を図り、機械翻訳システムが持つ一般的
な変換則や構文生成則に縛られずに実態に合った訳を生
成することができる。
Further, paying attention to the difference in structure between the source language and the target language, the skeleton forming the structure is registered as an original sentence frame and a translated sentence frame, and part-of-speech information is given to each unit to be embedded, thereby giving a syntactic structure. It is possible to generate one-to-one correspondence between conversion patterns and generate a translation that matches the actual situation without being bound by general conversion rules and syntax generation rules of the machine translation system.

【0085】また、繰り返し使用される表現あるいは言
い回し表現などで特定の表現をフレームとして登録で
き、そのフレームの内側あるいは外側に組み合わせて用
いる語、句、節、文を埋め込み語として登録できる様に
することにより、埋め込みパターンと語彙の相互関連を
繋がりのある語群として保持し、訳文生成時まで継承で
きる様にした。
Further, a specific expression such as an expression used repeatedly or a phrase expression can be registered as a frame, and words, phrases, clauses, and sentences used in combination inside or outside the frame can be registered as an embedded word. Thus, the mutual relationship between the embedding pattern and the vocabulary is held as a connected word group, and can be inherited until the translated sentence is generated.

【0086】また、埋め込みのパターン、構文構造変換
パターンを原文から訳文への変換パターンとしてルール
化することにより、このルールを発火させて訳文フレー
ムの内側あるいは外側に埋め込み訳語として埋め込むこ
とができ、グループ化された語群の生成ができる様にし
た。フレーム抽出部では、登録したフレームを入力文章
中より抽出することにより入力文章中の埋め込み対象部
分を決定できる様にした。
Further, by forming rules of the embedding pattern and the syntax structure conversion pattern as a conversion pattern from the original sentence to the translated sentence, this rule can be fired and embedded as an embedded translated word inside or outside the translated sentence frame. It is now possible to generate a generalized word group. The frame extracting unit can determine a portion to be embedded in the input text by extracting the registered frame from the input text.

【0087】以上のことにより、従来の機械翻訳システ
ムでは実現が困難であった言い回し表現や、「この場合
にはこの様に表現する」といった特定の表現の翻訳が可
能になった。
As described above, it has become possible to translate a wording expression, which is difficult to realize with a conventional machine translation system, and a specific expression such as "in this case, such an expression".

【0088】また、語の係り先の候補が複数存在する場
合に、複数の語群の間で組み合わせるべき語が違うグル
ープの語群に入れ子になるなどの問題があったが、埋め
込みパターンと語彙の相互関連性を訳文生成時まで継承
させることにより、この様な事の発生確率を小さくし
た。更に、対応関係がない構文構造の変換や語彙の原文
での品詞と訳文での品詞が違う場合においても、原文か
ら訳文への変換パターンのルールを発火させることによ
り、一対一の対応を図ることができる。
Further, when there are a plurality of candidate words, the words to be combined among a plurality of word groups are nested in a different group of words. The probability of occurrence of such a thing is reduced by inheriting the relevance of each other until the translation is generated. Furthermore, even if there is no correspondence between the syntactic structure and the part of speech in the original sentence and the part of speech in the vocabulary are different, one-to-one correspondence should be achieved by firing the rule of the conversion pattern from the original to the translated sentence. Can be.

【0089】更に、従来の機械翻訳システムでは、一般
則の適用により目標文を生成させようとするため個々の
表現に対して適切でない表現を生成し、感性の悪い文章
を生成していたが、本実施例では、互いの語の繋がりを
保持して訳すため、全体として締まった文章となり、
『この場合はこの様に訳す』という特定の表現は、補助
記憶装置上に記憶させた埋め込みルール及び変換パター
ンのルールの発火により、原文の表現から訳文の表現
へ、一対一対応の変換ができるので、その場に応じた適
切な表現の精度を高め、構文構造の決定や係り受けの多
義性解消などにおいて、揺れの要素を減少させることが
できる。
Further, in the conventional machine translation system, in order to generate a target sentence by applying a general rule, an expression that is not appropriate for each expression is generated, and a sentence with poor sensitivity is generated. In the present embodiment, since the translation is performed while maintaining the connection between the words, the entire sentence becomes a tight sentence,
The specific expression "translate in this case" can be converted one-to-one from the original expression to the translated expression by firing the rules of the embedding rules and conversion patterns stored on the auxiliary storage device. Therefore, it is possible to increase the precision of expression appropriate for the situation, and to reduce the swaying factor in determining the syntactic structure and eliminating the polysemy of dependency.

【0090】[0090]

【発明の効果】以上説明したように、本発明によれば、
原文の著者の感性を、翻訳文に反映させ、翻訳結果の正
確性を高めるとともに、翻訳結果の文章としての完成度
をより高くすることができるという効果がある。
As described above, according to the present invention,
The effect is that the sensitivity of the original sentence can be reflected in the translated sentence, the accuracy of the translated result can be improved, and the completeness of the translated result as a sentence can be further increased.

【0091】構造単位のmapping をパターン化すること
により、日本語から英語への変換の場合で説明すると、
連用修飾語や連体修飾語のまとまった単位で翻訳するこ
とができ、従来の機械翻訳のように形態素解析などの過
程を経て、文章を語の単位でバラバラに分割して訳語を
並び換えるのではないので、原文の意図したものを翻訳
結果に如実に表現できる。
By converting the structural unit mapping into a pattern, the case of converting from Japanese to English will be described.
It can be translated in units of continuous modifiers and continuous modifiers, and through a process such as morphological analysis like conventional machine translation, the sentence is divided into individual words and the translated words are rearranged. Since there is no translation, the intended result of the original text can be clearly expressed in the translation result.

【0092】更に、言い回し表現などにおいて、この場
合にはこの様に翻訳するということが、隣接する単語の
連鎖の情報などを活用することにより、より現実に相応
しい言い回しで、意図した表現を実現できる。
Further, in the case of a wording expression or the like, in this case, such translation means that the intended expression can be realized with a wording more suitable for reality by utilizing information of a chain of adjacent words. .

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明を適用した埋め込み機械翻訳システムの
基本ブロック図である。
FIG. 1 is a basic block diagram of an embedded machine translation system to which the present invention is applied.

【図2】埋め込み対象文章が含まれる例文と埋め込み対
象部分の抽出過程を示す図である。
FIG. 2 is a diagram illustrating an example sentence including an embedding target sentence and a process of extracting an embedding target portion.

【図3】フレーム表現辞書の構成を示す図である。FIG. 3 is a diagram showing a configuration of a frame expression dictionary.

【図4】原文及び訳文の埋め込みパターンを示した図で
ある。
FIG. 4 is a diagram showing an embedding pattern of an original sentence and a translated sentence.

【図5】埋め込み訳語辞書の構成を示す図である。FIG. 5 is a diagram showing a configuration of an embedded translation word dictionary.

【図6】埋め込みルールの構成を示す図である。FIG. 6 is a diagram showing a configuration of an embedding rule.

【図7】原文→訳文変換テーブルの構成を示す図であ
る。
FIG. 7 is a diagram showing a configuration of an original sentence → translation sentence conversion table.

【図8】埋め込みコードを埋め込んだ原文の例を示す図
である。
FIG. 8 is a diagram showing an example of an original sentence in which an embedded code is embedded.

【図9】埋め込み文テーブルの構成を示す図である。FIG. 9 is a diagram showing a configuration of an embedded sentence table.

【図10】生成途中の訳文の例を示す図である。FIG. 10 is a diagram showing an example of a translated sentence being generated.

【図11】生成された埋め込み文の例を示す図である。FIG. 11 is a diagram illustrating an example of a generated embedded sentence.

【図12】実施例の機械翻訳装置の翻訳処理手順を示す
フローチャートである。
FIG. 12 is a flowchart illustrating a translation processing procedure of the machine translation apparatus according to the embodiment.

【符号の説明】[Explanation of symbols]

1 入力装置 2 処理部 3 出力装置 4 補助記憶装置 5 主記憶装置 6 フレーム抽出部 7 コード埋め込み部 8 翻訳処理部 9 埋め込み文解析部 10 埋め込み文変換部 11 埋め込み文生成部 12 フレーム表現辞書 13 埋め込みパターン 14 埋め込み訳語辞書 15 埋め込みルール 16 原文→訳文変換テーブル 17 埋め込み文テーブル 18 *input 19 *output REFERENCE SIGNS LIST 1 input device 2 processing unit 3 output device 4 auxiliary storage device 5 main storage device 6 frame extraction unit 7 code embedding unit 8 translation processing unit 9 embedded sentence analysis unit 10 embedded sentence conversion unit 11 embedded sentence generation unit 12 frame expression dictionary 13 embedding Pattern 14 Embedding translated word dictionary 15 Embedding rules 16 Original sentence to translation translation table 17 Embedded sentence table 18 * input 19 * output

Claims (14)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 原文の特定表現に用いられる特定語句を
原文フレームとして記憶したフレーム記憶手段と、 前記原文フレームと、該原文フレームと組み合わされて
前記特定表現を構成する語または語群の属性とに対し
て、当該原文フレームに対応する訳文フレームと、前記
特定表現から該特定表現に対応する前記訳文フレームを
含んだ翻訳表現への構文構造の変換パターンとをルール
として記憶する変換ルール記憶手段と、 原文の単語の属性及び訳語を記憶した辞書手段と、 翻訳の対象となる原文を入力する入力手段と、 該入力手段より入力された原文中より、前記フレーム記
憶手段を参照して原文フレームを検出する検出手段と、 前記入力された原文中で、該検出手段により検出された
原文フレームと組み合わされて特定表現を構成している
語または語群の属性及び訳語を前記辞書手段より検索す
る検索手段と、 前記検出手段により検出された原文フレームと、該検索
手段により検索された語または語群の属性とに基づい
て、前記変換ルール記憶手段より適用すべきルールを選
出する選出手段と、 該選出手段により選出されたルールに基づいて、前記検
出された原文フレームに対応する訳文フレームと、前記
検出された原文フレームを含む特定表現から翻訳表現へ
の構文構造の変換パターンとを決定する決定手段と、 該決定手段により決定された訳文フレームに対して、該
決定手段により決定された変換パターンに基づいた位置
に、前記検索された語または語群の訳語を埋め込み、前
記入力された原文中の特定表現に対応する翻訳表現を生
成する生成手段と、 前記入力された原文が前記特定表現以外の部分を含むか
を判断する判断手段と、 該判断手段により、前記特定表現以外の部分を含むと判
断されたときは、当該特定表現を一まとまりとして前記
入力された原文を翻訳する翻訳手段と、 該翻訳手段による翻訳結果における前記特定表現に対応
する部分を、前記生成手段により生成された翻訳表現で
置換する置換手段とを具えたことを特徴とする機械翻訳
装置。
1. A frame storage means for storing a specific phrase used for a specific expression of an original sentence as an original sentence frame, an attribute of a word or a group of words constituting the specific expression in combination with the original sentence frame and the original sentence frame. Conversion rule storage means for storing, as rules, a translated sentence frame corresponding to the original sentence frame, and a conversion pattern of a syntax structure from the specific expression to a translation expression including the translated sentence frame corresponding to the specific expression. Dictionary means for storing the attributes and translations of the words of the original sentence; input means for inputting the original sentence to be translated; and, from the original sentence input from the input means, referencing the frame storage means to read the original frame. Detecting means for detecting, in the input original sentence, combining with the original sentence frame detected by the detecting means to form a specific expression A search unit for searching for the attribute and translation of the word or word group from the dictionary unit, an original text frame detected by the detection unit, and the attribute of the word or word group searched for by the search unit, A selection unit for selecting a rule to be applied from the conversion rule storage unit; a translation frame corresponding to the detected original text frame based on the rule selected by the selection unit; and a specification including the detected original text frame. Determining means for determining a conversion pattern of a syntactic structure from an expression to a translation expression; and determining the translation frame determined by the determining means at a position based on the conversion pattern determined by the determining means. Generating means for embedding a translated word of a word or group of words and generating a translated expression corresponding to the specific expression in the input original sentence; Determining means for determining whether the sentence includes a part other than the specific expression; and if the determining means determines that the sentence includes a part other than the specific expression, the input original text And a translating means for translating a part corresponding to the specific expression in the translation result by the translating means with the translated expression generated by the generating means.
【請求項2】 前記語群は、句、節、あるいは文である
ことを特徴とする請求項1に記載の機械翻訳装置。
2. The machine translation apparatus according to claim 1, wherein the word group is a phrase, a clause, or a sentence.
【請求項3】 前記ルール記憶手段は、前記ルールとし
て、前記翻訳表現の文法情報を対応する特定表現の文法
情報とは独立に含み、前記翻訳手段は、当該翻訳表現の
文法情報に基づいて、前記入力された原文を翻訳するこ
とを特徴とする請求項1に記載の機械翻訳装置。
3. The rule storage means includes, as the rule, grammatical information of the translated expression independently of grammatical information of a corresponding specific expression, and the translating means, based on grammatical information of the translated expression, 2. The machine translation apparatus according to claim 1, wherein the input original text is translated.
【請求項4】 前記文法情報は、品詞情報であることを
特徴とする請求項3に記載の機械翻訳装置。
4. The machine translation apparatus according to claim 3, wherein the grammatical information is part of speech information.
【請求項5】 前記文法情報は、文中の位置情報である
ことを特徴とする請求項3に記載の機械翻訳装置。
5. The machine translation apparatus according to claim 3, wherein the grammatical information is positional information in a sentence.
【請求項6】 前記生成手段は、形態素生成手段を有す
ることを特徴とする請求項1に記載の機械翻訳装置。
6. The machine translation apparatus according to claim 1, wherein the generation unit includes a morpheme generation unit.
【請求項7】 前記翻訳手段は、前記生成手段により生
成された翻訳表現を特定コードと対応付けてメモリに記
憶するとともに、当該翻訳表現に対応する前記入力され
た原文中の特定表現を当該特定のコードで置換して翻訳
し、前記置換手段は、前記特定コードにより前記メモリ
を参照して、前記翻訳表現を得ることを特徴とする請求
項1に記載の機械翻訳装置。
7. The translation unit stores the translation expression generated by the generation unit in a memory in association with a specific code, and identifies the specific expression in the input original sentence corresponding to the translation expression. 2. The machine translation apparatus according to claim 1, wherein the translation is performed by substituting and translating with the code, and the substitution unit obtains the translation expression by referring to the memory using the specific code.
【請求項8】 翻訳の対象となる原文を入力する入力工
程と、 該入力工程により入力された原文中より、原文の特定表
現に用いられる特定語句が原文フレームとして登録され
たフレーム記憶部を参照して原文フレームを検出する検
出工程と、 前記入力された原文中で、該検出工程により検出された
原文フレームと組み合わされて特定表現を構成している
語または語群の属性及び訳語を、原文の単語の属性及び
訳語が登録された辞書より検索する検索工程と、 前記原文フレームと、該原文フレームと組み合わされて
前記特定表現を構成する語または語群の属性とに対し
て、当該原文フレームに対応する訳文フレームと、前記
特定表現から該特定表現に対応する前記訳文フレームを
含んだ翻訳表現への構文構造の変換パターンとをルール
として記憶した変換ルール記憶部より、前記検出工程に
より検出された原文フレームと、前記検索工程により検
索された語または語群の属性とに基づいて、適用すべき
ルールを選出する選出工程と、 該選出工程により選出されたルールに基づいて、前記検
出された原文フレームに対応する訳文フレームと、前記
検出された原文フレームを含む特定表現から翻訳表現へ
の構文構造の変換パターンとを決定する決定工程と、 該決定工程により決定された訳文フレームに対して、該
決定工程により決定された変換パターンに基づいた位置
に、前記検索された語または語群の訳語を埋め込み、前
記入力された原文中の特定表現に対応する翻訳表現を生
成する生成工程と、 前記入力された原文が前記特定表現以外の部分を含むか
を判断する判断工程と、 該判断工程により、前記特定表現以外の部分を含むと判
断されたときは、当該特定表現を一まとまりとして前記
入力された原文を翻訳する翻訳工程と、 該翻訳工程による翻訳結果における前記特定表現に対応
する部分を、前記生成工程により生成された翻訳表現で
置換する置換工程とを具えたことを特徴とする機械翻訳
方法。
8. An inputting step of inputting an original sentence to be translated, and from the original sentence input in the inputting step, refer to a frame storage unit in which a specific phrase used for a specific expression of the original sentence is registered as an original sentence frame. Detecting an original sentence frame, and, in the input original sentence, an attribute and a translated word of a word or a group of words constituting a specific expression in combination with the original sentence frame detected by the detection step are written in the original sentence. A search step of searching from a dictionary in which the attributes and translations of the word are registered, the source text frame and the attributes of the words or word groups that constitute the specific expression in combination with the source text frame are compared with the source text frame. And a translation pattern of a syntax structure from the specific expression to a translation expression including the translation frame corresponding to the specific expression are recorded as rules. A selection step of selecting a rule to be applied from the stored conversion rule storage unit based on the original frame detected in the detection step and the attribute of the word or word group searched in the search step; A determining step of determining a translation frame corresponding to the detected original sentence frame and a conversion pattern of a syntax structure from a specific expression including the detected original sentence frame to a translated expression, based on the rule selected in the step; Embedded in the translation frame determined in the determining step, at a position based on the conversion pattern determined in the determining step, a translated word of the searched word or word group, A generating step of generating a translation expression corresponding to the expression; a determining step of determining whether the input original sentence includes a part other than the specific expression; A step of translating the input original sentence as a group when the specific expression is determined to include a portion other than the specific expression; and a process corresponding to the specific expression in a translation result by the translation step. A replacement step of replacing a part with the translation expression generated by the generation step.
【請求項9】 前記語群は、句、節、あるいは文である
ことを特徴とする請求項8に記載の機械翻訳方法。
9. The method according to claim 8, wherein the word group is a phrase, a clause, or a sentence.
【請求項10】 前記ルール記憶部は、前記ルールとし
て、前記翻訳表現の文法情報を対応する特定表現の文法
情報とは独立に含み、前記翻訳工程では、当該翻訳表現
の文法情報に基づいて、前記入力された原文を翻訳する
ことを特徴とする請求項8に記載の機械翻訳方法。
10. The rule storage unit includes, as the rule, grammatical information of the translated expression independently of grammatical information of a corresponding specific expression. In the translation step, based on grammatical information of the translated expression, 9. The machine translation method according to claim 8, wherein the input original text is translated.
【請求項11】 前記文法情報は、品詞情報であること
を特徴とする請求項10に記載の機械翻訳方法。
11. The machine translation method according to claim 10, wherein the grammatical information is part of speech information.
【請求項12】 前記文法情報は、文中の位置情報であ
ることを特徴とする請求項10に記載の機械翻訳方法。
12. The machine translation method according to claim 10, wherein the grammar information is position information in a sentence.
【請求項13】 前記生成工程は、形態素生成工程を有
することを特徴とする請求項8に記載の機械翻訳方法。
13. The machine translation method according to claim 8, wherein the generation step includes a morpheme generation step.
【請求項14】 前記翻訳工程は、前記生成工程により
生成された翻訳表現を特定コードと対応付けてメモリに
記憶する記憶工程と、当該翻訳表現に対応する前記入力
された原文中の特定表現を特定のコードで置換するコー
ド置換工程とを含み、前記置換工程は、前記特定コード
により前記メモリを参照して、前記翻訳表現を得るコー
ド検索工程を有することを特徴とする請求項8に記載の
機械翻訳方法。
14. The translation step includes: storing a translation expression generated in the generation step in a memory in association with a specific code; and storing a specific expression in the input original sentence corresponding to the translation expression. 9. A code replacement step of replacing with a specific code, wherein the replacement step includes a code search step of obtaining the translated expression by referring to the memory with the specific code. Machine translation method.
JP6089941A 1994-04-27 1994-04-27 Machine translation apparatus and method Expired - Fee Related JP2608384B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6089941A JP2608384B2 (en) 1994-04-27 1994-04-27 Machine translation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6089941A JP2608384B2 (en) 1994-04-27 1994-04-27 Machine translation apparatus and method

Publications (2)

Publication Number Publication Date
JPH07295992A JPH07295992A (en) 1995-11-10
JP2608384B2 true JP2608384B2 (en) 1997-05-07

Family

ID=13984737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6089941A Expired - Fee Related JP2608384B2 (en) 1994-04-27 1994-04-27 Machine translation apparatus and method

Country Status (1)

Country Link
JP (1) JP2608384B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324711A (en) * 1992-05-25 1993-12-07 Nippon Telegr & Teleph Corp <Ntt> Automatic translating method for natural language

Also Published As

Publication number Publication date
JPH07295992A (en) 1995-11-10

Similar Documents

Publication Publication Date Title
JP4911028B2 (en) Word translation device, translation method, and translation program
JP3356536B2 (en) Machine translation equipment
JP4404211B2 (en) Multilingual translation memory, translation method and translation program
JP3906356B2 (en) Syntax analysis method and apparatus
JP5235344B2 (en) Apparatus, method and program for machine translation
JPH02308370A (en) Machine translation system
JPH0351020B2 (en)
KR20030094632A (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
US4964030A (en) Apparatus for translating sentences containing punctuation marks
EP1655674A2 (en) THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI&amp;minus;LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
JP2007157123A (en) Improved chinese to english translation tool
USRE35464E (en) Apparatus and method for translating sentences containing punctuation marks
JP2608384B2 (en) Machine translation apparatus and method
JP2838984B2 (en) General-purpose reference device
JP2715875B2 (en) Multilingual summary generator
JP2719453B2 (en) Machine translation equipment
JP2947554B2 (en) Machine translation equipment
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program
JPH11282844A (en) Preparing method of document, information processor and recording medium
JPH06289890A (en) Natural language processor
JPH05225232A (en) Automatic text pre-editor
JPH11259474A (en) Machine translation system and machine translating method
JPH02110771A (en) Electronic translation device
JPH1011439A (en) English-japanese machine translation system
JPH0345423B2 (en)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080213

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100213

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100213

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110213

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140213

Year of fee payment: 17

LAPS Cancellation because of no payment of annual fees