JPH08329091A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH08329091A
JPH08329091A JP7156828A JP15682895A JPH08329091A JP H08329091 A JPH08329091 A JP H08329091A JP 7156828 A JP7156828 A JP 7156828A JP 15682895 A JP15682895 A JP 15682895A JP H08329091 A JPH08329091 A JP H08329091A
Authority
JP
Japan
Prior art keywords
term
frozen
machine translation
translated
translation device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7156828A
Other languages
Japanese (ja)
Other versions
JP3383478B2 (en
Inventor
Toshiyuki Sugio
俊之 杉尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP15682895A priority Critical patent/JP3383478B2/en
Publication of JPH08329091A publication Critical patent/JPH08329091A/en
Application granted granted Critical
Publication of JP3383478B2 publication Critical patent/JP3383478B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE: To guarantee a translation result of high quality even if an original text has unknown words, etc., mixed. CONSTITUTION: A term freezing means 2 substitute a frozen term which is not translated for an arbitrary term in the original text l and outputs it. A collation table 7 contains information on the frozen term and unfrozen term corresponding to the term frozen by the term freezing means 2. A machine translating means 3 translates the original text containing the frozen term outputted by the term freezing means 2 and outputs the frozen term as a term which is not translated. A term unfreezing means 4 refers to the collation table 7 and converts the frozen term into the corresponding unfrozen term and outputs when the translation outputted by the machine translating means 3 includes the frozen term.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、自然言語で記述された
原文書を目的言語の訳文書に翻訳する機械翻訳装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for translating an original document described in natural language into a translated document in a target language.

【0002】[0002]

【従来の技術】任意の言語を他の任意の翻訳する機械翻
訳装置では、未知語の扱いが問題となる。この未知語と
は、機械翻訳装置の辞書に登録されていない文字列であ
り、機械翻訳装置はそのような文字列に関する翻訳のた
めの情報を得ることができないため、原文の解析に失敗
したり、訳文の生成に悪影響を及ぼす。そこで、未知語
に対しては、何らかの方策を施す必要が出てくる。
2. Description of the Related Art In a machine translation device that translates an arbitrary language into another arbitrary language, the handling of unknown words becomes a problem. This unknown word is a character string that is not registered in the dictionary of the machine translation device, and because the machine translation device cannot obtain information for translation related to such a character string, it fails in the analysis of the original sentence. , It adversely affects the translation generation. Therefore, it is necessary to take some measures for unknown words.

【0003】このような対策として、例えば、特開平4
−306766号公報に記載されているように、未知語
である英文字列等がローマ字の文字列として認識できれ
ば、その文字列をかなに置き換えるようにしたものがあ
った。即ち、これは、翻訳文中に英文字列等が現れるの
を防ぎ、翻訳文の質を向上させる目的で、入力された英
文字列等の機械翻訳を行う過程で辞書に登録されていな
い語が現れた場合、その語がローマ字として認識できる
かどうかを判定し、ローマ字として認識されれば、ロー
マ字かなテーブルを用いてかなに変換し、翻訳結果を出
力するという構成であった。
As a countermeasure for this, for example, Japanese Patent Laid-Open No.
As described in Japanese Patent Laid-Open No. 306766, if an unknown English character string or the like can be recognized as a Roman character string, the character string is replaced with Kana. That is, this is to prevent words that are not registered in the dictionary in the process of performing machine translation of the entered English character string, etc., for the purpose of preventing the appearance of English character strings in the translated text and improving the quality of the translated text. When it appears, it is determined whether or not the word can be recognized as a Roman character, and if it is recognized as a Roman character, it is converted to Kana using the Roman character Kana table and the translation result is output.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記従
来の装置では、未知語に対して、未知語の記憶部やロー
マ字かなテーブルを設ける必要があり、これは、機械翻
訳装置の辞書に未知語を登録することと等価である。こ
の登録の手間をかけることを考えた場合、確かに英文字
列をローマ字を経てかなに変換する場合には効果がある
が、その他の未知語に対して適用できるかどうかは疑問
の余地が残されるという問題があった。このような点か
ら、未知語等が混在した原文を訳文の生成に悪影響を及
ぼすことなく高品位の翻訳結果を保証することのできる
機械翻訳装置の実現が望まれていた。
However, in the above-mentioned conventional apparatus, it is necessary to provide a storage unit for unknown words and a Romaji-kana table for unknown words. This is because the unknown words are stored in the dictionary of the machine translation device. It is equivalent to registering. Considering the time and effort required for this registration, it is certainly effective when converting an English character string to Kana through Roman letters, but there is no doubt as to whether it can be applied to other unknown words. There was a problem that From this point of view, it has been desired to realize a machine translation device that can guarantee a high-quality translation result without adversely affecting the generation of a translated sentence of an original sentence in which unknown words are mixed.

【0005】[0005]

【課題を解決するための手段】本発明は、前述の課題を
解決するために、視点を変えて、入力された未知語に対
する機械翻訳装置の本来は問題とされていた振舞い、つ
まり、未知語に対して機械翻訳装置は積極的に翻訳処理
を行わないという性質を利用することで、有用な翻訳装
置を構築するようにしたものである。そのために、本発
明は、入力文(原文)の従来の未知語や、更に、翻訳対
象としたくない部分が、機械翻訳装置に積極的に翻訳処
理されないようにするために、それらを機械翻訳装置に
対して見せかけの未知語とする手段を設けた。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention is to change the viewpoint, and the behavior which is originally a problem of the machine translation device with respect to the input unknown word, that is, the unknown word On the other hand, the machine translation device is constructed so as to construct a useful translation device by utilizing the property that the translation process is not actively performed. Therefore, in order to prevent the machine translation device from actively translating the conventional unknown words of the input sentence (original sentence) and the portion that is not desired to be translated, the present invention uses them. A means to make a fake unknown word was provided.

【0006】即ち、本発明の機械翻訳装置は、入力され
た原文中、任意の用語を、翻訳対象外となる凍結用語に
置換して出力する用語凍結手段と、任意の用語に対応し
た凍結用語と解凍用語とを示す照合表と、自然言語で記
述された原文を翻訳し、目的言語の訳文を生成すると共
に、原文中に凍結用語が含まれていた場合は、その凍結
用語を翻訳対象外として出力する機械翻訳手段と、この
機械翻訳手段から出力された訳文に対して、照合表を参
照し、凍結用語が適合した場合は、対応する解凍用語に
変換して出力する用語解凍手段とを備えたことを特徴と
するものである。
That is, the machine translation apparatus of the present invention replaces an arbitrary term in the input original sentence with a frozen term that is not a translation target and outputs the term, and a frozen term corresponding to the arbitrary term. If the original text contains a frozen term, it will not be translated. And a term decompressing means for converting and outputting the corresponding decompressed term when the frozen term matches, with reference to the collation table for the translated sentence output from this machine translating means. It is characterized by having.

【0007】[0007]

【作用】本発明の機械翻訳装置においては、用語凍結手
段は、原文に対して、任意の用語を凍結用語に置換して
出力する。また、照合表には、任意の用語に対応した凍
結用語と解凍用語との情報が格納されている。機械翻訳
手段は、用語凍結手段からの原文中に凍結用語が含まれ
ていた場合は、その凍結用語を翻訳対象外として出力す
る。用語解凍手段は、機械翻訳手段から出力された訳文
に対して、照合表に適合する凍結用語があるか否かを判
定し、適合する凍結用語があった場合は対応する解凍用
語に変換して出力する。
In the machine translation device of the present invention, the term freezing means replaces an arbitrary term with a frozen term and outputs the original sentence. Further, the collation table stores information on frozen terms and defrosted terms corresponding to arbitrary terms. When the original text from the term freezing means includes a frozen term, the machine translation means outputs the frozen term as a non-translation target. The term decompressing unit determines whether or not there is a frozen term conforming to the matching table in the translated text output from the machine translating unit, and if there is a matching frozen term, converts it to the corresponding defrosting term. Output.

【0008】[0008]

【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の機械翻訳装置の実施例を示す
構成図である。図の装置は、原文1に対して前編集を行
い機械翻訳して訳文5を出力する装置であり、そのため
の構成として、用語凍結手段2、機械翻訳手段3、用語
解凍手段4、辞書手段6、照合表7を備えている。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a machine translation device of the present invention. The device shown in the figure is a device that pre-edits the original sentence 1 and machine-translates it to output a translated sentence 5. As a configuration therefor, the term freezing means 2, machine translation means 3, term decompressing means 4, dictionary means 6 are provided. , A collation table 7 is provided.

【0009】原文1は、本機械翻訳装置に入力される自
然言語で記述された文章である。用語凍結手段2は、入
力された原文1中、任意の用語を翻訳対象外となる凍結
用語に置換して機械翻訳手段3に出力する機能を有して
いる。尚、この凍結とは、機械翻訳手段3が翻訳対象外
とする未知語相当にする動作を意味している。また、こ
の用語凍結手段2は、凍結処理を行った場合は、その用
語、凍結用語、解凍用語の情報を照合表7に格納する機
能を有している。
Original sentence 1 is a sentence written in natural language that is input to the machine translation apparatus. The term freezing unit 2 has a function of replacing an arbitrary term in the input original sentence 1 with a frozen term that is not a translation target and outputting it to the machine translation unit 3. The freezing means an operation in which the machine translation unit 3 corresponds to an unknown word that is not a translation target. In addition, the term freezing means 2 has a function of storing information of the term, the frozen term, and the defrosted term in the collation table 7 when the freezing process is performed.

【0010】機械翻訳手段3は、自然言語で記述された
原文を翻訳し、目的言語の訳文を生成する既知の機械翻
訳部であり、また、この機械翻訳手段3は原文中に凍結
状態として識別できる部分が含まれていた場合は、その
部分を翻訳対象外として出力するよう構成されている。
用語解凍手段4は、機械翻訳手段3が出力する訳文中の
用語のうち、用語凍結手段2により凍結された用語を、
後述する照合表7を参照して必要に応じて原文との用語
に復元したり、目的言語の用語に変換したりする機能を
有している。尚、以下、この復元/変換する動作を解凍
と呼ぶ。また、訳文5は用語解凍手段4で解凍が行われ
た結果の文である。
The machine translation unit 3 is a known machine translation unit that translates an original sentence described in a natural language and generates a translated sentence of a target language. Further, the machine translation unit 3 identifies the original sentence as a frozen state. If a possible part is included, the part is configured to be output as a non-translation target.
The term decompressing unit 4 selects, from the terms in the translated text output by the machine translation unit 3, a term frozen by the term freezing unit 2.
It has a function of referring to a collation table 7 which will be described later and restoring it to a term of an original sentence or converting it into a term of a target language as needed. The operation of restoring / converting will be referred to as decompression hereinafter. The translated sentence 5 is a sentence resulting from the decompression performed by the term decompressing means 4.

【0011】辞書手段6は、機械翻訳手段3が翻訳時に
使用したり、必要に応じて用語凍結手段2や用語解凍手
段4が用いるための既知の辞書手段であり、任意の単語
についての字種情報やコード体系および形態素情報等を
有している。尚、この形態素とは、例えば英語や日本語
でいえば、単語等の一定の意味を持つ文字群のことをい
う。照合表7は用語凍結手段2により作成されるもの
で、用語凍結手段2が凍結した用語の凍結方法と解凍方
法とが格納され、また、用語解凍手段4が解凍時に参照
して解凍動作を行うためのものである。
The dictionary means 6 is a known dictionary means used by the machine translation means 3 at the time of translation, and used by the term freezing means 2 and the term decompressing means 4 as necessary, and the character type for an arbitrary word. It has information, code system and morpheme information. The morpheme means, for example, in English or Japanese, a group of characters such as words having a certain meaning. The collation table 7 is created by the term freezing means 2, stores the freezing method and the defrosting method of the term frozen by the term freezing means 2, and the term defrosting means 4 refers to the defrosting operation to perform the defrosting operation. It is for.

【0012】図2は、照合表7の構成例を示す図であ
る。この照合表7は、用語凍結手段2が凍結時に作成し
たり、予め作成しておくものである。図中、10は照合
表7に格納される情報の一般形式を示し、スラッシュ
「/」で区切られた三つの記述フィールド(左から「用
語」、「凍結用語」、「解凍用語」)で構成されてい
る。ここで、「用語」フィールドには、原文1におい
て、翻訳処理の対象としない部分、即ち、翻訳非対象用
語が記載される。この翻訳非対象用語は、複数の単語で
構成される場合もあるので、それを一つの翻訳非対象用
語部分として原文1中に示しておく必要がある。その場
合には、「凍結用語」フィールドに、「用語」フィール
ドに記載された翻訳非対象用語に対応させた未知語相当
語(以下、これを凍結用語と呼ぶ)を記載しておく。ま
た、「解凍用語」フィールドには、「用語」フィールド
に記載されている翻訳非対象用語に対して、訳文5を生
成する際に置換すべき目的言語の用語(以下、これを解
凍用語と呼ぶ)を記載する。
FIG. 2 is a diagram showing a configuration example of the collation table 7. This collation table 7 is created by the term freezing means 2 at the time of freezing or created in advance. In the figure, 10 indicates the general format of the information stored in the collation table 7, which is composed of three description fields (from the left, "term", "frozen term", and "decompressed term") separated by slash "/". Has been done. Here, in the “term” field, a portion of the original sentence 1 that is not a target of translation processing, that is, a translation non-target term is described. Since this translation non-target term may be composed of a plurality of words, it is necessary to show it in the original sentence 1 as one translation non-target term part. In that case, an unknown word equivalent word (hereinafter, referred to as a frozen term) corresponding to the translation non-target term described in the “term” field is described in the “frozen term” field. In the “decompression term” field, the term of the target language that should be replaced when the translated sentence 5 is generated with respect to the translation non-target term described in the “term” field (hereinafter, referred to as decompression term). ) Is described.

【0013】凍結用語および解凍用語は、用語フィール
ドに記載の用語に等しい場合には省略されることも有り
得る。図中、11がこの状態を示しており、これは、英
語中の典型的な未知語「ODA」に対する情報である。
英文中、「ODA」は、固有名詞である「小田」の英語
表現や「政府開発援助」の略称である「ODA」等が考
えられるが、この場合は、凍結用語および解凍用語共に
原文の元の用語の表記のままで問題ないため、それらの
フィールド内の記載は省略されている。
The frozen and thawed terms may be omitted if they are equivalent to the terms listed in the term field. In the figure, 11 indicates this state, which is information for a typical unknown word "ODA" in English.
In the English sentence, "ODA" may be an English expression of "Oda" which is a proper noun or "ODA" which is an abbreviation of "government development assistance". In this case, both the frozen term and the thawed term are the original terms. The description in these fields is omitted because there is no problem with the notation of the term.

【0014】図中、12は原文表記と訳文表記が異なる
場合の用語「Machine Translation」に対する情報であ
る。この場合は凍結用語は未知語として扱われることを
想定して辞書手段6に存在しない「μτ」という表記が
なされ、解凍用語には、訳文での置換表記「MT」が記
載されている。
In the figure, 12 is information for the term "Machine Translation" when the original text and the translated text are different. In this case, the frozen term is described as “μτ” which does not exist in the dictionary means 6 on the assumption that it is treated as an unknown word, and the decompressed term has the replacement notation “MT” in the translated sentence.

【0015】また、図中、13は日本語の動詞「cop
yする」の「copy」の部分を翻訳非対象用語として
扱う場合の情報である。通常、翻訳非対象用語は、名詞
が殆どであるが、この例は、動詞を翻訳非対象用語とし
て扱う場合を示している。この例から分かるように、動
詞等のように原言語と目的言語の間で一意に対応しない
用語は対応関係を明確にするための冗長な用語(「co
pyする」の「する」の部分)も含めた記載が可能であ
る。尚、照合表7における凍結用語の記法は特に限定さ
れるものではないが、本実施例では、12の例にあるよ
うに記号列を用いることで実現した。即ち、通常、「μ
τ」といった用語は存在しないことから、これを見せか
けの未知語としている。
In the figure, 13 is a Japanese verb "cop".
This is information when the “copy” part of “y” is treated as a translation non-target term. Usually, most of the translation non-target terms are nouns, but this example shows a case where a verb is treated as a translation non-target term. As can be seen from this example, a term such as a verb that does not uniquely correspond between the source language and the target language is a redundant term (“co
It is also possible to include a description including the "do" portion of "py do". The notation of frozen terms in the collation table 7 is not particularly limited, but in the present embodiment, it is realized by using a symbol string as in the example of 12. That is, normally,
Since there is no term such as "τ", it is assumed to be an unknown word.

【0016】上記の照合表7は、本機械翻訳装置の動作
中に一時的に作成されるが、予め同等の照合表を作成し
ておき、本機械翻訳装置の実行時に利用するよう構成し
てもよい。また、本機械翻訳装置の処理実行後に、利用
した照合表7の内容を保存し蓄積することにより学習知
識として利用することも可能である。即ち、用語凍結手
段2に対して原文1が与えらえた場合、用語凍結手段2
は照合表7を参照して、原文1中に翻訳非対象用語が含
まれていないかどうかを判定するよう構成してもよい。
The above-mentioned collation table 7 is temporarily created during the operation of the machine translation apparatus. However, an equivalent collation table is prepared in advance and is used when the machine translation apparatus is executed. Good. Further, after the processing of the machine translation device is executed, the contents of the used collation table 7 can be saved and accumulated to be used as learning knowledge. That is, when the original sentence 1 is given to the term freezing means 2, the term freezing means 2
May refer to the collation table 7 to determine whether the original sentence 1 does not include a non-translated term.

【0017】次に、本機械翻訳装置の動作について説明
する。図3は、本機械翻訳装置における用語凍結手段2
の動作を示すフローチャートである。原文1が入力され
ると、用語凍結手段2は先ず、その原文1を単語に分割
する(ステップS1)。この単語への分割は形態素解析
の技術をもって行う。即ち、用語凍結手段2は、最初
に、辞書手段6を利用して形態素解析のための情報を得
る。そして、辞書手段6から得られた形態素解析情報を
利用して、原文1の分割した単語が翻訳対象であるかど
うかの検査を実施する(ステップS2)。ここで、その
単語が翻訳対象でない、つまり、翻訳非対象であるとい
うことには以下の要件が含まれる。
Next, the operation of the machine translation device will be described. FIG. 3 shows the term freezing means 2 in this machine translation device.
3 is a flowchart showing the operation of FIG. When the original sentence 1 is input, the term freezing means 2 first divides the original sentence 1 into words (step S1). The division into words is performed by the technique of morphological analysis. That is, the term freezing unit 2 first obtains information for morphological analysis using the dictionary unit 6. Then, using the morphological analysis information obtained from the dictionary means 6, it is checked whether or not the divided words of the original sentence 1 are to be translated (step S2). Here, that the word is not a translation target, that is, is not a translation target, includes the following requirements.

【0018】(a)当該単語が未知語である。 (b)当該単語が原文と異なる言語である。 (c)当該単語を意図的に翻訳対象としたくない。(A) The word is an unknown word. (B) The word is in a language different from the original sentence. (C) Do not intentionally set the word as a translation target.

【0019】上記(a)における未知語であるかどうか
の情報は、辞書手段6から得られる情報、即ち、辞書に
形態素としてその用語が登録されているかどうかの情報
で判断が可能である。また、(b)については、原文中
での当該単語の字種(漢字/ひらがな/カタカナ/アル
ファベット/記号等)や、コード体系(JIS/シフト
JIS等)などからの情報で判断が可能であり、これら
の情報についても辞書手段6から得ることができる。
The information as to whether or not it is an unknown word in the above (a) can be judged by the information obtained from the dictionary means 6, that is, whether or not the term is registered as a morpheme in the dictionary. As for (b), it is possible to make judgments based on information from the character type (Kanji / Hiragana / Katakana / Alphabet / Symbol, etc.) of the word in the original sentence, and the code system (JIS / Shift JIS, etc.). Also, these pieces of information can be obtained from the dictionary means 6.

【0020】更に、(c)については、本装置の使用者
が、特定の単語もしくは単語列に対して予め翻訳対象と
しない旨を指定した場合に判断可能である。これを実現
するのは原文中に翻訳非対象用語をマークしておく方法
等がある。尚、このマークの方法としては、例えば、一
般に前編集記号と呼ばれている括弧等の記号を用い、翻
訳非対象用語を括弧でくくるといった方法で行う。ま
た、本装置の使用者が指定する場合は、図示省略したキ
ーボードやポインティングデバイスといった入出力イン
タフェースを用いて行う。
Further, with respect to (c), it can be determined when the user of the apparatus has designated in advance that a particular word or word string is not to be translated. To achieve this, there is a method to mark non-translated terms in the original sentence. As a method of this mark, for example, a symbol such as a parenthesis generally called a preedit symbol is used, and the translation non-target term is parenthesized. Further, when the user of this apparatus designates, the input / output interface such as a keyboard or a pointing device (not shown) is used.

【0021】このようにして、原文1中の任意の単語が
翻訳非対象、つまり、凍結対象であると判断されると
(ステップS3)、上記(a)〜(c)の要件に対応し
た凍結方法を決定する(ステップS4)。例えば、
(a)に該当する未知語「ODA」については、図2中
の11に示すように、用語をそのまま固定する方法を採
用する。また、(b)に該当する用語「copyする」
については、図2の13にしめすように、凍結用語を
「★する」とし、解凍用語を「copy」とするよう
に、日本語である原文に出現する英語「copy」を識
別し、凍結する方法を採用する。更に、(c)に該当す
る用語「Machine Translation 」は、通常に翻訳しても
「機械翻訳」なる問題ない訳語を得ることができるはず
であるが、この場合は、本装置の使用者の意向により、
図2中の12に示すように略語「MT」と訳出する方法
を採用する。
In this way, when it is determined that an arbitrary word in the original sentence 1 is not to be translated, that is, to be frozen (step S3), it is frozen corresponding to the requirements (a) to (c). The method is determined (step S4). For example,
For the unknown word “ODA” corresponding to (a), a method of fixing the term as it is is adopted, as indicated by 11 in FIG. In addition, the term “copy” that corresponds to (b)
2), the freezing term is set to “★” and the decompressing term is set to “copy”, and the English “copy” that appears in the original Japanese sentence is identified and frozen. Adopt the method. Further, the term "Machine Translation" corresponding to (c) should be able to obtain a translated word that is not a problem even if it is normally translated, but in this case, the intention of the user of this device is high. Due to
The method of translating as an abbreviation "MT" as shown by 12 in FIG. 2 is adopted.

【0022】このようにして、凍結方法が決定される
と、最後に、決定された凍結方法で原文中の対象となる
用語を凍結し必要に応じて照合表7にその情報、即ち、
図2に示すような用語、凍結用語、解凍用語からなる情
報を格納する(ステップS5)。一方、上記ステップS
3の凍結対象であるか否かの判断処理において、その用
語が凍結対象でなければ、ステップS4、S5のステッ
プは省略される。最後に、未処理の単語があるかをチェ
ックし(ステップS6)、まだ、単語が残されているな
らば、ステップS2〜S6を繰り返す。そして、原文1
の全ての単語について処理を終えれば、用語凍結手段2
は、凍結処理を施した原文を機械翻訳手段3に渡して動
作を終了する。
When the freezing method is determined in this way, finally, the target term in the original text is frozen by the determined freezing method, and if necessary, the information, that is,
Information including terms, frozen terms, and defrosted terms as shown in FIG. 2 is stored (step S5). On the other hand, the above step S
In the process of determining whether or not the object is the freezing target in step 3, if the term is not the freezing target, steps S4 and S5 are omitted. Finally, it is checked whether there is an unprocessed word (step S6), and if there are still words left, steps S2 to S6 are repeated. And the original 1
After processing all the words in
Passes the frozen original text to the machine translation means 3 and ends the operation.

【0023】次に、本機械翻訳装置における用語解凍動
作を説明する。図4は、用語解凍手段4の動作を示すフ
ローチャートである。先ず、機械翻訳手段3から訳文を
入力する(ステップS11)。次に、入力した訳文の用
語を照合表7から得た情報により検索し(ステップS1
2)、その用語が解凍の対象であるかを判断する(ステ
ップS13)。この判断によって、その用語が解凍対象
であるならば、照合表7から得た当該用語の解凍用語に
よってその解凍方法を決定し(ステップS14)、用語
の解凍を行い、その結果を訳文5に反映させる(ステッ
プS15)。一方、ステップS13において、解凍の必
要がないと判断された場合は、ステップS14、S15
の処理は省略される。そして、最後に未処理の用語があ
るかをチェックし(ステップS16)、まだ、用語が残
されているならば、ステップS12〜S16を繰り返
す。訳文の全ての用語について処理を終えれば、用語解
凍手段4は解凍処理を施した訳文を出力して動作を終了
する。
Next, the term decompression operation in this machine translation device will be described. FIG. 4 is a flowchart showing the operation of the term decompression means 4. First, the translated text is input from the machine translation means 3 (step S11). Next, the term of the input translated sentence is searched by the information obtained from the collation table 7 (step S1.
2) Determine whether the term is subject to decompression (step S13). According to this judgment, if the term is to be decompressed, the decompression method is determined according to the decompression term of the term obtained from the collation table 7 (step S14), the term is decompressed, and the result is reflected in the translated sentence 5. (Step S15). On the other hand, if it is determined in step S13 that decompression is not necessary, steps S14 and S15.
Is omitted. Finally, it is checked whether or not there is an unprocessed term (step S16), and if the term still remains, steps S12 to S16 are repeated. When all the terms of the translated sentence have been processed, the term decompression means 4 outputs the decompressed translated sentence and ends the operation.

【0024】以上のように、上記実施例によれば、既知
の機械翻訳手段に対し、原文中の未知語や翻訳対象とし
たくない部分を翻訳されないようにするために、用語を
凍結し、かつ、凍結した用語を機械翻訳後に解凍するよ
うにしたので、機械翻訳手段が未知語に対して積極的に
翻訳処理を行わなくても、未知語や異言語が混在した原
文を、訳文の生成に悪影響を及ぼすことなく高品位の翻
訳結果を保証して翻訳することができる。
As described above, according to the above-mentioned embodiment, the term is frozen in order to prevent the known machine translation means from translating unknown words in the original sentence or portions which are not desired to be translated, and Since the frozen terms are decompressed after machine translation, it is possible to generate a translated sentence from an original sentence containing unknown words and different languages even if the machine translation means does not actively translate unknown words. High-quality translation results can be guaranteed and translated without adverse effects.

【0025】また、本実施例では、照合表7は、凍結対
象となる用語と、その用語を置換する凍結用語と、その
凍結用語に対応した解凍用語からなる記述フィールドを
有する情報で構成されているため、任意の用語に対し
て、容易に作成および変更等が可能である。更に、本実
施例では、用語凍結手段2は、原文1中、任意の用語を
凍結状態とした場合は、その凍結対象となる用語と、凍
結用語と、解凍用語とを照合表7に格納するようにした
ため、別途に照合表7を作成する手間がいらず、機械翻
訳装置としての操作性の向上に寄与することができる。
Further, in this embodiment, the collation table 7 is composed of information having a description field consisting of a term to be frozen, a frozen term to replace the term, and a defrosting term corresponding to the frozen term. Therefore, it is possible to easily create and change any term. Furthermore, in the present embodiment, the term freezing unit 2 stores the term to be frozen, the frozen term, and the defrosted term in the collation table 7 when any term in the original sentence 1 is put into a frozen state. Therefore, it is not necessary to separately prepare the collation table 7, and it is possible to contribute to improvement of operability as a machine translation device.

【0026】また、用語凍結手段2は、実施例中で説明
したように、原文1が与えられた場合、照合表7を参照
し、その原文1中に、凍結対象となる用語が含まれてい
るかを判定して、その用語が含まれていた場合は、照合
表7に基づいて凍結処理を行うよう構成してもよく、こ
のような構成であれば、その都度、凍結処理の操作を行
う必要がなく、より操作性の向上を図ることができる。
Further, as described in the embodiment, the term freezing means 2 refers to the matching table 7 when the original sentence 1 is given, and the original sentence 1 contains the term to be frozen. If the term is included, it may be configured to perform the freezing process based on the collation table 7. In such a configuration, the freezing process is performed each time. There is no need, and the operability can be improved.

【0027】尚、上記実施例では、凍結/解凍処理を、
未知語や翻訳非対象用語に対する翻訳を行う場合、即
ち、原文1における用語そのものの翻訳に適用した例を
示したが、原文1に付与されている文書書式や文書構造
(例えば、フォント情報や文書のタグ情報)といったも
のに適用することも可能である。このようにした場合、
照合表7は、凍結する文書書式や文書構造に対する凍結
用語と解凍方法を示すよう構成され、用語解凍手段4は
この照合表7に基づいて訳文を変換して出力する。
In the above embodiment, the freeze / thaw process is
In the case of translating an unknown word or a non-translated term, that is, an example applied to the translation of the term itself in the original sentence 1, the document format or document structure (for example, font information or document) attached to the original sentence 1 is shown. It is also possible to apply to things such as (tag information of). If you do this,
The collation table 7 is configured to show frozen terms and decompression methods for frozen document formats and document structures, and the term decompression means 4 converts the translated sentence based on the collation table 7 and outputs it.

【0028】[0028]

【発明の効果】以上説明したように、本発明の機械翻訳
装置によれば、翻訳対象とはしたくない部分を凍結用語
として機械翻訳を行い、その訳文に対して凍結用語に対
応した解凍処理を行うようにしたので、未知語等が混在
した原文であっても高品位の翻訳結果を保証することが
できる。
As described above, according to the machine translation apparatus of the present invention, a machine translation is performed by using a frozen term for a portion which is not desired to be translated, and the translated sentence is decompressed corresponding to the frozen term. Since this is performed, it is possible to guarantee a high-quality translation result even for an original sentence in which unknown words and the like are mixed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の機械翻訳装置を示すブロック図であ
る。
FIG. 1 is a block diagram showing a machine translation device of the present invention.

【図2】本発明の機械翻訳装置における照合表の構成例
を示す図である。
FIG. 2 is a diagram showing a configuration example of a matching table in the machine translation device of the present invention.

【図3】本発明の機械翻訳装置における用語凍結手段の
動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation of a term freezing unit in the machine translation device of the present invention.

【図4】本発明の機械翻訳装置における用語解凍手段の
動作を示すフローチャートである。
FIG. 4 is a flowchart showing an operation of a term decompressing unit in the machine translation device of the present invention.

【符号の説明】[Explanation of symbols]

1 原文 2 用語凍結手段 3 機械翻訳手段 4 用語解凍手段 5 訳文 6 辞書手段 7 照合表 1 original sentence 2 term freezing means 3 machine translation means 4 term decompressing means 5 translation 6 dictionary means 7 collation table

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力された原文中、任意の用語を、翻訳
対象外となる凍結用語に置換して出力する用語凍結手段
と、 前記任意の用語に対応した凍結用語と解凍用語とを示す
照合表と、 自然言語で記述された原文を翻訳し、目的言語の訳文を
生成すると共に、原文中に前記凍結用語が含まれていた
場合は、当該凍結用語を翻訳対象外として出力する機械
翻訳手段と、 前記機械翻訳手段から出力された訳文に対して、前記照
合表を参照し、前記凍結用語が適合した場合は、対応す
る解凍用語に変換して出力する用語解凍手段とを備えた
ことを特徴とする機械翻訳装置。
1. A term freezing means for replacing an arbitrary term in an input original sentence with a frozen term that is not translated and outputting the term, and a collation indicating a frozen term and a defrosting term corresponding to the arbitrary term. A machine translation unit that translates a table and an original sentence described in natural language to generate a translated sentence of a target language, and when the original sentence includes the frozen term, outputs the frozen term as a non-translation target. And a term decompressing means for converting the translated text output from the machine translation means into the corresponding decompressed term and outputting the defrosted term when the frozen term is matched. Characteristic machine translation device.
【請求項2】 請求項1記載の機械翻訳装置において、 照合表は、凍結対象となる用語と、その用語を置換する
凍結用語と、その凍結用語に対応した解凍用語からなる
記述フィールドを有する情報で構成されていることを特
徴とする機械翻訳装置。
2. The machine translation device according to claim 1, wherein the collation table has a description field including a term to be frozen, a frozen term to replace the term, and a decompression term corresponding to the frozen term. A machine translation device comprising:
【請求項3】 請求項2に記載の機械翻訳装置におい
て、 用語凍結手段は、原文中、任意の用語を凍結状態とした
場合は、その凍結対象となる用語と、凍結用語と、解凍
用語とを照合表に格納することを特徴とする機械翻訳装
置。
3. The machine translation device according to claim 2, wherein the term freezing means includes a term to be frozen, a frozen term, and a thawed term when an arbitrary term in the original sentence is frozen. A machine translation device characterized in that is stored in a collation table.
【請求項4】 請求項1〜3のいずれかに記載の機械翻
訳装置において、 用語凍結手段は、原文が与えられた場合、照合表を参照
し、当該原文中に、凍結対象となる用語が含まれている
かを判定して、その用語が含まれていた場合は、当該照
合表に基づいて凍結処理を行うことを特徴とする機械翻
訳装置。
4. The machine translation device according to any one of claims 1 to 3, wherein the term freezing unit refers to a matching table when an original sentence is given, and a term to be frozen is included in the original sentence. A machine translation device that determines whether or not a term is included, and if the term is included, performs a freezing process based on the matching table.
【請求項5】 入力された原文中、原文中の用語以外の
任意の文書情報を翻訳対象外となる凍結用語に置換して
出力する用語凍結手段と、 前記任意の文書情報に対応した凍結用語と解凍方法とを
示す照合表と、 自然言語で記述された原文を翻訳し、目的言語の訳文を
生成すると共に、原文中に前記凍結用語が含まれていた
場合は、当該凍結用語を翻訳対象外として出力する機械
翻訳手段と、 前記機械翻訳手段から出力された訳文に対して、前記照
合表を参照し、前記凍結用語があった場合は、対応する
解凍方法に基づき、当該訳文を変換して出力する用語解
凍手段とを備えたことを特徴とする機械翻訳装置。
5. A term freezing unit which replaces and outputs arbitrary document information other than the terms in the original text, which are not included in the original text, into a frozen term that is not to be translated, and a frozen term corresponding to the arbitrary document information. And a decompression method, and a source text written in natural language is translated to generate a translated sentence in the target language. If the original text contains the frozen term, the frozen term is translated. For the machine translation means output as outside and the translated text output from the machine translation means, refer to the collation table, and if there is the frozen term, convert the translated text based on the corresponding decompression method. A machine translation device, comprising:
JP15682895A 1995-05-31 1995-05-31 Machine translation equipment Expired - Fee Related JP3383478B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15682895A JP3383478B2 (en) 1995-05-31 1995-05-31 Machine translation equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15682895A JP3383478B2 (en) 1995-05-31 1995-05-31 Machine translation equipment

Publications (2)

Publication Number Publication Date
JPH08329091A true JPH08329091A (en) 1996-12-13
JP3383478B2 JP3383478B2 (en) 2003-03-04

Family

ID=15636247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15682895A Expired - Fee Related JP3383478B2 (en) 1995-05-31 1995-05-31 Machine translation equipment

Country Status (1)

Country Link
JP (1) JP3383478B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016139337A (en) * 2015-01-28 2016-08-04 日本電信電話株式会社 Text conversion device, method, and program
JP2018207339A (en) * 2017-06-06 2018-12-27 池上通信機株式会社 Monitor system for broadcasting

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016139337A (en) * 2015-01-28 2016-08-04 日本電信電話株式会社 Text conversion device, method, and program
JP2018207339A (en) * 2017-06-06 2018-12-27 池上通信機株式会社 Monitor system for broadcasting

Also Published As

Publication number Publication date
JP3383478B2 (en) 2003-03-04

Similar Documents

Publication Publication Date Title
US7809744B2 (en) Method and system for approximate string matching
JP3971373B2 (en) Hybrid automatic translation system that mixes rule-based method and translation pattern method
EP0283685B1 (en) A spelling assistance method for compound words
WO1998008169A1 (en) Method and apparatus for breaking words in a stream of text
JP2020190970A (en) Document processing device, method therefor, and program
US5732276A (en) Machine translation device
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP3383478B2 (en) Machine translation equipment
JP4042295B2 (en) Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method
JP4845921B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JPH07230468A (en) Method and device for automatically extracting keyword
JPH03260764A (en) Register system for translation dictionary
JP3197110B2 (en) Natural language analyzer and machine translator
JPH09114828A (en) Method for updating priority information on conversion candidate
JP3244286B2 (en) Translation processing device
JPH06259469A (en) Using system for proper noun dictionary
JP3410163B2 (en) Language processor
JPH11203281A (en) Electronic dictionary retrieving device and medium stored with control program for the device
JP2655922B2 (en) Machine translation equipment
JPH0232467A (en) Machine translation system
JPH02118785A (en) Method for correcting erroneous recognition
JPH0631547Y2 (en) translator
JPH05342258A (en) Natural language processing system
JPH03214356A (en) Language translating system
JPH10340264A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131220

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees