JPH06203059A - Machine translation apparatus - Google Patents

Machine translation apparatus

Info

Publication number
JPH06203059A
JPH06203059A JP4348939A JP34893992A JPH06203059A JP H06203059 A JPH06203059 A JP H06203059A JP 4348939 A JP4348939 A JP 4348939A JP 34893992 A JP34893992 A JP 34893992A JP H06203059 A JPH06203059 A JP H06203059A
Authority
JP
Japan
Prior art keywords
word
translation
information
translated
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4348939A
Other languages
Japanese (ja)
Inventor
Yasuyuki Numata
田 泰 之 沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4348939A priority Critical patent/JPH06203059A/en
Publication of JPH06203059A publication Critical patent/JPH06203059A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To heighten translation accuracy by performing equivalent selection/ learning in batch fashion without using a post-edit function by interactive translation of one text unit, acquiring the part of speech information of a word in an original text by the equivalent selection, and utilizing it in translation processing. CONSTITUTION:This apparatus is provided with a display means 6 which displays the word in a translation target document with corresponding equivalents>=one, an equivalent instruction means 7 which selects one desired equivalent from displayed equivalents, an equivalent information learning means 9 which stores learning information with respect to an instructed equivalent, and a translation execution means 11 which performs translation by using the instructed equivalent in addition to a conventional English-Japanese translation apparatus. Also, it is provided with a part of speech information estimation means 8 which estimates the part of speech of the word from the equivalent instructed by a user, and the original text can be analyzed and translated based on estimated part of speech information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、機械翻訳機に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translator.

【0002】[0002]

【従来の技術】近年、機械翻訳機は、ある言語を他の言
語に翻訳するための装置として広く用いられてる。ま
た、自動翻訳にこだわることなく、翻訳支援装置として
の位置づけが標準化しつつある。しかし、現在の機械翻
訳の技術レベルには限界があり、非常に長い文や意味的
なことを考慮しないと解読できないような文(例えば小
説など)では、その翻訳結果の品質は著しく低下し、そ
のまま使うには十分ではない。中でも、訳語の決定を自
動的にしかも精度高く行なうこと(訳語決定処理)は非
常に難しく、この問題が近い将来に解決されることはあ
まり期待できない。そして、この訳語決定の問題を解決
するために、従来の翻訳では次の2つの方法(機能)を
ユーザに提供していた。1つは「ユーザ辞書登録機能」
であり、もう1つは「訳語選択機能」を通じた「学習機
能」である。
2. Description of the Related Art In recent years, machine translators have been widely used as devices for translating one language into another. In addition, positioning as a translation support device is becoming standardized without being particular about automatic translation. However, the current technical level of machine translation is limited, and in very long sentences and sentences that cannot be deciphered without considering the meaning (for example, novels), the quality of the translation result is significantly reduced, Not enough to use as is. In particular, it is very difficult to automatically determine the translated word with high accuracy (translated word determination processing), and it is not expected that this problem will be solved in the near future. Then, in order to solve the problem of determining the translation word, the conventional translation provides the user with the following two methods (functions). One is "user dictionary registration function"
The other is the "learning function" through the "translated word selection function".

【0003】「ユーザ辞書登録機能」とは、ユーザが指
定した任意の単語に対して、任意の訳語を設定可能とす
る機能であり、同じ見出しの単語が、基本辞書、専門用
語辞書、ユーザ辞書のそれぞれに登録されている場合
は、ユーザ辞書に登録されている訳を優先して採用(翻
訳)するというものである。ユーザは、ある決まった文
書を翻訳する際には、翻訳の前にあらかじめ各単語の訳
をユーザ辞書に登録することにより、同じ見出しの単語
に対して何度もエディタを使って同じ訳語に修正すると
いう手間から開放される。
The "user dictionary registration function" is a function that allows an arbitrary translated word to be set for an arbitrary word specified by the user, and words with the same heading are the basic dictionary, the technical term dictionary, and the user dictionary. When registered in each of the above, the translation registered in the user dictionary is preferentially adopted (translated). When translating a certain document, the user registers the translation of each word in the user dictionary in advance before translating it, and corrects the word of the same heading to the same translation many times using an editor. It is released from the trouble of doing.

【0004】次に、「訳語選択機能」とは、翻訳機が翻
訳した訳文(翻訳結果)を構成する単語に対して、ユー
ザの指示のあった単語の別の訳語を提示し、ユーザに適
切な訳語を選択させる機能(訳語選択機能)である。訳
文中において、選択された新たな訳語は、元の訳語と入
れ替わることになる。また、「学習機能」とは、ユーザ
が訳語選択機能を通じて訳語を選択した単語に関して
は、その訳語情報を覚えておき、それ以後の予め決めら
れた一定期間、その単語に対してはその訳語が自動的に
当てられ、翻訳される機能のことである。この機能もま
た、何度も同じ単語が出てくるような文書を翻訳する際
には、一度訳語選択操作においてその単語に希望の訳語
を覚えさせればいいので、ユーザ辞書登録機能と同じ
く、同じ訳語を何度もエディタを使って異なる訳語に修
正するという手間から開放される。
Next, the "translation word selection function" refers to a word that composes a translated sentence (translation result) translated by the translator, presents another translation word of the word designated by the user, and is suitable for the user. This is a function to select a translation word (translation word selection function). The new translation selected in the translation will replace the original translation. In addition, the “learning function” means remembering the translated word information for a word for which the user has selected a translated word through the translated word selection function, and then, for a certain predetermined period after that, the translated word for that word It is a function that is automatically applied and translated. This function also works when translating a document in which the same word appears many times, because it is necessary to make that word remember the desired translated word once in the translated word selection operation. This frees you from the trouble of using the editor to modify the same translation into different translations many times.

【0005】次に、翻訳処理に関してであるが、とくに
英日翻訳では、文の解析を正しく行なうためには、予め
各単語がその文中でどのような品詞として存在している
かを明確にする必要がある。英語は多品詞語であるた
め、この問題は「多品詞解消問題」として、英日翻訳の
際の非常に解決が困難な問題の一つとして考えられてい
る。考えられる品詞の組み合わせを網羅的に準備し、そ
れらをすべて解析・翻訳してその結果を求める考え方も
あるが、組み合わせ数が容易に爆発してしまい、不要な
候補の枝がり技術が必要となる。いずれにしても、この
多品詞解消の問題は困難な問題であり、もし仮に原文中
の数単語でもその品詞解釈が事前に明らかであれば、翻
訳精度が高まることは間違いない。
Next, regarding translation processing, particularly in English-Japanese translation, in order to correctly analyze a sentence, it is necessary to clarify in advance what part of speech each word exists in the sentence. There is. Since English is a multi-part-of-speech word, this problem is considered as the "multi-part-of-speech elimination problem", which is one of the problems that is very difficult to solve in English-Japanese translation. There is also the idea of comprehensively preparing possible combinations of parts of speech, analyzing and translating all of them, and obtaining the result, but the number of combinations easily explodes, and unnecessary candidate branching technology is required. . In any case, this problem of multi-part-of-speech elimination is a difficult problem, and if even a few words in the original sentence have a clear part-of-speech interpretation in advance, there is no doubt that the translation accuracy will increase.

【0006】[0006]

【発明が解決しようとする課題】ところで、ある単語に
対する訳語が適切であるか不適切であるかは、一度翻訳
してみないとユーザにはわからない。このため、大量の
文章を翻訳する場合には、かなり時間がかかる。また、
不適切な訳語が得られた場合に、いずれの辞書にも希望
する訳語が存在しないのか、または存在するにもかかわ
らず単に優先度が低いせいかは、その単語の訳語情報を
表示しない限りは明確にならない。
By the way, it is not possible for the user to know whether the translated word for a certain word is appropriate or inappropriate unless it is translated once. Therefore, it takes a considerable amount of time to translate a large amount of text. Also,
If an incorrect translation is obtained, either because the desired translation does not exist in any dictionary, or because it has a low priority even if it exists, unless the translation information for that word is displayed. Not clear.

【0007】一般に、翻訳環境として複数のユーザ辞書
を利用することができるが、その場合でも辞書単位での
優先順位を設定できるだけである。例えば、ユーザ辞書
1とユーザ辞書2があり、単語A、単語Bがどちらのユ
ーザ辞書にも登録されている場合、単語Aはユーザ辞書
1の訳を、単語Bはユーザ辞書2の訳をと思っても、辞
書単位でしか優先順位を設定できないため、そのような
訳出をすることはできない。このような場合には、単語
A、Bに対して、それぞれ学習機能により訳語を設定す
るのが最善である。しかし、訳語選択を行なうために
は、一文単位の対話型翻訳を実施し、その仮定で、後編
集の一機能として訳語選択を利用するしか従来の翻訳機
では方法がない。一文単位の翻訳は、基本的にすべての
文の翻訳仮定においてユーザが翻訳機に貼り付く必要が
あり、時間のないバッチ的な翻訳処理を主体とするユー
ザにとっては非常に冗長であり、利用されないケースが
多い。また、訳語の学習機能は、訳語選択操作を通じて
のみ学習情報を獲得するため、一文単位の対話型翻訳に
おける訳語選択操作を行なわないユーザの場合、学習機
能の恩恵を得ることができない。
Generally, a plurality of user dictionaries can be used as a translation environment, but even in that case, it is only possible to set the priority order in dictionary units. For example, when there are a user dictionary 1 and a user dictionary 2 and word A and word B are registered in both user dictionaries, word A is a translation of user dictionary 1 and word B is a translation of user dictionary 2. Even if you think about it, you cannot set such a priority because you can set priorities only in dictionary units. In such a case, it is best to set a translated word for each of the words A and B by the learning function. However, in order to select a translated word, interactive translation is performed on a sentence-by-sentence basis, and on the assumption that translated word selection is used as a function of post-editing, the conventional translator has no method. One-sentence-based translation basically requires the user to paste it into the translator under the assumption that all sentences are translated, and is very redundant and is not used for users who mainly perform batch-like translation without time. There are many cases. Further, since the translated word learning function acquires learning information only through the translated word selection operation, a user who does not perform the translated word selection operation in the one-sentence interactive translation cannot benefit from the learning function.

【0008】次に、翻訳における各単語の品詞解釈の問
題であるが、ほとんどのケースにおいて、原文中におけ
る品詞解釈と訳文中におけるその訳の品詞は同一であ
る。例えば、英単語planの訳としては、名詞とし
て、 1.計画 2.プラン 3.方法 4.図面 などがあり、動詞として、 1.計画する 2.立案する などがあるが、原文が、It is a good plan to go at o
nce.「すぐ行くのは良い計画だ」であれば、つまり、p
lanが名詞であれば、訳文中でも、その訳「計画」は
名詞であり、原文が、I plan a new book on chemistr
y.「化学に関する新しい本を計画する」であれば、つま
り、planが動詞であれば、訳文中でも、その訳「計
画する」は動詞である。それにもかかわらず、従来の翻
訳機では、対話型翻訳における翻訳処理後に訳語選択を
ユーザに行なわせるため、そこで得られる品詞情報をう
まく翻訳処理に活用できない。
Next, regarding the problem of part-of-speech interpretation of each word in translation, in most cases, the part-of-speech interpretation in the original sentence and its part-of-speech in the translated sentence are the same. For example, the English word plan translates as a noun: Plan 2. Plan 3. Method 4. There are drawings, etc., and as verbs, 1. Plan 2. There is a plan, but the original text is It is a good plan to go at o
nce. "If it's a good plan to go right away," that is, p
If lan is a noun, the translation "plan" is a noun even in the translated sentence, and the original sentence is I plan a new book on chemistr.
y. If “plan a new book on chemistry”, that is, if plan is a verb, then in the translation, the translation “plan” is a verb. Nevertheless, in the conventional translator, since the user selects the translated word after the translation processing in the interactive translation, the part-of-speech information obtained there cannot be used effectively in the translation processing.

【0009】本発明は、このような従来の問題を解決す
るものであり、1文単位の対話型翻訳による後編集機能
を利用せずに、バッチ的に訳語選択・学習を実現し、ま
た、訳語選択を通じて原文中の単語の品詞情報を獲得
し、翻訳処理に利用することにより翻訳精度を高めるよ
うにした機械翻訳機を提供することを目的とする。
The present invention solves such a conventional problem, and realizes batch word selection / learning without using a post-editing function by interactive translation of one sentence unit, and It is an object of the present invention to provide a machine translator in which part-of-speech information of a word in an original sentence is acquired through translation word selection and used in translation processing to improve translation accuracy.

【0010】[0010]

【課題を解決するための手段】本発明は、上記目的を達
成するために、翻訳対象文章内で使われている単語を翻
訳用辞書に基づいて検索し、検索の結果に基づいて、文
章中で使われている単語の一覧を各単語に対応する1個
以上の訳語と共に表示し、表示された複数の訳語中か
ら、適切な訳語をユーザが選択出来るようにするととも
に、指定された訳語情報を対応する単語情報とともに記
憶し、それ以後の翻訳においては、その単語に対して既
に記憶されている訳語を用いて翻訳するようにしたもの
である。
In order to achieve the above object, the present invention searches a word used in a translation target sentence based on a translation dictionary, and based on the result of the search A list of words used in is displayed with one or more translated words corresponding to each word, and the user can select an appropriate translated word from the displayed multiple translated words, and the specified translated word information. Is stored together with the corresponding word information, and in the subsequent translation, the translated word already stored for that word is used for translation.

【0011】また、翻訳対象文章を実際に翻訳する前
に、訳語選択処理を行なえるようにし、そこで得られた
訳語情報から原文中の単語の品詞を推定して翻訳(解
析)処理に利用するようにしたものである。
Before the actual translation of the sentence to be translated, translation word selection processing can be performed, and the part of speech of the word in the original sentence is estimated from the translation word information obtained there and used for translation (analysis) processing. It was done like this.

【0012】[0012]

【作用】本発明は、上記構成により、ユーザは、一文ず
つの対話型翻訳を行なうことなく、訳語選択に関する操
作をまとめて行なうことができる。また、学習の効果に
より、それ以後に同じ単語が現れた場合には、自動的に
希望する訳語が現れることにより、翻訳作業の手間を軽
減できる。
With the above-described structure, the present invention allows the user to collectively perform the operation related to the translation word selection without performing the interactive translation of each sentence. Further, due to the effect of learning, when the same word appears after that, the desired translated word automatically appears, so that the labor of the translation work can be reduced.

【0013】さらに、上記訳語選択処理を通じて、各単
語の品詞解釈処理に対する事前情報が得られるため、原
文の解析能力が向上し、結果として、翻訳精度(訳文の
質)自体の向上が期待できる。
Further, through the translation word selection processing, since the a priori information about the part-of-speech interpretation processing of each word is obtained, the analysis ability of the original sentence is improved, and as a result, the translation accuracy (translation quality) itself can be expected to be improved.

【0014】[0014]

【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。本発明は、必ずしも英日機械翻訳機
を対象とするものではないが、以後の説明では、話を具
体的にするため英日機械翻訳機を前提とする。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. The present invention is not necessarily intended for an English-Japanese machine translator, but in the following description, an English-Japanese machine translator is premised for concrete explanation.

【0015】図1は本発明の一実施例における機械翻訳
機の機能ブロック図である。1は翻訳対象文書(原文)
の入力を行なうキーボード、フロッピーディスク、ネッ
トワークなどの入力手段、2は入力手段1から入力され
た原文と翻訳結果を対応づけて記憶する原文・訳文記憶
手段、3は翻訳を行なうために必要な語彙に関する知識
を提供する基本辞書、専門用語辞書、ユーザ辞書などの
翻訳用辞書である。ちなみに、基本辞書は、通常の翻訳
においては必ず検索され、専門用語辞書は、実際は情報
処理用語辞書、科学用語辞書、機械用語辞書など複数存
在し、翻訳の際に、ユーザが任意の専門用語辞書を指定
する。ユーザ辞書は、ユーザが作成できる辞書であり、
複数個存在し、専門用語辞書と同様に、翻訳の際にユー
ザが任意に指定する。4は翻訳用語辞書3に基づいて、
原文・訳文記憶手段2に記憶されている翻訳対象文書中
の単語(複合語なども含む)を検索する辞書検索手段で
ある。5は辞書検索手段4によって検索された単語情報
を記憶する単語情報記憶手段である。ただし、その際、
既に登録されている単語であるならば、重複を避けるた
め、あらたな登録は行なわない。記憶される単語情報と
しては、検索された単語の訳語、検索された単語が含ま
れている文の前後のテキストなどがある。6は原文・訳
文記憶手段2に記憶された原文、訳文、または辞書検索
手段4によって検索され、単語情報記憶手段5によって
記憶された単語を、付随する情報(訳語、各単語の前後
のテキストなど)とともに表示する表示手段である。7
は表示手段6に表示された各単語の訳語に対して、ユー
ザが希望する訳語の選択を行なうキーボード、マウスな
どの訳語指示手段、8は訳語指示手段7によってユーザ
が指示した訳語情報から、対応する単語の品詞情報を推
定する品詞情報推定手段である。9は訳語指示手段7に
よってユーザが指示した単語に関する(訳語)学習情報
と、品詞情報推定手段8によって推定されたその単語の
推定品詞とを記憶する訳語情報学習手段である。学習情
報とは、例えば「teacher」は「教師」と訳す、
といった訳語に関する情報である。10は翻訳を行なう
ために必要な文法に関する知識を提供する翻訳ルールで
ある。11は翻訳用辞書3、翻訳ルール10の知識を参
照しながら、与えられた翻訳対象文書の翻訳を行なう翻
訳実行手段ある。翻訳によって得られた訳文は、原文・
訳文記憶手段2に記憶される。また、翻訳機能の形態に
よっては、表示手段6に表示される。12は前置詞やb
e動詞などの他の品詞に従属する自立してない語彙を除
くための自立語フィルタリング手段である。
FIG. 1 is a functional block diagram of a machine translator according to an embodiment of the present invention. 1 is the document to be translated (original)
Input means such as a keyboard, floppy disk, network, etc. for inputting, 2 is an original / translated text storage means for storing the original text input from the input means 1 in association with the translation result, and 3 is a vocabulary necessary for translation It is a dictionary for translation such as a basic dictionary, a technical term dictionary, and a user dictionary that provides knowledge about. By the way, the basic dictionary is always searched in normal translation, and there are actually multiple technical term dictionaries such as information processing term dictionary, scientific term dictionary, machine term dictionary, etc. Is specified. The user dictionary is a dictionary that the user can create,
There are a plurality of them, and like the technical term dictionary, the user arbitrarily specifies them at the time of translation. 4 is based on the translation term dictionary 3,
It is a dictionary search means for searching words (including compound words) in the translation target document stored in the original / translated text storage means 2. Reference numeral 5 is a word information storage means for storing the word information retrieved by the dictionary retrieval means 4. However, at that time,
If the word is already registered, no new registration is performed to avoid duplication. The stored word information includes a translated word of the searched word and texts before and after the sentence including the searched word. Reference numeral 6 is an original sentence or a translated sentence stored in the original sentence / translated sentence storage means 2 or a word retrieved by the dictionary retrieval means 4 and stored in the word information storage means 5 with associated information (translated word, text before and after each word, etc.). ) And a display means for displaying. 7
Is a translation word indicating means such as a keyboard or a mouse for selecting a translation word desired by the user with respect to a translation word of each word displayed on the display means 6, and 8 is associated with the translation word information specified by the user by the translation word indicating means 7. It is a part-of-speech information estimation means for estimating the part-of-speech information of a word. Reference numeral 9 is a translated word information learning unit that stores (translated word) learning information regarding a word designated by the user by the translated word designation unit 7 and the estimated part-of-speech of the word estimated by the part-of-speech information estimation unit 8. Learning information means, for example, "teacher" translates as "teacher",
This is information about translated words. Reference numeral 10 is a translation rule that provides knowledge about the grammar necessary for performing translation. Reference numeral 11 is a translation execution means for translating a given document to be translated while referring to the knowledge of the translation dictionary 3 and the translation rule 10. The translated text obtained by translation is the original
It is stored in the translated text storage means 2. Further, depending on the form of the translation function, it is displayed on the display unit 6. 12 is a preposition or b
It is an independent word filtering means for removing non-independent vocabulary subordinate to other parts of speech such as e verb.

【0016】図2は本実施例の回路ブロック図であり、
21はキーボード(マウスを含む)、22は中央処理装
置(以下、CPUと略称する。)、23は陰極線管ディ
スプレイ(以下、CRTと略称する。)、24はランダ
ムアクセスメモリ(以下、RAMと略称する。)、25
はリードオンリーメモリ(以下、ROMと略称する。で
ある。
FIG. 2 is a circuit block diagram of this embodiment.
Reference numeral 21 is a keyboard (including a mouse), 22 is a central processing unit (hereinafter abbreviated as CPU), 23 is a cathode ray tube display (hereinafter abbreviated as CRT), 24 is a random access memory (hereinafter abbreviated as RAM). 25)
Is a read-only memory (hereinafter abbreviated as ROM).

【0017】図1に示した入力手段1、訳語指示手段7
はキーボード21により、原文・訳文記憶手段2、翻訳
ルール10、単語情報記憶手段5、訳語情報学習手段9
はRAM24により、表示手段6はCRT23により、
翻訳実行手段11はCPU22がRAM24およびRO
M25とデータのやりとりを行ないながらROM25に
記憶されたプログラムを実行することにより、実現され
ている。また、翻訳用辞書3は、ROM15、RAM2
4、または2次記憶装置のいずれかに記憶されている。
辞書検索手段4、品詞情報推定手段8は、ROM25に
記憶されているプログラムをCPU22が実行すること
により実現される。
The input means 1 and the translation word indicating means 7 shown in FIG.
Using the keyboard 21, the original / translated sentence storage means 2, the translation rule 10, the word information storage means 5, the translated word information learning means 9
By the RAM 24, the display means 6 by the CRT 23,
In the translation executing means 11, the CPU 22 has the RAM 24 and the RO.
It is realized by executing the program stored in the ROM 25 while exchanging data with the M25. The translation dictionary 3 includes a ROM 15 and a RAM 2
4 or a secondary storage device.
The dictionary search means 4 and the part-of-speech information estimation means 8 are realized by the CPU 22 executing the programs stored in the ROM 25.

【0018】図3は本発明の一実施例における処理の流
れを示すフローチャートである。以下、このフローチャ
ートに従い、本発明の一実施例における処理の流れを説
明する。まず、ステップ31で、入力手段1(キーボー
ド、フロッピーディスク、ネットワークなど)により、
原文(翻訳対象文書)が入力される。入力された原文
は、原文・訳文記憶手段2に記憶される。
FIG. 3 is a flow chart showing the flow of processing in one embodiment of the present invention. The flow of processing in the embodiment of the present invention will be described below with reference to this flowchart. First, in step 31, the input means 1 (keyboard, floppy disk, network, etc.)
The original text (document to be translated) is input. The input original sentence is stored in the original sentence / translated sentence storage unit 2.

【0019】次に、ステップ32で、入力手段1を通じ
て、ユーザにより、本発明の実体であるバッチ型訳語選
択機能が起動される。
Next, in step 32, the user activates the batch-type translated word selection function, which is the substance of the present invention, through the input means 1.

【0020】次に、ステップ33で、原文・訳文記憶手
段2に記憶された原文中の単語が、辞書検索手段4によ
り検索される。検索された単語は、自立語フィルタリン
グ手段12により、前置詞やbe動詞といった、基本的
に訳語選択の対象とはなりにくい品詞の語彙が除外さ
れ、自立語のみが単語情報記憶手段5に記憶される。例
えば、I wanted to be a teacher.という文に対して、
検索・登録処理が実行される場合、I,want,to,be,a,tea
cherが単語として検索されるが、「自立語フィルタリン
グ手段12」によって、to,be,aが除外され、I,want,te
acherに関する単語情報が記憶される。また新たに単語
情報を登録する際には、既にその単語に関する情報が単
語情報記憶手段5に登録されていないかどうかをチェッ
クし、同じ見出しの単語に関する登録の重複を避ける。
したがって、上記の文Iwanted to be a teacher.に対
する検索・登録処理の後に、He wanted to be a teache
r, too.という文が検索・登録処理の対象となると、新
たに、he,want,to,be,a,teacher,tooが単語として検索
されるが、「自立語フィルタフィング手段12」によっ
て、まず、to,be,a,tooが除外され、残された、he,wan
t,teacherに対しては、want,teacherが既に登録済みで
あるため、結果として、heに関する単語情報のみが記憶
されることになる。
Next, in step 33, the words in the original sentence stored in the original sentence / translated sentence storage means 2 are retrieved by the dictionary retrieval means 4. From the retrieved words, the independent word filtering unit 12 excludes the vocabulary of the part of speech that is basically difficult to select a translated word, such as prepositions and be verbs, and stores only the independent words in the word information storage unit 5. . For example, for the sentence I wanted to be a teacher.
When the search / registration process is executed, I, want, to, be, a, tea
cher is searched as a word, but "to, be, a" is excluded by "independent word filtering means 12", and I, want, te
Word information about acher is stored. Further, when newly registering word information, it is checked whether or not information on the word has already been registered in the word information storage means 5 to avoid duplication of registration for words of the same heading.
Therefore, after the search and registration process for the sentence I wanted to be a teacher.
When the sentence r, too. is subject to the search / registration process, he, want, to, be, a, teacher, too are newly searched as words, but by the "independent word filtering means 12", First, to, be, a, too are excluded and left, he, wan
For t and teacher, since want and teacher have already been registered, as a result, only the word information regarding he is stored.

【0021】またこの場合、辞書検索手段4が文書内の
単語を検索する際に、検索された単語が含まれていて単
語の前後の文脈がわかるテキスト、例えばKWICを同
時に抽出し、単語情報記憶手段5がそのテキストを対応
する単語とともに記憶し、表示手段6がそのテキストを
検索された単語とともに表示することにより、訳語を指
定する単語の前後関係が暗示されるため、ユーザは、容
易に適切な訳語を指定することが可能となる。すなわち
検索対象の文書は、本実施例におけるバッチ型訳語選択
機能が終了するまで変更されることはないので、文書中
におけるテキスト位置によって、そのテキスト情報が記
憶されることになる。例えば、前述の2つの文、I want
ed to be teachwer.He wanted to be a teacher,too.
が、仮に文章の先頭にあるとし、2番目の文のHeに関
する単語情報を記憶する際には、ed to be a teacher.
He wanted to be a teacといったテキストを記憶してお
き、ユーザに表示できると、ユーザは、Heに関する訳
語を判断しやすい。この場合、Heの前後20文字を表
示しているが記憶の仕方としては、文書中におけるHe
のテキスト位置を記憶しておけば、十分である。
Further, in this case, when the dictionary search means 4 searches for a word in a document, the text including the searched word and showing the context before and after the word, for example, KWIC, is simultaneously extracted to store the word information. The means 5 stores the text together with the corresponding word, and the display means 6 displays the text together with the searched word, so that the context of the word designating the translated word is implied, so that the user can easily select the appropriate word. It is possible to specify a translation. That is, the document to be searched is not changed until the batch-type translated word selection function in this embodiment is completed, so that the text information is stored depending on the text position in the document. For example, the two sentences above, I want
ed to be teachwer.He wanted to be a teacher, too.
However, suppose it is at the beginning of the sentence, and when memorizing the word information about He in the second sentence, ed to be a teacher.
If a text such as “He wanted to be a teac” is stored and can be displayed to the user, the user can easily determine the translated word regarding He. In this case, 20 characters before and after He are displayed.
It is enough to remember the text position of.

【0022】次にステップ34で、単語情報記憶手段5
に記憶された単語情報が、表示手段6によって、図4の
ように表示される。この表示では、デフォルトの訳が網
掛けにより表示されている。図4の場合、teache
rのデフォルト訳は、「教師」となっている。その際、
翻訳機の表示領域に比べて、実際に検索された単語数が
多い場合には、ユーザは、スクロールバーや改ページ機
能などのユーザインタフェースを通じて、すべての単語
情報を参照することになる。また、上記したように、各
単語が存在していたテキスト情報も同時に表示するよう
にしてもよい。
Next, at step 34, the word information storage means 5
The word information stored in is displayed by the display means 6 as shown in FIG. In this display, the default translation is shaded. In the case of FIG. 4, teach
The default translation of r is "teacher". that time,
When the number of actually searched words is larger than the display area of the translator, the user refers to all the word information through a user interface such as a scroll bar or a page break function. Further, as described above, the text information in which each word exists may be displayed at the same time.

【0023】次にステップ35で、表示手段6によって
表示された単語の訳語情報から、ユーザが希望する訳語
を、訳語指示手段7を通じて指示する。図5は、tea
cherの訳として、「先生」を選択した結果を示して
いる。強調表示が、「教師」から「先生」にかわってい
る。このようにして指示された訳語の情報は、訳語情報
学習手段9によって記憶される。図5に示した選択例で
は、「teacher」の訳は「先生」である。という
訳語情報が、訳語情報学習手段9に記憶されることにな
る。
Next, in step 35, the translation word instructing means 7 indicates the translation word desired by the user from the translation word information of the word displayed by the display means 6. Figure 5 shows tea
The result of selecting “teacher” as the translation of cher is shown. The highlighting changes from "teacher" to "teacher." The translated word information thus designated is stored by the translated word information learning means 9. In the selection example shown in FIG. 5, the translation of “teacher” is “teacher”. The translated word information is stored in the translated word information learning means 9.

【0024】また、本実施例においては、ユーザが指示
した訳語から品詞情報推定手段8によって原単語の品詞
が推定される。ユーザが選択した訳語の品詞が名詞なら
ば、原単語の品詞も名詞、ユーザが選択した訳語の品詞
が動詞ならば、原単語の品詞も動詞、という論理で訳語
を推定する。図5の選択の結果としては、「teach
er」の品詞は名詞である。という推定された品詞情報
が、訳語情報額種手段9に記憶される。この訳語選択イ
ンタフェースを通じて、ユーザは、表示された任意の単
語に対して、訳語選択を一度に行なうことになる。ユー
ザによる訳語選択が終了すると、バッチ型訳語選択機能
は終了する。
Further, in this embodiment, the part-of-speech information estimating unit 8 estimates the part-of-speech of the original word from the translated word designated by the user. If the part of speech of the translated word selected by the user is a noun, the part of speech of the original word is also a noun, and if the part of speech of the translated word selected by the user is a verb, the translated word of the original word is estimated to be a verb. The result of the selection in FIG.
The part of speech of "er" is a noun. The estimated part-of-speech information is stored in the translated word information amount sort means 9. Through this translated word selection interface, the user can select translated words at once for any displayed word. When the translation selection by the user is completed, the batch translation selection function ends.

【0025】次に、ステップ36で、ユーザにより翻訳
が指示される。翻訳は、翻訳実行手段11によって実行
される。上記の例では、本来、「私は教師になりたかっ
た。彼もまた、教師になりたかった。」と翻訳されると
ころであるが、訳語情報学習手段9によって記憶されて
いる訳語情報に基づいて、「私は先生になりたかった。
彼もまた、先生になりたかった。」という訳文が生成さ
れる。さらに、訳語情報学習手段9に記憶されている品
詞情報を利用して原文の解析を行ない、翻訳を行なうこ
とにより、原文の解析能力が向上し、結果として翻訳精
度自体の向上が期待できる。
Next, in step 36, the user instructs the translation. The translation is executed by the translation executing means 11. In the above example, it is originally translated as "I wanted to be a teacher. He also wanted to be a teacher." However, based on the translated word information stored by the translated word information learning means 9, "I wanted to be a teacher.
He also wanted to be a teacher. A translated sentence is generated. Furthermore, by using the part-of-speech information stored in the translated word information learning means 9 to analyze and translate the original sentence, the ability to analyze the original sentence is improved, and as a result, the translation accuracy itself can be expected to be improved.

【0026】以上のように、上記実施例によれば、訳語
選択をバッチ的に実現する機能とユーザインタフェース
を提供することにより、対話型翻訳を好まないユーザに
対して、訳語選択、学習機能の利用が可能となる。ま
た、訳語選択を通じて単語の品詞を推定し、原文の解析
に利用することにより、翻訳精度を高めることができ
る。
As described above, according to the above-described embodiment, by providing a function for implementing translation word selection in batch and a user interface, it is possible to provide translation word selection and learning functions for users who do not like interactive translation. It becomes available. In addition, translation accuracy can be improved by estimating the part of speech of a word through translation selection and using it for analysis of the original sentence.

【0027】[0027]

【発明の効果】本発明は、上記実施例から明らかなよう
に、1文単位の対話型翻訳における後編集機能を使わず
に訳語選択ができ、バッチ的翻訳ユーザに対する操作性
を向上することができる。また、訳語選択が行なわれた
単語に関しては、その品詞情報が得られるので、原文の
解析精度が向上し、結果として、翻訳品質の向上が期待
できる。
As is apparent from the above-described embodiment, the present invention can select a translated word without using the post-editing function in the interactive translation of one sentence unit, and improve the operability for batch translation users. it can. In addition, since the part-of-speech information is obtained for the word for which the translated word is selected, the analysis accuracy of the original sentence is improved, and as a result, the translation quality can be expected to be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における機械翻訳機の機能ブ
ロック図である。
FIG. 1 is a functional block diagram of a machine translator according to an embodiment of the present invention.

【図2】同実施例における機械翻訳機の回路ブロック図
である。
FIG. 2 is a circuit block diagram of a machine translator in the embodiment.

【図3】同実施例における機械翻訳機の動作を示すフロ
ーチャートである。
FIG. 3 is a flowchart showing an operation of the machine translator in the embodiment.

【図4】同実施例における訳語選択の際の表示例を示す
一覧図である。
FIG. 4 is a list view showing a display example when selecting a translated word in the embodiment.

【図5】同実施例における訳語選択の際のデフォルト以
外の訳を選択した場合の表示例を示す一覧図である。
FIG. 5 is a list diagram showing a display example when a translation other than the default translation is selected when selecting a translation word in the embodiment.

【符号の説明】[Explanation of symbols]

1 入力手段 2 原文・訳文記憶手段 3 翻訳用辞書 4 辞書検索手段 5 単語情報記憶手段 6 表示手段 7 訳語指示手段 8 品詞情報推定手段 9 訳語情報学習手段 10 翻訳ルール 11 翻訳実行手段 12 自立語フィルタリング手段 21 キーボード 22 CPU 23 CRT 24 RAM 25 ROM 1 input means 2 original sentence / translated sentence storage means 3 translation dictionary 4 dictionary retrieval means 5 word information storage means 6 display means 7 translated word instruction means 8 part-of-speech information estimation means 9 translated word information learning means 10 translation rules 11 translation execution means 12 independent word filtering Means 21 Keyboard 22 CPU 23 CRT 24 RAM 25 ROM

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 翻訳対象文書と翻訳結果を対応づけて記
憶する原文・訳文記憶手段と、単語の訳を記憶する翻訳
用辞書と、翻訳対象文章内で使われている単語を翻訳用
辞書に基づいて検索する辞書検索手段と、検索された単
語情報を記憶する単語情報記憶手段と、前記単語情報記
憶手段の内容に基づいて文書中で使われている単語の一
覧を各単語に対応する1個以上の訳語と共に表示する表
示手段と、前記表示手段によって表示された1個以上の
訳語中から適切な訳語をユーザによって指示させる訳語
指示手段と、前記ユーザによって指示された訳語に関す
る学習情報を記憶する訳語情報学習手段と、前記訳語に
関する学習情報を優先的に単語の訳出に利用しながら翻
訳対象文書を翻訳する翻訳実行手段とを有することを特
徴とする機械翻訳機。
1. An original sentence / translated sentence storage unit for storing a translation target document and a translation result in association with each other, a translation dictionary for storing a translation of a word, and a word used in a translation target sentence as a translation dictionary. A dictionary search means for performing a search based on the word information, a word information storage means for storing the searched word information, and a list of words used in the document based on the contents of the word information storage means, corresponding to each word. Display means for displaying together with more than one translation word, translation word instructing means for instructing a suitable translation word from the one or more translation words displayed by the display means by the user, and learning information about the translation word instructed by the user A machine translation machine for translating a document to be translated while preferentially using learning information about the translated word for translation of words. .
【請求項2】 請求項1記載の機械翻訳機において、辞
書検索手段が、文書内の単語を検索する際に、検索され
た単語が含まれていて単語の前後の文脈がわかるテキス
トを同時に抽出し、単語情報記憶手段が、そのテキスト
を対応する単語と共に記憶し、表示手段が、そのテキス
トを検索された単語と共に表示することを特徴とする機
械翻訳機。
2. The machine translator according to claim 1, wherein when the dictionary search means searches for a word in a document, a text including the searched word and extracting contexts before and after the word are simultaneously extracted. A machine translator, wherein the word information storage means stores the text together with the corresponding word, and the display means displays the text together with the retrieved word.
【請求項3】 請求項1または2記載の機械翻訳機にお
いて、訳語指示手段によって得られた訳語選択に関する
ユーザの指示情報から原単語の品詞を推定する品詞情報
推定手段を有し、翻訳実行手段が前記品詞情報推定手段
によって推定された品詞情報を原文の解析に利用して翻
訳することを特徴とする機械翻訳機。
3. The machine translator according to claim 1, further comprising a part-of-speech information estimation unit that estimates the part-of-speech of the original word from the user's instruction information regarding the translation word selection obtained by the translation word instruction unit, and the translation execution unit. A machine translator in which the part-of-speech information estimated by the part-of-speech information estimating means is utilized for analysis of an original sentence and translated.
JP4348939A 1992-12-28 1992-12-28 Machine translation apparatus Pending JPH06203059A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4348939A JPH06203059A (en) 1992-12-28 1992-12-28 Machine translation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4348939A JPH06203059A (en) 1992-12-28 1992-12-28 Machine translation apparatus

Publications (1)

Publication Number Publication Date
JPH06203059A true JPH06203059A (en) 1994-07-22

Family

ID=18400405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4348939A Pending JPH06203059A (en) 1992-12-28 1992-12-28 Machine translation apparatus

Country Status (1)

Country Link
JP (1) JPH06203059A (en)

Similar Documents

Publication Publication Date Title
CN107209759B (en) Annotation support device and recording medium
JP2003223437A (en) Method of displaying candidate for correct word, method of checking spelling, computer device, and program
US20030004702A1 (en) Partial sentence translation memory program
JPH0683554A (en) Operation guide device
KR20040065468A (en) Treatment method for multilanguage transer of patent paper and record medium for interpretation to recording using transer software
US6651039B1 (en) Mechanical translation apparatus and method
JP4431759B2 (en) Unregistered word automatic extraction device and program, and unregistered word automatic registration device and program
JPH09114852A (en) Information retrieval device
JPH06203059A (en) Machine translation apparatus
JPH08287088A (en) Method and device for information retrieval
JPS6118074A (en) Pre-editing system
JPH07325826A (en) Japanese language processing system
JP3666066B2 (en) Multilingual document registration and retrieval device
JPH1021222A (en) Machine translation method and terminology dictionary selecting method
JP2017091382A (en) Paginal translation dictionary creation device, paginal translation dictionary creation method, and program
JP2893239B2 (en) Translation support dictionary search and display system
JP3378267B2 (en) Machine translation equipment
JPH05101094A (en) Dictionary retrieval control method
JPH10293761A (en) Machine translation device, machine translation method and recording medium recording machine translation program
JPH06187370A (en) Document read assisting device
JPH06162071A (en) Machine translation device
JPH05342261A (en) Machine translation system
JPH0612449A (en) System and method for machine translation
JPH05197751A (en) Machine translation system
JPH02224064A (en) Machine translation system