JPH0589163A - Machine translation system - Google Patents

Machine translation system

Info

Publication number
JPH0589163A
JPH0589163A JP3252553A JP25255391A JPH0589163A JP H0589163 A JPH0589163 A JP H0589163A JP 3252553 A JP3252553 A JP 3252553A JP 25255391 A JP25255391 A JP 25255391A JP H0589163 A JPH0589163 A JP H0589163A
Authority
JP
Japan
Prior art keywords
language
character string
sentence
character
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3252553A
Other languages
Japanese (ja)
Other versions
JP3147947B2 (en
Inventor
Yumiko Yoshimura
裕美子 吉村
Mariko Kimura
真理子 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25255391A priority Critical patent/JP3147947B2/en
Publication of JPH0589163A publication Critical patent/JPH0589163A/en
Application granted granted Critical
Publication of JP3147947B2 publication Critical patent/JP3147947B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To easily discriminate a character string consisting of a character type peculiar to the second language mixed in the document of the first language with the other character string in a translated sentence. CONSTITUTION:A machine translation device translating the sentence of given first language into the sentence of the second language which is different from the first language is provided with a selection means 6 discriminating the character type in the character string in the sentence of the first language and selecting the character string of the character type which is not peculiar to the first language, a processing means 7 processing the character string so that it can be discriminated when the character type of the selected character string is discriminated and it agrees with the character type peculiar to the second language, a translation means 5 translating the processed sentence of the first language into the sentence of the second language, and a discrimination support processing means 7 processing the character string applied to the processed character string so that it can be identified by the processing means in the translated sentence in such a way that it arises in a system which can discriminate it from the other character string in the translated sentence.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、第一言語のデータを第
二言語のデータに翻訳する機械翻訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation apparatus for translating first language data into second language data.

【0002】[0002]

【従来の技術】日本語から英語への翻訳、英語から日本
語への翻訳のように、言語特有の文字種が異なる言語対
の間の翻訳において、第一言語の文書中に第二言語特有
の文字種の文字列が混在している場合、従来の機械翻訳
技術では、特に訳出に工夫が施されていないために、原
文書中では明確に他の文字列と区別されて認識できてい
た異種文字列が、訳文中では他の文字列に溶け込んでし
まい、読みにくい(理解しにくい)訳文を生成してしま
う、と云う問題があった。
2. Description of the Related Art In a translation between language pairs having different language-specific character types, such as a translation from Japanese to English and a translation from English to Japanese, a document specific to the second language is unique to a document of the first language. When character strings of different character types are mixed, conventional machine translation technology does not make any special efforts to translate the character strings, so different characters that could be clearly distinguished from other character strings in the original document were recognized. There was a problem that the string was merged with other character strings in the translated sentence, and a translated sentence that was difficult to read (difficult to understand) was generated.

【0003】その例をたとえば日本語から英語への翻訳
の際に生じるケースで説明する。日本語文書中に英単語
のアルファベット文字列 continueがあったとする。こ
れは英単語としては動詞であるが、日本語の文書中に存
在する限り、名詞句以外の構文上の機能を持ち得ない。
An example thereof will be described in the case that occurs when translating from Japanese into English. Suppose there is an English word alphabet string continue in a Japanese document. This is a verb as an English word, but as long as it exists in a Japanese document, it cannot have any syntactic function other than a noun phrase.

【0004】そこでこのような英単語を含む文を英文に
翻訳すると、名詞句として機能すべき構文中の位置に動
詞である continue が裸のまま生起することになる。
その結果、訳出された英文は非常に理解しにくい(時に
は誤解を招く)ものとなる。同様な問題は英語から日本
語への翻訳の場合にも生じる。たとえば、英語文書中に
日本語のひらがな・カタカナ・漢字などの文字列があっ
た場合、日本語では一般に単語間の切れ目としてスペー
スを置かないため、英文中にあったその日本語文字列は
生成された日本語の訳文中でまったく他の文字列に同化
してしまい、非常に読みにくくなるばかりでなく、生成
される訳文は書式的にも良いものとは言えない。
Therefore, when a sentence including such an English word is translated into an English sentence, the verb continue occurs at a position in the syntax that should function as a noun phrase without being naked.
As a result, the translated English text is very difficult (and sometimes misleading) to understand. A similar problem arises when translating from English to Japanese. For example, if a Japanese character string such as Hiragana, Katakana, or Kanji is found in an English document, the Japanese character string found in the English sentence is generated because there is generally no space between words in Japanese. Not only is it very hard to read because it is assimilated into another character string in the translated Japanese translation, but the translation that is generated is also not well-formed.

【0005】[0005]

【発明が解決しようとする課題】上述したように、従来
の機械翻訳装置では、英文と日本文などのように、言語
特有の文字種が異なる言語間の翻訳において、第一言語
の文書中に第二言語特有の文字種の文字列が混じってい
る場合、生成される第二言語への訳文の中でその文字列
が他の文字列と同化してしまい、結果として訳文が非常
に理解しにくくなったり、書式的にも良くないものとな
ると云う問題点があった。
As described above, in the conventional machine translation device, when translating between languages such as English and Japanese that have different language-specific character types, the first language document has If the character strings of the two language-specific character types are mixed, the character string will be assimilated with other character strings in the generated translation to the second language, and as a result, the translated text will be very difficult to understand. However, there was a problem that the format was not good.

【0006】本発明は上述した問題点を解決するために
なされたものであり、その目的とするところは、混乱の
もととなっている第一言語の文書中に混入している第二
言語特有の文字種からなる文字列を、訳文中で他の文字
列と容易に区別できるようにすることのできる機械翻訳
装置を提供することにある。
The present invention has been made to solve the above-mentioned problems, and an object of the present invention is to provide a second language mixed in a document of the first language, which is a source of confusion. It is an object of the present invention to provide a machine translation device capable of easily distinguishing a character string composed of a specific character type from other character strings in a translated sentence.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。すなわち、与えられ
る第一言語の文章をこれと異質の第二言語の文章に翻訳
する機械翻訳装置において、前記第一言語の文章中の文
字列における文字種を判別して第一言語に特有でない文
字種の文字列を選定する選定手段と、この選定された文
字列の文字種を判別して第二言語特有の文字種と一致す
るとき、その文字列を識別可能に処理する処理手段と、
この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、この翻訳された文章中
において前記処理手段にて識別可能に処理された文字列
に該当する文字列は翻訳された文章中の他の文字列と区
別可能な形式で生起するよう処理する弁別支援処理手段
とを設けて構成する。
In order to achieve the above object, the present invention is configured as follows. That is, in a machine translation device for translating a given first language sentence into a different second language sentence, a character type not unique to the first language is determined by determining the character type in the character string in the first language sentence. Selecting means for selecting the character string of, and a processing means for distinguishing the character string of the selected character string and recognizing the character string when they match the character type peculiar to the second language,
A translation unit that translates the sentence in the first language that has been processed by the processing unit into a sentence in the second language, and a character string corresponding to a character string that is identifiable by the processing unit in the translated sentence. Is provided with a discrimination support processing means for processing so as to occur in a format distinguishable from other character strings in the translated text.

【0008】また、第二には、複数の特徴付け形式のう
ち、所望の形式を選択する選択指示手段を設けると共
に、弁別支援処理手段は第一言語の文章中において前記
処理手段により識別可能に処理された文字列に該当する
文字列については翻訳文書中において第二言語の他の文
字列と識別できるように前記選択指示手段により指定さ
れた形式で特徴付け処理して出力する機能を持たせる。
Secondly, a selection instructing means for selecting a desired format from among a plurality of characterization formats is provided, and the discrimination support processing means can be identified by the processing means in the sentence of the first language. A character string corresponding to the processed character string has a function of characterizing and outputting in a format designated by the selection instructing means so that it can be distinguished from other character strings of the second language in the translated document. ..

【0009】[0009]

【作用】上記のように構成された本装置は、与えられる
第一言語の文章を選定手段により当該第一言語の文章中
の文字列における文字種を判別して第一言語に特有でな
い文字種の文字列を選定し、処理手段はこの選定された
文字列の文字種を判別して第二言語特有の文字種と一致
する場合に、その文字列を識別可能に処理する。このよ
うな処理が成された第一言語の文章は翻訳手段により翻
訳され、弁別支援処理手段はこの訳文中において前記処
理手段にて識別可能に処理された文字列に該当する文字
列は翻訳された文章中の他の文字列と区別可能な形式で
生起するよう処理する。
In the present apparatus configured as described above, the text of the given first language is selected by the selection means to determine the character type in the character string in the text of the first language, and the character of the character type not unique to the first language is determined. A string is selected, and the processing means discriminates the character type of the selected character string, and if the character type matches the character type peculiar to the second language, processes the character string so that the character string can be identified. The sentence in the first language that has been subjected to such processing is translated by the translation means, and the discrimination support processing means translates the character string corresponding to the character string that is identifiable by the processing means in the translated text. Process to occur in a format that can be distinguished from other character strings in the sentence.

【0010】この結果、第一言語の文章に含まれる第二
言語特有の文字種で構成される文字列は、第二言語に翻
訳後の他の文字列から区別できる所定の形式もしくは指
定の形式で特徴付けられて生起されることになる。
As a result, the character string composed of the character type peculiar to the second language included in the sentence of the first language is in a predetermined format or a specified format that can be distinguished from other character strings after being translated into the second language. It will be characterized and born.

【0011】このように、本発明の機械翻訳装置によれ
ば、翻訳に際し、文字種判別手段が第一言語の文書中に
混在する第一言語特有の文字列ではないが第二言語特有
の文字種からなる文字列を抽出し、識別可能に処理した
後、第二言語に翻訳し、この翻訳済み文章について弁別
支援処理手段は前記識別可能に処理した文字列に該当す
る文字列を訳文中の他の文字列と区別ができるように特
徴付けする。そのため、訳文において当該文字列が際立
ち、理解し易い訳文となる。また、当該文字列を他の文
字列から区別できるようにするにあたり、斜体文字形
式,引用符等での囲み形式,強調文字形式等、表示形式
に複数の実現方法がある場合は、その中から、どれを用
いるかを指定可能にすることにより、ユーザの要求のバ
リエーションを吸収でき、校正時の負担を軽減すること
ができる。
As described above, according to the machine translation apparatus of the present invention, when translating, the character type discriminating means is not a character string peculiar to the first language mixed in the document of the first language, but from the character type peculiar to the second language. Is extracted, processed to be identifiable, then translated into a second language, and the discrimination support processing means for this translated sentence is a character string corresponding to the identifiably processed character string in the translated sentence. Characterize it so that it can be distinguished from the character string. Therefore, the character string is prominent in the translated text, and the translated text is easy to understand. Also, in order to distinguish the character string from other character strings, if there are multiple ways to realize the display format, such as italicized character format, enclosing format in quotation marks, emphasized character format, etc. By making it possible to specify which one to use, it is possible to absorb variations in user requirements and reduce the burden of calibration.

【0012】従って、本発明によれば、混乱のもととな
っている第一言語の文書中に混在している第二言語特有
の文字種からなる文字列を、訳文中で他の文字列と容易
に区別できるようになる機械翻訳装置を提供できる。
Therefore, according to the present invention, a character string consisting of character types unique to the second language mixed in the document of the first language, which is a source of confusion, is replaced with another character string in the translated sentence. A machine translation device that can be easily distinguished can be provided.

【0013】[0013]

【実施例】以下、図面を参照しながら、日本語から英語
への翻訳を例に取り、本発明の実施例の説明を行う。本
発明の機械翻訳装置では、第一言語のデータを入力する
ための入力部と、翻訳に必要な辞書データを記録する辞
書記録部と、前記入力部より入力された第一言語のデー
タを前記辞書データを参照して第二言語のデータに翻訳
する翻訳部と、この翻訳部により得られた第二言語のデ
ータを出力するための出力部とを備える。そして、前記
翻訳部は、第一言語の原文中の個々の文字列の文字種を
判別する文字種判別部を備え、前記文字種判別部により
第一言語に特有でないと判別された文字列の文字種が第
二言語特有の文字種と一致する場合に、訳文中において
その文字列を他の文字列から区別できる手段(弁別支援
処理手段)を用いて生成する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The embodiments of the present invention will be described below with reference to the drawings, taking the translation from Japanese to English as an example. In the machine translation device of the present invention, the input unit for inputting the data in the first language, the dictionary recording unit for recording the dictionary data necessary for translation, and the data in the first language input from the input unit are A translation unit that refers to the dictionary data and translates the data into a second language data, and an output unit that outputs the second language data obtained by the translation unit. The translation unit includes a character type discriminating unit that discriminates the character type of each character string in the original text of the first language, and the character type of the character string discriminated by the character type discriminating unit is not unique to the first language. When the character string is unique to the two languages, it is generated by using a means (discrimination support processing means) that can distinguish the character string from other character strings in the translated sentence.

【0014】また、前記翻訳部の有する前記弁別支援処
理手段は、複数の実現方法を候補として持ち、前記入力
部より、どの方法を採用するかをユーザが選択・指定で
き、ユーザの指定に応じた実現方法で当該文字列を生成
する。
Further, the discrimination support processing means included in the translation unit has a plurality of realization methods as candidates, and the user can select / designate which method is to be adopted from the input unit, and according to the designation by the user. The character string is generated by the realization method described above.

【0015】図1は本発明の一実施例のブロック図を示
す。図1において、1は入力部、2は表示部、3は文書
記録部、4は辞書記録部、5は翻訳部、6は文字種判別
部、7は弁別支援処理部、8は翻訳制御部である。
FIG. 1 shows a block diagram of an embodiment of the present invention. In FIG. 1, 1 is an input unit, 2 is a display unit, 3 is a document recording unit, 4 is a dictionary recording unit, 5 is a translation unit, 6 is a character type discrimination unit, 7 is a discrimination support processing unit, and 8 is a translation control unit. is there.

【0016】これらのうち、前記入力部1は翻訳制御部
8に対し、翻訳対象となる原文(この場合、日本語文)
の入力や各種コマンドを入力したり、後に詳細を説明す
る弁別支援生成手段として、どの実現方法を用いるかを
指定するためのもので、通常、キーボード等が使用され
る。また、原文の入力についてOCR(光学的文字読取
装置)などによる入力も考えられる。
Of these, the input unit 1 instructs the translation control unit 8 to translate the original sentence (in this case, the Japanese sentence).
Is used to specify which realization method is to be used as a discrimination support generation means, which will be described later in detail, and a keyboard or the like is usually used. Further, with respect to the input of the original text, input by OCR (optical character reading device) or the like can be considered.

【0017】表示部2は、入力部1より入力した日本語
文や、翻訳部5により訳出された英語文を翻訳制御部8
の制御のもとに表示するためのもので、文字・記号や、
下線、斜文字などを表示できるものであり、例えばCR
Tディスプレイやプラズマ・ディスプレイ、液晶ディス
プレイ等が使用できる。また、弁別支援生成手段として
の実現方法の候補を表示する機能も持つ。
The display unit 2 translates the Japanese sentence input by the input unit 1 and the English sentence translated by the translation unit 5 into the translation control unit 8.
It is intended to be displayed under the control of
It can display underline, italic, etc., for example, CR
T displays, plasma displays, liquid crystal displays, etc. can be used. Further, it also has a function of displaying the candidates of the realization method as the discrimination support generation means.

【0018】文書記録部3は、翻訳制御部8の制御のも
とに第一言語と第二言語の文書それぞれを記録すると共
に、読出すことができるもので、日本語‐英語機械翻訳
システムを例にとると、第一言語である日本語文と第二
言語である英語文のそれぞれのデータを独立して記録で
きるほか、日本語文のデータとその翻訳結果としての英
語文のデータを対応づけて記録することが可能である。
Under the control of the translation control unit 8, the document recording unit 3 is capable of recording and reading each of the documents in the first language and the second language, and can read the Japanese-English machine translation system. For example, in addition to being able to record each data of the Japanese sentence which is the first language and the English sentence which is the second language independently, it is possible to associate the data of the Japanese sentence with the data of the English sentence as the translation result. It is possible to record.

【0019】辞書記録部4は、翻訳部5での翻訳処理に
必要な知識情報として、第一言語である日本語の単語・
熟語と第二言語である英語の訳語とを対応づけて記録し
た語彙辞書などの情報を記録するもので、さらに、見出
し語、品詞、活用形、概念、文法機能などを日本語と英
語の両方で記述したものも情報として記録できるもので
ある。
The dictionary recording unit 4 stores the words of the first language, Japanese, as knowledge information necessary for the translation processing in the translation unit 5.
It records information such as a vocabulary dictionary in which idioms and English translations, which are the second language, are associated with each other and records information such as headwords, parts of speech, conjugations, concepts, and grammatical functions in both Japanese and English. The information described in can also be recorded as information.

【0020】翻訳部5は、翻訳制御部8の制御のもとに
辞書記録部4の情報を参照しながら第一言語のデータで
ある日本語文を第二言語のデータである英語文に翻訳す
るものである。これは従来の翻訳部に加えて、文字種判
別部6と弁別支援処理部7を備えている。
Under the control of the translation control unit 8, the translation unit 5 translates the Japanese sentence, which is the data of the first language, into the English sentence, which is the data of the second language, while referring to the information in the dictionary recording unit 4. It is a thing. In addition to the conventional translation unit, it has a character type discrimination unit 6 and a discrimination support processing unit 7.

【0021】これらのうち文字種判別部6は、第一言語
である日本語の文書中に含まれた第二言語である英語特
有のアルファベット文字からなる文字列や、アルファベ
ット文字に記号・数字などが混じった文字列を判別して
抽出するものである。
Of these, the character type discriminating unit 6 includes a character string consisting of alphabetic characters peculiar to the second language English included in the document of the first language Japanese, and the alphabetic characters such as symbols and numbers. This is to distinguish and extract a mixed character string.

【0022】また、弁別支援処理部7は、前記文字種判
別部6により抽出された文字列を訳文中に生成する際
に、その文字列を訳文中の他の文字列と区別できるよう
に弁別支援処理手段を用いて生成処理を施す。この時、
予めユーザにより前記入力部1より弁別支援の実現方法
の指定がされていれば、指定内容に応じた処理をするよ
うにしてある。
When the character string extracted by the character type discriminating unit 6 is generated in the translated sentence, the discrimination supporting processing unit 7 discriminates the character string from other character strings in the translated sentence. Generation processing is performed using the processing means. At this time,
If the user has previously designated the method of realizing the discrimination support from the input unit 1, the processing according to the designated content is performed.

【0023】翻訳制御部8は、本装置の全体の制御を司
るものである。
The translation control unit 8 controls the entire apparatus.

【0024】図2は、前記入力部1のキー配列の一例を
示す図である。入力部1は数字や記号を含む和文/英文
入力用の文字キー201に加え、ファンクションキーと
して翻訳指示キー202、編集キー203、機能キー2
04、カーソルキー205、および他のキーを備えてい
る。
FIG. 2 is a view showing an example of the key arrangement of the input section 1. The input unit 1 includes a character key 201 for inputting Japanese / English sentences including numbers and symbols, a translation instruction key 202, an edit key 203, and a function key 2 as function keys.
04, cursor keys 205, and other keys.

【0025】図3は、表示部2の画面レイアウトの一例
を示す図である。入力した原文は画面左側の原文表示領
域301に表示される。翻訳処理の結果得られた訳文は
画面右側の訳文表示領域302に表示される。また、画
面上部の編集領域303は各種編集に必要な情報を表示
するために用いることができる。
FIG. 3 is a diagram showing an example of the screen layout of the display unit 2. The input original text is displayed in the original text display area 301 on the left side of the screen. The translated text obtained as a result of the translation processing is displayed in the translated text display area 302 on the right side of the screen. The edit area 303 at the top of the screen can be used to display information necessary for various edits.

【0026】図4は、翻訳制御部8の動作を説明するた
めのフローチャートである。このフローチャートを参照
して本システムの作用を説明する。
FIG. 4 is a flow chart for explaining the operation of the translation controller 8. The operation of this system will be described with reference to this flowchart.

【0027】翻訳制御部8は、文書記録部3に記録され
ている文書のうち、翻訳対象としたい文書が指定され、
翻訳開始のコマンドが入力部1から入力されることによ
り動作を開始する。翻訳開始に先立ち、まず、翻訳対象
文書の日本語文書原文中に現れるアルファベット文字列
やアルファベットと記号・数字の混じった文字列を訳文
中でどのように処理して生成するかをユーザに指定させ
る(ステップS401)。
The translation control unit 8 specifies the document to be translated among the documents recorded in the document recording unit 3,
The operation is started when a translation start command is input from the input unit 1. Before starting translation, first let the user specify how to process and generate alphabetic character strings that appear in the original Japanese text of the translation target document or character strings mixed with alphabets and symbols and numbers in the translated text. (Step S401).

【0028】これは翻訳時特定文字列表示形式設定画面
を翻訳制御部8が表示部2に表示させるべく制御し、ユ
ーザが入力部1によりこの画面を操作して選択指定する
ことで翻訳制御部8が設定内容を認識し、その設定内容
に沿ったかたちで処理を進める。
This is because the translation control unit 8 controls the display unit 2 to display the translation specific character string display format setting screen, and the user operates the screen with the input unit 1 to select and specify the translation control unit. 8 recognizes the setting contents, and advances the processing in accordance with the setting contents.

【0029】図5は、その際にユーザに提示する翻訳時
特定文字列表示形式設定画面の一例である。この実施例
では選択肢として、「斜体文字で生成する。」、「太字
体文字で生成する。」、「引用符で囲む。」、「下線を
付ける。」他を提示している。もちろん、「指定なし」
とすることもできる。
FIG. 5 is an example of a translation specific character string display format setting screen presented to the user at that time. In this embodiment, as options, "generate with italic characters", "generate with bold type characters", "enclose in quotation marks", "underline.", Etc. are presented. Of course, "no designation"
It can also be

【0030】ここでユーザにより、何等かの指定があっ
た場合には、翻訳制御部8はその内容を弁別支援生成手
段として設定する(ステップS402)。一方、指定が
ない場合にはデフォルト値として、「斜体文字で生成す
る。」を弁別支援処理手段に設定する(ステップS40
3)。
Here, if the user specifies something, the translation control unit 8 sets the content as the discrimination support generating means (step S402). On the other hand, if no designation is made, "generate in italics" is set as the default value in the discrimination support processing means (step S40).
3).

【0031】これらの処理によって原文中のアルファベ
ット文字列、およびアルファベットと記号・数字の混じ
った文字列に対する生成処理手段が決まるため、翻訳制
御部8は翻訳対象となる文書として第一言語のデータ
(データA)を文書記録部3から読み込む(ステップS
404)。もちろん、これは入力部1から直接、文書を
入力してこれを翻訳させるようにすることもできる。
Since these processes determine the generation processing means for the alphabetic character string in the original text and the character string in which the alphabet, the symbols, and the numbers are mixed, the translation control unit 8 determines the data of the first language ( Data A) is read from the document recording unit 3 (step S
404). Of course, this can also be performed by inputting a document directly from the input unit 1 and translating it.

【0032】翻訳制御部8はまず、データAの第一文
(第1段落)を取り出し(ステップS405)、これを
翻訳部5へ転送し、この翻訳部5に翻訳処理を実施させ
て翻訳結果を得る(ステップS406)。なお、この翻
訳過程については後に図6を用いて説明する。
The translation control unit 8 first takes out the first sentence (first paragraph) of the data A (step S405), transfers it to the translation unit 5, and causes the translation unit 5 to perform a translation process to obtain a translation result. Is obtained (step S406). The translation process will be described later with reference to FIG.

【0033】この処理をデータAの最後の文(最終段
落)が終了するまで繰り返し(ステップS407、S4
08)、データAの最後の文まで翻訳が終了した場合に
は、データAとその翻訳結果を文書記録部3に記録して
(ステップS409)、処理を終了する。
This process is repeated until the last sentence (final paragraph) of the data A is completed (steps S407 and S4).
08) and when the translation is completed up to the last sentence of the data A, the data A and the translation result are recorded in the document recording unit 3 (step S409), and the process is terminated.

【0034】図6は、図4におけるステップS406、
すなわち、翻訳部5の処理の流れを説明するフローチャ
ートである。
FIG. 6 shows a step S406 in FIG.
That is, it is a flowchart for explaining the flow of processing of the translation unit 5.

【0035】翻訳部5は、翻訳制御部8より翻訳対象と
なる文書データが転送されることにより動作を開始す
る。翻訳対象となる文書データが転送されると、翻訳部
5は文字種判別部6がまず、原文中の各単語の文字種の
判別を行い(ステップS601)、注目文字列であるア
ルファベット文字列からなる語、およびアルファベット
と記号・数字の混った語を抽出し、その抽出した語にマ
ークを付す。
The translation unit 5 starts its operation when the document data to be translated is transferred from the translation control unit 8. When the document data to be translated is transferred, in the translation unit 5, the character type discriminating unit 6 first discriminates the character type of each word in the original sentence (step S601), and the word consisting of the alphabetic character string which is the focused character string. , And a word with a mixture of alphabets and symbols / numbers are extracted, and the extracted word is marked.

【0036】本実施例ではトランスファ方式を用いてい
るので、その後、翻訳部5は翻訳のための解析処理(ス
テップS602)、変換処理(ステップS603)、生
成処理(ステップS604)を行い、翻訳結果を出力す
る前段階でのデータを得る。続いて、ステップS601
においてマークの付けられた語句に対して、弁別支援処
理部7は設定されている弁別支援の設定内容に応じた弁
別支援処理を施す(ステップS605)。
Since the transfer method is used in the present embodiment, the translation unit 5 thereafter performs the analysis process for translation (step S602), the conversion process (step S603), and the generation process (step S604) to obtain the translation result. Obtain the data at the stage before outputting. Then, step S601.
The discrimination support processing unit 7 performs the discrimination support processing according to the set content of the discrimination support that has been set on the words and phrases marked in (step S605).

【0037】弁別支援処理では、先の設定が「斜体文字
で生成する。」であれば、当該文字列は斜体文字となる
ように生成し、「太字体文字で生成する。」が設定され
ていれば、当該文字列は太字体文字で生成し、「引用符
で囲む。」が設定されていれば、当該文字列はダブル・
クォーテーション記号やシングル・クォーテーション記
号や各種括弧記号などの引用符で囲まれた形で生成し、
「下線を付ける。」が設定されていれば、当該文字列は
下線付きで生成する。
In the discrimination support process, if the previous setting is "generate in italic characters", the character string is generated to be italic characters, and "generate in bold type characters" is set. If so, the character string is generated in bold font, and if "enclose in quotation marks." Is set, the character string is double-byte.
It is generated in the form surrounded by quotation marks such as quotation marks, single quotation marks and various parentheses.
If "underline." Is set, the character string is generated with an underline.

【0038】図7に、これらの選択肢が設定された場合
の生成例を示す。この場合の翻訳対象とする原文(日本
文)は「There are がハイライトされます。」であり、
翻訳の結果は図7の(1) は「斜体文字で生成する。」が
設定された場合の、また、図7の(2) は「太字体文字で
生成する。」が設定された場合の、また、図7の(3) は
「引用符で囲む。」が設定された場合の、また、図7の
(4) は「下線を付ける。」が設定された場合の訳文の一
例である。
FIG. 7 shows an example of generation when these options are set. The original text (Japanese text) to be translated in this case is "There are highlighted."
The translation results are shown in Fig. 7 (1) when "generate in italics" is set, and in (2) in Fig. 7 when "generate in boldface." , (3) of FIG. 7 is set when “enclose in quotation marks.”
(4) is an example of a translated sentence when “underline.” Is set.

【0039】表示部2には翻訳部5により生成されたこ
のような処理のなされたデータを受けた翻訳制御部8の
制御によって、注目文字列は図7のような特徴付けがな
されたかたちで生成翻訳文が表示されることになり、こ
れにより、原文中にアルファベットで記述された英単語
は、英訳された文章中ではそれぞれこの部分がはっきり
わかるように表示部2に表示される。もちろん、プリン
タに印字させる場合も翻訳制御部8の制御によってこの
ような特徴を維持した状態で印字させることができる。
The display unit 2 receives the processed data generated by the translation unit 5 under the control of the translation control unit 8, and the character string of interest is characterized as shown in FIG. The generated translated sentence is displayed, so that the English words described in alphabet in the original sentence are displayed on the display unit 2 so that this portion can be clearly understood in the translated sentence. Of course, even when printing is performed by the printer, it is possible to perform printing while maintaining such characteristics under the control of the translation controller 8.

【0040】このように、本装置は与えられる第一言語
の文章をこれと異質の第二言語の文章に翻訳する機械翻
訳装置において、複数の特徴付け形式のうち、所望の形
式を選択指定する選択指示手段と、前記第一言語の文章
中の文字列における文字種を判別して第一言語に特有で
ない文字種の文字列を選定する選定手段と、この選定さ
れた文字列の文字種を判別して第二言語特有の文字種と
一致するとき、その文字列を識別可能に処理する処理手
段と、この処理手段による処理済みの第一言語の文章を
第二言語の文章に翻訳する翻訳手段と、この翻訳された
文章中において前記処理手段にて識別可能に処理された
文字列に該当する文字列は翻訳された文章中の他の文字
列と区別可能な前記選択指定した形式で生起するよう処
理する弁別支援処理手段とを設けて構成したものであ
る。
As described above, the present apparatus is a machine translation apparatus for translating a given sentence in a first language into a sentence in a different second language, and selects and designates a desired form from a plurality of characterizing forms. A selection instructing means, a selection means for determining a character type of a character string in a sentence of the first language to select a character string of a character type not unique to the first language, and a character type of the selected character string; When it matches the character type peculiar to the second language, the processing means for processing the character string so that it can be identified, the translation means for translating the text of the first language processed by this processing means into the text of the second language, A character string corresponding to a character string that has been processed to be identifiable by the processing means in the translated text is processed to occur in the selected and specified format that can be distinguished from other character strings in the translated text. Discrimination support It is constructed by providing a means.

【0041】そして、与えられる第一言語の文章を選定
手段により当該第一言語の文章中の文字列における文字
種を判別して第一言語に特有でない文字種の文字列を選
定し、処理手段はこの選定された文字列の文字種を判別
して第二言語特有の文字種と一致する場合に、その文字
列を識別可能に処理する。そして、このような処理が成
された第一言語の文章は翻訳手段により翻訳され、弁別
支援処理手段はこの訳文中において前記処理手段にて識
別可能に処理された文字列に該当する文字列は翻訳され
た文章中の他の文字列と区別可能な形式で生起するよう
処理すると云うものである。
Then, the text of the given first language is selected by the selecting means to determine the character type of the character string in the text of the first language, and the character string of the character type not unique to the first language is selected. When the character type of the selected character string is discriminated and if it matches the character type peculiar to the second language, the character string is processed so as to be identifiable. Then, the sentence in the first language subjected to such processing is translated by the translation means, and the discrimination support processing means determines that the character string corresponding to the character string processed by the processing means in the translated text is identifiable. The processing is performed so that it occurs in a format that can be distinguished from other character strings in the translated text.

【0042】この結果、第一言語の文章に含まれる第二
言語特有の文字種で構成される文字列を、第二言語に翻
訳後の他の文字列から区別できる所定の形式もしくは指
定の形式で特徴付けて生起されることになる。
As a result, the character string composed of the character type unique to the second language, which is included in the sentence of the first language, can be distinguished from other character strings after being translated into the second language in a predetermined format or a designated format. It will be characterized and aroused.

【0043】従って、第一言語で書かれた文章中に含ま
れる第二言語の文字種を使用した文字列に対しては第二
言語に翻訳された場合の出力において、区別できるよう
に特徴付けて表示できるようになる。
Therefore, the character string using the character type of the second language contained in the sentence written in the first language is characterized so that it can be distinguished in the output when translated into the second language. Can be displayed.

【0044】なお、本発明は上述した実施例に限定され
るものではない。例えば、上記の実施例においては、弁
別支援処理手段の実現方法の候補として、「斜体文字で
生成する。」、「太字体文字で生成する。」、「引用符
で囲む。」、「下線を付ける。」を挙げたが、これらに
限られるものではなく、書体・字体の他のバリエーショ
ンが多数応用できるし、反転文字化・高輝度化・網掛け
なども利用できる。また、引用符の種類を細分して選択
させても良い。更に、当該文字列が英単語として実在す
るものの場合に限って、弁別支援処理を適用するように
することも可能であるし、どのタイプの文字列に本弁別
支援処理を適用するかをユーザに指定させるようにして
も良い。
The present invention is not limited to the above embodiment. For example, in the above-described embodiment, as a candidate for the method for realizing the discrimination support processing means, "generate in italics", "generate in bold font", "enclose in quotation marks", "underline However, the present invention is not limited to these, and many other variations of typefaces and fonts can be applied, and inversion characters, high brightness, and shading can also be used. Also, the types of quotation marks may be subdivided and selected. Furthermore, it is also possible to apply the discrimination support process only when the character string actually exists as an English word, and the user can determine which type of character string the main discrimination support process is applied to. You may make it specify.

【0045】この他に、本実施例では、翻訳処力が「解
析」「変換」「生成」の手順で行われるトランスファ方
式に基づいて述べているが、ピボット方式により翻訳処
理でも可能である。これは本発明が、訳文出力の直前の
段階で弁別支援処理を行うものであるので、翻訳処理の
方式に影響されるものではないからである。
In addition to this, in the present embodiment, the translation processing is described based on the transfer method performed by the procedures of "analysis", "conversion", and "generation", but the translation processing can also be performed by the pivot method. This is because the present invention performs the discrimination support process immediately before the output of the translated sentence, and is not affected by the translation process method.

【0046】要するに、本発明はその主旨を逸脱しない
範囲で種々変更して実施することができる。
In short, the present invention can be implemented with various modifications without departing from the spirit thereof.

【0047】[0047]

【発明の効果】以上述べたように、本発明によれば、例
えば、日本語と英語の間の翻訳のように翻訳する言語対
の個々の言語の特有な文字種が異なっており、かつ第一
言語の文書中に第二言語特有の文字種からなる文字列が
混入している場合に、その文字列を第二言語の訳文の中
で他の文字列と区別がつき易い形式で生成できるため
に、混乱を招くことのない、しかも、理解容易な訳文を
生成することができるようになる他、他の文字列を区別
し易くする表現形式として多種多様の形式の中からユー
ザの好みに合う形式で実施させることもできる等、使い
勝手の格段に良い機械翻訳装置を提供できる。
As described above, according to the present invention, the unique character types of the individual languages of the language pair to be translated, such as the translation between Japanese and English, are different, and If a character string consisting of a character type unique to the second language is mixed in the language document, the character string can be generated in a format that is easily distinguishable from other character strings in the translated text of the second language. , Which will not cause confusion and will be able to generate translated text that is easy to understand, and will also be a format that suits the user's preference from among a wide variety of formats as an expression format that makes it easy to distinguish other character strings. It is also possible to provide a machine translation device that is remarkably easy to use.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の全体のブロック図。FIG. 1 is an overall block diagram of an embodiment of the present invention.

【図2】図1に示した入力部のキー配列の例を示す図。FIG. 2 is a diagram showing an example of a key layout of the input unit shown in FIG.

【図3】図1に示した表示部のレイアウトの例を示す
図。
FIG. 3 is a diagram showing an example of a layout of the display unit shown in FIG.

【図4】本発明の一実施例で用いる翻訳制御部の処理の
流れの一例を示すフローチャート。
FIG. 4 is a flowchart showing an example of a processing flow of a translation control unit used in an embodiment of the present invention.

【図5】図4において、日本語原文中に生起するアルフ
ァベット文字列の生成処理手段の内容をユーザに指定さ
せる際の表示部の表示例を示す図。
FIG. 5 is a diagram showing a display example of a display unit in FIG. 4 when the user specifies the content of the generation processing means of the alphabetic character string occurring in the Japanese original sentence.

【図6】図4における翻訳処理の詳細を示すフローチャ
ート。
FIG. 6 is a flowchart showing details of translation processing in FIG.

【図7】本発明の一実施例における処理の説明のための
データの例を示す図。
FIG. 7 is a diagram showing an example of data for explaining processing according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1…入力部、2…表示部、3…文書記録部、4…辞書記
録部、5…翻訳部、6…文字種判別部、7…弁別支援処
理部、8…翻訳制御部。
DESCRIPTION OF SYMBOLS 1 ... Input part, 2 ... Display part, 3 ... Document recording part, 4 ... Dictionary recording part, 5 ... Translation part, 6 ... Character type discrimination part, 7 ... Discrimination support processing part, 8 ... Translation control part.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は翻訳された文
章中の他の文字列と区別可能な形式で生起するよう処理
する弁別支援処理手段とを設けて構成したことを特徴と
する機械翻訳装置。
1. A machine translation device for translating a given sentence in a first language into a sentence in a second language which is different from the given sentence, wherein the character type in the character string in the sentence in the first language is determined to be the first language. A selecting means for selecting a character string of a non-unique character type; a processing means for distinguishing the character type of the selected character string and processing the character string so that the character string can be identified when the character type is unique to the second language; The translation means for translating the sentence in the first language that has been processed by the processing means into the sentence in the second language, and the character string corresponding to the character string that is distinguishably processed by the processing means in the translated text are A machine translation device, comprising: a discrimination support processing means for processing so as to occur in a format distinguishable from other character strings in a translated sentence.
【請求項2】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は翻訳された文
章中の他の文字列と区別可能な形式で生起するよう処理
する弁別支援処理手段と、 弁別支援処理手段による処理済みの翻訳結果を出力する
と共に、前記文字列は特徴付けして出力する手段とを設
けて構成したことを特徴とする機械翻訳装置。
2. A machine translation device for translating a given sentence in a first language into a sentence in a second language which is different from the first sentence, wherein the character type in the character string in the sentence in the first language is determined to be the first language. A selecting means for selecting a character string of a non-unique character type; a processing means for distinguishing the character type of the selected character string and processing the character string so that the character string can be identified when the character type is unique to the second language; The translation means for translating the sentence in the first language that has been processed by the processing means into the sentence in the second language, and the character string corresponding to the character string that is distinguishably processed by the processing means in the translated text are Discrimination support processing means for processing so as to occur in a form distinguishable from other character strings in the translated text, and outputting the translation result processed by the discrimination support processing means, and characterizing the character strings. Output Machine translation apparatus, characterized in that which is configured by providing a means.
【請求項3】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 複数の特徴付け形式のうち、所望の形式を選択する選択
指示手段と、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は前記選択指定
された形式とすべく処理する弁別支援処理手段とを設け
て構成したことを特徴とする機械翻訳装置。
3. A machine translation device for translating a given sentence in a first language into a sentence in a different second language, and a selection instruction means for selecting a desired one of a plurality of characterization forms, Selection means for determining a character type in a character string in a sentence of the first language and selecting a character string of a character type not specific to the first language, and a character type specific to the second language by determining the character type of the selected character string And a translation means for translating the sentence in the first language processed by the processing means into a sentence in the second language, and A machine translation apparatus comprising: a discrimination support processing means for processing a character string corresponding to a character string processed in a distinguishable manner by the processing means so as to be processed in the selected and specified format.
【請求項4】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 複数の特徴付け形式のうち、所望の形式を選択指定する
選択指示手段と、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は前記選択指定
された形式とすべく処理する弁別支援処理手段と、 弁別支援処理手段による処理済みの翻訳結果を出力する
と共に、前記文字列は特徴付けして出力する手段とを設
けて構成したことを特徴とする機械翻訳装置。
4. A machine translation device for translating a given sentence in a first language into a sentence in a different second language, and a selection instruction means for selecting and designating a desired form among a plurality of characterization forms. Selecting means for determining a character type in a character string in a sentence of the first language and selecting a character string of a character type not specific to the first language; and a character type of the selected character string for determining a character type of the second language When the character string matches the character string, a processing unit that processes the character string in a distinguishable manner, a translation unit that translates the sentence in the first language processed by the processing unit into a sentence in the second language, and a translation unit in the translated sentence. In the above, the character string corresponding to the character string processed by the processing means is outputted to the discrimination support processing means for processing so as to be in the selected and designated format, and the translation result processed by the discrimination support processing means. In addition, the machine translation device is characterized by being provided with means for characterizing and outputting the character string.
JP25255391A 1991-09-30 1991-09-30 Machine translation equipment Expired - Lifetime JP3147947B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25255391A JP3147947B2 (en) 1991-09-30 1991-09-30 Machine translation equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25255391A JP3147947B2 (en) 1991-09-30 1991-09-30 Machine translation equipment

Publications (2)

Publication Number Publication Date
JPH0589163A true JPH0589163A (en) 1993-04-09
JP3147947B2 JP3147947B2 (en) 2001-03-19

Family

ID=17238975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25255391A Expired - Lifetime JP3147947B2 (en) 1991-09-30 1991-09-30 Machine translation equipment

Country Status (1)

Country Link
JP (1) JP3147947B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332944A (en) * 1993-05-19 1994-12-02 Brother Ind Ltd Document processor provided with translating function

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332944A (en) * 1993-05-19 1994-12-02 Brother Ind Ltd Document processor provided with translating function

Also Published As

Publication number Publication date
JP3147947B2 (en) 2001-03-19

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
KR900008769B1 (en) Machine interpretting system
US6119077A (en) Translation machine with format control
JP3147947B2 (en) Machine translation equipment
JPH0883280A (en) Document processor
JP4350566B2 (en) Machine translation system
JPH08212216A (en) Natural language processor and natural language processing method
JP3131432B2 (en) Machine translation method and machine translation device
JP2621999B2 (en) Document processing device
JP2715419B2 (en) Translation equipment
JP3692711B2 (en) Machine translation device
JP2727076B2 (en) Translation support device
JPH08106461A (en) Method and device for document processing
JPH0350668A (en) Character processor
JPH05266009A (en) Method and device for production of document
JPH05189421A (en) Method and device for kana/kanji conversion of ancient classics
JP2005165652A (en) Translation memory system, translation method and program for translation memory system
JPH0232460A (en) Document processor
JPS60207948A (en) "kana"/"kanji" conversion processor
JPH08241315A (en) Word registering mechanism for document processor
JPH01197876A (en) Electronic dictionary
JPS62271054A (en) Correction system for morpheme analysis result of translation device
JPH06131327A (en) Method and device for processing character
JP2002041516A (en) Device and method for machine translation, and computer-readable storage medium with machine translating program recorded thereon
JPH1063660A (en) Machine translation system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 11