JP3147947B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP3147947B2 JP3147947B2 JP25255391A JP25255391A JP3147947B2 JP 3147947 B2 JP3147947 B2 JP 3147947B2 JP 25255391 A JP25255391 A JP 25255391A JP 25255391 A JP25255391 A JP 25255391A JP 3147947 B2 JP3147947 B2 JP 3147947B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- character string
- sentence
- character
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
二言語のデータに翻訳する機械翻訳装置に関する。
語への翻訳のように、言語特有の文字種が異なる言語対
の間の翻訳において、第一言語の文書中に第二言語特有
の文字種の文字列が混在している場合、従来の機械翻訳
技術では、特に訳出に工夫が施されていないために、原
文書中では明確に他の文字列と区別されて認識できてい
た異種文字列が、訳文中では他の文字列に溶け込んでし
まい、読みにくい(理解しにくい)訳文を生成してしま
う、と云う問題があった。
の際に生じるケースで説明する。日本語文書中に英単語
のアルファベット文字列 continueがあったとする。こ
れは英単語としては動詞であるが、日本語の文書中に存
在する限り、名詞句以外の構文上の機能を持ち得ない。
翻訳すると、名詞句として機能すべき構文中の位置に動
詞である continue が裸のまま生起することになる。
その結果、訳出された英文は非常に理解しにくい(時に
は誤解を招く)ものとなる。同様な問題は英語から日本
語への翻訳の場合にも生じる。たとえば、英語文書中に
日本語のひらがな・カタカナ・漢字などの文字列があっ
た場合、日本語では一般に単語間の切れ目としてスペー
スを置かないため、英文中にあったその日本語文字列は
生成された日本語の訳文中でまったく他の文字列に同化
してしまい、非常に読みにくくなるばかりでなく、生成
される訳文は書式的にも良いものとは言えない。
の機械翻訳装置では、英文と日本文などのように、言語
特有の文字種が異なる言語間の翻訳において、第一言語
の文書中に第二言語特有の文字種の文字列が混じってい
る場合、生成される第二言語への訳文の中でその文字列
が他の文字列と同化してしまい、結果として訳文が非常
に理解しにくくなったり、書式的にも良くないものとな
ると云う問題点があった。
なされたものであり、その目的とするところは、混乱の
もととなっている第一言語の文書中に混入している第二
言語特有の文字種からなる文字列を、訳文中で他の文字
列と容易に区別できるようにすることのできる機械翻訳
装置を提供することにある。
め、本発明は次のように構成する。すなわち、与えられ
る第一言語の文章をこれと異質の第二言語の文章に翻訳
する機械翻訳装置において、前記第一言語の文章中の文
字列における文字種を判別して第一言語に特有でない文
字種の文字列を選定する選定手段と、この選定された文
字列の文字種を判別して第二言語特有の文字種と一致す
るとき、その文字列を識別可能に処理する処理手段と、
この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、この翻訳された文章中
において前記処理手段にて識別可能に処理された文字列
に該当する文字列は翻訳された文章中の他の文字列と区
別可能な形式で生起するよう処理する弁別支援処理手段
とを設けて構成する。
ち、所望の形式を選択する選択指示手段を設けると共
に、弁別支援処理手段は第一言語の文章中において前記
処理手段により識別可能に処理された文字列に該当する
文字列については翻訳文書中において第二言語の他の文
字列と識別できるように前記選択指示手段により指定さ
れた形式で特徴付け処理して出力する機能を持たせる。
第一言語の文章を選定手段により当該第一言語の文章中
の文字列における文字種を判別して第一言語に特有でな
い文字種の文字列を選定し、処理手段はこの選定された
文字列の文字種を判別して第二言語特有の文字種と一致
する場合に、その文字列を識別可能に処理する。このよ
うな処理が成された第一言語の文章は翻訳手段により翻
訳され、弁別支援処理手段はこの訳文中において前記処
理手段にて識別可能に処理された文字列に該当する文字
列は翻訳された文章中の他の文字列と区別可能な形式で
生起するよう処理する。
言語特有の文字種で構成される文字列は、第二言語に翻
訳後の他の文字列から区別できる所定の形式もしくは指
定の形式で特徴付けられて生起されることになる。
ば、翻訳に際し、文字種判別手段が第一言語の文書中に
混在する第一言語特有の文字列ではないが第二言語特有
の文字種からなる文字列を抽出し、識別可能に処理した
後、第二言語に翻訳し、この翻訳済み文章について弁別
支援処理手段は前記識別可能に処理した文字列に該当す
る文字列を訳文中の他の文字列と区別ができるように特
徴付けする。そのため、訳文において当該文字列が際立
ち、理解し易い訳文となる。また、当該文字列を他の文
字列から区別できるようにするにあたり、斜体文字形
式,引用符等での囲み形式,強調文字形式等、表示形式
に複数の実現方法がある場合は、その中から、どれを用
いるかを指定可能にすることにより、ユーザの要求のバ
リエーションを吸収でき、校正時の負担を軽減すること
ができる。
っている第一言語の文書中に混在している第二言語特有
の文字種からなる文字列を、訳文中で他の文字列と容易
に区別できるようになる機械翻訳装置を提供できる。
への翻訳を例に取り、本発明の実施例の説明を行う。本
発明の機械翻訳装置では、第一言語のデータを入力する
ための入力部と、翻訳に必要な辞書データを記録する辞
書記録部と、前記入力部より入力された第一言語のデー
タを前記辞書データを参照して第二言語のデータに翻訳
する翻訳部と、この翻訳部により得られた第二言語のデ
ータを出力するための出力部とを備える。そして、前記
翻訳部は、第一言語の原文中の個々の文字列の文字種を
判別する文字種判別部を備え、前記文字種判別部により
第一言語に特有でないと判別された文字列の文字種が第
二言語特有の文字種と一致する場合に、訳文中において
その文字列を他の文字列から区別できる手段(弁別支援
処理手段)を用いて生成する。
理手段は、複数の実現方法を候補として持ち、前記入力
部より、どの方法を採用するかをユーザが選択・指定で
き、ユーザの指定に応じた実現方法で当該文字列を生成
する。
す。図1において、1は入力部、2は表示部、3は文書
記録部、4は辞書記録部、5は翻訳部、6は文字種判別
部、7は弁別支援処理部、8は翻訳制御部である。
8に対し、翻訳対象となる原文(この場合、日本語文)
の入力や各種コマンドを入力したり、後に詳細を説明す
る弁別支援生成手段として、どの実現方法を用いるかを
指定するためのもので、通常、キーボード等が使用され
る。また、原文の入力についてOCR(光学的文字読取
装置)などによる入力も考えられる。
文や、翻訳部5により訳出された英語文を翻訳制御部8
の制御のもとに表示するためのもので、文字・記号や、
下線、斜文字などを表示できるものであり、例えばCR
Tディスプレイやプラズマ・ディスプレイ、液晶ディス
プレイ等が使用できる。また、弁別支援生成手段として
の実現方法の候補を表示する機能も持つ。
とに第一言語と第二言語の文書それぞれを記録すると共
に、読出すことができるもので、日本語‐英語機械翻訳
システムを例にとると、第一言語である日本語文と第二
言語である英語文のそれぞれのデータを独立して記録で
きるほか、日本語文のデータとその翻訳結果としての英
語文のデータを対応づけて記録することが可能である。
必要な知識情報として、第一言語である日本語の単語・
熟語と第二言語である英語の訳語とを対応づけて記録し
た語彙辞書などの情報を記録するもので、さらに、見出
し語、品詞、活用形、概念、文法機能などを日本語と英
語の両方で記述したものも情報として記録できるもので
ある。
辞書記録部4の情報を参照しながら第一言語のデータで
ある日本語文を第二言語のデータである英語文に翻訳す
るものである。これは従来の翻訳部に加えて、文字種判
別部6と弁別支援処理部7を備えている。
である日本語の文書中に含まれた第二言語である英語特
有のアルファベット文字からなる文字列や、アルファベ
ット文字に記号・数字などが混じった文字列を判別して
抽出するものである。
別部6により抽出された文字列を訳文中に生成する際
に、その文字列を訳文中の他の文字列と区別できるよう
に弁別支援処理手段を用いて生成処理を施す。この時、
予めユーザにより前記入力部1より弁別支援の実現方法
の指定がされていれば、指定内容に応じた処理をするよ
うにしてある。
るものである。
示す図である。入力部1は数字や記号を含む和文/英文
入力用の文字キー201に加え、ファンクションキーと
して翻訳指示キー202、編集キー203、機能キー2
04、カーソルキー205、および他のキーを備えてい
る。
を示す図である。入力した原文は画面左側の原文表示領
域301に表示される。翻訳処理の結果得られた訳文は
画面右側の訳文表示領域302に表示される。また、画
面上部の編集領域303は各種編集に必要な情報を表示
するために用いることができる。
めのフローチャートである。このフローチャートを参照
して本システムの作用を説明する。
ている文書のうち、翻訳対象としたい文書が指定され、
翻訳開始のコマンドが入力部1から入力されることによ
り動作を開始する。翻訳開始に先立ち、まず、翻訳対象
文書の日本語文書原文中に現れるアルファベット文字列
やアルファベットと記号・数字の混じった文字列を訳文
中でどのように処理して生成するかをユーザに指定させ
る(ステップS401)。
を翻訳制御部8が表示部2に表示させるべく制御し、ユ
ーザが入力部1によりこの画面を操作して選択指定する
ことで翻訳制御部8が設定内容を認識し、その設定内容
に沿ったかたちで処理を進める。
特定文字列表示形式設定画面の一例である。この実施例
では選択肢として、「斜体文字で生成する。」、「太字
体文字で生成する。」、「引用符で囲む。」、「下線を
付ける。」他を提示している。もちろん、「指定なし」
とすることもできる。
た場合には、翻訳制御部8はその内容を弁別支援生成手
段として設定する(ステップS402)。一方、指定が
ない場合にはデフォルト値として、「斜体文字で生成す
る。」を弁別支援処理手段に設定する(ステップS40
3)。
ット文字列、およびアルファベットと記号・数字の混じ
った文字列に対する生成処理手段が決まるため、翻訳制
御部8は翻訳対象となる文書として第一言語のデータ
(データA)を文書記録部3から読み込む(ステップS
404)。もちろん、これは入力部1から直接、文書を
入力してこれを翻訳させるようにすることもできる。
(第1段落)を取り出し(ステップS405)、これを
翻訳部5へ転送し、この翻訳部5に翻訳処理を実施させ
て翻訳結果を得る(ステップS406)。なお、この翻
訳過程については後に図6を用いて説明する。
落)が終了するまで繰り返し(ステップS407、S4
08)、データAの最後の文まで翻訳が終了した場合に
は、データAとその翻訳結果を文書記録部3に記録して
(ステップS409)、処理を終了する。
すなわち、翻訳部5の処理の流れを説明するフローチャ
ートである。
なる文書データが転送されることにより動作を開始す
る。翻訳対象となる文書データが転送されると、翻訳部
5は文字種判別部6がまず、原文中の各単語の文字種の
判別を行い(ステップS601)、注目文字列であるア
ルファベット文字列からなる語、およびアルファベット
と記号・数字の混った語を抽出し、その抽出した語にマ
ークを付す。
るので、その後、翻訳部5は翻訳のための解析処理(ス
テップS602)、変換処理(ステップS603)、生
成処理(ステップS604)を行い、翻訳結果を出力す
る前段階でのデータを得る。続いて、ステップS601
においてマークの付けられた語句に対して、弁別支援処
理部7は設定されている弁別支援の設定内容に応じた弁
別支援処理を施す(ステップS605)。
で生成する。」であれば、当該文字列は斜体文字となる
ように生成し、「太字体文字で生成する。」が設定され
ていれば、当該文字列は太字体文字で生成し、「引用符
で囲む。」が設定されていれば、当該文字列はダブル・
クォーテーション記号やシングル・クォーテーション記
号や各種括弧記号などの引用符で囲まれた形で生成し、
「下線を付ける。」が設定されていれば、当該文字列は
下線付きで生成する。
の生成例を示す。この場合の翻訳対象とする原文(日本
文)は「There are がハイライトされます。」であり、
翻訳の結果は図7の(1) は「斜体文字で生成する。」が
設定された場合の、また、図7の(2) は「太字体文字で
生成する。」が設定された場合の、また、図7の(3) は
「引用符で囲む。」が設定された場合の、また、図7の
(4) は「下線を付ける。」が設定された場合の訳文の一
例である。
のような処理のなされたデータを受けた翻訳制御部8の
制御によって、注目文字列は図7のような特徴付けがな
されたかたちで生成翻訳文が表示されることになり、こ
れにより、原文中にアルファベットで記述された英単語
は、英訳された文章中ではそれぞれこの部分がはっきり
わかるように表示部2に表示される。もちろん、プリン
タに印字させる場合も翻訳制御部8の制御によってこの
ような特徴を維持した状態で印字させることができる。
の文章をこれと異質の第二言語の文章に翻訳する機械翻
訳装置において、複数の特徴付け形式のうち、所望の形
式を選択指定する選択指示手段と、前記第一言語の文章
中の文字列における文字種を判別して第一言語に特有で
ない文字種の文字列を選定する選定手段と、この選定さ
れた文字列の文字種を判別して第二言語特有の文字種と
一致するとき、その文字列を識別可能に処理する処理手
段と、この処理手段による処理済みの第一言語の文章を
第二言語の文章に翻訳する翻訳手段と、この翻訳された
文章中において前記処理手段にて識別可能に処理された
文字列に該当する文字列は翻訳された文章中の他の文字
列と区別可能な前記選択指定した形式で生起するよう処
理する弁別支援処理手段とを設けて構成したものであ
る。
手段により当該第一言語の文章中の文字列における文字
種を判別して第一言語に特有でない文字種の文字列を選
定し、処理手段はこの選定された文字列の文字種を判別
して第二言語特有の文字種と一致する場合に、その文字
列を識別可能に処理する。そして、このような処理が成
された第一言語の文章は翻訳手段により翻訳され、弁別
支援処理手段はこの訳文中において前記処理手段にて識
別可能に処理された文字列に該当する文字列は翻訳され
た文章中の他の文字列と区別可能な形式で生起するよう
処理すると云うものである。
言語特有の文字種で構成される文字列を、第二言語に翻
訳後の他の文字列から区別できる所定の形式もしくは指
定の形式で特徴付けて生起されることになる。
れる第二言語の文字種を使用した文字列に対しては第二
言語に翻訳された場合の出力において、区別できるよう
に特徴付けて表示できるようになる。
るものではない。例えば、上記の実施例においては、弁
別支援処理手段の実現方法の候補として、「斜体文字で
生成する。」、「太字体文字で生成する。」、「引用符
で囲む。」、「下線を付ける。」を挙げたが、これらに
限られるものではなく、書体・字体の他のバリエーショ
ンが多数応用できるし、反転文字化・高輝度化・網掛け
なども利用できる。また、引用符の種類を細分して選択
させても良い。更に、当該文字列が英単語として実在す
るものの場合に限って、弁別支援処理を適用するように
することも可能であるし、どのタイプの文字列に本弁別
支援処理を適用するかをユーザに指定させるようにして
も良い。
析」「変換」「生成」の手順で行われるトランスファ方
式に基づいて述べているが、ピボット方式により翻訳処
理でも可能である。これは本発明が、訳文出力の直前の
段階で弁別支援処理を行うものであるので、翻訳処理の
方式に影響されるものではないからである。
範囲で種々変更して実施することができる。
えば、日本語と英語の間の翻訳のように翻訳する言語対
の個々の言語の特有な文字種が異なっており、かつ第一
言語の文書中に第二言語特有の文字種からなる文字列が
混入している場合に、その文字列を第二言語の訳文の中
で他の文字列と区別がつき易い形式で生成できるため
に、混乱を招くことのない、しかも、理解容易な訳文を
生成することができるようになる他、他の文字列を区別
し易くする表現形式として多種多様の形式の中からユー
ザの好みに合う形式で実施させることもできる等、使い
勝手の格段に良い機械翻訳装置を提供できる。
図。
流れの一例を示すフローチャート。
ァベット文字列の生成処理手段の内容をユーザに指定さ
せる際の表示部の表示例を示す図。
ート。
データの例を示す図。
録部、5…翻訳部、6…文字種判別部、7…弁別支援処
理部、8…翻訳制御部。
Claims (4)
- 【請求項1】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は翻訳された文
章中の他の文字列と区別可能な形式で生起するよう処理
する弁別支援処理手段とを設けて構成したことを特徴と
する機械翻訳装置。 - 【請求項2】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は翻訳された文
章中の他の文字列と区別可能な形式で生起するよう処理
する弁別支援処理手段と、 弁別支援処理手段による処理済みの翻訳結果を出力する
と共に、前記文字列は特徴付けして出力する手段とを設
けて構成したことを特徴とする機械翻訳装置。 - 【請求項3】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 複数の特徴付け形式のうち、所望の形式を選択する選択
指示手段と、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は前記選択指定
された形式とすべく処理する弁別支援処理手段とを設け
て構成したことを特徴とする機械翻訳装置。 - 【請求項4】 与えられる第一言語の文章をこれと異質
の第二言語の文章に翻訳する機械翻訳装置において、 複数の特徴付け形式のうち、所望の形式を選択指定する
選択指示手段と、 前記第一言語の文章中の文字列における文字種を判別し
て第一言語に特有でない文字種の文字列を選定する選定
手段と、 この選定された文字列の文字種を判別して第二言語特有
の文字種と一致するとき、その文字列を識別可能に処理
する処理手段と、 この処理手段による処理済みの第一言語の文章を第二言
語の文章に翻訳する翻訳手段と、 この翻訳された文章中において前記処理手段にて識別可
能に処理された文字列に該当する文字列は前記選択指定
された形式とすべく処理する弁別支援処理手段と、 弁別支援処理手段による処理済みの翻訳結果を出力する
と共に、前記文字列は特徴付けして出力する手段とを設
けて構成したことを特徴とする機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25255391A JP3147947B2 (ja) | 1991-09-30 | 1991-09-30 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25255391A JP3147947B2 (ja) | 1991-09-30 | 1991-09-30 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0589163A JPH0589163A (ja) | 1993-04-09 |
JP3147947B2 true JP3147947B2 (ja) | 2001-03-19 |
Family
ID=17238975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25255391A Expired - Lifetime JP3147947B2 (ja) | 1991-09-30 | 1991-09-30 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3147947B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3292403B2 (ja) * | 1993-05-19 | 2002-06-17 | ブラザー工業株式会社 | 翻訳機能を備えた文書処理装置 |
-
1991
- 1991-09-30 JP JP25255391A patent/JP3147947B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0589163A (ja) | 1993-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0370774B1 (en) | Machine translation system | |
KR900008769B1 (ko) | 기계번역시스템 | |
US6119077A (en) | Translation machine with format control | |
JP3038079B2 (ja) | 自動翻訳装置 | |
JP3147947B2 (ja) | 機械翻訳装置 | |
JP3131432B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
JPH0883280A (ja) | 文書処理装置 | |
JPS6118074A (ja) | プレ・エデイツト方式 | |
JP2715419B2 (ja) | 翻訳装置 | |
JP2621999B2 (ja) | 文書処理装置 | |
JP3692711B2 (ja) | 機械翻訳装置 | |
JP2727076B2 (ja) | 翻訳支援装置 | |
JP2737160B2 (ja) | 文章処理装置 | |
JPH08106461A (ja) | 文書処理方法及び装置 | |
JPH07152763A (ja) | 機械翻訳装置と該装置における翻訳方法 | |
JPH02239368A (ja) | 機械翻訳装置 | |
JPH08171568A (ja) | 複数言語入力方法 | |
JPH05266009A (ja) | 文書作成装置及び文書作成方法 | |
JPH1063660A (ja) | 機械翻訳装置 | |
JPH06215023A (ja) | 機械翻訳装置 | |
JPH06236399A (ja) | 翻訳機能付きワードプロセッサ | |
JP2002041516A (ja) | 機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
JPH04323770A (ja) | 機械翻訳装置 | |
JPH0232460A (ja) | 文書処理装置 | |
JPH06131327A (ja) | 文字処理方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080112 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090112 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 11 |