JP3378267B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3378267B2
JP3378267B2 JP07465592A JP7465592A JP3378267B2 JP 3378267 B2 JP3378267 B2 JP 3378267B2 JP 07465592 A JP07465592 A JP 07465592A JP 7465592 A JP7465592 A JP 7465592A JP 3378267 B2 JP3378267 B2 JP 3378267B2
Authority
JP
Japan
Prior art keywords
translation
word
abbreviation
translated
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07465592A
Other languages
English (en)
Other versions
JPH05282358A (ja
Inventor
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07465592A priority Critical patent/JP3378267B2/ja
Publication of JPH05282358A publication Critical patent/JPH05282358A/ja
Application granted granted Critical
Publication of JP3378267B2 publication Critical patent/JP3378267B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子計算機を用いて自
然言語文書を翻訳する機械翻訳装置に関する。
【0002】
【従来の技術】近年、計算機による自然言語処理技術が
高まり、各種の文書処理システムが開発されている。特
に、大量の文書を他の言語の文書に自動的に翻訳処理す
る機械翻訳システムなどが実用化されている。
【0003】自然言語文書を翻訳するためには、数万語
ないし数十万語の語彙を蓄える大規模な自然言語処理用
辞書と、言語現象を規則的に整理した文法知識が必要で
ある。しかし、特定の言語においても実際の自然言語文
で用いられる語の数は非常に多く、さらにそれらを他の
言語に翻訳した訳語の数は、一般にもとの言語の語数と
同等乃至それ以上の数になる。それらの情報は一般に対
訳辞書として用意されているが、その対応関係は1対1
でなく、ユーザや文書の違いによっても訳語を変化させ
る必要のある場合も多い。事実上、その対応関係すべて
を予め翻訳用辞書として用意することは困難である。
【0004】特に、特定ユーザだけが用いる特殊な固有
名詞や、新しい語、表現をすべて収めることは、現実に
は不可能に近い。そこで一般性の高い語や訳語を機械翻
訳用辞書として準備提供し、それに含まれない語、訳語
の対訳関係はユーザの手で登録する方法が用いられてい
る。これが機械翻訳システムにおける辞書登録機能であ
る。
【0005】ところで、一般的に専門技術文献には略語
が頻出する。略語の訳語には、略語のまま出力して十分
理解可能な場合もあり、むしろ略語の元になった複合語
(以下、フルスペルという)を出力しないと分かりにく
い場合がある。しかし、すべての略語に関して略語訳出
とフルスペル訳出を制御する情報を、あらかじめ、また
は、漸次蓄えることは困難である。現実には略語含んだ
文を翻訳する際、訳語に関する優先度学習情報がない限
り、対訳辞書中の訳語の記述順序を元にして略語の訳語
またはフルスペルの訳語を出力している。
【0006】機械翻訳システムにおいて略語を訳出する
場合、略語のまま出力するか、フルスペルで出力するか
の判断は、一般的に2種類の情報を用いている。ここで
は例として、英日機械翻訳装置において、”OS”とい
う略語を翻訳する場合を考える。ここで”OS”は、
「OS」という略語の訳語と「オペレーティングシステ
ム」というフルスペルの訳語を持っているものとする。
【0007】まず、個々の略語に対する情報として訳語
の優先度学習情報がある場合、その情報が用いられる。
例えば、”OS”に対する訳語として、過去に「OS」
という略語が選択されていると、一般にはその選択内容
を学習しているので、その学習情報をもとに「OS」を
訳語として出力する。同様に、過去に「オペレーティン
グシステム」というフルスペルが選択されていると、そ
の学習情報をもとに「オペレーティングシステム」を訳
語として出力する。
【0008】次に、個々の略語に対する情報として訳語
の優先度学習情報がない場合、対訳辞書に記述されてい
る訳語の順序で、出力が決定する。例えば”OS”の対
訳辞書に、「OS、オペレーティングシステム」の順で
記述されていると、「OS」が訳語として出力される。
【0009】ところが、略語ごとの訳語優先度学習情報
がなく対訳辞書の訳語記述順序のみを利用する場合、文
書の種類やユーザが異なってもまったく同じ出力しか得
られない。したがって、どちらかといえば略語の訳語を
好む文書やユーザ、逆にフルスペルの訳語を好む文書や
ユーザ、という文書・ユーザごとの傾向があるにもかか
わらず、まったく同じ訳語を出力していた。
【0010】また、機械翻訳システムにおいて辞書登録
を行う場合、一語ずつ訳語を指示する対話的方法と、大
量の対訳関係を一度に指示する半自動的方法がある。
【0011】対話的方法では、ある原文とその望ましい
訳文との対応関係を考慮しながら、登録を行う。しかし
参照する対訳関係は、注目している原文一文に関するも
のであり、登録しようとする語が同一文書の別の文中に
現れていてもその事実をユーザが認識するのは困難であ
る。このため、登録時に注目していた文では最適の訳語
を指示したつもりでも、他の文では必ずしも適切な訳語
であるとは限らない。この結果、辞書登録したことによ
って、文書全体では訳文の品質を低下させる可能性があ
った。
【0012】まして半自動的方法では、原文と訳文の対
応関係を参照する機会がなく、上述の危険性は一層高い
ものである。
【0013】
【発明が解決しようとする課題】このように、従来の機
械翻訳装置においては、略語、フルスペルの優先度学習
情報がないので、その都度オペレータが略語、フルスペ
ルを確認し、変換等の処理を行なう必要があった。ま
た、辞書登録を行なう場合には、登録時には最適の訳語
を指示しても、他の文では必ずしも最適であるとは限ら
ず、訳文の品質を低下させるという欠点があった。
【0014】
【0015】この発明はこのような従来の課題を解決す
るためになされたもので、その目的は、対話的な辞書登
録時に、登録しようとする語が出現している文書内の文
を任意の数だけ表示出力することによって、文書全体と
して適切な登録を行いやすい機械翻訳装置を提供するこ
とである。
【0016】
【課題を解決するための手段】上記目的を達成するた
め、本願発明は、第1言語からなる原文データを記憶す
る記憶手段と、この原文記憶手段に記憶された第1言語
からなる原文データを、翻訳辞書を用いて第2言語から
なる訳文データとして翻訳する翻訳手段と、予め翻訳辞
書に登録されていない未知語を登録する登録手段とを具
備した機械翻訳装置であって、前記登録手段は、原文中
の未知語に対する訳語に関する情報を入力する際に、前
記記憶手段に記憶した原文データの中から、前記未知語
を含む原文データを検索し、検索の結果得られた前記未
知語を含む前記原文データ及び該原文データに対応して
検索される訳文データを、表示画面に一覧表示する機能
を備えたことを特徴とする。
【0017】
【0018】
【作用】本願発明によれば、登録する語が現れている文
とその訳文をユーザが参照することにより、局所的な情
報に基いた登録を避け、より適切な登録指示を行うこと
が可能になる。
【0019】
【0020】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明の第1実施例に係る英日機械翻訳装
置の構成を示すブロック図である。
【0021】同図において、1は入力装置であり、翻訳
すべき原文の入力、翻訳指示の操作、後述の略語訳出方
法の指定操作を行うのに用いる。一般的には、キーボー
ド、マウス、磁気ディスク、磁気テープ、OCRなどの
うちいずれか、あるいは複数種類のものが装備される。
2は翻訳処理装置であり、入力装置1から入力された原
文を後述の翻訳用対訳辞書、翻訳用文法を用いて翻訳処
理するのに用いる。一般的には計算機ソフトウェアとし
て実現される。3は出力装置であり、翻訳処理装置2で
翻訳された訳文の出力、略語訳出方法指定時の情報表示
を行うのに用いる。一般的には、CRTやプリンターが
装備される。4は原文保存装置であり、入力装置1から
入力された原文を保存するもので、磁気ディスク、光デ
ィスクなどで実現される。5は翻訳用対訳辞書であり、
翻訳用の語彙知識を収めており、磁気ディスク、光ディ
スクなどで実現される。6は翻訳用文法であり、翻訳用
の文法知識を収めており、磁気ディスク、光ディスクな
どで実現され、翻訳処理中には計算機メモリ上に展開さ
れるのが一般的である。7は訳文保存装置であり、翻訳
処理装置2から出力された訳文を保存するもので、磁気
ディスク、光ディスクなどで実現される。8は略語訳出
方法指定装置であり、入力装置1からの入力によって後
述の略語訳出方法記憶装置10の内容を編集するもの
で、計算機ソフトウェアなどで実現される。9は略語訳
出装置であり、翻訳処理装置2からの指示によって略語
の訳語を決定出力するものである。10は略語訳出方法
記憶装置であり、略語に関する訳出優先情報を保存する
もので、計算機上のメモリなどで実現される。
【0022】図2は、上記実施例システムの略語訳出装
置9の詳細な構成を示すブロック図である。
【0023】略語訳出装置9は、略語訳出方法参照装置
901、訳語取り出し装置902、見出し語訳語比較装
置903から構成され、他に略語訳出方法レジスタ90
4、略語訳語バッファ905をもつ。略語訳出方法参照
装置901は略語訳出方法記憶装置10の内容を検索す
るもので、計算機ソフトウェアなどで実現される。訳語
取り出し装置902は翻訳用対訳辞書5中の訳語を検索
し順次取り出すもので、計算機ソフトウェア、集積回路
などで実現される。見出し語訳語比較装置903は略語
の見出し語と訳語の綴りを比較するもので、同様に計算
機ソフトウェア、集積回路などで実現される。
【0024】図3は、機械翻訳システムが英文を日本語
に翻訳する際の手順を示す概略的な流れ図である。尚、
この実施例では、トランスファ方式の機械翻訳システム
で説明する。
【0025】文の翻訳を開始する前に、略語の訳出に関
する指定を行う。前述の略語訳出方法指定装置8の質問
に対して、入力装置1を介して「略語のまま出力す
る」、「フルスペルで出力する」のいずれかを指示す
る。この指示入力値を略語訳出方法記憶装置10の内容
として設定する(ステップST1)。
【0026】以下、翻訳処理装置2の中で、すべての文
の翻訳が終了するまで、一文ごとに翻訳処理が行なわれ
る(ステップST2)。入力された英文は単語に分割さ
れた後、英語語彙辞書を検索し形態素解析を行い、各単
語に品詞情報を付与する(ステップST3)。続いて英
語構文文法を参照して構文解析を行い、英語の中間構造
を生成する(ステップST4)。続いて英日変換辞書を
参照して構造変換を行い、日本語の中間構造に変換する
(ステップST5)。この中で、英語の単語乃至構造に
対する日本語の訳語が付与される。次に日本語構文文法
を参照して構文生成を行い、日本語での語順を決定する
(ステップST6)。最後に日本語形態素生成文法を参
照して各訳語の出力形態を決定する(ステップST
7)。各訳語の出力形態を合成した結果を訳文として出
力する(ステップST8)。以上のステップST3から
ステップST8の操作を、すべての文に対して繰り返
す。なお、上記ステップST3で用いる英語語彙辞書、
ステップST5で用いる英日変換辞書は、翻訳用対訳辞
書5に含まれるものであり、上記ステップST4で用い
る英語構文文法、ステップST6で用いる日本語構文文
法、ステップST7で用いる日本語形態素生成文法は翻
訳用文法6に含まれるものである。
【0027】図4は、本実施例システムを用いて英語の
略語を日本語に翻訳する際の手順を示す流れ図である。
【0028】ステップST11では、略語訳出方法参照
装置901によって略語訳出方法を検索する。
【0029】ステップST12では、検索して得られた
略語訳出方法を調べ、「略語のまま出力する」ことを示
すものならば、ステップST13に進む。「フルスペル
で出力する」ことを示すものならば、ステップST14
に進む。
【0030】ステップST13では、略語訳出方法レジ
スタ904の値を0にセットし、ステップST15に進
む。
【0031】ステップST14では、略語訳出方法レジ
スタ904の値を1にセットし、ステップST15に進
む。
【0032】ステップST15では、訳語取り出し装置
902によって対訳辞書中の訳語データから、英語の見
出し語(略語)に対する日本語の訳語を辞書記述の順に
ひとつ取り出し、略語訳語バッファ905にセットす
る。
【0033】ステップST16では、略語訳出方法レジ
スタ904の内容を調べ、値が0ならばステップST1
7に進み、値が1ならばステップST18に進む。
【0034】ステップST17では、見出し語訳語比較
装置903によって英語の見出し語と、略語訳語バッフ
ァ905の内容を比較する。両者の綴りが等しい場合、
ステップST19に進むが、異なる場合、ステップST
15に戻って次の訳語を取り出す。
【0035】ステップST18では、見出し語訳語比較
装置903によって英語の見出し語と、略語訳語バッフ
ァ905の内容を比較する。両者の綴りが異なる場合、
ステップST19に進むが、等しい場合、ステップST
15に戻って次の訳語を取り出す。
【0036】ステップST19では、その時点での略語
訳語バッファ905の内容を略語見出し語の訳語として
出力する。
【0037】次に、本実施例の英日機械翻訳装置を用い
て英語の略語の訳語を決定する手続きとデータの変化の
例(第1例〜第4例)を示す。
【0038】<第1例> 見出し語=”OS” 訳語記述=「OS、オペレーティングシステム」 略語訳出方法指定装置8への入力指示=「略語のまま出
力する」 ステップST11:略語訳出方法=「略語のまま出力す
る」 ステップST12:(ステップST13に進む) ステップST13:略語訳出方法レジスタ904←0 ステップST15:略語訳語バッファ905←「OS」 ステップST16:(ステップST17に進む) ステップST17:見出し語”OS”=略語訳語バッフ
ァ905(「OS」) ステップST18:略語訳語バッファ905の内容「O
S」を出力 <第2例> 見出し語=”OS” 訳語記述=「OS、オペレーティングシステム」 略語訳出方法指定装置8への入力指示=「フルスペルで
出力する」 ステップST11:略語訳出方法=「フルスペルで出力
する」 ステップST12:(ステップST14に進む) ステップST14:略語訳出方法レジスタ904←1 ステップST15:略語訳語バッファ905←「OS」 ステップST16:(ステップST18に進む) ステップST18:見出し語”OS”=略語訳語バッフ
ァ905(「OS」) ステップST15:略語訳語バッファ905←「オペレ
ーティングシステム」 ステップST16:(ステップST18に進む) ステップST18:見出し語”OS”≠ 略語訳語バッファ905(「オペレーティングシステ
ム」) ステップST19:略語訳語バッファ905の内容「オ
ペレーティングシステム」を出力 <第3例> 見出し語=”DBMS” 訳語記述=「データベース管理システム、DB管理シス
テム、DBMS」 略語訳出方法指定装置8への入力指示=「略語のまま出
力する」 ステップST11:略語訳出方法=「略語のまま出力す
る」 ステップST12:(ステップST13に進む) ステップST13:略語訳出方法レジスタ904←0 ステップST15:略語訳語バッファ905←「データ
ベース管理システム」 ステップST16:(ステップST17に進む) ステップST17:見出し語”DBMS”≠ 略語訳語バッファ905(「データベース管理システ
ム」) ステップST15:略語訳語バッファ905←「DB管
理システム」 ステップST16:(ステップST17に進む) ステップST17:見出し語”DBMS”≠略語訳語バ
ッファ905(「DB管理システム」) ステップST15:略語訳語バッファ905←「DBM
S」 ステップST16:(ステップST17に進む) ステップST17:見出し語”DBMS”=略語訳語バ
ッファ905(「DBMS」) ステップST19:略語訳語バッファ905の内容「D
BMS」を出力 <第4例> 見出し語=”DBMS” 訳語記述=「データベース管理システム、DB管理シス
テム、DBMS」 略語訳出方法指定装置8への入力指示=「フルスペルで
出力する」 ステップST11:略語訳出方法=「フルスペルで出力
する」 ステップST12:(ステップST14に進む) ステップST14:略語訳出方法レジスタ904←1 ステップST15:略語訳語バッファ905←「データ
ベース管理システム」 ステップST16:(ステップST18に進む) ステップST18:見出し語”DBMS”≠ 略語訳語バッファ905(「データベース管理システ
ム」) ステップST19:略語訳語バッファ905の内容「デ
ータベース管理システム」を出力 そして、第1例、第2例では、見出し語”OS”に対す
る対訳辞書の訳語記述が「OS、オペレーティングシス
テム」となっている場合について、第3例、第4例で
は、見出し語”DBMS”に対する対訳辞書の訳語記述
が「データベース管理システム、DB管理システム、D
BMS」となっている場合について説明する。
【0039】第1例は、略語訳出方法指定装置8からの
入力が「略語のまま出力する」である場合を示す。ステ
ップST11では、略語訳出方法参照装置901によっ
て略語訳出方法を検索する。「略語のまま出力する」が
得られる。ステップST12では、その値を調べた結
果、ステップST13に進む。ステップST13では、
略語訳出方法レジスタ904の値を0にセットする。ス
テップST15では、訳語取り出し装置902によって
訳語を辞書記述の順にひとつ取り出す。ここでは「O
S」が取り出され、略語訳語バッファ905にセットす
る。ステップST16では、略語訳出方法レジスタ90
4の値を調べ、ここでは0なのでステップST17に進
む。ステップST17では、見出し語訳語比較装置90
3によって英語の見出し語”OS”と、略語訳語バッフ
ァ905の内容「OS」を比較する。ここでは両者の綴
りが等しいので、ステップST19に進む。ステップS
T19では、略語訳語バッファ905の内容「OS」を
出力する。
【0040】第2例は、略語訳出方法指定装置8からの
入力が「フルスペルで出力する」である場合を示す。ス
テップST11では、略語訳出方法参照装置901によ
って略語訳出方法を検索する。「フルスペルで出力す
る」が得られる。ステップST12では、その値を調べ
た結果、ステップST14に進む。ステップST14で
は、略語訳出方法レジスタ904の値を1にセットす
る。ステップST15では、訳語取り出し装置902に
よって訳語を辞書記述の順にひとつ取り出す。ここでは
「OS」が取り出され、略語訳語バッファ905にセッ
トする。ステップST16では、略語訳出方法レジスタ
904の値を調べ、ここでは1なのでステップST18
に進む。ステップST18では、見出し語訳語比較装置
903によって英語の見出し語”OS”と、略語訳語バ
ッファ905の内容「OS」を比較する。ここでは両者
の綴りが等しいので、ステップST15に戻る。ステッ
プST15では、訳語取り出し装置902によって訳語
を辞書記述の順にひとつ取り出す。ここでは「オペレー
ティングシステム」が取り出され、略語訳語バッファ9
05にセットする。ステップST16では、略語訳出方
法レジスタ904の値を調べ、ここでは1なのでステッ
プST18に進む。ステップST18では、見出し語訳
語比較装置903によって英語の見出し語”OS”と、
略語訳語バッファ905の内容「オペレーティングシス
テム」を比較する。ここでは両者の綴りが異なるので、
ステップST19に進む。ステップST19では、略語
訳語バッファ905の内容「オペレーティングシステ
ム」を出力する。
【0041】第3例は、略語訳出方法指定装置8からの
入力が「略語のまま出力する」である場合を示す。ステ
ップST11では、略語訳出方法参照装置901によっ
て略語訳出方法を検索する。「略語のまま出力する」が
得られる。ステップST12では、その値を調べた結
果、ステップST13に進む。ステップST13では、
略語訳出方法レジスタ904の値を0にセットする。ス
テップST15では、訳語取り出し装置902によって
訳語を辞書記述の順にひとつ取り出す。ここでは「デー
タベース管理システム」が取り出され、略語訳語バッフ
ァ905にセットする。ステップST16では、略語訳
出方法レジスタ904の値を調べ、ここでは0なのでス
テップST17に進む。ステップST17では、見出し
語訳語比較装置903によって英語の見出し語”DBM
S”と、略語訳語バッファ905の内容「データベース
管理システム」を比較する。ここでは両者の綴りが異な
るので、ステップST15に戻る。ステップST15で
は、訳語取り出し装置902によって訳語を辞書記述の
順にひとつ取り出す。ここでは「DB管理システム」が
取り出され、略語訳語バッファ905にセットする。ス
テップST16では、略語訳出方法レジスタ904の値
を調べ、ここでは0なのでステップST17に進む。ス
テップST17では、見出し語訳語比較装置903によ
って英語の見出し語”DBMS”と、略語訳語バッファ
905の内容「DB管理システム」を比較する。ここで
は両者の綴りが異なるので、ステップST15に戻る。
ステップST15では、訳語取り出し装置902によっ
て訳語を辞書記述の順にひとつ取り出す。ここでは「D
BMS」が取り出され、略語訳語バッファ905にセッ
トする。ステップST16では、略語訳出方法レジスタ
904の値を調べ、ここでは0なのでステップST17
に進む。ステップST17では、見出し語訳語比較装置
903によって英語の見出し語”DBMS”と、略語訳
語バッファ905の内容「DBMS」を比較する。ここ
では両者の綴りが等しいので、ステップST19に進
む。ステップST19では、略語訳語バッファ905の
内容「DBMS」を出力する。
【0042】第4例は、略語訳出方法指定装置8からの
入力が「フルスペルで出力する」である場合を示す。ス
テップST11では、略語訳出方法参照装置901によ
って略語訳出方法を検索する。「フルスペルで出力す
る」が得られる。ステップST12では、その値を調べ
た結果、ステップST14に進む。ステップST14で
は、略語訳出方法レジスタ904の値を1にセットす
る。ステップST15では、訳語取り出し装置902に
よって訳語を辞書記述の順にひとつ取り出す。ここでは
「データベース管理システム」が取り出され、略語訳語
バッファ905にセットする。ステップST16では、
略語訳出方法レジスタ904の値を調べ、ここでは1な
のでステップHに進む。ステップST18では、見出し
語訳語比較装置903によって英語の見出し語”DBM
S”と、略語訳語バッファ905の内容「データベース
管理システム」を比較する。ここでは両者の綴りが異な
るので、ステップST19に進む。ステップST19で
は、略語訳語バッファ905の内容「データベース管理
システム」を出力する。
【0043】以上の処理の結果、略語の訳語を決定する
際、個々の略語に関する訳出方法の優先情報が蓄積され
ていない場合でも、文書ごと、あるいは、ユーザごとに
訳語のまま出力するか、フルスペルで出力するかの優先
性を反映することができ、ユーザの望む訳出を実現する
ことができる。
【0044】なお本発明は、上記実施例に限定されるも
のではない。
【0045】例えば、略語の訳語を略語のまま出力する
か、フルスペルで出力するかの判断に、略語見出し語の
長さ、すなわち構成文字数を用いてもよい。例えば、構
成文字数4未満の略語に対してはフルスペルで出力し、
構成文字数4以上の略語に対しては略語のまま出力する
というものである。この場合、略語訳出方法指定装置8
には、略語訳出方法判定基準文字数を入力するようにす
る。さらに略語訳出装置9には、略語訳出方法判定基準
レジスタ906と、新たに略語文字数計数装置907を
備える。略語文字数計数装置907は、略語である見出
し語の構成文字数をカウントするもので、計算機ソフト
ウェアまたは集積回路などで実現される。
【0046】図5は、本発明における第2の実施例シス
テムを用いて英語の略語を日本語に翻訳する際の手順を
示す流れ図である。
【0047】同図において、ステップST21では、略
語訳出方法参照装置901によって略語訳出方法判定基
準文字数を検索する。検索して得られた値を略語訳出方
法判定基準レジスタ906にセットする。
【0048】ステップST22では、略語文字数計数装
置907によって見出し語の構成文字数をカウントす
る。
【0049】ステップST23では、構成文字数と略語
訳出方法判定基準レジスタ906の値とを比較し、前者
と後者が等しいか前者が後者を上回れば、ステップST
24に進む。前者が後者を下回れば、ステップST25
に進む。
【0050】ステップST24では、略語訳出方法レジ
スタ904の値を0にセットし、ステップST26に進
む。
【0051】ステップST25では、略語訳出方法レジ
スタ904の値を1にセットし、ステップST26に進
む。
【0052】ステップST26では、訳語取り出し装置
902によって対訳辞書中の訳語データから、英語の見
出し語(略語)に対する日本語の訳語を辞書記述の順に
ひとつ取り出し、略語訳語バッファ905にセットす
る。
【0053】ステップST27では、略語訳出方法レジ
スタ904の内容を調べ、値が0ならばステップST2
8に進み、値が1ならばステップST29に進む。
【0054】ステップST28では、見出し語訳語比較
装置903によって英語の見出し語と、略語訳語バッフ
ァ905の内容を比較する。両者の綴りが等しい場合、
ステップST30に進むが、異なる場合、ステップST
26に戻って次の訳語を取り出す。
【0055】ステップST29では、見出し語訳語比較
装置903によって英語の見出し語と、略語訳語バッフ
ァ905の内容を比較する。両者の綴りが異なる場合、
ステップST30に進むが、等しい場合、ステップST
26に戻って次の訳語を取り出す。
【0056】ステップST30では、その時点での略語
訳語バッファ905の内容を略語見出し語の訳語として
出力する。
【0057】次に、第2の実施例の英日機械翻訳装置を
用いて英語の略語の訳語を決定する手続きとデータの変
化の例(第5例、第6例)を示す。ここでは、略語訳出
方法判定基準文字数の値を4とする。
【0058】<第5例> 見出し語=”OS” 訳語記述=「OS、オペレーティングシステム」 略語訳出方法指定装置8への入力指示=「文字数4」 ステップST21:略語訳出方法判定基準レジスタ90
6←4 ステップST22:見出し語”OS”の構成文字数←2 ステップST23:見出し語の構成文字数(2)<略語
訳出方法判定基準レジスタ906(4) ステップST25:略語訳出方法レジスタ904←1 ステップST26:略語訳語バッファ905←「OS」 ステップST27:(ステップST29に進む) ステップST29:見出し語”OS”=略語訳語バッフ
ァ905(「OS」) ステップST26:略語訳語バッファ905←「オペレ
ーティングシステム」 ステップST27:(ステップST29に進む) ステップST29:見出し語”OS”≠ 略語訳語バッファ905(「オペレーティングシステ
ム」) ステップST30:略語訳語バッファ905の内容「オ
ペレーティングシステム」を出力 <第6例> 見出し語=”DBMS” 訳語記述=「データベース管理システム、DB管理シス
テム、DBMS」 略語訳出方法指定装置8への入力指示=「文字数4」 ステップST21:略語訳出方法判定基準レジスタ90
6←4 ステップST22:見出し語”DBMS”の構成文字数
←4 ステップST23:見出し語の構成文字数(4)=略語
訳出方法判定基準レジスタ906(4) ステップST24:略語訳出方法レジスタ904←0 ステップST26:略語訳語バッファ905←「データ
ベース管理システム」 ステップST27:(ステップST28に進む) ステップST28:見出し語”DBMS”≠ 略語訳語バッファ905(「データベース管理システ
ム」) ステップST26:略語訳語バッファ905←「DB管
理システム」 ステップST27:(ステップST28に進む) ステップST28:見出し語”DBMS”≠略語訳語バ
ッファ905(「DB管理システム」) ステップST26:略語訳語バッファ905←「DBM
S」 ステップST27:(ステップST28に進む) ステップST28:見出し語”DBMS”=略語訳語バ
ッファ905(「DBMS」) ステップST30:略語訳語バッファ905の内容「D
BMS」を出力 第5例では、見出し語”OS”に対する対訳辞書の訳語
記述が「OS、オペレーティングシステム」となってい
る場合を示す。ステップST21では、略語訳出方法参
照装置901によって略語訳出方法判定基準文字数を検
索する。検索して得られた値が4なので、略語訳出方法
判定基準レジスタ906の値を4にセットする。ステッ
プST22では、略語文字数計数装置907によって見
出し語の構成文字数をカウントする。この場合は”O
S”の文字数2が得られる。ステップST23では、構
成文字数の値(2)と略語訳出方法判定基準レジスタ9
06の値(4)を調べ、ここでは前者が後者を下回るの
でステップST25に進む。ステップST25では、略
語訳出方法レジスタ904の値を1にセットする。ステ
ップST26では、訳語取り出し装置902によって訳
語を辞書記述の順にひとつ取り出す。ここでは「OS」
が取り出され、略語訳語バッファ905にセットする。
ステップST27では、略語訳出方法レジスタ904の
内容を調べ、値が1なのでステップST29に進む。ス
テップST29では、見出し語訳語比較装置903によ
って英語の見出し語”OS”と、略語訳語バッファ90
5の内容「OS」を比較する。ここでは両者の綴りが等
しいので、ステップST26に戻る。ステップST26
では、訳語取り出し装置902によって訳語を辞書記述
の順にひとつ取り出す。ここでは「オペレーティングシ
ステム」が取り出され、略語訳語バッファ905にセッ
トする。ステップST27では、略語訳出方法レジスタ
904の内容を調べ、値が1なのでステップST29に
進む。ステップST29では、見出し語訳語比較装置9
03によって英語の見出し語”OS”と、略語訳語バッ
ファ905の内容「オペレーティングシステム」を比較
する。ここでは両者の綴りが異なるので、ステップST
30に進む。ステップST30では、略語訳語バッファ
905の内容「オペレーティングシステム」を出力す
る。
【0059】また、第6例では、見出し語”DBMS”
に対する対訳辞書の訳語記述が「データベース管理シス
テム、DB管理システム、DBMS」となっている場合
を示す。ステップST21では、略語訳出方法参照装置
901によって略語訳出方法判定基準文字数を検索す
る。検索して得られた値が4なので、略語訳出方法判定
基準レジスタ906の値を4にセットする。ステップS
T22では、略語文字数計数装置907によって見出し
語の構成文字数をカウントする。この場合は、”DBM
S”の文字数4が得られる。ステップST23では、構
成文字数の値(4)と略語訳出方法判定基準レジスタ9
06の値(4)を調べ、ここでは両者が等しいのでステ
ップST24に進む。ステップST24では、略語訳出
方法レジスタ904の値を0にセットする。ステップS
T26では、訳語取り出し装置902によって訳語を辞
書記述の順にひとつ取り出す。ここでは「データベース
管理システム」が取り出され、略語訳語バッファ905
にセットする。ステップST27では、略語訳出方法レ
ジスタ904の内容を調べ、値が0なのでステップST
28に進む。ステップST28では、見出し語訳語比較
装置903によって英語の見出し語”DBMS”と、略
語訳語バッファ905の内容「データベース管理システ
ム」を比較する。ここでは両者の綴りが異なるので、ス
テップST26に戻る。ステップST26では、訳語取
り出し装置902によって訳語を辞書記述の順にひとつ
取り出す。ここでは「DB管理システム」が取り出さ
れ、略語訳語バッファ905にセットする。ステップS
T27では、1度目と同じ処理を行ってステップST2
8に進む。ステップST28では、見出し語訳語比較装
置903によって英語の見出し語”DBMS”と、略語
訳語バッファ905の内容「DB管理システム」を比較
する。ここでは両者の綴りが異なるので、ステップST
27に戻る。ステップST26では、訳語取り出し装置
902によって訳語を辞書記述の順にひとつ取り出す。
ここでは「DBMS」が取り出され、略語訳語バッファ
905にセットする。ステップST27では、1度目と
同じ処理を行ってステップST28に進む。ステップS
T28では、見出し語訳語比較装置903によって英語
の見出し語”DBMS”と、略語訳語バッファ905の
内容「DBMS」を比較する。ここでは両者の綴りが等
しいのでステップST30に進む。ステップST30で
は、略語訳語バッファ905の内容「DBMS」を出力
する。
【0060】こうして、略語を翻訳する場合に、略語の
まま出力するか、フルスペルで出力するかの優先性を指
定し、略語の訳出を制御することができるのである。
【0061】図6は本発明の第3実施例に係る機械翻訳
装置の構成を示すブロック図である。
【0062】同図において、21は入力装置であり、翻
訳すべき原文の入力、翻訳指示の操作、後述の辞書登録
指示操作を行うのに用いる。一般的には、キーボード、
マウス、磁気ディスク、磁気テープ、OCRなどのうち
いずれか、あるいは複数種類のものが装備される。22
は翻訳処理装置であり、入力装置21から入力された原
文を後述の翻訳用辞書、翻訳用文法を用いて翻訳処理す
るのに用いる。23は出力装置であり、翻訳処理装置2
2で翻訳された訳文の出力、辞書登録時の情報表示を行
うのに用いる。一般的には、CRTやプリンターが装備
される。24は原文保存装置であり、入力装置21から
入力された原文を保存するもので、磁気ディスク、光デ
ィスクなどで実現される。原文保存装置24の中では、
文書が1文ずつ区切られて保存されている。25は翻訳
用辞書であり、翻訳用の語彙知識を納めており、磁気デ
ィスク、光ディスクなどで実現される。26は翻訳用文
法であり、翻訳用の文法知識を納めており、磁気ディス
ク、光ディスクなどで実現され、翻訳処理中には計算機
メモリ上に展開されるのが一般的である。27は訳文保
存装置であり、翻訳処理装置22から出力された訳文を
保存するもので、磁気ディスク、光ディスクなどで実現
される。訳文保存装置27の中では、訳文が1文ずつ区
切られて保存されており、原文保存装置24に保存され
ている原文との対応関係も保存されている。28は辞書
登録装置であり、翻訳用辞書25の内容を追加・修正す
るのに用いる。
【0063】辞書登録装置28はさらに、指示入力装置
81、原語入力装置82、訳語入力装置83、原文検索
装置84、訳文検索装置85、原文表示装置86、訳文
表示装置87から構成される。指示入力装置81は、辞
書登録を行う際に、登録する原語やその訳語を入力する
ことを指示したり、登録語を含む原文や、その訳文を表
示することを指示するもので、キーボード、マウスなど
で実現される。原語入力装置82は、辞書に登録する原
語を入力するためのもの、訳語入力装置83はその語に
対する訳語を入力するためのものであり、いずれもキー
ボードなどで実現される。原文検索装置84は、登録し
ようとする原語を含む文を原文保存装置24から検索す
るためのもので、ソフトウェアまたは集積回路で実現さ
れる。訳文検索装置85は、原文検索装置84で検索さ
れた原文に対応する訳文を訳文保存装置27から検索す
るためのもので、やはりソフトウェアまたは集積回路で
実現される。原文表示装置86、訳文表示装置87は、
辞書登録を行う際に、登録する原語を含む原文や、その
訳文を表示するもので、CRTなどで実現される。な
お、指示入力装置81、原語入力装置82、訳語入力装
置83は、前記入力装置21と同じものを用いても良い
し、原文表示装置86、訳文表示装置87は前記出力装
置23と同じものを用いても良い。
【0064】図7は、本実施例システムで辞書登録を行
う際の手順を示す流れ図である。なお、この図では、入
力された文書が全部、あるいは一部すでに翻訳されたあ
とについて考える。
【0065】辞書登録は入力装置21から辞書登録指示
を行なうことによって開始する。
【0066】ステップST41では、登録を行おうとす
る原語を原語入力装置82を介して入力する。
【0067】ステップST42では、辞書登録装置28
に対する指示が分析される。「原文表示」なる指示の場
合、ステップST43に進む。「訳文表示」なる指示の
場合、ステップST45に進む。「訳語入力」なる指示
の場合、ステップST50に進む。「登録実行」なる指
示の場合、ステップST51に進む。
【0068】ステップST43では、該原語を原文検索
装置84によって原文保存装置24の中に検索し、続く
ステップST44で、該原語を含む原文を原文表示装置
86に表示する。その後、ステップST42に戻る。
【0069】ステップST45では、該原語を含む原文
が既に原文表示装置86に表示されているか否かを判断
し、表示されていればステップST48に、表示されて
いなければステップST46に進む。
【0070】ステップST46では、ステップST43
同様、該原語を原文検索装置84によって原文保存装置
24の中に検索し、続くステップST47で、検索の結
果得られた該原語を含む原文を原文表示装置86に表示
し、ステップST48に進む。
【0071】ステップST48では、既に表示されてい
る原文の各々の訳文を、1文ごとの原文と訳文との対応
関係から訳文検索装置85によって取り出し、続くステ
ップST49で、訳文表示装置87に表示する。原文が
まだ翻訳されていない場合は、何も表示しないか、ある
いは、訳文の代りに「未翻訳」の旨を表示する。その
後、ステップST42に戻る。
【0072】ステップST50では、原語に対する訳語
を訳語入力装置83を介して入力する。その後、ステッ
プST42に戻る。
【0073】ステップST51では、既にステップST
50で訳語が指示入力されているか否かを判断し、入力
されていればステップST53に進む。まだ訳語が入力
されていなければ、ステップST52で「まだ訳語が入
力されていない」旨の警告メッセージを表示し、ステッ
プST42に戻る。
【0074】ステップST53では、既に指示された原
語とそれに対する訳語にしたがって翻訳用辞書25に情
報を追加する。
【0075】図8乃至図14は、本実施例の辞書登録装
置の表示例を示す図である。
【0076】図8は、辞書登録装置の初期画面を示す図
である。最上部は操作を指示するコマンドを表示するコ
マンド表示部301である。その下の部分は左右に分か
れており、左部分が登録する原語を表示する原語表示部
302、右部分が原語に対する訳語を表示する訳語表示
部303である。さらに下の部分も左右に分かれてお
り、左部分が原語を含む文を表示する原文表示部30
4、右部分がそれに対する訳文を表示する訳文表示部3
05である。最下部は図7のステップST52での警告
メッセージ等を表示するシステムメッセージ部306で
ある。
【0077】図9は、辞書登録装置で原語を入力する画
面例を示す図である。
【0078】図8の状態からコマンド表示部301の
「原語入力」コマンドを選択すると、この状態になる。
原語表示部302には、図7のステップST41で原語
入力装置82から入力された原語が表示される。
【0079】図10は、辞書登録装置で原文表示を指示
したときの画面例を示す図である。
【0080】図9の状態からコマンド表示部301の
「原文表示」コマンドを選択すると、この状態になる。
原文表示部304には、図7のステップST43で原文
検索装置84によって検索された原文が表示される。表
示された原文の中で、該原語部分は強調表示(反転、下
線、高輝度など)される。
【0081】図11は、辞書登録装置で訳文表示を指示
したときの画面例を示す図である。
【0082】図9の状態あるいは図10の状態からコマ
ンド表示部301の「訳文表示」コマンドを選択する
と、この状態になる。訳文表示部305には、図7のス
テップST48で訳文検索装置85によって検索された
訳文が表示される。表示された訳文の中で、該原語の訳
語部分は強調表示(反転、下線、高輝度など)される。
これにより、登録しようとする原語に対する訳語が他の
文の中で適当か否かを容易に判断できる。
【0083】図12〜14は、辞書登録装置で訳語を入
力する画面例を示す図である。
【0084】図9の状態からコマンド表示部301の
「訳語入力」コマンドを選択すると、図12の状態にな
る。図10の状態からコマンド表示部301の「訳語入
力」コマンドを選択すると、図13の状態になる。ま
た、図11の状態からコマンド表示部301の「訳語入
力」コマンドを選択すると、図14の状態になる。いず
れも訳語表示部303には、図7のステップST50で
入力装置21から入力された訳語が表示される。この
後、コマンド表示部301の「登録実行」コマンドを選
択すると、翻訳用辞書25への登録が行われる。
【0085】以上の処理の結果、翻訳用辞書にない原語
や訳語を登録する際、該原語が現れる原文やその訳文を
確認することができ、文書全体にわたる影響を事前に予
測できるので、ユーザは局所的な情報に基いた不適切な
登録を避けることができる。
【0086】なお本発明は、上記実施例に限定されるも
のではない。
【0087】例えば、辞書登録時に表示する原文の数を
ユーザが指定できるようにしてもよい。また、辞書登録
時に訳語を入力した段階で、訳文表示装置が表示中の訳
文の中の訳語部分を該入力訳語で置換表示し、登録後の
予想訳文を表示するように強化してもよい。また、訳文
を表示する際にある原文がまだ翻訳されていない場合、
その場で翻訳を行ってその結果を訳文表示装置に表示し
てもよい。
【0088】
【発明の効果】以上述べたように本発明によれば、辞書
登録時に文書中の関連する原文・訳文を確認でき、文書
全体として不適切な登録を避けることのできる能率的な
機械翻訳システムを実現することができる。
【0089】
【図面の簡単な説明】
【図1】本発明の第1、第2実施例に係る機械翻訳装置
の構成を示すブロック図である。
【図2】略語訳出方法記憶装置の詳細構成を示すブロッ
ク図である。
【図3】英文を日本語に翻訳する際の手順を示すフロー
チャートである。
【図4】第1実施例システムを用いて英語の略語を日本
語に翻訳する手順を示すフローチャートである。
【図5】第2実施例システムを用いて英語の略語を日本
語に翻訳する手順を示すフローチャートである。
【図6】本発明の第3実施例に係る機械翻訳装置の構成
を示すブロック図である。
【図7】第3実施例のシステムで辞書登録を行なう際の
手順を示すフローチャートである。
【図8】辞書登録装置の初期画面を示す説明図である。
【図9】辞書登録装置で原語を入力する画面の例を示す
説明図である。
【図10】辞書登録装置で原文表示を指示したときの画
面の例を示す説明図である。
【図11】辞書登録装置で訳文表示を指示したときの画
面の例を示す説明図である。
【図12】辞書登録装置で訳語を入力する画面の例を示
す説明図である。
【図13】辞書登録装置で訳語を入力する画面の例を示
す説明図である。
【図14】辞書登録装置で訳語を入力する画面の例を示
す説明図である。
【符号の説明】
1 入力装置 2 翻訳処理装置 3 出力装置 4 原文保存装置 5 翻訳用対訳辞書 6 翻訳用文法 7 訳文保存装置 8 略語訳出方法指定装置 9 略語訳出装置 10 略語訳出方法記憶装置 21 入力装置 22 翻訳処理装置 23 出力装置 24 原文保存装置 25 翻訳用辞書 26 翻訳用文法 27 訳文保存装置 28 辞書登録装置

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】第1言語からなる原文データを記憶する記
    憶手段と、 この原文記憶手段に記憶された第1言語からなる原文デ
    ータを、翻訳辞書を用いて第2言語からなる訳文データ
    として翻訳する翻訳手段と、 予め翻訳辞書に登録されていない未知語を登録する登録
    手段とを具備した機械翻訳装置であって、 前記登録手段は、原文中の未知語に対する訳語に関する
    情報を入力する際に、前記記憶手段に記憶した原文デー
    タの中から、前記未知語を含む原文データを検索し、検
    索の結果得られた前記未知語を含む前記原文データ及び
    該原文データに対応して検索される訳文データを、表示
    画面に一覧表示する機能を備えたことを特徴とする機械
    翻訳装置。
  2. 【請求項2】検索の結果得られた前記原文データに対応
    する前記訳文データを表示する際に、該訳文データの中
    で前記未知語に対応する訳語部分を強調して表示するこ
    とを特徴とする請求項1に記載の機械翻訳装置。
  3. 【請求項3】所定の記憶手段に記憶された第1言語から
    なる原文データを、翻訳辞書を用いて第2言語からなる
    訳文データとして翻訳する機械翻訳方法であって、 予め翻訳辞書に登録されていない未知語を登録するにあ
    たり、原文中の未知語に対する訳語に関する情報を入力
    する際に、前記記憶手段に記憶した原文データの中か
    ら、前記未知語を含む原文データを検索し、検索の結果
    得られた前記未知語を含む前記原文データ及び該原文デ
    ータに対応して検索される訳文データを、表示画面に一
    覧表示するようにしたことを特徴とする機械翻訳方法。
  4. 【請求項4】検索の結果得られた前記原文データに対応
    する前記訳文データを表示する際に、該訳文データの中
    で前記未知語に対応する訳語部分を強調して表示するこ
    とを特徴とする請求項3に記載の機械翻訳方法。
JP07465592A 1992-03-30 1992-03-30 機械翻訳装置 Expired - Fee Related JP3378267B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07465592A JP3378267B2 (ja) 1992-03-30 1992-03-30 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07465592A JP3378267B2 (ja) 1992-03-30 1992-03-30 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH05282358A JPH05282358A (ja) 1993-10-29
JP3378267B2 true JP3378267B2 (ja) 2003-02-17

Family

ID=13553466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07465592A Expired - Fee Related JP3378267B2 (ja) 1992-03-30 1992-03-30 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3378267B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853707A (zh) * 2012-12-06 2014-06-11 英业达科技有限公司 一次性翻译多个目标字词的系统及其方法

Also Published As

Publication number Publication date
JPH05282358A (ja) 1993-10-29

Similar Documents

Publication Publication Date Title
US5850561A (en) Glossary construction tool
JP4504555B2 (ja) 翻訳支援システム
US5797011A (en) Method for controlling the translation of information on a display screen from a source language to a target language
RU2136038C1 (ru) Компьютерная система и способ подготовки текста на исходном языке и перевода на иностранные языки
US5612872A (en) Machine translation system
US6356894B2 (en) Document searching method for multilingual documents and storage medium therefore
US5907821A (en) Method of computer-based automatic extraction of translation pairs of words from a bilingual text
US5140522A (en) Method and apparatus for machine translation utilizing previously translated documents
US5214583A (en) Machine language translation system which produces consistent translated words
JP4076520B2 (ja) 翻訳支援プログラムおよび単語対応付けプログラム
JP2002215617A (ja) 品詞タグ付けをする方法
JP2008152760A (ja) マシンアシスト翻訳ツール
JP2002229981A (ja) 文字列の正規化表示を生成するシステム
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3378267B2 (ja) 機械翻訳装置
US5640581A (en) CD-ROM information editing apparatus
JP2621999B2 (ja) 文書処理装置
JP2005031813A (ja) 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
JPH0561902A (ja) 機械翻訳システム
JP3236027B2 (ja) 機械翻訳装置
JPH04174069A (ja) 言語理解支援装置
JPH1021242A (ja) 機械翻訳装置及び機械翻訳後編集方法
JP2000003365A (ja) 機械翻訳システム、返信メール作成支援システム及び文書作成支援システム並びに機械翻訳方法、返信メール作成方法及び文書作成方法
JPH0778166A (ja) 翻訳方法及び機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071206

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081206

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091206

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091206

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101206

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101206

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111206

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees