JP3294966B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3294966B2
JP3294966B2 JP02299795A JP2299795A JP3294966B2 JP 3294966 B2 JP3294966 B2 JP 3294966B2 JP 02299795 A JP02299795 A JP 02299795A JP 2299795 A JP2299795 A JP 2299795A JP 3294966 B2 JP3294966 B2 JP 3294966B2
Authority
JP
Japan
Prior art keywords
translation
bilingual
input
database
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02299795A
Other languages
English (en)
Other versions
JPH08221423A (ja
Inventor
秀樹 山本
久明 松下
達哉 介弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP02299795A priority Critical patent/JP3294966B2/ja
Publication of JPH08221423A publication Critical patent/JPH08221423A/ja
Application granted granted Critical
Publication of JP3294966B2 publication Critical patent/JP3294966B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された原文を目的
言語の訳文に翻訳して出力する機械翻訳装置に関する。
【0002】
【従来の技術】単語の情報を保持した辞書と、入力文の
構文解析及び訳文の生成を行なう文法知識とを用いて、
原文を目的言語の文に翻訳する機械翻訳装置の構成方法
が既に提案されている(特公平3−51020号公
報)。
【0003】自然言語の曖昧さのために、機械翻訳装置
が出力する訳文は、そのまま使用できない場合がある。
そのような場合は通常人手による後編集作業を行なって
最終的な訳文を生成する。又は、機械翻訳装置に備わっ
ているユーザ毎の辞書に単語を登録する機能(ユーザ辞
書機能)を用いて、単語を登録してから再度機械翻訳を
行なう。実際上、これらの二つの作業を併用することが
多い。
【0004】
【発明が解決しようとする課題】ところで、翻訳しよう
とする文章が大量である場合には、その中に同一の文章
が含まれていることが多い。例えば、装置の操作マニュ
アル等は同一文章を多く含んだものである。
【0005】このような場合、機械翻訳装置に同一文章
を発見する手段がなく、作業者の記憶に同一文章の発見
を委ねているため、翻訳作業が重複することが多く、全
体として作業に無駄がある。また、同一文章に対する機
械翻訳装置による翻訳結果が、翻訳時点のユーザ辞書登
録内容のために異なったり、同一翻訳結果が出力されて
も作業者の後編集によって最終的な翻訳結果が異なった
りし、同一の翻訳結果が得られないことが生じる。
【0006】一旦翻訳した多くの文章中の一部だけを変
更してその全体の翻訳を求めることも実際上多い。例え
ば、本の改訂版が発行された場合には、改訂以前の本と
大半が同じ文章になるが、改訂版全体の翻訳結果が必要
となる。
【0007】このような場合に、全体を再度機械翻訳し
訳文の修正を全文に渡って行なうか、又は、作業者が改
訂された前後の本を比較して翻訳が必要な文章を認識し
て機械翻訳させ、得られた訳文を改訂前の翻訳結果に適
宜埋め込むことを要する。いずれにせよ、大変な作業で
あり、機械翻訳装置を用いているに拘らず作業性は非常
に悪い。
【0008】そのため、翻訳対象の文章中に存在する複
数の同一文章に対して同一の翻訳結果を効率的に得られ
る機械翻訳装置が望まれている。
【0009】
【課題を解決するための手段】かかる課題を解決するた
め、本発明の機械翻訳装置は、(i) 対訳を格納している
対訳データベースと、(ii)少なくとも原文を含む入力を
取り込む入力処理手段と、(iii) 入力処理手段が取り込
んだ入力に対する対訳が対訳データベースに格納されて
いるかを検索して入力された原文の翻訳の必要性を判定
する対訳検索手段と、(iv)入力された原文を翻訳する翻
訳手段と、(v) 入力された原文及び入力された訳文でな
る対訳、又は、入力された原文及びそれを翻訳手段が翻
訳した訳文でなる対訳の情報を対訳データベースに登録
させる対訳更新手段と、(vi)対訳データベースの検索結
果に応じて、入力された原文に対する訳文として、検索
された訳文又は翻訳手段で翻訳された訳文を出力する出
力処理手段とを備え、(vii)入力にユーザ辞書情報を含
めると共に、対訳データベースに格納する対訳にも ユー
ザ辞書情報を含め、(viii)対訳検索手段は、検索した場
合において、入力処理手段が取り込んだ原文又は対訳
に、合致する対訳が対訳データベースにあっても、ユー
ザ辞書情報が異なる場合には、対応する対訳が対訳デー
タベースに存在しないこととすることを特徴とする。
【0010】
【作用】本発明の機械翻訳装置においては、対訳を格納
している対訳データベースと、入力に応じて対訳データ
ベースを検索する対訳検索手段と、入力又は検索結果に
応じて対訳データベースを更新する対訳更新手段とを有
する。
【0011】当該機械翻訳装置に入力がなされた場合に
は、対訳検索手段が対訳データベースの検索を実行する
ことにより、過去に同じ翻訳が実行されたか否かや、実
行されている場合にはその訳文を取り出すことができ
る。また、入力や検索結果に基づいて、必要ならば、対
訳更新手段が対訳データベースに対訳を登録することが
できる。さらに、対訳検索手段は、検索した場合におい
て、入力処理手段が取り込んだ原文又は対訳に、合致す
る対訳が対訳データベースにあっても、ユーザ辞書情報
が異なる場合には、対応する対訳が対訳データベースに
存在しないこととする。従って、同一文章の重複翻訳と
いう無駄を避けることができると共に、同一文章に対し
ては同一の訳文をユーザに早期に提示できるようにな
る。ここで、対訳が既に存在していても入力のユーザ辞
書IDとユーザ辞書IDが異なる場合にも翻訳させ、翻
訳結果がより良好となる最新のユーザ辞書を尊重させ、
訳語が一貫した統一のとれた翻訳結果を提示することが
できる。
【0012】
【実施例】(A)第1実施例 以下、本発明による機械翻訳装置の第1実施例を図面を
参照しながら詳述する。図1は、第1実施例の機械翻訳
装置の構成を示す機能ブロック図である。
【0013】第1実施例の機械翻訳装置10は、ディス
ク装置等の大容量記憶装置を有するワークステーション
やパーソナルコンピュータ等の情報処理装置で構成され
ており、機能的には、図1に示す構成を有する。
【0014】すなわち、機械翻訳装置10は、入力処理
手段11、対訳データベース検索手段(図1では対訳D
B検索手段で表している)12、翻訳手段13、対訳デ
ータベース更新手段(図1では対訳DB更新手段で表し
ている)14、出力処理手段15及び対訳データベース
16から構成されている。
【0015】対訳データベース16は、同一文章の重複
翻訳を避けたり、同一文章の統一された翻訳結果(訳
文)を得たりする目的で設けられており、原文データベ
ース16a、対訳管理データベース16b及び訳文デー
タベース16cからなる。
【0016】原文データベース16aは、原文と原文識
別情報(以下、原文IDと呼ぶ)との対を複数対格納し
ている。図2は、原文データベース16aの構造の一例
を示すものであり、木構造のものを示している。図2に
示す部分は、3個の原文「"cat" isa command name.
」、「"cat" concatenates argument files and outpu
tthem to standard output. 」、「with option -n, it
adds the line numberto the output data. 」を示し
ており、それぞれ原文IDとして「001」、「00
2」、「003」が付与されていることを示している。
【0017】このような木構造の場合、最初の2個の原
文で共通する先頭側の単語部分、すなわち「"cat" 」は
同じ枝になっており、これら原文を単独で格納している
場合に比べて、検索を高速に実行させることができる。
「"cat" is a command name.」が原文データベース16
aに存在するかを検索すると、「始」から木の枝を
「終」(91)までたどることで存在を確認でき、さら
にその下に格納されているデータ「001」(94)ま
でたどることでその原文IDが「001」であることが
分かる。
【0018】訳文データベース16cは、図3に示すよ
うに、訳文と訳文識別情報(以下、訳文IDと呼ぶ)と
の対を複数対格納している。図3では、訳文データベー
ス16cの構造をテーブル構造的に示しているが、高速
検索の点から、原文データベース16aと同様に木構造
のものが好ましい。
【0019】対訳管理データベース16bは、原文I
D、訳文ID、訳文時刻印及びユーザ辞書識別情報(以
下、ユーザ辞書IDと呼ぶ)でなる組(レコード)を複
数組格納している。図4は、対訳データベース16bの
構造の一例を示すものであり、テーブル構造のものを示
している。訳文時刻印は、対訳データベース16に入力
された入力単位毎に付けられる識別子である。ユーザ辞
書IDは、入力されたユーザ辞書名とその版数とを並べ
たものである。ユーザ辞書が指定されていない場合に
は、そのことを表すデータ、例えば「none」が挿入され
る。
【0020】なお、同一の機械翻訳装置10であって
も、使用者毎にユーザ辞書を登録できるようになされて
いることが多く、また、翻訳対象の文章が属する専門分
野毎にユーザ辞書が設けられていることがある。
【0021】入力処理手段11は、当該機械翻訳装置1
0に対する入力を取込んで処理するものである。なお、
入力はその時点でキー入力されたものであっても良く、
ファイルとして既に格納されているものであっても良
い。
【0022】以下では、説明の簡単化のために、ユーザ
からの入力は、動作モード、ユーザ辞書ID及び文章と
する。なお、動作モードとしては、入力文章を翻訳して
翻訳結果をそのまま出力する通常の動作モードである
「通常動作モード」と、翻訳に供する原文及び翻訳結果
等を必要に応じて対訳データベース16に蓄積させたり
対訳データベース16を検索したりする「用例翻訳モー
ド」の二つがある。また、入力文章は、原文だけの場合
と、原文及び訳文すなわち対訳の場合とがある。
【0023】対訳データベース検索手段12は、入力文
章の原文をキーとして対訳データベース16を検索する
ものであり、基本的には、原文データベース16a、対
訳管理データベース16b、訳文データベース16cの
順序で検索を行なう。すなわち、対訳データベース検索
手段12は、原文データベース16aに原文が登録され
ている場合には、原文IDに基づいて対訳管理データベ
ース16bを検索し、その結果に応じ、取出された訳文
IDをキーとして訳文データベース16cから適宜訳文
を取出すものである。
【0024】このような検索は、過去に翻訳された原文
に係る対訳が対訳データベース16に存在するか否かを
確認するために実行される。
【0025】以上が、対訳データベース検索手段12の
基本的な処理の流れであるが、場合分けしてより具体的
に対訳データベース検索手段12の処理を説明すると、
以下の通りである。
【0026】(1) 原文が入力された場合及び対訳が入力
された場合のいずれであろうと、入力された原文が原文
データベース16aに存在しないときには、翻訳手段1
3を起動する。
【0027】(2) 原文が入力された場合において、入力
された原文が原文データベース16aに存在し、かつ、
入力されたユーザ辞書IDと一致するユーザ辞書IDを
有するその原文に係る対訳管理データが存在するときに
は、訳文IDをもとに訳文データベース16cを検索
し、訳文時刻印が最新の訳文を翻訳結果として出力処理
手段15を起動する。
【0028】(3) 原文が入力された場合において、入力
された原文が原文データベース16aに存在し、かつ、
入力されたユーザ辞書IDに一致するユーザ辞書IDを
有するその原文に係る対訳管理データが存在しないとき
には、翻訳手段13を起動する。
【0029】(4) 対訳が入力された場合において、入力
された原文が原文データベース16aに存在し、かつ、
入力されたユーザ辞書IDに一致するユーザ辞書IDを
有するその原文に係る対訳管理データが存在するときに
は、訳文IDをもとに訳文データベース16cを検索
し、検索された訳文と入力された訳文が一致している
と、訳文時刻印が最新の訳文を翻訳結果として出力処理
手段15を起動する。
【0030】(5) 対訳が入力された場合において、入力
された原文が原文データベース16aに存在し、かつ、
入力されたユーザ辞書IDに一致するユーザ辞書IDを
有するその原文に係る対訳管理データが存在するときに
は、訳文IDをもとに訳文データベース16cを検索
し、検索された訳文と入力された訳文が一致していない
と、対訳データベース更新手段14を起動すると共に、
入力された訳文を翻訳結果として出力処理手段15を起
動する。
【0031】(6) 対訳が入力された場合において、入力
された原文が原文データベース16aに存在し、かつ、
入力されたユーザ辞書IDに一致するユーザ辞書IDを
有するその原文に係る対訳管理データが存在しないとき
には、翻訳手段13を起動する。
【0032】図5(A)は原文の入力形式例を示し、図
5(B)は対訳の入力形式例を示している。このように
対訳の入力形式では、文章の文字列の前に特殊な文字列
「## x ##」(xは数字;図5(B)では1)が
付加されており、対訳データベース検索手段12は、こ
の所定文字列の存在、不存在によって、原文が入力され
たか対訳が入力されたかを区別できる。
【0033】翻訳手段13は、入力処理手段11又は対
訳データベース検索手段12から翻訳が起動された場合
に、辞書及び翻訳ルールを用いて、入力処理手段11が
取込んだ原文を翻訳するものである。
【0034】対訳データベース更新手段14は、対訳デ
ータベース16に新しいデータを格納させるものであ
る。対訳データベース更新手段14は、原文データベー
ス16a、訳文データベース16b、対訳管理データベ
ース16cの順に更新処理を実行する。
【0035】対訳データベース更新手段14は、原文デ
ータベース16aに原文を登録しようとした場合におい
て、既に登録されていれば登録は実行せずに原文IDだ
けを認識し、登録されていなければ原文を原文データベ
ース16aに登録すると共に新しい原文IDを付与す
る。
【0036】対訳データベース更新手段14は、訳文デ
ータベース16cに訳文を登録しようとした場合におい
て、既に登録されていれば登録は実行せずに訳文IDだ
けを認識し、登録されていなければ訳文を訳文データベ
ース16cに登録すると共に新しい訳文IDを付与す
る。
【0037】対訳データベース更新手段14は、原文デ
ータベース16a及び又は訳文データベース16cに対
する更新処理が終了したときには、対訳管理データベー
ス16bの更新に進み、得られた原文ID及び又は訳文
IDと、入力されたユーザ辞書IDと、入力された時刻
印とでなるレコード(対訳管理データ)を、対訳管理デ
ータベース16bに登録する。
【0038】出力処理手段15は、上述のように、対訳
データベース検索手段12又は対訳データベース更新手
段14の制御下で、翻訳結果をユーザに提示するもので
ある。ユーザに提示する翻訳結果は、訳文だけであって
も良く、原文及び訳文の対(対訳)であっても良い。
【0039】次に、第1実施例の機械翻訳装置10の動
作を、図6のフローチャートをも参照しながら詳述す
る。
【0040】なお、図6は、図示の便宜上、1個の原文
又は対訳が入力された場合の処理の流れで記載してい
る。しかし、複数の原文又は対訳をまとめて入力するこ
とも可能であり、この場合には、後述するステップ10
3〜105の分岐先は入力された各原文又は対訳で異な
ったものとなることもある。すなわち、対訳データベー
ス16の検索や更新は、複数の原文又は対訳がまとめて
入力されても個別に実行される。
【0041】入力処理手段11がファイル等から入力を
受取ると、図6に示す処理を開始し、まず、入力情報中
の動作モードを調べる(ステップ101)。
【0042】動作モードが「通常翻訳モード」である
、翻訳手段13が、入力された原文を指定されたユー
ザ辞書、システム辞書及び翻訳ルールを用いて翻訳し
(ステップ109)、出力処理手段15がその翻訳結果
をユーザに提示して、今回の入力に対する一連の処理を
終了する(ステップ106)。
【0043】これに対して、動作モードが「用例動作モ
ード」であると、対訳データベース検索手段12が、原
文をキーとして対訳データベース16を検索する(ステ
ップ102)。そして、対訳データベース検索手段12
は、その原文に係る対訳が対訳データベース16に存在
するか否かを判定する(ステップ103)。
【0044】対訳が存在しなければ、翻訳手段13が、
入力された原文を指定されたユーザ辞書、システム辞書
及び翻訳ルールを用いて翻訳し(ステップ107)、対
訳データベース更新手段14が入力された原文や翻訳で
得られた訳文等に基づいて対訳データベース16を更新
し(ステップ108)、出力処理手段15が翻訳結果を
ユーザに提示して、今回の入力に対する一連の処理を終
了する(ステップ106)。
【0045】これに対して、入力された原文に係る対訳
が対訳データベース16に存在すると、さらに、入力さ
れたユーザ辞書IDと同じユーザ辞書IDを有する訳文
が対訳データベース16に存在するか否かを判定する
(ステップ104)。
【0046】入力されたユーザ辞書IDと同じユーザ辞
書IDを有する訳文が存在していないと、翻訳手段13
が、入力された原文を指定されたユーザ辞書、システム
辞書及び翻訳ルールを用いて翻訳し(ステップ10
7)、対訳データベース更新手段14が入力された原文
や翻訳で得られた訳文等に基づいて対訳データベース1
6を更新し(ステップ108)、出力処理手段15が翻
訳結果をユーザに提示して、今回の入力に対する一連の
処理を終了する(ステップ106)。
【0047】一方、入力されたユーザ辞書IDと同じユ
ーザ辞書IDを有する訳文が存在していると、対訳デー
タベース検索手段12は、入力された訳文と対訳データ
ベース16の訳文とが同じか否か、並びに、入力が原文
のみか否かを判定する(ステップ105)。言い換える
と、対訳が入力され、入力された訳文と対訳データベー
ス16の訳文とが一致している格納されている対訳が有
効な場合、及び、有効な対訳が存在する原文が入力され
た場合を、他の対訳データベース16の更新が必要な場
合と区別する判定を行なう。
【0048】有効な対訳の存在が確認された場合には、
対訳データベース16の更新は不要であるので、出力処
理手段15が入力された対訳を翻訳結果としてユーザに
提示して、今回の入力に対する一連の処理を終了する
(ステップ106)。
【0049】有効な対訳の存在が確認されない場合に
は、対訳データベース更新手段14が入力された原文及
び訳文等に基づいて対訳データベース16を更新し(ス
テップ108)、出力処理手段15が入力された対訳を
翻訳結果としてをユーザに提示して、今回の入力に対す
る一連の処理を終了する(ステップ106)。
【0050】このような一連の処理による対訳データベ
ース16の更新の有無や更新項目や出力内容を「用例動
作モード」について場合分けすると、以下のように場合
分けすることができる。
【0051】なお、以下の場合分けにおいては、図6上
では同じ処理経路をとるものがあるが、ステップ108
での更新処理やステップ106での出力に供する訳文の
種類(格納されているもの、翻訳されたもの、入力され
たもの)が他の場合と異なっている。
【0052】(a) 原文だけが入力された場合であって、
入力された原文が原文データベース16aに存在しない
場合には、入力された原文が翻訳され、その原文と、翻
訳により得られた訳文と、これら原文及び訳文を結ぶ対
訳管理データが対訳データベース16に登録され、入力
された原文の翻訳により得られた訳文がユーザに提示さ
れる。
【0053】この場合の処理ステップの変化は、101
〜103、107、108、106である。
【0054】(b) 原文だけが入力された場合であって、
入力された原文に係る対訳は対訳データベース16に存
在するが、入力されたユーザ辞書IDに一致するユーザ
辞書IDを有するその原文に係る対訳管理データが対訳
データベース16に存在しない場合には、入力された原
文が翻訳され、翻訳により得られた訳文と、対訳データ
ベース16に格納されている訳文とが一致すると、入力
された原文及び翻訳された訳文を結ぶ新たな対訳管理デ
ータ(訳文時刻印及びユーザ辞書IDが既存のものと異
なる)だけが対訳データベース16に登録され、入力さ
れた原文の翻訳により得られた訳文がユーザに提示され
る。
【0055】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0056】(c) 原文だけが入力された場合であって、
入力された原文に係る対訳は対訳データベース16に存
在するが、入力されたユーザ辞書IDに一致するユーザ
辞書IDを有するその原文に係る対訳管理データが対訳
データベース16に存在しない場合には、入力された原
文が翻訳され、翻訳により得られた訳文と、対訳データ
ベース16に格納されている訳文とが一致しないと、翻
訳により得られた訳文と、入力された原文及び翻訳され
た訳文を結ぶ対訳管理データが対訳データベース16に
登録され、入力された原文の翻訳により得られた訳文が
ユーザに提示される。
【0057】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0058】(d) 原文だけが入力された場合であって、
入力された原文に係る対訳が対訳データベース16に存
在し、しかも、入力されたユーザ辞書IDに一致するユ
ーザ辞書IDを有するその原文に係る対訳管理データが
対訳データベース16に存在する場合には、対訳データ
ベース16に対する登録動作は実行されず、対訳データ
ベース16から取出された訳文がユーザに提示される。
【0059】この場合の処理ステップの変化は、101
〜106である。
【0060】(e) 対訳が入力された場合であって、入力
された原文すら原文データベース16aに存在しない場
合には、入力された原文が翻訳され、翻訳により得られ
た訳文と、入力された訳文とが使用したユーザ辞書ID
を含めて一致すると、対訳データベース16に、入力さ
れた原文と、その翻訳により得られた訳文(入力訳文)
と、これら原文及び訳文を結ぶ対訳管理データが登録さ
れ、入力された原文の翻訳により得られた訳文(入力訳
文)がユーザに提示される。
【0061】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0062】(f) 対訳が入力された場合であって、入力
された原文すら原文データベース16aに存在しない場
合には、入力された原文が翻訳され、翻訳により得られ
た訳文と、入力された訳文とが一致しない(使用したユ
ーザ辞書IDだけが異なる場合を含む)と、対訳データ
ベース16に、入力された原文と、その翻訳により得ら
れた訳文と、これら原文及び訳文を結ぶ対訳管理データ
とが登録され、入力された原文の翻訳により得られた訳
文がユーザに提示される。
【0063】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0064】なお、入力された訳文の方を登録したりユ
ーザに提示したりしても良い。このような場合は、上記
場合(e) と同様である。
【0065】(g) 対訳が入力された場合であって、入力
された原文に係る対訳は対訳データベース16に存在す
るが、入力されたユーザ辞書IDと一致するユーザ辞書
IDを有する対訳管理データが存在しない場合には、入
力された原文が翻訳され、翻訳により得られた訳文と、
対訳データベース16に格納されている訳文とが一致す
ると、入力された原文及び翻訳された訳文を結ぶ新たな
対訳管理データ(訳文時刻印及びユーザ辞書IDが既存
のものと異なる)が対訳データベース16に登録され、
入力された原文の翻訳により得られた訳文がユーザに提
示される。
【0066】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0067】(h) 対訳が入力された場合であって、入力
された原文に係る対訳は対訳データベース16に存在す
るが、入力されたユーザ辞書IDと一致するユーザ辞書
IDを有する対訳管理データが存在しない場合には、入
力された原文が翻訳され、翻訳により得られた訳文と、
対訳データベース16に格納されている訳文とが一致し
ないと、翻訳により得られた訳文と、入力された原文及
び翻訳された訳文を結ぶ対訳管理データが対訳データベ
ース16に登録され、入力された原文の翻訳により得ら
れた訳文がユーザに提示される。
【0068】この場合の処理ステップの変化は、101
〜104、107、108、106である。
【0069】(i) 対訳が入力された場合であって、入力
された原文に係る対訳が対訳データベース16に存在
し、しかも、入力されたユーザ辞書IDと一致するユー
ザ辞書IDを有する対訳管理データが存在するが、その
対訳管理データが規定する訳文が入力された訳文と一致
しない場合には、入力された訳文と、入力された原文及
び訳文を結ぶ対訳管理データが対訳データベース16に
登録され、入力された訳文がユーザに提示される。
【0070】この場合の処理ステップの変化は、101
〜105、108、106である。
【0071】(j) 対訳が入力された場合であって、入力
された原文に係る対訳が対訳データベース16に存在
し、しかも、入力されたユーザ辞書IDと一致するユー
ザ辞書IDを有する対訳管理データが存在し、さらにそ
の対訳管理データが規定する訳文が入力された訳文と一
致する場合には、対訳データベース16に対する登録動
作は実行されず、入力された訳文がユーザに提示され
る。
【0072】この場合の処理ステップの変化は、101
〜106である。
【0073】次に、以上のような第1実施例の機械翻訳
装置10の動作を、具体例を用いて説明する。
【0074】図7に示す3個の原文1〜原文3が、ユー
ザ辞書が指定されずに「通常翻訳モード」で機械翻訳装
置10に入力されると、ステップ101、109、10
6を経由して直ちにそれらの翻訳結果がユーザに提示さ
れる。図8は、原文及び訳文の組で翻訳結果を提示した
場合を示しており、訳文1、訳文2、訳文3はそれぞれ
原文1、原文2、原文3に対応しているものである。
【0075】これに対して、図7に示す3個の原文1〜
原文3が、ユーザ辞書が指定されずに「用例翻訳モー
ド」が付与されて機械翻訳装置10に入力されると、機
械翻訳装置10は、原文1〜原文3のそれぞれに対して
訳文生成及び対訳登録を伴なう上述した場合(a) の処理
を行なって、結果としては、「通常翻訳モード」で機械
翻訳装置10に入力された場合と同様に図8に示す翻訳
結果をユーザに提示する。
【0076】しかしながら、この場合には、対訳データ
ベース16に対する検索、更新動作が実行され、原文デ
ータベース16aには上述した図2に示す内容が登録さ
れ、訳文データベース16cには上述した図3に示す内
容が登録され、対訳管理データベース16bには上述し
た図4に示す内容が登録される。
【0077】一般的に、システム辞書だけを用いた翻訳
では(ユーザ辞書を利用してたとしても)、良好な翻訳
が得られることは少なく、訳文が後編集されることが多
い。また、一方で、機械翻訳の出力(訳文)を見て、訳
文を直接変更するのではなく、原文を変更したり、ユー
ザ辞書に単語を登録したり、あるいは両方を同時に行な
ったりした後に、再度翻訳することによって、よりよい
訳文を得るという前編集作業が行なわれることもある。
また、前編集と後編集とが併用されることもある。
【0078】以下では、前編集と後編集とが併用されて
いる例について説明する。ここでは、図9に示すよう
に、原文1が原文4に修正され、訳文2が訳文4に修正
され、これら3個の対訳(原文4及び訳文1、原文2及
び訳文4、並びに、原文3及び訳文3)が、ユーザ辞書
が指定されずに「用例翻訳モード」が付与されて機械翻
訳装置10に入力されたとする。
【0079】このとき、機械翻訳装置10は、原文4及
び訳文1でなる対訳に対しては新しい訳文(訳文5)の
形成を伴なう上述した場合(f) の処理を行ない、原文2
及び訳文4でなる対訳に対してはその対訳の追加登録を
伴なう上述した場合(i) の処理を行ない、原文3及び訳
文3でなる対訳に対しては対訳データベース16の更新
を実行しない上述した場合(j) の処理を行なって、結果
として、図10に示す翻訳結果をユーザに提示する。
【0080】このような処理により、原文データベース
16aは図示は省略するが図2の内容に原文4が追加さ
れた内容に更新され、訳文データベース16cは図3に
示す内容に2個のレコードが追加された図11に示す内
容に更新され、対訳管理データベース16bは図4に示
す内容に2個のレコードが追加された図12に示す内容
に更新される。
【0081】対訳データベース16の各データベース1
6a、16b、16cがこのような内容のときに、図1
3に示す4個の原文4、原文2、原文5及び原文3が、
図14に示すユーザ辞書(ユーザ辞書ID=ws.00
1)が指定されて「用例翻訳モード」で機械翻訳装置1
0に入力されるとする。
【0082】このとき、機械翻訳装置10は、原文4に
対しては対訳管理データだけを追加する場合(b) の処理
を行ない、原文2及び原文3に対しては翻訳された訳文
及び対訳管理データを追加する場合(c) の処理を行な
い、原文5に対しては訳文生成及び対訳登録を伴なう上
述した場合(a) の処理を行なって、結果として、図15
に示す翻訳結果をユーザに提示する。
【0083】このような処理により、原文データベース
16aは図示は省略するが図2の内容に加えて原文4を
有する内容に、さらに原文5が追加された内容に更新さ
れ、訳文データベース16cは図11に示す内容に3個
のレコードが追加された図16に示す内容に更新され、
対訳管理データベース16bは図12に示す内容に3個
のレコードが追加された図10に示す内容に更新され
る。
【0084】従って、上記第1実施例によれば、対訳デ
ータベースを設けて過去に翻訳された対訳を格納してお
き、原文又は対訳入力時に、同一内容の原文に対する対
訳が対訳データベース16に格納されているか否かを判
定し、その判定結果によっては、翻訳を実行しないよう
にしたので、また、入力された対訳、又は、入力された
原文及びその翻訳された訳文を対訳データベース16に
登録するようにしたので、同一文章を重複翻訳するとい
う無駄を省くことができ、同一文章について統一がとれ
た訳文をユーザに提示することができる。
【0085】また、上記第1実施例によれば、動作モー
ドとして「通常翻訳モード」と「用例翻訳モード」を設
けたので、ユーザが動作モードを適宜選択できて使い勝
手を良好なものとしている。ユーザが翻訳結果の早期の
提示を希望したり同一文章を過去に翻訳したことがない
ことが分かっていたり(翻訳開始直後)した場合には
「通常翻訳モード」を選択し、同一の文章に対する統一
がとれた翻訳結果を希望する場合には「用例翻訳モー
ド」を選択すれば良い。
【0086】さらに、第1実施例によれば、対訳データ
ベース16の対訳データにユーザ辞書IDを含めるよう
にしたので、対訳が既に存在していても入力のユーザ辞
書IDとユーザ辞書IDが異なる場合にも翻訳させるよ
うにしたので、翻訳結果がより良好となる最新のユーザ
辞書を尊重したことになり、訳語が一貫した統一のとれ
た翻訳結果を提示することができる。
【0087】(B)第2実施例 次に、本発明による機械翻訳装置の第2実施例を図面を
参照しながら詳述する。なお、第2実施例の機能ブロッ
ク図も、上述した第1実施例に係る図1で表すことがで
きる。
【0088】この第2実施例は、動作モードとして、上
述した「通常翻訳モード」及び「用例翻訳モード」に加
えて、「対訳投入モード」を設けたものである。
【0089】「対訳投入モード」は、対訳データベース
16に対訳を登録させる動作を行ない、対訳データベー
ス16の検索や入力原文の翻訳は一切行なわない動作モ
ードである。例えば、訳文のみを後編集した最終的な対
訳を、対訳データベース16に格納する場合には、検索
動作を伴なう「用例翻訳モード」より「対訳投入モー
ド」の方が処理時間が短縮されるので、実用的である。
【0090】図18は、第2実施例のシステムの全体処
理を示すものであり、上述した図6との同一、対応ステ
ップには同一符号を付して示している。
【0091】この第2実施例では、動作モードの判定ス
テップ101aでは、3種類のモードのいずれであるか
を判定している。「通常翻訳モード」であれば、第1実
施例と同様に、ステップ109以降の処理を行なう。
「用例翻訳モード」であれば、第1実施例と同様に、ス
テップ102以降の処理を行なう。
【0092】「対訳投入モード」の場合には、ステップ
108以降の処理を行なう。すなわち、入力された原文
及び訳文等を対訳データベース16に登録させる。な
お、ユーザの提示処理においては(ステップ106a)
においては、「通常翻訳モード」及び「用例翻訳モー
ド」では翻訳結果を提示し、「対訳投入モード」では登
録が終了したことを提示する。
【0093】この第2実施例によっても、第1実施例と
同様な効果を奏することができる。これに加えて、第2
実施例によれば、対訳データベース16に対訳を単に登
録(投入)させる「対訳投入モード」をも設けているの
で、一段とユーザの使い勝手を良好なものとすることが
できる。
【0094】(C)第3実施例 次に、本発明による機械翻訳装置の第3実施例を図面を
参照しながら詳述する。ここで、図19が第3実施例を
示す機能ブロック図であり、図1との同一、対応部分に
は同一符号を付して示している。
【0095】この第3実施例は、機械翻訳装置10にL
AN等の高速ネットワーク20を介して文書検索装置3
0が接続されているシステムである。
【0096】文書検索装置30は、文書を格納している
文書格納手段33と、外部装置からの依頼に応じて文書
格納手段33から所定文書を取出す文書検索手段32
と、外部装置とのリンクの確立及び切断や情報授受を行
なう通信手段31とからなっている。
【0097】第3実施例の機械翻訳装置10には、文書
検索装置30に文書の検索を依頼し、返信されてきた文
書を受信する文書検索依頼手段34と、文書検索装置3
0との通信を実行する通信手段35とが設けられてい
る。文書検索依頼手段34は、検索文書を受信すると、
その受信文書を「用例翻訳モード」で入力処理手段11
に入力するものである。
【0098】すなわち、この第3実施例においては、検
索指示に応じて文書検索依頼手段34が文書検索装置3
0から取出した文書を直ちに機械翻訳構成に入力させて
翻訳結果を得るものである。なお、入力処理手段11に
は、第1実施例と同様な入力方法で入力することもでき
る。
【0099】この第3実施例によっても、第1実施例と
同様な効果を奏することができる。これに加えて、第3
実施例によれば、翻訳を希望する文書(複数の文章の
塊)が他装置にある場合でも、検索指示と翻訳指示とを
ユーザが別個に操作入力することなく、その文書の翻訳
結果を速やかにすることができる。
【0100】(D)他の実施例 (1) 上記実施例においては、「通常翻訳モード」及び
「用例翻訳モード」を用意したシステム、又は、「通常
翻訳モード」、「用例翻訳モード」及び「対訳投入モー
ド」を用意したシステムを示したが、「用例翻訳モー
ド」及び「対訳投入モード」を用意したシステムや、
「用例翻訳モード」だけを有するシステムであっても良
い。
【0101】(2) 上記実施例においては、英日翻訳の装
置を示したが、他の2言語間の翻訳装置に適用できるこ
とは勿論であり、装置が対応できる翻訳方向が2以上の
ものであっても良い。
【0102】(3) 上記実施例においては、入力の同一性
の判断単位や対訳データベースの更新単位を1文章とし
たものを示したが、複数の文章(例えば段落)を単位と
して、入力の同一性の判断(検索)や対訳データベース
の更新を行なうようにしても良い。
【0103】例えば、過去に翻訳されている大半の文章
が過去のものもと一致する操作マニュアルの改訂版を翻
訳する場合には、このような大きな単位での処理は好ま
しいものである。
【0104】(4) ユーザ辞書IDは、ユーザ辞書の属性
を規定できるものであれば良く、時間的な情報は版数に
限定されず、更新日や作成日であっても良い。
【0105】また、ユーザ辞書を複数指定しても良い。
ユーザ辞書を複数指定する場合は、複数のユーザ辞書全
てのIDが等しい場合を、ユーザ辞書に関する同一性の
条件とするのが望ましい。
【0106】(5) 上記実施例においては、原文とユーザ
辞書IDが同じであっても訳文が異なる場合には、異な
る対訳として対訳データベース16に登録するものを示
したが、原文とユーザ辞書IDが同じ対訳は1個のみ対
訳データベース16に登録するようにしても良い。この
場合には、後から入力されたものは後編集処理等に供さ
れていることが多いので、そちらだけを登録するように
すれば良い。このようにすると、対訳管理データベース
16bにおける訳文時刻印を不要にすることができ、記
憶容量を軽減することができる。
【0107】例えば、図12における上から5番目のレ
コードを登録するときには、図12における上から2番
目のレコードを消去する。このときには、図11におけ
る上から2番目のレコードも消去する。
【0108】(6) さらに、対訳データベース16に対す
る検索処理及び更新処理にユーザ辞書IDを用いない装
置としても良い。
【0109】(7) 「対訳投入モード」を有するシステム
において、「用例翻訳モード」での入力では対訳の入力
を許容しない装置にしても良い。
【0110】(8) ユーザ辞書ID以外の機械翻訳機能の
オプション項目を、ユーザ辞書IDに代えて、又は、加
えて、対訳データベース16の検索処理及び更新処理に
用いるようにしても良い。例えば、英文の操作マニュア
ルにおける「you 」を「あなた」と訳出するか否かの設
定項目情報を、対訳データベース16に盛り込んで対訳
データベース16の検索処理及び更新処理に用いるよう
にしても良い。
【0111】(9) 原文データベースや訳文データベース
等の構造は、木構造に限定されるものではない。例え
ば、ハッシュキーをインデックスとした配列をデータ構
造に用いることができる。
【0112】(10)上記実施例においては、対訳データベ
ース16を更新させるときにも、原文データベース16
a等の検索を再度実行するものを示したが、検索結果で
データなしであっても同じ原文が登録されていればその
原文IDを認識しておき、更新時に原文の検索を省略さ
せるようにしても良い。
【0113】(11)上記実施例においては、更新が必要な
場合に、更新終了後に訳文のユーザへの提示を行なうも
のを示したが、ユーザの提示処理を更新処理より先に実
行するようにしても良い。この場合に、ユーザへの提示
画面に更新実行有無をユーザに問うメッセージを表示さ
せ、更新の実行を行なうか否かをユーザに選択させるよ
うにしても良い。また、ユーザへの訳文提示を更新処理
より後で行なう場合であっても、更新実行有無をユーザ
に問うメッセージを表示させ、更新の実行を行なうか否
かをユーザに選択させるようにしても良い。
【0114】
【発明の効果】以上のように、本発明によれば、対訳デ
ータベースを設けて過去に翻訳された対訳を格納してお
き、入力文章に係る対訳が対訳データベースに格納され
ているか否かを判定し、その判定結果によっては、翻訳
を実行せずに翻訳結果を提示すると共に、入力された対
訳、又は、入力された原文及びその翻訳された訳文を対
訳データベースに登録し、また、入力処理手段が取り込
んだ原文又は対訳に、合致する対訳が対訳データベース
にあっても、ユーザ辞書情報が異なる場合には、対応す
る対訳が対訳データベースに存在しないこととするよう
にしたので、同一文章を重複翻訳するという無駄を省く
ことができると共に、同一文章について統一がとれた訳
文をユーザに提示することができる機械翻訳装置を実現
できる。
【図面の簡単な説明】
【図1】第1実施例の機能ブロック図である。
【図2】第1実施例の原文データベースの格納例(その
1)の説明図である。
【図3】第1実施例の訳文データベースの格納例(その
1)の説明図である。
【図4】第1実施例の対訳管理データベースの格納例
(その1)の説明図である。
【図5】第1実施例の原文入力と対訳入力との判別方法
の説明図である。
【図6】第1実施例の全体処理を示すフローチャートで
ある。
【図7】第1実施例の入力例(その1)の説明図であ
る。
【図8】第1実施例の出力例(その1)の説明図であ
る。
【図9】第1実施例の入力例(その2)の説明図であ
る。
【図10】第1実施例の出力例(その2)の説明図であ
る。
【図11】第1実施例の訳文データベースの格納例(そ
の2)の説明図である。
【図12】第1実施例の対訳管理データベースの格納例
(その2)の説明図である。
【図13】第1実施例の入力例(その3)の説明図であ
る。
【図14】第1実施例のユーザ辞書例の説明図である。
【図15】第1実施例の出力例(その3)の説明図であ
る。
【図16】第1実施例の原文データベースの格納例(そ
の3)の説明図である。
【図17】第1実施例の原文データベースの格納例(そ
の3)の説明図である。
【図18】第2実施例の全体処理を示すフローチャート
である。
【図19】第3実施例の機能ブロック図である。
【符号の説明】
10…機械翻訳装置、11…入力処理手段、12…対訳
データベース検索手段(対訳検索手段)、13…翻訳手
段、14…対訳データベース更新手段(対訳更新手
段)、15…出力処理手段、16…対訳データベース、
16a…原文データベース、16b…対訳管理データベ
ース、16c…訳文データベース。
フロントページの続き (56)参考文献 特開 平2−118774(JP,A) 特開 平4−160473(JP,A) 佐藤理史,「実例に基づく翻訳」,V ol.33、No.6、p.673−p.681 (1992) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された原文を目的言語の訳文に翻訳
    して出力する機械翻訳装置において、 対訳を格納している対訳データベースと、 少なくとも原文を含む入力を取り込む入力処理手段と、 上記入力処理手段が取り込んだ入力に対する対訳が上記
    対訳データベースに格納されているかを検索して入力さ
    れた原文の翻訳の必要性を判定する対訳検索手段と、 入力された原文を翻訳する翻訳手段と、 入力された原文及び入力された訳文でなる対訳、又は、
    入力された原文及びそれを上記翻訳手段が翻訳した訳文
    でなる対訳の情報を上記対訳データベースに登録させる
    対訳更新手段と、 上記対訳データベースの検索結果に応じて、入力された
    原文に対する訳文として、検索された訳文又は上記翻訳
    手段で翻訳された訳文を出力する出力処理手段とを備
    入力にユーザ辞書情報を含めると共に、上記対訳データ
    ベースに格納する対訳にもユーザ辞書情報を含め、 上記対訳検索手段は、検索した場合において、上記入力
    処理手段が取り込んだ原文又は対訳に、合致する対訳が
    上記対訳データベースにあっても、ユーザ辞書情報が異
    なる場合には、対応する対訳が上記対訳データベースに
    存在しないこととする ことを特徴とする機械翻訳装置。
  2. 【請求項2】 動作モードとして、上記対訳データベー
    スの検索、更新を伴う用例翻訳モードと、入力された原
    文を単純に翻訳して出力する通常翻訳モードとを設け、 通常翻訳モードが指示されて入力がなされた場合、上記
    入力処理手段が取り込んだ原文を上記翻訳手段が翻訳
    し、得られた訳文を上記出力処理手段が出力することを
    特徴とする請求項1に記載の機械翻訳装置。
  3. 【請求項3】 動作モードとして、上記対訳データベー
    スに対訳を登録させる対訳投入モードを設け、 対訳投入モードが指示されて入力がなされた場合、上記
    入力処理手段が取り込んだ原文及び訳文でなる対訳を上
    記対訳更新手段が上記対訳データベースに登録させるこ
    とを特徴とする請求項1又は2に記載の機械翻訳装置。
JP02299795A 1995-02-10 1995-02-10 機械翻訳装置 Expired - Fee Related JP3294966B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02299795A JP3294966B2 (ja) 1995-02-10 1995-02-10 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02299795A JP3294966B2 (ja) 1995-02-10 1995-02-10 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH08221423A JPH08221423A (ja) 1996-08-30
JP3294966B2 true JP3294966B2 (ja) 2002-06-24

Family

ID=12098171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02299795A Expired - Fee Related JP3294966B2 (ja) 1995-02-10 1995-02-10 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3294966B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5456260B2 (ja) * 2008-02-01 2014-03-26 ニフティ株式会社 翻訳処理プログラム、翻訳処理方法及び翻訳処理

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佐藤理史,「実例に基づく翻訳」,Vol.33、No.6、p.673−p.681(1992)

Also Published As

Publication number Publication date
JPH08221423A (ja) 1996-08-30

Similar Documents

Publication Publication Date Title
JP3666004B2 (ja) 多言語対応文書検索システム
JP4504555B2 (ja) 翻訳支援システム
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
US5140522A (en) Method and apparatus for machine translation utilizing previously translated documents
US5151857A (en) Dictionary linked text base apparatus
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP3281639B2 (ja) 文書検索システム
JP3294966B2 (ja) 機械翻訳装置
JP3601869B2 (ja) 機械翻訳システム
JP3347506B2 (ja) 機械翻訳システム
JP2752719B2 (ja) データベース操作装置
JPH10260992A (ja) データベース処理装置および記憶媒体
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP2011095802A (ja) 機械翻訳装置及びプログラム
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JPH0561902A (ja) 機械翻訳システム
JP3761364B2 (ja) 機械翻訳システム
JP2990314B2 (ja) データ管理装置
JP2002183134A (ja) 翻訳装置
JPH1069478A (ja) ワードプロセッサ
JPH1153363A (ja) 翻訳機および記録媒体
JP2011210193A (ja) 機械翻訳装置および機械翻訳プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080405

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090405

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090405

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100405

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100405

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110405

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110405

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130405

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees