JP2004171397A - 翻訳支援装置 - Google Patents

翻訳支援装置 Download PDF

Info

Publication number
JP2004171397A
JP2004171397A JP2002338364A JP2002338364A JP2004171397A JP 2004171397 A JP2004171397 A JP 2004171397A JP 2002338364 A JP2002338364 A JP 2002338364A JP 2002338364 A JP2002338364 A JP 2002338364A JP 2004171397 A JP2004171397 A JP 2004171397A
Authority
JP
Japan
Prior art keywords
translation
word
phrase
language
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002338364A
Other languages
English (en)
Inventor
Tatsuo Yamashita
達雄 山下
Akira Shioda
明 潮田
Hide Fuji
秀 富士
Seiji Okura
清司 大倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002338364A priority Critical patent/JP2004171397A/ja
Publication of JP2004171397A publication Critical patent/JP2004171397A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】ユーザによる単語または句の対応関係情報の修正を可能にし、さらにその修正された単語または句の対応関係情報を有効に利用することができる翻訳支援装置を提供すること。
【解決手段】第一言語用言語解析システム13と第二言語用言語解析システム14が、第一言語の入力文11と第二言語の入力文12とを単語および句に分割し、単語・句アライメントシステム15が、第一言語の入力文11と第二言語の入力文12との間の単語および句の対応付けを行い、その対応付けが不適切である場合に、蓄積制御手段17がユーザにそれらの対応付けを修正する手段を提供し、さらに単語および句の対応情報と第一言語の入力文11と第二言語の入力文12とを翻訳例データベース18に記憶し、辞書登録手段19が、対応付けが修正された単語を機械翻訳用の対訳単語辞書20に記憶する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、第1の言語により記述された参照対象となる参照文と該参照文を第2の言語に翻訳した参照翻訳文とが単語および/または句レベルで対応付けられた翻訳例をデータベースに蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援装置に関し、特に、ユーザによる単語あるいは句の対応関係情報の修正を可能にし、さらにその修正された単語あるいは句の対応関係情報を有効に利用することができる翻訳支援装置に関する。
【0002】
【従来の技術】
従来、コンピュータを用いた翻訳作業においては、翻訳メモリと呼ばれるソフトウェアを備えた翻訳支援装置が用いられている。翻訳メモリとは、原文と翻訳文とからなる翻訳例が蓄積された翻訳例データベースから、翻訳対象となる文と類似した文を含む翻訳例を検索し、その翻訳例をユーザに提示して、ユーザがそれらを参照しながら翻訳をおこなうことができるソフトウェアである。
【0003】
また、類似した翻訳例をユーザに提示するだけでなく、翻訳対象となる文を機械翻訳した結果も並べて提示するものもある。さらに、提示された翻訳例の原文が翻訳対象となる文と単語レベルで異なる場合に、その異なる単語の部分を機械翻訳で翻訳する、翻訳メモリと機械翻訳を融合した翻訳支援装置も存在する。
【0004】
そのうえ、類似した翻訳例をユーザに提示するだけでなく、翻訳対象となる文・翻訳例の原文・翻訳例の翻訳文における単語および句の対応する部分を対応付けてユーザに提示し、ユーザの翻訳作業を支援する翻訳メモリを用いた翻訳支援装置も存在する(例えば、平成14年5月9日に出願された特願2002−133630参照。)。ここで、句とは、意味的なまとまりをもつ結合された単語群を意味する。
【0005】
これらの翻訳支援装置では、ユーザが新しい翻訳例を翻訳例データベースに追加してそれを拡張していくことが可能である。また、ユーザが翻訳例を参照して翻訳した翻訳文とその原文との組を、新たに翻訳例として翻訳例データベースに追加して拡張することも可能である。
【0006】
単語や句の対応情報を含んだ翻訳例の登録手順は、以下のようである。まず、ユーザが原文と翻訳文との組の登録を要求した際に、言語解析システムがそれぞれの文に対し形態素解析・構文解析・意味解析を行って文の構造・意味を把握する。そして、その結果を用いて単語・句アライメントシステムが原文と翻訳文との間の単語や句の対応付けを行い、単語・句対応情報が付与された翻訳例として翻訳例データベースに記憶する。
【0007】
【発明が解決しようとする課題】
しかしながら、かかる単語や句の対応情報を提示する翻訳支援装置では、言語解析システムによる文の解析が不正確な場合や、翻訳文が原文を意訳したものである場合などには、単語・句アライメントシステムが正しく単語や句の対応付けをおこなうことは困難である。
【0008】
単語・句アライメントシステムによる対応付けが不適切な場合は、ユーザがその対応付けを修正する必要があるが、従来の翻訳支援装置では、単語や句の対応付けがおこなわれると、それが自動的に翻訳例データベースに登録されてしまい、その修正は翻訳例データベースの管理者に任されるか、あるいは修正がなされないまま放置されるという問題があった。このことは、翻訳例データベースが他のユーザ間で共有されている場合にも、管理者により修正がなされるまで質の低い翻訳例がユーザ間で使用され続けることとなり問題である。
【0009】
また、原文とそれに対する翻訳文の中に、対応付けが不可能な新しい単語が含まれていて、その単語どうしをユーザが対応付けて翻訳例データベースに登録したとしても、その知識を機械翻訳の精度の向上に有効に活かすことができなかった。また、句の対応付けも同様に、ユーザにより対応付けられた知識を機械翻訳の精度の向上に有効に活かすことができなかった。
【0010】
この発明は、上述した従来技術による問題点を解消するためになされたものであり、ユーザによる単語・句の対応情報の修正を可能にし、さらにその修正された単語・句の対応情報を有効に利用することができる翻訳支援装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した課題(問題)を解決し、目的を達成するため、請求項1の発明に係る翻訳支援装置は、第1の言語により記述された参照対象となる参照文(図1の第一言語の入力文11に対応する)と該参照文を第2の言語に翻訳した参照翻訳文(図1の第二言語の入力文12に対応する)とが単語および/または句レベルで対応付けられた翻訳例をデータベース(図2に示す翻訳例データベース18に対応する)に蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援装置(図2に示す翻訳支援装置10に対応する)であって、前記参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成する翻訳例生成手段(図2に示す第一言語解析部27と第二言語解析部28と単語・句アライメント部29に対応する)と、前記翻訳例生成手段によって翻訳例が生成された際に、該翻訳例を表示制御する翻訳例表示制御手段(図2に示す翻訳例表示部30に対応する)と、前記翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文を前記データベースに蓄積するよう制御する蓄積制御手段(図2に示す蓄積制御部31に対応する)と、を備えたことを特徴とする。
【0012】
この請求項1の発明によれば、翻訳例生成手段が、参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成し、翻訳例表示制御手段が、翻訳例生成手段によって翻訳例が生成された際に、その翻訳例を表示制御し、蓄積制御手段が、翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文をデータベースに蓄積することとしたので、翻訳例の登録前にユーザが単語および/または句レベルでの対応付けを修正でき、データベース内の翻訳例を質の高いものに維持することができる。
【0013】
また、請求項2の発明に係る翻訳支援装置は、請求項1の発明において、前記第1の言語により記述された参照単語と該参照単語を前記第2の言語に翻訳した参照翻訳語とを蓄積する単語蓄積手段(図2の対訳単語辞書20に対応する)と、前記翻訳例表示制御手段により表示制御された翻訳例について単語レベルの対応付けの修正がなされた前記参照単語と前記参照翻訳語とを前記単語蓄積手段に蓄積するよう制御する単語蓄積制御手段(図2の辞書登録部32に対応する)と、をさらに備え、前記翻訳例生成手段は、前記単語蓄積手段に蓄積された前記参照単語と前記参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうことを特徴とする。
【0014】
この請求項2の発明によれば、単語蓄積手段が、参照単語と参照翻訳語とを蓄積し、単語蓄積制御手段が、翻訳例表示制御手段により表示制御された翻訳例について単語レベルの対応付けの修正がなされた参照単語と参照翻訳語とを単語蓄積手段に蓄積するよう制御し、翻訳例生成手段が、単語蓄積手段に蓄積された参照単語と参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうこととしたので、ユーザにより対応付けの修正がなされた参照単語と参照翻訳語とを単語蓄積手段に登録でき、その知識を単語および/または句レベルでの対応付けや機械翻訳の精度の向上に有効に利用することができる。
【0015】
また、請求項3の発明に係る翻訳支援装置は、請求項1または2の発明において、前記第1の言語により記述された参照句と該参照句を前記第2の言語に翻訳した参照翻訳句とを蓄積する句蓄積手段(図8の対訳句辞書81に対応する)と、前記単語および/または句レベルでの対応付けの修正がなされた翻訳例から前記参照句と前記参照翻訳句とを抽出して前記句蓄積手段に蓄積するよう制御する句蓄積制御手段(図8の句対応情報抽出部80に対応する)と、をさらに備え、前記翻訳例生成手段は前記句蓄積手段に蓄積された前記参照句と前記参照翻訳句とを参照して句レベルでの対応付けをおこなうことを特徴とする。
【0016】
この請求項3の発明によれば、句蓄積手段が、参照句と参照翻訳句とを蓄積し、句蓄積制御手段が、単語および/または句レベルでの対応付けの修正がなされた翻訳例から参照句と参照翻訳句とを抽出して句蓄積手段に蓄積するよう制御し、翻訳例生成手段が、句蓄積手段に蓄積された参照句と参照翻訳句とを参照して句レベルでの対応付けをおこなうこととしたので、ユーザにより対応付けの修正がなされた参照句と参照翻訳句とを句蓄積手段に登録でき、その知識を句レベルでの対応付けや機械翻訳の精度の向上に有効に利用することができる。
【0017】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る翻訳支援装置の好適な実施の形態を詳細に説明する。なお、以下では、翻訳支援装置が翻訳メモリと機械翻訳システムとを搭載している場合について説明する。
【0018】
(実施の形態1)
まず、本実施の形態1に係る翻訳支援装置の翻訳例を翻訳例データベースに登録し、単語を対訳単語辞書に登録する処理の概念について説明する。図1は、本実施の形態1に係る翻訳支援装置の翻訳例を翻訳例データベースに登録し、単語を対訳単語辞書に登録する処理の概念を説明する概念図である。
【0019】
同図に示すように、この翻訳支援装置10は、まず、参照文に当たる第一言語の入力文11とその参照翻訳文に当たる第二言語の入力文12を読み込む。読み込まれた第一言語の入力文11と第二言語の入力文12は、第一言語用言語解析システム13と第二言語用言語解析システム14で、それぞれ言語解析がなされる。
【0020】
具体的には、第一言語用言語解析システム13と第二言語用言語解析システム14とが、入力された文の形態素解析・構文解析・意味解析等をそれぞれおこなう。形態素解析では、文を形態素に分け品詞を決定する作業をおこなう。形態素とは、文中の意味を持つ最小の言語単位のことである。この解析により、文中から単語を抽出することができる。構文解析は、形態素解析で抽出された形態素どうしがどのような関係で結びついているかを解析するものであり、句を抽出するために必要となる。
【0021】
意味解析は、形態素解析および構文解析によって得られた文の各構成要素に対し、意味的な妥当性を判定して意味構造を抽出するものである。この解析をおこなうことにより、より精度良く意味的にまとまりのある句を抽出することができる。以上の解析により、第一言語の入力文11と第二言語の入力文12とから単語および句を抽出することができる。
【0022】
単語と句とが抽出された第一言語の入力文11および第二言語の入力文12は、単語・句アライメントシステム15において、同じ意味を有する単語どうし、また句どうしが対応付けられ、その対応付けられた結果が翻訳例表示手段16によりユーザに通知される。
【0023】
ユーザはその結果を見て、単語・句アライメントシステム15による単語および句の対応付けに不適切なところがあれば、蓄積制御手段17によりその対応付けを修正する。そして、単語および句の修正された対応情報と第一言語の入力文11と第二言語の入力文12とは、翻訳例データベース18に登録され記憶される。
【0024】
翻訳例データベース18は、第一言語の入力文11と第二言語の入力文12と、単語の対応情報と、句の対応情報を記憶する。単語の対応情報に関しては、例えば、第一言語の入力文11が「これは赤いペンです」で、第二言語の入力文12が「This is a red pen」である場合には、(これ:1=This:1)、(赤い:4=red:11)、(ペン:6=pen:15)のような形式で記憶する。
【0025】
ここで、「(」および「)」は、それらに挟まれる部分が単語の対応関係の情報であることを表すものであり、「:」の右側の数字は、その単語が空白文字を含め文の先頭から何文字目にあるかを表すものであり、「=」は、その両側にある単語どうしが対応していることを表すものである。
【0026】
句の対応情報も同様にして、翻訳例データベース18に記憶することができる。上記の例では、((これ:1=This:1))、((赤いペン:4=a red pen:9))のような形式で句の対応関係を記憶する。ここで「((」および「))」は、それらに挟まれる部分が句の対応関係の情報であることを表すものであり、「:」の右側の数字は、その句が空白文字を含め文の先頭から何文字目にあるかを表すものであり、「=」は、その両側にある句どうしが対応していることを表すものである。
【0027】
もし、蓄積制御手段17で対応関係を修正された単語が、機械翻訳システム用の対訳単語辞書20に登録されていないものであれば、辞書登録手段19によりその単語を対訳単語辞書20に登録する。
【0028】
次に、本実施の形態1に係る翻訳支援装置10の翻訳例を翻訳例データベース18に登録し、単語を対訳単語辞書20に登録する翻訳例登録部21の構成について説明する。図2は、本実施の形態1に係る翻訳支援装置10の翻訳例を翻訳例データベース18に登録し、単語を対訳単語辞書20に登録する翻訳例登録部21の構成を示す機能ブロック図である。
【0029】
同図に示すように、翻訳支援装置10の翻訳例登録部21は、キーボード・タッチパネル等の入力装置22の操作によるか、あるいはハードディスク・CD−ROM等の記録装置23から、第一言語の入力文11と第二言語の入力文12との入力を受け付る。または、電子メールやWebブラウザ上から文をマウスなどの入力装置22を操作して取得し入力文とすることもできる。
【0030】
そして、それらの間の単語および句の対応付けを行い、その結果をディスプレイ装置24に出力する。その後、ユーザは単語および句の対応付けの結果を見て、修正が必要な場合は入力装置22を用いてそれを修正する。翻訳例登録部21は、ユーザからの修正を受け付け、その修正された単語および句の対応付け情報、さらに第一言語の入力文11と第二言語の入力文12とからなる翻訳例を翻訳支援装置10の翻訳例データベース18に出力して記憶させる。
【0031】
修正の必要がない場合は、ユーザは翻訳例登録部21にそのまま記憶させるよう要求する。翻訳例登録部21は、単語および句の対応付け情報、さらに第一言語の入力文11と第二言語の入力文12とからなる翻訳例を翻訳支援装置10の翻訳例データベース18に出力して記憶させる。
【0032】
機械翻訳用の対訳単語辞書20は、翻訳例登録部21が単語および句の対応付けをおこなう際に参照される。従って、対訳単語辞書20に存在しない単語が文中にあった場合には、単語の対応付けが不可能になる。この場合、辞書登録部32は、蓄積制御部31でユーザにより単語の対応付けが修正された単語を対訳単語辞書20に出力して記憶する。
【0033】
ここで、翻訳支援装置10の翻訳例登録部21の構成を具体的に説明する。この翻訳例登録部21は、インターフェース部25と、言語入力受付部26と、第一言語解析部27と、第二言語解析部28と、単語・句アライメント部29と、翻訳例表示部30と、蓄積制御部31と、辞書登録部32とを有する。
【0034】
インターフェース部25は、入力装置22・記録装置23・ディスプレイ装置24と翻訳例登録部21との間でデータの通信をおこなうためのインターフェースである。言語入力受付部26は、翻訳例データベース18に登録する第一言語の入力文11と第二言語の入力文12との入力を受け付ける受付部であり、第一言語の入力文11を第一言語解析部27に、第二言語の入力文12を第二言語解析部28に出力する。
【0035】
第一言語解析部27と第二言語解析部28は、第一言語の入力文11と第二言語の入力文12の言語解析をそれぞれおこなう解析部である。具体的には、形態素解析・構文解析・意味解析等を行い、文を形態素に分割し、文の構文構造・意味構造を抽出する。これにより、単語および意味的に妥当性のある句をそれぞれの文から抽出することができる。
【0036】
単語・句アライメント部29は、第一言語解析部27と第二言語解析部28とで解析された解析結果を取得し、第一言語解析部27により抽出された第一言語の入力文11の単語・句と、第二言語解析部28により抽出された第二言語の入力文12の単語・句との対応付けをそれぞれおこなう。
【0037】
単語の対応付けは、対訳単語辞書20を参照しておこなう。句の対応付けに関しては、第一言語解析部27と第二言語解析部28による解析で得られた解析結果と機械翻訳用の対訳単語辞書20とを参照して、同じ構文構造および意味構造を持つ句どうしを結合する。
【0038】
翻訳例表示部30は、単語・句アライメント部29で単語および句の対応付けがなされた第一言語の入力文11と第二言語の入力文12と、単語および句の対応付けを修正するための修正画面とを、インターフェース部25を経由してディスプレイ装置24のディスプレイ上に表示し、ユーザに提示する。
【0039】
蓄積制御部31は、ユーザが提示された結果をみて、単語あるいは句の対応付けに修正が必要と判断し、修正画面上で入力装置22により修正を行った場合に、インターフェース部25を経由してその修正を受け付け、その修正された単語および句の対応付け情報および第一言語の入力文11と第二言語の入力文12とからなる翻訳例を翻訳例データベース18に出力して記憶させる。
【0040】
対応付けの修正が必要でない場合には、ユーザは翻訳例データベース18にそのまま記憶させるよう要求する。その場合、蓄積制御部31は、単語と句の対応付け情報および第一言語の入力文11と第二言語の入力文12とからなる翻訳例を翻訳例データベース18に出力して記憶させる。
【0041】
辞書登録部32は、ユーザが単語の対応付けの修正後に、対訳単語辞書20への単語の登録を要求した場合には、インターフェース部25経由でディスプレイ装置24のディスプレイに単語登録用の画面を表示させ、その後単語とその翻訳語とを対訳単語辞書20に出力して記憶させる。この対訳単語辞書20は、翻訳例登録部21が単語および句の対応付けをおこなう際に参照される。
【0042】
次に、第一言語の入力文11と第二言語の入力部12との間の単語の対応関係について説明する。図3は、ディスプレイ上に表示された第一言語の入力文11と第二言語の入力文12との間の単語の対応関係の一例を示す図である。
【0043】
ここでは、翻訳支援の対象言語が日本語と英語であって、第一言語の入力文11として日本語の「これは赤いペンです」が、第二言語の入力文12として英語の「This is a red pen」が入力された場合について示すことにする。
【0044】
同図に示すように、翻訳支援装置10の翻訳例表示部30は、単語の対応関係を表示する単語ビュー33と、句の対応関係を表示する句ビュー34とをディスプレイ装置24のディスプレイ上に表示する。ユーザが単語ビュー33を選択すると、第一言語解析部27と第二言語解析部28とにより単語レベルにまで分割された、第一言語の入力文11と第二言語の入力文12とが表示される。
【0045】
そして、単語・句アライメント部29により対応付けられた、「これ」35と「This」38、「赤い」36と「red」39、「ペン」37と「pen」40とが、それぞれ線(41〜43)で結合されて表示される。この単語の対応付けをおこなう際には、対訳単語辞書20が参照され、同じ意味を持つ単語どうしが結合される。
【0046】
次に、第一言語の入力文11と第二言語の入力部12との間の句の対応関係について説明する。図4は、ディスプレイ上に表示された第一言語の入力文11と第二言語の入力文12との間の句の対応関係の一例を示す図である。
【0047】
同図に示すように、ユーザが句ビュー34を選択すると、第一言語解析部27と第二言語解析部28とにより意味的にまとまりのあるものとして抽出された句(44〜47)が、単語レベルまで分割された第一言語の入力文11と第二言語の入力文12とともに表示される。
【0048】
そして、単語・句アライメント部29により対応付けられた句である、「これ」44と「This」46、「赤い・ペン」45と「a・red・pen」47とが、それぞれ線(48と49)で結合されて表示される。
【0049】
次に、単語・句アライメント部29による第一言語の入力文11と第二言語の入力文12との間の単語の対応付けに誤りがある場合の修正について説明する。図5は、第一言語の入力文11と第二言語の入力文12との間の単語の対応付けの誤りを修正を示す図である。
【0050】
同図に示すように、単語ビュー33に単語レベルにまで分割された第一言語の入力文11「赤い・ペン・です」と、第二言語の入力文12「a・red・pen」とが表示されている。この表示は図3で示した単語ビュー33の表示と同等のものである。そしてさらに、単語・句アライメント部29で対応付けられた単語である、「赤い」36と「red」39、「ペン」37と「a」50との対応関係が、それぞれ線42と線51で表されている。
【0051】
ここで、「ペン」37と「a」50の単語の対応関係は誤りであり、ユーザがこの誤りに気付いて修正する場合には、まず入力装置22を用いて線51を指定しその対応関係を解消する。その後、ユーザが「ペン」37と「pen」40との正しい対応関係を持つ単語どうしを指定すると、その単語どうしの正しい対応関係が線52で表されて表示される。
【0052】
ここで、単語どうしの対応関係を誤るあるいは対応付けができない場合としては、まず、対訳単語辞書20にその単語が登録されていなかった場合がある。また、その単語が登録されていたとしても、登録されている単語に表記のぶれがある場合がある。例えば、登録されている単語対が「インタフェース」と「interface」とであった場合に、入力文中の単語には「インターフェース」とあるような場合である。
【0053】
また、同一の表記で意味の異なる単語が文中に複数回現れる場合もある。例えば、第一言語の入力文11が「私は夢を夢見る」で、第二言語の入力文12が「I dream a dream」であるような場合、名詞の「夢」と動詞の「夢見る」が第二言語の入力文12中のどちらの「dream」に対応するのかが不明確になるような場合である。
【0054】
さらに、第一言語の入力文11が第二言語の入力文12に対する意訳であるような場合もある。例えば、第一言語の入力文11が「読みが甘い」である場合に、第二言語の入力文12が「too optimistic」とあるような場合である。また、第一言語解析部27と第二言語解析部28とによる単語の抽出に誤りがあったような場合にも、単語の対応付けが困難なものとなる。
【0055】
句どうしの対応付けの修正も、上述の単語の対応付けの修正と同様におこなうことができる。本実施の形態1の翻訳支援装置10では、単語・句アライメント部29で句どうしの対応付けをおこなう際に、対訳単語辞書20を利用している。従って、上記の単語の対応付けに誤りがあったり、対応付けができなかったような場合、句の対応付けにも誤りが生じたり対応付けができない状況となる。
【0056】
次に、蓄積制御部31で対応付けが修正された単語を対訳単語辞書20に登録する単語登録について説明する。図6は、機械翻訳システム用の対訳単語辞書20に単語を登録する一例を示す図である。
【0057】
同図に示すように、単語ビュー33には、図5の対応付けが修正された単語対である「ペン」37と「pen」40とが線52で対応付けられて表示されている。ユーザは、対応付けが修正された単語対の一方の単語をマウス等の入力装置22で指定することで、単語登録ウインドウ60を表示し、登録か登録をキャンセルするかを指定する。この単語登録ウィンドウ60の表示は、辞書登録部32によりおこなわれる。ユーザが単語登録ウィンドウ60上で登録を選択すると、辞書登録部32は、対応付けが修正された単語対を対訳単語辞書20に出力して記憶させる。
【0058】
このように、単語の対応付けの修正後、ユーザがその単語の対訳単語辞書20への登録を要求した場合に、単語とその翻訳語とからなる単語対を辞書登録部32により容易に対訳単語辞書20に出力して記憶させることができる。
【0059】
次に、本実施の形態1に係る翻訳支援装置10の翻訳例を翻訳例データベース18に登録し、単語を対訳単語辞書20に登録する翻訳例登録部21の処理手順について説明する。図7は、本実施の形態1に係る翻訳支援装置10の翻訳例を翻訳例データベース18に登録し、単語を対訳単語辞書20に登録する翻訳例登録部21の処理手順を示すフローチャートである。
【0060】
同図に示すように、翻訳例登録部21の言語入力受付部26は、まず第一言語の入力文11と第二言語の入力文12との入力を受け付けて、第一言語の入力文11を第一言語解析部27に、第二言語の入力文12を第二言語解析部28にそれぞれ出力する(ステップS701)。
【0061】
そして、第一言語解析部27と第二言語解析部28とは、第一言語の入力文11と第二言語の入力文12との言語解析をそれぞれ行って、単語および句をそれぞれの文から抽出する(ステップS702)。続いて、単語・句アライメント部29は、第一言語の入力文11と第二言語の入力文12との間で抽出された単語および句の対応付けをおこなう(ステップS703)。
【0062】
その後、翻訳例表示部30は、第一言語の入力文11と第二言語の入力文12と、対応する単語どうし・句どうしの対応付けとをディスプレイ装置24上のディスプレイに表示し、ユーザに通知する(ステップS704)。そして、ユーザに対しディスプレイ上でその対応付けが正しいかどうかの判定を促す(ステップS705)。
【0063】
対応付けが正しい場合には(ステップS705,Yes)、蓄積制御部31は、翻訳例データベース18に単語および句の対応付け情報と第一言語の入力文11と第二言語の入力文12とを登録する(ステップS706)。対応付けが正しくない場合には(ステップS705,No)、蓄積制御部31は、ユーザからの対応付けの修正を受け付け、修正をおこなう(ステップS707)。修正後はステップS706に移行し、翻訳例データベース18に単語・句の対応付け情報と第一言語の入力文11と第二言語の入力文12とを登録する。
【0064】
続いて、辞書登録部32は、ユーザに対し対応付けが修正された単語どうしを対訳単語辞書20に登録するかどうかを問い合わせる(ステップS708)。単語を登録する場合には(ステップS708,Yes)、辞書登録部32は、対訳単語辞書20にその単語を登録する(ステップS709)。単語を登録しない場合には(ステップS708,No)、そのままこの単語登録処理を終了する。
【0065】
上述してきたように、本実施の形態1では、第一言語の入力文11と第二言語の入力文12とを読み込み、それらの文の言語解析を行って単語および句を抽出し、第一言語の入力文11と第二言語の入力文12との間で抽出された単語および句の対応付けを行い、その対応付けの結果をユーザが確認して対応付けを修正したい場合には、ユーザはその対応付けを修正でき、その修正された対応付け情報と第一言語の入力文11と第二言語の入力文12とを翻訳例データベース18に記憶させるよう構成したので、単語や句の対応付けが不適切である場合にそれをそのまま登録するようなことがなく、ユーザがその時点で修正することができ、その修正を翻訳メモリによる翻訳作業に即座に活かすことができる。
【0066】
また、ユーザにより対応付けが修正された単語とその翻訳語とを機械翻訳用の対訳単語辞書20に登録できるよう構成したので、翻訳例として蓄積されている単語情報を機械翻訳にも有効に活かすことができる。
【0067】
(実施の形態2)
ところで、上記実施の形態1では、単語・句アライメント部29が、対訳単語辞書20を参照して第一言語の入力文11と第二言語の入力文12との間で単語および句の対応付けをおこなうこととしたが、単語・句アライメント部29が対応付けた句の対応情報を翻訳例データベース18から抽出し、その情報をさらに参照することで句の対応付けの精度を上げることも可能である。
【0068】
例えば、実施の形態1では、第一言語の入力文11が第二言語の入力文12の意訳であるような場合には、対訳単語辞書20を参照したとしても正しい対応関係を見つけることは困難となる。例えば、第一言語の入力文11が「読みが甘い」で、対応する第二言語の入力文12が「too optimistic」であるような場合である。
【0069】
そこで、本実施の形態2では、上述のような翻訳例データベース18に蓄積された句の対応情報を抽出して対訳句辞書に記憶し、それと対訳単語辞書20の単語の情報との両方を参照することで、句の対応付けの精度を上げる場合について説明する。
【0070】
図8は、本実施の形態2に係る翻訳支援装置10の対訳句辞書を参照して句の対応付けをおこなう翻訳例登録部21の構成を示す機能ブロック図である。同図に示すように、本実施の形態2に係る翻訳支援装置10の翻訳例登録部21の構成は、図1の実施の形態1に係る翻訳支援装置10の翻訳例登録部21の構成に、句対応情報抽出部80と対訳句辞書81とを追加したものである。
【0071】
第一言語の入力文11と第二言語の入力文12との間の単語および句の対応情報が、蓄積制御部31により修正されて翻訳例データベース18に登録されると、句対応情報抽出部80は翻訳例データベース18から句の対応情報を抽出し、対訳句辞書81に句の意味情報を出力して記憶させる。
【0072】
ここでは、翻訳例データベース18に修正された翻訳例を登録する毎に句の対応情報を抽出することとしたが、ユーザからの要求に応じてある時点で一斉に抽出し、対訳句辞書81にその意味情報を出力して記憶させてもよい。
【0073】
具体的には、翻訳例データベース18において、((赤いペン:4=a red pen:9))のような形式で記憶されている句の対応情報を抽出し、そこから文中の位置を示す数字部分を除外して、{赤いペン=a red pen}のような形式で句の意味情報を記憶する。
【0074】
ここで「{」および「}」は、それらに挟まれる部分が句の意味情報であることを表すものであり、「=」は、その両側にある句どうしが同じ意味を有していることを表すものである。このようにして構築される対訳句辞書81は、単語・句アライメント部29が句の対応付けをおこなう際に参照される。
【0075】
上述してきたように、本実施の形態2では、句対応情報抽出部80が、翻訳例データベース18に蓄積された句の対応情報を抽出し対訳句辞書81に記憶させて、単語・句アライメント部29が句の対応付けをおこなう際に参照するよう構成したので、一旦対訳句辞書81に句の意味情報を記憶させてしまえば、その後単語・句アライメント部29による句の対応付けで同じ句が出てきた場合に、対訳句辞書81を参照することで、単語・句アライメント部29における句の対応付けを正確におこなうことができる。
【0076】
なお、本実施の形態1および2では、第一言語の入力文11が日本語で、第二言語の入力文12が英語である場合を示したが、本発明の対象言語は日本語と英語に限定されるものではなく、いかなる言語でも本発明の対象言語となり得る。
【0077】
(付記1)第1の言語により記述された参照対象となる参照文と該参照文を第2の言語に翻訳した参照翻訳文とが単語および/または句レベルで対応付けられた翻訳例をデータベースに蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援装置であって、
前記参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成する翻訳例生成手段と、
前記翻訳例生成手段によって翻訳例が生成された際に、該翻訳例を表示制御する翻訳例表示制御手段と、
前記翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文を前記データベースに蓄積するよう制御する蓄積制御手段と、
を備えたことを特徴とする翻訳支援装置。
【0078】
(付記2)前記蓄積制御手段は、前記データベースから前記翻訳対象となる翻訳文に類似する参照文を含む前記翻訳例がユーザに提示された際に、前記翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた前記修正翻訳文を前記データベースに蓄積するよう制御することを特徴とする付記1に記載の翻訳支援装置。
【0079】
(付記3)前記第1の言語により記述された参照単語と該参照単語を前記第2の言語に翻訳した参照翻訳語とを蓄積する単語蓄積手段と、前記翻訳例表示制御手段により表示制御された翻訳例について単語レベルの対応付けの修正がなされた前記参照単語と前記参照翻訳語とを前記単語蓄積手段に蓄積するよう制御する単語蓄積制御手段と、をさらに備え、前記翻訳例生成手段は、前記単語蓄積手段に蓄積された前記参照単語と前記参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうことを特徴とする付記1または2に記載の翻訳支援装置。
【0080】
(付記4)前記第1の言語により記述された参照句と該参照句を前記第2の言語に翻訳した参照翻訳句とを蓄積する句蓄積手段と、前記単語および/または句レベルでの対応付けの修正がなされた翻訳例から前記参照句と前記参照翻訳句とを抽出して前記句蓄積手段に蓄積するよう制御する句蓄積制御手段と、をさらに備え、前記翻訳例生成手段は前記句蓄積手段に蓄積された前記参照句と前記参照翻訳句とを参照して句レベルでの対応付けをおこなうことを特徴とする付記1、2または3に記載の翻訳支援装置。
【0081】
(付記5)第1の言語により記述された参照対象となる参照文と該参照文を第2の言語に翻訳した参照翻訳文とが単語および/または句レベルで対応付けられた翻訳例をデータベースに蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援方法であって、
前記参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成する翻訳例生成工程と、
前記翻訳例生成工程によって翻訳例が生成された際に、該翻訳例を表示制御する翻訳例表示制御工程と、
前記翻訳例表示制御工程により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文を前記データベースに蓄積するよう制御する蓄積制御工程と、
を含んだことを特徴とする翻訳支援方法。
【0082】
(付記6)前記蓄積制御工程は、前記データベースから前記翻訳対象となる翻訳文に類似する参照文を含む前記翻訳例がユーザに提示された際に、前記翻訳例表示制御工程により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた前記修正翻訳文を前記データベースに蓄積するよう制御することを特徴とする付記5に記載の翻訳支援方法。
【0083】
(付記7)前記第1の言語により記述された参照単語と該参照単語を前記第2の言語に翻訳した参照翻訳語とを蓄積する単語蓄積工程と、前記翻訳例表示制御工程により表示制御された翻訳例について単語レベルの対応付けの修正がなされた前記参照単語と前記参照翻訳語とを前記単語蓄積工程により蓄積するよう制御する単語蓄積制御工程と、をさらに備え、前記翻訳例生成工程は、前記単語蓄積工程により蓄積された前記参照単語と前記参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうことを特徴とする付記5または6に記載の翻訳支援方法。
【0084】
(付記8)前記第1の言語により記述された参照句と該参照句を前記第2の言語に翻訳した参照翻訳句とを蓄積する句蓄積工程と、前記句レベルでの対応付けの修正がなされた翻訳例から前記参照句と前記参照翻訳句とを抽出して前記句蓄積工程により蓄積するよう制御する句蓄積制御工程と、をさらに備え、前記翻訳例生成工程は前記句蓄積工程により蓄積された前記参照句と前記参照翻訳句とを参照して句レベルでの対応付けをおこなうことを特徴とする付記5、6または7に記載の翻訳支援方法。
【0085】
(付記9)第1の言語により記述された参照対象となる参照文と該参照文を第2の言語に翻訳した参照翻訳文とが単語および/または句レベルで対応付けられた翻訳例をデータベースに蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援方法をコンピュータに実行させるプログラムであって、
前記参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成する翻訳例生成工程と、
前記翻訳例生成工程によって翻訳例が生成された際に、該翻訳例を表示制御する翻訳例表示制御工程と、
前記翻訳例表示制御工程により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文を前記データベースに蓄積するよう制御する蓄積制御工程と、
をコンピュータに実行させるプログラム。
【0086】
【発明の効果】
以上説明したように、請求項1の発明によれば、翻訳例生成手段が、参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成し、翻訳例表示制御手段が、翻訳例生成手段によって翻訳例が生成された際に、その翻訳例を表示制御し、蓄積制御手段が、翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文をデータベースに蓄積することとしたので、翻訳例の登録前にユーザが単語および/または句レベルでの対応付けを修正でき、データベース内の翻訳例を質の高いものに維持することが可能な翻訳支援装置が得られるという効果を奏する。
【0087】
また、請求項2の発明によれば、単語蓄積手段が、参照単語と参照翻訳語とを蓄積し、単語蓄積制御手段が、翻訳例表示制御手段により表示制御された翻訳例について単語レベルの対応付けの修正がなされた参照単語と参照翻訳語とを単語蓄積手段に蓄積するよう制御し、翻訳例生成手段が、単語蓄積手段に蓄積された参照単語と参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうこととしたので、ユーザにより対応付けの修正がなされた参照単語と参照翻訳語とを単語蓄積手段に登録でき、その知識を単語および/または句レベルでの対応付けや機械翻訳の精度の向上に有効に利用することが可能な翻訳支援装置が得られるという効果を奏する。
【0088】
また、請求項3の発明によれば、句蓄積手段が、参照句と参照翻訳句とを蓄積し、句蓄積制御手段が、単語および/または句レベルでの対応付けの修正がなされた翻訳例から参照句と参照翻訳句とを抽出して句蓄積手段に蓄積するよう制御し、翻訳例生成手段が、句蓄積手段に蓄積された参照句と参照翻訳句とを参照して句レベルでの対応付けをおこなうこととしたので、ユーザにより対応付けの修正がなされた参照句と参照翻訳句とを句蓄積手段に登録でき、その知識を句レベルでの対応付けや機械翻訳の精度の向上に有効に利用することが可能な翻訳支援装置が得られるという効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態1に係る翻訳支援装置の翻訳例を翻訳例データベースに登録し、単語を対訳単語辞書に登録する処理の概念を説明する概念図である。
【図2】本実施の形態1に係る翻訳支援装置の翻訳例を翻訳例データベースに登録し、単語を対訳単語辞書に登録する翻訳例登録部の構成を示す機能ブロック図である。
【図3】ディスプレイ上に表示された第一言語の入力文と第二言語の入力文との間の単語の対応関係の一例を示す図である。
【図4】ディスプレイ上に表示された第一言語の入力文と第二言語の入力文との間の句の対応関係の一例を示す図である。
【図5】第一言語の入力文と第二言語の入力文との間の単語の対応付けの誤りの修正を示す図である。
【図6】機械翻訳システム用の対訳単語辞書に単語を登録する一例を示す図である。
【図7】本実施の形態1に係る翻訳支援装置の翻訳例を翻訳例データベースに登録し、単語を対訳単語辞書に登録する翻訳例登録部の処理手順を示すフローチャートである。
【図8】本実施の形態2に係る翻訳支援装置の対訳句辞書を参照して句の対応付けをおこなう翻訳例登録部の構成を示す機能ブロック図である。
【符号の説明】
10 翻訳支援装置
11 第一言語の入力文
12 第二言語の入力文
13 第一言語用言語解析システム
14 第二言語用言語解析システム
15 単語・句アライメントシステム
16 翻訳例表示手段
17 蓄積制御手段
18 翻訳例データベース
19 辞書登録手段
20 対訳単語辞書
21 翻訳例登録部
22 入力装置
23 記録装置
24 ディスプレイ装置
25 インターフェース部
26 言語入力受付部
27 第一言語解析部
28 第二言語解析部
29 単語・句アライメント部
30 翻訳例表示部
31 蓄積制御部
32 辞書登録部
33 単語ビュー
34 句ビュー
60 単語登録ウィンドウ
80 句対応情報抽出部
81 対訳句辞書

Claims (3)

  1. 第1の言語により記述された参照対象となる参照文と該参照文を第2の言語に翻訳した参照翻訳文とが単語および/または句レベルで対応付けられた翻訳例をデータベースに蓄積しておき、翻訳対象となる翻訳文が入力された際に該翻訳文に類似する参照文を含む翻訳例を前記データベースから検索してユーザに提示する翻訳支援をおこなう翻訳支援装置であって、
    前記参照文および参照翻訳文の単語および/または句レベルでの対応付けをおこなって翻訳例を生成する翻訳例生成手段と、
    前記翻訳例生成手段によって翻訳例が生成された際に、該翻訳例を表示制御する翻訳例表示制御手段と、
    前記翻訳例表示制御手段により表示制御された翻訳例について単語および/または句レベルの対応付けの修正がなされた修正翻訳文を前記データベースに蓄積するよう制御する蓄積制御手段と、
    を備えたことを特徴とする翻訳支援装置。
  2. 前記第1の言語により記述された参照単語と該参照単語を前記第2の言語に翻訳した参照翻訳語とを蓄積する単語蓄積手段と、前記翻訳例表示制御手段により表示制御された翻訳例について単語レベルの対応付けの修正がなされた前記参照単語と前記参照翻訳語とを前記単語蓄積手段に蓄積するよう制御する単語蓄積制御手段と、をさらに備え、前記翻訳例生成手段は、前記単語蓄積手段に蓄積された前記参照単語と前記参照翻訳語とを参照して単語および/または句レベルでの対応付けをおこなうことを特徴とする請求項1に記載の翻訳支援装置。
  3. 前記第1の言語により記述された参照句と該参照句を前記第2の言語に翻訳した参照翻訳句とを蓄積する句蓄積手段と、前記単語および/または句レベルでの対応付けの修正がなされた翻訳例から前記参照句と前記参照翻訳句とを抽出して前記句蓄積手段に蓄積するよう制御する句蓄積制御手段と、をさらに備え、前記翻訳例生成手段は前記句蓄積手段に蓄積された前記参照句と前記参照翻訳句とを参照して句レベルでの対応付けをおこなうことを特徴とする請求項1または2に記載の翻訳支援装置。
JP2002338364A 2002-11-21 2002-11-21 翻訳支援装置 Pending JP2004171397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002338364A JP2004171397A (ja) 2002-11-21 2002-11-21 翻訳支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002338364A JP2004171397A (ja) 2002-11-21 2002-11-21 翻訳支援装置

Publications (1)

Publication Number Publication Date
JP2004171397A true JP2004171397A (ja) 2004-06-17

Family

ID=32701612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002338364A Pending JP2004171397A (ja) 2002-11-21 2002-11-21 翻訳支援装置

Country Status (1)

Country Link
JP (1) JP2004171397A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072594A (ja) * 2005-09-05 2007-03-22 Sharp Corp 翻訳装置、翻訳方法および翻訳プログラム、媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072594A (ja) * 2005-09-05 2007-03-22 Sharp Corp 翻訳装置、翻訳方法および翻訳プログラム、媒体

Similar Documents

Publication Publication Date Title
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
JP3220560B2 (ja) 機械翻訳装置
JP3161942B2 (ja) 訳振り機械翻訳装置
JP4237001B2 (ja) 文書のコロケーション誤りを自動的に検出するシステムおよび方法
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JP4113235B2 (ja) 翻訳支援装置
JP2004220266A (ja) 機械翻訳装置および機械翻訳方法
JP2007072594A (ja) 翻訳装置、翻訳方法および翻訳プログラム、媒体
JP2000259635A (ja) 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体
JP2004171397A (ja) 翻訳支援装置
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP5185343B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4021813B2 (ja) 複合語登録プログラムおよび登録装置
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP3236027B2 (ja) 機械翻訳装置
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JP4812811B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2003058536A (ja) 翻訳装置
JP2928246B2 (ja) 翻訳支援装置
JP2749954B2 (ja) 自然言語解析装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JP3014746B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050309

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20050309

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20050408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070424