JP2007149109A - 翻訳支援装置 - Google Patents
翻訳支援装置 Download PDFInfo
- Publication number
- JP2007149109A JP2007149109A JP2006345371A JP2006345371A JP2007149109A JP 2007149109 A JP2007149109 A JP 2007149109A JP 2006345371 A JP2006345371 A JP 2006345371A JP 2006345371 A JP2006345371 A JP 2006345371A JP 2007149109 A JP2007149109 A JP 2007149109A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- bilingual
- sentence
- parallel
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【課題】 機械翻訳装置と翻訳メモリ装置の連携により翻訳作業の自動化を高め、作業を効率化して翻訳品質を向上させる。
【解決手段】インタフェース部10で翻訳対象文の入力、翻訳文の出力、翻訳制御に関し入出力指示を行う。機械翻訳装置12はある言語の文書を他の言語の文書に翻訳する。翻訳メモリ装置14は、ある言語の文章とこれ対応する他の言語の対訳文を蓄積した対訳データベース16の検索により、翻訳する。データ互換処置部18は、機械翻訳装置12で翻訳した対訳情報と翻訳メモリ装置14で翻訳した対訳情報を共通化して相互に対訳情報としての取り込みを可能する。
【選択図】 図1
【解決手段】インタフェース部10で翻訳対象文の入力、翻訳文の出力、翻訳制御に関し入出力指示を行う。機械翻訳装置12はある言語の文書を他の言語の文書に翻訳する。翻訳メモリ装置14は、ある言語の文章とこれ対応する他の言語の対訳文を蓄積した対訳データベース16の検索により、翻訳する。データ互換処置部18は、機械翻訳装置12で翻訳した対訳情報と翻訳メモリ装置14で翻訳した対訳情報を共通化して相互に対訳情報としての取り込みを可能する。
【選択図】 図1
Description
本発明は、ある言語の文書を他の言語に翻訳する翻訳支援装置、特に機械翻訳装置と翻訳メモリ装置とを連携させて翻訳を行う翻訳支援装置に関する。
従来、例えば英文を日本文に翻訳する翻訳支援装置としては、機械翻訳装置、翻訳メモリ装置、電子辞書装置、インターネット用語検索装置、要約作成装置などが知られている。
機械翻訳装置は、ある言語を他の言語へ翻訳する計算機システムであり、翻訳対象文の文法構造に着目して語順を変換する構文解析を行った後、更に文章中の情報に基づき各単語の意味をとらえて翻訳する意味処理などを行っている。
機械翻訳装置は、実際の翻訳業務に耐えうる翻訳精度が出ないのが現状であるが、定型的な文型や語句が頻出する分野に特化すれば、人間よりはるかに大量な文書を一定の文体と訳語で翻訳できる。また、表などのように訳語が決まりきっているものに対しては高精度で効率良く翻訳できる。
翻訳メモリ装置は、翻訳対象文章と翻訳文章との対訳文を対訳文データベースに蓄積しておき、翻訳対象文を検索キーとして対訳文データベースを検索し、翻訳対象文に一致した対訳文またはそれに近い文に近い対訳文を表示する。この翻訳メモリ装置は実際の翻訳業務に使われており、文体や訳語の統一などの品質向上には貢献しているが、効率はそれほど上がっていない。
電子辞書装置は、辞書引きの作業を効率化するために、CD−ROMまたはインターネットのホームページから単語やその用例を検索したりする支援装置である。
インターネット用語検索装置は、検索エンジンなどであり、単語を検索キーにして、その単語を含む文書などをインターネットのホームページから検索する支援装置である。
要約作成装置は、膨大な翻訳作業を行なう際に、対象となる文書の要約を作成するものであり、要約を得ることで翻訳しやすくなる。
特開平10−254870号公報
特開平9−26961号公報
しかしながら、このような従来の翻訳支援装置は、機械翻訳装置、翻訳メモリ装置、電子辞書装置、インターネット用語検索装置、要約作成装置といった装置がばらばらに存在しており、これらを組み合わせて翻訳作業を行っても、以下の理由で十分な翻訳作業の効率化は実現できなかった。
まず電子辞書装置やインターネット用語検索装置から検索してきた訳語は、機械翻訳装置に辞書登録しなければ、機械翻訳に使用できず、辞書登録に手間と時間がかかる問題がある。
翻訳メモリ装置は、大量の対訳文を対訳データベースに蓄積して検索に利用しているが、対訳データベースに蓄積した対訳文情報は、データ形式が相違するし、そのまま取り込むことはできないので、機械翻訳装置で活用することができない。
翻訳メモリ装置は、翻訳対象文を検索キーとして対訳データベースの対訳文との間で表層レベルのマッチングしかとれないため、構文的に見て本来は検索されるべき対訳文が埋もれてしまう。
また翻訳メモリ装置は、単なる検索システムなので、例えば単語が1語違っており、自動的にその単語を変えれば翻訳できるようなものでも、検索結果を人手で修正しなければならない。
本発明は、機械翻訳装置と翻訳メモリ装置の連携により翻訳作業の自動化を高め、作業を効率化して翻訳品質を向上させる翻訳支援装置、方法、翻訳支援プログラムを提供することを目的とする。
図1は本発明の原理説明図である。
本発明の翻訳支援装置は、翻訳対象文の入力、翻訳文の出力、翻訳制御に関する入出力指示を行うインタフェース部10と、ある言語の文書を他の言語の文書に翻訳する機械翻訳装置12と、対訳情報を蓄積した対訳データベース16と、対訳データベース16の検索によりある言語の文書を他の言語の文書に翻訳する作業を支援する翻訳メモリ装置14と、機械翻訳装置12で翻訳した対訳情報と翻訳メモリ装置14で翻訳した対訳情報を共通化して相互に対訳情報としての取り込みを可能するデータ互換処理部18とを備えたことを特徴とする。
対訳データベース16には、翻訳メモリ装置14で使用する対訳文データベース26と対訳文を形態素解析や構文解析によって解析した解析済み対訳文データベース28、及び機械翻訳装置12で使用する対訳語句と対訳パターンを登録した辞書32,34が設けられ,データ互換処理部18は、機械翻訳装置12で得られた対訳文又は翻訳メモリ装置14で得られた対訳文を修正したものを対訳文データベース26に追加し、翻訳メモリ装置12で得られた対訳文またはユーザが翻訳した対訳文を対訳文データベース26に追加すると共に対訳文を解析して得た解析済み対訳文を解析済み対訳文データベース28に追加し、更に解析済み対訳文から対訳語句及び又は対訳パターンを抽出して機械翻訳装置10側の辞書32,34に追加する。
これによって機械翻訳装置で得られた対訳情報が翻訳メモリ装置で使用する検索用のデータベースに反映され、同時に翻訳メモリ装置の検索用データベースに蓄積されている対訳情報が機械翻訳装置の辞書に反映され、それぞれの対訳情報が共通の資産として活用できることで、翻訳作業の自動化が更に押し進められ、作業の効率化と翻訳品質の向上が期待される。
データ互換処理部18は、対訳データベース16の解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させる。これにより確信度の低い候補を辞書に登録するか否かユーザが判断し、また確信度の高い候補だけを自動的に辞書登録するようなことができ、機械翻訳装置に誤った対訳語句や対訳パターンが登録されてしまうことを防ぐ。
本発明の翻訳支援装置は更に類似文翻訳部36を設ける。類似文翻訳部36は、翻訳メモリ装置に翻訳を要求した際に、入力文による対訳データベースの検索で類似文を検索すると共に、機械翻訳装置に入力文を渡して解析結果を取得し、対訳ベースの検索結果と機械翻訳装置から取得した解析結果を比較して相違する入力語句を機械翻訳装置に渡して対訳語句を取得して対訳類似文の相違語句を置換する。
このため対訳データベースから類似文が検索された場合、相違する語句が機械翻訳装置との連携で自動的翻訳され、翻訳メモリ装置から得られた対訳文の語句の誤りを人為的に修正する必要がなくなる。
本発明の翻訳支援装置は、更に、構造検索部38を備える。構造検索部38は、翻訳メモリ装置の検索入力文をデータ互換処理部18を経由して機械翻訳装置に渡して解析結果を取得し、この解析結果を検索キーとして解析済み対訳文データベースから構造の似た対訳文を検索して表示させる。このため対訳データベースの検索が翻訳対象文の表層的なマッチングではなく、構造の似た対訳文も検索できる。
本発明の翻訳支援装置において、更に、指定された用語の用例を検索して表示する表現検索部40を設ける。このため機械翻訳装置でも翻訳メモリ装置のいずれでも正しい対訳語句がでないような場合、この語句を含む例文を検索して表示させることで、翻訳効率が向上する。
本発明の翻訳支援装置において、更に、確信度設定部42を設ける。確信度設定部42は、翻訳メモリ装置と機械翻訳装置で同時に翻訳する際に、翻訳メモリ装置からの確信度を示す点数をつけた翻訳候補の出力表示に対し、機械翻訳装置から出力された訳文候補に確信度を示す点数を付けて表示させる。
これは翻訳メモリ装置は翻訳候補に確信度を付けて表示しているが、機械翻訳装置は、翻訳候補の確信度は表示されないので、これに確信度を付けて同時に表示することで、翻訳メモリ装置と機会翻訳装置の翻訳候補の中から確信度の高い正しい翻訳結果を即時に見分けることができる。
本発明の翻訳支援装置は、更に、翻訳する前に翻訳対象文書の大意を表示する要約作成部44を設ける。このため膨大な翻訳作業の際に翻訳対象文書から要約が作成され、この要約を翻訳してみることで、その後の翻訳作業が予測でき、翻訳がしやすくなる。
本発明の翻訳支援装置は、更に、翻訳対象文書の文字数、単語数、表現等を含む文書情報を計算して出現頻度順に表示させる概要計算部46を設ける。このような翻訳対象文に関する文書情報が自動的に表示されることで、予めどういう語句や表現に注意して翻訳すればよいかが、一目瞭然となる。
本発明の翻訳支援装置において、インタフェース部10は、翻訳対象文を表示する原文表示部20と、翻訳した翻訳文を表示するシステム出力表示部24と、機械翻訳、翻訳メモリ検索、構造検索、用語検索を含む編集指示を行う訳編集部22とを備える。
このインタフェース部はユーザに対し翻訳作業画面として表示され、同じ画面上に原文、翻訳文及び編集ツールが表示されることで、機械翻訳装置と翻訳メモリ装置を連携させた翻訳作業を効率良く行うことができる。
本発明は、翻訳支援方法を提供する。この翻訳支援方法は、ある言語の文書を他の言語の文書に機械翻訳装置で翻訳し、対訳情報を蓄積した対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳メモリ装置で翻訳し、機械翻訳装置で翻訳した対訳情報と翻訳メモリ装置で翻訳した対訳情報をデータ互換可能に共通化して相互に対訳情報として取り込むことを特徴とする。
また翻訳支援方法は、対訳データベースには、翻訳メモリ装置で使用する対訳文データベースと対訳文を形態素解析や構文解析などによって解析した解析済み対訳文データベース、及び機械翻訳装置で使用する対訳語句と対訳パターンを登録した辞書が設けられ、機械翻訳装置で得られた対訳文、又は翻訳メモリ装置で得られた対訳文を修正したものを互換データに変換して対訳文データベースに追加し、翻訳メモリ装置で得られた対訳文またはユーザが翻訳した対訳文を前記対訳文データベースに追加すると共に対訳文を解析して得た解析済み対訳文を前記解析済み対訳文データベースに追加し、更に解析済み対訳文から対訳語句及び又は対訳パターンを抽出して機械翻訳装置の辞書に追加することを特徴とする。
翻訳支援方法は、更に、解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させる。
翻訳支援方法は、更に、翻訳メモリ装置に翻訳を要求した際に、入力文による対訳データベースの検索で類似文を検索すると共に、機械翻訳装置に入力文を渡して解析結果を取得し、対訳データベースの検索結果と機械翻訳装置から取得した解析結果を比較して相違する入力語句を機械翻訳装置に渡して対訳語句を取得して対訳類似文の相違語句を置換する類似文翻訳を行う。
翻訳支援方法は、更に、翻訳メモリ装置の検索入力文をデータ互換処理部を経由して機械翻訳装置に渡して解析結果を取得し、この解析結果を検索キーとして解析済み対訳文データベースから構造の似た対訳文を検索して表示させる。
翻訳支援方法は、更に、指定された用語の用例を検索して表示する。翻訳支援方法は、更に、翻訳メモリ装置と機械翻訳装置で同時に翻訳する際に、翻訳メモリ装置からの確信度を示す点数をつけた翻訳候補の出力表示に対し、機械翻訳装置から出力された訳文候補に確信度を示す点数を付けて表示させる。
翻訳支援方法は、更に、翻訳する前に翻訳対象文書の大意を示す要約を表示する。翻訳支援方法は、更に、翻訳対象文書の文字数、単語数、表現を含む文書情報を計算して出現頻度順に表示させる。
翻訳支援方法は、インタフェース部に、翻訳対象文を原文表示部に表示し、翻訳した翻訳文をシステム出力表示部に表示し、機械翻訳、翻訳メモリ検索、構造検索、用語検索を含む訳編集部から編集指示を行わせる。
本発明は、翻訳支援プログラムを提供する。この翻訳支援プログラムは、コンピュータに、ある言語の文書を他の言語の文書に機械翻訳により翻訳させ、対訳情報を蓄積した対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳メモリ装置により翻訳させ、機械翻訳装置で翻訳した対訳情報と翻訳メモリ装置で翻訳した対訳情報をデータ互換可能に共通化して相互に対訳情報としての取り込むことを実行させる。この翻訳支援プログラムの詳細は、翻訳支援方法と基本的に同じになる。
以上説明してきたように本発明の機械翻訳装置で得られた対訳情報が翻訳メモリ装置で使用する対訳データベースに反映され、同時に翻訳メモリ装置の対訳データベースに蓄積されている対訳情報が機械翻訳装置に反映され、それぞれの対訳情報が共通の資産として活用できることで、翻訳作業の自動化が更に推し進められ、作業の効率化と翻訳品質の向上を図ることができる。
また翻訳メモリ装置の翻訳結果として単語が一語でも違うような類似文の検索結果が翻訳結果として得られたような場合にも、機械翻訳装置との連携により検索された自動的に修正されて正しい翻訳結果が得られることで、翻訳メモリ装置を使用した翻訳作業を効率化でき、その翻訳結果が機械翻訳装置に反映されることで、より効率的な翻訳が実現できる。
図2は本発明による翻訳支援装置の機能構成のブロック図である。図2において、本発明の翻訳支援装置の基本構成は、インタフェース部10、機械翻訳装置12、翻訳メモリ装置14、対訳データベース16、データ互換処理部18及び類似文翻訳部36で構成される。
これに加え本発明の翻訳支援装置にあっては、支援機能を更に強化するために、構造検索部38、表現検索部40、確信度設定部42、要約作成部44、概要計算部46を設けることができる。
インタフェース部10は原文表示部20、訳編集部22及びシステム出力表示部24を備え、翻訳対象文書15の入力及び翻訳結果の翻訳文書25に対する出力を行う。このインタフェース部10としては、例えば図3のような翻訳作業画面11が準備されている。
図3の翻訳作業画面11は、原文表示部20、訳編集部22、機械翻訳表示部24−1、翻訳メモリ表示部24−2及び対訳データベースマッチ文表示部35を備えている。原文表示部20には図2の翻訳対象文書15が表示される。
訳編集部22には編集表示部106が設けられ、その下にユーザが翻訳動作を指示するための制御釦として翻訳釦108、翻訳メモリ釦110、機械翻訳釦112、構造検索釦114、用語検索釦116、上書き釦118が設けられる。
このうち翻訳釦108を操作すると、翻訳メモリ釦110、機械翻訳釦112、構造検索釦114及び用語検索釦116の全てを操作したと同じ翻訳動作が行われる。
機械翻訳表示部24−1には、翻訳対象文としての原文と機械翻訳された訳文が表示される。翻訳メモリ表示部24−2には、翻訳したい文と対訳データベース16の検索で取得された類似文、更に対訳文が表示される。対訳データベースマッチ文表示部35には、翻訳メモリ装置14による対訳データベース16の検索でマッチした対訳文の複数候補が表示される。図4は、図3の翻訳作業画面11を使用した翻訳作業中の表示の一例である。
再び図2を参照するに、機械翻訳装置12は機械翻訳部30、対訳パターン辞書32、対訳語句辞書34を備えており、インタフェース部10よりの翻訳要求に対し、翻訳対象文書15を取り込んで対象文ごとに構文構造の解析を行い、対訳パターン辞書32及び対訳語句辞書34の検索で対訳パターン及び対訳語句を取得し、更に意味処理を加えて対訳文を作成する。
機械翻訳装置12としては、独立した機械翻訳プログラムの実行で実現され、例えば富士通株式会社製「ATLAS」などを使用することができる。
翻訳メモリ装置14は、インタフェース部10からのユーザによる翻訳要求に対し翻訳対象文書15から対象文書を切り出し、この対象文書を検索入力文として検索データベース16−1を検索し、翻訳対象文の原言語の文に近い対訳文を取得する。この翻訳メモリ装置14も機械翻訳装置12と同様、独立したプログラムとして実現されており、例えばTRADOS社製の「Translators Workbench」を使用することができる。
対訳データベース16には、検索データベース16−1の対訳文データベース26と解析済み対訳文データベース28、および機械翻訳装置12側の対訳パターン辞書32と対訳語句辞書34が含まれる。このうち対訳文データベース26及び解析済み対訳文データベース28は、翻訳メモリ装置14の検索メモリとして使用される。
また機械翻訳装置12に設けている対訳パターン辞書32及び対訳語句辞書34は、機械翻訳部30による機械翻訳に使用されるものであるが、データ互換処理部18を介して機械翻訳装置12と翻訳メモリ装置14のデータの共通化を図ることにより、対訳パターン辞書32及び対訳語句辞書34もデータ互換処理部18を経由して、対訳データベース16の範疇に機能的に含まれることになる。
データ互換処理部18は、機械翻訳装置12で得られた対訳情報と翻訳メモリ装置14で得られた対訳情報を両者のデータ共通化により、それぞれの対訳情報として活用できるように対訳データベース16を構築する。
即ちデータ互換処理部18は、翻訳メモリ装置14で翻訳した対訳文またはユーザが翻訳した対訳文を解析し、解析済み対訳文データベース28に追加し、更に解析済み対訳文から対訳パターン及び対訳語句を抽出し、機械翻訳装置12側の対訳パターン辞書32及び対訳語句辞書34に追加する。
また機械翻訳装置12で機械翻訳が行われ、ユーザによる修正なりを経て翻訳が確定すると、データ互換処理部18は、確定した対訳文を対訳文データベース26及び解析済み対訳文データベース28に登録し、同時に対訳パターン辞書32及び対訳語句辞書34にも対訳パターン及び対訳語句を追加登録することになる。
このようなデータ互換処理部18による機械翻訳結果及び翻訳メモリ検索結果のそれぞれの対訳情報への反映により、翻訳メモリ装置14で蓄積した対訳文情報を機械翻訳装置12が活用でき、同時に機械翻訳装置12の翻訳結果を翻訳メモリ装置14側で活用することができる。
類似文翻訳部36は、翻訳メモリ装置14に対する翻訳要求に対する対訳文データベース26の検索で類似文を取得した際に、翻訳対象文となる検索入力文と解析構造を比較して相違する語句を抽出し、この語句を機械翻訳装置12を使用して翻訳して類似文の対訳文の相違する語句を置き換えることで対訳文を得るようにしている。
このため、翻訳メモリ装置14による対訳データベース16の検索で1または複数の僅かな語句が相違している類似文の対訳結果が得られた場合にも、対訳結果の中の相違する部分についてのユーザ修正を必要とすることなく、機械翻訳装置12との連携で自動的に修正翻訳され、これによって翻訳メモリ装置14の翻訳効率を大幅に高めることができる。
更に本発明の翻訳機能を高めるために設けている構造検索部38、表現検索部40、確信度設定部42、要約作成部44及び概要計算部46について簡単に説明すると次のようになる。
構造検索部38は、インタフェース部10で入力した翻訳対象文の構造を解析し、その構造に近い対訳文を対訳データベース16から検索して表示する。この構造検索部38による検索結果は、図3の翻訳作業画面11の対訳データベースマッチ文表示部35に例えば図4の作業画面のように表示される。
表現検索部40は、本発明の翻訳支援装置の対訳データベース16に機能構成として含まれる機械翻訳装置12の対訳パターン辞書32や対訳語句辞書34、更には必要に応じてインターネット45から用語の用例や表現を検索して、翻訳作業画面に必要に応じて表示する。
確信度設定部42は、インタフェース部10より機械翻訳装置12と翻訳メモリ装置14の両方に対し同じ翻訳対象文書に対する翻訳要求が行われた際に、翻訳メモリ装置14にあっては翻訳結果について予め確信度を付して出力表示しているが、機械翻訳装置12の翻訳結果についてはこの確信度の表示がないことから、確信度設定部42によって機械翻訳装置12の翻訳結果についても確信度を付けて、インタフェース部10として実現される作業画面上に翻訳メモリ装置14の翻訳結果と機械翻訳装置12の翻訳結果につき、両方について確信度を例えばパーセント表示で示して表示させ、ユーザによってどちらの翻訳結果が使えるかどうかを判断させるようにしている。
要約作成部44は、膨大な翻訳対象文書15を扱う際に動作することで要約文書を作成し、この自動的に作成された要約文書について翻訳結果を得ることで、その後の翻訳作業の様子がユーザに分かり、翻訳作業をより進め易くさせることができる。
概要計算部46は、翻訳を行おうとする翻訳対象文書15について単語や表現の出現数を計算し、出現順に表示する。また翻訳対象文書の対訳データベース16に対するマッチ率などを計算して表示することもできる。なお、これらの各処理部の機能は後の説明で更に明らかにされる。
図5は、図2のデータ互換処理部18による対訳データベース作成処理のフローチャートである。データ互換処理部18は、まずステップS1で対訳文を対訳データベースに蓄積する処理を行う。本発明の翻訳支援装置を立ち上げた初期段階では対訳文の蓄積がないことから、過去に翻訳した翻訳文書25から対訳文を抽出し、対訳文データベース26に蓄積する。図6は、対訳文データベース26に蓄積する対訳文レコード48であり、翻訳対象文50とその対訳文52の組合せで構成されている。
再び図5を参照するに、抽出した対訳文の対訳文データベース26に対する蓄積が済むと、ステップS2で対訳文を機械翻訳装置12に引き渡して構造を解析し、解析結果を解析済み対訳文データベース28に蓄積する。この解析済み対訳文としては、図6の翻訳対象文50の構造解析で得られた図7の解析情報付き翻訳対象文54を解析済み対訳文データベース28に登録することになる。
ここで解析済み対訳文データベース28に登録している解析情報付き翻訳翻訳対象文は、対訳文データベース26の対応する対訳文レコードとリンク関係が作られている。
次に図5のステップS3で、解析済み対訳文データベース28の解析済み対訳文から頻出する表現を抽出し、最終的な決定はユーザが登録するか否か判断した後、決定した表現を対訳パターン辞書32に登録する。またステップS4で同様に解析済み対訳文から頻出する表現を抽出し、最終的な決定はユーザが行った後、決定した語句を対訳語句辞書34に登録する。
更に対訳文データベース26に翻訳メモリ装置14で既に対訳文を蓄積していた場合には、対訳文データベース26に蓄積した日本語を書式変換し、対訳パターン辞書32や対訳語句辞書34に登録する処理をステップS5で行う。
このようなデータ互換処理部18による対訳データベース16の作成処理は、本発明の翻訳支援装置の立ち上げ時はもちろんのこと、機械翻訳装置12で翻訳結果が決定されるごと、あるいは翻訳メモリ装置14で同じく翻訳結果が決定されるごとに、取得された対訳文を対象に対訳文データベース26への登録、解析済み対訳文データベース28への登録、対訳パターン辞書32への登録、更に対訳語句辞書34への登録をダイナミックに行う。
図8は、図7の解析情報付き翻訳対象文54に基づいて抽出された対訳語句の一例であり、図8(A)の対訳語句56及び図8(B)の対訳語句62が、この場合には抽出され、機械翻訳装置12側の対訳語句辞書34に登録される。
また図9は、図6の対訳文レコード48及び図7の解析情報付き翻訳対象文54から抽出された対訳パターンであり、翻訳対象パターン70とこれに対応する対訳パターン72の組でなる対訳パターンレコード68を対訳パターン辞書32に登録する。
図10はデータ互換処理部18による対訳データベース作成処理の他の実施形態のフローチャートである。この実施形態にあっては解析済み対訳文から頻出する表現や対訳パターン、更には翻訳メモリ装置で蓄積した対訳文データベース26の用語について、ユーザに対しそれぞれの確信度をつけて表示し、この確信度に基づいてユーザが辞書登録するか決めるようにしたことを特徴とする。
図10において、ステップS1,S2は図5の対訳データベース作成処理と同じであり、ステップS3で解析済み対訳文から頻出する表現を抽出すると、ステップS4でユーザに対し抽出した表現に確信度を付けて表示する。このためユーザは、抽出した表現に付けられた確信度を見て対訳パターン辞書32に登録するか否か決めることができる。ユーザが確信度により抽出された表現を登録する指示を行うと、ステップS5で選択指定された表現を対訳パターン辞書32に登録する。
ステップS6〜S8は解析済み対訳文から抽出した語句の対訳語句辞書34に対する登録であり、ステップS7で抽出語句に確信度を付して表示することでユーザが登録するか否か判断し、登録を指示した場合にはステップS8で、選択指定された語句を対訳語句辞書34に登録することになる。
更にステップS9,S10にあっては、翻訳メモリ装置14のメモリ側となる対訳文データベース26の用語について同じく確信度を付してユーザに表示し、ユーザが選択指定した用語を書式変換して対訳語句辞書34に登録している。
このように解析済み対訳文から抽出した表現や語句に確信度を付けた場合には、確信度が高い表現や語句については自動的に辞書登録する処理を行うこともできる。
図11は、図2の類似文翻訳部36の処理内容を説明している。類似文翻訳部36にあっては、翻訳メモリ装置14に対する翻訳要求で入力された例えば図11(A)のような翻訳対象文74を検索キーとして対訳データベース16を参照し、対訳文データベース26から類似文76を取得したとする。
この類似文76については、同時に解析済み対訳文データベース28の検索によって解析済み対訳文が得られている。この解析済み対訳文は図11(B)のように、解析済み単語対応データ82として使用することができる。この解析済み単語対応データ82において、翻訳対象類似文84における主語、動詞、目的語が類似対訳文86における主語、動詞、目的語に実線で示すように対応付けされている。
一方、図11(A)の入力された翻訳対象文74については、その構造が判明していないことから、機械翻訳装置12側に送って文の構造を解析し、解析済み翻訳対象文を取得する。
そして解析済み翻訳対象文と既に構造解析が済んでいる類似文76とを構造的に比較することによって、翻訳対象文と翻訳対象類似文の差分となる相違点として「We」と「Tokyo」を抽出することができる。このようにして抽出された相違点「We」と「Tokyo」は機械翻訳装置12に渡され、辞書検索によって対訳語句として「我々」と「東京」を取得する。
そして類似文76における対訳類似文の相違点である「私」と「横浜」について、機械翻訳装置12の翻訳結果として得られた「我々」と「東京」を入れ替える置換を行うことで、入力した翻訳対象文74に対応する訳文80を自動的に得ることができる。
図12は、図2の類似文翻訳部36による類似文検索処理のフローチャートである。まずステップS1で翻訳メモリ装置14に対し翻訳要求のあった翻訳対象文を取り込み、ステップS2で翻訳対象文を検索キーとして対訳データベース16の対訳文データベース26及び解析済み対訳文データベース28を検索し、類似文を取得する。
次にステップS3で翻訳対象文を機械翻訳装置12で解析し、解析済みの検索類似文と翻訳対象文の間で解析構造を比較して相違点を抽出する。続いてステップS5で、相違点として抽出された語句を機械翻訳装置12の辞書引きで翻訳する。最終的にステップS6で、機械翻訳装置12の辞書引きで得られた翻訳結果を類似文対訳文の相違部分に入れる置換を行って翻訳結果を出力表示する。
図13は同じ翻訳対象文書について、図2の本発明による翻訳支援装置における機械翻訳装置12と翻訳メモリ装置14に対し翻訳要求を行った場合の処理動作のタイムチャートである。
図13において、インタフェース部10が翻訳処理動作の全体的な制御管理を行うメインルーチンとして動作する。即ちインタフェース部10は、例えば図3のような翻訳作業画面11として提供されていることから、ユーザはこの翻訳作業画面11の訳編集部22の操作機能を使用して翻訳動作を行わせる。
具体的には、翻訳対象文書を入力した状態でユーザが図11の翻訳作業画面11における訳編集部22の翻訳釦108をクリックすると、図13のインタフェース部10によるメインルーチンのステップS1の翻訳要求が機械翻訳装置12に対し行われ、同時にステップS3の翻訳要求が翻訳メモリ装置14に対し行われることになる。
なお図13のタイムチャートにあっては、機械翻訳装置と翻訳メモリ装置の翻訳操作を分離するため翻訳要求が順番に出され、それに対する応答が得られるようにしているが、実際には機械翻訳装置12と翻訳メモリ装置14は同時に行われたステップS1,S3の翻訳要求に対し並列的に動作して翻訳結果を返すようになる。
ステップS1の翻訳要求が機械翻訳装置12に与えられると、ステップS101で翻訳対象文の構造解析で得られた表現と語句について対訳パターン辞書32と対訳語句辞書34の検索を対訳データベース16に対し行う。
対訳データベース16側にあっては、ステップS301で辞書検索の結果を機械翻訳装置12に応答し、これに基づき機械翻訳装置12にあっては翻訳対象文の機械翻訳をステップS102で行い、翻訳結果をインタフェース部10に送って、ステップS2で機械翻訳による翻訳結果の表示を行う。
一方、ステップS3で翻訳メモリ装置14に対し同じ翻訳対象文についての翻訳要求が行われ、翻訳メモリ装置14はステップS201で翻訳対象文を検索キーとして対訳データベース16に設けている対訳文データベース26及び解析済み対訳文データベース28に対し検索要求を行う。
この検索要求に対し対訳データベース16は、対訳文データベース26及び解析済み対訳文データベース28の検索結果をステップS302で翻訳メモリ装置14に応答する。対訳データベース16からの応答結果が類似文であったとすると、ステップS202で翻訳対象文と検索対象文の相違点を構造解析の結果によって比較して相違点を検出する。この場合、ステップS102における機械翻訳処理において、翻訳対象文については構造の解析結果が得られていることから、改めて機械翻訳装置12に構造解析を要求する必要はない。
ステップS203では比較により検出した相違点となる語句の辞書引きを機械翻訳装置12に要求し、ステップS103で辞書引きを行って結果を翻訳メモリ装置14に返し、これを受けて翻訳メモリ装置14はステップS204で辞書引き結果を相違点の対訳文と置き換えて翻訳を行う。
この翻訳結果はインタフェース部10に送られ、ステップS4で翻訳メモリ装置14による翻訳結果、この場合には類似文翻訳文36による翻訳結果が表示される。このためステップS3の翻訳要求からステップS4の翻訳結果が表示されるまでの間の一点鎖線のブロック87で囲んだ部分の処理が、図2の類似文翻訳部36による処理に相当する。
ステップS5にあっては、ステップS2の機械翻訳装置12による翻訳結果についてユーザがその修正を行って確定すると、修正確定した翻訳結果が機械翻訳装置12に通知され、ステップS104で対訳データベースの更新要求が対訳データベース16に対し行われる。
これを受けて対訳データベース16にあっては、ステップS303で対訳データベース16の更新を行う。具体的には、翻訳結果の解析済み対訳文に基づき表現や語句を抽出し、対訳パターン辞書32や対訳語句辞書34に登録する。また確定した対訳文を対訳文データベース26に追加し、更にその解析済み対訳文を解析済み対訳文データベース28に登録する。
またインタフェース部10のステップS6で、ステップS4で得られた翻訳結果のメモリ追加要求がユーザにより行われると、翻訳メモリ装置14に対し追加要求が行われ、ステップS205で対訳データベース16に対し更新要求を行う。
この更新要求を受けて対訳データベース16にあっては、対訳文の対訳文データベース26への追加、解析済み対訳文の解析済み対訳文データベース28への追加、更に構造解析済みの対訳文から抽出した表現や語句をデータ互換処理部18でデータ形式を変換して機械翻訳装置12の対訳パターン辞書32や対訳語句辞書34に登録することで、対訳データベース16の更新を行う。
図14は、図2の本発明による翻訳支援装置に設けた構造検索部38による構造検索処理のフローチャートである。構造検索部38は、翻訳メモリ装置14の翻訳機能を支援する。即ち、翻訳メモリ装置14により対訳データベース16に対し翻訳対象文を検索キーとして似たものを検索した場合、構造的には近いにも関わらず表層的な文字列として似ていない文を検索することができない。
そこで構造検索部38にあっては、入力した翻訳対象文を機械翻訳装置12に引き渡して構造の解析を行わせ、解析済み翻訳対象文を取得し、この解析済み翻訳対象文を検索キーとして対訳データベース16における解析済み対訳文データベース28を含めて検索することで、対訳データベース16から構造が似た文を検索して出力することができ、これによって翻訳メモリ装置14の対訳データベースの検索でのマッチ文の深さを十分にとることができる。
この構造検索部38の図14の処理にあっては、まずステップS1で翻訳対象文について機械翻訳装置と連携して構造を解析し、ステップS2で解析結果を検索キーとして解析済み対訳文データベースから構造の似た文を検索してインタフェース部10に出力して表示させたり、類似文翻訳部36に対する類似文として提供して類似文翻訳を行わせることができる。
図15は、図2の表現検索部40による処理のフローチャートである。この表現検索処理にあっては、ステップS1で検索を必要とする対象語句を入力すると、この入力した対象語句を検索キーとして対訳データベース16を検索し、対象語句を含む原文とその対訳文を検索してインタフェース部10に表示する。この場合、ステップS2にあっては更に、インターネット45に対し検索キーとして対象語句を送信し、この語句や表現を含む例文を検索することもできる。
この表現検索部40の機能は例えば、ある英文を日本文に翻訳した場合、翻訳メモリ装置14で検索しても機械翻訳装置12で翻訳しても正しい翻訳結果が得られず、翻訳結果が違っていることが分かるが、翻訳対象英文の言っている表現をどのように翻訳すべきか分からない場合、表現検索部40による検索で例文が表示されることにより翻訳作業の効率を向上することができる。
図16は、図2の確信度設定部42による表示内容の説明図である。図2の翻訳メモリ装置14にあっては、翻訳結果についてその確信度が併せて表示される。これに対し機械翻訳装置12にあっては確信度は表示されない。
このため、インタフェース部10から翻訳メモリ装置14と機械翻訳装置12の両方に対し同じ翻訳対象文についての翻訳要求を行った場合、翻訳結果として2つの翻訳結果を並べて表示する場合、翻訳メモリ装置14の翻訳結果については確信度が表示されているが、機械翻訳装置12の翻訳結果については確信度の表示がなく、ユーザはどちらの翻訳結果を選択するか迷うことになる。
そこで確信度設定部42は、機械翻訳装置12の翻訳結果について確信度を付して表示する。
図16にあっては翻訳対象文88について、機械翻訳装置12により得られた出力表示部90の翻訳結果92につき機械翻訳であることを示す記号「MT」に続いて確信度設定部42で付加した確信度として100%が設けられ、その後ろに対訳文が表示される。
この出力表示部90は、翻訳メモリ装置14により得られた翻訳結果94,96のメモリ翻訳であることを示す記号「TM」の後ろに確信度として78%,42%が示され、その後ろに対象文と対訳文が表示されている。
このように出力表示部90に機械翻訳の結果と翻訳メモリによる翻訳結果が混在する場合にも、機械翻訳の翻訳結果92につき確信度設定部42で確信度が付されることで、ユーザは両者の翻訳結果につき確信度を見て翻訳候補の中から翻訳結果を適切に選択して確定することが可能となる。
図17は、図2の概要計算部46による表示内容の説明図である。概要計算部46にあっては、翻訳対象文書15を対象に、この実施形態にあっては語句、表現、更に翻訳メモリ装置14側におけるマッチ率を計算して表示する図17の頻出語リスト100にあっては、出現頻度の高い順に計算された語句がリスト表示される。また頻出表現リスト102にあっては、出現頻度の高い順に対訳パターンと同じ形式で表現がリスト表示される。更に翻訳メモリのマッチ率104として、翻訳対象文書中のマッチ文の数とマッチ率がマッチ率の高い順にリスト表示される。
このような本発明の概要計算部46による表示部98をユーザが見ることで、翻訳対象文書について予めどういう単語や表現に注意して翻訳すれば良いかが一目瞭然であり、また翻訳メモリ装置14を使用した場合の翻訳結果もマッチ率から予想でき、機械翻訳装置12と翻訳メモリ装置14の両方もしくはいずれか一方を使った翻訳作業などの選択が適切にできる。
図18は、本発明のインタフェース部10として使用される翻訳作業画面の他の実施形態の説明図である。この翻訳作業画面120にあっては、原文表示部124と訳編集部122を設けており、訳編集部122を使用して翻訳作業を進めることができる。
図19は翻訳作業画面120の作業中の一例であり、原文表示部124に翻訳対象文書が表示され、訳編集部122に構造解析された翻訳対象文書が表示される。この訳編集部122の表示につき、例えば反転部126に示すように翻訳箇所を指定すると、翻訳ウィンドウ128に確信度と共に複数の翻訳結果が表示され、例えば確信度100%の翻訳結果を選択することで、編集作業を進めながら翻訳を行うようになる。
もちろん翻訳作業画面は上記の実施形態に限定されず、必要に応じて適宜のユーザインタフェースとして最適な画面構成を作ることができる。
また本発明は翻訳支援プログラムを提供するものであり、その実施形態は図2の機械翻訳装置12及び翻訳メモリ装置14が独立したプログラムとして動作することから、それ以外のデータ互換処理部18、類似文翻訳部36を基本とした図5の対訳データベース作成処理のフローチャート及び図12の類似文翻訳処理のフローチャートを実現するプログラムとして実現される。
この翻訳支援プログラムには更に、図2の構造検索部38の機能を実現するプログラム、表現検索部40の機能を実現するプログラム、確信度設定部42の機能を実現するプログラム、要約作成部44の機能を実現するプログラム、更に概要計算部46の機能を実現するプログラムを、支援プログラムとして必要に応じて加えることができる。
なお、本発明は上記の実施形態に限定されず、その目的と利点を損なわない適宜の変形を含む。また本発明は上記の実施形態に示した数値による限定は受けない。
(付記1)翻訳対象文書の入力、翻訳文書の出力及び翻訳制御に関する入出力指示を行うインタフェース部と、ある言語の文書を他の言語の文書に翻訳する機械翻訳装置と、対訳情報を蓄積した対訳データベースと、前記対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳する作業を支援する翻訳メモリ装置と、前記機械翻訳装置で翻訳した対訳情報と前記翻訳メモリ装置で翻訳した対訳情報を共通化して相互に対訳情報としての取り込みを可能するデータ互換処理部とを備えたことを特徴とする翻訳支援装置。
(付記2)付記1記載の翻訳支援装置において、前記対訳データベースには、前記翻訳メモリ装置で使用する対訳文データベースと対訳文を形態素解析や構文解析によって解析した解析済み対訳文データベース、及び前記機械翻訳装置で使用する対訳語句と対訳パターンを登録した辞書が設けられ,前記データ互換処理部は、前記機械翻訳装置で得られた対訳文又は前記翻訳メモリ装置で得られた対訳文を修正したものを前記対訳文データベースに追加し、前記翻訳メモリ装置で得られた対訳文またはユーザが翻訳した対訳文を前記対訳文データベースに追加すると共に対訳文を解析して得た解析済み対訳文を前記解析済み対訳文データベースに追加し、更に前記解析済み対訳文から対訳語句及び又は対訳パターンを抽出して前記機械翻訳装置の辞書に追加することを特徴とする翻訳支援装置。
(付記3)付記2記載の翻訳支援装置において、更に、前記データ互換処理部は、前記解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させることを特徴とする翻訳支援装置。
(付記4)付記1記載の翻訳支援装置において、更に、前記翻訳メモリ装置に翻訳を要求した際に、入力文による前記対訳データベースの検索で類似文を検索すると共に、前記機械翻訳装置に入力文を渡して解析結果を取得し、前記対訳データベースの検索結果と前記機械翻訳装置から取得した解析結果を比較して相違する入力語句を前記機械翻訳装置に渡して対訳語句を取得して対訳類似文の相違語句を置換する類似文翻訳部を設けたことを特徴とする翻訳支援装置。
(付記5)付記1記載の翻訳支援装置において、更に、前記翻訳メモリ装置の検索入力文を前記データ互換処理部を経由して前記機械翻訳装置に渡して解析結果を取得し、該解析結果を検索キーとして前記解析済み対訳文データベースから構造の似た対訳文を検索して表示させる構造検索部を設けたことを特徴とする翻訳支援装置。
(付記6)付記1記載の翻訳支援装置において、更に、指定された用語の用例を検索して表示する表現検索部を設けたことを特徴とする翻訳支援装置。
(付記7)付記1記載の翻訳支援装置において、更に、前記翻訳メモリ装置と機械翻訳装置で同時に翻訳する際に、前記翻訳メモリ装置からの確信度を示す点数をつけた翻訳候補の出力表示に対し、前記機械翻訳装置から出力された訳文候補に確信度を示す点数を付けて表示させる確信度設定部を設けたことを特徴とする翻訳支援装置。
(付記8)付記1記載の翻訳支援装置において、更に、翻訳する前に翻訳対象文書の大意を表示する要約作成部を設けたことを特徴とする翻訳支援装置。
(付記9)付記1記載の翻訳支援装置において、更に、翻訳対象文書の文字数、単語数、表現等を含む文書情報を計算して出現頻度順に表示させる概要計算部を設けたことを特徴とする翻訳支援装置。
(付記10)付記1記載の翻訳支援装置において、前記インタフェース部が、翻訳対象文を表示する原文表示部と、翻訳した翻訳文を表示するシステム出力表示部と、編集指示を行う訳編集部とを備えたことを特徴とする翻訳支援装置。
(付記11)ある言語の文書を他の言語の文書に機械翻訳装置で翻訳し、対訳情報を蓄積した対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳メモリ装置で翻訳し、前記機械翻訳装置で翻訳した対訳情報と前記翻訳メモリ装置で翻訳した対訳情報をデータ互換可能に共通化して相互に対訳情報としての取り込むことを特徴とする翻訳支援方法。
(付記12)付記11記載の翻訳支援方法において、前記対訳データベースには、前記翻訳メモリ装置で使用する対訳文データベースと対訳文を形態素解析や構文解析などによって解析した解析済み対訳文データベース、及び前記機械翻訳装置で使用する対訳語句と対訳パターンを登録した辞書が設けられ,前記機械翻訳装置で得られた対訳文又は前記翻訳メモリ装置で得られた対訳文環修正したものを互換データに変換して対訳文データベースに追加し、前記翻訳メモリ装置で得られた対訳文またはユーザが翻訳した対訳文を前記対訳文データベースに追加すると共に対訳文を解析して得た解析済み対訳文を前記解析済み対訳文データベースに追加し、更に前記解析済み対訳文から対訳語句及び又は対訳パターンを抽出して前記機械翻訳装置の辞書に追加することを特徴とする翻訳支援方法。
(付記13)付記12記載の翻訳支援方法において、更に、前記解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させることを特徴とする翻訳支援方法。
(付記14)付記11記載の翻訳支援方法において、更に、前記翻訳メモリ装置に翻訳を要求した際に、入力文による前記対訳データベースの検索で類似文を検索すると共に、前記機械翻訳装置に入力文を渡して解析結果を取得し、前記対訳データベースの検索結果と前記機械翻訳装置から取得した解析結果を比較して相違する入力語句を前記機械翻訳装置に渡して対訳語句を取得して対訳類似文の相違語句を置換する類似文翻訳を行うことを特徴とする翻訳支援方法。
(付記15)付記11記載の翻訳支援方法において、更に、前記翻訳メモリ装置の検索入力文を前記データ互換処理部を経由して前記機械翻訳装置に渡して解析結果を取得し、該解析結果を検索キーとして前記解析済み対訳文データベースから構造の似た対訳文を検索して表示させることを特徴とする翻訳支援方法。
(付記16)付記11記載の翻訳支援方法において、更に、指定された用語の用例を検索して表示することを特徴とする翻訳支援方法。
(付記17)付記11記載の翻訳支援方法において、更に、前記翻訳メモリ装置と機械翻訳装置で同時に翻訳する際に、前記翻訳メモリ装置からの確信度を示す点数をつけた翻訳候補の出力表示に対し、前記機械翻訳装置から出力された訳文候補に確信度を示す点数を付けて表示させることを特徴とする翻訳支援方法。
(付記18)付記11記載の翻訳支援方法において、更に、翻訳する前に翻訳対象文書の大意を示す要約を表示することを特徴とする翻訳支援方法。
(付記19)付記11記載の翻訳支援方法において、更に、翻訳対象文書の文字数、単語数、表現を含む文書情報を計算して出現頻度順に表示させることを特徴とする翻訳支援方法。
(付記20)付記11記載の訳支援方法において、インタフェース部に、翻訳対象文を原文表示部を表示し、翻訳した翻訳文をシステム出力表示部に表示し、訳編集部から編集指示を行うことを特徴とする翻訳支援方法。
(付記21)コンピュータに、ある言語の文書を他の言語の文書に機械翻訳により翻訳させ、対訳情報を蓄積した対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳メモリ装置により翻訳させ、前記機械翻訳装置で翻訳した対訳情報と前記翻訳メモリ装置で翻訳した対訳情報をデータ互換可能に共通化して相互に対訳情報としての取り込むことを実行させる翻訳支援プログラム。
(付記22)付記21記載の翻訳支援プログラムにおいて、前記機械翻訳装置で得られた対訳文を互換データに変換して対訳文データベースに追加し、前記翻訳メモリ装置で得られた対訳文またはユーザが翻訳した対訳文を前記対訳文データベースに追加すると共に対訳文を解析して得た解析済み対訳文を前記解析済み対訳文データベースに追加し、更に前記解析済み対訳文から対訳語句及び又は対訳パターンを抽出して前記機械翻訳装置の辞書に追加することを前記コンピュータに実行させる翻訳支援プログラム。
(付記23)付記22記載の翻訳支援プログラムにおいて、更に、前記解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させることを前記コンピュータに実行させる翻訳支援プログラム。
(付記24)付記21記載の翻訳支援プログラムにおいて、更に、前記翻訳メモリ装置に翻訳を要求した際に、入力文による前記対訳データベースの検索で類似文を検索すると共に、前記機械翻訳装置に入力文を渡して解析結果を取得し、前記対訳ベースの検索結果と前記機械翻訳装置から取得した解析結果を比較して相違する入力語句を前記機械翻訳装置に渡して対訳語句を取得して対訳類似文の相違語句を置換することを前記コンピュータに実行させる翻訳支援プログラム。
(付記25)付記21記載の翻訳支援プログラムにおいて、更に、前記翻訳メモリ装置の検索入力文を互換データに変換して前記機械翻訳装置に渡して解析結果を取得し、該解析結果を検索キーとして前記解析済み対訳文データベースから構造の似た対訳文を検索して表示させることを前記コンピュータに実行させる翻訳支援プログラム。
(付記26)付記21記載の翻訳支援プログラムにおいて、更に、指定された用語の用例を検索して表示することを前記コンピュータに実行させる翻訳支援プログラム。
(付記27)付記21記載の翻訳支援プログラムにおいて、更に、前記翻訳メモリ装置と機械翻訳装置で同時に翻訳する際に、前記翻訳メモリ装置からの確信度を示す点数をつけた翻訳候補の出力表示に対し、前記機械翻訳装置から出力された訳文候補に確信度を示す点数を付けて表示させることを前記コンピュータに実行させる翻訳支援プログラム。
(付記28)付記21記載の翻訳支援プログラムにおいて、更に、翻訳する前に翻訳対象文書の大意を示す要約を表示することを前記コンピュータに実行させる翻訳支援プログラム。
(付記29)付記21記載の翻訳支援プログラムにおいて、更に、翻訳対象文書の文字数、単語数、表現を含む文書情報を計算して出現頻度順に表示させることを前記コンピュータに実行させる翻訳支援プログラム。
(付記30)付記21記載の訳支援方法において、インターフェース部に、翻訳対象文を原文表示部を表示し、翻訳した翻訳文をシステム出力表示部に表示し、訳編集部から編集指示を行うことを特徴とする翻訳支援方法。
(付記31)コンピュータに、ある言語の文書を他の言語の文書に機械翻訳により翻訳させ、対訳情報を蓄積した対訳データベースの検索によりある言語の文書を他の言語の文書に翻訳メモリ装置により翻訳させ、前記機械翻訳装置で翻訳した対訳情報と前記翻訳メモリ装置で翻訳した対訳情報法をデータ互換可能に共通化して相互に対訳情報としての取り込むこと、を実行させる翻訳支援プログラムを記録したコンピュータ読取可能な記録媒体。
10:インタフェース部
11:翻訳作業画面
12:機械翻訳装置
14:翻訳メモリ装置
15:翻訳対象文書(原文)
16:対訳データベース
16−1:検索データベース
18:データ互換装置
20:原文表示部
22:訳編集部
24:システム出力表示部
24−1:機械翻訳表示部
24−2:翻訳メモリ表示部
25:翻訳文書
26:対訳文データベースマッチ文表示部
28:解析済み対訳文データベース
30:機械翻訳部
32:対訳パターン辞書
34:対訳語句辞書
35:対訳データベースマッチ文表示部
36:類似文翻訳部
38:構造検索部
40:表現検索部
42:確信度設定部
44:要約作成部
45:インターネット
46:概要計算部
48:対訳文レコード
54:解析情報付き翻訳対象文
56,62:対訳語句
70:翻訳対象パターン
72:対訳パターン
74:翻訳対象文
76:類似文
80:訳文
82:解析済み単語対応データ
11:翻訳作業画面
12:機械翻訳装置
14:翻訳メモリ装置
15:翻訳対象文書(原文)
16:対訳データベース
16−1:検索データベース
18:データ互換装置
20:原文表示部
22:訳編集部
24:システム出力表示部
24−1:機械翻訳表示部
24−2:翻訳メモリ表示部
25:翻訳文書
26:対訳文データベースマッチ文表示部
28:解析済み対訳文データベース
30:機械翻訳部
32:対訳パターン辞書
34:対訳語句辞書
35:対訳データベースマッチ文表示部
36:類似文翻訳部
38:構造検索部
40:表現検索部
42:確信度設定部
44:要約作成部
45:インターネット
46:概要計算部
48:対訳文レコード
54:解析情報付き翻訳対象文
56,62:対訳語句
70:翻訳対象パターン
72:対訳パターン
74:翻訳対象文
76:類似文
80:訳文
82:解析済み単語対応データ
Claims (1)
- 翻訳対象文書の入力、翻訳文書の出力及び翻訳制御に関する入出力指示を行うインタフェース部と、
ある言語の文書を対訳パターン辞書および対訳語句辞書に基づいて他の言語の文書に翻訳する機械翻訳装置と、
前記翻訳対象文書を検索データベースに有する対訳文データベースおよび解析済み訳文データベースに基づいて前記他の言語の文書に翻訳する作業を支援する翻訳メモリ装置と、
前記翻訳メモリ装置で翻訳した対訳文またはユーザが翻訳した対訳文を解析した解析済み対訳文を前記解析済み対訳文データベースに追加し、更に前記解析済み対訳文から対訳パターンおよび対訳語句を抽出し、前記機械翻訳装置側の前記対訳パターン辞書および前記対訳語句辞書に追加し、更に前記機械翻訳装置で機械翻訳が行われユーザによる修正を経て翻訳が確定した対訳文を前記検索データベースに有する前記対訳文データベースおよび前記解析済み対訳文データベースに登録し、同時に前記機械翻訳装置側の前記対訳パターン辞書および前記対訳語句辞書に対訳パターンおよび対訳語句を追加登録することにより、前記機械翻訳装置で翻訳した対訳情報と前記翻訳メモリ装置で翻訳した対訳情報を共通化して相互に対訳情報としての取り込みを可能とするデータ互換処理部と、
を備え、
前記データ互換性処理部は、前記解析済み対訳文から自動抽出された対訳語句候補や対訳パターン候補に確信度を付して表示させることを特徴とする翻訳支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006345371A JP4113235B2 (ja) | 2006-12-22 | 2006-12-22 | 翻訳支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006345371A JP4113235B2 (ja) | 2006-12-22 | 2006-12-22 | 翻訳支援装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001078386A Division JP3969628B2 (ja) | 2001-03-19 | 2001-03-19 | 翻訳支援装置、方法及び翻訳支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007149109A true JP2007149109A (ja) | 2007-06-14 |
JP4113235B2 JP4113235B2 (ja) | 2008-07-09 |
Family
ID=38210382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006345371A Expired - Fee Related JP4113235B2 (ja) | 2006-12-22 | 2006-12-22 | 翻訳支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4113235B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009245053A (ja) * | 2008-03-31 | 2009-10-22 | Funai Electric Advanced Applied Technology Research Institute Inc | 翻訳プログラム、翻訳システム及び対訳データ生成方法 |
JP2009289219A (ja) * | 2008-05-30 | 2009-12-10 | Fuji Xerox Co Ltd | 翻訳メモリ翻訳装置および翻訳プログラム |
JP2010204819A (ja) * | 2009-03-02 | 2010-09-16 | Fujitsu Ltd | 機械翻訳装置及び機械翻訳プログラム |
JP2016071439A (ja) * | 2014-09-26 | 2016-05-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 翻訳方法及び翻訳システム |
JP2018500698A (ja) * | 2015-03-27 | 2018-01-11 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 翻訳情報の提供方法及びシステム |
CN111428523A (zh) * | 2020-03-23 | 2020-07-17 | 腾讯科技(深圳)有限公司 | 翻译语料生成方法、装置、计算机设备及存储介质 |
TWI817160B (zh) * | 2020-07-13 | 2023-10-01 | 日商日東電工股份有限公司 | 附防汙層之光學膜 |
-
2006
- 2006-12-22 JP JP2006345371A patent/JP4113235B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009245053A (ja) * | 2008-03-31 | 2009-10-22 | Funai Electric Advanced Applied Technology Research Institute Inc | 翻訳プログラム、翻訳システム及び対訳データ生成方法 |
JP2009289219A (ja) * | 2008-05-30 | 2009-12-10 | Fuji Xerox Co Ltd | 翻訳メモリ翻訳装置および翻訳プログラム |
JP2010204819A (ja) * | 2009-03-02 | 2010-09-16 | Fujitsu Ltd | 機械翻訳装置及び機械翻訳プログラム |
JP2016071439A (ja) * | 2014-09-26 | 2016-05-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 翻訳方法及び翻訳システム |
JP2018500698A (ja) * | 2015-03-27 | 2018-01-11 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 翻訳情報の提供方法及びシステム |
CN111428523A (zh) * | 2020-03-23 | 2020-07-17 | 腾讯科技(深圳)有限公司 | 翻译语料生成方法、装置、计算机设备及存储介质 |
CN111428523B (zh) * | 2020-03-23 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 翻译语料生成方法、装置、计算机设备及存储介质 |
TWI817160B (zh) * | 2020-07-13 | 2023-10-01 | 日商日東電工股份有限公司 | 附防汙層之光學膜 |
Also Published As
Publication number | Publication date |
---|---|
JP4113235B2 (ja) | 2008-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3969628B2 (ja) | 翻訳支援装置、方法及び翻訳支援プログラム | |
US10061768B2 (en) | Method and apparatus for improving a bilingual corpus, machine translation method and apparatus | |
US8594992B2 (en) | Method and system for using alignment means in matching translation | |
JP4113235B2 (ja) | 翻訳支援装置 | |
US8219381B2 (en) | Dictionary registration apparatus, dictionary registration method, and computer product | |
JP2006012168A (ja) | 翻訳メモリシステムにおいてカバレージおよび質を改良する方法 | |
JP2004038976A (ja) | 用例ベースの機械翻訳システム | |
JP2006268375A (ja) | 翻訳メモリシステム | |
JP2008083952A (ja) | 辞書作成支援システム、方法及びプログラム | |
JP2009151777A (ja) | 音声言語パラレルコーパスのアライメント方法及び装置 | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
JP2004220266A (ja) | 機械翻訳装置および機械翻訳方法 | |
KR100958340B1 (ko) | 실시간 대화식 기계 번역 장치 및 방법 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
JP5148583B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP2006228242A (ja) | 翻訳装置、翻訳プログラム及び翻訳方法 | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP4054353B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
KR20080029567A (ko) | 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 | |
JP2009116584A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2011210193A (ja) | 機械翻訳装置および機械翻訳プログラム | |
JP2011210194A (ja) | 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080410 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110418 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |