JP2006011842A - 翻訳装置および翻訳プログラム - Google Patents

翻訳装置および翻訳プログラム Download PDF

Info

Publication number
JP2006011842A
JP2006011842A JP2004188259A JP2004188259A JP2006011842A JP 2006011842 A JP2006011842 A JP 2006011842A JP 2004188259 A JP2004188259 A JP 2004188259A JP 2004188259 A JP2004188259 A JP 2004188259A JP 2006011842 A JP2006011842 A JP 2006011842A
Authority
JP
Japan
Prior art keywords
sentence
language
example sentence
translation
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004188259A
Other languages
English (en)
Other versions
JP4643183B2 (ja
Inventor
Takeshi Kutsumi
毅 九津見
Ichiko Sada
いち子 佐田
Naoko Shinozaki
直子 篠崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004188259A priority Critical patent/JP4643183B2/ja
Publication of JP2006011842A publication Critical patent/JP2006011842A/ja
Application granted granted Critical
Publication of JP4643183B2 publication Critical patent/JP4643183B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】用例データベースに基づいて自然で質のよい翻訳を行うことができる翻訳装置を提供する。
【解決手段】第1言語例文と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を判定し当該語句を原文中の前記相違箇所の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該語句に対応する訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える。
【選択図】図2

Description

この発明は、翻訳装置および翻訳プログラムに関し、より詳細には、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置および翻訳プログラムに関する。
翻訳装置として従来から広く使われている手法は、原語(第1言語)の文章を構成する規則を、訳文言語(第2言語)の規則と対応させ、規則に基づいて翻訳文(第2言語)を生成する、いわゆる規則主導型翻訳装置である。標準的な構文を持つ文章にこの手法を適用した場合は違和感のない翻訳ができるが、やや例外的な構文を持つ文章に対しては不自然な表現になりやすかった。
この欠点を改善するために、人間の翻訳成果や実際の第2言語文の用例をデータベース化して訳文生成に使用する、例文主導型もしくは蓄積例文利用型と呼ばれる翻訳支援装置が知られている。
そのような翻訳装置の一例として、用例を用例データベースに蓄積しておくと共に言語の単語を意味の類似性に基づいて木構造に階層化した辞書データベースを用い、原文(入力文)と用例の類似性を数値計算して、その数値が最小である用例を検索し、検索結果に従って翻訳する用例主導型翻訳装置が知られている(例えば、特許文献1参照)。さらに、入力文を構文単位に分割してからマッチングを行う手法が知られている(例えば、特許文献2参照)。あるいは、原文に類似する例文の訳文を編集可能に表示し、ユーザが表示された類似の訳文を編集して原文を翻訳するようにした翻訳支援装置が知られている(例えば、特許文献3参照)。また、それに基づいて第1言語と第2言語の対訳文を蓄積した対訳データベースの検索によって翻訳を行う翻訳メモリ装置を備え、機械翻訳装置で翻訳した対訳情報と翻訳メモリ装置で翻訳した対訳情報を相互に取り込んで連携させ、翻訳作業の自動化を高める翻訳支援装置が知られている(例えば、特許文献4参照)。
特許第2609173号公報 特開平10−21243号公報 特開平09−245040号公報 特開2002−278964号公報
しかしながら、用例データベースと共に木構造に階層化した辞書データベースを用いる手法は、用例と辞書との両方をデータベースとして備える必要があり、膨大なデータを作成する必要がある。このため、開発に要する作業工数とコストの面の負担が大きい。類似の例文を表示してユーザが編集する手法はユーザの負担が大きい。また、入力文を構文単位に分割する手法は、構文解析手段を必要とし、用例データベースと構文解析辞書を用意する作業工数とコストの負担が大きい。翻訳メモリ装置と機械翻訳装置を備える手法もそれらの両方を用意するための作業工数とコスト面の負担が大きい。
この発明が解決しようとする問題点は、大規模なデータベースを必要とせず、しかも用例データベースのみに基づいて自然で質のよい翻訳を自動的に行うことができる翻訳装置を提供することである。
この発明は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置を提供する。
また、この発明は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語の原文を入力する入力部と、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備える翻訳装置を提供する。
この発明の翻訳装置は、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部とを備えて合成文あるいは訳文を作成するので、合成文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて質のよい翻訳支援情報を出力することができる。
さらに、この発明の翻訳装置は、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えるので、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができ、これによって、訳文が適切でなかった場合でもユーザは例文や合成文を翻訳支援情報として得ることができる。
また、この発明の翻訳装置は、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部とを備えるので、訳文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて自然な表現の翻訳を実現することができる。従って、データベース開発に要する工数やコストが少なく、またデータベースを保持する記憶容量も小さくでき、質のよい翻訳が可能な翻訳装置を安価に提供することができる。
この発明の翻訳装置は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えることを特徴とする。
ここで、言語とは広義に解釈されるものであって、情報を伝達するための規則であれば異国語に限らず、方言や同一の言語であってもよい。あるいは、人間が会話をする言語に限らずコンピュータ処理用の言語などであってもよい。
また、例文の形態は、単文に限らず、語、句や複数の文から成るものを含んでいてもよい。
出力部からの出力は文字として表示されてもよいが、それに限らず例えば情報として記憶装置に記憶される態様や、音声などの態様であってもよい。
また、この発明の翻訳装置は、第1言語の原文を入力する入力部と、複数組の対訳例文を記憶する対訳例文記憶部と、対訳例文検索部と、相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備えることを特徴とする。
ここで、入力部からの入力はこの発明の翻訳装置が処理可能な情報に変換されるものであれば文字に限らず、例えば音声などであってもよい。
前述の翻訳装置は、単独の装置として構成されてもよいが、それに限られず、たとえばパーソナルコンピュータなどの汎用処理装置にインストールするソフトウェアとして提供され、そのソフトウェアの処理を実行することによって翻訳装置として機能するものであってもよい。
訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定するように構成されていてもよい。このようにすれば、訳語の候補が複数ある場合に、それらの候補の中から適切な訳語を選択することができる。
また、対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成されていてもよい。
さらにまた、出力された文をユーザが編集するための編集部をさらに備えていてもよい。このようにすれば、翻訳装置から出力された前記の文を参考にしながら、その内容をユーザが自由に編集することができ、ユーザの意図に沿う最終的な訳文の作成を支援することができる。
前記語句が、単語および連語であってもよい。
また、第1言語例文から当該例文の語句の構成に関する語句情報を作成し、各第1言語例文に対応する第2言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第1言語の語句と第2言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えていてもよい。このようにすれば、ユーザは、第1言語と第2言語の対応する例文を入力するだけで付加情報を入力することなく対訳例文を作成し、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いて翻訳を行うことができる。従って、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録することが容易にでき、これによって、特定分野の対訳例文を充実させるなどしてより適切な翻訳を行うことが容易にできる。
さらにまた、対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、出力部は当該語句についての検索結果を出力するように構成されていてもよい。このようにすれば、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文の作成を支援することができる。
また、この発明は、第1言語の原文を入力させる入力処理と、対訳例文記憶部に記憶された複数組の対訳例文であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第1言語例文を検索する対訳例文検索処理と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成処理と、生成された訳文を出力する出力処理とをコンピュータに実行させる翻訳プログラムを提供する。
以下、図面に示す実施形態に基づいてこの発明を詳述する。
(装置の構成例)
図1は、この発明の翻訳装置の構成の一例を示すブロック図である。
図1の入力部300は、翻訳すべき原文、処理翻訳に関する指示、訳文の編集に関する内容を入力する手段であり、例えばキーボードやマウスボタンで構成されるが、これに限らずタブレットやタッチパネルなどであってもよい。
記憶部900は、共通の意味を持つ複数言語の文と、その文を構成する語の言語間の対応とを含む用例データベースを記憶する手段である。図11は、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。対訳例文データベースの詳細については、後述する。記憶部900は、ハードディスクを用いて構成することができるが、それにかぎらずフラッシュメモリや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。また、記憶部は装置本体に着脱自在に構成されて交換可能であってもよく、本体に固定されて交換不可能であってもよい。
入力部300からの入力データもしくは指示、記憶部900から読み出したデータの処理は、CPU100によって実行される。前記の記憶部900や入力部300またはCPU100とバスなどの転送部200を介して接続されている。あるいは、転送部200は少なくともその一部にネットワークを含んでいてもよい。
翻訳メモリプログラムモジュール700は、CPU100が実行する処理のプログラムを記憶する記憶手段である。翻訳メモリプログラムモジュール700は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。
制御プログラムモジュール500は、翻訳装置が実行すべき翻訳メモリの処理以外の処理に関するプログラムが格納されている。例えば、訳文候補の文字列を編集するための処理や、入力や出力の制御に関する処理である。制御プログラムモジュール500は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。
動作用メインメモリ800は、CPUが一時的に使用するデータを記憶する高速のメモリである。メインメモリ800には、例えば、原文の内容を一時的に保持する原文バッファ810や、翻訳メモリに関するデータを保持する翻訳メモリ関連バッファ820などが含まれる。
この発明は、従来の規則主導型翻訳装置と併用することが可能であり、その場合は、機械翻訳プログラムモジュール600に規則主導型翻訳処理のプログラムがこのモジュールに格納される。点線で描いているのは、前記モジュールがこの発明の必須構成要素でないことを示すためである。また、機械翻訳プログラムモジュール600を装置に含む場合は、動作用メインメモリ800中に、図示しない規則主導型翻訳処理に関連するバッファを確保する。
出力部400は、訳文や訳文候補、編集の結果を出力する手段であり、LCDなどを用いた表示装置から構成されてもよいが、これに限らず、CRTなどの他の表示デバイスであってもよく、あるいはインクジェット方式などのプリンタ、外部の装置へデータを出力する出力I/F部が含まれていてもよい。
(データ処理の観点からの構成)
図2は、この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。図において、翻訳のための原文は、入力部300を介してユーザによって入力されるか、あるいは原文のデータが記憶された原文記憶部10から読み込まれる。これらの入力に関する指示は、ユーザ・インタフェース15によって管理される。ユーザ・インタフェース15によって、入力操作に関する画面が出力部400に表示され、ユーザは画面表示の内容から所望の入力方法を入力部300を用いて指示し、指示された内容をユーザ・インタフェース部15が判断してユーザの選択に応じた所定の処理が実行される。そして、ユーザが行った操作や翻訳の結果が出力部400に表示され、あるいは翻訳結果が翻訳結果記憶部11に格納される。
また、ユーザは出力部400に表示された翻訳結果を編集することができる。編集に関する処理は編集部40が行う。
入力された原文は、対訳例文検索処理部31に入力される。対訳例文検索処理部31は、入力された原文と類似する例文を、対訳例文記憶部51に記憶された対訳例文データベースを参照して抽出する。対訳例文データベースは、翻訳装置の中に予め用意されている用例のほかに、ユーザが登録した対訳例文を含んでいてもよい。対訳例文検索処理部31は、一定の類似度以上の例文の第1言語とそれに対応する第2言語の例文およびそれらの文を構成する語の言語間での対応に関するデータと、原文と例文との相違点に関するデータとを訳文合成・生成処理部30へ送る。
訳文合成・生成処理部30は、送られたデータに基づいて、抽出された例文の原文との相違点を第2言語で表わした文、抽出された第2言語の例文を原文との相違箇所のみ第1言語で置換した文を生成する。また、対訳例文検索処理部31を介して対訳例文データベースを参照し、前記相違箇所を補完した訳文を生成する。
このようにして生成した訳文と、前記の翻訳過程の文とをユーザ・インタフェースを介して出力部400へ出力する。
ユーザが対訳例文を登録する場合は、ユーザが入力した対訳例文は語・句対応付け処理部50へ送られる。語・句対応付け処理部50は、例文を解析して語・句の構成と対応情報を付加するために対訳辞書引き処理部52を介して対訳辞書53を参照する。このようにして語・句の構成と対応付けに関する情報を付加して対訳例文データベースと同じ形式を持つ登録対訳例文は、対訳例文記憶部51に記憶され、以降の翻訳処理では、先に記憶されている対訳例文と同様に参照される。
なお、規則主導型翻訳装置を併用する場合、その装置の翻訳辞書21を対訳辞書53と共用してもかまわない。また、機械翻訳処理部20の一部を対訳辞書引き処理部52と共用してもかまわない。
(概略の処理手順)
図3は、この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。図3に示すように、翻訳すべき原文をユーザに入力させ(Step s11)て図1の原文バッファ810に格納した後、さらに訳文を生成する指示を入力させる(Step s12)。規則主導型翻訳処理を併用する場合は、その処理を実行する(Step s13)。規則主導型翻訳装置は本願発明の必須構成要素ではなく、そのことを示すために、s13を点線で描いている。規則主導型翻訳を行わない場合、ルーチンはs12を実行した後s14へ移る。また、その処理手順は公知であるので、この明細書ではこれ以上の説明を行わない。次に、ルーチンは、対訳例文データベースを検索して訳文の合成・生成処理を行う(Step s14)。この処理の詳細は図5に記載されており、図5の説明として後述する。そして、ルーチンは、前記の処理を行った結果を出力して表示する(Step s15)。この処理の詳細については、さらに後述する。ユーザは、表示された訳文や翻訳の途中経過のデータを必要に応じて編集したり、ユーザが利用しやすい形態に変換したりする(Step s16)。この処理の詳細については、さらに後述する。
ここで、s12〜s14の処理は、必ずしも図のとおりの手順で行う必要はなく、例えばs13とs14を同時に行ってもよく、またs14をs13より先に行ってもよい。
図4は、ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。図4に示すように、第1及び第2言語を含んだ登録すべき対訳例文をユーザに入力させた(Step s31)後、さらに登録の指示を入力させる(Step s32)。指示が入力されたら、対訳例文に対する語句の構成と対応付けの情報を付加する(Step s33)。この処理によって、既に登録されている対訳例文と同じ形式に整えた後に対訳例文をデータベースに登録する(Step s34)。
(対訳例文の検索と合成・生成処理−概要)
以降の説明では、具体的な文を例に挙げながら各部の詳細な処理を説明する。ここで、「第1言語」が日本語、「第2言語」が英語であるとする。また、「△」は空白文字を表わす記号であるとする。
図5は、図3のStep s14に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。図3のStep 11でユーザによって入力された原文が、
「私の眼鏡が見つかりません。」
という日本語の文であるとする。これが図1の原文バッファ810に格納されている。図12は、前述の原文が原文バッファ810に格納された様子を模式的に示した説明図である。図12に示すように、原文は、各文字の文字位置が識別可能に構成された原文バッファ810に、13文字からなる文として格納される。ここで、原文バッファの長さは固定されておらず、例文よりも長い文も短い文も格納できる。後述する他のバッファに関しても同様である。
また、図11は、対訳例文データベースのデータ構造の一例を示す説明図である。図11は、以下のことを示している。
まず、図11(a)は、対訳例文データベースが「第1言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の日本語文(第1言語文)が、17文字からなる「私のスーツケースが見つかりません。」であることを示している。
次に、図11(b)は、対訳例文データベースが「第1言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(b)に示すように、第1言語文の単語情報データは、対訳例文データベースに含まれる前述の対訳例文の日本語文の単語区切りが「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の間の7箇所であること、文が8単語からなること、そして各単語の文字数を示している。
さらに、図11(c)は、対訳例文データベースが「第2言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の英語文(第2言語文)が「I can't find my suitcase.」の全部で25文字からなる英文であることを示している。
そして、図11(d)は、対訳例文データベースが「第2言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(d)に示すように、第2言語文は、その単語区切りが「I」「can」「't」「find」「my」「suitcase」「.」の間の6箇所であること、全部で7単語からなること、そして各単語の文字数を示している。
最後に、図11(e)は、対訳例文データベースが「対応関係データ」を含むことと、そのデータの一例を示している。図11(e)に示すように、対応関係データは、第1言語文と第2言語文との単語の対応関係が4つの組からなり、それぞれの組の対応が以下のような対応関係であることを、それぞれの単語番号を用いて示している。
「私の――が見つかりません」−「I can't find my」
(ここで、日本語文中の「――」は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である)
「私の」−「 my」
「スーツケース」−「suitcase」
「が見つかりません」−「I can't find」
図5のStep s141で示す類似文検索処理は、次の手順で行う。
(対訳例文の検索と合成・生成処理−類似文検索処理)
まず、「私の眼鏡が見つかりません。」をキーとして、日本語が類似する対訳例文を図1の対訳例文データベース51中から検索する(Step s141)。対訳例文データベース51は、例えば、第1言語「見つかりません」の語句を用いた例文として、以下の例文を記憶している。即ち、
対訳例文の例1
第1言語例文:「私のスーツケースが見つかりません。」と、
第2言語例文:「I can't find my suitcase.」の組、
対訳例文の例2
第1言語例文:「探している商品が見つかりません。」と、
第2言語例文:「I can't find the thing I want.」の組、
対訳例文の例3
第1言語例文:「ニューヨーク中電話しましたが、その本は見つかりませんでした。」と、
第2言語例文:「Although we have telephoned all over New York , we have been unable to find copies.」の組、
対訳例文の例4
第1言語例文「それが見つかるまでの間、どうにかしてもらえませんか。」と、
第2言語例文「What will you do for me until you find it?」の組
の5組である。
また、対訳例文データベース51は、第2言語「atmosphere」の語句を用いた例文として、
対訳例文の例5
第2言語例文「I like the homey atmosphere of that restaurant.」と、
第1言語例文「あのレストランの家庭的な雰囲気が好きだ」の組、
対訳例文の例6
第2言語例文「bad atmosphere engulfed the city」と、
第1言語例文「町はひどい大気に包まれた」の組、
の2組の例文を記憶している。
図29は、これらの対訳例文の例1、2のデータ構造を示す説明図である。図29に示す対訳例文の例1のデータ構造は、「第1言語文の単語情報データ」の単語区切りが、「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の8単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「I」「can」「't」「find」「my」「suitcase」「.」の7単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「私の――が見つかりません」−「I can't find my」
ここで、前述のように日本語文中の「――」は、省略記号でなく、いわば穴あき箇所を示す。
対応2: 「私の」−「 my」
対応3: 「スーツケース」−「suitcase」
対応4: 「が見つかりません」−「I can't find」
また、対訳例文の例2のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」の8単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「I」「can」「't」「find」「the」「thing」「I」「want」「.」の9単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can't find」
さらに図30は、対訳例文の例3、4のデータ構造を示す説明図である。対訳例文の例3のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「ニューヨーク」「中」「電話」「しました」「が」「、」「その」「本」「は」「見つかり」「ませ」「ん」「でした」「。」の14単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「Although」「we」「have」「telephoned」「all」「over」「New」「York」「,」「we」「have」「been」「unable」「to」「find」「copies」「.」の17単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「ニューヨーク」−「New York」
対応2: 「ニューヨーク中」−「all over New York」
対応3: 「電話し」−「telephoned」
対応4: 「電話しました」−「we have telephoned」
対応5: 「が」−「Although」
対応6: 「その本」−「copies」
対応7: 「は見つかりませんでした」−「we have been unable to find」
対応8: 「ませんでした」−「we have been unable to」
また、対訳例文の例4のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「それ」「が」「見つかる」「まで」「の」「間」「どうにか」「して」「もらえませんか」「。」の10単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「What」「will」「you」「do」「for」「me」「until」「you」「find」「it」「?」の11単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「それ」−「it」
対応2: 「が見つかるまでの間」−「until you find」
対応3: 「てもらえませんか」−「will you」
対応4: 「どうにかしてもらえませんか」―「What will you do for me」
さらに図31は、対訳例文の例5、6のデータ構造を示す説明図である。対訳例文の例5のデータ構造は、「第2言語文の単語情報データ」の単語区切りが「I」「like」「the」「homey」「atmosphere」「of」「that」「restaurant」「.」の9単語であり、「第1言語の単語情報データ」は、単語区切りが「あの」「レストラン」「の」「家庭的な」「雰囲気」「が」「好き」「だ」「。」の9単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「I like」−「が好きだ」
対応2: 「homey」−「家庭的な」
対応3: 「atmosphere」−「雰囲気」
対応4: 「of that restaurant」−「あのレストランの」
対応5: 「restaurant」−「レストラン」
また、対訳例文の例6のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「Bad」「atmosphere」「engulfed」「the」「city」「.」の6単語であり、「第2言語の単語情報データ」は、単語区切りが「町」「は」「ひどい」「大気」「に」「包まれた」「。」の7単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「Bad」−「ひどい」
対応2: 「atmosphere」−「大気」
対応3: 「the city」−「町」
図6は、この類似文検索処理(Step s141)の詳細な手順の一例を示すフローチャートである。図6に示すように、ルーチンは、対訳例文データベース51から一組の対訳例文を読み込んで(Step s1411)、その対訳例文と原文との類似度を求める(Step s1412)。類似文の検索は公知の技術を用いて実現することができる。また、原文と例文との類似度も、公知の方法で求められるので、ここでは、これ以上の説明は行わない。そして、求めた類似度が所定の値(閾値)以上であるかどうかを調べ(Step s1413)、閾値以上である場合は、読み込んだ対訳例文を対訳例文検索結果バッファ822に格納する。その後、ルーチンはStep s1415へ進む。一方、求めた類似度が所定の値未満であった場合は、前述の処理を行わずにStep s1415へ進む。Step s1415では、まだ読み込んでいない対訳例文があるかどうかを調べ、読み込んでいない対訳例文がある場合、ルーチンは、次に読み込む一組の対訳例文を選択してから最初のStep s1411へ戻り、選択した対訳例文に関して前述の処理を繰り返す。このように、すべての対訳例文をチェックし、残りの対訳例文がなくなった場合、ルーチンは類似文検索処理を終了し、図5のStep s142へと進む。
図14は、検索された対訳例文を格納する対訳例文検索結果バッファ822の例を示す説明図である。図14では、2つの検索結果が対訳例文検索結果バッファ822に格納されている。そのうちの1つ目の第1言語文は、「私のスーツケースが見つかりません。」であり、2つ目の第1言語文は「探している商品が見つかりません。」である。これらのデータの他に、第1言語の単語情報、第2言語文、第2言語の単語情報が対訳例文データベースからコピーされて格納され、さらに前述の類似文検索処理で求めた原文と対訳例文との類似度が格納される。
ここで、原文と検索する対訳例文との類似度判定の閾値を下げると、「見つかりません」の語句を有する前記対訳例文の例3の「ニューヨーク中電話しましたが、その本は見つかりませんでした。」や、対訳例文の例4の「それが見つかるまでの間、どうにかしてもらえませんか。」が検索される。ここでは、かかる類似度の閾値を「50%」と設定しており、類似度「87%」の対訳例文の例1の「私のスーツケースが見つかりません。」と類似度「58%」の対訳例文の例2の「探している商品が見つかりません。」の2文が検索の結果として得られる。
(対訳例文の検索と合成・生成処理−第1言語相違箇所決定処理)
次に、ルーチンは、第1言語における相違箇所を決定する(図5のStep s142)。図7は、この第1言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図7に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1421)。そして、処理対象とする類似対訳の第1言語文と、原文との相違箇所を判定する(Step s1422)。相違箇所の判定は、公知の技術を用いて実現することができる。
相違箇所の決定後、ルーチンはStep s1423へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ(Step s1423)、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1424)相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第1言語相違箇所決定処理を終了し、図5のStep s143へと進む。
図15は、前述の処理によって決定された第1言語の相違箇所の結果を格納する相違箇所データバッファ825のデータ構造とデータの一例を示す説明図である。相違箇所データバッファ825は、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図15は、以下のことを示している。
入力文「私の眼鏡が見つかりません。」と、検索結果1の対訳候補の日本語文「私のスーツケースが見つかりません。」の、第1番目の相違箇所について、
「相違箇所番号」は、原文と類似対訳との相違箇所が1箇所であることを示している。
「入力文文字位置」と「入力文文字数」とは、原文「私の眼鏡が見つかりません。」と類似対訳との相違箇所は、原文の3番目の文字から2文字である。そして、図12の原文バッファ810を参照することにより、相違箇所は「眼鏡」であることがわかる。
「第1言語文単語番号」と「第1言語文単語数」とは、対訳候補の日本語文「私のスーツケースが見つかりません。」における相違箇所が、3番目の単語から1単語であることを示している。そして、図14の「検索結果1」の「第1言語文の単語情報バッファ」ならびに「第1言語文バッファ」を参照することにより、相違箇所は「スーツケース」であることがわかる。
なお、図15の例では、入力文「私の眼鏡が見つかりません。」と検索結果1の対訳候補の日本語文「私のスーツケースが見つかりません。」との相違箇所の個数は、1カ所だけであるので、相違箇所データバッファ825のデータ列数は1列である。一般に、相違箇所が複数有る場合はこのデータ列数が複数になり、「相違箇所番号」は1から1ずつ昇順の整数の値をとる。
(対訳例文の検索と合成・生成処理−第2言語相違箇所決定処理)
続いて、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を決定する(図5のStep s143)。
図8は、この第2言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図8に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1431)。そして、処理対象とする類似対訳の第1言語文の相違箇所に対応する第2言語文の相違箇所を判定する(Step s1432)。相違箇所の判定は、第1言語の相違箇所を示す相違箇所データバッファ825の内容、第1言語文と第2言語文との語の対応関係を示す対応関係バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
相違箇所の判定後、ルーチンはStep s1433へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1434)相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第2言語相違箇所決定処理を終了し、図5のStep s144へと進む。
図16は、前述の処理によって決定された第2言語の相違箇所を第1言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファ823のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図16は、以下のことを示している。
「対訳例文単語番号」の欄は、対訳候補の英語文「I can't find my suitcase.」における相違箇所は、6番目の単語から1単語「suitcase」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が、原文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であるが、ある単語番号の単語が第1言語(原語)のものであることと、その単語番号の「相違箇所番号」の欄に有効な値が格納されていること、すなわち対訳の第2言語文に第1言語が合成されていることとは同じことなので、「言語フラグ」と「相違箇所番号」の両欄を兼用させてもよい。
(対訳例文の検索と合成・生成処理−合成文作成処理)
次に、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を原文(第1言語)で置換した合成文を作成する(図5のStep s144)。
図9は、この第2言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。図9に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1441)。そして、処理対象とする類似対訳の第2言語文の相違箇所に原文の語をあてはめた合成文を作成する(Step s1442)。相違箇所の置換は、原文に対する類似対訳の第2言語における相違箇所を示す合成単語情報バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
合成文作成後、ルーチンはStep s1443へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1444)合成文の作成を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第2言語合成文の作成処理を終了し、図5のStep s145へと進む。
図16に、合成された文を格納する合成文バッファ823のデータ構造とデータの一例を示す。図16の合成文バッファ823は、以下のことを示している。
「対訳例文文字番号」の欄は、対訳候補の英語(第2言語)文「I can't find my suitcase.」における相違箇所が、17番目と18番目であり、19番目の文字は、対訳例文の第2言語文の25番目の文字であることを示している。
「相違箇所番号」の欄は、17,18番目の文字の相違箇所が、入力文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であり、17,18番目の文字が第1言語であり、その他の文字は第2言語であることを示している。
(対訳例文の検索と合成・生成処理−第2言語文生成処理)
最後に、ルーチンは、合成文の第1言語を適切な第2言語に置換した訳文を生成する(図5のStep S145)。
図10は、合成文の第1言語を適切な第2言語に置換する第2言語文生成処理の詳細な手順の一例を示すフローチャートである。図10に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1451)。そして、処理対象とする合成文の第1言語の合成箇所に適当な第2言語の語をあてはめた第2言語文を作成する(Step s1452)。ここで、合成文の第1言語の合成箇所に適当な第2言語の語をあてはめるために、相違箇所の第1言語、即ち「眼鏡」の語について対訳例文の検索をおこなう。検索した結果から、もっとも適切な語を判定し、それに対応する第2言語の語を合成文に当てはめる。この例では「眼鏡」の語であるが、複数の語からなる句であってもよい。この処理の詳細については、後述する。
合成文作成後、ルーチンはStep s1453へ進み、検索された全ての合成文に対して第2言語文の生成を行ったかどうかを調べ、また生成していない合成文がある場合、ルーチンは、次の類似対訳を選択して(Step s1454)第2言語文の作成を繰り返す。全ての類似対訳について第2言語文の生成を行った場合、ルーチンは第2言語文生成処理を終了し、図5のStep s145、即ち図1のStep s14の処理を終了してStep s15の処理へ進む。
図17は、前述の処理によって第2言語文を生成するために用いる相違箇所第1言語単語バッファ、相違箇所言語変換結果バッファおよび生成された第2言語文を格納する生成文バッファ824のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図17は、以下のことを示している。
まず、相違箇所第1言語単語バッファの「文字」欄は、入力文と検索結果1との第1の相違箇所が「眼鏡」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が第1の相違箇所であることを示している。さらに、「合成文単語番号」の欄は、前記の合成文単語情報バッファの相違箇所番号欄から合成文の単語番号の「6」が相違箇所であることを求め、その結果を格納している。また、前述のように相違箇所の第1言語「眼鏡」の語について対訳例文データベースの検索を行った結果、対応する第2言語の適切な表現が「glasses」であると得られた場合に、その結果を相違箇所言語変換結果バッファに格納している。そして、図16の合成文単語情報バッファの内容と前述の相違箇所言語変換結果バッファの内容とから、第2言語文を求め、その結果を図17の生成文バッファ824に格納する。あるいは、相違箇所言語変換結果バッファの内容のままでなく、活用形を適用して第2言語文を生成するようにしてもよい。そのような活用形は、言語処理に関する解析手法を用いて導出することができる。
生成文バッファ824の内容は、以下のことを示している。
「文字」欄は、第2言語生成文が「I can't find my glasses.」であることを示している。
「言語フラグ」欄は、第2言語合成文の第17〜25文字の「glasses」が、原文との相違箇所に由来することを示している。
「相違箇所番号」の欄は、第2言語合成文の第17〜25文字の「glasses」が、図14の相違箇所データバッファ825に示す第1番目の相違箇所に由来することを示している。
「対訳例文文字番号」の欄によれば、第2言語生成文のうち、第1〜16文字の「I can't find my 」と、第24文字の「.」が、図14の検索結果1の第2言語文バッファ中の第1〜第16文字と、第25文字に由来することを示している。
「言語フラグ」欄と「相違箇所番号」欄は、第2言語生成文を表示する際に、相違箇所を異なった態様で示すための情報として用いることができる。
以上が、図3のフローチャートのs14に示した対訳例文検索・合成・生成処理の詳細な処理手順の説明である。
(結果表示処理)
次に、ルーチンは図3のフローチャートのs15に示す結果表示処理を実行する。
図18は、結果表示の態様の一例を示す説明図である。g110の対訳検索結果表示部は、この発明の翻訳装置の原文、翻訳の途中経過および結果を表示する領域である。対訳検索結果表示部g110中、g111の表示「私の眼鏡が見つかりません。」は、図12の原文バッファ810の内容が表示されたものである。また、g112の「私のスーツケースが見つかりません。」は、図14に示す検索結果1の第1言語文バッファの内容が表示されたものである。g113の「I can’t find my suitcase.」は、図14に示す検索結果1の第2言語文バッファの検索結果1が表示されたものである。また、g114の「I can’t find my 眼鏡.」は、図16に示す第1検索結果の合成文バッファ823の内容が表示されたものである。そして、g115の「I can’t find my glasses.」は、図17の生成文バッファ824の内容が表示されたものである。
また、これらの下に以下の内容が表示されている
私の眼鏡が見つかりません。
探している商品が見つかりません。
I can’t find the thing I want.
I can’t find 私の眼鏡.
I can’t find my glasses.
これらの表示は、図14に示す検索結果2の対訳例文に関する内容であり、各表示は、前述した検索結果1の対訳例文に関する表示g111〜g115に対応するものである。
ユーザは、入力文に対する各結果に関して、上記の5種類の文を表示するか否かを個別に選択することができる。図18の出力画面例は、上記の5つの文すべてを表示した場合の例である。これに対し、図21は、上記の1〜3番目の文のみを表示し、4、5番目の文は表示させないようにした出力画面例を示す説明図である。各文の表示・非表示は、処理結果表示フラグバッファ850の各欄の値によって決定される。その例を図19に示す。図19は、「原文」、「第1言語文」、「第2言語文」、の欄の値が表示され、「第2言語合成文」、「第2言語生成文」の欄の値が「非表示」になっているので、それに対応して、1から3番目のみが表示されて図21のような画面が表示される。
処理結果表示フラグバッファ850の初期値は、本装置の動作開始時に、所定の値に定められてもよいし、ユーザがその値を変更できるように構成されてもよい。
図20は、結果表示処理(図3のStep s15の処理)の詳細を示すフローチャートである。図18の出力画面例にある各文の表示選択指示欄(g121, g122, g123, g124, g125)をユーザが操作した際の処理を表している。なお、以下の説明並びにフローチャート中に「クリック」とあるのは、装置の設計の一例であって、他の操作法であってもかまわない。
まず、その時点における処理結果表示フラグバッファの各欄の値に基づいて、各検索結果におけるg111〜g115の各文の表示・非表示を決定する(s1502〜s1511)、そして、決定した内容に従って画面の描画を行う(s1514)。
描画処理を終えたら、ルーチンは、ユーザの操作待ちで待機する(s1515)。図18の表示選択指示欄のいずれか(g121, g122, g123, g124, g125)がユーザによってクリックされると、それに応じて処理結果表示フラグバッファ850の内容が変更され、処理結果表示フラグバッファ850が再チェックされて各文の表示・非表示が決め直され、出力画面が再描画される。ユーザの操作待ち状態から、この状態を脱するような操作がユーザによってなされる(s1516)(たとえば、ウィンドウが閉じられるなど)まで、この状態が続く。このような処理によって、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができる。
以上が、図3のStep s15の結果表示処理の詳細な処理手順の説明である。
(表示内容の編集)
次に、ルーチンは図3のStep s16に示す表示内容の編集処理を実行する。図23は、この表示内容の編集処理の際の表示態様の一例を示す説明図である。この処理は、図18や図21のように対訳例文検索結果が表示され、あるいは併用する機械翻訳の結果が表示されている状態から、所望に応じてユーザが表示内容を編集することができる機能を提供する。
図22は、ユーザによる編集・利用に関する処理(図3のStep s16)の詳細を示すフローチャートである。
このモードの処理に入ると、まず、翻訳結果の一例として、前述の検索結果1の第2言語生成文「I can’t find my glasses.」が、g102(出力結果表示・編集部)に転写されて(s1601)ユーザの操作待ち状態(Step s1602)に入る。なお、この初期動作は、この発明の翻訳装置の一実施形態であって、これに限るものではない。
ユーザの操作待ち状態においては、操作に応じて以下のような動作がなされる。
図18に示すg110(対訳検索結果表示部)内をクリックした場合、ルーチンはStep s1603へ進み、クリックした位置にある文を強調表示する(Step s1604)。なお、その時点で、クリックした位置にある文以外の文が既に強調表示されている場合は、その文を通常表示に戻す。すなわち、g110領域内で強調表示される文は1文のみに制御される。そしてユーザの操作待ち状態に戻る。
また、図18のg132(対訳検索結果の転写指示ボタン)をクリックした場合、ルーチンはs1605へ進み、g110領域内で強調表示されている文を、g102(出力結果表示・編集部)の領域に追加的に転写する(Step s1606)。そしてユーザの操作待ち状態に戻る。
あるいは、図18のg131(機械翻訳結果の転写指示ボタン)をクリックした場合、ルーチンはs1607へ進み、g103領域に表示されている機械翻訳結果の文字列(図13の機械翻訳文バッファ830に格納されている内容)を、g102の領域に追加的に転写する(Step s1608)。 そしてユーザの操作待ち状態に戻る。
あるいはまた、図18のg102(出力結果表示・編集部)の領域内をクリックした場合、ルーチンはStep s1609へ進み、g102の領域がテキストエディタとして動作するようになる(Step s1610)。そして、ユーザは、既に存在している文を参考にしながら、その内容を自由に編集することができる。テキストエディタの動作の詳細は公知の技術であるので詳細な説明は略す。ここで、g102の領域外のどこかをユーザがクリックすれば、テキストエディタモードを抜け、ユーザの待ち状態に戻る。
また、図18のg133(出力結果確定指示ボタン)をクリックした場合、ルーチンはs1611へ進み、その時点でg102(出力結果表示・編集部)領域に存在している文字列を確定させる。たとえば、クリップボードにコピーしたり、連動して動く他のアプリケーションプログラムに入力したりする(Step s1612)。そして編集動作を終了する。
図23は、図21の状態から、図20に示すg132(機械翻訳結果の転写指示ボタン)をクリックした後の状態を示す説明図である。これによって、g103(機械翻訳結果表示部)の領域に表示されている機械翻訳文「My glasses aren’t found.」が、g102(出力結果表示・編集部)に元からあった第2言語生成文「I can’t find my glasses.」の後に追加された状態を示している。
この機能によって、ユーザは、機械が提示する情報を利用しながら編集を行うことにより最終的な訳文を作成することもできる。訳文が適切で、編集の必要がなければこの機能を利用する必要はない。
(語・句検索モードへの自動移行)
前述したような処理を行うことによって、対訳例文データベースを用いた翻訳を行うことができるが、入力した原文と類似する対訳例文を対訳例文データベースから検索した際に、所定の閾値以上の類似度を持つ例文が存在しなかった場合が考えられる。このような場合に、入力文を語・句に分割して、分割された各々の語・句について対訳例文データベースを検索し、その結果を出力させるようにしてもよい。これによって、最適な訳文が見つからなかった場合でも、参考情報を出力してユーザの翻訳を支援することができる。
図24は、このような機能を含む翻訳装置の全体の処理を示すフローチャートである。図24に示す処理のうち、Step s205の分岐の左側の処理の流れ、すなわち、START→s201→s202→s203→s204→s205→s211→s212→s213→s214→s215→s216に至る流れは、前述の説明と同様に、入力された原文と類似の文を対訳例文データベースから検索して、その結果に基づいて訳文を生成するものである。すなわち、s201は図3のs11、s202は図3のs12、s203は図3のs13、s204は図5のs141に、それぞれ相当する。また、s205の判定は、図6のStep s1412の類似度判定と同様であり、また、図6に示す処理のようにすべての対訳文について順次検索処理を行う。そして、入力文との類似度がある閾値以上の対訳例文が、1組も存在しない場合、ルーチンはs221に進むが、1組以上存在した場合は、ルーチンはs211へ進む。s211は図5のs142、s212は図5のs143、s213は図5のs144、s214は図5のs145、s215は図3のs15、s216は図3のs16に、それぞれ相当する。
以下、図24に示す処理で入力文との類似度がある閾値以上の対訳例文が1組も存在しない場合の処理について、説明する。今、入力された原文が「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」であるとし、この入力文に対して類似度がある閾値以上の対訳例文が1組も存在しないとする。その場合、Step s205での判定で、ルーチンはStep s221に進み、前記の原文を語・句に分割する。分割の具体的な判定方法としては、たとえば形態素解析手段(公知技術)と単語辞書とを用いる方法がある。この場合、辞書が必要になるが、その辞書は、第1言語の単言語辞書でよく、対訳辞書である必要はない。たとえば入力文が日本語の場合、日本語の単語を集積し整理したものでよく、日本語の見出しに英語の訳語がついている必要はない。あるいは、他の方法として、スペースの位置で区切る方法がある。この場合、辞書が不要であり、英語などのように、単語間にスペースを空けて書く言語の場合に使うことができる。さらに、上記の2つの方法と異なる手法として、文字種が切り替わる位置で区切る方法がある。この場合も、辞書は不要である。たとえば日本語の場合、文字種を漢字・ひらがな・カタカナ・英字・数字・記号などに分類した場合の、文字種の異なっている文字境界で区切る。日本語のように、使われる文字が大まかに何種類かに大別され、それぞれの文字種の使われ方に一定の傾向があるような言語の場合に使うことができる。
このようにして、原文を語・句に分割し、これらの日本語(第1言語)の語・句のうち、検索して意味のあるものを用いて、対訳例文データベースが検索し(Step s222)、検索した語・句を第1言語に含む対訳例文を検索結果として得る。ここで、たとえば日本語の文を語・句に分割する方法や、それらの語・句から検索して意味のあるものを選択する方法、日本語文を格納したデータベースを日本語の語・句によって検索する方法は公知の技術を用いて実現することができる。
そして、前記の検索結果を出力する(Step s223)。図25及び図26は、検索結果の出力態様の一例を示す説明図である。図25は、前述の図18と同様のウインドウであるが、入力文との類似度がある閾値以上の対訳例文が存在しないので、その旨が対訳検索結果表示部に表示されている状態を示している。また、出力結果表示・編集部には、《検索結果1》の《第2言語生成文》の代わりに、併用する機械翻訳処理による訳文「Recently, we introduced the new model of the electronic dictionary in the market.」が自動的に転写されている。ただし、これはあくまでも本装置の設計の一例であり、他にも様々な処理方針が考えられる。そして、同時に図26のような画面が、たとえば、マルチウィンドウシステムを用いて表示される。図26の画面には、原文から分割された語・句と、それを用いて検索された対訳例文が表示されている。図26の、語・句検索モードの出力画面例において、g201(入力文表示部)領域には、入力された原文「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」が自動的に転写されている。g204の検索結果表示部およびg207の検索語句リスト表示部には、入力文から分割された語・句(g205及びg207)が表示されている。これらのg205またはg207の語・句をクリックすると、g204の領域におけるそれらの語・句の下側に、g206に示すように、それらの語・句によって検索された対訳例文が表示される。
また、g201の入力文表示部は、ユーザが編集することも可能であり、ユーザによって書き換えられた文に基づいて語・句に分割して対訳例文を検索することも可能である。その場合には、g202の検索指示ボタンをクリックすることにより、改めて語・句による検索の指示を明示的に行う。
g204の領域では、対訳例文が表示されている際に、対訳例文が表示されている箇所をクリックすると、その箇所の対訳例文が強調表示される。強調表示される対訳例文は高々1組であり、ある対訳例文が強調表示されている時に、別の対訳例文の箇所がクリックされれば、新たにクリックされた箇所の対訳例文が強調表示され、それまで強調表示されていた対訳例文は通常表示に戻る。
前述のように検索結果の表示を行った後、ユーザにこれらの検索結果を編集させ、あるいは編集せずにその一部または全部を利用させるための処理を実行する(Step s224)。すなわち、図26の語・句検索モードの出力画面において、g204の領域内のある対訳例文が強調表示されている際に、g203の「検索結果の転写指示ボタン」をクリックすると、そのとき強調表示されている対訳例文の第2言語文が、図25の画面の出力結果表示・編集部に追加的に転写され、同時に図26の語・句検索モードの出力画面が閉じられる。その結果、元の出力画面は図27のようになる。図27の画面では、出力結果表示・編集部には、機械翻訳文「Recently, we introduced the new model of the electronic dictionary in the market.」に加えて、語・句により検索された文「I’d like to show you our new line of electronic goods.」が格納されている。図27の画面で、ユーザは、出力結果表示・編集部に表示された文を元に、編集をすることができる。
前述の機能により、この発明の翻訳装置は、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文(第2言語)の作成を支援することができる。
なお、前述した処理は、あくまでもこの発明の翻訳装置における一つの実施形態であり、たとえば、g207の検索語句リスト表示部をg204と別に設けることをせず、検索結果と検索語句リストと一つの表示部に表示するなど、種々の異なる実施形態が考えられる。そして、それらの態様は、この発明の範疇に含まれる。
(ユーザによる対訳例文の登録)
この発明の翻訳装置は、翻訳に用いる対訳例文をユーザが登録でき、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いた翻訳を行うことができる。これにより、ユーザは、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録したりでき、これによって特定の分野の対訳例文を充実させて翻訳をより適切に行うことができる。
また、この発明によれば、新規の対訳例文をユーザ登録する際に、ユーザに登録させた複数言語の文の組を単に文として登録するだけでなく、各言語の文をそれぞれの語・句に分割し、分割された語・句の言語間の対応付けを行い、それらの語・句の分割および対応付けに関する情報を付加して登録する。従って、ユーザ登録された対訳例文は、予め登録されている対訳例文と同じ情報を有し、予め登録されている対訳例文に対して何ら遜色なく、翻訳に利用され、質のよい翻訳が提供される。
図4は、ユーザによる対訳例文の登録の処理の流れを示すフローチャートである。図4に示すように、まずユーザによって新規の対訳例文が入力される(Step s31)。 図2でいうと、ユーザ・インタフェース15の制御のもと、入力部300または原文ファイル10から、対訳例文が入力される。
いま、登録しようとする対訳例文の組が、2つの言語からなり、
第1言語文(日本語):探している商品が見つかりません。
第2言語文(英語): I can’t find the thing I want.
であるとする。もっとも、入力される対訳例文は、このように対応する複数言語の文の文字列(いわゆるプレーンテキスト)に限られるものではなく、他の「翻訳メモリ」装置(例文検索型翻訳支援装置)で用いられている対訳例文のデータ形式をそのまま取り込む機能を含んでいてもよい。
対訳例文の入力の後、ユーザにより「登録」の指示がされる(Step s32)。図2でいうと、ユーザ・インタフェース15の制御のもと、入力部300から登録指示が入力される。
そして、ユーザの登録指示に応じて、入力された対訳例文を、文を構成する語・句に分割し、分割した語・句について言語間の対応付けの処理を行う(Step s33)。本実施例における対訳例文それぞれの語・句への分割、及び対訳例文相互の語・句の対応付け処理は、図2に示すように、語・句対応付け処理部50が、対訳辞書53およびそれを検索するための対訳辞書引き処理部52を用いて行う。
今、登録しようとする対訳例文が前述の文の組であるので、語・句対応付け処理部50が、まず、これらの文を以下のような語に分割する。
第1言語文(日本語):「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」
第2言語文(英語): 「I」「can」「’t」「find」「the」「thing」「I」「want」「.」
そして、言語間の語・句の対応情報を、以下のように決する。
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can’t find」
対応5: 「探している――が見つかりません」−「I can’t find ―― I want」
ここで、文中の「――」で示した箇所は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である。
入力された対訳例文と、前述の処理とによって得られる語・句情報ならびに語・句の対応に関する情報から、図14の検索結果2に示した各バッファのうち、「入力文との類似度バッファ」を除くバッファに格納する情報がすべて得られる。
前述の語・句対応付け処理の後、対訳例文の登録を行う(Step s34)。図2でいうと、対訳例文データベース51に、前述の対訳例文及びそれに付加する語・句情報や語・句の対応情報を登録する。これらの各情報を格納するバッファと、その内容は図14の検索結果2に示すとおりである。ただし、図14の検索結果2中の「入力文との類似度バッファ」は除く。
なお、この実施例の説明では、ユーザが入力した対訳文の語・句を分割し、分割した語・句を言語間で対応付ける手段として、対訳辞書53およびそれを検索する対訳辞書引き処理部52を用いるようにしたが、対訳文の語・句の対応付けの手段はこれに限られるものではない。たとえば、既に対訳例文データベースに登録されている語・句対応付け済みの対訳例文から情報を獲得して、新規に入力した対訳例文の語・句対応付けを行うという方法も考えられる。また、機械翻訳を併用する場合、語・句対応付け処理部50、対訳辞書引き処理部52および対訳辞書53の一部を機械翻訳処理と共用するように構成してもよい。
(適切な訳語選択による訳文生成)
この発明の例文主導型翻訳装置は、図2の訳文合成・生成処理部30が、合成文の相違箇所である第1言語の語・句を第2言語に置換する。この処理は、図5のフローチャートにおいてはStep s145の処理で示されている。この第2言語への置換、即ち訳文生成処理は、置換すべき適切な訳語を選択する高度なものである。この処理に関して、さらに説明する。
以下の説明においては、原語(第1言語)が英語、第2言語が日本語の場合であって、入力された原文が、
That restaurant offers a good atmosphere.
の場合を例にあげて説明する。これは、説明のための一例であって、他の文であっても、第1言語が日本語で第2原語が英語の場合であっても、あるいはそのいずれか一方または両方が日本語および英語以外の言語であってもかまわない。
この原文に類似する対訳例文の検索結果として、以下の対訳例文の組が挙がったとする。
第1言語(英語): That restaurant offers a good service.
第2言語(日本語): そのレストランはサービスがいい。
この場合、第1言語相違箇所の決定処理(図5のStep s142)の結果、原文と対訳例文の第1言語における相違箇所は、原文では「atmosphere」であり、対訳例文の第1言語文では「service」であると判定される。
そして、その後の第2言語相違箇所の決定処理(図5のStep s143)では、対訳例文の第2言語文における相違箇所が「サービス」であると判定される。以上の処理がなされた状態で、第2言語合成文の合成処理(図5のStep S144)を行い、合成文として
「そのレストランはatmosphereがいい。」
を得る。
第2言語生成文の生成処理(図5のStep s145)では、合成文のうち第1言語
(英語)が挿入された相違箇所「atmosphere」を第2言語(日本語)に変換する。前述の
ように、図2の訳文合成・生成処理部30は、相違箇所の「atmosphere」をキーワードに
対訳例文データベース51を検索する。いま、検索の結果、「atmosphere」を含む対訳例文
の組として、以下のような例を含む対訳例文の組が複数個見いだされたとする。

前記の対訳例文の例5
英語例文 「I like the homey atmosphere of that restaurant. 」と
日本語例文「あのレストランの家庭的な雰囲気が好きだ。」の組

前記の対訳例文の例6
英語例文 「bad atmosphere engulfed the city」と、
日本語例文「町はひどい大気に包まれた」の組、

そして、図31に示した、これらの対訳例文のデータに含まれている対応関係データによって、
対訳例文の例5では「atmosphere」−「雰囲気」が対応づけられていることがわかり、
対訳例文の例6では「atmosphere」−「大気」が対応づけられていることがわかる。
このようにして、「atmosphere」に対応する日本語として「雰囲気」と「大気」とが見出されたとする。訳文合成・生成処理部30は、これらの検索結果の日本語表現中、最も適切な語を選んでひとつの語に決定する必要がある。これを実現するために、訳文合成・生成処理部30は、次の処理を行う。
上記のように、検索した対訳例文の第1言語(英語)文について、入力文にある他の単語(例えば「restaurant」、「offers」および「good」)との共起の度合いを求める。ここで、共起の対象となる語は、原文に含まれるすべての語であってもよいが、所定の規則に従って対象とする語を絞り込むようにしてもよい。その詳細については、後述する。
前述のようにして共起の度合いを求めた結果、「atmosphere」−「雰囲気」が対応づけられている対訳例文の方が、入力文にある単語と共起度が高いと算出されたとする。この場合、合成文の相違箇所「atmosphere」を置換する訳語は、「雰囲気」であると判定され、その結果生成される第2言語の訳文は、
「そのレストランは雰囲気がいい。」
が得られる。
この機能によって、この発明の翻訳装置は、原文と対訳例文との相違箇所を置換すべき第2言語の候補が複数あっても、それらの候補の中から適切な訳語を選択することができる。
ここで、共起の対象となる語を絞り込む規則を以下に説明する。たとえば、共起の度合いを調べる上で対象から除外すべき語を予め定義しておくことができる。この実施例のように、第1言語が英語の場合、冠詞、代名詞、助動詞、be動詞、前置詞などの品詞を除外対象とすればよい。このような語は、語単独で独立した意味をもつことが少ないからである。図28は、除外対象語のリストの一例を示す説明図である。図28のような除外対象語のリストを作成しておき、原文の語にこれらが含まれる場合、それらの語を除いて共起の度合いを調べるようにすれば、訳文生成のための処理の量を減らすことができる。
この発明の翻訳装置の構成の一例を示すブロック図である。 この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。 この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。 ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。 図3のStep s14に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。 この発明の実施形態において、類似文検索処理の手順の一例を示すフローチャートである。 この発明の実施形態において、第1言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。 この発明の実施形態において、第2言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。 この発明の実施形態において、第2言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。 この発明の実施形態において、合成文の第1言語を適切な第2言語に置換する第2言語文生成処理の詳細な手順の一例を示すフローチャートである。 この発明の翻訳装置において、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。 原文を格納する原文バッファの構造を模式的に示した説明図である。 この発明の翻訳装置における機械翻訳文バッファの構造を模式的に示した説明図である。 この発明の翻訳装置において、検索された対訳例文を格納する対訳例文検索結果バッファの構造を示す説明図である。 この発明の翻訳装置において、第1言語の相違箇所の結果を格納する相違箇所データバッファの構造を示す説明図である。 第2言語の相違箇所を第1言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファの構造を示す説明図である。 第2言語文を生成するために用いる相違箇所第1言語単語バッファと、相違箇所言語変換結果バッファおよび生成された第2言語文を格納する生成文バッファの構造を示す説明図である。 この発明の翻訳装置における、結果表示の態様の一例を示す説明図である。 この発明の翻訳装置における、結果表示の態様の異なる一例を示す説明図である。 この発明の翻訳装置における、結果表示処理の詳細を示すフローチャートである。 この発明の翻訳装置における、結果表示の態様のさらに異なる一例を示す説明図である。 この発明の翻訳装置における、ユーザによる編集・利用に関する処理の詳細を示すフローチャートである。 この発明の翻訳装置における、表示内容の編集処理の際の表示態様の一例を示す説明図である。 この発明の翻訳装置における、語・句検索モードへの自動移行機能を含む全体の処理を示すフローチャートである。 この発明の翻訳装置における、検索結果の出力態様の一例を示す説明図である。 この発明の翻訳装置における、検索結果の出力態様の異なる一例を示す説明図である。 この発明の翻訳装置における、検索結果の出力態様のさらに異なる一例を示す説明図である。 この発明の翻訳装置における、除外対象語のリストの一例を示す説明図である。 対訳例文の例1、2のデータ構造を示す説明図である。 対訳例文の例3、4のデータ構造を示す説明図である。 対訳例文の例5、6のデータ構造を示す説明図である。
符号の説明
10 原文記憶部
11 翻訳結果記憶部
15 ユーザ・インタフェース
20 機械翻訳処理部
21 翻訳辞書
22 文法規則
30 訳文合成・生成処理部
31 対訳例文検索処理部
40 編集部
50 語・句対応付け処理部
51 対訳例文データベース(ユーザ登録対訳例文を含む)
52 対訳辞書引き処理部
53 対訳辞書
100 CPU
200 バスラインまたはネットワーク
300 入力部
400 出力部
500 制御プログラムモジュール
510 文字列編集部
521 機械翻訳文を文字列編集手段に入力する手段
522 第2原語生成文を文字列編集手段に入力する手段
530 表示制御部
531 原文表示選択部
532 対訳例文第1言語文表示選択部
533 対訳例文第2言語文表示選択部
534 第2言語合成文表示選択部
535 第2言語生成文表示選択部
600 機械翻訳プログラムモジュール
610 第1−第2言語辞書検索処理部
700 翻訳メモリプログラムモジュール
710 対訳例文検索処理プログラム
711 類似度判定処理プログラム
712 相違箇所判定処理プログラム
720 第2言語相違箇所判定処理プログラム
730 第2言語文合成処理プログラム
740 第2言語文生成処理プログラム
741 生成のための文法解析処理
750 対訳例文登録処理プログラム
751 対訳語句対応付け処理
800 動作用メインメモリ
810 原文バッファ
820 翻訳メモリ関連バッファ
821 ワークバッファ
822 対訳例文検索結果バッファ
823 合成文バッファ
824 生成文バッファ
825 相違箇所データバッファ
830 機械翻訳文バッファ
840 対訳例文登録関連バッファ
841 ワークバッファ
842 対訳例文バッファ
850 処理結果表示フラグバッファ
900 記憶部
910 語句対応付け済み対訳例文データ
920 第1−第2言語対訳辞書データ
930 第1→第2言語翻訳辞書データ、第1→第2言語翻訳文法規則データ、その他の第1→第2言語翻訳規則データ
940 第2言語生成用規則データ
g102 出力結果表示・編集部
g103 機械翻訳結果部
g110 対訳検索結果表示部
g111 原文バッファ表示部
g112 検索結果第1言語文バッファ表示部
g113 検索結果第2言語文バッファ表示部
g114 合成文バッファ表示部
g115 生成文バッファ表示部
g121〜125 表示選択指示ボックス
g131 機械翻訳結果の転写指示ボタン
g132 対訳検索結果の転写指示ボタン
g133 出力結果確定指示ボタン

Claims (9)

  1. 第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、
    第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
    翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、
    原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
    第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、
    合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、
    原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置。
  2. 第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、
    第1言語の原文を入力する入力部と、
    第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
    原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、
    原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
    原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、
    決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、
    生成された訳文を出力する出力部とを備える翻訳装置。
  3. 訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定する請求項2記載の翻訳装置。
  4. 前記対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、
    機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成される請求項1〜3のいずれか一つに記載の翻訳装置。
  5. 出力された文をユーザが編集するための編集部をさらに備える請求項1〜3のいずれか一つに記載の翻訳装置。
  6. 前記語句が、単語および連語である請求項1〜3のいずれか一つに記載の翻訳装置。
  7. 第1言語例文から当該例文の語句の構成に関する語句情報を作成し、各第1言語例文に対応する第2言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第1言語の語句と第2言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えた請求項1または2記載の翻訳装置。
  8. 対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、
    出力部は当該語句についての検索結果を出力するように構成される請求項1または2記載の翻訳装置。
  9. 第1言語の原文を入力させる入力処理と、
    対訳例文記憶部に記憶された複数組の対訳例文であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第1言語例文を検索する対訳例文検索処理と、
    原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、
    原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、
    決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成処理と、
    生成された訳文を出力する出力処理とをコンピュータに実行させる例文主導型翻訳プログラム。
JP2004188259A 2004-06-25 2004-06-25 翻訳装置および翻訳プログラム Expired - Fee Related JP4643183B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004188259A JP4643183B2 (ja) 2004-06-25 2004-06-25 翻訳装置および翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004188259A JP4643183B2 (ja) 2004-06-25 2004-06-25 翻訳装置および翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2006011842A true JP2006011842A (ja) 2006-01-12
JP4643183B2 JP4643183B2 (ja) 2011-03-02

Family

ID=35779041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004188259A Expired - Fee Related JP4643183B2 (ja) 2004-06-25 2004-06-25 翻訳装置および翻訳プログラム

Country Status (1)

Country Link
JP (1) JP4643183B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158590A (ja) * 2006-12-20 2008-07-10 Oki Electric Ind Co Ltd 文書選択装置及び文書選択プログラム
JP2011095802A (ja) * 2009-10-27 2011-05-12 Toshiba Corp 機械翻訳装置及びプログラム
JP2011107852A (ja) * 2009-11-14 2011-06-02 Toshiba Corp 機械翻訳装置及びプログラム
WO2023189110A1 (ja) * 2022-03-28 2023-10-05 株式会社バンダイ 翻訳システム、翻訳装置及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2609173B2 (ja) * 1990-03-26 1997-05-14 株式会社エイ・ティ・アール自動翻訳電話研究所 用例主導型機械翻訳方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2609173B2 (ja) * 1990-03-26 1997-05-14 株式会社エイ・ティ・アール自動翻訳電話研究所 用例主導型機械翻訳方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158590A (ja) * 2006-12-20 2008-07-10 Oki Electric Ind Co Ltd 文書選択装置及び文書選択プログラム
JP2011095802A (ja) * 2009-10-27 2011-05-12 Toshiba Corp 機械翻訳装置及びプログラム
JP2011107852A (ja) * 2009-11-14 2011-06-02 Toshiba Corp 機械翻訳装置及びプログラム
WO2023189110A1 (ja) * 2022-03-28 2023-10-05 株式会社バンダイ 翻訳システム、翻訳装置及びプログラム

Also Published As

Publication number Publication date
JP4643183B2 (ja) 2011-03-02

Similar Documents

Publication Publication Date Title
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2838984B2 (ja) 汎用参照装置
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4869281B2 (ja) 機械翻訳装置、プログラム及び方法
WO2009144890A1 (ja) 翻訳前換言規則生成システム
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4646078B2 (ja) 相互に関係する固有表現の組抽出装置及びその方法
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP3692711B2 (ja) 機械翻訳装置
JP3313810B2 (ja) アスペクト処理装置
JP2023169063A (ja) 日本語入力システムのkearm学習変換
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2006065542A (ja) 機械翻訳方法
JP2013174958A (ja) テキスト読み上げ装置およびテキスト読み上げ方法
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2004240605A (ja) 文の拡大表現方法、文の拡大表現生成方法および文の拡大表現生成装置
JP2024021555A (ja) 日本語入力システムのkearm優先変換
JPH11232003A (ja) ドキュメント表示装置,表示方法および記憶媒体
JPH0785026A (ja) 辞書更生方法及び装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JP2008226115A (ja) 機械翻訳装置
JPH0773185A (ja) 機械翻訳装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101202

R150 Certificate of patent or registration of utility model

Ref document number: 4643183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees