JP2006011842A

JP2006011842A - 翻訳装置および翻訳プログラム

Info

Publication number: JP2006011842A
Application number: JP2004188259A
Authority: JP
Inventors: Takeshi Kutsumi; 毅九津見; Ichiko Sada; いち子佐田; Naoko Shinozaki; 直子篠崎
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2004-06-25
Filing date: 2004-06-25
Publication date: 2006-01-12
Anticipated expiration: 2024-06-25
Also published as: JP4643183B2

Abstract

【課題】用例データベースに基づいて自然で質のよい翻訳を行うことができる翻訳装置を提供する。
【解決手段】第１言語例文と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第１言語の原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第１言語例文中の前記相違箇所に対応する第２言語例文の語句を判定し当該語句を原文中の前記相違箇所の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該語句に対応する訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第１言語例文、前記第１言語例文に対応する第２言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える。
【選択図】図２

Description

この発明は、翻訳装置および翻訳プログラムに関し、より詳細には、第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置および翻訳プログラムに関する。

翻訳装置として従来から広く使われている手法は、原語（第１言語）の文章を構成する規則を、訳文言語（第２言語）の規則と対応させ、規則に基づいて翻訳文（第２言語）を生成する、いわゆる規則主導型翻訳装置である。標準的な構文を持つ文章にこの手法を適用した場合は違和感のない翻訳ができるが、やや例外的な構文を持つ文章に対しては不自然な表現になりやすかった。

この欠点を改善するために、人間の翻訳成果や実際の第２言語文の用例をデータベース化して訳文生成に使用する、例文主導型もしくは蓄積例文利用型と呼ばれる翻訳支援装置が知られている。

そのような翻訳装置の一例として、用例を用例データベースに蓄積しておくと共に言語の単語を意味の類似性に基づいて木構造に階層化した辞書データベースを用い、原文（入力文）と用例の類似性を数値計算して、その数値が最小である用例を検索し、検索結果に従って翻訳する用例主導型翻訳装置が知られている（例えば、特許文献１参照）。さらに、入力文を構文単位に分割してからマッチングを行う手法が知られている（例えば、特許文献２参照）。あるいは、原文に類似する例文の訳文を編集可能に表示し、ユーザが表示された類似の訳文を編集して原文を翻訳するようにした翻訳支援装置が知られている（例えば、特許文献３参照）。また、それに基づいて第１言語と第２言語の対訳文を蓄積した対訳データベースの検索によって翻訳を行う翻訳メモリ装置を備え、機械翻訳装置で翻訳した対訳情報と翻訳メモリ装置で翻訳した対訳情報を相互に取り込んで連携させ、翻訳作業の自動化を高める翻訳支援装置が知られている（例えば、特許文献４参照）。
特許第２６０９１７３号公報特開平１０−２１２４３号公報特開平０９−２４５０４０号公報特開２００２−２７８９６４号公報

しかしながら、用例データベースと共に木構造に階層化した辞書データベースを用いる手法は、用例と辞書との両方をデータベースとして備える必要があり、膨大なデータを作成する必要がある。このため、開発に要する作業工数とコストの面の負担が大きい。類似の例文を表示してユーザが編集する手法はユーザの負担が大きい。また、入力文を構文単位に分割する手法は、構文解析手段を必要とし、用例データベースと構文解析辞書を用意する作業工数とコストの負担が大きい。翻訳メモリ装置と機械翻訳装置を備える手法もそれらの両方を用意するための作業工数とコスト面の負担が大きい。

この発明が解決しようとする問題点は、大規模なデータベースを必要とせず、しかも用例データベースのみに基づいて自然で質のよい翻訳を自動的に行うことができる翻訳装置を提供することである。

この発明は、第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置であって、第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第１言語の原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第１言語例文中の前記相違箇所に対応する第２言語例文の語句を抽出し当該第２言語の語句を原文中の前記相違箇所の第１言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第１言語の語句に対応する第２言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第１言語例文、前記第１言語例文に対応する第２言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置を提供する。

また、この発明は、第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置であって、第１言語の原文を入力する入力部と、第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備える翻訳装置を提供する。

この発明の翻訳装置は、翻訳すべき第１言語の原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第１言語例文中の前記相違箇所に対応する第２言語例文の語句を抽出し当該第２言語の語句を原文中の前記相違箇所の第１言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第１言語の語句に対応する第２言語の訳語で置換した訳文を作成する訳文生成部とを備えて合成文あるいは訳文を作成するので、合成文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて質のよい翻訳支援情報を出力することができる。

さらに、この発明の翻訳装置は、原文、原文に類似する第１言語例文、前記第１言語例文に対応する第２言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えるので、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができ、これによって、訳文が適切でなかった場合でもユーザは例文や合成文を翻訳支援情報として得ることができる。

また、この発明の翻訳装置は、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成部とを備えるので、訳文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて自然な表現の翻訳を実現することができる。従って、データベース開発に要する工数やコストが少なく、またデータベースを保持する記憶容量も小さくでき、質のよい翻訳が可能な翻訳装置を安価に提供することができる。

この発明の翻訳装置は、第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置であって、第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第１言語の原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第１言語例文中の前記相違箇所に対応する第２言語例文の語句を抽出し当該第２言語の語句を原文中の前記相違箇所の第１言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第１言語の語句に対応する第２言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第１言語例文、前記第１言語例文に対応する第２言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えることを特徴とする。

ここで、言語とは広義に解釈されるものであって、情報を伝達するための規則であれば異国語に限らず、方言や同一の言語であってもよい。あるいは、人間が会話をする言語に限らずコンピュータ処理用の言語などであってもよい。
また、例文の形態は、単文に限らず、語、句や複数の文から成るものを含んでいてもよい。
出力部からの出力は文字として表示されてもよいが、それに限らず例えば情報として記憶装置に記憶される態様や、音声などの態様であってもよい。

また、この発明の翻訳装置は、第１言語の原文を入力する入力部と、複数組の対訳例文を記憶する対訳例文記憶部と、対訳例文検索部と、相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備えることを特徴とする。
ここで、入力部からの入力はこの発明の翻訳装置が処理可能な情報に変換されるものであれば文字に限らず、例えば音声などであってもよい。

前述の翻訳装置は、単独の装置として構成されてもよいが、それに限られず、たとえばパーソナルコンピュータなどの汎用処理装置にインストールするソフトウェアとして提供され、そのソフトウェアの処理を実行することによって翻訳装置として機能するものであってもよい。

訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定するように構成されていてもよい。このようにすれば、訳語の候補が複数ある場合に、それらの候補の中から適切な訳語を選択することができる。
また、対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成されていてもよい。
さらにまた、出力された文をユーザが編集するための編集部をさらに備えていてもよい。このようにすれば、翻訳装置から出力された前記の文を参考にしながら、その内容をユーザが自由に編集することができ、ユーザの意図に沿う最終的な訳文の作成を支援することができる。
前記語句が、単語および連語であってもよい。

また、第１言語例文から当該例文の語句の構成に関する語句情報を作成し、各第１言語例文に対応する第２言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第１言語の語句と第２言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えていてもよい。このようにすれば、ユーザは、第１言語と第２言語の対応する例文を入力するだけで付加情報を入力することなく対訳例文を作成し、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いて翻訳を行うことができる。従って、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録することが容易にでき、これによって、特定分野の対訳例文を充実させるなどしてより適切な翻訳を行うことが容易にできる。

さらにまた、対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、出力部は当該語句についての検索結果を出力するように構成されていてもよい。このようにすれば、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文の作成を支援することができる。

また、この発明は、第１言語の原文を入力させる入力処理と、対訳例文記憶部に記憶された複数組の対訳例文であって、第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第１言語例文を検索する対訳例文検索処理と、原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成処理と、生成された訳文を出力する出力処理とをコンピュータに実行させる翻訳プログラムを提供する。
以下、図面に示す実施形態に基づいてこの発明を詳述する。

（装置の構成例）
図１は、この発明の翻訳装置の構成の一例を示すブロック図である。
図１の入力部３００は、翻訳すべき原文、処理翻訳に関する指示、訳文の編集に関する内容を入力する手段であり、例えばキーボードやマウスボタンで構成されるが、これに限らずタブレットやタッチパネルなどであってもよい。

記憶部９００は、共通の意味を持つ複数言語の文と、その文を構成する語の言語間の対応とを含む用例データベースを記憶する手段である。図１１は、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。対訳例文データベースの詳細については、後述する。記憶部９００は、ハードディスクを用いて構成することができるが、それにかぎらずフラッシュメモリや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクＲＯＭやＣＤなどの書き換え不可能な記憶手段であってもよい。また、記憶部は装置本体に着脱自在に構成されて交換可能であってもよく、本体に固定されて交換不可能であってもよい。

入力部３００からの入力データもしくは指示、記憶部９００から読み出したデータの処理は、ＣＰＵ１００によって実行される。前記の記憶部９００や入力部３００またはＣＰＵ１００とバスなどの転送部２００を介して接続されている。あるいは、転送部２００は少なくともその一部にネットワークを含んでいてもよい。

翻訳メモリプログラムモジュール７００は、ＣＰＵ１００が実行する処理のプログラムを記憶する記憶手段である。翻訳メモリプログラムモジュール７００は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクＲＯＭやＣＤなどの書き換え不可能な記憶手段であってもよい。

制御プログラムモジュール５００は、翻訳装置が実行すべき翻訳メモリの処理以外の処理に関するプログラムが格納されている。例えば、訳文候補の文字列を編集するための処理や、入力や出力の制御に関する処理である。制御プログラムモジュール５００は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクＲＯＭやＣＤなどの書き換え不可能な記憶手段であってもよい。

動作用メインメモリ８００は、ＣＰＵが一時的に使用するデータを記憶する高速のメモリである。メインメモリ８００には、例えば、原文の内容を一時的に保持する原文バッファ８１０や、翻訳メモリに関するデータを保持する翻訳メモリ関連バッファ８２０などが含まれる。

この発明は、従来の規則主導型翻訳装置と併用することが可能であり、その場合は、機械翻訳プログラムモジュール６００に規則主導型翻訳処理のプログラムがこのモジュールに格納される。点線で描いているのは、前記モジュールがこの発明の必須構成要素でないことを示すためである。また、機械翻訳プログラムモジュール６００を装置に含む場合は、動作用メインメモリ８００中に、図示しない規則主導型翻訳処理に関連するバッファを確保する。
出力部４００は、訳文や訳文候補、編集の結果を出力する手段であり、ＬＣＤなどを用いた表示装置から構成されてもよいが、これに限らず、ＣＲＴなどの他の表示デバイスであってもよく、あるいはインクジェット方式などのプリンタ、外部の装置へデータを出力する出力Ｉ／Ｆ部が含まれていてもよい。

（データ処理の観点からの構成）
図２は、この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。図において、翻訳のための原文は、入力部３００を介してユーザによって入力されるか、あるいは原文のデータが記憶された原文記憶部１０から読み込まれる。これらの入力に関する指示は、ユーザ・インタフェース１５によって管理される。ユーザ・インタフェース１５によって、入力操作に関する画面が出力部４００に表示され、ユーザは画面表示の内容から所望の入力方法を入力部３００を用いて指示し、指示された内容をユーザ・インタフェース部１５が判断してユーザの選択に応じた所定の処理が実行される。そして、ユーザが行った操作や翻訳の結果が出力部４００に表示され、あるいは翻訳結果が翻訳結果記憶部１１に格納される。

また、ユーザは出力部４００に表示された翻訳結果を編集することができる。編集に関する処理は編集部４０が行う。
入力された原文は、対訳例文検索処理部３１に入力される。対訳例文検索処理部３１は、入力された原文と類似する例文を、対訳例文記憶部５１に記憶された対訳例文データベースを参照して抽出する。対訳例文データベースは、翻訳装置の中に予め用意されている用例のほかに、ユーザが登録した対訳例文を含んでいてもよい。対訳例文検索処理部３１は、一定の類似度以上の例文の第１言語とそれに対応する第２言語の例文およびそれらの文を構成する語の言語間での対応に関するデータと、原文と例文との相違点に関するデータとを訳文合成・生成処理部３０へ送る。

訳文合成・生成処理部３０は、送られたデータに基づいて、抽出された例文の原文との相違点を第２言語で表わした文、抽出された第２言語の例文を原文との相違箇所のみ第１言語で置換した文を生成する。また、対訳例文検索処理部３１を介して対訳例文データベースを参照し、前記相違箇所を補完した訳文を生成する。
このようにして生成した訳文と、前記の翻訳過程の文とをユーザ・インタフェースを介して出力部４００へ出力する。

ユーザが対訳例文を登録する場合は、ユーザが入力した対訳例文は語・句対応付け処理部５０へ送られる。語・句対応付け処理部５０は、例文を解析して語・句の構成と対応情報を付加するために対訳辞書引き処理部５２を介して対訳辞書５３を参照する。このようにして語・句の構成と対応付けに関する情報を付加して対訳例文データベースと同じ形式を持つ登録対訳例文は、対訳例文記憶部５１に記憶され、以降の翻訳処理では、先に記憶されている対訳例文と同様に参照される。
なお、規則主導型翻訳装置を併用する場合、その装置の翻訳辞書２１を対訳辞書５３と共用してもかまわない。また、機械翻訳処理部２０の一部を対訳辞書引き処理部５２と共用してもかまわない。

（概略の処理手順）
図３は、この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。図３に示すように、翻訳すべき原文をユーザに入力させ（Ｓｔｅｐｓ１１）て図１の原文バッファ８１０に格納した後、さらに訳文を生成する指示を入力させる（Ｓｔｅｐｓ１２）。規則主導型翻訳処理を併用する場合は、その処理を実行する（Ｓｔｅｐｓ１３）。規則主導型翻訳装置は本願発明の必須構成要素ではなく、そのことを示すために、ｓ１３を点線で描いている。規則主導型翻訳を行わない場合、ルーチンはｓ１２を実行した後ｓ１４へ移る。また、その処理手順は公知であるので、この明細書ではこれ以上の説明を行わない。次に、ルーチンは、対訳例文データベースを検索して訳文の合成・生成処理を行う（Ｓｔｅｐｓ１４）。この処理の詳細は図５に記載されており、図５の説明として後述する。そして、ルーチンは、前記の処理を行った結果を出力して表示する（Ｓｔｅｐｓ１５）。この処理の詳細については、さらに後述する。ユーザは、表示された訳文や翻訳の途中経過のデータを必要に応じて編集したり、ユーザが利用しやすい形態に変換したりする（Ｓｔｅｐｓ１６）。この処理の詳細については、さらに後述する。
ここで、ｓ１２〜ｓ１４の処理は、必ずしも図のとおりの手順で行う必要はなく、例えばｓ１３とｓ１４を同時に行ってもよく、またｓ１４をｓ１３より先に行ってもよい。

図４は、ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。図４に示すように、第１及び第２言語を含んだ登録すべき対訳例文をユーザに入力させた（Ｓｔｅｐｓ３１）後、さらに登録の指示を入力させる（Ｓｔｅｐｓ３２）。指示が入力されたら、対訳例文に対する語句の構成と対応付けの情報を付加する（Ｓｔｅｐｓ３３）。この処理によって、既に登録されている対訳例文と同じ形式に整えた後に対訳例文をデータベースに登録する（Ｓｔｅｐｓ３４）。

（対訳例文の検索と合成・生成処理−概要）
以降の説明では、具体的な文を例に挙げながら各部の詳細な処理を説明する。ここで、「第１言語」が日本語、「第２言語」が英語であるとする。また、「△」は空白文字を表わす記号であるとする。

図５は、図３のＳｔｅｐｓ１４に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。図３のＳｔｅｐ１１でユーザによって入力された原文が、
「私の眼鏡が見つかりません。」
という日本語の文であるとする。これが図１の原文バッファ８１０に格納されている。図１２は、前述の原文が原文バッファ８１０に格納された様子を模式的に示した説明図である。図１２に示すように、原文は、各文字の文字位置が識別可能に構成された原文バッファ８１０に、１３文字からなる文として格納される。ここで、原文バッファの長さは固定されておらず、例文よりも長い文も短い文も格納できる。後述する他のバッファに関しても同様である。

また、図１１は、対訳例文データベースのデータ構造の一例を示す説明図である。図１１は、以下のことを示している。
まず、図１１（ａ）は、対訳例文データベースが「第１言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の日本語文（第１言語文）が、１７文字からなる「私のスーツケースが見つかりません。」であることを示している。
次に、図１１（ｂ）は、対訳例文データベースが「第１言語文の単語情報データ」を含むことと、そのデータの一例を示している。図１１（ｂ）に示すように、第１言語文の単語情報データは、対訳例文データベースに含まれる前述の対訳例文の日本語文の単語区切りが「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の間の７箇所であること、文が８単語からなること、そして各単語の文字数を示している。
さらに、図１１（ｃ）は、対訳例文データベースが「第２言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の英語文（第２言語文）が「I can't find my suitcase.」の全部で２５文字からなる英文であることを示している。
そして、図１１（ｄ）は、対訳例文データベースが「第２言語文の単語情報データ」を含むことと、そのデータの一例を示している。図１１（ｄ）に示すように、第２言語文は、その単語区切りが「Ｉ」「can」「't」「find」「my」「suitcase」「.」の間の６箇所であること、全部で７単語からなること、そして各単語の文字数を示している。
最後に、図１１（ｅ）は、対訳例文データベースが「対応関係データ」を含むことと、そのデータの一例を示している。図１１（ｅ）に示すように、対応関係データは、第１言語文と第２言語文との単語の対応関係が４つの組からなり、それぞれの組の対応が以下のような対応関係であることを、それぞれの単語番号を用いて示している。
「私の――が見つかりません」−「I can't find my」
（ここで、日本語文中の「――」は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である）
「私の」−「 my」
「スーツケース」−「suitcase」
「が見つかりません」−「I can't find」
図５のＳｔｅｐｓ１４１で示す類似文検索処理は、次の手順で行う。

（対訳例文の検索と合成・生成処理−類似文検索処理）
まず、「私の眼鏡が見つかりません。」をキーとして、日本語が類似する対訳例文を図１の対訳例文データベース５１中から検索する（Ｓｔｅｐｓ１４１）。対訳例文データベース５１は、例えば、第１言語「見つかりません」の語句を用いた例文として、以下の例文を記憶している。即ち、
対訳例文の例１
第１言語例文：「私のスーツケースが見つかりません。」と、
第２言語例文：「I can't find my suitcase.」の組、
対訳例文の例２
第１言語例文：「探している商品が見つかりません。」と、
第２言語例文：「I can't find the thing I want.」の組、
対訳例文の例３
第１言語例文：「ニューヨーク中電話しましたが、その本は見つかりませんでした。」と、
第２言語例文：「Although we have telephoned all over New York , we have been unable to find copies.」の組、
対訳例文の例４
第１言語例文「それが見つかるまでの間、どうにかしてもらえませんか。」と、
第２言語例文「What will you do for me until you find it?」の組
の５組である。

また、対訳例文データベース５１は、第２言語「atmosphere」の語句を用いた例文として、
対訳例文の例５
第２言語例文「I like the homey atmosphere of that restaurant.」と、
第１言語例文「あのレストランの家庭的な雰囲気が好きだ」の組、
対訳例文の例６
第２言語例文「bad atmosphere engulfed the city」と、
第１言語例文「町はひどい大気に包まれた」の組、
の２組の例文を記憶している。

図２９は、これらの対訳例文の例１、２のデータ構造を示す説明図である。図２９に示す対訳例文の例１のデータ構造は、「第１言語文の単語情報データ」の単語区切りが、「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の８単語であり、「第２言語の単語情報データ」は、英語文の単語区切りが「Ｉ」「can」「't」「find」「my」「suitcase」「.」の7単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「私の――が見つかりません」−「I can't find my」
ここで、前述のように日本語文中の「――」は、省略記号でなく、いわば穴あき箇所を示す。
対応２：「私の」−「 my」
対応３：「スーツケース」−「suitcase」
対応４：「が見つかりません」−「I can't find」

また、対訳例文の例２のデータ構造は、「第１言語文の単語情報データ」の単語区切りが「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」の８単語であり、「第２言語の単語情報データ」は、英語文の単語区切りが「Ｉ」「can」「't」「find」「the」「thing」「I」「want」「.」の９単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「探している商品」−「the thing I want」
対応２：「探している」−「I want」
対応３：「商品」−「thing」
対応４：「が見つかりません」−「I can't find」

さらに図３０は、対訳例文の例３、４のデータ構造を示す説明図である。対訳例文の例３のデータ構造は、「第１言語文の単語情報データ」の単語区切りが「ニューヨーク」「中」「電話」「しました」「が」「、」「その」「本」「は」「見つかり」「ませ」「ん」「でした」「。」の１４単語であり、「第２言語の単語情報データ」は、英語文の単語区切りが「Although」「we」「have」「telephoned」「all」「over」「New」「York」「,」「we」「have」「been」「unable」「to」「find」「copies」「.」の１７単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「ニューヨーク」−「New York」
対応２：「ニューヨーク中」−「all over New York」
対応３：「電話し」−「telephoned」
対応４：「電話しました」−「we have telephoned」
対応５：「が」−「Although」
対応６：「その本」−「copies」
対応７：「は見つかりませんでした」−「we have been unable to find」
対応８：「ませんでした」−「we have been unable to」

また、対訳例文の例４のデータ構造は、「第１言語文の単語情報データ」の単語区切りが「それ」「が」「見つかる」「まで」「の」「間」「どうにか」「して」「もらえませんか」「。」の１０単語であり、「第２言語の単語情報データ」は、英語文の単語区切りが「What」「will」「you」「do」「for」「me」「until」「you」「find」「it」「？」の１１単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「それ」−「it」
対応２：「が見つかるまでの間」−「until you find」
対応３：「てもらえませんか」−「will you」
対応４：「どうにかしてもらえませんか」―「What will you do for me」

さらに図３１は、対訳例文の例５、６のデータ構造を示す説明図である。対訳例文の例５のデータ構造は、「第２言語文の単語情報データ」の単語区切りが「I」「like」「the」「homey」「atmosphere」「of」「that」「restaurant」「.」の９単語であり、「第１言語の単語情報データ」は、単語区切りが「あの」「レストラン」「の」「家庭的な」「雰囲気」「が」「好き」「だ」「。」の９単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「I like」−「が好きだ」
対応２：「homey」−「家庭的な」
対応３：「atmosphere」−「雰囲気」
対応４：「of that restaurant」−「あのレストランの」
対応５：「restaurant」−「レストラン」

また、対訳例文の例６のデータ構造は、「第１言語文の単語情報データ」の単語区切りが「Bad」「atmosphere」「engulfed」「the」「city」「.」の６単語であり、「第２言語の単語情報データ」は、単語区切りが「町」「は」「ひどい」「大気」「に」「包まれた」「。」の７単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応１：「Bad」−「ひどい」
対応２：「atmosphere」−「大気」
対応３：「the city」−「町」

図６は、この類似文検索処理（Ｓｔｅｐｓ１４１）の詳細な手順の一例を示すフローチャートである。図６に示すように、ルーチンは、対訳例文データベース５１から一組の対訳例文を読み込んで（Ｓｔｅｐｓ１４１１）、その対訳例文と原文との類似度を求める（Ｓｔｅｐｓ１４１２）。類似文の検索は公知の技術を用いて実現することができる。また、原文と例文との類似度も、公知の方法で求められるので、ここでは、これ以上の説明は行わない。そして、求めた類似度が所定の値（閾値）以上であるかどうかを調べ（Ｓｔｅｐｓ１４１３）、閾値以上である場合は、読み込んだ対訳例文を対訳例文検索結果バッファ８２２に格納する。その後、ルーチンはＳｔｅｐｓ１４１５へ進む。一方、求めた類似度が所定の値未満であった場合は、前述の処理を行わずにＳｔｅｐｓ１４１５へ進む。Ｓｔｅｐｓ１４１５では、まだ読み込んでいない対訳例文があるかどうかを調べ、読み込んでいない対訳例文がある場合、ルーチンは、次に読み込む一組の対訳例文を選択してから最初のＳｔｅｐｓ１４１１へ戻り、選択した対訳例文に関して前述の処理を繰り返す。このように、すべての対訳例文をチェックし、残りの対訳例文がなくなった場合、ルーチンは類似文検索処理を終了し、図５のＳｔｅｐｓ１４２へと進む。

図１４は、検索された対訳例文を格納する対訳例文検索結果バッファ８２２の例を示す説明図である。図１４では、２つの検索結果が対訳例文検索結果バッファ８２２に格納されている。そのうちの１つ目の第１言語文は、「私のスーツケースが見つかりません。」であり、２つ目の第１言語文は「探している商品が見つかりません。」である。これらのデータの他に、第１言語の単語情報、第２言語文、第２言語の単語情報が対訳例文データベースからコピーされて格納され、さらに前述の類似文検索処理で求めた原文と対訳例文との類似度が格納される。

ここで、原文と検索する対訳例文との類似度判定の閾値を下げると、「見つかりません」の語句を有する前記対訳例文の例３の「ニューヨーク中電話しましたが、その本は見つかりませんでした。」や、対訳例文の例４の「それが見つかるまでの間、どうにかしてもらえませんか。」が検索される。ここでは、かかる類似度の閾値を「５０％」と設定しており、類似度「８７％」の対訳例文の例１の「私のスーツケースが見つかりません。」と類似度「５８％」の対訳例文の例２の「探している商品が見つかりません。」の２文が検索の結果として得られる。

（対訳例文の検索と合成・生成処理−第１言語相違箇所決定処理）
次に、ルーチンは、第１言語における相違箇所を決定する（図５のＳｔｅｐｓ１４２）。図７は、この第１言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図７に示すように、ルーチンは対訳例文データベース５１中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する（Ｓｔｅｐｓ１４２１）。そして、処理対象とする類似対訳の第１言語文と、原文との相違箇所を判定する（Ｓｔｅｐｓ１４２２）。相違箇所の判定は、公知の技術を用いて実現することができる。

相違箇所の決定後、ルーチンはＳｔｅｐｓ１４２３へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ（Ｓｔｅｐｓ１４２３）、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して（Ｓｔｅｐｓ１４２４）相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第１言語相違箇所決定処理を終了し、図５のＳｔｅｐｓ１４３へと進む。

図１５は、前述の処理によって決定された第１言語の相違箇所の結果を格納する相違箇所データバッファ８２５のデータ構造とデータの一例を示す説明図である。相違箇所データバッファ８２５は、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ８２２の構造体の一部としてバッファ構造を定義してもよい。図１５は、以下のことを示している。

入力文「私の眼鏡が見つかりません。」と、検索結果１の対訳候補の日本語文「私のスーツケースが見つかりません。」の、第１番目の相違箇所について、
「相違箇所番号」は、原文と類似対訳との相違箇所が１箇所であることを示している。
「入力文文字位置」と「入力文文字数」とは、原文「私の眼鏡が見つかりません。」と類似対訳との相違箇所は、原文の３番目の文字から２文字である。そして、図１２の原文バッファ８１０を参照することにより、相違箇所は「眼鏡」であることがわかる。
「第１言語文単語番号」と「第１言語文単語数」とは、対訳候補の日本語文「私のスーツケースが見つかりません。」における相違箇所が、３番目の単語から１単語であることを示している。そして、図１４の「検索結果１」の「第１言語文の単語情報バッファ」ならびに「第１言語文バッファ」を参照することにより、相違箇所は「スーツケース」であることがわかる。
なお、図１５の例では、入力文「私の眼鏡が見つかりません。」と検索結果１の対訳候補の日本語文「私のスーツケースが見つかりません。」との相違箇所の個数は、１カ所だけであるので、相違箇所データバッファ８２５のデータ列数は１列である。一般に、相違箇所が複数有る場合はこのデータ列数が複数になり、「相違箇所番号」は１から１ずつ昇順の整数の値をとる。

（対訳例文の検索と合成・生成処理−第２言語相違箇所決定処理）
続いて、ルーチンは、原文に対する類似対訳の第２言語における相違箇所を決定する（図５のＳｔｅｐｓ１４３）。
図８は、この第２言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図８に示すように、ルーチンは対訳例文データベース５１中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する（Ｓｔｅｐｓ１４３１）。そして、処理対象とする類似対訳の第１言語文の相違箇所に対応する第２言語文の相違箇所を判定する（Ｓｔｅｐｓ１４３２）。相違箇所の判定は、第１言語の相違箇所を示す相違箇所データバッファ８２５の内容、第１言語文と第２言語文との語の対応関係を示す対応関係バッファの内容、第２言語文の単語情報バッファの内容および第２言語文バッファの内容を用いて処理することができる。

相違箇所の判定後、ルーチンはＳｔｅｐｓ１４３３へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して（Ｓｔｅｐｓ１４３４）相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第２言語相違箇所決定処理を終了し、図５のＳｔｅｐｓ１４４へと進む。

図１６は、前述の処理によって決定された第２言語の相違箇所を第１言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファ８２３のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ８２２の構造体の一部としてバッファ構造を定義してもよい。図１６は、以下のことを示している。
「対訳例文単語番号」の欄は、対訳候補の英語文「I can't find my suitcase.」における相違箇所は、６番目の単語から１単語「suitcase」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が、原文と検索結果１の対訳候補の日本語文の第１番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第１言語のものか第２言語のものかを示す情報であるが、ある単語番号の単語が第１言語（原語）のものであることと、その単語番号の「相違箇所番号」の欄に有効な値が格納されていること、すなわち対訳の第２言語文に第１言語が合成されていることとは同じことなので、「言語フラグ」と「相違箇所番号」の両欄を兼用させてもよい。

（対訳例文の検索と合成・生成処理−合成文作成処理）
次に、ルーチンは、原文に対する類似対訳の第２言語における相違箇所を原文（第１言語）で置換した合成文を作成する（図５のＳｔｅｐｓ１４４）。
図９は、この第２言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。図９に示すように、ルーチンは対訳例文データベース５１中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する（Ｓｔｅｐｓ１４４１）。そして、処理対象とする類似対訳の第２言語文の相違箇所に原文の語をあてはめた合成文を作成する（Ｓｔｅｐｓ１４４２）。相違箇所の置換は、原文に対する類似対訳の第２言語における相違箇所を示す合成単語情報バッファの内容、第２言語文の単語情報バッファの内容および第２言語文バッファの内容を用いて処理することができる。

合成文作成後、ルーチンはＳｔｅｐｓ１４４３へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して（Ｓｔｅｐｓ１４４４）合成文の作成を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第２言語合成文の作成処理を終了し、図５のＳｔｅｐｓ１４５へと進む。

図１６に、合成された文を格納する合成文バッファ８２３のデータ構造とデータの一例を示す。図１６の合成文バッファ８２３は、以下のことを示している。
「対訳例文文字番号」の欄は、対訳候補の英語（第２言語）文「I can't find my suitcase.」における相違箇所が、１７番目と１８番目であり、１９番目の文字は、対訳例文の第２言語文の２５番目の文字であることを示している。
「相違箇所番号」の欄は、１７，１８番目の文字の相違箇所が、入力文と検索結果１の対訳候補の日本語文の第１番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第１言語のものか第２言語のものかを示す情報であり、１７，１８番目の文字が第１言語であり、その他の文字は第２言語であることを示している。

（対訳例文の検索と合成・生成処理−第２言語文生成処理）
最後に、ルーチンは、合成文の第１言語を適切な第２言語に置換した訳文を生成する（図５のＳｔｅｐＳ１４５）。
図１０は、合成文の第１言語を適切な第２言語に置換する第２言語文生成処理の詳細な手順の一例を示すフローチャートである。図１０に示すように、ルーチンは対訳例文データベース５１中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する（Ｓｔｅｐｓ１４５１）。そして、処理対象とする合成文の第１言語の合成箇所に適当な第２言語の語をあてはめた第２言語文を作成する（Ｓｔｅｐｓ１４５２）。ここで、合成文の第１言語の合成箇所に適当な第２言語の語をあてはめるために、相違箇所の第１言語、即ち「眼鏡」の語について対訳例文の検索をおこなう。検索した結果から、もっとも適切な語を判定し、それに対応する第２言語の語を合成文に当てはめる。この例では「眼鏡」の語であるが、複数の語からなる句であってもよい。この処理の詳細については、後述する。

合成文作成後、ルーチンはＳｔｅｐｓ１４５３へ進み、検索された全ての合成文に対して第２言語文の生成を行ったかどうかを調べ、また生成していない合成文がある場合、ルーチンは、次の類似対訳を選択して（Ｓｔｅｐｓ１４５４）第２言語文の作成を繰り返す。全ての類似対訳について第２言語文の生成を行った場合、ルーチンは第２言語文生成処理を終了し、図５のＳｔｅｐｓ１４５、即ち図１のＳｔｅｐｓ１４の処理を終了してＳｔｅｐｓ１５の処理へ進む。

図１７は、前述の処理によって第２言語文を生成するために用いる相違箇所第１言語単語バッファ、相違箇所言語変換結果バッファおよび生成された第２言語文を格納する生成文バッファ８２４のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ８２２の構造体の一部としてバッファ構造を定義してもよい。図１７は、以下のことを示している。

まず、相違箇所第１言語単語バッファの「文字」欄は、入力文と検索結果１との第１の相違箇所が「眼鏡」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が第１の相違箇所であることを示している。さらに、「合成文単語番号」の欄は、前記の合成文単語情報バッファの相違箇所番号欄から合成文の単語番号の「６」が相違箇所であることを求め、その結果を格納している。また、前述のように相違箇所の第１言語「眼鏡」の語について対訳例文データベースの検索を行った結果、対応する第２言語の適切な表現が「ｇｌａｓｓｅｓ」であると得られた場合に、その結果を相違箇所言語変換結果バッファに格納している。そして、図１６の合成文単語情報バッファの内容と前述の相違箇所言語変換結果バッファの内容とから、第２言語文を求め、その結果を図１７の生成文バッファ８２４に格納する。あるいは、相違箇所言語変換結果バッファの内容のままでなく、活用形を適用して第２言語文を生成するようにしてもよい。そのような活用形は、言語処理に関する解析手法を用いて導出することができる。

生成文バッファ８２４の内容は、以下のことを示している。
「文字」欄は、第２言語生成文が「I can't find my glasses.」であることを示している。
「言語フラグ」欄は、第２言語合成文の第１７〜２５文字の「glasses」が、原文との相違箇所に由来することを示している。
「相違箇所番号」の欄は、第２言語合成文の第１７〜２５文字の「glasses」が、図１４の相違箇所データバッファ８２５に示す第１番目の相違箇所に由来することを示している。
「対訳例文文字番号」の欄によれば、第２言語生成文のうち、第１〜１６文字の「I can't find my 」と、第２４文字の「.」が、図１４の検索結果１の第２言語文バッファ中の第１〜第１６文字と、第２５文字に由来することを示している。
「言語フラグ」欄と「相違箇所番号」欄は、第２言語生成文を表示する際に、相違箇所を異なった態様で示すための情報として用いることができる。
以上が、図３のフローチャートのｓ１４に示した対訳例文検索・合成・生成処理の詳細な処理手順の説明である。

（結果表示処理）
次に、ルーチンは図３のフローチャートのｓ１５に示す結果表示処理を実行する。
図１８は、結果表示の態様の一例を示す説明図である。g110の対訳検索結果表示部は、この発明の翻訳装置の原文、翻訳の途中経過および結果を表示する領域である。対訳検索結果表示部g110中、g111の表示「私の眼鏡が見つかりません。」は、図１２の原文バッファ８１０の内容が表示されたものである。また、g112の「私のスーツケースが見つかりません。」は、図１４に示す検索結果１の第１言語文バッファの内容が表示されたものである。g113の「I can’t find my suitcase.」は、図１４に示す検索結果１の第２言語文バッファの検索結果１が表示されたものである。また、g114の「I can’t find my 眼鏡.」は、図１６に示す第１検索結果の合成文バッファ８２３の内容が表示されたものである。そして、g115の「I can’t find my glasses.」は、図１７の生成文バッファ８２４の内容が表示されたものである。
また、これらの下に以下の内容が表示されている
私の眼鏡が見つかりません。
探している商品が見つかりません。
I can’t find the thing I want.
I can’t find 私の眼鏡.
I can’t find my glasses.
これらの表示は、図１４に示す検索結果２の対訳例文に関する内容であり、各表示は、前述した検索結果１の対訳例文に関する表示g111〜g115に対応するものである。

ユーザは、入力文に対する各結果に関して、上記の５種類の文を表示するか否かを個別に選択することができる。図１８の出力画面例は、上記の５つの文すべてを表示した場合の例である。これに対し、図２１は、上記の１〜３番目の文のみを表示し、４、５番目の文は表示させないようにした出力画面例を示す説明図である。各文の表示・非表示は、処理結果表示フラグバッファ８５０の各欄の値によって決定される。その例を図１９に示す。図１９は、「原文」、「第１言語文」、「第２言語文」、の欄の値が表示され、「第２言語合成文」、「第２言語生成文」の欄の値が「非表示」になっているので、それに対応して、１から３番目のみが表示されて図２１のような画面が表示される。
処理結果表示フラグバッファ８５０の初期値は、本装置の動作開始時に、所定の値に定められてもよいし、ユーザがその値を変更できるように構成されてもよい。

図２０は、結果表示処理（図３のＳｔｅｐｓ１５の処理）の詳細を示すフローチャートである。図１８の出力画面例にある各文の表示選択指示欄（g121, g122, g123, g124, g125）をユーザが操作した際の処理を表している。なお、以下の説明並びにフローチャート中に「クリック」とあるのは、装置の設計の一例であって、他の操作法であってもかまわない。
まず、その時点における処理結果表示フラグバッファの各欄の値に基づいて、各検索結果におけるg111〜g115の各文の表示・非表示を決定する（ｓ１５０２〜ｓ１５１１）、そして、決定した内容に従って画面の描画を行う（ｓ１５１４）。
描画処理を終えたら、ルーチンは、ユーザの操作待ちで待機する（ｓ１５１５）。図１８の表示選択指示欄のいずれか（g121, g122, g123, g124, g125）がユーザによってクリックされると、それに応じて処理結果表示フラグバッファ８５０の内容が変更され、処理結果表示フラグバッファ８５０が再チェックされて各文の表示・非表示が決め直され、出力画面が再描画される。ユーザの操作待ち状態から、この状態を脱するような操作がユーザによってなされる（ｓ１５１６）（たとえば、ウィンドウが閉じられるなど）まで、この状態が続く。このような処理によって、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができる。
以上が、図３のＳｔｅｐｓ１５の結果表示処理の詳細な処理手順の説明である。

（表示内容の編集）
次に、ルーチンは図３のＳｔｅｐｓ１６に示す表示内容の編集処理を実行する。図２３は、この表示内容の編集処理の際の表示態様の一例を示す説明図である。この処理は、図１８や図２１のように対訳例文検索結果が表示され、あるいは併用する機械翻訳の結果が表示されている状態から、所望に応じてユーザが表示内容を編集することができる機能を提供する。

図２２は、ユーザによる編集・利用に関する処理（図３のＳｔｅｐｓ１６）の詳細を示すフローチャートである。
このモードの処理に入ると、まず、翻訳結果の一例として、前述の検索結果１の第２言語生成文「I can’t find my glasses.」が、g102(出力結果表示・編集部)に転写されて（ｓ１６０１）ユーザの操作待ち状態（Ｓｔｅｐｓ１６０２）に入る。なお、この初期動作は、この発明の翻訳装置の一実施形態であって、これに限るものではない。
ユーザの操作待ち状態においては、操作に応じて以下のような動作がなされる。
図１８に示すg110(対訳検索結果表示部)内をクリックした場合、ルーチンはＳｔｅｐｓ１６０３へ進み、クリックした位置にある文を強調表示する（Ｓｔｅｐｓ１６０４）。なお、その時点で、クリックした位置にある文以外の文が既に強調表示されている場合は、その文を通常表示に戻す。すなわち、g110領域内で強調表示される文は１文のみに制御される。そしてユーザの操作待ち状態に戻る。

また、図１８のg132(対訳検索結果の転写指示ボタン)をクリックした場合、ルーチンはｓ１６０５へ進み、g110領域内で強調表示されている文を、g102(出力結果表示・編集部)の領域に追加的に転写する（Ｓｔｅｐｓ１６０６）。そしてユーザの操作待ち状態に戻る。
あるいは、図１８のg131(機械翻訳結果の転写指示ボタン)をクリックした場合、ルーチンはｓ１６０７へ進み、g103領域に表示されている機械翻訳結果の文字列（図１３の機械翻訳文バッファ８３０に格納されている内容）を、g102の領域に追加的に転写する（Ｓｔｅｐｓ１６０８）。そしてユーザの操作待ち状態に戻る。
あるいはまた、図１８のg102(出力結果表示・編集部)の領域内をクリックした場合、ルーチンはＳｔｅｐｓ１６０９へ進み、g102の領域がテキストエディタとして動作するようになる（Ｓｔｅｐｓ１６１０）。そして、ユーザは、既に存在している文を参考にしながら、その内容を自由に編集することができる。テキストエディタの動作の詳細は公知の技術であるので詳細な説明は略す。ここで、g102の領域外のどこかをユーザがクリックすれば、テキストエディタモードを抜け、ユーザの待ち状態に戻る。
また、図１８のg133(出力結果確定指示ボタン)をクリックした場合、ルーチンはｓ１６１１へ進み、その時点でg102(出力結果表示・編集部)領域に存在している文字列を確定させる。たとえば、クリップボードにコピーしたり、連動して動く他のアプリケーションプログラムに入力したりする（Ｓｔｅｐｓ１６１２）。そして編集動作を終了する。

図２３は、図２１の状態から、図２０に示すg132(機械翻訳結果の転写指示ボタン)をクリックした後の状態を示す説明図である。これによって、g103(機械翻訳結果表示部)の領域に表示されている機械翻訳文「My glasses aren’t found.」が、g102(出力結果表示・編集部)に元からあった第２言語生成文「I can’t find my glasses.」の後に追加された状態を示している。
この機能によって、ユーザは、機械が提示する情報を利用しながら編集を行うことにより最終的な訳文を作成することもできる。訳文が適切で、編集の必要がなければこの機能を利用する必要はない。

（語・句検索モードへの自動移行）
前述したような処理を行うことによって、対訳例文データベースを用いた翻訳を行うことができるが、入力した原文と類似する対訳例文を対訳例文データベースから検索した際に、所定の閾値以上の類似度を持つ例文が存在しなかった場合が考えられる。このような場合に、入力文を語・句に分割して、分割された各々の語・句について対訳例文データベースを検索し、その結果を出力させるようにしてもよい。これによって、最適な訳文が見つからなかった場合でも、参考情報を出力してユーザの翻訳を支援することができる。

図２４は、このような機能を含む翻訳装置の全体の処理を示すフローチャートである。図２４に示す処理のうち、Ｓｔｅｐｓ２０５の分岐の左側の処理の流れ、すなわち、ＳＴＡＲＴ→ｓ２０１→ｓ２０２→ｓ２０３→ｓ２０４→ｓ２０５→ｓ２１１→ｓ２１２→ｓ２１３→ｓ２１４→ｓ２１５→ｓ２１６に至る流れは、前述の説明と同様に、入力された原文と類似の文を対訳例文データベースから検索して、その結果に基づいて訳文を生成するものである。すなわち、ｓ２０１は図３のｓ１１、ｓ２０２は図３のｓ１２、ｓ２０３は図３のｓ１３、ｓ２０４は図５のｓ１４１に、それぞれ相当する。また、ｓ２０５の判定は、図６のＳｔｅｐｓ１４１２の類似度判定と同様であり、また、図６に示す処理のようにすべての対訳文について順次検索処理を行う。そして、入力文との類似度がある閾値以上の対訳例文が、１組も存在しない場合、ルーチンはｓ２２１に進むが、１組以上存在した場合は、ルーチンはｓ２１１へ進む。ｓ２１１は図５のｓ１４２、ｓ２１２は図５のｓ１４３、ｓ２１３は図５のｓ１４４、ｓ２１４は図５のｓ１４５、ｓ２１５は図３のｓ１５、ｓ２１６は図３のｓ１６に、それぞれ相当する。

以下、図２４に示す処理で入力文との類似度がある閾値以上の対訳例文が１組も存在しない場合の処理について、説明する。今、入力された原文が「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」であるとし、この入力文に対して類似度がある閾値以上の対訳例文が１組も存在しないとする。その場合、Ｓｔｅｐｓ２０５での判定で、ルーチンはＳｔｅｐｓ２２１に進み、前記の原文を語・句に分割する。分割の具体的な判定方法としては、たとえば形態素解析手段（公知技術）と単語辞書とを用いる方法がある。この場合、辞書が必要になるが、その辞書は、第１言語の単言語辞書でよく、対訳辞書である必要はない。たとえば入力文が日本語の場合、日本語の単語を集積し整理したものでよく、日本語の見出しに英語の訳語がついている必要はない。あるいは、他の方法として、スペースの位置で区切る方法がある。この場合、辞書が不要であり、英語などのように、単語間にスペースを空けて書く言語の場合に使うことができる。さらに、上記の２つの方法と異なる手法として、文字種が切り替わる位置で区切る方法がある。この場合も、辞書は不要である。たとえば日本語の場合、文字種を漢字・ひらがな・カタカナ・英字・数字・記号などに分類した場合の、文字種の異なっている文字境界で区切る。日本語のように、使われる文字が大まかに何種類かに大別され、それぞれの文字種の使われ方に一定の傾向があるような言語の場合に使うことができる。

このようにして、原文を語・句に分割し、これらの日本語（第１言語）の語・句のうち、検索して意味のあるものを用いて、対訳例文データベースが検索し（Ｓｔｅｐｓ２２２）、検索した語・句を第１言語に含む対訳例文を検索結果として得る。ここで、たとえば日本語の文を語・句に分割する方法や、それらの語・句から検索して意味のあるものを選択する方法、日本語文を格納したデータベースを日本語の語・句によって検索する方法は公知の技術を用いて実現することができる。
そして、前記の検索結果を出力する（Ｓｔｅｐｓ２２３）。図２５及び図２６は、検索結果の出力態様の一例を示す説明図である。図２５は、前述の図１８と同様のウインドウであるが、入力文との類似度がある閾値以上の対訳例文が存在しないので、その旨が対訳検索結果表示部に表示されている状態を示している。また、出力結果表示・編集部には、《検索結果１》の《第２言語生成文》の代わりに、併用する機械翻訳処理による訳文「Recently, we introduced the new model of the electronic dictionary in the market.」が自動的に転写されている。ただし、これはあくまでも本装置の設計の一例であり、他にも様々な処理方針が考えられる。そして、同時に図２６のような画面が、たとえば、マルチウィンドウシステムを用いて表示される。図２６の画面には、原文から分割された語・句と、それを用いて検索された対訳例文が表示されている。図２６の、語・句検索モードの出力画面例において、g201(入力文表示部)領域には、入力された原文「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」が自動的に転写されている。g204の検索結果表示部およびg207の検索語句リスト表示部には、入力文から分割された語・句(g205及びg207)が表示されている。これらのg205またはg207の語・句をクリックすると、g204の領域におけるそれらの語・句の下側に、g206に示すように、それらの語・句によって検索された対訳例文が表示される。

また、g201の入力文表示部は、ユーザが編集することも可能であり、ユーザによって書き換えられた文に基づいて語・句に分割して対訳例文を検索することも可能である。その場合には、g202の検索指示ボタンをクリックすることにより、改めて語・句による検索の指示を明示的に行う。
g204の領域では、対訳例文が表示されている際に、対訳例文が表示されている箇所をクリックすると、その箇所の対訳例文が強調表示される。強調表示される対訳例文は高々１組であり、ある対訳例文が強調表示されている時に、別の対訳例文の箇所がクリックされれば、新たにクリックされた箇所の対訳例文が強調表示され、それまで強調表示されていた対訳例文は通常表示に戻る。

前述のように検索結果の表示を行った後、ユーザにこれらの検索結果を編集させ、あるいは編集せずにその一部または全部を利用させるための処理を実行する（Ｓｔｅｐｓ２２４）。すなわち、図２６の語・句検索モードの出力画面において、g204の領域内のある対訳例文が強調表示されている際に、g203の「検索結果の転写指示ボタン」をクリックすると、そのとき強調表示されている対訳例文の第２言語文が、図２５の画面の出力結果表示・編集部に追加的に転写され、同時に図２６の語・句検索モードの出力画面が閉じられる。その結果、元の出力画面は図２７のようになる。図２７の画面では、出力結果表示・編集部には、機械翻訳文「Recently, we introduced the new model of the electronic dictionary in the market.」に加えて、語・句により検索された文「I’d like to show you our new line of electronic goods.」が格納されている。図２７の画面で、ユーザは、出力結果表示・編集部に表示された文を元に、編集をすることができる。

前述の機能により、この発明の翻訳装置は、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文（第２言語）の作成を支援することができる。
なお、前述した処理は、あくまでもこの発明の翻訳装置における一つの実施形態であり、たとえば、g207の検索語句リスト表示部をg204と別に設けることをせず、検索結果と検索語句リストと一つの表示部に表示するなど、種々の異なる実施形態が考えられる。そして、それらの態様は、この発明の範疇に含まれる。

（ユーザによる対訳例文の登録）
この発明の翻訳装置は、翻訳に用いる対訳例文をユーザが登録でき、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いた翻訳を行うことができる。これにより、ユーザは、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録したりでき、これによって特定の分野の対訳例文を充実させて翻訳をより適切に行うことができる。

また、この発明によれば、新規の対訳例文をユーザ登録する際に、ユーザに登録させた複数言語の文の組を単に文として登録するだけでなく、各言語の文をそれぞれの語・句に分割し、分割された語・句の言語間の対応付けを行い、それらの語・句の分割および対応付けに関する情報を付加して登録する。従って、ユーザ登録された対訳例文は、予め登録されている対訳例文と同じ情報を有し、予め登録されている対訳例文に対して何ら遜色なく、翻訳に利用され、質のよい翻訳が提供される。

図４は、ユーザによる対訳例文の登録の処理の流れを示すフローチャートである。図４に示すように、まずユーザによって新規の対訳例文が入力される（Ｓｔｅｐｓ３１）。図２でいうと、ユーザ・インタフェース１５の制御のもと、入力部３００または原文ファイル１０から、対訳例文が入力される。

いま、登録しようとする対訳例文の組が、２つの言語からなり、
第１言語文（日本語）：探している商品が見つかりません。
第２言語文（英語）： I can’t find the thing I want.
であるとする。もっとも、入力される対訳例文は、このように対応する複数言語の文の文字列（いわゆるプレーンテキスト）に限られるものではなく、他の「翻訳メモリ」装置（例文検索型翻訳支援装置）で用いられている対訳例文のデータ形式をそのまま取り込む機能を含んでいてもよい。

対訳例文の入力の後、ユーザにより「登録」の指示がされる（Ｓｔｅｐｓ３２）。図２でいうと、ユーザ・インタフェース１５の制御のもと、入力部３００から登録指示が入力される。

そして、ユーザの登録指示に応じて、入力された対訳例文を、文を構成する語・句に分割し、分割した語・句について言語間の対応付けの処理を行う（Ｓｔｅｐｓ３３）。本実施例における対訳例文それぞれの語・句への分割、及び対訳例文相互の語・句の対応付け処理は、図２に示すように、語・句対応付け処理部５０が、対訳辞書５３およびそれを検索するための対訳辞書引き処理部５２を用いて行う。

今、登録しようとする対訳例文が前述の文の組であるので、語・句対応付け処理部５０が、まず、これらの文を以下のような語に分割する。
第１言語文（日本語）：「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」
第２言語文（英語）：「I」「can」「’t」「find」「the」「thing」「I」「want」「.」
そして、言語間の語・句の対応情報を、以下のように決する。
対応１：「探している商品」−「the thing I want」
対応２：「探している」−「I want」
対応３：「商品」−「thing」
対応４：「が見つかりません」−「I can’t find」
対応５：「探している――が見つかりません」−「I can’t find ―― I want」
ここで、文中の「――」で示した箇所は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である。

入力された対訳例文と、前述の処理とによって得られる語・句情報ならびに語・句の対応に関する情報から、図１４の検索結果２に示した各バッファのうち、「入力文との類似度バッファ」を除くバッファに格納する情報がすべて得られる。

前述の語・句対応付け処理の後、対訳例文の登録を行う（Ｓｔｅｐｓ３４）。図２でいうと、対訳例文データベース５１に、前述の対訳例文及びそれに付加する語・句情報や語・句の対応情報を登録する。これらの各情報を格納するバッファと、その内容は図１４の検索結果２に示すとおりである。ただし、図１４の検索結果２中の「入力文との類似度バッファ」は除く。

なお、この実施例の説明では、ユーザが入力した対訳文の語・句を分割し、分割した語・句を言語間で対応付ける手段として、対訳辞書５３およびそれを検索する対訳辞書引き処理部５２を用いるようにしたが、対訳文の語・句の対応付けの手段はこれに限られるものではない。たとえば、既に対訳例文データベースに登録されている語・句対応付け済みの対訳例文から情報を獲得して、新規に入力した対訳例文の語・句対応付けを行うという方法も考えられる。また、機械翻訳を併用する場合、語・句対応付け処理部５０、対訳辞書引き処理部５２および対訳辞書５３の一部を機械翻訳処理と共用するように構成してもよい。

（適切な訳語選択による訳文生成）
この発明の例文主導型翻訳装置は、図２の訳文合成・生成処理部３０が、合成文の相違箇所である第１言語の語・句を第２言語に置換する。この処理は、図５のフローチャートにおいてはＳｔｅｐｓ１４５の処理で示されている。この第２言語への置換、即ち訳文生成処理は、置換すべき適切な訳語を選択する高度なものである。この処理に関して、さらに説明する。

以下の説明においては、原語（第１言語）が英語、第２言語が日本語の場合であって、入力された原文が、
That restaurant offers a good atmosphere.
の場合を例にあげて説明する。これは、説明のための一例であって、他の文であっても、第１言語が日本語で第２原語が英語の場合であっても、あるいはそのいずれか一方または両方が日本語および英語以外の言語であってもかまわない。

この原文に類似する対訳例文の検索結果として、以下の対訳例文の組が挙がったとする。
第１言語（英語）： That restaurant offers a good service.
第２言語（日本語）：そのレストランはサービスがいい。
この場合、第１言語相違箇所の決定処理（図５のＳｔｅｐｓ１４２）の結果、原文と対訳例文の第１言語における相違箇所は、原文では「atmosphere」であり、対訳例文の第１言語文では「service」であると判定される。

そして、その後の第２言語相違箇所の決定処理（図５のＳｔｅｐｓ１４３）では、対訳例文の第２言語文における相違箇所が「サービス」であると判定される。以上の処理がなされた状態で、第２言語合成文の合成処理（図５のＳｔｅｐＳ１４４）を行い、合成文として
「そのレストランはatmosphereがいい。」
を得る。

第２言語生成文の生成処理（図５のＳｔｅｐｓ１４５）では、合成文のうち第１言語
（英語）が挿入された相違箇所「atmosphere」を第２言語（日本語）に変換する。前述の
ように、図２の訳文合成・生成処理部３０は、相違箇所の「atmosphere」をキーワードに
対訳例文データベース５１を検索する。いま、検索の結果、「atmosphere」を含む対訳例文
の組として、以下のような例を含む対訳例文の組が複数個見いだされたとする。

前記の対訳例文の例５
英語例文「I like the homey atmosphere of that restaurant. 」と
日本語例文「あのレストランの家庭的な雰囲気が好きだ。」の組

前記の対訳例文の例６
英語例文「bad atmosphere engulfed the city」と、
日本語例文「町はひどい大気に包まれた」の組、

そして、図３１に示した、これらの対訳例文のデータに含まれている対応関係データによって、
対訳例文の例５では「atmosphere」−「雰囲気」が対応づけられていることがわかり、
対訳例文の例６では「atmosphere」−「大気」が対応づけられていることがわかる。
このようにして、「atmosphere」に対応する日本語として「雰囲気」と「大気」とが見出されたとする。訳文合成・生成処理部３０は、これらの検索結果の日本語表現中、最も適切な語を選んでひとつの語に決定する必要がある。これを実現するために、訳文合成・生成処理部３０は、次の処理を行う。
上記のように、検索した対訳例文の第１言語（英語）文について、入力文にある他の単語（例えば「restaurant」、「offers」および「good」）との共起の度合いを求める。ここで、共起の対象となる語は、原文に含まれるすべての語であってもよいが、所定の規則に従って対象とする語を絞り込むようにしてもよい。その詳細については、後述する。

前述のようにして共起の度合いを求めた結果、「atmosphere」−「雰囲気」が対応づけられている対訳例文の方が、入力文にある単語と共起度が高いと算出されたとする。この場合、合成文の相違箇所「atmosphere」を置換する訳語は、「雰囲気」であると判定され、その結果生成される第２言語の訳文は、
「そのレストランは雰囲気がいい。」
が得られる。

この機能によって、この発明の翻訳装置は、原文と対訳例文との相違箇所を置換すべき第２言語の候補が複数あっても、それらの候補の中から適切な訳語を選択することができる。

ここで、共起の対象となる語を絞り込む規則を以下に説明する。たとえば、共起の度合いを調べる上で対象から除外すべき語を予め定義しておくことができる。この実施例のように、第１言語が英語の場合、冠詞、代名詞、助動詞、ｂｅ動詞、前置詞などの品詞を除外対象とすればよい。このような語は、語単独で独立した意味をもつことが少ないからである。図２８は、除外対象語のリストの一例を示す説明図である。図２８のような除外対象語のリストを作成しておき、原文の語にこれらが含まれる場合、それらの語を除いて共起の度合いを調べるようにすれば、訳文生成のための処理の量を減らすことができる。

この発明の翻訳装置の構成の一例を示すブロック図である。この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。図３のＳｔｅｐｓ１４に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。この発明の実施形態において、類似文検索処理の手順の一例を示すフローチャートである。この発明の実施形態において、第１言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。この発明の実施形態において、第２言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。この発明の実施形態において、第２言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。この発明の実施形態において、合成文の第１言語を適切な第２言語に置換する第２言語文生成処理の詳細な手順の一例を示すフローチャートである。この発明の翻訳装置において、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。原文を格納する原文バッファの構造を模式的に示した説明図である。この発明の翻訳装置における機械翻訳文バッファの構造を模式的に示した説明図である。この発明の翻訳装置において、検索された対訳例文を格納する対訳例文検索結果バッファの構造を示す説明図である。この発明の翻訳装置において、第１言語の相違箇所の結果を格納する相違箇所データバッファの構造を示す説明図である。第２言語の相違箇所を第１言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファの構造を示す説明図である。第２言語文を生成するために用いる相違箇所第１言語単語バッファと、相違箇所言語変換結果バッファおよび生成された第２言語文を格納する生成文バッファの構造を示す説明図である。この発明の翻訳装置における、結果表示の態様の一例を示す説明図である。この発明の翻訳装置における、結果表示の態様の異なる一例を示す説明図である。この発明の翻訳装置における、結果表示処理の詳細を示すフローチャートである。この発明の翻訳装置における、結果表示の態様のさらに異なる一例を示す説明図である。この発明の翻訳装置における、ユーザによる編集・利用に関する処理の詳細を示すフローチャートである。この発明の翻訳装置における、表示内容の編集処理の際の表示態様の一例を示す説明図である。この発明の翻訳装置における、語・句検索モードへの自動移行機能を含む全体の処理を示すフローチャートである。この発明の翻訳装置における、検索結果の出力態様の一例を示す説明図である。この発明の翻訳装置における、検索結果の出力態様の異なる一例を示す説明図である。この発明の翻訳装置における、検索結果の出力態様のさらに異なる一例を示す説明図である。この発明の翻訳装置における、除外対象語のリストの一例を示す説明図である。対訳例文の例１、２のデータ構造を示す説明図である。対訳例文の例３、４のデータ構造を示す説明図である。対訳例文の例５、６のデータ構造を示す説明図である。

符号の説明

１０原文記憶部
１１翻訳結果記憶部
１５ユーザ・インタフェース
２０機械翻訳処理部
２１翻訳辞書
２２文法規則
３０訳文合成・生成処理部
３１対訳例文検索処理部
４０編集部
５０語・句対応付け処理部
５１対訳例文データベース（ユーザ登録対訳例文を含む）
５２対訳辞書引き処理部
５３対訳辞書
１００ＣＰＵ
２００バスラインまたはネットワーク
３００入力部
４００出力部
５００制御プログラムモジュール
５１０文字列編集部
５２１機械翻訳文を文字列編集手段に入力する手段
５２２第２原語生成文を文字列編集手段に入力する手段
５３０表示制御部
５３１原文表示選択部
５３２対訳例文第１言語文表示選択部
５３３対訳例文第２言語文表示選択部
５３４第２言語合成文表示選択部
５３５第２言語生成文表示選択部
６００機械翻訳プログラムモジュール
６１０第１−第２言語辞書検索処理部
７００翻訳メモリプログラムモジュール
７１０対訳例文検索処理プログラム
７１１類似度判定処理プログラム
７１２相違箇所判定処理プログラム
７２０第２言語相違箇所判定処理プログラム
７３０第２言語文合成処理プログラム
７４０第２言語文生成処理プログラム
７４１生成のための文法解析処理
７５０対訳例文登録処理プログラム
７５１対訳語句対応付け処理
８００動作用メインメモリ
８１０原文バッファ
８２０翻訳メモリ関連バッファ
８２１ワークバッファ
８２２対訳例文検索結果バッファ
８２３合成文バッファ
８２４生成文バッファ
８２５相違箇所データバッファ
８３０機械翻訳文バッファ
８４０対訳例文登録関連バッファ
８４１ワークバッファ
８４２対訳例文バッファ
８５０処理結果表示フラグバッファ
９００記憶部
９１０語句対応付け済み対訳例文データ
９２０第１−第２言語対訳辞書データ
９３０第１→第２言語翻訳辞書データ、第１→第２言語翻訳文法規則データ、その他の第１→第２言語翻訳規則データ
９４０第２言語生成用規則データ
ｇ１０２出力結果表示・編集部
ｇ１０３機械翻訳結果部
ｇ１１０対訳検索結果表示部
ｇ１１１原文バッファ表示部
ｇ１１２検索結果第１言語文バッファ表示部
ｇ１１３検索結果第２言語文バッファ表示部
ｇ１１４合成文バッファ表示部
ｇ１１５生成文バッファ表示部
ｇ１２１〜１２５表示選択指示ボックス
ｇ１３１機械翻訳結果の転写指示ボタン
ｇ１３２対訳検索結果の転写指示ボタン
ｇ１３３出力結果確定指示ボタン

Claims

第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置であって、
第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
翻訳すべき第１言語の原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、
原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
第１言語例文中の前記相違箇所に対応する第２言語例文の語句を抽出し当該第２言語の語句を原文中の前記相違箇所の第１言語の語句に置き換えた合成文を作成する合成部と、
合成文に含まれる原文中の語句を当該第１言語の語句に対応する第２言語の訳語で置換した訳文を作成する訳文生成部と、
原文、原文に類似する第１言語例文、前記第１言語例文に対応する第２言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置。
第１言語例文と、第１言語例文に対応する第２言語例文とを用いて第１言語から第２言語への翻訳を行う翻訳装置であって、
第１言語の原文を入力する入力部と、
第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
原文に類似する第１言語例文を複数組の対訳例文から検索する対訳例文検索部と、
原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、
決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成部と、
生成された訳文を出力する出力部とを備える翻訳装置。
訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定する請求項２記載の翻訳装置。
前記対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、
機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成される請求項１〜３のいずれか一つに記載の翻訳装置。
出力された文をユーザが編集するための編集部をさらに備える請求項１〜３のいずれか一つに記載の翻訳装置。
前記語句が、単語および連語である請求項１〜３のいずれか一つに記載の翻訳装置。
第１言語例文から当該例文の語句の構成に関する語句情報を作成し、各第１言語例文に対応する第２言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第１言語の語句と第２言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えた請求項１または２記載の翻訳装置。
対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、
出力部は当該語句についての検索結果を出力するように構成される請求項１または２記載の翻訳装置。
第１言語の原文を入力させる入力処理と、
対訳例文記憶部に記憶された複数組の対訳例文であって、第１言語例文と、第１言語例文の語句の構成に関する情報と、第１言語例文に対応する第２言語例文と、第２言語例文の語句の構成に関する情報と、前記第１言語例文の語句と第２言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第１言語例文を検索する対訳例文検索処理と、
原文と検索された対訳例文の第１言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、
原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、
決定された訳語で第１言語例文中の前記相違箇所に対応する第２言語例文の語句を置換して訳文を作成する訳文生成処理と、
生成された訳文を出力する出力処理とをコンピュータに実行させる例文主導型翻訳プログラム。