JP2009519534A

JP2009519534A - テキスト編集装置及び方法

Info

Publication number: JP2009519534A
Application number: JP2008545101A
Authority: JP
Inventors: ヒューローソン−タンクレッド、
Original assignee: エミルリミテッド
Priority date: 2005-12-16
Filing date: 2006-12-18
Publication date: 2009-05-14
Also published as: US20090076792A1; CN101361064A; GB0525657D0; EP1969490A2; WO2007068960A2; GB2433403A; GB2433403B; WO2007068960A3

Abstract

第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理するコンピュータ装置であって、前記装置は、第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットを格納する情報格納手段と、前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、受け取ったユーザ指示に基づき前記第１のセットを編集するテキストデータ制御手段と、表示データを生成するように作用する表示データ生成手段とを備え、前記表示データは、表示媒体上で第１及び第２の表示エリアを規定するように作用し、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記第１の言語からの翻訳より前の前記テキストを備えるか、又は前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、ここで前記表示データ生成手段はさらに、前記表示データに区別情報を含めるように作用し、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する。

Description

本発明は、テキスト編集装置及び方法に、具体的にはある言語から別の言語への翻訳の後に続くテキスト後編集（ｐｏｓｔ−ｅｄｉｔｉｎｇ）のための、又は機械生成テキストの後編集のための、装置及び方法に、関する。

翻訳サービスに対する需要の高まりは世界貿易の成長率を上回っており、さらには世界経済の成長率を上回っている。現在、全インターネットトラフィックの半分以上は英語以外の言語であり、商業活動における英語優勢の傾向が全般的に下火になっていることは明らかである。翻訳業への人員補充は拡大こそしているが、需要を満たすに至っていない。その一方で、新しい自然言語処理技術にともない翻訳処理に占めるコンピュータの割合がより一層拡大することが見込まれる。

従来、自然言語翻訳におけるソフトウェアの使用には主に２通りのアプローチがある。最初のアプローチにあたる機械翻訳（ＭＴ）は１９５０年代から存在するが、これまでのところ翻訳の主流として頼りになる基盤を確立するには至っていない。確率統計学的手法の拡大にともないこの状況が今後数年間にある程度変わる見込みはあるが、ＭＴはインターネットで広く利用されているにもかかわらず、幅広い支持を得るには至っていない。ＭＴソリューションが非実用的とみなされる主な理由は、機械翻訳の品質が多くの用途にとって不十分だからである。ＭＴシステムには、技術的な翻訳に比べて推論的な翻訳の場合に性能が落ちる傾向がある。これにはいくつかの理由がある。すなわち、認識されない語は翻訳されず、そのまま翻訳済みテキストの中にコピーされる。複数の意味を持つ語は翻訳されても文脈にそぐわない意味を与えることがある。また、ＭＴシステムの効果は原文の構文の複雑化にともない低下する。同様に、２つの言語で文の構造が大幅に異なる場合にもＭＴシステムの効果は低下する。

結果的に、機械翻訳されたテキストの品質を許容水準まで向上させるための後編集が必要となる。現在の機械翻訳システムでその出力を人間並みの翻訳に転換するには多大な時間と労力を要することがある。

通例、機械翻訳ソフトウェアに用意されたユーザインターフェイスには、ユーザがコンピュータ画面上で翻訳するテキストを入力したり貼り付けたりするための第１のエリアと、機械翻訳出力を表示する第２の画面エリアがある。現在最も普及している（且つ最も古い）ＭＴシステムの１つに、多数の言語間の翻訳に対応する「Ｓｙｓｔｒａｎ」と呼ばれるソフトウェアパッケージがある。

もう１つの主要技術は翻訳メモリ（ＴＭ）システムのそれである。翻訳メモリシステムは、実際の翻訳はすべて人間に任せ、専ら翻訳済み資料（大量のテキストになることがある）を再利用するための効率的システムを提供し、機械支援ヒト翻訳（ＭＡＨＴ）と呼ばれるものを達成することにより、ＭＴの従来の問題を回避する。現在利用できるＴＭシステムは、まず初めに大量の資料を人手で翻訳する点が非効率的であるが、こうして翻訳された資料はソフトウェアによって自動的に効率よく処理できる。

現在様々なＴＭシステムが市販されている。例えば「Ｔｒａｄｏｓ」ＴＭシステムは、最も普及したＴＭシステムの１つである。「Ｔｒａｄｏｓ」は、該当する原文を自動的に提示し、それを以前の一致する文に照合する「ワークベンチ」ウィンドウによって翻訳済みの文を再利用し、ユーザによる入力の繰り返しを回避する。Ｔｒａｄｏｓのようなシステムでは、ユーザが所望の「曖昧一致」レベルを単独の数値で設定でき、１００％は完全一致だけを意味する。曖昧レベルを１００％未満に設定すると、システムは、ユーザによって設定された閾値より上で原文に部分的にか完全に一致する訳文を表示する。有用な曖昧一致レベルは９０％以上である。この閾値を下回ると曖昧一致の編集作業が手に負えないほど膨らむ。ただしシステムは、例えば終止符で区切られたテキスト区画として識別される文全体だけを照合し、語単位や句単位では翻訳を提供しない。

本発明の一態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集方法又は装置を提供する。この装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段を含む。装置は、表示媒体上に表示される表示データを生成する表示データ生成手段を含む。装置はまた、ユーザによる編集が可能な翻訳済みテキストを第１の表示エリアに提示するため、そして翻訳前テキストかユーザ編集前翻訳済みテキストのいずれか一方を第２の表示エリアに表示するため、ディスプレイを制御するように作用するコントローラを含む。コントローラは、第１の表示エリアでテキストの選択部分を強調表示し、第２の表示エリアでテキストの対応する部分を強調表示し、且つユーザ入力手段を通じて新たなテキスト選択を得る場合には前記強調表示を更新するように構成される。強調表示されたテキストを、好ましくは原文の書式を乱すことなく、周囲のテキストから区別するため、強調表示は、太字、斜体、下線、テキスト色、背景色、フォントタイプ、フォントサイズ、その他の使用を含んでよい。

コントローラは、前記翻訳前テキスト及びユーザ編集前翻訳済みテキストの他方を第３の表示エリアに表示し、さらに第１の表示エリアにおけるテキストの選択部分に対応する前記テキストの部分を第３の表示エリアで強調表示するように構成できる。コントローラは、最初の翻訳前テキストと誤りが訂正された翻訳前テキストのいずれか一方又は両方を、それぞれ前記第２又は第３の表示エリアに、又は追加の表示エリアに、表示するように構成できる。コントローラは、テキストの個々の部分をサブセンテンスレベルで強調表示するように構成できる。コントローラは、第１のウィンドウで第１の句を強調表示し、第２のウィンドウで対応する第２の句を強調表示し、さらに前記強調表示された語の翻訳に相当する追加の語を強調表示するように構成でき、ここで前記追加の語は、第１又は第２の強調表示された句に対し異なる句内に位置する。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置はユーザ入力手段とコントローラとを備え、同コントローラは、翻訳前テキスト及び／又は翻訳後テキストの言語を識別し、且つ翻訳済みテキストの後編集にあたって後編集プロセスを自動的に選択するため、及び／又は後編集プロセスの選択を検証するため、前記言語識別を使用するように適応される。

コントローラは、少なくとも第１の言語から、第２の言語、第３の言語にかけて前記テキストを翻訳するのに使われる翻訳言語の順序を識別し、さらに後編集プロセスの選択にあたって、又は後編集プロセスの選択の検証にあたって、前記順序順序を使用するように構成できる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置はユーザ入力手段とコントローラとを備え、同コントローラは、テキストの入力元タイプを識別することにより、そして前記入力元タイプに従って訂正プロセスを選択することにより、翻訳前テキストの誤りを訂正するように適応される。

コントローラは、翻訳前テキストの入力元タイプに従って翻訳前訂正を実施するように構成できる。加えて、又は代わりに、コントローラは、翻訳済みテキストの入力元タイプに従って翻訳後訂正を実施するように構成できる。コントローラは、光学式文字認識（ＯＣＲ）、音声ディクテーション、又はキーボードのいずれか１つとしての入力元タイプ識別をもとに１つ以上の処理ルールを選択するように構成できる。コントローラは、統計解析を用いて前記テキストの入力元タイプを識別するように構成できる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、前記テキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、前記句を、その構文及び／又は語彙プロパティの点で再構成又は修正するため、又は所定のユーザ指示を受けてテキストの別の部分へ、例えば同じ文の中で、移動するため、個々の句を自動的に選択する手段とを、備える。かかる句識別及び／又はかかる変更は記録でき、後で再利用できる。このパターン検出機能は構文解析で支援できる。例えば、句識別のときには文法上の所定の語配置を検出し、使用できる。ユーザはいくつかの実施形態において、構文単位を選択するためのパラメータを、又は構文単位に優先順位を付けるためのパラメータを、選択することにより、構文解析プロセスを構成できる。任意に、ユーザは配列基準を選択することもできる。ユーザはまた、個人的設定を、例えば前もって設定された語彙的に決定する句の主辞／補語関係の強調表示を、指定できる。句の主辞とは句が文法上依存する語であり、至極簡単な例を挙げると、「ｂａｎｋｏｆｉｎｖｅｓｔｍｅｎｔ」では語ｂａｎｋが主辞であり、構成子ｏｆｉｎｖｅｓｔｍｅｎｔは補語である。主辞「ｃｅｒｔｉｆｉｃａｔｅ」を含む全ての句で、補語の前置詞（通常は「ｏｆ」、ただし単に分類の観点で識別されることもある）を削除し、補語の名詞又は名詞句（専ら文法上の分類によって識別される）を句の最初の語又は構成子となるよう移動する設定を指定できる。無論、補語そのものの中にかかる標識語があってもよく、この場合は主辞の語彙的内容にかかわりなく変更が施される。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、句及び／又は句境界を識別する手段と、指定言語に固有の自動句配列ルールを実施する手段とを備える。いくつかの実施形態においてはユーザが句配列ルールの適用順序を指定又は変更できる。例えば特定の句配列ルールの配備にあたって標識語基準を使用し、文脈固有調整を行うこともできる。標識語又は表現を含む句は、その句における語又は表現の存在と位置からマクロの対象としてマークされ、その句の文法的構造は語彙的内容にかかわりなく並べ替えられる。かくして標識によって識別された文脈で効果的な並べ替え手順を使用し、自動化された構造変更の過剰概括を防ぐことができる。

コントローラは、識別された前記句の句タイプによる分類により構文モデルを構築するように構成できる。コントローラは、前記句タイプを指示するため識別された前記句にフラグを付すように構成できる。コントローラは、句タイプに従い前記ディスプレイ上で句の強調表示を提示するように構成できる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、前記翻訳前及び翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、翻訳前テキストの第１の句に出現する語と翻訳済みテキストの対応しない第２の句に出現する対応する語とを識別する手段とを備える。コントローラは、出現した句のパターンをテンプレート句パターンスキーマに照合することにより、そして食い違いにフラグを付すことにより、これを果たすことができ、その結果、人手による訂正介入を円滑にする。ユーザは、局所句又はテンプレート句の変更を行うことができる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、ユーザ指導ドラッグ・アンド・ドロップ編集を可能にするように、そして文における前記テキストの新規位置に応じて編集済みテキストの大文字・小文字及び／又は句読点を自動的に修正するように、構成され、これは空白の適切な処置を含む。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、句を識別するように、そして個々の句の中の語について数、大文字・小文字、及び／又は性の一致を検証するように、構成される。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ここで前記コントローラは、選択された句又は語の置換にあたって複数のオプションをユーザに提供するためオートテキスト機能を実施する手段を備える。

オートテキスト機能は、複数の代替訳がある語の場合に提供されうる。オートテキスト機能は、ユーザがユーザインターフェイスを使って選択された語の前記オプションを巡回することを可能にするように構成できる。オートテキスト機能は、ユーザが前記オプションを事前に定義することを可能にするためユーザによるカスタマイズが可能である。オートテキスト機能は、前記オプションを外部から入手するように構成される。オートテキスト機能はオンライン辞書アクセスと完全に一体化でき、この場合、オンライン辞書項目は全域置換に使用でき、格納されたプロファイルに登録でき、あるいはオートテキストマーカーに割り当てることにより必要に応じて簡単に利用できる。オートテキスト項目は任意に選択される検索基準で完全に検索できる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、複数の意味を持つ訳語を識別する手段と、代替意味の置換をユーザに選択させるため提供することとをさらに備える。ユーザ選択はローカルドロップダウンリストを通じて果たすことができ、個々の語／句ごとに禁止することができる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、第１の言語ではなく第２の言語に固有の文法構造を翻訳済みテキストに自動的に挿入する手段を備える。これは、従来のスタイルチェッカーの原理に概ね従って作用するが、スタイルパラメータは機械テキスト出力の特定の問題に関連して明示的に設定される。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、第２の言語ではなく第１の言語に固有の文法構造を翻訳済みテキストから自動的に除去する手段を備える。この処理アプローチは、前の段落で述べたそれの正反対であってよい。

コントローラは、文字列置換機能を曖昧一致とともに実施するように構成できる。コントローラは、構文解析パターン認識・置換機能を実施するように構成できる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、ユーザ編集の完了を指示するため入力の受け取り後に実施される文法及びスタイル調整のための自動手段を備える。このプロセスをユーザに開放し、ユーザによる監視と介入を許すこともできる。文法、スタイル、及び可読性ツールは既存の「オーサリングソフトウェア」に類似するが、最初の起点言語に由来するスタイル問題により密着する。これはまた、ユーザが、例えば顧客の要望に照らして、より幅広くカスタマイズできる。一実施形態においてはスタイルプロファイルがユーザに提供され、同じように翻訳されるテキストを受け取る相手に応じて異なるスタイルで提示できる。これは、単なる了解度ではなく多様性と読みやすさを促進する点が前述した構造的再配置と異なる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、コントローラは、複数のテキスト編集手順を格納し、且つ前記手順のリストを編纂し、且つ別の入力テキストに使用するため保存する手段を備える。これらの手順は「プロファイル」と呼ぶこともできる。

本発明のさらなる態様は、少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置を提供し、同装置は、テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するよう適応されたコントローラとを備え、コントローラは、テキスト編集手順を規定する情報を格納、蓄積、編集、及び併合する手段と、テキスト編集手順を規定する格納された前記情報を複数のユーザで共用する手段とを備える。複数のユーザはその場で、又は１つ以上のネットワークを介して、情報にアクセスできる。

本発明の態様のいずれかで、コントローラは、選択された正字法を翻訳済みテキストに適用するため自動編集プロセスを選択し且つ実施するように構成できる。コントローラはまた、数字及び／又は日付の書式設定のため選択された自動編集プロセスを実施するように構成できる。コントローラはまた、選択された自動編集プロセスを複数の文書に適用するように構成できる。本発明の態様のいずれかで、テキスト編集装置はコンピュータ装置であってよい。コントローラは、説明する本発明の態様のいずれかの機能を遂行するように構成されたコンピュータプロセッサであってよい。

本発明のさらなる態様は、翻訳済みテキストの後編集のためのルール一式を備えるプロファイルを管理するプロファイル管理システム又は方法を提供する。リストは、ある種のテキスト又は言語にとっての適切性に従って各々分類できる。ソフトウェア使用の好適な特色として、プロファイルを編集し、組み合わせることにより新しいプロファイルが形成され、これまで対処がなされなかった後編集領域の改善をもたらす。場合によっては、巧みに組み合わされたプロファイルがヒトによる後編集に徐々に取って代わり、ヒトによる後編集がまったく必要でなくなることが予想される。また、これらのプロファイルは独立した知的財産になり得るものである。

プロファイルは多数のユーザによる並行使用を通じて統合と精査を伴いながら進化できる。プロファイル管理システムは、プロファイル間の差異を簡単に登録できる手段を提供でき、プロファイルの内容に対し体系的な編集変更を施すように構成できる。プロファイルを構成するマクロをグループ分けし、任意の組み合わせで配備することもまた可能である。

本発明のさらなる態様は、コンピュータ生成テキストを表す情報を管理する方法及び装置を提供する。この装置は、前記コンピュータ生成テキストを表す第１の情報セットを格納する情報格納手段と、前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、受け取ったユーザ指示に基づき前記第１のセットを編集するテキストデータ制御手段と、表示データを生成するように作用する表示データ生成手段とを備え、前記表示データは、表示媒体上で第１及び第２の表示エリアを規定するように作用し、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記テキストデータ制御手段による編集より前の前記第１のセットに一致する。表示データ生成手段はさらに、前記表示データに区別情報を含めるように作用し、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する。翻訳済みテキストがかかわる本発明の態様との関係で説明する特徴はいずれも、コンピュータ生成テキスト管理の実施形態にも応用でき、あるいはコンピュータ生成テキスト管理の実施形態で使用するように適応できる。

本発明のいずれかの態様において、句読点は終止符、カンマ、コロン、セミコロン、ハイフン、ダッシュ、空白、アポストロフィ、大文字使用、その他を含むことがある。

編集プロセスはいくつかの実施形態において機械翻訳プロセスを前提とする。ただしこれ以外の出所から入手した翻訳で後編集を行う場合でも、本発明の多大な利益を得ることができる。例えば、翻訳者が翻訳言語に完全には堪能でない場合のヒト翻訳にも本発明の実施形態を役立てることができる。非ネイティブスピーカーによって作られた原文にも同様に役立てることができ、この場合は、繰り返し起こる言語上の異常を体系的に抑制できる。一連の重要な実施形態は、現在利用できるか先々開発される様々なテキスト処理ソフトウェアによって１つの言語の中で機械的に、又はコンピュータによって、生成されるテキストに関係する。（ことによると多量の）文書から所定の情報を入手する「テキストマイニング」は、かかるソフトウェアの一例である。例えば「テキストマイニング」ソフトウェアは、文書の要約をユーザが指定する長さで自動的に生成しうる。このようにして生成されるテキストはえてして機械言語合成の結果であり、機械翻訳の場合と同様の後編集を必要とするか、又は機械翻訳の場合と同様の後編集を役立てることができる。

ユーザ入力手段は、ポインティングデバイス（例えばマウス、トラックパッド、トラックボール、ペン、トラックポイントデバイス）、タッチパッド、ゲームパッド、ゲームコントローラ、ジョイスティック、リモコン、タッチスクリーン、キーボード、キーパッドをはじめとする（場合によってはカスタマイズ可能なボタンを有する）、ユーザ入力装置であってよい。ディスプレイはモニタ、ＴＶ画面、ボタンを備えるタッチスクリーン、ディクテーション入力、タイプの異なる他の何らかのディスプレイ、又は将来の何らかの装置であってよい。

本発明は、適切にプログラムされたプログラム可能デジタルコントローラを使用し、又はハードウェアとソフトウェアの組み合わせを使用し、専用ハードウェアで実装できる。

代わりに本発明は、ソフトウェア又はプログラム可能演算装置によって実装できる。これはデスクトップコンピュータ、ラップトップコンピュータ、手持ち型コンピュータ、ＰＤＡ（個人用デジタル補助装置）、携帯電話機をはじめとする何らかのコンピュータを、又は将来の何らかの装置を、含む。本発明による方法の各プロセスのためのコードはモジュール形式であってよく、あるいは別のやり方で構成され同じ機能を遂行するものであってよい。本発明による方法及び装置は、ネットワーク接続を伴うコンピュータに適用できる。

したがって本発明は、本発明の装置としてのプログラム可能コントローラ、コンピュータ、又は複数のコンピュータを制御する機械可読命令又はコンピュータコードを保持する保持媒体を包含する。保持媒体は、フロッピー（登録商標）ディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ハードディスク、磁気テープ、プログラム可能記憶装置、将来の何らかの装置をはじめとする何らかの格納媒体を、あるいは電気信号、光信号、マイクロ波信号、ＲＦ信号、電磁信号、磁気信号、音響信号をはじめとする過渡的媒体を、含みうる。通信ネットワーク上でコンピュータコードを搬送する符号化信号、例えばインターネット、イントラネット、ローカルエリアネットワーク等のＩＰネットワーク上でコンピュータコードを搬送するＴＣＰ／ＩＰ信号は、かかる信号の一例である。

本発明の実施形態は、翻訳者がＭＴ出力を人間並みの水準まで後編集するのにかかる労力を最小限に抑えることができる環境を提供する。本発明の実施形態はＴＭシステムの手法を部分的に使用するが、本発明によって提供される適応によってこれらの手法はより総合的で効果的なものとなる。

これより添付の図面を参照しながら本発明の実施形態を単なる例証として説明する。

図１は、本発明の一実施形態を実装する装置を示すブロック図である。装置は、ディスプレイ１０１、キーボード１０２、及びポインティングデバイス１０３の各々へ接続されたコンピュータ１００を含む。コンピュータ１００は、中央演算処理装置（ＣＰＵ）１０４と、作業メモリ１０５と、ストレージアプリケーション１０６と、ディスプレイドライバ１０７とを含む。コンピュータ１００はまた、ＣＰＵ１０４、作業メモリ１０５、ストレージアプリケーション１０６、及びディスプレイドライバ１０７間でデータを転送する内部バス１０８を含む。コンピュータ１００は、キーボード１０２とポインティングデバイス１０３とからユーザ入力信号を受け付けるよう構成される。コンピュータはＣＰＵ１０４を使用しながら作業メモリ１０５及び／又はストレージアプリケーション１０６に格納されたソフトウェアを実行でき、さらにディスプレイドライバ１０７を使用しながらディスプレイを操作する制御信号を生成できる。

コンピュータ１００は一実施形態において、強調表示された翻訳前テキストの選択と対応する強調表示された翻訳済みテキストの選択をディスプレイ１０１に表示するため、ディスプレイドライバに対し制御信号を生成するよう構成される。コンピュータ１００はさらなる実施形態において、ヒト翻訳者に求められる作業負荷を軽減するため、自動又は半自動編集プロセスの選択の内少なくとも一方を実施するよう構成される。コンピュータ１００はさらなる実施形態において、これらの編集プロセスの集合を、先々新たな入力テキストで再利用するため、格納し、整理するよう構成される。コンピュータは、作業メモリに格納されたコンピュータソフトウェアコードと、ストレージアプリケーション１０６に格納されうる語の語彙目録と対応する翻訳とによって実施されうる機械翻訳エンジンを実行するように構成できる。

本発明の実施形態は、後編集機能の特定部分を処理するよう各々設計された１組のプログラムを、又は複数の異なる機能を持つ単独のプログラムを、備えてよい。

好ましくは、以下の機能の一部又は全部が提供される。

・テキスト整合、予備翻訳、正則化
・局所的編集
・文字列処理
・語彙解析、パターン処理
・プロファイル管理
・後−後編集
これよりこれらの機能を１つずつ説明しながら、それらがいかに作用し、総合処理フローに一体化されるかを明らかにする。

ＭＴシステムで入力される外国語テキストの準備は一般的に予備翻訳と呼ばれており、ＭＴ出力の品質を大きく左右する可能性がある。

本発明の好適な実施形態においては、後編集処理にあたってテキストを最適な状態で提示するためテキスト整合機能が提供される。２つの並行するテキストの提示は可能な限り人間工学的に調整でき、かくして翻訳者は２つの文書の中で自身の位置を至極簡便にたどることができる。たとえ翻訳者が本発明のいくつかの実施形態で提供される追加的機能を利用しない場合でもこの機能が極めて有用であることに留意されたい。どんな翻訳でも原資料と目的資料を相関させる必要はある。

翻訳で重要となる人間工学上の要因は２つのテキストを同時にたどる必要性である。それには目による相互参照作業が多分に要求され、これによってヒト翻訳者の能率は大いに落ちることがある。ＴｒａｄｏｓＴＭシステムでは、該当する原文を自動的に提示し、それを以前の一致する文に照合する「ワークベンチ」ウィンドウを提供することによってこの問題にダイレクトに対処している。これは、翻訳者が原文の翻訳にかかる前に原文を見つける必要がないことを意味する。ＳｙｓｔｒａｎＭＴシステムもまた整合モードを提供することによってこの問題に対処しており、整合モードでは両方のテキストが分割画面に現れ、一方の画面部分で文が選択されると自動的に他方の画面部分で対応する訳文が強調表示される。

既存のシステムにはいずれも欠点がある。Ｔｒａｄｏｓタイプのシステムでは、文にアクセスするたびにワークベンチを更新する必要があり、それにはある程度の時間がかかるから、文から文への移動の点ではどちらかというと融通がきかない。Ｓｙｓｔｒａｎタイプの方法はこの問題を回避するが、その代償としてこのモードでは、ＭｉｃｒｏｓｏｆｔＷｏｒｄ文書やその他のユーザ編集可能文書ではなくｈｔｍｌファイルを扱う必要がある。本発明の一実施形態は、ＭＴ出力と原文の両方に編集後出力を相関させるシステムを提供する。これにより翻訳者は、テキストにおける自身の介入を原書における位置に随時相関させることができるほか、ＭＴの実行後に施された後編集変更を監視することができる。加えて、翻訳済みテキストと後編集済みテキストとの違いは、例えばそれらをテキストの残りの部分とは別の色で表示することにより、強調表示できる。これにより、精密に的を絞ったマクロ編集が可能となり、その結果は様々な文脈の中で強調表示される。概して、文字列及びパターンマクロの文脈感知性は、あらゆる実施形態において大きなシステム利点となる。

図２は、本発明の一実施形態におけるテキスト整合ウィンドウ構成のコンピュータスクリーンショットを示している。アプリケーションウィンドウの中には２つのテキストウィンドウが見られ、アプリケーションウィンドウの上部にはコントロールボタンがあって、テキストを保存するにあたって、及び／又は様々な編集及び／又は表示機能を実施するにあたって、ユーザ指示を受け付けるユーザインターフェイスを提供する。２つのテキストウィンドウのいずれか一方は翻訳前のテキストを表示するよう構成でき、さもなくば翻訳者によって何らかの後編集変更が施される前の翻訳済みテキストを表示するよう構成できる。他方のテキストウィンドウは編集可能な翻訳済みテキストを表示するよう構成でき、かくして翻訳者はこのウィンドウに表示されるテキストにダイレクトに編集を施すことができる。

図示された例で、第１のウィンドウは英語の機械翻訳出力を表示し、第２のウィンドウは編集後の機械翻訳出力を表示している。第１のウィンドウでは、第２段落の最初の２文がユーザによって強調表示されている。機械翻訳された出力テキストの第１の強調表示された文には、「ｔｈｅｆｏｒｅｔｏｌｄｐｒｉｎｃｉｐｌｅｓａｎｄｃｒｉｔｅｒｉａ」等、いくつかの欠陥が見られる。第２のウィンドウに表示された編集後のテキストでは、この欠陥が翻訳者によって訂正されている。第１のウィンドウで強調表示された部分に対応するテキストは第２のウィンドウの中で自動的に強調表示されているから、翻訳者にとって２つのテキストを相関させることは容易い。

ユーザはテキストの特定部分を、例えばマウス等のユーザ入力装置を使って、選択することにより、人手で強調表示できる。代わりに、テキスト区分を一度に１つずつ自動的に強調表示できる。ある特定の区分に施した編集に満足したユーザは、次の区分の選択を選ぶことができる。ユーザはいくつかの実施形態において、以前の区分をさらなる編集のため再度選択することを選べる。ユーザはいくつかの実施形態において、自動的に強調表示される区分の長さ又は特性を決定するためパラメータを選択できる。これらの選択方法のいずれかによってユーザが第１のウィンドウで別の文を選択すると、新たに選択されたテキストに合わせて第２のウィンドウにおける強調表示は更新される。

好適な実施形態において、後編集機能にはどんなタイプの入力及び出力テキストファイルでも、例えばｒｔｆ（リッチテキスト形式）ファイル、ＭｉｃｒｏｓｏｆｔＷｏｒｄ文書、その他一般的なワープロ文書形式、ｈｔｍｌ（ハイパーテキストマークアップ言語）、ｐｄｆ（ポータブル文書形式）、その他を、使用できる。編集機能と保存機能を利用でき、翻訳者は、「ワークベンチ」システムの場合と違って、現在の文のみならず前後の文脈を容易く参照できる。翻訳者は、暫定的なＭＴ出力テキストとの相関を望まない場合に（代わりに、検分を簡単にするため編集後出力テキストだけを原文と相関する場合に）、オプション設定を通じてこの機能を無効にできる。この整合方法には、ＤｅｊａＶｕ等の他のＴＭシステムやＲｅｖｅｒｓｏ／Ｐｒｏｍｔ等の他のＭＴシステムで採用されている並行列テキスト表示システムより人間工学的であるというさらなる利点がある。かかるシステムでは、翻訳ファイルを最終的な出力文書に再び統合する必要もある。

本発明のいくつかの実施形態で提供されるさらなる有益な準備機能は、ＭＴ出力の元となる言語を識別できることである。これは１つのプロパティとしてプロファイルに割り当て、使用することができる。プロファイルは、１組の自動編集プロセスを、例えばマクロを、定義するものである。このように言語をプロファイルに割り当てれば、関連するプロファイルの中にある全てのマクロ（文字列一致マクロとパターン一致マクロを含む）がそれぞれの究極起源言語に対応していることを確認でき、誤って別の言語に関係するプロファイルに混入したマクロは直ちに見つけることができる。この危険は、プロファイルが拡大し、個々の翻訳者や組織の間で利用されるにつれて現実味を増す。従来のＴＭ翻訳メモリは２つの異なる自然言語で文を照合するだけだが、究極起点言語の識別によってプロファイルをこの脅威から守ることができる。プロファイルは起点言語と翻訳言語の両方を指摘するように構成できる。テキストの翻訳が何度か行われた場合は、一連の翻訳にかかわる各言語の詳細をプロファイルに収容できる。プロファイルは言語のタイプを、例えば東洋語、ゲルマン語、コンピュータプログラミング言語等を、指摘することもできる。ＭＴ用の設定をプロファイルに盛り込むこともできる。

原文そのものにも様々な形の欠陥があり、ＭＴシステムを困らせる大きな原因となっている。これらは、「ソフト」電子文書に本質的に備わるものと、例えばＯＣＲプロセスによる、又は音声認識プロセスによる、編集可能文書の製作に具体的に起因するものとに大別することができる。

ソフトテキストの特徴的問題は大抵、数多くの従来システムで既に取り上げられている綴りの誤りと文法違反の２つに該当する。ＭＴ入力に向けて外国語文書を準備するにあたって、標準的なワープロパッケージで利用できるような対話型のスペル・文法チェックプロセスは必要ない。このプロセスは大部分自動化できる。スペルチェックは簡単で（疑わしいケースは後ほどヒト翻訳者にピックアップさせる）、非常に単純な文法上の誤り（散在する空白、又は、特に表の列に見られる所謂ブロークンテキスト等）を集めた所定のリストに従って行われる文法訂正とともに多かれ少なかれ自動的に処理することもできる。「完璧」な原文を用意するには容認し難いほど多大な介入が要求されることがある。ただし、後続の処理を遅滞させる相当数の低レベルの誤りを取り除くことは可能である。

ＯＣＲからの出力テキストの使用はさらなる困難を投げかける。ＯＣＲ技術は急速に向上しており、ＭＴ利用を大幅に拡大する余地を提供しているが、極めて有利な状況でない限り、少なからぬ期間中に様々な問題を多発する可能性がある。ここで２つの例を述べると、ＯＣＲの場合はソフトテキストよりも大掛かりなスペルチェック機能で異なる特徴的な誤りパターンを処理する必要があり、さらにＯＣＲではしばしば文の流れを中断する改行の形でブロークンテキストが発生する。これは特に、甚だしい語順の並べ替えをともなう言語からの翻訳で深刻な問題となる。本発明の実施形態は、例えば句読点に相反する改行を排除する機能を提供できる。これは場合によっては過剰概括を招くが、例外として封じ込めるか後処理で取り除くことができる。

音声認識を使用するとタイプの異なる誤りが生じ、例えば発音が類似する語が誤って識別されることがある。本発明のいくつかの実施形態では、これらの誤りのいくつかをシンプルな文法チェックで自動的に排除できる。音声認識を使えば原文を作成できるほか、ヒト翻訳者は音声認識ソフトウェアを使って原文の翻訳を入力できる。いずれにせよ、ある種の誤りを発生させるものとして音声認識プロセスを識別すれば、自動訂正を施すことによって全体的な成果を高めることができる。

図３は、本発明の一実施形態に従い翻訳対象テキストの入力元タイプに応じた編集・翻訳プロセスを示すフローチャートである。プロセスはステップＳ３００で始まり、ここでコンピュータ１００は翻訳対象テキストの起点言語を識別する。コンピュータ１００は、例えば原文の語彙解析によって、あるいは統計又はパターン解析によって、あるいはテキストに関連する言語識別情報を読み取ることによって、あるいは言語を識別するためのユーザ入力を受け付けることによって、これを果たすことができる。

次に、コンピュータ１００はステップＳ３０１で入力元タイプを識別する。例えば原文は、キーボードでのタイピングによって、光学式文字認識（ＯＣＳ）によって、又は音声認識によって、コンピュータへ入力された可能性がある（あるいは別のコンピュータへ入力されてこのコンピュータへ移された可能性がある）。コンピュータ１００は、ある特定の形式の入力に見込まれる誤りのタイプの検出を試みるため、例えば原文の統計及び／又はパターン解析によって、原文のタイプを識別できる。代わりに、ユーザ入力によって、又はテキストファイルに関連する入力元タイプ情報をコンピュータが読み取ることによって、入力元タイプを識別できる。

例えば、ＯＣＲ入力の場合はテキストに余分な空白が数多く見られることがあり、及び／又は特有の読み取りエラーが発生することがあり、例えばＯＣＲ装置が誤って特定の文字を他の文字より安易に検出することによって、特定の文字が検出される割合が予想以上に高くなることがある。音声認識入力ではタイプの異なる誤りが生じることがあり、例えば発音が類似する語が誤って数多く識別されることがある。また、背景の音によって実際には存在していなかった語が余分に「認識」されることがあるので、いくつかの実施形態においては、テキストの文法解析によって音声認識を入力タイプとして認識する。

図３の実施形態で、ＯＣＲ入力やディクテーション入力として識別されないテキストはタイピングによる入力と仮定する。これはテキストが、コンピュータ１００でキーボード１０２を使って打ち込まれることを意味し、あるいは代わりに、別のコンピュータで打ち込まれ、例えばネットワークやディスクを使って、コンピュータ１００へ移されることを意味する。ただし、隣接する文字がたまたま置き換わる等、打ち込みテキストにも固有の誤りが生じることがある。本発明のさらなる実施形態においては、打ち込みテキストをはっきりと識別でき、特徴的な誤りを持たないテキストには、又は入力元タイプが不明のテキストには、第４の入力元タイプ範疇として「その他」を使用する。言語を把握できれば入力元タイプの識別に役立つので、コンピュータ１００にとっては、入力元タイプを識別する前に言語を識別すると有利である。

図３の実施形態で、もしもステップＳ３０１で入力元が打ち込みテキストと識別されるなら、コンピュータ１００で実行するソフトウェアはステップＳ３０２で打ち込みテキストを受け取り、ステップＳ３０５でタイピングの誤りを訂正し、プロセスはステップＳ３０８へ進み、そこでコンピュータ１００は言語に固有の訂正を行う。もしもステップＳ３０１で入力元タイプがＯＣＲと識別されるなら、コンピュータ１００で実行するソフトウェアはステップＳ３０３でＯＣＲデータを受け取る。次にコンピュータ１００はステップＳ３０６でＯＣＲに固有の訂正を行い、その後にステップＳ３０８の言語固有誤り訂正が続く。もしもステップＳ３０１で入力元タイプが音声認識と識別されるなら、コンピュータ１００で実行するソフトウェアはステップＳ３０４で音声認識データを受け取る。次にコンピュータ１００はステップＳ３０７で音声認識に固有の訂正を行い、その後にステップＳ３０８の言語固有誤り訂正が続く。ソフトウェアはいくつかの実施形態において、１つのＯＣＲ入力から根強い欠陥を除去する、例えばある特定のファックス装置の印刷特性が原因で生じる誤りを除去する、専用のＯＣＲプロファイルを作成できる。これは、例えばＯＣＲの供給業者が変わる場合や数通りのＯＣＲソフトウェアを使用する組織で、外部ＯＣＲエンジンの編集機能を使用するより便利である。コンピュータ１００はステップＳ３０８の言語固有誤り訂正の後に、ステップＳ３０９でテキストの機械翻訳を実行する。次にコンピュータ１００は、ステップＳ３１０で自動後編集プロセスを実行する。そしてコンピュータ１００はステップＳ３１１で、テキストの後編集のため後編集ツールの使用をヒト翻訳者に提供する。最後にコンピュータ１００はステップＳ３１２で後−後編集を実行し、例えば、近傍の重複する語やその他の誤りをチェックする。

代替の実施形態で、図３のステップのいくつかは省略でき、あるいは別の順序で遂行できる。例えばいくつかの実施形態において、機械翻訳プロセスが終わるまでは言語固有誤り訂正を行わない。

本発明のさらなる実施形態においては、機械翻訳プロセスに先立つ予備翻訳プロセスとは別の供給元から翻訳済みテキストを入手できる。例えば、本発明による後編集システムは、他の供給元から入手した翻訳済みテキストの、例えばヒト翻訳の、後編集に役立てることもできる。例えば、翻訳者がある程度の知識を持ち、ただし完全には精通していない言語で、ヒト翻訳が行われたなら、本発明によるシステムを使って別のヒト翻訳者がその翻訳をチェックし、編集すると、又は最初のヒト翻訳者が自身の翻訳で誤りチェック作業を行うと、有利である。

いくつかの実施形態においては、ＭＴエンジンへの起点言語入力へ適用されるプロセスに加え、ヒト翻訳者による後編集が始まる前のＭＴ出力に対し編集プロセスを自動的に行うことができる。これらのプロセスでは、ＭＴ出力の、ヒトが介入せずとも自動的に正則化できる部分を、扱う。例えばこれは、正字法の選択と数字や日付の処理に役立つ可能性がある。

正字法の分野で最も分かりやすい転換は、アメリカ英語からイギリス英語（又はその他の英語）への変更であろう。これは所定の仕様に従って遂行できる。これは、英語以外のより局地的な綴り習慣にも対応する。無論、ノルウェー語とギリシア語の２形式や欧州ポルトガル語と南米ポルトガル語との違い等、他の言語間の類似性にも同様のルールを使用できる。

番号や日付の表記にも正則化を役立てることができる。数字の句読点や日付の構成子順序については本発明の実施形態から「既製」プロファイルを提供できる。末端顧客の要求に合わせて所望の形式を文書ごとに設定できるほか、ＭＴ出力によって生成される日付／数字で意味論上取るに足りないばらつきを許容するため、ある程度の曖昧さを入力仕様に盛り込むことも可能である。

いくつかの実施形態において、この正則化工程の後に続く次のＭＴ出力処理段階では通例、不定数の文字列・パターンマクロを収容する１つ以上のプロファイルをテキストに適用する。これらのプロファイルは手動で選択されるか、又は翻訳のエンドユーザによるテキスト入力に関係するパラメータに基づき自動的に決定されるか、又はある特定の顧客のデフォルトとして設定される。これにより、リアルタイムで遠隔的に決定するパラメータにプロファイル工程を完全に一致させることが可能となる。ユーザは、例えばウェブポータルを通じてテキストを提出でき、さらにプロファイルの選択プロセスを指導するためパラメータ及び／又はオプション仕様を提供できる。いくつかの実施形態において、有利な状況ではこのテキスト固有プロファイルの選択によって全後編集作業の大部分を果たすことができる。プロファイルの実行が完了した後に、必要とあらば改善されたテキストでさらなる後編集を行うことができ、かかる後編集の結果も既存のプロファイルか新規のプロファイルに格納できる。

本発明の好適な実施形態においては、３つのテキストが明確に、同時に提示されたこの段階で後編集を簡便に効率よく行うための一連のツールを翻訳者に与えることができる。これらのツールには、その場で使用し同じテキストや先々のテキストには影響しないツールのほかに、文書全体に通用する専用ツールや、（ＴＭのように）将来的に再利用される資料を作るための専用ツールがある。

ＭＴ出力にともなう重大問題として、たとえある文の個々の句が正しく再現されるとしても、句の全体的な配置と順序が翻訳言語にそぐわないことがある。この問題に対処するには、かなりのテキスト区画を、まずは選択し、次にドラッグしながら、移動する必要がある。該当する句が識別され強調表示される本発明の実施形態では、このプロセスが容易く果たされる。この場合は、該当部分を１回クリックして「ピックアップ」し、所望の位置へ簡単に移することができる。別の実施形態においては、句順序選好に関するルールによって、例えばドイツ語の句順序に関するＴＭＰ（時間・様態・場所）ルールに沿って、このプロセスそのものを部分的に自動化できる。

ソフトウェアはＭＴ出力文の句分割を遂行し、色分けに従って、例えば赤＝名詞句（ＮＰ）、黄＝前置詞句（ＰＰ）、青＝動詞句（ＶＰ）等に従って、分割結果を強調表示する。これにより文の句構造は直ちに表示される。形容詞句（ＡＰ）と副詞句（ＡｄｖＰ）も識別し、色分けできる。これ以外の色分け表示形式も可能である。そして、自動的に区画として扱われる句の配置替えが可能となる。句の中の語順の誤りは文字列・パターン処理機能で可能な限り自動化でき、文の全体構造は高度な局所的介入（ことによると上述した部分的自動化の対象となる）に任せることができる。

この句再配置機能で直面する１つの問題として、原文の真の分割がＭＴ出力の分割に反映されるとは限らない。句の中での語順の歪みの問題（文字列／パターン置換によって対処）と、句そのものの順番の問題（上述した句再配置機能によって対処）に加え、翻訳のときには個々の語が本来の句から隣接する句の中へずれこむことがある。以降のバージョンでは、（ホスト）句構造における異常な進入を標示する強調表示機能を開発できる可能性がある。この場合はヒト編集者がずれた語を正しい句脈絡に戻すであろう。脱線の検出を完全に自動化することは可能でないが、脱線が発生するリスクが高い句脈絡をマクロ認識機能を使って強調表示することは可能である。かかるパターンの基準は進行中の文書処理結果を踏まえて設定できる。ヒトの習慣から著しくかけ離れた誤謬パターンであるこれらの脱線要素は、ヒト後編集者にとって最も厄介なＭＴ出力欠陥の１つである。本発明のいくつかの実施形態ではこの問題が透明化され、その深刻さはかなり軽減される。

局所的・単発的語順再配置はＭＴ後編集で大きな位置を占め、今のところ完全には自動化できない。本発明の実施形態はこの問題にあたって、標準ドラッグ・アンド・ドロップ機能をインテリジェント大文字／小文字・句読点変更機能で補う。例えば、文の先頭に移される語は自動的に大文字になり、先頭から文の中へ移される語は自動的に小文字になる。終止符に隣接するカンマ等、散在する句読点や空白も自動的に整理できる。さらなる実施形態においてはこれらの機能をユーザが強化し、カスタマイズでき、ことによると数と大文字／小文字及び性（英語以外の言語）の自動一致機能を併せて使用する。

単独のテキストの中でさえ多発する同形異音異義語も後編集では重大な局所的要素となる。（少なくとも）ｉｎｖｅｓｔｍｅｎｔ、ｓｙｓｔｅｍ、又はａｎｎｅｘを意味するドイツ語のＡｎｌａｇｅはその好例である。この場合、全域置換機能は有利でなく、個々のケースに個別に取り組む必要がある。ただし、不要な語に取って代わるテキストを見つけて配置するオートテキスト機能（通常のワープロのそれに類似）によってこのプロセスの円滑化を図ることはできる。例えばＭＴ出力でＡｎｌａｇｅが執拗にｓｙｓｔｅｍと翻訳されるなら、例えばユーザが該当するホットキーを押した後に、代替語としてｉｎｖｅｓｔｍｅｎｔかａｎｎｅｘを提供するようオートテキスト機能を学習させることは容易い。同形異音異義語に対処するさらなる方法では、クロステキスト及びトランスドキュメント編集の文脈で後述する保留概括置換を使用する。

代替訳を標準で提供するシソーラスタイプの機能はこのアプローチを発展させたものである。例えばＲｅｖｅｒｓｏはテキストそのものの中で代替訳（例えばフランス語のｃｏｍｐｒｅｎｄｒｅに対しｉｎｃｌｕｄｅ／ｕｎｄｅｒｓｔａｎｄ）を提供するが、それには選択と削除が伴うからやや不便である。好適な実施形態では、ヒト編集者が、例えばｉｎｃｌｕｄｅを、クリックするだけで形態学的に対応するｕｎｄｅｒｓｔａｎｄに置換されるから、より効率的である（置換が自動的に行われないなら、シソーラスモードで一連の選択肢を提供できる）。

右クリックによるシソーラス機能のコンセプトはさらに発展させることができる。ヒト編集者はオートテキスト置換オプションをカスタマイズできる。好ましい代替訳は自動的に提供され、好ましい候補は一連のクリックかホットキーを使って選択する。オートテキスト候補は文書単位でカスタマイズできるばかりでなく、文書内の節単位でもカスタマイズできる。ヒト編集者は代用テキストプロンプトを何度でも変更でき、プロンプトの順序も変更できる。また、一般に利用できる術語資料をシソーラス機能にプラグインできる。その範囲は原則として、専有用語集から公開のオンライン辞書や市販のソフトウェア辞書アプリケーションにまで及ぶ。後者の機能は特に、ＭＴプロセスを生き延びる起点言語の処理に役立つ。

前置詞はこの現象の特殊なケースであり、自動翻訳にとって周知の難題である。例えば、フランス語の前置詞ａの意味はｔｏからｏｎ、ｆｏｒ、ｗｉｔｈにまで及ぶ（無論これ以外の意味を持つこともある）。好適な実施形態では、候補となる全ての前置詞と起点言語に近い前置詞（ＭＴプロセスを生き延びて後編集入力まで残ることがある）を交互に提供するホットキー機能でこの問題に対処できる。ユーザの便宜を図るため、これは完全にカスタマイズ可能である。前置詞句の問題も後述する固定パターン置換で大部分対処できる。

実のところ後編集作業のかなりの部分を占める頻繁で細かな変更（例えば冠詞の挿入（スラブ語）又は削除（ロマンス語））については、自動挿入／削除機能を一連の語（例えば冠詞及び／又は前置詞）に使用できる。局所語順反転にも同様の機能を使用できる。これは名詞が後ろに続く形容詞／分詞にとって重要な機能となるが、さらに発展させ、２つの語の順序だけでなく語と句の順序や２つの句の順序を反転させることも可能である。例えば、フランス語テキストからの機械翻訳出力が「ｐｏｌｉｃｉｅｓａｎｄｓｔｒａｔｅｇｉｅｓｎａｔｉｏｎａｌａｎｄｉｎｔｅｒｎａｔｉｏｎａｌ」なら、シングルクリックかキーストロークによる順序反転機能でこれを「ｎａｔｉｏｎａｌａｎｄｉｎｔｅｒｎａｔｉｏｎａｌｐｏｌｉｃｉｅｓａｎｄｓｔｒａｔｅｇｉｅｓ」に移動することができる。つまり、この反転機能には局所分割機能が組み込まれているといえる。

反転機能をさらに発展させ、該当するセンテンスツリーの中に階層スケールを設けることができる。編集者は、トークンレベル、接続詞レベル、直接的な句レベル、より上位の句又は節レベルで構造反転を選ぶことができる。これにより反転への入力としての分割プロセスが事実上自動化され、作業の負荷は半減する。ユーザは右クリックドロップダウンユーザインターフェイスを通じて階層反転レベルを選択できる。

全体的な自動化が可能でない場合には、上述したツールを局所レベルで使用することによって翻訳者の作業は大いに楽になる。ただし本発明のさらなる実施形態は、ことによると先々の文書への投影をも含む、パワフルな全域変更機能を提供する。全域変更は、文字列置換レベルで、及び／又は構文解析パターン置換レベルで、遂行できる。後者は、標準的なＴＭシステムの限界を超えた、よりパワフルな技術である。前者にも従来のＴＭを凌ぐ大きな利点がある。

この方面で本発明の実施形態から提供される２つの大きな利点として、通常ならば文全体の再利用しか提供しないＴＭシステムに対し、文字列置換はサブセンテンスレベルで行われる。さらに変更は、これを再び提示するため保存するのではなく、事前に文書に投影されるから、自明の変更を再確認する必要はない。

従来のＴＭのもう１つの特徴として、従来のＴＭは「曖昧一致」を提供する。これは、完全な一致ではなく非常に近い／そこそこ近い一致（ユーザ設定次第）の場合でも置換文が提供されることを意味する。これはワープロの検索置換機能を凌ぐＴＭシステムの能力である。ただしこれらの機能は純粋に統計的なものであって、何ら意味論的なものではない。より精緻なツールも可能ではあるが、従来のＴＭの曖昧置換機能は所定のデータ等価率に基づいている。本発明の実施形態は、次節で説明する構文解析パターン置換機能のほかに、曖昧変更の妥当性を保証する形態感知型置換機能を文字列レベルで提供する。この機能は特定の要求に合わせてカスタマイズでき、翻訳者の「お役所的」仕事を削減する。

好適な実施形態では、ある特定の語に関連するパターンだけを置換する固定パターン置換も可能である。文脈によっては適切であったり適切でなかったりする不完全な一致をそのまま提供することによって、しかるべき最終結果に到達するまでに余分な仕事をどっさり増やすのではなく、置換が望まれる文脈を分類するこの機能は、ライバルにあたるＴＭアプローチより格段に効率的である。

本発明のいくつかの実施形態では、テキストを選択し、右クリックしたときに開く文字列置換ウィンドウで文字列置換を実行できる。図４は、本発明の一実施形態における文字列置換ウィンドウの一例を示す。

この例で、文字列の最大長はＯｐｔｉｏｎｓドロップダウンリストで設定できるが、この機能の利点が最も発揮されるのは約５単語までの文字列である。このウィンドウの置換入力ボックスには新規の文字列を挿入できる。既存の置換済み文字列から置換対象文字列にできるだけ近い文字列をプロンプトする機能のほかに、ユーザが適当な置換文字列をさらに探すことを望む場合には検索を簡単に行えるドロップダウンリストが提供される。これにより、作業の簡便さと一貫性の両方が向上する。ユーザは文字列が得られない場合に、任意の文字列を打ち込むかディクテーションで入力できる。文字列を入力したユーザは、その文字列を使って文書の中で全域置換を行うか、あるいは先々の文書で同じ文字列が再び出現する場合に使用するためその文字列をマクロとして記録するかを決めることができる。これは、大文字・小文字の区別や語全体の使用に関する仕様に従って行うことができる。ここでも形態認識機能を適用できる。例えば、フランス語の句ｆｏｒｍｕｌａｉｒｅｄｅｒｅｇｉｓｔｒａｔｉｏｎをｒｅｇｉｓｔｒａｔｉｏｎｆｏｒｍに変更するなら、複数形の場合にもこの変更を自動的に行うこともできる。図５は、本発明の一実施形態における置換マッピングウィンドウを示すコンピュータスクリーンショットである。

形態置換機能は句内整合機能を具備するという点においても、よりパワフルである。これにより、後編集者は、任意の長さの句（実際面では約１０語まで）を選択し、その句の中にある任意の語、又は原則として全ての語と、置換句との間で系統的整合を果たすことができ、形態調整機能による変更の後には各々の置換語が同じ句に適用される。例えば、ＭＴ出力テキストがＴｈｅｂｏｄｙｇｒａｎｔｓｐｅｒｍｉｔｓｔｏｓｅｅｋｅｒｓｈａｌｆ−ｙｅａｒｌｙなら、整合機能を使って語ｂｏｄｙをａｕｔｈｏｒｉｔｙに、語ｇｒａｎｔｓをｉｓｓｕｅｓに、語ｐｅｒｍｉｔｓをｌｉｃｅｎｓｅｓに、語ｓｅｅｋｅｒｓをａｐｐｌｉｃａｎｔｓに、語ｈａｌｆ−ｙｅａｒｌｙをｓｅｍｉ−ａｎｎｕａｌｌｙに、それぞれ対応させることができる。これは、繰り返し出現するまったく同じ句が適切に置換されるだけでなく（ＭＴと同じ）、形態学的に同属のものも適切に置換されることを意味する。例えば、Ｔｈｅｂｏｄｙｇｒａｎｔｅｄｐｅｒｍｉｔｓｔｏｓｅｅｋｅｒｓｈａｌｆ−ｙｅａｒｌｙは適切にＴｈｅａｕｔｈｏｒｉｔｙｉｓｓｕｅｄｌｉｃｅｎｃｅｓｔｏａｐｐｌｉｃａｎｔｓｓｅｍｉ−ａｎｎｕａｌｌｙになる。

この整合機能は、既に上で述べた、概括的置換を保留する、もう１つの重要でパワフルな特徴を持つ。これは文書の中で変更が行われ、変更が不適切な場合にはキャンセルされ、さもなくば、例えば「デバッグモード」を使って、別の置換が行われることを意味する。これは後述するとおり、新規文書にプロファイルを適用するときに所定のマクロを起動するのにも使える。

変更が文書全体で行われる場合は、実際に行われた変更の数をメトリック機能で直ちに伝えることができる。ある１つの句の変更数はしばしば１つ以上の他の変更のそれの目安となり、これをもとに全域変更が有利かどうかを判断できるから、これは特に熟練ユーザにとって有利である。メトリック結果は様々な形式で提示でき、今後のマクロ計画に役立てることができる。

先々の文書に変更を投影する場合は、その変更をマクロとして登録し、ユーザによって特定の文書のために作成されるプロファイルか、一連の文書のために作成されるプロファイルに盛り込むことができる。これらのプロファイルの作成と編集と使用については後ほど説明する。

文字列処理とパターン処理では、（標準ＴＭ曖昧度マトリクスに従い、又はレギュラーフォームコンセプトの活用により）ニアミスを含めるように置換機能を拡張することができる。これは特にＯＣＲ出力テキストや、原文全般に見られる非意味論的欠陥（例えば、タイプミス、句読点の間違い、及び散在する空白）の処理に役立つ。曖昧レベルは設定でき、及び／又は曖昧次元は選択できる（例えば、特定の品詞に対する感度、句読点に対する加重拡大、文、句、又は動詞加重の選択等）。編集者が包含又は排除又は個別置換にケースバイケースで対応するための対話型ボックスを用意できる。図６は、新規マクロの作成と編集を行う編集モードのスクリーンショットを示す。

句レベル操作の弱みとして、文レベルの（曖昧）繰り返しを取りこぼすおそれがある。これは従来のＴＭシステムの強みである。このため、初出の文に対する局所的編集作業を繰り返しのときに再現できないおそれがある。この問題は、完成した編集済み文を対応するＭＴ出力文に相関し、その文への文字列適用を許すＴＭバックアップ機能によって解決できる。ＴＭバックアップは最終的な編集済み出力を、（局所編集ではなく）概括化処理のみの対象となるＭＴ出力に組み合わせてペアにする。その結果、局所編集は必要に応じて自動的に再現できるから、ＴＭシステムに残された優位はなくなる。

ＴＭバックアップでは、単なる文字列の類似性だけでなくタグ付きパターンを記録することもできる。このためシステムは従来のＴＭ一致を提供できるだけでなく、パターンマクロとしてまだ登録されていない初期のパターン変更に基づいてパターン置換を提供できる。ヒト編集者は、繰り返しの見込みが高く、パターンマクロを作成するだけの価値があるパターンを判断することはできないから、これは非常に便利である。この強化ＴＭ機能によって取りこぼされた重要パターンはプロンプトできるようになる。ヒト編集者は新規の局所的文脈でパターン変更を役立てることができるほか、既製マクロを新規パターンマクロに取り込んで何度でも使用できる。

このような理由から上述した文字列パターン置換は従来のＴＭよりパワフルだが、単なる文字列ではなく構文解析順序レベルの自動置換という大きな可能性もある。なぜなら、構文解析順序は、実際の意味的注入とは別の構文パターンをピックアップする可能性を提供するからである。これは後述する。

フランス語の句ｆｏｒｍｕｌａｉｒｅｄｅｒｅｇｉｓｔｒａｔｉｏｎの例に戻り、これはすでに複数形の場合まで概括化できる。ただし、よりパワフルな概括化はｆｏｒｍｕｌａｉｒｅｄｅｄｅｃｌａｒａｔｉｏｎ又はｆｏｒｍｕｌａｉｒｅｄ’ａｔｔｅｓｔａｔｉｏｎ等、関連する句にまで及ぶ。これらのケースでは、本発明の実施形態が（従来のＴＭとは違って）句の統語構造を理解するという事実を利用し、概ね次のような働きをするルールを成立させることができる：もしもｆｏｒｍｕｌａｉｒｅｄ（ｅ）［名詞］が見つかるなら、［名詞］ｆｏｒｍに置き換える。至極基礎的な例ではあるが、パターン置換の使用は、システムを使用する翻訳者の技能とテキストの従順性しだいで無限に発展させることができる。

上の例は２つの大きな絞めつけを被る。まず第一に、この例の句は極めて短い。単なる名詞と形容詞の順序の反転は別として、実際これは最短の句である。第二に、この例ではある１つの句を（その都度変えることはできるが）検討しているに過ぎない。

これはさらに概括化できる。任意の長さの順序を選択することは可能であり、さらにそれに変更を施し、先に検討した単純なケースと同じ成果を多少なりとも得ることも可能である。ここで厄介なのは過剰概括の問題が拡大することである。例えば、前と同じルールに従って「ａｃｔｉｖｉｔｉｅｓｏｆｉｎｓｕｒａｎｃｅａｎｄｒｅｉｎｓｕｒａｎｃｅ」を「ｉｎｓｕｒａｎｃｅａｎｄｒｅｉｎｓｕｒａｎｃｅａｃｔｉｖｉｔｉｅｓ」に変換することはできるが、ａｎｄの後ろの語がこの句の一部でない場合には危険を背負うことになる。

この問題は、文字列やそれよりも大きいパターンの中でのパターン変更を「固定」し、接続詞の後に続く名詞が別の句に属する文脈を概括的自動変更から除外することによって回避できる。後続の実施形態では、句を強調表示するための句境界認識機能から句境界標識をパターン／構文置換マクロそのものに組み込むことが可能となる可能性がある。

原則として、句の長さに制限はない。これは、従来から節と呼ばれているものを構成することもあれば文全体にまで及ぶことすらある。これは文法上の目的から組み合わされたひとまとまりの語を意味するに過ぎず、何らかの再配置を要する。

ゲルマン語派のいずれかの言語で、ＭＴエンジンからの典型的な出力は次のようになる。

Ｔｈｅ（ｉ）［ｏｎｔｈｅａｃｃｏｕｎｔ］（ｉｉ）［ｃｒｅｄｉｔｅｄ］（ｉｉｉ）ａｍｏｕｎｔ（ｉｖ）

この場合、これに対応する英語の翻訳はＴｈｅａｍｏｕｎｔｃｒｅｄｉｔｅｄｏｎｔｈｅａｃｃｏｕｎｔである。変換にあたっては２つの変更を要する。まずは（ｉｖ）を（ｉｉ）の手前に移し、次に（ｉｉｉ）を（ｉｖ）の後ろに置かなければならない。この場合、細かな語を追加又は削除する必要性や大文字化の問題（ならびに句読点処理の、特にカンマ処理の、問題）は無視してよい。

ここで単純なドラッグ・アンド・ドロップを活かすこともできるが、ドラッグしなければならないのは個々の語ではなく従属句であるという事実を踏まえてこの機能を修正することもできる。人間工学上の利点は（ｉｉ）を簡単に選択できるかどうかに大きく左右される。

変換された的確な句は全域マクロに登録できる。図７は、句再配置マクロの設定に用いる句再配置ウィンドウのスクリーンショットを示す。句再配置マクロは、すでに文字列置換機能のところで検討したマクロに類似するが、複雑な情報構造のため文字列置換のそれよりも多くの処理が要求される。これは新規テキストでのプロファイル工程に利用できるほか、上述した類の将来のドロップダウンで代替候補を提供するのに役立てることができる。

先に述べた形態多様性吸収機能を使うことも可能である。これは英語以外の言語でより一層重要となる問題ではあるが、英語においても少なくとも複数形と単数形とで形態変化がある。そこで、少なくとも以下に記す句は、最初の句の後に自動的に変換しなければならない。

Ｔｈｅ（ｉ）［ｏｎｔｈｅａｃｃｏｕｎｔ］（ｉｉ）［ｃｒｅｄｉｔｅｄ］（ｉｉｉ）ａｍｏｕｎｔｓ（ｉｖ）

Ｔｈｅ（ｉ）［ｏｎｔｈｅａｃｃｏｕｎｔｓ］（ｉｉ）［ｃｒｅｄｉｔｅｄ］（ｉｉｉ）ａｍｏｕｎｔ（ｉｖ）

Ｔｈｅ（ｉ）［ｏｎｔｈｅａｃｃｏｕｎｔｓ］（ｉｉ）［ｃｒｅｄｉｔｅｄ］（ｉｉｉ）ａｍｏｕｎｔｓ（ｉｖ）

ただし、重要な利点は構造的に近似する句まで拡張することによって得られる。

以下（そして無論これの全形態学的同類）を検討する。

Ｔｈｅ（ｉ）［ｆｒｏｍｔｈｅａｃｃｏｕｎｔ］（ｉｉ）［ｄｅｂｉｔｅｄ］（ｉｉｉ）ａｍｏｕｎｔｓ（ｉｖ）

この例も自動変換に組み入れ、まずは現在の文書の残りの部分で、さらにそれ以降の全ての文書で、処理することができれば大いに有利であることは明白である。それには、「ｄｅｂｉｔｅｄ」を「ｃｒｅｄｉｔｅｄ」と同じＰＯＳとして認識し、文脈の中でまったく同じように簡単に移動できるようにしなければならない。このほかに、前置詞の変更も相応に行わなければならない。

現在利用できる統計型ＭＴを使用し、この変更を実現するように動詞と句前置詞をリンクすることは不可能か、さもなくば人間工学的に是認されない可能性がある。ただし、もしもｄｅｂｉｔｅｄ句が後ほどこの文書の中で（又は以降の文書の中で）（ｉｉ）、（ｉｉｉ）、及び（ｉｖ）の正しい順序で出現し代名詞が変わらないなら、前置詞の変更を人手で入力するだけでよく、システムは変換辞書を自動的に更新するから、人間工学上のメリットはある。

その結果、時間が経つにつれプロファイル工程にかかる時間は当初のＭＴ処理より大幅に長くなる可能性がある。多くの場合、これは合理的な分業を意味する。ＭＴは引き続き有用な要約をほぼ瞬時に出力し、他方パターン置換マクロの適用にはそれよりも遥かに多くの時間がかかるが、それでも職業翻訳の所要時間の点で後編集プロセスの改善につながる。

これより、再構成パターンをより広くテキスト（及び言語）にわたって投影する可能性を論ずる。これらのオプションは、ユーザがシステムに馴染むにつれて提供できる。

これを果たす２つの可能性をこれより説明する。まずは純粋なＰＯＳ句再構成機能がある。これは、何らかの好適なＰＯＳタグ付け基準に従って形成された同じ統語構造を持つ（又は同じ統語構造を持たない）句ならどんな句にでも通用し得る。これは明らかにパワフルなツールであるが、数多くのカウンタインスタンスを有用な結果として生み出す危険がある。

ある種のハイブリッド又は固定句再配置機能はより実用的な資源であり、これはプロトタイプで使われる実際の語を１つ以上含む句に適用する。これらの実際の語は、過剰概括の危険を最小限に抑えることができる文脈だけに置換を固定する。例えば、最初の最も単純な例に戻り、語ｆｏｒｍとの関係で一般的な構造変換パターンを確立することができる。

これは２通りに発展させることができる。まず、「ｆｏｒｍｏｆｅｍｐｌｏｙｍｅｎｔ」や「ｆｏｒｍｏｆｗｏｒｄｓ」等、例外を導入する迅速で効率のよい方法を用意する必要がある。究極的には例外そのものを有効に投影できるように分類することも可能であろう。これには２通りのやり方があり、１つはブール演算子を使って概括化が適切でない文脈を指示するやり方であり、もう１つはマクロの中で顕著な例外をあらかじめ指定するやり方である。例外の数はトークンで多くタイプで少なくなることが見込まれるから、かかる例外は人間工学的に非効率的ではない。また、例外構築プロセスはシステムオプションを通じて幅広くカスタマイズできる。

２番目の発展形では変換で同様に扱われる語を導入する。例えば翻訳者は、語「ｆｏｒｍ」の周辺で成立するパターンを「ｃｅｒｔｉｆｉｃａｔｅ」に、場合によっては「ｄｏｃｕｍｅｎｔ」に、投影することを決めることができる。後者は、翻訳者が言語全体ではなく文書のレベルで翻訳を概括化することを指定する場合である。

本発明のいくつかの実施形態においては、ある特定の非統語論的形成異常を、実際にはそれに変更を加えたり変更を提供せずに、強調表示できる。これにより翻訳者の注意はそれらに集まり、機能の価値はテキストの全体的処理スピードに反比例して増加する。

これらの基礎的再構成装置の拡張は、例えば高度な技能を持つユーザに対し、オプションとして提供できる。ただしそれらはＭＴ出力と後編集技術との関係の進化を実証するものであり、これは成熟した統計型ＭＴの登場によってより顕著となるであろう。

本発明のいくつかの実施形態は、機械生成テキストやその他の翻訳テキストに固有の欠陥を取り除くさらなるツールとして後−後編集（ＰＰＥ）文法・スタイルチェック機能を提供する。これは、出力テキストの最終通読として対話的に機能する。このモジュールは、ゲルマン語の主語−動詞の置き違え等、ヒト後編集者が見落とした明らかな語の配置替え及び／又は句の繰り返し、その他をピックアップする。文法チェックツールは、本発明から提供される他の機能と同様、後編集プロセス全体を条件付ける起点言語の識別にある程度従い、ヒト編集者の個々の要求に合わせて調整できる。

残された文法／構文上の誤りを除去することに加え、このエンジンはスタイル介入を提供することもできる。ここでもヒト後編集者は特定のパラメータを規定する（特に前置詞又は形容詞句の順序に関係するパラメータ）。これらのパラメータの違反にはフラグが付され、ヒト編集者にはデフォルト仕様への適合を取り戻すための一連の介入ツールが与えられる。この機能は既存のスタイルチェック技術を基礎とし、特定のＭＴ後編集要求に合わせて改作できる。

文字列置換機能とパターン置換機能から生成されるマクロはプロファイルに格納できる。かくしてプロファイルはマクロを集めたものとなる。プロファイルはＴＭシステムの翻訳メモリに相当し、時間の経過にともない進化する。したがってプロファイルそのものが価値ある知的財産となる。プロファイルには２つの形が、すなわち文字列マクロのそれとパターンマクロのそれがある。いずれも基本的には同じ働きをするが、文字列マクロのほうが処理負荷が軽いから、文字列マクロのほうが格段に速い。好適な実施形態においては、これらのプロファイルを自由に組み合わせ、新規のテキストに対応するプロファイルを作ることさえできる。

本発明のいくつかの実施形態においては、言語認識モジュール（ＬＲＭ）がプロファイルマネージャにとって重要な補足機能となる。これは原文（ＭＴエンジンへ入力される前のものも含む）の言語を識別する。この場合は、言語に精通しないユーザでも最初に適当なＭＴエンジンを選択するか、又は機械翻訳に適用する設定を選択し、その後で適当なプロファイルを選択し出力を実行できるから便利である。これは例えば、中国語をまったく知らない人物が自身のシステムで２、３の設定を行うだけで叩き台となる文書の翻訳を作れることを意味する。

図８は、本発明の一実施形態におけるマクロプロファイルマネージャのスクリーンショットを示す。マクロプロファイルマネージャは、コントロール及び選択ボタンとマクロのリストを表示するリスト表示エリアとを含むウィンドウの中で実行される。プロファイル選択ボタンによって、ある特定のプロファイルにおけるマクロのリストが表示される。リストの中では、マクロ名とマクロの色分けを示すボックスとともに各マクロが提示される。ある特定のマクロでポインタをクリックすると、ポップアップマクロオプションメニューが現れる。この例では実行と、表示と、優先順位の変更と、名前の変更と、コピーと、移動と、削除と、閉じるためのオプションが提示されている。プロファイルの中でマクロやマクロの部分を検索する様々な検索オプションを提供することもでき、蓄積された資料を読者に向けて様々な角度から明快に表示できる。

プロファイルマネージャオプションは新規文書が開くときに、その文書に対して１つ以上のプロファイルを実行することをユーザに提案できる。これは、プロファイルの中の各マクロが大文字・小文字の区別、分割、及び形態に関する所定のパラメータに従って置換を要する状況を見つけ相応に置換することを意味する。

図９は、本発明の一実施形態におけるプロファイル実行マネージャのスクリーンショットを示す。第１のウィンドウはプロファイルのリストを提示し、この例のそれは「ｄｅｆａｕｌｔｐｒｏｆｉｌｅ」と、「ｄｕｔｃｈｔａｘａｔｉｏｎ」と、「ｆｉｒｓｔｈｏｌ」と、「ｔｎｔ」と、「Ｇｅｒｍａｎｃｏｍｐｕｔｅ」と、「ｇｅｒｍｔａｘｌｅｇ」と、「ｓｅｐｔｆｒｅｎｃｈ」とを含む。この例では「Ｇｅｒｍａｎｃｏｍｐｕｔｅ」プロファイルがあらかじめ選択され、強調表示されている。第２のウィンドウは、選択されたプロファイルの中で使用できるマクロのリストを提示する。各マクロにはカラーマーカーが対応しており、選択や選択の解除ができるようになっている。第３のウィンドウは、マクロを使って処理する文書のリストを提示する。第４のウィンドウは、選択されたプロファイルで選択したマクロのリストを提示する。プログレスバーは、選択されたマクロを実行するシステムの進捗状況を表示する。

このプロセスが完了した後にはメトリックが処理結果を提示し、選択されたプロファイルの適切性やテキストに対する残りの作業量をつかむのに役立つ。図１０はプロファイル実行の詳細を示すスクリーンショットである。第１のウィンドウエリアは置換のリストをそれぞれの回数とともに提示する。これをもとに翻訳者は置換の回数が予想に反し、詳しい調査を要する状況をつかむことができるから、翻訳者にとって有益な情報である。置換を含む編集済みテキストは第２のウィンドウエリアで提示される。

そしてユーザは上述したツールを用いたテキスト編集に進むことができる。内容が類似する数通りの文書を翻訳する場合に、いくつかの類似するテキストを使って関連するプロファイルを構築したら、それ以降の後編集者の仕事は、文字列置換やパターン置換の余地が残っていない局所的変更に実質的に限定されるであろう。

プロファイルは当然、密接に関係する一連の文書でその最たる効果を発揮し、銀行／保険契約における債券発行目論見書や融資覚書はその好例である。ただしこのプロファイル管理機能では、マクロの再利用と組み換えを通じて新規の文書に最も役立つプロファイルを用意することができる。例えば、成熟したドイツ語通信セクタ用プロファイルと成熟したドイツ語銀行契約書用プロファイルがあると仮定する。そして今、ドイツ語の通信契約書を翻訳する必要があるとする。この場合は、２つのプロファイルから役に立つ見込みが高いマクロを選び、それらをドイツ語通信契約書専用の新たなプロファイルにまとめることができる。さらに重要なこととして、特定の顧客や特定のプロジェクトに合わせてプロファイルを作ることも可能である。既に用語は実行段階で自動的に指定されており、語彙の適用にあたって人的誤りの可能性はないから、用語の統一を図る上で非常に効果的である。図１１は、マクロを別のプロファイルにコピーするためのユーザインターフェイスのスクリーンショットを示す。第１のウィンドウエリアはマクロのリストを提示し、この例ではあらかじめ３つのマクロが選択されている。第２のウィンドウエリアは編集後テキストを提示する。ポップアップウィンドウは、選択されたマクロのコピー先（すなわち他のマクロ）のリストを提示する。コピー手順を開始するユーザ指示を受け付けるため「ｃｏｐｙ」ボタンが用意されており、さらにコピープロセスを終了するため「ｃｌｏｓｅ」ボタンが用意されている。これは１つの可能な実施形態に過ぎず、例えばプロファイルの管理にあたって異なるユーザインターフェイス機能及び／又はツールを使用するさらなる実施形態も可能である。

単純に両方のプロファイルを新規テキストで実行することも可能であり、多くの場合はこれが最良の方法であろう。しかし場合によっては、ある１つの文脈で役に立つマクロが別の文脈で実際に弊害をもたらすこともある。これは、文字列置換（Ａｎｌａｇｅの例）よりむしろパターン認識に広く当てはまる問題である。

プロファイルを「切り詰める」ことができればマクロのモジュール構造が活かされ、基礎的なプロファイルを自由に組み合わせながら新規テキストにとって最良の初期入力を用意できる。この機能はマクロに標識を付けるシステムによって確保できる。例えば色分けシステムを使用できる。マクロを作成するときには、ほかの場所で弊害をもたらす見込みが高いもの（赤）、弊害をもたらす可能性があるもの（黄）、無害なもの（緑）として、マクロをマークできる。以降の編集プロセスでは、この色分けをもとに弊害をもたらす可能性があるマクロ（又は容認し難いほど長い時間がかかる可能性があるマクロ）を簡単に削除できる。ユーザはプロファイルの発展にともない、後編集の仕事そのものがプロファイルを適切に選択し編集する作業に徐々に取って代わられ、生産性の点で明らかに有利であることに気づくであろう。好ましくはプロファイルの内容表示にあたって、色分けされた項目のサブグループ又はグループの一部又は全部を選択し、表示するように設定できる。

上述した言語認識機能は、既存のプロファイルにあるマクロを組み合わせて新しいプロファイルにまとめる作業に大いに役立てることができる。これにより、ある１つの外国語からのＭＴ出力処理に由来するマクロと別の言語に由来するそれとの取り違えを保証できる。この安全レベルの向上によって、ヒト編集者はマクロの色分けに対する警戒策を緩めることができ、適切な言語の中でのマクロ利用を高めることができる。

翻訳者にとって、従来のＴＭシステムから本発明によるシステムへの移行にあたって、それまで蓄積された、場合によってはかなりの資産に相当する、翻訳メモリの利点を失う可能性は、１つの障壁となる可能性がある。本発明の実施形態ではこの問題を回避するため、好ましくは翻訳メモリをプロファイルへダイレクトにインポートできるようにする。翻訳メモリは、原文と訳文を（２つのテキストの書式、その他に関するある程度の量の追加情報とともに）集めたものである。本発明の実施形態において、マクロは原文と訳文の文字列ではなく、ＭＴ出力と訳文の文字列を相関させる。ただし、ＭＴ出力の文を原文に相関させることは造作ない（つまり、翻訳メモリに含まれた原文に対してＭＴエンジンを実行する）。新規文書の翻訳にあたって同じＭＴエンジンを使用するなら、繰り返し現れる文はピックアップされ、翻訳メモリシステムを使用する場合とまったく同じように置換される。よって、翻訳メモリにある異言語間文相関情報は、本発明の実施形態によるプロファイルへ自動的に容易く移すことができる。ＭＴエンジンと後編集者とのインターオペラビリティを最適化するため、プロファイルからＭＴユーザ辞書にかけてダイレクトにマクロを送り込むことにより同様の利点を得ることができる。

要約すると、ＭＴはようやく翻訳ツールの主流として確立されつつあり、統計型ＭＴの登場により今後数年間はこの傾向が続くであろう。しかしＭＴとＦＨＱＴ（完全に人間並みの翻訳）とのギャップはいつまで続くか分からない。これは古典的「ラストマイル」問題の一例である。ＭＴシステムにとっては、（現在インターネットでよく利用されているように）人の手を借りずに、要旨をつかむことを目的としたテキストに近づけることのほうが容易く、完全に人間並みの品質に到達する最後の一歩というところでは今なお熟練翻訳者が必要とされる。ＴＭや従来の直接的翻訳に比べてこのギャップはＭＴにとって今なお大きいため、ＭＴの実用性は今なお支持されていない。ＯＣＲ技術の着実な進歩もＭＴタイプの技術の改良を後押しする重要な材料である。

本発明の実施形態は、人間並みの品質を達成するためＭＴ出力で効果的な局所介入を行う一連のツールを提供することにより、及び／又は文字列レベルと構文解析パターンレベルの両方で繰り返し出現する構造の効果的再利用を極大化することにより、このギャップの橋渡しとなる完璧な環境を提供する。

これは、ＭＴとＴＭの最良の部分を組み合わせたものといえる。翻訳にあたって既に機械に備わる便利な部分は最大限利用する一方で、蓄積された繰り返しは従来のＴＭシステムより有効に活用できる。その結果、本発明の実施形態は密接に関連する一連のテキストの場合（ＴＭの得意分野）でもＴｒａｄｏｓやその類似品を凌駕するほか、ＴＭではまるで役に立たないどころか最初に文の一致を入力するという骨の折れる作業が要求される完全に「手つかずの」テキストの場合でも、（翻訳者にとってシステムが成熟した時点で）その翻訳に大きく貢献する。

本発明のいくつかの実施形態には、プロファイルを作っていくらでも再利用、再配備できるという大きな利点がある（ここでもＴＭ翻訳メモリの限界を超越する）。プロファイルは進化し、プロファイルそのものが重要な資産となり、ソフトウェアそのものと併せて販売したり、オーダーメイド方式で委託製作できる。

本発明の好適な実施形態は、例えばＭｉｃｒｏｓｏｆｔＯｆｆｉｃｅ形式をはじめとする既存の主要ファイルタイプの全てに適合する。本発明の実施形態は、スタンドアロンモードで単独で作動できるほか、ＭＳＷｏｒｄ等のテキスト編集アプリケーションでプラグインとして作動できる。後者の場合、Ｗｏｒｄの編集機能の殆どはそのまま利用できる。本発明の実施形態はこれ以外のファイル形式でも、例えばＭＳＯｆｆｉｃｅに含まれる他のファイル形式でも、様々なデスクトップパブリッシング環境やウェブ環境でも、利用できる。文書から文書にかけてマクロの形で保存される情報はどんな形式のファイルにでも等しく配備できる。本発明の実施形態は、ＭＳＷｏｒｄ以外のＯｆｆｉｃｅ形式文書でもＭＳＷｏｒｄ形式の文書と同様の成果をもたらす。

上述した例は、例えば、英語、フランス語、ドイツ語、ロシア語、スペイン語、中国語、日本語、イタリア語等をはじめとするヒトの意志伝達言語の翻訳と後編集に関するものだが、本発明は、例えば、Ｃ＋＋、ＶｉｓｕａｌＢａｓｉｃ、Ｊａｖａ（登録商標）ｓｃｒｉｐｔ、Ｊａｖａ（登録商標）等をはじめとするコンピュータプログラミング言語の翻訳の後編集にも利用できる。例えば、プログラムのソースコードを第１の言語で記述したコンピュータプログラマが、例えば第１の言語より速く実行する、第１の言語より新しい、第１の言語より扱いやすいといった理由から、別の言語を使ってそのプログラムを改作することを望むことはありうる。この場合、上述した機能はどれでも使用又は改作でき、コンピュータプログラミング言語の自動翻訳に役立てることができる。かかる実施形態では、コンピュータプログラミング開発パッケージとの統合等、特別な機能を提供できる。いくつかの実施形態において、上記のタスクに専用のマクロを開発し、単独のアドオンとして提供できる。このソフトウェアは、自然言語の機械翻訳の後編集の場合とまったく同じ要領で既存又は将来の自動コンピュータ言語間翻訳システムを支援するのに役立てることもできる。

本発明の実施形態は、様々な種類の文書の形式変換に、又はバイナリファイル、符号化ファイル、その他のデータファイルからの可読テキスト抽出に、役立てることもできる。

これまで本発明を、現時点におけるこれの好適な実施形態の観点から説明してきたが、当業者にとって、特許請求の範囲によって規定される本発明の範囲から逸脱することなく様々な変更を好適な実施形態に施せることは明白であろう。

本発明の一実施形態を実装する装置を示すブロック図である。本発明の一実施形態でテキスト整合ウィンドウを示すコンピュータスクリーンショットである。本発明の一実施形態で編集・翻訳プロセスの要約を示すフローチャートである。本発明のさらなる実施形態で文字列置換ウィンドウを示すコンピュータスクリーンショットである。本発明のさらなる実施形態で置換マッピングウィンドウを示すコンピュータスクリーンショットである。本発明のさらなる実施形態で新規マクロ作成のための編集モードを示すコンピュータスクリーンショットである。本発明のさらなる実施形態で句再配置ウィンドウを示すコンピュータスクリーンショットである。本発明のさらなる実施形態でマクロプロファイルマネージャを示すコンピュータスクリーンショットである。本発明のさらなる実施形態でプロファイル実行マネージャを示すコンピュータスクリーンショットである。本発明のさらなる実施形態でプロファイル実行の詳細を示すコンピュータスクリーンショットである。本発明のさらなる実施形態でマクロを別のプロファイルへコピーするマクロ選択ボックスの一例を示すコンピュータスクリーンショットである。

Claims

少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ここで前記コントローラは、前記テキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、前記句を、その構文プロパティ、又はその語彙プロパティ、又は両方の点で再構成又は修正するため、又は所定のユーザ指示を受けて前記テキストの別の部分へ移動するため、個々の句を自動的に選択する手段とを備える、
テキスト編集装置。
前記コントローラは、ユーザ指示又は格納済み修正手順に従って個々の単語列の語彙的内容を修正するように、且つ追加の単語列の修正にあたって前記ユーザ指示又は修正手順を再利用するように、構成され、ここで前記再利用は形態変化を含みうる、請求項１に記載のテキスト編集装置。
前記コントローラは、前記テキストの構文解析を遂行するように適応され、前記ユーザ入力手段は、前記構文解析に用いる構文単位の仕様についてユーザ指示を受け取るように構成される、請求項１に記載のテキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ここで前記コントローラは、句及び／又は句境界を識別する手段と、指定言語に固有の自動句配列ルールを実施する手段とを備える、
テキスト編集装置。
前記句配列ルールは、文脈固有ルールを備え、前記文脈固有ルールは、１つ以上の標識語又は標識表現基準に従って配備される、請求項４に記載のテキスト編集装置。
前記コントローラは、句タイプに従って前記ディスプレイ上に句の強調表示を提示するように構成される、先行する請求項のいずれかに記載のテキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ここで前記コントローラは、前記翻訳前及び翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、前記翻訳前テキストの第１の句に出現する語と前記翻訳済みテキストの対応しない第２の句に出現する対応する語とを識別する手段とを備える、
テキスト編集装置。
前記コントローラは、前記テキスト内の句パターンをテンプレート句パターンに比較するように、且つ差異にフラグを付すように、構成される、請求項７に記載のテキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ここで前記コントローラは、ユーザ指導ドラッグ・アンド・ドロップ編集を可能にするように、且つ文における前記テキストの新規位置に応じて編集済みテキストの大文字・小文字及び／又は句読点を自動的に修正するように、構成され、これは空白の適切な処置を含みうる、テキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ここで前記コントローラは、句を識別するように、且つ個々の句の中の語について数、大文字・小文字、及び／又は性の一致を検証するように、構成される、
テキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、前記第１の言語ではなく前記第２の言語に固有の文法構造を前記翻訳済みテキストにて自動的に生成する手段を備える、
テキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、前記第２の言語ではなく前記第１の言語に固有の文法構造を前記翻訳済みテキストから自動的に除去する手段を備える、
テキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、ユーザ編集の完了を指示するため入力の受け取り後に実施される文法及びスタイル調整のための自動手段を備える、
テキスト編集装置。
前記文法及びスタイル調整のための自動手段は、文法又はスタイルの調整にあたってスタイルプロファイルを使用するように構成され、前記スタイルプロファイルはユーザによる選択が可能である、請求項１３に記載のテキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、前記コントローラは、複数のテキスト編集手順を格納し、且つ前記手順のリストを編纂し、且つ別の入力テキストに使用するため保存する手段を備える、
テキスト編集装置。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御するように適応されたコントローラとを備え、前記コントローラは、テキスト編集手順を格納、蓄積、編集、及び併合する手段と、格納された前記テキスト編集手順を複数のユーザで共用する手段とを備える、
テキスト編集装置。
前記コントローラは、選択された正字法を翻訳済みテキストに適用するため自動編集プロセスを選択し且つ実施するように構成される、先行する請求項のいずれかに記載のテキスト編集装置。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理するコンピュータ装置であって、前記装置は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットを格納する情報格納手段と、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
受け取ったユーザ指示に基づき前記第１のセットを編集するテキストデータ制御手段と、
表示データを生成するように作用する表示データ生成手段とを備え、前記表示データは、表示媒体上で第１及び第２の表示エリアを規定するように作用し、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記第１の言語からの翻訳より前の前記テキストを備えるか、又は前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、ここで前記表示データ生成手段はさらに、前記表示データに区別情報を含めるように作用し、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する、
装置。
前記表示データ生成手段は、前記翻訳前テキスト及びユーザ編集前翻訳済みテキストの他方を第３の表示エリアに表示するように、且つ前記第１の表示エリアで選択された前記テキストの前記部分に対応する前記テキストの部分を前記第３の表示エリアで強調表示するように、作用する、請求項１８に記載の装置。
前記表示データ生成手段は、最初の翻訳前テキストと誤りが訂正された翻訳前テキストのいずれか一方又は両方を、それぞれ前記第２及び第３の表示エリアに、又は追加の表示エリアに、表示するように作用する、請求項１８又は請求項１９に記載の装置。
前記表示データ生成手段は、前記テキストの個々の部分をサブセンテンスレベルで強調表示するように作用する、先行する請求項のいずれかに記載の装置。
前記表示データ生成手段は、前記第１のウィンドウにて前記テキストの第１の句を強調表示し、且つ前記第２のウィンドウにて前記テキストの対応する第２の句を強調表示し、且つ強調表示された前記テキストの翻訳に相当する１つ以上の追加の語を強調表示するように作用し、ここで前記追加の語は、前記第１又は第２の強調表示された句に対し異なる句内に位置する、請求項２１に記載の装置。
前記翻訳前テキスト及び／又は翻訳後テキストの言語を識別し、且つ前記翻訳済みテキストの後編集のため後編集プロセスを自動的に選択するにあたって、及び／又は後編集プロセスの選択を検証するにあたって、前記言語識別を使用する手段をさらに備える、先行する請求項のいずれかに記載の装置。
少なくとも第１の言語から、第２の言語、第３の言語へ前記テキストを翻訳するのに使用する翻訳言語の順序を識別し、且つ後編集プロセスの選択にあたって、又は後編集プロセスの選択の検証にあたって、前記順序を使用する手段をさらに備える、請求項２３に記載の装置。
前記テキストの入力元タイプを識別することにより、そして前記入力元タイプに従って訂正プロセスを選択することにより、前記翻訳前テキストで誤りを訂正する手段をさらに備える、先行する請求項のいずれかに記載の装置。
誤りを訂正する前記手段は、前記翻訳前テキストの入力元タイプに従って翻訳前訂正を実施するように構成される、請求項２５に記載の装置。
誤りを訂正する前記手段は、前記翻訳済みテキストの入力元タイプに従って翻訳後訂正を実施するように構成される、請求項２５又は請求項２６に記載の装置。
誤りを訂正する前記手段は、光学式文字認識（ＯＣＲ）、音声ディクテーション、又はキーボードのいずれか１つとしての前記入力元タイプの識別をもとに１つ以上の処理ルールを選択するように構成される、請求項２５から２７のいずれか一項に記載の装置。
誤りを訂正する前記手段は、統計解析を用いて前記テキストの前記入力元タイプを識別するように構成される、請求項２６から２８のいずれか一項に記載の装置。
選択された正字法を翻訳済みテキストに適用するため自動編集プロセスを選択し且つ実施する手段をさらに備える、先行する請求項のいずれかに記載の装置。
数字及び／又は日付の書式設定のため選択された自動編集プロセスを実施する手段をさらに備える、先行する請求項のいずれかに記載の装置。
前記テキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、所定のユーザ指示を受けて前記句を前記テキストの別の部分へ移動するため、個々の句を自動的に選択する手段とをさらに備える、先行する請求項のいずれかに記載の装置。
句及び／又は句境界を識別する手段と、指定言語に固有の自動句配列ルールを実施する手段とをさらに備える、先行する請求項のいずれかに記載の装置。
識別された前記句の句タイプによる分類により構文モデルを構築する手段をさらに備える、請求項３３に記載の装置。
前記句タイプを指示するため識別された前記句にフラグを付す手段をさらに備える、請求項３４に記載の装置。
前記句タイプに従い前記ディスプレイ上で句の強調表示を提示することをさらに備える、請求項３４又は請求項３５に記載の装置。
前記翻訳前及び翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出手段と、前記翻訳前テキストの第１の句に出現する語と前記翻訳済みテキストの対応しない第２の句に出現する対応する語とを識別する手段とをさらに備える、先行する請求項のいずれかに記載の装置。
ユーザ指導ドラッグ・アンド・ドロップ編集を可能にする手段と、文における前記テキストの新規位置に応じて編集済みテキストの大文字・小文字及び／又は句読点を自動的に修正する手段とをさらに備える、先行する請求項のいずれかに記載の装置。
句を識別し、且つ個々の句の中の語について数、大文字・小文字、及び／又は性の一致を検証する手段をさらに備える、先行する請求項のいずれかに記載の装置。
選択された句又は語の置換にあたって複数のオプションをユーザに提供するためオートテキスト機能を実施する手段をさらに備える、先行する請求項のいずれかに記載の装置。
前記オートテキスト機能は、複数の代替訳がある語の場合に提供される、請求項４０に記載の装置。
前記オートテキスト機能は、ユーザがユーザインターフェイスを使って選択された語の前記オプションを巡回することを可能にするように構成される、請求項４０又は請求項４１に記載の装置。
オートテキスト機能は、ユーザが前記オプションを事前に定義することを可能にするためユーザによるカスタマイズが可能である、請求項４０から４２のいずれか一項に記載の装置。
オートテキスト機能は、前記オプションを外部から入手するように構成される、請求項４０から４３のいずれか一項に記載の装置。
選択された自動編集プロセスを複数の文書に適用する手段をさらに備える、先行する請求項のいずれかに記載の装置。
複数の意味を持つ訳語を識別する手段と、代替意味の置換をユーザに選択させるため提供する手段とをさらに備える、先行する請求項のいずれかに記載の装置。
第１の言語にはなく第２の言語にはある文法構造を前記翻訳済みテキストから自動的に挿入する手段をさらに備える、先行する請求項のいずれかに記載の装置。
第２の言語にはなく第１の言語にはある文法構造を前記翻訳済みテキストから自動的に削除する手段をさらに備える、先行する請求項のいずれかに記載の装置。
文字列置換機能を曖昧一致とともに実施する手段をさらに備える、先行する請求項のいずれかに記載の装置。
構文解析パターン認識・置換機能を実施する手段をさらに備える、先行する請求項のいずれかに記載の装置。
ユーザ編集の完了を指示するため入力の受け取り後に文法及びスタイルを自動的に調整する手段をさらに備える、先行する請求項のいずれかに記載の装置。
複数のテキスト編集手順を格納し、且つ前記手順のリストを編纂し、且つ別の入力テキストに使用するため保存する手段をさらに備える、先行する請求項のいずれかに記載の装置。
翻訳済みテキストの後編集のためのルール一式を備えるプロファイルを管理するプロファイル管理システム。
請求項５２に従い複数のルールを備えるプロファイルに相当するコンピュータ可読コードを保持する信号又は保持媒体。
前記ルールは、ある種のテキスト又は言語において使用するための適切性に従って各々分類される、請求項５４に記載の信号又は保持媒体。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集するテキスト編集装置であって、前記装置は、
テキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力受け取り部と、
少なくとも１つのディスプレイと、
第１の表示エリアでユーザによる編集が可能な翻訳済みテキストを提示するため、そして第２の表示エリアで翻訳前テキスト又はユーザ編集前翻訳済みテキストのいずれか一方を表示するため、ディスプレイを制御するように適応されたコントローラとを備え、
ここで前記コントローラは、前記第１の表示エリアにて前記テキストの選択部分を強調表示し、前記第２の表示エリアにて前記テキストの対応する部分を強調表示し、且つ前記ユーザ入力受け取り部を通じて新たなテキスト選択を得る場合に前記強調表示を更新するように構成される、
テキスト編集装置。
コンピュータ生成テキストを表す情報を管理するコンピュータ装置であって、前記装置は、
前記コンピュータ生成テキストを表す第１の情報セットを格納する情報格納手段と、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取るユーザ入力手段と、
受け取ったユーザ指示に基づき前記第１のセットを編集するテキストデータ制御手段と、
表示データを生成するように作用する表示データ生成手段とを備え、前記表示データは、表示媒体上で第１及び第２の表示エリアを規定するように作用し、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、ここで前記表示データ生成手段はさらに、前記表示データに区別情報を含めるように作用し、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する、
装置。
請求項１から５３、請求項５６、又は請求項５７のいずれか一項に記載の前記装置としてのコンピュータを構成するコンピュータ可読コードを保持する信号又は保持媒体。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットを格納することと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
受け取ったユーザ指示に基づき前記第１のセットを編集することと、
表示媒体上で第１及び第２の表示エリアを規定する表示データを生成することとを備え、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記第１の言語からの翻訳より前の前記テキストを備えるか、又は前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、ここで表示データを前記生成することは、前記表示データに区別情報を含めることを含み、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する、
方法。
前記表示媒体上で第３の表示エリアを規定する表示データを生成することをさらに備え、前記第３の表示エリアは、第３の情報セットに対応する第３のテキスト情報を収容し、前記第３の情報セットは、前記第１の言語からの翻訳より前の前記テキストを備えるか、又は前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、ここで表示データを前記生成することは、前記表示データに区別情報を含めることを備え、前記区別情報は、前記第１のテキスト情報の前記部分に対応する前記第３のテキスト情報の部分を、前記第３のテキストのそれぞれの残りの部分から視覚的に区別するように作用する、請求項５９に記載の方法。
表示データを前記生成することは、最初の翻訳前テキストと誤りが訂正された翻訳前テキストのいずれか一方又は両方を、それぞれ前記第２又は第３の表示エリアに、又は追加の表示エリアに、表示するため表示データを生成することをさらに備える、請求項５９又は請求項６０に記載の方法。
前記区別情報は、前記テキストの個々の部分をサブセンテンスレベルで区別する、請求項５９から６１のいずれか一項に記載の方法。
前記区別情報は、前記第１のウィンドウにて前記テキストの第１の句を区別し、且つ前記第２のウィンドウにて前記テキストの対応する第２の句を区別し、且つ区別された前記テキストの翻訳に相当する１つ以上の追加の語を区別し、ここで前記追加の語は、前記第１又は第２の区別された句に対し異なる句内に位置する、請求項６２に記載の方法。
前記翻訳前テキスト及び／又は翻訳後テキストの言語を識別することと、前記翻訳済みテキストの後編集にあたって後編集プロセスを自動的に選択するため、及び／又は後編集プロセスの選択を検証するため、前記言語識別を使用することとをさらに備える、請求項５９から６３のいずれか一項に記載の方法。
少なくとも第１の言語から、第２の言語、第３の言語へ前記テキストを翻訳するのに使用する翻訳言語の順序を識別することと、後編集プロセスの選択にあたって、又は後編集プロセスの選択の検証にあたって、前記順序を使用することとをさらに備える、請求項６４に記載の方法。
前記テキストの入力元タイプを識別することにより、そして前記入力元タイプに従って訂正プロセスを選択することにより、前記翻訳前テキストで誤りを訂正することをさらに備える、請求項５９から６５のいずれか一項に記載の方法。
前記翻訳前テキストの入力元タイプに従って翻訳前訂正を実施することをさらに備える、請求項６６に記載の方法。
前記翻訳済みテキストの入力元タイプに従って翻訳後訂正を実施することをさらに備える、請求項６６又は請求項６７に記載の方法。
光学式文字認識（ＯＣＲ）、音声ディクテーション、又はキーボードのいずれか１つとしての前記入力元タイプの識別をもとに１つ以上の処理ルールを選択することをさらに備える、請求項６６から６８のいずれか一項に記載の方法。
統計解析を用いて前記テキストの前記入力元タイプを識別することをさらに備える、請求項６７から６９のいずれか一項に記載の方法。
選択された正字法を翻訳済みテキストに適用するため自動編集プロセスを選択することと、実施することとをさらに備える、請求項５９から７０のいずれか一項に記載の方法。
数字及び／又は日付の書式設定のため選択された自動編集プロセスを実施することをさらに備える、請求項５９から７１のいずれか一項に記載の方法。
前記テキストの中で句及び／又は句境界を自動的に識別するパターン検出と、所定のユーザ指示を受けて前記句を前記テキストの別の部分へ移動するため、個々の句の自動選択とを、実施することをさらに備える、請求項５９から７２のいずれか一項に記載の方法。
句及び／又は句境界を識別することと、指定言語に固有の自動句配列ルールを実施することとをさらに備える、請求項５９から７３のいずれか一項に記載の方法。
識別された前記句の句タイプによる分類により構文モデルを構築することをさらに備える、請求項７４に記載の方法。
前記句タイプを指示するため識別された前記句にフラグを付すことをさらに備える、請求項７５に記載の方法。
前記句タイプに従って句を区別するため区別情報を生成することと、前記区別情報を前記表示データに含めることとをさらに備える、請求項７５又は請求項７６に記載の方法。
前記翻訳前テキスト及び翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出と、前記翻訳前テキストの第１の句に出現する語と前記翻訳済みテキストの対応しない第２の句に出現する対応する語との識別とをさらに備える、請求項５９から７７のいずれか一項に記載の方法。
ユーザ指導ドラッグ・アンド・ドロップ編集を可能にすることと、文における前記テキストの新規位置に応じて編集済みテキストの大文字・小文字及び／又は句読点を自動的に修正することとをさらに備える、請求項５９から７８のいずれか一項に記載の方法。
句を識別することと、個々の句の中の語について数、大文字・小文字、及び／又は性の一致を検証することとをさらに備える、請求項５９から７９のいずれか一項に記載の方法。
選択された句又は語の置換にあたって複数のオプションをユーザに提供するためオートテキスト機能を実施することをさらに備える、請求項５９から８０のいずれか一項に記載の方法。
前記オートテキスト機能は、複数の代替訳がある語の場合に提供される、請求項８１に記載の方法。
前記オートテキスト機能は、ユーザ指示を受けて選択された語の前記オプションのユーザ制御巡回を可能にする、請求項８１又は請求項８２に記載の方法。
オートテキスト機能は、ユーザが前記オプションを事前に定義することを可能にするためユーザによるカスタマイズが可能である、請求項８１から８３のいずれか一項に記載の方法。
オートテキスト機能は、前記オプションを外部から入手するように構成される、請求項８１から８４のいずれか一項に記載の方法。
選択された自動編集プロセスを複数の文書に適用することをさらに備える、請求項５９から８５のいずれか一項に記載の方法。
複数の意味を持つ訳語を識別することと、代替意味の置換をユーザに選択させるため提供することとをさらに備える、請求項５９から８６のいずれか一項に記載の方法。
第１の言語にはなく第２の言語にはある文法構造を翻訳済みテキストから自動的に挿入することをさらに備える、請求項５９から８７のいずれか一項に記載の方法。
第２の言語にはなく第１の言語にはある文法構造を翻訳済みテキストから自動的に削除することをさらに備える、請求項５９から８８のいずれか一項に記載の方法。
文字列置換機能を曖昧一致とともに実施することをさらに備える、請求項５９から８９のいずれか一項に記載の方法。
構文解析パターン認識及び置換機能を実施することをさらに備える、請求項５９から９０のいずれか一項に記載の方法。
ユーザ編集の完了を指示するため入力の受け取り後に自動文法及びスタイル調整プロセスを実施することをさらに備える、請求項５９から９１のいずれか一項に記載の方法。
複数のテキスト編集手順を格納することと、且つ前記手順のリストを編纂することと、別の入力テキストに使用するため保存することとをさらに備える、請求項５９から５２のいずれか一項に記載の方法。
翻訳済みテキストの後編集のためのルール一式を備えるプロファイルを管理するプロファイル管理方法であって、前記方法は、ユーザが選択されたプロファイルに盛り込むルールを選択するためのユーザインターフェイスを提供することを備える、
方法。
少なくとも第１の言語から第２の言語へ翻訳されるテキストを編集する方法であって、前記方法は、
テキストの選択及び／又は編集のためユーザ指示を受け取ることと、
第１の表示エリアでユーザによる編集が可能な翻訳済みテキストを提示するため表示媒体を制御し、第２の表示エリアで翻訳前テキスト又はユーザ編集前の翻訳済みテキストを表示する、制御信号を生成することと、
前記第１の表示エリアで前記テキストの選択部分を強調表示することと、
前記第２の表示エリアで前記テキストの対応する部分を強調表示することと、
前記ユーザ入力手段を通じて新たなテキスト選択を得る場合に前記強調表示を更新することとを備える、
方法。
コンピュータ生成テキストを表す情報を管理する方法であって、前記方法は、
前記コンピュータ生成テキストを表す第１の情報セットを格納することと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
受け取ったユーザ指示に基づき前記第１のセットを編集することと、
表示データを生成することとを備え、前記表示データは、表示媒体上で第１及び第２の表示エリアを規定するように作用し、前記第１の表示エリアは、前記テキストデータ制御手段の制御下で前記第１の情報セットに対応する第１のテキスト情報を収容し、前記第２の表示エリアは、第２の情報セットに対応する第２のテキスト情報を収容し、前記第２の情報セットは、前記テキストデータ制御手段による編集より前の前記第１のセットに一致し、
ここで前記表示データ生成手段はさらに、前記表示データに区別情報を含めるように作用し、前記区別情報は、前記第１のテキスト情報の一部分と前記第２のテキスト情報の対応する部分とを前記第１及び第２のテキストのそれぞれの残りの部分から視覚的に区別するように作用する、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
前記翻訳前及び／又は翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出と、前記句を、その構文プロパティ、又はその語彙プロパティ、又は両方の点で再構成又は修正するため、又は所定のユーザ指示を受けて前記テキストの別の部分へ移動するため、個々の句の自動選択とを遂行することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
ユーザ指示又は格納済み修正手順に従って個々の単語列の語彙的内容を修正することと、追加の単語列の修正にあたって前記ユーザ指示又は修正手順を再利用することとをさらに備え、ここで前記再利用は形態変化を含みうる、請求項９７に記載の方法。
構文解析に用いる構文単位の仕様についてユーザ指示を受け取ることと、前記テキストの前記構文解析を遂行することとをさらに備える、請求項９７に記載の方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
句及び／又は句境界を識別することと、指定言語に固有の自動句配列ルールを実施することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
前記句配列ルールは、文脈固有ルールを備え、前記文脈固有ルールは、１つ以上の標識語又は標識表現基準に従って配備される、請求項１００に記載の方法。
前記句タイプに従って前記ディスプレイ上に句の強調表示を提示することをさらに備える、請求項９７から１０１のいずれか一項に記載の方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
前記翻訳前及び翻訳済みテキストの中で句及び／又は句境界を自動的に識別するパターン検出と、前記翻訳前テキストの第１の句に出現する語と前記翻訳済みテキストの対応しない第２の句に出現する対応する語との識別とを遂行することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
前記テキスト内の句パターンをテンプレート句パターンに比較することと、差異にフラグを付すこととをさらに備える、請求項１０３に記載の方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
ユーザ指導ドラッグ・アンド・ドロップ編集を可能にすることと、文における前記テキストの新規位置に応じて編集済みテキストの大文字・小文字及び／又は句読点を自動的に修正することであって、空白の適切な処置を含みうることと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
句を識別することと、個々の句の中の語について数、大文字・小文字、及び／又は性の一致を検証することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
前記第１の言語ではなく前記第２の言語に固有の文法構造を前記翻訳済みテキストにて自動的に生成することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
第２の言語ではなく第１の言語に固有の文法構造を前記翻訳済みテキストから自動的に除去することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
ユーザ編集の完了を指示するため入力の受け取り後に文法及びスタイルを自動的に調整することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
文法及びスタイルを前記自動的に調整することは、文法又はスタイルの調整にあたってスタイルプロファイルを使用し、前記スタイルプロファイルはユーザによる選択が可能である、請求項１０９に記載の方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
複数のテキスト編集手順を格納することと、前記手順のリストを編纂することと、別の入力テキストに使用するため保存することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
第１の言語から第２の言語へ翻訳されるテキストを表す情報を管理する方法であって、前記方法は、
第１の言語から第２の言語へ翻訳されるテキストを表す第１の情報セットにアクセスすることと、
前記第１の情報セットで表されるテキストの選択及び／又は編集のためユーザ指示を受け取ることと、
テキスト編集手順を格納、蓄積、編集、及び併合することと、格納済みの前記テキスト編集手順を複数のユーザで共用することと、
ユーザによる編集が可能な翻訳済みテキストを提示するためディスプレイを制御する表示データを生成することとを備える、
方法。
選択された正字法を翻訳済みテキストに適用するため自動編集プロセスを選択することと、実施することとをさらに備える、請求項９７から１１２のいずれか一項に記載の方法。
請求項５９から１１３のいずれか一項に記載の方法を遂行するためのコンピュータ可読コードを保持する信号又は保持媒体。