JP3954520B2

JP3954520B2 - 翻訳支援システム

Info

Publication number: JP3954520B2
Application number: JP2003106303A
Authority: JP
Inventors: 俊和築山; 利広笠原; 正人西村
Original assignee: 株式会社シュライバー
Priority date: 2003-04-10
Filing date: 2003-04-10
Publication date: 2007-08-08
Anticipated expiration: 2023-04-10
Also published as: JP2004310648A

Description

【０００１】
【発明の属する技術分野】
本発明は、ＤＴＰ（ＤｅｓｋＴｏｐＰｕｂｌｉｓｈｉｎｇａｐｐｌｉｃａｔｉｏｎ）等の文書デザインソフトウェアや、その他のソフトウェアにより作成された原文データ中のテキストデータを翻訳する際に、翻訳メモリ装置や機械翻訳装置を利用して翻訳作業を円滑に行なうための翻訳支援システムに関する。
【０００２】
【従来の技術】
近年、印刷される文書やインターネット等の電気通信回線で交換される文書の殆どのものは、そのテキストデータや図版データがＤＴＰソフトウェア等の文書デザインソフトウェアを利用して、文字指定やレイアウト（版組み）がなされ、テキストデータや図版のデータ（コンテンツと称される）と文字指定や文字、図版のレイアウトデータ（エクスプレッションと称される）とを含むドキュメントファイルが作成され、上記エクスプレッションは個々のＤＴＰソフトウェアに依存する。
【０００３】
ところで、複数の言語によるドキュメントファイルを作成する場合には、あらかじめ各言語による文書を作成し、これら各言語に対応して各言語のテキストデータ、図版データ等のコンテンツに、レイアウトデータ等のエクスプレッションを付加するという方法があるが、この方法では翻訳の作業のほかに言語の数の分だけエクスプレッションを付加する作業も行なわなければならず、非効率的で実際的ではなく、例えば世界各国に輸出される製品に添付される取扱説明書のようなドキュメントを作成する場合には不向きである。
【０００４】
したがって、通常はある１つの言語を用いてドキュメントファイルを作成し、このドキュメントファイルを原文ドキュメントファイルとし、この原文ドキュメントファイル中からテキストデータ（原文テキストデータ）を抜き出し、この原文テキストデータに基づいて他の言語に翻訳した翻訳テキストデータを作成して原文テキストデータと置き換え、原文ドキュメントファイル中のエクスプレッションを殆ど変更せずにほぼそのまま使って翻訳ドキュメントファイルを作成するという方法が一般的に採用されている。
【０００５】
テキストデータを翻訳する際には、翻訳者が全ての文書を手作業で翻訳して翻訳テキストデータを入力するというプリミティブな方法もあるが、翻訳すべきテキストデータの量が多い場合、通常は複数の翻訳者が分担して翻訳作業を行なうため、翻訳テキストデータの文章に用語や表現のばらつきが生じ、翻訳文に統一性がなくなるというような問題がある。
【０００６】
そこで、翻訳メモリ装置を用いて翻訳者が作成した翻訳文と原文との関係から対訳文のデータを蓄積し、この蓄積データを利用することによって複数の翻訳者による翻訳作業に統一性を持たせ、しかも一度翻訳した文章と同じあるいは類似の表現については自動的に翻訳文が生成されるようにして翻訳作業の翻訳品質を向上させることが一般的に行なわれるようになってきており、このような翻訳メモリ装置を、現状では翻訳精度が不充分であるといわれている機械翻訳装置と併用することによって高精度の翻訳を円滑に行なうようにする試みもなされている（特許文献１参照）。
【０００７】
翻訳メモリ装置や機械翻訳装置を利用して原文ドキュメントファイル中のテキストデータを翻訳する場合、例えばＤＴＰソフトウェアの機能（通常はプラグインアプリケーションとして提供される）を利用して原文ドキュメントファイルをＸＭＬ（ＥｘｔｅｎｓｉｂｌｅＭａｒｋｕｐＬａｎｇｕａｇｅ）文書等の標準化されたメタ言語（メタタグ）を付したファイル（以下、メタ言語ファイルと呼ぶ）として出力し、このメタ言語ファイルを翻訳メモリ装置や機械翻訳装置に入力して原文テキストデータを翻訳する。
【０００８】
ここで、翻訳メモリ装置や機械翻訳装置は１つのセンテンスを単位とする文章認識を行なって構文を解析し、この解析結果に基づいて単語の置き換えや語順の変更を行なうのであるが、ＤＴＰソフトウェアから出力されるメタ言語ファイルには、エクスプレッション用の制御コードに対応するメタ言語のタグ（メタタグ）とこのメタタグにはないＤＴＰソフトウェア独自の制御コードが特殊キャラクタとして挿入されており、メタタグについては一般的に使用されている翻訳メモリ装置や機械翻訳装置ではテキストとして認識しないようにすることが可能であるが、ＤＴＰソフトウェア独自に設定された特殊キャラクタはテキストと混同して認識されてしまい、この誤認が原因となって翻訳メモリ装置や機械翻訳装置によるセンテンスの区切りの認識が正確に行なわれない場合がある。
【０００９】
なお、メタ言語により記述されたメタ言語ファイルをブラウザアプリケーションで表示すると、ＤＴＰソフトウェアに依存する特殊キャラクタは表示されないかあるいはスペースに置換されて表示されるので、いずれも検索、置換を行なうことは不可能であり、特殊キャラクタをソースファイルから翻訳者や編集者が手作業によって置き換えたり、削除したりするのは極めて煩雑であり、実際的ではない。
【００１０】
また、上述した従来技術は文書デザインソフトウェアにて取扱われるドキュメントファイル中のテキストデータの翻訳に関するものであるが、ドキュメントファイルに限らず、ファイル内にテキストデータを含むコンテンツと、このコンテンツの表示用にソフトウェア独自の制御コードを含むファイル、例えばワードプロセッシングソフトウェアや表計算ソフトウェアのファイルにおいてもファイル中のテキストデータの翻訳が必要である場合にはドキュメントファイルと同様の問題が生じる。
【００１１】
なお、ワードプロセッシングソフトウェアの場合には、ソフトウェアに依存する制御コードを除去したり、このような制御コードをＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）タグ等の標準化された制御コードに変換して出力したりする機能を備えるものが多いので、上述した文書デザインソフトウェアによるドキュメントファイルほどには問題が生じないとも考えられるが、ソフトウェアに依存する機能を活用して作成したファイルは、ＨＴＭＬ文書等の他の形式のファイルとして出力するとソフトウェア独自の機能を充分に発揮することのできないものとなってしまい、上述した文書デザインソフトウェアのドキュメントファイルと同様の問題が生じる。
【００１２】
【特許文献１】
特開２００２−２７８９６４（第３頁−第１３頁、図１、２）
【００１３】
【目的】
本発明の目的とするところは、ＤＴＰソフトウェア等の文書デザインソフトウェアやその他のソフトウェアを利用して作成されたデータ中のテキストデータを、翻訳メモリ装置や機械翻訳装置を利用した翻訳作業に容易に利用することができて正確な翻訳を行なうことができる状態に変換でき、しかも翻訳後のテキストデータを文書デザインソフトウェア等の元のソフトウェアで利用できる状態すなわちレイアウト等のエクスプレッションを含む状態のデータにほぼ自動的に復元することができる支援システムを提供することにある。
【００１４】
【発明の構成】
本発明は、文書データをエンコード変換すると、文書データ中の特定のキャラクタが意味のないキャラクタとして表示されて、文書の内容を読み取ることができなくなるといういわゆる文字化けと呼ばれる現象が生じることに着目して構成したものである。
【００１５】
すなわち、通常は文書に文字化けが生じると文書の内容を読み取ることができなくなるので、いかに文字化けが生じないようにするかということについての考察や提案は従来から多数なされてきたが、敢えて文字化けを生じさせることによって文書データ中に含まれる、ソフトウェアに依存する特殊キャラクタを翻訳作業に支障を与えない特定のキャラクタに置換したり、あるいは不要な特殊キャラクタを除去したりするという全く新規な技術的発想に基づいてなされたものである。
【００１６】
しかして本発明の請求項１に係る翻訳支援システムは、中央処理部、エンコードデータ記憶部、キャラクタ置換用データ記憶部と、文書デザイン装置とのデータの入出力を行う第１入出力インターフェース部および翻訳メモリ装置や機械翻訳装置等の翻訳装置とのデータの入出力を行う第２入出力インターフェース部とを備え、原文テキストデータと、あるアプリケーションソフトウェアに依存する各種の機能制御用コードたる特殊キャラクタを含む１次原文データが、前記文書デザイン装置から第１インターフェース部を経て中央処理部に送られると、同中央処理部は前記エンコードデータ部に記憶部に予め記録されているエンコード変換用データを参照して１次原文データのエンコード方式を変更し、前記特殊キャラクタに文字化けを生じせしめることにより、特殊キャラクタを文字化け部分として中央処理部にて自動的に検索できる状態の２次原文データを生成し、同データ中の特殊キャラクタを、中央処理部が前記キャラクタ置換用データ記憶部に予め記録されているデータを参照しながら前記翻訳装置における構文解析に支障を与えない特定のキャラクタに自動置換あるいは除去して３次原文データを生成し、この３次原文データをそのままあるいは中央処理部にて元のエンコード方式に戻して前記第２入出力インターフェース部を介して前記翻訳装置に出力できるようにした構成のものとしてある。
【００１７】
本発明の請求項２に係る翻訳支援システムは、前記１次原文データを、原文テキストデータに、標準化されたメタ言語が付されたメタ言語データで構成したものとしてある。
【００１８】
本発明の請求項３に係る翻訳支援システムは、前記１次原文データを、前記文書デザイン装置の文書デザインソフトウェアに依存する前記特殊キャラクタを含み、原文テキストデータを、標準化されたメタ言語が付されたメタ言語データで構成したものとしてある。
【００１９】
本発明の請求項４に係る翻訳支援システムは、前記翻訳装置において２次原文データ中の原文テキストデータが訳文テキストデータに置き換えられ、前記特定キャラクタが残された１次訳文データが前記第２入出力インターフェース部を経て中央処理部に入力されると、この１次訳文データから、あるいは前記中央処理部が前記エンコードデータ記憶部を参照して１次訳文データを元のエンコード方式に戻したものから訳文データ中に残された前記特定キャラクタを、前記キャラクタ置換用データ記憶部を参照して元の特殊キャラクタに置き換えて、前記第１入出力インターフェース部を介して文書デザイン装置へ同装置の文書デザインソフトウェア用の２次訳文データとして出力するようにした構成のものとしてある。
【００２０】
本発明の請求項５に係る翻訳支援システムは、前記２次訳文データを、訳文テキストデータに、標準化されたメタ言語が付されたメタ言語データで構成したものとしてある。
【００２１】
本発明の請求項６に係る翻訳支援システムは、前記２次訳文データを、前記文書デザイン装置の文書デザインソフトウェアに依存する前記特殊キャラクタを含み、訳文テキストデータにメタ言語が付されたメタ言語データで構成したものとしてある。
【００２２】
【実施例】
以下、本発明に係る翻訳支援システムの実施例を添付図面に示す具体例に基づいて詳細に説明する。
図１はシステム構成の具体例を示し、同図において１は本発明に係る支援システム、２は文書デザイン装置、３は翻訳メモリ装置をそれぞれ示している。
【００２３】
支援システム１は、文書デザイン装置２および翻訳メモリ装置３との間の各データ入出力用の第１と第２の入出力インターフェース部４、５と、これらインターフェース部を介して文書デザイン装置２や翻訳メモリ装置３から入力されたデータのエンコード変換を行なうとともに、前記文書デザイン装置２にて稼動する文書デザイン用のアプリケーションソフトウェア（以下、文書デザインソフトと称する）に依存する各種の機能制御用コードたる特殊キャラクタと、予め設定した特定のキャラクタとの間の検索・置換を行なう中央処理部６と、上記エンコード変換用のデータを格納するエンコードデータ記憶部７および上記特殊キャラクタと特定キャラクタの対応関係に関するデータを格納するキャラクタ置換用データ記憶部８を備えており、これら両記憶部７、８はいずれも中央処理部６を介して別途の入力装置から新規データの追加や既存データの変更等のデータ更新を行なうことができるようになっている。
【００２４】
なお、上記支援システム１はパーソナルコンピュータ等の電子計算機で構成するが、エンコードの変更やキャラクタの検索・置換は電子計算機にインストールしたワードプロセッシングソフトウェア、例えばマイクロソフト社のＭｉｃｒｏｓｏｆｔＷｏｒｄ（商品名）やテキストエディタあるいは適宜のブラウズソフトウェアの機能を使用することもできる。
【００２５】
前記文書デザイン装置２は、ＤＴＰ等の文書デザインソフト、例えばアドビシステムズ社の市販アプリケーションソフトウェアであるＡｄｏｂｅｉｎＤｅｓｉｇｎ（商品名）を備え、同ソフトを稼動する主処理部２ａと、文書デザインソフトにより作成されたソフト独自の形式によるドキュメントデータと、Ｗ３Ｃ（ＷｏｒｌｄＷｉｄｅＷｅｂＣｏｎｓｏｒｔｉｕｍ）によって標準化されたＸＭＬ（ＥｘｔｅｎｓｉｂｌｅＭａｒｋｕｐＬａｎｇｕａｇｅ）規格等によるメタ言語を付された文書データ（以下、メタ言語データと呼ぶ）との間の相互の変換および入出力を行なう変換処理部２ｂとを備えている。
【００２６】
なお、具体的には上記文書デザイン装置はパーソナルコンピュータ等の電子計算機に文書デザインソフトをインストールしたもので構成し、変換処理部２ｂは文書デザインソフトにプラグインされたソフトウェア、例えばアドビシステムズ社のＸＭｅｄｉａ（商品名）で構成されるものとし、さらに前記メタ言語データの入出力はメタ言語データがファイル化されたＸＭＬファイルで行なうようにする。
【００２７】
前記翻訳メモリ装置３は、制御タグ処理部３ａ、解析処理部３ｂおよび対訳文データベース３ｃを備えており、制御タグ処理部３ａは外部から入力されたメタ言語データ中の制御コードであるメタタグと原文テキストデータとを識別し、解析処理部３ｂにて原文テキストデータの構文を解析して対訳文データベース３ｃに蓄積されているデータを参照し、解析処理部３ｂにて適切な対訳文を選出または翻訳者に対訳文の候補を提示し、また対訳文が蓄積されていない場合は翻訳者により入力された新たな対訳文を新規の対訳文データとして対訳文データベース３ｃに蓄積するものとしてある。
【００２８】
上記翻訳メモリ装置３も前述した文書デザイン装置２の場合と同様に、パーソナルコンピュータ等の電子計算機に翻訳メモリソフトウェア、例えばトラドス社のＴｒａｄｏｓ（商品名）をインストールしたもので構成し、この翻訳メモリソフトウェアは対訳文データベース３ｃを管理するとともに、同ソフトウェアにプラグインされた例えば同トラドス社のＷｉｎＡｌｉｇｎ（商品名）とＴｒａｎｓｌａｔｏｒ'ｓＷｏｒｋｂｅｎｃｈ（商品名）を解析処理部３ｂ、同トラドス社のＴａｇＥｄｉｔｏｒ（商品名）を制御タグ処理部３ａとして利用する。
【００２９】
なお、支援システム１、文書デザイン装置２および翻訳メモリ装置３は上述のように個別のパーソナルコンピュータ等の電子計算機を使用することもできるし、これら各装置に対応するソフトウェアをインストールした１台の電子計算機とすることもでき、あるいは複数台の電子計算機を相互に接続したネットワークシステムで使用することもでき、いずれの構成であっても、支援システム１、文書デザイン装置２および翻訳メモリ装置３間の相互のデータは適宜の形式のファイルあるいはメモリデータとして受け渡す構成とする。
【００３０】
次に、上述のように構成した本発明の翻訳支援システムにおける翻訳作業の具体例について説明する。
図２は文書デザイン装置２にて作成された原文たるドキュメントデータ（例えば同図２中に示されるように英文）から、支援システム１によって翻訳メモリ装置３で利用可能な３次原文データを生成するまでのプロセスを示すフローチャートである。
【００３１】
なお、原文であるドキュメントデータに使用される特殊キャラクタは前述のとおり文書デザインソフトに依存するので、以下の具体例においては、上記ドキュメントデータをアドビシステムズ社のＡｄｏｂｅｉｎＤｅｓｉｇｎ（商品名）で作成されたものとし、１次原文データは同アドビシステムズ社のＸＭｅｄｉａ（商品名）によってＸＭＬ文書ファイルとして出力されるものとする。
【００３２】
同図２において、原文第１ステップ表示（Ａ１）は文書デザインソフトにて作成されたドキュメントの文書デザイン装置２における表示状態を示している。同ドキュメントのデータには、画面に表示されている原文テキストのほかに、各種制御用の特殊キャラクタが隠れており、これらの特殊キャラクタのうち、メタタグたるＸＭＬの制御タグ（ＸＭＬタグ）に一意対応するものは変換処理部２ｂにおいてＸＭＬタグに自動的に変換され、また、対応しない特殊キャラクタはそのままデータ中に残され、その後ある特定のエンコード方式、例えば国際標準化機構（ＩＳＯ）によって標準化されたエンコード方式であるＵＴＦ−８規格に基づいて１次原文データとしてファイル（ＸＭＬファイル）出力される。
【００３３】
文書デザイン装置２から出力された１次原文データを支援システム１の中央処理部６によって、具体的には支援システム１にインストールされたブラウズソフトウェア例えばワードプロセッシングソフトウェアであるマイクロソフト社のＭｉｃｒｏｓｏｆｔＷｏｒｄ（商品名）にて表示させると、原文第２ステップ表示（Ａ２）のようにＸＭＬタグが表示される。
【００３４】
上記１次原文データを、中央処理部６にてエンコードデータ記憶部７を参照することによってエンコード方式を、例えば前記ＵＴＦ−８から日本工業規格（ＪＩＳ）によって規格化（標準化）されたＳｈｉｆｔ−ＪＩＳ規格のエンコード方式に変更すると２次原文データが生成され、原文第３ステップ表示（Ａ３）のようにＸＭＬタグはそのまま表示されるが、原文テキスト中に、自動的に検索が可能な文字化けが生じる。
【００３５】
なお、上記ＵＴＦ−８からＳｈｉｆｔ−ＪＩＳにエンコードを変更した場合に発生する文字化けと特殊キャラクタの対応関係の具体例を図３に示す。
同図３において、「元の文字列」の列は文書デザイン装置２における表示、「ＵＴＦ−８」の列は１次原文データ中に含まれる特殊キャラクタ、「Ｓｈｉｆｔ−ＪＩＳ」の列は中央処理部６におけるエンコード変換後の文字化け、「特定キャラクタ」の列は文字化けの置換用文字列の具体例をそれぞれ示す。
【００３６】
また、同図３において、「カテゴリーＡ」の行は置換処理が必要なキャラクタであり、翻訳メモリ装置３において原文テキストの文節区切りと認識させることが必要なもの、「カテゴリーＢ」の行は、「カテゴリーＡ」と同様に置換処理が必要なキャラクタであり、翻訳メモリ装置３において原文テキストの文節区切りと認識させないようにしなければならないもの、「カテゴリーＣ」の行は置換処理が必要であるが、後述する復元処理は必要ないものであり、この「カテゴリーＣ」のキャラクタは文書デザイン装置２の機能（または仕様）によりカール付きの文字または文字列に復元されるもの、「カテゴリーＤ」の行は削除のみで置換処理も復元処理も必要がないものであり、原文言語に特有の版組に固有の制御を行なうためのものとしてある。
【００３７】
上述のように発生した文字化けは支援システム１の中央処理部６によって検索され、検索された文字化けに対し、前記キャラクタ置換用データ記憶部８のデータに基いて同図３中の「Ｓｈｉｆｔ−ＪＩＳ」の列の文字化けと「特定キャラクタ」の列の置換用文字列との対応関係に基づいて文字化けが特定キャラクタの文字列に置換または除去されて、図２に示される原文第４ステップ表示（Ａ４）のようにＸＭＬタグと、原文テキストおよび特定キャラクタを含む、翻訳メモリで利用可能な３次原文データが生成、表示される。
【００３８】
なお、同図３に示されている「特定キャラクタ」の置換用文字列は、あくまでも一例であり、翻訳メモリにおける構文解析に支障を与えないものであれば任意のものに設定することが可能であり、また、いわゆる「文字列」でなくても単一の文字や記号等のキャラクタを使用することもできる。さらに、同図３中、「カテゴリーＡ」として分類した改行記号や行頭ドットを元のキャラクタとする文字化けに対して、ＸＭＬの開始タグと終了タグとの間に文字列がない「＜Ｒ＞＜／Ｒ＞」「＜Ｄ＞＜／Ｄ＞」のようないわゆる空タグを使用すると文字化けとの対応関係を把握しやすいというメリットがあり、また、注釈文（ＲＥＭ文）等の制御を行なわないタグや内容を持たない空要素タグを置換用文字列として使用するのも好適である。
【００３９】
図４は翻訳メモリ装置３にて作成された訳文たるドキュメントデータ（例えば同図４中に示されるように仏文）から、支援システム１によって文書デザイン装置２で利用可能な２次訳文データを生成するまでのプロセスを示すフローチャートである。
【００４０】
前記３次原文データは翻訳メモリ装置３によって構文解析、対訳文との置き換え等の翻訳作業がなされて訳文（例えば図４中に示されるように仏文）テキストデータとなって翻訳メモリ装置３から支援システム１へ出力される（訳文第１ステップ表示（Ｂ１））。
【００４１】
上記翻訳メモリ装置３からの出力データは１次訳文データであり、同データは翻訳メモリ装置に入力されたときと同じエンコードすなわち本実施例ではＳｈｉｆｔ−ＪＩＳであり、またメタタグであるＸＭＬタグを含むＸＭＬデータであって特定キャラクタが含まれている。
【００４２】
次に、上述した１次訳文データは、前記第２入出力インターフェース５を経て中央処理部６に送られ、中央処理部が前記キャラクタ置換用データ記憶部８内のデータを参照して同データ中の特定キャラクタが「Ｓｈｉｆｔ−ＪＩＳ」の文字化けに復元（再置換）される（訳文第２ステップ表示（Ｂ２））。
なお、この際、図３中にカテゴリーＣおよびＤとした復元処理の不要なものについてはこの復元処理は行なわれない。
【００４３】
復元処理後のデータは、中央処理部６がエンコードデータ記憶部７を参照することにより例えばＳｈｉｆｔ−ＪＩＳからＵＴＦ−８にエンコードが変更され、このエンコード変換によって復元された文字化けが元の特殊キャラクタに戻されて２次訳文データとして文書デザイン装置２に出力される（訳文第３ステップ表示（Ｂ３）。
【００４４】
文書デザイン装置２においては、２次訳文データのＸＭＬタグを同デザイン装置固有の制御コードである特殊キャラクタに戻し、あるいは２次訳文データに含まれている特殊キャラクタをそのまま利用して、訳文テキストデータを図版等のその他のコンテンツとともに、所定のエクスプレッションに基づいて表示する（訳文第４ステップ表示（Ｂ４））。
【００４５】
なお、文書デザイン装置における表示、印刷は原文言語から訳文言語に置き換えられた際に文字の長さや強制改行の位置等の文書デザイン上での操作、編集が必要となる。
【００４６】
上述した実施例においては、原文から訳文への翻訳作業に翻訳メモリ装置を用いる場合の具体例に基づいて説明したが、翻訳メモリ装置と機械翻訳装置とを複合して使用する場合もあるし、翻訳メモリ装置に代えて機械翻訳装置を単独で使用する場合もある。
【００４７】
また、エンコード方式については「ＵＴＦ−８」と「Ｓｈｉｆｔ−ＪＩＳ」との関係に基づいて説明したが、一方のエンコード方式に代えて他のエンコード方式を用いる場合もあるし、２種類の他のエンコード方式を使用する場合もあり、これらの場合には、エンコード方式の変更にともなって生じる文字化けは、本実施例で説明したものとは自ずと異なるが、特殊キャラクタと文字化けとの対応関係を、使用するエンコード方式に応じて支援システムに予め登録しておくことによって適用することが可能である。
【００４８】
【発明の効果】
以上、本発明に係る翻訳支援システムによれば文書データをエンコード変換することによって生じる文字化けを敢えて生成することにより、文書データ中に含まれる、ソフトウェアに依存する特殊キャラクタが翻訳作業に支障を与えない特定のキャラクタに置換されたり、あるいは不要な特殊キャラクタが除去されたりするという全く新規な技術的発想に基づき、ＤＴＰソフトウェア等の文書デザインソフトウェアやその他のソフトウェアを利用して作成されたデータ中のテキストデータを、翻訳メモリ装置や機械翻訳装置を利用した翻訳作業に容易に利用することができて正確な翻訳を行なうことができる状態に変換でき、しかも翻訳語のテキストデータを文書デザインソフトウェア等の元のソフトウェアで利用できる状態すなわちレイアウト等のエクスプレッションを含む状態のデータにほぼ自動的に復元することができる。
【００４９】
したがって、文書デザインソフトウェアで制作された文書中のテキストの翻訳作業に際し、この翻訳作業に伴う文書デザインの編集に要する時間を大幅に短縮することができる。
【図面の簡単な説明】
【図１】本発明に係る支援システムの実施例を他の装置との関係とともに示す構成図。
【図２】文書デザイン装置の原文データを翻訳メモリ装置で利用できるデータに変換するまでの過程を示すフローチャート。
【図３】エンコード方式をＵＴＦ−８からＳｈｉｆｔ−ＪＩＳに変更した場合に発生する文字化けと特殊キャラクタの対応関係の具体例を示す表。
【図４】翻訳メモリ装置からの訳文データを文書デザイン装置で利用できるデータに変換するまでの過程を示すフローチャート。
【符号の説明】
１支援システム
２文書デザイン装置
３翻訳メモリ装置
４、５入出力インターフェース部
６中央処理部
７エンコードデータ記憶部
８キャラクタ置換用データ記憶部

Claims

中央処理部、エンコードデータ記憶部、キャラクタ置換用データ記憶部と、文書デザイン装置とのデータの入出力を行う第１入出力インターフェース部および翻訳メモリ装置や機械翻訳装置等の翻訳装置とのデータの入出力を行う第２入出力インターフェース部とを備え、
原文テキストデータと、あるアプリケーションソフトウェアに依存する各種の機能制御用コードたる特殊キャラクタを含む１次原文データが、前記文書デザイン装置から第１インターフェース部を経て中央処理部に送られると、同中央処理部は前記エンコードデータ部に記憶部に予め記録されているエンコード変換用データを参照して１次原文データのエンコード方式を変更し、前記特殊キャラクタに文字化けを生じせしめることにより、特殊キャラクタを文字化け部分として中央処理部にて自動的に検索できる状態の２次原文データを生成し、同データ中の特殊キャラクタを、中央処理部が前記キャラクタ置換用データ記憶部に予め記録されているデータを参照しながら前記翻訳装置における構文解析に支障を与えない特定のキャラクタに自動置換あるいは除去して３次原文データを生成し、この３次原文データをそのままあるいは中央処理部にて元のエンコード方式に戻して前記第２入出力インターフェース部を介して前記翻訳装置に出力できるように構成した翻訳支援システム。
前記１次原文データは、原文テキストデータに、標準化されたメタ言語が付されたメタ言語データである請求項１に記載の翻訳支援システム。
前記１次原文データは、前記文書デザイン装置の文書デザインソフトウェアに依存する前記特殊キャラクタを含み、原文テキストデータに、標準化されたメタ言語が付されたメタ言語データである請求項１に記載の翻訳支援システム。
前記翻訳装置において２次原文データ中の原文テキストデータが訳文テキストデータに置き換えられ、前記特定キャラクタが残された１次訳文データが前記第２入出力インターフェース部を経て中央処理部に入力されると、この１次訳文データから、あるいは前記中央処理部が前記エンコードデータ記憶部を参照して１次訳文データを元のエンコード方式に戻したものから訳文データ中に残された前記特定キャラクタを、前記キャラクタ置換用データ記憶部を参照して元の特殊キャラクタに置き換えて、前記第１入出力インターフェース部を介して文書デザイン装置へ同装置の文書デザインソフトウェア用の２次訳文データとして出力するように構成した請求項１乃至３に記載の翻訳支援システム。
前記２次訳文データは、訳文テキストデータに、標準化されたメタ言語が付されたメタ言語データである請求項４に記載の翻訳支援システム。
前記２次訳文データは、前記文書デザイン装置の文書デザインソフトウェアに依存する前記特殊キャラクタを含み、訳文テキストデータにメタ言語が付されたメタ言語データである請求項４に記載の翻訳支援システム。