JP2005202739A - 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム - Google Patents

機械翻訳装置、機械翻訳方法及び機械翻訳プログラム Download PDF

Info

Publication number
JP2005202739A
JP2005202739A JP2004008954A JP2004008954A JP2005202739A JP 2005202739 A JP2005202739 A JP 2005202739A JP 2004008954 A JP2004008954 A JP 2004008954A JP 2004008954 A JP2004008954 A JP 2004008954A JP 2005202739 A JP2005202739 A JP 2005202739A
Authority
JP
Japan
Prior art keywords
language
layout information
layout
information
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004008954A
Other languages
English (en)
Inventor
Yasuko Sawada
泰子 澤田
Etsuo Ito
悦雄 伊藤
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004008954A priority Critical patent/JP2005202739A/ja
Publication of JP2005202739A publication Critical patent/JP2005202739A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 第二言語の文字の長さが第一言語の文字の長さと異なり、第一言語の文字表示領域を直接反映することができない場合、第一言語の文字の長さ、第一言語の文字の長さと第二言語の文字の長さとの比等から第二言語の文字用出力領域を算出し、第二言語の文字用のレイアウトを調整する機械翻訳装置、機械翻訳方法及びプログラムを提供する。
【解決手段】 第一言語の文字の長さと第二言語の文字の長さとを比較し、第一言語の文字と第二言語の文字とが異なる長さであるとき、必要に応じて第一言語の文字のデータ内のレイアウト情報を生成する処理を行い、その生成した第二言語データのレイアウト情報として反映し、その結果を表示部5に表示する。第一言語の文字と第二言語の文字との長さが同一であるときは、中央処理部7は、第一言語データのレイアウト情報を第二言語データのレイアウト情報としてそのまま反映し、表示部5に表示する。
【選択図】図1

Description

本発明は、機械翻訳技術に係り、特に、翻訳処理後の第二言語の文字の長さに応じて第二言語の文字出力領域を調整し、ユーザに見易い翻訳結果を提示する機械翻訳装置、機械翻訳方法及びプログラムに関する。
産業分野に限らず様々な分野におけるグローバル化の進行によって、外国語を用いた迅速な情報交換へのニーズが急速に高まってきており、情報交換のためのツールとして機械翻訳装置が期待されている。従来、第一言語(例えば、日本語)の文字を第二言語(例えば、英語)の文字に翻訳する機械翻訳装置においては、第一言語データの文字情報の長さと、その翻訳された結果として得られる第二言語データの文字情報の長さとは、大きく異なっている場合が多い。したがって、第一言語の文字が表中に又は円グラフ中などに記載されているとき、第一言語データ中のレイアウトとして少なくとも一つの図形がある場合には、その図形を同一の大きさのまま第二言語データのレイアウトとして反映することができない場合が少なくない。
この問題を解決するために、文字の大きさ、行間や文字間を変更して第一言語の文字が記載されているレイアウトを反映させる方法が提案されている(例えば、特許文献1参照。)。この特許文献1には、与えられた第一言語の文字とその翻訳された第二言語の文字を表示部に表示する際に、その表示部上での表示長をそれぞれ計算し、短い方の文の表示長を、その行間長又は文字間長を伸ばすことにより、長い方の文の表示長に一致させ表示部上での相対位置が同一になるようにしたものである。また、第二言語の文字がその第一言語の文字より長くなったとき、第一言語の文字の長さと第二言語の文字の長さとが同一の長さとなるように、第二言語の文字を要約する方法が知られている(例えば、特許文献2参照。)。
特開昭60−20283号公報(第2頁) 特開平7-192000号公報(第7頁)
しかしながら、上記した特許文献1においては、文字の大きさ、行間又は文字間を変更するために、第二言語の文字が読みにくい文字となる場合がある。また、上記した特許文献2においては、第一言語の文字を翻訳した第二言語の文字を要約することにより、第二言語の文字中に第一言語の文字にあった情報の一部が失われる場合もある。
このように、従前の機械翻訳装置における機械翻訳方法では、第一言語の文字の長さと第二言語の文字の長さとが異なることが多く、第一言語データ内のレイアウトをそのまま第二言語データのレイアウトとして反映することが難しく、ときには第二言語の文字が見にくくなり、さらに第一言語の文字の情報が失われるという問題点があった。
そこで、本発明は上記問題点を解決するためになされたものであり、第二言語の文字の長さが第一言語の文字の長さと異なる場合、第一言語の文字の長さ、第一言語の文字の長さと第二言語の文字の長さとの比などから第二言語の文字用出力領域を算出し、第二言語の文字用のレイアウトを調整して見易く且つ便宜な翻訳結果を表示する機械翻訳装置、機械翻訳方法及びプログラムを提供することを目的とする。
上記問題点を解決するために、本発明の機械翻訳装置は、第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳する機械翻訳装置であって、第一言語データの文字情報を抽出する文字情報抽出手段と、第一言語データのレイアウト情報を抽出するレイアウト情報抽出手段と、文字情報抽出手段により抽出された文字情報を第二言語に翻訳する翻訳手段と、抽出された文字情報の長さと翻訳された文字情報の長さとを比較するとともに、レイアウト情報抽出手段により抽出されたレイアウト情報を変更するか否かを判定する長さ比較手段と、複数の調整用レイアウト情報が登録されているレイアウト情報生成用参照テーブルと、長さ比較手段によりレイアウト情報を変更すると判定された場合、レイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成手段とを具備することを特徴としている。
次に、本発明の機械翻訳方法は、第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳する機械翻訳装置における翻訳方法であって、第一言語データの文字情報を抽出する文字情報抽出ステップと、第一言語データのレイアウト情報を抽出するレイアウト情報抽出ステップと、抽出された文字情報を第二言語に翻訳する翻訳ステップと、抽出された文字情報の長さと翻訳された文字情報の長さとを比較するとともに、抽出されたレイアウト情報を変更するか否かを判定する長さ比較ステップと、レイアウト情報を変更すると判定された場合、複数の調整用レイアウト情報が登録されているレイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成ステップとを具備することを特徴としている。
さらに、本発明の機械翻訳プログラムは、第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳するコンピュータに、第一言語データの文字情報を抽出する文字情報抽出機能と、第一言語データのレイアウト情報を抽出するレイアウト情報抽出機能と、抽出された文字情報を第二言語に翻訳する翻訳機能と、抽出された文字情報の長さと翻訳された文字情報の長さとを比較するとともに、抽出されたレイアウト情報を変更するか否かを判定する長さ比較機能と、レイアウト情報を変更すると判定された場合、複数の調整用レイアウト情報が登録されているレイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成機能とを実現させることを特徴としている。
本発明によれば、第二言語の文字の長さが第一言語の文字の長さと異なる場合、第一言語の文字の長さと第二言語の文字の長さとの比及び第一言語の文字の表示領域に基づき、第二言語の文字の長さに合うレイアウトを生成することにより、ユーザに見易い翻訳結果を表示することができる。
本発明に係る機械翻訳装置は、第一言語の文字が表や円グラフ内に記載されているレイアウトからなる第一言語データ内における第一言語の文字の長さと第二言語の文字の長さとを比較し、この比較の結果を参照してレイアウトの調整をするものである。以下の実施例1においては第一言語の文字が単一の表内又は円グラフ内に記載されているレイアウトを有するデータである場合、実施例2においては第一言語の文字が複数の表内又は円グラフ内に記載されているレイアウトを有するデータである場合について説明する。
まず、本発明に係る機械翻訳装置1の構成について図1を参照して説明する。
図1は、本発明に係る機械翻訳装置1の構成を示すブロック図である。本発明に係る機械翻訳装置1は、第一言語の文字のデータを入力するための入力部2と、第一言語の文字を翻訳することにより得た第二言語の文字を表示して機械翻訳装置1を使用するユーザに提示するための表示部5と、第一言語の文字を翻訳することにより得た第二言語の文字のデータを記憶するためのデータ記憶部6と、中央処理部7と、後記するプログラム部8と、辞書部15と、バッファ部16とからなっている。
入力部2は、第一言語として文字列、各種ファイルデータ及びコマンドの入力を行うためのものである。入力部2による入力方法には、キーボード3からユーザの指示により直接第一言語の文字が打ち込まれる場合、又はユーザやアプリケーションを介して各種記憶媒体に記憶されているファイル4や機械翻訳装置1がネットワークを介して接続された別の電子計算機等からのファイル4を読み込むことによって第一言語の文字が入力される場合等が挙げられる。図1には、入力部2としてキーボード3及びファイル4を示したが、これらに限らず、OCR、ペン、マウス、タブレット又はタッチパネルであってもよい。また、入力部2は機械翻訳装置1内から切り離されて独立した構成を有していてもよい。
表示部5は、入力部2から入力された第一言語の文字の有するデータ又は第一言語の文字を翻訳することにより得た第二言語の文字の有するデータを表示してユーザに提示するためのものであり、例えばCRTディスプレイ又は液晶ディスプレイからなるものである。また、表示部5は機械翻訳装置1内から切り離されて独立した構成を有していてもよい。
データ記憶部6は、OS(オペレーティング・システム)のほか、第二言語の文字のデータがファイルとして保存されたものを記憶するための記憶領域であり、機械翻訳装置1の電源が切断された後であっても永続的にデータを記憶する記憶領域である。データ記憶部6は、具体的にはハードディスクドライブ、フラッシュメモリ又は光磁気ディスクとそれを制御するコントローラとの組合せからなるものであるが、またこれらの他、磁気テープ、CD−ROM、DVD−ROM、フレキシブルディスク、MO、CD−R、CD−RW又はメモリカードとそれぞれを制御するコントローラとの組合せからなるものであってもよい。
中央処理部7は、中央演算処理装置(CPU)であり、データ記憶部6内に記憶されているOS(オペレーティング・システム)、プログラム部8内の各種プログラムを読み込んでバッファ部16に一時的に記憶し、機械翻訳装置1内の各部の動作制御及びデータ転送の処理を行うものである。
プログラム部8には、入力部2より入力されたデータから文字列などの文字情報を抽出するためのプログラムを記憶している文字情報抽出部9と、入力部2より入力されたデータからレイアウトの形態又はレイアウトの位置などレイアウトに関する情報を抽出するためのプログラムを記憶しているレイアウト情報抽出部10と、文字情報抽出部9に記憶されているプログラムに基づいて抽出された文字情報に対して辞書部15を参照して翻訳処理を実行するためのプログラムを記憶している翻訳処理部11と、文字情報抽出部9に記憶されているプログラムに基づいて抽出された第一言語の文字の長さと翻訳処理部11に記憶されているプログラムに基づいて翻訳された第二言語の文字の長さとを比較するとともに、その比較の結果に基づいて第一言語データのレイアウトを変更するか否かを判定するプログラムを記憶している長さ比較部12と、後記するレイアウト情報生成用参照テーブルを作成するためのプログラムを記憶しているレイアウト情報生成用参照テーブル作成部13と、文字の長さの比較の結果及び第一言語データのレイアウト情報に基づいて第二言語データ内のレイアウトを生成するためのプログラムを記憶しているレイアウト情報生成処理部14が記憶されている。
辞書部15は、中央処理部7がプログラム部8内の翻訳処理部11に記憶されているプログラムに基づいて入力部2から入力された第一言語の文字を翻訳する際に使用するための辞書であり、具体的には、形態素解析用辞書、構文解析用辞書、翻訳用辞書などからなるものである。
バッファ部16は、中央処理部7がプログラム部8内の所定のプログラムを読み込んで一時的に記憶し、そのプログラムに従った処理を実行する際のワーク領域である。表示部5に表示される第一言語の文字のデータ又は第二言語の文字のデータは、中央処理部7がプログラム部8内の各種プログラムに基づいてバッファ部16内にて処理したデータ、又はデータ記憶部6から読み込んでこのバッファ部16内に展開したデータである。
本発明に係る機械翻訳装置1による文字の長さのカウントについて図2を参照して説明する。
図2は、第一言語の文字(例えば日本語とする。)の長さ及び第二言語の文字(例えば英語とする。)の長さをカウントするときの一例を示した図面である。中央処理部7は、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、第一言語の文字と第二言語の文字の長さをカウントする。
図2において、中央制御部7は、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、第一言語の文字である「私はりんごが大好きだ。」の長さを22バイトと算出する。ただし、文字の長さは、半角英数字や半角スペースを1バイト、全角文字や全角スペースを2バイトとしてカウントする。中央処理部7は、プログラム部8内の翻訳処理部11内に記憶されているプログラムに基づき、第一言語の文字(日本語)「私はりんごが大好きだ。」を第二言語の文字(英語)「I like apples very much.」に翻訳し、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、第二言語の文字の長さを24バイトと算出する。
次に、機械翻訳装置1の動作について図3ないし図12を参照して説明する。
図3は本発明に係る機械翻訳装置1の動作を説明するフローチャートであり、図5は図3の各処理の一であるレイアウト情報生成処理を詳細に説明するフローチャートである。図6ないし図12は、本発明に係る機械翻訳装置1の動作を説明する具体例のデータを示した図面である。図6ないし図8は、例えば図6に示したように、第一言語の文字や第二言語の文字のみの領域18、及び表で囲まれた領域19から構成されている。図9及び図10は、同様に、文字のみの領域20、及び円グラフで囲まれた領域21から、さらに図11及び図12は、文字のみの領域22と同領域24、ならびに円グラフ及び枠で囲まれた領域23と同領域25から構成されている。
レイアウト情報生成用参照テーブルについて図4、図6ないし図8を参照して説明する。
図4は、機械翻訳装置1の実施例1のレイアウト情報生成処理におけるレイアウト情報生成用参照テーブル17であり、図6ないし図8を参照して具体的に説明する。図6は第一言語の文字、図7及び図8は第二言語の文字である。
図4のレイアウト情報生成用参照テーブル17には、第一言語データのレイアウト情報に含まれている図形、その図形の領域面積、その図形に応じて自動的に付与される領域番号(n)、後記する優先順位(p)、各領域内の第一言語の文字の長さ、同第二言語の文字の長さ、及び第一言語の文字の長さと第二言語の文字の長さとの比が書き込まれる。中央処理部7は、ステップ3でカウントした第一言語の文字の長さ、ステップ6でカウントした第二言語の文字の長さ、及び第一言語の文字の長さと第二言語の文字の長さとの比をレイアウト情報生成用参照テーブル17に書き込む。このレイアウト情報生成用参照テーブル17は、中央処理部7がプログラム部8内のレイアウト情報生成用参照テーブル作成部13に記憶されているプログラムに基づいて作成される。
実施例1では、第一言語を日本語、第二言語を英語とし、第一言語の文字は日本語で記載され、第二言語の文字は英語で記載されるものとして説明する。
図3において、機械翻訳装置1の動作が開始すると、中央処理部7は、プログラム部8から各々のプログラムを読み込んで適宜にバッファ部16に記憶し、その読み込んだプログラムに従って所定の処理を実行する。
すなわち、入力部2のキーボード3からユーザの指示により直接第一言語の文字が打ち込まれた場合、又はユーザやアプリケーションを介して各種記憶媒体に記憶されているファイル4から第一言語の文字が入力されると、中央処理部7は、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、入力されたデータを読み込み(ステップ1)、中央処理部7は、その読み込んだ第一言語データ内のレイアウト情報に含まれる図形内の総ての文字を抽出して翻訳処理に必要な文字情報を得る(ステップ2)。このとき、中央処理部7は、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、図2を参照して説明したように、ステップ2で抽出した総ての第一言語の文字の長さをカウントする(ステップ3)。具体的には、図6のレイアウト情報に含まれている図形(表形式)内の総ての文字「テキストファイル(*.txt)」、「HTMLファイル(*.htm、*.html)」「パソコンで一般的に用いられているシフトJISコードで記述したテキストファイル」及び「HTML形式のファイル」の長さをそれぞれ23バイト、26バイト、76バイト及び18バイトとカウントする。また図9のレイアウト構造(円グラフ構造)内の総ての文字の「英文の会議資料を翻訳したい。」、「海外の取引先に英文メールを送りたい。」、「複数の辞書を共有化して翻訳結果を統一化したい。」及び「バイリンガルなネイティブに通訳を依頼する。」の長さをそれぞれ28バイト、36バイト、46バイト及び42バイトとカウントする。
中央処理部7は、プログラム部8内のレイアウト情報抽出部10に記憶されているプログラムに基づき、第一言語データからレイアウト情報を抽出する(ステップ4)。ここでいう「レイアウト情報」とは、入力部2から入力されたデータのレイアウト(例えば図6ないし図8では表、図9ないし図12では円グラフなど。)の位置座標、レイアウトの形状、レイアウトを構成する図形内を罫線が仕切る領域又はレイアウトの色彩などの形態情報を意味する。
中央処理部7は、プログラム部8内の翻訳処理部11内に記憶されているプログラムに基づき、辞書部15を参照してステップ2で抽出した翻訳処理に必要な文字情報の翻訳処理を行う(ステップ5)。このとき、中央処理部7は、プログラム部8内の文字情報抽出部9に記憶されているプログラムに基づき、翻訳した結果である総ての第二言語の文字(第二言語)の長さをカウントする(ステップ6)。具体的には、図7の表内の総ての文字「Text file (*.txt)」、「HTML file (*.htm、 *.html)」、「Text files in the shifted JIS code which is typically used in personal computers.」及び「Files in the HTML format.」の長さをそれぞれ17バイト、25バイト、77バイト及び25バイトとカウントする。また図10の円グラフ内の総ての文字の「I want to translate English meeting documents.」、「I want to send some English mail to an overseas customer.」、「I want to share two or more dicitionaries to unify a translation result.」、及び「I want to ask a bilingual native employer to interpret some documents.」の長さをそれぞれ41バイト、57バイト、69バイト及び70バイトとカウントする。
中央処理部7は、プログラム部8内のレイアウト情報生成用参照テーブル作成部13に記憶されているプログラムに基づき、ステップ3でカウントした第一言語の文字の長さ、ステップ6でカウントした第二言語の文字の長さ、第一言語の文字の長さと第二言語の文字の長さとの比、及び必要な情報をレイアウト情報生成用参照テーブル17に書き込み、前記図形内の各領域に領域番号(n)を付与し、図4に示すようなレイアウト情報生成用参照テーブル17を作成する(ステップ7)。
中央処理部7は、プログラム部8内の長さ比較部12に記憶されているプログラムに基づき、ステップ3でカウントした第一言語の文字の長さとその対応するステップ6でカウントした第二言語の文字の長さとが同一か否かを一文字ずつ比較して第二言語が第一言語の表示領域内に収まるか否かを判定する(ステップ8)。
この判定の結果、第二言語が第一言語の表示領域内に収まらないと判定したとき(ステップ8のYES)、中央処理部7は、プログラム部8内の長さ比較部12に記憶されているプログラムに基づいて第一言語データのレイアウト情報を変更すると判定し、後記するレイアウト情報生成処理を行い(ステップ9)、機械翻訳装置1の動作は終了する。
これに対し、前記図形内の総ての文字において、中央処理部7が第一言語の文字の長さと第二言語の文字の長さとは同一であると判定したとき(ステップ8のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、第一言語データのレイアウト形態を第二言語データのレイアウトの形態として反映し、その反映した第二言語データを表示部5に表示し(ステップ10)、機械翻訳装置1の動作は終了する。
次に、本発明に係る機械翻訳装置1のレイアウト情報生成処理について図4及び図5を参照して説明する。
図5は、本発明に係る機械翻訳装置1の実施例1におけるレイアウト情報生成処理(ステップ9)の詳細な動作を説明するフローチャートであり、必要に応じて図6ないし図12を参照して説明する。
中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ7においてレイアウト情報生成用参照テーブル17を作成する際に付与した領域番号を表わすパラメータnに基づき(ステップ11)、n=1なる領域から順に(ステップ12)、プログラム部8内の長さ比較部12に記憶されているプログラムに基づいて第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ13)。
この判定の結果、中央処理部7が第二言語の文字は第一言語の文字よりも短いと判定したとき(ステップ13のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、n=1なる領域を第二言語の文字の表示領域としてそのまま仮反映する(ステップ14)。ここで、仮反映としたのは、次の領域(n=2)で第二言語の文字が劇的に第一言語の文字よりも長くなったときに第二言語の文字のレイアウト全体を調整する必要が生じるからである。中央処理部7は、領域番号nをインクリメントし(ステップ15)、プログラム部8内の長さ比較部12に記憶されているプログラムに基づき、次の領域(n=2)における第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ13)。
ステップ13による比較の結果、中央処理部7が第二言語の文字は第一言語の文字よりも長いと判定したとき(ステップ13のYES)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ1で読み込んだ第一言語データのレイアウト情報に含まれている図形の領域番号n=2なる表示領域を反映し(ステップ16)、この反映した第二言語の文字の表示領域が第一言語データの図形の対応する領域内に収まるか否かを判定する(ステップ17)。
この判定の結果、中央処理部7がステップ16で反映した第二言語の文字の表示領域は第一言語の文字のレイアウトの領域内に収まると判定したとき(ステップ17のYES)、中央処理部7は、ステップ16で反映した第二言語の文字の表示領域をその領域の表示領域として仮反映する(ステップ18)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル17を参照し、ステップ18にて仮反映した領域番号nは最後であるか否かを判定し(ステップ24)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ24のNO、ステップ25)、その次の領域番号nにおける第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ13)。
ステップ17による判定の結果、中央処理部7がステップ16で反映した第二言語の文字の表示領域は第一言語の文字の表示領域内に収まらないと判定したとき(ステップ17のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ1で読み込んだ第一言語データのページスペースを参照し、このページスペースからはみ出ない範囲の下で第一言語の文字の表示領域を拡大する(ステップ19)。
中央処理部7は、ステップ19で拡大した第一言語の文字の表示領域がページスペースを考慮した最大サイズになったときに、第二言語の文字が前記ページスペース内に収まるか否かを判定する(ステップ20)。
この判定の結果、中央処理部7がステップ19で拡大した第一言語の文字の表示領域に第二言語の文字は収まると判定したとき(ステップ20のYES)、中央処理部7は、ステップ19で拡大した第一言語の文字の表示領域を第二言語の文字の表示領域として仮反映する(ステップ18)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル17を参照し、ステップ18にて仮反映した領域番号nは最後であるか否かを判定し(ステップ24)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ24のNO、ステップ25)、その次の領域番号nにおける第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ13)。
ステップ20の判定の結果、中央処理部7が最大サイズに拡大された第一言語データのレイアウト内にでも第二言語の文字は対応する表示領域に収まらないと判定したとき(ステップ20のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、第一言語データのレイアウト情報に含まれている図形の大きさを維持し、その図形の外に新規の枠を追加し、第二言語の文字をこの追加した枠内に表示する(ステップ21)。具体的には、第一言語データのレイアウトが図9のような円グラフ形式の場合、中央処理部7は図10に示すように、点線で囲まれた各領域における第二言語の文字表示領域が図9のレイアウトの大きさのままでは採用できないと判断したとき、ステップ21の処理により、中央処理部7は、図11に示すような第二言語データのレイアウトを表示部5に表示する(但し、この図11は、後記するステップ24の処理により円グラフは縮小されている)。またさらに、中央処理部7は、円グラフの各々の領域に図4に示した領域番号に対応する参照番号を付与し、円グラフ外に枠を追加して第二言語の文字を表示するようにしてもよい(図12参照)。
中央処理部7は、ステップ21で表示した第二言語の文字の表示領域がページ内に収まるか否かを判定する(ステップ22)。ここでいう「ページ」とは、例えば図9の外枠のことであり、「ページをはみ出る」とは、ステップ21で新規の枠を追加して表示した第二言語データのレイアウト情報に含まれている図形がページ内に収まらないということを意味する。ステップ22の判定の結果、中央処理部7がステップ21で得た第二言語データのレイアウト情報に含まれている図形がページをはみ出ないでページ内に収まると判定したとき(ステップ22のYES)、中央処理部7は、ステップ21で表示した第二言語の文字の表示領域を第二言語の文字の表示領域として仮反映する(ステップ18)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル17を参照し、ステップ18にて仮反映した領域番号nは最後であるか否かを判定し(ステップ24)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ24のNO、ステップ25)、その次の領域番号nにおける第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ13)。
ステップ22の判定の結果、中央処理部7がステップ21で得た第二言語の文字のレイアウトがページをはみ出てしまいページ内に収まらないと判定したとき(ステップ22のNO)、中央処理部7は、ステップ21で得た第二言語の文字の表示領域のうち、第二言語の文字を表示する枠を拡大し、第二言語の文字がその枠内に表示され、ページ内に収まるようにその枠以外のレイアウト情報に含まれている図形を縮小する(ステップ23)。具体的には、図10のような円グラフ形式のレイアウトでは、第二言語の文字を枠内に表示できるように枠を拡大するとともに、円グラフを縮小する(図11参照)。このように、データ内のレイアウト情報に含まれている図形のうち、枠の大きさだけを変更するだけでなく、同一データ内の他の図形を変更することにより、ページをまたがることなく第二言語の文字を一つのページ内に表示することができ、見易い第二言語の文字を表示することができる。
このとき、中央処理部7は、レイアウト情報生成用参照テーブル17を参照し、ステップ18にて仮反映した領域番号nは最後であるか否かを判定し(ステップ24)、領域番号nが最後であると判定したとき(ステップ24のYES)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ14又はステップ18で仮反映した第二言語の文字表示領域のうち最も第一言語の文字が長い領域を基準とし、この基準とした第二言語の文字表示領域及びその他の第二言語の文字表示領域に基づいてレイアウト情報を生成し(ステップ25)、その結果を表示部5に表示し(ステップ26)、レイアウト情報生成処理は終了する。具体的には、図6に示した各第一言語の文字の表示領域のうち、第一言語の文字が最も長い第一言語の文字「パソコンで一般的に用いられているシフトJISコードで記述したテキストファイル」の表示領域を基準とし、その表示領域に隣接する領域がそれぞれステップ14又はステップ18で仮決定した表示領域と比較してその基準とした表示領域との調整を行い、図7又は図8に示すようなレイアウトが構成される。
このように、本発明の実施例1によれば、第一言語データ内のレイアウト情報に含まれている図形内に文字があるとき、その総ての第一言語の文字の長さとその第二言語の文字の長さとを比較して第一言語の文字と第二言語の文字とが異なる長さであるとき、必要に応じて第一言語データのレイアウト情報を調整する処理を行い、その調整したレイアウト情報を第二言語データのレイアウト情報として反映して表示部5に表示する。総ての第一言語の文字と第二言語の文字との長さが同一であるとき、中央処理部7は、第一言語データのレイアウト情報を第二言語データのレイアウト情報としてそのまま反映し、表示部5に表示する。
中央処理部7は、レイアウト情報生成処理において、第一言語データのレイアウト情報に含まれている図形内に存する各領域に領域番号nを付与し、各々の領域毎に第一言語の文字と第二言語の文字との長さの比較を行い、各領域において第二言語の文字表示領域が必要か否かを判定し、各領域における第二言語の文字表示領域を仮決定する。総ての領域に対して第二言語の文字表示領域が必要か否かの判定を行い、中央処理部7は、最も長い第一言語の文字を含む領域を基準とし、レイアウト情報生成用参照テーブル17を参照して第二言語データのレイアウトを構成する。この作用により、機械翻訳装置1は、第一言語の文字のデータ内に表示部5に、第一言語の文字の表示領域の無駄なスペースをなくした見易い第二言語の文字を表示することができる。
さらに、レイアウト情報生成処理において、中央処理部7は、ページスペースを考慮しつつ必要に応じて第一言語データのレイアウト情報に含まれている図形外に新規の枠を追加し、その追加した枠内に第二言語の文字を表示する。また、その図形に参照番号を付与して新規の枠を追加し、その枠内にその参照番号に対応した第二言語の文字を表示することにより第二言語の文字を表示部5に表示する。この作用により、機械翻訳装置1は、第一言語データのレイアウト情報に含まれている図形中の第一言語の文字の長さを基準としたレイアウト情報生成処理を実行することができ、必要に応じて新規の枠を追加して第二言語の文字を表示することができるため、同じデータ内に第一言語の文字の情報を失うことなく、見易く且つ便宜な第二言語の文字(翻訳結果)を表示することができる。
さらに、前記仮決定した第二言語の文字表示領域をそのまま第二言語の文字表示領域として本採用するのではなく、最も第一言語の文字の長い領域を基準とし、さらに必要に応じて次に第一言語の文字の長い領域を基準とした各領域に対する第二言語の文字の本採用を行うため、第一言語の文字のレイアウトの一部を担う図形を徒に変更することなく、見易く且つ便宜な第二言語の文字(翻訳結果)を表示することができる。
実施例2は、図14及び図15に示すように、第一言語データのレイアウト情報に含まれている図形が表及び円グラフという複数の図形からなる場合である。この場合においても、実施例1と同様、機械翻訳装置1の構成は実質的には同一であるが、レイアウト情報に含まれている図形が複数あるためレイアウト情報生成用参照テーブルの内容が異なる。以下、機械翻訳装置1の構成において実施例1と実施例2とで共通する部分についての説明は省略する。
レイアウト情報生成用参照テーブルについて図13ないし図15を参照して説明する。
図13は、機械翻訳装置1の実施例2のレイアウト情報生成処理におけるレイアウト情報生成用参照テーブル18であり、図14及び図15を参照して具体的に説明する。図14は表形式及び円グラフのレイアウトを有する第一言語データの一例、図15は表形式及び円グラフのレイアウトを有する第二言語データの一例である。
図13のレイアウト情報生成用参照テーブル18には、第一言語データのレイアウト情報に含まれている図形、その図形の領域面積、その図形に応じて自動的に付与される領域番号(n)、レイアウト情報生成処理のためにどの図形を基準としてレイアウト調整を開始するかを決定するための優先順位(p)、各領域内の第一言語の文字の長さ、同第二言語の文字長さ、及び第一言語の文字の長さと第二言語の文字の長さとの比が書き込まれる。中央処理部7は、ステップ3でカウントした第一言語の文字の長さ、ステップ6でカウントした第二言語の文字の長さ、及び第一言語の文字の長さと第二言語の文字の長さとの比をレイアウト情報生成用参照テーブル18に書き込む。このレイアウト情報生成用参照テーブル18は、中央処理部7がプログラム部8内のレイアウト情報生成用参照テーブル作成部13に記憶されているプログラムに基づいて作成される。
実施例2についても実施例1と同様、第一言語を日本語、第二言語を英語とし、第一言語の文字は日本語で記載され、第二言語の文字は英語で記載されるものとして説明する。
次に、本発明に係る機械翻訳装置1のレイアウト情報生成処理について図13及び図16を参照して説明する。
図16は、本発明に係る機械翻訳装置1のレイアウト情報生成処理の動作を説明するフローチャートであり、必要に応じて図13ないし図15を参照して説明する。また、実施例2においても図3にて説明した処理(ステップ1からステップ10)については実施例1と同様であるため、ここではその動作の説明を省略する。
図16において、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ7においてレイアウト情報生成用参照テーブル18を作成する際に付与した優先順位を表わすパラメータpに基づき(ステップ31)、図13に示すレイアウト情報生成用参照テーブル18を参照して各々の図形のページに占める領域面積(割合)の最も大きい図形(p=1)を基準とし、それぞれのpの値に対して第一言語データのページスペースを考慮した最大許容領域を予め算出する(ステップ32)。具体的には、図14に示したようにステップ1で読み込んだ第一言語データのレイアウト情報に含まれている図形が円グラフと表である場合、これら二つの図形の最大許容領域を算出し、この最大許容領域を区切るための最大許容領域区切り線19(点線)を入れる。さらに、必要に応じて、図14には図形で囲まれていない文字列「・アンケートの結果をまとめますと、右のグラフのようになります。・回答率は下の表のようになります。」を単一のテキスト領域とみなし、そのテキスト領域とは異なる他のレイアウトとの区切りを決定するための最大許容領域区切り線20を入れる構成としてもよい。
中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ7においてレイアウト情報生成用参照テーブル18を作成する際に付与した領域番号を表わすパラメータnに基づき(ステップ33)、領域番号n=1なる領域から順に(ステップ34)、プログラム部8内の長さ比較部12に記憶されているプログラムに基づいて第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ35)。
この判定の結果、中央処理部7が第二言語の文字は第一言語の文字よりも短いと判定したとき(ステップ35のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、領域番号n=1なる領域を第二言語の文字の表示領域としてそのまま仮反映する(ステップ36)。中央処理部7は、領域番号nをインクリメントし(ステップ37)、プログラム部8内の長さ比較部12に記憶されているプログラムに基づき、次の領域(n=2)における第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ35)。
ステップ35による比較の結果、中央処理部7が第二言語の文字は第一言語の文字よりも長いと判定したとき(ステップ35のYES)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ1で読み込んだ第一言語データのレイアウト情報に含まれている図形のn=2なる表示領域を反映し(ステップ38)、この反映した第二言語の文字の表示領域が第一言語の文字の表示領域内に収まるか否かを判定する(ステップ39)。
この判定の結果、中央処理部7がステップ38で反映した第二言語の文字の表示領域は対応する第一言語の文字の表示領域内に収まると判定したとき(ステップ39のYES)、中央処理部7は、ステップ38で反映した第二言語の文字の表示領域を優先順位p及び領域番号n(以下「状態(p、n)」という。)における第二言語の文字の表示領域として第二言語の文字の表示領域を仮反映する(ステップ40)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル18を参照し、ステップ40にて仮反映した領域番号nは優先順位pに対して付与された各領域のうち最後の領域番号であるか否かを判定し(ステップ46)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ46のNO、ステップ47)、その次の領域番号n+1における第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ35)。
ステップ39による判定の結果、中央処理部7がステップ38で反映した第二言語の文字の表示領域は第一言語の文字の表示領域内に収まらないと判定したとき(ステップ39のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、レイアウト情報生成用参照テーブル18に書き込んだ最大許容領域を参照し、この最大許容領域に収まる範囲で第一言語の文字の表示領域を拡大する(ステップ41)。
中央処理部7は、ステップ41で拡大した第一言語の文字の表示領域が最大許容領域を考慮した最大サイズになったときに、第二言語の文字がその最大許容領域を考慮して拡大された表示領域内に収まるか否かを判定する(ステップ42)。
この判定の結果、中央処理部7がステップ41で拡大した第一言語の文字の表示領域に第二言語の文字は収まると判定したとき(ステップ42のYES)、中央処理部7は、ステップ41で拡大した第一言語の文字の表示領域を状態(p、n)における第二言語の文字の表示領域として仮反映する(ステップ40)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル18を参照し、ステップ40にて仮反映した領域番号nは最後であるか否かを判定し(ステップ46)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ46のNO、ステップ47)、その次の領域番号n+1における第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ35)。
ステップ42の判定の結果、中央処理部7が最大許容領域を考慮して拡大された第一言語の文字の表示領域内においても第二言語の文字は収まらないと判定したとき(ステップ42のNO)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、第一言語が表示領域の大きさを維持し、第一言語データのレイアウト情報に含まれている図形の外に新規の枠を追加し、対応する第二言語の文字をこの追加した枠内に表示する(ステップ43)。
中央処理部7は、ステップ43で表示した第二言語の文字の表示領域が最大許容領域内に収まるか否かを判定する(ステップ44)。この判定の結果、中央処理部7がステップ43で得た第二言語の文字の表示領域が最大許容領域内に収まると判定したとき(ステップ44のYES)、中央処理部7は、ステップ43で表示した第二言語の文字の表示領域を状態(p、n)における第二言語の文字の表示領域として仮反映する(ステップ40)。このとき、中央処理部7は、レイアウト情報生成用参照テーブル18を参照し、ステップ40にて仮反映した領域番号nは最後であるか否かを判定し(ステップ46)、領域番号nが未だ最後でないときは領域番号nをインクリメントし(ステップ46のNO、ステップ47)、その次の領域番号n+1における第二言語の文字が第一言語の文字より長いか否かを判定する(ステップ35)。
ステップ44の判定の結果、中央処理部7がステップ43で得た第二言語の文字の表示領域が最大許容領域内に収まらないと判定したとき(ステップ44のNO)、中央処理部7は、ステップ43で得た第二言語の文字の表示領域のうち、第二言語の文字を表示する枠を拡大し、第二言語の文字がその枠内に表示され、ページ内に収まるようにその枠以外のレイアウト情報に含まれている図形を縮小する(ステップ45)。
このとき、中央処理部7は、レイアウト情報生成用参照テーブル18を参照し、ステップ40にて仮決定した領域番号nは最後であるか否かを判定し(ステップ46)、領域番号nが最後であると判定したとき(ステップ46のYES)、中央処理部7は、プログラム部8内のレイアウト情報生成処理部14に記憶されているプログラムに基づき、ステップ36又はステップ40で仮反映した第二言語の文字表示領域のうち最も第一言語の文字が長い領域を基準とし、この基準とした第二言語の文字表示領域及びその他の第二言語の文字表示領域に基づいて優先順位pにおける第二言語の文字のレイアウト情報を生成して仮決定する(ステップ48)。
中央処理部7は、続いて総ての優先順位pの値に対してレイアウト情報生成処理を実行した否かを確認し(ステップ49)、未だ総ての優先順位pの値に対してレイアウト情報生成処理を実行していないときは(ステップ49のNO)、優先順位pをインクリメントして他の優先順位pの値に対してレイアウト情報生成処理を実行するが(ステップ50)、総ての優先順位pの値に対してレイアウト情報生成処理を実行しているときは(ステップ49のYES)、ステップ31からステップ50までの処理に基づいて生成したレイアウトに基づいて第二言語データのレイアウト情報を生成し(ステップ51)、翻訳結果を表示部5に表示し(ステップ52)、機械翻訳装置1のレイアウト処理は終了する。
このように、本発明の実施例2によれば、第一言語データの総ての第一言語の文字の長さとその第二言語の文字の長さとを比較し、第二言語の文字が第一言語の文字の表示領域内に収まらないとき、必要に応じて第一言語データのレイアウト情報を生成する処理を行い、その生成したレイアウト情報を第二言語データのレイアウト情報として反映して表示部5に表示する。総ての第一言語の文字と第二言語の文字との長さが同一であるとき、中央処理部7は、第一言語データのレイアウト情報を第二言語の文字のレイアウトとしてそのまま反映し、表示部5に表示する。
また、第一言語データのレイアウト情報に含まれている図形が複数ある場合、どの図形を基準としてレイアウト情報生成処理を実行するかを決定するための優先順位を設定し、この優先順位が設定された各々の図形に対してレイアウト情報生成処理を実行する。中央処理部7は、このレイアウト情報生成の際総ての第二言語の文字が第二言語の文字の表示領域内に収まり且つ総ての図形がページをはみ出ないで処理するために、それぞれの図形のページ内のスペースを勘案して算出された最大許容領域及びレイアウト情報生成用参照テーブル18を参照してレイアウト情報生成処理を実行する。この作用により、機械翻訳装置1は、第一言語データのレイアウト情報に複数の図形情報が含まれている場合であっても、優先順位を設定して順々にそれぞれの図形に対してレイアウト情報生成処理を実行することができ、必要に応じて第二言語データに新規の枠を追加して同じページ内に第一言語の文字の情報を失うことなく、表示部5に、見易く且つ便宜な第二言語の文字(翻訳結果)を表示することができる。
なお、本発明は、上記実施の形態に限定されるものでなく、その要旨を逸脱しない範囲で種々変形して実施できる。例えば、長さの単位は文字データの文字列の他、バイト数、その言語の文字の平均横幅と文字数の積を用いてもよい。例えば、日本語を英語に翻訳した場合、英語の文字(アルファベット)は日本語の文字(かな、漢字)の半分の幅で表現されることが多いため、文字数が二倍以上になった場合に初めて英文の方が長いとすることもできる。
さらに、ステップ114で算出したそれぞれの優先順位pの値に対して算出した最大許容領域であるが、レイアウトを構成する総ての図形がページ内に収まらないときには、ページのスペースを考慮して事後的に最大許容領域を再算出する構成又は他の優先順位pの値の最大許容領域を縮小してレイアウト情報生成処理をやりなおす構成としてもよい。
本発明に係る機械翻訳装置1の構成を示すブロック図。 文字の長さのカウントに関する一例。 機械翻訳装置1の動作を説明するフローチャート。 レイアウト情報生成用参照テーブル17の一例。 機械翻訳装置1の実施例1に係るレイアウト情報生成処理の動作を説明するフローチャート。 表形式のレイアウト情報を有する第一言語データの一例。 表形式のレイアウト情報を有する第二言語データの一例。 表形式のレイアウト情報を有する第二言語データの別例。 円グラフ形式のレイアウト情報を有する第一言語データの一例。 円グラフ形式のレイアウト情報を有する第二言語データの一例。 円グラフ形式のレイアウト情報を有する第二言語データの別例。 円グラフ形式のレイアウト情報を有する第二言語データの別例。 レイアウト情報生成用参照テーブル26の一例。 表形式及び円グラフ形式のレイアウト情報を有する第一言語データの一例。 表形式及び円グラフ形式のレイアウト情報を有する第二言語データの一例。 機械翻訳装置1の実施例2に係るレイアウト情報生成処理の動作を説明するフローチャート。
符号の説明
1・・・機械翻訳装置、2・・・入力部、3・・・キーボード、4・・・ファイル、5・・・表示部、6・・・データ記憶部、7・・・中央処理部、8・・・プログラム部、9・・・文字情報抽出部、10・・・レイアウト情報抽出部、11・・・翻訳処理部、12・・・長さ比較部、13・・・レイアウト情報生成用参照テーブル作成部、14・・・レイアウト情報生成処理部、15・・・辞書部、16・・・バッファ部、17、26・・・レイアウト情報生成用参照テーブル、18、20、22、24・・・テキストデータのみの領域、19・・・表で囲まれた領域、21・・・円グラフで囲まれた領域、23、25・・・円グラフ及び枠で囲まれた領域

Claims (15)

  1. 第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳する機械翻訳装置であって、
    前記第一言語データの文字情報を抽出する文字情報抽出手段と、
    前記第一言語データのレイアウト情報を抽出するレイアウト情報抽出手段と、
    前記文字情報抽出手段により抽出された文字情報を第二言語に翻訳する翻訳手段と、
    前記抽出された文字情報の長さと前記翻訳された文字情報の長さとを比較するとともに、前記レイアウト情報抽出手段により抽出されたレイアウト情報を変更するか否かを判定する長さ比較手段と、
    複数の調整用レイアウト情報が登録されるレイアウト情報生成用参照テーブルと、
    前記長さ比較手段によりレイアウト情報を変更すると判定された場合、前記レイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成手段とを具備することを特徴とする機械翻訳装置。
  2. 前記第一言語データのレイアウト情報に少なくとも一つの図形情報が含まれている場合、
    前記レイアウト情報生成手段は、前記抽出されたレイアウト情報をもとに、前記図形を前記第一言語データの文字情報を含む領域毎に分割するとともに、前記抽出された文字情報の表示領域、前記抽出された文字情報の長さ及び前記翻訳された文字情報の長さに基づき、前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項1記載の機械翻訳装置。
  3. 前記レイアウト情報生成手段は、必要に応じて前記図形のサイズを変更し、前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項2記載の機械翻訳装置。
  4. 前記レイアウト情報生成手段は、前記図形のサイズを縮小し、この縮小した図形外に新規の枠を追加して前記第二言語の文字情報に対応させたレイアウト情報を生成することを特徴とする請求項2記載の機械翻訳装置機械翻訳装置。
  5. 前記レイアウト情報生成手段は、前記第一言語データ中に前記図形が複数ある場合、どの図形を基準としてレイアウト調整を開始するかを決定するための優先順位を設定するとともに、この設定した優先順位に従い、各々の図形に対して前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項2、3又は4記載の機械翻訳装置。
  6. 第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳する機械翻訳装置における翻訳方法であって、
    前記第一言語データの文字情報を抽出する文字情報抽出ステップと、
    前記第一言語データのレイアウト情報を抽出するレイアウト情報抽出ステップと、
    前記抽出された文字情報を第二言語に翻訳する翻訳ステップと、
    前記抽出された文字情報の長さと前記翻訳された文字情報の長さとを比較するとともに、前記抽出されたレイアウト情報を変更するか否かを判定する長さ比較ステップと、
    前記レイアウト情報を変更すると判定された場合、複数の調整用レイアウト情報が登録されるレイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成ステップとを具備することを特徴とする機械翻訳方法。
  7. 前記第一言語データのレイアウト情報に少なくとも一つの図形情報が含まれている場合、
    前記レイアウト情報生成ステップは、前記抽出されたレイアウト情報をもとに、前記図形を前記第一言語データの文字情報を含む領域毎に分割するとともに、前記抽出された文字情報の表示領域、前記抽出された文字情報の長さ及び前記翻訳された文字情報の長さに基づき、前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項6に記載の機械翻訳方法。
  8. 前記レイアウト情報生成ステップは、必要に応じて前記図形のサイズを変更し、前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項7記載の機械翻訳方法。
  9. 前記レイアウト情報生成ステップは、前記図形のサイズを縮小し、この縮小した図形外に新規の枠を追加して前記第二言語の文字情報に対応させたレイアウト情報を生成することを特徴とする請求項7記載の機械翻訳方法。
  10. 前記レイアウト情報生成ステップは、前記第一言語データ中に前記図形が複数ある場合、どの図形を基準としてレイアウト調整を開始するかを決定するための優先順位を設定するとともに、この設定した優先順位に従い、各々の図形に対して前記翻訳された文字情報に対応させたレイアウト情報を生成することを特徴とする請求項7、8又は9記載の機械翻訳方法。
  11. 第一言語及びレイアウト情報からなる第一言語データを第二言語データに翻訳するコンピュータに、
    前記第一言語データの文字情報を抽出する文字情報抽出機能と、
    前記第一言語データのレイアウト情報を抽出するレイアウト情報抽出機能と、
    前記抽出された文字情報を第二言語に翻訳する翻訳機能と、
    前記抽出された文字情報の長さと前記翻訳された文字情報の長さとを比較するとともに、前記抽出されたレイアウト情報を変更するか否かを判定する長さ比較機能と、
    前記レイアウト情報を変更すると判定された場合、複数の調整用レイアウト情報が登録されるレイアウト情報生成用参照テーブルを参照してレイアウト情報を生成するレイアウト情報生成機能とを実現させるための機械翻訳プログラム。
  12. 前記第一言語データのレイアウト情報に少なくとも一つの図形情報が含まれている場合、
    前記レイアウト情報生成機能は、前記抽出されたレイアウト情報をもとに、前記図形を前記第一言語データの文字情報を含む領域毎に分割するとともに、前記抽出された文字情報の表示領域、前記抽出された文字情報の長さ及び前記翻訳された文字情報の長さに基づき、前記翻訳された文字情報に対応させたレイアウト情報を生成することを実現させるための請求項11に記載の機械翻訳プログラム。
  13. 前記レイアウト調整機能は、必要に応じて前記図形のサイズを変更し、前記翻訳された文字情報に対応させたレイアウト情報を生成することを実現させるための請求項12記載の機械翻訳プログラム。
  14. 前記レイアウト情報生成機能は、前記図形のサイズを縮小し、この縮小した図形外に新規の枠を追加して前記第二言語の文字情報に対応させたレイアウト情報を生成することを実現させるための請求項12記載の機械翻訳プログラム。
  15. 前記レイアウト情報生成機能は、前記第一言語データ中に前記図形が複数ある場合、どの図形を基準としてレイアウト調整を開始するかを決定するための優先順位を設定するとともに、この設定した優先順位に従い、各々の図形に対して前記翻訳された文字情報に対応させたレイアウト情報を生成することを実現させるための請求項12、13又は14記載の機械翻訳プログラム。
JP2004008954A 2004-01-16 2004-01-16 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム Pending JP2005202739A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004008954A JP2005202739A (ja) 2004-01-16 2004-01-16 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004008954A JP2005202739A (ja) 2004-01-16 2004-01-16 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Publications (1)

Publication Number Publication Date
JP2005202739A true JP2005202739A (ja) 2005-07-28

Family

ID=34822128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004008954A Pending JP2005202739A (ja) 2004-01-16 2004-01-16 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Country Status (1)

Country Link
JP (1) JP2005202739A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007087056A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 翻訳装置及びプログラム
JP2010506304A (ja) * 2006-10-02 2010-02-25 グーグル・インコーポレーテッド 翻訳文とともに原文をユーザインタフェース上に表示すること
JP2013005935A (ja) * 2011-06-24 2013-01-10 Canon Inc X線撮影装置、x線撮影方法及びプログラム
JP2014092745A (ja) * 2012-11-06 2014-05-19 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007087056A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 翻訳装置及びプログラム
JP2010506304A (ja) * 2006-10-02 2010-02-25 グーグル・インコーポレーテッド 翻訳文とともに原文をユーザインタフェース上に表示すること
US8577668B2 (en) 2006-10-02 2013-11-05 Google Inc. Displaying original text in a user interface with translated text
US9547643B2 (en) 2006-10-02 2017-01-17 Google Inc. Displaying original text in a user interface with translated text
US10114820B2 (en) 2006-10-02 2018-10-30 Google Llc Displaying original text in a user interface with translated text
JP2013005935A (ja) * 2011-06-24 2013-01-10 Canon Inc X線撮影装置、x線撮影方法及びプログラム
JP2014092745A (ja) * 2012-11-06 2014-05-19 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US6522999B2 (en) Apparatus and method for controlling the display of a translation or dictionary searching process
KR101150132B1 (ko) 시작 템플릿과 목표 템플릿 사이의 콘텐츠 맵핑을 위한방법 및 시스템
US7913191B2 (en) Common input/output interface for application programs
US7676741B2 (en) Structural context for fixed layout markup documents
JP2007328654A (ja) 検索装置、検索プログラムおよび検索方法
US20050216836A1 (en) Electronic document processing
US10572587B2 (en) Title inferencer
US7337393B2 (en) Methods and systems for providing an editable visual formatting model
JPWO2008108061A1 (ja) 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
US7168037B2 (en) Text composition spacing amount setting device with icon indicators
US20020146181A1 (en) System, method and computer program product for a multi-lingual text engine
JP2005202739A (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
EP1679614A2 (en) Method and apparatus for providing foreign language text display when encoding is not available
US20200265612A1 (en) Automatic patent drawings displaying device
JP2008146637A (ja) ドメイン変換言語
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
JPH08106464A (ja) 文書生成装置
US10755034B2 (en) Information processing apparatus
JPH0252303B2 (ja)
JP2007304867A (ja) 翻訳支援システム、指示データ生成装置、訳文データ生成装置ならびにそれらのプログラム
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3209531B2 (ja) 対訳エディタ
WO2023171790A1 (ja) 文章作成支援装置及び文章作成支援プログラム
JP7003457B2 (ja) 文書再構成装置
JP2640340B2 (ja) 文書作成編集装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070323

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070410