JP2009080727A - Translation device and program - Google Patents
Translation device and program Download PDFInfo
- Publication number
- JP2009080727A JP2009080727A JP2007250709A JP2007250709A JP2009080727A JP 2009080727 A JP2009080727 A JP 2009080727A JP 2007250709 A JP2007250709 A JP 2007250709A JP 2007250709 A JP2007250709 A JP 2007250709A JP 2009080727 A JP2009080727 A JP 2009080727A
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- original
- image
- original text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Description
本発明は、翻訳装置及びプログラムに関する。 The present invention relates to a translation apparatus and a program.
原文を含む原稿のスキャン画像を解析し、スキャン画像に含まれる原文を翻訳して出力する装置がある。例えば、下記特許文献1には、原文と翻訳文を行単位で交互に配置した画像を出力する方法が記載されている。この方法によると、例えば、利用者は翻訳結果の確認を容易に行うことができる。
しかしながら、特許文献1の方法では、原文の文字サイズよりも翻訳文の文字サイズを小さくするため、原文の文字サイズによっては、翻訳文の文字サイズが小さくなりすぎてしまい、翻訳結果の確認が容易でなくなる場合がある。そもそも、利用者にとっての重要性は、原文よりも翻訳文の方が高い傾向にある。 However, in the method of Patent Document 1, since the character size of the translated sentence is made smaller than the character size of the original sentence, the character size of the translated sentence becomes too small depending on the character size of the original sentence, and it is easy to check the translation result. May disappear. To begin with, translations tend to be more important for users than for originals.
本発明は、上記課題を鑑みてなされたものであって、原文と翻訳文とを同時に出力する場合においての、利用者の利便性を向上させる翻訳装置及びプログラムの提供を、その目的の一つとする。 The present invention has been made in view of the above problems, and one of its purposes is to provide a translation device and a program that improve the convenience of the user when outputting an original sentence and a translated sentence simultaneously. To do.
請求項1の発明は、原文領域を含む原稿画像を取得する原稿画像取得手段と、前記原稿画像の前記原文領域を特定する原文領域特定手段と、前記原稿画像の前記原文領域に含まれる文字からなる原文を認識して翻訳文を生成する翻訳手段と、前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段と、を含むことを特徴とする翻訳装置である。ここで、ルビ文字とは、翻訳文書において翻訳文が縦書きである場合には翻訳文の文字列(親文字の文字列)の右又は左に添えて配置され、翻訳文が横書きである場合には親文字の文字列の上又は下に添えて配置される文字であって、その文字サイズが親文字の文字サイズよりも小さい文字をいう。 According to the first aspect of the present invention, there is provided a document image acquiring unit that acquires a document image including a source region, a source region specifying unit that specifies the source region of the document image, and characters included in the source region of the document image. A translation means for recognizing the original sentence to generate a translation sentence, and a translation document in which the translation sentence is arranged as a parent character in the original sentence area of the manuscript image and the original sentence is arranged as a ruby character to generate a translation document And a generation unit. Here, the ruby character is placed along the right or left of the character string of the translated sentence (parent character string) when the translated sentence is written vertically in the translated document, and the translated sentence is written horizontally. Is a character that is placed above or below the character string of the parent character and whose character size is smaller than the character size of the parent character.
請求項2の発明は、請求項1の発明において、前記原文領域に含まれる原文の文字サイズを特定する文字サイズ特定手段と、親文字の文字サイズを、前記文字サイズ特定手段により特定された文字サイズに基づいて決定する文字サイズ決定手段、をさらに含むことを特徴とする。 According to a second aspect of the present invention, in the first aspect of the present invention, the character size specifying means for specifying the character size of the original text included in the original text area, and the character size specified by the character size specifying means for the character size of the parent character. Character size determining means for determining based on the size is further included.
請求項3の発明は、請求項2の発明において、前記原文領域のサイズと、翻訳文の文字数と、前記決定された親文字の文字サイズと、に基づいて、少なくとも1つの行からなる翻訳文を配置する翻訳文領域を前記原文領域内に規則的に設定する翻訳文領域設定手段と、前記各翻訳文領域の間に、少なくとも1つの行からなる原文を配置するルビ文字領域を設定するルビ文字領域設定手段と、をさらに含むことを特徴とする。 According to a third aspect of the present invention, in the second aspect of the invention, a translated sentence comprising at least one line based on the size of the original text area, the number of characters of the translated sentence, and the determined character size of the parent character. A translated sentence area setting means for regularly setting a translated sentence area in which the text is arranged in the original sentence area, and a ruby character area in which the source sentence consisting of at least one line is set between the translated sentence areas. And a character area setting means.
請求項4の発明は、請求項3の発明において、前記原文領域に含まれる原文の各行の文字行画像を取得する文字行画像取得手段をさらに含み、前記翻訳文書生成手段は、前記各ルビ文字領域に、前記各文字行画像を配置する、ことを特徴とする。 The invention of claim 4 further includes character line image acquisition means for acquiring a character line image of each line of the original text included in the original text area according to the invention of claim 3, wherein the translated document generation means Each character line image is arranged in an area.
請求項5の発明は、請求項4の発明において、前記各文字行画像の高さが、翻訳文領域の間隔よりも大きいか否かを判断する判断手段と、その高さが前記間隔よりも大きいと判断された文字行画像を、その高さが前記間隔以下となるように縮小する第1縮小手段と、をさらに含むことを特徴とする。 According to a fifth aspect of the present invention, in the invention of the fourth aspect, the judging means for judging whether or not the height of each character line image is larger than the interval between the translated sentence regions, and the height is higher than the interval. It further includes first reduction means for reducing the character line image determined to be large so that the height thereof is equal to or less than the interval.
請求項6の発明は、請求項4又は5の発明において、前記原文領域内に配置される翻訳文の行数よりも前記文字行画像の数が大きい場合に、各文字行画像の長さを1より小さい倍率で縮小する第2縮小手段をさらに含み、前記第2縮小手段により縮小された各文字行画像の連結画像を各ルビ文字領域の長さで分割し、各分割画像を、新たな文字行画像とすることを特徴とする。 The invention of claim 6 is the invention of claim 4 or 5, wherein when the number of character line images is larger than the number of lines of translated sentences arranged in the source text area, the length of each character line image is set. A second reduction unit that reduces the image at a magnification smaller than 1 and divides the connected images of the character line images reduced by the second reduction unit by the length of each ruby character region, A character line image is used.
請求項7の発明は、請求項6の発明において、前記1より小さい倍率は、前記原文領域内に配置される翻訳文の行数を前記文字行画像の数で割った商以下の倍率である、ことを特徴とする。 According to a seventh aspect of the present invention, in the sixth aspect of the present invention, the magnification smaller than 1 is a magnification equal to or lower than a quotient obtained by dividing the number of translated text lines arranged in the source text area by the number of character line images. It is characterized by that.
請求項8の発明は、原文領域を含む原稿画像を取得する原稿画像取得手段、前記原稿画像の前記原文領域を特定する原文領域特定手段、前記原稿画像の前記原文領域に含まれる文字からなる原文を認識し、翻訳する翻訳手段、前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段としてコンピュータを機能させるプログラムである。 The invention according to claim 8 is a document image acquisition means for acquiring a document image including a text area, a text area specifying means for specifying the text area of the text image, and a text composed of characters included in the text area of the text image. A computer functioning as a translation document generating means for recognizing and translating a text, arranging a translated text as a parent character in the original text area of the manuscript image and arranging the original text as a ruby character to generate a translated document It is a program to let you.
請求項1及び請求項8の発明によれば、原文と翻訳文とを同時に出力する場合においての、利用者の利便性を向上させることができる。 According to the first and eighth aspects of the invention, it is possible to improve the convenience for the user when the original text and the translated text are output simultaneously.
請求項2の発明によれば、原文画像における原文の文字サイズに基づいて、親文字の文字サイズを決定することができる。
According to the invention of
請求項3の発明によれば、規則正しく、原文と翻訳文とを出力することができる。 According to the invention of claim 3, the original sentence and the translated sentence can be output regularly.
請求項4の発明によれば、原文を誤りなく出力することができる。 According to the invention of claim 4, the original text can be output without error.
請求項5の発明によれば、ルビ文字が親文字に重ならないように図ることができる。 According to the invention of claim 5, it is possible to prevent the ruby character from overlapping the parent character.
請求項6の発明によれば、翻訳文の行数よりも原文の行数を少なくすることができる。 According to the invention of claim 6, the number of lines in the original sentence can be made smaller than the number of lines in the translated sentence.
請求項7の発明によれば、翻訳文の行数よりも原文の行数を確実に少なくすることができる。 According to the invention of claim 7, the number of lines of the original sentence can be surely reduced from the number of lines of the translated sentence.
本発明の実施形態について図面を参照しながら説明する。図1は、本発明の実施形態に係る翻訳装置2のハードウェア構成図の一例である。同図に示すように、翻訳装置2は、中央処理部40と、主記憶部42と、補助記憶部44と、画像読取部46と、操作部48と、ディスプレイ50を含む。各部は、データバス54を介して、相互に通信可能である。なお、翻訳装置2は、図示しないネットワークインターフェイスやプリンタ等も含む。
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is an example of a hardware configuration diagram of a
中央処理部40は、CPUやMPU等である。中央処理部40は、主記憶部42に予め格納されているプログラムに従って動作し、各部を制御する。また、中央処理部40は、主記憶部42に格納される情報を用いて演算し、主記憶部42に出力する。なお、上記プログラムは、主記憶部42に格納されるものに限らず、CD−ROMやDVD−ROMやDVD−ROM等の情報記憶媒体に格納されるものであってもよいし、ネットワークから供給されるものであってもよい。
The
主記憶部42は、RAMやROM等のメモリ素子である。主記憶部42は、上記プログラムを格納する。また、主記憶部42は、各部から入力される情報を格納する。
The
補助記憶部44は、ハードディスク等である。補助記憶部44は、中央処理部40からの制御信号に従い、主記憶部42に格納される情報を記憶する。
The
画像読取部46は、スキャナである。画像読取部46は、中央処理部40からの制御信号に従って、原稿を読み取り、読取った原稿画像を主記憶部42に出力する。ここで、原稿は、第1言語の原文を含む。ここでは、第1言語は、日本語である。
The
操作部48は、キーボードやマウス等である。操作部48は、操作情報を主記憶部42に出力する。ディスプレイ50は、中央処理部40からの制御信号に従い、主記憶部42に格納される情報を表示する。
The
図2は、中央処理部40が上記プログラムに従って動作することにより、翻訳装置2にて実現される機能のブロック図である。ここでは、本発明に関連する機能を中心として示す。同図に示すように、翻訳装置2は、原稿画像取得部60と、原文領域特定部62と、文字行画像取得部64と、翻訳部66と、親文字サイズ決定部68と、配置領域設定部70と、翻訳文書生成部76と、翻訳結果出力部78と、を含む。配置領域設定部70は、親文字領域設定部72と、ルビ文字領域設定部74と、を含む。
FIG. 2 is a block diagram of functions realized by the
原稿画像取得部60は、画像読取部46を中心として実現される。原稿画像取得部60は、原稿を読み取り、原稿画像の画像データ(ビットマップデータ)を取得する。
The document
原文領域特定部62は、中央処理部40を中心として実現される。原文領域特定部62は、原稿画像取得部60によって取得された原稿画像のレイアウトを解析し、原稿画像に含まれる原文領域の位置・範囲を特定する。本実施形態では、原文領域特定部62は、図3に示すように、原文領域を、原文画像を囲む矩形領域として検出し、そのX座標とY座標の範囲を特定する。
The original text
文字行画像取得部64は、中央処理部40を中心として実現される。文字行画像取得部64は、原文領域ごとに、当該原文領域に含まれる原文の各行の文字行画像を取得する。
The character line
本実施形態では、文字行画像取得部64は、図4に示すように、原文領域ごとに射影演算を行い、垂直方向の軸(Y軸)に対する文字画素の射影ヒストグラムを生成する。そして、文字行画像取得部64は、原文領域ごとに、射影ヒストグラム基づいて、文字行領域の位置・範囲を特定する。すなわち、文字行画像取得部64は、文字画素数が所定値TH以上であるY座標の範囲を特定し、特定した範囲を、それぞれ、各文字行領域の垂直方向の範囲とする。また、原文領域のX座標の範囲を、各文字行領域の水平方向の範囲とする。こうして、文字行画像取得部64は、図5に示すように、原文領域ごとに、文字行領域を特定する。
In the present embodiment, as shown in FIG. 4, the character line
そして、文字行画像取得部64は、原文領域ごとに、各文字行領域内の画像(すなわち、文字行画像)を複製する。こうして、文字行画像取得部64は、原文領域ごとに、各文字行画像を取得する。
And the character line
翻訳部66は、中央処理部40を中心として実現される。翻訳部66は、原文領域に含まれる文字からなる原文を認識して第2言語の翻訳文を生成する。
The
本実施形態では、翻訳部66は、原文領域ごとに、当該原文領域から取得された文字行画像の一つ一つに含まれる文字を認識することにより、当該原文領域に含まれる原文を認識する。そして、翻訳部66は、原文領域ごとに、認識した原文の翻訳文のテキストを生成する。ここでは、第2言語は英語である。
In the present embodiment, the
親文字サイズ決定部68は、中央処理部40を中心として実現される。親文字サイズ決定部68は、原文領域ごとに、後述する翻訳文書生成部76が当該原文領域内に翻訳文の文字を親文字として配置する際の文字サイズを決定する。ここでは、文字サイズとは、フォントサイズである。
The parent character
本実施形態では、親文字サイズ決定部68は、原文領域ごとに、当該原文領域から取得された文字行画像の縦幅から、当該原文領域に含まれる原文の文字サイズを特定し、特定した文字サイズより大きい文字サイズ(例えば、特定した文字サイズより1ポイント大きい文字サイズ)を、当該原文領域に配置される親文字の文字サイズとする。
In the present embodiment, the parent character
配置領域設定部70は、中央処理部40を中心として実現される。配置領域設定部70は、親文字領域設定部72と、ルビ文字領域設定部74と、を含む。
The arrangement
親文字領域設定部72は、原文領域ごとに、当該原文領域のサイズと、翻訳文の文字数と、当該原文領域に配置される親文字の文字サイズと、に基づいて、親文字を配置する親文字領域を当該原文領域内に設定する。
The parent character
本実施形態では、親文字領域設定部72は、原文領域の横幅と、当該原文領域に配置される親文字の文字サイズの横幅と、に基づいて、当該原文領域に配置可能な親文字の一行あたりの文字数を算出する。そして、親文字領域設定部72は、翻訳文の文字数(親文字の文字数)から、原文領域に親文字を配置した場合の行数を算出する。例えば、原文領域に配置可能な親文字の一行あたりの文字数が100文字で、親文字の文字数が450文字であれば、算出される行数は5行となる。
In the present embodiment, the parent character
そして、親文字領域設定部72は、原文領域内に、算出した行数と同数の配置領域を設定する。具体的には、親文字領域設定部72は、算出した行数で原文領域を横に等分してできた矩形領域の一つ一つを、配置領域として設定する。なお、図6(a)は、算出した行数が3行である場合に、原文領域内に設定される配置領域の一例を示す。
The parent character
そして、親文字領域設定部72は、図6(b)に示すように、各配置領域の底部に、親文字の文字サイズの縦幅をその縦幅とし、原文領域の横幅をその横幅とする親文字領域を設定する。従って、各親文字領域は、等間隔に設定される。
Then, as shown in FIG. 6B, the parent character
ルビ文字領域設定部74は、原文領域ごとに、当該原文領域内に、原文の文字をルビ文字として配置するためのルビ文字領域を設定する。本実施形態では、ルビ文字領域設定部74は、ルビ文字領域を、各配置領域内に一つずつ設定する。具体的には、ルビ文字領域設定部74は、図6(b)に示すように、配置領域内の親文字領域以外の矩形領域をルビ文字領域として設定する。従って、各ルビ文字領域の縦幅は、配置領域の縦幅から親文字領域の縦幅を引いた差となり、各ルビ文字領域の横幅は、原文領域の横幅となる。
The ruby character
翻訳文書生成部76は、原稿画像の各原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置して、翻訳文書を生成する。なお、図7は、図3に示す原稿画像に基づいて生成された翻訳文書を示す。
The translated
本実施形態では、翻訳文書生成部76は、原稿画像の各原文領域内を特定色で塗り潰す。そして、翻訳文書生成部76は、図8に示すように、原稿領域ごとに、当該原稿領域内に設定された各ルビ文字領域に、当該原文領域から取得された各文字行画像を配置する。
In the present embodiment, the translation
但し、翻訳文書生成部76は、場合によっては、各文字行画像を縮小してから配置する。
However, the translation
すなわち、翻訳文書生成部76は、注目している原文領域内の各ルビ文字領域に当該原文領域から取得された文字行画像を配置する場合、当該原文領域から取得された文字行画像の中から縦幅の最も大きいもの(注目文字行画像)を選択し、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する。そして、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ、図9に示すように、各文字行画像の縦幅を縮小する。ここでは、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、縮小する。これにより、各文字行画像の縦幅が、ルビ文字領域の縦幅以下に縮小される。
That is, when the translated
また、翻訳文書生成部76は、注目している原文領域内の各ルビ文字領域に当該原文領域から取得された文字行画像を配置する場合、当該原文領域内に設定された親文字領域の数よりも当該原文領域から取得された文字行画像の数が多い場合、図10に示すように各文字行画像の横幅を縮小する。例えば、翻訳文書生成部76は、各文字行画像の横幅を、親文字領域の数を文字行画像の数で割った商以下の倍率で、縮小する。なお、倍率は、1より小さい所定の倍率であってもよい。
In addition, when the translated
そして、翻訳文書生成部76は、以上のようにして縦幅と横幅の少なくとも一方が縮小された各文字行画像を、各ルビ文字領域にルビ文字領域、翻訳文書生成部76は、各文字行画像の横幅を縮小した場合、図11(a)に示すように、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割する。そして、図11(b)に示すように、各分割画像を、新たな文字行画像として、各ルビ文字領域に配置する。
Then, the translation
以上のようにして各文字行画像を各ルビ文字領域に配置すると、翻訳文書生成部76は、各親文字領域に、親文字サイズ決定部68により決定された文字サイズで、翻訳文の文字画像を、親文字として配置する。こうして、翻訳文書生成部76は、翻訳文書の画像データ(ビットマップデータ)を生成する。
When each character line image is arranged in each ruby character area as described above, the translation
翻訳結果出力部78は、中央処理部40を中心として実現される。翻訳結果出力部78は、翻訳文書生成部76により生成された翻訳文書をディスプレイ50に出力させる。なお、翻訳結果出力部78は、翻訳文書をプリンタに印刷出力させるようにしてもよい。
The translation
次に、上記の機能を有する翻訳装置2が、実行する処理の一例を、図12のフローチャートを参照しながら説明する。なお、本実施形態では、利用者が翻訳装置2に原稿を読み取らせ翻訳指示操作を行った場合に、この処理が実行される。
Next, an example of processing executed by the
翻訳装置2は、原稿画像取得部60の機能により、原稿を読み取って原稿画像の画像データを取得する。そして、翻訳装置2は、取得した原稿画像にスキュー補正や下地除去処理等の公知の高画質化処理を施す(S101)。そして、翻訳装置2は、原文領域特定部62の機能により、原稿画像のレイアウトを解析し、原稿画像に含まれる原文領域の位置・範囲を特定する(S102)。
The
そして、翻訳装置2は、文字行画像取得部64の機能により、原文領域ごとに、原文の各行の文字行領域を特定し、各文字行領域内の画像(すなわち、文字行画像)を複製して取得する(S103)。
Then, the
そして、翻訳装置2は、公知の処理により、S103のステップで取得した文字行画像ごとに、当該文字行画像に含まれる原文の文字を認識する(S104)。そして、翻訳装置2は、文字行画像ごとに認識した文字を原文領域単位で統合することにより、原文領域ごとに、当該原文領域に含まれる原文を認識する(S105)。そして、翻訳装置2は、原文領域ごとに、認識した原文の翻訳文のテキストを生成する(S106)。
And the
そして、翻訳装置2は、S102のステップで特定された原文領域のうちから1つの注目原文領域を選択する(S107)。そして、翻訳装置2は、注目原文領域内を所定色(例えば白)で塗り潰す(S108)。ここで、翻訳装置2は、注目原文領域のうち文字行領域以外の領域の平均色を検出し、当該平均色で注目原文領域内を塗り潰すようにしてもよい。
Then, the
そして、翻訳装置2は、親文字サイズ決定部68の機能により、注目原文領域内に配置する親文字の文字サイズを決定する(S109)。
Then, the
すなわち、翻訳装置2は、注目原文領域から取得された文字行画像の1つに着目し、その縦幅に基づいて、注目原文領域に含まれる原文の文字サイズを特定する。そして、翻訳装置2は、特定した文字サイズより1ポイント大きい文字サイズを、注目原文領域に配置する親文字の文字サイズとして決定する。
That is, the
また、翻訳装置2は、着目している文字行画像に基づいて、注目原文領域に含まれる原文の文字色を検知し、検知した文字色とは異なる文字色を、親文字の文字色として決定する(S110)。例えば、翻訳装置2は、検知した文字色と所定色差のある文字色を、親文字の文字色として決定する。
Further, the
そして、翻訳装置2は、親文字領域設定部72の機能により、注目原文領域に親文字を配置した場合の行数を算出し、注目原文領域内に、算出した行数と同数の配置領域を設定する。そして、翻訳装置2は、各配置領域の底部に親文字領域を設定する(図6参照)。また、翻訳装置2は、ルビ文字領域設定部74の機能により、各配置領域内の親文字領域以外の矩形領域を、ルビ文字領域として設定する(S111)。
Then, the
そして、翻訳装置2は、注目原文領域内に設定した親文字領域の数よりも注目原文領域から取得した文字行画像の数が多いか否かを判断する(S112)。そして、親文字領域の数が文字行画像の数以上である場合(S112のN)、翻訳装置2は、注目原文領域から取得された文字行画像の中から最も大きい縦幅の文字行画像(注目文字行画像)を選択し、その縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する(S113)。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅以下であれば(S113のN)、S114に進む。一方、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ(S113のY)、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、縮小し(S115)、S114のステップに進む。
Then, the
一方、注目原文領域内に設定した親文字領域の数よりも注目原文領域から取得した文字行画像の数が多い場合(S112のY)、翻訳装置2は、各文字行画像の横幅を、親文字領域の数を文字行画像の数で割った商以下の倍率で、縮小する(S116)。なお、ここでの倍率は1より小さい所定の倍率であってもよい。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する(S117)。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅以下であれば(S117のN)、S118に進む。一方、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ(S117のY)、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で縮小して(S119)、S118のステップに進む。なお、翻訳装置2は、S116及びS119のステップにおいて、各文字行画像を全体的に縮小するようにしてもよい。
On the other hand, when the number of character line images acquired from the target text area is larger than the number of parent character areas set in the target text area (Y in S112), the
そして、翻訳装置2は、S118のステップにおいて、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割し、各分割画像を、新たな文字行画像として、S114のステップに進む。
Then, in step S118,
そして、翻訳装置2は、S114のステップにおいて、各文字行画像を、各ルビ文字領域に配置し、各親文字領域に、翻訳文の文字の画像、すなわち、親文字の画像を、S109のステップで決定された文字サイズで配置する(S120)。
Then, in step S114, the
そして、翻訳装置2は、すべての原文領域を対象にS108乃至S120のステップを実行したか否かを判断する(S121)。そして、すべての原文領域を対象にS108乃至S120のステップを実行していない場合(S121のN)、翻訳装置2は、他の注目原文領域を選択して、S108以降のステップを実行する。一方、すべての原文領域を対象にS108乃至S120のステップを実行した場合(S121のY)、翻訳装置2は、ここでまでのステップにより生成した翻訳文書の画像データに基づいて、翻訳文書をディスプレイ50に出力したり、印刷出力したりする(S122)。以上が、翻訳装置2が実行する処理の具体的内容である。なお、翻訳装置2は、原稿が複数頁からなる場合は、各頁の原稿画像について図12の処理を実行すればよい。
Then, the
以上のように、本発明の実施形態に係る翻訳装置2によれば、原文の文字がルビ文字として配置され、翻訳文の文字が親文字として配置された翻訳文書が出力されるので、利用者にとっての利便性が向上する。
As described above, according to the
本発明の実施形態は、上記実施形態だけに限らない。 The embodiment of the present invention is not limited to the above embodiment.
例えば、翻訳装置2は、S105のステップで認識した原文のテキストの画像を各ルビ文字領域に描画することにより翻訳文書の画像データを生成するようにしてもよい。但し、翻訳装置2は、ルビ文字(原文の文字)の画像を、ルビ文字のサイズが親文字(翻訳文の文字)よりも小さくなるように描画する。
For example, the
また、例えば、翻訳装置2は、S111のステップにおいて、各親文字領域を、各配置領域の底部ではなく、上部に設定するようにしてもよい。すなわち、親文字の各行の文字列の下にルビ文字の各行の文字列を配置するようにしてもよい。
Further, for example, the
また、例えば、翻訳装置2は、S115のステップにおいて、各文字行画像を、全体的に縮小するようにしてもよい。この場合、翻訳装置2は、S115のステップの後、S118のステップと同様に、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割し、各分割画像を、新たな文字行画像として、S114のステップに進む。
For example, the
また、例えば、翻訳装置2は、S111のステップにおいて、各配置領域を、原文領域の上部から下部になるに従ってその縦幅が徐々に大きくなるように設定するようにしてもよい。これにより、各親文字領域は、その間隔が原文領域の上部から下部になるに従って徐々に大きくなるように設定される。なお、この場合、翻訳装置2は、S113やS117のステップにおいて、注目文字行画像の縦幅が、最上部の配置領域に設定したルビ文字領域の縦幅よりも大きいか否かを判断するようにし、S115やS119のステップにおいて、当該ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、各文字行画像の縦幅を縮小することが考えられる。
For example, the
また、例えば、翻訳装置2は、原稿画像自身に親文字とルビ文字とを配置しているが、原稿画像の複製画像に親文字とルビ文字とを配置するようにしてもよい。
Further, for example, the
また、翻訳装置2は、上記実施形態では翻訳文書を画像データ形式で生成しているが、他のデータ形式で生成するようにしてもよい。例えば、翻訳装置2は、原稿画像(正確には、各原文領域に文字行画像が配置された状態の原稿画像)に対する親文字の描画位置、描画サイズ、描画色等のデータを含む描画データとして、翻訳文書を生成するようにしてもよい。
Moreover, although the
また、本発明は、第1言語と第2言語がどのような言語であっても、適用可能である。例えば、本発明は、フランス語をドイツ語に翻訳する場合にも適用可能である。 In addition, the present invention is applicable regardless of the language of the first language and the second language. For example, the present invention can be applied to a case where French is translated into German.
また、本発明は、横書きの原文を含む原稿だけでなく、縦書きの原文を含む原稿にも適用可能である。 Further, the present invention can be applied not only to a document including a horizontally written original but also to a document including a vertically written original.
2 翻訳装置、40 中央処理部、42 主記憶部、44 補助記憶部、46 画像読取部、48 操作部、50 ディスプレイ、54 データバス、60 原稿画像取得部、62 原文領域特定部、64 文字行画像取得部、66 翻訳部、68 親文字サイズ決定部、70 配置領域設定部、72 親文字領域設定部、74 ルビ文字領域設定部、76 翻訳文書生成部、78 翻訳結果出力部。 2 translation device, 40 central processing unit, 42 main storage unit, 44 auxiliary storage unit, 46 image reading unit, 48 operation unit, 50 display, 54 data bus, 60 original image acquisition unit, 62 original text region specifying unit, 64 character line Image acquisition unit, 66 translation unit, 68 parent character size determination unit, 70 arrangement region setting unit, 72 parent character region setting unit, 74 ruby character region setting unit, 76 translation document generation unit, 78 translation result output unit
Claims (8)
前記原稿画像の前記原文領域を特定する原文領域特定手段と、
前記原稿画像の前記原文領域に含まれる文字からなる原文を認識して翻訳文を生成する翻訳手段と、
前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段と、
を含むことを特徴とする翻訳装置。 Document image acquisition means for acquiring a document image including a source text area;
Original text area specifying means for specifying the original text area of the original image;
Translation means for recognizing an original text composed of characters included in the original text area of the original image and generating a translated text;
In the original text area of the original image, a translated text is arranged as a parent character, a translated text is arranged as a ruby character, and a translated document is generated to generate a translated document
The translation apparatus characterized by including.
親文字の文字サイズを、前記文字サイズ特定手段により特定された文字サイズに基づいて決定する文字サイズ決定手段、
をさらに含むことを特徴とする請求項1に記載の翻訳装置。 Character size specifying means for specifying the character size of the original text included in the original text area;
Character size determining means for determining a character size of a parent character based on the character size specified by the character size specifying means;
The translation apparatus according to claim 1, further comprising:
前記各翻訳文領域の間に、少なくとも1つの行からなる原文を配置するルビ文字領域を設定するルビ文字領域設定手段と、
をさらに含むことを特徴とする請求項2に記載の翻訳装置。 Based on the size of the original text area, the number of characters of the translated text, and the determined character size of the parent character, a translated text area in which the translated text consisting of at least one line is arranged in the original text area. A translation area setting means to be set to
Ruby character area setting means for setting a ruby character area in which an original sentence consisting of at least one line is arranged between the translated sentence areas;
The translation apparatus according to claim 2, further comprising:
前記翻訳文書生成手段は、前記各ルビ文字領域に、前記各文字行画像を配置する、
ことを特徴とする請求項3に記載の翻訳装置。 A character line image acquisition means for acquiring a character line image of each line of the original text included in the original text area;
The translated document generation means arranges each character line image in each ruby character region.
The translation apparatus according to claim 3.
その高さが前記間隔よりも大きいと判断された文字行画像を、その高さが前記間隔以下となるように縮小する第1縮小手段と、
をさらに含むことを特徴とする請求項4に記載の翻訳装置。 Determining means for determining whether or not the height of each character line image is larger than the interval between translated sentence regions;
First reduction means for reducing a character line image whose height is determined to be larger than the interval so that the height is equal to or less than the interval;
The translation apparatus according to claim 4, further comprising:
前記第2縮小手段により縮小された各文字行画像の連結画像を各ルビ文字領域の長さで分割し、各分割画像を、新たな文字行画像とする、
ことを特徴とする請求項4又は5に記載の翻訳装置。 A second reduction means for reducing the length of each character line image at a magnification smaller than 1 when the number of the character line images is larger than the number of lines of translated sentences arranged in the original sentence region;
Dividing the concatenated image of each character line image reduced by the second reduction means by the length of each ruby character region, and making each divided image a new character line image;
The translation apparatus according to claim 4 or 5, characterized in that:
ことを特徴とする請求項6に記載の翻訳装置。 The magnification smaller than 1 is a magnification equal to or lower than the quotient obtained by dividing the number of translated text lines arranged in the original text area by the number of character line images.
The translation apparatus according to claim 6.
前記原稿画像の前記原文領域を特定する原文領域特定手段、
前記原稿画像の前記原文領域に含まれる文字からなる原文を認識し、翻訳する翻訳手段、
前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段、
としてコンピュータを機能させるプログラム。 A document image acquisition means for acquiring a document image including an original area;
Original text area specifying means for specifying the original text area of the document image;
Translation means for recognizing and translating an original text consisting of characters included in the original text area of the original image;
A translation document generating means for arranging a translation sentence as a parent character in the original sentence area of the original image and arranging the original sentence as a ruby character to generate a translation document;
As a program that allows the computer to function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007250709A JP4998176B2 (en) | 2007-09-27 | 2007-09-27 | Translation apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007250709A JP4998176B2 (en) | 2007-09-27 | 2007-09-27 | Translation apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009080727A true JP2009080727A (en) | 2009-04-16 |
JP4998176B2 JP4998176B2 (en) | 2012-08-15 |
Family
ID=40655416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007250709A Expired - Fee Related JP4998176B2 (en) | 2007-09-27 | 2007-09-27 | Translation apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4998176B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118959A (en) * | 2010-11-10 | 2012-06-21 | Sharp Corp | Translation display device |
US9110871B2 (en) | 2010-11-10 | 2015-08-18 | Sharp Kabushiki Kaisha | Correcting a document character size based on the average value of each character size |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6415869A (en) * | 1987-07-09 | 1989-01-19 | Ricoh Kk | Translating device |
JPH03273449A (en) * | 1990-03-23 | 1991-12-04 | Ricoh Co Ltd | Machine translation device |
JPH07121539A (en) * | 1993-10-21 | 1995-05-12 | Matsushita Electric Ind Co Ltd | Machine translation system |
JP2001216292A (en) * | 2000-01-31 | 2001-08-10 | Toshiba Corp | Layout image editing device and layout image editing method |
JP2006268150A (en) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | Translation device, method and program, and storage medium stored with the program |
JP2006276905A (en) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | Translation device, image processing device, image forming device, and translation method and program |
JP2009053932A (en) * | 2007-08-27 | 2009-03-12 | Fuji Xerox Co Ltd | Document image processor and document image processing program |
-
2007
- 2007-09-27 JP JP2007250709A patent/JP4998176B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6415869A (en) * | 1987-07-09 | 1989-01-19 | Ricoh Kk | Translating device |
JPH03273449A (en) * | 1990-03-23 | 1991-12-04 | Ricoh Co Ltd | Machine translation device |
JPH07121539A (en) * | 1993-10-21 | 1995-05-12 | Matsushita Electric Ind Co Ltd | Machine translation system |
JP2001216292A (en) * | 2000-01-31 | 2001-08-10 | Toshiba Corp | Layout image editing device and layout image editing method |
JP2006268150A (en) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | Translation device, method and program, and storage medium stored with the program |
JP2006276905A (en) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | Translation device, image processing device, image forming device, and translation method and program |
JP2009053932A (en) * | 2007-08-27 | 2009-03-12 | Fuji Xerox Co Ltd | Document image processor and document image processing program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118959A (en) * | 2010-11-10 | 2012-06-21 | Sharp Corp | Translation display device |
US8682642B2 (en) | 2010-11-10 | 2014-03-25 | Sharp Kabushiki Kaisha | Translation display apparatus |
US9110871B2 (en) | 2010-11-10 | 2015-08-18 | Sharp Kabushiki Kaisha | Correcting a document character size based on the average value of each character size |
Also Published As
Publication number | Publication date |
---|---|
JP4998176B2 (en) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4483909B2 (en) | Translation apparatus and program | |
JP2005073015A (en) | Device and method for image processing and computer program | |
JP2009294788A (en) | Information processor, information processing method, control program, and recording medium | |
JP2010009509A (en) | Image processor, image processing method, program thereof, and storage medium | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP2009053932A (en) | Document image processor and document image processing program | |
JP4232679B2 (en) | Image forming apparatus and program | |
JP5049922B2 (en) | Image processing apparatus and image processing method | |
JP5538812B2 (en) | Image processing apparatus, image processing method, and program | |
US8660357B2 (en) | Image processing apparatus, method, and computer program | |
JP4998176B2 (en) | Translation apparatus and program | |
JP2009087270A (en) | Image processing device and program | |
US8533590B2 (en) | Information processing apparatus and layout processing method | |
JP2005303740A (en) | Image forming apparatus, image forming method, and program | |
JP2010183484A (en) | Image forming apparatus with copying function | |
JP5126018B2 (en) | Document image processing apparatus and program | |
JP2009223363A (en) | Document processor and document processing program | |
JP5612974B2 (en) | Serif check device, serif check method, and program | |
JP5650683B2 (en) | Image processing apparatus, image processing method, and image processing program | |
US20100104131A1 (en) | Document processing apparatus and document processing method | |
JP2009141525A (en) | Apparatus and method of processing image | |
JP2009205209A (en) | Document image processor and document image processing program | |
JP2011151703A (en) | Image processing apparatus, character magnification processing method and character magnification program | |
JP4735212B2 (en) | Image processing device | |
US8707165B2 (en) | Information processing apparatus, control method, and storage medium for adjustment of alternate document layers to reduce printed pages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120417 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120430 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |