JP4998176B2 - 翻訳装置及びプログラム - Google Patents

翻訳装置及びプログラム Download PDF

Info

Publication number
JP4998176B2
JP4998176B2 JP2007250709A JP2007250709A JP4998176B2 JP 4998176 B2 JP4998176 B2 JP 4998176B2 JP 2007250709 A JP2007250709 A JP 2007250709A JP 2007250709 A JP2007250709 A JP 2007250709A JP 4998176 B2 JP4998176 B2 JP 4998176B2
Authority
JP
Japan
Prior art keywords
character
area
original
image
original text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007250709A
Other languages
English (en)
Other versions
JP2009080727A (ja
Inventor
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2007250709A priority Critical patent/JP4998176B2/ja
Publication of JP2009080727A publication Critical patent/JP2009080727A/ja
Application granted granted Critical
Publication of JP4998176B2 publication Critical patent/JP4998176B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、翻訳装置及びプログラムに関する。
原文を含む原稿のスキャン画像を解析し、スキャン画像に含まれる原文を翻訳して出力する装置がある。例えば、下記特許文献1には、原文と翻訳文を行単位で交互に配置した画像を出力する方法が記載されている。この方法によると、例えば、利用者は翻訳結果の確認を容易に行うことができる。
特開平5−324720号公報
しかしながら、特許文献1の方法では、原文の文字サイズよりも翻訳文の文字サイズを小さくするため、原文の文字サイズによっては、翻訳文の文字サイズが小さくなりすぎてしまい、翻訳結果の確認が容易でなくなる場合がある。そもそも、利用者にとっての重要性は、原文よりも翻訳文の方が高い傾向にある。
本発明は、上記課題を鑑みてなされたものであって、原文と翻訳文とを同時に出力する場合においての、利用者の利便性を向上させる翻訳装置及びプログラムの提供を、その目的の一つとする。
請求項1の発明は、原文領域を含む原稿画像を取得する原稿画像取得手段と、前記原稿画像の前記原文領域を特定する原文領域特定手段と、前記原稿画像の前記原文領域に含まれる文字からなる原文を認識して翻訳文を生成する翻訳手段と、前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段と、を含むことを特徴とする翻訳装置である。ここで、ルビ文字とは、翻訳文書において翻訳文が縦書きである場合には翻訳文の文字列(親文字の文字列)の右又は左に添えて配置され、翻訳文が横書きである場合には親文字の文字列の上又は下に添えて配置される文字であって、その文字サイズが親文字の文字サイズよりも小さい文字をいう。
請求項2の発明は、請求項1の発明において、前記原文領域に含まれる原文の文字サイズを特定する文字サイズ特定手段と、親文字の文字サイズを、前記文字サイズ特定手段により特定された文字サイズに基づいて決定する文字サイズ決定手段、をさらに含むことを特徴とする。
請求項3の発明は、請求項2の発明において、前記原文領域のサイズと、翻訳文の文字数と、前記決定された親文字の文字サイズと、に基づいて、少なくとも1つの行からなる翻訳文を配置する翻訳文領域を前記原文領域内に規則的に設定する翻訳文領域設定手段と、前記各翻訳文領域の間に、少なくとも1つの行からなる原文を配置するルビ文字領域を設定するルビ文字領域設定手段と、をさらに含むことを特徴とする。
請求項4の発明は、請求項3の発明において、前記原文領域に含まれる原文の各行の文字行画像を取得する文字行画像取得手段をさらに含み、前記翻訳文書生成手段は、前記各ルビ文字領域に、前記各文字行画像を配置する、ことを特徴とする。
請求項5の発明は、請求項4の発明において、前記各文字行画像の高さが、翻訳文領域の間隔よりも大きいか否かを判断する判断手段と、その高さが前記間隔よりも大きいと判断された文字行画像を、その高さが前記間隔以下となるように縮小する第1縮小手段と、をさらに含むことを特徴とする。
請求項6の発明は、請求項4又は5の発明において、前記原文領域内に配置される翻訳文の行数よりも前記文字行画像の数が大きい場合に、各文字行画像の長さを1より小さい倍率で縮小する第2縮小手段をさらに含み、前記第2縮小手段により縮小された各文字行画像の連結画像を各ルビ文字領域の長さで分割し、各分割画像を、新たな文字行画像とすることを特徴とする。
請求項7の発明は、請求項6の発明において、前記1より小さい倍率は、前記原文領域内に配置される翻訳文の行数を前記文字行画像の数で割った商以下の倍率である、ことを特徴とする。
請求項8の発明は、原文領域を含む原稿画像を取得する原稿画像取得手段、前記原稿画像の前記原文領域を特定する原文領域特定手段、前記原稿画像の前記原文領域に含まれる文字からなる原文を認識し、翻訳する翻訳手段、前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段としてコンピュータを機能させるプログラムである。
請求項1及び請求項8の発明によれば、原文と翻訳文とを同時に出力する場合においての、利用者の利便性を向上させることができる。
請求項2の発明によれば、原文画像における原文の文字サイズに基づいて、親文字の文字サイズを決定することができる。
請求項3の発明によれば、規則正しく、原文と翻訳文とを出力することができる。
請求項4の発明によれば、原文を誤りなく出力することができる。
請求項5の発明によれば、ルビ文字が親文字に重ならないように図ることができる。
請求項6の発明によれば、翻訳文の行数よりも原文の行数を少なくすることができる。
請求項7の発明によれば、翻訳文の行数よりも原文の行数を確実に少なくすることができる。
本発明の実施形態について図面を参照しながら説明する。図1は、本発明の実施形態に係る翻訳装置2のハードウェア構成図の一例である。同図に示すように、翻訳装置2は、中央処理部40と、主記憶部42と、補助記憶部44と、画像読取部46と、操作部48と、ディスプレイ50を含む。各部は、データバス54を介して、相互に通信可能である。なお、翻訳装置2は、図示しないネットワークインターフェイスやプリンタ等も含む。
中央処理部40は、CPUやMPU等である。中央処理部40は、主記憶部42に予め格納されているプログラムに従って動作し、各部を制御する。また、中央処理部40は、主記憶部42に格納される情報を用いて演算し、主記憶部42に出力する。なお、上記プログラムは、主記憶部42に格納されるものに限らず、CD−ROMやDVD−ROMやDVD−ROM等の情報記憶媒体に格納されるものであってもよいし、ネットワークから供給されるものであってもよい。
主記憶部42は、RAMやROM等のメモリ素子である。主記憶部42は、上記プログラムを格納する。また、主記憶部42は、各部から入力される情報を格納する。
補助記憶部44は、ハードディスク等である。補助記憶部44は、中央処理部40からの制御信号に従い、主記憶部42に格納される情報を記憶する。
画像読取部46は、スキャナである。画像読取部46は、中央処理部40からの制御信号に従って、原稿を読み取り、読取った原稿画像を主記憶部42に出力する。ここで、原稿は、第1言語の原文を含む。ここでは、第1言語は、日本語である。
操作部48は、キーボードやマウス等である。操作部48は、操作情報を主記憶部42に出力する。ディスプレイ50は、中央処理部40からの制御信号に従い、主記憶部42に格納される情報を表示する。
図2は、中央処理部40が上記プログラムに従って動作することにより、翻訳装置2にて実現される機能のブロック図である。ここでは、本発明に関連する機能を中心として示す。同図に示すように、翻訳装置2は、原稿画像取得部60と、原文領域特定部62と、文字行画像取得部64と、翻訳部66と、親文字サイズ決定部68と、配置領域設定部70と、翻訳文書生成部76と、翻訳結果出力部78と、を含む。配置領域設定部70は、親文字領域設定部72と、ルビ文字領域設定部74と、を含む。
原稿画像取得部60は、画像読取部46を中心として実現される。原稿画像取得部60は、原稿を読み取り、原稿画像の画像データ(ビットマップデータ)を取得する。
原文領域特定部62は、中央処理部40を中心として実現される。原文領域特定部62は、原稿画像取得部60によって取得された原稿画像のレイアウトを解析し、原稿画像に含まれる原文領域の位置・範囲を特定する。本実施形態では、原文領域特定部62は、図3に示すように、原文領域を、原文画像を囲む矩形領域として検出し、そのX座標とY座標の範囲を特定する。
文字行画像取得部64は、中央処理部40を中心として実現される。文字行画像取得部64は、原文領域ごとに、当該原文領域に含まれる原文の各行の文字行画像を取得する。
本実施形態では、文字行画像取得部64は、図4に示すように、原文領域ごとに射影演算を行い、垂直方向の軸(Y軸)に対する文字画素の射影ヒストグラムを生成する。そして、文字行画像取得部64は、原文領域ごとに、射影ヒストグラム基づいて、文字行領域の位置・範囲を特定する。すなわち、文字行画像取得部64は、文字画素数が所定値TH以上であるY座標の範囲を特定し、特定した範囲を、それぞれ、各文字行領域の垂直方向の範囲とする。また、原文領域のX座標の範囲を、各文字行領域の水平方向の範囲とする。こうして、文字行画像取得部64は、図5に示すように、原文領域ごとに、文字行領域を特定する。
そして、文字行画像取得部64は、原文領域ごとに、各文字行領域内の画像(すなわち、文字行画像)を複製する。こうして、文字行画像取得部64は、原文領域ごとに、各文字行画像を取得する。
翻訳部66は、中央処理部40を中心として実現される。翻訳部66は、原文領域に含まれる文字からなる原文を認識して第2言語の翻訳文を生成する。
本実施形態では、翻訳部66は、原文領域ごとに、当該原文領域から取得された文字行画像の一つ一つに含まれる文字を認識することにより、当該原文領域に含まれる原文を認識する。そして、翻訳部66は、原文領域ごとに、認識した原文の翻訳文のテキストを生成する。ここでは、第2言語は英語である。
親文字サイズ決定部68は、中央処理部40を中心として実現される。親文字サイズ決定部68は、原文領域ごとに、後述する翻訳文書生成部76が当該原文領域内に翻訳文の文字を親文字として配置する際の文字サイズを決定する。ここでは、文字サイズとは、フォントサイズである。
本実施形態では、親文字サイズ決定部68は、原文領域ごとに、当該原文領域から取得された文字行画像の縦幅から、当該原文領域に含まれる原文の文字サイズを特定し、特定した文字サイズより大きい文字サイズ(例えば、特定した文字サイズより1ポイント大きい文字サイズ)を、当該原文領域に配置される親文字の文字サイズとする。
配置領域設定部70は、中央処理部40を中心として実現される。配置領域設定部70は、親文字領域設定部72と、ルビ文字領域設定部74と、を含む。
親文字領域設定部72は、原文領域ごとに、当該原文領域のサイズと、翻訳文の文字数と、当該原文領域に配置される親文字の文字サイズと、に基づいて、親文字を配置する親文字領域を当該原文領域内に設定する。
本実施形態では、親文字領域設定部72は、原文領域の横幅と、当該原文領域に配置される親文字の文字サイズの横幅と、に基づいて、当該原文領域に配置可能な親文字の一行あたりの文字数を算出する。そして、親文字領域設定部72は、翻訳文の文字数(親文字の文字数)から、原文領域に親文字を配置した場合の行数を算出する。例えば、原文領域に配置可能な親文字の一行あたりの文字数が100文字で、親文字の文字数が450文字であれば、算出される行数は5行となる。
そして、親文字領域設定部72は、原文領域内に、算出した行数と同数の配置領域を設定する。具体的には、親文字領域設定部72は、算出した行数で原文領域を横に等分してできた矩形領域の一つ一つを、配置領域として設定する。なお、図6(a)は、算出した行数が3行である場合に、原文領域内に設定される配置領域の一例を示す。
そして、親文字領域設定部72は、図6(b)に示すように、各配置領域の底部に、親文字の文字サイズの縦幅をその縦幅とし、原文領域の横幅をその横幅とする親文字領域を設定する。従って、各親文字領域は、等間隔に設定される。
ルビ文字領域設定部74は、原文領域ごとに、当該原文領域内に、原文の文字をルビ文字として配置するためのルビ文字領域を設定する。本実施形態では、ルビ文字領域設定部74は、ルビ文字領域を、各配置領域内に一つずつ設定する。具体的には、ルビ文字領域設定部74は、図6(b)に示すように、配置領域内の親文字領域以外の矩形領域をルビ文字領域として設定する。従って、各ルビ文字領域の縦幅は、配置領域の縦幅から親文字領域の縦幅を引いた差となり、各ルビ文字領域の横幅は、原文領域の横幅となる。
翻訳文書生成部76は、原稿画像の各原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置して、翻訳文書を生成する。なお、図7は、図3に示す原稿画像に基づいて生成された翻訳文書を示す。
本実施形態では、翻訳文書生成部76は、原稿画像の各原文領域内を特定色で塗り潰す。そして、翻訳文書生成部76は、図8に示すように、原稿領域ごとに、当該原稿領域内に設定された各ルビ文字領域に、当該原文領域から取得された各文字行画像を配置する。
但し、翻訳文書生成部76は、場合によっては、各文字行画像を縮小してから配置する。
すなわち、翻訳文書生成部76は、注目している原文領域内の各ルビ文字領域に当該原文領域から取得された文字行画像を配置する場合、当該原文領域から取得された文字行画像の中から縦幅の最も大きいもの(注目文字行画像)を選択し、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する。そして、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ、図9に示すように、各文字行画像の縦幅を縮小する。ここでは、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、縮小する。これにより、各文字行画像の縦幅が、ルビ文字領域の縦幅以下に縮小される。
また、翻訳文書生成部76は、注目している原文領域内の各ルビ文字領域に当該原文領域から取得された文字行画像を配置する場合、当該原文領域内に設定された親文字領域の数よりも当該原文領域から取得された文字行画像の数が多い場合、図10に示すように各文字行画像の横幅を縮小する。例えば、翻訳文書生成部76は、各文字行画像の横幅を、親文字領域の数を文字行画像の数で割った商以下の倍率で、縮小する。なお、倍率は、1より小さい所定の倍率であってもよい。
そして、翻訳文書生成部76は、以上のようにして縦幅と横幅の少なくとも一方が縮小された各文字行画像を、各ルビ文字領域にルビ文字領域、翻訳文書生成部76は、各文字行画像の横幅を縮小した場合、図11(a)に示すように、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割する。そして、図11(b)に示すように、各分割画像を、新たな文字行画像として、各ルビ文字領域に配置する。
以上のようにして各文字行画像を各ルビ文字領域に配置すると、翻訳文書生成部76は、各親文字領域に、親文字サイズ決定部68により決定された文字サイズで、翻訳文の文字画像を、親文字として配置する。こうして、翻訳文書生成部76は、翻訳文書の画像データ(ビットマップデータ)を生成する。
翻訳結果出力部78は、中央処理部40を中心として実現される。翻訳結果出力部78は、翻訳文書生成部76により生成された翻訳文書をディスプレイ50に出力させる。なお、翻訳結果出力部78は、翻訳文書をプリンタに印刷出力させるようにしてもよい。
次に、上記の機能を有する翻訳装置2が、実行する処理の一例を、図12のフローチャートを参照しながら説明する。なお、本実施形態では、利用者が翻訳装置2に原稿を読み取らせ翻訳指示操作を行った場合に、この処理が実行される。
翻訳装置2は、原稿画像取得部60の機能により、原稿を読み取って原稿画像の画像データを取得する。そして、翻訳装置2は、取得した原稿画像にスキュー補正や下地除去処理等の公知の高画質化処理を施す(S101)。そして、翻訳装置2は、原文領域特定部62の機能により、原稿画像のレイアウトを解析し、原稿画像に含まれる原文領域の位置・範囲を特定する(S102)。
そして、翻訳装置2は、文字行画像取得部64の機能により、原文領域ごとに、原文の各行の文字行領域を特定し、各文字行領域内の画像(すなわち、文字行画像)を複製して取得する(S103)。
そして、翻訳装置2は、公知の処理により、S103のステップで取得した文字行画像ごとに、当該文字行画像に含まれる原文の文字を認識する(S104)。そして、翻訳装置2は、文字行画像ごとに認識した文字を原文領域単位で統合することにより、原文領域ごとに、当該原文領域に含まれる原文を認識する(S105)。そして、翻訳装置2は、原文領域ごとに、認識した原文の翻訳文のテキストを生成する(S106)。
そして、翻訳装置2は、S102のステップで特定された原文領域のうちから1つの注目原文領域を選択する(S107)。そして、翻訳装置2は、注目原文領域内を所定色(例えば白)で塗り潰す(S108)。ここで、翻訳装置2は、注目原文領域のうち文字行領域以外の領域の平均色を検出し、当該平均色で注目原文領域内を塗り潰すようにしてもよい。
そして、翻訳装置2は、親文字サイズ決定部68の機能により、注目原文領域内に配置する親文字の文字サイズを決定する(S109)。
すなわち、翻訳装置2は、注目原文領域から取得された文字行画像の1つに着目し、その縦幅に基づいて、注目原文領域に含まれる原文の文字サイズを特定する。そして、翻訳装置2は、特定した文字サイズより1ポイント大きい文字サイズを、注目原文領域に配置する親文字の文字サイズとして決定する。
また、翻訳装置2は、着目している文字行画像に基づいて、注目原文領域に含まれる原文の文字色を検知し、検知した文字色とは異なる文字色を、親文字の文字色として決定する(S110)。例えば、翻訳装置2は、検知した文字色と所定色差のある文字色を、親文字の文字色として決定する。
そして、翻訳装置2は、親文字領域設定部72の機能により、注目原文領域に親文字を配置した場合の行数を算出し、注目原文領域内に、算出した行数と同数の配置領域を設定する。そして、翻訳装置2は、各配置領域の底部に親文字領域を設定する(図6参照)。また、翻訳装置2は、ルビ文字領域設定部74の機能により、各配置領域内の親文字領域以外の矩形領域を、ルビ文字領域として設定する(S111)。
そして、翻訳装置2は、注目原文領域内に設定した親文字領域の数よりも注目原文領域から取得した文字行画像の数が多いか否かを判断する(S112)。そして、親文字領域の数が文字行画像の数以上である場合(S112のN)、翻訳装置2は、注目原文領域から取得された文字行画像の中から最も大きい縦幅の文字行画像(注目文字行画像)を選択し、その縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する(S113)。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅以下であれば(S113のN)、S114に進む。一方、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ(S113のY)、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、縮小し(S115)、S114のステップに進む。
一方、注目原文領域内に設定した親文字領域の数よりも注目原文領域から取得した文字行画像の数が多い場合(S112のY)、翻訳装置2は、各文字行画像の横幅を、親文字領域の数を文字行画像の数で割った商以下の倍率で、縮小する(S116)。なお、ここでの倍率は1より小さい所定の倍率であってもよい。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きいか否かを判断する(S117)。そして、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅以下であれば(S117のN)、S118に進む。一方、翻訳装置2は、注目文字行画像の縦幅がルビ文字領域の縦幅よりも大きければ(S117のY)、各文字行画像の縦幅を、ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で縮小して(S119)、S118のステップに進む。なお、翻訳装置2は、S116及びS119のステップにおいて、各文字行画像を全体的に縮小するようにしてもよい。
そして、翻訳装置2は、S118のステップにおいて、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割し、各分割画像を、新たな文字行画像として、S114のステップに進む。
そして、翻訳装置2は、S114のステップにおいて、各文字行画像を、各ルビ文字領域に配置し、各親文字領域に、翻訳文の文字の画像、すなわち、親文字の画像を、S109のステップで決定された文字サイズで配置する(S120)。
そして、翻訳装置2は、すべての原文領域を対象にS108乃至S120のステップを実行したか否かを判断する(S121)。そして、すべての原文領域を対象にS108乃至S120のステップを実行していない場合(S121のN)、翻訳装置2は、他の注目原文領域を選択して、S108以降のステップを実行する。一方、すべての原文領域を対象にS108乃至S120のステップを実行した場合(S121のY)、翻訳装置2は、ここでまでのステップにより生成した翻訳文書の画像データに基づいて、翻訳文書をディスプレイ50に出力したり、印刷出力したりする(S122)。以上が、翻訳装置2が実行する処理の具体的内容である。なお、翻訳装置2は、原稿が複数頁からなる場合は、各頁の原稿画像について図12の処理を実行すればよい。
以上のように、本発明の実施形態に係る翻訳装置2によれば、原文の文字がルビ文字として配置され、翻訳文の文字が親文字として配置された翻訳文書が出力されるので、利用者にとっての利便性が向上する。
本発明の実施形態は、上記実施形態だけに限らない。
例えば、翻訳装置2は、S105のステップで認識した原文のテキストの画像を各ルビ文字領域に描画することにより翻訳文書の画像データを生成するようにしてもよい。但し、翻訳装置2は、ルビ文字(原文の文字)の画像を、ルビ文字のサイズが親文字(翻訳文の文字)よりも小さくなるように描画する。
また、例えば、翻訳装置2は、S111のステップにおいて、各親文字領域を、各配置領域の底部ではなく、上部に設定するようにしてもよい。すなわち、親文字の各行の文字列の下にルビ文字の各行の文字列を配置するようにしてもよい。
また、例えば、翻訳装置2は、S115のステップにおいて、各文字行画像を、全体的に縮小するようにしてもよい。この場合、翻訳装置2は、S115のステップの後、S118のステップと同様に、各文字行画像を横方向に連結してルビ文字領域の横幅の長さで分割し、各分割画像を、新たな文字行画像として、S114のステップに進む。
また、例えば、翻訳装置2は、S111のステップにおいて、各配置領域を、原文領域の上部から下部になるに従ってその縦幅が徐々に大きくなるように設定するようにしてもよい。これにより、各親文字領域は、その間隔が原文領域の上部から下部になるに従って徐々に大きくなるように設定される。なお、この場合、翻訳装置2は、S113やS117のステップにおいて、注目文字行画像の縦幅が、最上部の配置領域に設定したルビ文字領域の縦幅よりも大きいか否かを判断するようにし、S115やS119のステップにおいて、当該ルビ文字領域の縦幅を注目文字行画像の縦幅で割った商以下の倍率で、各文字行画像の縦幅を縮小することが考えられる。
また、例えば、翻訳装置2は、原稿画像自身に親文字とルビ文字とを配置しているが、原稿画像の複製画像に親文字とルビ文字とを配置するようにしてもよい。
また、翻訳装置2は、上記実施形態では翻訳文書を画像データ形式で生成しているが、他のデータ形式で生成するようにしてもよい。例えば、翻訳装置2は、原稿画像(正確には、各原文領域に文字行画像が配置された状態の原稿画像)に対する親文字の描画位置、描画サイズ、描画色等のデータを含む描画データとして、翻訳文書を生成するようにしてもよい。
また、本発明は、第1言語と第2言語がどのような言語であっても、適用可能である。例えば、本発明は、フランス語をドイツ語に翻訳する場合にも適用可能である。
また、本発明は、横書きの原文を含む原稿だけでなく、縦書きの原文を含む原稿にも適用可能である。
本発明の実施形態に係る翻訳装置のハードウェア構成の一例を示す図である。 本発明の実施形態に係る翻訳装置の機能ブロックの一例を示す図である。 原稿画像の一例を示す図である。 文字行領域を特定する様子を説明するための図である。 文字行領域を到底する様子を説明するための図である。 原文領域に、配置領域、親文字領域、ルビ文字領域を設定する様子を説明するための図である。 翻訳文書の一例を示す図である。 原文領域に文字行画像を配置する様子を説明するための図である。 文字行画像の縦幅を縮小する様子を説明するための図である。 文字行画像の横幅を縮小する様子を説明するための図である。 新たな文字行画像を生成する様子を説明するための図である。 本発明の実施形態に係る翻訳装置が実行する処理の一例を示すフローチャート図である。
符号の説明
2 翻訳装置、40 中央処理部、42 主記憶部、44 補助記憶部、46 画像読取部、48 操作部、50 ディスプレイ、54 データバス、60 原稿画像取得部、62 原文領域特定部、64 文字行画像取得部、66 翻訳部、68 親文字サイズ決定部、70 配置領域設定部、72 親文字領域設定部、74 ルビ文字領域設定部、76 翻訳文書生成部、78 翻訳結果出力部。

Claims (4)

  1. 原文領域を含む原稿画像を取得する原稿画像取得手段と、
    前記原稿画像の前記原文領域を特定する原文領域特定手段と、
    前記原稿画像の前記原文領域に含まれる文字からなる原文を認識して翻訳文を生成する翻訳手段と、
    前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段と、
    を含み、
    前記翻訳文生成手段は、
    前記原文領域に含まれる原文の文字サイズを特定する文字サイズ特定手段と、
    親文字の文字サイズを、前記文字サイズ特定手段により特定された文字サイズに基づいて決定する文字サイズ決定手段と、
    前記原文領域のサイズと、翻訳文の文字数と、前記決定された親文字の文字サイズと、に基づいて、少なくとも1つの行からなる翻訳文を配置する翻訳文領域を前記原文領域内に規則的に設定する翻訳文領域設定手段と、
    前記各翻訳文領域の間に、少なくとも1つの行からなる原文を配置するルビ文字領域を設定するルビ文字領域設定手段と、
    前記原文領域に含まれる原文の各行の文字行画像を取得する文字行画像取得手段と、
    前記各ルビ文字領域に前記各文字行画像を配置する配置手段と、
    を含み、
    前記配置手段は、
    前記原文領域内に配置される翻訳文の行数よりも前記文字行画像の数が大きい場合、前記各文字行画像の長さを1より小さい倍率で縮小するとともに、縮小された各文字行画像の連結画像を各ルビ文字領域の長さで分割し、各分割画像を、新たな文字行画像として、前記各ルビ文字領域に配置すること、
    を特徴とする翻訳装置。
  2. 前記翻訳文生成手段は、
    前記各文字行画像の高さが、翻訳文領域の間隔よりも大きいか否かを判断する判断手段と、
    その高さが前記間隔よりも大きいと判断された文字行画像を、その高さが前記間隔以下となるように縮小する縮小手段と、
    をさらに含むことを特徴とする請求項1に記載の翻訳装置。
  3. 前記1より小さい倍率は、前記原文領域内に配置される翻訳文の行数を前記文字行画像の数で割った商以下の倍率である、
    ことを特徴とする請求項1又は2に記載の翻訳装置。
  4. 原文領域を含む原稿画像を取得する原稿画像取得手段、
    前記原稿画像の前記原文領域を特定する原文領域特定手段、
    前記原稿画像の前記原文領域に含まれる文字からなる原文を認識し、翻訳する翻訳手段、
    前記原稿画像の前記原文領域内に、翻訳文を親文字として配置するとともに、原文をルビ文字として配置し、翻訳文書を生成する翻訳文書生成手段、
    としてコンピュータを機能させるためのプログラムであって、
    前記翻訳文生成手段は、
    前記原文領域に含まれる原文の文字サイズを特定する文字サイズ特定手段と、
    親文字の文字サイズを、前記文字サイズ特定手段により特定された文字サイズに基づいて決定する文字サイズ決定手段と、
    前記原文領域のサイズと、翻訳文の文字数と、前記決定された親文字の文字サイズと、に基づいて、少なくとも1つの行からなる翻訳文を配置する翻訳文領域を前記原文領域内に規則的に設定する翻訳文領域設定手段と、
    前記各翻訳文領域の間に、少なくとも1つの行からなる原文を配置するルビ文字領域を設定するルビ文字領域設定手段と、
    前記原文領域に含まれる原文の各行の文字行画像を取得する文字行画像取得手段と、
    前記各ルビ文字領域に前記各文字行画像を配置する配置手段と、
    を含み、
    前記配置手段は、
    前記原文領域内に配置される翻訳文の行数よりも前記文字行画像の数が大きい場合、前記各文字行画像の長さを1より小さい倍率で縮小するとともに、縮小された各文字行画像の連結画像を各ルビ文字領域の長さで分割し、各分割画像を、新たな文字行画像として、前記各ルビ文字領域に配置すること、
    を特徴とするプログラム。
JP2007250709A 2007-09-27 2007-09-27 翻訳装置及びプログラム Expired - Fee Related JP4998176B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007250709A JP4998176B2 (ja) 2007-09-27 2007-09-27 翻訳装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007250709A JP4998176B2 (ja) 2007-09-27 2007-09-27 翻訳装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2009080727A JP2009080727A (ja) 2009-04-16
JP4998176B2 true JP4998176B2 (ja) 2012-08-15

Family

ID=40655416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007250709A Expired - Fee Related JP4998176B2 (ja) 2007-09-27 2007-09-27 翻訳装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4998176B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5144736B2 (ja) 2010-11-10 2013-02-13 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
JP5211193B2 (ja) 2010-11-10 2013-06-12 シャープ株式会社 翻訳表示装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6415869A (en) * 1987-07-09 1989-01-19 Ricoh Kk Translating device
JPH03273449A (ja) * 1990-03-23 1991-12-04 Ricoh Co Ltd 機械翻訳装置
JP3294919B2 (ja) * 1993-10-21 2002-06-24 松下電器産業株式会社 機械翻訳装置
JP2001216292A (ja) * 2000-01-31 2001-08-10 Toshiba Corp レイアウト画像編集装置及びレイアウト画像編集方法
JP2006276905A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
JP2006268150A (ja) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 翻訳を行う装置、方法、プログラムおよび該プログラムを記憶した記憶媒体
JP2009053932A (ja) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd 文書画像処理装置、及び文書画像処理プログラム

Also Published As

Publication number Publication date
JP2009080727A (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
JP4483909B2 (ja) 翻訳装置及びプログラム
JP2005073015A (ja) 画像処理装置及び画像処理方法及びコンピュータプログラム
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
US9614984B2 (en) Electronic document generation system and recording medium
JP4232679B2 (ja) 画像形成装置およびプログラム
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP5769131B2 (ja) 画像処理装置およびプログラム
US8660357B2 (en) Image processing apparatus, method, and computer program
JP2011090578A (ja) 画像処理装置、画像処理方法及びプログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP4165435B2 (ja) 画像形成装置およびプログラム
JP2009087270A (ja) 画像処理装置及びプログラム
US8533590B2 (en) Information processing apparatus and layout processing method
JP2012198597A (ja) 制御装置及びコンピュータプログラム
JP2009223363A (ja) 文書処理装置および文書処理プログラム
JP5126018B2 (ja) 文書画像処理装置及びプログラム
JP2010183484A (ja) コピー機能を有する画像形成装置
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP5612974B2 (ja) セリフチェック装置、セリフチェック方法、及びプログラム
JP5650683B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2009141525A (ja) 画像処理装置及び画像処理方法
US20100104131A1 (en) Document processing apparatus and document processing method
JP4735212B2 (ja) 画像処理装置
JP2011151703A (ja) 画像処理装置、文字拡大処理方法および文字拡大プログラム
US8707165B2 (en) Information processing apparatus, control method, and storage medium for adjustment of alternate document layers to reduce printed pages

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120430

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees