JP2011193173A

JP2011193173A - 画像処理装置、プログラム及び記録媒体

Info

Publication number: JP2011193173A
Application number: JP2010056765A
Authority: JP
Inventors: Hiroyuki Sakuyama; 宏幸作山; Yoshihisa Oguro; 慶久大黒
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2010-03-12
Filing date: 2010-03-12
Publication date: 2011-09-29

Abstract

【課題】白地以外に印刷された原画像の再現性と訳語の判読性を両立させること
【解決手段】スキャナ１０１が読み取った画像情報から、文字列で構成される単語を切り出し、切り出した単語に対応する訳語を、原画像中の単語に関連づけた位置に埋め込んだ第１のファイルを生成する。第１のファイルを生成する場合は、前記訳語を埋め込まない第２のファイルを生成する場合に比べて、前記画像読取手段から出力される画像データの低濃度部の画素値を大きくすることで、ハイライト部分を暗くして訳語を見やすくする。
【選択図】図１

Description

本発明は、画像処理装置、プログラム及び記録媒体に関する。

ＭＦＰ（多機能型プリンタ）においては、従来からスキャンした原画像を指定されたファイルフォーマットでラップし、ファイルとして出力する機能(以下、単純スキャン機能と呼ぶ)が広く用いられている。この単純スキャン機能は、原画像を忠実に再現することが望まれるため、典型的には、原画像のハイライト部からダーク部までを均一に再現するものとなっている。

ところで、最近では、スキャンした原画像に訳語を付加してからファイルフォーマットでラップし、ファイルとして出力するようなアプリケーションが考案されている。以下、これについて説明する。
外国語の文章を読む場合、ある単語の意味が分からないために読み進めることができないといったことが起こる。この場合は、辞書を引いてその単語の意味を知り、読み進めることになる。しかし、辞書を引くのは手間がかかり読み進めることは容易ではないことは誰でも経験するところである。

そこで、外国語で記述された文章を自動的に翻訳して出力する対訳複写機のような装置があれば便利であるが、そのような対訳複写機の一例として、例えば、特許文献１に記載された「翻訳複写装置」が既に知られている。
この翻訳複写装置では、第１に、画像読取手段が原画像をスキャンし、第２に、識別手段が読み取った原画像を絵柄情報と文字情報として識別し、第３に、翻訳手段が文字情報について文字毎に認識し、更にその内容を他言語に翻訳して「原画像と共に」翻訳画像を出力するように構成されている。つまり、上記「翻訳複写装置」によれば、原画像の複写画像と共に文字情報に関する翻訳画像が得られるので辞書を引く手間を省くことができる。

ここで、上記「原画像と共に」翻訳画像を出力する場合の典型的な例は、当該単語の直下または直上に、ルビのような形で訳語を配置する態様である。また、その訳語については、原画像中の文字の判読性を損なわないように、原画像の文字よりも小さめの大きさとしかつ色も薄めとすることが一般的である。
こうした、ルビのような態様の長所は、外国語の文章の原レイアウト(挿絵も含む)を維持したまま、訳語を付加できることである。最近では、この長所を生かして、スキャンした原画像に前記訳語を付加した状態でファイルフォーマットでラップし、ファイルとして出力する機能(以下、単訳スキャン機能と呼ぶ)が考案されている。

図２１は、単訳スキャン機能で生成した訳語付きファイルを表示した例であり、原画像の単語の上に訳語が表示されている。また、図２２は、訳語付きファイルの内部構成を示したものであり、スキャンで生成された画像データレイヤと、単語訳を埋め込んだテキストデータのレイヤの２つのレイヤから成り立っている。
こうした、スキャン画像のレイヤに対してテキストデータのレイヤを加える例は、所謂サーチャブルＰＤＦ（Portable Document Format）として広く知られており、テキストデータのレイヤは、可視にしたり非可視にしたりすることが可能である。

ところで、上記２つのスキャン機能は、ともに原画像を忠実に再現するのが基本であるが、単純スキャン機能が均一な再現を基本とするのに対し、単訳スキャン機能の場合は、均一では不都合な場合がある。例えば、最近の文書は必ずしも真っ白な地に対してプリントされている場合だけでなく、色地の上にプリントされていることがある。この場合に、原画像中の文字よりも小さめの大きさかつ薄めの色で訳語を配置すると、前記色地が邪魔になって見難くなることがある。

本発明は、上記従来の問題を回避するためなされたものであって、スキャナで読み取った原画像中の単語に対応する訳語を前記単語の位置に関連付けて印刷する際に、前記単語が、原画像が印刷された用紙の地肌の影響を受けて見難くならないようにすることである。

請求項１の発明は、画像情報を読み取る画像読取手段と、前記画像読取手段が読み取った画像情報から、文字列で構成される単語を切り出す単語切出手段と、切り出した単語に対応する訳語を、原画像中の単語に関連づけた位置に埋め込んだ状態の第１のファイルを生成する手段と、前記訳語を埋め込まない状態の第２のファイルを生成する手段とを有する画像処理装置において、第１のファイルを生成する場合に、前記第２のファイルを生成する場合に比べて、前記画像読取手段から出力される画像データの低濃度部の画素値を大きくする画素値補正手段を有することを特徴とする画像処理装置である。
請求項２の発明は、請求項１に記載された画像処理装置において、前記画素値補正手段は、埋め込む対訳語の表示色の濃度或いは彩度、或いはフォントサイズが小さいほど、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置である。
請求項３の発明は、請求項１に記載された画像処理装置において、前記埋め込む対訳語を分類し、前記分類毎に前記埋め込む対訳語の表示色の濃度あるいは彩度を変える濃度又は彩度変更手段を有し、前記画素値補正手段は、前記表示色の濃度或いは彩度の最低値に基づいて、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置である。
請求項４の発明は、請求項１に記載された画像処理装置において、前記埋め込む対訳語を分類し、前記分類毎に前記埋め込む対訳語の表示色の濃度或いは彩度を変える濃度又は彩度変更手段を有し、前記画素値補正手段は、フォントサイズの大きさの最小値に基づいて、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置である。
請求項５の発明は、請求項１ないし４のいずれかに記載された画像処理装置のコンピュータを、前記画像処理装置の前記画像読取手段以外の各手段として機能させるためのプログラムである。
請求項６の発明は、請求項５に記載されたプログラムを記録したコンピュータ読取可能な記録媒体である。

本発明によれば、スキャナで読み取った原画像中の単語に対応する訳語を前記単語の位置に関連付けて印刷する際に、前記単語が、原画像が印刷された用紙の地肌の影響を受けることがなく、したがって見難くなることがない。

図１Ａは、本発明の実施形態に係る画像処理装置の構成を概略的に示したブロック図であり、図１ＢはそのＣＰＵの機能ブロック図である。本画像処理装置におけるファイルフォーマットの構成を示したものである。第１のスキャナ処理の手順を示すフロー図である。本画像処理装置における通常の原稿読取処理手順を示すフロー図である。本画像処理装置における埋め込み用原稿読取処理手順を示すフロー図である。埋め込みファイル用γ補正の例を示したものである。埋め込みファイル用γ補正の別の実施形態を示したものである。第２実施形態（埋め込みレイヤの文字の彩度又は濃度に応じたγ補正）及び第３実施形態（フォントサイズに応じたγ補正）の処理の手順を示したフロー図である。第２実施形態、但し埋め込みレイヤの文字の彩度に応じたγ補正を表す入力画素値と出力画素値との関係を示す図である。第２実施形態、但し埋め込みレイヤの文字の濃度に応じたγ補正の例を示した図である。第３の実施形態である埋め込みレイヤの文字のサイズに応じたγ補正の例を示した図である。本画像処理装置における原稿認識処理の手順を示すフロー図である。段組認識と段組位置認識を説明するための図である。行認識と行位置認識を説明するための図である。単語抽出及び単語位置認識を説明するための図である。訳語辞書検索処理手順を示すフロー図である。ルビレイヤ中の訳語オブジェクトの形式を示す図である。ルビレイヤ中の訳語オブジェクトの１例を示す図である。訳語の配置座標を示す図である。ルビレイヤの生成処理手順を示すフロー図である。従来の訳語付きファイルの表示例を示す図である。従来の訳語付きファイルの構成を示す図である。

本発明の画像処理装置をその実施形態について図面を参照して説明する。
図１Ａは、本発明の実施形態に係る画像処理装置の構成を概略的に示したブロック図であり、図１ＢはＣＰＵの内部構造を示すブロック図である。
本画像処理装置１０は、原稿画像を読み取る画像読取手段であるスキャナ１０１、入力画像メモリ１０２、出力される埋め込みテキストを記憶する出力テキストメモリ１０３、文字認識に使用するデータが格納されている認識辞書メモリ１０４、単語とその単語に対応する訳語および訳語の出力属性（出力する際の色およびサイズが規定された属性）が格納されている訳語辞書メモリ１０５、画像処理装置全体の制御を実行するＣＰＵ１０６、制御プログラムが格納されているＲＯＭ１０７、制御プログラムが一時的に使用するＲＡＭ１０８、読み取った画像を記憶する入力画像メモリであるハードディスク（ＨＤＤ）１０９、スタート、ストップ等の指示を与える操作パネル１１０、上記各機器間のデータのやりとりを行う内部システム・バス１１１等により構成されている。

ＣＰＵ１０６は、図１Ｂに示すようにプログラムによって実現される機能実現手段として、例えば、スキャナ１０１が読み取った画像情報から、文字列で構成される単語を切り出す単語切出手段１０６ａと、単語と当該単語に対応する訳語とを記憶する単語辞書データと、原画像中の単語に関連づけた位置に訳語を埋め込んだ状態の第１のファイルを生成するファイル生成手段（１）１０６ｂと、前記訳語を埋め込まない状態の第２のファイルを生成するファイル生成手段（２）１０６ｃと、第１のファイルを生成する場合に、前記第２のファイルを生成する場合に比べて、前記画像読取手段から出力される画像データの低濃度部の画素値を大きくする画素値補正手段１０６ｄと、前記埋め込む対訳語を分類し、前記分類毎に表示色の濃度あるいは彩度を変える濃度／彩度変更手段１０６ｅを備えている。

図２は、本画像処理装置におけるファイルフォーマットの構成を示したものであり、ファイルフォーマットのバージョンを示すヘッダ１２０に続き、画像データレイヤ１２１、訳語レイヤ１２２が格納されている。画像データレイヤ１２１は、画像の符号そのもののみから成り、画像圧縮方式としては、従来周知のＪＰＥＧ（Joint Photographic Experts Group）を採用している。

以上の構成において、図３は、ＣＰＵ１０６によるスキャナ処理の手順を示すフロー図である。
単訳ＰＤＦ生成のように訳語レイヤ１２２としてルビレイヤの生成を行う場合には、最初から埋め込み用原稿読取処理が行われ、単純なＰＤＦを生成する場合には、最初から通常原稿読取処理が行われる。
即ち、ルビレイヤの生成を行うときは（Ｓ１０１、Ｙｅｓ）、スキャナ１０１でレイヤへの埋め込み用原稿を読み取り（Ｓ１０２）、読み取った原稿の認識処理を行う（Ｓ１０３）。原稿の認識処理を行った後、認識された原稿の訳語辞書検索処理を行い（Ｓ１０４）、次に、原稿のテキストにルビを振るためのルビレイヤ生成処理を行う（Ｓ１０５）。最後に原画像を指定されたファイルフォーマットでラップするファイルフォーマットラップ処理を行う（Ｓ１０６）。

ルビレイヤ生成を行わないときは（Ｓ１０１、Ｎｏ）、通常の原稿読み取りを行い（Ｓ１０７）、次に、原画像を指定されたファイルフォーマットでラップするファイルフォーマットラップ処理を行う（Ｓ１０６）。

図４は、本画像処理装置（ＣＰＵ１０６）による通常の原稿読取処理手順を示すフロー図であり、まず、スキャナ１０１でスキャンを行い（Ｓ２０１）、その後、スキャナからの出力はＡ／Ｄ変換され（Ｓ２０２）、その後、周知のシェーディング補正（Ｓ２０３）が行われる。

これに対し、図５は、本画像処理装置（ＣＰＵ１０６）による埋め込み用原稿読取処理手順を示すフロー図である。シェーディング補正までの動作（Ｓ３０１〜Ｓ３０３）は通常原稿読取処理（Ｓ２０１〜Ｓ２０３）と同じであるが、その後ＣＰＵ１０６（画素値補正手段１０６ｄ）により埋め込みファイル用γ補正（Ｓ３０４）が行われる。

図６は、横軸に入力画素値、縦軸に出力画素値を取って、画素値補正手段１０６ｄによる埋め込みファイル用γ補正の実施形態（第１実施形態の１）を示したものであり、ＲＧＢの各々に対して図示したγ補正がなされる。本処理は、ハイライト部をより薄く出力することで、原稿の地の影響を低減し、訳語の判読性を向上させるためである。γ補正後の画像データは、ＪＰＥＧ方式で圧縮される。

図７は、横軸に入力画素値、縦軸に出力画素値を取って、画素値補正手段１０６ｄによる埋め込みファイル用γ補正の別の実施形態（第１実施形態の２）を示したものである。図６に示す実施形態では、ハイライト部のみの画素値を大きく補正したが、ハイライト〜シャドー全域での階調性を考えた場合には、図７に示すようなγ補正を行うことが好ましい。即ち、画像読み取り手段から出力される画素値に関し、低濃度部から高濃度部における画素値を大きく出力するが、その大きくする程度が、高濃度部に比べ低濃度において大きいことが特徴である。
この場合も、γ補正後の画像データは、同様にＪＰＥＧ方式で圧縮される。

その後、ルビレイヤの生成を行う場合には、後述する原稿認識、訳語辞書検索、ルビレイヤ生成処理、最後に、これらのレイヤをファイルフォーマットでラップする処理が行われる。一方、ルビレイヤの生成を行わない場合には、単純にファイルフォーマットでラップする処理が行われる。

図８は、ＣＰＵ１０６による、第２実施形態（埋め込みレイヤの文字の彩度又は濃度に応じたγ補正）、第３実施形態（フォントサイズに応じたγ補正）の処理の手順を示したフロー図である。
第２及び第３実施形態においては、最初に通常の原稿読取処理が行われる（Ｓ４０１）。続いて、単訳ＰＤＦ生成のように、ルビレイヤの生成を行う場合には（Ｓ４０２、Ｙｅｓ）、原稿認識処理（Ｓ４０３）、訳語辞書検索処理（Ｓ４０４）を行った後、そのファイル生成手段（１）１０６ｂによりルビレイヤの生成処理を行い（Ｓ４０５）、画素値補正手段１０６ｄにより、生成するルビの濃度や大きさ等に応じて、通常の原稿読取処理の結果に対して埋め込みファイル用γ補正が行われ（Ｓ４０６）、原画像を指定されたファイルフォーマットでラップするファイルフォーマットラップ処理を行う（Ｓ４０７）。補正後の画像データはＪＰＥＧ方式で圧縮される。
一方、単純なＰＤＦを生成する場合には、特段のγ補正は行われずに、ＪＰＥＧ方式で圧縮される。

本画像処理装置（ＣＰＵ１０６）の濃度／彩度変更手段１０６ｅは、前記埋め込む対訳語を分類し、前記分類毎に表示色の濃度あるいは彩度を変える機能を有しているので、この濃度／彩度変更手段１０６ｅにより変更した対訳語の表示色の濃度あるいは彩度に応じた画素値の補正について説明する。
図９は、第２実施形態の１、但し埋め込みレイヤの文字の彩度に応じたγ補正を表す入力画素値と出力画素値との関係を示す図である。
本実施形態では、埋め込みレイヤのテキストの彩度が全て閾値以上である場合には、通常の彩度であるとして、通常の原稿読取処理の結果（＝画像データ）に対して破線で示したγ補正がなされ、そうでない場合には、画素値補正手段１０６ｄにより、低彩度テキスト用の実線で示したγ補正がなされる。低彩度テキスト用のγ補正の方が、通常彩度のそれよりも、ハイライト部の出力画素値を大きくしている。

図１０は、第２実施形態の２、但し埋め込みレイヤの文字の濃度に応じたγ補正の例を示したものである。
濃度と輝度は負の相関関係にあるため、本実施形態では、濃度の代わりの輝度を用いる。図１０に示す第２実施形態では、埋め込みレイヤのテキストの輝度が全て閾値以下である場合には、通常の輝度であるとして、通常の原稿読取処理の結果（＝画像データ）に対して破線で示したγ補正がなされ、そうでない場合には、画素値補正手段１０６ｄにより、高輝度（＝低濃度）テキスト用の実線で示したγ補正がなされる。高輝度（＝低濃度）テキスト用のγ補正の方が、通常輝度のそれよりも、ハイライト部の出力画素値を大きくしている。

図１１は、第３実施形態である埋め込みレイヤの文字のサイズに応じたγ補正の例を横軸に入力画素値、縦軸に出力画素値を取って示したものである。図１１の例では、埋め込みレイヤのフォントサイズが全て閾値以上（例えば８ポイント以上）である場合には、通常のフォントサイズであるとして、通常の原稿読取処理の結果（＝画像データ）に対して破線で示したγ補正がなされ、そうでない場合には、画素値補正手段１０６ｄにより、小フォント用の実線で示したγ補正がなされる。小フォント用のγ補正の方が、通常フォントのそれよりも、ハイライト部の出力画素値を大きくしている。

図１２は、本画像処理装置（ＣＰＵ１０６）による原稿認識処理の手順を示すフロー図である。原稿認識処理は、まず初めに段組認識を実行する（Ｓ５０１）。段組認識は、主走査方向及び副走査方向共に、読取画像データの文字が存在しない部分（白領域）が一定間隔以上存在した場合を段の区切りとして認識する。
次に、段組位置認識を実行する（Ｓ５０２）。段組位置認識は、スキャナにより読み取られ、入力画像メモリ１０２に保存されている画像情報に、画素単位で座標を与え、認識された段組が画像中に占める座標を求める。例えば、図１３に示した原稿中の「1．0 Introduction」で始まる段組を例に採ると、図１３に示すように「1．0 Introduction」で始まる段組が完全に含まれる長方形の領域（所謂外接矩形）を求め、その領域の左上の座標（ｂｓｘ、ｂｓｙ）と右下の座標（ｂｅｘ、ｂｅｙ）を認識する。

次に、行認識を実行する（Ｓ５０３）。行認識は認識された段組ごとに行い、副走査方向に、読取画像データの文字が存在しない部分（白領域）が一定間隔以上存在した場合を行の区切りとして認識する。
次に、行位置認識を実行する（Ｓ５０４）。行位置認識は、上記同様、入力画像メモリに保存されている画像情報に、画素単位で座標を与え、認識された行が画像中に占める座標を求める。例えば、図１３に示した原稿中の「RICOH Corporation」で始まる行を例にすると、図１４に示すように「RICOH Corporation」で始まる行が完全に含まれる長方形の領域（所謂外接矩形）を求め、その領域の左上の座標（ｌｓｘ、ｌｓｙ）と右下の座標（ｌｅｘ、ｌｅｙ）を認識する。

次に、文字認識を実行する（Ｓ５０５）。文字認識アルゴリズムは公知のテンプレートマッチングを利用する。認識辞書メモリには、文字認識に使用するテンプレートデータが格納されている。
次に、文字認識で認識された文字から単語抽出を実行する（Ｓ５０６）。単語抽出は行毎に行い、主走査方向に読取画像データの文字が存在しない部分（白領域）が一定間隔以上存在した場合、また空白文字、句読点等の区切記号が存在した場合を単語の区切りとして抽出する。

次に、単語位置認識を実行する（Ｓ５０７）。単語位置認識は、上記同様、入力画像メモリに保存されている画像データに、画素単位で座標を与え、認識された単語が画像中に占める座標を求める。例えば、図１４に示した原稿中の「RICOH」という単語を例にすると、図１５に示すように「RICOH」が完全に含まれる長方形の領域（所謂外接矩形）を求め、その領域の左上の座標（ｗｓｘ、ｗｓｙ）と右下の座標（ｗｅｘ、ｗｅｙ）を認識する。

以上の原稿認識処理に続いて、図１６に示す訳語辞書検索処理が行われる。訳語辞書検索は、初めに、前述の単語抽出処理により抽出され記憶されている単語を一つ読み出す認識単語読み出しを実行する（Ｓ６０１）。次に、語尾変化検査により読み出された単語に活用に伴う語尾変化が起きているか否かを検査する（Ｓ６０２）。語尾変化があった場合は（Ｓ６０３、Ｙｅｓ）、品詞特定によりその単語の品詞を特定する（Ｓ６０４）。例えば、語尾変化として“ｓ”が付いている場合は、複数形になり得る品詞と判定し名詞と特定する。また、“ｅｄ”が付いていた場合は、過去形になり得る品詞と判定し動詞と特定する。語尾変化があった場合は、さらに原形取得により、その単語の原形を取得する（Ｓ６０５）。

次に、辞書検索を実行する（Ｓ６０６）。即ち、検索の対象となる訳語辞書メモリ１０５には、予め単語とその単語に対応する訳語がペアで登録されており、また、各単語毎に出力属性も登録されている。例えば、“ｐｌａｙ”という単語は、訳語辞書メモリ内において、次のように登録されている。
ｐｌａｙ〔動〕遊ぶ；〜する；演奏する〔名〕遊び
これは、第一優先品詞が動詞で、そのときの訳語が「遊ぶ」、「〜する」、「演奏する」を表し、第二優先品詞が名詞で、そのときの訳語が「遊び」であることを表す。本実施形態では、品詞特定で動詞と特定されれば、３つの訳語のうち最初の「遊ぶ」が読み出され、名詞と特定されれば「遊び」が読み出される。

次に、辞書に存在するか否かを検査し（Ｓ６０７）、存在すれば（Ｓ６０７、Ｙｅｓ）、出力属性が参照される（Ｓ６０８）。ここで、出力属性は、その単語に対応する訳語を実際に出力する際の色およびサイズが規定された属性であり、本実施形態では、簡単な分類に属する単語の場合、標準の色（例えば（ＲＧＢ）=（0、0、255））よりも彩度が低い色(例えば（ＲＧＢ）=（0、0、200））または標準サイズよりも２ポイント小さいサイズで出力を行うという属性が規定されている。
以上の訳語辞書メモリ１０５内の単語と、前記認識単語読み出しにより読み出された単語を、１文字ずつ比較し、全ての文字が一致する単語が存在するか否かを判断（パターンマッチング）する。全ての文字が一致する単語が存在した場合は、目的の単語が辞書に登録されていることになる。

このように、目的の単語が訳語辞書に存在する場合には、前記出力属性が参照され、該属性および当該単語の位置（図１５の２点の座標）を付けた状態で訳語・属性・位置記憶が行われる（Ｓ６０９）。即ち、ステップＳ６０９の「訳語・属性・位置記憶」では、品詞特定結果に応じた単語の訳語と、当該単語の出力属性と、当該単語について認識された位置を出力テキストメモリ１０３に記憶する。
なお、ステップＳ６０３で、語尾変化がなければ（Ｓ６０３、Ｎｏ）、辞書に存在するか否か検査し（Ｓ６０７）、辞書に存在すれば（Ｓ６０７、Ｙｅｓ）既に述べたステップＳ６０８以下の処理を行い、存在しなければ（Ｓ６０７、Ｎｏ）処理を終了する。

訳語辞書検索処理の後には、ルビレイヤ生成処理が行われる。ルビレイヤは、複数の訳語オブジェクトの集合からなり、１つの訳語オブジェクトは図１７に示す要素から成る。
即ち、訳語オブジェクトは、訳語開始識別子と訳語終了識別子との間に挟まれた、オペランドとオペコードから構成されており、本実施形態ではオペランドにはフォントオペレータTf、色オペレータrg、配置オペレータTd、テキストオペレータTjがある。

図１８は、訳語オブジェクトの具体例であり、オペランド、フォントオペレータTfに対してはオペコード、フォント番号とフォントサイズが指定される。本実施形態では、/F1（フォント番号１番）は明朝体を指し、/F2（フォント番号２番）はゴシック体を示す。８はフォントサイズである。
色オペレータrgに対しては、訳語の色としてＲＧＢ各々の画素値を順に指定可能であり、２５５００は赤を示す。
配置オペレータTdに対しては、７２０dpiに換算した場合の、訳語を配置する外接矩形の左上の座標（図１５では（wsx、wsy））を指定する。座標の原点は紙の左上である。但し、本実施形態における訳語は、単語よりも上の位置（ｙ座標が小さい位置）に配置し、具体的には図１９に示す通りである。

テキストオペレータTjに対しては、（）内に、訳語として配置するテキストを指定することが可能であり、図１８の例では、要旨という訳語が指定されている。
なお、訳語オブジェクトが複数ある場合には、続く訳語オブジェクト内でフォントまたは色についてのオペランドおよびオペコードを省略することが可能である。省略された場合は、直前の訳語オブジェクトの値が適用される。

また、本実施形態においては、ルビ的に配置する訳語のフォントサイズの最小値、濃度や輝度の最小値が問題となるため、図２０の、ルビレイヤ生成処理時には、上記最小値が保持される。つまり、訳語・属性・位置読み出しを行い（Ｓ７０１）、次に図１２に示す方法で配置位置を算出し（Ｓ７０２）、図１２の形式で訳語オブジェトを生成し（Ｓ７０３）、読み出した属性中のフォントサイズ（または濃度または彩度）が最小であれば（Ｓ７０４、Ｙｅｓ）、その最小値を保持して（Ｓ７０５）、また、ステップ７０４で読み出した属性中のフォントサイズ（または濃度または彩度）が最小でなければそのままルビレイヤを生成し、それぞれ次の訳語・属性・位置の処理に移る（Ｓ７０６）。

上記のサイズや濃度、輝度の最小値については、図８におけるステップＳ４０６の「埋め込みファイル用γ補正」では、その最小値に応じて、図９〜１１に示したγ補正がなされる。

図２０の処理において、濃度を算出する場合には、既に述べたように濃度と輝度は負の相関関係にあるため、簡易的に輝度の値で代用することができる。
本実施形態における輝度Yの算出式は、最も簡易なY＝（R＋２G＋B）/4、或いは、Ｙ＝0．299×R+0．587×G+0．144×B、を用いることができる。
例えば輝度が６４以上の場合に、輝度が通常より高い（濃度が薄い）と判定して、図１０の実線のγ補正が適用されるようにすればよい。

輝度同様、彩度自体の定義もいくつか存在するが、図２０において彩度を算出する場合は、本実施形態においては、ＨＳＶ表色系(Hue、Saturation、Value of Brightness)のＳ(彩度：Saturation)を用いることができる。
ＲＧＢの各画素値の最大値、最小値をmax、minとすると、本実施形態でのＳはＳ =２５５＊（max-min）/max、で算出され、例えばＳが１６８以下の場合に、彩度が通常より低いと判定して、図９の実線のγ補正が適用されるようにすればよい。
あるいは、より精度の良い算出法としては、ＲＧＢ値を周知のsＲＧＢ（standardＲＧＢ）値に換算し、sＲＧＢ値をXYZ値に変換し、XYZ値をL*a*b*値に変換し、最終的に √（a*²＋b*²）を彩度とすればよい。
例えば、√（a*²＋b*²）が４０未満の場合に彩度が通常より低いと判定して、図９の実線のγ補正が適用されるようにすればよい。

なお、輝度の代わりに明度（明度も濃度と負の相関関係にある）を用いる場合は、ここでのLの値を用いることも可能である。また、以上の例で用いた閾値は例に過ぎず、固定値としておくことも、ユーザによって指定可能にしておくことも可能である

本発明の実施形態によれば、（１）訳語の表示色を考慮して、或いは（２）訳語の表示色の濃度或いは彩度の最低値を考慮して、或いは（３）表示サイズの最小値を考慮して、それぞれ原画像の再現性と訳語の判読性を両立させることができる。

以上本発明の実施形態に係る画像処理装置について説明したが、上記画像処理装置における各機能を実施する手段、例えば、前記画像読取手段が読み取った画像情報から、文字列で構成される単語を切り出す単語切出手段、単語と該単語に対応する訳語とを記憶する単語辞書データと、原画像中の単語に関連づけた位置に訳語を埋め込んだ状態の第１のファイルを生成する手段、前記訳語を埋め込まない状態の第２のファイルを生成する手段、画像読取手段から出力される画像データの低濃度部の画素値を大きくする手段、埋め込む対訳語を分類し、前記分類毎に表示色の濃度あるいは彩度を変える手段は、画像処理装置のコンピュータにプログラムを読み取らせて実行することにより実現される。
また、上記プログラムは、周知のコンピュータ読取可能な記録媒体に記録される。

１０・・・画像処理装置、１０１・・・スキャナ、１０２・・・入力画像メモリ、１０３・・・出力テキストメモリ、１０４・・・認識辞書メモリ、１０５・・・訳語辞書メモリ、１０６・・・ＣＰＵ、１０６ａ・・・単語切出手段、１０６ｂ・・・ファイル生成手段（１）、１０６ｃ・・・ファイル生成手段（２）、１０７・・・ＲＯＭ、１０９・・・ＲＡＭ、１０９・・・ハードディスク、１１０・・・操作パネル、１１１・・・内部システム・バス。

特開昭６２−１５４８４５号公報

Claims

画像情報を読み取る画像読取手段と、
前記画像読取手段が読み取った画像情報から、文字列で構成される単語を切り出す単語切出手段と、切り出した単語に対応する訳語を、原画像中の単語に関連づけた位置に埋め込んだ状態の第１のファイルを生成する手段と、前記訳語を埋め込まない状態の第２のファイルを生成する手段とを有する画像処理装置において、
第１のファイルを生成する場合に、前記第２のファイルを生成する場合に比べて、前記画像読取手段から出力される画像データの低濃度部の画素値を大きくする画素値補正手段を有することを特徴とする画像処理装置。
請求項１に記載された画像処理装置において、
前記画素値補正手段は、埋め込む対訳語の表示色の濃度或いは彩度、或いはフォントサイズが小さいほど、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置。
請求項１に記載された画像処理装置において、
前記埋め込む対訳語を分類し、前記分類毎に前記埋め込む対訳語の表示色の濃度あるいは彩度を変える濃度又は彩度変更手段を有し、
前記画素値補正手段は、前記表示色の濃度或いは彩度の最低値に基づいて、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置。
請求項１に記載された画像処理装置において、
前記埋め込む対訳語を分類し、前記分類毎に前記埋め込む対訳語の表示色の濃度或いは彩度を変える濃度又は彩度変更手段を有し、
前記画素値補正手段は、フォントサイズの大きさの最小値に基づいて、前記画像データの低濃度部の画素値を大きくすることを特徴とする画像処理装置。
請求項１ないし４のいずれかに記載された画像処理装置のコンピュータを、前記画像処理装置の前記画像読取手段以外の各手段として機能させるためのプログラム。
請求項５に記載されたプログラムを記録したコンピュータ読取可能な記録媒体。